e-works数字化企业网  »  文章频道  »  基础信息化  »  存储

闪存阵列:极速响应,激发数据价值

2017/8/4    来源:e-works    作者:e-works吴丽萍      
关键字:存储  闪存阵列  
闪存阵列主要是为了解决高IPOS和低延时的问题,针对海量数据中心业务,应用系统数据访问频度分布均匀,对IO性能要求很高,或者大规模应用整合后带来的高IO性能要求。

 
    (七)自动数据分层
 
    自动分层技术(automated data tiering)能够在同一阵列的不同类型介质间迁移数据。自动分层技术的系统可以在子LUN级(在多数情况下是子文件级)针对不同数据类型进行自动层级化。有了这种能力,系统能够压缩分解不频繁使用的数据。其还可以根据同样的能力进行数据迁移,此外,其也能够比较这些子文件分节段的部分来进行存储和去重。通过元数据,阵列能够判断哪些部分应该去重,那些不应该。所有这一切需要的只是一个重复数据删除引擎。分层技术可以自动统计数据热度,将最常访问的数据自动移动到闪存盘上,较少访问的数据移动到低成本的传统存储盘上,采取归档的方式处理,一旦冷数据恢复其活跃性,也可以自动存储到比较快速的盘。这种处理冷热数据的自动化分层存储方式,不仅可以为用户带来存储效率的提升,同时还可以带来成本的节约。
 
    自动数据分层带来了多种好处,它能减少存储分层间动态分类和迁移数据时管理存储所需的时间,通过把低频访问数据转移到低成本驱动,组织不仅能省下用于高性能驱动的花费,还能通过减轻负载来提高性能。另外,减少活动文件的数据可以减少日常备份时间。
 
    自动分层存储管理系统由以下几个部分构成:
 
    1、在阵列中动态地迁移数据卷的能力。这通常需要一个将逻辑结构与物理结构分离开的虚拟层提供辅助;
 
    2、一个设置规则、收集和保存信息、执行这些规则和监控成功与否的软件层;
 
    3、少量额外的存储空间以执行数据迁移。
 
    自动分层的基本原理是,数据在创建后随着时间推移价值会逐步降低。数据主要在其创建后的72小时内被访问。在此之后访问量会骤然减少,访问频率越来越低,30天以后数据只会被偶尔访问。在这时,数据就成了“被动数据”或“冷数据”。
 
    随着数据价值的降低,数据应当迁移到低速、低成本的存储层上。自动分层技术会基于诸如数据创建时间、访问频率、最后访问时间或响应时间之类的策略进行数据迁移。
 
    自动分层存储产品的好处是它们可以使大多数随机密集的环境受益。在少部分的数据集(<10%)被频繁访问的OLTP(联机事务处理)数据库环境中,这些产品运行良好。假设被频繁访问的数据库的百分比适合高性能介质的容量,性能就可以得到极大的提升。这可以使它们以在更短的响应时间内处理更多的事务,不会与把重做日志(redo log)、临时表(temp table)和索引(index)放进固态存储相混淆,还能提高数据库的性能。
 
    (八)扩展

   
存储阵列扩展包括纵向扩展和横向扩展。
 
    1、纵向扩展:(Scale Up),又称向上扩展,是指使用单个(或双冗余)控制器对存储介质进行管控,而存储容量可扩展的架构,这是最初的企业级磁盘阵列设计,支持了近二十年来企业级存储从DAS到SAN的发展,至今仍被大多数阵列厂商所采用。打个比方说,我们向原有的机器添加CPU、内存。
 
    然而,随着阵列的扩展和容量的增长,纵向扩展架构达到了一个瓶颈,因为所有的I / O都要通过相同的控制器。这些控制器的整体性能是有限的,因为它们原是被设计支持那些每秒只能处理几百IOPS的旋转磁盘驱动器的。纵向扩展系统也是低效的,因为用户发现在远未到达系统所能支持硬盘驱动器的最大存储容量前,就已经达到了存储控制器的性能极限。
 
    虽然纵向扩展全闪存系统在单独一组控制器上运行所有I/O,但是全闪存系统的控制器设计是用于支持闪存所能达到的更高IOPS的,因此性能瓶颈不再是一个问题。另外,闪存存储密度(每机架千兆字节量)比旋转式磁盘高得多,因此纵向扩展全闪存阵列的容量不太可能像纵向扩展磁盘阵列那样很快耗尽。
 
    2、横向扩展(Scale Out),又称向外扩展,横向扩展体系结构使用一种由模块或节点所组成的拓扑结构,其中每个节点都具有存储容量和控制器,从而使性能也能随着群集中的容量增加而提高。它们还允许I / O通过多个控制器,因此降低了纵向扩展“单控式”架构带来的瓶颈。横向扩展能力是应对并发访问和提升性能容量的最基本特性,所以闪存是必须具备的功能;然而,即使是低端定位,它们也比纵向扩展系统要贵得多,因为通常至少需要三个节点。他们还需要大量的并行能力以达到它们所声称的性能数字。
 
    横向扩展全闪存阵列将一个控制器和存储介质放置在相同的模块配置当中,使它们可以将系统容量扩展到当前的最高水平。这种分布式控制器架构也使得系统能够支持更多的工作负载,因为每个模块都可以独立处理I/O。
 
    3、究竟选择横向还是纵向
 
    一般来说,纵向扩展提供最高的单卷IOPS能力,更适用于要求最高性能而工作负荷或应用服务器有限的环境。对很多公司而言,这是一个大的虚拟服务器环境或者是数据库服务器集群。但考虑到闪存的高性能和高存储密度,纵向扩展全闪存系统正适用于越来越多的应用场景。据报道,有几家纵向扩展全闪存系统已能达到半PB的存储容量,同时保持极高的性能。公司购买闪存产品通常是由于一个关键应用存在特定的性能问题。这种场景下,纵向扩展的全闪存系统应该就可以,并且实施较易。
 
    然而,如果这个全闪存产品成为常规的生产存储阵列,而且用户对它的操作愈发舒适习惯,他们通常会放置更多的应用以提高工作效率。这意味着系统会增加更多的工作负荷,更多的物理连接数以及总容量。在这种情况下,如果公司能预见到自己将会添加足够的系统,需要足够的容量,那么横向扩展的全闪存系统可能是一个更好的选择。
 
    纵向扩展全闪存阵列的应用场景比横向扩展阵列更加广泛,并有更多的产品选择。但对于那些真正需要灵活性以扩展容量和显著提升性能的场景,横向扩展的全闪存阵列可能是更好的选择,尤其是当有大量并行工作负载的时候。目前市场上已经有可以进行纵向和横向扩展的产品出现。用户可以在单一系统内增加容量,然后以横向扩展的方式将多个系统进行集群,从而同时提供两种方式的优点。
 
    (九)数据容灾
 
    数据容灾(Disaster Recovery),又称为异地数据复制技术,是指建立一个异地的数据系统,该系统是本地关键应用数据的一个可用复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。采用的主要技术是数据备份和数据复制技术。
 
    按照其实现的技术方式来说,主要可以分为同步传输方式和异步传输方式(各厂商在技术用语上可能有所不同),另外,也有如“半同步”这样的方式。半同步传输方式基本与同步传输方式相同,只是在Read占I/O比重比较大时,相对同步传输方式,可以略微提高I/O的速度。而根据容灾的距离,数据容灾又可以分成远程数据容灾和近程数据容灾方式。下面,我们将主要按同步传输方式和异步异步传输方式对数据容灾展开讨论,其中也会涉及到远程容灾和近程容灾的概念,并作相应的分析。
 
    优秀的数据容灾系统对于计算机信息系统而言,就是为其提供的一个能应付各种灾难的环境。当计算机系统在遭受如火灾、水灾、地震、战争等不可抗拒的自然灾难以及计算机犯罪、计算机病毒、掉电、网络/通信失败、硬件/软件错误和人为操作错误等人为灾难时,容灾系统将保证用户数据的安全性,甚至一个更加完善的容灾系统,还能提供不间断的应用服务,可以说,容灾系统是数据存储备份的最高层次。
 
 
    (十)双活
 
    数据双活一般可分为对称双活和非对称双活。
  

    非对称双活(asymmetricDual Active),又称互备模式,是指每个逻辑单元都有自己的专属的控制器,控制器之间各干各的活,互不干扰,不会产生冲突,“非对称”意思就是“各干各的”,你坏了我接管,我坏了你接管,但是两个控制器都在干活,所以“双活”。
 
    而对称双活(symmetric Dual Active),则是指两个控制器角色完全对等,不再分逻辑单元的归属权,任何控制器都可以处理任何逻辑单元的I/O,这给系统设计带来了复杂性,首先要求双控要配合起来,针对已经应答的目标地址有重叠的写I/O,要保证时序一致性,双控必须做好沟通保证后应答的I/O后写入;另外,同时还要解决数据防撕裂问题,有时候阵列内部会自行读或者写某些目标地址数据块,此时双控要用锁来保证每次读写的防撕裂,对某个块的操作可能会被分为多次子I/O,这些子I/O是一个一致性组或者说组成一次原子操作,中途不能被交织入其他I/O,否则就会撕裂导致不一致。正因如此,对称式双活增加了开发难度。但是对称式双活能够以I/O粒度来平衡系统的负载,不会出现某一个逻辑单元太忙而另一个很闲从而导致控制器负载不均衡的现象。

    闪存的主要应用场景如OLTP等,只有无归属、性能均衡的对称双活架构才能更好应对。
 

责任编辑:吴丽萍
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐