e-works数字化企业网  »  文章频道  »  基础信息化  »  存储

企业存储知识普及系列(二):存储控制单元及协议

2019/2/11    来源:e-works    作者:e-works  熊东旭      
关键字:存储  存储知识  存储控制单元  
本文谈了企业级存储为什么容量那么大、存储速度那么快以及RAID技术是如何支撑大容量、高速率的企业存储应用需求。

    在企业存储实施与转型系列(一)中,小编简单梳理了存储的演化历程,以及介绍了三种存储架构DAS、NAS和SAN。其中提到了专门协议接口SCSI、FC,网络共享协议NFS、CIFS以及RAID。这些到底是什么鬼?

从硬盘谈起

    话说小编的第一台电脑是2003年上大学花4500元购买的,配置是英特尔赛扬2.4处理、512M内存、飞利浦纯平显示器,硬盘是西部数据40G 5400RPM。当时这个配置已经相当不错,但拿到现在比,性能肯定会被秒杀。

    就硬盘来说,现在随便一个硬盘容量都是以TB为单位,支持SATA接口,转速为7200。相比当初40GB容量,ATA接口以及5400的转速,无论是性能还是容量都无法相比。那么,硬盘是如何通过容量、转速、接口提高性能的?

硬盘结构

硬盘结构

    硬盘就是一层层磁盘片叠加而成,每一层盘片上下都有一个读写磁头,用来读写数据。为了让数据能快速准确的读写,每一个磁盘面又划分为不同的柱面、扇区和磁道。这就是为什么硬盘在出厂存储数据之前都要进行格式化,格式化就是为硬盘的所有磁盘划分出柱面、扇区和磁道的过程。如果硬盘厂商能在有限的空间内放入更多的磁盘片,并提升每个磁盘片的密度,就可以提升硬盘的存储容量。同时,通过提升盘面转速和增强磁头的灵敏性,还可以提升硬盘的读写性能。当然,磁头读写再快还得依赖于接口的传输速率。

ATA/IDE与SATA

ATA/IDE与SATA

    早期IDE硬盘采用的是ATA接口,后来逐渐发展成SATA接口。ATA/IDE采用“并行通信”的传输模式,也就是说通过多根数据线,同时传输多个信号。从外观上来看,IDE硬盘的ATA接口共有40根引脚。但ATA硬盘理论最快的传输也就100MB/s,通常就几十的传输速率。而SATA是一种串口ATA传输模式,传输速率150MB/s起步。现在个人电脑的硬盘大多是这种模式,当然随着闪存技术的发展,越来越多的人开始采用速度更快的闪存卡或固态硬盘。

    当然,个人电脑用来存储数据的都是硬盘,但对企业而言,硬盘无论是在容量、速率和性能方面,远远不能满足需求。那么,如何解决企业动辄过P级的数据存储需求?

企业存储=盘多力量大

    企业对存储的需求是容量大(PB级)、读写和传输速率快(GB级)。怎么解决这个问题?记得小时候看动画片,但凡一个人解决不了的事情,就通过多人变身组成一个体积大、吨位重的人物,然后轻松的秒杀对手。

    一个人办不到的事情,集合多人的力量一定能办到。同样的道理,既然单个硬盘无法满足企业级的数据存储需求,那么就一次集合多块硬盘组合起来应对容量和性能提升的需求。这就是RAID技术。

    RAID即独立磁盘冗余阵列,RAID技术将多个单独的物理硬盘以不同的方式组合成一个逻辑硬盘,从而达到提升存储容量、读写性能和数据安全性的目的。

RAID技术应用

RAID技术应用

    在企业级存储产品选型过程中,基本所有的存储产品都能提供RAID功能,主要包括RAID 0、RAID 1、RAID3、RAID 5、RAID 6、RAID 10、RAID 50几个级别。

    RAID 0条带存储

RAID 0条带存储

RAID 0条带存储

    RAID 0称条带存储或数据分条,即把数据分成若干相等大小的小块,并把它们写到阵列上不同的硬盘上,这种技术又称“Stripping”(即将数据条带化),RAID 0在读写时是以并行的方式对各硬盘同时进行操作。

    也就是说,如果一条数据需要存储,RAID控制器会先将这条数据划分为数个大小相等的小块,并行进行数据的读写。这样做的大幅提升数据的存取效率。在所有RAID存储中,RAID0的读写速度最快。但由于没有冗余的数据存储保障机制,一旦一个硬盘出现问题,所有的数据都将无法使用,不适合关键性的业务。

    RAID 1镜像/双工

RAID 1镜像/双工

RAID 1镜像/双工

    RAID 1即镜像/双工。让每个工作盘都有一个镜像盘,每次写数据时必须同时写入镜像盘,读数据时只从工作盘读出,一旦工作盘发生故障立即转入镜像盘,从镜像盘中读出数据。当更换故障盘后,数据可以重构,恢复工作盘正确数据。

    RAID1的特点是数据安全性相对其它RAID级是最好的,因为读写自从工作盘读写,不出问题时,镜像盘只做数据的备份。出问题时才读写,而且能方便的重构工作盘数据。但其缺点也非常明显,相当于一半的存储空间都用于数据的备份,最高的存储资源利用率只有50%,是所有RAID中磁盘利用率最低的一个级别。因此,RAID 1非常适合对数据安全性和可用性要求较高的场景。

    RAID 3 条带分布+专用盘校验

RAID 3 条带分布+专用盘校验

RAID 3 条带分布+专用盘校验

    RAID 3 即条带分布+专用盘校验,采用RAID3要至少使用三块硬盘配置,在其中的一块硬盘上存贮专用的校验数据,当某块硬盘出现故障时,其它硬盘可以通过校验数据将有故障的硬盘的数据重新恢复出来。数据以位或字节的方式存于各盘,分散记录在组内相同扇区的各个硬盘上。

    从RAID 3的架构看,校验盘只需一个,数据盘越多存储系统的利用率就越高。当然RAID 3兼顾了数据安全和磁盘的利用效率,实现了数据的高可用性,但校验盘成为性能瓶颈,每次读写牵动整个组,且每次只能完成一次I/O。如果企业采用RAID 3,校验盘可用采用性能更高的闪存盘,这样能极大的提升系统性能。

    RAID 5 条带技术+分布式校验

RAID 5 条带技术+分布式校验

RAID 5 条带技术+分布式校验

    RAID 5将所有校验的数据分别存贮在所有的硬盘上,每一个硬盘的不同地方既存贮数据,也存贮校验数据。当某块硬盘出现故障时,其它硬盘可以通过校验数据将故障的硬盘的数据重新恢复出来。

    RAID 3是专门划出一个磁盘做数据的校验盘,但RAID 5是把所有校验数据分布存储在数据盘中,这样仍然保证的数据的高可用性,但不足的是异或较验影响存储性能。适合于文件及应用服务器、数据库服务器等日常业务应用。

    RAID6 高级数据保护

    RAID6是在RAID 5基础上,为了进一步加强数据保护而设计的一种RAID方式,实际上是一种扩展RAID 5等级。与RAID 5的不同之处于除了每个硬盘上都有同级数据XOR校验区外,还有一个针对每个数据块的XOR校验区。

RAID6 高级数据保护

RAID6 高级数据保护

    与RAID 5相比,RAID 6增加了第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,因此写性能差。较差的性能和复杂的实施方式使得RAID 6很少得到实际应用。

    当然除了这里谈到的RAID 0、RAID 1、RAID 3、RAID 5、RAID 6,还有RAID 10、RAID 50两种,RAID 10就是RAID 0+RAID 1的技术组合,RAID 50就是RAID 0+RAID 5的技术组合。

RAID技术对比

RAID技术对比

    对于RAID技术的选择,如果考虑数据的高可用性和安全性,就需要选择有带校验或冗余功能的RAID,如RAID 1、RAID 3、RAID5、RAID 6等,如果不考虑高可用性,只考虑效率就可以选RAID 0。因此存储产品的选型和规划过程中一定要根据不同的业务的数据要求进行实施。

    虽然企业存储的容量高、速度快等需求可以通过RAID技术来解决,但存储系统的数据传输问题一直都是存储应用的一大瓶颈。如何提高存储系统的数据传输效率一直是技术厂商致力于想解决的问题。

存储与服务器之间的数据传输

    以个人计算机来说,我们都知道网卡是用于连接计算机和网络的硬件,网卡一般插在计算机总线扩展槽上或者是集成在主板上,卡上有连接到网络的接口。存储网络与服务器的连接也是同样的道理。

RAID控制器

RAID控制器

    每一台存储设备都有专门的控制器,控制器实现了一种或几种通讯协议,比如FC、SCSI等,可以实现SCSI或FC等存储协议到物理存储设备的操作协议之间的转换。存储通过控制器上的FC、SCSI等接口接入到网络,以实现到服务器的数据读写交互。

SCSI卡

SCSI卡

FC卡

FC卡

    对服务器而言,要从存储系统读写数据,就必须通过安装支持SCSI、FC等协议的专用总线适配卡HBA卡,通过将卡插入到服务器内部的总线接口,实现与存储系统之间的数据交互。

    换句话说,服务器与存储之间的数据通信要要利用SCSI、FC等协议实现,就像个人计算机之间通信需要利用TCP/IP协议一样,HBA是服务器内部的I/O通道与存储系统的I/O通道之间的物理连接。比如连接光纤的有FC HBA、连接iSCSI的有iSCSI HBA,这些HBA通过相对应的FC交换机或iSCSI-FC路由器接入到网络,实现数据的传输。

    目前主流SCSI-3最高数据传输率640MBps,FC传输率则达到4Gb/8Gb/16Gb,光纤通道用于服务器共享存储设备的连接,存储控制器和驱动器之间的内部连接。

    谈了这么多,你能看懂下面这张图吗?

存储系统主柜后面板

存储系统主柜后面板(曙光DS800-G10)

小结

    本篇文章谈了企业级存储为什么容量那么大、存储速度那么快以及RAID技术是如何支撑大容量、高速率的企业存储应用需求,进而讲到企业这么多的数据是如何实现高效、高速的传输,我们还聊了FC、SCSI两种专用协议接口。相信您再到机房走一走,一定不会弄错哪是服务器,哪是存储。

    在下一篇的系列文章中我们将重点讲解企业存储的容灾与备份,敬请关注。

责任编辑:程玥
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐