网管联盟 | 网管论坛 | 网管u家 | 网管博客 | 网管软件 | 网管求职 | 小游戏 | 网管搜索 | 网管原创 | 网管聚合 | 网管读摘 | 网管焦点 | 世界素材 | 会员投稿 | 会员中心 
中国网管联盟
Windows Linux Cisco 网络技术 数据库 黑客攻防 DotNet Java PHP 认证 新闻资讯 服务器 存储资讯 网络设备 网管学堂 技术专题 焦点 网吧频道
 当前位置: > bitsCN.com > 存储资讯 > 存储技术 > Raid6:看上去很美,尚待进一步完善  

Raid6:看上去很美,尚待进一步完善

2006-12-07  作者:bitsCN整理  来源:it168  点评 投稿 收藏

    众所周知,服务器和存储阵列的硬盘上的数据是珍贵的。RAID技术就是用以保护这些数据的有效方式之一。经过多年的发展,RAID技术虽然种类众多,但一个突出的局限性就是,无法容忍两块硬盘同时故障的情况发生。一旦存储系统中两块硬盘同时损坏,以往的RAID技术对此也无能为力了。

    RAID6正是为了解决这个问题应运而生的。由于采用双重校验的容错方式,因而大大提高存储系统双磁盘容错能力,广受厂商追捧,成为磁盘冗余家族的新兴贵族。一时间,各厂商均宣称自身产品支持RAID6,一场RAID6的普及大潮似乎已经来临。 网管网www_bitscn_com

    然而仔细研究这些宣称支持RAID6的厂商的产品我们可以发现,真正意义上完全实现RAID6支持的厂商只有HDS一家,其他厂商则或多或少在实现方式上打了少许折扣。例如IBM用RAID5E和RAID5EE来替代,结合了RAID5和热备用技术,一定程度上支持两个磁盘故障,但无法真正做到两块硬盘同时掉线。HP的ADG通过在PROLIANT NT服务器上的阵列技术,最终实现二块硬盘同时可以坏,安全性虽好于RAID 5,但牺牲了一定的性能。而NETAPP则一贯通过RAIDDP来替代RAID6。 网管u家u.bitsCN.com

    为什么这些追捧RAID6的厂商迟迟无法提供支持真正RAID6的产品?看起来很美的RAID6在普及过程中遭遇了怎样的瓶颈呢?

中国网管论坛bbs.bitsCN.com

要安全还是要性能
    通过前面介绍过的“RAID6算法解析”,我们已经知道RAID6是通过使用基于Galois Field算法或者有限场的数学MDS代码,以便在驱动器上对数据进行编码校验,从而避免产生错误或者删除。 中国网管论坛bbs.bitsCN.com

    毫无疑问,RAID6是比传统RAID5冗余级别更高的磁盘容错系统,数据平均无故障时间(MTDL)也比传统RAID5系统更高,但基于如此复杂的校验运算,任何一台存储系统或者服务器要实现RAID6,都需要耗费大量的资源。

网管u家u.bitsCN.com

    举例来说明的话:如果磁盘没有故障,RAID 6的写操作通常是可以接受的。可是一旦一块磁盘故障,性能会降低N倍。原来一个写操作只需并行完成两个磁盘写,而如果RAID中1块磁盘有故障,8块盘的RAID 6即需要完成7个块盘的并行读和两块盘的并行写。RAID组中磁盘越多,性能越差,而针对RAID6所主要预防的双磁盘故障的情况,如果2块磁盘同时发生故障,我们很难想象系统需要通过多么复杂的运算才能完成一次读、写的操作。

网管联盟bitsCN@com

    通常写操作可以100% cache hit,而读操作能做到90%以上就已经很不错了,何况这种大规模的磁盘读写。所以存储系统通常要求物理读,写cache是0.00x毫秒级的,而物理读写如果需要若干毫秒,respnd time则可能达到1000倍以上的差别,对于大型系统,这种性能的变化无法接受,所谓的双磁盘容错也变得没有实际意义。

中国网管联盟bitsCN.com

    尽管Intel等厂商已经基于RAID6校验运算原理开发出了硬件的校验加速器,但实际上只能应付一定数量磁盘的RAID组发生故障的情况。搭载到存储系统的硬盘的大容量化趋势可能永无止境,越来越多的硬盘数量也造成了越来越大的故障概率。同时我们还不能排除RAID6加速芯片的单点故障,对RAID系统可能产生的毁灭性的打击。因此实际上RAID6加速运算芯片目前还存在一定的性能和可靠性的局限。 中国网管论坛bbs.bitsCN.com

    而同时,RAID6对磁盘空间的利用率也远不及RAID5,势必意味着用户需要花费额外的费用来保证数据的安全,这让某些厂商和用户也为此头疼不已。

网管联盟bitsCN@com

应用推动RAID6发展 网管网www_bitscn_com

    尽管RAID6在实际应用中还存在大量问题,但现实应用中,面对对双磁盘容错的急迫需求, RAID6仍然拥有光明的发展前景。

网管bitscn_com

    基于以下几方面的情况,我们认为RAID6可能在未来的存储系统中占据日益重要的位置。 网管u家u.bitscn@com

    首先,SATA 、SAS等硬盘应用容量的增长:SATA 与SAS硬盘同时都具有低成本,大容量的优点,因而被广泛应用于存储系统的二级存储与近线备份的模式中,成为承载用户海量数据的主要存储介质,一旦发生无法恢复的故障,会对用户造成巨大损失。而同时,这两个类型的硬盘平均无故障时间(MTBF)相比FC和SCSI硬盘更短,事实上增加了两块硬盘同时故障的机率。使得RAID6在SATA、SAS等中低端存储系统中占据尤为重要的地位。 网管u家u.bitscn@com

    其次,单块硬盘数据量大,重建时间过长:一块硬盘如果容量越大,就意味着如果这块盘坏掉,需要重建数据的时间越长。系统在执行重建任务时承受着巨大的负载,很有可能在长时间的重建过程中损坏第二块盘。而现在的单块硬盘容量正朝着日益增大的方向发展,客观上也增加了故障重建时间窗口和重建负载,增大了重建过程中第二块磁盘故障的概率。 网管网www_bitscn_com

    再次,硬盘数量的增加很大程度上提高了硬盘预期故障发生率:当服务器或磁盘阵列中增加硬盘的数量时,很大程度上提高了硬盘预期故障发生率。在系统用备援硬盘恢复数据时,其余的硬盘也增加了故障发生率。因此系统内硬盘块数越多,越需要提升数据冗余的安全性。 网管bitscn_com

    最后,人为错误:当一块硬盘坏掉时,维护人员会用一块新盘来取代这个坏掉的盘。此时如果发生维护人员拔错硬盘的状况,就会造成同时掉两块盘的状况,RAID 数据将丢失。基于人为因素的不可控性,此类情况的发生概率也不容忽视。

中国网管联盟bitsCN.com

依然光明的发展前景
    服务器或者存储系统如果同时损坏两块盘,在没有RAID6的情况下,硬盘中的数据将会无法恢复,而造成无法估量的损失。尽管两块硬盘同时损坏比一块盘损坏的可能性要小很多,但是随着SATA硬盘容量的增大和磁盘密度的增加,在许多情况下,我们无法忽略两块硬盘损坏的情况下可能对系统造成的损失。 网管联盟bitsCN_com

    基于RAID6目前的性能和安全瓶颈,RAID6正被逐渐在中低端磁盘阵列的磁盘容错系统中得到应用,因为中低端用户本身对数据的读写性能和安全性都没有过高的要求。我们不建议将现阶段的RAID6技术应用于大型数据库的关键实时应用中,由此带来的性能和安全问题将使双磁盘容错成为得不偿失的一种数据安全保护方案。 网管bitscn_com

    但是否大型数据库就不需要双磁盘容错保护方案呢?尽管高端系统大多数情况下采用了可靠性较高的光纤硬盘,尽管RAID6某种程度上以牺牲性能为代价,尽管RAID6耗损了额外的存储空间,但谈到RAID6,我们依然面露期望的神色。因为双磁盘容错对于数据安全为第一位的高端系统实在是太重要了。而随着下一波SAS系统的快速普及, RAID6还将在更为广泛的领域发挥重要的作用。

网管联盟bitsCN_com

    从目前RAID6的发展来看,RAID6加速芯片的研究正成为该技术发展的瓶颈,除了Intel,其他诸如Promise等公司也都开始RAID6硬件解决方案的研究。随着P+Q算法的优化和ASIC芯片发展,RAID6的写入速度慢的缺点也会进一步得到解决。RAID6必将为用户带来更好的利益,给存储市场带来更好的前景。 中国网管联盟bitsCN.com


TAGs   完善   进一步   看上去   RAID6   硬盘   系统   磁盘   故障   数据      
 上一篇:存储虚拟化第二次浪潮:更加注重可实现性   下一篇:数据有效存档,你该选择何种介质?
Raid6:看上去很美,尚待进一步完善 评论:
loading.. 评论加载中…
评论:请自觉遵守互联网相关政策法规,评论不得超过250字。

验证码: 注册用户
本类热门排行:
最新推荐文章:
网管论坛交流: