网易企业邮箱,中国企业邮箱第一品牌
  • 咨询电话: 400-999-7163
    当前位置: 首页 >> 常见问题 >> 行业问题

    网易企业邮箱采用什么样的存储技术保证用户的安全备份?采用什么样的RAID备份方案?

    时间:2022.03.31

    采用什么样的存储技术保证用户的安全备份?采用什么样的备份方案?



    用户数据和邮件数据全部采用raid6来保护用户数据的安全,并实时监控raid6的健康状况。


    RAID6技术是在RAID 5基础上,为了进一步加强数据保护而设计的一种RAID方式,实际上是一种扩展RAID 5等级。与RAID 5的不同之处于除了每个硬盘上都有同级数据XOR校验区外,还有一个针对每个数据块的XOR校验区。当然,当前盘数据块的校验数据不可能存在当前盘而是交错存储的,具体形式见图。这样一来,等于每个数据块有了两个校验保护屏障(一个分层校验,一个是总体校验),因此RAID 6的数据冗余性能相当好。但是,由于增加了一个校验,所以写入的效率较RAID 5还差,而且控制系统的设计也更为复杂,第二块的校验区也减少了有效存储空间。


    raid 6是由一些大型企业提出来的私有raid级别标准,它的全称叫“independent data disks with two independent distributed parity schemes(带有两个独立分布式校验方案的独立数据磁盘)”。这种raid级别是在raid 5的基础上发展而成,因此它的工作模式与raid 5有异曲同工之妙,不同的是raid 5将校验码写入到一个驱动器里面,而raid 6将校验码写入到两个驱动器里面,这样就增强了磁盘的容错能力,同时raid 6阵列中允许出现故障的磁盘也就达到了两个,但相应的阵列磁盘数量最少也要4个。

    RAID-6 是在RAID-5基础上把校验信息由一位增加到两位的raid 级别。

    RAID-6和RAID-5一样对逻辑盘进行条带化然后存储数据和校验位,只是对每一位数据又增加了一位校验位。这样在使用RAID-6时会有两块硬盘用来存储校验位,增强了容错功能,同时必然会减少硬盘的实际使用容量。以前的raid级别一般只允许一块硬盘坏掉,而RAID-6可以允许坏掉两块硬盘,因此,RAID-6 要求至少4块硬盘。




    在实际应用中RAID6的应用范围并没有其它的RAID模式那么广泛。因为实现这个功能一般需要设计更加复杂、造价更昂贵的RAID控制器,所以它一般也不会集成在主板上。

    RAID6的性能:

    既然RAID6是最新的RAID冗余技术,那么他的性能应该是非常不错的。

    (1)RAID6的随机读取性能:很好(当使用大数据块时)。

    (2)RAID6的随机写入性能:差,因为不但要在每硬盘上写入校验数据而且要在专门的校验硬盘上写入数据。

    (3)RAID6的持续读取性能:好(当使用小数据块时)。

    (4)RAID6的持续写入性能:一般。

    (5)RAID6的优点:快速的读取性能,更高的容错能力。

    (6)RAID6的缺点:很慢的写入速度,RAID控制器在设计上更加复杂,成本更高。

    RAID6技术虽好不过并不是每个企业都可以用得到的,而且他的高额价格也不是谁都承担得起的,对于大部分中小企业来说数据的保存所需级别并没有那么高,这种情况下我们只需要使用常规的RAID5即可。就现在而言,对于那些数据中心,信息中心等对数据安全级别要求比较高的企业,使用RAID6保护数据还是有必要的。



    RAID6与RAID5数据安全性对比

    磁盘阵列(disk array)可以有效的提高存储系统的可靠性和性能,同时也存在显著的缺点,那就是由于多个设备(磁盘)同时使用,导致了可靠性降低(从概率的角度来讲:N个设备的可靠性是一个设备的1/N)。

    解决方案

    RAID(Redundant array of inexpensive disk)就是为了解决这个问题而产生的,RAID通过给磁盘阵列增加冗余磁盘提高了磁盘阵列的可靠性。所谓冗余磁盘,即该磁盘不用于存放实际数据,而用来存放一些冗余信息,而这些冗余信息可用来在必要的时候进行有效数据恢复,从而增加磁盘阵列的可靠性,翻译成中文应该叫廉价磁盘冗余阵列。

    在RAID6出现之前,RAID已经有了从RAID0~RAID5六个版本。那么我们已经有了这么多的RAID方式,提供了相当级别的可靠性保护,为什么我们还需要RAID6?在这里,我们这里先比较研究一下几种比较有代表性的RAID方式:

    磁盘冗余家族概览

    目前应用最广泛,支持设备最多的RAID方式主要是RAID0,RAID1和RAID5

    (1)无冗余(RAID0):RAID0实际上不能算做真正的RAID技术,它只是实现了磁盘阵列存放数据的带状分布。虽然提高了大规模数据访问的性能,但是RAID0并没有冗余容错的功能,因为它本身并无冗余,所以可以说这里的RAID0是个误称


    (2)镜像(RAID1):RAID1同样实现了数据的带状分布,与RAID0所不同的是,在数据写入一个磁盘的时候,同时在另一个磁盘做相应的镜象。因此,RAID1虽然有数据容错功能,但是其对磁盘的利用率实在比较底,仅为50%。


    (3)奇偶校验(RAID5):相对于RAID1比较,RAID5也是仅仅实现了单个磁盘的冗余纠错功能,但是却大大提高了磁盘的有效利用率。以RAID5(4D+P)为例子来讲,使用4块磁盘存放数据位,使用1块磁盘存放校验位。其基本原理是这样的:根据条带化的数据4D(使用四位数据)生成一位的校验信息,存放在第五块磁盘中。



    生成P校验位的公式一般是这样的:
    P = D1  D2  D3
    P为校验位,D1~D3分别代表三个数据位,表示异或操作。
    可以看到,当D1,D2,D3中其余的一个数据丢失的时候,可以利用其余的三个数据位和校验位P进行恢复,具体的恢复公式如下:
    例如,当D1丢失的时候,D1 = D2  D3  P
    同时可以看到,当两快磁盘出现故障的时候,RAID5无法恢复。

    RAID6:突破磁盘冗余局限

    RAID5已经提供了一定程度的可靠性,然而也牺牲了一定的读取速度。特别是在RAID重构作业中,大量的数据读写操作增加硬盘的负担,旧的硬盘更容易发生故障。RAID5的局限性还表现在RAID5仅能在一块硬盘发生故障的情况下修复数据,如果2块硬盘同时发生故障,RAID5则无能为力。

    以前,两块盘同时坏的情况是小概率事件,几乎不可能发生。但是近来随着光纤(FC)盘和SATA盘的容量和密度不断增加,使得RAID 5的重建时间也不断增加。两块硬盘同时损坏的概率也大幅增加,在企业级存储上,这种风险必须得到重视。所以RAID6应需诞生了。

    RAID6同RAID5最大的区别就是在RAID5的基础上除了具有P校验位以外,还加入了第2个校验位Q位。以RAID6(6D+1P+1Q)为例子,这个系统需要8块硬盘,其中6块用于存放数据,1块用于存放P校验位,1块用于存放Q校验位。当然,我得又一次强调,并非某个具体的独立的盘全部用来存放P校验信息,另外一个Q校验信息。而是对于某个位组(6个数据位+P位+Q位)来说,采用某种原则,6块盘上存放数据位,1块盘存放P位,1块盘用来存放Q位。


    其数学原理如下:
    校验位的生成:
    P = D1  D2  D3
    Q = GF(D1)  GF(D2)  GF(D3)
    D1~D3:条带化的数据
    P:P校验位
    Q:Q校验位
    :异或操作
    GF(D1):对D1位进行Galois Field变换。


        当一块磁盘出现数据错误或者丢失的时候,恢复方法同RAID5,无须使用Q校验位。当两块磁盘上的数据出现错误或者丢失的时候,恢复方法为:利用上边给出的P,Q的生成公式,联立方程组,无论受损的数据是否包括P或者Q,总是能够解出损失的两位的数据。


        RAID6与RAID5数据安全性比较:

        针对同样是8个磁盘,数据利用率同样是75%,但分别用RAID5和RAID6进行构建的磁盘阵列情况进行比较。一个用两个独立的RAID5(3D+1P)构建;另一个用RAID6(6D+1P+1Q)构建,应用伯努利(Bernoulli)概率分布分析如下( 假设单个磁盘在10年内出现故障的概率是):

    两个独立的RAID5(3D+1P)构建的系统数据安全的概率分析:

    在三种情况下,该系统的数据是安全的:
    1. 8个磁盘都没有损坏的情况,概率是
    2. 8个磁盘只有一个损坏的情况,概率是
    3. 两个独立RAID5(3D+1P)系统中,各损坏一个磁盘的情况,概率是
    所以,两个独立的RAID5(3D+1P)构建的系统数据安全的总概率是

    一个RAID6(6D+1P+1Q)构建的系统数据安全的概率分析:
    1. 8个磁盘都没有损坏的情况,概率是 [与上个系统相同]
    2. 8个磁盘只有一个损坏的情况,概率是  [与上个系统相同]
    3. 8个磁盘中有两个损坏的情况,概率是
    所以,一个RAID6(6D+1P+1Q)构建的系统数据安全的总概率是

    实际一点,假设单个磁盘在10年内出现故障的概率是 ,则用RAID5构建的系统,十年内不出故障的安全概率为99.881629%;对比用RAID6构建的系统,十年内不出故障的安全概率为99.994607%。

    可见,RAID6的数据安全级别是相当高的。当然RAID5的安全性也相当好了。从上面数据看起来,两者相差不大。但是对于出现故障的概率RAID5是0.118371%, RAID6是0.005393%.这样看来,提高还是很大的。随着磁盘的容量越来越大导致数据出错概率 的增大。两者的差距还会进一步加大,RAID6的优势就更明显了。而当磁盘容量增至20多TB的时候,RAID6的安全性比RAID5已经高出1000倍左右。

    总结篇

    RAID6与RAID5区别总结如下:

        RAID6是在RAID5的改进,RAID6不仅能在一个磁盘离线的情况下将数据恢复(使用和RAID5一样的异或校验),而且由于用了两个盘作为纠错盘,所以能应付两个磁盘同时离线的情况。

    1、冗余和数据恢复能力


    2、读写性能差别


    3、硬盘利用率


    在使用大数据块的情况下,RAID6的随机读取性能很好;因为不但要在每硬盘上写入校验数据而且要在专门的校验硬盘上写入数据,RAID6的随机写入性能很差。RAID6的持续写入性能一般,在使用小数据块时表现很好。总体而言,RAID6拥有更快速的读取性能,更高的容错能力。但同时,RAID6也存在写入速度很慢的缺点,RAID控制器在设计上更加复杂,成本更高。


    以上是网易企业邮箱raid5和6的一些资料信息,如果需要更加详细的raid1 raid2 raid5 raid6 raid10的信息,可以查看,raid1 raid2 raid5 raid6 raid10五种raid冗余磁盘阵列史上最全解析,其他模式可以参考:JBOD模式,basic模式,shr模式三种模式史上最全解析

    25年技术沉淀,专注企业邮箱

    

    查看更多+ 热门问题

    查看更多+ 新闻中心

    咨询电话:
    400-999-7163

    在线QQ咨询:
    点击这里给我发消息
    • 网易企业邮箱优秀经销商

      连续多年获得网易优秀经销商

    • 23年只专注于企邮行业

      一心一意专心致力于企业邮箱

    • 一站式服务

      满足企业信息化个性需求

    • 售后保障

      一对一邮箱顾问服务

    网易企业邮箱 - 产品介绍 - 开通邮箱 - 成功案例 - 产品报价 - 优惠活动 - 常见问题 - 关于我们 - 服务范围 - 站点地图 - 核心服务 -
    全部区域: - 上海 - 北京 - 安徽 - 福建 - 甘肃 - 广东 - 广西 - 贵州 - 海南 - 河北 - 河南 - 黑龙江 - 湖北 - 湖南 - 吉林 - 江苏 - 江西 - 辽宁 - 内蒙古 - 宁夏 - 青海 - 山东 - 山西 - 陕西 - 四川 - 天津 - 西藏 - 新疆 - 云南 - 浙江 - 重庆 - 香港 - 澳门 - 台湾 - 企业邮箱申请 -
    Copyright © 2018-2021 网易企业邮箱申请购买中心 客服热线:400-999-7163
    咨询电话
    400-999-7163
    E-mail
    admin@163biz.com