WO2015010476A1

WO2015010476A1 - 数据恢复方法、数据恢复设备和分布式存储系统

Info

Publication number: WO2015010476A1
Application number: PCT/CN2014/073383
Authority: WO
Inventors: 马晓慧; 孙亚萍; 陈海啸
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2013-07-26
Filing date: 2014-03-13
Publication date: 2015-01-29
Anticipated expiration: 2016-01-26
Also published as: EP2854033A4; EP2854033A1; CN103412799A; US20150033070A1; US9529675B2; CN103412799B; EP2854033B1

Abstract

本发明涉及数据恢复方法、数据恢复设备和分布式存储系统，该方法包括：在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定；根据恢复后的所述目标数据存储节点的数据，降级恢复剩余的丢失数据。本发明实施例采用校验数据进行数据恢复可以保证分布式系统如云存储存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能。

Description

数据恢复方法、数据恢复设备和分布式存储系统本申请要求于 2013年 7月 26日提交中国专利局、申请号为 201310320300. 3、发明名称为 "数据恢复方法、数据恢复设备和分布式存储系统" 的中国专利申请的优先权，其全部内容通过弓 I用结合在本申请中。技术领域本发明涉及计算机技术领域，尤其涉及一种数据恢复方法、数据恢复设备和分布式存储系统。背景技术随着云计算技术的普及，云存储也越来越贴近人们的生活。云存储的供应商也在逐年增加，目前业界的供应商数已达到了将近 200个。数据可以被存放在远程的云存储系统上，因此可以极大的降低了对本地存储的需求。但是云存储依然面临着诸多问题：如何以最小的成本，为用户数据提供最高的可靠性；如何保证用户数据的安全性，不被窃取、加密等。

为了保证用户数据的安全性，可以将同一份数据复制多份副本（repl ication), 存放在不同的存储节点上。如果某一存储节点出错，但只要还有一个存储节点存在，用户就可以获取这个数据。例如：做三个副本，空间的浪费达到原始数据的 3倍。对于云存储供应商而言，采用副本的存储空间浪费严重，成本很高。

为了提升存储的空间利用率，可以采用纠删码（Erasure Code ) 替代副本，纠删码是一种被普遍采用的数据冗余纠错算法。其中，最著名的 Erasure Code是 Reed Solomon Code (里德所罗门码）采用 GF矩阵和数据相乘，可以得到了校验码。但是，对于计算机 CPU ( Central Processing Unit , 中央处理器）而言，乘法的性能很低，因此 Reed Solomon Code算法的性能较低。此外，目前的 Reed Solomon Code算法中数据的位宽最大为 32位，由于位宽越大性能越高，对性能具有很大限制。

此夕卜，早期 IBM提出的 EVEN0DD, 是针对 RAID ( redundant array of independent disks ,独立磁盘冗余阵列）系统的一种冗余度为 2 (具有两组校验数据）的算法。 cheng huang和 l ihao xu提出将其推广到冗余度为 3 (具有三组校验数据）的 STAR算法（添加斜率为 -1的校验）。

在三个数据存储节点（即三个数据磁盘）丢失时，采用 EVEN0DD与 STAR的恢复算法复杂且编码实现难度大；在两个数据存储节点和水平校验节点（即两个数据磁盘、水平校验磁盘）丢失时，需要先恢复水平校验节点的数据，再恢复数据存储节点的原始数据，恢复性能较低，而且算法不易于编码实现。发明内容

有鉴于此，本发明要解决的技术问题是，现有分布式存储系统的数据恢复性能较低。为了解决上述技术问题，根据本发明的一实施例，提供了一种数据恢复方法，包括：在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定；

根据恢复后的所述目标数据存储节点的数据，降级恢复剩余的丢失数据。

对于上述数据恢复方法，在一种可能的实现方式中，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点；所述根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，包括：

根据校验数据，生成对角调节因子和逆对角调节因子，所述校验数据包括水平校验节点、对角校验节点和逆对角校验节点的数据；

根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据；

根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过优化的十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据。

对于上述数据恢复方法，在一种可能的实现方式中，所述根据校验数据，生成对角调节因子和逆对角调节因子，包括：

0 =¾ · θβ·)

采用公式 ' 生成所述对角调节因子；

R = Θ (P. ® R )

采用公式 ⁵ 。、 ' '；生成所述逆对角调节因子；

其中， ft为所述对角调节因子，为所述逆对角调节因子， ^为所述水平校验节点的第个条带单元数据， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， 0≤i≤p-2， p为大于或等于数据存储节点的个数的素数。

对于上述数据恢复方法，在一种可能的实现方式中，所述根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据，包括：采用公式 = ®( ), ,)生成所述第一水平校验数据；采用公式 = a ® a ® ( ¾' D_<t__]>p ) 生成所述第一对角校验数据；采用公式 = ® ®( ¾¹ Ζ)<,_{+ ί>} ,) 生成所述第一逆对角校验数据；其中，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据，为第列数据存储节点的第个条带单元的数据， r、 _S、 t为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤J'≤P'-1 ， 0<r<s<t<p'_p为对 p进行取模运算。

对于上述数据恢复方法，在一种可能的实现方式中，所述根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据，包括：

通过十字交叉运算建立丢失数据的丢失盘号处于中间的数据存储节点的公式： k -D_ds ® D © D ® D_<d+a+b>p,_s = P_<d>p ® P ® R ® Q ；其中， 0≤ί ≤ρ-1 _; s为所述丢失盘号处于中间的数据存储节点的盘号； a、 b为丢失的三个数据存储节点之间的盘号差， a = _S-_r,b = t-s

根据丢失数据的数据存储节点的盘号差确定的移动的步长和循环异或求和次数，对所述丢失盘号处于中间的数据存储节点的公式进行消元处理后，将所有丢失的数据存储节点的条带单元数据转化为所述丢失盘号处于中间的数据存储节点的两个条带单元数据的异或和，求出所述丢失盘号处于中间的数据存储节点的数据。

对于上述数据恢复方法，在一种可能的实现方式中，所述对所述丢失盘号处于中间的数据存储节点的公式进行消元处理后，将所有丢失的数据存储节点的条带单元数据转化为所述丢失盘号处于中间的数据存储节点的两个条带单元数据的异或和，包括：对所述丢失盘号处于中间的数据存储节点的公式采用，步长 offDis进行 k次异或求和，得到所述丢失盘号处于中间的数据存储节点公式 ® ⁾<„₊2minDis>_P ,, , 若

k = m，贝¹ J min Dis - b, offDis - a , 否贝¹ J min Dis - a, offDis - b , < + v x offDis >_p =d， 0 < < p - \ ;

其中，根据所述中间的数据存储节点的公式得到的循环方程组，用于表示所述中间的数据存储节点的两个数据的异或和，所述循环方程组的每一个公式至多具有两个变所述求出所述丢失盘号处于中间的数据存储节点的数据，包括：

根据所述丢失盘号处于中间的数据存储节点的虚拟补零的条带单元数据 ^__1Λ = 0，代入求解所述循环方程组中只具有一个变量的公式，根据求解结果依次求解所述循环方程组的其他公式，得到所述丢失盘号处于中间的数据存储节点的每个数据。

对于上述数据恢复方法，在一种可能的实现方式中，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，所述目标数据存储节点为丢失的所述两个数据存储节点的任意一个，所述根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，包括：

根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和；

根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据；

根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出丢失的所述两个数据存储节点的任意一个的数据。

对于上述数据恢复方法，在一种可能的实现方式中，所述根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和，包括：采用公式 ρ_χ ® = (^²β.)®(^² ），生成对角调节因子和逆对角调节因子的异或和，其中，为所述对角调节因子，为所述逆对角调节因子， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据，

0 < i≤p-2 , p为丢失的水平校验数据的盘号，且 p为大于或等于数据存储节点的个数的素数。

对于上述数据恢复方法，在一种可能的实现方式中，所述根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据，包括：采用公式 = Q Θ (θ' Ζ)<,—_>^)生成所述第二对角校验数据；采用公式 ^^,Φ^Φ¹ _;) 生成所述第二逆对角校验数据；其中，为所述第二对角校验数据，为所述第二逆对角校验数据，为第 j'列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ ·≤ρ'-1， 0<r<s<p'<p, <>_p为对 p进行取模运算。

对于上述数据恢复方法，在一种可能的实现方式中，所述根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出所述一个数据存储节点的数据，包括：

根据建立丢失数据公式， /^^^ ^^^^ ^^^ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_s θζ)_<Μ+2(ί— = G>_<u+S>p ® _u+s—_2r>p㊉ a㊉^，根据虚拟补零的条带单元数据 ^— _1Λ =0，求出第 s列数据存储节点丢失的数据；或

根据建立丢失数据公式/ ^ΘΖ)_<Μ+2(ί— ^®ft® = _M ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_r®D__<u+2s__r>p ®R ® ^，根据虚拟补零的条带单元数据 Ζ^ =0，求出第 r列数据存储节点丢失的数据。

为了解决上述技术问题，根据本发明的另一实施例，提供了一种数据恢复设备，包括- 目标恢复单元，用于在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定；

降级恢复单元，用于根据恢复后的所述目标数据存储节点的数据，降级恢复剩余的丢失数据。

对于上述数据恢复设备，在一种可能的实现方式中，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点；所述目标恢复单元包括：

调节因子生成模块，用于根据校验数据，生成对角调节因子和逆对角调节因子，所述校验数据包括水平校验节点、对角校验节点和逆对角校验节点的数据；

第一校验数据生成模块，用于根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据；

十字交叉运算模块，用于根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过优化的十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据。

对于上述数据恢复设备，在一种可能的实现方式中，所述调节因子生成模块具体用于：采用公式 ^ ' 生成所述对角调节因子；

R

采用公式 ^s - (P. ®

« Θ R )

·、 ' ' 生成所述逆对角调节因子；

其中，为所述对角调节因子，为所述逆对角调节因子，为所述水平校验节点的第个条带单元数据， β为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， Q≤i≤p-2， p为大于或等于数据存储节点的个数的素数。

对于上述数据恢复设备，在一种可能的实现方式中，所述第一校验数据生成模块具体用于- 采用公式 = φ ( A , )生成所述第一水平校验数据；

=0 " 采用公式 = ¾ Φ β Θ ( ¾' D_<t__{j>p j} ) 生成所述第一对角校验数据；生成所述第一逆对角校验数据；

其中，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据，为第列数据存储节点的第个条带单元的数据， r、 _S、 ί为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤j'≤p'-l ， 0<r<s<t<p'_p为对 p进行取模运算。

对于上述数据恢复设备，在一种可能的实现方式中，所述十字交叉运算模块具体用于：

通过十字交叉运算建立丢失数据的丢失盘号处于中间的数据存储节点的公式- -D_d,_s Φ D_<d+a〉 Φ D_<d+b>^^ Θ D_<d+a+b〉 = P_<d〉_p ® P ® Q 其中， 0≤ί ≤ρ-1 _; s为所述丢失盘号处于中间的数据存储节点的盘号；。、 6为丢失的三个数据存储节点之间的盘号差， _a = _S-r,b = t-_S;

对于上述数据恢复设备，在一种可能的实现方式中，所述十字交叉运算模块具体还用于- 对所述丢失盘号处于中间的数据存储节点的公式采用，步长 offDis进行 k次异或求和，得到所述丢盘号处于中间的数据存储节点公式

® ⁾<„₊2minDis>_P,, &k , 若

k = m，贝¹ J min Dis - b, offDis - a , 否贝¹ J min Dis - a, offDis - b , < + vx offDis >_p =d， 0<u< p-\;

根据所述丢失盘号处于中间的数据存储节点的虚拟补零的条带单元数据 ^__1Λ =0，代入求解所述循环方程组中只具有一个变量的公式，根据求解结果依次求解所述循环方程组的其他公式，得到所述丢失盘号处于中间的数据存储节点的每个数据。

对于上述数据恢复设备，在一种可能的实现方式中，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，所述目标恢复单元包括：

因子异或和模块，用于根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和；

第二校验数据生成模块，用于根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据；

对称消元运算模块，用于根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出丢失的所述两个数据存储节点的任意一个的数据。

对于上述数据恢复设备，在一种可能的实现方式中，所述因子异或和模块具体用于: 采用公式 ^ = (^²ρ,.)®(^² ），生成对角调节因子和逆对角调节因子的异或和，其中，为所述对角调节因子，为所述逆对角调节因子， β为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， Q≤i≤p-2， p为丢失的水平校验数据的盘号，且 p为大于或等于数据存储节点的个数的素数。

对于上述数据恢复设备，在一种可能的实现方式中，所述第二校验数据生成模块具体用于- 采用公式 Q;= Q Θ (¾' /)<,_ _>^)生成所述第二对角校验数据；采用公式 ^^,Φ^Φ¹ Ζ)<,₊ ,> _;) 生成所述第二逆对角校验数据；其中，为所述第二对角校验数据，为所述第二逆对角校验数据，为第 j'列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号， 0≤ ≤p'-1， 0≤r<s<p'≤p, <>_p为对 p进行取模运算。

对于上述数据恢复设备，在一种可能的实现方式中，所述对称消元运算模块具体用于：

根据建立丢失数据公式， /^^^ ^^^^ ^^^ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_s θζ)_<Μ+2(ί— = G>_<u+S>p ® ㊉ a㊉^，根据虚拟补零的条带单元数据 ^— _1Λ =0，求出第 s列数据存储节点丢失的数据；或根据建立丢失数据公式 D_u,_r Θ D_{<u+2 s} ,_r θ ¾ Θ W_s = G ㊉，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_r ® D__<u+2s__r>p ® R ® ® ，根据虚拟补零的条带单元数据 Ζ^ = 0，求出第 r列数据存储节点丢失的数据。

为了解决上述技术问题，根据本发明的另一实施例，提供了一种分布式存储系统，包括：多个数据存储节点、多个校验节点和数据恢复设备；

所述数据恢复设备采用本发明实施例中任意一种结构的数据恢复设备。

本发明实施例采用校验数据进行数据恢复可以保证分布式系统如云存储存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能。

根据下面参考附图对示例性实施例的详细说明，本发明的其它特征及方面将变得清楚。附图说明包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面，并且用于解释本发明的原理。

图 la为本发明实施例一的数据恢复方法的流程图；

图 11T图 Id为本发明实施例一的数据恢复方法中校验节点的示意图；

图 2a为本发明实施例二的数据分流方法的流程图；

图 2b为本发明实施例二的数据分流方法中的十字交叉运算的示意图；

图 2c为本发明实施例二的数据分流方法中的按步长进行循环异或求和的示意图；图 2d为本发明实施例二的数据分流方法中的按优化步长进行循环异或求和的示意图；

图 2e为本发明实施例二的数据恢复方法中数据存储的结构示意图；

图 3a为本发明实施例三的数据分流方法的流程图；

图 3b为本发明实施例三的数据分流方法中对称消元的示意图；

图 4为本发明实施例四的数据恢复设备的结构框图；

图 5为本发明实施例五的数据恢复设备的结构框图；

图 6为本发明实施例六的数据恢复设备的结构框图；

图 7为本发明的实施例七的数据恢复设备的结构框图；图 8为本发明的实施例八的分布式存储系统的结构框图。具体实施方式

以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词 "示例性"意为 "用作例子、实施例或说明性" 。这里作为 "示例性"所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本发明，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有这些具体细节，本发明同样可以实施。在另外一些实例中，对于大家熟知的方法、手段、元件和电路未作详细描述，以便于凸显本发明的主旨。

实施例一

图 la为本发明实施例一的数据恢复方法的流程图，如图 la所示，该数据恢复方法包括- 步骤 101、在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定。

步骤 102、根据恢复后的所述目标数据存储节点的数据，降级恢复剩余的丢失数据。优选地，如果分布式系统或 RAID中具有的数据存储节点（数据磁盘）个数为 p '，可以将每个数据存储节点划分为 p个条带单元，其中， p≥p '， p为素数即质数。此外，分布式系统或 RAID中可以具有 3个校验节点，因此总节点个数为; 7 '+3个。数据存储节点盘号为 0 ' - 1，每个盘分为 p - 1个同等大小的条带，条带编号的取值范围为 0 - 2，第行的条带数据为虚拟补零，在存储节点上不存在。从数学角度上，数据存储节点分块后可以看为一个矩阵 D，其中 ^D "可以表示第 j个数据存储节点第 i个条带单元数据， ^表示水平校验节点的第 i个条带单元数据， ρ,表示对角校验节点的第 i个条带单元数据，表示逆对角校验节点的第 i个条带单元数据。图 lb〜图 Id为本发明实施例一的数据恢复方法中校验节点的示意图，水平校验节点 P (parity I ) 的生成方式可以按照同类型的图案进行异或得到，参见图 lb ; 斜率为 " 1 " 的对角校验节点 Q (parity I I ) 的生成方式可以为数据存储节点中同类型的图形表示的数据异或后与最后一行的调节因子 ( adjuster) 的值异或而来，调节因子（adjuster) 不保存，参见图 lc; 斜率为的逆对角校验节点 R (parity I I I ) 的生成方式与对角校验节点类似，仅同类型的图形的在数据存储节点的位置为逆序，可以参见图 ld。此外，也可以采用其他斜率的校验节点，例如：斜率为 " 2 " 的校验节点、对角为 "_2 " 的校验节点等。

本发明实施例中，分布式存储系统丢失三个节点数据具体可以包括以下情况：情况一、在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点。

对于情况一，在恢复丢失的三个数据存储节点的数据时，先恢复的目标数据存储节点可以是丢失盘号处于中间的数据存储节点（简称中间节点）。例如：可以计算丢失盘号为最大的数据存储节点（简称最大节点）与中间节点的盘号差，以及丢失盘号为最小的数据存储节点（简称最小节点）与中间节点的盘号差，确定最少的异或次数和步长，将丢失最大节点和最小节点的数据转化为丢失的中间节点的两个条带单元数据异或和，从而得到 P对异或和，然后依据中间节点的虚拟补零的条带单元数据，逐步求得中间节点的所有条带单元的数据，进一步可降级恢复剩余两丢失的节点数据。

情况二、在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，所述目标数据存储节点为丢失的所述两个数据存储节点的任意一个。

对于情况二，在恢复丢失的水平校验节点和两个数据存储节点的数据时，可以先恢复丢失的数据存储节点的数据，提供给用户，然后恢复丢失的水平校验节点的数据。其中，对角校验节点和逆对角校验节点的调节因子异或和可以由这两个校验节点的所有条带单元数据异或而来。公共条带单元的对角校验节点的调节因子和逆对角校验节点的调节因子异或可以将两个丢失的数据存储节点的条带单元数据，转化为同一个丢失的数据存储节点的两条带单元数据异或和。然后，依据该这一个数据存储节点的虚拟补零的条带单元数据，可以逐步求得这一个数据存储节点的所有条带单元数据，进一步可恢复另一数据存储节点的数据和水平校验节点的数据。

本实施例采用校验数据进行数据恢复可以保证分布式系统存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能。此外，由于数据分布不同的数据存储节点中，有利于数据的保密，用户的数据更安全。在丢失三个数据存储节点的数据的情况下，首先恢复丢失盘号处于中间的数据存储节点，算法简单，易于编码实现; 在丢失水平校验节点和两个数据存储节点的数据的情况下，首先恢复一个数据存储节点，不仅算法简单，易于编码实现，还可以将恢复的数据存储节点先发给用户，并行恢复水平校验节点的数据，减少用户的等待时间，提高用户体检。

实施例二

图 2a为本发明实施例二的数据分流方法的流程图，图 2a与图 la标号相同的步骤具有相同的含义，为简明起见，省略对这些组件的详细说明。如图 2a所示，与上述实施例的区别在于：在上述实施例中所述的情况一，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，步骤 101根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，具体可以包括以下步骤：

步骤 201、根据校验数据，生成对角调节因子和逆对角调节因子，所述校验数据包括水平校验节点、对角校验节点和逆对角校验节点的数据。

具体地，设丢失号数据存储节点，其中 0≤r<s<t<p'≤ ;7，其主要思想是通过十字交叉组合先恢复中间节点。可以采用公式（1.1) 和公式（1.2) 生成调节因子 (adjuster)。其中对角校验节点的调节因子可以简称为对角调节因子，参见公式（1.1)；逆对角校验节点的调节因子可以简称为逆对角调节因子，参见公式（1.2)。

Q = ®(Ε θβ,·)

'·=。、， ¹， ( 1.1)

R =^P®(P. ®R )

s '·=。、， ^l， (1.2)

在公式（1.1)、（1.2)中，为所述对角调节因子，为所述逆对角调节因子， P_t 为所述水平校验节点的第个条带单元数据， β.为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， Q≤i≤_P-2， p为大于或等于数据存储节点的个数 p'的素数。

步骤 202、根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据。

具体地，可以采用公式（L 3)〜（1.5)生成新的校验数据。其中，采用公式（ 1.3) 生成第一水平校验数据；采用公式（ 1.4) 生成所述第一对角校验数据；采用公式 ( 1.4) 生成所述第一逆对角校验数据；

P; = P; θ( Θ D; ,.) (1.3)

R_t' = ^ Φ Φ ( θ' D_<i+ ,·> ,·) (1.5) 在公式（1.3)〜（1.5)，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据， D_tj为第列数据存储节点的第个条带单元的数据， r、 s、 t为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤j≤p'-l， 0<r<s<t<p'<p, <>_p为对 p进行取模运算。

步骤 203、根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过优化的十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据。

具体地，图 2b为本发明实施例二的数据分流方法中的十字交叉运算的示意图，如图 2b所示，十字交叉线经过奇数次的条带单元中包括一个三角，偶数次的条带单元中包括一个方形（两个三角组成），数据存储节点的条带单元数据具有对称性，包括方形的相交节点在进行异或运算的过程中可以消去，例如：经过/ 。的两条线上所有的数据存储节点的条带单元数据的异或运算，相当于消去了 Z 。。因此可以通过十字交叉运算，建立丢失数据的丢失盘号处于中间的数据存储节点的公式 a.6)：

A_d=D_{d s} Φ D_{<d+a>p S}®D_{<d+b>p S} Φ D_{<d+a+b>p s} = P_<'_d>p ® P_<'_d+a+b>p ® _d—_r>P ®Q<'_d+t>P ( 1· 6) 在公式（1.6) 中， 0≤ i≤_P_i ; s为所述丢失盘号处于中间的数据存储节点的盘号； a、 6为丢失的三个数据存储节点之间的盘号差， _a = _s-r,b = t-_S。

然后，根据丢失数据的数据存储节点的盘号差确定的移动的步长和循环异或求和次数，可以对所述丢失盘号处于中间的数据存储节点的公式进行消元处理后，将所有丢失的数据存储节点的条带单元数据转化为所述丢失盘号处于中间的数据存储节点的两个条带单元数据的异或和，求出所述丢失盘号处于中间的数据存储节点的数据，进行消元处理的具体方式可以包括：

通常，普通的用十字交叉运算可以包括：对丢失盘号处于中间的数据存储节点的公式采用步长 6进行欠异或求和，得到所述丢失盘号处于中间的数据存储节点的公式 (1.7):

D_u,_s® D_<u〜 (1.7) 在公式（1.7) 中，根据<^-^^6 =0确定，图 2c为本发明实施例二的数据分流方法中的按步长进行循环异或求和的示意图，如图 2c所示，以 6=2， =3为例，可以对盘号为 "2" 的数据存储节点进行消元处理，沿着十字交叉的四条线，按照步长 2进行 3 次异或求和后，将十字交叉线经过偶数次的条带单元/ ₂、 Z ₂、 Z ₂消去，可以得到仅包括两个变量的/ ₂、 Z ₂的异或和公式。盘号为 "2" 的数据存储节点的成对的条带单元数据之间的异或和公式可以类似得到。

优化的十字交叉运算具体可以包括：对所述丢失盘号处于中间的数据存储节点的τ公式，采用步长 offDis进行欠异或求和，若存在， im < min Dis - x offDis >_p=0, 以步长 offDis移动欠（即进行欠异或求和），可以得到所述丢失盘号处于中间的数据存储节点的公式 (1.8)：

k-l

A。㊉ D <w+2min Dis> _f =∑4 "<w+vxoffDis>_n (1.8) 其中，根据公式 α.9) 可以确定：

其中，若 k = m，贝 lj min Dis-ό, offDis -a，否贝 lj min Dis - a, offDis - ό， <_M + vxoffDis >_p =d, 0<u<p-l, A 为上述公式（1.6) 中一个十字交叉的四条线所过数据存储节点的数据的异或和，求解最优的后，由于先恢复中间节点的数据。例如：如果 a = 2,6 = l，可得 = 2，且以步长 offDis = 6 = 1移动异或，图 2d为本发明实施例二的数据分流方法中的按优化步长进行循环异或求和的示意图，如图 2d所示，按照步长 1进行 2次异或求和后，可以将 Z ₂、 D₂₂, Z ₂消去，可以得到仅包括两个变量的

Z ₂、 Z ₂的异或和公式。盘号为 "2" 的数据存储节点的成对的条带单元数据之间的异或和公式可以类似得到。

其中，根据所述中间的数据存储节点的公式得到的循环方程组，用于表示所述中间的数据存储节点的两个数据的异或和，所述循环方程组的每一个公式至多具有两个变进一步地，求出所述丢失盘号处于中间的数据存储节点的数据，具体可以包括：根据所述丢失盘号处于中间的数据存储节点的虚拟补零的条带单元数据 =0，代入求解所述循环方程组中只具有一个变量的公式，根据求解结果依次求解所述循环方程组的其他公式，得到所述丢失盘号处于中间的数据存储节点的每个数据。图 2e为本发明实施例二的数据恢复方法中数据存储的结构示意图，如图 2e所示，以 5个数据存储节点盘号为 "(Γ4" 为例，生成 3个校验节点 P、 Q、 R, 共 8个节点，将每个节点等大小划分为 4个条带，第 5条带（图中行号 4的黑色实心圆形）为虚拟补零的条带，根据这个五个数据存储节点生成的水平校验节点的盘号可以 "5"，对角校验节点的盘号可以为 "6"，逆对角校验节点的盘号可以为 "7"。水平校验节点 P (parity I) 的生成方式可以参见图 lb，对角校验节点 Q (parity II) 的生成方式可以参见图 lc，逆对角校验节点 R (parity III) 的生成方式可以参见图 ld。

对于情况一，参见图 2d所示，假设丢失节点 "0、 2、 3" ，根据本实施例的数据恢复方法，恢复这三个数据存储节点的数据的具体过程可以包括：

执行步骤 201，计算对角校验节点 Q、逆对角校验节点 R的调节因子，根据公式（1.1) 和公式（1.2) 可以得到公式（1.1.0) 和公式（1.2.0) ：

Q_s= P₀® P,® P₂® P^Q^Q^Q^Q, (1.1.0) ?, - ₀ ® ® ₂ ® ₃ ® i?₀ ® ?! ® i?₂ ® R₃ (1.2.0) 执行步骤 202、计算水平校验节点 P、对角校验节点 Q、逆对角校验节点 R的校验数据，根据公式（1.3) 可以得到第一水平校验数据的公式组（L3.0) ；将公式（1.1.0) 代入公式（L4) 可以得到第一对角校验数据的公式组（1.4.0) ，将公式（1.2.0) 代入公式（1.5) 可以得到第一逆对角校验数据的公式组（1.5.0) 。

(1. 3.0)

P^=D _l®D ₄®P_}

尸₄=0

Q₀=D_l @Q_s@Q₀

(1 =

= ®z ₄® ㊉

®D_l ®R_s®R₂

-D₂₄@R_s@R₃

= D₀,_t '㊉ A,₄㊉

执行步骤 203、确定最小的异或求和次数和步长 offDis。由于丢失的节点号差为 α = 0— 2 = 2,6 = 3— 2 = 1 ，代入公式 ( 1.9 ) 可以得到

<l-mx2>₅=0,<2-nxl>₅ = 0,m = 3,n = 2,k = min^n,n} = 2,因此，异或求和次数 A = 2 步长为 offDis=b=l，参见图 2b所确定的恢复方式符合公式（1.8)，可以将公式组（1.3.0)、 (1.4.0) 、 (1.5.0) 代入公式 (1.8) ，得到公式 (1.8.0) 。

k-l

D_u ® _<u+2x2>5 =∑ „_+νχ1>5 Θ _+2+1+νχ1>5 eR„__0+vxl>5®e„_+3+vxl>5 (1.8.0) ν=0

由于 ο≤"≤ρ-ι，公式 α.8.0)可以展开为循环方程组 α.8.1)，包括的 ρ-ι = 4 对数据的异或和，每个公式都是盘号为 "2" 的一对数据的异或和。

D₀₂ Θ D₄₂ = Ρ₀ Θ尸₃' Θ Θ ρ; Θ ' Θ Ρ_Α Θ ?; Θ Q₄'

Ζ ₂Θ Ζ ₂ = 'ΘΡ₄'Θ Θρ ΘΡ₂'ΘΡ。ΘΑ;Θρ。 ^ _g ^

D₂₂ Θ D_l2 = Ρ^® Ρ₀® R₂' @Q₀® ® ® ^₃®Q ， . .

D₃₂ Θ D₂₂ =Ρ;ΦΡ Φ ®Q[ ®P^@P^®R₄' ®Q₂' 由于 D₄₂条带单元数据为零，可以先计算循环方程组（L8.1) 中第一个公式中的

D₀₂，再根据 D_Q2计算第二个公式中的 D₁₂，从而逐个计算盘号为 "2"的数据存储节点的数据，然后，可降级为 EVEN0DD等形式恢复盘号为 "0" 、 "3" 的数据存储节点的数据。

本实施例采用校验数据进行数据恢复可以保证分布式系统存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能；在丢失三个数据存储节点的数据的情况下，首先恢复丢失盘号处于中间的数据存储节点，并且循环异或次数 k只用简单的数学公式即可求得，恢复时异或次数少，进一步节省所需的云存储处理内存，算法简单，易于编码实现。

实施例三图 3a为本发明实施例三的数据分流方法的流程图，图 3a与图 la标号相同的步骤具有相同的含义，为简明起见，省略对这些组件的详细说明。如图 3a所示，与上述实施例的区别在于：在上述实施例所述的情况二时，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，步骤 101中根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，具体可以包括以下步骤：

步骤 301、在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和。

具体地，设丢失 r， p号数据存储节点，其中 0≤r<s< ≤ ， a = s-r , 可以采用公式（2. 1) 生成对角调节因子和逆对角调节因子的异或和；

Q_S @R_S = (0² Q)0 (®² R_t) (2. 1) 其中， ft为所述对角调节因子，为所述逆对角调节因子， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， 0<i<p-2 , 为丢失的水平校验数据的盘号，且为大于或等于数据存储节点的个数的素数。

步骤 302、根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据。

具体地，可以采用公式（2.2) 和公式（2.3) 生成新的校验数据，其中，采用公式（2. 2) 生成第二对角校验数据；采用公式（2. 3) 生成所述第二逆对角校验数据；

^ =^@( @ D ) ( 2. 3) 其中， β:为所述第二对角校验数据，为所述第二逆对角校验数据， Z 为第列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ ·≤ -1， 0<r<s<p'<p, <>_p为对进行取模运算。

步骤 303、根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出丢失的所述两个数据存储节点的任意一个的数据。

具体可以包括以下方式：

方式一、先恢复第 S列数据存储节点丢失的数据。

可以根据建立丢失数据公式（2.4):

D_{u s} ®D_<u+2(s__r)>p^®Q_s ®R_S = Q_<'_u+S>p ®R ( 2.4) 对公式（2.4) 进行消元处理可以得到公式（2.5):

D_u,_s ® D_<u+2(s__r)>^_s = Q_<'_u+S>p ®R ®Q_S®R_S ( 2.5) 然后，根据虚拟补零的条带单元数据 ^__ΐΛ =ο，求出第 s列数据存储节点丢失的数据。

方式二、先恢复第 r列数据存储节点丢失的数据。

可以根据建立丢失数据公式（2.6):

D_u,_r®D_<u+2(s__r)>^_r®Q_s ®R_S = Q_<'_u+2s__r>p ® R_<'_u—_r>p ( 2.6) 对公式（2.6) 进行消元处理可以得到公式（2.7):

D_u,_r®D_<u+2(s__r)>^_r ^ Q_<'_u+2s__r>p ®R ®Q_S®R_S ( 2.7) 然后，根据虚拟补零的条带单元数据 D_p =0，求出第 r列数据存储节点丢失的数据。

其中，先恢复 ^和/ "都可以；图 3b为本发明实施例三的数据分流方法中对称消元的示意图，如图 3b所示，左侧一列数字中，标记为条带单元数据 "4" 的行是虚拟补零的行。对于情况二，假设丢失盘号为 "1" 、 "3" 的数据存储节点和水平校验节点 P，根据本实施例的数据恢复方法，具体可以包括：

执行步骤 301、计算对角校验节点 Q、逆对角校验节点 R的调节因子的异或和，根据公式（2.1) 可以得到公式（2.1.0) ：

执行步骤 302，计算对角校验节点 Q、逆对角校验节点 R的校验数据，根据公式（2.2) 可以得到第二对角校验数据的公式组（2.2.0) ；根据公式（2.3) 可以得到第一逆对角校验数据的公式组（2.3.0) 。

R₀ = D₀, _a®D₂₂@R₀

R[ = A,₀

R₂ =A, ₀®D_l @R₂ (2.3.0)

R₃ =A, ,®D_o @D₂ @R₃

®D₃ 执行步骤 303，参见图 3b，对公式（2.4)进行消元处理得到公式（2.5)，公式（2.5) 可以得到循环方程组（2.5.0)。例如：将两条线交叉的点进行异或运算，可以消除 D₃₁，得到 D₁₃、 I ^的异或和公式，参见如下循环方程组（2.5.0) 的第二个公式，以此方式可以得到循环方程组（2.5.0) 的所有公式。

由于 D₄₃条带单元数据为零，可逐个计算！ ₃,Ζ ₃,Ζ)₂,₃,Ζ)₃,₃条带单元数据，恢复盘号为 "3"的数据存储节点的数据，进一步恢复盘号为 "1"的数据存储节点的数据，最后恢复水平校验节点 Ρ的数据。

当然，也可以根据公式（2.7) ，先恢复恢复盘号为 "1" 的数据存储节点的数据，再恢复盘号为 "3" 的数据存储节点的数据，最后恢复水平校验节点 Ρ的数据。

本实施例采用校验数据进行数据恢复可以保证分布式系统存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能；在丢失水平校验节点和两个数据存储节点的数据的情况下，首先恢复一个数据存储节点，不仅算法简单，易于编码实现，恢复性能比先恢复水平校验节点高，还可以将恢复的数据存储节点先发给用户，并行恢复水平校验节点的数据，减少用户的等待时间，提高用户的满意度。实施例四

图 4为本发明实施例四的数据恢复设备的结构框图，如图 4所示，该数据恢复设备可以包括：

目标恢复单元 41，用于在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定；

降级恢复单元 43，用于根据恢复后的所述目标数据存储节点的数据，降级恢复剩余的丢失数据。

具体地，在分布式系统或 RAID中可以包括多个数据存储节点和校验节点，其中，每个数据存储节点可以分为多个条带单元。条带单元的个数一般大于或等于数据存储节点的个数，具体可以参见本发明数据恢复方法实施例中的相关描述。参见图 11T图 ld，校验节点可以包括水平校验节点、对角校验节点和逆对角校验节点，或者还可以包括斜率为 "2" 的校验节点、对角为 "-2" 的校验节点等。

本实施例采用校验数据进行数据恢复可以保证分布式系统存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能。

实施例五

图 5为本发明实施例五的数据恢复设备的结构框图，图 5与图 4相同的组件具有相同的含义，与上一实施例的区别在于：

如图 5所示，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点；该数据恢复设备的目标恢复单元 41可以包括：

调节因子生成模块 51，用于根据校验数据，生成对角调节因子和逆对角调节因子，所述校验数据包括水平校验节点、对角校验节点和逆对角校验节点的数据；

第一校验数据生成模块 53，用于根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据；

十字交叉运算模块 55，用于根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过优化的十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据。

在一种可能的实现方式中，所述调节因子生成模块 51具体可以用于：

Q = ®(P. ®Q. )

采用公式 ^ ' 生成所述对角调节因子；采用公式 ^s ' ' 生成所述逆对角调节因子；

其中，为所述对角调节因子，为所述逆对角调节因子， ^为所述水平校验节点的第个条带单元数据， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， 0≤i≤p-2，为大于或等于数据存储节点的个数的素数。

在一种可能的实现方式中，所述第一校验数据生成模块 53具体可以用于：采用公式/ = Φ ( Θ Z), _;)生成所述第一水平校验数据；

=0 " 采用公式 β: = ft Φ β Θ ( V D_i__j>p ) 生成所述第一对角校验数据；采用公式 = Φ Φ( Θ¹ D_<i+i> 生成所述第一逆对角校验数据；其中，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据，为第列数据存储节点的第个条带单元的数据， r、 _S、 t为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ ≤p'-l ， 0<r<s<t<p'_p为对进行取模运算。

在一种可能的实现方式中，所述十字交叉运算模块 55具体可以用于：

通过十字交叉运算建立丢失数据的丢失盘号处于中间的数据存储节点的公式： k —D_d,_s Φ D_{<c a}〉 Φ D_<d+b>p^_s Θ D_<d+a+b>^^_s = P_<d〉_p ® P ® Q 其中， 0≤ί ≤ -1 _; s为所述丢失盘号处于中间的数据存储节点的盘号； a、 b为丢失的三个数据存储节点之间的盘号差， a = _S-_r,b = t-s

根据丢失数据的数据存储节点的盘号差确定的移动的步长和循环异或求和次数，对所述丢失盘号处于中间的数据存储节点的公式进行消元处理后，将所有丢失的数据存储节点的条带单元数据转化为所述丢失盘号处于中间的数据存储节点的两个条带单元数据的异或和，求出所述丢失盘号处于中间的数据存储节点的数据。在一种可能的实现方式中，所述十字交叉运算模块 55具体还可以用于：

对所述丢失盘号处于中间的数据存储节点的公式采用，步长 offDis进行 k次异或求和，得到所述丢失盘号处于中间的数据存储节点公式

<b-mxa>_p=0

㊉ D ∑4 ，其中，根据公式 < <3_MX6 >_p= 0确定，若 k = minim, n) k = m , 贝 lj min Dis - b, offDis - a , 否贝¹ J min Dis - a, offDis - b , _p =d， 0<u< p-\;

根据所述丢失盘号处于中间的数据存储节点的虚拟补零的条带单元数据 ? =0，代入求解所述循环方程组中只具有一个变量的公式，根据求解结果依次求解所述循环方程组的其他公式，得到所述丢失盘号处于中间的数据存储节点的每个数据。

实施例六

图 6为本发明实施例六的数据恢复设备的结构框图，图 6与图 4相同的组件具有相同的含义，与上一实施例的区别在于：

如图 6所示，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，该数据恢复设备的目标恢复单元 41可以包括：

因子异或和模块 57，用于根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和；

第二校验数据生成模块 58，用于根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据；

对称消元运算模块 59，用于根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出丢失的所述两个数据存储节点的任意一个的数据。

在一种可能的实现方式中，所述因子异或和模块 57具体可以用于：采用公式 © =(^²β)®(^² ），生成对角调节因子和逆对角调节因子的异或和，其中，为所述对角调节因子，为所述逆对角调节因子， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据，

0<i<p-2 , 为丢失的水平校验数据的盘号，且为大于或等于数据存储节点的个数的素数。

所述第二校验数据生成模块 58包括：采用公式 β: = β Θ ( Θ¹ D_<t__{j>p j})生成所述第二对角校验数据；采用公式 Α^^,Φ^Φ¹ _;) 生成所述第二逆对角校验数据；

j

其中， β:为所述第二对角校验数据，为所述第二逆对角校验数据， Z 为第列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号， 0≤ j≤p'-l， 0<r<s<p'<p, <>_p为对进行取模运算。

在一种可能的实现方式中，对称消元运算模块 59具体可以用于：

根据建立丢失数据公式

=ρ _>ρ® _₂ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_s ®D_<u+2{s__r)>^ = Q_<'_u+S>p ®R @¾ @ ^，根据虚拟补零的条带单元数据 ^__1Λ =0，求出第 s列数据存储节点丢失的数据；或

根据建立丢失数据公式 ζ @Α_Μ+2 θ ® =ρ:_Μ+2^_>ρ® _>ρ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_r®D_{<u+2 s}—_r>p,_r = Q_<'_u+2s__r>p ®R ®Q_S®R_S ' 根据虚拟补零的条带单元数据 D_p =0，求出第 r列数据存储节点丢失的数据。

本实施例采用校验数据进行数据恢复可以保证分布式系统存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能；在丢失水平校验节点和两个数据存储节点的数据的情况下，首先恢复一个数据存储节点，不仅算法简单，易于编码实现，恢复性能比先恢复水平校验节点高，还可以将恢复的数据存储节点先发给用户，并行恢复水平校验节点的数据，减少用户的等待时间，提高用户的满意度。

实施例七

图 7为本发明的实施例七的数据恢复设备的结构框图。所述的数据恢复设备可以是具备计算能力的主机服务器、个人计算机 PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对计算节点的具体实现做限定。

所述数据恢复设备包括处理器（processor) 71、通信接口（Communications Interface) 72, 存储器（memory array) 73和总线 74。其中，处理器 71、通信接口 72、以及存储器 73通过总线 74完成相互间的通信。

通信接口 72用于与网元通信，其中网元包括例如虚拟机管理中心、共享存储等。处理器 71用于执行程序。处理器 71可能是一个中央处理器 CPU，或者是专用集成电路 ASIC (Appl ication Specific Integrated Circuit ), 或者是被配置成实施本发明实施例的一个或多个集成电路。

存储器 73用于存放文件。存储器 73可能包含高速 RAM存储器，也可能还包括非易失性存储器（non-volati le memory) , 例如至少一个磁盘存储器。存储器 73也可以是存储器阵列。存储器 73还可能被分块，并且所述块可按一定的规则组合成虚拟卷。

在一种可能的实施方式中，上述程序可为包括计算机操作指令的程序代码。该程序具体可用于：

在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定；

在一种可能的实现方式中，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点；所述根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，包括：根据校验数据，生成对角调节因子和逆对角调节因子，所述校验数据包括水平校验节点、对角校验节点和逆对角校验节点的数据；

在一种可能的实现方式中，所述根据校验数据，生成对角调节因子和逆对角调节因子，包括：

Q = ®(P. ®Q. )

采用公式 ^ ' 生成所述对角调节因子；采用公式 ^{s _}^。 ⁱ 生成所述逆对角调节因子；

其中， ft为所述对角调节因子，为所述逆对角调节因子， ^为所述水平校验节点的第个条带单元数据， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， 0≤i≤p-2，为大于或等于数据存储节点的个数的素数。

在一种可能的实现方式中，所述根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据，包括：采用公式 Φ( Θ 生成所述第一水平校验数据；

=0 " 采用公式 β: =Q_s®Q_i®( V D_i__j>p ) 生成所述第一对角校验数据；采用公式 = Φ Φ( Θ¹ D_<i+i> 生成所述第一逆对角校验数据；其中，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据，为第列数据存储节点的第个条带单元的数据， r、 _S、 t为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ j≤p'-l ， 0<r<s<t<p'_p为对 p进行取模运算。在一种可能的实现方式中，所述根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据，包括：

通过十字交叉运算建立丢失数据的丢失盘号处于中间的数据存储节点的公式： k —D_d,_s Φ D_{<c a} Φ D_<d+b>p^_s Θ D_<d+a+b>^^_s = P_{<d p} ® P ® Q 其中， 0≤ί ≤ρ-1 _; s为所述丢失盘号处于中间的数据存储节点的盘号； a b为丢失的三个数据存储节点之间的盘号差， a = _S-_r,b = t-s

在一种可能的实现方式中，所述对所述丢失盘号处于中间的数据存储节点的公式进行消元处理后，将所有丢失的数据存储节点的条带单元数据转化为所述丢失盘号处于中间的数据存储节点的两个条带单元数据的异或和，包括：

® ⁾<„₊2minDis>_P,, 确定，若

k = m , 贝 lj min Dis - b, offDis - a , 否贝¹ J min Dis - a, offDis - b , _p =d， 0<u< p-\;

在一种可能的实现方式中，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，所述目标数据存储节点为丢失的所述两个数据存储节点的任意一个，所述根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，包括：

在一种可能的实现方式中，所述根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和，包括：采用公式 © =(^²β)®(^² ），生成对角调节因子和逆对角调节因子的异或和，其中，为所述对角调节因子，为所述逆对角调节因子， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， 0<i<p-2 , 为丢失的水平校验数据的盘号，且为大于或等于数据存储节点的个数的素数。

在一种可能的实现方式中，所述根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据，包括：采用公式 β: = β Θ (Θ¹ D_<t__{j>p j})生成所述第二对角校验数据；采用公式 R; = Φ ( Θ¹ D_<i+ ,·> , ) 生成所述第二逆对角校验数据；其中， β:为所述第二对角校验数据，为所述第二逆对角校验数据， Z 为第列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ ·≤ρ'-1， 0<r<s<p'<p, <>_p为对进行取模运算。

在一种可能的实现方式中，所述根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出所述一个数据存储节点的数据，包括：

根据建立丢失数据公式 Α^@Ζ)_<μ+2( _>Ρ Θ ® =ρ_Μ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_s ® D_<u+2{s__r)>^ = Q_<' _u+S>p ® R @a @ ^，根据虚拟补零的条带单元数据 ^__1Λ = 0，求出第 s列数据存储节点丢失的数据；或

根据建立丢失数据公式 @ ® = _{M+2 p} ® _r>p ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_r ® D_{<u+2 s}—_r>p,_r = Q_<' _u+2s__r>p ® R @ ¾ ® ^，根据虚拟补零的条带单元数据 D_p = 0，求出第 r列数据存储节点丢失的数据。

实施例八

图 8为本发明的实施例八的分布式存储系统的结构框图。如图 8所示，该分布式存储系统包括：多个数据存储节点 81、多个校验节点 83和数据恢复设备 85 ;

其中，所述数据恢复设备 85采用本发明实施例中任意一种结构的数据恢复设备。本实施例采用校验数据进行数据恢复可以保证分布式系统存储空间的有效利用率，以满足分布式存储系统的性能要求；根据丢失数据的对称性确定首先恢复的目标数据存储节点，并根据校验数据和未丢失的数据对丢失的三个节点数据进行恢复，可以提升分布式存储系统丢失三个节点数据的情况下的数据恢复性能。

本领域普通技术人员可以意识到，本文所描述的实施例中的各示例性单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现，取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时，则在一定程度上可认为本发明的技术方案的全部或部分（例如对现有技术做出贡献的部分）是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的存储介质中，包括若干指令用以使得计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括 U盘、移动硬盘、只读存储器（ROM, Read-Only Memory)、随机存取存储器（RAM, Random Access Memory ) 磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

权利要求

1、一种数据恢复方法，其特征在于，包括：

2、根据权利要求 1所述的数据恢复方法，其特征在于，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点；所述根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，包括：

3、根据权利要求 2所述的数据恢复方法，其特征在于，所述根据校验数据，生成对角调节因子和逆对角调节因子，包括：

Q = ® (P. ® Q. )

4、根据权利要求 3所述的数据恢复方法，其特征在于，所述根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据，包括：采用公式 Φ( Θ 生成所述第一水平校验数据；

=0 " 采用公式 β: = ft Φ β Θ ( V D_i__j>p ) 生成所述第一对角校验数据；采用公式 = Φ Φ( Θ¹ D_<i+i> 生成所述第一逆对角校验数据；其中，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据，为第列数据存储节点的第个条带单元的数据， r、 _S、 t为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ j≤p'-l ， 0<r<s<t<p'_p为对进行取模运算。

5、根据权利要求 4所述的数据恢复方法，其特征在于，所述根据所述对角调节因子、逆对角调节因子、所述第一水平校验数据、第一对角校验数据和第一逆对角校验数据，通过十字交叉运算求出所述丢失盘号处于中间的数据存储节点的数据，包括：

通过十字交叉运算建立丢失数据的丢失盘号处于中间的数据存储节点的公式： k —D_d,_s Φ D_{<c a}〉 Φ D_<d+b>p^_s Θ D_<d+a+b>^^_s = P_<d〉_p ® P ® Q

其中， 0≤ί ≤ρ-1 _; s为所述丢失盘号处于中间的数据存储节点的盘号； a、 b为丢失的三个数据存储节点之间的盘号差， a = _S-_r,b = t-s

6、根据权利要求 5所述的数据恢复方法，其特征在于，所述对所述丢失盘号处于中间的数据存储节点的公式进行消元处理后，将所有丢失的数据存储节点的条带单元数据转化为所述丢失盘号处于中间的数据存储节点的两个条带单元数据的异或和，包括：对所述丢失盘号处于中间的数据存储节点的公式采用，步长 offDis进行 k次异或求和，得到所述丢失盘号处于中间的数据存储节点公式

<b-mxa>_p=0

®D_<w+2minDi = _<w+vx。其中，根据公式 <a-nxb>_p= 0确定，若 k = m im.n k二 m，贝' J min Dis = b, offDis = a , 否贝' J min Dis = a, offDis -b？ < w + v x offDis >_n =d , 0 < < p - \ ;

7、根据权利要求 1所述的数据恢复方法，其特征在于，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，所述目标数据存储节点为丢失的所述两个数据存储节点的任意一个，所述根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，包括：

8、根据权利要求 7所述的数据恢复方法，其特征在于，所述根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和，包括：采用公式 © = (^²β) ® (^² ），生成对角调节因子和逆对角调节因子的异或和，其中，为所述对角调节因子，为所述逆对角调节因子， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据， 0 < i < p-2 , 为丢失的水平校验数据的盘号，且为大于或等于数据存储节点的个数的素数。

9、根据权利要求 8所述的数据恢复方法，其特征在于，所述根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据，包括：采用公式 β: = β Θ ( Θ¹ D_<t__{j>p j})生成所述第二对角校验数据；采用公式 Α^^,Φ^Φ¹ _;) 生成所述第二逆对角校验数据；其中， β:为所述第二对角校验数据，为所述第二逆对角校验数据， Z 为第列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤ ·≤ρ'-1， 0<r<s<p'<p, <>_p为对进行取模运算。

10、根据权利要求 9所述的数据恢复方法，其特征在于，所述根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出所述一个数据存储节点的数据，包括：

根据建立丢失数据公式

根据建立丢失数据公式 @ ® = _{M+2 p}® _r>p ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 Α^ΘΖ^^—^^^^—^θ^—^θβθ^, 根据虚拟补零的条带单元数据 D_p =0，求出第 r列数据存储节点丢失的数据。

11、一种数据恢复设备，其特征在于，包括- 目标恢复单元，用于在分布式存储系统丢失三个节点数据的情况下，根据未丢失的校验节点和数据存储节点的数据，恢复所述三个节点数据中目标数据存储节点的数据，所述目标数据存储节点根据丢失数据的对称性确定；

12、根据权利要求 11所述的数据恢复设备，其特征在于，在丢失的所述三个节点数据包括三个数据存储节点的数据的情况下，所述目标数据存储节点为丢失盘号处于中间的数据存储节点；所述目标恢复单元包括：

调节因子生成模块，用于根据校验数据，生成对角调节因子和逆对角调节因子，所述校验数据包括水平校验节点、对角校验节点和逆对角校验节点的数据；第一校验数据生成模块，用于根据未丢失的数据存储节点的数据、所述对角调节因子和所述水平调节因子，生成第一水平校验数据、第一对角校验数据和第一逆对角校验数据；

13、根据权利要求 12所述的数据恢复设备，其特征在于，所述调节因子生成模块具体用于-

Q = ®(P. ®Q. )

14、根据权利要求 13所述的数据恢复设备，其特征在于，所述第一校验数据生成模块具体用于- 采用公式 Φ( Θ 生成所述第一水平校验数据；

=0 " 采用公式 β: = ft Φ β Θ ( V D_i__j>p ) 生成所述第一对角校验数据；采用公式 = Φ Φ( Θ¹ D_<i+i> 生成所述第一逆对角校验数据；其中，为所述第一水平校验数据，为所述第一对角校验数据，为所述第一逆对角校验数据，为第列数据存储节点的第个条带单元的数据， r、 _S、 t为丢失的数据存储节点的盘号，为数据存储节点的个数， 0≤j'≤ -l ， 0<r<s<t<p'_p为对进行取模运算。

15、根据权利要求 14所述的数据恢复设备，其特征在于，所述十字交叉运算模块具体用于：通过十字交叉运算建立丢失数据的丢失盘号处于中间的数据存储节点的公式： k —D_d,_s Φ D_{<c a} Φ D_<d+b>p^_s Θ D_<d+a+b>^^_s = P_{<d p} ® P ® Q 其中， 0≤ί ≤ρ-1 _; s为所述丢失盘号处于中间的数据存储节点的盘号； a b为丢失的三个数据存储节点之间的盘号差， a = _S-_r,b = t-s

16、根据权利要求 15所述的数据恢复设备，其特征在于，所述十字交叉运算模块具体还用于：

® ⁾<„₊2minDis>_P,, 确定，若

17、根据权利要求 11所述的数据恢复设备，其特征在于，在丢失的所述三个节点数据包括水平校验节点和两个数据存储节点的数据的情况下，所述目标恢复单元包括：因子异或和模块，用于根据所述对角校验节点和所述逆对角校验节点的数据，生成对角调节因子和逆对角调节因子的异或和；

第二校验数据生成模块，用于根据未丢失的数据存储节点的数据，生成第二对角校验数据和第二逆对角校验数据；对称消元运算模块，用于根据所述对角调节因子和逆对角调节因子的异或和、所述第二对角校验数据和第二逆对角校验数据，采用对称消元运算求出丢失的所述两个数据存储节点的任意一个的数据。

18、根据权利要求 17所述的数据恢复设备，其特征在于，所述因子异或和模块具体用于- 采用公式 © =(^²β)®(^² ），生成对角调节因子和逆对角调节因子的异或和，其中，为所述对角调节因子，为所述逆对角调节因子， ρ,为所述对角校验节点的第个条带单元数据，为所述逆对角校验节点的第个条带单元数据，

19、根据权利要求 18所述的数据恢复设备，其特征在于，所述第二校验数据生成模块具体用于- 采用公式 β: = β Θ (Θ¹ D_<t__{j>p j})生成所述第二对角校验数据；采用公式 Α^^,Φ^Φ¹ _;) 生成所述第二逆对角校验数据；

j

其中，为所述第二对角校验数据，为所述第二逆对角校验数据，为第 j'列数据存储节点的第个条带单元数据， r、 s为丢失的数据存储节点的盘号， 0≤ j≤p'-l， 0<r<s<p'<p, <>_p为对进行取模运算。

20、根据权利要求 19所述的数据恢复设备，其特征在于，所述对称消元运算模块具体用于- 根据建立丢失数据公式 ®ρ =ρ _>ρ® _₂ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_s ®D_<u+2{s__r)>^ = Q_<'_u+S>p ®R @a @ ^，根据虚拟补零的条带单元数据 ^__1Λ =0，求出第 s列数据存储节点丢失的数据；或

根据建立丢失数据公式 ζ @Α_Μ+2 θ ® =ρ:_Μ+2^_>ρ® _>ρ ，经过消元处理将丢失的两个数据存储节点的条带单元数据转化为一个数据存储节点的两个条带单元数据的异或和，得到公式 D_u,_r®D_{<u+2 s} ,_r = Q_<'_u+2s__r>p ®R ®Q_S®R_S ' 根据虚拟补零的条带单元数据 = 0，求出第 r列数据存储节点丢失的数据。

21、一种分布式存储系统，其特征在于，包括：多个数据存储节点、多个校验节点和数据恢复设备；

所述数据恢复设备采用权利要求 11-20中任一项所述的数据恢复设备。