CN111475475A

CN111475475A - 一种数据矩阵的差异化压缩存储模型

Info

Publication number: CN111475475A
Application number: CN202010251491.2A
Authority: CN
Inventors: 陈正生; 郑晓龙; 李邦杰; 李雪瑞; 杨晓云; 管冬冬; 郝辉; 苏明晓; 崔阳; 吕浩
Original assignee: Rocket Force University of Engineering of PLA
Current assignee: Rocket Force University of Engineering of PLA
Priority date: 2020-04-01
Filing date: 2020-04-01
Publication date: 2020-07-31

Abstract

本发明公开了一种数据矩阵的差异化压缩存储模型，具体步骤如下：按照矩阵元素的物理或数学意义(即精度要求)，将矩阵分为高精度，一般精度，低精度等不同精度要求的区域；分别对这些区域设计相应的满足精度的数据结构；将不同区域或精度要求的数据，采用数据集合，分别单独存储。本发明在运用的过程中，易于数据结构实现，适用于各种编程语言，在满足必要精度的前提下，实现了矩阵的压缩，兼顾了数据精度和数据压缩的需求；与适应性广，有利于进行推广运用。

Description

一种数据矩阵的差异化压缩存储模型

技术领域

本发明涉及数据矩阵技术领域，尤其涉及一种数据矩阵的差异化压缩存储模型。

背景技术

针对数据矩阵的常规算法存在着：特殊矩阵存储只能适应少数的特殊矩阵，通用性不足、已有通用算法并没有考虑矩阵本身的特点、有损失的压缩存储往往造成了较大的精度损失的缺点，且常规的压缩算法虽然具有较好的通用性，但是没有考虑到矩阵具体的应用背景，因此压缩效果难以再提高。为此，我们提出了一种数据矩阵的差异化压缩存储模型。

发明内容

本发明的目的是为了解决现有技术中存在的缺点，而提出的一种数据矩阵的差异化压缩存储模型。

为了实现上述目的，本发明采用了如下技术方案：

一种数据矩阵的差异化压缩存储模型，具体步骤如下：

S1：按照矩阵元素的物理或数学意义(即精度要求)，将矩阵分为高精度，一般精度，低精度等不同精度要求的区域；

S2：分别对这些区域设计相应的满足精度的数据结构；

S3：将不同区域或精度要求的数据，采用数据集合，分别单独存储。

优选的，在步骤S2中，所述的数据结构包括：双精度、单精度、半精度等。

本发明提出的一种数据矩阵的差异化压缩存储模型，有益效果在于：本方案在运用的过程中，实现简单，易于数据结构实现，适用于各种编程语言，在实现中，只需要将不同精度要求的数据，分区域分别存储即可；在满足必要精度的前提下，实现了矩阵的压缩，兼顾了数据精度和数据压缩的需求；与现有压缩算法兼容，可以在现有压缩算法基础上，实现矩阵的进一步压缩；适应性广，不仅适用于实例中用的浮点数，也适用于整形，字符串等其它类型的矩阵压缩，适用于对称矩阵，也适用于稀疏矩阵，且压缩倍率高，有利于进行推广运用。

附图说明

图1为具有不同区域特征的协方差矩阵的示意图；

图2为集中算法的压缩倍率趋势图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

一种数据矩阵的差异化压缩存储模型，具体步骤如下：

S2：分别对这些区域设计相应的满足精度的数据结构；

在步骤S2中，所述的数据结构包括：双精度、单精度、半精度等。

实施例1：

以测量平差中的平差矩阵计算为例。随着观测站点的数量的增加，平差矩阵的规模动辄上万阶次，给有限的存储和计算资源带来了困难。

在参数平差里面，主要有如下矩阵，系数阵

参数估值向量

常数向量

参数改正数向量

参数或改正数向量的协方差矩阵

以及法方程右手边向量

数据计算完毕后，需要存储这些有用的结果，其中重要的是参数向量

及其协方差矩阵

协方差矩阵是一个对称矩阵，常规存储法占用存储空间是对应参数向量存储空间的平方。但是协方差矩阵是一个对称阵。可以采用上、下三角矩阵的形式存储。然而即使这样存储后，仍然占用较大的存储空间。

对于协方差矩阵，采用本发明的存储方法如下：

首先将其划分不同的区域，如图1所示，本例中，可以划分三个区域，分别用中区域、上区域、下区域表示，其中上区域、下区域对称相等，即a[i,j]＝a[j,i]，因而只需要存储上区域或下区域其中一个区域即可。在协方差阵中，主对角线是对应参数的协方差估值，是最重要的计算指标之一，而非对角线部分是参数之间的联系数，通常只需要查看其相对数值，是次重要的数据。

不难得出，对于协方差阵这种对称矩阵，若不压缩，则需存储元素个数为m²个；采用三角形压缩存储算法需要存储的元素个数为:m+(m-1)+...+2+1＝m(m+1)/2。

m+(m-1)+...+2+1＝m(m+1)/2

若以本发明算法，令主对角线为重要数据，为m个，其它为非重点数据为m(m-1)/2个。设重点参数存储类型所占空间为a，非重点为b，则差异存储法所占空间为S＝a·m+b·m·(m-1)/2＝m(a+b(m-1)/2)

若以原始存储算法所占空间为被除数，改进算法存储空间为除数，可以得到所压缩存储空间的倍数，如下表1所示。

表1不同算法压缩的倍数

名称	所占存储空间	压缩倍数
			原始存储法	am	1
高精度三角存储	am(m+1)/2	2m/(m+1)
			差异三角存储	am+bm(m-1)	a/[a+b(m-1)]
低精度三角存储	bm(m+1)/2	2ma/[(m+1)b]

对于协方差阵，以重点参数的精度需求为双精度(1个数值8byte)，而非重点为单精度(1个数值4byte)为例，差异存储法所占空间为S＝8·m+2·m·(m-1)＝2m(m+3)

根据矩阵的不同阶次，可得占用存储空间如下表2所示：

表2不同存储算法所占用的存储空间(单位：Byte)

进一步的从图2可以看出：在1000阶次以上时，采用三角存储的单双精度差异存储法与全单精度存储法的节约倍数基本一致都为4倍。

同样，按照精度够用原则，若非重要区域可以采用更低的数据结构如只有16位(2个字节)半精度浮点数，则最多可以压缩存储空间为16倍！

综上所述：本发明在运用的过程中，实现简单，易于数据结构实现，适用于各种编程语言，在实现中，只需要将不同精度要求的数据，分区域分别存储即可；在满足必要精度的前提下，实现了矩阵的压缩，兼顾了数据精度和数据压缩的需求；与现有压缩算法兼容，可以在现有压缩算法基础上，实现矩阵的进一步压缩；适应性广，不仅适用于实例中用的浮点数，也适用于整形，字符串等其它类型的矩阵压缩，适用于对称矩阵，也适用于稀疏矩阵，且压缩倍率高，有利于进行推广运用。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种数据矩阵的差异化压缩存储模型，其特征在于，具体步骤如下：

S2：分别对这些区域设计相应的满足精度的数据结构；

2.根据权利要求1所述的一种数据矩阵的差异化压缩存储模型，其特征在于，在步骤S2中，所述的数据结构包括：双精度、单精度、半精度等。