WO2024259890A1

WO2024259890A1 - 数据备份方法、电子设备及计算机可读存储介质

Info

Publication number: WO2024259890A1
Application number: PCT/CN2023/133236
Authority: WO
Inventors: 闫泳冰
Original assignee: XFusion Digital Technologies Co Ltd
Current assignee: XFusion Digital Technologies Co Ltd
Priority date: 2023-06-19
Filing date: 2023-11-22
Publication date: 2024-12-26
Anticipated expiration: 2025-12-19
Also published as: CN116954996A

Abstract

本申请实施例公开一种数据备份方法、电子设备及计算机可读存储介质，该方法应用于电子设备，该电子设备包括中央处理器、内存和硬件加速设备，该内存包括第一缓冲区；该方法具体包括：读取第一数据文件中的第一数据，并将读取的第一数据存入第一缓冲区，其中，第一数据文件存储在原数据库目录对应的数据盘中；通过硬件加速设备压缩第一缓冲区中的第一数据，以生成第一数据对应的备份数据；将备份数据写入备份目录对应的数据盘中。本申请实施例，可以提高数据备份的效率。

Description

数据备份方法、电子设备及计算机可读存储介质

本申请要求在2023年6月19日提交中国国家知识产权局、申请号为202310729914.0，发明名称为“数据备份方法、电子设备及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据库领域，尤其涉及一种数据备份方法、电子设备及计算机可读存储介质。

背景技术

随着网络、通信技术的快速发展，海量数据正以前所未有的增长趋势冲击着各个行业。为了有效地管理、维护这些数据，用户通常会使用数据库进行数据存储。同时，为了防止数据库中的数据丢失，用户经常需要进行数据库的物理备份。

与此同时，如何提高数据库的物理备份效率是业界关注的问题。

发明内容

本申请实施例公开了一种数据备份方法、电子设备及计算机可读存储介质，可以提高数据库的物理备份效率。

第一方面公开一种数据备份方法，该数据备份方法可以应用于电子设备，也可以应用于电子设备中的模块(例如，芯片、中央处理器等)，还可以应用于能实现全部或部分电子设备功能的逻辑模块或软件(如下述备份工具)。该电子设备可以包括中央处理器、内存和硬件加速设备，该内存可以包括第一缓冲区，下面以应用于电子设备为例进行描述。该数据备份方法可以包括：读取第一数据文件中的第一数据，并将该第一数据存入该第一缓冲区，其中，该第一数据文件存储在原数据库目录对应的数据盘中；通过该硬件加速设备压缩该第一缓冲区中的第一数据，以生成该第一数据对应的备份数据；将该备份数据写入备份目录对应的数据盘中。

本申请实施例中，在进行数据库物理备份时，可以先将第一数据存入第一缓冲区中，然后可以通过硬件加速设备以第一缓冲区为单位进行数据的压缩，这样，可以保证硬件加速设备的性能得到充分利用，从而可以提高数据压缩的效率，进而可以提高数据库物理备份的效率。并且，通过硬件加速设备进行数据压缩，还可以降低电子设备的整体功耗。

作为一种可能的实施方式，该读取第一数据文件中的第一数据，并将该第一数据存入该第一缓冲区，包括：打开第一数据文件；在该第一缓冲区没有存入或者没有存满第一数据的情况下，读取该第一数据文件中的第一数据，并将该第一数据存入该第一缓冲区。

本申请实施例中，在第一缓冲区没有存入或者没有存满第一数据的情况下，才读取第一数据文件中的第一数据，并将读取的第一数据存入第一缓冲区中。这样，可以保证第一缓冲区中存储的第一数据不会被覆盖，从而可以保证数据的完整性，进而可以保证备份数据的完整性。

作为一种可能的实施方式，该通过该硬件加速设备压缩该第一缓冲区中的第一数据，包括：在该第一缓冲区中存满该第一数据的情况下，通过该硬件加速设备压缩该第一缓冲区中的第一数据。

本申请实施例中，在第一缓冲区存满之后，再压缩第一缓冲区中的数据，可以最大程度地发挥硬件加速设备的性能，从而可以提高数据库物理备份的速度。

作为一种可能的实施方式，该方法还可以包括：硬件加速设备完成压缩该第一缓冲区中的第一数据之后，将该第一缓冲区的状态变更为空闲状态。

本申请实施例中，可以通过为第一缓冲区设置状态标记，当第一缓冲区的状态标记为空闲时，可以使用第一缓冲区，向第一缓冲区中写入第一数据，当第一缓冲区的状态标记为非空闲时，不可以使用第一缓冲区。这样，可以保证电子设备可以基于第一缓冲区的状态标记充分利用第一缓冲区。

作为一种可能的实施方式，该第一缓冲区为多个，该方法还包括：从该第一数据文件中读取剩余数据，并将该剩余数据存入第二缓冲区中，该第二缓冲区为该第一缓冲区中的其余任意一个没有存入或者没有存满该第一数据的缓冲区；当该硬件加速设备完成压缩一个第一缓冲区中的第一数据，通过该硬件加速设备压缩该第二缓冲区中的数据。

本申请实施例中，第一缓冲区的数量可以为多个，这样，可以保证硬件加速设备在压缩一个第一缓冲区中的数据的同时，电子设备可以向其它没有存入或者没有存满数据的缓冲区写入数据，可以使得缓冲区的压缩和缓冲区的存储并行，从而可以进一步提高数据库物理备份的效率。

作为一种可能的实施方式，该将该第一数据存入该第一缓冲区中包括：校验该第一数据；在校验成功的情况下，将该第一数据页存入该第一缓冲区中。

本申请实施例中，在将读取的第一数据存入第一缓冲区之前，可以先进行校验，在校验成功的情况下，再将读取的第一数据存入第一缓冲区中，这样，可以避免存入错误的数据，可以保证备份数据的准确性。并且，通过数据校验还可以丢弃错误的数据，可以减少需要压缩的数据，从而可以节约电子设备的处理资源，同时，还可以降低电子设备的整体功耗。

作为一种可能的实施方式，该方法还包括：通过多个线程从该原数据库目录下多个数据文件中分别读取第一数据，并将读取的不同数据文件中的第一数据分别存入多个第一缓冲区没有存入或者没有存满该第一数据的缓冲区中；当第三缓冲区存满的情况下，通过该硬件加速设备压缩该第三缓冲区中的数据，该第三缓冲区为该多个第一缓冲区中任一存满的缓冲区。

本申请实施例中，可以通过多个线程向多个缓冲区中写入数据，这样，可以保证电子设备的硬件加速设备始终有存满的缓冲区可以进行压缩，从而可以使得硬件加速设备的性能得到充分利用，进而可以进一步提高数据库物理备份的效率。

作为一种可能的实施方式，该电子设备包括多个硬件加速设备，该方法还包括：当该多个第一缓冲区中存在多个存满的缓冲区时，通过该多个硬件加速设备处理并行压缩该多个存满的缓冲区中的数据。

本申请实施例中，电子设备可以包括多个硬件加速设备，此时，电子设备可以通过多个硬件加速设备并行压缩多个缓冲区中的数据，可以进一步提高数据库物理备份的效率。

作为一种可能的实施方式，该线程的数量根据第一时间、第二时间、该电子设备包括的硬件加速设备的数量确定；该第一时间为从原数据库目录下读取第一数据到存满一个第一缓冲区所需的时间，该第二时间为一个硬件加速设备完成压缩一个存满的第一缓冲区，并由该中央处理器将对应的备份数据写入备份目录对应的数据盘中所需的时间。

本申请实施例中，可以根据第一时间、第二时间、硬件加速设备的数量确定需要开启的线程的数据，这样，可以保证线程的数量与电子设备包括的硬件加速设备的处理能力相适配。在保证电子设备的硬件加速设备始终有存满的缓冲区可以进行压缩的情况下，不会过度占用电子设备的处理器资源。

作为一种可能的实施方式，该缓冲区的数量根据第一时间、第二时间、该电子设备包括的硬件加速设备的数量确定；该第一时间为从原数据库目录下读取第一数据到存满一个第一缓冲区所需的时间，该第二时间为一个硬件加速设备完成压缩一个存满的第一缓冲区，并由该中央处理器将对应的备份数据写入备份目录对应的数据盘中所需的时间。

本申请实施例中，可以根据第一时间、第二时间、硬件加速设备的数量确定需要设置的缓冲区的数量，这样，可以保证缓冲区的数量与线程的数量以及电子设备包括的硬件加速设备的处理能力相适配，不会过度占用电子设备的内存资源。

作为一种可能的实施方式，该方法还包括：在数据备份过程中，根据该第一时间、该第二时间、该电子设备包括的硬件加速设备的数量动态调整该线程的数量和/或该缓冲区的数量。

本申请实施例中，第一时间和第二时间可以是变化的，因此，电子设备可以对缓冲区的数量和线程的数量进行动态地调整，以提高缓冲区资源和线程资源的利用效率。并且，对缓冲区的数量和线程的数量动态进行调整可以保证不会过度占用内存资源和处理器资源，也不会导致缓冲区数量和线程数量不够使用，无法发挥硬件加速设备的性能。

作为一种可能的实施方式，该中央处理器包括该硬件加速设备。

本申请实施例中，硬件加速设备可以集成在中央处理器中，这样，可以减少硬件加速设备和中央处理器的通信时延，从而可以进一步提高数据库物理备份的效率。

第二方面公开一种电子设备，该计算设备包括处理器、存储器，该处理器调用该存储器中存储的计算机程序实现如上述第一方面以及第一方面中任一可能的实现方式中所提供的数据备份方法。

第三方面公开一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序或计算机指令，当该计算机程序或计算机指令运行时，实现如上述各方面公开的数据备份方法。

第四方面公开一种芯片，包括处理器，用于执行存储器中存储的程序，当程序被执行时，使得芯片执行上述各方面公开的数据备份方法。

作为一种可能的实施方式，存储器位于芯片之外。

第六方面公开一种计算机程序产品，该计算机程序产品包括计算机程序代码，当该计算机程序代码被运行时，使得上述各方面公开的数据备份方法被执行。

应理解，本申请上述多个方面或者任一种可能的实施方式的实现和有益效果可互相参考。

附图说明

图1是本申请实施例公开的一种电子设备的结构示意图；

图2是本申请实施例公开的一种数据库物理备份的场景示意图；

图3是本申请实施例公开的一种电子设备的软件结构示意图；

图4是本申请实施例公开的一种备份工具进行数据库物理备份的场景示意图；

图5是本申请实施例公开的一种数据库物理备份方法的流程示意图；

图6是本申请实施例公开的另一种数据库物理备份方法的流程示意图；

图7是本申请实施例公开的又一种数据库物理备份方法的流程示意图；

图8是本申请实施例公开的又一种数据库物理备份方法的流程示意图；

图9是本申请实施例公开的又一种数据库物理备份方法的流程示意图；

图10是本申请实施例公开的又一种数据库物理备份方法的流程示意图。

具体实施方式

本申请实施例公开了一种数据库物理备份方法、电子设备及计算机可读存储介质，可以提高数据库物理备份的效率，并可以减小硬盘空间的占用。下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

为了更好地理解本申请实施例，下面先对本申请实施例的相关术语和相关技术进行描述。

数据库集群，一般是由多台机器组成的数据库系统。一个数据库集群上可以创建一个或多个数据库。数据库集群中的一台机器可以称为一个节点。

数据库集群可以包括集中式数据库集群、分布式数据库集群等。其中，集中式数据库集群可以包括一个主机(主节点)和多个备机(从节点)，主机和备机存储的数据可以相同。分布式数据库集群也可以包括主节点和从节点，每个节点上可以存放数据的某个分片，多个节点存储的数据分片可以共同拼接为一份完整数据。数据库集群中的主节点可以管理和监控各个从节点，或者数据库集群中可以包括一个单独的管理主节点或从节点的管理节点，用于管理和监控各个从节点。例如，主节点可以向各个从节点下发数据操作指令，如数据备份指令，指示从节点进行数据备份。

硬件加速技术，是一种通过硬件设备来加快处理速度的技术，如加快压缩、解压缩、解密、加密、随机数生成、数字签名、视频编解码等处理速度。并且，针对于硬件加速而言，可以设计用于特定处理的专用硬件，比如说，针对于压缩任务，可以设计专用于处理压缩任务的硬件，以提高数据压缩效率。本申请实施例中，这些用于特定处理的专用硬件可以称为硬件加速设备。

在实际场景下，硬件加速设备可以用来协助中央处理器(central processing unit，CPU)进行工作，以提升整体处理效率。例如，可以将计算密集型任务(计算量较大的任务)分配给硬件加速设备来处理，以减轻CPU的压力，并提高整体处理速度。此外，由于硬件加速设备是针对于特定处理设计的专用硬件，因此，相较于CPU而言，其具有更低的功耗。

相关技术中，针对于硬件加速技术，可以包括x86架构下的QAT(quick assist technology，快速辅助技术)、arm(advanced RISC machine，进阶精简指令集机器)架构下的KAE(Kunpeng accelerator engine，鲲鹏加速引擎)。

随着网络、通信技术的快速发展，海量数据正以前所未有的增长趋势冲击着各个行业。为了有效地管理、维护这些数据，用户通常会使用数据库进行数据存储。同时，考虑到数据容灾的需求，通常需要对数据库的数据文件进行周期性的物理备份，以便之后在发生灾难(如正在处理业务数据的主机发生宕机或者其他故障，导致数据丢失)时，备机能够根据之前物理备份生成的备份集进行业务的恢复，从而实现业务的连续进行。

其中，数据库的物理备份，是指将原数据库目录下的数据文件复制一份或多份，分别存放在其它目录下，这些目录可以称为备份目录。备份集，是指数据库备份文件的集合，也就是备份目录下存放的一个或多个备份文件。通常情况下，在进行数据库的物理备份时，一般需要对数据库的数据文件进行压缩操作，以降低备份集的硬盘空间占用。也就是说，备份目录下的每个备份文件可以是一个压缩文件，并且，原数据库目录下的数据文件可以与备份目录下的备份文件一一对应。应理解，原数据库目录可以为待备份数据库的目录。

相关技术中，数据库的物理备份可以包括读数据、校验、压缩、落盘四个步骤。其中，数据库通常使用固定大小的数据页(page)来存储数据，如每个数据页的大小可以为8千字节(kilobyte，KB)。基于此，备份工具(备份软件)可以依次对每个数据页进行校验、压缩处理，并将压缩生成的备份页(backup page)写入备份集目录中。具体地，电子设备可以从数据库的数据文件中依次读取8KB大小的数据页。之后，电子设备可以依次对读取的8KB的数据页进行校验并计算其校验和。再之后，电子设备可以使用由软件实现的压缩算法，如lz4、zlib、zstd等软件压缩算法，依次对校验之后的8KB的数据页进行压缩处理。最后，电子设备可以依次将压缩后的数据页落盘，存储到对应的备份目录下，以生成备份集。

上述处理流程中，需要逐页对每个数据页进行校验，也需要逐页对每个校验之后的数据页进行压缩。其中，校验和压缩都是计算密集型任务，需要占用大量的CPU资源，校验和压缩中任一处理均可能使得CPU处于满负荷工作状态，因此，在CPU资源有限的情况下，校验和压缩一般是串行执行。同时，在进行数据库的物理备份的过程中，压缩是一个较为耗时的过程，通常情况下会占到物理备份总耗时的50％，甚至更多。

为了提高数据库物理备份的效率，减少数据库物理备份的整体耗时，本申请实施例中，可以在数据库物理备份时采用硬件加速技术，也就是说，可以通过硬件加速设备进行数据页的压缩等。并且，可以设置一个或多个缓冲区，可以先将待压缩的数据页存入缓冲区中，当缓冲区存满的情况下，硬件加速设备可以以缓冲区为单位进行批量数据页的压缩，从而可以保证硬件加速设备的性能得到充分利用。

为了更好地理解本申请实施例，下面先对本申请实施例的系统架构进行描述。

请参阅图1，图1是本申请实施例公开的一种电子设备的结构示意图。其中，电子设备100可以为手机终端、平板电脑、笔记本电脑、台式电脑、服务器等，本申请实施例在此不作限定。该电子设备100可以包括：中央处理器101、硬件加速设备102、内存103和硬盘104。中央处理器101、硬件加速设备102、内存103以及硬盘104可以相互连接或者通过总线105相互连接。

本申请实施例中，硬盘104可以用于存储数据库的数据文件。中央处理器101可以用于从硬盘中读取数据库中的数据文件，并执行校验等操作。内存103可以用于提供一个或多个缓冲区，暂时存储校验之后的数据页。硬件加速设备102可以以缓冲区为单位进行批量数据页的压缩，得到压缩之后的备份数据包。并且，可以将压缩之后的备份数据包存入硬盘104中。

本申请实施例中，硬件加速设备102可以为具有数据压缩功能的专用硬件，以辅助中央处理器101提高数据压缩的效率。示例性的，硬件加速设备102可以为QAT加速卡、KAE加速卡等。

示例性的，硬盘104可以为机械硬盘(hard disk drive，HDD)，也可以为固态硬盘(solid state drive，SSD)等。

需要说明的是，图1中仅分别示意1个中央处理器、1个硬件加速设备、1个内存和1个硬盘，但在实际情况下，电子设备可以包括2个、3个、4个或者更多个中央处理器、硬件加速设备、内存和硬盘，本申请实施例对此不作限定。

在一种可能的实现方式中，中央处理器101和硬件加速设备102可以独立设置，也可以集成到一起，如将硬件加速设备102集成到中央处理器101中。需要说明的是，上述电子设备100可以为集中式数据库集群中的某个节点，也可以为分布式数据库集群中的某个节点，还可以为其它包括数据库的设备。其中，针对集中式数据库集群和分布式数据库集群来说，其每个节点(包括主节点和从节点)可以自动进行数据库中数据文件的备份，也可以由主节点或者管理节点统一下发备份命令，各节点在接收到备份命令之后，再进行数据库中数据文件的备份。

需要说明的是，图1所示的系统架构只是示例性说明，并不对其构成限定。实际应用中，电子设备100还可以包括更多或更少的部件，或者不同的部件设置等，这里不作限制。

下面结合图2对本申请的物理备份流程进行示例性说明。

请参阅图2，图2是本申请实施例公开的一种数据库物理备份的场景示意图。在图2中，为了便于进行说明，假设数据库的原数据库目录对应的存储空间为主数据盘，备份目录对应的存储空间为备(份)数据盘。这种情况下，进行数据库物理备份时，需要将主数据盘中存储的原数据库目录下的数据文件读取出来，并压缩后存储到对应的备份目录下。原数据库目录下包括多少个数据文件，备份目录下可以包括对应数量的备份文件，也就是说，原数据库目录下的数据文件可以与备份目录下的备份文件一一对应。并且，备份目录下的备份文件的组织方式与原数据库目录下的数据文件的组织方式可以相同。其中，这里的组织方式可以包括采用的数据结构、数据之间的相互关系等。

具体地，CPU可以从主数据盘中依次读取原数据库目录下的数据文件中的数据页，并且可以对读取的数据页进行校验。当校验完成之后，CPU可以将校验之后的数据页存入空闲的缓冲区中，例如，A缓冲区当前处于空闲状态，CPU可以将校验之后的数据页存入A缓冲区中。当A缓冲区存满之后，CPU可以将A缓冲区标记为忙碌，例如，CPU可以为缓冲区设置一个状态标签，并将该状态标签设置为忙碌，并且，CPU可以通知硬件加速设备对A缓冲区中的数据页进行压缩处理，可以得到压缩后的备份数据包，以及可以将压缩后的备份数据包存入备数据盘中备份目录对应的存储空间。之后，CPU可以将A缓冲区的状态标签变更为空闲状态，以便可以重新写入待备份的数据页。

也就是说忙碌状态指示缓冲区中存满数据，而空间状态指示缓冲区中没有存入数据或者没有存满数据。

其中，上述处理流程中，当A缓冲区存满，硬件加速设备对A缓冲区中的数据页进行压缩处理的同时，CPU可以继续从主数据盘中读取原数据库目录下的数据文件中的数据页，将读取的数据页存入缓冲区B中，当缓冲区B存满之后，再通知硬件加速设备对B缓冲区中的数据页进行压缩处理。也就是说，A缓冲区和B缓冲区可以用来交替存储校验后的数据页，当A缓冲区存满后，在通过硬件加速设备对A缓冲区中的数据页进行压缩处理的同时，CPU可以通过B缓冲区继续存储校验后的数据页。之后，当B缓冲区存满，且A缓冲区重新空闲后，可以再通过A缓冲区存储，这样，数据页的校验和压缩可以并行进行，从而可以提高数据库物理备份的整体效率。

应理解，通过不断的读取数据页存入A缓冲区和B缓冲区，以及交替对A缓冲区和B缓冲区中的数据页进行压缩，可以完成对所有数据文件的压缩备份，生成完整的备份集。

应理解，图2中以两个缓冲区示意数据库物理备份的处理流程，但本申请实施例并不限定缓冲区的数量。例如，也可以设置1个缓冲区，3个、4个或者更多个缓冲区。还应理解，虽然上述以原数据库目录对应的存储空间为主数据盘，备份目录对应的存储空间为备数据盘进行说明，但并不对其构成限定，在实际情况下，原数据库目录和备份目录对应的存储空间可以为同一硬盘，如均为主数据盘。也就是说，原数据库目录下的数据文件和备份目录下的备份文件可以存储在同一硬盘中。

需要说明的是，硬件加速设备内部以硬件方式(包括各种处理电路)实现了非常高效的压缩算法，压缩性能远优于以软件方式实现的压缩算法(如lz4、zlib、zstd等)，例如，硬件加速设备具有更快的压缩速度，以及更小的压缩体积。因此，在上述处理流程中，通过硬件加速设备进行数据页的压缩，可以缩短压缩所需的时间。同时，考虑到通过硬件加速设备进行数据页的压缩会带来硬件间的通信开销，如CPU与硬件加速设备之间的通信开销。因此，如果每校验一个数据页就通知硬件加速设备进行压缩处理，可能会导致硬件通信的开销太大，并且，单数据页的压缩无法有效利用硬件加速设备的性能，从而会影响数据库物理备份的整体效率。基于此，本申请实施例中可以设置一个或多个缓冲区，当缓冲区存满之后，再通知硬件加速设备对缓冲区中的所有数据页进行压缩处理，这样，可以降低硬件间的通信开销，充分利用硬件加速设备的计算能力。

下面对本申请实施例的软件架构进行示例性说明。

请参阅图3，图3是本申请实施例公开的一种电子设备的软件结构示意图。其中，该电子设备100可以包括数据库106，数据库106可以包括备份工具1061。也就是说，备份工具1061可以为数据库106中的一个子程序模块。

请参阅图4，图4是本申请实施例公开的一种备份工具进行数据库物理备份的场景示意图。如图4所示，本申请实施例中，备份工具1061可以从主数据盘中读取数据库中的数据文件，并执行校验等操作，并且可以将校验之后的数据页存入内存中的缓冲区，如A缓冲区、B缓冲区等。当缓冲区存满之后，备份工具1061可以调用硬件加速设备提供的数据压缩API，数据压缩API会相应地调用硬件加速设备的驱动程序，硬件加速设备的驱动程序会驱动硬件加速设备对缓冲区中的数据页进行压缩，可以得到压缩之后的备份数据包。并且，备份工具1061可以将压缩之后的备份数据包存入备份目录下的备份文件中，以生成完整的备份集。

关于备份工具1061更详细地描述，可以参考下述方法实施例中的相关描述，在此不再详细赘述。

在一种可能的实现方式中，备份工具1061可以不为数据库106的子模块，可以为一个独立的模块。

需要说明的是，图3所示的软件结构只是示例性说明，并不对其构成限定。在本申请另一些实施例中，图3所示的软件结构可以包括比图示更多或更少的软件模块。

基于上述系统架构，请参阅图5，图5是本申请实施例公开的一种数据库物理备份方法的流程示意图。如图5所示，其为单缓冲区设置下的数据库物理备份的处理流程，该处理方法可以由中央处理器CPU执行，具体可以是处理器调用备份工具中的程序来执行，该处理流程可以包括但不限于如下步骤：

501.CPU打开原数据库目录下的第一数据文件。

其中，第一数据文件可以为存储在主数据盘中，通过原数据库目录可查找到的任一未备份的数据文件。

当进行数据库物理备份时，CPU可以依次对原数据库目录下的数据文件进行备份，生成对应的备份文件，存储到备份目录对应的备份数据盘中。示例性的，CPU可以先打开原数据库目录下的任一未备份的数据文件，以便于读取其中的数据页。

502.当第一缓冲区处于空闲状态时，CPU从第一数据文件中依次读取数据页，并将读取到的数据页依次存入第一缓冲区中。

为了使得硬件加速设备的性能得到充分利用，电子设备的硬件加速设备可以以缓冲区为单位进行批量数据页的压缩。因此，在单缓冲区的情况下，CPU可以先判断第一缓冲区是否处于空闲状态。如果第一缓冲区处于非空闲状态，也就是处于忙碌状态，CPU可以等待第一缓冲区空闲。如果第一缓冲区处于空闲状态，CPU可以从第一数据文件中依次读取数据页，并将读取到的数据页依次存入第一缓冲区中，直到存满第一缓冲区。应理解，数据文件中的数据页之间可以存在顺序，并且，每个数据页可以包括一个标识，如逻辑地址、数据页的编号等。因此，在一种可能的实现方式中，从第一数据文件中依次读取数据页可以理解为按照数据页的顺序依次读取，如按照逻辑地址的先后顺序依次读取连续的数据页。其中，初始状态下，第一缓冲区默认为空闲状态。第一缓冲区的大小可以为数据页大小的N倍，N为大于或等于2的整数。例如，N可以为8、16等。示例性的，当数据页大小为8KB时，第一缓冲区的大小可以为64KB、128KB等。应理解，第一缓冲区可以为在电子设备的内存中开辟的一块存储区域，可以用于电子设备在进行数据库物理备份过程中暂时存储需要进行压缩的数据页。

应理解，在最后一次读取第一数据文件中的剩余数据页时，可能由于第一数据文件中的剩余未读取的数据页的数量较少，不足以存满第一缓冲区，这种情况下，可以将第一数据文件中剩余未读取的数据页均存入第一缓冲区，然后可以视为第一缓冲区存满。

在一种可能的实现方式中，CPU将读取数据页依次存入第一缓冲区之前，可以先对读取数据页依次进行校验。这里的校验包括两种情况，一种情况为：针对每一个数据页计算校验码，这种情况下，CPU针对每一个数据页计算校验码之后，可以将数据页和对应的校验码一起存入第一缓冲区中(如将校验码附加在对应的未备份数据页的末尾)，以便之后基于备份集恢复数据时可以对数据的准确性进行校验。另一种情况为：针对每一个数据页计算校验码，并与之前计算的校验码进行比对，判断当前读取的数据页是否准确。这种情况下，CPU针对每一个数据页计算校验码之后，可以将当前计算得到的校验码与数据页之前计算得到的校验码进行(如之前将该数据页存储到主数据盘时计算得到的校验码)比对，如果相同，则表明当前读取的未备份的数据页是正确的，可以将其存入第一缓冲区中，如果不相同，则表明当前读取的未备份的数据页是错误的，可以跳过这个数据页，或者可以进行数据恢复。

应理解，校验码通常是基于原始数据通过某种运算得出，用以检验原始数据的正确性。常用的校验码可以包括奇偶校验码、海明校验码、循环冗余校验(Cyclic Redundancy Check，CRC)码等。

503.当第一缓冲区存满时，CPU将第一缓冲区的状态变更为忙碌状态，并通过硬件加速设备压缩第一缓冲区中的多个数据页，可以得到对应的备份数据包。

随着CPU持续向第一缓冲区中存数据页，第一缓冲区会存满，此时，为了避免CPU继续向第一缓冲区写入数据，CPU可以将第一缓冲区的状态变更为忙碌状态。并且，CPU可以通知硬件加速设备对第一缓冲区中的数据页进行压缩处理，当硬件加速设备对第一缓冲区中的数据页进行压缩处理之后，可以得到对应的备份数据包，该备份数据包中包括通过硬件加速设备压缩第一缓冲区中的数据页得到的对应的备份数据包。其中，第一缓冲区中的数据页对应的备份数据包也可以理解为第一缓冲区中的数据页对应的压缩数据。

CPU通过硬件加速设备压缩第一缓冲区中的多个数据页具体可以包括：CPU可以调用硬件加速设备提供的压缩API(application programming interface，应用程序编程接口)，压缩API会相应地调用硬件加速设备的驱动程序，硬件加速设备的驱动程序会驱动硬件加速设备压缩第一缓冲区中的多个数据页。其中，CPU调用硬件加速设备提供的压缩API时，可以提供相应地的参数，如第一缓冲区的地址等，以便硬件加速设备压缩第一缓冲区中的多个数据页。

504.CPU将对应的备份数据包写入备份目录对应的备数据盘中，并将第一缓冲区的状态变更为空闲状态。

当硬件加速设备压缩完第一缓冲区中的多个数据页之后，硬件加速设备可以通知CPU第一缓冲区压缩完成。之后，CPU可以将压缩第一缓冲区中的多个数据页，得到的对应的备份数据包写入备份目录对应的备数据盘中。并且，CPU可以将第一缓冲区的状态变更为空闲状态，以便可以重新写入待备份的数据页，也即是剩余未读取的数据页。需要说明的是，由于硬件加速设备压缩完第一缓冲区中的数据之后，可以将压缩得到的备份数据包存储在第一缓冲区中，也可以存储在其它空闲的缓冲区中，而针对这两种不同的情况，第一缓冲区的变更为空闲状态的时间可以不同。如果将压缩得到的备份数据包存储在第一缓冲区中，则需要等待CPU将备份数据包写入备份目录对应的备数据盘中，在备份数据包写入备份目录对应的备数据盘之后，可以将第一缓冲区的状态变更为空闲状态。而如果将压缩得到的备份数据包存储在其它空闲的缓冲区中，可以在硬件加速设备压缩完第一缓冲区的数据页之后，将第一缓冲区的状态变更为空闲状态，不需要等待备份数据包写入备份目录对应的备数据盘中。

可以理解的是，由于原数据库目录下的数据文件和备份目录下的备份文件是一一对应的，因此，CPU将对应的备份数据包写入备份目录下，其实是写入备份目录下与第一数据文件对应的备份文件中。

505.CPU判断第一数据文件是否备份完，在未备份完的情况下，执行步骤502，在备份完的情况下，执行步骤506。

CPU将第一数据文件中的多个数据页对应的备份数据包写入备份目录对应的备数据盘中之后，可以判断第一数据文件是否备份完，也就是判断第一数据文件中是否还包括未备份的数据页或未读取的数据页，如果第一数据文件还未备份完(第一数据文件中还包括未备份的数据页)，CPU可以继续读取第一数据文件中未备份的数据页，可以执行步骤502，如果第一数据文件已经备份完(第一数据文件中不包括未备份的数据页)，CPU可以继续判断原数据库目录下是否还包括未备份的数据文件，可以执行步骤506。

506.CPU判断原数据库目录下是否包括未备份的数据文件，在原数据库目录下包括未备份的数据文件的情况下，可以执行步骤501，在原数据库目录下不包括未备份的数据文件的情况下，可以执行步骤507。当第一数据文件备份完时，CPU可以判断原数据库目录下是否还包括未备份的数据文件，如果原数据库目录下包括未备份的数据文件，CPU可以继续打开原数据库目录下任一未备份的数据文件，可以执行步骤501。如果原数据库目录下不包括未备份的数据文件，也就是说，原数据库目录下的所有数据文件都已经备份完，此时，CPU可以执行步骤507。

需要说明的是，由于不同的业务需求，针对同一个第一数据文件，可能存在多次备份的情况，例如，先将第一数据文件备份到第一备数据盘中，再将第一数据文件备份到第二备数据盘中，因此，此时在判断一个第一数据文件是否为未备份的数据文件，或者判断一个数据页是否为未备份的数据页时，可能由于上述原因而存在不同的判断结果，基于此，本申请实施例针对上述步骤502-507中，CPU判断第一数据文件中是否包括未备份的数据页中的未备份的数据页是指在本次备份过程中，例如本次执行的步骤501-507的过程中还没有进行过备份的数据页，以及CPU在判断原数据库目录下是否还包括未备份的数据文件，是指在本次备份过程中，例如本次执行的步骤501-507的过程中还没有进行过备份的数据文件。

需要说明的是，备数据盘和主数据盘可以为同一个物理硬盘，也可以为不同的物理硬盘。

507.CPU结束数据库的物理备份，释放相关资源。

当原数据库目录下的所有数据文件均备份完时，备份目录下可以包括完整的备份文件，CPU可以结束数据库的物理备份，并释放相关资源，如释放第一缓冲区等内存资源。

需要说明的是，上述步骤501～步骤507之间的顺序并不是唯一的，某些步骤可以并行执行，如步骤504和步骤505可以并行执行，并且，上述步骤的执行顺序可以根据实际情况进行调整。例如，在一种可能的实现方式中，步骤506可以最先执行，当确定原数据库目录下不包括未备份的数据文件时，CPU可以执行步骤507，当确定原数据库目录下包括未备份的数据文件时，CPU可以执行步骤501，以及接下来的步骤502～步骤505，在执行步骤505时，如果确定第一数据文件已经备份完，则可以再执行步骤506，继续判断是否原数据库目录下是否还包括未备份的数据文件。再例如，上述步骤501～步骤507 可以拆分为两个独立的执行流程，一个负责向第一缓冲区中写未备份的数据页，一个负责压缩第一缓冲区中的数据页，这两个处理流程可以并行执行，并且可以通过第一缓冲区的状态关联起来。如图6所示，其可以为向第一缓冲区中写数据页的处理流程，在向第一缓冲区中写数据页时，CPU可以检测第一缓冲区是否处于空闲状态，当第一缓冲区处于空闲状态的情况下，CPU可以向第一缓冲区持续的写入未备份的数据页。再如图7所示，其可以为通过硬件加速设备压缩第一缓冲区中的数据页的处理流程，在压缩第一缓冲区中的数据页时，CPU可以检测第一缓冲区是否处于忙碌状态，当第一缓冲区处于忙碌状态的情况下，也即是第一缓冲区存满的情况下，CPU可以通过硬件加速设备对第一缓冲区中的数据页进行压缩处理，并将压缩得到的备份数据包写入备份目录对应的备数据盘中。图6和图7中的相关步骤可以参考上述步骤501-步骤507中的相关描述，在此不再详细赘述。

上述处理流程中，CPU在进行数据库的物理备份时，可以通过硬件加速设备以缓冲区为单位进行批量数据页的压缩，可以极大地提高数据压缩的效率，从而可以提高数据库物理备份的速度。

图5为单缓冲区情况下的数据库物理备份流程，但在实际情况下，在数据库物理备份时，也可以采用多缓冲区，这样，可以使得数据读取与压缩并行进行，或者可以使得数据读取、校验与压缩并行进行，从而可以进一步提高数据库物理备份的速度。下面结合图8和图9对多个缓冲区设置下的数据库物理备份流程进行示例性说明。其中，图8可以为多缓冲区设置下，向处于空闲状态的缓冲区中写入未备份的数据页的流程，图9可以为多缓冲区设置下，通过硬件加速设备压缩处于忙碌状态的缓冲区中的数据页的流程。

下面先对图8所示的处理流程进行介绍，如图8所示，该处理流程可以由中央处理器CPU执行，具体可以是处理器调用备份工具中的程序来执行，该处理流程可以包括但不限于如下步骤：

801.CPU打开原数据库目录下的第一数据文件。

其中，第一数据文件可以为第一数据文件可以为存储在主数据盘中，通过原数据库目录可查找到的任一未备份的数据文件。

步骤801与步骤501类似，可以参考上述步骤501中的相关描述。

802.当电子设备的多个缓冲区中存在处于空闲状态的缓冲区时，CPU从第一数据文件中依次读取数据页，并将读取的数据页依次存入第二缓冲区中。

其中，第二缓冲区可以为多个缓冲区中处于空闲状态的任一缓冲区。

在多个缓冲区的情况下，CPU可以先判断多个缓冲区中是否存在处于空闲状态的缓冲区。如果多个缓冲区中不存在处于空闲状态的缓冲区，CPU可以等待多个缓冲区空闲。如果多个缓冲区中存在处于空闲状态的缓冲区，CPU可以从第一数据文件中依次读取数据页，并将读取的数据页依次存入第二缓冲区中，直到存满第二缓冲区。其中，初始状态下，多个缓冲区默认为空闲状态。应理解，这多个缓冲区可以是从内存空间中开辟的用于存储待备份数据页的缓冲区。

应理解，在最后一次读取第一数据文件中的剩余数据页时，可能由于第一数据文件中的剩余未读取的数据页的数量较少，不足以存满第二缓冲区，这种情况下，可以将第一数据文件中剩余未读取的数据页全部存入第二缓冲区，并且，可以视为第二缓冲区存满。

在一种可能的实现方式中，CPU将读取的未备份的数据页依次存入第二缓冲区之前，可以先对读取的未备份的数据页依次进行校验。关于数据页校验的描述，可以参考步骤501中的相关描述，在此不再赘述。

803.当第二缓冲区存满时，CPU将第二缓冲区的状态变更为忙碌状态。

随着CPU持续向第二缓冲区中存数据页，第二缓冲区会存满，此时，为了避免CPU继续向第二缓冲区写入数据，CPU可以将第二缓冲区的状态变更为忙碌状态。并且，CPU可以通知硬件加速设备对第二缓冲区中的数据页进行压缩处理。

804.CPU判断第一数据文件是否备份完，在未备份完的情况下，执行步骤802，在备份完的情况下，执行步骤805。

CPU存满第二缓冲区之后，可以判断第一数据文件是否备份完，也就是判断第一数据文件中是否还包括未备份的数据页，如果第一数据文件还未备份完，CPU可以继续读取第一数据文件中未备份的数据页，可以执行步骤802，如果第一数据文件已经备份完，CPU可以继续判断原数据库目录下是否还包括未备份的数据文件，可以执行步骤805。

805.CPU判断原数据库目录下是否包括未备份的数据文件，在原数据库目录下包括未备份的数据文件的情况下，可以执行步骤801，在原数据库目录下不包括未备份的数据文件的情况下，可以执行步骤806。

当第一数据文件备份完时，CPU可以判断原数据库目录下是否还包括未备份的数据文件，如果原数据库目录下包括未备份的数据文件，CPU可以继续打开原数据库目录下任一未备份的数据文件，可以执行步骤801。如果原数据库目录下不包括未备份的数据文件，也就是说，原数据库目录下的所有数据文件都已经备份完，此时，CPU可以执行步骤806。

806.CPU结束数据库的物理备份，释放相关资源。

当原数据库目录下的所有数据文件均备份完时，备份目录下可以包括完整的备份文件，CPU可以结束数据库的物理备份，并释放相关资源，如释放第二缓冲区等内存资源。

下面对图9所示的处理流程进行介绍，如图9所示，该处理流程可以由中央处理器CPU执行，具体可以是处理器调用备份工具中的程序来执行，该处理流程可以包括但不限于如下步骤：

901.当电子设备的多个缓冲区中存在处于忙碌状态的缓冲区时，CPU通过硬件加速设备压缩第三缓冲区中的多个数据页，可以得到对应的备份数据包。

其中，第三缓冲区可以为多个缓冲区中处于忙碌状态的任一缓冲区。

从图8所示可见，在未备份完数据库的所有数据文件时，CPU可以持续向多个缓冲区中的空闲缓冲区中写入待备份的数据页。并且，在某个缓冲区存满时，CPU可以通知硬件加速设备对该缓冲区中的数据页进行压缩处理。因此，当CPU的多个缓冲区中存在处于忙碌状态的缓冲区时，CPU可以通过硬件加速设备对第三缓冲区中的多个数据页进行压缩处理，可以得到对应的备份数据包。例如，假设包括3个缓冲区，分别为缓冲区a、缓冲区b和缓冲区c，其中缓冲区a和缓冲区b处于忙碌状态，此时，CPU可以通过硬件加速设备压缩缓冲区a中的多个数据页，再压缩缓冲区b中的多个数据页。

需要说明的是，在一种可能的实现方式中，当存在多个处于忙碌状态的缓冲区时，硬件加速设备可以并行地对这多个处于忙碌状态的缓冲区中的数据页进行压缩处理，从而可以提高数据库物理备份的整体速度。或者，如果CPU包括多个硬件加速设备，这种情况下，当存在多个处于忙碌状态的缓冲区时，CPU可以分别通过多个硬件加速设备对不同的缓冲区中的数据页进行压缩处理，从而可以提高数据库物理备份的整体速度。

902.CPU将对应的备份数据包写入备份目录对应的备数据盘中，并将第三缓冲区的状态变更为空闲状态。

当硬件加速设备压缩完第三缓冲区中的多个数据页之后，硬件加速设备可以通知CPU第三缓冲区压缩完成。之后，CPU可以将压缩第三缓冲区中的多个数据页，得到的对应的备份数据包写入备份目录对应的备数据盘中。并且，CPU可以将第三缓冲区的状态变更为空闲状态，以便可以重新写入待备份的数据页。

在上述图8和图9所示的数据库物理备份的过程中，数据读取、校验与压缩可以并行进行。例如，假设包括缓冲区a、缓冲区b和缓冲区c，且初始状态均为空闲状态。在数据库物理备份时，CPU可以从原数据库目录下读取未备份的数据页并进行校验，然后将校验之后的数据页存入缓冲区a中，当缓冲区a存满之后，可以将缓冲区a的状态变更为忙碌状态，并且，可以通知硬件加速设备对缓冲区a中的数据页进行压缩处理。在硬件加速设备对缓冲区a中的数据页进行压缩处理的同时，CPU可以继续从原数据库目录下读取未备份的数据页并进行校验，然后将校验之后的数据页存入缓冲区b中，当缓冲区b存满之后，可以将缓冲区b的状态变更为忙碌状态，并且，可以通知硬件加速设备对缓冲区b中的数据页进行压缩处理。这样，之后硬件加速设备压缩完缓冲区a中的数据页之后，可以接着压缩缓冲区b中的数据，不需要等待，从而可以提高数据库物理备份的整体效率。

可以理解的是，从原数据库目录下读取未备份的数据页到存满一个处于空闲状态的缓冲区所需的时间(下述简称T1)，与硬件加速设备压缩一个处于忙碌状态的缓冲区，并由CPU将对应的备份数据包写入备份目录对应的数据盘中所需的时间可能不同(下述简称T2)。因此，为了充分利用电子设备包括的硬件加速设备的处理能力，在一些情况下，电子设备可以开启多个线程并行地从原数据库目录下读取未备份的数据页(如多个线程分别读取原数据库目录下不同的数据文件中的未备份数据页)，以及将读取的未备份的数据页存入空闲状态的缓冲区中。

在一种可能的实现方式中，开启线程的数量可以根据第一时间、第二时间、硬件加速设备的数量(下述简称M)确定。

示例性的，开启线程的数量可以为表示向上取整。这样，可以使得相同时间内存满的缓冲区的数量可以大于压缩的缓冲区的数量，或者存满的缓冲区的数量可以等于压缩的缓冲区的数量(也即是缓冲区的存储与缓冲区的压缩达到平衡)，从而可以最大化的利用电子设备的硬件加速设备，进而可以进一步提高数据库物理备份的速度。

应理解，为了达到上述最大化的利用电子设备的硬件加速设备进行压缩处理的效果，还需要缓冲区的数量进行支持。其中，缓冲区的数量可以基于线程的数量、硬件加速设备的数量确定。示例性的，缓冲区的数量可以为线程的数量+硬件加速设备的数量，也即是这样，可以保证缓冲区的数量足够，开启的多个线程都有对应的空闲缓冲区可以写入未备份的数据页，并且，也可以保证，电子设备包括的硬件加速设备都有忙碌的缓冲区可以进行压缩处理。需要说明的是，针对于这种情况下的缓冲区数量设置，对于每个缓冲区来说，其可以存储硬件加速设备压缩该缓冲区中的数据得到的对应的备份数据包。也就是说，一个缓冲区中的待备份的数据页和该待备份的数据页对应的备份数据包可以通过同一个缓冲区存储。

举例说明，假设T1为4s(秒)，也就是说一个线程从原数据库目录下读取未备份的数据页到存满一个处于空闲状态的缓冲区所需的时间为4s，其中包括数据页的校验等时间。T2为2s，也就是说一个硬件加速设备压缩一个处于忙碌状态的缓冲区，并由CPU将对应的备份数据写入备份目录对应的数据盘中所需的时间为2s。硬件加速设备的数量为2，分别为硬件加速设备1和硬件加速设备2。此时，可以计算得到线程的数量为4/2*2个，也即是4个线程，分别为线程1-线程4。缓冲区的数量可以为4+2，也即是6个缓冲区，分别为缓冲区1-缓冲区6。初始状态下，6个缓冲区可以均为空，之后，线程1-线程4可以分别并行的向缓冲区1-缓冲区4写入未备份的数据页，在4s时，缓冲区1-缓冲区4可以被存满。之后，在4s～6s之间，硬件加速设备1和硬件加速设备2可以分别对缓冲区1和缓冲区2进行压缩处理，并且，CPU可以将对应的备份数据包写入备份目录对应的数据盘中，同时，线程1和线程2可以分别向缓冲区5和缓冲区6写入未备份的数据页。在6s时，硬件加速设备1和硬件加速设备2可以分别压缩完缓冲区1和缓冲区2中的数据页。在6s～8s之间，硬件加速设备1和硬件加速设备2可以分别对缓冲区3和缓冲区4进行压缩处理，并且，CPU可以将对应的备份数据包写入备份目录对应的数据盘中，同时，线程1和线程2可以分别继续向缓冲区5和缓冲区6写入未备份的数据页，线程3和线程4可以分别向缓冲区1和缓冲区2写入未备份的数据页。在8s时，硬件加速设备1和硬件加速设备2可以分别压缩完缓冲区3和缓冲区4中的数据页，并且，可以由CPU将对应的备份数据包写入备份目录对应的数据盘中，同时，线程1和线程2可以分别存满缓冲区5和缓冲区6。在8s～10s之间，硬件加速设备1和硬件加速设备2可以分别对缓冲区5和缓冲区6进行压缩处理，并且，可以由CPU将对应的备份数据包写入备份目录对应的数据盘中，同时，线程3和线程4可以分别继续向缓冲区1和缓冲区2写入未备份的数据页，线程1和线程2可以分别向缓冲区3和缓冲区4写入未备份的数据页。在10s时，硬件加速设备1和硬件加速设备2可以分别压缩完缓冲区5和缓冲区6中的数据页，并且，可以由CPU将对应的备份数据包写入备份目录对应的数据盘中，同时，线程3和线程4可以分别存满缓冲区1和缓冲区2。可见，在数据库物理备份过程中，线程1-线程4可以并行地分别向4个处于空闲状态的缓冲区写入数据页，硬件加速设备1和硬件加速设备2可以并行地分别压缩两个处于忙碌状态的缓冲区。并且，当硬件加速设备1或硬件加速设备2压缩完1个处于忙碌状态的缓冲区，并由CPU将对应的备份数据包写入备份目录对应的数据盘后，总会有处于忙碌状态的缓冲区可以供其继续进行压缩处理，这样，可以使得硬件加速设备1和硬件加速设备2的处理资源得到充分利用。

应理解，上述T1还与缓冲区的大小、CPU的负载等有关，上述T2还与缓冲区的大小、硬件加速设备的负载、硬件加速设备本身的处理能力等有关。例如，在缓冲区的大小、硬件加速设备本身的处理能力等确定的情况下，如果数据库物理备份之外的任务占用的CPU资源越多，CPU的负载可以越大，从而会导致用于数据库物理备份的CPU资源减少，进而会导致上述T1相应的变大。同理，如果硬件加速设备还需要处理其它的任务，T2也会相应的变化。其它任务占用的硬件加速设备的处理资源越多，硬件加速设备的负载可以越大，相应地，T2可以越大。

由于在数据库物理备份过程中，T1和T2可能会变化，因此，电子设备可以动态地调整线程的数量和缓冲区的数量。示例性的，在数据库物理备份过程中，电子设备可以动态监测或预测T1和T2的大小，之后，可以在T1或T2变化时，动态地调整开启的线程数量和缓冲区数量。例如，假设硬件加速设备的数量为2，当前T1为4s，T2为2s，此时，电子设备可以开启4个线程进行缓冲区的存储，以及可以设置6个缓冲区。之后，如果CPU的负载较高，T1可以变为2s，T2不变，此时，电子设备可以确定开启2个线程、4个缓冲区较为合适，因此，电子设备可以关闭2个线程，以及可以释放2个缓冲区的资源，这样，在保证数据库物理备份效率的基础上，可以减少CPU资源和内存资源的占用。

可见，在数据库物理备份过程中，电子设备动态调整线程的数量和缓冲区的数量，可以使得缓冲区的存储和缓冲区的压缩保持平衡的状态，也就是说，在相同时间内，存满的缓冲区的数量和压缩的缓冲区的数量几乎相等。这样，可以使得硬件加速设备的性能得到充分利用，并且，缓冲区的数量和线程的数量较为合适，可以避免占用过多的CPU资源和过多的内存资源。

基于上述系统架构，请参阅图10，图10是本申请实施例公开的又一种数据库物理备份方法的流程示意图，该备份方法可以通过电子设备的中央处理器CPU执行，该电子设备可以包括中央处理器、内存和硬件加速设备，该内存可以包括第一缓冲区。如图10所示，该处理流程可以包括但不限于如下步骤：

1001.CPU读取第一数据文件中的第一数据，并将第一数据存入第一缓冲区。

其中，第一数据文件存储在原数据库目录对应的数据盘，如上述主数据盘。第一数据可以为第一数据文件中的未备份的数据页。示例性的，第一缓冲区的大小可以为数据页大小的N倍，N为大于或等于2的整数。

示例性的，CPU可以先打开第一数据文件，之后，如果第一缓冲区没有存入或者没有存满第一数据，这种情况下，第一缓冲区还可以继续存储数据，此时，CPU可以读取第一数据文件中的第一数据，并将读取的第一数据存入第一缓冲区中。应理解，第一缓冲区没有存入或者没有存满第一数据可以理解为第一缓冲区处于空闲状态，可以参考上述图5所示实施例中的相关描述。还需要说明的是，当第一缓冲区中的第一数据压缩完成，得到对应的压缩数据之后，可以将对应的压缩数据也存入第一缓冲区中，之后，可以将第一缓冲区中存储的压缩数据写入备份目录对应的数据盘中。之后，当将第一缓冲区中存储的压缩数据成功写入备份目录对应的数据盘中之后，第一缓冲区可以视为空的缓冲区，也即是没有存入第一数据的缓冲区。

在一种可能的实现方式中，CPU将读取的第一数据存入第一缓冲区之前，可以校验读取的第一数据，之后，在第一数据校验成功的情况下，CPU再将第一数据页存入第一缓冲区中。

1002.CPU通过硬件加速设备压缩第一缓冲区中的第一数据，生成第一数据对应的备份数据。

在一种可能的实现方式中，在第一缓冲区中存满第一数据的情况下，CPU通过硬件加速设备压缩第一缓冲区中的第一数据。这样，可以保证缓冲区空间的利用率。

在一种可能的实现方式中，第一缓冲区可以为多个。这种情况下，CPU可以从第一数据文件中读取剩余数据，也即是读取第一数据文件中剩余未读取的数据页或待备份的数据页，并将读取的剩余数据存入第二缓冲区中。其中，第二缓冲区可以为多个第一缓冲区中的其余任意一个没有存入或者没有存满第一数据的缓冲区。当硬件加速设备完成压缩一个第一缓冲区中的第一数据，通过硬件加速设备压缩第二缓冲区中的数据。也就是说，在包括多个缓冲区的情况下，硬件加速设备在压缩一个第一缓冲区中的数据的同时，CPU可以从第一数据文件中继续读取剩余数据，并将剩余数据存入另外的第一缓冲区中，可以保证CPU向缓冲区中写入数据与硬件加速设备压缩数据并行，从而可以提高数据备份效率。

在一种可能的实现方式中，可以通过多个线程从原数据库目录下多个数据文件中分别读取第一数据，并将读取的不同数据文件中的第一数据分别存入多个第一缓冲区没有存入或者没有存满所述第一数据的缓冲区中；当第三缓冲区存满的情况下，通过硬件加速设备压缩第三缓冲区中的数据。其中，第三缓冲区可以为多个第一缓冲区中任一存满的缓冲区。

应理解，上述多个数据文件中的第一数据可以为不同的数据。

在一种可能的实现方式中，当多个第一缓冲区中存在多个存满的缓冲区时，CPU可以通过多个硬件加速设备处理并行压缩多个存满的缓冲区中的数据。

示例性的，开启的线程的数量和缓冲区的数量可以根据第一时间、第二时间、电子设备包括的硬件加速设备的数量确定。其中，第一时间可以为从原数据库目录下读取第一数据到存满一个第一缓冲区所需的时间，第二时间为一个硬件加速设备完成压缩一个存满的第一缓冲区，并由CPU将对应的备份数据写入备份目录对应的数据盘中所需的时间。

在一种可能的实现方式中，电子设备的硬件加速设备设置于该电子设备的处理器中，也就是说，电子设备的硬件加速设备与电子设备的处理器可以集成在一起。

可以理解的是，在数据备份过程中，第一时间、第二时间可能会变化。因此，在数据备份过程中，CPU可以根据第一时间、第二时间、电子设备包括的硬件加速设备的数量动态调整线程的数量和/或缓冲区的数量。

1003.CPU将对应的备份数据写入备份目录对应的数据盘中。

上述步骤1001-步骤1003可以参考图5、图8和图9中相关步骤的描述，在此不再赘述。

需要说明的是，上述不同实施例中的相关信息(即相同信息或相似信息)和相关描述可以相互参考。

上述步骤501-507，601-606，701-702，801-806，901-902，1001-1003中的执行主体除了为电子设备中的中央处理器CPU之外，还可以是电子设备中的其他控制器或者处理芯片，如CPLD，FPGA等控制器。

应理解，上述图5、图6、图7、图8、图9和图10中以CPU作为交互示意的执行主体为例来示意上述处理流程，但本申请并不限制该交互示意的执行主体。例如，图5、图6、图7、图8、图9和图10中的CPU也可以是支持该CPU实现该方法的芯片、芯片系统、电子设备等，还可以是能实现全部或部分CPU功能的逻辑模块或软件(如上述备份工具)。

本申请实施例还公开一种电子设备，该电子设备包括存储器和处理器，存储器用于存储电子设备的计算机程序或计算机指令，处理器可以用于读取存储器中存储的程序或计算机指令，执行上述方法实施例中的方法。上述存储器可以包括但不限于是随机存储记忆体(random access memory，RAM)、只读存储器(read-only memory，ROM)、可擦除可编程只读存储器(erasable programmable read only memory，EPROM)或便携式只读存储器(compact disc read-only memory，CD-ROM)等。上述处理器可以是CPU、复杂可编程逻辑器件、通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，数字信号处理器和微处理器的组合等等。

本申请实施例还公开一种计算机可读存储介质，其上存储有指令，该指令被执行时执行上述方法实施例中的方法。

本申请实施例还公开一种包括指令的计算机程序产品，该指令被执行时执行上述方法实施例中的方法。

显然，上述所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或者特性可以包含在本实施例申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是相同的实施例，也不是与其它实施例互斥的独立的或是备选的实施例。本领域技术人员可以显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。本申请的说明书和权利要求书及所述附图中术语“第一”、“第二”、“第三”等是区别于不同的对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。例如，包含了一系列步骤或单元，或者可选地，还包括没有列出的步骤或单元，或者可选地还包括这些过程、方法、产品或设备固有的其它步骤或单元。可以理解的是，上述条件判断的等号可以取大于一端也可以取小于一端，例如，上述对于一个阈值大于、小于或等于的条件判断，也可以改为对该阈值大于或等于、小于的条件判断，在此不作限定。

可以理解的是，附图中仅示出了与本申请相关的部分而非全部内容。应当理解的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

在本说明书中使用的术语“部件”、“模块”、“系统”、“单元”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件或执行中的软件。例如，单元可以是但不限于在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或分布在两个或多个计算机之间。此外，这些单元可从在上面存储有各种数据结构的各种计算机可读介质执行。单元可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一单元交互的第二单元数据。例如，通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

以上所述的具体实施方式，对本申请的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本申请的具体实施方式而已，并不用于限定本申请的保护范围，凡在本申请的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种数据备份方法，其特征在于，所述方法应用于电子设备，所述电子设备包括中央处理器、内存和硬件加速设备，所述内存包括第一缓冲区；所述方法包括：

读取第一数据文件中的第一数据，并将所述第一数据存入所述第一缓冲区，其中，所述第一数据文件存储在原数据库目录对应的数据盘中；

通过所述硬件加速设备压缩所述第一缓冲区中的第一数据，以生成所述第一数据对应的备份数据；

将所述备份数据写入备份目录对应的数据盘中。
根据权利要求1所述的方法，其特征在于，所述通过所述硬件加速设备压缩所述第一缓冲区中的第一数据，包括：

在所述第一缓冲区中存满所述第一数据的情况下，通过所述硬件加速设备压缩所述第一缓冲区中的第一数据。
根据权利要求1或2所述的方法，其特征在于，所述第一缓冲区为多个，所述方法还包括：

从所述第一数据文件中读取剩余数据，并将所述剩余数据存入所述第二缓冲区中；所述第二缓冲区为所述多个第一缓冲区中其余任意一个没有存入或者存满第一数据的缓冲区；

当所述硬件加速设备完成压缩所述第一缓冲区中的第一数据，通过所述硬件加速设备压缩所述第二缓冲区中的数据。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

通过多个线程从所述原数据库目录下多个数据文件中分别读取第一数据，并将读取的不同数据文件中的第一数据分别存入多个第一缓冲区没有存入或者没有存满所述第一数据的缓冲区中；

当第三缓冲区存满的情况下，通过所述硬件加速设备压缩所述第三缓冲区中的数据，所述第三缓冲区为所述多个第一缓冲区中任一存满的缓冲区。
根据权利要求3或4所述的方法，其特征在于，所述电子设备包括多个硬件加速设备，所述方法还包括：

当所述多个第一缓冲区中存在多个存满的缓冲区时，通过所述多个硬件加速设备处理并行压缩所述多个存满的缓冲区中的数据。
根据权利要求4或5所述的方法，其特征在于，所述线程的数量根据第一时间、第二时间、所述电子设备包括的硬件加速设备的数量确定；所述第一时间为从原数据库目录下读取第一数据到存满一个第一缓冲区所需的时间，所述第二时间为一个硬件加速设备完成压缩一个存满的第一缓冲区，并由所述中央处理器将对应的备份数据写入备份目录对应的数据盘中所需的时间。
根据权利要求3-6任一项所述的方法，其特征在于，所述缓冲区的数量根据第一时间、第二时间、所述电子设备包括的硬件加速设备的数量确定；所述第一时间为从原数据库目录下读取第一数据到存满一个第一缓冲区所需的时间，所述第二时间为一个硬件加速设备完成压缩一个存满的第一缓冲区，并由所述中央处理器将对应的备份数据写入备份目录对应的数据盘中所需的时间。
根据权利要求3-7任一项所述的方法，其特征在于，所述方法还包括：

在数据备份过程中，根据所述第一时间、所述第二时间、所述电子设备包括的硬件加速设备的数量动态调整所述线程的数量和/或所述缓冲区的数量。
根据权利要求1-8任一项所述的方法，其特征在于，所述中央处理器包括所述硬件加速设备。
一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述处理器调用所述存储器中存储的计算机程序或计算机指令实现如权利要求1-9任一项所述的方法。