WO2017101301A1 - 数据信息处理方法及装置 - Google Patents

数据信息处理方法及装置 Download PDF

Info

Publication number
WO2017101301A1
WO2017101301A1 PCT/CN2016/088128 CN2016088128W WO2017101301A1 WO 2017101301 A1 WO2017101301 A1 WO 2017101301A1 CN 2016088128 W CN2016088128 W CN 2016088128W WO 2017101301 A1 WO2017101301 A1 WO 2017101301A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
blood relationship
network
node
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/CN2016/088128
Other languages
English (en)
French (fr)
Inventor
刘宏斌
国铁龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Le Holdings Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Original Assignee
Le Holdings Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Le Holdings Beijing Co Ltd, LeTV Information Technology Beijing Co Ltd filed Critical Le Holdings Beijing Co Ltd
Priority to EP16758075.2A priority Critical patent/EP3206146A4/en
Priority to US15/241,292 priority patent/US20170169167A1/en
Publication of WO2017101301A1 publication Critical patent/WO2017101301A1/zh
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Definitions

  • the present disclosure relates to the field of data information processing technologies, and in particular, to a data information processing method and apparatus.
  • Data is one of the organization's most valuable assets. There is a direct link between the company's data quality and business performance, and high-quality data can keep the company competitive and invincible in times of economic turmoil. With a generally deep data quality, companies can trust all data that meets all needs at all times.
  • Data quality management refers to a series of management, identification, measurement, monitoring, early warning, etc. of various data quality problems that may arise from each stage of planning, acquisition, storage, sharing, maintenance, application, and demise of data. Activities and improved data quality by improving and improving the management of the organization.
  • the present disclosure provides a data information processing method and apparatus.
  • a data information processing method comprising:
  • the blood relationship information includes at least: a data flow direction
  • the task logic includes any one of data format conversion and data operation.
  • the establishing a blood relationship network between the plurality of stored data includes:
  • the data flow between the two nodes is marked between the two nodes according to the blood relationship information.
  • the method further includes:
  • the found data is determined to be suspected problem data.
  • the method further includes:
  • a data information processing apparatus including:
  • a task logic acquiring module configured to acquire task logic for processing the data when processing the data
  • An association data determining module configured to determine input data and output data corresponding to the task logic according to execution logic of the task logic
  • a blood relationship information determining module configured to determine blood relationship information of the input data and the output data
  • a network establishing module configured to establish, according to the blood relationship information of each of the stored data, a blood relationship network between the plurality of stored data.
  • the blood relationship information includes at least: a data flow direction
  • the task logic includes any one of data format conversion and data operation.
  • the network establishing module includes:
  • a node graph generation submodule configured to generate a node graph including the plurality of stored data, where each stored data is displayed in a node form in the node graph;
  • a blood relationship determination sub-module configured to determine whether there is a blood relationship between any two nodes in the node graph
  • the data flow direction indication sub-module is configured to mark a data flow direction between the two nodes between the two nodes according to the blood relationship information when there is a blood relationship between the two nodes.
  • the device further includes:
  • a first kinship relationship network obtaining module configured to acquire a target kinship network in which the problem data is located when detecting problem data having a quality problem
  • a data search module configured to search, in the target blood relationship network, all data having a blood relationship with the problem data
  • the suspected problem data determining module is configured to determine the found data as suspected problem data.
  • the device further includes:
  • a data processing judging module configured to determine whether data processing of the first data in the blood relationship network is detected
  • a second kinship relationship information obtaining module configured to acquire, according to the current task logic, the blood relationship information of the second data associated with the first data, when detecting the data processing of the first data in the kinship network ;
  • a node adding module configured to add, according to the blood relationship information of the second data, a node corresponding to the second data in the blood relationship network.
  • a computer storage medium can store a program, and when the program is executed, the implementation manner of the data information processing method provided by the first aspect of the present invention can be implemented. Part or all of the steps.
  • the method provided by the embodiment of the present invention acquires task logic for processing the data, and then determines input data and output data corresponding to the task logic according to the execution logic of the task logic;
  • the blood relationship information of the input data and the output data; and the blood relationship network between the plurality of stored data is established according to the blood relationship information of each of the stored data for the plurality of stored data.
  • the input logic and the output data related to the logical logic of the task are determined by acquiring the execution logic of the corresponding task logic. Since there is task logic between the input data and the output data, it can be determined. There is a blood relationship between the two, and then the blood relationship between the data is determined by the method for each stored data, and finally the blood relationship network between all the stored data can be obtained.
  • the method when there is a problem in a certain data in the network, other suspected problem data in the blood relationship network can be passed, so that the technician can eliminate or modify the data with the quality problem, thereby improving the quality of the stored data. .
  • FIG. 1 is a flowchart of a data information processing method according to an embodiment of the present invention
  • FIG. 2 is a schematic flow chart of step S103 in FIG. 1;
  • FIG. 3 is a schematic diagram of a node according to an embodiment of the present disclosure.
  • FIG. 4 is a schematic diagram of a blood relationship network according to an embodiment of the present invention.
  • FIG. 5 is a flowchart of another data information processing method according to an embodiment of the present invention.
  • FIG. 6 is a flowchart of still another data information processing method according to an embodiment of the present invention.
  • FIG. 7 is a schematic diagram of another blood relationship network according to an embodiment of the present invention.
  • FIG. 8 is a schematic structural diagram of a data information processing apparatus according to an embodiment of the present disclosure.
  • FIG. 9 is a schematic structural diagram of a network establishment module in FIG. 8.
  • FIG. 10 is a schematic structural diagram of another data information processing apparatus according to an embodiment of the present disclosure.
  • FIG. 11 is a schematic structural diagram of still another data information processing apparatus according to an embodiment of the present invention.
  • FIG. 1 is a flowchart of a data information processing method according to an embodiment of the present invention.
  • the data information processing method can be applied to a server. As shown in FIG. 1, the method can include the following steps.
  • Step S101 When processing the data, acquire task logic for processing the data.
  • the data can be in different forms in different storage media.
  • data is described in units of data.
  • the output target of each data processing task can be used as a data unit.
  • the input source of each data processing task can also be used as a data unit.
  • each cell in the data table can be used as a data unit; in addition, in the front-end presentation, the report can also be used as a data unit.
  • the task logic for processing the data unit can be acquired with the data unit as an object.
  • the task logic refers to a manner of processing data, such as data format conversion and data operation.
  • Step S102 Determine input data and output data corresponding to the task logic according to execution logic of the task logic.
  • execution logic for each task logic.
  • the execution logic refers to the flow direction between data, taking the data format conversion as an example, the data before the format conversion is the input data, and the format converted data is the output data, taking the data operation as an example, the data operation
  • Each of the previous parameters can be input data, and the data obtained after the data operation is output data.
  • Step S103 Determine blood relationship information of the input data and the output data.
  • the output data is obtained by processing the input data, and therefore, it can be determined that there is an association relationship between the input data and the output data.
  • the blood relationship information may at least include: a data flow direction.
  • Step S104 Establish, for a plurality of stored data, a blood relationship network between the plurality of stored data according to the blood relationship information of each of the stored data.
  • the blood relationship information corresponding to the stored data can be obtained, so that in the process of accumulating the stored data, the blood relationship information of each stored data can be obtained at the same time, and the blood relationship is utilized.
  • Information, the flow relationship between the stored data can be obtained. Therefore, in this step, the relationship between all the stored data can be sorted out by storing the flow relationship between the data, and the blood relationship between the plurality of stored data can be obtained.
  • the network which is the "family spectrum” between the data, can be found through the "family map" for each node's parent node (ie input data) and child nodes (ie output data).
  • the method provided by the embodiment of the present invention acquires task logic for processing the data, and then determines input data and output data corresponding to the task logic according to the execution logic of the task logic;
  • the blood relationship information of the input data and the output data; and the blood relationship network between the plurality of stored data is established according to the blood relationship information of each of the stored data for the plurality of stored data.
  • the input data and the output data related to the logic of the task are determined, due to the input data and the output data.
  • There is a task logic between them so it can be determined that there is a blood relationship between the two, and then the blood relationship between the data is determined by the method for each stored data, and finally the blood relationship network between all the stored data can be obtained.
  • other suspected problem data in the blood relationship network may be passed, so that the technician can eliminate or modify the data with the quality problem, thereby improving the quality of the stored data.
  • step S103 shown in FIG. 1 may include the following steps.
  • Step S1031 Generate a node map including the plurality of stored data.
  • each stored data is presented in the form of a node in the node graph. As shown in FIG. 3, each circle is a node, indicating a data, and a number corresponding to the data is set on the node.
  • Step S1032 Determine whether there is a blood relationship between any two nodes in the node graph.
  • this step it is determined whether there is a blood relationship between the two nodes by judging whether there is a task logic between the two nodes.
  • step S1033 is performed. Otherwise, the process ends.
  • Step S1033 The data flow direction between the two nodes is marked between the two nodes according to the blood relationship information.
  • the data flow between the two nodes can be indicated by arrows between the nodes, thereby obtaining a blood relationship network.
  • the method may further include the following steps.
  • Step S201 When the problem data with the quality problem is detected, the target blood relationship network where the problem data is located is obtained.
  • the target blood relationship network where the problem data is located can be found.
  • the blood relationship network shown in FIG. 4 can be determined as the target blood relationship network.
  • Step S202 Find all data having a blood relationship with the problem data in the target blood relationship network.
  • the nodes having the task logic between the data and the data are searched, for example, the nodes having the direct task logic between the node 12 and the node 12 are: 11, 14, and 15, The nodes in FIG. 4 and node 12 having indirect task logic are: 14, 16, 17, 18, and 19.
  • Step S203 The found data is determined as the suspected problem data.
  • the corresponding direct input data may include: node 11 and node 14, and for node 14, node 19 is direct input data of node 14, when node 12 is used as input data, corresponding
  • the direct output data may include: node 15 and node 17, for node 15, the corresponding direct output data is node 14 and node 16, and for node 17, the corresponding direct output data is node 18.
  • nodes 11, 14, and 15, and nodes 14, 16, 17, 18, and 19 are all associated with node 12 these nodes can be used as suspected problem data.
  • the method provided by the embodiment of the present invention in a large amount of stored data, once a quality problem of a certain node is determined, all nodes associated with the node having the quality problem can be quickly found through the blood relationship network as a suspected problem. The data, in turn, can quickly locate the data of this quality problem, and thus provide a strong guarantee for solving the data problem.
  • data corresponding to each node in the network may also be processed as input data. Accordingly, as shown in FIG. 6, the method may further include the following steps.
  • Step S301 Determine whether data processing of the first data in the blood relationship network is detected.
  • the stored data is used as the basis of data processing, that is, the stored data is logically operated as input data. Therefore, in this step, whether the blood is detected in real time
  • the first data in the relational network performs data processing.
  • step S302 is performed; otherwise, the flow is ended.
  • Step S302 Acquire blood relationship information of the second data associated with the first data according to the current task logic.
  • the target data obtained after the data processing may be the second data, and then the blood relationship information between the first data and the second data is obtained. interest.
  • Step S303 Add a node corresponding to the second data in the blood relationship network according to the blood relationship information of the second data.
  • the upper node x may be added on the basis of FIG. The flow of data between node 18 and node x.
  • FIG. 8 is a schematic structural diagram of a data information processing apparatus according to an embodiment of the present invention. As shown in FIG. 8, the data information processing apparatus may include:
  • the task logic obtaining module 11 is configured to acquire task logic for processing the data when processing the data.
  • the data can be in different forms in different storage media.
  • data is described in units of data.
  • the output target of each data processing task can be used as a data unit.
  • the input source of each data processing task can also be used as a data unit.
  • each cell in the data table can be used as a data unit; in addition, in the front-end presentation, the report can also be used as a data unit.
  • the task logic for processing the data unit can be acquired with the data unit as an object.
  • the task logic refers to a method of processing data, such as data format conversion and data operation, etc.
  • the association data determining module 12 is configured to determine input data and output data corresponding to the task logic according to execution logic of the task logic.
  • execution logic for each task logic.
  • the execution logic refers to the flow direction between data, taking the data format conversion as an example, the data before the format conversion is the input data, and the format converted data is the output data, taking the data operation as an example, the data operation
  • Each of the previous parameters can be input data, and the data obtained after the data operation is output data.
  • the blood relationship information determining module 13 is configured to determine blood relationship information of the input data and the output data.
  • the output data is obtained by processing the input data, and therefore, it can be determined that there is an association relationship between the input data and the output data.
  • the blood relationship information may at least include: a data flow direction.
  • the network establishing module 14 is configured to establish, according to the blood relationship information of each of the stored data, a blood relationship network between the plurality of stored data for the plurality of stored data.
  • the blood relationship information corresponding to the stored data can be obtained, so that in the process of accumulating the stored data, the blood relationship information of each stored data can be obtained at the same time, and the blood relationship is utilized.
  • Information, the flow relationship between the stored data can be obtained. Therefore, in this step, the relationship between all the stored data can be sorted out by storing the flow relationship between the data, and the blood relationship between the plurality of stored data can be obtained.
  • the network which is the "family spectrum” between the data, can be found through the "family map" for each node's parent node (ie input data) and child nodes (ie output data).
  • the network establishment module 14 shown in the foregoing embodiment of FIG. 8 may include:
  • the node graph generation sub-module 141 is configured to generate a node graph including the plurality of stored data, where each stored data is presented in the form of a node in the node graph.
  • each stored data is presented in the form of a node in the node graph. As shown in FIG. 3, each circle is a node, indicating a data, and a number corresponding to the data is set on the node.
  • the kinship relationship determining sub-module 142 is configured to determine whether there is a blood relationship between any two nodes in the node graph.
  • whether there is a blood relationship between the two nodes is determined by determining whether there is a task logic between the two nodes.
  • the data flow direction indication sub-module 143 is configured to mark the data flow direction between the two nodes between the two nodes according to the blood relationship information when there is a blood relationship between the two nodes.
  • the flow of data between the two nodes can be indicated by arrows between the nodes.
  • the data information processing apparatus provided by the embodiment of the present invention may further include:
  • the first kinship relationship network obtaining module 21 is configured to acquire a target kinship network in which the problem data is located when the problem data with the quality problem is detected.
  • the target blood relationship network where the problem data is located can be found.
  • the blood relationship network shown in FIG. 4 can be determined as the target blood relationship network.
  • the data search module 22 is configured to find all data having a blood relationship with the problem data in the target blood relationship network.
  • the nodes having the task logic between the data and the data are searched, for example, the nodes having the direct task logic between the node 12 and the node 12 are: 11, 14, and 15, The nodes in FIG. 4 and node 12 having indirect task logic are: 14, 16, 17, 18, and 19.
  • the suspected problem data determining module 23 is configured to determine the found data as suspected problem data.
  • the corresponding direct input data may include: node 11 and node 14, and for node 14, node 19 is direct input data of node 14, when node 12 is used as input data, corresponding
  • the direct output data may include: node 15 and node 17, for node 15, the corresponding direct output data is node 14 and node 16, and for node 17, the corresponding direct output data is node 18.
  • nodes 11, 14, and 15, and nodes 14, 16, 17, 18, and 19 are all associated with node 12 these nodes can be used as suspected problem data.
  • the device in a large amount of stored data, once a quality problem of a certain node is determined, all nodes associated with the node having the quality problem can be quickly found through the blood relationship network as a suspect problem.
  • the data in turn, can quickly locate the data of this quality problem, and thus provide a strong guarantee for solving the data problem.
  • the data information processing apparatus provided by the embodiment of the present invention may further include:
  • the data processing judging module 31 is configured to determine whether data processing of the first data in the blood relationship network is detected.
  • the stored data is used as the basis of data processing, that is, the stored data is logically operated as input data. Therefore, in this step, whether the blood is detected in real time
  • the first data in the relational network performs data processing.
  • the second kin relationship information obtaining module 32 is configured to: when detecting data processing of the first data in the kinship network, acquire a blood relationship of the second data associated with the first data according to the current task logic information.
  • the target data obtained after the data processing may be the second data, and then the blood relationship information between the first data and the second data is acquired.
  • the node adding module 33 is configured to add a node corresponding to the second data in the blood relationship network according to the blood relationship information of the second data.
  • the upper node x may be added on the basis of FIG. The flow of data between node 18 and node x.
  • the embodiment of the present invention further provides a computer storage medium, wherein the computer storage medium can store a program, and the program can be implemented in various implementation manners of the data information processing method provided by the embodiment shown in FIG. Some or all of the steps.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种数据信息处理方法及装置,该方法包括:在对数据处理时,获取对所述数据进行处理的任务逻辑(S101);根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据(S102);确定所述输入数据和输出数据的血缘关系信息(S103);针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络(S104)。利用该方法,可以在该网络中的某一个数据出现问题时,可以通过该血缘关系网络中的其它疑似问题数据,以便于技术人员将出现质量问题的数据剔除或修改,提高存储的数据的质量。

Description

数据信息处理方法及装置
本申请要求于2015年12月14日提交中国专利局、申请号为201510927475.X、发明名称为“数据信息处理方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本公开涉及数据信息处理技术领域,尤其涉及一种数据信息处理方法及装置。
背景技术
数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
数据质量管理,是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。
在目前的数据质量管理过程中,大量数据采用手工录入,使得数据之间相对分散,而实际在数据产生过程中,不同数据之间可能具有一定关联性,这就导致当数据量较大时,一旦某一个数据质量出现问题,无法及时有效发现与该出现质量问题相关的其它数据,进而导致数据可能存在隐患,使得数据质量降低。
发明内容
为克服相关技术中存在的问题,本公开提供一种数据信息处理方法及装置。
根据本公开实施例的第一方面,提供一种数据信息处理方法,该方法包括:
在对数据处理时,获取对所述数据进行处理的任务逻辑;
根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输 出数据;
确定所述输入数据和输出数据的血缘关系信息;
针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
可选地,所述血缘关系信息至少包括:数据流向;
所述任务逻辑包括:数据格式转换和数据运算中的任意一种。
可选地,所述建立所述多个存储数据之间的血缘关系网络,包括:
生成包含所述多个存储数据的节点图,每个存储数据在所述节点图中以节点的形式展现;
判断所述节点图中任意两个节点之间是否存在血缘关系;
当两个节点之间存在血缘关系时,根据血缘关系信息在所述两个节点之间标示出所述两个节点之间的数据流向。
可选地,所述方法还包括:
当检测到具有质量问题的问题数据时,获取所述问题数据所在的目标血缘关系网络;
在所述目标血缘网络中查找与所述问题数据之间具有血缘关系的所有数据;
将查找到的数据确定为疑似问题数据。
可选地,所述方法还包括:
判断是否检测到对所述血缘关系网络中的第一数据进行数据处理;
当检测到对所述血缘关系网络中的第一数据进行数据处理时,根据本次任务逻辑获取与所述第一数据相关联第二数据的血缘关系信息;
根据所述第二数据的血缘关系信息,在所述血缘关系网络中增加与所述第二数据相对应的节点。
根据本公开实施例的第二方面,提供一种数据信息处理装置,包括:
任务逻辑获取模块,用于在对数据处理时,获取对所述数据进行处理的任务逻辑;
关联数据确定模块,用于根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据;
血缘关系信息确定模块,用于确定所述输入数据和输出数据的血缘关系信息;
网络建立模块,用于针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
可选地,所述血缘关系信息至少包括:数据流向;
所述任务逻辑包括:数据格式转换和数据运算中的任意一种。
可选地,所述网络建立模块,包括:
节点图生成子模块,用于生成包含所述多个存储数据的节点图,每个存储数据在所述节点图中以节点的形式展现;
血缘关系判断子模块,用于判断所述节点图中任意两个节点之间是否存在血缘关系;
数据流向标示子模块,用于当两个节点之间存在血缘关系时,根据血缘关系信息在所述两个节点之间标示出所述两个节点之间的数据流向。
可选地,所述装置还包括:
第一血缘关系网络获取模块,用于当检测到具有质量问题的问题数据时,获取所述问题数据所在的目标血缘关系网络;
数据查找模块,用于在所述目标血缘网络中查找与所述问题数据之间具有血缘关系的所有数据;
疑似问题数据确定模块,用于将查找到的数据确定为疑似问题数据。
可选地,所述装置还包括:
数据处理判断模块,用于判断是否检测到对所述血缘关系网络中的第一数据进行数据处理;
第二血缘关系信息获取模块,用于当检测到对所述血缘关系网络中的第一数据进行数据处理时,根据本次任务逻辑获取与所述第一数据相关联第二数据的血缘关系信息;
节点增加模块,用于根据所述第二数据的血缘关系信息,在所述血缘关系网络中增加与所述第二数据相对应的节点。
根据本公开实施例的第三方面,提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可实现本发明第一方面提供的数据信息处理方法的各实现方式中的部分或全部步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
本发明实施例提供的该方法,在对数据处理时,获取对该数据进行处理的任务逻辑,然后根据该任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据;确定所述输入数据和输出数据的血缘关系信息;针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
通过该方法,对于任意一个处理的数据,通过获取对应的任务逻辑的执行逻辑,确定和该任务逻辑相关的输入数据和输出数据,由于输入数据和输出数据之间存在有任务逻辑,因此可以确定二者之间是具有血缘关系,然后针对每个存储的数据均通过该方法确定数据之间的血缘关系,最终可以得到所有存储数据之间的血缘关系网络。利用该方法,可以在该网络中的某一个数据出现问题时,可以通过该血缘关系网络中的其它疑似问题数据,以便于技术人员将出现质量问题的数据剔除或修改,提高存储的数据的质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据信息处理方法的流程图;
图2为图1中步骤S103的流程示意图;
图3为本发明实施例提供的节点的示意图;
图4为本发明实施例提供的一种血缘关系网络的示意图;
图5本发明实施例提供的另一种数据信息处理方法的流程图;
图6本发明实施例提供的又一种数据信息处理方法的流程图;
图7为本发明实施例提供的另一种血缘关系网络的示意图;
图8为本发明实施例提供的一种数据信息处理装置的结构示意图;
图9为图8中的网络建立模块的结构示意图;
图10为本发明实施例提供的另一种数据信息处理装置的结构示意图;
图11为本发明实施例提供的又一种数据信息处理装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是本发明实施例提供的一种数据信息处理方法的流程图。该数据信息处理方法可以应用于服务器中,如图1所示,该方法可以包括以下步骤。
步骤S101:在对数据处理时,获取对所述数据进行处理的任务逻辑。
在不同的存储媒介中,数据的形式可以均不相同。为了描述方便,在本发明实施例中,以数据单元来描述数据。一般而言,每个数据处理任务的输出目标可以作为一个数据单元,另外,每个数据处理任务的输入源也可以作为一个数据单元。例如:在关系型数据库中,数据表中的每一个单元格可以作为一个数据单元;另外,在前端展现中,报表也可以作为一个数据单元。
参见上述描述,在该步骤中,可以以数据单元为对象,获取对该数据单元进行处理的任务逻辑。
在本发明实施例中,任务逻辑是指对数据进行处理的方式,例如:数据格式转换和数据运算等。
步骤S102:根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据。
对于每个任务逻辑而言,均有执行逻辑。在本发明实施例中,执行逻辑是指数据之间的流向,以数据格式转换为例,格式转换前的数据为输入数据,格式转换后的数据为输出数据,以数据运算为例,数据运算前的每个参数均可以为输入数据,数据运算后得到的数据为输出数据。
步骤S103:确定所述输入数据和输出数据的血缘关系信息。
由于输入数据和输出数据均与同一任务逻辑相关联,所以,输出数据是将输入数据进行处理后得到的,因此,可以确定输入数据和输出数据之间存在关联关系。
在本发明实施例中,血缘关系信息至少可以包括:数据流向。
步骤S104:针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
对于服务器中记录到的每个存储数据,均可以得到可以和该存储数据对应的血缘关系信息,这样,在存储数据积累过程中,可以同时得到每个存储数据的血缘关系信息,利用这些血缘关系信息,就可以得到存储数据之间的流向关系,因此,在该步骤中可以通过存储数据之间的流向关系,将所有存储数据之间关系梳理清楚,得到这多个存储数据之间的血缘关系网络,也即数据之间的“族谱图”,通过“族谱图”可以找到每个节点的父节点(即输入数据)以及子节点(即输出数据)。
本发明实施例提供的该方法,在对数据处理时,获取对该数据进行处理的任务逻辑,然后根据该任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据;确定所述输入数据和输出数据的血缘关系信息;针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
通过该方法,对于任意一个处理的数据,通过获取对应的任务逻辑的执行逻辑,确定和该任务逻辑相关的输入数据和输出数据,由于输入数据和输出数据之 间存在有任务逻辑,因此可以确定二者之间是具有血缘关系,然后针对每个存储的数据均通过该方法确定数据之间的血缘关系,最终可以得到所有存储数据之间的血缘关系网络。进而当该网络中的某一个数据出现问题时,可以通过该血缘关系网络中的其它疑似问题数据,以便于技术人员将出现质量问题的数据剔除或修改,提高存储的数据的质量。
在本发明另一实施例中,如图2所示,上述图1所示的步骤S103可以包括以下步骤。
步骤S1031:生成包含所述多个存储数据的节点图。
在本发明实施例中,每个存储数据在所述节点图中以节点的形式展现。如图3所示,每个圆圈为一个节点,表示一个数据,在节点上均设置有和该数据对应编号。
步骤S1032:判断所述节点图中任意两个节点之间是否存在血缘关系。
在该步骤中,通过判断两个节点之间是否具有任务逻辑的方式,来判断这两个节点之间是否存在血缘关系。
当两个节点之间存在血缘关系时,执行步骤S1033。否则,结束流程。
步骤S1033:根据血缘关系信息在所述两个节点之间标示出所述两个节点之间的数据流向。
如图4所示,在节点之间可以通过箭头的方式,标示出两个节点之间的数据流向,进而得到血缘关系网络。
在本发明其它实施例中,如图5所示,当建立多个存储数据之间的血缘关系网络后,该方法还可以包括以下步骤。
步骤S201:当检测到具有质量问题的问题数据时,获取所述问题数据所在的目标血缘关系网络。
当检测到问题数据后,通过查找前面建立的所有血缘关系网络,可以查找出该问题数据所在的目标血缘关系网络。以上述图4为例,当问题数据为节点12对应的数据时,可以将图4所示的血缘关系网络确定为目标血缘关系网络。
步骤S202:在所述目标血缘网络中查找与所述问题数据之间具有血缘关系的所有数据。
当图4中节点12对应的数据为问题数据时,查找与该数据之间具有任务逻辑所有节点,例如:图4中和节点12之间具有直接任务逻辑的节点为:11、14和15,图4中和节点12具有间接任务逻辑的节点为:14、16、17、18和19。
步骤S203:将查找到的数据确定为疑似问题数据。
当将节点12作为输出数据时,对应的直接输入数据可以包括:节点11和节点14,并且对于节点14而言,节点19为节点14的直接输入数据,当将节点12作为输入数据时,对应的直接输出数据可以包括:节点15和节点17,对于节点15而言,对应的直接输出数据为节点14和节点16,对于节点17而言,对应的直接输出数据为节点18。
一旦确定节点12对应的数据为问题数据时,由于节点11、14和15,以及,节点14、16、17、18和19均和节点12相关联,所以,这些节点均可以作为疑似问题数据。
通过本发明实施例提供的该方法,在大量存储数据中,一旦确定出某一个节点出现质量问题时,可以快速通过血缘关系网络查找到和该出现质量问题的节点相关联的所有节点作为疑似问题数据,进而可以对本次出现质量问题的数据进行快速定位,进而为解决数据问题提供有力保障。
在本发明另一实施例中,对于网络中的每个节点对应的数据,还可能被作为输入数据进行数据处理,相应地,如图6所示,该方法还可以包括以下步骤。
步骤S301:判断是否检测到对所述血缘关系网络中的第一数据进行数据处理。
对于数据库中存储的数据,可能会被前端调用,并且以这些存储的数据作为数据处理的基础,即将这些存储的数据作为输入数据进行逻辑运算,因此,在该步骤中,可以实时检测是否对血缘关系网络中的第一数据进行数据处理。
当检测到对所述血缘关系网络中的第一数据进行数据处理时,执行步骤S302;否则,结束流程。
步骤S302:根据本次任务逻辑获取与所述第一数据相关联第二数据的血缘关系信息。
当将第一数据作为输入数据,对第一数据进行数据处理时,在数据处理后得到的目标数据可以为第二数据,然后获取第一数据和第二数据之间的血缘关系信 息。
步骤S303:根据所述第二数据的血缘关系信息,在所述血缘关系网络中增加与所述第二数据相对应的节点。
以图4为例,当以节点18为输入数据进行数据处理时,若生成的第二数据为节点x,如图7所示,可以在图4的基础上,增加上节点x,并且标示出节点18和节点x之间的数据流向。
基于同一公开构思,本公开实施例还提供了一种数据信息处理装置。图8为本发明实施例提供的一种数据信息处理装置的结构示意图,如图8所示,该数据信息处置装置可以包括:
任务逻辑获取模块11,用于在对数据处理时,获取对所述数据进行处理的任务逻辑。
在不同的存储媒介中,数据的形式可以均不相同。为了描述方便,在本发明实施例中,以数据单元来描述数据。一般而言,每个数据处理任务的输出目标可以作为一个数据单元,另外,每个数据处理任务的输入源也可以作为一个数据单元。例如:在关系型数据库中,数据表中的每一个单元格可以作为一个数据单元;另外,在前端展现中,报表也可以作为一个数据单元。
参见上述描述,在该步骤中,可以以数据单元为对象,获取对该数据单元进行处理的任务逻辑。
在本发明实施例中,任务逻辑是指对数据进行处理的方式,例如:数据格式转换和数据运算等
关联数据确定模块12,用于根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据。
对于每个任务逻辑而言,均有执行逻辑。在本发明实施例中,执行逻辑是指数据之间的流向,以数据格式转换为例,格式转换前的数据为输入数据,格式转换后的数据为输出数据,以数据运算为例,数据运算前的每个参数均可以为输入数据,数据运算后得到的数据为输出数据。
血缘关系信息确定模块13,用于确定所述输入数据和输出数据的血缘关系信息。
由于输入数据和输出数据均与同一任务逻辑相关联,所以,输出数据是将输入数据进行处理后得到的,因此,可以确定输入数据和输出数据之间存在关联关系。
在本发明实施例中,血缘关系信息至少可以包括:数据流向。
网络建立模块14,用于针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
对于服务器中记录到的每个存储数据,均可以得到可以和该存储数据对应的血缘关系信息,这样,在存储数据积累过程中,可以同时得到每个存储数据的血缘关系信息,利用这些血缘关系信息,就可以得到存储数据之间的流向关系,因此,在该步骤中可以通过存储数据之间的流向关系,将所有存储数据之间关系梳理清楚,得到这多个存储数据之间的血缘关系网络,也即数据之间的“族谱图”,通过“族谱图”可以找到每个节点的父节点(即输入数据)以及子节点(即输出数据)。
在本发明另一实施例中,如图9所示,上述图8实施例中所示的网络建立模块14可以包括:
节点图生成子模块141,用于生成包含所述多个存储数据的节点图,每个存储数据在所述节点图中以节点的形式展现。
在本发明实施例中,每个存储数据在所述节点图中以节点的形式展现。如图3所示,每个圆圈为一个节点,表示一个数据,在节点上均设置有和该数据对应编号。
血缘关系判断子模块142,用于判断所述节点图中任意两个节点之间是否存在血缘关系。
在本发明实施例中,通过判断两个节点之间是否具有任务逻辑的方式,来判断这两个节点之间是否存在血缘关系。
数据流向标示子模块143,用于当两个节点之间存在血缘关系时,根据血缘关系信息在所述两个节点之间标示出所述两个节点之间的数据流向。
如图4所示,在节点之间可以通过箭头的方式,标示出两个节点之间的数据流向。
在本发明另一实施例中,如图10所示,本发明实施例提供的该数据信息处理装置还可以包括:
第一血缘关系网络获取模块21,用于当检测到具有质量问题的问题数据时,获取所述问题数据所在的目标血缘关系网络。
当检测到问题数据后,通过查找前面建立的所有血缘关系网络,可以查找出该问题数据所在的目标血缘关系网络。以上述图4为例,当问题数据为节点12对应的数据时,可以将图4所示的血缘关系网络确定为目标血缘关系网络。
数据查找模块22,用于在所述目标血缘网络中查找与所述问题数据之间具有血缘关系的所有数据。
当图4中节点12对应的数据为问题数据时,查找与该数据之间具有任务逻辑所有节点,例如:图4中和节点12之间具有直接任务逻辑的节点为:11、14和15,图4中和节点12具有间接任务逻辑的节点为:14、16、17、18和19。
疑似问题数据确定模块23,用于将查找到的数据确定为疑似问题数据。
当将节点12作为输出数据时,对应的直接输入数据可以包括:节点11和节点14,并且对于节点14而言,节点19为节点14的直接输入数据,当将节点12作为输入数据时,对应的直接输出数据可以包括:节点15和节点17,对于节点15而言,对应的直接输出数据为节点14和节点16,对于节点17而言,对应的直接输出数据为节点18。
一旦确定节点12对应的数据为问题数据时,由于节点11、14和15,以及,节点14、16、17、18和19均和节点12相关联,所以,这些节点均可以作为疑似问题数据。
通过本发明实施例提供的该装置,在大量存储数据中,一旦确定出某一个节点出现质量问题时,可以快速通过血缘关系网络查找到和该出现质量问题的节点相关联的所有节点作为疑似问题数据,进而可以对本次出现质量问题的数据进行快速定位,进而为解决数据问题提供有力保障。
在本发明另一实施例中,如图11所示,本发明实施例提供的该数据信息处理装置还可以包括:
数据处理判断模块31,用于判断是否检测到对所述血缘关系网络中的第一数据进行数据处理。
对于数据库中存储的数据,可能会被前端调用,并且以这些存储的数据作为数据处理的基础,即将这些存储的数据作为输入数据进行逻辑运算,因此,在该步骤中,可以实时检测是否对血缘关系网络中的第一数据进行数据处理。
第二血缘关系信息获取模块32,用于当检测到对所述血缘关系网络中的第一数据进行数据处理时,根据本次任务逻辑获取与所述第一数据相关联第二数据的血缘关系信息。
当将第一数据作为输入数据,对第一数据进行数据处理时,在数据处理后得到的目标数据可以为第二数据,然后获取第一数据和第二数据之间的血缘关系信息。
节点增加模块33,用于根据所述第二数据的血缘关系信息,在所述血缘关系网络中增加与所述第二数据相对应的节点。
以图4为例,当以节点18为输入数据进行数据处理时,若生成的第二数据为节点x,如图7所示,可以在图4的基础上,增加上节点x,并且标示出节点18和节点x之间的数据流向。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可实现图1-图7所示实施例提供的数据信息处理方法的各实现方式中的部分或全部步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

  1. 一种数据信息处理方法,其特征在于,包括:
    在对数据处理时,获取对所述数据进行处理的任务逻辑;
    根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据;
    确定所述输入数据和输出数据的血缘关系信息;
    针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
  2. 根据权利要求1所述的方法,其特征在于,所述血缘关系信息至少包括:数据流向;
    所述任务逻辑包括:数据格式转换和数据运算中的任意一种。
  3. 根据权利要求1所述的方法,其特征在于,所述建立所述多个存储数据之间的血缘关系网络,包括:
    生成包含所述多个存储数据的节点图,每个存储数据在所述节点图中以节点的形式展现;
    判断所述节点图中任意两个节点之间是否存在血缘关系;
    当两个节点之间存在血缘关系时,根据血缘关系信息在所述两个节点之间标示出所述两个节点之间的数据流向。
  4. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    当检测到具有质量问题的问题数据时,获取所述问题数据所在的目标血缘关系网络;
    在所述目标血缘网络中查找与所述问题数据之间具有血缘关系的所有数据;
    将查找到的数据确定为疑似问题数据。
  5. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    判断是否检测到对所述血缘关系网络中的第一数据进行数据处理;
    当检测到对所述血缘关系网络中的第一数据进行数据处理时,根据本次任务逻辑获取与所述第一数据相关联第二数据的血缘关系信息;
    根据所述第二数据的血缘关系信息,在所述血缘关系网络中增加与所述第二数据相对应的节点。
  6. 一种数据信息处理装置,其特征在于,包括:
    任务逻辑获取模块,用于在对数据处理时,获取对所述数据进行处理的任务逻辑;
    关联数据确定模块,用于根据所述任务逻辑的执行逻辑,确定与所述任务逻辑相对应的输入数据和输出数据;
    血缘关系信息确定模块,用于确定所述输入数据和输出数据的血缘关系信息;
    网络建立模块,用于针对多个存储数据,根据每个所述存储数据的血缘关系信息,建立所述多个存储数据之间的血缘关系网络。
  7. 根据权利要求6所述的装置,其特征在于,所述血缘关系信息至少包括:数据流向;
    所述任务逻辑包括:数据格式转换和数据运算中的任意一种。
  8. 根据权利要求6所述的装置,其特征在于,所述网络建立模块,包括:
    节点图生成子模块,用于生成包含所述多个存储数据的节点图,每个存储数据在所述节点图中以节点的形式展现;
    血缘关系判断子模块,用于判断所述节点图中任意两个节点之间是否存在血缘关系;
    数据流向标示子模块,用于当两个节点之间存在血缘关系时,根据血缘关系信息在所述两个节点之间标示出所述两个节点之间的数据流向。
  9. 根据权利要求6所述的装置,其特征在于,所述装置还包括:
    第一血缘关系网络获取模块,用于当检测到具有质量问题的问题数据时,获取所述问题数据所在的目标血缘关系网络;
    数据查找模块,用于在所述目标血缘网络中查找与所述问题数据之间具 有血缘关系的所有数据;
    疑似问题数据确定模块,用于将查找到的数据确定为疑似问题数据。
  10. 根据权利要求6所述的装置,其特征在于,所述装置还包括:
    数据处理判断模块,用于判断是否检测到对所述血缘关系网络中的第一数据进行数据处理;
    第二血缘关系信息获取模块,用于当检测到对所述血缘关系网络中的第一数据进行数据处理时,根据本次任务逻辑获取与所述第一数据相关联第二数据的血缘关系信息;
    节点增加模块,用于根据所述第二数据的血缘关系信息,在所述血缘关系网络中增加与所述第二数据相对应的节点。
PCT/CN2016/088128 2015-12-14 2016-07-01 数据信息处理方法及装置 Ceased WO2017101301A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP16758075.2A EP3206146A4 (en) 2015-12-14 2016-07-01 Data information processing method and device
US15/241,292 US20170169167A1 (en) 2015-12-14 2016-08-19 Method And Electronic Device For Data Information Processing

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510927475.X 2015-12-14
CN201510927475.XA CN105868521A (zh) 2015-12-14 2015-12-14 数据信息处理方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/241,292 Continuation US20170169167A1 (en) 2015-12-14 2016-08-19 Method And Electronic Device For Data Information Processing

Publications (1)

Publication Number Publication Date
WO2017101301A1 true WO2017101301A1 (zh) 2017-06-22

Family

ID=56623737

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/088128 Ceased WO2017101301A1 (zh) 2015-12-14 2016-07-01 数据信息处理方法及装置

Country Status (3)

Country Link
EP (1) EP3206146A4 (zh)
CN (1) CN105868521A (zh)
WO (1) WO2017101301A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860811A (zh) * 2021-02-05 2021-05-28 北京百度网讯科技有限公司 数据血缘关系的确定方法、装置、电子设备和存储介质
CN113204594A (zh) * 2021-05-28 2021-08-03 平安国际智慧城市科技股份有限公司 数据血缘关系生成方法、装置、存储介质和计算机设备
CN114090266A (zh) * 2021-12-01 2022-02-25 中科三清科技有限公司 空气质量预报生成方法和装置
CN114416848A (zh) * 2022-01-25 2022-04-29 建信融通有限责任公司 基于数据仓库的数据血缘关系处理方法及装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694195B (zh) * 2017-04-10 2022-04-12 腾讯科技(深圳)有限公司 一种分布式数据仓库的管理方法及系统
CN107239335B (zh) * 2017-06-09 2020-06-05 中国工商银行股份有限公司 分布式系统的作业调度系统及方法
CN109976929A (zh) * 2017-12-28 2019-07-05 中国电信股份有限公司 数据生产过程的故障定位方法、装置
CN110019315A (zh) * 2018-06-19 2019-07-16 杭州数澜科技有限公司 一种用于数据血缘解析的方法和装置
CN110502589B (zh) * 2019-08-20 2023-12-01 创新先进技术有限公司 一种节点血缘关系确定方法、装置以及电子设备
CN111597255A (zh) * 2020-04-29 2020-08-28 北京金山云网络技术有限公司 数据灾备处理方法、装置、电子设备及存储介质
CN112818015B (zh) * 2021-01-21 2022-07-15 广州汇通国信科技有限公司 基于数据血缘分析的数据追踪方法、系统及存储介质
CN113191879B (zh) * 2021-05-21 2024-12-24 中国工商银行股份有限公司 基于复杂网络的数据报送方法、装置、系统及介质
CN113486215B (zh) * 2021-07-05 2024-12-17 中国工商银行股份有限公司 一种基于数据关联性的数据展示方法、装置及设备
CN114090558A (zh) * 2021-11-10 2022-02-25 支付宝(杭州)信息技术有限公司 针对数据库的数据质量管理方法和装置
CN115712617A (zh) * 2022-11-29 2023-02-24 金蝶软件(中国)有限公司 单据数据质量检测方法、系统、设备及计算机可读介质
CN119003495B (zh) * 2024-07-05 2026-01-13 广东光速数据有限公司 一种基于大数据的信息化处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8510254B2 (en) * 2008-10-27 2013-08-13 Taiwan Semiconductor Manufacturing Company, Ltd. Ontology model to accelerate engineering analysis in manufacturing
CN103268355A (zh) * 2013-06-05 2013-08-28 中国电子科技集团公司第十五研究所 数据问题处理方法和处理系统
CN103955526A (zh) * 2014-05-09 2014-07-30 中国联合网络通信集团有限公司 数据存储方法和装置
CN104346367A (zh) * 2013-07-30 2015-02-11 华为技术有限公司 一种数据集成的方法和装置
CN104881427A (zh) * 2015-04-01 2015-09-02 北京科东电力控制系统有限责任公司 一种面向电网调控运行的数据血统分析方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090022519A (ko) * 2007-08-30 2009-03-04 김정태 인터넷을 이용한 족보 서비스 시스템 및 그 방법
KR101639292B1 (ko) * 2008-12-02 2016-07-13 아브 이니티오 테크놀로지 엘엘시 데이터 요소 사이의 관계를 시각화하는 방법
CN102902750A (zh) * 2012-09-20 2013-01-30 浪潮齐鲁软件产业有限公司 一种通用的数据抽取转换方法
US9256656B2 (en) * 2013-08-20 2016-02-09 International Business Machines Corporation Determining reliability of data reports
CN103617182A (zh) * 2013-11-07 2014-03-05 宁波保税区攀峒信息科技有限公司 一种基本亲缘关系数据库构建方法和装置
CN103902653B (zh) * 2014-02-28 2017-08-01 珠海多玩信息技术有限公司 一种构建数据仓库表血缘关系图的方法和装置
CN104915390A (zh) * 2015-05-25 2015-09-16 广州精点计算机科技有限公司 一种etl数据血统查询系统及查询方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8510254B2 (en) * 2008-10-27 2013-08-13 Taiwan Semiconductor Manufacturing Company, Ltd. Ontology model to accelerate engineering analysis in manufacturing
CN103268355A (zh) * 2013-06-05 2013-08-28 中国电子科技集团公司第十五研究所 数据问题处理方法和处理系统
CN104346367A (zh) * 2013-07-30 2015-02-11 华为技术有限公司 一种数据集成的方法和装置
CN103955526A (zh) * 2014-05-09 2014-07-30 中国联合网络通信集团有限公司 数据存储方法和装置
CN104881427A (zh) * 2015-04-01 2015-09-02 北京科东电力控制系统有限责任公司 一种面向电网调控运行的数据血统分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3206146A4 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860811A (zh) * 2021-02-05 2021-05-28 北京百度网讯科技有限公司 数据血缘关系的确定方法、装置、电子设备和存储介质
CN112860811B (zh) * 2021-02-05 2023-07-18 北京百度网讯科技有限公司 数据血缘关系的确定方法、装置、电子设备和存储介质
CN113204594A (zh) * 2021-05-28 2021-08-03 平安国际智慧城市科技股份有限公司 数据血缘关系生成方法、装置、存储介质和计算机设备
CN114090266A (zh) * 2021-12-01 2022-02-25 中科三清科技有限公司 空气质量预报生成方法和装置
CN114416848A (zh) * 2022-01-25 2022-04-29 建信融通有限责任公司 基于数据仓库的数据血缘关系处理方法及装置
CN114416848B (zh) * 2022-01-25 2025-03-18 建信融通有限责任公司 基于数据仓库的数据血缘关系处理方法及装置

Also Published As

Publication number Publication date
EP3206146A1 (en) 2017-08-16
EP3206146A4 (en) 2017-08-16
CN105868521A (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
WO2017101301A1 (zh) 数据信息处理方法及装置
US10476904B2 (en) Non-transitory recording medium recording cyber-attack analysis supporting program, cyber-attack analysis supporting method, and cyber-attack analysis supporting apparatus
US9621571B2 (en) Apparatus and method for searching for similar malicious code based on malicious code feature information
US9235410B2 (en) Tracking software package dependencies using a graph model
KR102301946B1 (ko) 분산 시스템에서 결함을 분석하기 위한 비주얼 툴
US20180063171A1 (en) Non-transitory computer-readable recording medium storing cyber attack analysis support program, cyber attack analysis support method, and cyber attack analysis support device
US10915508B2 (en) Data linking
WO2020220638A1 (zh) 链路系统与日志系统的关联方法、装置及存储介质
US10078502B2 (en) Verification of a model of a GUI-based application
CN104699735A (zh) 企业级数据中心的数据处理方法及装置
CN114154166A (zh) 异常数据识别方法、装置、设备和存储介质
CN107798047A (zh) 重复工单检测方法、装置、服务器和介质
CN114706856A (zh) 故障处理方法及装置、电子设备和计算机可读存储介质
Molka et al. Conformance checking for BPMN-based process models
WO2021133471A1 (en) Skill determination framework for individuals and groups
JP6419667B2 (ja) テストdbデータ生成方法及び装置
CN113918438A (zh) 服务器异常的检测方法、装置、服务器及存储介质
CN104462311B (zh) 一种信息的展示方法和装置
CN118233169A (zh) 威胁事件溯源方法、装置及电子设备
JP6523799B2 (ja) 情報分析システム、情報分析方法
CN107920067B (zh) 一种主动对象存储系统上的入侵检测方法
CN105868099A (zh) 分支提交差异检测方法及装置
CN113378172B (zh) 用于识别敏感网页的方法、装置、计算机系统和介质
US10296527B2 (en) Determining an object referenced within informal online communications
CN103577312B (zh) 一种软件的时间性能的检测方法及装置

Legal Events

Date Code Title Description
REEP Request for entry into the european phase

Ref document number: 2016758075

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2016758075

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE