WO2015074290A1 - 数据库实现方法 - Google Patents

数据库实现方法 Download PDF

Info

Publication number
WO2015074290A1
WO2015074290A1 PCT/CN2013/088207 CN2013088207W WO2015074290A1 WO 2015074290 A1 WO2015074290 A1 WO 2015074290A1 CN 2013088207 W CN2013088207 W CN 2013088207W WO 2015074290 A1 WO2015074290 A1 WO 2015074290A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
code
field
node
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/CN2013/088207
Other languages
English (en)
French (fr)
Inventor
盛杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to US14/385,872 priority Critical patent/US9665600B2/en
Priority to JP2016554770A priority patent/JP6262874B2/ja
Priority to EP13897923.2A priority patent/EP3073392A4/en
Publication of WO2015074290A1 publication Critical patent/WO2015074290A1/zh
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures

Definitions

  • the present invention relates to the field of database technologies, and in particular, to a database implementation method.
  • a database is a repository for organizing, storing, and managing data.
  • the database in the related technology is mainly based on the "table", "field”, designed for unit coding.
  • the table name is first analyzed, the table name is encoded, and the table is created according to the table name and the encoding; the field name is obtained, the field name is encoded, and the field name is created in the corresponding table structure created. .
  • each data element passes the path: "table name,,.” field name “encoding conversion, addressing by two encodings” to the storage space, and then "data element” "Stored in the specified recording space, the third time encoding the "record” stored by the data element at the time of storage.
  • the encoding of the table, the encoding of the field, and the encoding of the recording are performed independently, and the various types of encodings can be repeated.
  • the addressing speed is slower.
  • a database implementation method is provided in an embodiment of the present invention, including: The data relationship between the provided table, the field, and the table and the table is uniquely coded according to a preset rule;
  • mapping in the created node cluster value comparison table, a name corresponding to each code, where the name includes a name of the table, a name of the field, or a name of the data relationship;
  • the coding sub-node with unique coding is established under the coding node corresponding to the field, and the data element is stored in the storage space corresponding to the coding sub-node.
  • FIG. 1 is a flow chart showing a method for implementing a database in an embodiment of the present invention. detailed description The present invention will be further described in detail below by way of specific embodiments and in conjunction with the accompanying drawings.
  • the main processing steps include:
  • Step S11 The data relationship between the provided table, the field, and the table and the table is uniquely coded according to a preset rule
  • Step S12 storing the obtained code of the table, the coding of the field, and the coding of the data relationship in the created node cluster coding structure table to form an encoding node;
  • Step S13 according to the affiliation between the table, the field, and the data relationship, Establishing a subordinate mapping between the encoding of the table, the encoding of the field, and the encoding of the data relationship in the node cluster coding structure table;
  • Step S14 mapping the name corresponding to each code in the created node cluster value comparison table, the name including the name of the table, the name of the field, or the name of the data relationship; Step S15: wherein, the code node corresponding to the field is established A coding sub-node having a unique coding, and storing data elements in a storage space corresponding to the coding sub-node.
  • the database implementation method provided by the embodiment of the present invention separately encodes a table, a field, a data relationship, and a data element, and uniformly stores a node cluster coding structure table and a node cluster value comparison table that are created in an address space; Any table, field and data element can be obtained by addressing the unique code of the table, field and data element to be addressed once, thereby improving the addressing efficiency of the database.
  • the database implementation method of the embodiment of the present invention further includes: adding one or more of a new table, a new field, and a new data relationship; and further comprising: directly addressing the table and the field to be deleted according to the created coding node Or a data relationship, and clearing the data space occupied by the addressed table, field, and data relationship to be deleted; further comprising: directly addressing the table, field, or data relationship to be changed according to the created coding node, and Correspondingly modify the information in the data space occupied by the addressed table, field and data relationship to be changed.
  • a new table adds one or more of a new table, a new field, and a new data relationship, including:
  • the table, the field, and the data relationship to be added are uniquely encoded according to a preset rule, and a new code is obtained;
  • the created node cluster value comparison table maps the names corresponding to the newly added codes.
  • the data relationship between the provided table, the field, and the table and the table is uniquely encoded according to a preset rule, including: when the provided table, the field, and the data relationship between the table and the table are encoded, Sequential integer coding is performed from small to large according to the same coding rule.
  • the table, the field, and the data relationship to be added are uniquely encoded according to a preset rule, and the newly added code is obtained, including: obtaining a maximum value of the current integer code in the database, and increasing the maximum value of the obtained current integer code. Step size After that, as the starting value of the newly added code, the table, the field, and the data relationship to be added are sequentially integer-encoded by the starting value to obtain a new code.
  • a plurality of implementation manners are added to the node cluster value comparison table.
  • the present invention provides various examples, and specifically includes:
  • the database implementation method of the embodiment of the present invention further includes: performing a database encoding operation on a table in an HTML format provided by the user.
  • the database encoding operation is performed on the HTML formatted table provided by the user, including: capturing a table element of a table in an HTML format, wherein the table element includes: a table name element, a data segment element, a data element element, and a data relationship element; Create a data to be converted pool according to the captured table element; scan all the elements in the data to be converted, and create a unique encoding for all the elements in the node cluster coding structure table, and establish a mapping relationship between the created codes, At the same time, the name corresponding to each code is mapped in the node cluster value comparison table.
  • the database encoding operation is performed on the HTML formatted table provided by the user, and further includes: when detecting the user adding, deleting, or changing the data segment or the data element, corresponding to the node cluster coding structure table and the node cluster value comparison table Add a new encoding, delete the specified encoding and the data in the space corresponding to the specified encoding, or tamper with the data in the specified encoding storage space.
  • the database implementation method of the embodiment of the present invention further includes: directly obtaining a corresponding table, a field, a data relationship or a data element according to the created coding node, and using the addressed table, field, data relationship, and data element to pre-predict Let the rules perform the operation.
  • the database is created by using the database implementation method in the related art.
  • the table or field in the database changes mainly including the following situations:
  • the existing database coding method when the calculation is needed, through the analysis of the calculation range, first obtain a plurality of "calculation table names" involved in the calculation, map and acquire through the "table name code set”, and then analyze In each table, multiple "calculated field names” that need to be involved in the calculation are mapped and acquired through the "field encoding set".
  • the data records corresponding to these "calculation table names" + “calculated field names” are scatter-stored, called “distributed computing recordsets.” Then, in the “Distributed Calculation Record Set,” analyze the connection relationship between the table and the table, analyze the condition range in the record, and then use the "relational connection,” and “record filter” to separate these "decomposition calculation records.” Set, read and merge into a “combined calculation record set”, and finally get a new "calculation result record set” through the corresponding operation.
  • the objective disadvantages of the existing database coding method are as follows: The encoding of the table, the encoding of the field, and the encoding of the recording are performed independently, the storage is also separated, and the encoding is repeatable, so that one data element is addressed. Both require multiple encoding conversions and distributed addressing, and the addressing speed is slow. At the same time, the "table name,” and “field name” of the addressing are both "string” type, and multiple “comparison” operations are required for addressing. , resulting in slow addressing speed.
  • the existing database coding method objective shortcomings three the addition, deletion, change of the table, the addition, deletion, change of the field, because it is always necessary to manually configure and obtain a new table code, field coding, this code is usually In this case, it cannot be automatically created and obtained by the program, which leads to the need for secondary coding and development of the calculation program after the table and field changes, resulting in the computer program being inelastic;
  • the objective disadvantage of the existing database coding method is four: after the table and the field are determined, the storage of the data element is stored in a matrix manner, but not all the fields need to store the data element on all the record lines, which leads to the storage space. Waste, this is also
  • the objective disadvantages of the existing database coding methods are five: In terms of computational efficiency, each time the calculation range is determined, it involves the conversion of multiple table codes, the conversion of field codes, and the addressing needs to be calculated in the decomposed storage space.
  • the data record collection when the number of tables involved in the calculation is increased, the addressing efficiency of the calculation record set is getting lower and lower, and the number of I/Os of the computer increases with the number of tables involved in the calculation range.
  • Linear or even exponential growth, I / O times is an important indicator of computational efficiency, the more I / O times, the more efficient the addressing efficiency, the fewer I / O times, the higher the addressing efficiency.
  • the traditional data encoding method will reduce the computational efficiency.
  • a unique non-repeating integer encoding is first created, and then the encoded code is created.
  • the process of defining the meaning of the use of the created code is a process that begins with an empty node that is completely non-directional and then continuously assigns a table or field or data element or relationship to the code.
  • the definition target In the existing database implementation method, the definition target must be determined first: if it is a definition table, it is encoded in the table set; if it is a defined field, it is encoded in the field under the specific table space; if it is a definition relationship, Then it is coded in a specific relational container; the existing data encoding process is defined by creating a node with actual meaning in a meaningful real space determined in advance, and then using it under the rules of the container. process.
  • any data node in the existing database implementation method can only be created once, creating a fixed growth relationship and record in one direction.
  • Any of the coding nodes in the database implementation method of the embodiment of the present invention can be freely created, defined twice, and create a new growth relationship and related records in either direction.
  • the use of tables, fields, and data elements is a comparison addressing, a read record, and a calculation process with the table name, the field name, and the record value feature as paths.
  • the use of tables, fields, and data elements is a process of direct addressing, direct reading, and direct calculation with integer encoding as the core.
  • a uniform unique integer-code In DataBase (UOCID) is used for each table, field, data element, and relationship, and UOCID coding is not repeated, and is uniformly stored in an address space; Store in the same address space in UOIC order, so that any table, field, data element, and data set are addressed by only a unique UOCID-address, and the UOCID code is also encoded. Consistent with the physical storage order, the target data can be extracted at one time without index secondary positioning, and the addressing efficiency is high and the speed is fast.
  • the addition, deletion, and change of the table, the addition, deletion, and modification of the field do not need to be manually configured through the database background, but directly press: "UOCID current maximum number of codes +1 "The way automatically grows the new code. Or press: "UOCID Current Idle Code” to activate the new code. Therefore, the UOCID encoding system allows for elastic growth in the design of tables and fields.
  • the database implementation method of the embodiment of the invention adds, deletes, and changes the table, and automatically adds and deletes the UOCID code by the program, thereby allowing the computer program to add, delete, and dynamically changing definitions, ⁇ 1 may be on a table, a field mapped to dynamically defined UOCID encoding, to the user to define, increases the elasticity of the program code, reducing the dependence on the secondary development of IT skill.
  • the database implementation method of the embodiment of the present invention allows data to be stored in any dimension of a table or a field as needed, and the storage of the data element is stored according to: "UOCID encoding + compact queue mode" instead of matrix storage, reducing storage The waste of space.
  • the UOCID coding determines the calculation range each time, and only involves the coding conversion of one table, and simultaneously addresses the data record set that needs to be calculated in the same storage space, and simultaneously addresses through
  • the data is extracted from the integers in the same order as the physical storage order. Therefore, no matter the calculation range, only the addressing of one coding table is involved, which greatly reduces the number of I/Os of the computer during calculation.
  • the I/O times are computational efficiency. Important indicators, the more I/O times, the more efficient the addressing, the less I/O times, and the higher the addressing efficiency.
  • UOCID coding can perform unlimited multiplexing definition of reusable tables, fields, data records and data structures on the stored data.
  • a high multiplexing rate of data is achieved, and UOCID is a uniform unique encoding, which makes it easy to maintain the multiplexing structure.
  • a UOCID data reference replacement pool is automatically formed in the process of creating a database, and is automatically called by the program to automatically switch.
  • the program implementation of the data reference replacement pool is further given in the embodiment of the present invention, for example:
  • the purchase form will be automatically renamed to: PRE purchase form
  • the UOCID code structure table and the UOCID value table are automatically mapped or automatically generated by the temporary new table, and the new table name is consistent with the actual use name:
  • the SELECT * FROM purchase table will be built on the UOCID-encoded mapping table or temporary table.
  • the purchase form will be automatically renamed to: PRE purchase form
  • the UOCID code structure table and the UOCID value table are automatically mapped or automatically generated by the temporary new table.
  • the new table name is consistent with the actual use name:
  • the following two operations are atomic operations. If both operations succeed, the operation is considered as INERT INTO VALUE. Otherwise, if any operation fails, the entire INERT INTO VALUE operation returns.
  • the database implementation method of the embodiment of the present invention can also automatically detect whether there is a new table, or a field, or a relationship of data relationships. If a new table, a new field, or a new data relationship is detected, the newly added Tables, fields, and data relationships are uniquely encoded.
  • the database implementation method of the embodiment of the present invention can also perform a database encoding operation on the HTML formatted table provided by the user, specifically, the table element of the table in the HTML format, wherein the table element includes: a table name element, a data segment element, a data element element, and a data relationship element; the data to be converted pool is created according to the captured table element; all elements in the data to be converted pool are scanned, and respectively in the node cluster coding structure table A unique encoding is created for all elements, and a mapping relationship between the created encodings is established, and the names corresponding to the respective encodings are mapped in the node cluster value comparison table.
  • the database encoding operation on the HTML format table further includes: performing UOCID encoding and tagging (setAttribute) on all elements of the HTML page, and automatically embedding the UOCID encoding into the TD ⁇ TR tag, and the UOCID is created by creating a new attribute. generate.
  • the method further includes automatically expanding the table in the HTML format to create a button for adding or changing fields;
  • a new UOCID code is automatically created and stored in the UOCID code structure table and the cluster value table.
  • the database implementation method of the embodiment of the present invention can automatically listen to all tables and fields, automatically convert to a UOCID encoding library, and automatically generate a new mapping relationship, without affecting the development reference of the existing software to the database.
  • the HTML element in the interface is automatically scanned, compared with the UOCID encoding library, the new element is encoded and newly created, and returned to the database to form a new mapping, thereby realizing a completely consistent mapping relationship between the UOCID and the existing database in the development reference. Expand the design flexibility on tables and fields.
  • any existing coding node ie, a UOCID node, for example, 381769 directly applies for a new UOCID coding sub-node, and the node has only one integer code (for example, 381776), and does not need any meaning, the coding feature It is unique and non-repeating throughout the UOCID encoding library.
  • a meaningful name may be defined on the newly added node, which may be a table name, a field name, or a data element.
  • the node relationship to which it belongs can be freely defined to form the storage form of the UOCID+ compact queue.
  • the UOCID node corresponds to the data element, and the batch of UOCID nodes can also be attributed to another or a batch of UOCID nodes at the same time.
  • a node cluster of any meaning can be created underneath.
  • the definition of each node cluster regardless of the structure of the table, field, relationship, data element, can be infinitely in each UOCID node.
  • Form a meaningful set of meaningful UOCID nodes for example, under a UOCID node, you can load a process set, a data set, a code instruction set, or even a graphic, an interface, a file, or you can load one of the most primitive Data element, a value.
  • UOCID free code based scalable coding UOCID node a computer program may be a logic 1, lines of code, logical node configuration UOCID encoding complex formed is ⁇ , and the value assigned UOCID encoding a computer program of instructions for each row of forming free container.
  • UOCID node cluster Through the free definition of the UOCID node, a UOCID node cluster, which can be included in the actual sense: table set, field set, relationship set, calculation set, and instruction structure, interface element, function element of the computer program, Behavioral element. It is stored in integer encoding order of UOCID on the storage, and the relationship is related to the description. Form a complete UOCID system code.
  • each node code does not need to be meaningful in the allocation, and is stored in order during storage.
  • a complete system definition can be formed. This complete system definition is from Structure to Elements can be freely expanded and stored, and defined twice, as long as they reflect actual intent or logic. Elements including data tables, data fields, codes, processes, etc., can be defined and augmented by UOCID node encoding. At the same time, its storage is compact.
  • the computer program can be used to perform dynamic table, dynamic field design, storage, reading and calculation on the new coding system.
  • the data layer, the logic layer and the presentation layer are all integrated by the UOCID coding form.
  • the existing database coding technology is removed, and the precoding of the table and the field is required, and the dynamic coding needs are adopted.
  • the reference to the data no longer needs the table name and the field name, but is directly referenced by the code, which realizes the infinite elasticity of the dynamic definition table and the field, realizes the fast positioning efficiency of the calculation, and also realizes The maximum multiplexing efficiency of multiplexed data.
  • the database formed by the database implementation method of the embodiment of the present invention directly refers to the UOCID coded address for calculation, and does not need to refer to the table name + field name for operation.
  • the entire encoding system can refer to the UOCID encoding without having to address the table name and field name.
  • the data operation integration may be performed based on a complex cloud system, for example, a group company. Due to historical reasons, the data types of the subordinate enterprises of the same type are different and the rules are different. Traditional databases must be designed with complex interfaces. Each interface needs to be repeatedly addressed to tables and fields, and integrated into a unified interface specification for unified computing. However, the UOCID-encoded system has a unique UOCID-encoded address for each table, field, and data element. Therefore, the interface design can be unified, and the source data to be calculated can be addressed at one time to implement irregular data. Cloud integration.
  • the operation performed by the database formed by the database implementation method of the embodiment of the present invention also solves the data reference problem between different systems of the same enterprise, for example, the interface reference of the data between the financial system, the ERP system, the CRM system, and the HR system, Requires the development of complex interfaces for existing databases, and only requires a uniform UOCID interface address, which can be used directly and participate in operations across different types of systems.
  • the existing database is compared with the UOCID storage performance.
  • the larger the data size the storage space section brought by UOCID encoding.
  • the database implementation method of the embodiment of the present invention performs UOCID coding allocation on all computer expressed elements (tables, fields, data elements, codes, tags, etc.), and the allocated codes are consistent with the physical storage order, and all computers are
  • the expressed elements (tables, fields, data elements, codes, tags, etc.) exist in the same contiguous storage space, while allowing each UOCID node code to create an infinitely flexible UOCID encoding node cluster, with references to all computer elements It is possible to perform an addressing acquisition directly through UOCID encoding, which greatly improves efficiency in addressing and calculation.
  • UOCID codes and values Since the storage of UOCID codes and values is stored in a first-come-first-served manner, it is possible to create nodes as needed and compact storage, which saves a lot of storage space when the data grows massively.
  • UOCID coding takes node coding as the core, and there is no reference restriction on table names and field names, which improves the flexibility of computer programs in creating, adding, deleting, changing, creating, adding, deleting, and changing fields.
  • the UOCID encoding system comprehensively improves the storage, design and computing performance of the computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库实现方法,包括:对提供的表、字段,以及表与表之间的数据关系按预设规则分别唯一编码;将得到的表的编码、字段的编码及数据关系的编码均存储在创建的节点簇编码结构表中,形成编码节点;根据上述表、字段及数据关系之间的从属关系,在节点簇编码结构表中建立表的编码、字段的编码及数据关系的编码之间的从属映射;且在创建的节点簇值对照表中映射各编码所对应的名称;其中,在字段所对应的编码节点下建立具有唯一编码的编码子节点,并在编码子节点对应的存储空间中存储数据元。因此,寻址任何一个表、字段及数据元时,可以通过欲寻址的表、字段及数据元的唯一编码一次寻址获取,能够提高数据库的寻址效率。

Description

数据库实现方法
技术领域 本发明涉及数据库技术领域, 具体而言, 涉及数据库实现 方法。
背景技术 数据库是一种用来组织、 存储及管理数据的仓库。 相关技 术中的数据库主要以 "表"为核心, "字段,,为单位编码设计实现。
相关技术中数据库编码实现时, 首先分析得到表名, 对表 名编码, 并根据表名及编码, 创建表; 获取字段名, 对字段名 编码, 并在创建的对应的表结构中创建字段名。
相关技术中的数据库实现方法, 数据需要存储时, 每个数 据元通过路径: "表名,,."字段名 "编码转换,通过两次编码"寻址" 到存储空间, 然后将 "数据元"存储在指定的记录空间中, 在存 储时对数据元存储的 "记录 "进行第三次编码。
相关技术中的数据库实现方法, 对表的编码、 字段的编码 及记录的编码分别独立进行, 各类编码之间可重复, 在寻址指 定数据元时, 均需多次编码转换并分散寻址, 寻址速度较慢。 发明内容 本发明的目的在于提供数据库实现方法, 以解决上述的问 题。
在本发明的实施例中提供了数据库实现方法, 包括: 对提供的表、 字段, 以及表与表之间的数据关系按预设规 则分别唯一编码;
将得到的所述表的编码、 所述字段的编码及所述数据关系 的编码均存储在创建的节点簇编码结构表中, 形成编码节点; 根据所述表、 字段及所述数据关系之间的从属关系, 在所 述节点簇编码结构表中建立表的编码、 字段的编码及数据关系 的编码之间的从属映射;
且在创建的节点簇值对照表中映射各编码所对应的名称, 所述名称包括所述表的名称、 字段的名称或所述数据关系的名 称;
其中, 在所述字段所对应的编码节点下建立具有唯一编码 的编码子节点, 并在所述编码子节点对应的存储空间中存储数 据元。
本发明实施例提供的数据库实现方法, 对表、 字段、 数据 关系及数据元分别进行唯一编码, 并统一存储在一个地址空间 即创建的节点簇编码结构表及节点簇值对照表; 如此寻址任何 一个表、 字段及数据元时, 可以通过欲寻址的表、 字段及数据 元的唯一编码一次寻址获取,由此能够提高数据库的寻址效率。 附图说明 图 1示出了本发明实施例中数据库实现方法的流程图。 具体实施方式 下面通过具体的实施例子并结合附图对本发明做进一步的 详纟田描述。
本发明实施例中提供一种数据库实现方法, 如图 1所示, 主要处理步骤包括:
步骤 S11 : 对提供的表、 字段, 以及表与表之间的数据关 系按预设规则分别唯一编码;
步骤 S12: 将得到的表的编码、 字段的编码及数据关系的 编码均存储在创建的节点簇编码结构表中, 形成编码节点; 步骤 S13: 根据表、 字段及数据关系之间的从属关系, 在 节点簇编码结构表中建立表的编码、 字段的编码及数据关系的 编码之间的从属映射;
步骤 S14: 且在创建的节点簇值对照表中映射各编码所对 应的名称,名称包括表的名称、字段的名称或数据关系的名称; 步骤 S15: 其中, 在字段所对应的编码节点下建立具有唯 一编码的编码子节点, 并在编码子节点对应的存储空间中存储 数据元。
本发明实施例提供的数据库实现方法, 对表、 字段、 数据 关系及数据元分别进行唯一编码, 并统一存储在一个地址空间 即创建的节点簇编码结构表及节点簇值对照表; 如此寻址任何 一个表、 字段及数据元时, 可以通过欲寻址的表、 字段及数据 元的唯一编码一次寻址获取,由此能够提高数据库的寻址效率。 本发明实施例的数据库实现方法还包括: 添加新的表、 新 的字段及新的数据关系中的一种或多种; 还包括: 根据创建的 编码节点, 直接寻址欲删除的表、 字段或数据关系, 并对寻址 到的欲删除的表、字段及数据关系所占用的数据空间进行清除; 还包括: 根据创建的编码节点, 直接寻址欲更改的表、 字段或 数据关系, 并对寻址到的欲更改的表、 字段及数据关系所占用 的数据空间中的信息进行对应修改。
具体地, 添加新的表、 新的字段及新的数据关系中的一种 或多种, 包括:
对欲添加的表、字段及数据关系按预设规则进行唯一编码, 得到新增编码;
将新增编码添加到节点簇值对照表中, 并在节点簇编码结 构表中建立添加的表的新增编码、 字段的新增编码及数据关系 的新增编码之间的从属映射; 且在创建的节点簇值对照表中映 射各新增编码所对应的名称。
本发明实施例中对提供的表、 字段, 以及表与表之间的数 据关系按预设规则分别唯一编码, 包括: 对提供的表、 字段, 以及表与表之间的数据关系编码时, 按照同一编码规则由小到 大进行顺序整数编码。
进一步地, 对欲添加的表、 字段及数据关系按预设规则进 行唯一编码, 得到新增编码, 包括: 获取数据库中当前整数编 码的最大值, 将获取到的当前整数编码的最大值增加预设步长 后作为新增编码的起始值, 利用起始值对欲添加的表、 字段及 数据关系由小到大进行顺序整数编码, 得到新增编码。
本发明实施例中将新增编码添加到节点簇值对照表中的实 现方式有多种, 本发明给出多种示例, 其具体包括:
利用得到的新增编码在节点簇值对照表中创建新的编码节 点, 以将新增编码添加到节点簇值对照表中;
或,
利用得到的新增编码在已建立的编码节点下创建新的编码 子节点, 以将新增编码添加到节点簇值对照表中;
或,
利用得到的新增编码在已创建的编码子节点下创建新的从 属子节点, 以将新增编码添加到节点簇值对照表中。
进一步地, 本发明实施例的数据库实现方法还包括: 对用 户提供的 HTML格式的表进行数据库编码操作。
其中,对用户提供的 HTML格式的表进行数据库编码操作, 包括: 抓取 HTML格式的表的表元素, 其中表元素包括: 表名 称元素、 数据段元素、 数据元元素及数据关系元素; 才艮据抓取 到的表元素创建数据待转换池; 扫描数据待转换池中的所有元 素, 并在节点簇编码结构表中分别对所有元素创建唯一编码, 并建立创建的编码之间的映射关系, 同时在节点簇值对照表中 映射各编码所对应的名称。 本发明实施例中对用户提供的 HTML 格式的表进行数据 库编码操作, 还包括: 检测到用户增加、 删除、 或更改数据段 或数据元时, 对应在节点簇编码结构表及节点簇值对照表中增 加新的编码、删除指定编码及该指定编码对应的空间中的数据, 或在指定的编码存储空间中爹改数据。
本发明实施例的数据库实现方法还包括: 根据创建的编码 节点, 直接寻址获取相应的表、 字段、 数据关系或数据元, 并 利用寻址到的表、 字段、 数据关系及数据元按预设规则进行运 算。
以下通过与相关技术中的数据库实现方法对比, 对本发明 实施例的数据库实现方法进行进一步说明。
利用相关技术中的数据库实现方法创建数据库, 数据库中 的表或字段发生变化主要包括以下情形:
情形一: "表"的"增加"、 "删除 "与"更名"
( 1 )在"增加"表时, 创建一个独立的新的 "表空间", 同时 对应一个"表编码,,, 并对增加的表定义一个与已存在的表不重 复的"表名", 并将"表名"作为未来数据存储、 计算的路径。
(2)"表"需要"删除"时:现有数据库实现方法是,通过"表名" 映射到 "表编码,,寻址到相应表空间, 将其从 "表集合"的定义中 逐一比较"表编码", 清除符合"该表编码"的记录, 同时将其已 经占用的空间记录予标记清空, 以供新的"表,,、 "字段,,、 "数据 元"重新占用。 (3)"表,,需要"更名"时: 现有数据库方法是, 通过"表名"映 射到"表编码", 寻址到相应表空间, 将其从 "表集合"的定义中 修改该条编码记录中对"表名,,的定义。
情形二: "字段"需要"增加"、 "删除"、 "变更名称"、 "变更 类型"
( 1 ) "字段"需要增加时, 通过"表名"映射到 "表编码,,寻址 到"表空间", 再检索到字段尾部, 创建一个新的"字段空间", 然后"命名"并分配一个"表编码"。
( 2 ) "字段"需要删除时, 通过"表名"映射到 "表编码"寻 址到 "表空间,,, 再通过"字段名 "映射到 "字段编码"寻址到 "字段 空间", 在"字段集合"的定义中消除该编码字段名的记录, 并将 该字段名下的所有 i己录标 i己删除, 以供新的字段、 数据元重新 占用。
( 3 )字段需要"变更名称"或"变更类型", 通过"表名"映射 到"表编码,,寻址到"表空间,,,再通过 "表字段"映射到 "字段编码" 进行寻址到"字段空间", 再对"字段集合"中该字段名的记录予 以名称爹改、 类型爹改, 类型爹改时, 需要将该字段下的所有 数据元, 都逐一寻址并转换类型。
现有数据库编码方式, 在需要计算时, 通过对计算范围的 分析, 先得出计算需要涉及到的多个"计算表名称", 通过"表名 称编码集"映射并获取到, 然后再分析出每个表中, 需要涉及计 算的多个"计算字段名称", 通过"字段编码集"映射并获取到。 首先这些"计算表名称" +"计算字段名称"所对应的数据记录是 分散存储的, 称为"分散计算记录集"。 然后, 在"分散计算记录 集,,中, 分析出表与表之间的连接关系, 分析出记录中的条件范 围, 然后通过"关系连接,,与"记录筛选", 将这些"分解计算记录 集,,读取出来合并成一个 "合并计算记录集", 最后通过相应的运 算得到新的"计算结果记录集"。
( 1 )现有数据库编码方式客观缺点一: 对表的编码、 字段 的编码、 记录的编码是分别独立进行的, 存储也是分离的, 而 且彼此编码是可重复的, 所以在寻址一个数据元, 均需要多次 编码转换并分散寻址, 寻址速度慢; 同时, 寻址的 "表名,,与 "字 段名"都是"字符串"型, 寻址时需要多次"比较"运算, 导致寻址 速度慢。
( 2 )现有数据库编码方式客观缺点二:对表的增加、删除、 变更, 对字段的增加、 删除、 变更, 均需要对数据库后台进行 人工配置并获取一个新的表编码、 字段编码, 也就是数据库在 表、 字段的设计上, 没有弹性。
( 3 )现有数据库编码方式客观缺点三:对表的增加、删除、 变更, 对字段的增加、 删除、 变更, 由于总是需要人工配置并 获取新的表编码、 字段编码, 这种编码通常情况下, 不能通过 程序自动创建并获取, 导致在表与字段变更后, 通常对计算程 序需要进行二次编码与开发, 导致计算机程序没有弹性; ( 4 )现有数据库编码方式客观缺点四:对表、字段确定后, 对数据元的存储是按矩阵方式存储的, 但不是所有字段在所有 记录行上都需要存储数据元, 这导致存储空间的浪费, 这也是
( 5 )现有数据库编码方式客观缺点五: 在计算效率上, 每 次确定计算范围, 都涉及到多个表编码的转换、 字段编码的转 换, 并在分解的存储空间时寻址需要计算的数据记录集合, 在 计算涉及到的表的个数越多时, 计算记录集合的寻址效率就会 越来越低, 计算机的 I/O次数随着计算范围涉及到的表的个数 增多而呈现线性甚至指数增长, I/O次数是计算效率的重要指标, I/O 次数越多, 寻址效率越^ ί氐, I/O 次数越少, 寻址效率越高。 最终导致随着数据规模与计算范围的扩大, 传统的数据编码方 式计算效率会随之降低。
( 6 )现有数据库编码方式客观缺点六: 在存储数据上, 没 有编码复用结构将可复用的表、 字段、 数据记录与数据结构进 行复用定义。 导致数据在结构上的复用率低, 由于没有统一编 码, 导致维护复用结构的难度大。
本发明实施例中的数据库实现方法与现有数据库的实现方 法主要差别如下:
( 1 )本发明实施例的数据库实现方法中, 对于任何一个有 意义的元素(包括表、 或字段、 或数据元时), 会首先创建一个 唯一的不重复的整数编码, 然后在创建的编码基础上, 自由定 义创建的编码的使用意义。定义创建的编码的使用意义的过程, 是一个由完全无指向意义的空节点开始, 然后再不断在此编码 上赋予表或字段或数据元或关系的过程。
而现有数据库实现方法中, 必须先确定定义的目标: 如果 是定义表, 则在表集合中予以编码; 如果是定义字段, 则在具 体表空间下的字段中予以编码; 如果是定义关系, 则在具体的 关系容器中予以编码; 定义现有数据编码过程, 是一个由事先 确定的有意义的实际空间中创建一个有实际指向意义的节点开 始, 然后在所在容器的规则下按需要使用的过程。
由此看出, 现有数据库实现方法中的任一数据节点, 都只 能#支一次创建, 在一个方向上创建固定的增长关系及记录。 而 本发明实施例的数据库实现方法中的任一编码节点, 都可以自 由创建、 二次定义, 并在任一方向上创建新的增长关系及相关 记录。
同时, 现有数据库实现方法中, 对表、 字段及数据元的使 用, 是以表名、 字段名、 记录值特征为路径的比较寻址、 读取 记录、 计算过程。 而本发明实施例中, 对表、 字段及数据元的 使用, 是以整数编码为核心的直接寻址、 直接读取记录、 直接 计算的过程。
在程序引用方面, 现有数据库编码对表、 字段、 数据元的 引用, 必须指定具体的表名称、 字段名称、 记录值特征, 在多 个分散的存储空间中逐一定位。 而本发明实施例的数据库实现 方法中对表、 字段、 数据元的引用, 都只需根据创建的编码, 就可以直接在同一个存储空间中一次性定位。
本发明实施例中对每一个表、 字段、 数据元、 关系进行统 一唯一整数编码 (Universal Only integer-Code In DataBase , 筒 称 UOCID), 彼此 UOCID编码不重复, 并统一存储在一个地址 空间; 并在存在的同一地址空间中按 UOIC顺序进行存储, 这 样, 寻址任何一个表、 字段、 数据元、 数据集, 都只需要通过 唯一的 UOCID—次寻址到, 同时 UOCID编码的還辑编码顺序 与物理上存储顺序保持一致, 不需要通过索引二次定位, 就可 一次提取目标数据, 寻址效率高, 速度快。
本发明实施例的数据库实现方法中, 对表的增加、 删除、 变更, 对字段的增加、 删除、 变更, 不需要通过数据库后台进 行人工配置, 而是直接按: "UOCID当前最大编码数 +1"方式自 动增长新编码。 或者按: "UOCID当前空闲编码"方式激活新编 码。 因此, UOCID编码系统允许在表、 字段的设计上的弹性增 长。
本发明实施例的数据库实现方法, 对表的增加、 删除、 变 更, 对字段的增加、 删除、 变更, 可以通过程序自动创建并获 取 UOCID 编码, 因此允许计算机程序对表、 字段在增加、 删 除、 变更进行动态定义, 可以^ 1对表、 字段的动态定义映射成 UOCID编码, 交给用户去定义, 提高了程序编码的弹性, 降低 了二次开发对 IT技术人员的依赖性。 本发明实施例的数据库实现方法, 允许数据在表、 字段的 任何维度进行按需要存储, 对数据元的存储是按: "UOCID 编 码 +紧凑队列方式 "存储的, 而不是矩阵式存储, 减少存储空间 的浪费。
本发明实施例的数据库实现方法, 在计算效率上, UOCID 编码每次确定计算范围, 只涉及一个表的编码转换, 同时在同 一个存储空间时寻址需要计算的数据记录集合, 同时寻址通过 与物理存储顺序一致的整数进行数据抽取, 因此无论计算范围 多大, 都只涉及到一个编码表的寻址, 大大降氏了计算机在计 算时的 I/O次数, I/O次数是计算效率的重要指标, I/O次数越 多, 寻址效率越^ ί氐, I/O次数越少, 寻址效率越高。 采用本发明 实施例的数据库实现方法,实现了数据规模与计算范围的扩大, 对计算效率的影响极低, 尤其是在海量计算方面, 有明显的计 算优势。
本发明实施例的数据库实现方法, 在存储数据上, UOCID 编码可以对可复用的表、 字段、 数据记录与数据结构进行无限 的复用定义。 实现了数据在结构上的高复用率, 同时 UOCID 是统一的唯一的编码, 导致维护复用结构的变得容易。
本发明实施例数据库实现方法, 在创建数据库的过程中会 自动形成 UOCID 数据引用替换池, 供程序自动调用, 自动切 换。 本发明实施例中进一步给出数据引用替换池的程序实现, 例如:
UOCID转换前: SELECT * FROM 采购表, 直接指向采 购表。
UOCID转换后:
采购表会自动更名为: PRE采购表
自动将 UOCID编码结构表与 UOCID值表通过映射或自动 生成临时新表, 新表名称与实际使用名称保持一致为: 采购表
SELECT * FROM 采购表 会建立在 UOCID编码后的映射 表或临时表上
UOCID转换前: INERT INTO VALUE 到采购表.采购员, 直接去添力口一行。
UOCID转换后:
采购表会自动更名为: PRE采购表
自动将 UOCID编码结构表与 UOCID值表通过映射或自动 生成临时新表, 新表名称与实际使用名称保持一致为: 采购表 INERT IN TO VALUE到采购表.采购员, 会执行两个操作: 直接去采购表, 自动增加一行例如: 采购员 =张三 的记录 同时去 UOCID 编码表中自动增加一行例如: 78880xx BEOF 7888002记录, 以及去 UOCID襄值表中自动增加一行例 如: 78880xx 张三 如下两个操作为原子操作,两个操作均成功才视为 INERT INTO VALUE成功, 否则任一操作失败, 则整个 INERT INTO VALUE操作返回失败。
本发明实施例的数据库实现方法还能够自动侦测, 是否有 新表、 或字段、 或数据关系的建立, 若侦测到有新表、 新字段 或新的数据关系建立时, 对新增加的表、 字段及数据关系进行 唯一编码。
本发明实施例的数据库实现方法还能对用户提供的 HTML 格式的表进行数据库编码操作, 具体地, 包括抓取 HTML格式 的所述表的表元素, 其中所述表元素包括: 表名称元素、 数据 段元素、 数据元元素及数据关系元素; 才艮据抓取到的所述表元 素创建数据待转换池; 扫描所述数据待转换池中的所有元素, 并在节点簇编码结构表中分别对所有元素创建唯一编码, 并建 立创建的编码之间的映射关系, 同时在所述节点簇值对照表中 映射各编码所对应的名称。
进一步地,在对 HTML格式的表进行数据库编码操作还包 括:将 HTML页面所有元素进行 UOCID编码标记( setAttribute ), 且将 UOCID编码全部自动嵌入到 TD\TR标签中, UOCID通过 创建新的 attribute而生成。
在对 HTML 格式的表进行数据库编码操作时还包括将 HTML格式的表进行自动扩充, 创建增加或变更字段的按钮; 当用户输入新的字段后, 自动创建新的 UOCID 编码, 并存入 UOCID编码结构表与簇值表中。
本发明实施例的数据库实现方法, 能够自动侦听所有表与 字段, 自动转换为 UOCID 编码库并自动生成新的映射关系, 不影响现有软件对数据库的开发引用。 同时, 自动扫描界面中 HTML元素, 与 UOCID编码库进行对比, 对新的元素进行编 码新建, 并传回数据库形成新的映射, 实现 UOCID 与现有数 据库在开发引用上的完全一致映射关系, 从而扩充在表、 字段 上的设计弹性。
本发明实施例中在任意一个现有编码节点 (即 UOCID 节 点, 例如 381769 ) 直接申请一个新的 UOCID编码子节点, 这 个节点仅有一个整数编码 (例如 381776 ), 不需要任何意义, 该编码特征就是在整个 UOCID编码库中是唯一的、不重复的。
本发明实施例中可以在新增的节点上定义一个有实际意义 的名称, 可以是表名、 字段名、 也可以是数据元。
对于新增的 UOCID编码,可以对每个 UOCID编码定义实 际的意义, 例如一批表名、 字段名。
在具体节点下申请新的 UOCID 子节点, 进行具体的数据 元定义, 例如以采购订单表实际数据记录、 供应商清单实际数 据 i己录为例进行定义。
对实际的数据元节点, 可以对其所属的节点关系进行自由 定义, 以形成 UOCID+紧凑队列的存储形式, 本例中: 一批 UOCID节点对应了数据元, 同时还可以将该批 UOCID节点同 时归属另一个或一批 UOCID节点。
对于每个 UOCID 节点编码, 其下都可以创建一个任意意 义的节点簇, 每一个节点簇的定义, 无论是何种结构的表、 字 段、 关系、 数据元, 都可以无穷地在每个 UOCID节点下延伸。 形成一个完整意义上的有意义 UOCID 节点集合, 例如, 一个 UOCID节点下, 可以装载一个流程集、 一个数据集、 一段代码 指令集、 甚至一个图形、 一个界面、 一个文件, 也可以装载一 个最原始的数据元素、 一个值。
根据 UOCID 节点编码的自由扩展性, 可以^ 1计算机程序 的逻辑、 代码行、 与 UOCID 节点编码所形成的逻辑结构进行 配合, 并对计算机程序的每一行指令分配 UOCID 编码值, 形 成自由的 UOCID代码容器。
通过对 UOCID节点的自由定义,形成一个 UOCID节点簇, 这个节点簇, 可以包含实际意义中的: 表集合、 字段集合、 关 系集合、 计算集合, 以及计算机程序的指令结构、 界面元素、 功能元素、 行为元素。 其在存储上全是 UOCID 的整数编码顺 序存储, 将关系与描述进行了对应。 形成一个完整的 UOCID 系统编码。
UOCID每个节点编码在分配时是不需要实际意义的,在存 储时按顺序存储,通过对每个节点的结构关系以及值进行对应, 即可形成一个完整的系统定义, 这个完整的系统定义从结构到 元素, 都可以自由扩展与存储、 二次定义, 只要能反映实际的 意图或逻辑即可。 包括数据表、数据字段、代码、 流程等元素, 均可以通过 UOCID 节点编码进行定义与扩充。 同时其存储是 紧凑的, 在逻辑上与物理上均不需要空白的空间区域进行区别 表与表之间, 字段与字段之间的关系, 而是通过 UOCID 结构 关系中予以关联, 而 UOCID结构关系中,全是整数予以关联, 在存储上仅占用很少的字节, 大大节约了数据表、 字段在存储 时需要开销的空间。
才艮据形成的 UOCID 节点簇定义, 即可让计算机程序在新 的编码系统上进行动态的表、 动态的字段设计、 存储、 读取与 计算。 同时将数据层、 逻辑层、 表示层都通过 UOCID 编码形 式进行集成,在本质上,去掉了现有数据库编码技术中,对表、 字段的预编码需要, 而采取了动态编码需要。 在新的 UOCID 编码系统中, 对数据的引用不再需要表名与字段名, 而是直接 用编码进行引用, 实现了动态定义表、 字段的无限弹性, 实现 了计算的快速定位效率, 还实现了复用数据的最大复用效率。
利用本发明实施例的数据库实现方法形成的数据库, 实现 计算时, 直接引用 UOCID 编码地址进行运算, 不需要引用表 名 +字段名进行运算。
而现有数据库编码技术可能需要从几百 ~几千个表中,并从 每个表的几个 ~几十个字段中寻址, 并将数据特征进行比较, 找 到源数据需要多次 I/O读取才能结算。而通过 UOCID编码直接 引用计算的优势在于, 当需要在海量数据中提取数据进行运算 时, UOCID编码能直接定位数据源地址, 读取源数据的效率大 大提面。
同时, 整个编码大系统, 都可以对 UOCID 编码进行引用 计算, 而不需要去寻址表名与字段名。
利用本发明实施例的数据库实现方法形成的数据库进行运 算时, 可基于一个复杂的云系统进行数据运算集成, 例如一个 集团公司,由于历史原因,其下属企业的同一类数据格式不同、 规则不同, 传统数据库必须进行复杂的接口设计、 每个接口都 需要进行表、 字段的反复寻址, 整合到一个统一的接口规范再 进行统一计算。但通过 UOCID编码的系统, 由于对每一个表、 字段、 数据元都在整个云系统拥有唯一的 UOCID 编码地址, 因此可以统一接口设计, 一次性寻址到需要计算的源数据, 实 现不规则数据的云集成。
利用本发明实施例的数据库实现方法形成的数据库进行的 运算也解决了同一个企业在不同系统间的数据引用问题, 例如 在财务系统、 ERP系统、 CRM系统、 HR系统间数据的接口引 用, 不需要现有数据库的复杂接口开发, 而仅需要统一的 UOCID接口地址,就可以直接弓 I用并参与跨不同种类系统的运 算。
现有数据库与 UOCID存储性能比较, 在特定模型数据的 海量增长方面, 数据规模越大, UOCID编码带来的存储空间节 省越明显, 本例中在数据增长的最后一个阶段, 数据存储空间 节省 50%以上。
综述: 采用本发明实施例的数据库实现方法, 对所有计算 机表达的元素(表、字段、数据元、代码、标记等)都进行 UOCID 编码分配, 分配的编码与物理存储顺序保持一致, 将所有计算 机表达的元素 (表、 字段、 数据元、 代码、 标记等)存在同一 个连续的存储空间, 同时允许每个 UOCID 节点编码下可以创 建一个无限弹性的 UOCID 编码节点簇, 同时对所有计算机元 素的引用都可能直接通过 UOCID 编码进行一次寻址获取, 在 寻址与计算方面都大大提高了效率。 由于 UOCID 编码与值的 存储是采用先申请先存储的方式, 实现了按需要创建节点并紧 凑存储, 对数据在海量增长时对存储空间的大量节省。 同时, UOCID编码以节点编码为核心,没有表名、字段名的引用限制, 提高了计算机程序在对表创建、 增加、 删除、 变更, 对字段创 建、 增加、 删除、 变更时的灵活性。 UOCID编码系统, 综合改 进了计算机的存储、 设计与计算性能。 以上所述仅为本发明的优选实施例而已, 并不用于限制本 发明, 对于本领域的技术人员来说, 本发明可以有各种更改和 变化。 凡在本发明的精神和原则之内, 所作的任何修改、 等同 替换、 改进等, 均应包含在本发明的保护范围之内。

Claims

权利要求
1. 一种数据库实现方法, 其特征在于, 包括:
对提供的表、 字段, 以及表与表之间的数据关系按预设规 则分别唯一编码;
将得到的所述表的编码、 所述字段的编码及所述数据关系 的编码均存储在创建的节点簇编码结构表中, 形成编码节点; 根据所述表、 字段及所述数据关系之间的从属关系, 在所 述节点簇编码结构表中建立表的编码、 字段的编码及数据关系 的编码之间的从属映射;
且在创建的节点簇值对照表中映射各编码所对应的名称, 所述名称包括所述表的名称、 字段的名称或所述数据关系的名 称;
其中, 在所述字段所对应的编码节点下建立具有唯一编码 的编码子节点, 并在所述编码子节点对应的存储空间中存储数 据元。
2. 根据权利要求 1所述的方法, 其特征在于, 还包括: 添加新的表、 新的字段及新的数据关系中的一种或多种;
还包括: 根据创建的编码节点, 直接寻址欲删除的表、 字 段或数据关系, 并对寻址到的欲删除的表、 字段及数据关系所 占用的数据空间进行清除; 还包括: 根据创建的编码节点, 直接寻址欲更改的表、 字 段或数据关系, 并对寻址到的欲更改的表、 字段及数据关系所 占用的数据空间中的信息进行对应爹改。
3. 根据权利要求 2所述的方法, 其特征在于, 所述添加 新的表、 新的字段及新的数据关系中的一种或多种, 包括: 对欲添加的表、 字段及数据关系按所述预设规则进行唯一 编码, 得到新增编码;
将所述新增编码添加到所述节点簇值对照表中, 并在所述 节点簇编码结构表中建立添加的表的新增编码、 字段的新增编 码及数据关系的新增编码之间的从属映射; 且在创建的节点簇 值对照表中映射各新增编码所对应的名称。
4. 根据权利要求 3所述的方法, 其特征在于, 所述对提 供的表、 字段, 以及表与表之间的数据关系按预设规则分别唯 一编码, 包括: 对提供的表、 字段, 以及表与表之间的数据关 系编码时, 按照同一编码规则由小到大进行顺序整数编码。
5. 根据权利要求 4所述的方法, 其特征在于, 所述对欲 添加的表、 字段及数据关系按所述预设规则进行唯一编码, 得 到新增编码, 包括:
获取数据库中当前整数编码的最大值, 将获取到的当前整 数编码的最大值增加预设步长后作为新增编码的起始值, 利用 所述起始值对欲添加的表、 字段及数据关系由小到大进行顺序 整数编码, 得到新增编码。
6. 4艮据权利要求 3所述的方法, 其特征在于, 所述将所 述新增编码添加到所述节点簇值对照表中, 包括:
利用得到的所述新增编码在所述节点簇值对照表中创建新 的编码节点,以将所述新增编码添加到所述节点簇值对照表中; 或,
利用得到的所述新增编码在已建立的编码节点下创建新的 编码子节点,以将所述新增编码添加到所述节点簇值对照表中; 或,
利用得到的所述新增编码在已创建的编码子节点下创建新 的从属子节点, 以将所述新增编码添加到所述节点簇值对照表 中。
7. 根据权利要求 1所述的方法, 其特征在于, 还包括: 对用户提供的 HTML格式的表进行数据库编码操作。
8. 根据权利要求 7所述的方法, 其特征在于, 所述对用 户提供的 HTML格式的表进行数据库编码操作, 包括:
抓取 HTML格式的所述表的表元素,其中所述表元素包括: 表名称元素、 数据段元素、 数据元元素及数据关系元素;
才艮据抓取到的所述表元素创建数据待转换池;
扫描所述数据待转换池中的所有元素, 并在节点簇编码结 构表中分别对所有元素创建唯一编码, 并建立创建的编码之间 的映射关系, 同时在所述节点簇值对照表中映射各编码所对应 的名称。
9. 根据权利要求 8所述的方法, 其特征在于, 所述对用 户提供的 HTML格式的表进行数据库编码操作, 还包括: 检测 到用户增加、 删除、 或更改数据段或数据元时, 对应在所述节 点簇编码结构表及所述节点簇值对照表中增加新的编码、 删除 指定编码及该指定编码对应的空间中的数据, 或在指定的编码 存储空间中爹改数据。
10. 根据权利要求 1所述的方法, 其特征在于, 还包括: 根据创建的所述编码节点, 直接寻址获取相应的表、 字段、 数 据关系或数据元, 并利用寻址到的表、 字段、 数据关系及数据 元按预设规则进行运算。
PCT/CN2013/088207 2013-11-22 2013-11-29 数据库实现方法 Ceased WO2015074290A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US14/385,872 US9665600B2 (en) 2013-11-22 2013-11-29 Method for implementing database
JP2016554770A JP6262874B2 (ja) 2013-11-22 2013-11-29 データベース実現方法
EP13897923.2A EP3073392A4 (en) 2013-11-22 2013-11-29 Database implementation method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310597381.1 2013-11-22
CN201310597381.1A CN103559323B (zh) 2013-11-22 2013-11-22 数据库实现方法

Publications (1)

Publication Number Publication Date
WO2015074290A1 true WO2015074290A1 (zh) 2015-05-28

Family

ID=50013569

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/088207 Ceased WO2015074290A1 (zh) 2013-11-22 2013-11-29 数据库实现方法

Country Status (5)

Country Link
US (1) US9665600B2 (zh)
EP (1) EP3073392A4 (zh)
JP (1) JP6262874B2 (zh)
CN (1) CN103559323B (zh)
WO (1) WO2015074290A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599149A (zh) * 2016-12-07 2017-04-26 爱普(福建)科技有限公司 一种工程文本的编码方法
CN106933631B (zh) * 2017-03-13 2021-03-05 王小安 一种用户信息库
CN106991190A (zh) * 2017-04-11 2017-07-28 广东浪潮大数据研究有限公司 一种数据库自动创建子数据库系统
CN108509503A (zh) * 2018-03-01 2018-09-07 华子昂 基于中医机器人数据库编码的方法及系统
CN109086406B (zh) * 2018-08-01 2021-08-10 山东省国土测绘院 一种非同构数据转换方法
CN109597763B (zh) * 2018-12-04 2022-02-25 北京广利核系统工程有限公司 一种对多项数据进行归一化的一致性验证方法及装置
CN109710542B (zh) * 2018-12-28 2021-03-16 北京像素软件科技股份有限公司 一种满n叉树构建方法及装置
CN110008236B (zh) * 2019-04-15 2020-08-04 重庆天蓬网络有限公司 一种数据分布式自增编码方法、系统、设备及介质
CN110263043A (zh) * 2019-06-24 2019-09-20 苏州睿威博科技有限公司 数据存储方法、数据查询方法、装置及存储介质
CN111147546B (zh) * 2019-11-29 2021-05-14 中科院计算技术研究所大数据研究院 一种边缘集群资源的处理方法及系统
CN111968022B (zh) * 2020-08-12 2021-10-26 武汉易瑞信息技术股份有限公司 一种基于json配置方式的业务编号生成系统及方法
CN112256698B (zh) * 2020-10-16 2023-09-05 美林数据技术股份有限公司 一种基于多哈希函数的表关系自动关联方法
CN113033151A (zh) * 2021-03-26 2021-06-25 西安热工研究院有限公司 一种火电数据采集测点编码方法和系统
US11899693B2 (en) * 2022-02-22 2024-02-13 Adobe Inc. Trait expansion techniques in binary matrix datasets

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255215A (zh) * 1997-05-06 2000-05-31 伯特斯泰普技术联合股份有限公司 在信息处理系统中存储和操作数据的系统和方法
CN1652112A (zh) * 2005-03-02 2005-08-10 北京北方烽火科技有限公司 一种嵌入式环境下数据字典的实现方法
CN1825306A (zh) * 2005-10-31 2006-08-30 北京神舟航天软件技术有限公司 基于关系数据库的xml数据存储与访问方法
CN103106198A (zh) * 2011-11-09 2013-05-15 金蝶软件(中国)有限公司 树型结构实现方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005056085A (ja) * 2003-08-01 2005-03-03 Fujitsu Ltd データ構造変換プログラム
JP2006053724A (ja) * 2004-08-11 2006-02-23 Hitachi Ltd Xmlデータ管理方法
JP4945196B2 (ja) * 2005-08-24 2012-06-06 Soop株式会社 データ管理システム
US7831629B2 (en) * 2006-01-06 2010-11-09 Microsoft Corporation Method for building data encapsulation layers for highly variable schema
US8327186B2 (en) * 2009-03-10 2012-12-04 Netapp, Inc. Takeover of a failed node of a cluster storage system on a per aggregate basis
CN102750328B (zh) * 2012-05-29 2018-08-10 北京城市网邻信息技术有限公司 一种数据结构的构造和存储方法
CN102867059A (zh) * 2012-09-19 2013-01-09 浪潮(北京)电子信息产业有限公司 一种树形结构中数据的处理方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255215A (zh) * 1997-05-06 2000-05-31 伯特斯泰普技术联合股份有限公司 在信息处理系统中存储和操作数据的系统和方法
CN1652112A (zh) * 2005-03-02 2005-08-10 北京北方烽火科技有限公司 一种嵌入式环境下数据字典的实现方法
CN1825306A (zh) * 2005-10-31 2006-08-30 北京神舟航天软件技术有限公司 基于关系数据库的xml数据存储与访问方法
CN103106198A (zh) * 2011-11-09 2013-05-15 金蝶软件(中国)有限公司 树型结构实现方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3073392A4 *

Also Published As

Publication number Publication date
JP6262874B2 (ja) 2018-01-17
CN103559323A (zh) 2014-02-05
EP3073392A1 (en) 2016-09-28
EP3073392A4 (en) 2017-02-22
CN103559323B (zh) 2016-02-10
US9665600B2 (en) 2017-05-30
JP2016539449A (ja) 2016-12-15
US20150261793A1 (en) 2015-09-17

Similar Documents

Publication Publication Date Title
WO2015074290A1 (zh) 数据库实现方法
CN107122443B (zh) 一种基于Spark SQL的分布式全文检索系统及方法
US9405790B2 (en) System, method and data structure for fast loading, storing and access to huge data sets in real time
US9639542B2 (en) Dynamic mapping of extensible datasets to relational database schemas
Karnitis et al. Migration of relational database to document-oriented database: structure denormalization and data transformation
Stadler et al. Making interoperability persistent: A 3D geo database based on CityGML
CN103003813B (zh) 记录的列状存储表示
US10628421B2 (en) Managing a single database management system
US20150347492A1 (en) Representing an outlier value in a non-nullable column as null in metadata
CN105793843A (zh) 用于oltp和分析工作量的用于内存数据库的组合行和列式存储
CN105095294B (zh) 一种分布式存储系统中管理异构副本的方法及装置
MX2010012866A (es) Compaginacion de datos jerarquicos.
CN112912870A (zh) 租户标识符的转换
WO2021057824A1 (zh) 查询数据的方法、装置、计算设备和存储介质
CN116126864A (zh) 索引构建方法、数据查询方法及相关设备
US10996855B2 (en) Memory allocation in a data analytics system
US20180349443A1 (en) Edge store compression in graph databases
CN102508866A (zh) 基于数字寻址的指挥关系树结构化存储与快速处理方法
CN112632170B (zh) 基于sql的数据处理方法、装置和设备
US9767191B2 (en) Group based document retrieval
CN115114297A (zh) 数据轻量存储及查找方法、装置、电子设备及存储介质
KR20230091749A (ko) 데이터맵 생성 방법 및 장치
CN120743924B (zh) 一种基于关系型的面向大规模多模数据的数据导入方法
TWI460598B (zh) 分支映射編碼處理方法
CN119807911A (zh) 一种计算数据表达式的方法及相关装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 14385872

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13897923

Country of ref document: EP

Kind code of ref document: A1

REEP Request for entry into the european phase

Ref document number: 2013897923

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2013897923

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2016554770

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE