WO2024228294A1 - 分析装置、分析方法及び分析プログラム - Google Patents

分析装置、分析方法及び分析プログラム Download PDF

Info

Publication number
WO2024228294A1
WO2024228294A1 PCT/JP2024/007990 JP2024007990W WO2024228294A1 WO 2024228294 A1 WO2024228294 A1 WO 2024228294A1 JP 2024007990 W JP2024007990 W JP 2024007990W WO 2024228294 A1 WO2024228294 A1 WO 2024228294A1
Authority
WO
WIPO (PCT)
Prior art keywords
records
key
unit
analysis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2024/007990
Other languages
English (en)
French (fr)
Inventor
哲士 田中
陽一 櫻井
匡史 澤田
龍太 山際
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Business Inc
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to AU2024266332A priority Critical patent/AU2024266332A1/en
Priority to EP24800025.9A priority patent/EP4708260A4/en
Publication of WO2024228294A1 publication Critical patent/WO2024228294A1/ja
Priority to US19/375,290 priority patent/US20260056925A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09CCIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
    • G09C1/00Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system

Definitions

  • the present invention relates to an analysis device, an analysis method, and an analysis program.
  • Secure computation systems are known that perform statistical calculations while keeping data secret, and provide users with the statistics obtained as a result of the calculations.
  • secure computation systems are sometimes used to analyze data in fields such as the medical field, which handles important personal information.
  • Patent Document 3 a method for manipulating tables using secure computation is known (see, for example, Patent Document 3).
  • FIG. 6 is a diagram explaining the conventional procedure for deleting duplicates.
  • records with duplicates in the "Employee ID" column and the "Department Code” column (hereinafter referred to as the duplicate deletion key) are deleted except for one. Therefore, record group 61a and record group 62a in table 51a in FIG. 6 are the targets of duplicate deletion.
  • Records included in the set of records to be deleted for duplicate deletion share a common duplicate deletion key, but have different values in the "Entry Date" column, for example. For this reason, when deleting duplicates, there may be a desire to keep the record with the most recent "Entry Date,” for example.
  • the records to be deleted from the set of records to be deleted may be determined randomly. As a result, after duplicate deletion, the desired records may not remain.
  • the analysis device of the present invention is characterized by having a sorting unit that sorts records of a table including records with duplicate values of a first key by a second key different from the first key through secret calculation, and a deletion unit that deletes, through secret calculation, all records except for one record located at a predetermined position in each set of records with duplicate values of the first key included in the table sorted by the sorting unit.
  • FIG. 1 is a diagram illustrating an example of the configuration of an analysis system according to an embodiment.
  • FIG. 2 is a diagram illustrating an example of the configuration of the analysis device according to the embodiment.
  • FIG. 3 is a diagram illustrating a procedure for deleting duplicates according to the embodiment.
  • FIG. 4 is a flowchart showing a process flow of the analysis device according to the embodiment.
  • FIG. 5 is a diagram illustrating an example of a computer that executes an analysis program.
  • FIG. 6 is a diagram for explaining a conventional procedure for deleting duplicates.
  • the analysis system is a system for analyzing data using secure computation.
  • the analysis system 1 includes a secure computation system 10.
  • the secure computation system 10 is also connected to a providing device 20 and a providing device 30 via a network N.
  • the network N is the Internet.
  • the secure computation system 10 is also connected to a terminal device 40.
  • the providing device 20 and the providing device 30 are devices on the data provider side.
  • the providing device 20 and the providing device 30 provide (register) data to the secure computing system 10.
  • the data provided by the providing device 20 and the providing device 30 includes information that is desired to be kept confidential (e.g., personal information such as an individual's name and address).
  • the providing device 20 and the providing device 30 provide data related to medical receipts and DPCs (Diagnosis Procedure Combinations) used in medical institutions.
  • the secure computation system 10 has a data storage unit 11 and a data processing unit 12.
  • the data storage unit 11 includes a plurality of storage devices (storage device 111, storage device 112, storage device 113) that store data by secret sharing.
  • the data processing unit 12 includes a plurality of computation devices (computation device 121, computation device 122, computation device 123) that process data by secure computation. Note that the number of storage devices and the number of computation devices are not limited to the example shown in FIG. 1.
  • the secure computation system 10 can perform secret sharing and secure computation according to the method described in Non-Patent Document 1 (URL: https://www.rd.ntt/sil/project/sc/secure_computation.html).
  • the data provided to the secure computing system 10 is divided (fragmented) into multiple shares. Then, each of the multiple shares is distributed and stored in multiple storage devices included in the data storage unit 11. In the example of FIG. 1, the provided data is divided into three shares. Then, storage device 111, storage device 112, and storage device 113 each store one share.
  • the data processing unit 12 performs secure computation on the shares accumulated in the data accumulation unit 11.
  • the data processing unit 12 performs secure computation by multi-party computation using multiple computing devices.
  • the data processing unit 12 performs secure computation by computing device 121, computing device 122, and computing device 123.
  • the data processing unit 12 can perform various statistical calculations without restoring the shares.
  • the data processing unit 12 can perform table operations such as sorting and joining, tallying the number of records, calculating statistics such as sums, averages, maximum values, minimum values, and sample variances, and performing statistical tests such as t-tests.
  • the data processing unit 12 can perform statistical analyses such as regression analysis and principal component analysis.
  • the analysis device 13 uses the data processing unit 12 to analyze the data.
  • the analysis device 13 provides the analysis result to the terminal device 40 on the data user side based on the result of the secret calculation executed by the data processing unit 12. The user can obtain the data analysis result via the terminal device 40.
  • the secure computing system 10 may be provided with data on the attributes and physical condition of each individual.
  • the data on the attributes and physical condition is personal information that is preferably kept confidential.
  • the data on the attributes and physical condition includes, for example, age, sex, height, weight, etc.
  • the data storage unit 11 stores fragmented shares of the provided data in each storage device.
  • each divided share is meaningless data on its own. Therefore, it is not possible to restore the original data from a single share. However, by collecting multiple shares, it is possible to restore the original data.
  • the user of the data cannot view the registered data itself, but can view the results of the analysis of the data via the analysis device 13 and the terminal device 40.
  • the data includes the gender and weight of individuals, the user cannot view the gender and weight of each individual, but can view the "average weight of men," which is the result of the analysis of the data.
  • the data storage unit 11 can perform secret sharing using a technique known as Shamir's threshold secret sharing method.
  • the data storage unit 11 stores three coordinates that pass through a polynomial with the original data as an intercept in each server as shares. Furthermore, since the slope of the polynomial is determined randomly, the shares are not necessarily the same each time even if the original data is the same.
  • the original data may be a numeric value, or may be data that has already been converted into a numeric value.
  • the secure computing system 10 can restore the original data from multiple shares. If the polynomial is a linear expression, the secure computing system 10 can find the intercept (corresponding to the original data) from the intersection of the axis and a straight line connecting two coordinates (corresponding to shares). On the other hand, since a straight line cannot be determined from a single coordinate, the original data cannot be restored.
  • the data processing unit 12 can perform secure computation on the original data without restoring the shares.
  • the result of adding the shares represented by coordinates corresponds to the share resulting from adding the original data of each share.
  • the analysis device 13 In response to a request from the terminal device 40, the analysis device 13 causes the data processing unit 12 to execute processing using secret calculations.
  • the data processing unit 12 or the terminal device 40 may realize functions equivalent to those of the analysis device 13.
  • the analysis system 1 may be configured without the analysis device 13.
  • the terminal device 40 is connected to the data processing unit 12 and executes processing equivalent to that of the analysis device 13.
  • statistical calculations based on shares may be executed by the terminal device 40 rather than the data processing unit 12.
  • the table that the analysis device 13 performs duplicate deletion on is, for example, a table included in a relational database (RDB) in which multiple tables are associated.
  • RDB relational database
  • the conventional technology has a problem in that it may not be possible to specify which records to keep when deleting duplicates.
  • the analysis device 13 of the first embodiment can delete duplicates in a table using secure computation while leaving the specified records.
  • FIG. 2 is a diagram showing an example of the configuration of the analysis device according to an embodiment.
  • the analysis device 13 has a communication unit 131, an input unit 132, an output unit 133, a memory unit 134, and a control unit 135.
  • the communication unit 131 communicates data with other devices.
  • the communication unit 131 is a NIC (Network Interface Card).
  • the communication unit 131 can send and receive data with other devices.
  • the input unit 132 is an interface for accepting data input.
  • the input unit 132 is connected to input devices such as a mouse and a keyboard.
  • the output unit 133 is an interface for outputting data.
  • the output unit 133 is connected to input devices such as a display and a speaker.
  • the memory unit 134 is a storage device such as a hard disk drive (HDD), a solid state drive (SSD), or an optical disk.
  • the memory unit 134 may be a semiconductor memory in which data can be rewritten, such as a random access memory (RAM), a flash memory, or a non-volatile static random access memory (NVSRAM).
  • the memory unit 134 stores the operating system (OS) and various programs executed by the analysis device 13.
  • OS operating system
  • the control unit 135 controls the entire analysis device 13.
  • the control unit 135 is, for example, an electronic circuit such as a CPU (Central Processing Unit), MPU (Micro Processing Unit), or GPU (Graphics Processing Unit), or an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or FPGA (Field Programmable Gate Array).
  • the control unit 135 also has an internal memory for storing programs that define various processing procedures and control data, and executes each process using the internal memory.
  • the control unit 135 functions as various processing units by running various programs.
  • the control unit 135 has a determination unit 1351, a sorting unit 1352, and a deletion unit 1353.
  • FIG. 3 is a diagram for explaining the procedure for deleting duplicates according to an embodiment.
  • FIG. 3 shows the contents of each table in a state in which they can be read as natural language, but in reality, the process shown in FIG. 3 is performed using secret computation on tables that have been accumulated in an unreadable share state (for example, a list of numbers that appear meaningless).
  • Table 51 in FIG. 3 is the table that is subject to duplicate deletion.
  • records with duplicates in the "Employee ID" column and the "Department Code” column are deleted except for one. Therefore, record group 61 and record group 62 in table 51 in FIG. 3 are subject to duplicate deletion.
  • the determination unit 1351 determines the duplicate deletion key, the sort key, and the sort order.
  • the duplicate deletion key and the sort key are a set of one or more columns.
  • the sort key is used in the sorting process described below.
  • the determination unit 1351 can determine a duplicate deletion key and a sort key in response to a request from a user received via the terminal device 40. However, the duplicate deletion key and the sort key are assumed to be different.
  • the determination unit 1351 receives a request to "delete records with duplicate 'employee ID' and 'department code', leaving only the record with the oldest 'entry date'.” In this case, the determination unit 1351 determines the "employee ID” column and the "department code” column as duplicate deletion keys. The determination unit 1351 also determines the "entry date” column as the sort key. The determination unit 1351 also determines the sort order to be ascending.
  • the determination unit 1351 determines the sort order to be ascending. Conversely, if the record requested to be kept is the record with the largest value (which is equivalent to the newest in the case of date and time), the determination unit 1351 determines the sort order to be descending.
  • the sorting unit 1352 sorts the records of table 51, including records with duplicate values for the duplicate deletion key, by secret calculation using the sort key.
  • the sorting unit 1352 also sorts the records of the table in a specified order, either ascending or descending.
  • Table 52 is the table after the sorting unit 1352 sorts table 51.
  • the determination unit 1351 has determined that the "Entry Date” column is the sort key, and that the sort order is ascending. Therefore, the sort unit 1352 sorts the records in table 51 in ascending order of the "Entry Date” column. In this case, as shown in table 52, records with smaller values in the "Entry Date” column (older dates and times) are placed higher.
  • the deletion unit 1353 uses secret computation to delete all records except for one record located at a predetermined position in each set of records with duplicate deletion keys included in the table 52 sorted by the sort unit 1352. For example, in the example of FIG. 3, the deletion unit 1353 deletes all records except for the one record located at the top of the set.
  • Record group 61 and record group 62 in table 52 are both collections of records with duplicate deletion keys.
  • the deletion unit 1353 deletes the record at the bottom of the records included in record group 61 (the record whose "Entry Date” column has a value of "9/3/2022") and leaves the other records (the records whose "Entry Date” column has a value of "9/2/2022").
  • the deletion unit 1353 may delete the records so that the lowest record remains, rather than the topmost record.
  • the determination unit 1351 determines the order opposite to that described above. That is, if the record requested to be kept is the record with the smallest value (which in the case of date and time is equivalent to the oldest), the determination unit 1351 determines the sort order to be descending. Conversely, if the record requested to be kept is the record with the largest value (which in the case of date and time is equivalent to the newest), the determination unit 1351 determines the sort order to be ascending.
  • the output control unit 1354 outputs table 52 after deleting the records.
  • the output control unit 1354 may also output the results of further statistical analysis using table 52 from which the records have been deleted.
  • FIG. 4 is a flowchart showing the flow of processing by the analysis device according to the embodiment.
  • the analysis device 13 determines a duplicate deletion key, a sort key, and a sort order based on a request from a user (step S101).
  • the analysis device 13 sorts the records in the table using secret computation based on the determined duplicate deletion key and order (step S102).
  • the analysis device 13 obtains a group of records with duplicate deletion keys from the sorted table (step S103). Then, the analysis device 13 selects one of the unprocessed record groups (step S104).
  • the analysis device 13 deletes all records except the top record from the selected record group using secret calculation (step S105).
  • step S106 If there are unselected record groups (step S106, Yes), the analysis device 13 returns to step S104 and repeats the process. If there are no unselected record groups (step S106, No), the analysis device 13 outputs the final table (step S107).
  • the analysis device 13 includes a sorting unit 1352 and a deleting unit 1353.
  • the sorting unit 1352 sorts records of a table including records with duplicate values of a first key (duplicate deletion key) by a second key (sort key) different from the first key, by secure computation.
  • the deleting unit 1353 deletes, by secure computation, records other than one record located at a predetermined position in each set of records with duplicate first keys included in the table sorted by the sorting unit 1352. This allows the analysis device 13 to specify records to be kept by sorting such that the records to be kept when deleting duplicates are located at a predetermined position.
  • the sorting unit 1352 sorts the records in the table in a specified order, either ascending or descending.
  • the deletion unit 1353 deletes all records in the set except for one record that is at the top or bottom. This allows the analysis device 13 to place the records that are not to be deleted at the top or bottom in response to a user request, and delete the other records.
  • each component of each device shown in the figure is functionally conceptual, and does not necessarily have to be physically configured as shown in the figure.
  • the specific form of distribution and integration of each device is not limited to that shown in the figure, and all or a part of it can be functionally or physically distributed or integrated in any unit depending on various loads, usage conditions, etc.
  • each processing function performed by each device can be realized in whole or in part by a CPU (Central Processing Unit) and a program analyzed and executed by the CPU, or can be realized as hardware by wired logic. Note that the program may be executed not only by the CPU but also by other processors such as a GPU.
  • the analysis device 13 can be implemented by installing an analysis program that executes the above-mentioned analysis processing as package software or online software on a desired computer.
  • the above-mentioned analysis program can be executed by an information processing device, thereby making the information processing device function as the analysis device 13.
  • the information processing device referred to here includes desktop or notebook personal computers.
  • the information processing device also includes mobile communication terminals such as smartphones, mobile phones, and PHS (Personal Handyphone Systems), as well as slate terminals such as PDAs (Personal Digital Assistants).
  • the analysis device 13 can also be implemented as an analysis server device that treats a terminal device used by a user as a client and provides services related to the above-mentioned analysis processing to the client.
  • the analysis server device is implemented as a server device that provides an analysis service that receives a table to be deleted for duplicates as input and outputs a table after duplicates have been deleted.
  • FIG. 5 is a diagram showing an example of a computer that executes an analysis program.
  • the computer 1000 has, for example, a memory 1010 and a CPU 1020.
  • the computer 1000 also has a hard disk drive interface 1030, a disk drive interface 1040, a serial port interface 1050, a video adapter 1060, and a network interface 1070. Each of these components is connected by a bus 1080.
  • the memory 1010 includes a ROM (Read Only Memory) 1011 and a RAM (Random Access Memory) 1012.
  • the ROM 1011 stores a boot program such as a BIOS (Basic Input Output System).
  • BIOS Basic Input Output System
  • the hard disk drive interface 1030 is connected to a hard disk drive 1090.
  • the disk drive interface 1040 is connected to a disk drive 1100.
  • a removable storage medium such as a magnetic disk or optical disk is inserted into the disk drive 1100.
  • the serial port interface 1050 is connected to a mouse 1110 and a keyboard 1120, for example.
  • the video adapter 1060 is connected to a display 1130, for example.
  • the hard disk drive 1090 stores, for example, an OS 1091, an application program 1092, a program module 1093, and program data 1094. That is, the programs that define each process of the analysis device 13 are implemented as program modules 1093 in which computer-executable code is written.
  • the program modules 1093 are stored, for example, in the hard disk drive 1090.
  • a program module 1093 for executing processes similar to the functional configuration of the analysis device 13 is stored in the hard disk drive 1090.
  • the hard disk drive 1090 may be replaced by an SSD (Solid State Drive).
  • the setting data used in the processing of the above-mentioned embodiment is stored as program data 1094, for example, in memory 1010 or hard disk drive 1090.
  • the CPU 1020 reads out the program module 1093 or program data 1094 stored in memory 1010 or hard disk drive 1090 into RAM 1012 as necessary, and executes the processing of the above-mentioned embodiment.
  • the program module 1093 and program data 1094 may not necessarily be stored in the hard disk drive 1090, but may be stored in a removable storage medium, for example, and read by the CPU 1020 via the disk drive 1100 or the like.
  • the program module 1093 and program data 1094 may be stored in another computer connected via a network (such as a LAN (Local Area Network), WAN (Wide Area Network)).
  • the program module 1093 and program data 1094 may then be read by the CPU 1020 from the other computer via the network interface 1070.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

実施形態の分析装置は、ソート部及び削除部を有する。ソート部は、第1のキー(重複削除キー)の値が重複するレコードを含むテーブルのレコードを、第1のキーと異なる第2のキー(ソートキー)で秘密計算によりソートする。削除部は、ソート部によるソートが行われたテーブルに含まれる、第1のキーが重複するレコードの集合のそれぞれについて、集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを秘密計算により削除する。

Description

分析装置、分析方法及び分析プログラム
 本発明は、分析装置、分析方法及び分析プログラムに関する。
 従来、データを秘匿したまま統計的な演算を行い、演算の結果得られた統計量をユーザに提供する秘密計算システムが知られている。例えば、秘密計算システムは、重要な個人情報を取り扱う医療分野等におけるデータの分析に利用される場合がある。
 また、秘密計算を用いてテーブル(表)の操作を行う方法が知られている(例えば、特許文献3を参照)。
国際公開第2019/124260号 特開2020-042128号公報 特開2014-139640号公報
日本電信電話株式会社、秘密計算のシステムとその原理、[online]、[令和4年11月24日検索]、インターネット<URL:https://www.rd.ntt/sil/project/sc/secure_computation.html>
 しかしながら、従来の技術では、秘密計算によるテーブルの重複削除の際に、残すレコードを指定できない場合がある。
 図6は、従来の重複削除の手順を説明する図である。ここでは、「社員ID」列及び「所属部コード」列(以下、重複削除キー)が重複しているレコードが、1つを残して削除される。このため、図6のテーブル51aのレコード群61a及びレコード群62aが、重複削除の対象である。
 重複削除の対象のレコード群に含まれるレコードは、重複削除キーは共通しているのに対し、例えば「入館日」列の値は互いに異なる。このため、重複削除の際に、例えば「入館日」が最も新しいレコードを残したい、といった要望があることが考えられる。
 一方で、従来の重複削除では、重複削除の対象のレコード群に含まれるレコードのうち、どのレコードが削除されるかがランダムに決定される場合がある。このため、重複削除の後に、要望通りのレコードが残らない場合がある。
 上述した課題を解決し、目的を達成するために、本発明の分析装置は、第1のキーの値が重複するレコードを含むテーブルのレコードを、前記第1のキーと異なる第2のキーで秘密計算によりソートするソート部と、前記ソート部によるソートが行われた前記テーブルに含まれる、前記第1のキーが重複するレコードの集合のそれぞれについて、前記集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを、秘密計算により削除する削除部と、を有することを特徴とする。
 本発明によれば、秘密計算によるテーブルの重複削除の際に、残すレコードを指定できる。
図1は、実施形態に係る分析システムの構成例を示す図である。 図2は、実施形態に係る分析装置の構成例を示す図である。 図3は、実施形態に係る重複削除の手順を説明する図である。 図4は、実施形態に係る分析装置の処理の流れを示すフローチャートである。 図5は、分析プログラムを実行するコンピュータの一例を示す図である。 図6は、従来の重複削除の手順を説明する図である。
 以下に、本願に係る分析装置、分析方法及び分析プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。
 まず、図1を用いて、分析システムの構成を説明する。分析システムは、秘密計算を利用してデータの分析を行うためのシステムである。
 図1に示すように、分析システム1は、秘密計算システム10を含む。また、秘密計算システム10は、ネットワークNを介して提供装置20及び提供装置30と接続される。例えば、ネットワークNはインターネットである。また、秘密計算システム10は、端末装置40と接続される。
 提供装置20及び提供装置30は、データ提供者側の装置である。提供装置20及び提供装置30は、秘密計算システム10にデータを提供(登録)する。
 提供装置20及び提供装置30によって提供されるデータは、秘匿化されることが望ましい情報(例えば、個人の氏名、住所等の個人情報)を含む。例えば、提供装置20及び提供装置30は、医療機関で利用されるレセプト及びDPC(Diagnosis Procedure Combination)に関するデータを提供する。
 秘密計算システム10は、データ蓄積部11及びデータ処理部12を有する。データ蓄積部11は、秘密分散によりデータを蓄積する複数の蓄積装置(蓄積装置111、蓄積装置112、蓄積装置113)を含む。また、データ処理部12は、秘密計算によりデータを処理する複数の計算装置(計算装置121、計算装置122、計算装置123)を含む。なお、蓄積装置の数及び計算装置の数は、図1に示す例に限られない。
 秘密計算システム10は、非特許文献1(掲載URL:https://www.rd.ntt/sil/project/sc/secure_computation.html)に記載された方法に従って、秘密分散及び秘密計算を実行することができる。
 まず、秘密計算システム10に提供されたデータは、複数のシェアに分割される(断片化)。そして、複数のシェアのそれぞれは、データ蓄積部11に含まれる複数の蓄積装置に分散して蓄積される。図1の例では、提供されたデータが3つのシェアに分割される。そして、蓄積装置111、蓄積装置112、蓄積装置113が、それぞれ1つずつシェアを蓄積する。
 データ処理部12は、データ蓄積部11に蓄積されたシェアに対し、秘密計算を実行する。データ処理部12は、複数の計算装置を使ったマルチパーティ計算により秘密計算を実行する。図1の例では、データ処理部12は、計算装置121、計算装置122、計算装置123により秘密計算を実行する。
 データ処理部12は、シェアを復元することなく各種の統計演算を行うことができる。例えば、データ処理部12は、ソート、結合等のテーブルの操作、レコード数の集計、総和、平均、最大値、最小値、標本分散等の統計量の計算、t検定等の統計的検定を行うことができる。さらに、データ処理部12は、回帰分析及び主成分分析といった統計的分析を行うことができる。
 分析装置13は、データ処理部12を利用してデータの分析を行う。分析装置13は、データ処理部12によって実行された秘密計算の結果に基づき、分析結果をデータ利用者側の端末装置40に提供する。利用者は、端末装置40を介してデータの分析結果を得ることができる。
 例えば、秘密計算システム10には、個人ごとの属性及び身体に関するデータが提供される場合がある。属性及び身体に関するデータは秘匿化されることが望ましい個人情報である。属性及び身体に関するデータには、例えば年齢、性別、身長、体重等が含まれる。データ蓄積部11は、提供されたデータを断片化したシェアを各蓄積装置に格納する。
 なお、分割された個々のシェアは、単独では意味のないデータである。そのため、1つのシェアから元のデータを復元することはできない。一方、複数のシェアを揃えることで元のデータを復元することが可能になる。
 データの利用者は、登録されたデータそのものを閲覧することはできないが、分析装置13及び端末装置40を介して、データの分析結果を閲覧することができる。例えば、データに個人の性別及び体重が含まれている場合、利用者は、各個人の性別及び体重を閲覧することはできないが、データの分析結果である「男性の平均体重」を閲覧することができる。
 一例として、データ蓄積部11は、Shamirの閾値秘密分散法という手法を使って秘密分散を行うことができる。このとき、データ蓄積部11は、元のデータを切片とする多項式を通る3つの座標をシェアとして各サーバに保管する。また、多項式の傾きはランダムに決定されるため、元のデータが同じであってもシェアが毎回同じであるとは限らない。なお、元のデータは、数値であってもよいし、数値に変換済みのデータであってもよい。
 秘密計算システム10は、複数のシェアから元のデータを復元することができる。多項式が1次式であれば、秘密計算システム10は、2つの座標(シェアに相当)を結ぶ直線と軸との交点から切片(元のデータに相当)を求めることができる。一方で、1つの座標からは直線が定まらないため、元のデータを復元することはできない。
 また、前述の通り、データ処理部12は、シェアを復元することなく元のデータに対し秘密計算を実行することができる。例えば、座標で表されたシェア同士を加算した結果は、各シェアの元のデータ同士を加算した結果のシェアに相当する。
 分析装置13は、端末装置40からの要求に応じて、データ処理部12に秘密計算による処理を実行させる。なお、データ処理部12又は端末装置40が、分析装置13と同等の機能を実現してもよい。例えば、分析システム1は、分析装置13を有さない構成であってもよい。その場合、端末装置40がデータ処理部12と接続され、分析装置13と同等の処理を実行する。さらに、シェアに基づく統計演算は、データ処理部12ではなく端末装置40によって実行されてもよい。
 第1の実施形態では、分析装置13が秘密計算によりテーブルの重複削除を行う場合の例を説明する。なお、分析装置13が重複削除の対象とするテーブルは、例えば複数のテーブルが関連付けられたリレーショナルデータベース(RDB:Relational Database)に含まれるテーブルである。
 既に図6を用いて説明した通り、従来の技術には、重複削除の際に、残すレコードを指定できない場合があるという問題がある。これに対して、第1の実施形態の分析装置13は、指定されたレコードを残して秘密計算によるテーブルの重複削除を行うことができる。
 図2を用いて、分析装置13の構成を説明する。図2は、実施形態に係る分析装置の構成例を示す図である。
 分析装置13の各部について説明する。図2に示すように、分析装置13は、通信部131、入力部132、出力部133、記憶部134及び制御部135を有する。
 通信部131は、他の装置の間でデータの通信を行う。例えば、通信部131はNIC(Network Interface Card)である。通信部131は他の装置との間でデータの送受信を行うことができる。
 入力部132は、データの入力を受け付けるためのインタフェースである。入力部132は、例えばマウス及びキーボード等の入力装置と接続される。
 出力部133は、データを出力するためのインタフェースである。出力部133は、例えばディスプレイ及びスピーカ等の入力装置と接続される。
 記憶部134は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスク等の記憶装置である。なお、記憶部134は、RAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)等のデータを書き換え可能な半導体メモリであってもよい。記憶部134は、分析装置13で実行されるOS(Operating System)及び各種プログラムを記憶する。
 制御部135は、分析装置13全体を制御する。制御部135は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)等の電子回路や、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積回路である。また、制御部135は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、内部メモリを用いて各処理を実行する。
 制御部135は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部135は、決定部1351、ソート部1352及び削除部1353を有する。
 図3を用いて、制御部135の各処理部の機能とともに、重複削除の手順を説明する。図3は、実施形態に係る重複削除の手順を説明する図である。なお、説明のため、図3には各テーブルの内容を自然言語として判読できる状態で示しているが、実際には、図3に示す処理は、判読不可能なシェアの状態(例えば、無意味に見える数値の羅列)で蓄積されたテーブルを対象として、秘密計算により行われる。
 図3のテーブル51は、重複削除の対象のテーブルである。ここでは、「社員ID」列及び「所属部コード」列(以下、重複削除キー)が重複しているレコードが、1つを残して削除される。このため、図3のテーブル51のレコード群61及びレコード群62は、重複削除の対象である。
 決定部1351は、重複削除キー、ソートキー及びソートの順序を決定する。重複削除キー及びソートキーは、1つ以上の列の集合である。ソートキーは後述するソート処理で用いられる。
 決定部1351は、端末装置40を介して受け取った利用者からの要求に応じて重複削除キー及びソートキーを決定することができる。ただし、重複削除キーとソートキーは異なるものとする。
 例えば、決定部1351は、「「社員ID」と「所属部コード」が重複するレコードを、「入館日」が最も古いレコードを残して削除する。」という要求があった場合を考える。この場合、決定部1351は、「社員ID」列と「所属部コード」列を重複削除キーに決定する。また、決定部1351は、「入館日」列をソートキーに決定する。また、決定部1351は、ソートの順序を昇順に決定する。
 なお、決定部1351は、残すことが要求されたレコードが、値が最も小さい(日時の場合は最も古いことと同意)レコードである場合、ソートの順序を昇順に決定する。逆に、決定部1351は、残すことが要求されたレコードが、値が最も大きい(日時の場合は最も新しいことと同意)レコードである場合、ソートの順序を降順に決定する。
 ソート部1352は、重複削除キーの値が重複するレコードを含むテーブル51のレコードを、ソートキーで秘密計算によりソートする。また、ソート部1352は、昇順及び降順のうち、指定された順序でテーブルのレコードをソートする。テーブル52は、ソート部1352がテーブル51をソートした後のテーブルである。
 決定部1351によって、「入館日」列がソートキーに決定され、ソートの順序が昇順に決定されている。このため、ソート部1352は、テーブル51のレコードを「入館日」列の昇順でソートする。この場合、テーブル52に示すように、「入館日」列の値が小さい(日時が古い)レコードほど、上位に配置される。
 削除部1353は、ソート部1352によるソートが行われたテーブル52に含まれる、重複削除キーが重複するレコードの集合のそれぞれについて、集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを秘密計算により削除する。例えば、図3の例では、削除部1353は、集合の中で最上位にある1つのレコード以外のレコードを削除する。
 テーブル52のレコード群61及びレコード群62は、いずれも重複削除キーが重複するレコードの集合である。削除部1353は、レコード群61に含まれるレコードのうち、最下位に位置するレコード(「入館日」列の値が「2022/9/3」であるレコード)を削除し、それ以外のレコード(「入館日」列の値が「2022/9/2」であるレコード)を残す。
 なお、図3の例では、ソート後のテーブル52における各レコード群に含まれるレコードは互いに隣接しているが、各レコード群に含まれるレコードは互いに隣接していなくてもよい。
 また、削除部1353は、分析装置13は、最上位のレコードではなく、最下位のレコードを残すように削除を行ってもよい。その場合、決定部1351は、上記の説明と逆の順序を決定する。すなわち、決定部1351は、残すことが要求されたレコードが、値が最も小さい(日時の場合は最も古いことと同意)レコードである場合、ソートの順序を降順に決定する。逆に、決定部1351は、残すことが要求されたレコードが、値が最も大きい(日時の場合は最も新しいことと同意)レコードである場合、ソートの順序を昇順に決定する。
 出力制御部1354は、レコードを削除した上でテーブル52を出力する。また、出力制御部1354は、レコードを削除したテーブル52を用いてさらに統計的な分析を行った結果を出力してもよい。
 図4は、実施形態に係る分析装置の処理の流れを示すフローチャートである。図4に示すように、まず、分析装置13は、利用者からの要求を基に、重複削除キー、ソートキー及びソートの順序を決定する(ステップS101)。分析装置13は、決定した重複削除キーと順序を基にテーブルのレコードを秘密計算によりソートする(ステップS102)。
 次に、分析装置13は、重複削除キーが重複するレコード群を、ソート済みのテーブルから取得する(ステップS103)。ここで、分析装置13は、未処理のレコード群のうち1つを選択する(ステップS104)。
 分析装置13は、選択したレコード群のレコードのうち、最上位のレコード以外を秘密計算により削除する(ステップS105)。
 分析装置13は、未選択のレコード群がある場合(ステップS106、Yes)、ステップS104に戻り処理を繰り返す。分析装置13は、未選択のレコード群がない場合(ステップS106、No)、最終的に得られたテーブルを出力する(ステップS107)。
[実施形態の効果]
 これまで説明してきたように、分析装置13は、ソート部1352及び削除部1353を有する。ソート部1352は、第1のキー(重複削除キー)の値が重複するレコードを含むテーブルのレコードを、第1のキーと異なる第2のキー(ソートキー)で秘密計算によりソートする。削除部1353は、ソート部1352によるソートが行われたテーブルに含まれる、第1のキーが重複するレコードの集合のそれぞれについて、集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを秘密計算により削除する。これにより、分析装置13は、重複削除の際に残すレコードがあらかじめ定められた位置に配置されるようにソートを行うことで、残すレコードを指定できる。
 ソート部1352は、昇順及び降順のうち、指定された順序でテーブルのレコードをソートする。また、削除部1353は、集合の中で最上位又は最下位にある1つのレコード以外のレコードを削除する。これにより、分析装置13は、利用者の要求に応じて削除されないレコードを最上位又は最下位に配置し、その他のレコードを削除することができる。
[システム構成等]
 また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU(Central Processing Unit)及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。なお、プログラムは、CPUだけでなく、GPU等の他のプロセッサによって実行されてもよい。
 また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
 一実施形態として、分析装置13は、パッケージソフトウェアやオンラインソフトウェアとして上記の分析処理を実行する分析プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の分析プログラムを情報処理装置に実行させることにより、情報処理装置を分析装置13として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
 また、分析装置13は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の分析処理に関するサービスを提供する分析サーバ装置として実装することもできる。例えば、分析サーバ装置は、重複削除対象のテーブルを入力とし、重複削除済みのテーブルを出力とする分析サービスを提供するサーバ装置として実装される。
 図5は、分析プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
 メモリ1010は、ROM(Read Only Memory)1011及びRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
 ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、分析装置13の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、分析装置13における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
 また、上述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020は、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した実施形態の処理を実行する。
 なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
 1 分析システム
 10 秘密計算システム
 11 データ蓄積部
 12 データ処理部
 13 分析装置
 131 通信部
 132 入力部
 133 出力部
 134 記憶部
 135 制御部
 1351 決定部
 1352 ソート部
 1353 削除部

Claims (5)

  1.  第1のキーの値が重複するレコードを含むテーブルのレコードを、前記第1のキーと異なる第2のキーで秘密計算によりソートするソート部と、
     前記ソート部によるソートが行われた前記テーブルに含まれる、前記第1のキーが重複するレコードの集合のそれぞれについて、前記集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを、秘密計算により削除する削除部と、
     を有することを特徴とする分析装置。
  2.  前記ソート部は、昇順及び降順のうち、指定された順序で前記テーブルのレコードをソートすることを特徴とする請求項1に記載の分析装置。
  3.  前記削除部は、前記集合の中で最上位又は最下位にある1つのレコード以外のレコードを削除する
     ことを特徴とする請求項1又は2に記載の分析装置。
  4.  分析装置によって実行される分析方法であって、
     第1のキーの値が重複するレコードを含むテーブルのレコードを、前記第1のキーと異なる第2のキーで秘密計算によりソートするソート工程と、
     前記ソート工程によるソートが行われた前記テーブルに含まれる、前記第1のキーが重複するレコードの集合のそれぞれについて、前記集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを、秘密計算により削除する削除工程と、
     を含むことを特徴とする分析方法。
  5.  第1のキーの値が重複するレコードを含むテーブルのレコードを、前記第1のキーと異なる第2のキーで秘密計算によりソートするソートステップと、
     前記ソートステップによるソートが行われた前記テーブルに含まれる、前記第1のキーが重複するレコードの集合のそれぞれについて、前記集合の中であらかじめ定められた位置にある1つのレコード以外のレコードを、秘密計算により削除する削除ステップと、
     をコンピュータに実行させることを特徴とする分析プログラム。
PCT/JP2024/007990 2023-05-01 2024-03-04 分析装置、分析方法及び分析プログラム Ceased WO2024228294A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
AU2024266332A AU2024266332A1 (en) 2023-05-01 2024-03-04 Analysis device, analysis method, and analysis program
EP24800025.9A EP4708260A4 (en) 2023-05-01 2024-03-04 Analysis device, analysis method, and analysis program
US19/375,290 US20260056925A1 (en) 2023-05-01 2025-10-31 Analysis device, analysis method, and analysis program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2023075832A JP2024160620A (ja) 2023-05-01 2023-05-01 分析装置、分析方法及び分析プログラム
JP2023-075832 2023-05-01

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US19/375,290 Continuation US20260056925A1 (en) 2023-05-01 2025-10-31 Analysis device, analysis method, and analysis program

Publications (1)

Publication Number Publication Date
WO2024228294A1 true WO2024228294A1 (ja) 2024-11-07

Family

ID=93332911

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2024/007990 Ceased WO2024228294A1 (ja) 2023-05-01 2024-03-04 分析装置、分析方法及び分析プログラム

Country Status (5)

Country Link
US (1) US20260056925A1 (ja)
EP (1) EP4708260A4 (ja)
JP (1) JP2024160620A (ja)
AU (1) AU2024266332A1 (ja)
WO (1) WO2024228294A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014139640A (ja) 2013-01-21 2014-07-31 Nippon Telegr & Teleph Corp <Ntt> 秘密計算による表の等結合システム、方法
WO2019124260A1 (ja) 2017-12-18 2019-06-27 日本電信電話株式会社 秘密計算システム及び方法
WO2019225401A1 (ja) * 2018-05-25 2019-11-28 日本電信電話株式会社 秘密集約関数計算システム、秘密計算装置、秘密集約関数計算方法、およびプログラム
JP2020042128A (ja) 2018-09-10 2020-03-19 日本電信電話株式会社 秘密統計処理システム、方法、統計処理装置及びプログラム
WO2021144840A1 (ja) * 2020-01-14 2021-07-22 日本電信電話株式会社 暗号化データ分析装置、暗号化データ分析方法、プログラム
WO2022254691A1 (ja) * 2021-06-04 2022-12-08 日本電信電話株式会社 秘密計算装置、秘密計算システム、秘密計算方法、およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014139640A (ja) 2013-01-21 2014-07-31 Nippon Telegr & Teleph Corp <Ntt> 秘密計算による表の等結合システム、方法
WO2019124260A1 (ja) 2017-12-18 2019-06-27 日本電信電話株式会社 秘密計算システム及び方法
WO2019225401A1 (ja) * 2018-05-25 2019-11-28 日本電信電話株式会社 秘密集約関数計算システム、秘密計算装置、秘密集約関数計算方法、およびプログラム
JP2020042128A (ja) 2018-09-10 2020-03-19 日本電信電話株式会社 秘密統計処理システム、方法、統計処理装置及びプログラム
WO2021144840A1 (ja) * 2020-01-14 2021-07-22 日本電信電話株式会社 暗号化データ分析装置、暗号化データ分析方法、プログラム
WO2022254691A1 (ja) * 2021-06-04 2022-12-08 日本電信電話株式会社 秘密計算装置、秘密計算システム、秘密計算方法、およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NTT CORP., SYSTEM OF SECURE COMPUTATION AND PRINCIPLES THEREOF, 24 November 2022 (2022-11-24), Retrieved from the Internet <URL:https://www.rd.ntt/sil/project/sc/securecomputation.html>
See also references of EP4708260A1

Also Published As

Publication number Publication date
JP2024160620A (ja) 2024-11-14
US20260056925A1 (en) 2026-02-26
EP4708260A4 (en) 2026-05-06
EP4708260A1 (en) 2026-03-11
AU2024266332A1 (en) 2025-11-20

Similar Documents

Publication Publication Date Title
US12614113B2 (en) Using consistency metadata for filtering of machine learning data across jobs
US12056583B2 (en) Target variable distribution-based acceptance of machine learning test data sets
US10585913B2 (en) Apparatus and method for distributed query processing utilizing dynamically generated in-memory term maps
US10713589B1 (en) Consistent sort-based record-level shuffling of machine learning data
US10366053B1 (en) Consistent randomized record-level splitting of machine learning data
US10168921B1 (en) Systems and methods for storing time-series data
US10360405B2 (en) Anonymization apparatus, and program
CN103620601A (zh) 在映射缩减过程中汇合表
JP2017049693A (ja) 個人情報匿名化方法、プログラム、及び情報処理装置
US9619458B2 (en) System and method for phrase matching with arbitrary text
KR20130126012A (ko) 비즈니스 인텔리전스의리포트 제공 방법 및 장치
WO2024228294A1 (ja) 分析装置、分析方法及び分析プログラム
US10282361B2 (en) Transforming time series data points from concurrent processes
US20240143674A1 (en) Processing and publishing scanned data for detecting entities in a set of domains via a parallel pipeline
WO2024228293A1 (ja) 分析装置、分析方法及び分析プログラム
CN114168557B (zh) 一种访问日志的处理方法、装置、计算机设备和存储介质
WO2024228299A1 (ja) 分析装置、分析方法及び分析プログラム
EP4217880B1 (en) Deterministic mapping and routing of items to physical resources
JP7720512B2 (ja) 情報提供装置、情報提供方法及び情報提供プログラム
WO2024228296A1 (ja) 分析装置、分析方法及び分析プログラム
Eom et al. Android malware detection using feature selections and random forest
US11734245B1 (en) Systems and methods for storing time-series data
WO2024228295A1 (ja) 分析装置、分析方法及び分析プログラム
CN109871215B (zh) 软件发布的方法和装置
WO2024228297A1 (ja) 分析装置、分析方法及び分析プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 24800025

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: AU2024266332

Country of ref document: AU

ENP Entry into the national phase

Ref document number: 2024266332

Country of ref document: AU

Date of ref document: 20240304

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

WWE Wipo information: entry into national phase

Ref document number: 2024800025

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

ENP Entry into the national phase

Ref document number: 2024800025

Country of ref document: EP

Effective date: 20251201

WWP Wipo information: published in national office

Ref document number: 2024800025

Country of ref document: EP