JPH11238006A - データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体 - Google Patents
データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体Info
- Publication number
- JPH11238006A JPH11238006A JP10037750A JP3775098A JPH11238006A JP H11238006 A JPH11238006 A JP H11238006A JP 10037750 A JP10037750 A JP 10037750A JP 3775098 A JP3775098 A JP 3775098A JP H11238006 A JPH11238006 A JP H11238006A
- Authority
- JP
- Japan
- Prior art keywords
- record
- data
- data item
- unified
- definition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 アプリケーションプログラムの個別作成や人
手による目視確認処理を必要とせずに、表現形式が均一
でないデータが格納されたファイルから不整合データを
除去して統合レコードを効率的に作成するデータクリー
ニング処理方法および装置とデータクリーニング処理プ
ログラムを記録した記録媒体を提供する。 【解決手段】 レコード統一化処理部1でレコード統一
化定義4に従いレコードの各データ項目に対して統一表
現形式のデータ項目の統一化レコードを作成し、レコー
ド統合処理部2でレコード統合定義5に従い統一化レコ
ード群に対して同一データ項目値を有する統一化レコー
ドを統合した統合レコードを作成し、データ項目間制約
条件チェック処理部3でデータ項目間制約条件チェック
定義6に従い統合レコードのデータ項目間制約条件をチ
ェックし、その結果を表示するデータ項目を付加したデ
ータ項目間制約条件チェック結果レコードを作成する。
手による目視確認処理を必要とせずに、表現形式が均一
でないデータが格納されたファイルから不整合データを
除去して統合レコードを効率的に作成するデータクリー
ニング処理方法および装置とデータクリーニング処理プ
ログラムを記録した記録媒体を提供する。 【解決手段】 レコード統一化処理部1でレコード統一
化定義4に従いレコードの各データ項目に対して統一表
現形式のデータ項目の統一化レコードを作成し、レコー
ド統合処理部2でレコード統合定義5に従い統一化レコ
ード群に対して同一データ項目値を有する統一化レコー
ドを統合した統合レコードを作成し、データ項目間制約
条件チェック処理部3でデータ項目間制約条件チェック
定義6に従い統合レコードのデータ項目間制約条件をチ
ェックし、その結果を表示するデータ項目を付加したデ
ータ項目間制約条件チェック結果レコードを作成する。
Description
【0001】
【発明の属する技術分野】本発明は、データ値の表現形
式が均一でないデータが格納された1つ以上のファイル
から、複数のレコードを突合し、不整合データを除去し
て、統一された表現形式の統合レコードを作成するデー
タクリーニング処理方法および装置とデータクリーニン
グ処理プログラムを記録した記録媒体に関し、更に詳し
くは、例えば複数の基幹系データベースから抽出された
データを統合データベースまたはデータウェアハウスに
格納する際のデータクリーニング処理に適用し得るデー
タクリーニング処理方法および装置に関する。なお、こ
こで使用されているファイルとは、データベースから抽
出されたデータが格納されたファイルである。
式が均一でないデータが格納された1つ以上のファイル
から、複数のレコードを突合し、不整合データを除去し
て、統一された表現形式の統合レコードを作成するデー
タクリーニング処理方法および装置とデータクリーニン
グ処理プログラムを記録した記録媒体に関し、更に詳し
くは、例えば複数の基幹系データベースから抽出された
データを統合データベースまたはデータウェアハウスに
格納する際のデータクリーニング処理に適用し得るデー
タクリーニング処理方法および装置に関する。なお、こ
こで使用されているファイルとは、データベースから抽
出されたデータが格納されたファイルである。
【0002】
【従来の技術】複数のデータベースから抽出されたデー
タをデータウェアハウスに格納する場合には、複数のデ
ータベースからデータが抽出されるので、(1)同一デ
ータ項目名であるがデータの意味が異質であったり、
(2)異なるデータ項目名であってもデータの意味が同
じであったり、(3)データ属性(型)が相違したり、
(4)データ形式や文字コードが相違したり、(5)デ
ータの不整合が発生するということがある。
タをデータウェアハウスに格納する場合には、複数のデ
ータベースからデータが抽出されるので、(1)同一デ
ータ項目名であるがデータの意味が異質であったり、
(2)異なるデータ項目名であってもデータの意味が同
じであったり、(3)データ属性(型)が相違したり、
(4)データ形式や文字コードが相違したり、(5)デ
ータの不整合が発生するということがある。
【0003】上述した(1)乃至(4)における問題は
複数のデータベースのスキーマ構造の相違に依存する問
題であり、データウェアハウスとして規定した統一スキ
ーマに変換するデータ流通プラットフォームDB-STREAM
(情報処理学会論文誌 Vol.38,No.12,1997,pp.2553-256
5 )により解決されている。
複数のデータベースのスキーマ構造の相違に依存する問
題であり、データウェアハウスとして規定した統一スキ
ーマに変換するデータ流通プラットフォームDB-STREAM
(情報処理学会論文誌 Vol.38,No.12,1997,pp.2553-256
5 )により解決されている。
【0004】
【発明が解決しようとする課題】上述した(5)におけ
る問題は、複数のデータベース間のデータ値の相違に依
存する問題であり、従来は不整合データの検出および除
去(この処理をデータクリーニング処理と称する)を行
うアプリケーションプログラムを個別に作成したり、ま
たは人手による全データの目視確認で対処する必要があ
り、非効率的であるという問題がある。
る問題は、複数のデータベース間のデータ値の相違に依
存する問題であり、従来は不整合データの検出および除
去(この処理をデータクリーニング処理と称する)を行
うアプリケーションプログラムを個別に作成したり、ま
たは人手による全データの目視確認で対処する必要があ
り、非効率的であるという問題がある。
【0005】本発明は、上記に鑑みてなされたもので、
その目的とするところは、アプリケーションプログラム
の個別作成や人手による目視確認処理を必要とせずに、
表現形式が均一でないデータが格納されたファイルから
不整合データを除去して統合レコードを効率的に作成す
るデータクリーニング処理方法および装置とデータクリ
ーニング処理プログラムを記録した記録媒体を提供する
ことにある。
その目的とするところは、アプリケーションプログラム
の個別作成や人手による目視確認処理を必要とせずに、
表現形式が均一でないデータが格納されたファイルから
不整合データを除去して統合レコードを効率的に作成す
るデータクリーニング処理方法および装置とデータクリ
ーニング処理プログラムを記録した記録媒体を提供する
ことにある。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、データ値の表現形式が均
一でないデータが格納された入力ファイルから、複数の
レコードを突合し、不整合データを除去して統合レコー
ドを作成するデータクリーニング処理方法であって、レ
コードのデータ表現形式の統一方法を記述するレコード
統一化定義、複数のレコードの統合方法を記述するレコ
ード統合定義、およびレコード内のデータ項目間制約条
件のチェック方法を記述するデータ項目間制約条件チェ
ック定義を設け、データ項目毎のデータ表現形式を統一
化する標準データ統一化部品群、および該標準データ統
一化部品群以外にユーザが指定する統一化を可能とする
個別データ統一化部品群を定義しておき、前記レコード
統一化定義に従い、入力ファイルに格納された1つ以上
のレコードの各データ項目に対して前記標準データ統一
部品群および個別データ統一化部品群を使用し、統一表
現形式のデータ項目を作成し、各レコード中に付加して
統一化レコードを作成するレコード統一化処理を行い、
前記レコード統合定義に従い、レコード統一化処理結果
である統一化レコード群に対して、同一データ項目値を
有する統一化レコードを統合した統合レコードおよび同
一データ項目値を持たない統一化レコードである非統合
レコードをそれぞれ別ファイルに出力するレコード統合
処理を行い、前記データ項目間制約条件チェック定義に
従い、レコード統合処理結果である統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、チェック結果を表示するデータ項
目値に従い、データ項目間制約条件チェック結果レコー
ドを別ファイルに出力するデータ項目間制約条件チェッ
ク処理を行うことを要旨とする。
め、請求項1記載の本発明は、データ値の表現形式が均
一でないデータが格納された入力ファイルから、複数の
レコードを突合し、不整合データを除去して統合レコー
ドを作成するデータクリーニング処理方法であって、レ
コードのデータ表現形式の統一方法を記述するレコード
統一化定義、複数のレコードの統合方法を記述するレコ
ード統合定義、およびレコード内のデータ項目間制約条
件のチェック方法を記述するデータ項目間制約条件チェ
ック定義を設け、データ項目毎のデータ表現形式を統一
化する標準データ統一化部品群、および該標準データ統
一化部品群以外にユーザが指定する統一化を可能とする
個別データ統一化部品群を定義しておき、前記レコード
統一化定義に従い、入力ファイルに格納された1つ以上
のレコードの各データ項目に対して前記標準データ統一
部品群および個別データ統一化部品群を使用し、統一表
現形式のデータ項目を作成し、各レコード中に付加して
統一化レコードを作成するレコード統一化処理を行い、
前記レコード統合定義に従い、レコード統一化処理結果
である統一化レコード群に対して、同一データ項目値を
有する統一化レコードを統合した統合レコードおよび同
一データ項目値を持たない統一化レコードである非統合
レコードをそれぞれ別ファイルに出力するレコード統合
処理を行い、前記データ項目間制約条件チェック定義に
従い、レコード統合処理結果である統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、チェック結果を表示するデータ項
目値に従い、データ項目間制約条件チェック結果レコー
ドを別ファイルに出力するデータ項目間制約条件チェッ
ク処理を行うことを要旨とする。
【0007】請求項1記載の本発明にあっては、レコー
ド統一化定義に従い、ファイルに格納されたレコードの
各データ項目に対して統一表現形式のデータ項目を作成
して統一化レコードを作成し、レコード統合定義に従
い、統一化レコード群に対して同一データ項目値を有す
る統一化レコードを統合した統合レコードおよび同一デ
ータ項目値を持たない統一化レコードである非統合レコ
ードを作成してそれぞれ別ファイルに格納し、データ項
目間制約条件チェック定義に従い、統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、該レコードをチェック結果を表示
するデータ項目値に従い別ファイルに出力するため、従
来のように入力ファイル毎にデータクリーニング処理用
アプリケーションプログラムを作成する必要もないとと
もに、人手による全データの目視確認作業も必要なく、
効率化を図ることができる。
ド統一化定義に従い、ファイルに格納されたレコードの
各データ項目に対して統一表現形式のデータ項目を作成
して統一化レコードを作成し、レコード統合定義に従
い、統一化レコード群に対して同一データ項目値を有す
る統一化レコードを統合した統合レコードおよび同一デ
ータ項目値を持たない統一化レコードである非統合レコ
ードを作成してそれぞれ別ファイルに格納し、データ項
目間制約条件チェック定義に従い、統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、該レコードをチェック結果を表示
するデータ項目値に従い別ファイルに出力するため、従
来のように入力ファイル毎にデータクリーニング処理用
アプリケーションプログラムを作成する必要もないとと
もに、人手による全データの目視確認作業も必要なく、
効率化を図ることができる。
【0008】また、請求項2記載の本発明は、データ値
の表現形式が均一でないデータが格納された入力ファイ
ルから、複数のレコードを突合し、不整合データを除去
して統合レコードを作成するデータクリーニング処理装
置であって、レコードのデータ表現形式の統一方法を記
述するレコード統一化定義、複数のレコードの統合方法
を記述するレコード統合定義、およびレコード内のデー
タ項目間制約条件のチェック方法を記述するデータ項目
間制約条件チェック定義を格納する定義格納手段と、デ
ータ項目毎のデータ表現形式を統一化する標準データ統
一化部品群、および該標準データ統一化部品群以外にユ
ーザが指定する統一化を可能とする個別データ統一化部
品群を定義して格納する部品群格納手段と、前記レコー
ド統一化定義に従い、入力ファイルに格納された1つ以
上のレコードの各データ項目に対して前記標準データ統
一部品群および個別データ統一化部品群を使用し、統一
表現形式のデータ項目を作成し、各レコード中に付加し
て統一化レコードを作成するレコード統一化処理手段
と、前記レコード統合定義に従い、レコード統一化処理
結果である統一化レコード群に対して、同一データ項目
値を有する統一化レコードを統合した統合レコードおよ
び同一データ項目値を持たない統一化レコードである非
統合レコードをそれぞれ別ファイルに出力するレコード
統合処理手段と、前記データ項目間制約条件チェック定
義に従い、レコード統合処理結果である統合レコード内
のデータ項目間制約条件をチェックし、その結果を表示
するデータ項目を付加したデータ項目間制約条件チェッ
ク結果レコードを作成し、チェック結果を表示するデー
タ項目値に従い、データ項目間制約条件チェック結果レ
コードを別ファイルに出力するデータ項目間制約条件チ
ェック処理手段とを有することを要旨とする。
の表現形式が均一でないデータが格納された入力ファイ
ルから、複数のレコードを突合し、不整合データを除去
して統合レコードを作成するデータクリーニング処理装
置であって、レコードのデータ表現形式の統一方法を記
述するレコード統一化定義、複数のレコードの統合方法
を記述するレコード統合定義、およびレコード内のデー
タ項目間制約条件のチェック方法を記述するデータ項目
間制約条件チェック定義を格納する定義格納手段と、デ
ータ項目毎のデータ表現形式を統一化する標準データ統
一化部品群、および該標準データ統一化部品群以外にユ
ーザが指定する統一化を可能とする個別データ統一化部
品群を定義して格納する部品群格納手段と、前記レコー
ド統一化定義に従い、入力ファイルに格納された1つ以
上のレコードの各データ項目に対して前記標準データ統
一部品群および個別データ統一化部品群を使用し、統一
表現形式のデータ項目を作成し、各レコード中に付加し
て統一化レコードを作成するレコード統一化処理手段
と、前記レコード統合定義に従い、レコード統一化処理
結果である統一化レコード群に対して、同一データ項目
値を有する統一化レコードを統合した統合レコードおよ
び同一データ項目値を持たない統一化レコードである非
統合レコードをそれぞれ別ファイルに出力するレコード
統合処理手段と、前記データ項目間制約条件チェック定
義に従い、レコード統合処理結果である統合レコード内
のデータ項目間制約条件をチェックし、その結果を表示
するデータ項目を付加したデータ項目間制約条件チェッ
ク結果レコードを作成し、チェック結果を表示するデー
タ項目値に従い、データ項目間制約条件チェック結果レ
コードを別ファイルに出力するデータ項目間制約条件チ
ェック処理手段とを有することを要旨とする。
【0009】請求項2記載の本発明にあっては、レコー
ド統一化定義に従い、ファイルに格納されたレコードの
各データ項目に対して統一表現形式のデータ項目を作成
して統一化レコードを作成し、レコード統合定義に従
い、統一化レコード群に対して同一データ項目値を有す
る統一化レコードを統合した統合レコードおよび同一デ
ータ項目値を持たない統一化レコードである非統合レコ
ードを作成してそれぞれ別ファイルに格納し、データ項
目間制約条件チェック定義に従い、統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、該レコードをチェック結果を表示
するデータ項目値に従い別ファイルに出力するため、従
来のように入力ファイル毎にデータクリーニング処理用
アプリケーションプログラムを作成する必要もないとと
もに、人手による全データの目視確認作業も必要なく、
効率化を図ることができる。
ド統一化定義に従い、ファイルに格納されたレコードの
各データ項目に対して統一表現形式のデータ項目を作成
して統一化レコードを作成し、レコード統合定義に従
い、統一化レコード群に対して同一データ項目値を有す
る統一化レコードを統合した統合レコードおよび同一デ
ータ項目値を持たない統一化レコードである非統合レコ
ードを作成してそれぞれ別ファイルに格納し、データ項
目間制約条件チェック定義に従い、統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、該レコードをチェック結果を表示
するデータ項目値に従い別ファイルに出力するため、従
来のように入力ファイル毎にデータクリーニング処理用
アプリケーションプログラムを作成する必要もないとと
もに、人手による全データの目視確認作業も必要なく、
効率化を図ることができる。
【0010】更に、請求項3記載の本発明は、データ値
の表現形式が均一でないデータが格納された入力ファイ
ルから、複数のレコードを突合し、不整合データを除去
して統合レコードを作成するデータクリーニング処理プ
ログラムを記録した記録媒体であって、レコードのデー
タ表現形式の統一方法を記述するレコード統一化定義、
複数のレコードの統合方法を記述するレコード統合定
義、およびレコード内のデータ項目間制約条件のチェッ
ク方法を記述するデータ項目間制約条件チェック定義を
設け、データ項目毎のデータ表現形式を統一化する標準
データ統一化部品群、および該標準データ統一化部品群
以外にユーザが指定する統一化を可能とする個別データ
統一化部品群を定義しておき、前記レコード統一化定義
に従い、入力ファイルに格納された1つ以上のレコード
の各データ項目に対して前記標準データ統一部品群およ
び個別データ統一化部品群を使用し、統一表現形式のデ
ータ項目を作成し、各レコード中に付加して統一化レコ
ードを作成するレコード統一化処理を行い、前記レコー
ド統合定義に従い、レコード統一化処理結果である統一
化レコード群に対して、同一データ項目値を有する統一
化レコードを統合した統合レコードおよび同一データ項
目値を持たない統一化レコードである非統合レコードを
それぞれ別ファイルに出力するレコード統合処理を行
い、前記データ項目間制約条件チェック定義に従い、レ
コード統合処理結果である統合レコード内のデータ項目
間制約条件をチェックし、その結果を表示するデータ項
目を付加したデータ項目間制約条件チェック結果レコー
ドを作成し、チェック結果を表示するデータ項目値に従
い、データ項目間制約条件チェック結果レコードを別フ
ァイルに出力するデータ項目間制約条件チェック処理を
行うデータクリーニング処理プログラムを記録媒体に記
録することを要旨とする。
の表現形式が均一でないデータが格納された入力ファイ
ルから、複数のレコードを突合し、不整合データを除去
して統合レコードを作成するデータクリーニング処理プ
ログラムを記録した記録媒体であって、レコードのデー
タ表現形式の統一方法を記述するレコード統一化定義、
複数のレコードの統合方法を記述するレコード統合定
義、およびレコード内のデータ項目間制約条件のチェッ
ク方法を記述するデータ項目間制約条件チェック定義を
設け、データ項目毎のデータ表現形式を統一化する標準
データ統一化部品群、および該標準データ統一化部品群
以外にユーザが指定する統一化を可能とする個別データ
統一化部品群を定義しておき、前記レコード統一化定義
に従い、入力ファイルに格納された1つ以上のレコード
の各データ項目に対して前記標準データ統一部品群およ
び個別データ統一化部品群を使用し、統一表現形式のデ
ータ項目を作成し、各レコード中に付加して統一化レコ
ードを作成するレコード統一化処理を行い、前記レコー
ド統合定義に従い、レコード統一化処理結果である統一
化レコード群に対して、同一データ項目値を有する統一
化レコードを統合した統合レコードおよび同一データ項
目値を持たない統一化レコードである非統合レコードを
それぞれ別ファイルに出力するレコード統合処理を行
い、前記データ項目間制約条件チェック定義に従い、レ
コード統合処理結果である統合レコード内のデータ項目
間制約条件をチェックし、その結果を表示するデータ項
目を付加したデータ項目間制約条件チェック結果レコー
ドを作成し、チェック結果を表示するデータ項目値に従
い、データ項目間制約条件チェック結果レコードを別フ
ァイルに出力するデータ項目間制約条件チェック処理を
行うデータクリーニング処理プログラムを記録媒体に記
録することを要旨とする。
【0011】請求項3記載の本発明にあっては、レコー
ド統一化定義に従い、ファイルに格納されたレコードの
各データ項目に対して統一表現形式のデータ項目を作成
して統一化レコードを作成し、レコード統合定義に従
い、統一化レコード群に対して同一データ項目値を有す
る統一化レコードを統合した統合レコードおよび同一デ
ータ項目値を持たない統一化レコードである非統合レコ
ードを作成してそれぞれ別ファイルに格納し、データ項
目間制約条件チェック定義に従い、統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、該レコードをチェック結果を表示
するデータ項目値に従い別ファイルに出力するデータク
リーニング処理プログラムを記録媒体に記録しているた
め、該記録媒体を使用して、その流通性を高めることが
できる。
ド統一化定義に従い、ファイルに格納されたレコードの
各データ項目に対して統一表現形式のデータ項目を作成
して統一化レコードを作成し、レコード統合定義に従
い、統一化レコード群に対して同一データ項目値を有す
る統一化レコードを統合した統合レコードおよび同一デ
ータ項目値を持たない統一化レコードである非統合レコ
ードを作成してそれぞれ別ファイルに格納し、データ項
目間制約条件チェック定義に従い、統合レコード内のデ
ータ項目間制約条件をチェックし、その結果を表示する
データ項目を付加したデータ項目間制約条件チェック結
果レコードを作成し、該レコードをチェック結果を表示
するデータ項目値に従い別ファイルに出力するデータク
リーニング処理プログラムを記録媒体に記録しているた
め、該記録媒体を使用して、その流通性を高めることが
できる。
【0012】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態について説明する。
の形態について説明する。
【0013】図1は、本発明の一実施形態に係るデータ
クリーニング処理装置の構成を示すブロック図である。
同図に示すデータクリーニング処理装置は、データ値の
表現形式が均一でないデータが格納された入力ファイル
から、複数のレコードを突合し、不整合データを除去し
て統合レコードを作成してファイルに出力するものであ
り、本実施形態では、一例として電話番号および顧客名
の表現形式が均一でない2つの顧客データベースから抽
出されたデータが格納されたファイルから電話番号およ
び顧客名が同一のレコードを統合したデータウェアハウ
スを構築する際のデータクリーニング処理に本発明のデ
ータクリーニング処理装置を適用する場合について説明
している。
クリーニング処理装置の構成を示すブロック図である。
同図に示すデータクリーニング処理装置は、データ値の
表現形式が均一でないデータが格納された入力ファイル
から、複数のレコードを突合し、不整合データを除去し
て統合レコードを作成してファイルに出力するものであ
り、本実施形態では、一例として電話番号および顧客名
の表現形式が均一でない2つの顧客データベースから抽
出されたデータが格納されたファイルから電話番号およ
び顧客名が同一のレコードを統合したデータウェアハウ
スを構築する際のデータクリーニング処理に本発明のデ
ータクリーニング処理装置を適用する場合について説明
している。
【0014】図1において、1はレコード統一化処理
部、2はレコード統合処理部、3はデータ項目間制約条
件チェック処理部、4はレコード統一化定義、5はレコ
ード統合定義、6はデータ項目間制約条件チェック定
義、7は標準データ統一化部品群、8は個別データ統一
化部品群、9と10は入力ファイル、11と12はレコ
ード統一化処理結果ファイル、13は統合レコード格納
ファイル、14と15は非統合レコード格納ファイル、
16はデータ制約条件チェック結果OKファイル、17
はデータ制約条件チェック結果NGファイルである。
部、2はレコード統合処理部、3はデータ項目間制約条
件チェック処理部、4はレコード統一化定義、5はレコ
ード統合定義、6はデータ項目間制約条件チェック定
義、7は標準データ統一化部品群、8は個別データ統一
化部品群、9と10は入力ファイル、11と12はレコ
ード統一化処理結果ファイル、13は統合レコード格納
ファイル、14と15は非統合レコード格納ファイル、
16はデータ制約条件チェック結果OKファイル、17
はデータ制約条件チェック結果NGファイルである。
【0015】レコード統一化定義4は、レコードのデー
タ表現形式の統一方法を記述した定義であり、レコード
統合定義5は、複数のレコードの統合方法を記述した定
義であり、またデータ項目間制約条件チェック定義6
は、統合コード内のデータ項目間制約条件のチェック方
法を記述した定義である。レコード統一化定義4、レコ
ード統合定義5、データ項目間制約条件チェック定義6
は、具体的にはメモリ等に格納されているものである。
タ表現形式の統一方法を記述した定義であり、レコード
統合定義5は、複数のレコードの統合方法を記述した定
義であり、またデータ項目間制約条件チェック定義6
は、統合コード内のデータ項目間制約条件のチェック方
法を記述した定義である。レコード統一化定義4、レコ
ード統合定義5、データ項目間制約条件チェック定義6
は、具体的にはメモリ等に格納されているものである。
【0016】また、標準データ統一化部品群7は、デー
タ項目毎のデータ表現形式を統一化する部品群であり、
個別データ統一化部品群8は、標準データ統一化部品群
7以外にユーザが指定する統一化を可能とする部品群で
ある。なお、標準データ統一化部品群7および個別デー
タ統一化部品群8は、その情報がメモリ等に格納されて
いるものである。
タ項目毎のデータ表現形式を統一化する部品群であり、
個別データ統一化部品群8は、標準データ統一化部品群
7以外にユーザが指定する統一化を可能とする部品群で
ある。なお、標準データ統一化部品群7および個別デー
タ統一化部品群8は、その情報がメモリ等に格納されて
いるものである。
【0017】レコード統一化処理部1は、レコード統一
化定義4に従い、標準データ統一化部品群7および個別
データ統一化部品群8を用いて、入力ファイル9中のレ
コードのデータ項目に対する統一表現形式のデータ項目
を付加し、レコード統一化処理結果ファイル11に格納
する。次に、レコード統一化処理部1は、上記と同様
に、入力ファイル10中の各レコードのデータ項目に対
する統一表現形式のデータ項目を付加し、レコード統一
化処理結果ファイル12に格納する。
化定義4に従い、標準データ統一化部品群7および個別
データ統一化部品群8を用いて、入力ファイル9中のレ
コードのデータ項目に対する統一表現形式のデータ項目
を付加し、レコード統一化処理結果ファイル11に格納
する。次に、レコード統一化処理部1は、上記と同様
に、入力ファイル10中の各レコードのデータ項目に対
する統一表現形式のデータ項目を付加し、レコード統一
化処理結果ファイル12に格納する。
【0018】レコード統合処理部2は、突合対象のデー
タ項目を指定したレコード統合定義5に従い、レコード
統一化処理部1の処理結果であるレコード統一化処理結
果ファイル11とレコード統一化処理結果ファイル12
中のレコードを突合し、同一のデータ項目値を持つレコ
ードを統合レコードとして、統合レコード格納ファイル
13に格納する。同一のデータ項目値を持たないレコー
ド統一化処理結果ファイル11中とレコード統一化処理
結果ファイル12中のレコードは、それぞれ非統合レコ
ード格納ファイル14と非統合レコード格納ファイル1
5に格納する。
タ項目を指定したレコード統合定義5に従い、レコード
統一化処理部1の処理結果であるレコード統一化処理結
果ファイル11とレコード統一化処理結果ファイル12
中のレコードを突合し、同一のデータ項目値を持つレコ
ードを統合レコードとして、統合レコード格納ファイル
13に格納する。同一のデータ項目値を持たないレコー
ド統一化処理結果ファイル11中とレコード統一化処理
結果ファイル12中のレコードは、それぞれ非統合レコ
ード格納ファイル14と非統合レコード格納ファイル1
5に格納する。
【0019】データ項目間制約条件チェック処理部3
は、統合レコード格納ファイル13中の統合レコードの
データ項目値がデータ項目間制約条件チェック定義6を
満足するかどうかをチェックし、その結果(同一、相違
を識別する値)をデータ項目として追加し、そのデータ
項目値に従い、データ制約条件チェック結果OKファイ
ル16もしくはデータ制約条件チェック結果NGファイ
ル17のいずれかに格納する。
は、統合レコード格納ファイル13中の統合レコードの
データ項目値がデータ項目間制約条件チェック定義6を
満足するかどうかをチェックし、その結果(同一、相違
を識別する値)をデータ項目として追加し、そのデータ
項目値に従い、データ制約条件チェック結果OKファイ
ル16もしくはデータ制約条件チェック結果NGファイ
ル17のいずれかに格納する。
【0020】次に、各部の詳細について図2〜図4に示
す説明図および図5に示す全体の動作を示すフローチャ
ートを参照して説明する。
す説明図および図5に示す全体の動作を示すフローチャ
ートを参照して説明する。
【0021】まず、レコード統一化処理部1の詳細につ
いて図2の説明図を参照して説明する。
いて図2の説明図を参照して説明する。
【0022】図2において、1はレコード統一化処理
部、4はレコード統一化定義、7は標準データ統一化部
品群、8は個別データ統一化部品群、9と10は入力フ
ァイル、11と12はレコード統一化処理結果ファイ
ル、18と19は入力レコード、20と21は統一化レ
コードである。
部、4はレコード統一化定義、7は標準データ統一化部
品群、8は個別データ統一化部品群、9と10は入力フ
ァイル、11と12はレコード統一化処理結果ファイ
ル、18と19は入力レコード、20と21は統一化レ
コードである。
【0023】入力ファイル9と入力ファイル10中に
は、それぞれ1つ以上の入力レコード18と入力レコー
ド19が格納されている。入力レコード18は、複数の
データ項目A1〜Anで構成される。入力レコード19
は、複数のデータ項目B1〜Bmで構成される。
は、それぞれ1つ以上の入力レコード18と入力レコー
ド19が格納されている。入力レコード18は、複数の
データ項目A1〜Anで構成される。入力レコード19
は、複数のデータ項目B1〜Bmで構成される。
【0024】レコード統一化処理部1は、入力ファイル
9から入力レコード18を読み込み(図5のステップS
11)、入力レコード18のデータ項目A1〜Anに対
して使用する標準データ統一化部品群7および個別デー
タ統一化部品群8を指定したレコード統一化定義4に従
い、入力レコード18のデータ項目A1〜Anに対応す
る統一表現形式のデータ項目NA1〜NAnを付加す
る。例えば、A1が電話番号を格納するデータ項目であ
る場合、電話番号の様々な表現形式(“012−345
−6789”,“012(345)6789”,“(0
12)345−6789”など)を統一表現形式(“0
123456789”)に変換し、データ項目NA1と
して付加する。また、A2が顧客名を格納するデータ項
目である場合、顧客名の様々な表現形式を統一し(例え
ば、“(株)…”,“株)…”,“(株) …”,“…株
式会社”,“…(株)”,“…(株”などを“株式会社
…”に統一)、データ項目NA2として付加し、レコー
ド統一化処理結果ファイル11に格納する。これを入力
ファイル9のすべての入力レコード18に対して行う
(ステップS13)。
9から入力レコード18を読み込み(図5のステップS
11)、入力レコード18のデータ項目A1〜Anに対
して使用する標準データ統一化部品群7および個別デー
タ統一化部品群8を指定したレコード統一化定義4に従
い、入力レコード18のデータ項目A1〜Anに対応す
る統一表現形式のデータ項目NA1〜NAnを付加す
る。例えば、A1が電話番号を格納するデータ項目であ
る場合、電話番号の様々な表現形式(“012−345
−6789”,“012(345)6789”,“(0
12)345−6789”など)を統一表現形式(“0
123456789”)に変換し、データ項目NA1と
して付加する。また、A2が顧客名を格納するデータ項
目である場合、顧客名の様々な表現形式を統一し(例え
ば、“(株)…”,“株)…”,“(株) …”,“…株
式会社”,“…(株)”,“…(株”などを“株式会社
…”に統一)、データ項目NA2として付加し、レコー
ド統一化処理結果ファイル11に格納する。これを入力
ファイル9のすべての入力レコード18に対して行う
(ステップS13)。
【0025】次に、レコード統一化処理部1は、入力フ
ァイル10中のすべての入力レコード19に対して、上
記と同様の処理を行い、レコード統一化処理結果ファイ
ル12を作成する(ステップS13)。
ァイル10中のすべての入力レコード19に対して、上
記と同様の処理を行い、レコード統一化処理結果ファイ
ル12を作成する(ステップS13)。
【0026】次に、レコード統合処理部2の詳細につい
て図3を参照して説明する。
て図3を参照して説明する。
【0027】図3において、2はレコード統合処理部、
5はレコード統合定義、11と12はレコード統一化処
理結果ファイル、13は統合レコード格納ファイル、1
4と15は非統合レコード格納ファイル、20と21は
統一化レコード、22は統合レコード、23と24は非
統合レコードである。
5はレコード統合定義、11と12はレコード統一化処
理結果ファイル、13は統合レコード格納ファイル、1
4と15は非統合レコード格納ファイル、20と21は
統一化レコード、22は統合レコード、23と24は非
統合レコードである。
【0028】レコード統一化処理結果ファイル11とレ
コード統一化処理結果ファイル12中には、それぞれ1
つ以上の統一化レコード20と統一化レコード21が格
納されている。統一化レコード20は、データ項目A1
〜An,NA1〜NAnで構成される。統一化レコード
21はデータ項目B1〜Bm,NB1〜NBmで構成さ
れる。
コード統一化処理結果ファイル12中には、それぞれ1
つ以上の統一化レコード20と統一化レコード21が格
納されている。統一化レコード20は、データ項目A1
〜An,NA1〜NAnで構成される。統一化レコード
21はデータ項目B1〜Bm,NB1〜NBmで構成さ
れる。
【0029】レコード統合処理部2は、複数レコードの
統合方法を記述したレコード統合定義5(例えば、統一
表現形式の電話番号で統合する場合の定義:「統一化レ
コード20のデータ項目NA1と統一化レコード21の
データ項目NB1の値が同一のレコードを統合する」)
に従い、データ項目NA1とデータ項目NB1の値が一
致する統一化レコード20と21から、データ項目A1
〜An,NA1〜NAn,B1〜Bm,NB1〜NBm
から構成される統合レコード22を作成し、統合レコー
ド格納ファイル13に格納する(ステップS15)。デ
ータ項目NA1の値と一致するデータ項目NB1を持つ
統一化レコード21が存在しない統一化レコード20
は、非統合レコード23として非統合レコード格納ファ
イル14に格納する。データ項目NB1の値と一致する
データ項目NA1を持つ統一化レコード20が存在しな
い統一化レコード21は、非統合レコード24として非
統合レコード格納ファイル15に格納する(ステップS
17)。
統合方法を記述したレコード統合定義5(例えば、統一
表現形式の電話番号で統合する場合の定義:「統一化レ
コード20のデータ項目NA1と統一化レコード21の
データ項目NB1の値が同一のレコードを統合する」)
に従い、データ項目NA1とデータ項目NB1の値が一
致する統一化レコード20と21から、データ項目A1
〜An,NA1〜NAn,B1〜Bm,NB1〜NBm
から構成される統合レコード22を作成し、統合レコー
ド格納ファイル13に格納する(ステップS15)。デ
ータ項目NA1の値と一致するデータ項目NB1を持つ
統一化レコード21が存在しない統一化レコード20
は、非統合レコード23として非統合レコード格納ファ
イル14に格納する。データ項目NB1の値と一致する
データ項目NA1を持つ統一化レコード20が存在しな
い統一化レコード21は、非統合レコード24として非
統合レコード格納ファイル15に格納する(ステップS
17)。
【0030】次に、データ項目間制約条件チェック処理
部3の詳細について図4を参照して説明する。
部3の詳細について図4を参照して説明する。
【0031】図4において、3はデータ項目間制約条件
チェック処理部、6はデータ項目間制約条件チェック定
義、13は統合レコード格納ファイル、16はデータ制
約条件チェック結果OKファイル、17はデータ制約条
件チェック結果NGファイル、22は統合レコード、2
5はデータ項目間制約条件チェック結果レコードであ
る。
チェック処理部、6はデータ項目間制約条件チェック定
義、13は統合レコード格納ファイル、16はデータ制
約条件チェック結果OKファイル、17はデータ制約条
件チェック結果NGファイル、22は統合レコード、2
5はデータ項目間制約条件チェック結果レコードであ
る。
【0032】統合レコード格納ファイル13中には、1
つ以上の統合レコード22が格納されている。統合レコ
ード22は、データ項目A1〜An,NA1〜NAn,
B1〜Bm,NB1〜NBmから構成される。
つ以上の統合レコード22が格納されている。統合レコ
ード22は、データ項目A1〜An,NA1〜NAn,
B1〜Bm,NB1〜NBmから構成される。
【0033】データ項目間制約条件チェック処理部3
は、データ項目間制約条件チェック定義6(例えば、顧
客名が同一であるかをチェックする場合の定義:「デー
タ項目NA2とNB2が同一であること」)に従い、統
合レコード22のデータ項目間の制約条件をチェック
し、チェック結果(例えば、同一は“0”、相違は
“9”の値)を示すデータ項目NCを付加したデータ項
目間制約条件チェック結果レコード25を作成し、デー
タ項目NCの値が同一を示す値(“0”)である場合は
データ制約条件チェック結果OKファイル16へ格納
し、データ項目NCの値が相違を示す値(“9”)であ
る場合はデータ制約条件チェック結果NGファイル17
へ格納する(ステップS19)。
は、データ項目間制約条件チェック定義6(例えば、顧
客名が同一であるかをチェックする場合の定義:「デー
タ項目NA2とNB2が同一であること」)に従い、統
合レコード22のデータ項目間の制約条件をチェック
し、チェック結果(例えば、同一は“0”、相違は
“9”の値)を示すデータ項目NCを付加したデータ項
目間制約条件チェック結果レコード25を作成し、デー
タ項目NCの値が同一を示す値(“0”)である場合は
データ制約条件チェック結果OKファイル16へ格納
し、データ項目NCの値が相違を示す値(“9”)であ
る場合はデータ制約条件チェック結果NGファイル17
へ格納する(ステップS19)。
【0034】
【発明の効果】以上説明したように、本発明によれば、
レコード統一化定義に従いレコードの各データ項目に対
して統一表現形式のデータ項目を作成して統一化レコー
ドを作成し、レコード統合定義に従い統一化レコード群
に対して同一データ項目値を有する統一化レコードを統
合して統合レコードを作成し、データ項目間制約条件チ
ェック定義に従い統合レコード内のデータ項目間制約条
件をチェックし、その結果を表示するデータ項目を付加
したデータ項目間制約条件チェック結果レコードを作成
し、該レコードをチェック結果を表示するデータ項目値
に従い別ファイルに出力するので、従来のように入力フ
ァイル毎にデータクリーニング処理用アプリケーション
プログラムを個別に作成する必要もないとともに、人手
による全データの目視確認作業も必要なく、効率化を図
ることができる。
レコード統一化定義に従いレコードの各データ項目に対
して統一表現形式のデータ項目を作成して統一化レコー
ドを作成し、レコード統合定義に従い統一化レコード群
に対して同一データ項目値を有する統一化レコードを統
合して統合レコードを作成し、データ項目間制約条件チ
ェック定義に従い統合レコード内のデータ項目間制約条
件をチェックし、その結果を表示するデータ項目を付加
したデータ項目間制約条件チェック結果レコードを作成
し、該レコードをチェック結果を表示するデータ項目値
に従い別ファイルに出力するので、従来のように入力フ
ァイル毎にデータクリーニング処理用アプリケーション
プログラムを個別に作成する必要もないとともに、人手
による全データの目視確認作業も必要なく、効率化を図
ることができる。
【0035】特に、本発明では、ユーザがレコード統一
化定義、レコード統合定義およびデータ項目間制約条件
チェック定義の3つの定義を行うだけでデータクリーニ
ング処理を実現できる。また、データクリーニング処理
をレコード統一化処理、レコード統合処理、データ項目
間制約条件チェック処理に分割することにより、データ
クリーニング処理内容に変更が発生した場合、処理内容
の修正箇所が限定され修正が容易であるとともに、各処
理の再利用が容易であり、不整合レコードの除去が段階
的に可能であって、不整合原因を早期に特定することが
できる。
化定義、レコード統合定義およびデータ項目間制約条件
チェック定義の3つの定義を行うだけでデータクリーニ
ング処理を実現できる。また、データクリーニング処理
をレコード統一化処理、レコード統合処理、データ項目
間制約条件チェック処理に分割することにより、データ
クリーニング処理内容に変更が発生した場合、処理内容
の修正箇所が限定され修正が容易であるとともに、各処
理の再利用が容易であり、不整合レコードの除去が段階
的に可能であって、不整合原因を早期に特定することが
できる。
【図1】本発明の一実施形態に係るデータクリーニング
処理装置の構成を示すブロック図である。
処理装置の構成を示すブロック図である。
【図2】図1に示すデータクリーニング処理装置に使用
されているレコード統一化処理部の詳細な作用を示す説
明図である。
されているレコード統一化処理部の詳細な作用を示す説
明図である。
【図3】図1に示すデータクリーニング処理装置に使用
されているレコード統合処理部の詳細な作用を示す説明
図である。
されているレコード統合処理部の詳細な作用を示す説明
図である。
【図4】図1に示すデータクリーニング処理装置に使用
されているデータ項目間制約条件チェック処理部の詳細
な作用を示す説明図である。
されているデータ項目間制約条件チェック処理部の詳細
な作用を示す説明図である。
【図5】図1に示すデータクリーニング処理装置の全体
的処理を示すフローチャートである。
的処理を示すフローチャートである。
1 レコード統一化処理部 2 レコード統合処理部 3 データ項目間制約条件チェック処理部 4 レコード統一化定義 5 レコード統合定義 6 データ項目間制約条件チェック定義 7 標準データ統一化部品群 8 個別データ統一化部品群
───────────────────────────────────────────────────── フロントページの続き (72)発明者 池田 哲夫 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内
Claims (3)
- 【請求項1】 データ値の表現形式が均一でないデータ
が格納された入力ファイルから、複数のレコードを突合
し、不整合データを除去して統合レコードを作成するデ
ータクリーニング処理方法であって、 レコードのデータ表現形式の統一方法を記述するレコー
ド統一化定義、複数のレコードの統合方法を記述するレ
コード統合定義、およびレコード内のデータ項目間制約
条件のチェック方法を記述するデータ項目間制約条件チ
ェック定義を設け、 データ項目毎のデータ表現形式を統一化する標準データ
統一化部品群、および該標準データ統一化部品群以外に
ユーザが指定する統一化を可能とする個別データ統一化
部品群を定義しておき、 前記レコード統一化定義に従い、入力ファイルに格納さ
れた1つ以上のレコードの各データ項目に対して前記標
準データ統一部品群および個別データ統一化部品群を使
用し、統一表現形式のデータ項目を作成し、各レコード
中に付加して統一化レコードを作成するレコード統一化
処理を行い、 前記レコード統合定義に従い、レコード統一化処理結果
である統一化レコード群に対して、同一データ項目値を
有する統一化レコードを統合した統合レコードおよび同
一データ項目値を持たない統一化レコードである非統合
レコードをそれぞれ別ファイルに出力するレコード統合
処理を行い、 前記データ項目間制約条件チェック定義に従い、レコー
ド統合処理結果である統合レコード内のデータ項目間制
約条件をチェックし、その結果を表示するデータ項目を
付加したデータ項目間制約条件チェック結果レコードを
作成し、チェック結果を表示するデータ項目値に従い、
データ項目間制約条件チェック結果レコードを別ファイ
ルに出力するデータ項目間制約条件チェック処理を行う
ことを特徴とするデータクリーニング処理方法。 - 【請求項2】 データ値の表現形式が均一でないデータ
が格納された入力ファイルから、複数のレコードを突合
し、不整合データを除去して統合レコードを作成するデ
ータクリーニング処理装置であって、 レコードのデータ表現形式の統一方法を記述するレコー
ド統一化定義、複数のレコードの統合方法を記述するレ
コード統合定義、およびレコード内のデータ項目間制約
条件のチェック方法を記述するデータ項目間制約条件チ
ェック定義を格納する定義格納手段と、 データ項目毎のデータ表現形式を統一化する標準データ
統一化部品群、および該標準データ統一化部品群以外に
ユーザが指定する統一化を可能とする個別データ統一化
部品群を定義して格納する部品群格納手段と、 前記レコード統一化定義に従い、入力ファイルに格納さ
れた1つ以上のレコードの各データ項目に対して前記標
準データ統一部品群および個別データ統一化部品群を使
用し、統一表現形式のデータ項目を作成し、各レコード
中に付加して統一化レコードを作成するレコード統一化
処理手段と、 前記レコード統合定義に従い、レコード統一化処理結果
である統一化レコード群に対して、同一データ項目値を
有する統一化レコードを統合した統合レコードおよび同
一データ項目値を持たない統一化レコードである非統合
レコードをそれぞれ別ファイルに出力するレコード統合
処理手段と、 前記データ項目間制約条件チェック定義に従い、レコー
ド統合処理結果である統合レコード内のデータ項目間制
約条件をチェックし、その結果を表示するデータ項目を
付加したデータ項目間制約条件チェック結果レコードを
作成し、チェック結果を表示するデータ項目値に従い、
データ項目間制約条件チェック結果レコードを別ファイ
ルに出力するデータ項目間制約条件チェック処理手段と
を有することを特徴とするデータクリーニング処理装
置。 - 【請求項3】 データ値の表現形式が均一でないデータ
が格納された入力ファイルから、複数のレコードを突合
し、不整合データを除去して統合レコードを作成するデ
ータクリーニング処理プログラムを記録した記録媒体で
あって、 レコードのデータ表現形式の統一方法を記述するレコー
ド統一化定義、複数のレコードの統合方法を記述するレ
コード統合定義、およびレコード内のデータ項目間制約
条件のチェック方法を記述するデータ項目間制約条件チ
ェック定義を設け、 データ項目毎のデータ表現形式を統一化する標準データ
統一化部品群、および該標準データ統一化部品群以外に
ユーザが指定する統一化を可能とする個別データ統一化
部品群を定義しておき、 前記レコード統一化定義に従い、入力ファイルに格納さ
れた1つ以上のレコードの各データ項目に対して前記標
準データ統一部品群および個別データ統一化部品群を使
用し、統一表現形式のデータ項目を作成し、各レコード
中に付加して統一化レコードを作成するレコード統一化
処理を行い、 前記レコード統合定義に従い、レコード統一化処理結果
である統一化レコード群に対して、同一データ項目値を
有する統一化レコードを統合した統合レコードおよび同
一データ項目値を持たない統一化レコードである非統合
レコードをそれぞれ別ファイルに出力するレコード統合
処理を行い、 前記データ項目間制約条件チェック定義に従い、レコー
ド統合処理結果である統合レコード内のデータ項目間制
約条件をチェックし、その結果を表示するデータ項目を
付加したデータ項目間制約条件チェック結果レコードを
作成し、チェック結果を表示するデータ項目値に従い、
データ項目間制約条件チェック結果レコードを別ファイ
ルに出力するデータ項目間制約条件チェック処理を行う
ことを特徴とするデータクリーニング処理プログラムを
記録した記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10037750A JPH11238006A (ja) | 1998-02-19 | 1998-02-19 | データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10037750A JPH11238006A (ja) | 1998-02-19 | 1998-02-19 | データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11238006A true JPH11238006A (ja) | 1999-08-31 |
Family
ID=12506162
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10037750A Pending JPH11238006A (ja) | 1998-02-19 | 1998-02-19 | データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11238006A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002215646A (ja) * | 2001-01-22 | 2002-08-02 | Nec Corp | 欠損データ補完方法及び欠損データ補完システム |
| JP2003067234A (ja) * | 2001-08-29 | 2003-03-07 | Landscape:Kk | データベース管理システム |
| JP2009533739A (ja) * | 2006-04-11 | 2009-09-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構成可能アイテムの構成データを提供するシステム、方法、媒体、及びコンピュータ・プログラム(構成管理システムにおける重み付け決定) |
| CN106709035A (zh) * | 2016-12-29 | 2017-05-24 | 贵州电网有限责任公司电力科学研究院 | 一种电力多维全景数据的预处理系统 |
-
1998
- 1998-02-19 JP JP10037750A patent/JPH11238006A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002215646A (ja) * | 2001-01-22 | 2002-08-02 | Nec Corp | 欠損データ補完方法及び欠損データ補完システム |
| JP2003067234A (ja) * | 2001-08-29 | 2003-03-07 | Landscape:Kk | データベース管理システム |
| JP2009533739A (ja) * | 2006-04-11 | 2009-09-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構成可能アイテムの構成データを提供するシステム、方法、媒体、及びコンピュータ・プログラム(構成管理システムにおける重み付け決定) |
| JP4886845B2 (ja) * | 2006-04-11 | 2012-02-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構成可能アイテムの構成データを提供するシステム、方法、媒体、及びコンピュータ・プログラム(構成管理システムにおける重み付け決定) |
| CN106709035A (zh) * | 2016-12-29 | 2017-05-24 | 贵州电网有限责任公司电力科学研究院 | 一种电力多维全景数据的预处理系统 |
| CN106709035B (zh) * | 2016-12-29 | 2019-11-26 | 贵州电网有限责任公司电力科学研究院 | 一种电力多维全景数据的预处理系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7092956B2 (en) | Deduplication system | |
| KR101153069B1 (ko) | 데이터 테이블 조작에 관한 스프레드시트 함수의 설계 | |
| US8886617B2 (en) | Query-based searching using a virtual table | |
| US8321469B2 (en) | Systems and methods of profiling data for integration | |
| US20050216378A1 (en) | Method and apparatus for mapping dimension-based accounting entries to allow segment-based reporting | |
| CN110704635B (zh) | 一种知识图谱中三元组数据的转换方法及装置 | |
| KR20160117965A (ko) | NoSQL 모델 생성 방법 및 그 장치 | |
| CN118170785A (zh) | 一种数据血源关系分析系统及方法 | |
| JPH11238006A (ja) | データクリーニング処理方法および装置とデータクリーニング処理プログラムを記録した記録媒体 | |
| US7225412B2 (en) | Visualization toolkit for data cleansing applications | |
| JP2019159837A (ja) | データベース結合装置、データベース結合方法及びデータベース結合プログラム | |
| JP2009169474A (ja) | システムログ管理支援装置およびシステムログ管理支援方法 | |
| JP2001256043A (ja) | プログラムソースの修正履歴管理方法および修正履歴管理システム | |
| CN115756486A (zh) | 一种数据接口解析方法及装置 | |
| CN113626385A (zh) | 一种基于文本数据读取的方法和系统 | |
| CN114265839A (zh) | 一种纯文本接口文件入关系型数据库通用处理方法及装置 | |
| JPH02278335A (ja) | ソフトウェア標準化方法 | |
| JPH09153091A (ja) | 報告用ファイル生成システム | |
| JPH01280831A (ja) | プログラム内データ名称標準化支援方法 | |
| JP2003345865A (ja) | 業務の分析方法およびその装置、プログラム、記憶媒体 | |
| JP2024121524A (ja) | マイクロサービス設計支援システム、マイクロサービス設計支援方法及びプログラム | |
| JPH11272433A (ja) | 項目名付きファイルダンプ出力方法 | |
| CN115827096A (zh) | 软件产品的可视化方法、装置、设备和介质 | |
| JP3482651B2 (ja) | データ処理装置 | |
| JP2003030575A (ja) | データ集計・帳票編集システム、データ集計・帳票編集方法、および、データ集計・帳票編集プログラム |