JPH06332766A - データベースの結合方法 - Google Patents
データベースの結合方法Info
- Publication number
- JPH06332766A JPH06332766A JP5117251A JP11725193A JPH06332766A JP H06332766 A JPH06332766 A JP H06332766A JP 5117251 A JP5117251 A JP 5117251A JP 11725193 A JP11725193 A JP 11725193A JP H06332766 A JPH06332766 A JP H06332766A
- Authority
- JP
- Japan
- Prior art keywords
- database
- common field
- record
- score
- field information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 本発明の目的は、相互参照を可能とする結合
データベースを正確に、人為的に作業を交えず、自動的
に作成することができるデータベースの高速結合方法を
提供することである。 【構成】 本発明は、異なるデータベースのレコードに
ついて、共通のフィールドごとに比較し、一致の成否に
より、解析処理の処理内容及び、共通のフィールド情報
の信頼性の度合いから予め作成された採点表による得点
をそれぞれのレコードに付与し、得点により異なるデー
タベースを関連付け、結合する個々のレコードを決定す
る。
データベースを正確に、人為的に作業を交えず、自動的
に作成することができるデータベースの高速結合方法を
提供することである。 【構成】 本発明は、異なるデータベースのレコードに
ついて、共通のフィールドごとに比較し、一致の成否に
より、解析処理の処理内容及び、共通のフィールド情報
の信頼性の度合いから予め作成された採点表による得点
をそれぞれのレコードに付与し、得点により異なるデー
タベースを関連付け、結合する個々のレコードを決定す
る。
Description
【0001】
【産業上の利用分野】本発明は、データベースの結合方
法に係り、特に、任意の異なる独立したデータベースに
おて、情報に信頼性の違いがある、或いは、表現形式の
相違を持つ個々のレコードを互いに関連付け、相互参照
を可能とする結合データベースを正確に、且つ自動的に
作成するデータベースの結合方法に関する。
法に係り、特に、任意の異なる独立したデータベースに
おて、情報に信頼性の違いがある、或いは、表現形式の
相違を持つ個々のレコードを互いに関連付け、相互参照
を可能とする結合データベースを正確に、且つ自動的に
作成するデータベースの結合方法に関する。
【0002】
【従来の技術】従来、任意の異なる独立したデータベー
スにおいて、個々のレコードを関連付け、結合したいと
いう要求があった場合に、任意の異なる独立したデータ
ベースが統一的に規則に基づいて作成されている場合
は、データベースの共通のフィールドに対してDBMS
(データベース管理システム)に用意されているJOI
N(結合)操作などで容易に結合することができる。
スにおいて、個々のレコードを関連付け、結合したいと
いう要求があった場合に、任意の異なる独立したデータ
ベースが統一的に規則に基づいて作成されている場合
は、データベースの共通のフィールドに対してDBMS
(データベース管理システム)に用意されているJOI
N(結合)操作などで容易に結合することができる。
【0003】データベースの結合方法であるJOIN操
作には、結合する項目でデータベースへの両テーブルを
ソートして(又はインデックスを利用して)、両テーブ
ル7の同一キーのものを取り出す方法と、データベース
のテーブル間で一方のテーブルを基準にして他方のデー
タベースのテーブルを総当たりし、条件を満足するもの
を取り出す方法がある。
作には、結合する項目でデータベースへの両テーブルを
ソートして(又はインデックスを利用して)、両テーブ
ル7の同一キーのものを取り出す方法と、データベース
のテーブル間で一方のテーブルを基準にして他方のデー
タベースのテーブルを総当たりし、条件を満足するもの
を取り出す方法がある。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来のJOIN操作でデータベースを結合する方法は、任
意の異なる独立したデータベースが、それぞれの規則に
基づいて作成されている場合には、情報の表現形式に統
一性がなく、任意の異なる独立したデータベースのある
情報、例えば、「事務所」と「オフィス」が共通のフィ
ールドで、同一の事項を指していたとしても、その表現
にこのようなゆらぎが生じていることが多々あること、
また、データベースの共通のフィールド情報、例えば、
住所の都道府県情報と住所の街区情報などに信頼性の差
異が存在すること等があるため、単純な共通のフィール
ド情報の一致をみる比較では、結合される件数は少な
く、着目するフィールドによっては、非常に信頼性が低
くなっている。そのため、正確な結合データベースを作
成するためには、 (1) 片方のデータベースを基準にして、他のデータベー
スの内容を盛り込んで、新しい結合データベースを人為
的に最初から作成し直す; (2) 片方のデータベースを基準にして、個々のレコード
に対して結合する相手となるレコードを、他のデータベ
ースの内容から人為的に発見する;等の方法があるが、
これらの方法を採った場合には、いずれも莫大な人為的
稼働、作業時間、そして、作業コストを投じなければ結
合を実現できない等の欠点がある。
来のJOIN操作でデータベースを結合する方法は、任
意の異なる独立したデータベースが、それぞれの規則に
基づいて作成されている場合には、情報の表現形式に統
一性がなく、任意の異なる独立したデータベースのある
情報、例えば、「事務所」と「オフィス」が共通のフィ
ールドで、同一の事項を指していたとしても、その表現
にこのようなゆらぎが生じていることが多々あること、
また、データベースの共通のフィールド情報、例えば、
住所の都道府県情報と住所の街区情報などに信頼性の差
異が存在すること等があるため、単純な共通のフィール
ド情報の一致をみる比較では、結合される件数は少な
く、着目するフィールドによっては、非常に信頼性が低
くなっている。そのため、正確な結合データベースを作
成するためには、 (1) 片方のデータベースを基準にして、他のデータベー
スの内容を盛り込んで、新しい結合データベースを人為
的に最初から作成し直す; (2) 片方のデータベースを基準にして、個々のレコード
に対して結合する相手となるレコードを、他のデータベ
ースの内容から人為的に発見する;等の方法があるが、
これらの方法を採った場合には、いずれも莫大な人為的
稼働、作業時間、そして、作業コストを投じなければ結
合を実現できない等の欠点がある。
【0005】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、任意の異なる独立した
データベースに対して、情報に信頼性の違いあるいは、
表現形式の相違を持つ個々のレコードを互いに関連付
け、相互参照を可能とする結合データベースを正確に、
人為的な作業を交えず、自動的に作成することができる
データベースの結合方法を提供することを目的とする。
で、上記従来の問題点を解決し、任意の異なる独立した
データベースに対して、情報に信頼性の違いあるいは、
表現形式の相違を持つ個々のレコードを互いに関連付
け、相互参照を可能とする結合データベースを正確に、
人為的な作業を交えず、自動的に作成することができる
データベースの結合方法を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は、共通のフィー
ルドを持ち、共通のフィールド情報の信頼性或いはその
表現形式が異なるデータベースのレコードを、共通のフ
ィールド情報を利用することにより、個々に関連付ける
データベース結合方法において、表現形式の異なる該共
通のフィールド情報に対しては、表現形式を統一する解
析処理を行い、解析処理後の共通のフィールド情報を作
成し、異なるデータベースのレコードについて、共通の
フィールドごとに比較し、一致の成否により、解析処理
の処理内容及び、共通のフィールド情報の信頼性の度合
いから予め得点を設定し、得点を信頼性の度合によりそ
れぞれのレコードに付与し、得点に基づいて異なるデー
タベースを関連付け、結合する個々のレコードを決定す
る。
ルドを持ち、共通のフィールド情報の信頼性或いはその
表現形式が異なるデータベースのレコードを、共通のフ
ィールド情報を利用することにより、個々に関連付ける
データベース結合方法において、表現形式の異なる該共
通のフィールド情報に対しては、表現形式を統一する解
析処理を行い、解析処理後の共通のフィールド情報を作
成し、異なるデータベースのレコードについて、共通の
フィールドごとに比較し、一致の成否により、解析処理
の処理内容及び、共通のフィールド情報の信頼性の度合
いから予め得点を設定し、得点を信頼性の度合によりそ
れぞれのレコードに付与し、得点に基づいて異なるデー
タベースを関連付け、結合する個々のレコードを決定す
る。
【0007】
【作用】本発明は、共通のフィールドを持つ任意の異な
るデータベース間において、共通のフィールド情報の信
頼性が低い、或いはその表現形式が異なっていたとして
も、表現形式の異なる共通のフィールド情報に対して
は、表現形式を統一させる種々の解析アルゴリズムによ
る処理を行い、解析処理後の共通のフィールド情報を作
成し、次に、共通のフィールド毎に比較し、フィールド
のデータの一致の成否により、解析処理の処理内容及
び、共通のフィールド情報の信頼性の度合いから作成さ
れた採点表による得点をそれぞれのレコードに付与し、
得点によって、異なるデータベースの個々のレコードを
関連づけ、相互参照を可能とする結合データベースを正
確に人為的な作業を交えず、自動的に作成することがで
きる。
るデータベース間において、共通のフィールド情報の信
頼性が低い、或いはその表現形式が異なっていたとして
も、表現形式の異なる共通のフィールド情報に対して
は、表現形式を統一させる種々の解析アルゴリズムによ
る処理を行い、解析処理後の共通のフィールド情報を作
成し、次に、共通のフィールド毎に比較し、フィールド
のデータの一致の成否により、解析処理の処理内容及
び、共通のフィールド情報の信頼性の度合いから作成さ
れた採点表による得点をそれぞれのレコードに付与し、
得点によって、異なるデータベースの個々のレコードを
関連づけ、相互参照を可能とする結合データベースを正
確に人為的な作業を交えず、自動的に作成することがで
きる。
【0008】
【実施例】以下、図面とともに本発明のデータベースの
結合方法の実施例を説明する。
結合方法の実施例を説明する。
【0009】図1は、本発明の一実施例のデータベース
結合方法のブロック図を示す。
結合方法のブロック図を示す。
【0010】同図に示すシステムは、電話帳データベー
ス(DB1),或いは地図データベース(DB2)など
の複数の結合対象データベース1、結合処理が行われた
結果を表す結合データベース(DB3)2、結合対象デ
ータベース1より該当レコードを取り出す或いは結合デ
ータベース2を更新するデータベース制御部3、データ
ベース制御部3に対し、レコードの要求あるいは、格納
を指示し、該当レコードを記憶しておく一時記録部4、
一時記録部4に記録されている文字列に対し、変換処理
を加える一般文字列処理部5、一時記録部4に記録され
ているレコード群の比較をフィールド毎に行い、比較結
果に基づいて点数処理を行い、一時記録部4に書き戻す
処理および、一時記録部4に集計された点数に基づい
て、結合相手レコードを決定する比較照合部6、比較照
合部6からの問い合わせに対し、照合結果に対応する点
数を発行する採点表7より構成される。
ス(DB1),或いは地図データベース(DB2)など
の複数の結合対象データベース1、結合処理が行われた
結果を表す結合データベース(DB3)2、結合対象デ
ータベース1より該当レコードを取り出す或いは結合デ
ータベース2を更新するデータベース制御部3、データ
ベース制御部3に対し、レコードの要求あるいは、格納
を指示し、該当レコードを記憶しておく一時記録部4、
一時記録部4に記録されている文字列に対し、変換処理
を加える一般文字列処理部5、一時記録部4に記録され
ているレコード群の比較をフィールド毎に行い、比較結
果に基づいて点数処理を行い、一時記録部4に書き戻す
処理および、一時記録部4に集計された点数に基づい
て、結合相手レコードを決定する比較照合部6、比較照
合部6からの問い合わせに対し、照合結果に対応する点
数を発行する採点表7より構成される。
【0011】図2は本発明の一実施例の動作を示すフロ
ーチャートである。
ーチャートである。
【0012】以下の説明において、同図のフローチャー
トに示す処理において、DB1は電話帳データベースで
あり、DB2は地図データベースである。
トに示す処理において、DB1は電話帳データベースで
あり、DB2は地図データベースである。
【0013】図3は本発明の一実施例の電話帳データベ
ース(DB1)を示し、図4は本発明の一実施例の地図
データベース(DB2)を示す。図5は本発明の一実施
例の結合データベースの例を示す。
ース(DB1)を示し、図4は本発明の一実施例の地図
データベース(DB2)を示す。図5は本発明の一実施
例の結合データベースの例を示す。
【0014】図3及び図4のデータベースの各レコード
はフィールド構成をとるものである。本実施例では、D
B1とDB2を結合して、図5に示すような結合データ
ベースDB3を構築するものである。
はフィールド構成をとるものである。本実施例では、D
B1とDB2を結合して、図5に示すような結合データ
ベースDB3を構築するものである。
【0015】ステップ1)結合対象データベース1のう
ち、電話帳データベース(DB1)に未処理のレコード
が存在するか確認し、取り出すDB1のレコードがなく
なれば、ステップ10の終了処理に移行する。一方、D
B1より取り出すレコードが残っていれば、ステップ2
に移行する。
ち、電話帳データベース(DB1)に未処理のレコード
が存在するか確認し、取り出すDB1のレコードがなく
なれば、ステップ10の終了処理に移行する。一方、D
B1より取り出すレコードが残っていれば、ステップ2
に移行する。
【0016】ステップ2)データベース制御部3は、図
3に示すようなフィールド構成の1レコードをDB1か
ら取り出し、清音化、拗音・撥音正規化、法人名称削
除、職業語尾削除、固有情報抽出処理等の文字列変換処
理を行い、変換処理後のデータをデータベース制御部3
から一時記録部4に記録する。
3に示すようなフィールド構成の1レコードをDB1か
ら取り出し、清音化、拗音・撥音正規化、法人名称削
除、職業語尾削除、固有情報抽出処理等の文字列変換処
理を行い、変換処理後のデータをデータベース制御部3
から一時記録部4に記録する。
【0017】ステップ3)結合対象データベース1のう
ちの地図データベース(DB2)に対して、DB1より
取り出した1レコードと比較が済んでいないものが存在
する限り、ステップ4からステップ6の操作を繰り返
し、DB1から取り出された1レコードとDB2の全て
のレコードの比較が済んだ時点で処理をステップ7に移
行する。
ちの地図データベース(DB2)に対して、DB1より
取り出した1レコードと比較が済んでいないものが存在
する限り、ステップ4からステップ6の操作を繰り返
し、DB1から取り出された1レコードとDB2の全て
のレコードの比較が済んだ時点で処理をステップ7に移
行する。
【0018】ステップ4)データベース制御部3によ
り、図4に示すようなDB2のフィールド構成の1レコ
ードを取り出し、ステップ2と同様な文字列変換処理を
加え、変換処理後のデータをデータベース制御部3から
一時記録部4に記録する。
り、図4に示すようなDB2のフィールド構成の1レコ
ードを取り出し、ステップ2と同様な文字列変換処理を
加え、変換処理後のデータをデータベース制御部3から
一時記録部4に記録する。
【0019】ステップ5)比較照合部6において、一時
記録部4に記録されたDB1のレコードとDB2のレコ
ードの住所コード及び、文字列変換処理を加えた名義、
ビル名のフィールドについて比較照合を行い、比較照合
の結果を採点表7に照らし合わせて点数を得る。
記録部4に記録されたDB1のレコードとDB2のレコ
ードの住所コード及び、文字列変換処理を加えた名義、
ビル名のフィールドについて比較照合を行い、比較照合
の結果を採点表7に照らし合わせて点数を得る。
【0020】ステップ6)ステップ5で得られた点数と
レコードと共に一時記録部4に保存し、ステップ3に移
行する。
レコードと共に一時記録部4に保存し、ステップ3に移
行する。
【0021】ステップ7)DB2の全てのレコードの比
較が終了すれば、一時記録部4に記録されたレコードの
点数のうち最も高い点数のレコードを、比較照合部6に
より判断し、結合を示すフラグを付与する。
較が終了すれば、一時記録部4に記録されたレコードの
点数のうち最も高い点数のレコードを、比較照合部6に
より判断し、結合を示すフラグを付与する。
【0022】ステップ8)DB1の1レコード及び、結
合を示すフラグが付与されたDB2のレコードから図5
に示すようなフィールド構成の結合レコードを生成し、
データベース制御部3から結合データベース2(DB
3)に書き出す。
合を示すフラグが付与されたDB2のレコードから図5
に示すようなフィールド構成の結合レコードを生成し、
データベース制御部3から結合データベース2(DB
3)に書き出す。
【0023】ステップ9)一時記録部4の内容を消去
し、ステップ1に移行する。
し、ステップ1に移行する。
【0024】ステップ10)処理を終了する。
【0025】上記のような方法により、結合データベー
ス2を作成することができる。
ス2を作成することができる。
【0026】上記に示したフローチャート処理を具体的
に説明する。
に説明する。
【0027】まず、図4に示すように、DB1の電話帳
データベースのフィールドには、「県コード」、「市区
コード」、「町村コード」及び「丁目」コードよりなる
「住所コード」、「名義」、「ビル名」、「電話番号」
及び「職業コード」がある。また、図4に示すように、
DB2の地図データベースのフィールドには、「県コー
ド」、「市区コード」、「町村コード」及び「丁目」コ
ードよりなる「住所コード」、「名義」、「ビル名」、
「地図座標」及び「建物ID」等がある。
データベースのフィールドには、「県コード」、「市区
コード」、「町村コード」及び「丁目」コードよりなる
「住所コード」、「名義」、「ビル名」、「電話番号」
及び「職業コード」がある。また、図4に示すように、
DB2の地図データベースのフィールドには、「県コー
ド」、「市区コード」、「町村コード」及び「丁目」コ
ードよりなる「住所コード」、「名義」、「ビル名」、
「地図座標」及び「建物ID」等がある。
【0028】DB1及びDB2において、共通のフィー
ルドである住所コードは、県コード、市区コード、町村
コードそして、丁目コードのように住所階層に従った、
階層化されたコードによって成り立っており、住所コー
ドデータにおいて、県コード、市区コードそして、町村
コードは信頼性が高く、丁目コードはそれらに比べて信
頼性が低いなど、そのデータの確からしさにはフィール
ドの特徴によってばらつきがあり、一方、名義あるい
は、ビル名などは、文字列で記述されており、表現上の
ゆらぎが存在する。
ルドである住所コードは、県コード、市区コード、町村
コードそして、丁目コードのように住所階層に従った、
階層化されたコードによって成り立っており、住所コー
ドデータにおいて、県コード、市区コードそして、町村
コードは信頼性が高く、丁目コードはそれらに比べて信
頼性が低いなど、そのデータの確からしさにはフィール
ドの特徴によってばらつきがあり、一方、名義あるい
は、ビル名などは、文字列で記述されており、表現上の
ゆらぎが存在する。
【0029】この文字列の表現上のゆらぎをもつ情報を
統一するために文字変換処理を行う。
統一するために文字変換処理を行う。
【0030】図6は本発明の一実施例の文字変換処理の
例を示す。
例を示す。
【0031】同図は、DB1及びDB2において共通の
フィールドである名義或いはビル名などの表現上のゆら
ぎを持つ文字列で表現された情報に対する変換処理内容
を示している。
フィールドである名義或いはビル名などの表現上のゆら
ぎを持つ文字列で表現された情報に対する変換処理内容
を示している。
【0032】まず、清音化処理は、濁音あるいは、半濁
音の濁り音を消去する処理で、例えば、『ボタン書房』
を「ホタン書房」とする。また、拗音・撥音正規化処理
は、小さい文字「っ」を大きな文字「つ」に変換する処
理で、例えば、『キャッシュ金融』を「キヤツシユ金
融」とする。また、法人名削除処理は、「株式会社」な
どの法人を表す語を削除する処理で、例えば、『電信株
式会社」を「電信」とする。また、職業語尾削除処理
は、「駅」、「寺」などの職業語尾を削除する処理で、
例えば、『JR新宿駅』を「JR新宿」とする。また、
固有情報抽出処理は、固有名義を表現する語のみをある
ロジックによって抽出する処理で、例えば、『田中特許
事務所』を「田中」とする。
音の濁り音を消去する処理で、例えば、『ボタン書房』
を「ホタン書房」とする。また、拗音・撥音正規化処理
は、小さい文字「っ」を大きな文字「つ」に変換する処
理で、例えば、『キャッシュ金融』を「キヤツシユ金
融」とする。また、法人名削除処理は、「株式会社」な
どの法人を表す語を削除する処理で、例えば、『電信株
式会社」を「電信」とする。また、職業語尾削除処理
は、「駅」、「寺」などの職業語尾を削除する処理で、
例えば、『JR新宿駅』を「JR新宿」とする。また、
固有情報抽出処理は、固有名義を表現する語のみをある
ロジックによって抽出する処理で、例えば、『田中特許
事務所』を「田中」とする。
【0033】図7は本発明の一実施例の採点表を示す。
同図に示す採点表は、文字列変換処理の処理内容及び住
所コードの一致の度合いにより定まる点数処理について
記述されたものである。
同図に示す採点表は、文字列変換処理の処理内容及び住
所コードの一致の度合いにより定まる点数処理について
記述されたものである。
【0034】上記の文字列変換処理の結果と住所コード
の一致を完全一致か末尾のみ相違しているものとに分
け、採点する。例えば、文字列変換処理を行わずに、住
所コードが完全一致した場合の採点は20点とし、末尾
のみが相違している場合の採点は、10点、また、職業
語尾削除処理後に住所コードと完全一致した場合には1
3点となる。
の一致を完全一致か末尾のみ相違しているものとに分
け、採点する。例えば、文字列変換処理を行わずに、住
所コードが完全一致した場合の採点は20点とし、末尾
のみが相違している場合の採点は、10点、また、職業
語尾削除処理後に住所コードと完全一致した場合には1
3点となる。
【0035】上記のDB1、DB2の結合対象データベ
ース1より結合データベース2を生成する場合について
説明する。
ース1より結合データベース2を生成する場合について
説明する。
【0036】まず、データベース制御部3は、結合対
象のデータベースである電話帳データベース(DB1)
の1レコードを取り出し、一般文字列処理部5により文
字列の統一のための文字列変換処理を行い、一時記録部
4にDB1のレコードを格納する。
象のデータベースである電話帳データベース(DB1)
の1レコードを取り出し、一般文字列処理部5により文
字列の統一のための文字列変換処理を行い、一時記録部
4にDB1のレコードを格納する。
【0037】データベース制御部3は、結合対象のデ
ータベースである地図データベース(DB2)の1レコ
ードを取り出し、と同様に文字列変換処理を行い、一
時記録部4にDB2のレコードを格納する。
ータベースである地図データベース(DB2)の1レコ
ードを取り出し、と同様に文字列変換処理を行い、一
時記録部4にDB2のレコードを格納する。
【0038】本実施例では、住所コードの一致の度合
いを参照するので、比較照合部6は、採点表7を用い
て、一時記録部4に格納されているDB1のレコードと
DB2のレコードの住所コードを比較し、その比較され
たDB2のレコードを点数と共に一時記録部4に格納し
ておく。このようにして、すべてのDB2のレコードの
比較照合が終了したら、一時記録部4に格納されている
点数を付与されているDB2のレコードのうち最も高い
点数のレコードとで一時記録部4に格納されているD
B1のレコードとを結合する。本実施例の場合は、図3
のDB1に対するレコードとして、、図4に示されるD
B2のレコードの住所コードが文字列変換処理について
は未処理状態でDB1のレコードと完全一致しているた
めに、最高点の20点が付与される。
いを参照するので、比較照合部6は、採点表7を用い
て、一時記録部4に格納されているDB1のレコードと
DB2のレコードの住所コードを比較し、その比較され
たDB2のレコードを点数と共に一時記録部4に格納し
ておく。このようにして、すべてのDB2のレコードの
比較照合が終了したら、一時記録部4に格納されている
点数を付与されているDB2のレコードのうち最も高い
点数のレコードとで一時記録部4に格納されているD
B1のレコードとを結合する。本実施例の場合は、図3
のDB1に対するレコードとして、、図4に示されるD
B2のレコードの住所コードが文字列変換処理について
は未処理状態でDB1のレコードと完全一致しているた
めに、最高点の20点が付与される。
【0039】本実施例では、結合データベース2のフ
ィールド構成は、『電話番号』、『職業コード』、『地
図座標』、及び『建物ID』である。従って、DB1よ
り電話番号“03-3123-4567”、職業コード“10242002”
が転送され、DB2より地図座標“24-65-72-41 ”、建
物ID“54202 ”が転送され、これらのデータが結合デ
ータベース2に書き込まれる。
ィールド構成は、『電話番号』、『職業コード』、『地
図座標』、及び『建物ID』である。従って、DB1よ
り電話番号“03-3123-4567”、職業コード“10242002”
が転送され、DB2より地図座標“24-65-72-41 ”、建
物ID“54202 ”が転送され、これらのデータが結合デ
ータベース2に書き込まれる。
【0040】1レコードの結合データベースへ2の書
込みが終了したら、一時記録部4をクリアする。
込みが終了したら、一時記録部4をクリアする。
【0041】上記実施例に示すように、住所コードのよ
うな表現にゆらぎのないフィールドデータを用いて、比
較照合を行うレコードを絞り込むことによって、信頼性
を落とさず高速に結合データベース2を作成することが
できる。
うな表現にゆらぎのないフィールドデータを用いて、比
較照合を行うレコードを絞り込むことによって、信頼性
を落とさず高速に結合データベース2を作成することが
できる。
【0042】また、上記実施例では、情報の信頼性の度
合から作成された採点表7による得点によりデータベー
スのレコードを関連付けて結合データベースを生成した
が、ソフトウェア内部にテーブルを設けて処理しても良
い。また、表現形式のみが異なる共通のフィールド情報
については、共通のフィールド情報の表現形式を統一さ
せる種々の解析アルゴリズムを用いてもよい。
合から作成された採点表7による得点によりデータベー
スのレコードを関連付けて結合データベースを生成した
が、ソフトウェア内部にテーブルを設けて処理しても良
い。また、表現形式のみが異なる共通のフィールド情報
については、共通のフィールド情報の表現形式を統一さ
せる種々の解析アルゴリズムを用いてもよい。
【0043】
【発明の効果】上述のように本発明によれば、任意の異
なる独立したデータベースに対してその情報に信頼性の
違いあるいは、表現形式の相違をもつ個々のレコードを
互いに関連付け、相互参照を可能とする結合データベー
スを、信頼性を損なわずに、人為的な作業を交えずに、
自動的に作成することができる。
なる独立したデータベースに対してその情報に信頼性の
違いあるいは、表現形式の相違をもつ個々のレコードを
互いに関連付け、相互参照を可能とする結合データベー
スを、信頼性を損なわずに、人為的な作業を交えずに、
自動的に作成することができる。
【図1】本発明の一実施例のデータベース結合方法のブ
ロック図である。
ロック図である。
【図2】本発明の一実施例の動作を示すフローチャート
である。
である。
【図3】本発明の一実施例の電話帳データベース(DB
1)を示す図である。
1)を示す図である。
【図4】本発明の一実施例の地図データベース(DB
2)を示す図である。
2)を示す図である。
【図5】本発明の一実施例の結合データベースの例を示
す図である。
す図である。
【図6】本発明の一実施例の文字変換処理の例を示す図
である。
である。
【図7】本発明の一実施例の採点表である。
1 結合対象データベース 2 結合データベース 3 データベース制御部 4 一時記録部 5 一般文字列処理部 6 比較照合部 7 採点表
Claims (1)
- 【請求項1】 共通のフィールドを持ち、該共通のフィ
ールド情報の信頼性或いはその表現形式が異なるデータ
ベースのレコードを、該共通のフィールド情報を利用す
ることにより、個々に関連付けるデータベース結合方法
において、 表現形式の異なる該共通のフィールド情報に対しては、
表現形式を統一する解析処理を行い、該解析処理後の共
通のフィールド情報を作成し、 該共通のフィールド情報の信頼性或いは表現形式が異な
るデータベースのレコードについて、共通のフィールド
ごとに比較し、一致の成否により、該解析処理の処理内
容及び、共通のフィールド情報の信頼性の度合いから予
め得点を設定し、該得点を信頼性の度合によりそれぞれ
のレコードに付与し、該得点に基づいて異なるデータベ
ースを関連付け、結合する個々のレコードを決定するこ
とを特徴とするデータベースの結合方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11725193A JP3635341B2 (ja) | 1993-05-19 | 1993-05-19 | データベースの結合方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11725193A JP3635341B2 (ja) | 1993-05-19 | 1993-05-19 | データベースの結合方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH06332766A true JPH06332766A (ja) | 1994-12-02 |
| JP3635341B2 JP3635341B2 (ja) | 2005-04-06 |
Family
ID=14707141
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11725193A Expired - Fee Related JP3635341B2 (ja) | 1993-05-19 | 1993-05-19 | データベースの結合方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3635341B2 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011248661A (ja) * | 2010-05-27 | 2011-12-08 | Sharp Corp | データベース制御装置、データベース制御方法、プログラム及び記録媒体 |
| US8435590B2 (en) | 2008-11-24 | 2013-05-07 | Stokely-Van Camp, Inc. | Use of novel carbohydrates and carbohydrate blends to provide a sports beverage with increased absorption |
| WO2014206182A1 (zh) * | 2013-06-28 | 2014-12-31 | 深圳市华傲数据技术有限公司 | 一种企业数据匹配方法和装置 |
| JP2021043683A (ja) * | 2019-09-10 | 2021-03-18 | 株式会社オービック | 反社情報照合装置、反社情報照合方法、及び反社情報照合プログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0554083A (ja) * | 1991-08-21 | 1993-03-05 | Nec Corp | データベース検索方式 |
-
1993
- 1993-05-19 JP JP11725193A patent/JP3635341B2/ja not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0554083A (ja) * | 1991-08-21 | 1993-03-05 | Nec Corp | データベース検索方式 |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8435590B2 (en) | 2008-11-24 | 2013-05-07 | Stokely-Van Camp, Inc. | Use of novel carbohydrates and carbohydrate blends to provide a sports beverage with increased absorption |
| JP2011248661A (ja) * | 2010-05-27 | 2011-12-08 | Sharp Corp | データベース制御装置、データベース制御方法、プログラム及び記録媒体 |
| WO2014206182A1 (zh) * | 2013-06-28 | 2014-12-31 | 深圳市华傲数据技术有限公司 | 一种企业数据匹配方法和装置 |
| JP2021043683A (ja) * | 2019-09-10 | 2021-03-18 | 株式会社オービック | 反社情報照合装置、反社情報照合方法、及び反社情報照合プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3635341B2 (ja) | 2005-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7308456B2 (en) | Method and apparatus for building one or more indexes on data concurrent with manipulation of data | |
| EP0336584A3 (en) | Sort merge output | |
| CN113407538A (zh) | 一种多源异构关系型数据库数据的增量采集方法 | |
| US6947944B1 (en) | Database managing apparatus and database record retrieving apparatus | |
| JP2000353177A (ja) | データ・マイニングする方法およびシステム | |
| JPS60218142A (ja) | デ−タの動的型変換方式 | |
| JPH06332766A (ja) | データベースの結合方法 | |
| JP2921522B1 (ja) | データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体 | |
| US20040044683A1 (en) | Data compiling method | |
| US6973454B2 (en) | Data processing method, computer readable recording medium, and data processing device | |
| JP3183252B2 (ja) | データベース検索システム | |
| JPH11312166A (ja) | データベース管理装置 | |
| JPH05334360A (ja) | 名称認識方法 | |
| JP3780772B2 (ja) | データベースの索引創成装置 | |
| JPH06266888A (ja) | 文字認識装置 | |
| JP3255121B2 (ja) | データベース検索装置、データベース検索方法、情報処理装置、データベース検索方法をコンピュータに実行させるプログラムを記録した記録媒体 | |
| JPH1011338A (ja) | リレーショナル・データベース・システム,該システムへのデータ格納・読み出し方法,およびそのためのプログラムを記録した記録媒体 | |
| JP2000214878A (ja) | 音声情報処理装置 | |
| JPH05265821A (ja) | データベースのインデックス管理方式 | |
| JP2838972B2 (ja) | 自動索引作成装置 | |
| JP2658097B2 (ja) | 二次ファイル作成方式 | |
| JPS63152000A (ja) | 属性切替型検索照合認識システム | |
| JPH01248233A (ja) | データベース検索装置 | |
| JPS63153597A (ja) | 検索照合型認識システム | |
| JP2001092666A (ja) | プロセス記述方法及びプロセス記述検索方法及びプロセス実行プログラムを格納した記憶媒体及びプロセス記述検索プログラムを格納した記憶媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041130 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20041201 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041213 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |