JPH1011292A - 知識発見システム - Google Patents
知識発見システムInfo
- Publication number
- JPH1011292A JPH1011292A JP8164612A JP16461296A JPH1011292A JP H1011292 A JPH1011292 A JP H1011292A JP 8164612 A JP8164612 A JP 8164612A JP 16461296 A JP16461296 A JP 16461296A JP H1011292 A JPH1011292 A JP H1011292A
- Authority
- JP
- Japan
- Prior art keywords
- knowledge
- database
- case
- data
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001939 inductive effect Effects 0.000 claims abstract description 11
- 238000007418 data mining Methods 0.000 abstract description 15
- 238000012545 processing Methods 0.000 abstract description 9
- 230000006698 induction Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 19
- 238000000034 method Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】学習目標概念に関連する知識を帰納論理プログ
ラミングの背景知識として利用しつつ、データベースか
らのデータマイニングを自動的に行うことができる知識
発見システムを提供すること。 【解決手段】プリアンプ12がインデックスファイル1
1に基づいてデータベース18に格納したデータから入
力ファイル13を自動生成し、この入力ファイル13を
基にメイアンプであるPROGOL14が学習を行い、
その結果得られた知識をエキスパートシステム16の知
識ベース17に格納する。
ラミングの背景知識として利用しつつ、データベースか
らのデータマイニングを自動的に行うことができる知識
発見システムを提供すること。 【解決手段】プリアンプ12がインデックスファイル1
1に基づいてデータベース18に格納したデータから入
力ファイル13を自動生成し、この入力ファイル13を
基にメイアンプであるPROGOL14が学習を行い、
その結果得られた知識をエキスパートシステム16の知
識ベース17に格納する。
Description
【0001】
【発明の属する技術分野】本発明は、データベースと帰
納推論プログラミングを結合してデータベースから知識
発見を行う知識発見システムに関し、特に、データベー
スに格納したデータからの知識発掘を自動的に行う知識
発見システムに関する。
納推論プログラミングを結合してデータベースから知識
発見を行う知識発見システムに関し、特に、データベー
スに格納したデータからの知識発掘を自動的に行う知識
発見システムに関する。
【0002】
【従来の技術】近年のコンピュータ技術の著しい進展と
ハードウエアの低価格化に伴い、各種データベースに
は、多種多様の膨大なデータが十分に解析されないまま
格納されており、その肥大化傾向にはますます拍車がか
かっている。
ハードウエアの低価格化に伴い、各種データベースに
は、多種多様の膨大なデータが十分に解析されないまま
格納されており、その肥大化傾向にはますます拍車がか
かっている。
【0003】しかし、かかるデータベースがいかに大量
のデータを保持していたとしても、そのデータを有効な
知識として利用できなければ意味がないため、データを
有用化する技術が重要となる。
のデータを保持していたとしても、そのデータを有効な
知識として利用できなければ意味がないため、データを
有用化する技術が重要となる。
【0004】このため、データベースに格納したデータ
からの知識発掘(以下「データマイニング(Data Minin
g)」と言う。)が、特にニューラルネットワーク技術
分野で脚光を浴びている。
からの知識発掘(以下「データマイニング(Data Minin
g)」と言う。)が、特にニューラルネットワーク技術
分野で脚光を浴びている。
【0005】具体的には、このニューラルネットワーク
技術では、コンピュータ上の神経(シナプス)でつなが
った複数のニューロンにデータを学習させ、その学習結
果を使って診断、認識及び予測等を行うため、かかるニ
ューロンの学習機能をデータ分析に活用して、データマ
イニングを実現している。
技術では、コンピュータ上の神経(シナプス)でつなが
った複数のニューロンにデータを学習させ、その学習結
果を使って診断、認識及び予測等を行うため、かかるニ
ューロンの学習機能をデータ分析に活用して、データマ
イニングを実現している。
【0006】
【発明が解決しようとする課題】しかしながら、このニ
ューラルネットワーク技術には、学習結果に対して複雑
な変換を施さなければ知識ベースとして利用できないと
いう特性があるため、例えば株価の操作のような結果の
みを利用するシステムには有効であるが、学習結果を知
識ベースに反映してエキスパートシステムで利用するこ
とは難しい。
ューラルネットワーク技術には、学習結果に対して複雑
な変換を施さなければ知識ベースとして利用できないと
いう特性があるため、例えば株価の操作のような結果の
みを利用するシステムには有効であるが、学習結果を知
識ベースに反映してエキスパートシステムで利用するこ
とは難しい。
【0007】また、このニューラルネットワーク技術に
は、各ニューロンにデータを学習させる際に人が介在し
なければならないという特性を有するため、完全自動化
によるデータマイニングを行うことは難しい。
は、各ニューロンにデータを学習させる際に人が介在し
なければならないという特性を有するため、完全自動化
によるデータマイニングを行うことは難しい。
【0008】このように、かかるニューラルネットワー
ク技術は、データマイニングを行う上で有用である反
面、知識ベースへの応用及び自動化等の面で著しく制約
を受けるという問題がある。
ク技術は、データマイニングを行う上で有用である反
面、知識ベースへの応用及び自動化等の面で著しく制約
を受けるという問題がある。
【0009】そこで、本発明では、上記問題点を解決
し、学習目標概念に関連する知識を帰納論理プログラミ
ングの背景知識として利用しつつ、データベースからの
データマイニングを自動的に行うことができる知識発見
システムを提供することを目的とする。
し、学習目標概念に関連する知識を帰納論理プログラミ
ングの背景知識として利用しつつ、データベースからの
データマイニングを自動的に行うことができる知識発見
システムを提供することを目的とする。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、第1の発明は、データベースに格納したデータから
知識を発見し、発見した知識をエキスパートシステムが
有する知識ベースに供給する知識発見システムにおい
て、正事例、負事例、背景知識、モード宣言及びタイプ
情報を少なくとも有する入力ファイルを前記データベー
スに保持したデータから自動生成する自動生成手段と、
前記自動生成手段が生成した入力ファイルに基づいて学
習を行い、一階述語論理に基づく帰納推論を行う帰納推
論手段とを具備することを特徴とする。
め、第1の発明は、データベースに格納したデータから
知識を発見し、発見した知識をエキスパートシステムが
有する知識ベースに供給する知識発見システムにおい
て、正事例、負事例、背景知識、モード宣言及びタイプ
情報を少なくとも有する入力ファイルを前記データベー
スに保持したデータから自動生成する自動生成手段と、
前記自動生成手段が生成した入力ファイルに基づいて学
習を行い、一階述語論理に基づく帰納推論を行う帰納推
論手段とを具備することを特徴とする。
【0011】また、第2の発明は、前記自動生成手段
は、前記データベースに格納した個々のデータの属性間
の相互関係に基づいて背景知識を生成する背景知識生成
手段を具備することを特徴とする。
は、前記データベースに格納した個々のデータの属性間
の相互関係に基づいて背景知識を生成する背景知識生成
手段を具備することを特徴とする。
【0012】また、第3の発明は、前記自動生成手段
は、正事例が有する複数の要素から一要素を除外した条
件を満たす事例のみを前記データベースから抽出して負
事例を生成する負事例生成手段をさらに具備することを
特徴とする。
は、正事例が有する複数の要素から一要素を除外した条
件を満たす事例のみを前記データベースから抽出して負
事例を生成する負事例生成手段をさらに具備することを
特徴とする。
【0013】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
て図面を参照して説明する。
【0014】本実施の形態では、データベースに格納し
たデータから有効な知識を獲得する際に、DBアンプ
(DataBase Amplifier)を用いてデータベースからのデ
ータマイニングを自動的に行っている。
たデータから有効な知識を獲得する際に、DBアンプ
(DataBase Amplifier)を用いてデータベースからのデ
ータマイニングを自動的に行っている。
【0015】このため、本実施の形態で用いる知識発見
システムの構成を説明する前に、標準的な知識獲得処理
を考えた場合におけるこのDBアンプの位置づけとその
概要について説明する。
システムの構成を説明する前に、標準的な知識獲得処理
を考えた場合におけるこのDBアンプの位置づけとその
概要について説明する。
【0016】図2は、このDBアンプの知識獲得処理に
おける位置づけを示す図である。
おける位置づけを示す図である。
【0017】図2に示すように、知識獲得の標準的な手
順は、専門家等に対するインタビューによる事実のデー
タベース化(ステップ201)、データベースからの有
効なデータの抽出(ステップ202)、データ表現をル
ール獲得用に変換(ステップ203)、ルールの獲得
(ステップ204)、知識表現への変換(ステップ20
5)、知識ベースへの格納(ステップ206)からな
る。
順は、専門家等に対するインタビューによる事実のデー
タベース化(ステップ201)、データベースからの有
効なデータの抽出(ステップ202)、データ表現をル
ール獲得用に変換(ステップ203)、ルールの獲得
(ステップ204)、知識表現への変換(ステップ20
5)、知識ベースへの格納(ステップ206)からな
る。
【0018】ここで、このDBアンプは、データベース
からデータを抽出する段階(ステップ202)から、獲
得したルールを知識表現に変換する段階(ステップ20
5)までの処理を担うものである。
からデータを抽出する段階(ステップ202)から、獲
得したルールを知識表現に変換する段階(ステップ20
5)までの処理を担うものである。
【0019】すなわち、本実施の形態では、このDBア
ンプを用いることにより、データベースから直接知識獲
得を行うためのインターフェース部分となるモジュール
のフレームワークを構築している。
ンプを用いることにより、データベースから直接知識獲
得を行うためのインターフェース部分となるモジュール
のフレームワークを構築している。
【0020】具体的には、このDBアンプは、ルールの
獲得及び知識表現への変換(ステップ204〜205)
については機械学習システムを用いて実現することと
し、この機械学習システムに対してデータベースのデー
タを受け渡すために、有効なデータの抽出とデータ表現
の変換(ステップ202〜203)を行っている。
獲得及び知識表現への変換(ステップ204〜205)
については機械学習システムを用いて実現することと
し、この機械学習システムに対してデータベースのデー
タを受け渡すために、有効なデータの抽出とデータ表現
の変換(ステップ202〜203)を行っている。
【0021】したがって、このDBアンプを用いること
により、十分な量の情報を持つデータベースさえ構築で
きれば、知識獲得をコンピュータに実行させることが可
能となる。
により、十分な量の情報を持つデータベースさえ構築で
きれば、知識獲得をコンピュータに実行させることが可
能となる。
【0022】図3は、図2に示すDBアンプの概略構成
を示す図である。
を示す図である。
【0023】図3に示すように、このDBアンプでは、
ILPシステム(Inductive LogicProgramming)をメイ
ンアンプとして採用するとともに、このILPシステム
とデータベースとを直接つなぐ汎用的なフレームワーク
としてプリアンプを設けた構成となる。
ILPシステム(Inductive LogicProgramming)をメイ
ンアンプとして採用するとともに、このILPシステム
とデータベースとを直接つなぐ汎用的なフレームワーク
としてプリアンプを設けた構成となる。
【0024】ここで、このILPシステムとは、命題論
理を基にするこれまでの機械学習のアプローチを発展さ
せた一階述語論理に基づくシステムであり、正事例と負
事例に加えて背景知識(background knowledge)を利用
できるものである。
理を基にするこれまでの機械学習のアプローチを発展さ
せた一階述語論理に基づくシステムであり、正事例と負
事例に加えて背景知識(background knowledge)を利用
できるものである。
【0025】このように、このILPシステムでは、背
景知識を利用して個々のデータの属性間の制約や属性値
の階層構造、包含関係といった制約を付加することによ
り閉世界を構築することができる。
景知識を利用して個々のデータの属性間の制約や属性値
の階層構造、包含関係といった制約を付加することによ
り閉世界を構築することができる。
【0026】そして、このような閉世界をの構築が可能
になると、知識獲得時の計算量の爆発を解決できるとと
もに、ノイズや誤りに対する処理を行うことも可能とな
る。
になると、知識獲得時の計算量の爆発を解決できるとと
もに、ノイズや誤りに対する処理を行うことも可能とな
る。
【0027】なお、ここで言う正事例(positive data
example)とは、指定された引数を全て含む事例を意味
するものとし、負事例(negative data example)と
は、正事例以外の事例のうちILPシステムの学習に使
用する事例を意味するものとする。
example)とは、指定された引数を全て含む事例を意味
するものとし、負事例(negative data example)と
は、正事例以外の事例のうちILPシステムの学習に使
用する事例を意味するものとする。
【0028】また、このILPシステムとして、CLI
NT、RUTH及びPROGOL等の各種システムが知
られているが、本実施の形態では、PROGOLをメイ
アンプとして採用することとする。
NT、RUTH及びPROGOL等の各種システムが知
られているが、本実施の形態では、PROGOLをメイ
アンプとして採用することとする。
【0029】このPROGOLを採用した理由は、デー
タベースからの知識獲得を行う際に、他のILPシステ
ムのデータベースからの知識獲得におけるいくつかの課
題が既に解決されており、また、プリアンプとのデータ
の引き渡しを実現する仕組みがPROGOL中に既に一
部実装されているためである。
タベースからの知識獲得を行う際に、他のILPシステ
ムのデータベースからの知識獲得におけるいくつかの課
題が既に解決されており、また、プリアンプとのデータ
の引き渡しを実現する仕組みがPROGOL中に既に一
部実装されているためである。
【0030】具体的には、このPROGOLは、リファ
インメントグラフのトップダウン検索と最特殊仮説に基
づくボトムアップを組み合わせたものであり、与えられ
た事例を必要とする最も特殊なクローズ(clause)をモ
ード宣言(mode declaration)で用意された言語によっ
て行うことにより、逆解(inverse solution)を求める
ものである。
インメントグラフのトップダウン検索と最特殊仮説に基
づくボトムアップを組み合わせたものであり、与えられ
た事例を必要とする最も特殊なクローズ(clause)をモ
ード宣言(mode declaration)で用意された言語によっ
て行うことにより、逆解(inverse solution)を求める
ものである。
【0031】このため、本実施の形態では、このモード
宣言と、扱うデータの特性を記述するタイプ情報(type
information)とを用いてプリアンプとのデータの引き
渡しを行うこととした。
宣言と、扱うデータの特性を記述するタイプ情報(type
information)とを用いてプリアンプとのデータの引き
渡しを行うこととした。
【0032】以上、本発明に係わるDBアンプの位置づ
けとその概要について説明した。
けとその概要について説明した。
【0033】次に、本実施の形態で用いる知識発見シス
テムの構成について説明する。
テムの構成について説明する。
【0034】図1は、本実施の形態で用いる知識発見シ
ステムの全体構成を示すブロック図である。
ステムの全体構成を示すブロック図である。
【0035】図1に示すように、この知識発見システム
は、知識ベース17に基づいて問題を解決するエキスパ
ートシステム16と、データベース18と、DBアンプ
10とからなる。
は、知識ベース17に基づいて問題を解決するエキスパ
ートシステム16と、データベース18と、DBアンプ
10とからなる。
【0036】すなわち、本実施の形態で用いる知識発見
システムでは、データベース18とエキスパートシステ
ム16との間にDBアンプ10を介在させることによ
り、データベース18から取得した知識をエキスパート
システム16の知識ベース17にフィードバックしてい
るのである。
システムでは、データベース18とエキスパートシステ
ム16との間にDBアンプ10を介在させることによ
り、データベース18から取得した知識をエキスパート
システム16の知識ベース17にフィードバックしてい
るのである。
【0037】すなわち、このDBアンプ10は、データ
ベース18からルールを抽出して知識ベース17に格納
する処理部であり、実際に分類学習を行うメインアンプ
すなわちPROGOL14と、このPROGOL14の
学習に必要な最適な入力ファイル13をデータベース1
8の内容から自動的に生成するプリアンプ12とを有す
る。
ベース18からルールを抽出して知識ベース17に格納
する処理部であり、実際に分類学習を行うメインアンプ
すなわちPROGOL14と、このPROGOL14の
学習に必要な最適な入力ファイル13をデータベース1
8の内容から自動的に生成するプリアンプ12とを有す
る。
【0038】そして、このプリアンプ12では、生デー
タ変換ルール11a、モード宣言11b、タイプ情報1
1c及び要素定義11dからなるインデックスファイル
11を参照して、データベース18のデータから入力フ
ァイル13を作成し、この入力ファイル13をPROG
OL14に引き渡す。
タ変換ルール11a、モード宣言11b、タイプ情報1
1c及び要素定義11dからなるインデックスファイル
11を参照して、データベース18のデータから入力フ
ァイル13を作成し、この入力ファイル13をPROG
OL14に引き渡す。
【0039】ここで、この生データ変換ルール11aと
は、後述するRERモデルの解釈に基づいてデータベー
ス18に記憶したデータを変換するルールであり、モー
ド宣言11b及びタイプ情報11cは、探索空間を定義
するためのものであり、要素定義11dは、学習させた
い概念を他のいずれの述語で表現させるかを示す定義で
ある。
は、後述するRERモデルの解釈に基づいてデータベー
ス18に記憶したデータを変換するルールであり、モー
ド宣言11b及びタイプ情報11cは、探索空間を定義
するためのものであり、要素定義11dは、学習させた
い概念を他のいずれの述語で表現させるかを示す定義で
ある。
【0040】また、上記プリアンプ12が作成する入力
ファイル13は、正事例13a、負事例13b、背景知
識13c、モード宣言13d及びタイプ情報13eを含
み、この背景知識13cには、背景知識として学習のタ
ーゲットとなる概念を表現するための述語の定義を示す
要素条項と、正事例を参照して生成された疑似生データ
という2つの要素が含まれる。
ファイル13は、正事例13a、負事例13b、背景知
識13c、モード宣言13d及びタイプ情報13eを含
み、この背景知識13cには、背景知識として学習のタ
ーゲットとなる概念を表現するための述語の定義を示す
要素条項と、正事例を参照して生成された疑似生データ
という2つの要素が含まれる。
【0041】なお、この背景知識13cは、本実施の形
態が新たに導入したRERモデルの概念における派生属
性に基づいて同定され、かかる背景知識13cを入力フ
ァイル13に設けることにより、PROGOL14によ
る最短時間での学習に大きな効果をもたらすことが可能
となる。
態が新たに導入したRERモデルの概念における派生属
性に基づいて同定され、かかる背景知識13cを入力フ
ァイル13に設けることにより、PROGOL14によ
る最短時間での学習に大きな効果をもたらすことが可能
となる。
【0042】次に、本実施の形態で採用するRERデー
タモデルについて説明する。
タモデルについて説明する。
【0043】図1に示すデータベース18から帰納論理
プログラミングシステムであるPROGOL14への入
力データを得るためには、目標概念及び背景知識の設計
が必要となる。そして、この目標概念を同定するために
は、対象概念を構成する独立変数の集合を決定しなけれ
ばならない。
プログラミングシステムであるPROGOL14への入
力データを得るためには、目標概念及び背景知識の設計
が必要となる。そして、この目標概念を同定するために
は、対象概念を構成する独立変数の集合を決定しなけれ
ばならない。
【0044】例えば、構造物の設計におけるCADデー
タから菱形のような特定形状を認識するプログラムを学
習する場合を考えると、この菱形を構成する4点がここ
での独立変数になることは自明であるが、通常の4角形
を考えた場合と同様に、その特徴を記述するためには、
4点の他に各点を結ぶ各辺の長さ、隣り合う2辺のなす
角度などが必要となる。
タから菱形のような特定形状を認識するプログラムを学
習する場合を考えると、この菱形を構成する4点がここ
での独立変数になることは自明であるが、通常の4角形
を考えた場合と同様に、その特徴を記述するためには、
4点の他に各点を結ぶ各辺の長さ、隣り合う2辺のなす
角度などが必要となる。
【0045】ところが、これら4点の座標が与えられる
と、線分の長さや隣り合う辺の角度はこの4点の座標か
ら計算することができる。
と、線分の長さや隣り合う辺の角度はこの4点の座標か
ら計算することができる。
【0046】したがって、本実施の形態では、独立変数
のみを目標概念の引数として付与し、かかる独立変数か
ら計算できる属性については背景知識として定義するこ
ととした。
のみを目標概念の引数として付与し、かかる独立変数か
ら計算できる属性については背景知識として定義するこ
ととした。
【0047】このため、本実施の形態では、意味の記述
を行うためのデータモデルであるERモデル(Entry Re
lationship Model)の概念を拡張して、属性を基本属性
(primitive property)と派生属性(derived propert
y)に分けたRERモデル(Refined Entry Relationshi
p Model)の概念を新たに導入した。
を行うためのデータモデルであるERモデル(Entry Re
lationship Model)の概念を拡張して、属性を基本属性
(primitive property)と派生属性(derived propert
y)に分けたRERモデル(Refined Entry Relationshi
p Model)の概念を新たに導入した。
【0048】図4は、本実施の形態で採用するRERモ
デルをCADに適用した場合の一例を示す図である。
デルをCADに適用した場合の一例を示す図である。
【0049】図4に示すように、このRERモデルは、
2つのライン(line)が接続されている場合のモデルを
示しており、具体的には、ライン41には、該ラインの
端点となるノード座標を示すノード(node)42と、該
ラインの長さを示すレングス(length)43とを属性と
して持つ。
2つのライン(line)が接続されている場合のモデルを
示しており、具体的には、ライン41には、該ラインの
端点となるノード座標を示すノード(node)42と、該
ラインの長さを示すレングス(length)43とを属性と
して持つ。
【0050】ここで、このノード42は、独立変数であ
ることが明らかなため基本属性として取り扱い、レング
ス43は、ノード42が有する座標から算定することが
できるため派生属性として取り扱うことになる。
ることが明らかなため基本属性として取り扱い、レング
ス43は、ノード42が有する座標から算定することが
できるため派生属性として取り扱うことになる。
【0051】すなわち、かかるノード42は目標概念の
引数として用いられ、一方レングス43は図1に示す背
景知識13cとして使用される。
引数として用いられ、一方レングス43は図1に示す背
景知識13cとして使用される。
【0052】次に、このRERモデルに基づく目標概念
及び背景知識の設定について説明する。
及び背景知識の設定について説明する。
【0053】本実施の形態では、上記RERモデルにお
ける全てのエンティティ(Entity)に付随する基本属性
を引数とする述語として学習目標概念を定義する。
ける全てのエンティティ(Entity)に付随する基本属性
を引数とする述語として学習目標概念を定義する。
【0054】そして、各エンティティと基本属性との間
の関連を明示するために、エンティティ名をファンクタ
とする <Entity_Name>(PP1,…,PPn) という形式の構造体を導入する。ただし、PPi(i=1〜
n)はエンティティの基本属性を示すものとする。
の関連を明示するために、エンティティ名をファンクタ
とする <Entity_Name>(PP1,…,PPn) という形式の構造体を導入する。ただし、PPi(i=1〜
n)はエンティティの基本属性を示すものとする。
【0055】さらに、目標概念全体は、目標概念名を述
語名とし、各エンティティに対する上記構造体を引数と
する述語として定義される。
語名とし、各エンティティに対する上記構造体を引数と
する述語として定義される。
【0056】一方、各エンティティの各派生属性に対応
して、その派生属性名を述語名とする述語を導入する。
そして、この述語の引数としては、その派生属性が依存
する基本属性若しくは他の派生属性を用いる。
して、その派生属性名を述語名とする述語を導入する。
そして、この述語の引数としては、その派生属性が依存
する基本属性若しくは他の派生属性を用いる。
【0057】各述語の定義は、その派生属性を反映する
ように、論理プログラムによって定義されなければなら
ないが、この部分については人手による定義にゆだねら
れている。
ように、論理プログラムによって定義されなければなら
ないが、この部分については人手による定義にゆだねら
れている。
【0058】次に、図1に示すプリアンプ12が行う負
事例の自動生成について説明する。
事例の自動生成について説明する。
【0059】従来、分類問題における負事例を生成する
際には、他のクラスに属する負事例をそのクラスの負事
例とするのが一般的であり、機械的にその生成を行うこ
とが可能となる。
際には、他のクラスに属する負事例をそのクラスの負事
例とするのが一般的であり、機械的にその生成を行うこ
とが可能となる。
【0060】しかしながら、かかる生成技術を用いて負
事例を生成すると、データベース18の規模が大きくな
ればなるほど、これに比例して負事例の数が増加する結
果となる。したがって、かかる負事例を精査することな
くPROGOL14に引き渡すと、かかる負事例を用い
た学習のための計算量が爆発的に累増してしまう。
事例を生成すると、データベース18の規模が大きくな
ればなるほど、これに比例して負事例の数が増加する結
果となる。したがって、かかる負事例を精査することな
くPROGOL14に引き渡すと、かかる負事例を用い
た学習のための計算量が爆発的に累増してしまう。
【0061】このため、本実施の形態では、正事例でな
いデータの中で正事例に近いもののみを負事例として選
択することによって負事例の量を必要最小限に押さえ、
PROGOLでの処理を軽減することとした。
いデータの中で正事例に近いもののみを負事例として選
択することによって負事例の量を必要最小限に押さえ、
PROGOLでの処理を軽減することとした。
【0062】具体的には、正事例の中から1つのデータ
を取り出したならば、このデータが持つ引数を調べ、任
意の1つ引数を除いた他の引数を全て含むデータが存在
すればこれを負事例として選択する。かかる処理を全て
の正事例に対して行い、出力された結果のみを負事例と
して採用する。
を取り出したならば、このデータが持つ引数を調べ、任
意の1つ引数を除いた他の引数を全て含むデータが存在
すればこれを負事例として選択する。かかる処理を全て
の正事例に対して行い、出力された結果のみを負事例と
して採用する。
【0063】このため、ある正事例に着目すると、該正
事例が持つ全ての引数のうち、1つだけ引数が足らない
データが負事例として採用されるため、正事例に近い有
用なデータのみを負事例として選択でき、その負事例数
を必要最小限に押さることができたことになる。
事例が持つ全ての引数のうち、1つだけ引数が足らない
データが負事例として採用されるため、正事例に近い有
用なデータのみを負事例として選択でき、その負事例数
を必要最小限に押さることができたことになる。
【0064】図5は、図1に示すプリアンプ12が行う
負事例生成の一例を示す図である。
負事例生成の一例を示す図である。
【0065】図5に示すように、例えば正事例が、 predicate([v11,v12],[v21,v22],[v31,v32],[v41,v4
2],…). であるとすると、とえあえず引数[v11,v12]を除いた1
つの近似事例 predicate(…,[v21,v22],…,[v31,v32],…,[v41,v42],
…). を作成する。
2],…). であるとすると、とえあえず引数[v11,v12]を除いた1
つの近似事例 predicate(…,[v21,v22],…,[v31,v32],…,[v41,v42],
…). を作成する。
【0066】そして、この近似事例に基づいてデータベ
ース18を検索すると、該近似事例の全ての引数を有す
る predicate([v91,v92],[v21,v22],[v31,v32],[v41,v4
2],[v221,v222]). predicate([v31,v32],[v41,v42],[v21,v22]). predicate([v51,v52],[v41,v42],[v31,v32],[v101,v10
2],[v21,v22]). をそれぞれ得ることができる。
ース18を検索すると、該近似事例の全ての引数を有す
る predicate([v91,v92],[v21,v22],[v31,v32],[v41,v4
2],[v221,v222]). predicate([v31,v32],[v41,v42],[v21,v22]). predicate([v51,v52],[v41,v42],[v31,v32],[v101,v10
2],[v21,v22]). をそれぞれ得ることができる。
【0067】その後、得られたデータの前に”:−”を
付加して負事例であることを明示した後、正事例から別
の1つの引数を除外して同様に近似事例を作成し、該近
似事例に基づいてデータベース18から同様に負事例を
検索する。
付加して負事例であることを明示した後、正事例から別
の1つの引数を除外して同様に近似事例を作成し、該近
似事例に基づいてデータベース18から同様に負事例を
検索する。
【0068】このようにして、正事例の引数を1つだけ
欠いたデータを負事例としてデータベース18から抽出
することになる。
欠いたデータを負事例としてデータベース18から抽出
することになる。
【0069】次に、本実施の形態で行う有限探索空間の
設定について説明する。
設定について説明する。
【0070】有限時間内に効果的な学習を行うために
は、効果的に探索空間を設定することが必要となるた
め、本実施の形態では、正事例に現れるデータのみを述
語の変数のドメインとする考え方を採用し、有限領域を
与えるタイプ情報を正事例中のデータのみによって定義
して、正事例の引数のとる値のみに探索空間を限定する
こととした。
は、効果的に探索空間を設定することが必要となるた
め、本実施の形態では、正事例に現れるデータのみを述
語の変数のドメインとする考え方を採用し、有限領域を
与えるタイプ情報を正事例中のデータのみによって定義
して、正事例の引数のとる値のみに探索空間を限定する
こととした。
【0071】すなわち、本実施の形態で用いるPROG
OL14では、モード宣言で述語の引数のタイプを指定
し、タイプ情報の指定によってドメインが決定されるた
め、このPROGOL14の仕組みを利用して探索空間
を設定したのである。
OL14では、モード宣言で述語の引数のタイプを指定
し、タイプ情報の指定によってドメインが決定されるた
め、このPROGOL14の仕組みを利用して探索空間
を設定したのである。
【0072】次に、図1に示すDBアンプ10を用いた
場合と用いない場合の負事例及び背景知識のデータ数の
関係について説明する。
場合と用いない場合の負事例及び背景知識のデータ数の
関係について説明する。
【0073】図6(a)は、図1に示すDBアンプ10
を用いない場合の負事例及び背景知識のデータ数の関係
を示す図である。
を用いない場合の負事例及び背景知識のデータ数の関係
を示す図である。
【0074】同図に示すように、この場合には負事例数
及び背景知識のデータ数がともに多くのデータ数を持
つ。このため、メイアンプであるPROGOL14が分
類学習を行う際の計算量的負担は大きくなることが分か
る。
及び背景知識のデータ数がともに多くのデータ数を持
つ。このため、メイアンプであるPROGOL14が分
類学習を行う際の計算量的負担は大きくなることが分か
る。
【0075】図6(b)は、図1に示すDBアンプ10
を用いた場合の負事例及び背景知識のデータ数の関係を
示す図である。
を用いた場合の負事例及び背景知識のデータ数の関係を
示す図である。
【0076】同図に示すように、この場合には負事例数
及び背景知識のデータ数がともに低減されている。この
ため、PROGOL14が分類学習を行う際の計算量的
負担は軽減されることが分かる。
及び背景知識のデータ数がともに低減されている。この
ため、PROGOL14が分類学習を行う際の計算量的
負担は軽減されることが分かる。
【0077】以上、本実施の形態が新たに導入したRE
Rモデルの概念と、目標概念及び背景知識と、負事例の
自動生成と、有限探索空間の設定とについて説明した。
Rモデルの概念と、目標概念及び背景知識と、負事例の
自動生成と、有限探索空間の設定とについて説明した。
【0078】次に、この知識発見システムを実際のエキ
スパートシステムである応答文自動検索メールシステム
に展開した場合について説明する。
スパートシステムである応答文自動検索メールシステム
に展開した場合について説明する。
【0079】なお、ここで用いるデータベースは、イン
ターネット(Internet)を介して入手した電子メールと
その応答結果を格納する事例データベースであり、また
エキスパートシステムは、過去に入手した問い合わせの
事実データから典型的な質問パターンを抽出し、そのお
のおのに該当する内容のメール文書を正事例とするルー
ルの知識獲得を行うものである。
ターネット(Internet)を介して入手した電子メールと
その応答結果を格納する事例データベースであり、また
エキスパートシステムは、過去に入手した問い合わせの
事実データから典型的な質問パターンを抽出し、そのお
のおのに該当する内容のメール文書を正事例とするルー
ルの知識獲得を行うものである。
【0080】すなわち、このエキスパートシステムは、
新たに問い合わせメールを入手したならば、このエキス
パートシステムの持つ推論エンジンが自動的に知識ベー
スを参照し、メールの内容がどの典型質問パターンのル
ールと合致するかを判定し、典型質問パターンごとに格
納されている典型質問文を表示する。
新たに問い合わせメールを入手したならば、このエキス
パートシステムの持つ推論エンジンが自動的に知識ベー
スを参照し、メールの内容がどの典型質問パターンのル
ールと合致するかを判定し、典型質問パターンごとに格
納されている典型質問文を表示する。
【0081】このため、ここで用いる知識発見システム
は、専門家がどのような最終的な判断を下したか(エキ
スパートシステムが出力した結果通りに返信したか、他
の回答を指示したか)を格納する事例データベースから
新たなルールを学習する知識獲得をDBアンプに行わせ
ることになる。
は、専門家がどのような最終的な判断を下したか(エキ
スパートシステムが出力した結果通りに返信したか、他
の回答を指示したか)を格納する事例データベースから
新たなルールを学習する知識獲得をDBアンプに行わせ
ることになる。
【0082】なお、ルールのレビューのプロセスについ
ては、唯一コンピュータシステム化しないこととする
が、その理由は、抽出された結果を確認作業を行わずに
直接知識ベースに格納することとすると、エキスパート
システムの出力結果に極端な異常値が発生するおそれが
あるためである。
ては、唯一コンピュータシステム化しないこととする
が、その理由は、抽出された結果を確認作業を行わずに
直接知識ベースに格納することとすると、エキスパート
システムの出力結果に極端な異常値が発生するおそれが
あるためである。
【0083】次に、この知識発見システムが行う処理の
流れについて説明する。
流れについて説明する。
【0084】図7は、知識発見システムをメールシステ
ムに適用した場合の処理の流れを示す図である。
ムに適用した場合の処理の流れを示す図である。
【0085】図7に示すように、まず最初にエキスパー
トシステム70がメールを受信したならば(ステップ7
01)、キーワード辞書を用いてメールからキーワード
を抽出し(ステップ702〜703)、知識ベースを用
いて推論エンジンによる推論を実行する(ステップ70
4〜705)。
トシステム70がメールを受信したならば(ステップ7
01)、キーワード辞書を用いてメールからキーワード
を抽出し(ステップ702〜703)、知識ベースを用
いて推論エンジンによる推論を実行する(ステップ70
4〜705)。
【0086】そして、この推論の結果得られた候補パタ
ーンとその詳細をリスト化し(ステップ706)、最適
候補を選択するとともにメール応答を行う(ステップ7
07)。
ーンとその詳細をリスト化し(ステップ706)、最適
候補を選択するとともにメール応答を行う(ステップ7
07)。
【0087】そして、この応答結果は、DBアンプ71
の事例データベースに登録され(ステップ708)、入
力ファイルジェネレータたるプリアンプがこの事例デー
タベースを参照して入力ファイルを作成する(ステップ
709〜710)。
の事例データベースに登録され(ステップ708)、入
力ファイルジェネレータたるプリアンプがこの事例デー
タベースを参照して入力ファイルを作成する(ステップ
709〜710)。
【0088】なお、このDBアンプ71はPROGOL
をデータマイニングエンジンとして採用するため、ここ
で作成した入力ファイルは、図1に示す入力ファイル1
3と同様に、正事例、負事例、背景知識、モード宣言及
びタイプ情報を有することになる。
をデータマイニングエンジンとして採用するため、ここ
で作成した入力ファイルは、図1に示す入力ファイル1
3と同様に、正事例、負事例、背景知識、モード宣言及
びタイプ情報を有することになる。
【0089】その後、この入力ファイルを受け取ったデ
ータマイニングエンジンすなわちPROGOLが帰納推
論を行い、学習したルールを出力する(ステップ711
〜712)。
ータマイニングエンジンすなわちPROGOLが帰納推
論を行い、学習したルールを出力する(ステップ711
〜712)。
【0090】そして、このルールはあらためてエキスパ
ートシステムの知識ベースに格納され(ステップ70
5)、次回以降のメール受信時の推論エンジンによる推
論に利用される。
ートシステムの知識ベースに格納され(ステップ70
5)、次回以降のメール受信時の推論エンジンによる推
論に利用される。
【0091】ここで、この事例データベースの内容は、
過去の電子メールの応答記録であり、事務機器メーカA
社での顧客若しくは潜在顧客を対象とした問い合わせ応
対業務を蓄積したものを想定している。
過去の電子メールの応答記録であり、事務機器メーカA
社での顧客若しくは潜在顧客を対象とした問い合わせ応
対業務を蓄積したものを想定している。
【0092】また、電子メールによる問い合わせ内容の
ほとんどは、A社が発売している事務機器に関する使用
上の障害や要求に関するものであり、これらのメールを
20の典型的な質問文として分類するとともに、新たな
質問文が20のカテゴリーのいずれに属するかを判定す
るためのルールを学習させるものとする。
ほとんどは、A社が発売している事務機器に関する使用
上の障害や要求に関するものであり、これらのメールを
20の典型的な質問文として分類するとともに、新たな
質問文が20のカテゴリーのいずれに属するかを判定す
るためのルールを学習させるものとする。
【0093】図8は、上記事例データベースの構造を示
す図である。
す図である。
【0094】図8に示すように、この事例データベース
では、問い合わせ日時を示す”QDate”、”返信ア
ドレス”、”会社名”、”お客様名”、”住所”及び”
電話番号”と、”質問内容”と、”Qkeyword”
と、”該当典型質問文”というフィールドを有してい
る。
では、問い合わせ日時を示す”QDate”、”返信ア
ドレス”、”会社名”、”お客様名”、”住所”及び”
電話番号”と、”質問内容”と、”Qkeyword”
と、”該当典型質問文”というフィールドを有してい
る。
【0095】ここで、フィールド”質問内容”には、電
子メールに記載されていた問い合わせの原文が格納さ
れ、フィールド”Qkeyword”には、概念辞書の
参照によって抽出されたキーワードのリストが格納さ
れ、フィールド”該当典型質問文”には、専門家による
いずれの典型質問文に該当するかの判断結果が格納され
ている。特に、フィールド”該当典型質問文”には、フ
ォーム1〜20までに分類された結果が数値で記載され
ている。
子メールに記載されていた問い合わせの原文が格納さ
れ、フィールド”Qkeyword”には、概念辞書の
参照によって抽出されたキーワードのリストが格納さ
れ、フィールド”該当典型質問文”には、専門家による
いずれの典型質問文に該当するかの判断結果が格納され
ている。特に、フィールド”該当典型質問文”には、フ
ォーム1〜20までに分類された結果が数値で記載され
ている。
【0096】図9は、本DBアンプ71によって獲得さ
れた知識の一例を示す図である。
れた知識の一例を示す図である。
【0097】図9に示すように、この獲得ルールは、
「メールの質問文Aが’カラーコピ’と’方法’という
キーワードを持ち、かつ、’切’というキーワードを持
たず、かつ、リスト長が4以下のとき、典型質問文の1
番に分類される(同様の意味の質問文と理解できる)」
という内容を意味している。
「メールの質問文Aが’カラーコピ’と’方法’という
キーワードを持ち、かつ、’切’というキーワードを持
たず、かつ、リスト長が4以下のとき、典型質問文の1
番に分類される(同様の意味の質問文と理解できる)」
という内容を意味している。
【0098】次に、図7に示すエキスパートシステム7
0について説明する。
0について説明する。
【0099】このエキスパートシステム70への入力
は、インターネット上のWWW(World Wide Web)サー
バ宛の電子メールであり、サーバ上のホームページを実
現するHTML(HiperText Makeup Langage)中に、C
GIを用いて電子メール送信用のツールを実装してい
る。
は、インターネット上のWWW(World Wide Web)サー
バ宛の電子メールであり、サーバ上のホームページを実
現するHTML(HiperText Makeup Langage)中に、C
GIを用いて電子メール送信用のツールを実装してい
る。
【0100】そして、このツールで作成したファイルを
A社のインターネット接続サーバ上のホームページ中に
搭載するとともに、質問者からの情報はA社の一部門で
ある「お客様相談センター」の顧客対応のエキスパート
システム宛に自動的に送信される。
A社のインターネット接続サーバ上のホームページ中に
搭載するとともに、質問者からの情報はA社の一部門で
ある「お客様相談センター」の顧客対応のエキスパート
システム宛に自動的に送信される。
【0101】図10は、WWWのホームページに設けた
電子メール送信用ツールの一例を示す図である。
電子メール送信用ツールの一例を示す図である。
【0102】図10に示すように、この電子メール送信
用ツールは、質問内容の入力枠と、インターネットアド
レスの入力枠と、住所、会社名、名前及び電話番号の入
力枠とがそれぞれ設けられている。
用ツールは、質問内容の入力枠と、インターネットアド
レスの入力枠と、住所、会社名、名前及び電話番号の入
力枠とがそれぞれ設けられている。
【0103】このため、質問者は、これらの箇所に該当
事項を入力した後、ツールの最下部に設けた送信枠をマ
ウス等で指示することにより、電子メールをエキスパー
トシステムに自動送信することができる。
事項を入力した後、ツールの最下部に設けた送信枠をマ
ウス等で指示することにより、電子メールをエキスパー
トシステムに自動送信することができる。
【0104】再びエキスパートシステムの説明に戻る
と、このエキスパートシステムは、入力した電子メール
の問い合わせの本文を概念辞書に照らし合わせてキーワ
ード抽出を行い、リスト形式でデータベース中の該当す
るフィールドに格納する。
と、このエキスパートシステムは、入力した電子メール
の問い合わせの本文を概念辞書に照らし合わせてキーワ
ード抽出を行い、リスト形式でデータベース中の該当す
るフィールドに格納する。
【0105】また、推論エンジンは、キーワードのリス
トを入力データとして知識ベースを参照する。ただし、
本実施の形態ではデータベースの内容がRERモデルに
基づいて解釈するよう構成したことから、獲得されたル
ールは全て原始的な述語に変換され、推論の対象とな
る。
トを入力データとして知識ベースを参照する。ただし、
本実施の形態ではデータベースの内容がRERモデルに
基づいて解釈するよう構成したことから、獲得されたル
ールは全て原始的な述語に変換され、推論の対象とな
る。
【0106】このため、例えばDBアンプ71の出力結
果として得られたルールが have(A,keywordX) order(keywordY,keywordZ) not_have(A,keywordW) であるときには、エキスパートシステムの推論エンジン
は、この典型質問文に該当する条件を以下のように解釈
する。
果として得られたルールが have(A,keywordX) order(keywordY,keywordZ) not_have(A,keywordW) であるときには、エキスパートシステムの推論エンジン
は、この典型質問文に該当する条件を以下のように解釈
する。
【0107】すなわち、リストの要素を順に抽出してゆ
くと、 (1) keywordXが少なくとも1つ抽出され
る。
くと、 (1) keywordXが少なくとも1つ抽出され
る。
【0108】(2) keywordYが少なくとも1
つ抽出される。
つ抽出される。
【0109】(3) keywordZが少なくとも1
つ抽出される。
つ抽出される。
【0110】(4) keywordWは決して抽出さ
れない。
れない。
【0111】(5) keywordYはkeywor
dZよりも先に抽出される。
dZよりも先に抽出される。
【0112】という条件を満足するものである。
【0113】最終的に得られる結果は、図11に示すよ
うに、「どの典型質問文にどれくらいの確からしさをも
って該当するか」を上記の条件を満たす割合を該当可能
性として、模範的な回答文(データベース中に典型質問
文とともに一意に決定されている)とともに出力する。
うに、「どの典型質問文にどれくらいの確からしさをも
って該当するか」を上記の条件を満たす割合を該当可能
性として、模範的な回答文(データベース中に典型質問
文とともに一意に決定されている)とともに出力する。
【0114】以上、本発明に係わる知識発見システムを
実際のエキスパートシステムである応答文自動検索メー
ルシステムに展開した場合について説明した。
実際のエキスパートシステムである応答文自動検索メー
ルシステムに展開した場合について説明した。
【0115】上述してきたように、本実施の形態では、
プリアンプ12がインデックスファイル11に基づいて
データベース18に格納したデータから入力ファイル1
3を自動生成し、この入力ファイル13を基にメイアン
プであるPROGOL14が学習を行い、その結果得ら
れた知識をエキスパートシステム16の知識ベース17
に格納するよう構成したので、下記に示す効果が得られ
る。
プリアンプ12がインデックスファイル11に基づいて
データベース18に格納したデータから入力ファイル1
3を自動生成し、この入力ファイル13を基にメイアン
プであるPROGOL14が学習を行い、その結果得ら
れた知識をエキスパートシステム16の知識ベース17
に格納するよう構成したので、下記に示す効果が得られ
る。
【0116】1)データベースからのデータマイニング
を自動的に行うことが可能となる。
を自動的に行うことが可能となる。
【0117】2)データマイニングによって得られた知
識をエキスパートシステムの知識ベースに反映すること
ができる。
識をエキスパートシステムの知識ベースに反映すること
ができる。
【0118】また、本実施の形態では、RERモデルと
いう新たな概念を導入し、このRERモデルに基づいて
プリアンプ12がデータベース18に格納した個々のデ
ータの属性間の相互関係に基づいて背景知識13cを作
成するよう構成したので、学習目標概念に関連する知識
を帰納論理プログラミングの背景知識として利用するこ
とができる。
いう新たな概念を導入し、このRERモデルに基づいて
プリアンプ12がデータベース18に格納した個々のデ
ータの属性間の相互関係に基づいて背景知識13cを作
成するよう構成したので、学習目標概念に関連する知識
を帰納論理プログラミングの背景知識として利用するこ
とができる。
【0119】さらに、本実施の形態では、プリアンプ1
2が入力ファイル13を生成する際に、正事例が有する
複数の要素から一要素を除外した条件を満たす事例のみ
をデータベース18から抽出して負事例を生成するよう
構成したので、負事例の総数を低減して、メインアンプ
であるPROGOL14でのデータマイニングを効率良
く行うことができる。
2が入力ファイル13を生成する際に、正事例が有する
複数の要素から一要素を除外した条件を満たす事例のみ
をデータベース18から抽出して負事例を生成するよう
構成したので、負事例の総数を低減して、メインアンプ
であるPROGOL14でのデータマイニングを効率良
く行うことができる。
【0120】
【発明の効果】以上詳細に説明したように、第1の発明
では、データベースに格納したデータから正事例、負事
例、背景知識、モード宣言及びタイプ情報を少なくとも
有する入力ファイルを自動生成し、生成した入力ファイ
ルに基づく学習を通じて一階述語論理に基づく帰納推論
を行って知識を発見し、発見した知識をエキスパートシ
ステムが有する知識ベースに供給するよう構成したの
で、下記に示す効果が得られる。
では、データベースに格納したデータから正事例、負事
例、背景知識、モード宣言及びタイプ情報を少なくとも
有する入力ファイルを自動生成し、生成した入力ファイ
ルに基づく学習を通じて一階述語論理に基づく帰納推論
を行って知識を発見し、発見した知識をエキスパートシ
ステムが有する知識ベースに供給するよう構成したの
で、下記に示す効果が得られる。
【0121】1)データベースからのデータマイニング
を自動的に行うことが可能となる。
を自動的に行うことが可能となる。
【0122】2)データマイニングによって得られた知
識をエキスパートシステムの知識ベースに反映すること
ができる。
識をエキスパートシステムの知識ベースに反映すること
ができる。
【0123】また、第2の発明では、入力ファイルを生
成する際にデータベースに格納した個々のデータの属性
間の相互関係に基づいて背景知識を作成するよう構成し
たので、学習目標概念に関連する知識を帰納論理プログ
ラミングの背景知識として利用することが可能となる。
成する際にデータベースに格納した個々のデータの属性
間の相互関係に基づいて背景知識を作成するよう構成し
たので、学習目標概念に関連する知識を帰納論理プログ
ラミングの背景知識として利用することが可能となる。
【0124】さらに、第3の発明では、入力ファイルを
生成する際に正事例が有する複数の要素から一要素を除
外した条件を満たす事例のみをデータベースから抽出し
て負事例を生成するよう構成したので、負事例の総数を
低減して、データマイニングを効率良く行うことが可能
となる。
生成する際に正事例が有する複数の要素から一要素を除
外した条件を満たす事例のみをデータベースから抽出し
て負事例を生成するよう構成したので、負事例の総数を
低減して、データマイニングを効率良く行うことが可能
となる。
【図1】本実施の形態で用いる知識発見システムの全体
構成を示すブロック図。
構成を示すブロック図。
【図2】DBアンプの知識獲得処理における位置づけを
示す図。
示す図。
【図3】図2に示すDBアンプの概略構成を示す図。
【図4】本実施の形態で採用するRERモデルをCAD
に適用した場合の一例を示す図。
に適用した場合の一例を示す図。
【図5】図1に示すプリアンプが行う負事例生成の一例
を示す図。
を示す図。
【図6】図1に示すDBアンプを用いた場合と用いない
場合の負事例及び背景知識のデータ数の関係を示す図。
場合の負事例及び背景知識のデータ数の関係を示す図。
【図7】図1に示す知識発見システムをメールシステム
に適用した場合の処理の流れを示す図。
に適用した場合の処理の流れを示す図。
【図8】図7に示す事例データベースの基本構造を示す
図。
図。
【図9】図7に示す事例データベースから抽出した獲得
ルールの一例を示す図。
ルールの一例を示す図。
【図10】WWWのホームページ上に設けたメール送信
画面の一例を示す図。
画面の一例を示す図。
【図11】図7に示すエキスパートシステムからの出力
結果の一例を示す図。
結果の一例を示す図。
10…DBアンプ、 11…インデックスファイル、
12…プリアンプ、13…入力ファイル、 14…メイ
ンアンプ(PROGOL)、15…ルール、 16…エ
キスパートシステム、 17…知識ベース、18…デー
タベース、11a…生データ変換ルール、 11b…モ
ード宣言、11c…タイプ情報、 11d…要素定義、
13a…正事例、 13b…負事例、 13c…背景知
識、13d…モード宣言、 13e…タイプ情報
12…プリアンプ、13…入力ファイル、 14…メイ
ンアンプ(PROGOL)、15…ルール、 16…エ
キスパートシステム、 17…知識ベース、18…デー
タベース、11a…生データ変換ルール、 11b…モ
ード宣言、11c…タイプ情報、 11d…要素定義、
13a…正事例、 13b…負事例、 13c…背景知
識、13d…モード宣言、 13e…タイプ情報
フロントページの続き (72)発明者 岡野 洋 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内
Claims (3)
- 【請求項1】 データベースに格納したデータから知識
を発見し、発見した知識をエキスパートシステムが有す
る知識ベースに供給する知識発見システムにおいて、 正事例、負事例、背景知識、モード宣言及びタイプ情報
を少なくとも有する入力ファイルを前記データベースに
保持したデータから自動生成する自動生成手段と、 前記自動生成手段が生成した入力ファイルに基づいて学
習を行い、一階述語論理に基づく帰納推論を行う帰納推
論手段と、 を具備することを特徴とする知識発見システム。 - 【請求項2】 前記自動生成手段は、 前記データベースに格納した個々のデータの属性間の相
互関係に基づいて背景知識を生成する背景知識生成手段
を具備することを特徴とする請求項1記載の知識発見シ
ステム。 - 【請求項3】 前記自動生成手段は、 正事例が有する複数の要素から一要素を除外した条件を
満たす事例のみを前記データベースから抽出して負事例
を生成する負事例生成手段をさらに具備することを特徴
とする請求項2記載の知識発見システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8164612A JPH1011292A (ja) | 1996-06-25 | 1996-06-25 | 知識発見システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8164612A JPH1011292A (ja) | 1996-06-25 | 1996-06-25 | 知識発見システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1011292A true JPH1011292A (ja) | 1998-01-16 |
Family
ID=15796507
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8164612A Pending JPH1011292A (ja) | 1996-06-25 | 1996-06-25 | 知識発見システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1011292A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11345201A (ja) * | 1998-05-29 | 1999-12-14 | Ntt Data Corp | 情報提供システム及び情報提供ネットワークシステム |
| US6581051B1 (en) | 1999-01-11 | 2003-06-17 | Matsushita Electric Industrial Co., Ltd. | Agent presentation apparatus |
| KR100433531B1 (ko) * | 2001-12-11 | 2004-05-31 | 삼성전자주식회사 | 사용자 개인 정보 데이터 관리 방법, 사용자 개인 정보 데이터 관리 컴퓨터 및 기록매체 |
| JP2006500654A (ja) * | 2002-09-20 | 2006-01-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | コンピュータ・システムにおける適応型問題判別及びリカバリー |
| JP2007179397A (ja) * | 2005-12-28 | 2007-07-12 | Taka:Kk | 顧客サポートシステム |
| JP2011090413A (ja) * | 2009-10-20 | 2011-05-06 | Canon Inc | 画像認識装置、その処理方法及びプログラム |
| JP2013537655A (ja) * | 2010-06-22 | 2013-10-03 | プライマル フュージョン インコーポレイテッド | 複雑な知識表現を分析および合成するシステムおよび方法 |
-
1996
- 1996-06-25 JP JP8164612A patent/JPH1011292A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11345201A (ja) * | 1998-05-29 | 1999-12-14 | Ntt Data Corp | 情報提供システム及び情報提供ネットワークシステム |
| US6581051B1 (en) | 1999-01-11 | 2003-06-17 | Matsushita Electric Industrial Co., Ltd. | Agent presentation apparatus |
| KR100433531B1 (ko) * | 2001-12-11 | 2004-05-31 | 삼성전자주식회사 | 사용자 개인 정보 데이터 관리 방법, 사용자 개인 정보 데이터 관리 컴퓨터 및 기록매체 |
| JP2006500654A (ja) * | 2002-09-20 | 2006-01-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | コンピュータ・システムにおける適応型問題判別及びリカバリー |
| JP2007179397A (ja) * | 2005-12-28 | 2007-07-12 | Taka:Kk | 顧客サポートシステム |
| JP2011090413A (ja) * | 2009-10-20 | 2011-05-06 | Canon Inc | 画像認識装置、その処理方法及びプログラム |
| JP2013537655A (ja) * | 2010-06-22 | 2013-10-03 | プライマル フュージョン インコーポレイテッド | 複雑な知識表現を分析および合成するシステムおよび方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112860872B (zh) | 基于自学习的配电网操作票语义合规性的校验方法及系统 | |
| Brézillon | Context in problem solving: A survey | |
| KR20230046491A (ko) | 딥러닝 언어모델과 자연어 처리기술을 이용한 프로젝트 스펙정보 분석 및 리스크 예측 방법과 시스템, 및 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체 | |
| WO1999000724A2 (en) | Method and apparatus for automatically organizing information | |
| Mashuri | Sentiment analysis in twitter using lexicon based and polarity multiplication | |
| Kashmira et al. | Generating entity relationship diagram from requirement specification based on nlp | |
| CN117033540A (zh) | 报表生成方法、装置、电子设备和介质 | |
| CN119441404A (zh) | 一种基于大语言模型实现的智能金融问答系统 | |
| CN117076661A (zh) | 面向预训练大语言模型调优的立法规划意图识别方法 | |
| CN119807351A (zh) | 一种信息处理方法、装置、设备以及存储介质 | |
| CN120316235A (zh) | 对话式企业知识问答方法、装置、存储介质及电子设备 | |
| JPH1011292A (ja) | 知識発見システム | |
| CN120256737B (zh) | 信息处理方法、电子设备及计算机可读存储介质 | |
| JP7540114B1 (ja) | 情報処理システム、情報処理方法及びプログラム | |
| CN112100395A (zh) | 一种专家合作可行性分析方法 | |
| Contissa et al. | How the law has become computable | |
| CN118626126A (zh) | 代码内容的修复方法、装置、设备、存储介质及程序产品 | |
| Cook et al. | SHAMROQ: Towards semantic models of regulations. | |
| Liu et al. | A fuzzy structure processing mechanism for graph grammar | |
| US11232088B2 (en) | Method and system for interactive search indexing | |
| Chen | English translation template retrieval based on semantic distance ontology knowledge recognition algorithm | |
| Chai et al. | RAG-Based Language Model with Enhanced Indexing Optimization for Financial Intelligent Customer Service Application | |
| Beresnev et al. | Dialogue system for service desk of complex software systems based on relational concept analysis | |
| CN120448504B (zh) | 基于多Agent大模型的客服问答处理方法、装置、设备及介质 | |
| CN119721027B (zh) | 数据处理方法和装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050726 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050921 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051018 |