JPH07129601A - 情報検索装置 - Google Patents
情報検索装置Info
- Publication number
- JPH07129601A JPH07129601A JP5276478A JP27647893A JPH07129601A JP H07129601 A JPH07129601 A JP H07129601A JP 5276478 A JP5276478 A JP 5276478A JP 27647893 A JP27647893 A JP 27647893A JP H07129601 A JPH07129601 A JP H07129601A
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- input
- natural language
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 自然言語を利用することで、情報検索の際の
検索結果の理解を容易にし、情報検索の効率を向上を図
る。また学習により、自然言語を利用した情報検索装置
の構築を容易にする。 【構成】 ユーザ入力部107で入力された検索条件を
基に、あいまい検索実行部103でデータの検索が実行
される。検索の結果は検索結果変換部106で自然言語
定義部104を参照して自然言語に変換される。変換さ
れた検索結果は出力部108で表示出力される。 【効果】 本発明により、情報検索結果の可読性が高ま
り、データの持つ傾向を容易に掴め、データベースから
情報を導く作業の効率化が図れる。本発明により、検索
効率のよい情報検索装置が容易に構築できる。
検索結果の理解を容易にし、情報検索の効率を向上を図
る。また学習により、自然言語を利用した情報検索装置
の構築を容易にする。 【構成】 ユーザ入力部107で入力された検索条件を
基に、あいまい検索実行部103でデータの検索が実行
される。検索の結果は検索結果変換部106で自然言語
定義部104を参照して自然言語に変換される。変換さ
れた検索結果は出力部108で表示出力される。 【効果】 本発明により、情報検索結果の可読性が高ま
り、データの持つ傾向を容易に掴め、データベースから
情報を導く作業の効率化が図れる。本発明により、検索
効率のよい情報検索装置が容易に構築できる。
Description
【0001】
【産業上の利用分野】本発明は、情報処理分野、制御分
野等、大量のデータを扱う分野一般に関連するものであ
り、特にデータベースの利用が盛んな分野で適用可能な
情報検索装置に関する。
野等、大量のデータを扱う分野一般に関連するものであ
り、特にデータベースの利用が盛んな分野で適用可能な
情報検索装置に関する。
【0002】
【従来の技術】本発明においてデータとは、ビジネス分
野における顧客情報、営業情報、また制御分野における
プラントの運転履歴、運転状態のデータなどを指す。こ
れらのデータは、数値データの場合もあれば、記号デー
タの場合もあり、通常データベースと呼ばれるデータ記
憶システムに蓄えらることが多いが、これ以外にもプラ
ント装置等で、プラントからオンラインで転送されてく
る場合もある。
野における顧客情報、営業情報、また制御分野における
プラントの運転履歴、運転状態のデータなどを指す。こ
れらのデータは、数値データの場合もあれば、記号デー
タの場合もあり、通常データベースと呼ばれるデータ記
憶システムに蓄えらることが多いが、これ以外にもプラ
ント装置等で、プラントからオンラインで転送されてく
る場合もある。
【0003】データベースは、通常、磁気記憶装置等よ
り構成され、データの一括管理、すなわちデータの整理
・保管を最大の利用目的としている。データベースに記
憶されている内容は、要求に応じて自由に読み出した
り、書き換えたりすることが可能であり、データベース
を利用することで、大量のデータを効率的に管理するこ
とが可能になる。このような利用法は、データベースの
1次的な利用であり、現在の中心的な利用法となってい
る。
り構成され、データの一括管理、すなわちデータの整理
・保管を最大の利用目的としている。データベースに記
憶されている内容は、要求に応じて自由に読み出した
り、書き換えたりすることが可能であり、データベース
を利用することで、大量のデータを効率的に管理するこ
とが可能になる。このような利用法は、データベースの
1次的な利用であり、現在の中心的な利用法となってい
る。
【0004】1次的な利用法に加えて、データの解析を
行ない、様々な有益な情報を導き出す高度な利用法、す
なわちデータベースの2次的な利用の開発が進められて
いる。例えばビジネス分野であれば顧客の個々のデータ
の管理を行なう1次的な利用方法に加え、顧客の情報を
解析して営業戦略に役立てる2次的な利用方法の開発が
進められている。
行ない、様々な有益な情報を導き出す高度な利用法、す
なわちデータベースの2次的な利用の開発が進められて
いる。例えばビジネス分野であれば顧客の個々のデータ
の管理を行なう1次的な利用方法に加え、顧客の情報を
解析して営業戦略に役立てる2次的な利用方法の開発が
進められている。
【0005】データベースの1次的な利用の技術として
は、データベースから目的の情報を取り出すための情報
検索技術がある。情報検索技術とは、データベース等に
アクセスして目的の情報を得る技術であり、このなか
で、人間の用いる自然言語による検索を扱うものとし
て、あいまい検索技術(以下、従来技術1と呼ぶ)が提
案されている。従来技術1の例としては、寺野寿郎、浅
居喜代治、菅野道夫共編「ファジィシステム入門」(オ
ーム社刊)205ページから207ページ記載のものが
ある。
は、データベースから目的の情報を取り出すための情報
検索技術がある。情報検索技術とは、データベース等に
アクセスして目的の情報を得る技術であり、このなか
で、人間の用いる自然言語による検索を扱うものとし
て、あいまい検索技術(以下、従来技術1と呼ぶ)が提
案されている。従来技術1の例としては、寺野寿郎、浅
居喜代治、菅野道夫共編「ファジィシステム入門」(オ
ーム社刊)205ページから207ページ記載のものが
ある。
【0006】データベースの2次的な利用の技術として
は、データの統計的な性質を調べる統計解析技術などが
ある。
は、データの統計的な性質を調べる統計解析技術などが
ある。
【0007】以下、熱ボイラーの稼働状況のデータを対
象に、従来技術の説明を行なう。今、ボイラー装置の稼
働状況を管理するデータベースがあるとする。ボイラー
装置は、内部状態が、「ボイラー内温度」および「ボイ
ラー内圧力」の値で表現される。ボイラー装置は、圧力
弁を介して内部状態の制御が行なわれる。「圧力弁制御
量」は圧力弁の開度であり、簡単には、圧力弁を開くと
ボイラーの温度および圧力が下がり、逆に閉じると温度
および圧力が上昇する。ボイラーのデータベースには複
数のボイラー装置のデータが記録されている。ボイラー
のデータは、「ボイラー名」、「時刻」、「ボイラー内
温度」、「ボイラー内圧力」、「圧力弁制御量」、の5
項目からなる。データベースに記憶されている内容の一
部を表1に示す。データの項目の内、ボイラー名は記号
データで、それ以外は数値データである。
象に、従来技術の説明を行なう。今、ボイラー装置の稼
働状況を管理するデータベースがあるとする。ボイラー
装置は、内部状態が、「ボイラー内温度」および「ボイ
ラー内圧力」の値で表現される。ボイラー装置は、圧力
弁を介して内部状態の制御が行なわれる。「圧力弁制御
量」は圧力弁の開度であり、簡単には、圧力弁を開くと
ボイラーの温度および圧力が下がり、逆に閉じると温度
および圧力が上昇する。ボイラーのデータベースには複
数のボイラー装置のデータが記録されている。ボイラー
のデータは、「ボイラー名」、「時刻」、「ボイラー内
温度」、「ボイラー内圧力」、「圧力弁制御量」、の5
項目からなる。データベースに記憶されている内容の一
部を表1に示す。データの項目の内、ボイラー名は記号
データで、それ以外は数値データである。
【0008】従来技術1のあいまい検索技術について説
明する。
明する。
【0009】今、上記のボイラーの稼働状況データベー
スを、任意の項目、例えばボイラー名により検索する。
通常の検索では、記号データの項目については検索条件
を記号で入力し、数値データの項目については検索条件
を数値または、数式等で入力する。具体的な検索条件と
しては、例えば、 検索条件:(ボイラー名 = ”ボイラー1”)、 検索条件:(200度 < ボイラー内温度 < 300
度)、 などと設定する。
スを、任意の項目、例えばボイラー名により検索する。
通常の検索では、記号データの項目については検索条件
を記号で入力し、数値データの項目については検索条件
を数値または、数式等で入力する。具体的な検索条件と
しては、例えば、 検索条件:(ボイラー名 = ”ボイラー1”)、 検索条件:(200度 < ボイラー内温度 < 300
度)、 などと設定する。
【0010】数値データを検索する場合、人間の用いる
自然言語で検索条件を設定できると直観的で分かりやす
い。すなわち次のような設定である。
自然言語で検索条件を設定できると直観的で分かりやす
い。すなわち次のような設定である。
【0011】検索条件:(ボイラー内温度 = 高い)。
【0012】しかしながらこの場合、自然言語の「高
い」が具体的にどのような数値の範囲を指すかあいまい
であるため、データにアクセスする際の直接の検索条件
として扱えない。そこでファジィ論理を用いたあいまい
検索技術によりこの点を解決する。なお、ファジィ論理
の詳細は向殿政男著「ファジィのはなし」(日刊工業新
聞社刊,13頁〜65頁)等に詳しい。
い」が具体的にどのような数値の範囲を指すかあいまい
であるため、データにアクセスする際の直接の検索条件
として扱えない。そこでファジィ論理を用いたあいまい
検索技術によりこの点を解決する。なお、ファジィ論理
の詳細は向殿政男著「ファジィのはなし」(日刊工業新
聞社刊,13頁〜65頁)等に詳しい。
【0013】あいまい検索の実行手順を図16に示す。
図16中、ステップ1601でユーザは検索条件を入力
する。ここでは、次の検索条件を考える。
図16中、ステップ1601でユーザは検索条件を入力
する。ここでは、次の検索条件を考える。
【0014】検索条件:((ボイラー名=”ボイラー
1”)かつ(ボイラー内温度=高い))。
1”)かつ(ボイラー内温度=高い))。
【0015】検索条件には数値データであるボイラー内
温度の項目に、「高い」という自然言語が入力されてい
る。ステップ1602では、検索条件のうち数値データ
の項目に自然言語で入力があった、「ボイラー内温度=
高い」をファジィメンバシップ関数に対応づけ、数値デ
ータを扱える形に変換する。「ボイラー内温度が高い」
には、図17に示すようなファジィメンバシップ関数を
対応させる。ファジィメンバシップ関数は予め定義され
ているものとする。
温度の項目に、「高い」という自然言語が入力されてい
る。ステップ1602では、検索条件のうち数値データ
の項目に自然言語で入力があった、「ボイラー内温度=
高い」をファジィメンバシップ関数に対応づけ、数値デ
ータを扱える形に変換する。「ボイラー内温度が高い」
には、図17に示すようなファジィメンバシップ関数を
対応させる。ファジィメンバシップ関数は予め定義され
ているものとする。
【0016】次にステップ1603でデータ検索が実行
される。検索条件は、記号データであるボイラー名とフ
ァジィメンバシップ関数に変換されているボイラー内温
度である。
される。検索条件は、記号データであるボイラー名とフ
ァジィメンバシップ関数に変換されているボイラー内温
度である。
【0017】ステップ1603のデータ検索の詳細な手
順を図18に示す。
順を図18に示す。
【0018】まずステップ1801〜1804で、デー
タベース内の全てのデータについて、検索条件に対する
適合度を算定する。ここで適合度とは、データが検索条
件にどれだけ適合しているかを示す[0,1]の連続値
であり、検索条件が完全に適合していれば1になる。条
件が記号データの場合は、項目が一致した場合に適合度
が1、そうでない場合に0の2値をとる。
タベース内の全てのデータについて、検索条件に対する
適合度を算定する。ここで適合度とは、データが検索条
件にどれだけ適合しているかを示す[0,1]の連続値
であり、検索条件が完全に適合していれば1になる。条
件が記号データの場合は、項目が一致した場合に適合度
が1、そうでない場合に0の2値をとる。
【0019】ステップ1802およびステップ1803
では、データの個々の検索条件に対する適合度を求め
る。個々の検索条件とは検索条件の各要素、すなわち
「ボイラー名=ボイラー1」および「ボイラー内温度=
高い」を指す。
では、データの個々の検索条件に対する適合度を求め
る。個々の検索条件とは検索条件の各要素、すなわち
「ボイラー名=ボイラー1」および「ボイラー内温度=
高い」を指す。
【0020】検索条件の要素は、 要素1:(ボイラー名=”ボイラー1”)、 要素2:(ボイラー内温度 = 高い)、 であるから、例えば表1の番号4のデータに対する適合
度はそれぞれ、 要素1に対する適合度=1、 要素2に対する適合度=0.5、 となる。
度はそれぞれ、 要素1に対する適合度=1、 要素2に対する適合度=0.5、 となる。
【0021】個々の検索条件全てについて適合度が算定
されたら、ステップ1804において検索条件の各要素
の適合度から、検索条件全体に対する適合度を求める。
適合度同士の演算には、様々なファジィ演算が適用可能
である。ファジィ演算については、前述の向殿政男著
「ファジィのはなし」(日刊工業新聞社刊,13頁〜6
5頁)等に詳しい。ここでは、ファジィ演算のなかのM
IN-MAX演算を例に説明する。このMIN-MAX演
算は、要素が「かつ」で結合されている時は、その要素
の内のミニマム、すなわち小さい方を全体の値とし、要
素が「または」で結合されている時はその要素の内のマ
キシマム、すなわち大きい方を全体の値とする演算であ
る。
されたら、ステップ1804において検索条件の各要素
の適合度から、検索条件全体に対する適合度を求める。
適合度同士の演算には、様々なファジィ演算が適用可能
である。ファジィ演算については、前述の向殿政男著
「ファジィのはなし」(日刊工業新聞社刊,13頁〜6
5頁)等に詳しい。ここでは、ファジィ演算のなかのM
IN-MAX演算を例に説明する。このMIN-MAX演
算は、要素が「かつ」で結合されている時は、その要素
の内のミニマム、すなわち小さい方を全体の値とし、要
素が「または」で結合されている時はその要素の内のマ
キシマム、すなわち大きい方を全体の値とする演算であ
る。
【0022】このMIN-MAX演算にしたがえば、検
索条件の要素は、「かつ」で結合されているため、先の
要素1と要素2の適合度の小さい方になり、 番号4のデータの適合度 = 0.5。
索条件の要素は、「かつ」で結合されているため、先の
要素1と要素2の適合度の小さい方になり、 番号4のデータの適合度 = 0.5。
【0023】以上の操作をデータベース中の全てのデー
タについて行ない、各データの適合度を算定して、処理
はステップ1805に進む。ステップ1805では、検
索条件を満たしているデータを選択して出力する。デー
タの適合度は、そのデータがどれだけ検索条件に適合し
ているかを示す指標であるから、適合度の大きなデータ
を選択すれば良い。適合度がどれくらいの値であれば検
索条件を満たすかは、さまざまな判断がある。例えば、
「適合度>0.5」であれば検索条件を満たしているな
どであるが、ここでは、簡単のため適合度の値が最も大
きいものを選ぶことにする。
タについて行ない、各データの適合度を算定して、処理
はステップ1805に進む。ステップ1805では、検
索条件を満たしているデータを選択して出力する。デー
タの適合度は、そのデータがどれだけ検索条件に適合し
ているかを示す指標であるから、適合度の大きなデータ
を選択すれば良い。適合度がどれくらいの値であれば検
索条件を満たすかは、さまざまな判断がある。例えば、
「適合度>0.5」であれば検索条件を満たしているな
どであるが、ここでは、簡単のため適合度の値が最も大
きいものを選ぶことにする。
【0024】この操作により選ばれるデータは、表1に
示す番号3のデータの組になる。番号3のデータが選択
されて、あいまい検索が終了する。
示す番号3のデータの組になる。番号3のデータが選択
されて、あいまい検索が終了する。
【0025】
【表1】
【0026】従来技術2について説明する。従来技術2
は、データに統計的な処理を施してデータの持つ情報を
明らかにするものである。統計処理として最も簡単に
は、データベースに含まれている各データについて平均
・分散等を調べる方法がある。さらに各項目間の関係を
調べたければ、共分散を調べる、相関係数を調べるなど
の方法がある。
は、データに統計的な処理を施してデータの持つ情報を
明らかにするものである。統計処理として最も簡単に
は、データベースに含まれている各データについて平均
・分散等を調べる方法がある。さらに各項目間の関係を
調べたければ、共分散を調べる、相関係数を調べるなど
の方法がある。
【0027】例えばデータベースに表2のデータが含ま
れているとする。「ボイラー内温度」、「ボイラー内圧
力」の平均値はそれぞれ、「300度」、「7気圧」と
なるのでこれがほぼ通常の稼働状態であると見当をつけ
ることができる。ボイラー稼働時に、これより大きく外
れた値が発生すれば、ボイラーの異常を検知することが
可能になる。
れているとする。「ボイラー内温度」、「ボイラー内圧
力」の平均値はそれぞれ、「300度」、「7気圧」と
なるのでこれがほぼ通常の稼働状態であると見当をつけ
ることができる。ボイラー稼働時に、これより大きく外
れた値が発生すれば、ボイラーの異常を検知することが
可能になる。
【0028】このようにして、データベースに蓄積され
たデータに統計処理を施すことで有用な情報を導き出す
ことができる。
たデータに統計処理を施すことで有用な情報を導き出す
ことができる。
【0029】
【発明が解決しようとする課題】従来技術1の問題点に
ついて述べる。
ついて述べる。
【0030】従来技術1は、検索条件については自然言
語で指定可能であったが、検索結果については、何の処
理も施されない。このために検索者は検索結果を理解し
づらい。例えばボイラー内温度が高い場合のボイラー内
圧力の傾向を知ることが目的で、表1のデータに対して
検索を行なう。検索条件は、検索条件:(ボイラー内温
度=高い)、とする。ただし、ファジィメンバシップ関
数および適合度算定のためのファジィ演算等は適当に定
義されているものとする。
語で指定可能であったが、検索結果については、何の処
理も施されない。このために検索者は検索結果を理解し
づらい。例えばボイラー内温度が高い場合のボイラー内
圧力の傾向を知ることが目的で、表1のデータに対して
検索を行なう。検索条件は、検索条件:(ボイラー内温
度=高い)、とする。ただし、ファジィメンバシップ関
数および適合度算定のためのファジィ演算等は適当に定
義されているものとする。
【0031】検索を実行すると、検索結果として次のよ
うに複数のデータが得られることがある。
うに複数のデータが得られることがある。
【0032】ボイラー内温度=380度、ボイラー内圧
力=7気圧。
力=7気圧。
【0033】ボイラー内温度=350度、ボイラー内圧
力=8気圧。
力=8気圧。
【0034】ボイラー内温度=320度、ボイラー内圧
力=6気圧。
力=6気圧。
【0035】この検索結果を見ると、ボイラー内温度が
高い場合のボイラー内圧力は、6〜8気圧であることが
わかる。しかしながら、6〜8気圧と言う数字が持つ意
味、例えばこの圧力の値が相対的に高いのか低いのか
は、直接にはわからない。これは、ボイラー内圧力が数
値データであり、それをそのまま表示するために生じる
問題である。これは、通常の情報検索でも同様に生じて
いた問題であり、あいまい検索によっても解決されなか
った問題である。
高い場合のボイラー内圧力は、6〜8気圧であることが
わかる。しかしながら、6〜8気圧と言う数字が持つ意
味、例えばこの圧力の値が相対的に高いのか低いのか
は、直接にはわからない。これは、ボイラー内圧力が数
値データであり、それをそのまま表示するために生じる
問題である。これは、通常の情報検索でも同様に生じて
いた問題であり、あいまい検索によっても解決されなか
った問題である。
【0036】また、従来技術1では、自然言語をファジ
ィメンバシップ関数を介して数値に変換し、検索を行な
う。検索者の意図通りに検索が行なわれるためには、フ
ァジィメンバシップ関数の形状がデータベースの内容を
十分に反映している必要がある。しかしながら、ファジ
ィメンバシップ関数の形状をデータベースに適合するよ
うに調整する作業は、多大な試行錯誤が必要であり、あ
いまい検索装置の構築効率低下の問題を招いている。
ィメンバシップ関数を介して数値に変換し、検索を行な
う。検索者の意図通りに検索が行なわれるためには、フ
ァジィメンバシップ関数の形状がデータベースの内容を
十分に反映している必要がある。しかしながら、ファジ
ィメンバシップ関数の形状をデータベースに適合するよ
うに調整する作業は、多大な試行錯誤が必要であり、あ
いまい検索装置の構築効率低下の問題を招いている。
【0037】このように、従来技術1では、第1に検索
結果が数値データを含む場合に検索結果の持つ意味が直
観的には理解が難しい点、第2にファジィメンバシップ
関数の調整に多大な労力が必要な点、の2点が問題とな
る。
結果が数値データを含む場合に検索結果の持つ意味が直
観的には理解が難しい点、第2にファジィメンバシップ
関数の調整に多大な労力が必要な点、の2点が問題とな
る。
【0038】従来技術2の問題点について述べる。
【0039】従来技術2の統計的な手法は、あくまでも
データの統計的な性質について調べるものであり、統計
上で発生頻度の少ない事柄を調べるには不適当である。
上記のボイラーの例でいえば、異常稼働時のデータであ
る。異常稼働時のデータは正常稼働時のデータに較べ、
出現頻度が低い。そのため得られたデータに直接統計解
析を行なうと、異常稼働時のデータが圧倒的多数の正常
稼働時のデータに埋もれる事態が発生し、解析が不可能
になる。例えば正常稼働時と異常稼働時の出現頻度が1
00対1の場合、異常稼働時のデータがデータ全体の平
均値に与える影響は100対1であり、平均値を調べて
も異常稼働時の状況は解析できない。
データの統計的な性質について調べるものであり、統計
上で発生頻度の少ない事柄を調べるには不適当である。
上記のボイラーの例でいえば、異常稼働時のデータであ
る。異常稼働時のデータは正常稼働時のデータに較べ、
出現頻度が低い。そのため得られたデータに直接統計解
析を行なうと、異常稼働時のデータが圧倒的多数の正常
稼働時のデータに埋もれる事態が発生し、解析が不可能
になる。例えば正常稼働時と異常稼働時の出現頻度が1
00対1の場合、異常稼働時のデータがデータ全体の平
均値に与える影響は100対1であり、平均値を調べて
も異常稼働時の状況は解析できない。
【0040】これを防ぐためには、元のデータから異常
時のデータを選り分けた上で、解析を行なえば良い。し
かしながら、この選り分けを行なうためにはボイラーの
異常稼働状態に関する事前の知識が必要である。データ
の解析を行なう前に、そのデータの持つ傾向や性質を知
ることは一般にあまり期待できない。また事前の知識が
あったとしても、これによりデータを選り分ける作業
は、情報検索の効率の低下を招く。
時のデータを選り分けた上で、解析を行なえば良い。し
かしながら、この選り分けを行なうためにはボイラーの
異常稼働状態に関する事前の知識が必要である。データ
の解析を行なう前に、そのデータの持つ傾向や性質を知
ることは一般にあまり期待できない。また事前の知識が
あったとしても、これによりデータを選り分ける作業
は、情報検索の効率の低下を招く。
【0041】このように従来技術2では、統計的手法の
成否がデータの性質に左右される問題があり、また、目
的の情報を正確に取り出すためには、非常な労力が必要
になる点が問題になる。
成否がデータの性質に左右される問題があり、また、目
的の情報を正確に取り出すためには、非常な労力が必要
になる点が問題になる。
【0042】本発明の第1の目的は、上記従来例1の第
1の問題点を克服し、データベース等の検索結果に数値
データの項目が含まれる際には、これを自然言語に変換
して可読性を高め、情報検索の効率向上を図ることにあ
る。
1の問題点を克服し、データベース等の検索結果に数値
データの項目が含まれる際には、これを自然言語に変換
して可読性を高め、情報検索の効率向上を図ることにあ
る。
【0043】本発明の第2の目的は、上記従来例1の第
2の問題点を克服し、ファジィメンバシップ関数の調整
を自動化することで、情報検索装置の構築の効率向上を
図ることにある。
2の問題点を克服し、ファジィメンバシップ関数の調整
を自動化することで、情報検索装置の構築の効率向上を
図ることにある。
【0044】本発明の第3の目的は、上記従来例2の問
題点を克服し、データの持つ傾向を掴むことを容易とす
ることで、情報検索により情報を導き出す作業の効率化
を図ることにある。
題点を克服し、データの持つ傾向を掴むことを容易とす
ることで、情報検索により情報を導き出す作業の効率化
を図ることにある。
【0045】
【課題を解決するための手段】本発明は、データベース
検索結果に数値データの項目が含まれる場合、これを自
然言語に変換する手段を具備する。
検索結果に数値データの項目が含まれる場合、これを自
然言語に変換する手段を具備する。
【0046】本発明は、データベース検索結果に数値デ
ータの項目が含まれる場合、これを自然言語に変換する
手段、さらに検索条件および検索結果の項目のうち数値
データの項目にはファジィメンバシップ関数を対応させ
る手段を具備する。
ータの項目が含まれる場合、これを自然言語に変換する
手段、さらに検索条件および検索結果の項目のうち数値
データの項目にはファジィメンバシップ関数を対応させ
る手段を具備する。
【0047】本発明は、データベース検索において、数
値データの項目を自然言語を用いて検索する場合、自然
言語の対応する具体的な検索条件の数値を、ユーザの明
示的な指定なしに決定する手段を具備する。
値データの項目を自然言語を用いて検索する場合、自然
言語の対応する具体的な検索条件の数値を、ユーザの明
示的な指定なしに決定する手段を具備する。
【0048】本発明は、データベース等において、数値
データの項目に自然言語を対応させ、次に自然言語と数
値データを結びつけるファジィメンバシップ関数を対応
させ、さらにファジィメンバシップ関数の形状を、ユー
ザの指定した学習データを基に、自動的に決定する手段
を具備する。
データの項目に自然言語を対応させ、次に自然言語と数
値データを結びつけるファジィメンバシップ関数を対応
させ、さらにファジィメンバシップ関数の形状を、ユー
ザの指定した学習データを基に、自動的に決定する手段
を具備する。
【0049】本発明は、データベースのデータをディス
プレイ画面上でユーザに提示し、さらにマウス等の指示
手段により、ユーザが学習データを指定する手段を具備
し、この学習データを基に自然言語の対応する具体的な
検索条件の数値を決定する手段を具備する。
プレイ画面上でユーザに提示し、さらにマウス等の指示
手段により、ユーザが学習データを指定する手段を具備
し、この学習データを基に自然言語の対応する具体的な
検索条件の数値を決定する手段を具備する。
【0050】本発明は、検索結果の項目および値の組合
せに対して、検索結果のデータがどの程度合致している
か示す手段を具備する。
せに対して、検索結果のデータがどの程度合致している
か示す手段を具備する。
【0051】
【作用】本発明は、ファジィメンバシップ関数等を利用
して、データベース等の数値データの項目に自然言語を
対応させる。これにより検索結果に数値データが含まれ
る場合でも、ユーザは、検索結果を自然言語により得る
ことが可能になる。
して、データベース等の数値データの項目に自然言語を
対応させる。これにより検索結果に数値データが含まれ
る場合でも、ユーザは、検索結果を自然言語により得る
ことが可能になる。
【0052】本発明は、データベース等の中の数値デー
タの項目と、ユーザが定義した自然言語の対応関係を、
ユーザの指定した学習データを基に自動的に決定する。
これにより、ユーザは学習データを指定するだけで、数
値データの項目と自然言語を対応づけることが可能にな
る。
タの項目と、ユーザが定義した自然言語の対応関係を、
ユーザの指定した学習データを基に自動的に決定する。
これにより、ユーザは学習データを指定するだけで、数
値データの項目と自然言語を対応づけることが可能にな
る。
【0053】本発明は、データベース等の中の数値デー
タの項目と、ユーザが定義した自然言語の対応関係を決
定しているファジィメンバシップ関数を、ユーザの指定
した学習データを基に自動的に決定する。これにより、
ユーザは学習データを指定するだけで、ファジィメンバ
シップ関数の定義が可能になる。
タの項目と、ユーザが定義した自然言語の対応関係を決
定しているファジィメンバシップ関数を、ユーザの指定
した学習データを基に自動的に決定する。これにより、
ユーザは学習データを指定するだけで、ファジィメンバ
シップ関数の定義が可能になる。
【0054】本発明は、検索結果の持つ傾向を、データ
の項目と自然言語の組合せで示す。これにより、ユーザ
は検索結果の持つ傾向を簡単に知ることが可能になる。
の項目と自然言語の組合せで示す。これにより、ユーザ
は検索結果の持つ傾向を簡単に知ることが可能になる。
【0055】
【実施例】本発明の実施例について図面を用いて詳細に
説明する。例としてボイラーの稼働状況のデータを対象
に説明を行なう。今、ボイラー装置の稼働状況を管理す
るデータベースがあるとする。ボイラー装置の内部状態
は、「ボイラー内温度」および「ボイラー内圧力」の値
で表現される。ボイラー装置は、内部状態の制御が圧力
弁を介して行なわれ、「圧力弁制御量」の値は、オペレ
ータの行なった操作を示す。「圧力弁制御量」は圧力弁
の開度であり、簡単には、圧力弁を開くとボイラーの温
度、圧力が下がり、逆に閉じると温度圧力が上昇する傾
向にある。ボイラーのデータベースには、複数のボイラ
ー装置のデータが記録されている。前記表1で示される
ように、ボイラーのデータの項目は、「ボイラー名」、
「時刻」、「ボイラー内温度」、「ボイラー内圧力」、
「圧力弁制御量」、の5項目からなる。データベースに
記憶されている内容の一部が表2であるとする。各項目
の内、ボイラー名は記号データで、それ以外は数値デー
タである。
説明する。例としてボイラーの稼働状況のデータを対象
に説明を行なう。今、ボイラー装置の稼働状況を管理す
るデータベースがあるとする。ボイラー装置の内部状態
は、「ボイラー内温度」および「ボイラー内圧力」の値
で表現される。ボイラー装置は、内部状態の制御が圧力
弁を介して行なわれ、「圧力弁制御量」の値は、オペレ
ータの行なった操作を示す。「圧力弁制御量」は圧力弁
の開度であり、簡単には、圧力弁を開くとボイラーの温
度、圧力が下がり、逆に閉じると温度圧力が上昇する傾
向にある。ボイラーのデータベースには、複数のボイラ
ー装置のデータが記録されている。前記表1で示される
ように、ボイラーのデータの項目は、「ボイラー名」、
「時刻」、「ボイラー内温度」、「ボイラー内圧力」、
「圧力弁制御量」、の5項目からなる。データベースに
記憶されている内容の一部が表2であるとする。各項目
の内、ボイラー名は記号データで、それ以外は数値デー
タである。
【0056】
【表2】
【0057】本発明の第1の実施例を図面を用いて詳細
に説明する。第1の実施例は、検索結果の自然言語によ
る出力である。すなわち、データベース等の検索結果に
数値データの項目が含まれている際に、これを自然言語
に変換して可読性を高めることで検索システムの操作性
を向上させ、情報検索の効率向上を図る。
に説明する。第1の実施例は、検索結果の自然言語によ
る出力である。すなわち、データベース等の検索結果に
数値データの項目が含まれている際に、これを自然言語
に変換して可読性を高めることで検索システムの操作性
を向上させ、情報検索の効率向上を図る。
【0058】図1は本発明の第1の実施例の情報検索装
置の概要である。図1中、データ記憶部101とデータ
アクセス部105により、通常のデータベースが構成さ
れている。データベースには、本発明が対象とするデー
タが蓄積され、このデータは、データアクセス部に検索
条件を入力することで検索可能である。ただし、データ
ベースアクセス部105が受け付けるデータベース検索
の入力は、通常の情報検索の入力、すなわち検索するデ
ータの様式と同じものである。検索するデータが数値デ
ータであれば、数値または数式で入力し、記号データで
あれば記号で入力する必要がある。
置の概要である。図1中、データ記憶部101とデータ
アクセス部105により、通常のデータベースが構成さ
れている。データベースには、本発明が対象とするデー
タが蓄積され、このデータは、データアクセス部に検索
条件を入力することで検索可能である。ただし、データ
ベースアクセス部105が受け付けるデータベース検索
の入力は、通常の情報検索の入力、すなわち検索するデ
ータの様式と同じものである。検索するデータが数値デ
ータであれば、数値または数式で入力し、記号データで
あれば記号で入力する必要がある。
【0059】以下では、変換方式にファジィメンバシッ
プ関数およびファジィ演算を用いた方式を例に説明を行
なう。
プ関数およびファジィ演算を用いた方式を例に説明を行
なう。
【0060】ユーザ入力部107は、ディスプレイ、キ
ーボード、マウス等により構成され、ユーザからの入力
を受けつける。ユーザの検索条件入力はこのユーザ入力
部107を介して行なわれる。検索条件は、データベー
スのデータの様式と同じである必要はなく、例えば数値
データを検索する際に、自然言語で検索条件を指定して
も良い。数値データの検索条件に自然言語が指定された
際には、検索条件変換部102は自然言語定義部104
を参照して、自然言語をファジィメンバシップ関数に変
換する。
ーボード、マウス等により構成され、ユーザからの入力
を受けつける。ユーザの検索条件入力はこのユーザ入力
部107を介して行なわれる。検索条件は、データベー
スのデータの様式と同じである必要はなく、例えば数値
データを検索する際に、自然言語で検索条件を指定して
も良い。数値データの検索条件に自然言語が指定された
際には、検索条件変換部102は自然言語定義部104
を参照して、自然言語をファジィメンバシップ関数に変
換する。
【0061】あいまい検索実行部103は、変換された
検索条件入力を基に、データベースに対して従来例の
「あいまい検索」等を行ない、検索結果を得る。
検索条件入力を基に、データベースに対して従来例の
「あいまい検索」等を行ない、検索結果を得る。
【0062】検索結果変換部106は、検索結果に数値
データの項目が含まれている場合に、自然言語定義部1
04を参照し、数値データの項目を自然言語に変換す
る。検索結果出力部はディスプレイ等により構成され、
自然言語に変換された検索結果を表示出力する。
データの項目が含まれている場合に、自然言語定義部1
04を参照し、数値データの項目を自然言語に変換す
る。検索結果出力部はディスプレイ等により構成され、
自然言語に変換された検索結果を表示出力する。
【0063】自然言語定義部104は、数値データと自
然言語の変換を行なう方式を記憶する。ファジィメンバ
シップ関数の形状およびファジィ演算の方法が記憶され
ている。
然言語の変換を行なう方式を記憶する。ファジィメンバ
シップ関数の形状およびファジィ演算の方法が記憶され
ている。
【0064】本発明の情報検索装置の実行の手順を図2
に示す。図中、ステップ201の検索条件入力、ステッ
プ202の検索条件変換およびステップ203のあいま
い検索実行は、前記従来例1などと同様の手順において
行なわれる。すなわち、ステップ201で入力された検
索条件は、数値データの項目に自然言語で指定があった
場合、ステップ202において、ファジィメンバシップ
関数に変換される。ステップ203では変換された検索
条件で、従来例のあいまい検索が実行される。
に示す。図中、ステップ201の検索条件入力、ステッ
プ202の検索条件変換およびステップ203のあいま
い検索実行は、前記従来例1などと同様の手順において
行なわれる。すなわち、ステップ201で入力された検
索条件は、数値データの項目に自然言語で指定があった
場合、ステップ202において、ファジィメンバシップ
関数に変換される。ステップ203では変換された検索
条件で、従来例のあいまい検索が実行される。
【0065】ただし、上記ステップ201からステップ
203の検索は、あいまい検索ではなく、前記従来例で
述べた通常の検索方法、すなわち数値データの項目は数
値データの範囲を指定すること等で検索を行なっても良
い。
203の検索は、あいまい検索ではなく、前記従来例で
述べた通常の検索方法、すなわち数値データの項目は数
値データの範囲を指定すること等で検索を行なっても良
い。
【0066】ステップ204では、あいまい検索の検索
結果に数値データの項目が含まれている場合、これを自
然言語に変換する。変換された検索結果はステップ20
5でユーザに出力される。
結果に数値データの項目が含まれている場合、これを自
然言語に変換する。変換された検索結果はステップ20
5でユーザに出力される。
【0067】ボイラー稼働状況のデータを例に、本実施
例の情報検索の具体的な手順について説明する。今、検
索条件が、 検索条件:((ボイラー名=”ボイラー1”)かつ(ボイラ
ー内温度=高い))、 であったとする。「ボイラー内温度が高い」のファジィ
メンバシップ関数が図3に示す定義であり、適合度のフ
ァジィ演算がMIN−MAX、検索条件に適合するデー
タは適合度が最大のものを選ぶとする。あいまい検索を
実行すると表1中の番号3のデータの組が選ばれる。従
来例では、データが選択されると、これをそのまま出力
して処理は終りであるが、本発明ではこれをさらに検索
結果のデータの項目の内、数値データのものを自然言語
に変換して出力する。これは、本発明の情報検索装置で
は、図1中の検索結果変換部106であり、本発明の処
理の手順ではステップ204に対応する。
例の情報検索の具体的な手順について説明する。今、検
索条件が、 検索条件:((ボイラー名=”ボイラー1”)かつ(ボイラ
ー内温度=高い))、 であったとする。「ボイラー内温度が高い」のファジィ
メンバシップ関数が図3に示す定義であり、適合度のフ
ァジィ演算がMIN−MAX、検索条件に適合するデー
タは適合度が最大のものを選ぶとする。あいまい検索を
実行すると表1中の番号3のデータの組が選ばれる。従
来例では、データが選択されると、これをそのまま出力
して処理は終りであるが、本発明ではこれをさらに検索
結果のデータの項目の内、数値データのものを自然言語
に変換して出力する。これは、本発明の情報検索装置で
は、図1中の検索結果変換部106であり、本発明の処
理の手順ではステップ204に対応する。
【0068】ボイラー稼働状況のデータの項目は、ボイ
ラー名以外は数値データである。これら数値データは、
ステップ204で自然言語に変換される。変換は、図1
中の自然言語定義部104中に記憶されている内容に従
い、検索結果変換部106において行なわれる。図5は
変換の詳細な手順を示す。
ラー名以外は数値データである。これら数値データは、
ステップ204で自然言語に変換される。変換は、図1
中の自然言語定義部104中に記憶されている内容に従
い、検索結果変換部106において行なわれる。図5は
変換の詳細な手順を示す。
【0069】ステップ501では、変換対象の項目に対
応する自然言語の候補を選ぶ。「ボイラー内圧力」の項
目の数値を自然言語に変換するのであれば、対応する自
然言語として定義されている、「高い」および「低い」
がファジィメンバシップ関数と共に自然言語定義部10
4から読み出される。それぞれの自然言語には、図4の
ファジィメンバシップ関数が割り当てられているものと
する。
応する自然言語の候補を選ぶ。「ボイラー内圧力」の項
目の数値を自然言語に変換するのであれば、対応する自
然言語として定義されている、「高い」および「低い」
がファジィメンバシップ関数と共に自然言語定義部10
4から読み出される。それぞれの自然言語には、図4の
ファジィメンバシップ関数が割り当てられているものと
する。
【0070】ステップ502では、データの項目の数値
およびファジィメンバシップ関数から各候補の適合度を
算定する。「ボイラー内圧力」の数値、「9気圧」に対
する適合度は次のようになる。
およびファジィメンバシップ関数から各候補の適合度を
算定する。「ボイラー内圧力」の数値、「9気圧」に対
する適合度は次のようになる。
【0071】「高い」の適合度=1.0 「低い」の適合度=0.0 ステップ503では、最も適合度の高い自然言語を選択
する。すなわち、「ボイラー内圧力」の項目に対応する
自然言語として「高い」が選択される。
する。すなわち、「ボイラー内圧力」の項目に対応する
自然言語として「高い」が選択される。
【0072】他の数値データの項目も同様に処理され、
図2中のステップ204の検索出力の変換が終了する。
図2中のステップ204の検索出力の変換が終了する。
【0073】変換されたデータは、最終的にステップ2
05でユーザに対して出力される。出力は、図1中の検
索結果出力部108において、次のような内容がディス
プレイ等にされる。
05でユーザに対して出力される。出力は、図1中の検
索結果出力部108において、次のような内容がディス
プレイ等にされる。
【0074】「番号」=3 「時刻」= 正午。 「ボイラー内温度」=「高い」。 「ボイラー内圧力」=「高い」。 「圧力弁制御量」=「大」。
【0075】以上のようにして、検索結果に含まれてい
る数値データの項目を自然言語に変換することが可能に
なる。
る数値データの項目を自然言語に変換することが可能に
なる。
【0076】ちなみに、検索結果を自然言語に変換しな
い場合の出力は次のようになる。
い場合の出力は次のようになる。
【0077】「番号」=3 「時刻」= 12:00。 「ボイラー内温度」=「400°C」。 「ボイラー内圧力」=「9気圧」。 「圧力弁制御量」=「+30」。
【0078】この2つを比較すると、数値データの項目
を自然言語に変換することでデータの可読性が向上し、
検索結果の持つ意味や内容が理解しやすくなることは明
らかである。
を自然言語に変換することでデータの可読性が向上し、
検索結果の持つ意味や内容が理解しやすくなることは明
らかである。
【0079】検索結果出力部108において画面等に表
示する内容としては、図6に示すように数値および自然
言語に変換したもの両方を表示するか、またはどちらか
一方を表示する。両方表示する場合、自然言語の方は、
数値データの全データ中での傾向を示すガイド的な役割
となる。さらに自然言語表示の補助として、自然言語の
対応するメンバシップ関数の適合度、重心値等を表示し
てもよい。
示する内容としては、図6に示すように数値および自然
言語に変換したもの両方を表示するか、またはどちらか
一方を表示する。両方表示する場合、自然言語の方は、
数値データの全データ中での傾向を示すガイド的な役割
となる。さらに自然言語表示の補助として、自然言語の
対応するメンバシップ関数の適合度、重心値等を表示し
てもよい。
【0080】また、検索結果を表示する際に、自然言語
に変換したものと数値のままのものが混ざっても構わな
い。
に変換したものと数値のままのものが混ざっても構わな
い。
【0081】上記第1の実施例では、各項目の自然言語
毎にファジィメンバシップ関数を対応させたが、項目の
組合せに対してファジィメンバシップ関数を対応させて
も良い。例えば上記では、「温度が高い」にファジィメ
ンバシップ関数が対応したが、「ボイラー1の温度が高
い」、「ボイラー2の温度が高い」、等として、それぞ
れ異なるファジィメンバシップ関数を対応させても良
い。
毎にファジィメンバシップ関数を対応させたが、項目の
組合せに対してファジィメンバシップ関数を対応させて
も良い。例えば上記では、「温度が高い」にファジィメ
ンバシップ関数が対応したが、「ボイラー1の温度が高
い」、「ボイラー2の温度が高い」、等として、それぞ
れ異なるファジィメンバシップ関数を対応させても良
い。
【0082】上記第1の実施例では、数値データと自然
言語の変換にはファジィメンバシップ関数およびファジ
ィ演算を用いた。変換方式としては、ファジィメンバシ
ップ関数以外にも、定義域のみ定める、数式で与える、
等の方法を用いてもよい。また、他に条件を指定しても
よい。例えば、 {ボイラー内圧力が「高い」|ボイラー内圧力>5気圧}、 {ボイラー内圧力が「高い」|ボイラー内圧力>ボイラー内温度/50}、 {ボイラー内圧力が「高い」|(ボイラー名=”ボイラー1”かつ 時刻>12:00 かつ ボイラー内圧力>5気圧)}、 などとする方法である。この場合はそれぞれ、 ボイラー内圧力の値が5気圧より高い、 ボイラー内圧力の値がボイラー内温度の50分の1より
大きい、 ボイラー1で、時刻が12:00以降でボイラー内圧力
が5気圧より高い、 場合に、ボイラー内圧力の値を「高い」に変換する。
言語の変換にはファジィメンバシップ関数およびファジ
ィ演算を用いた。変換方式としては、ファジィメンバシ
ップ関数以外にも、定義域のみ定める、数式で与える、
等の方法を用いてもよい。また、他に条件を指定しても
よい。例えば、 {ボイラー内圧力が「高い」|ボイラー内圧力>5気圧}、 {ボイラー内圧力が「高い」|ボイラー内圧力>ボイラー内温度/50}、 {ボイラー内圧力が「高い」|(ボイラー名=”ボイラー1”かつ 時刻>12:00 かつ ボイラー内圧力>5気圧)}、 などとする方法である。この場合はそれぞれ、 ボイラー内圧力の値が5気圧より高い、 ボイラー内圧力の値がボイラー内温度の50分の1より
大きい、 ボイラー1で、時刻が12:00以降でボイラー内圧力
が5気圧より高い、 場合に、ボイラー内圧力の値を「高い」に変換する。
【0083】上記第1の実施例の検索結果の変換では、
ファジィメンバシップ関数の適合度を基準に自然言語の
選択を行なったが、これ以外にも、「数値データとファ
ジィメンバシップ関数の重心値の距離により比較を行な
う」、「適合度が0以上のものはすべて選択する」、等
の方法を用いてもよい。
ファジィメンバシップ関数の適合度を基準に自然言語の
選択を行なったが、これ以外にも、「数値データとファ
ジィメンバシップ関数の重心値の距離により比較を行な
う」、「適合度が0以上のものはすべて選択する」、等
の方法を用いてもよい。
【0084】上記第1の実施例ではデータベース等のデ
ータが数値データで、これを自然言語で検索する場合に
ついて述べたが、これとは逆に自然言語、記号等のデー
タを数値で検索することも当然可能である。この場合自
然言語設定部で上記手順のステップ204とは逆の変
換、すなわち数値データから自然言語、記号への変換を
行なうことになる。
ータが数値データで、これを自然言語で検索する場合に
ついて述べたが、これとは逆に自然言語、記号等のデー
タを数値で検索することも当然可能である。この場合自
然言語設定部で上記手順のステップ204とは逆の変
換、すなわち数値データから自然言語、記号への変換を
行なうことになる。
【0085】上記第1の実施例では、データベースから
目的のデータを取り出す手段として、あいまい検索を用
いたが、あいまい検索以外の検索方法、例えば、検索条
件をデータベースのデータと同じ様式で指定して、デー
タベースアクセス部に検索条件を直接入力するなどの通
常のデータベース検索を行なっても良い。
目的のデータを取り出す手段として、あいまい検索を用
いたが、あいまい検索以外の検索方法、例えば、検索条
件をデータベースのデータと同じ様式で指定して、デー
タベースアクセス部に検索条件を直接入力するなどの通
常のデータベース検索を行なっても良い。
【0086】本発明の第2の実施例を図面を用いて詳細
に説明する。第2の実施例は、自然言語定義の自動学習
機能である。すなわち、ユーザの指定する学習データを
基に、データベース等の中の数値データの項目と自然言
語を対応づける自然言語定義を自動学習し、自然言語定
義の設定作業の効率化をはかる。
に説明する。第2の実施例は、自然言語定義の自動学習
機能である。すなわち、ユーザの指定する学習データを
基に、データベース等の中の数値データの項目と自然言
語を対応づける自然言語定義を自動学習し、自然言語定
義の設定作業の効率化をはかる。
【0087】図7は本発明の第2の実施例の対象である
情報検索装置の概要である。データ記憶部101、検索
条件変換部102、あいまい検索実行部103、自然言
語定義部104、データアクセス部105、検索結果変
換部106、ユーザ入力部107、および検索結果出力
部108は上記第1の実施例と同じ構成である。ユーザ
の学習データ指定は、ユーザ入力部107を介して行な
われる。
情報検索装置の概要である。データ記憶部101、検索
条件変換部102、あいまい検索実行部103、自然言
語定義部104、データアクセス部105、検索結果変
換部106、ユーザ入力部107、および検索結果出力
部108は上記第1の実施例と同じ構成である。ユーザ
の学習データ指定は、ユーザ入力部107を介して行な
われる。
【0088】学習実行部701は、指定された学習デー
タに適合するように、自然言語定義部104に記憶され
ている、数値と自然言語の変換方式を調整する。
タに適合するように、自然言語定義部104に記憶され
ている、数値と自然言語の変換方式を調整する。
【0089】第2の実施例の具体的な例として、第1の
実施例の説明に用いたボイラー稼働状況のデータベース
を用いる。数値と自然言語の変換方式は、第1の実施例
の説明で用いたものと同様にファジィメンバシップ関数
とファジィ演算を用いる方式とする。この場合、ファジ
ィメンバシップ関数の形状が自動学習の対象となる。
実施例の説明に用いたボイラー稼働状況のデータベース
を用いる。数値と自然言語の変換方式は、第1の実施例
の説明で用いたものと同様にファジィメンバシップ関数
とファジィ演算を用いる方式とする。この場合、ファジ
ィメンバシップ関数の形状が自動学習の対象となる。
【0090】ボイラー稼働状況のデータベース中の項目
の「ボイラー内温度」に対応する自然言語の定義を学習
する方法について説明する。自然言語定義の学習は例え
ば図8の手順で行なわれる。図8中ステップ801から
803は順序が変わってもよい。
の「ボイラー内温度」に対応する自然言語の定義を学習
する方法について説明する。自然言語定義の学習は例え
ば図8の手順で行なわれる。図8中ステップ801から
803は順序が変わってもよい。
【0091】まずステップ801でデータの項目に対応
する自然言語を与える。これは、ユーザが与えても良い
し、予め、「大」、「中」、「小」の3つの言葉が自動
的に割り当てられる等の設定にしておいてもよい。ここ
では、データの項目が「ボイラー内温度」であるから
「高」、「中」、「低」の3つを割り当てることにす
る。
する自然言語を与える。これは、ユーザが与えても良い
し、予め、「大」、「中」、「小」の3つの言葉が自動
的に割り当てられる等の設定にしておいてもよい。ここ
では、データの項目が「ボイラー内温度」であるから
「高」、「中」、「低」の3つを割り当てることにす
る。
【0092】ステップ802では、それぞれの言葉に学
習実行前の初期値としてのファジィメンバシップ関数、
ファジィメンバシップ関数の鋳型を割り当てる。
「高」、「中」、「低」それぞれに、図9のようなファ
ジィメンバシップ関数が割り当てられたとする。この操
作も、ステップ802と同じようにユーザが与えても良
いし、例えば3角形のファジィメンバシップ関数が自動
的に割り当てられるよう設定していてもよい。
習実行前の初期値としてのファジィメンバシップ関数、
ファジィメンバシップ関数の鋳型を割り当てる。
「高」、「中」、「低」それぞれに、図9のようなファ
ジィメンバシップ関数が割り当てられたとする。この操
作も、ステップ802と同じようにユーザが与えても良
いし、例えば3角形のファジィメンバシップ関数が自動
的に割り当てられるよう設定していてもよい。
【0093】ステップ803で、自然言語の学習データ
の候補となるデータをデータベースから読み出し、ユー
ザに表示する。
の候補となるデータをデータベースから読み出し、ユー
ザに表示する。
【0094】ステップ804では、ユーザが学習データ
候補の中から自然言語に対応すべき学習データを選択す
る。これは、「高」、「中」、「低」の自然言語のそれ
ぞれに対し、該当するデータをユーザが選ぶ作業であ
る。表1のデータでは、「高」に対応するデータとして
は、「番号」が2、3、8、9等、「中」に対応するデ
ータとしては、データ番号4、5、13等、「低」に対
応するデータとしてはデータ番号1、7等が選ばれると
する。
候補の中から自然言語に対応すべき学習データを選択す
る。これは、「高」、「中」、「低」の自然言語のそれ
ぞれに対し、該当するデータをユーザが選ぶ作業であ
る。表1のデータでは、「高」に対応するデータとして
は、「番号」が2、3、8、9等、「中」に対応するデ
ータとしては、データ番号4、5、13等、「低」に対
応するデータとしてはデータ番号1、7等が選ばれると
する。
【0095】ステップ803およびステップ804の学
習データ候補の表示、ユーザの選択の方法としては、例
えば図10に示すように学習候補データを一覧表示し、
そこから学習データを選択する。表示する学習データの
候補は、データベースのデータ全てでもよいし、一部だ
けでもよい。また、数値の欠落など、学習データとして
不適当なデータは除去して表示してもよい。図中、10
01はデータベースの中のデータ一覧であり、ユーザ
は、データ一覧の表示欄をマウス等の指示手段を用いて
指定することで、学習データに加えることができる。1
002は、指示手段が現在指示している学習データ、1
003は、選択中の学習データの対応すべき自然言語の
表示であり、1004は、学習データに選択されたデー
タ番号等の表示である。このよう方法により選択された
学習データの一部を表3に示す。
習データ候補の表示、ユーザの選択の方法としては、例
えば図10に示すように学習候補データを一覧表示し、
そこから学習データを選択する。表示する学習データの
候補は、データベースのデータ全てでもよいし、一部だ
けでもよい。また、数値の欠落など、学習データとして
不適当なデータは除去して表示してもよい。図中、10
01はデータベースの中のデータ一覧であり、ユーザ
は、データ一覧の表示欄をマウス等の指示手段を用いて
指定することで、学習データに加えることができる。1
002は、指示手段が現在指示している学習データ、1
003は、選択中の学習データの対応すべき自然言語の
表示であり、1004は、学習データに選択されたデー
タ番号等の表示である。このよう方法により選択された
学習データの一部を表3に示す。
【0096】表3において、教師値の項にはデータに対
応する自然言語が表示される。
応する自然言語が表示される。
【0097】
【表3】
【0098】実際のファジィメンバシップ関数の学習は
ステップ805で実行される。学習には、各自然言語毎
に個別に学習を行なう方式(個別学習方式)と、全て同
時に行なう方式(同時学習方式)等がある。いずれも、
基本的にはメンバシップ関数の誤差を求めた後、勾配法
によりメンバシップ関数のパラメータを修正する方法で
ある。
ステップ805で実行される。学習には、各自然言語毎
に個別に学習を行なう方式(個別学習方式)と、全て同
時に行なう方式(同時学習方式)等がある。いずれも、
基本的にはメンバシップ関数の誤差を求めた後、勾配法
によりメンバシップ関数のパラメータを修正する方法で
ある。
【0099】個別学習方式について述べる。個別学習方
式の手順は例えば図11で示される。
式の手順は例えば図11で示される。
【0100】ステップ1101では、各学習データ毎に
自然言語の適合度を求め、予め与えておいた基準値との
比較を行なう。全ての学習データの適合度が基準適合度
を上回れば学習は終了する。基準適合度とは、適合度の
値がいくら以上の場合にその自然言語が成立するかを示
す値であり、例えば0.8などに設定しておく。データ
の適合度が基準適合度を上回れば、その自然言語はデー
タの数値に対応しているわけであり、自然言語のファジ
ィメンバシップ関数の形状を修正する必要がない。
自然言語の適合度を求め、予め与えておいた基準値との
比較を行なう。全ての学習データの適合度が基準適合度
を上回れば学習は終了する。基準適合度とは、適合度の
値がいくら以上の場合にその自然言語が成立するかを示
す値であり、例えば0.8などに設定しておく。データ
の適合度が基準適合度を上回れば、その自然言語はデー
タの数値に対応しているわけであり、自然言語のファジ
ィメンバシップ関数の形状を修正する必要がない。
【0101】適合度が基準適合度を下回るデータがある
場合は、ステップ1102において、該当する各データ
毎に誤差を算定する。各データに対する誤差は例えば次
式で算定される。
場合は、ステップ1102において、該当する各データ
毎に誤差を算定する。各データに対する誤差は例えば次
式で算定される。
【0102】
【数1】 ej = {(基準値) − (適合度)}2。 …(1) ステップ1103では、ステップ1102で求めた誤差
の収束の有無を判定し、収束していたら処理を終了す
る。これは、学習データに誤りがある等の理由で、ステ
ップ1701の終了条件が満たされない場合に、学習を
終了する条件である。収束の判定は、例えば次式によ
る。
の収束の有無を判定し、収束していたら処理を終了す
る。これは、学習データに誤りがある等の理由で、ステ
ップ1701の終了条件が満たされない場合に、学習を
終了する条件である。収束の判定は、例えば次式によ
る。
【0103】
【数2】 |(前回の誤差の総和)−(今回の誤差の総和)| < 0.1 …(2) ただし、誤差の総和は次で表される。
【0104】
【数3】 Σej 。 …(3) j(jは適合度が基準値未満のデータ) 誤差が収束していなかったら、ステップ1104でファ
ジィメンバシップ関数の形状を定めている形状パラメー
タに修正を加え、適合度が基準値を上回るようにファジ
ィメンバシップ関数の形状を調整する。ファジィメンバ
シップ関数の形状パラメータpiは次式等により変更す
る。
ジィメンバシップ関数の形状を定めている形状パラメー
タに修正を加え、適合度が基準値を上回るようにファジ
ィメンバシップ関数の形状を調整する。ファジィメンバ
シップ関数の形状パラメータpiは次式等により変更す
る。
【0105】
【数4】 pi ← pi + α・Σ(∂ej /∂pi)。 …(4) j(jは適合度が基準値未満のデータ) ただし、αは学習係数であり微小な値を与える。
【0106】全てのパラメータの変更が終了したらステ
ップ1101に戻る。ステップ1101〜1104の手
順を繰り返すことで、学習データに対して適合度が基準
値を越えるようにファジィメンバシップ関数の形状が修
正される。
ップ1101に戻る。ステップ1101〜1104の手
順を繰り返すことで、学習データに対して適合度が基準
値を越えるようにファジィメンバシップ関数の形状が修
正される。
【0107】以上の手順を各データの項目の各自然言語
について行なえば、目的とする図8中ステップ805の
ファジィメンバシップ関数の学習が完了する。
について行なえば、目的とする図8中ステップ805の
ファジィメンバシップ関数の学習が完了する。
【0108】次に、同時学習方式について説明する。同
時学習方式は、1つのデータの項目に対応する自然言語
全てを同時に学習する方式である。以下では、学習デー
タに対応すべき自然言語を教師値と呼ぶ。同時学習方式
の手順は例えば図12で示される。
時学習方式は、1つのデータの項目に対応する自然言語
全てを同時に学習する方式である。以下では、学習デー
タに対応すべき自然言語を教師値と呼ぶ。同時学習方式
の手順は例えば図12で示される。
【0109】表3の学習データを用いて、「ボイラー内
温度が高い」に同時学習方式を適用した場合について、
図12の手順に従って説明する。
温度が高い」に同時学習方式を適用した場合について、
図12の手順に従って説明する。
【0110】まずステップ1201およびステップ12
02で各学習データについて、データ項目に対応する自
然言語を求め、教師値と比較する。全ての学習データで
教師値と自然言語が一致すれば処理は終了する。
02で各学習データについて、データ項目に対応する自
然言語を求め、教師値と比較する。全ての学習データで
教師値と自然言語が一致すれば処理は終了する。
【0111】一致しない学習データがある場合、処理は
ステップ1203に進む。一致しなかった学習データに
ついて、これが一致するように各自然言語のファジィメ
ンバシップ関数の形状を調整する。
ステップ1203に進む。一致しなかった学習データに
ついて、これが一致するように各自然言語のファジィメ
ンバシップ関数の形状を調整する。
【0112】例えば表3のデータ番号1の学習データに
対して、「ボイラー内温度」の各自然言語の適合度は、 「高」の適合度=0.7。 「中」の適合度=0.3。 「低」の適合度=0.0。
対して、「ボイラー内温度」の各自然言語の適合度は、 「高」の適合度=0.7。 「中」の適合度=0.3。 「低」の適合度=0.0。
【0113】である。最も適合度の高いものは「高」と
なり。これが「ボイラー内温度」の自然言語として得ら
れる。しかしながら、これは教師値「中」と異なるた
め、この学習データについて、「ボイラー内温度」の
「高」、「中」、「低」のファジィメンバシップ関数の
修正が必要である。
なり。これが「ボイラー内温度」の自然言語として得ら
れる。しかしながら、これは教師値「中」と異なるた
め、この学習データについて、「ボイラー内温度」の
「高」、「中」、「低」のファジィメンバシップ関数の
修正が必要である。
【0114】ステップ1203およびステップ1204
で一致しなかった学習データを順に1つずつ取り出し、
1205〜1208でデータ項目に対応する自然言語の
ファジィメンバシップ関数の学習を行なう。
で一致しなかった学習データを順に1つずつ取り出し、
1205〜1208でデータ項目に対応する自然言語の
ファジィメンバシップ関数の学習を行なう。
【0115】まず、ステップ1205および1206で
は、データ項目に対する自然言語を順に選択する。
は、データ項目に対する自然言語を順に選択する。
【0116】ステップ1207では、選択された自然言
語の学習データに対する誤差を算定する。選択された自
然言語が教師値と一致している場合、すなわち「中」の
ファジィメンバシップ関数の誤差は、 e = {1 − (適合度)}2、 とし、それ以外で適合度が教師値の自然言語より大きい
場合、すなわち「高」のファジィメンバシップ関数の誤
差は、 e = {(教師値自然言語の適合度) − (適合度)}2、 とする。ステップ1208では算定した誤差よりファジ
ィメンバシップ関数の調整を行なう。ファジィメンバシ
ップ関数の各パラメータpiは次式等により変更する。
語の学習データに対する誤差を算定する。選択された自
然言語が教師値と一致している場合、すなわち「中」の
ファジィメンバシップ関数の誤差は、 e = {1 − (適合度)}2、 とし、それ以外で適合度が教師値の自然言語より大きい
場合、すなわち「高」のファジィメンバシップ関数の誤
差は、 e = {(教師値自然言語の適合度) − (適合度)}2、 とする。ステップ1208では算定した誤差よりファジ
ィメンバシップ関数の調整を行なう。ファジィメンバシ
ップ関数の各パラメータpiは次式等により変更する。
【0117】
【数5】 pi ← pi + α・(∂e/∂pi)。 …
(5) ただし、αは学習係数であり微小な値を与える。
(5) ただし、αは学習係数であり微小な値を与える。
【0118】以上の手順を繰り返すことにより、教師値
と一致する自然言語は適合度が大きくなる方向に、一致
しない自然言語は適合度が小さくなる方向にファジィメ
ンバシップ関数の形状が調整されていく。上記の例で
は、「高」に対応するファジィメンバシップ関数は適合
度が小さくなり、また教師値と同じ「高」に対応するフ
ァジィメンバシップ関数は適合度が大きくなる。最終的
に、学習データに対して、教師値と同じ自然言語の適合
度が最大になり、学習データに対応する自然言語は教師
値と同じものになる。
と一致する自然言語は適合度が大きくなる方向に、一致
しない自然言語は適合度が小さくなる方向にファジィメ
ンバシップ関数の形状が調整されていく。上記の例で
は、「高」に対応するファジィメンバシップ関数は適合
度が小さくなり、また教師値と同じ「高」に対応するフ
ァジィメンバシップ関数は適合度が大きくなる。最終的
に、学習データに対して、教師値と同じ自然言語の適合
度が最大になり、学習データに対応する自然言語は教師
値と同じものになる。
【0119】以上の手順を各データ項目について行なえ
ば、目的とする図8中ステップ805のファジィメンバ
シップ関数の学習が完了する。
ば、目的とする図8中ステップ805のファジィメンバ
シップ関数の学習が完了する。
【0120】学習後のファジィメンバシップ関数の形状
を図13に示す。
を図13に示す。
【0121】上記の同時学習の手順では簡単のため省略
したが、学習データに誤りがある等の場合に学習が終了
しないのを防ぐため、ステップ1203等において誤差
の収束状況を監視して、誤差が収束した場合は処理を終
了するようにしてもよい。
したが、学習データに誤りがある等の場合に学習が終了
しないのを防ぐため、ステップ1203等において誤差
の収束状況を監視して、誤差が収束した場合は処理を終
了するようにしてもよい。
【0122】上記の同時学習の手順では、ステップ12
04から1208において学習データ1つに対してファ
ジィメンバシップ関数の形状パラメータの修正を1回行
なったが、これ以外に、学習データ1つ毎の、形状パラ
メータの修正量を加算しておき、学習データ全体での修
正量の和を用いてファジィメンバシップ関数の形状を修
正してもよい。
04から1208において学習データ1つに対してファ
ジィメンバシップ関数の形状パラメータの修正を1回行
なったが、これ以外に、学習データ1つ毎の、形状パラ
メータの修正量を加算しておき、学習データ全体での修
正量の和を用いてファジィメンバシップ関数の形状を修
正してもよい。
【0123】上記第2の実施例では、数値データと自然
言語の変換にはファジィメンバシップ関数およびファジ
ィ演算を用いた。変換方式としては、ファジィメンバシ
ップ関数以外にも、定義域のみ定める、数式で与える、
等の方法を用いてもよい。また、他に条件を指定しても
よい。例えば、 {ボイラー内圧力が「高い」|ボイラー内圧力>5気圧}、 {ボイラー内圧力が「高い」|ボイラー内圧力>ボイラー内温度/50}、 {ボイラー内圧力が「高い」|(ボイラー名=”ボイラー1”かつ 時刻>12:00 かつ ボイラー内圧力>5気圧)}、 などとする方法である。
言語の変換にはファジィメンバシップ関数およびファジ
ィ演算を用いた。変換方式としては、ファジィメンバシ
ップ関数以外にも、定義域のみ定める、数式で与える、
等の方法を用いてもよい。また、他に条件を指定しても
よい。例えば、 {ボイラー内圧力が「高い」|ボイラー内圧力>5気圧}、 {ボイラー内圧力が「高い」|ボイラー内圧力>ボイラー内温度/50}、 {ボイラー内圧力が「高い」|(ボイラー名=”ボイラー1”かつ 時刻>12:00 かつ ボイラー内圧力>5気圧)}、 などとする方法である。
【0124】このような変換方式でも、上記第2の実施
例の手順中のファジィメンバシップ関数の形状パラメー
タを調整している部分、図12中ではステップ1208
に対応する部分を、数式のパラメータを調整する、条件
が成立している時だけパラメータを調整する、等に変更
すれば容易に本発明を実現することができる。
例の手順中のファジィメンバシップ関数の形状パラメー
タを調整している部分、図12中ではステップ1208
に対応する部分を、数式のパラメータを調整する、条件
が成立している時だけパラメータを調整する、等に変更
すれば容易に本発明を実現することができる。
【0125】上記第2の実施例では、データベースから
目的のデータを取り出す手段として、あいまい検索を用
いたが、あいまい検索以外の検索方法、例えば、検索条
件をデータベースのデータと同じ様式で指定して、デー
タベースアクセス部に検索条件を直接入力するなどの通
常のデータベース検索を行なっても良い。
目的のデータを取り出す手段として、あいまい検索を用
いたが、あいまい検索以外の検索方法、例えば、検索条
件をデータベースのデータと同じ様式で指定して、デー
タベースアクセス部に検索条件を直接入力するなどの通
常のデータベース検索を行なっても良い。
【0126】上記第2の実施例では、メンバシップ関数
のパラメータの修正に勾配法を用いたが、ニュトン法、
共役勾配法等の計算方法を用いても構わない。
のパラメータの修正に勾配法を用いたが、ニュトン法、
共役勾配法等の計算方法を用いても構わない。
【0127】また、最初にメンバシップ関数の鋳形を与
えて、これを修正するのではなく、クラスタリング、最
小2乗法等、公知の手法を利用して、直接に、ファジィ
メンバシップ関数の同定を行なってもよい。
えて、これを修正するのではなく、クラスタリング、最
小2乗法等、公知の手法を利用して、直接に、ファジィ
メンバシップ関数の同定を行なってもよい。
【0128】本発明の第3の実施例を図面を用いて詳細
に説明する。第3の実施例は検索結果の説明機能であ
る。すなわち、検索結果が自然言語で得られた後、さら
にデータの項目と自然言語の組合せが、検索結果にどの
ように現れたかを調べて表示し、ユーザが容易に検索結
果の傾向を把握できるようにする。
に説明する。第3の実施例は検索結果の説明機能であ
る。すなわち、検索結果が自然言語で得られた後、さら
にデータの項目と自然言語の組合せが、検索結果にどの
ように現れたかを調べて表示し、ユーザが容易に検索結
果の傾向を把握できるようにする。
【0129】図14は本発明の第3の実施例の対象であ
る情報検索装置の概要である。データ記憶部101、検
索条件変換部102、あいまい検索実行部103、自然
言語定義部104、データアクセス部105、検索結果
変換部106、およびユーザ入力部107は上記第1の
実施例と同じ構成である。
る情報検索装置の概要である。データ記憶部101、検
索条件変換部102、あいまい検索実行部103、自然
言語定義部104、データアクセス部105、検索結果
変換部106、およびユーザ入力部107は上記第1の
実施例と同じ構成である。
【0130】類似検索結果出力部1401は、検索結果
のデータから、同じ傾向を示すデータをまとめ、検索結
果全体の中での出現頻度をデータの合致度として出力す
る。
のデータから、同じ傾向を示すデータをまとめ、検索結
果全体の中での出現頻度をデータの合致度として出力す
る。
【0131】本発明の第3の実施例の具体的な手順を次
に示す。
に示す。
【0132】ステップ14.1 検索条件を入力し、検
索を行なう。
索を行なう。
【0133】ステップ14.2 得られた検索結果のう
ちで、各項目と自然言語を組合せたものが、検索結果の
データにどれだけの頻度で現れたかを求める。
ちで、各項目と自然言語を組合せたものが、検索結果の
データにどれだけの頻度で現れたかを求める。
【0134】ステップ14.3 ステップ1401.2
の結果を表示する。
の結果を表示する。
【0135】ステップ14.1では、第1の実施例で説
明した情報検索が実行される。検索結果のデータのうち
数値項目のデータは自然言語に変換されている。
明した情報検索が実行される。検索結果のデータのうち
数値項目のデータは自然言語に変換されている。
【0136】次にステップ14.1で得られた検索結果
をもとに、ステップ14.2が実行される。ステップ1
4.2では、検索結果の各項目と対応する自然言語の組
合せを作り、検索結果得られたデータに対して、それぞ
れの組合せに合致するデータおよび合致しないデータを
調べ、その組合せで検索結果のデータの傾向をどれだけ
説明できるかをデータの合致度として数値で出力する。
をもとに、ステップ14.2が実行される。ステップ1
4.2では、検索結果の各項目と対応する自然言語の組
合せを作り、検索結果得られたデータに対して、それぞ
れの組合せに合致するデータおよび合致しないデータを
調べ、その組合せで検索結果のデータの傾向をどれだけ
説明できるかをデータの合致度として数値で出力する。
【0137】第3の実施例を具体的な例により説明す
る。例えばボイラー稼働状況のデータベースに対して、
適当な検索条件によりステップ14.1を実行する。検
索の結果、「ボイラー内温度」の項目について次のよう
なデータが得られたとする。
る。例えばボイラー稼働状況のデータベースに対して、
適当な検索条件によりステップ14.1を実行する。検
索の結果、「ボイラー内温度」の項目について次のよう
なデータが得られたとする。
【0138】データ1: (ボイラー内温度が高)、 データ2: (ボイラー内温度が高)、 データ3: (ボイラー内温度が低)、 データ4: (ボイラー内温度が中)、 データ5: (ボイラー内温度が高)、 データ6: (ボイラー内温度が高)、 データ7: (ボイラー内温度が中)、 データ8: (ボイラー内温度が高)、 データ9: (ボイラー内温度が高)、 データ10:(ボイラー内温度が中)。
【0139】次にステップ14.2を実行すると、項目
と対応する自然言語の組合せに対する合致度は、それぞ
れ (ボイラー内温度が高): 0.6(10件中6件合
致)、 (ボイラー内温度が中): 0.3(10件中3件合
致)、 (ボイラー内温度が低): 0.1(10件中1件合
致)、 となる。
と対応する自然言語の組合せに対する合致度は、それぞ
れ (ボイラー内温度が高): 0.6(10件中6件合
致)、 (ボイラー内温度が中): 0.3(10件中3件合
致)、 (ボイラー内温度が低): 0.1(10件中1件合
致)、 となる。
【0140】ステップ14.3では、ステップ14.2
での結果を表示する。表示の具体的な例を図15に示
す。1501は検索条件の表示、1502はデータ項目
と自然言語の組合せの表示、1503は各組合せに対す
るデータの合致度の表示である。
での結果を表示する。表示の具体的な例を図15に示
す。1501は検索条件の表示、1502はデータ項目
と自然言語の組合せの表示、1503は各組合せに対す
るデータの合致度の表示である。
【0141】表示すべき内容が大量の場合は、データの
項目名と自然言語をユーザが選択して表示するなど、階
層的な表示方法をとってもよい。また、ここでは項目と
自然言語の組合せの中で、合致率の高いものについて表
示を行なったが、任意の項目と任意の自然語について、
検索結果に対する合致率を表示しても良い。また、必要
に応じて、合致度の大きさで並べかえを行なったりグラ
フ表示する等の加工を加えて表示してもよい。
項目名と自然言語をユーザが選択して表示するなど、階
層的な表示方法をとってもよい。また、ここでは項目と
自然言語の組合せの中で、合致率の高いものについて表
示を行なったが、任意の項目と任意の自然語について、
検索結果に対する合致率を表示しても良い。また、必要
に応じて、合致度の大きさで並べかえを行なったりグラ
フ表示する等の加工を加えて表示してもよい。
【0142】本発明の第3の実施例の情報検索システム
を利用することで、データベースに含まれている情報を
分かりやすい形で取り出すことができ、データベースか
ら情報を導き出す作業の効率化が図れる。例えば、上記
の例では、検索結果が10個のデータで得られている
が、似た傾向のものをまとめると全部で3つに整理され
ている。また、検索結果の中、「ボイラー内温度が低」
の場合、発生頻度は少なくとも、ボイラー内状況の1つ
として取り出すことが可能になっている。また、同じ傾
向のデータをまとめ、検索結果を整理して表示するた
め、ユーザが調べなければならないデータ数を減らすこ
とができ、効率的な情報検索が可能になる。
を利用することで、データベースに含まれている情報を
分かりやすい形で取り出すことができ、データベースか
ら情報を導き出す作業の効率化が図れる。例えば、上記
の例では、検索結果が10個のデータで得られている
が、似た傾向のものをまとめると全部で3つに整理され
ている。また、検索結果の中、「ボイラー内温度が低」
の場合、発生頻度は少なくとも、ボイラー内状況の1つ
として取り出すことが可能になっている。また、同じ傾
向のデータをまとめ、検索結果を整理して表示するた
め、ユーザが調べなければならないデータ数を減らすこ
とができ、効率的な情報検索が可能になる。
【0143】上記の手順のステップ14.2、ステップ
14.3では、データの項目およびデータの数が多い場
合に多大な計算時間が必要になる。また、実際に重要な
のは合致度の高い項目と自然言語の組合せを求めること
であるので、ステップ14.2では、分枝限定法など公
知の組合せ最適化手法を使って、計算時間の削減を図っ
ても良い。
14.3では、データの項目およびデータの数が多い場
合に多大な計算時間が必要になる。また、実際に重要な
のは合致度の高い項目と自然言語の組合せを求めること
であるので、ステップ14.2では、分枝限定法など公
知の組合せ最適化手法を使って、計算時間の削減を図っ
ても良い。
【0144】上記第1、第2および第3の実施例ではデ
ータは全て磁気ディスク装置等により構成されるデータ
記憶システムを想定していたが、これは例えば、データ
バス等を介して、データの送受信が行なわれる構成であ
っても差し支えない。例えばプラント装置からのデータ
がリアルタイムで送られてくるような場合、送られてく
るデータを、自然言語を含む検索条件によって選別し
て、さらに検索結果を自然言語により表示してもよい。
ータは全て磁気ディスク装置等により構成されるデータ
記憶システムを想定していたが、これは例えば、データ
バス等を介して、データの送受信が行なわれる構成であ
っても差し支えない。例えばプラント装置からのデータ
がリアルタイムで送られてくるような場合、送られてく
るデータを、自然言語を含む検索条件によって選別し
て、さらに検索結果を自然言語により表示してもよい。
【0145】また、上記第1、第2および第3の実施例
では、検索条件および検索結果の表示と実際の検索の変
換は、自然言語と数値データのみについて説明したが、
予め定義できるものでさえあれば、記号等のデータと数
値データの変換等でもよい。例えば記号xが、 x={1,2,3}、 と自然言語定義部104に定義されているとする。検索
変換部106は、検索結果のデータ中に{1,2,
3}、となるデータがあれば、これをxに変換して出力
する。
では、検索条件および検索結果の表示と実際の検索の変
換は、自然言語と数値データのみについて説明したが、
予め定義できるものでさえあれば、記号等のデータと数
値データの変換等でもよい。例えば記号xが、 x={1,2,3}、 と自然言語定義部104に定義されているとする。検索
変換部106は、検索結果のデータ中に{1,2,
3}、となるデータがあれば、これをxに変換して出力
する。
【0146】
【発明の効果】本発明により、データベース等の検索結
果に数値データの項目が含まれる際には、これが自然言
語に変換され、検索結果の可読性が高まり、情報検索の
効率が向上する。
果に数値データの項目が含まれる際には、これが自然言
語に変換され、検索結果の可読性が高まり、情報検索の
効率が向上する。
【0147】本発明により、数値と自然言語の変換を行
なうファジィメンバシップ関数の調整が自動化され、ユ
ーザはメンバシップ関数の形状を明示的に指定すること
なく、効率的に検索システムを構築可能になる。
なうファジィメンバシップ関数の調整が自動化され、ユ
ーザはメンバシップ関数の形状を明示的に指定すること
なく、効率的に検索システムを構築可能になる。
【0148】本発明により、データの持つ傾向を掴むこ
とが容易になり、データベースから情報を導き出す作業
の効率化が図れる。
とが容易になり、データベースから情報を導き出す作業
の効率化が図れる。
【図1】本発明の第1の実施例の情報検索装置。
【図2】本発明の第1の実施例の情報検索装置の情報検
索の手順。
索の手順。
【図3】本発明の第1の実施例の「ボイラー内温度が
高」のファジィメンバシップ関数。
高」のファジィメンバシップ関数。
【図4】本発明の第1の実施例の「ボイラー内圧力が
高」および「ボイラー内圧力が低」のファジィメンバシ
ップ関数。
高」および「ボイラー内圧力が低」のファジィメンバシ
ップ関数。
【図5】本発明の第1の実施例の情報検索装置の情報検
索の手順中の検索結果変換手順。
索の手順中の検索結果変換手順。
【図6】本発明の第1の実施例の情報検索装置の検索結
果の表示例。
果の表示例。
【図7】本発明の第2の実施例の情報検索装置。
【図8】本発明の第2の実施例の情報検索装置の学習実
行の手順。
行の手順。
【図9】本発明の第2の実施例の、学習前の「ボイラー
内温度が高」、「ボイラー内温度が中」、および「ボイ
ラー内温度が低」のファジィメンバシップ関数。
内温度が高」、「ボイラー内温度が中」、および「ボイ
ラー内温度が低」のファジィメンバシップ関数。
【図10】本発明の第2の実施例の学習データの指定画
面および指定方式の表示例。
面および指定方式の表示例。
【図11】本発明の第2の実施例の個別学習方式の手
順。
順。
【図12】本発明の第2の実施例の同時学習方式の手
順。
順。
【図13】本発明の第2の実施例の、学習後の「ボイラ
ー内温度が高」、「ボイラー内温度が中」、および「ボ
イラー内温度が低」のファジィメンバシップ関数。
ー内温度が高」、「ボイラー内温度が中」、および「ボ
イラー内温度が低」のファジィメンバシップ関数。
【図14】本発明の第3の実施例の情報検索装置。
【図15】本発明の第3の実施例の情報検索装置の検索
結果の説明の表示例。
結果の説明の表示例。
【図16】従来技術1のあいまい検索の手順。
【図17】従来技術1のあいまい検索で用いた、「ボイ
ラー内温度が高」のファジィメンバシップ関数。
ラー内温度が高」のファジィメンバシップ関数。
【図18】従来技術1のあいまい検索の詳細な手順。
101…データ記憶部、102…検索条件変換部、10
3…あいまい検索実行部、104…自然言語定義部、1
05…データアクセス部、106…検索結果変換部、1
07…ユーザ入力部、108…検索結果出力部、601
…検索条件表示部、602…検索結果表示部、701…
学習実行部、1001…学習データ候補一覧表示部、1
002…現在選択中の学習データ候補の表示例、100
3…教師値のデータ項目および自然言語の表示部、10
04…選択された学習データの表示部、1401…類似
検索結果出力部、1501…検索条件の表示部、150
2…データの項目と自然言語の組合せの表示部、150
3…検索結果のデータの合致度表示部。
3…あいまい検索実行部、104…自然言語定義部、1
05…データアクセス部、106…検索結果変換部、1
07…ユーザ入力部、108…検索結果出力部、601
…検索条件表示部、602…検索結果表示部、701…
学習実行部、1001…学習データ候補一覧表示部、1
002…現在選択中の学習データ候補の表示例、100
3…教師値のデータ項目および自然言語の表示部、10
04…選択された学習データの表示部、1401…類似
検索結果出力部、1501…検索条件の表示部、150
2…データの項目と自然言語の組合せの表示部、150
3…検索結果のデータの合致度表示部。
Claims (7)
- 【請求項1】データを記憶するデータ記憶手段と、該デ
ータ記憶手段にアクセスして、データの検索を行なうデ
ータ検索手段と、ユーザの入力を受け付けるユーザ入力
手段と、ユーザの入力が検索条件であった場合に、該検
索条件を上記データ検索手段の入力として適合する様式
に変換する入力変換方式を定義して記憶する入力データ
様式変換定義手段と、該定義された入力変換方式を用い
て、ユーザにより入力された検索条件を上記データ検索
手段の入力として適合する様式に変換する入力データ様
式変換手段と、上記データ検索手段を用いて該変換され
た検索条件に合致するデータの検索を行なうデータ検索
実行手段と、検索されたデータを数値と自然言語の様式
に変換する出力変換方式を定義して記憶する出力データ
様式変換定義手段と、検索されたデータに対し、該定義
された出力変換方式を用いて、数値と自然言語の変換を
行なう出力データ様式変換手段と、該変換されたデータ
をユーザに示す検索結果表示手段とからなることを特徴
とする情報検索装置。 - 【請求項2】上記出力データ様式変換手段は、数値と自
然言語の変換をおこなうための、ファジィメンバシップ
関数およびファジィ演算を用いた変換方式を記憶する手
段を含む請求項1記載の情報検索装置。 - 【請求項3】上記検索結果表示手段は、データの項目お
よび自然言語の組合せについて、その組合せが検索結果
として得られたデータ全体に占める割合等を算定して表
示する手段からなる請求項1または2記載の情報検索装
置。 - 【請求項4】データを記憶するデータ記憶手段と、該デ
ータ記憶手段にアクセスして、データの検索を行なうデ
ータ検索手段と、ユーザの入力を受け付けるユーザ入力
手段と、ユーザの入力が検索条件であった場合に、該検
索条件を上記データ検索手段の入力として適合する様式
に変換する入力変換方式を定義して記憶する入力データ
様式変換定義手段と、該定義された入力変換方式を用い
て、ユーザにより入力された検索条件を上記データ検索
手段の入力として適合する様式に変換する入力データ様
式変換手段と、上記データ検索手段を用いて該変換され
た検索条件に合致するデータの検索を行なうデータ検索
実行手段と、検索されたデータを数値と自然言語の様式
に変換する出力変換方式を定義して記憶する出力データ
様式変換定義手段と、検索されたデータに対し、該定義
された出力変換方式を用いて、数値と自然言語の変換を
行なう出力データ様式変換手段と、該変換されたデータ
をユーザに示す検索結果表示手段と、ユーザの入力が自
然言語の学習データの指定であった場合、上記入力変換
方式と出力変換方式から、指定された自然言語に対応す
る変換方式を選択し、さらに上記データ検索手段を用い
て学習データを選択し、選択した変換方式が選択した学
習データに適合するように、該変換方式を調整するデー
タ様式変換定義学習手段とからなることを特徴とする情
報検索装置。 - 【請求項5】データを記憶するデータ記憶手段と、該デ
ータ記憶手段にアクセスして、データの検索を行なうデ
ータ検索手段と、ユーザの入力を受け付けるユーザ入力
手段と、ユーザの入力が検索条件であった場合に、該検
索条件を上記データ検索手段の入力として適合する様式
に変換する入力変換方式を定義して記憶する入力データ
様式変換定義手段と、該定義された入力変換方式を用い
て、ユーザにより入力された検索条件を上記データ検索
手段の入力として適合する様式に変換する入力データ様
式変換手段と、上記データ検索手段を用いて該変換され
た検索条件に合致するデータの検索を行なうデータ検索
実行手段と、検索されたデータを数値と自然言語の様式
に変換する出力変換方式を定義して記憶する出力データ
様式変換定義手段と、検索されたデータに対し、定義さ
れた出力変換方式を用いて、数値と自然言語の変換を行
なう出力データ様式変換手段と、該変換された検索結果
のデータをユーザに示す検索結果表示手段と、入力デー
タ様式変換定義手段および出力データ様式変換定義手段
のすくなくとも一方において、ファジィメンバシップ関
数およびファジィ演算を用いた数値と自然言語の変換方
式を記憶し、ユーザの入力が自然言語の学習データの指
定であった場合、該入力データ様式変換定義手段中の変
換方式または該出力データ様式変換定義手段中の変換方
式から、指定された自然言語に対応するファジィメンバ
シップ関数およびファジィ演算からなる変換方式を選択
し、さらに上記データ検索手段を用いて学習データを選
択し、選択した変換方式が学習データに適合するよう
に、該変換方式中のファジィ演算を参照して該変換方式
中のファジィメンバシップ関数の形状を調整するデータ
様式変換定義学習手段とからなることを特徴とする情報
検索装置。 - 【請求項6】上記データ様式変換定義学習手段は、数値
と自然言語の変換について、ファジィメンバシップ関数
およびファジィ演算を用いた変換方式を記憶する入力デ
ータ様式変換定義手段および出力データ様式変換定義手
段と、ユーザの入力が自然言語の学習データの指定であ
った場合、該入力データ様式変換定義手段中の変換方式
と該出力データ様式変換定義手段中の変換方式から、指
定された自然言語に対応する変換方式を選択し、さらに
データ検索手段を用いて学習データを選択し、選択した
変換方式が学習データに適合するように、該変換方式中
のファジィ演算を参照して該変換方式中のファジィメン
バシップ関数の形状を調整するデータ様式変換定義学習
手段とからなることを特徴とする請求項5記載の情報検
索装置。 - 【請求項7】上記ユーザ入力手段は、上記入力データ様
式変換定義手段中または出力データ様式変換定義手段中
の自然言語および学習データの候補の一覧を表示するデ
ィスプレイ画面と、マウス等の指示手段によりユーザに
指定された自然言語または学習データを、ハイライト表
示、ディスプレイ画面上の他の領域に別個に表示する手
段からなることを特徴する請求項6記載の情報検索装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5276478A JPH07129601A (ja) | 1993-11-05 | 1993-11-05 | 情報検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5276478A JPH07129601A (ja) | 1993-11-05 | 1993-11-05 | 情報検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07129601A true JPH07129601A (ja) | 1995-05-19 |
Family
ID=17570017
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5276478A Pending JPH07129601A (ja) | 1993-11-05 | 1993-11-05 | 情報検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07129601A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08297534A (ja) * | 1995-04-27 | 1996-11-12 | Brother Ind Ltd | 座標入力装置 |
| JP2001014321A (ja) * | 1999-06-28 | 2001-01-19 | Toshiba Corp | 情報検索方法および情報検索装置 |
| JP2017165407A (ja) * | 2010-10-22 | 2017-09-21 | トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド | 障害物の近くに車両を駐車させるための方法及びシステム |
-
1993
- 1993-11-05 JP JP5276478A patent/JPH07129601A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08297534A (ja) * | 1995-04-27 | 1996-11-12 | Brother Ind Ltd | 座標入力装置 |
| JP2001014321A (ja) * | 1999-06-28 | 2001-01-19 | Toshiba Corp | 情報検索方法および情報検索装置 |
| JP2017165407A (ja) * | 2010-10-22 | 2017-09-21 | トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド | 障害物の近くに車両を駐車させるための方法及びシステム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1209582B1 (en) | Document retrieval method and system and computer readable storage medium | |
| US20210173817A1 (en) | Method and system for large scale data curation | |
| AU781157B2 (en) | Document-classification system, method and software | |
| US20020069197A1 (en) | Method and apparatus for categorizing information, and a computer product | |
| US20140229476A1 (en) | System for Information Discovery & Organization | |
| JPH0877010A (ja) | データ分析方法および装置 | |
| WO2002073531A1 (en) | One-step data mining with natural language specification and results | |
| EP1623344B1 (en) | Presentation of data using meta-morphing | |
| JP2005501321A (ja) | ドキュメントを自動的にインデックスする方法 | |
| US9594755B2 (en) | Electronic document repository system | |
| KR100877156B1 (ko) | 비정형 질의언어에 대한 사전 성능 분석 시스템 및 방법 | |
| US7779018B2 (en) | Presentation of data using meta-morphing | |
| CN120565123B (zh) | 一种基于多模态大模型的疾病预测与辅助诊断系统构建方法及系统 | |
| CN119537520A (zh) | 一种基于语言大模型的企业管理制度问答控制方法及系统 | |
| CN121009966B (zh) | 一种基于知识库的模型蒸馏方法和装置 | |
| US7325005B2 (en) | System and method for category discovery | |
| CN121434365A (zh) | 一种基于半导体知识库的搭建与应用方法、设备及介质 | |
| Kravets et al. | Research of the LDA algorithm results for patents texts processing | |
| JPH07129601A (ja) | 情報検索装置 | |
| CN117725229B (zh) | 一种知识组织体系辅助更新方法 | |
| CN119293342A (zh) | 一种面向科学领域的智能技术动态追踪系统 | |
| JPH0394375A (ja) | 文書検索装置 | |
| CN119443574A (zh) | 一种基于ai大语言模型的专家与项目匹配方法 | |
| Appavu et al. | Knowledge-based system for text classification using ID6NB algorithm | |
| Campbell et al. | An approach for the capture of context-dependent document relationships extracted from Bayesian analysis of users' interactions with information |