JP2000276487A - 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体 - Google Patents

事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体

Info

Publication number
JP2000276487A
JP2000276487A JP11083027A JP8302799A JP2000276487A JP 2000276487 A JP2000276487 A JP 2000276487A JP 11083027 A JP11083027 A JP 11083027A JP 8302799 A JP8302799 A JP 8302799A JP 2000276487 A JP2000276487 A JP 2000276487A
Authority
JP
Japan
Prior art keywords
case
sentence
search
similar
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11083027A
Other languages
English (en)
Inventor
Yasuhiro Takayama
泰博 高山
Katsushi Suzuki
克志 鈴木
Takeyuki Aikawa
勇之 相川
Yamahiko Ito
山彦 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11083027A priority Critical patent/JP2000276487A/ja
Publication of JP2000276487A publication Critical patent/JP2000276487A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】事例蓄積・検索対象が自然言語で記述された複
数の事例文からなる複雑な事例に対しても類似検索によ
って問題の解決を容易にする事例蓄積・検索技術を提供
する。 【解決手段】電子化文書中から種別毎に各々の事例文を
切出す処理対象文抽出手段と、類似文照合手段が領域オ
ントロジ(事例蓄積・検索対象領域依存知識)を用いて
求めた前記各々の事例文同士の構文構造的・意味的な類
似度に基づいて類似事例文を分類して類似事例データを
作成して事例データベースに格納する類似文クラスタリ
ング手段と、前記類似文照合手段が求めた入力検索文と
前記各々の事例文との間の類似度に基づいて前記検索文
と類似する類似事例文を前記事例データベースの中から
検索する類似事例検索手段とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、過去に発生した問
題の記述とその解決策との対が記録された文書、例え
ば、コールセンタでの問合せ記録などを基に作成した
「事例」を新たな問題の解決に用いるヘルプデスクシス
テムなどで利用するために、事例を蓄積すると共に類似
事例を検索する事例蓄積・検索技術に関するものであ
る。
【0002】
【従来の技術】相談窓口における問合せ応対業務などで
のやりとりを電子的な手段で蓄積したデータを再利用し
たいという要求が強い。こうした要求に対して、従来、
自然言語で表現された事例を事例データベースに予め登
録しておき、新規に入力された検索事例に類似した事例
を前記事例データベースの中から検索する技術が、例え
ば、特開平9−73464号公報「類似事例検索装置」
に開示されている。以降、本技術を従来技術1と呼ぶこ
とにする。
【0003】図26は、従来技術1に係る類似事例検索
装置の構成を示す構成図である。図26において、1は
自然言語で記述されて問題部分と解決方法部分とから構
成される事例、2は事例1を蓄積した事例データベー
ス、3は事例1から生成されて、事例番号と、カテゴリ
番号と、キーワード番号と、重みとから構成される属性
情報、4は属性情報3を蓄積した属性データベースであ
る。
【0004】また、5は事例1から抽出した各々のキー
ワードに一意の番号を付して格納するキーワード番号テ
ーブル、6は事例番号と当該事例番号を持つ事例の中か
ら抽出したキーワードに対応するキーワード番号とを対
応付けて格納したキーワードテーブル、7は事例番号と
当該事例番号を持つ事例の分類を表すカテゴリ(カテゴ
リの種類は予め設定しておく)に対応するカテゴリ番号
とを対応付けて格納したカテゴリテーブルである。
【0005】また、8は行方向にカテゴリ番号を列方向
にキーワード番号をとったテーブルの各々の欄に当該カ
テゴリ番号に対応するカテゴリに含まれて当該キーワー
ド番号に対応するキーワードを含む事例の事例数を格納
する事例数テーブル、9はキーワード番号テーブル5
と、キーワードテーブル6と、カテゴリテーブル7と、
事例数テーブル8とを記憶したメモリ、10は事例1の
属性情報3を生成する属性情報生成手段、11は事例デ
ータベース2に格納された事例間の類似度を生成する類
似度生成手段である。
【0006】次に、従来技術1に係る類似事例検索装置
の動作について図26を用いて説明する。まず、事例登
録時の動作について説明する。
【0007】事例数テーブル8には、図26に示すよう
に、テーブルの各欄に当該カテゴリ番号に対応するカテ
ゴリおよび当該キーワード番号に対応するキーワードを
含む事例の事例数を格納する他に、事例テーブル8の各
行における各欄に格納されたキーワード毎の事例数の和
(当該キーワード番号に対応するキーワードを含む事例
の事例数の合計)、各列における各欄に格納されたカテ
ゴリ毎の事例数の和(当該カテゴリ番号に対応するカテ
ゴリに含まれる事例の事例数の合計)、事例データベー
ス2に蓄積された全事例の事例総数を格納する。
【0008】なお、事例数テーブル8は、初期状態では
予め設定しておいたカテゴリの種類に対応するカテゴリ
番号だけが存在するが、事例1が蓄積(格納)される度
に、事例1から抽出されたキーワードに対応するキーワ
ード番号が行方向に追加され、当該カテゴリ番号および
キーワード番号に対応する欄の事例数、当該カテゴリに
対応するカテゴリ毎の事例数の和、当該キーワードに対
応するキーワード毎の事例数の和、前記全事例の事例総
数が更新される。
【0009】事例登録時には、属性情報生成手段10が
次の処理を実行する。即ち、まず、与えられた事例の問
題部分からキーワードを抽出し、キーワード番号を付与
してキーワード番号テーブル5に格納する。次に、抽出
した前記キーワードついてキーワード番号テーブル5に
格納されているキーワード番号を取出し、前記事例に付
与された事例番号に対応付けてキーワードテーブル6に
格納する。
【0010】次に、ユーザの指示によって、前記事例に
付与されたカテゴリのカテゴリ番号を前記事例の事例番
号に対応付けてカテゴリテーブル7に格納する。次に、
事例数テーブル8にキーワード番号を必要に応じて追加
すると共に、事例テーブル8における該当欄の事例数、
前記キーワード毎の事例数の和、前記カテゴリ毎の事例
数の和、前記全事例の事例総数のデータを更新する。
【0011】次に、事例数テーブル8を基にして重みを
生成する。なお、事例数テーブル8に格納されたカテゴ
リ数n、キーワード数m、全事例の事例総数s、カテゴ
リc i(1≦i≦n)に属する事例の和si、キーワード
番号j(1≦j≦m)のキーワードが出現する事例の和
j、カテゴリciに属し、かつ、キーワード番号mのキ
ーワードが出現する事例数tijを生成し、tij≠0とな
るキーワード番号jのキーワードについて、カテゴリc
iにおけるキーワード番号jのキーワードに対する重み
ωijは、 ωij=(tij/tj−si/s)+(tij/si−tj
s) として生成する。次に、前記事例についての事例番号、
カテゴリ番号、キーワード毎の重みから構成される属性
情報を作成して属性データベース4に格納する。
【0012】次に、事例検索時の動作について説明す
る。事例検索時には、類似度生成手段11が次の処理を
実行する。即ち、まず、新規に入力された検索事例の
「問題」部分からキーワードを抽出する。次に、属性デ
ータベース4を検索し、抽出されたキーワードと同一の
キーワードが存在する事例のカテゴリ番号およびキーワ
ード毎の重みから構成される属性情報を取出す。
【0013】次に、取出した属性情報を基に類似度を生
成する。与えられた前記事例と取出した前記属性情報に
対応する事例との間の類似度は、取出した事例のキーワ
ード毎の重みの組から、類似度ω=(一致したキーワー
ドの重みの総和)×(一致したキーワード数/属性デー
タベース4から取出したキーワードリストの長さ)を算
出して生成する。次に、生成した類似度ωが高い順にソ
ートし、類似度ωが高い事例から事例のカテゴリ、類似
度、データの内容などを出力し、表示または印字する。
【0014】また、機器などのクレーム処理の作業など
において、過去の故障内容、故障対応内容、故障属性デ
ータ等を保持する事例ベースを提供する技術が、例え
ば、特開平6−309172号公報「知識ベース装置お
よび知識ベース構築方法」に開示されている。以降、本
技術を従来技術2と呼ぶことにする。
【0015】図27は、従来技術2に係る知識ベース装
置の構成を示す構成図である。
【0016】図27において、12は推論、類似検索、
事例編集、知識編集などをユーザが指示すると共に、そ
れに伴う推論条件、検索条件などのデータをユーザが入
力する指示・入力手段と、検索結果やメニュなどのデー
タをユーザに提示する表示手段とを備えたユーザインタ
フェース、13は条件部と、結論部と、事例番号とから
構成される知識を格納した知識ベース、14は一般的な
シソーラスを格納した類義語辞書、15は管理項目(顧
客名など)と、故障内容と、キーワード群と、故障原因
と、故障対応内容とから構成される事例データ、16は
事例データ15を格納した事例ベース、17はキーワー
ドと、事例データでのキーワードの出現回数と、1事例
データ内でのキーワード間の同時出現関係と、1事例デ
ータ内でのキーワードの同時出現回数とから構成されネ
ットワーク構造になっているキーワード関係データベー
スである。
【0017】また、18はユーザインタフェース12を
介したユーザとのやり取りによって事例データベース1
6に格納された事例データ15の編集を行う事例編集手
段、19はユーザインタフェース12から推論条件を受
取り、知識ベース13に格納された知識を利用して推論
を行う推論手段、20はユーザインタフェース12から
検索条件を受取り、類義語辞書14に格納されている一
般的なシソーラスを用いて前記検索条件を一般化し、事
例ベース16に格納された事例データ15の類似検索を
行う類似検索手段、21は事例ベース16に格納された
事例データ15からキーワードデータを獲得し、獲得し
たキーワードデータを用いてキーワード間の関係データ
を作成するキーワード関係データ作成手段である。
【0018】また、22はキーワード関係データベース
17に格納されたキーワード関係データからメニューを
作成するメニュー作成手段、23はキーワード関係デー
タベース17に格納されたキーワード関係データと事例
データベース16に格納された事例データ15から知識
24を生成する事例・知識コネクト手段、25はユーザ
インタフェース12からの知識編集の指示によって事例
・知識コネクト手段23が生成した知識24を編集し、
知識ベース13に格納する知識編集手段である。
【0019】次に、従来技術2に係る知識ベース装置の
動作について図27を用いて説明する。まず、事例登録
時の動作について説明する。
【0020】事例登録時には、まず、事例編集手段18
により、顧客名(管理項目の1つ)、故障内容、キーワ
ード群を入力し、事例データ15を作成して事例ベース
16に格納しておく。キーワード群は、直接入力する
か、メニュー作成手段22により作成されたメニューを
指定することによって入力する。また、キーワード関係
データ生成手段21により、キーワード、キーワードの
出現回数、キーワード間の同時出現回数をキーワード関
係データベース21に格納しておく。
【0021】次に、事例・知識コネクト手段23によ
り、キーワード関係データベース21に格納されている
同時出現頻度の高いキーワードの組合せを、候補となる
知識24の条件部として生成し、生成したキーワードの
組合せを持つ事例データを事例ベース16から検索し、
検索して得られた事例データの故障原因、故障対応内
容、事例番号を結論部とした知識24を生成し、生成し
た知識24を知識編集手段25によりユーザが編集して
知識ベース13に格納しておく。
【0022】次に、事例検索時の動作について説明す
る。事例検索時には、まず、推論手段19はユーザイン
タフェース12を介してユーザから検索条件データを受
取り、受取った検索条件データに基づいて知識ベース1
3に格納された知識を検索する。受取った検索条件デー
タが知識24の条件部にある場合には、ユーザインタフ
ェース12を介して当該知識の結論部をユーザに提示す
る。受取った検索条件データが知識24中の「条件部」
にある知識が知識ベース13の中にない場合には、類似
検索手段20により、一般的なシソーラスを格納した類
義語辞書14を用いて検索条件データの条件を広げ、事
例ベース30に格納された事例データ15に対して類似
検索を実行する。
【0023】また、文書検索において検索結果の妥当性
の判定を容易にすることを目的とした技術が、例えば、
特開平7−192020号公報「文書情報検索装置」に
開示されている。以降、本技術を従来技術3と呼ぶこと
にする。
【0024】本従来技術3に係る文書情報検索装置にお
いては、入力文章を形態素解析、構文解析して、キーワ
ードと「視点」のリストからなる検索命令を生成し、本
検索命令によって文書データを検索することにより、複
数視点を軸にして検索命令と文書データとの類似の度合
いを表示することにより検索結果の妥当性の判定を容易
にしている。本従来技術3は、自然言語の構文解析は行
うが、その解析結果を視点の抽出だけに用いており、実
際の検索時にはキーワードと視点とから構成した情報だ
けを用いている。
【0025】図28は、従来技術3に係る文書情報検索
装置の構成を示す構成図である。図28において、26
はユーザが検索を指示するキーワードまたは自然言語か
らなる文章を入力する入力部、28はユーザが入力した
入力文章27を解析して検索命令に変換して得られた検
索命令29を入力部26へ出力する入力解析部である。
【0026】また、30は文章データを格納する文章デ
ータ記録部、31は入力部26から検索命令29を入力
として文書データ記録部30に格納された文章データを
参照することによって関連する文書を検索して得られた
検索結果32を出力する検索部、33は入力部26から
検索命令29を受取ると共に検索部31が出力した検索
結果32を受取って検索履歴として格納する検索履歴記
憶部、35は検索履歴記憶部33に格納された検索履歴
を入力して木構造で表示する検索履歴表示部である。
【0027】また、36は検索部31で検索して得られ
た検索結果32を入力して検索結果の文書の集合を多次
元で表示する(例えば、各々の文書の表題や書誌事項な
どを木構造や表やリストなどで表示する)と共に表示さ
れた文書の集合の中から文書を選択する検索結果表示
部、37は検索結果表示部36で選択された文書の内容
(全文)を表示するブラウズ部、34は検索履歴記憶部
33、検索履歴表示部35、検索結果表示部36を制御
して検索履歴の格納・表示を制御・管理する履歴管理部
である。
【0028】図29は、図28における入力解析部28
の構成を示す構成図である。図29において、38は個
々の文を入力して形態素解析を行ってその解析結果を出
力する形態素解析部、39は形態素解析の結果を入力し
て構文解析を行ってその結果を出力する構文解析部、4
0は入力文章27を入力して形態素解析38および構文
解析39を起動して構文解析結果を得る入力解析制御部
である。
【0029】また、41は視点を抽出するために用いる
規則を記述した視点抽出用規則、42は前記構文解析結
果を入力して視点抽出用規則を参照して視点情報を作成
する視点抽出部、43は視点抽出部42において抽出し
た視点情報を入力すると共に個々の文から自立語を抽出
して検索命令を構成する検索命令生成部である。なお、
図29中、図28と同一または相当部分には同一符号を
付して説明を省略する。
【0030】次に、従来技術3に係る文書情報検索装置
の動作について図28および図29を用いて説明する。
入力解析部28においては、図29に示した入力解析制
御部40によって、形態素解析部38、構文解析部39
を起動し、入力文章27に対する構文解析結果を得る。
次に、視点抽出部42によって(述部、様相、格構造)
というパターンを視点に割当てる視点抽出用規則41を
用いて視点のリストを生成し、検索命令生成部43にお
いて前記構文解析結果から自立語を抽出することによ
り、<キーワード>と<視点のリスト>からなる検索命
令29を生成する。
【0031】図28に示した検索部31においては、検
索命令29を用いて文書データ記憶部30に格納されて
いる文書データを検索して、視点毎に類似した文書を検
索結果32として得ることにより、検索結果表示部36
に視点毎の検索結果(文書の集合)を表示することがで
きる。また、履歴管理部34、検索履歴記憶部33、検
索履歴表示部35においては、過去の検索命令と検索結
果の履歴を管理・記憶しておき、記憶しておいた検索命
令と検索結果の履歴を表示することができる。更に、検
索結果表示部36に表示された検索結果である文書の集
合の中から文書を選択することにより、ブラウズ部37
に選択された文書の全文を表示することができる。
【0032】
【発明が解決しようとする課題】従来技術1および従来
技術2においては、事例中の自然言語での記述が単文で
あるような単純な類似検索を想定しているため、事例デ
ータの蓄積検索対象部分が複数の文からなるような複雑
な場合、予め事例から文を抽出して分類しておき、類似
検索による問題解決を容易にすることができないという
課題があった。
【0033】また、従来技術1においては、キーワード
抽出だけで索引を生成しており、キーワードのカテゴリ
分類および頻度情報だけで類似度計算を行なうので、事
例を構成する文の様相表現(否定、推量など)などを含
めた詳細な自然言語の類似性を判断することができない
という課題があった。
【0034】また、従来技術2においては、一般的なシ
ソーラスを格納した類義語辞書を利用しているが、出現
頻度の高いキーワードの組合せだけで索引を生成し、類
似検索の入力も入力内容から抽出したキーワードだけを
用いているので、文の様相表現などを含めた詳細な自然
言語の類似性に関する処理が考慮されておらず、入力文
と構文的・意味的に類似した文を含む事例を検索するこ
とができないという課題があった。
【0035】また、従来技術3においては、検索入力文
章の構文解析を行うが、構文解析結果情報を視点の抽出
だけに用いており、実際の検索時にはキーワードと視点
とから構成した情報だけを用いている。従って、従来技
術1および従来技術2と同様に、入力文と構文的・意味
的に類似した文を含む文書を検索することができないと
いう課題があった。
【0036】また、従来技術3においては、本発明のよ
うに文書データ間の関係を含めて事例として予め蓄積し
ておく手段を備えていないので、データ間の関係を意識
した検索はできないという課題があった。
【0037】本発明は、前記のような課題を解決するた
めになされたもので、蓄積・検索対象が複数の事例文か
らなる複雑な事例に対しても、類似検索による問題の解
決を容易にすることができる事例蓄積・検索装置、およ
び事例蓄積方法並びに事例検索方法、および事例蓄積プ
ログラムを記録したコンピュータで読取可能な記録媒体
並びに事例検索プログラムを記録したコンピュータで読
取可能な記録媒体を提供することを目的とする。
【0038】また、本発明は、事例を構成する文の様相
表現(否定、推量など)を含めた多様な自然言語表現に
対応して詳細な類似性を考慮し、構文的・意味的に類似
した文を含む事例の検索を可能にすることを目的とす
る。
【0039】また、本発明は、文書データに対して類似
や背反といったデータ間の関係を意識した検索を可能に
することを目的とする。
【0040】
【課題を解決するための手段】本発明に係る第1の事例
蓄積・検索装置は、事例蓄積・検索の対象とする領域に
依存した用語と前記用語間の関係とに関する知識を予め
格納した領域オントロジと、自然言語で記述された電子
化文書の中から前記事例蓄積・検索の対象とする各々の
事例文を切出す処理対象文抽出手段と、ユーザが所望す
る事例文を検索するための検索文を入力する検索入力手
段と、前記処理対象抽出手段によって切出された各々の
事例文または前記検索入力手段によって入力された検索
文を入力として前記領域オントロジに格納された知識を
参照して形態素解析および構文解析を行って前記各々の
事例文または前記検索文の構造を作成する文解析手段
と、前記文解析手段によって作成された前記各々の事例
文または前記検索文の構造を入力として前記領域オント
ロジに格納された知識を参照して前記各々の事例文同士
の類似度または前記各々の事例文と前記検索文との間の
類似度を求める類似文照合手段と、前記類似文照合手段
によって求められた前記各々の事例文同士の類似度に基
づいて前記各々の事例文を分類して事例クラスタを構成
し、前記事例クラスタの情報と前記事例クラスタ間の関
係情報とから構成される事例データを作成する類似文ク
ラスタリング手段と、前記類似文クラスタリング手段に
よって作成された事例データを格納する事例データベー
スと、前記類似文照合手段によって求められた前記各々
の事例文と前記検索文との間の類似度に基づいて前記検
索文入力手段によって入力された検索文に類似した類似
事例文を前記事例データベースに格納された事例データ
の中から検索する類似事例検索手段と、前記類似事例検
索手段によって検索された類似事例文を表示する検索結
果表示手段とを備えたことを特徴とする。
【0041】本発明に係る第1の事例蓄積方法は、自然
言語で記述された電子化文書の中から事例蓄積の対象と
する各々の事例文を切出す処理対象文抽出ステップと、
前記処理対象抽出ステップによって切出された各々の事
例文を入力として前記事例蓄積の対象とする領域に依存
した用語と前記用語間の関係とに関する知識を予め格納
した領域オントロジを参照して形態素解析および構文解
析を行って前記各々の事例文の構造を作成する文解析ス
テップと、前記文解析ステップによって作成された前記
各々の事例文の構造を入力として前記領域オントロジに
格納された知識を参照して前記各々の事例文同士の類似
度を求める類似文照合ステップと、前記類似文照合ステ
ップによって求められた前記各々の事例文同士の類似度
に基づいて前記各々の事例文を分類して事例クラスタを
構成し、前記事例クラスタの情報と前記事例クラスタ間
の関係情報とから構成される事例データを作成して事例
データベースに格納する類似文クラスタリングステップ
とから構成されたことを特徴とする。
【0042】本発明に係る第2の事例蓄積方法は、前記
処理対象文抽出ステップでは、抽出した前記事例文に対
して事例文の種別を付与することを特徴とする。
【0043】本発明に係る第3の事例蓄積方法は、前記
類似文クラスタリングステップでは、前記各々の事例文
を分類して構成するクラスタの階層数または・および前
記各々の事例文同士が類似していると判断する際に用い
るクラスタ間の類似度の閾値を指定することを特徴とす
る。
【0044】本発明に係る第4の事例蓄積方法は、前記
領域オントロジでは、意味的な上位−下位関係を記述し
たIS−A関係知識、意味的な部分−全体の関係を記述
したHAS−A関係知識、概念間の関係を記述した格関
係知識、1つの意味・概念・関係を複数の表現で記述し
た言換え知識、同時には起り得ない背反関係を記述した
知識の内、少なくとも1種類の知識を記述することを特
徴とする。
【0045】本発明に係る第5の事例蓄積方法は、前記
似文照合ステップでは、構前記文解析ステップにおいて
作成された文の構造における構文的要素の属性に基づい
て前記各々の事例文同士の意味構造を照合することによ
って類似度を求めることを特徴とする。
【0046】本発明に係る第6の事例蓄積方法は、前記
類似文照合ステップでは、前記各々の事例文同士の類似
度を求める際に用いる照合の詳細度を指定することを特
徴とする。
【0047】本発明に係る第7の事例蓄積方法は、前記
文解析ステップは、前記事例文の構造を木構造として作
成し、前記類似文照合ステップでは、前記各々の事例文
同士の類似度を求める際に用いる照合の詳細度を前記事
例文の木構造の深さによって指定することを特徴とす
る。
【0048】本発明に係る第8の事例蓄積方法は、前記
事例データベースでは、事例クラスタ間の関係として類
似関係または・および背反関係を記述することを特徴と
する。
【0049】本発明に係る第1の事例検索方法は、事例
検索の対象とする事例データを格納した事例データベー
スの中からユーザが所望する事例文を検索するための検
索文を入力する検索入力ステップと、前記検索入力ステ
ップによって入力された検索文を入力として前記事例検
索の対象とする領域に依存した用語と前記用語間の関係
とに関する知識を予め格納した領域オントロジに格納さ
れた知識を参照して形態素解析および構文解析を行って
前記検索文の構造を作成する文解析ステップと、前記文
解析ステップによって作成された前記検索文の構造を入
力として前記領域オントロジに格納された知識を参照し
て前記各々の事例文と前記検索文との間の類似度を求め
る類似文照合ステップと、前記類似文照合ステップによ
って求められた前記各々の事例文と前記検索文との間の
類似度に基づいて前記検索文入力ステップによって入力
された検索文に類似した類似事例文を前記事例データベ
ースに格納された事例データの中から検索する類似事例
検索ステップと、前記類似事例検索ステップによって検
索された類似事例文を表示する検索結果表示ステップと
から構成されたことを特徴とする。
【0050】本発明に係る第1の事例蓄積プログラムを
記録したコンピュータで読取り可能な記憶媒体は、自然
言語で記述された電子化文書の中から事例蓄積の対象と
する各々の事例文を切出す処理対象文抽出手順と、前記
処理対象抽出手順によって切出された各々の事例文を入
力として前記事例蓄積の対象とする領域に依存した用語
と前記用語間の関係とに関する知識を予め格納した領域
オントロジを参照して形態素解析および構文解析を行っ
て前記各々の事例文の構造を作成する文解析手順と、前
記文解析手順によって作成された前記各々の事例文の構
造を入力として前記領域オントロジに格納された知識を
参照して前記各々の事例文同士の類似度を求める類似文
照合手順と、前記類似文照合手順によって求められた前
記各々の事例文同士の類似度に基づいて前記各々の事例
文を分類して事例クラスタを構成し、前記事例クラスタ
の情報と前記事例クラスタ間の関係情報とから構成され
る事例データを作成して事例データベースに格納する類
似文クラスタリング手順とから構成される事例蓄積プロ
グラムを記録したことを特徴とする。
【0051】本発明に係る第1の事例検索プログラムを
記録したコンピュータで読取り可能な記憶媒体は、事例
検索の対象とする事例データを格納した事例データベー
スの中からユーザが所望する事例文を検索するための検
索文を入力する検索入力手順と、前記検索入力手順によ
って入力された検索文を入力として前記事例検索の対象
とする領域に依存した用語と前記用語間の関係とに関す
る知識を予め格納した領域オントロジを参照して形態素
解析および構文解析を行って前記検索文の構造を作成す
る文解析手順と、前記文解析手順によって作成された前
記検索文の構造を入力として前記領域オントロジに格納
された知識を参照して前記各々の事例文と前記検索文と
の間の類似度を求める類似文照合手順と、前記類似文照
合手順によって求められた前記各々の事例文と前記検索
文との間の類似度に基づいて前記検索文入力手順によっ
て入力された検索文に類似した類似事例文を前記事例デ
ータベースに格納された事例データの中から検索する類
似事例検索手順と、前記類似事例検索手順によって検索
された類似事例文を表示する検索結果表示手順とから構
成された事例検索プログラムを記録したことを特徴とす
る。
【0052】
【発明の実施の形態】実施の形態1.以下、本発明に係
る事例蓄積・検索技術について図を用いて説明する。
【0053】図1は、本発明に係る実施の形態1による
事例蓄積・検索装置の構成を示す構成図である。
【0054】図1において、44は事例蓄積・検索装置
が蓄積・検索処理の対象とする事例の対象領域に依存し
た用語や当該用語間の関係に関する知識を予め記述して
格納しておく領域オントロジ、45は事例をフィールド
毎に区切って自然言語で記述した文書が格納された電子
化文書ファイル(図示せず)の中からフィールド毎に事
例蓄積処理の対象となる各々の文(以降「事例文」と呼
ぶ)を切出す処理対象文抽出部である。
【0055】また、46は事例検索処理のために検索用
の文(以降「検索文」と呼ぶ)を入力する検索文入力
部、47は処理対象文抽出部45において切出された各
事例文、または検索文入力部46において入力された検
索文に対して、単語辞書、文法規則(以上図示せず)、
領域オントロジ44などを参照して形態素解析および構
文解析を行う文解析部、48は2つの文の構造を入力と
し、領域オントロジ44、類似度の計算規則(図示せ
ず)などを参照して文同士の類似度を求める類似文照合
部である。
【0056】また、49は文解析部47において各事例
文を形態素解析および構文解析して得られた事例文の構
造の集合を入力とし、入力した事例文の構造の集合の中
の任意の2つの事例文の構造に対して類似文照合部48
が求めた事例文同士の類似度に基づいて相互に類似した
文を分類(クラスタリング)してフィールド毎に事例の
クラスタを構成し、構成した事例クラスタの情報および
事例クラスタ間の関係情報を作成する類似文クラスタリ
ング部、50は類似文クラスタリング部49でフィール
ド毎に作成した事例クラスタの情報および事例クラスタ
間の関係情報を索引付きで格納する事例データベース、
51は事例データベース50に格納されたクラスタの情
報およびクラスタ間の関係情報に基づいて事例のクラス
タの階層構造を問題解決木として編集する事例クラスタ
編集部である。
【0057】また、52は文解析部47において検索文
を形態素解析および構文解析して得られた検索文の構造
を入力し、事例データベース50に格納された各事例文
の構造と入力された検索文の構造に対して類似文照合部
48が求めた事例文と検索文との間の類似度に基づいて
検索文と類似した事例文を検索する類似事例検索部、5
3は類似事例検索部52における検索結果や確認のため
に事例データベース50に格納された事例クラスタの内
容を表示する検索結果表示部である。
【0058】次に、本発明に係る実施の形態1による事
例蓄積・検索装置の動作について説明する。
【0059】本発明に係る実施の形態1による事例蓄積
・検索装置の機能には、大別すると、電子化文書の中か
ら事例を抽出して事例データベースに蓄積する事例蓄積
機能と事例データベースに蓄積された事例の中から類似
事例を検索する事例検索機能の2つの機能がある。
【0060】まず、本発明に係る実施の形態1による事
例蓄積・検索装置における事例蓄積機能の動作の概要に
ついて図2を用いて説明する。
【0061】図2は、本発明に係る実施の形態1による
事例蓄積・検索装置における事例蓄積機能の処理の流れ
を示すフローチャートである。なお、図2中、図1と同
一または相当部分には同一符号を付して説明を省略す
る。
【0062】図2において、処理対象文抽出処理(ステ
ップS1)は図1に示した事例蓄積・検索装置の構成中
の処理対象文抽出部45において実行される。また、文
解析処理(ステップS2)は図1に示した事例蓄積・検
索装置の構成中の文解析部47において実行される。ま
た、類似文クラスタリング処理(ステップS3)は図1
に示した事例蓄積・検索装置の構成中の類似文クラスタ
リング部49において実行される。また、事例クラスタ
編集処理(ステップS4)は図1に示した事例蓄積・検
索装置の構成中の事例クラスタ編集部51において実行
される。
【0063】まず、処理対象文抽出処理(ステップS
1)において、電子化文書ファイルを入力し、事例蓄積
・検索処理の対象となる各々の事例文を切出す。次に、
文解析処理(ステップS2)において、処理対象文抽出
処理(ステップS1)によって切出した各々の事例文を
入力し、形態素解析および構文解析を行って各々の事例
文の構造(具体的には後述する係り受け構造)を生成す
る。次に、類似文クラスタリング処理(ステップS3)
において、文解析処理(ステップS2)によって生成さ
れた各々の事例文の構造に対して類似文照合部47を呼
出して任意の事例文間の類似度を求め、処理対象文抽出
処理(ステップS1)によって切出された各々の事例文
を求めた類似度に基づいて分類(クラスタリング)して
フィールド毎にクラスタの情報およびクラスタ間の関係
情報を作成し、作成した情報を事例データベース50に
格納する。次に、事例クラスタ編集処理(ステップS
4)において、事例データベース50に格納されたクラ
スタの情報およびクラスタ間の関係情報を入力し、事例
クラスタの階層構造を問題解決木として編集する。
【0064】なお、図2において、類似クラスタリング
処理(ステップS3)は図1に示した事例蓄積・検索装
置における類似文照合部47を呼出すように構成してい
るが、この類似文照合部47は類似クラスタリング処理
(ステップS3)から呼出されるモジュール(ステップ
の集合)として構成し、プログラムで実現しても良い。
【0065】次に、本発明に係る実施の形態1による事
例蓄積・検索装置のもう一方の機能である事例蓄積機能
の動作の概要について図24を用いて説明する。
【0066】図24は、本発明に係る実施の形態1によ
る事例蓄積・検索装置における事例検索機能の処理の流
れを示すフローチャートである。なお、図24中、図2
と同一または相当部分には同一符号を付して説明を省略
する。
【0067】図24において、検索文入力処理(ステッ
プS41)は図1に示した事例蓄積・検索装置の構成中
の検索文入力部46において実行される。また、類似事
例検索処理(ステップS42)は図1に示した事例蓄積
・検索装置の構成中の類似事例検索部52において実行
される。また、検索結果表示処理(ステップS43)は
図1に示した事例蓄積・検索装置の構成中の検索結果表
示部53において実行される。
【0068】まず、検索文入力処理(ステップS41)
において、事例データベース50に格納された事例を検
索するための検索文を入力する。次に、文解析処理(ス
テップS2)において、検索文入力処理(ステップS4
1)によって入力された検索文に対して形態素解析およ
び構文解析を行って検索文の構造具体的には後述する係
り受け構造)を生成する。次に、類似事例検索処理(ス
テップS42)において、文解析処理(ステップS2)
によって生成された検索文の構造と事例データベース5
0に格納された各々の事例文の構造に対して類似文照合
部47を呼出して検索文と各々の事例文との間の類似度
を求め、求めた類似度に基づいて検索文入力処理(ステ
ップS41)によって入力された検索文に類似する類似
事例文を事例データベース50の中から検索する。次
に、検索結果表示処理(ステップS43)において、類
似事例検索処理(ステップS42)によって検索された
結果得られた類似事例文や事例データベース50に格納
された事例クラスタの内容を表示する。
【0069】なお、図24において、類似事例検索処理
(ステップS42)は図1に示した事例蓄積・検索装置
における類似文照合部47を呼出すように構成している
が、この類似文照合部47は類似事例検索処理(ステッ
プS42)から呼出されるモジュール(ステップの集
合)として構成し、プログラムで実現しても良い。
【0070】以下、適宜図を参照しながら、本発明に係
る実施の形態1による事例蓄積・検索装置における事例
蓄積機能の動作の詳細を、図2に示したフローチャート
に従って具体例を用いて説明する。
【0071】まず、処理対象文抽出処理(ステップS
1)について説明する。ステップS1においては、事例
蓄積処理の対象とする問合せ記録などの電子化文書ファ
イルを入力し、入力した電子化文書ファイルの中から処
理対象の事例文を抽出する。
【0072】図3は、電子化文書ファイルの構成の例を
示す図である。図3において、54は事例蓄積処理の対
象とする1つの電子化文書ファイル、55、56は各々
電子化文書ファイル54中に存在し、複数のフィールド
を持つ文書、57は文書55の中に存在するフィールド
の内、内容が数字や簡単な文字列で表現される(属性と
しての)定型フィールド、58は文書55中に存在する
フィールドの内、自然言語で表現された複数の文で記述
される(属性としての)非定型フィールド、59は文書
55の先頭の区切りを示す文書開始タグ、60は文書5
5の末尾の区切りを示す文書終了タグである。
【0073】また、61は文書55において定型フィー
ルド、非定型フィールドに拘らず、文書中に存在する各
々のフィールド(以降「文書フィールド」と呼ぶ)の先
頭の区切りを示す文書フィールド開始タグ、62は文書
55において文書フィールドの末尾の区切りを示す文書
フィールド終了タグである。
【0074】なお、図3に示した電子化文書ファイル5
4において符号61、62が具体的に示しているもの
は、61が文書フィールド「顧客名」に対する文書フィ
ールド開始タグであり、62が文書フィールド「顧客
名」に対する文書フィールド終了タグである。
【0075】図3に示すように、1つの電子化文書ファ
イル54の中に複数の文書が格納されている場合があ
る。図3に示した電子化文書ファイルの例では、文書開
始タグ59「<DOC>」と文書終了タグ60</DO
C>とによって文書の区切りが表されている。
【0076】また、1つの文書は複数の文書フィールド
から構成されている。例えば、図3に示したように、文
書55の中には、「顧客名」、「顧客電話」、「機
種」、「件名」といった文書フィールドのように、記述
内容が定型的であり、数字や簡単な文字列などで表現で
きる定型フィールド57と、「質問」、「回答」といっ
た文書フィールドのように、記述内容が非定型的であ
り、自然言語で表現される複数の文で記述される非定型
フィールド58とから構成される。
【0077】また、1つの文書フィールドは、図3に示
した電子化文書ファイルの例では、文書フィールド開始
タグ61は記号「<」と記号「>」とで囲まれ、記号
「<」と記号「>」とを含む文字列であり、文書フィー
ルド開始タグ61から「<」と記号「>」とを除いた文
字列がフィールド名である。一方、文章フィールド終了
タグ62は記号「</」と記号「>」とで囲まれ、記号
「</」と記号「>」とを含むた文字列であり、文書フ
ィールド終了タグ62から記号「</」と記号「>」と
を除いた文字列がフィールド名である。
【0078】図4は、図2に示したフローチャートにお
ける処理対象文抽出処理(ステップS1)の流れを示す
フローチャートである。図3に示したような電子化文書
ファイル54を入力した場合の処理対象文抽出処理(ス
テップS1)を図4に示したフローチャートを用いて説
明する。
【0079】まず、文書開始タグ59「<DOC>」が
見つかるまで(ステップS6)電子化文書ファイル54
を先頭から文字列を順次読み進める(ステップS5)。
電子化文書ファイル54の終りを検出する(図4に示し
たフローチャートにおいては「EOF」と表記してい
る)までに文書開始タグ59が見つからなかった場合
は、処理を終了する。文書開始タグ59が見つかった場
合は、ステップS7へ進み、文書終了タグ60「</D
OC>」が見つかるまで(ステップS8)電子化文書フ
ァイル54の文字列を順次読込む(ステップS7)。電
子化文書ファイル54の終りを検出するまでに文書終了
タグ60が見つからなかった場合は、処理を終了する。
文書終了タグ60が見つかった場合は、ステップS9へ
進む。
【0080】ステップS9においては、ステップS7に
おいて読込んだ文字列(ここでは、文書開始タグ59お
よび文書終了タグ60は読み進め、読込んだ文字列には
含まれないものとする)が空でなければ、読込んだ文字
列を1つの文書55であると判断して切出し、切出した
文書55を事例として処理するために、文書55に対し
て一意に定まる事例番号を付与する(ステップS9)。
次に、ステップS9において切出した文書55に対し
て、処理の流れは後述する1文書に対する処理対象文抽
出処理(ステップS10)を実行した後、ステップS5
に戻り、以上の処理を繰返す。
【0081】なお、以下の(1)乃至(3)の3つの場
合には、(a)ユーザに警告を出して処理を続行する、
(b)ユーザに警告を出して処理を一旦中断してユーザ
の指示を待ち、ユーザの指示に従った処理をした後、処
理を続行する、(c)ユーザに警告を出して処理を終了
する、の何れかの処置をとる。 (1)ステップS6において、文書開始タグ59と文書
終了タグ60とを除いて読み進むデータがあった場合。 (2)ステップS8において、電子化文書ファイル54
の終りを検出した場合で、かつ、ステップS9およびス
テップS10において未処理の読込んだ文字列が存在す
る場合。 (3)ステップS9において、読込んだ文字列が空であ
った場合。
【0082】図5は、図4に示したフローチャートにお
ける1文書に対する処理対象文抽出処理(ステップS1
0)の流れを示すフローチャートである。次に、図5に
示したフローチャートを用いて1文書に対する処理対象
文抽出処理(ステップS10)を説明する。
【0083】1文書に対する処理対象文抽出処理(ステ
ップS10)においては電子化文書ファイル54におけ
る1文書分の文字列を入力として受取る。まず、記号
「<」と記号「>」とで囲まれ、記号「<」の次の文字
が記号「/」でない文字列、即ち、文書フィールド開始
タグ61が見つかるまで(ステップS12)入力された
1文書分の文字列を先頭から順次読み進める(ステップ
S11)。入力された1文書分の文字列の終りを検出す
る(図5に示したフローチャートにおいては「EOD」
と表記している)までに文書フィールド開始タグ61が
見つからなかった場合は、処理を終了する。
【0084】文書フィールド開始タグ61が見つかった
場合は、ステップS13へ進み、記号「</」と記号
「>」とで囲まれた文字列、即ち、文書フィールド終了
タグ62が見つかるまで(ステップS14)入力された
1文書分の文字列を順次読込む(ステップS13)。入
力された1文書分の文字列の終りを検出するまでに文書
フィールド終了タグ62が見つからなかった場合は、処
理を終了する。文書フィールド終了タグ62が見つかっ
た場合は、ステップS15へ進む。
【0085】ステップS15においては、ステップS7
において読込んだ文字列(ここでは、文書フィールド開
始タグ61および文書フィールド終了タグ62は別に保
存し、読込んだ文字列には含まれないものとする)が空
でない場合は、読込んだ文字列を1つのフィールドの内
容であると判断して切出すと共に、文書フィールド開始
タグ61および/または文書フィールド終了タグ62か
らフィールド名を取出し、フィールドを特定する。
【0086】図6は、定型フィールドか非定型フィール
ドかといった文書フィールドに関する情報を予め記述し
た文書フィールド情報の例を示す図である。図6におい
て、63は文書フィールド情報、64は本事例蓄積・検
索方法において取扱う全てのフィールドのフィールド名
を登録した「フィールド名」の欄、65は「フィールド
名」の欄64に登録された各々のフィールドが定型フィ
ールドか非定型フィールドかという属性を予め定義して
登録した「定型/非定型」の欄、66は「フィールド
名」の欄64に登録された各々のフィールドに対して設
定可能なオプションの情報を登録した「オプション」の
欄であり、67は事例データの集合を大きく分類するた
めに設定した「カテゴリ」属性、68は事例データの一
覧を表示する場合などに各々の事例を識別するために用
いる「タイトル」属性である。
【0087】フィールド名の取出し処理は、文書フィー
ルド開始タグ61から記号「<」および記号「>」を取
除いた文字列と文書フィールド終了タグ62から記号
「</」および記号「>」を取除いた文字列とが同一で
(一致し)かつ空でない場合は、前記文字列をフィール
ド名であると判断して取出す。
【0088】次に、フィールドの特定処理は、図6に示
した文書フィールド情報63を参照し、フィールド名の
取出し処理において取出したフィールド名が「フィール
ド名」の欄64に登録されている場合は、その登録され
ているフィールド名に対応する「定型/非定型」の欄6
5の属性値を取出し、定型フィールドか非定型フィール
ドかを特定する。
【0089】次に、取出した属性値が「定型」の場合は
ステップS16に進み、定型フィールドに対する処理を
実行する。また、取出した属性値が「非定型」の場合は
ステップS17へ進み、非定型フィールドに対する処理
を実行する。
【0090】定型フィールドの処理を行うステップS1
6においては、ステップS15で取出したフィールドの
内容をそのまま事例データベース50の対応する欄に登
録する。図3に示した電子化文書ファイル54の例で
は、フィールドが「<顧客名>」の場合、事例データベ
ース50のフィールド名の欄が「顧客名」である欄に対
応するフィールド内容の欄に文字列「山田太郎」をその
まま登録する。
【0091】また、非定型フィールドの処理を行うステ
ップS17においては、処理の流れは後述する「非定型
フィールド処理」を呼出す。図3に示した電子化文書フ
ァイル54の例では、「<質問>」フィールドと「<回
答>」フィールドに対して、本「非定型フィールド処
理」が呼ばれる。
【0092】ステップS16またはステップS17の処
理が終った後、ステップS11に戻って以上の各処理を
繰返す。
【0093】なお、以下の(1)乃至(5)の5つの場
合には、(a)ユーザに警告を出して処理を続行する、
(b)ユーザに警告を出して処理を一旦中断してユーザ
の指示を待ち、ユーザの指示に従った処理をした後、処
理を続行する、(c)ユーザに警告を出して処理を終了
する、の何れかの処置をとる。
【0094】(1)ステップS12において、文書フィ
ールド開始タグ61と文書フィールド終了タグ62とを
除いて読み進むデータがあった場合。 (2)ステップS8において、電子化文書ファイル54
の終りを検出した場合で、かつ、ステップS16または
ステップS17において未処理の読込んだ文字列が存在
する場合。 (3)ステップS15において、読込んだ文字列が空で
あった場合。 (4)ステップS15において、切出した文字列(1つ
のフィールドに相当する)に対する文書フィールド開始
タグ61から取出したフィールド名と、同文書フィール
ド終了タグ62から取出したフィールド名とが一致しな
い場合。 (5)ステップS15において取出したフィールド名が
図6に示した文書フィールド情報63に存在しない場
合。なお、取出したフィールド名が空であった場合も含
まれる。
【0095】図7は、図3に示した電子化文書ファイル
54における非定型フィールドに対する処理(図5に示
したフローチャートにおけるステップS17)の流れを
示すフローチャートである。
【0096】図7において、69は各々の文書に対して
設定された事例番号、70は処理対象である非定型フィ
ールドのフィールド名、71は後述する文切出し処理
(ステップS18)において1文毎に切出された事例
文、72は事例文71の各々に付与された一連の文番
号、73は後述する文タグ付与処理(ステップS20)
において各々の事例文71の各々に付与された文タグ、
74は文タグ73毎に(同一の文タグ73を持つ)事例
文71の各々に付与された一連の文タグ毎文番号であ
る。
【0097】次に、図7に示したフローチャートを用い
て非定型フィールドの処理の流れを説明する。
【0098】まず、処理対象文書(例えば図3における
文書55)の事例番号69と処理対象の非定型フィール
ド(例えば図3における非定型フィールド58の「<質
問>」フィールド)のフィールド名70が入力として受
渡されており、電子化文書ファイル54中の処理対象の
非定型フィールドに記述されている複数の文の中から、
句点「。」、中点「・」、章番号などの箇条書きを表す
文字列などから判定して、1つの文を切出す(ステップ
S18)。
【0099】図3に示した電子化文書ファイル54の例
では、「<質問>」フィールドからは、まず「エアコン
から音がする。」という文を切出す。ここでは、文切出
し処理(ステップ18)において切出した文のことを事
例データを構成する「事例文」と呼ぶ。ステップS18
において事例文71を切出すことができた場合には、抽
出した事例文71に、事例文71が属する事例の事例番
号69、事例文71が属するフィールドのフィールド名
70、処理対象のフィールド(例えば図3に示した「<
質問>」フィールド)内で何番目の文であるかを示す文
番号72を付与する。
【0100】次に、事例文を切出すことができたか否か
を調べ(ステップS19)、事例文を切出すことができ
なかった場合には、処理対象フィールド内の全文の抽出
が終了したものと判断し、文書フィールド終了タグ(例
えば図3における「</質問>」)が存在することを確
認し(ステップS21)、非定型フィールド処理を終了
して、図5に示したフローチャートにおける非定型フィ
ールド処理の呼出し元であるステップ17に戻り、次に
ステップS11へ進む。なお、ステップS21におい
て、文書フィールド終了タグが存在することが確認でき
ない場合は警告を出す。
【0101】一方、ステップS19において事例文を切
出すことができた場合には、切出された事例文71に対
して事例文71のタイプを表すラベルである「文タグ」
73を付与する(ステップS20)。
【0102】図8は、文タグ一覧表の例を示す図であ
る。図8において、75は文タグ一覧表である。文タグ
付与処理(ステップS20)においては、文タグ73を
付与するための情報として、例えば、図8に示した文タ
グ一覧表75を参照する。
【0103】図8に示すように、文タグ一覧表75に
は、「フィールド」毎に文中のキーとなる表現である
「条件」部と本「条件」部に対応する「文タグ」を予め
定義しておく。
【0104】例えば、図3に示した電子化文書ファイル
54の例では、<質問>フィールドの最初の事例文「エ
アコンから音がする。」に対しては、図8に示した文タ
グ一覧表を参照すると、「フィールド」が「<質問>」
である「条件」部には「で使用」「がする」……という
キーワードが記述されているが、「がする」というキー
ワードが前記事例文中に存在するので、前記事例文の文
タグは、文タグ一覧表75における「がする」という
「条件」部に対応する「文タグ」を取出して「症状」と
なる。
【0105】また、図3に示した電子化文書ファイル5
4の例で、<回答>フィールドの最後の事例文「異常で
はないので対策不要。」に対しては、図8に示した文タ
グ一覧表を参照すると、「フィールド」が「<回答>」
である「条件」部には「ため」「ようだ」「思われる」
「要」「不要」……というキーワードが記述されている
が、「不要」というキーワードが前記事例文中に存在す
るので、前記事例文の文タグは、文タグ一覧表75にお
ける「不要」という「条件」部に対応する「文タグ」を
取出して「対策」となる。
【0106】なお、図8においては、説明を簡単にする
ため、表層(文中に含まれる字面)の文字列を用いて文
タグを特定する場合を示しているが、「条件」部に文の
構文パターンや否定・推量などの様相表現などを指定で
きるようにしておき、切出した事例文に対して後述する
文解析処理を行ってから文タグ一覧表75との対応を取
って文タグを決定しても良い。
【0107】図9は、処理対象文抽出処理(ステップS
1)によって、図3に示した電子化文書ファイル54の
文書55から生成された「事例」の例を示す図である。
図9において、76は事例である。なお、図9中、図7
と同一または相当部分には同一符号を付して説明を省略
する。
【0108】図9に示した例では、事例76として、事
例番号69(図9に示した例では「0001」)が割当
てられている。
【0109】また、図3に示した定型フィールド57の
各文書フィールド「<顧客名>」「<顧客電話>」「<
件名>」「<機種>」に対しては、事例76として、フ
ィールド名「顧客名」「顧客番号」「件名」「機種」と
当該フィールド名に対応させた定型フィールドの内容
「山田太郎」「0□□□−△▽−○○○○」「エアコン
の冷媒音」「エアコン」が生成されている。
【0110】また、図3に示した非定型フィールド58
の各フィールド「<質問>」「<回答>」に対しては、
事例76として、「質問」「回答」といったフィールド
名70、各フィールド名70に対応させて、「エアコン
から音がする。」……「異常ではないので対策不要。」
といった当該フィールドに属する事例文71、各フィー
ルド毎に事例文71の各々に対して「1」「2」「3」
「4」(以上<質問>フィールド)「1」「2」(以上
<回答>フィールド)といった一連の文番号72、「症
状」「環境」「症状」「症状」(以上<質問>フィール
ド)「原因」「対策」(以上<回答>フィールド)とい
った文タグ73が生成されている。
【0111】また、文タグ73「症状」が与えられてい
るのは、<質問>フィールドに属する文番号1,3、4
の事例文71であり、その他の事例文71にはそれぞれ
異なる文タグ73が与えられているので、文番号1、
2、3、4(以上<質問フィールド>)、1、2(以上
<回答>フィールド)の事例文71に対して、それぞれ
「1」「1」「2」「3」「1」「1」といった文タグ
毎文番号74が割当てられている。
【0112】図9においては、文切り出し処理(図7に
示したフローチャートにおけるステップS18)、文タ
グ付与処理(同ステップS20)が全て成功した場合を
示しているが、これら2つのの処理は文の区切りや文タ
グ付与条件の曖昧さのために事例文の切出しを誤る場合
がある。その場合には、図1に示した事例蓄積・検索装
置における処理対象文抽出部45に表示機能を設け、図
9に示したような形式で事例をユーザに提示(表示)し
てユーザからの編集・修正入力を受付ける構成とするこ
とにより、人手による編集・修正が可能となる。
【0113】以上で図2に示したフローチャートにおけ
る処理対象文抽出処理(ステップS1)が終了し、次に
文解析処理(ステップS2)を実行する。
【0114】文解析処理(ステップS2)においては、
処理対象抽出処理(ステップS1)において得られた処
理対象文(事例文)の集合に対して形態素解析および構
文解析を行い、文の構造を生成する。
【0115】図10は、図2に示したフローチャートに
おける文解析処理(ステップS2)の流れを示すフロー
チャートである。図10において、77は後述する形態
素解析(ステップS22)において用いる解析用単語辞
書である。なお、図10中、図2と同一または相当部分
には同一符号を付して説明を省略する。次に、図10に
示したフローチャートを用いて文解析処理(ステップS
2)の流れを説明する。
【0116】文解析処理(ステップS2)は、図10に
示すように、形態素解析処理(ステップS22)と構文
解析処理(ステップS23)とからなる。形態素解析処
理(ステップS22)では解析用単語辞書77を、構文
解析ステップS23では領域オントロジ44を参照す
る。また、解析用単語辞書77を領域オントロジ44の
中に含めておき、形態素解析処理(ステップS22)が
領域オントロジ44を参照するように構成しても良い。
【0117】図11は、図10に示したフローチャート
における形態素解析処理(ステップS22)の流れを示
すフローチャートであると共に、図1に示した事例蓄積
・検索装置における文解析部47中の形態素解析部(図
示せず)の構成を示す構成図である。
【0118】図11において、78は図1に示した事例
蓄積・検索装置における文解析部47の中に存在して形
態素解析を行う形態素解析部、79は形態素解析を行う
際に用いる付属語を予め格納した付属語辞書、80は付
属語辞書79に格納した付属語の接続関係を予め記述し
て付属語辞書79に格納した付属語接続表、81は形態
素解析処理(ステップ22)の処理対象となる入力文、
82は入力文81を形態素解析した際の解析途中結果、
83は形態素解析処理(ステップ22)を実行して得ら
れた形態素解析結果、84、85,86は解析用単語辞
書77の構造を示し、それぞれ、「見出し」、「品詞」
情報、「意味シンボル」である。なお、図11中、図1
0と同一または相当部分には同一符号を付して説明を省
略する。
【0119】次に、図11に示した形態素解析部78の
構成図とフローチャートとを用いて形態素解析部78の
動作と形態素解析処理(ステップS32)の流れを説明
する。
【0120】形態素解析部78では、形態素解析処理
(ステップS22)を実行する。形態素解析処理(ステ
ップS22)では、解析用単語辞書77、付属語辞書7
9、付属語接続表80を参照し、形態素解析を行ない、
入力文81を形態素の列に分割する。形態素解析の方
法、付属語辞書79、付属語接続表80については、多
くの文献に詳述されているのでここでは説明を省略す
る。なお以下の説明では、図11の解析途中結果82に
示すように、形態素の区切りを「/」によって略記表示
する。
【0121】図11に示した解析途中結果82は、自立
語部分から、解析用単語辞書77に記述された情報(見
出し84、品詞情報85、単語の種別を表す概念情報で
ある意味シンボル86)を参照できる構成とする。この
とき、解析途中結果82に解析用単語辞書77を参照す
るためのポインタ情報を保持しても良いし、解析用単語
辞書77が2次記憶装置に存在するなどの原因により参
照に時間を要する場合は、1次記憶装置上に前記解析用
単語辞書77の情報をコピーしても良い。なお、以下の
説明では、図11に示したように意味シンボル86は単
語を記号「<」と記号「>」とで囲んで表すものとす
る。
【0122】図12は、図10に示したフローチャート
における構文解析処理(ステップS23)の処理の流れ
を示すフローチャートであると共に、図1に示した事例
蓄積・解析装置における文解析部45の中の構文解析部
(図示せず)の構成を示す構成図である。
【0123】図12において、87は文解析部45の中
に存在し、構文解析を行う構文解析部、88は係り受け
処理(ステップS25)で用いるため予め格納した文法
規則、89は形態素解析結果83を入力とし、文節構造
生成処理(ステップS24)で生成した文節構造、90
は文節構造89を入力とし、係り受け解析処理(ステッ
プS25)で生成した係り受け構造である。
【0124】次に、図12に示した構文解析部87の構
成図とフローチャートとを用いて構文解析部の動作と形
態素解析処理(ステップS23)の流れを説明する。
【0125】構文解析部87は、係り受け解析を行なう
基本単位である文節構造89を生成する文節構造生成部
(図示せず)と、文法規則88を参照して係り受け解析
を行う係り受け解析部(図示せず)とから構成される。
【0126】図10に示した構文解析処理(ステップS
23)では、まず、文節構造生成処理(ステップS2
4)において、図11に示した形態素解析出力結果83
を入力とし、係り受け解析を行なう基本単位である文節
構造89を生成する。文節構造89は、1個以上の自立
語形態素だけから構成されるか、または1個以上の自立
語形態素と当該自立語形態素に連なる1個以上の付属語
形態素とから構成される。
【0127】図13は、文節構造89の例を示す図であ
る。図13において、91は係り受けの係り部分の属性
である係り属性、92は係り受けの受け部分の属性であ
る受け属性、93は当該文節を構成する少なくとも1個
の自立語形態素情報へのポインタを格納した自立語情
報、94は0個以上の付属語形態素情報へのポインタを
格納した付属語情報である。
【0128】係り受け解析処理(ステップS25)で
は、文法規則88に従って文節構造89の係り受け解析
を行い、係り受け構造90を構文解析結果として生成す
る。係り受け解析の方法については、多くの文献等に解
説されているので、ここでは詳細な説明を省略する。な
お、一般に係り受け解析の途中で多数の曖昧性を生ずる
が、当該曖昧性を解消するために領域オントロジ44を
適宜参照する。なお、文法規則88は、係り受け解析処
理(ステップS25)のプログラム中に埋込んだ構成と
しても良い。
【0129】以上で、図2に示したフローチャートにお
ける文解析処理(ステップS2)の処理が終了する。次
に、領域オントロジ44を参照して類似文の照合を行う
類似文照合部48を呼出しながら処理対象文(事例文)
の構文解析結果90の集合を類似文ごとに分類(クラス
タリング)する類似文クラスタリング処理(ステップS
3)を実行する。
【0130】図14は、図3に示した電子化文書ファイ
ル54から生成された類似した事例文の集合を含むクラ
スタからなる問題解決木95の例を示す図である。
【0131】図14において、95は問題解決木、96
は「気になる音」というラベルが設定されたクラスタ、
97は「本体ランプ未点灯」というラベルが設定された
クラスタ、98は「本体表示ランプ点滅」というラベル
が設定されたクラスタ、99は「入力タイマ作動」とい
うラベルが設定されたクラスタ、100は当該クラスタ
に関連付けられている事例(文)の数、101は検索時
に利用する確認チェック欄、102はクラスタ表示のた
めに設定したクラスタの表示ラベル、103は当該クラ
スタが問題解決木95の終端に位置する場合に、当該ク
ラスタが終端であることが判るように付与した終端表示
である。
【0132】図14に示すような類似文の集合を含むク
ラスタからなる問題解決木95を構成し、作成された問
題解決木95の各クラスタが類似した事例文の集合を持
ち、図9に示すように、各事例文71が事例76へのポ
インタを持つ形式で図1に示す事例データベース50に
蓄積される。図2に示したフローチャートにおける類似
文クラスタリング処理(ステップS3)の流れを説明す
る前に、まず、類似文クラスタリング処理(ステップS
3)から呼出して文同士の類似度を求める類似文照合部
48の動作について説明する。
【0133】領域オントロジ44を参照して類似文の照
合を行う類似文照合部48における文同士の類似度の計
算は、文の係り受け構造におけるノードの階層毎の重み
付けやノード内の属性による重み付け(否定、推量など
の様相表現を計算対象にする処理)によって行う。
【0134】図15は、2つの文の係り受け構造の例を
示す図である。図15において、104は文So「セン
サが目詰まりを認識する」の係り受け構造、105は文
Si「センサが結露を検出する」の係り受け構造であ
る。
【0135】次に、図15を用いて類似文照合部48に
おける文同士の類似度の計算方法を説明する。類似文照
合部48における自然言語の文同士の類似度計算関数を
Sim(A,B,D)とする。引数AおよびBは、図1
0に示した構文解析処理(ステップS23)を実行した
結果得られた構文解析結果である係り受け構造90(図
12)であり、図15に示すような木構造をしている。
また、引数Dは、文同士の類似度計算を行う際の照合の
詳細度であり、図15に示した2つの木構造をした係り
受け構造104、105の類似度計算の際に、ルートノ
ードから何階層目までを処理対象とするかを示す値であ
る。ここでは簡単のため、D=2として説明する。
【0136】最初に初期類似度1.0を与える。類似度
1.0は、入力された2つの文が全く同じ意味を表すと
いうことを意味する。以下の処理では、木構造を辿りな
がら各ノードの情報を比較し、異なる部分に「ペナルテ
ィ」を与え、1.0から減じていく。類似度が0または
所定の値になった時点で、比較対象は類似していないと
見なして類似度計算を打切る。
【0137】図16は、類似度計算におけるペナルティ
の計算規則の例を示す図である。
【0138】まず、第1レベルのノード間の比較を行
う。ここでは、意味シンボルが「<検出動作>」で等し
く、実際の単語が異なるので図16に示した規則R1に
従ってペナルティ値−0.01を与える。次に、第2レ
ベルのノード間の比較を行う。このとき、左側のノード
「センサ<モニタ装置>」は情報が完全に一致するので
ペナルティを与えない。右側のノードは意味シンボルが
異なるので図16の規則R4に従ってペナルティ−0.
3を与える。このようにして、類似度は、1.0−0.
01−0.3を計算して0.69となる。
【0139】例えば、仮に前記引数の値Dとして「1」
が与えられていれば、類似度計算は第1レベルのノード
だけが対象となり、類似度は1.0−0.01を計算し
て0.99となる。このように、Dの値によって類似度
計算の精度を制御できるので、検索状況に応じて柔軟な
処理(類似度計算)が可能となる。
【0140】図17は、領域オントロジ44に格納され
た領域に関する知識の例を示す図である。図17におい
て、106は上位概念−下位概念の関係を示すIS−A
関係知識、107は全体−部分の関係を示すHAS−A
関係知識、108は概念間の関係を示す格関係知識、1
09は表現の差異が大きい場合にその違いを吸収する言
換え知識、110は「<タイマ表示>」に関するHAS
−A関係知識であり、同時には起り得ない背反関係を示
す知識である。なお、図17中、図2と同一または相当
部分には同一符号を付して説明を省略する。
【0141】即ち、領域オントロジ44は、事例蓄積・
検索処理の対象とする領域に依存したIS−A関係知識
106、HAS−A関係知識107、格関係知識10
8、言換え知識109からなどから構成され、背反関係
を示す知識の記述も可能である。なお、IS−A関係知
識106やHAS−A関係知識107は、通常「シソー
ラス」と呼ばれるものである。
【0142】また、図15に示した係り受け構造104
に対して図16に示した規則R2を適用すると、図17
に示したIS−A関係知識106によって、単語「モニ
タ装置」の意味シンボルが「<本体装置>」の場合、文
「モニタ装置が目詰まりを認識する」の類似度は、1.
0−0.1を計算して0.9となる。
【0143】一方、図16に示した規則R5を図12に
示した文「RCでタイマが入らない」の係り受け構造9
0に適用すると、構文解析結果のノードの属性に否定を
含むので、図16に示した規則R5によって文「RCで
タイマが入る」の係り受け構造との類似度は、1.0−
0.9を計算して0.1となる。類似度計算を打切るた
めの所定の値(閾値)が、例えば、0.2に設定されて
いたとすると、前記2つの文は類似していないことにな
り、類似度計算は本時点で打切られる。
【0144】同様に、文中に「〜だろう」のような推量
表現があり、構文解析結果のノードの属性に推量を含む
場合には、図16に示した規則R6が適用されてペナル
ティとして−0.15を減じた類似度が与えられる。
【0145】また、同様にして、文「タイマボタンの入
力を受付けない」に対して図16に示した規則R3を適
用すると、図17に示したHAS−A関係知識107を
用いて、文「リモコンの入力を受付けない」との類似度
は、1.0−0.2を計算して0.8と比較的高くな
る。
【0146】領域オントロジ44のHAS−A関係知識
107には、背反な情報を記述することもできる。図1
7に示した「<タイマ表示>」に関するHAS−A関係
知識110の例を用いて説明する。
【0147】「<タイマ表示>」には、「なし」、「切
タイマ」、「入タイマ」という状態があるが、図17に
示した「<タイマ表示>」に関するHAS−A関係知識
110は、「なし」と「切タイマ」または「入タイマ」
とは同時には表示されないので背反であることを示して
いる。本「<タイマ表示>」に関するHAS−A関係知
識110によって、事例文中に文「タイマ表示はなしで
ある」と文「タイマ表示に入タイマがついている。」が
あるとき、クラスタ間の情報として事例データベース5
0の中にそれぞれの文を含むクラスタが背反であるとい
う情報を格納しておくために用いることができる。
【0148】図17に示すように、領域オントロジ44
の言い換え知識109には、同じ意味になる言葉の表現
を記述することができる。図17に示す例では、知識1
09は、「<ブレーカ>が飛ぶ」と「<ブレーカ>が落
ちる」とが同じ意味になるという言い換え知識109が
記述されており、類似度の計算時に本言い換え知識10
9を参照することによって、文「ブレーカが飛ぶ」と文
「ブレーカが落ちる」との類似度は1.0である(意味
的に一致する)として取扱うことができる。
【0149】図18は、図2に示したフローチャートに
おける類似文クラスタリング処理(ステップS3)の処
理の流れを示すフローチャートである。図18におい
て、111は事例番号69、フィールド名70、事例文
71、文番号72、文タグ73、文タグ毎文番号74、
係り受け構造90から構成される事例文データ、112
は複数の事例文データ111から構成される事例文デー
タの集合である。なお、図18中、図7および図12と
同一または相当部分には同一符号を付して説明を省略す
る。
【0150】次に、図18を用いて、図2に示したフロ
ーチャートにおける類似文クラスタリング処理(ステッ
プS3)の処理の流れを説明する。類似文クラスタリン
グ処理(ステップS3)は、事例文データの集合112
を入力パラメータとして受取る。
【0151】まず、分類(クラスタリング)の対象とす
るフィールド名70、文タグ73の種類、クラスタの最
大階層の数layerを指定する(ステップS26)。
次に、現在の階層を「1」として、指定された条件に合
う事例文の集合、最大階層数(layer)、現在の階
層「1」を入力パラメータとしてクラスタリング処理
(ステップS27)を呼出す。クラスタリング処理(ス
テップS27)の処理の流れについては後述する。次
に、クラスタリング処理(ステップS27)の処理結果
である図14に示した問題解決木95を事例データベー
ス50に格納する。
【0152】図19は、図18に示したクラスタリング
処理(ステップS27)の処理の流れを示すフローチャ
ートである。図19において、113は後述する実際の
クラスタリングを行うクラスタリング副処理(ステップ
S30)の実行結果である。
【0153】クラスタリング処理(ステップS27)
は、まず、事例文の集合、最大階層数layer、現在
の階層iをパラメータとして受取ると、現在の階層iと
最大階層数layerとを比較し(ステップS29)、
現在の階層iが最大階層数layerよりも大きい場合
は処理を終了する。一方、現在の階層iが最大階層数l
ayer以下の場合は、事例文の集合に対してクラスタ
リング副処理(ステップS30)を呼出し、実際のクラ
スタリング処理を行う。クラスタリング副処理(ステッ
プS30)の処理の流れは後述する。クラスタリング副
処理(ステップS30)の実行結果113として、クラ
スタ数kと事例文の集合であるk個のクラスタ{C1,
C2,……,Ck}とが得られる。
【0154】次に、jをクラスタリング処理(ステップ
S27)の内部に設けたカウンタとし、カウンタjの値
を初期値1に設定する(ステップS31)。カウンタj
の値とクラスタ数kの値を比較し(ステップS32)、
カウンタjの値がクラスタ数kよりも大きい場合は処理
を終了する。一方、カウンタjの値がクラスタ数k以下
の場合は、事例文の集合Cj、最大階層layer、現
在の階層(i+1)を入力パラメータとしてクラスタリ
ング処理(ステップS37)を再帰的に呼出す。次に、
カウンタjの値を1だけ増分してステップS32へ戻
り、ステップS32からの処理を繰返す。
【0155】図20は、図19に示したフローチャート
におけるクラスタリング副処理(ステップS30)の処
理の流れを示すフローチャートである。次に、図20を
用いて、類似文照合部48による類似度計算を用いてク
ラスタリングを行うクラスタリング副処理(ステップS
30)の処理の流れを説明する。
【0156】まず、2つの文が類似していると判定する
閾値thを設定する(ステップS34)。ここでは、閾
値thの値を0.75として説明する。閾値thはクラ
スタの作成状況に応じて変更することができるものとす
る。次に、一つのクラスタCi(i=1,2,……,
n;nは処理対象の事例文の数)がそれぞれ1つの事例
文Siからなる初期クラスタを構成する(ステップS3
5)。続いて、類似文照合部48を呼出してSim(S
i,Sj,D)を求め、クラスタ間の類似度Sim(C
i,Cj)をSim(Si,Sj,D)として各クラス
タ間の初期の類似度表を作成する。ここで、i=1,
2,……,n、j=i+1,i+2,……,nである。
なお、Dの値は必要に応じて設定する。
【0157】図21は、事例文がS1,S2,……,S
5の5個の文からなり、C1={S1},C2={S
2},……,C5={S5}の5個のクラスタからクラ
スタリング処理を始める場合のクラスタ間の類似度を格
納した類似度表の例を示す図である。図21において、
114はクラスタ間の初期の類似度表、115は第1回
目のクラスタリング処理を行った場合の類似度表、11
6は第2回目のクラスタリング処理を行った場合の類似
度表である。なお、これらの類似度表114、115、
116はそれぞれ対象行列になるので、下半分のみに値
を格納している。
【0158】次に、前記初期の類似度表114から最大
の類似度を持つクラスタの対CuとCvを求める(ステ
ップS37)。図21に示した類似度表114において
は、Cu=C4、Cv=C5、Sim(Cu,Cv)=
Sim(C4,C5)=0.99であり、クラスタ間の
類似度が最大となっている。
【0159】次に、最大の類似度Sim(Cu,Cv)
と閾値thを比較し(ステップS38)、最大の類似度
Sim(Cu,Cv)が閾値thよりも大きい場合はク
ラスタリング処理を続行し、最大の類似度Sim(C
u,Cv)が閾値th以下の場合はクラスタリング処理
を終了する。図21に示した初期の類似度表114の例
では、最大の類似度Sim(C4,C5)が0.99、
閾値thが0.75であるから、クラスタリング処理を
続行する。
【0160】次に、ステップS2406では、クラスタ
の対CuとCvを1つのクラスタCu,v={Su,S
v}に纏める。図20に示した初期の類似度表の例に対
して第1回目のクラスタリング処理を行った場合、クラ
スタの対C4とC5が1つのクラスタC4,5={S
4,S5}に纏められる。
【0161】次に、クラスタの対を纏めることによって
新しく生成されたクラスタCu,vとその他のクラスタ
Ciとの類似度Sim(Cu,v,Ci)を(Sim
(Ci,Cu)+Sim(Ci,Cv))/2なる式で
計算し、類似度表を再編成する(ステップS40)。図
21に示した例では、初期の類似度表114に対して、
第1回目のクラスタリング処理を行った場合の類似度表
115が得られる。
【0162】次に、ステップS37に戻り、ステップS
38においてクラスタ間の類似度Sim(Cu,Cv)
が閾値th以下となるまでステップS37からの処理を
繰返す。
【0163】図20に示したステップS40における式
(前記式)では、2つのクラスタCu、Cvの類似度の
単純平均値を計算しているが、クラスタ内の事例文の数
を考慮した重み付き平均値などを用いても良い。
【0164】図21に示した例では、2回目の繰返しの
後、クラスタC1とクラスタC2とを纏めて作成された
第2回目のクラスタリング処理を行った場合の類似度表
116において、最大の類似度Sim(C1,2,C4,
5)が0.73となり、閾値thの0.75以下となる
ので、ステップS38においてクラスタリング副処理
(ステップS30)を終了する。このとき、図21に示
した例では、C1,2={S1,S2}、C3={S
3}、C4,5={S4,S5}の3つのクラスタが生
成されている。
【0165】以上で、図2に示したフローチャートにお
いて事例文の分類処理を行う類似文クラスタリング処理
(ステップS3)が終了する。次に、図2に示したフロ
ーチャートにおける事例クラスタ編集処理(ステップS
4)を実行し、事例データベース50に格納された事例
データのクラスタの階層を図14に示すような構造の問
題解決木95として編集して表示する。
【0166】図14に示した問題解決木95の例は、図
2に示したフローチャートにおける処理対象文抽出処理
(ステップS1)で抽出された図9に示す事例文71の
内、図6に示したフィールド64のフィールド名が「<
質問>」であるフィールドから文タグ73として「症
状」を持つ1、2、3番目に出現した事例文71、即
ち、文タグ毎分番号が1、2、3の事例文71に対し
て、クラスタの階層数3を図2に示したフローチャート
における類似文クラスタリング処理(ステップS3)で
指定して類似文のクラスタリングを行って作成したもの
である。
【0167】図14に示した問題解決木95は、図6に
示したフィールド名64の欄のフィールド名に対応する
オプション66の欄における「カテゴリ」属性67の値
毎に作成する。また、図1に示した事例クラスタ編集部
51における各クラスタの表示は、当該クラスタが含む
事例文の数が多い順に上から下に表示する。各クラスタ
は類似した事例文の集合からなり、マウスなどの操作に
よって各クラスタの表示ラベル102を指定して当該ク
ラスタ内の情報が参照できるものとする。また、事例ク
ラスタ編集部51では、ユーザの操作によりクラスタの
表示ラベル102の文字列を設定および編集できるもの
とする。
【0168】図22は、事例データベース50に格納さ
れた事例文データ111の例を示す図である。なお、図
22中、図18と同一または相当部分には同一符号を付
して説明を省略する。
【0169】図2に示したフローチャートにおける処理
対象文抽出処理(ステップS1)の出力、細かくは、図
7に示したフローチャートにおける文タグ付与処理(ス
テップS20)の出力である事例番号69、フィールド
名70、事例文71、文番号72、文タグ73、文タグ
毎文番号74の上に、図2に示したフローチャートにお
ける文解析処理(ステップS2)、細かくは、図12に
示したフローチャートにおける係り受け解析処理(ステ
ップS25)を実行することによって得られた係り受け
構造90が付け加えられた後、図2に示したフローチャ
ートにおける類似文クラスタリング処理(ステップS
3)において事例文データが属するクラスタが決定さ
れ、該クラスタのクラスタ番号が付与されて事例データ
ベース50に格納される。このとき、事例データベース
50には図14に示した問題解決木95のようなクラス
タ間の階層を表す情報も同時に格納される。
【0170】また、図23は、図2に示したフローチャ
ートにおける類似文クラスタリング処理(ステップS
3)において問題解決木95(図14参照)を事例デー
タベース50に格納する処理において、事例データベー
ス50に格納した階層関係以外のクラスタ間情報の例を
示す図である。
【0171】クラスタ間情報は、図23に示すように、
クラスタ番号で表される2つのクラスタ間の関係を定義
する。関係のタイプの例としては、−1(背反)と1
(類似)とがある。背反関係は、図17における「<タ
イマ表示>」に関するHAS−A関係知識110に示し
た背反関係を参照して作成する。
【0172】類似関係は、各クラスタに当該クラスタを
代表する代表文を設定できるようにしておき、その代表
文の間の類似度をクラスタ間情報として事例データベー
ス50に格納しておく。
【0173】以上で、本発明に係る実施の形態1による
事例蓄積・検索装置における事例蓄積機能の動作の詳細
な説明を終了する。
【0174】以下、適宜図を参照しながら、本発明に係
る実施の形態1による事例蓄積・検索装置における事例
検索機能の動作の詳細を、図24に示したフローチャー
トに従って具体例を用いて説明する。
【0175】まず、検索文入力処理(ステップS41)
において、ユーザが所望の文書を検索するための検索文
(新たな問題の記述)を入力する。このとき、検索文の
入力は、キーボード、文字認識装置、音声認識装置(以
上図示せず)などの入力装置を用いて行う。
【0176】次に、文解析処理(ステップS2)におい
て、検索文入力処理(ステップS41)によって入力さ
れた検索文の解析を行う。
【0177】文解析処理(ステップS2)は、前述した
事例蓄積処理における説明と同様に、図10に示した形
態素解析処理(ステップS22)と構文解析処理(ステ
ップS23)の順で前記検索文を解析し、前記検索文に
対する係り受け構造を生成する。前記各処理は前述した
事例構築処理の場合と同様であるので説明を省略する。
【0178】次に、類似事例検索処理(ステップS4
2)の処理の流れを説明する。まず、事例データベース
50の1次検索を行う。事例データベース50の容量が
小さい場合は入力された検索文と全ての事例文との間で
類似文照合部48の処理を行うという方法もあるが、一
般的には事例データベース50には大容量の事例文が格
納されているため、入力された事例文と全ての事例文と
の照合処理を行えば、処理時間に問題が生じる。そこ
で、事例文の係り受け構造に対して、当該構造の構文要
素または当該構文要素が持つ意味シンボルによる索引を
設けておき、当該索引を用いて1次検索処理を行った
後、類似文照合部48の処理を行い、処理対象の事例文
を予め絞り込んでおく構成とする。
【0179】次に、図24に示したフローチャートにお
ける類似事例検索処理(ステップS42)では、類似文
照合部48を起動して前記1次検索結果の各事例文の係
り受け解析結果と入力された検索文の係り受け解析結果
との類似度を求め、求めた類似度に基づいて類似文の照
合を行う。類似文照合処理では、図17に示した領域オ
ントロジ44を参照しながら類似文の照合を行う。
【0180】次に、図24に示したフローチャートにお
ける類似事例検索処理(ステップS42)の処理の流れ
を図25に示したフローチャートに従って説明する。
【0181】まず、ループ処理のための初期化設定を行
う(ステップ44)。次に、ステップS45からステッ
プS47までのループ処理を前記1次検索結果の各事例
文に対して実行する。
【0182】まず、ステップS46において、1次検索
結果のi番目の事例文Si(図15に示した事例文Si
「センサが結露を検出する」に対する係り受け構造10
5)と入力検索文So(図15に示した事例文So「セ
ンサが目詰まりを認識する」に対する係り受け構造10
4)との間で前述の類似度計算Sim(Si,So,
D)を行う。Dの値は、前述したように必要に応じて設
定しておく。
【0183】最後に、検索結果を類似度順にソートし
(ステップS48)、ソートした結果を図1に示した検
索結果表示部53に出力する(ステップS43)。
【0184】本発明に係る事例蓄積・検索方法によれ
ば、検索文と事例文とが事例文中に含まれるキーワード
のレベルでは完全に一致していても、検索文と事例文と
の文の意味内容が異なれば類似度が小さくなる。また、
検索文と事例文とに含まれるキーワードが異なっていて
も、領域オントロジ44を利用して類似文照合を行うこ
とによって意味的に同じ内容の検索文と事例文との文の
類似度が高くなる。
【0185】従来のキーワードベースの事例蓄積・検索
においては、以上のような木目細かな処理はしていない
ので、否定文などが事例検索時に検索ゴミとして余計な
事例文が上位に出力されてしまうが、本発明に係る事例
蓄積・検索方法によれば、例えば、類似度が0.5以下
の事例文は表示しないといった設定をすることによって
余計な事例文を類似文として出力しないようにすること
ができる。
【0186】以上のように、事例検索時には、図24に
示した文解析処理(ステップS2)における図10に示
した形態素解析処理(ステップS22)において入力検
索文を単語単位に分割し、図10に示した構文解析処理
(ステップS23)において前記入力検索文に対する係
り受け構造を生成し、図23に示した類似事例検索処理
(ステップS42)において係り受け構造による検索を
行ない、事例蓄積時に用いたものと同じ類似文照合部4
8において領域オントロジ44を参照しながら前記入力
検索文と前記検索結果との類似度を計算し、計算して得
られた類似度に従って図23に示した検索結果表示処理
(ステップS43)において前記類似度に従って検索結
果を図1に示した検索結果表示部53に出力することに
より、多様な自然言語の表現に対して検索ゴミの少ない
事例検索を実現することができる。
【0187】図24に示した検索結果表示処理(ステッ
プS43)における検索結果の表示方法は、図14に示
したような問題解決木95を検索結果表示部53に表示
し、入力検索文と類似した事例文を含むクラスタを強調
表示しても良い。図14は、例えば、「いやな音が聞こ
える」という入力検索文に対して、「気になる音」とい
うラベルが設定されたクラスタ96が最も類似した事例
文「変な音が聞こえる」を含むクラスタとして強調表示
された例を示している。
【0188】また、図1に示した検索結果表示部53に
おいては、事例クラスタ編集部51と同様に問題解決木
95をクラスタが含む事例文の数が多い順に上から下に
表示することによって過去に蓄積された件数が多い事例
をユーザが容易に参照することができる。ユーザは各ク
ラスタを指定し、指定されたクラスタが含む事例文に対
応する事例を参照し、図9に示すような形式で事例を表
示することができる。1つのクラスタには複数の事例文
が含まれ、それぞれ別の事例に対応する。事例を参照す
る際に事例の一覧表を表示する場合には、図6に示した
フィールド名64欄の各フィールド名に対応するオプシ
ョン66欄に記述された「タイトル」属性68を事例の
内容として一覧表示すれば良い。
【0189】また、事例データベース50には図22に
示した事例文データ111の他に図23に示したクラス
タ間情報も格納されている。次に、クラスタ間情報の使
い方について説明する。
【0190】クラスタ間情報は、クラスタ番号で表され
る2つのクラスタ間の背反関係や類似関係が定義されて
いる。本クラスタ間情報を用いることにより、例えば、
「タイマ表示はなし」という入力文に対して、図14に
示す問題解決木95において「本体ランプ未点灯」とい
うクラスタ97が検索された場合に、ユーザが当該クラ
スタ97の状態が正しいとして、確認チェック101欄
を選択した場合に、類似クラスタである「本体エリア表
示未点灯」というクラスタ98を強調表示したり、背反
クラスタである「入タイマ作動」というクラスタ99の
表示を非強調表示したりすることができる。本実施の形
態1のように、事例蓄積時において、データ間の関係を
含めて事例データとして予め事例データベース50に格
納しておくことにより、データ間の関係を意識した検索
の効率化を図ることができる。
【0191】また、以上のような事例蓄積・検索処理を
プログラムとして実現して得られた事例蓄積・検索プロ
グラムをコンピュータで読取可能な記録媒体に記録し、
記録媒体に記録した事例蓄積・検索プログラムをパーソ
ナルコンピュータ、マイクロプロセッサなどのコンピュ
ータにロードして実行しても良い。
【0192】また、前記事例蓄積・検索プログラムは、
ネットワークに接続されたコンピュータまたはディスク
装置に格納されており、前記プログラムのロードはネッ
トワークを経由して行っても良い。
【0193】また、前記事例蓄積・検索プログラムはネ
ットワークを介して接続されたコンピュータ中に存在
し、前記コンピュータにアクセスして前記事例蓄積・検
索プログラムを実行しても良い。
【0194】
【発明の効果】本発明に係る第1の事例蓄積・検索装置
によれば、事例蓄積・検索の対象が複数の事例文からな
る事例に対しても、自然言語で記述された電子化文書の
中から各々の事例文を切出して分類した事例データを事
例データベースに蓄積しておき、入力された検索文と前
記事例データベースに分類して格納された事例文とを照
合することにより、複雑な事例に対しても類似検索によ
る問題の解決を容易にすることができるという効果を奏
する。
【0195】本発明に係る第1の事例蓄積方法によれ
ば、事例蓄積・検索の対象が複数の事例文からなる事例
に対しても、自然言語で記述された電子化文書の中から
各々の事例文を切出して分類した事例データを事例デー
タベースに蓄積しておき、入力された検索文と前記事例
データベースに分類して格納された事例文とを照合する
ことにより、複雑な事例に対しても類似検索による問題
の解決を容易にすることができるという効果を奏する。
【0196】本発明に係る第2の事例蓄積方法によれ
ば、更に、処理対象文抽出ステップにおいて、切出した
事例文に事例文の種別を付与することによって、事例蓄
積処理の対象とする事例文を特定することができるの
で、前記分類処理において、文の種類と記述順を反映さ
せた分類を行うことができるという効果を奏する。
【0197】本発明に係る第3の事例蓄積方法によれ
ば、更に、類似文クラスタリングステップにおいて、各
々の事例文を分類して構成するクラスタの階層数または
・および前記各々の事例文同士が類似していると判断す
る際に用いるクラスタ間の類似度の閾値を指定するの
で、事例蓄積処理が対象とする事例文の「文タグ」やそ
の順番などに応じて、前記階層数またはクラスタ間の類
似度の閾値を適切に設定することによって、木目細かく
且つ精度良くクラスタリング処理をすることができると
共に、クラスタリング処理の効率化を図ることができる
という効果を奏する。
【0198】本発明に係る第4の事例蓄積方法によれ
ば、更に、領域オントロジにおいて、意味的な上位−下
位の関係を示すIS−A関係知識、意味的な部分−全体
の関係を示すHAS−A関係知識、概念間の関係を示す
格関係知識、表現の差異が大きい場合の違いを吸収する
言換え知識、同時には起り得ない背反関係にある知識を
それぞれ記述するので、事例蓄積処理の対象とする領域
に依存した知識の記述が柔軟になり、木目細かな知識の
記述ができるので、文解析処理や類似文照合処理の精度
が向上し、更には、事例検索時における類似文クラスタ
リング処理や類似事例検索処理の精度を向上することが
できるという効果を奏する。
【0199】本発明に係る第5の事例蓄積方法によれ
ば、更に、類似文照合ステップにおいて、前記領域オン
トロジ用いて各々の事例文を構文解析して得られた各々
の事例文の(係り受け)構造における構文的な要素の属
性によって意味構造を照合することによって類似度を求
めるので、事例を構成する文の様相表現(否定、推量な
ど)を含めた多様な自然言語表現に対応して、構文解析
結果の構文木のノードに設定されるような詳細な(木目
細かな)類似性を考慮して判定することによって、構文
的および・または意味的に類似した文を含む事例の検索
をすることができるという効果を奏する。
【0200】本発明に係る第6の事例蓄積方法によれ
ば、更に、類似文照合ステップにおいて、各々の事例文
同士の類似度を求める際に用いる照合の詳細度を指定す
るので、ユーザが主導権を持って類似性の基準を与える
ことができると共に、事例蓄積処理の対象とする事例文
の「文タグ」やその順番などによって木目細かく類似性
の基準を与えることができるという効果を奏する。
【0201】本発明に係る第7の事例蓄積方法によれ
ば、更に、前記文解析ステップにおいて、前記事例文の
構造を木構造として作成し、類似文照合ステップにおい
て、各々の事例文同士の類似度を求める際に用いる照合
の詳細度を前記事例文の処理対象とする木構造の深さに
よって指定するので、類似文照合処理の効率化を図るこ
とができるという効果を奏する。
【0202】本発明に係る第8の事例蓄積方法によれ
ば、更に、事例データベースにおいて、クラスタ間の関
係として類似関係または背反関係を記述するので、ある
クラスタを指定した場合に類似度計算など特別な計算を
することなく前記クラスタと類似したクラスタを検索す
ることができるので、類似事例検索処理や検索結果表示
処理など事例検索処理の効率化を図ることができるとい
う効果を奏する。
【0203】本発明に係る第1の事例検索方法によれ
ば、事例蓄積・検索の対象が複数の事例文からなる事例
に対しても、自然言語で記述された電子化文書の中から
各々の事例文を切出して分類した事例データを事例デー
タベースに蓄積しておき、入力された検索文と前記事例
データベースに分類して格納された事例文とを照合する
ことにより、複雑な事例に対しても類似検索による問題
の解決を容易にすることができるという効果を奏する。
【0204】本発明に係る第1の事例蓄積プログラムを
記録したコンピュータで読取り可能な記録媒体によれ
ば、前記記録媒体に記録された事例蓄積プログラムを実
行することにより、事例蓄積・検索の対象が複数の事例
文からなる事例に対しても、自然言語で記述された電子
化文書の中から各々の事例文を切出して分類した事例デ
ータを事例データベースに蓄積しておき、入力された検
索文と前記事例データベースに分類して格納された事例
文とを照合することにより、複雑な事例に対しても類似
検索による問題の解決を容易にすることができるという
効果を奏する。
【0205】本発明に係る第1の事例検索プログラムを
記録したコンピュータで読取り可能な記録媒体によれ
ば、前記記録媒体に記録された事例検索プログラムを実
行することにより、事例蓄積・検索の対象が複数の事例
文からなる事例に対しても、自然言語で記述された電子
化文書の中から各々の事例文を切出して分類した事例デ
ータを事例データベースに蓄積しておき、入力された検
索文と前記事例データベースに分類して格納された事例
文とを照合することにより、複雑な事例に対しても類似
検索による問題の解決を容易にすることができるという
効果を奏する。
【図面の簡単な説明】
【図1】本発明に係る実施の形態1による事例蓄積・検
索装置の構成を示す構成図である。
【図2】本発明に係る実施の形態1による事例蓄積・検
索装置における事例蓄積機能の処理の流れを示すフロー
チャートである。
【図3】電子化文書ファイルの構成の例を示す図であ
る。
【図4】処理対象文抽出処理(ステップS1)の流れを
示すフローチャートである。
【図5】1文書に対する処理対象文抽出処理(ステップ
S10)の流れを示すフローチャートである。
【図6】定型フィールドか非定型フィールドかといった
文書フィールドに関する情報を予め記述した文書フィー
ルド情報の例を示す図である。
【図7】電子化文書ファイル54における非定型フィー
ルドに対する処理(図5に示したフローチャートにおけ
るステップS17)の流れを示すフローチャートであ
る。
【図8】文タグ一覧表の例を示す図である。
【図9】処理対象文抽出処理(ステップS1)によっ
て、図3に示した電子化文書ファイル54の文書55か
ら生成された「事例」の例を示す図である。
【図10】文解析処理(ステップS2)の流れを示すフ
ローチャートである。
【図11】形態素解析処理(ステップS22)の流れを
示すフローチャートであると共に、事例蓄積・検索装置
における文解析部47中の形態素解析部(図示せず)の
構成を示す構成図である。
【図12】図10に示したフローチャートにおける構文
解析処理(ステップS23)の処理の流れを示すフロー
チャートであると共に、図1に示した事例蓄積・解析装
置における文解析部45の中の構文解析部(図示せず)
の構成を示す構成図である。
【図13】文節構造89の例を示す図である。
【図14】電子化文書ファイル54から生成された類似
した事例文の集合を含むクラスタからなる問題解決木9
5の例を示す図である。
【図15】2つの文の係り受け構造の例を示す図であ
る。
【図16】類似度計算におけるペナルティの計算規則の
例を示す図である。
【図17】領域オントロジ44に格納された領域に関す
る知識の例を示す図である。
【図18】類似文クラスタリング処理(ステップS3)
の処理の流れを示すフローチャートである。
【図19】クラスタリング処理(ステップS27)の処
理の流れを示すフローチャートである。
【図20】クラスタリング副処理(ステップS30)の
処理の流れを示すフローチャートである。
【図21】事例文をクラスタリング処理する場合のクラ
スタ間の類似度を格納した類似度表の例を示す図であ
る。
【図22】図18に示したフローチャートにおける問題
解決木95(図14参照)を事例データベース50(図
2参照)に格納する処理(ステップS28)において、
事例データベース50に格納した階層関係以外のクラス
タ間情報の例を示す図である。
【図23】図18に示したフローチャートにおける問題
解決木95(図14参照)を事例データベース50(図
2参照)に格納する処理(ステップS28)において、
事例データベース50に格納した階層関係以外のクラス
タ間情報の例を示す図である。
【図24】本発明に係る実施の形態1による事例蓄積・
検索装置における事例検索機能の処理の流れを示すフロ
ーチャートである。
【図25】図24に示したフローチャートにおける類似
事例検索処理(ステップS42)の処理の流れを示すフ
ローチャートである。
【図26】従来技術1に係る類似事例検索装置の構成を
示す構成図である。
【図27】従来技術2に係る知識ベース装置の構成を示
す構成図である。
【図28】従来技術3に係る文書情報検索装置の構成を
示す構成図である。
【図29】図28における入力解析部28の構成を示す
構成図である。
【符号の説明】
44 領域オントロジ 45 処理対象文抽出部 46 検索文入力部 47 文解析部 48 類似文照合文 49 類似文クラスタリング部 50 事例データベース 51 事例クラスタ編集部 52 類似事例検索部 53 検索結果表示部 ステップS1 処理対象文抽出処理ステップ ステップS2 文解析処理ステップ ステップS3 類似文クラスタリング処理ステップ ステップS4 事例クラスタ編集処理ステップ ステップS41 検索文入力処理ステップ ステップS42 類似事例検索処理ステップ ステップS43 検索結果表示処理ステップ なお、図中、同一符号は同一または相当部分を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 相川 勇之 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 (72)発明者 伊藤 山彦 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5B075 ND03 ND20 ND35 NK02 NK10 NK32 NK35 NR03 NR12 PP02 PP24 PQ02 PR06 QM08 UU06 UU40 (54)【発明の名称】 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記 録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで 読取可能な記録媒体

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】事例蓄積・検索の対象とする領域に依存し
    た用語と前記用語間の関係とに関する知識を予め格納し
    た領域オントロジと、 自然言語で記述された電子化文書の中から前記事例蓄積
    ・検索の対象とする各々の事例文を切出す処理対象文抽
    出手段と、 ユーザが所望する事例文を検索するための検索文を入力
    する検索入力手段と、 前記処理対象文抽出手段によって切出された各々の事例
    文または前記検索入力手段によって入力された検索文を
    入力として前記領域オントロジに格納された知識を参照
    して形態素解析および構文解析を行って前記各々の事例
    文または前記検索文の構造を作成する文解析手段と、 前記文解析手段によって作成された前記各々の事例文ま
    たは前記検索文の構造を入力として前記領域オントロジ
    に格納された知識を参照して前記各々の事例文同士の類
    似度または前記各々の事例文と前記検索文との間の類似
    度を求める類似文照合手段と、 前記類似文照合手段によって求められた前記各々の事例
    文同士の類似度に基づいて前記各々の事例文を分類して
    事例クラスタを構成し、前記事例クラスタの情報と前記
    事例クラスタ間の関係情報とから構成される事例データ
    を作成する類似文クラスタリング手段と、 前記類似文クラスタリング手段によって作成された事例
    データを格納する事例データベースと、 前記類似文照合手段によって求められた前記各々の事例
    文と前記検索文との間の類似度に基づいて前記検索文入
    力手段によって入力された検索文に類似した類似事例文
    を前記事例データベースに格納された事例データの中か
    ら検索する類似事例検索手段と、 前記類似事例検索手段によって検索された類似事例文を
    表示する検索結果表示手段とを備えたことを特徴とする
    事例蓄積・検索装置。
  2. 【請求項2】自然言語で記述された電子化文書の中から
    事例蓄積の対象とする各々の事例文を切出す処理対象文
    抽出ステップと、 前記処理対象抽出ステップによって切出された各々の事
    例文を入力として前記事例蓄積の対象とする領域に依存
    した用語と前記用語間の関係とに関する知識を予め格納
    した領域オントロジを参照して形態素解析および構文解
    析を行って前記各々の事例文の構造を作成する文解析ス
    テップと、 前記文解析ステップによって作成された前記各々の事例
    文の構造を入力として前記領域オントロジに格納された
    知識を参照して前記各々の事例文同士の類似度を求める
    類似文照合ステップと、 前記類似文照合ステップによって求められた前記各々の
    事例文同士の類似度に基づいて前記各々の事例文を分類
    して事例クラスタを構成し、前記事例クラスタの情報と
    前記事例クラスタ間の関係情報とから構成される事例デ
    ータを作成して事例データベースに格納する類似文クラ
    スタリングステップと、 から構成されたことを特徴とする事例蓄積方法。
  3. 【請求項3】前記処理対象文抽出ステップは、抽出した
    前記事例文に対して事例文の種別を付与することを特徴
    とする請求項2に記載の事例蓄積方法。
  4. 【請求項4】前記類似文クラスタリングステップは、前
    記各々の事例文を分類して構成するクラスタの階層数ま
    たは・および前記各々の事例文同士が類似していると判
    断する際に用いるクラスタ間の類似度の閾値を指定する
    ことを特徴とする請求項2に記載の事例蓄積方法。
  5. 【請求項5】前記領域オントロジは、意味的な上位−下
    位関係を記述したIS−A関係知識、意味的な部分−全
    体の関係を記述したHAS−A関係知識、概念間の関係
    を記述した格関係知識、1つの意味・概念・関係を複数
    の表現で記述した言換え知識、同時には起り得ない背反
    関係を記述した知識の内、少なくとも1種類の知識を記
    述することを特徴とする請求項2に記載の事例蓄積方
    法。
  6. 【請求項6】前記類似文照合ステップは、前記文解析ス
    テップにおいて作成された各々の事例文の構造における
    構文的要素の属性に基づいて前記各々の事例文同士の意
    味構造を照合することによって類似度を求ることを特徴
    とする請求項2に記載の事例蓄積方法。
  7. 【請求項7】前記類似文照合ステップは、前記各々の事
    例文同士の類似度を求める際に用いる照合の詳細度を指
    定することを特徴とする請求項2に記載の事例蓄積方
    法。
  8. 【請求項8】前記文解析ステップは、前記事例文の構造
    を木構造として作成し、 前記類似文照合ステップは、前記各々の事例文同士の類
    似度を求める際に用いる照合の詳細度を前記事例文の木
    構造の深さによって指定することを特徴とする請求項7
    に記載の事例蓄積方法。
  9. 【請求項9】前記事例データベースは、事例クラスタ間
    の関係として類似関係または・および背反関係を記述す
    ることを特徴とする請求項2に記載の事例蓄積方法。
  10. 【請求項10】事例検索の対象とする事例データを格納
    した事例データベースの中からユーザが所望する事例文
    を検索するための検索文を入力する検索入力ステップ
    と、 前記検索入力ステップによって入力された検索文を入力
    として前記事例検索の対象とする領域に依存した用語と
    前記用語間の関係とに関する知識を予め格納した領域オ
    ントロジを参照して形態素解析および構文解析を行って
    前記検索文の構造を作成する文解析ステップと、 前記文解析ステップによって作成された前記検索文の構
    造を入力として前記領域オントロジを参照して前記各々
    の事例文と前記検索文との間の類似度を求める類似文照
    合ステップと、 前記類似文照合ステップによって求められた前記各々の
    事例文と前記検索文との間の類似度に基づいて前記検索
    文入力ステップによって入力された検索文に類似した類
    似事例文を前記事例データベースに格納された事例デー
    タの中から検索する類似事例検索ステップと、 前記類似事例検索ステップによって検索された類似事例
    文を表示する検索結果表示ステップとから構成されたこ
    とを特徴とする事例検索方法。
  11. 【請求項11】自然言語で記述された電子化文書の中か
    ら事例蓄積の対象とする各々の事例文を切出す処理対象
    文抽出手順と、 前記処理対象抽出手順によって切出された各々の事例文
    を入力として前記事例蓄積の対象とする領域に依存した
    用語と前記用語間の関係とに関する知識を予め格納した
    領域オントロジを参照して形態素解析および構文解析を
    行って前記各々の事例文の構造を作成する文解析手順
    と、 前記文解析手順によって作成された前記各々の事例文の
    構造を入力として前記領域オントロジに格納された知識
    を参照して前記各々の事例文同士の類似度を求める類似
    文照合手順と、 前記類似文照合手順によって求められた前記各々の事例
    文同士の類似度に基づいて前記各々の事例文を分類して
    事例クラスタを構成し、前記事例クラスタの情報と前記
    事例クラスタ間の関係情報とから構成される事例データ
    を作成して事例データベースに格納する類似文クラスタ
    リング手順とから構成されることを特徴とする事例蓄積
    プログラムを記録したコンピュータで読取可能な記憶媒
    体。
  12. 【請求項12】事例検索の対象とする事例データを格納
    した事例データベースの中からユーザが所望する事例文
    を検索するための検索文を入力する検索入力手順と、 前記検索入力手順によって入力された検索文を入力とし
    て前記事例検索の対象とする領域に依存した用語と前記
    用語間の関係とに関する知識を予め格納した領域オント
    ロジを参照して形態素解析および構文解析を行って前記
    検索文の構造を作成する文解析手順と、 前記文解析手順によって作成された前記検索文の構造を
    入力として前記領域オントロジに格納された知識を参照
    して前記各々の事例文と前記検索文との間の類似度を求
    める類似文照合手順と、 前記類似文照合手順によって求められた前記各々の事例
    文と前記検索文との間の類似度に基づいて前記検索文入
    力手順によって入力された検索文に類似した類似事例文
    を前記事例データベースに格納された事例データの中か
    ら検索する類似事例検索手順と、 前記類似事例検索手順によって検索された類似事例文を
    表示する検索結果表示手順とから構成されことを特徴と
    する事例検索プログラムを記録したコンピュータで読取
    り可能な記憶媒体。
JP11083027A 1999-03-26 1999-03-26 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体 Pending JP2000276487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11083027A JP2000276487A (ja) 1999-03-26 1999-03-26 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11083027A JP2000276487A (ja) 1999-03-26 1999-03-26 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2000276487A true JP2000276487A (ja) 2000-10-06

Family

ID=13790764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11083027A Pending JP2000276487A (ja) 1999-03-26 1999-03-26 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2000276487A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263322A (ja) * 2002-03-11 2003-09-19 Toshiba Corp 情報環境設定システム、プログラム及び方法
WO2006048998A1 (ja) * 2004-11-05 2006-05-11 Intellectual Property Bank Corp. キーワード抽出装置
US7272595B2 (en) 2002-09-03 2007-09-18 International Business Machines Corporation Information search support system, application server, information search method, and program product
WO2011068178A1 (ja) * 2009-12-04 2011-06-09 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
WO2012039122A1 (ja) * 2010-09-22 2012-03-29 日本電気株式会社 顧客応対分析システム、顧客応対分析方法および顧客応対分析プログラム
KR101137243B1 (ko) 2007-04-17 2012-04-20 (주)야긴스텍 온톨로지 기반의 인텔리전트 이씨엠 시스템
JP2015197722A (ja) * 2014-03-31 2015-11-09 大日本印刷株式会社 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
WO2015181962A1 (ja) * 2014-05-30 2015-12-03 株式会社日立製作所 検索方法及び装置並びに記憶媒体
WO2016006276A1 (ja) * 2014-07-10 2016-01-14 日本電気株式会社 インデックス生成装置及びインデックス生成方法
WO2016103451A1 (ja) * 2014-12-26 2016-06-30 株式会社日立製作所 関連情報取得方法及び装置並びに記憶媒体
CN112380348A (zh) * 2020-11-25 2021-02-19 中信百信银行股份有限公司 元数据处理方法、装置、电子设备及计算机可读存储介质
JP2021533401A (ja) * 2019-02-27 2021-12-02 グーグル エルエルシーGoogle LLC コンピューティングデバイスとの継続的な会話の検出
JP2021196786A (ja) * 2020-06-12 2021-12-27 パナソニックIpマネジメント株式会社 文書分類方法、文書分類装置及びプログラム
US11676582B2 (en) 2019-02-27 2023-06-13 Google Llc Detecting conversations with computing devices
CN120196648A (zh) * 2025-05-26 2025-06-24 佰聆数据股份有限公司 一种电力业务系统的校验方法、装置、设备及介质

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263322A (ja) * 2002-03-11 2003-09-19 Toshiba Corp 情報環境設定システム、プログラム及び方法
US7272595B2 (en) 2002-09-03 2007-09-18 International Business Machines Corporation Information search support system, application server, information search method, and program product
WO2006048998A1 (ja) * 2004-11-05 2006-05-11 Intellectual Property Bank Corp. キーワード抽出装置
KR101137243B1 (ko) 2007-04-17 2012-04-20 (주)야긴스텍 온톨로지 기반의 인텔리전트 이씨엠 시스템
JPWO2011068178A1 (ja) * 2009-12-04 2013-04-18 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
WO2011068178A1 (ja) * 2009-12-04 2011-06-09 日本電気株式会社 関連文書検索システム、装置、方法及びプログラム
WO2012039122A1 (ja) * 2010-09-22 2012-03-29 日本電気株式会社 顧客応対分析システム、顧客応対分析方法および顧客応対分析プログラム
JP2015197722A (ja) * 2014-03-31 2015-11-09 大日本印刷株式会社 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
US10311111B2 (en) 2014-05-30 2019-06-04 Hitachi, Ltd. Search method and apparatus and storage medium
WO2015181962A1 (ja) * 2014-05-30 2015-12-03 株式会社日立製作所 検索方法及び装置並びに記憶媒体
JPWO2015181962A1 (ja) * 2014-05-30 2017-04-20 株式会社日立製作所 検索方法及び装置並びに記憶媒体
WO2016006276A1 (ja) * 2014-07-10 2016-01-14 日本電気株式会社 インデックス生成装置及びインデックス生成方法
US10437803B2 (en) 2014-07-10 2019-10-08 Nec Corporation Index generation apparatus and index generation method
JPWO2016006276A1 (ja) * 2014-07-10 2017-05-25 日本電気株式会社 インデックス生成装置及びインデックス生成方法
JPWO2016103451A1 (ja) * 2014-12-26 2017-04-27 株式会社日立製作所 関連情報取得方法及び装置並びに記憶媒体
WO2016103451A1 (ja) * 2014-12-26 2016-06-30 株式会社日立製作所 関連情報取得方法及び装置並びに記憶媒体
JP2021533401A (ja) * 2019-02-27 2021-12-02 グーグル エルエルシーGoogle LLC コンピューティングデバイスとの継続的な会話の検出
US11436411B2 (en) 2019-02-27 2022-09-06 Google Llc Detecting continuing conversations with computing devices
US11676582B2 (en) 2019-02-27 2023-06-13 Google Llc Detecting conversations with computing devices
JP7358407B2 (ja) 2019-02-27 2023-10-10 グーグル エルエルシー コンピューティングデバイスとの継続的な会話の検出
US11893350B2 (en) 2019-02-27 2024-02-06 Google Llc Detecting continuing conversations with computing devices
US12223950B2 (en) 2019-02-27 2025-02-11 Google Llc Detecting conversations with computing devices
JP2021196786A (ja) * 2020-06-12 2021-12-27 パナソニックIpマネジメント株式会社 文書分類方法、文書分類装置及びプログラム
JP7445891B2 (ja) 2020-06-12 2024-03-08 パナソニックIpマネジメント株式会社 文書分類方法、文書分類装置及びプログラム
CN112380348A (zh) * 2020-11-25 2021-02-19 中信百信银行股份有限公司 元数据处理方法、装置、电子设备及计算机可读存储介质
CN112380348B (zh) * 2020-11-25 2024-03-26 中信百信银行股份有限公司 元数据处理方法、装置、电子设备及计算机可读存储介质
CN120196648A (zh) * 2025-05-26 2025-06-24 佰聆数据股份有限公司 一种电力业务系统的校验方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
US6983240B2 (en) Method and apparatus for generating normalized representations of strings
EP0960376B1 (en) Text processing and retrieval system and method
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
CN1871597B (zh) 利用一套消歧技术处理文本的系统和方法
US20070106499A1 (en) Natural language search system
JP2000276487A (ja) 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体
Galvez et al. Term conflation methods in information retrieval: Non‐linguistic and linguistic approaches
CN121256007B (zh) 一种基于增强元数据的rag智能检索问答系统及方法
Li et al. Developing ontologies for engineering information retrieval
JP3617096B2 (ja) 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法
Erozel et al. Natural language querying for video databases
Moscato et al. iwin: A summarizer system based on a semantic analysis of web documents
JP2001188678A (ja) 言語事例推論装置,言語事例推論方法及び言語事例推論プログラムが記述された記憶媒体
JP2001184358A (ja) カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体
JPH0844771A (ja) 情報検索装置
Klang et al. Linking, searching, and visualizing entities in wikipedia
KR101088483B1 (ko) 이종 분류체계들을 매핑시키는 방법 및 장치
JP3579945B2 (ja) 階層項目検索装置および階層項目検索方法
Vickers Ontology-based free-form query processing for the semantic web
JP4059501B2 (ja) 自然語辞書更新装置
Mukherjee et al. Automatic extraction of significant terms from the title and abstract of scientific papers using the machine learning algorithm: A multiple module approach
CN121188143B (zh) 一种基于意图识别的图书语义检索方法、装置及电子设备
Hazman et al. Ontology learning from textual web documents
JP4206266B2 (ja) 全文検索装置、処理方法、処理プログラム及び記録媒体
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040624