JPH1131149A - インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法 - Google Patents

インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法

Info

Publication number
JPH1131149A
JPH1131149A JP9184222A JP18422297A JPH1131149A JP H1131149 A JPH1131149 A JP H1131149A JP 9184222 A JP9184222 A JP 9184222A JP 18422297 A JP18422297 A JP 18422297A JP H1131149 A JPH1131149 A JP H1131149A
Authority
JP
Japan
Prior art keywords
module
dictionary
executing
processing
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9184222A
Other languages
English (en)
Other versions
JPH1131149A5 (ja
Inventor
Atsushi Takato
淳 高藤
Yasuhiro Hosokawa
康博 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9184222A priority Critical patent/JPH1131149A/ja
Publication of JPH1131149A publication Critical patent/JPH1131149A/ja
Publication of JPH1131149A5 publication Critical patent/JPH1131149A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 自然言語フロントエンドとして、多機能なア
プリケーションの操作に対するユーザの負荷を軽減する
ことができるインテリジェント・インターフェイス(I
IF:Intelligent Interface)システムおよびそれを
用いた文書検索方法を得ること。 【解決手段】 IIFシステム1は、全体制御を実行す
るモジュール11と、該全体制御を実行するモジュール
11に接続されている文正規化を実行するモジュール1
2と、文構造解析を実行するモジュール13と、CBR
処理を実行するモジュール14と、自然言語による問い
返し処理を管理するDM(Discourse Manager)のモジュ
ール15とから構成されており、ユーザはAM3を介し
て全体制御を実行するモジュール11にアクセスするも
のである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、インテリジェン
ト・インターフェイス・システムおよびそれを用いた文
書検索方法に関し、特に、多機能なアプリケーションの
操作に対するユーザの負荷を軽減することができるイン
テリジェント・インターフェイス・システムおよびそれ
を用いた文書検索方法に関するものである。
【0002】
【従来の技術】現在、パーソナルコンピュータにおいて
用いるアプリケーション(ソフトウェア)は、ますます
多機能化し、その多機能化するアプリケーションに対し
て、ユーザがそれらを使い始めたり、使いこなそうとす
るときの負荷がますます大きくなる傾向にある。
【0003】上記の如き傾向において、その解決策とし
ては様々なGUI上の工夫が凝らされている。例えば、
アイコンやツールバーに配置された機能ボタンがあげら
れ、これに操作によりオペレータの負荷を軽減しようと
するものである。
【0004】
【発明が解決しようとする課題】しかしながら、これら
も数が多いとどれが求める機能なのか分からず、多機能
なアプリケーションの操作に対するユーザの負荷を必ず
しも軽減しないという問題点がある。
【0005】上記問題点に対する対策の一つとして、自
然言語による問い合わせを行う、あるいは、何らかの指
示を与えるといったインターフェイスが考えられる。こ
れは、必ずしも完全な回答ではないが、アプリケーショ
ンとうまく連携することで、既存の操作(GUIなど)
を支援することができる。特に初心者などのソフト利用
の敷居を下げる効果を持つことが期待できるものであ
る。
【0006】この発明は、上記の如き問題点およびその
対策に着目してなされたものであり、上記のような自然
言語フロントエンドとして、多機能なアプリケーション
の操作に対するユーザの負荷を軽減することができるイ
ンテリジェント・インターフェイス(IIF:Intellig
ent Interface )システムおよびそれを用いた文書検索
方法を得ることを目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に係るインテリジェント・インターフェ
イス・システムにあっては、全体制御を実行するモジュ
ールと、前記全体制御を実行するモジュールに接続さ
れ、文正規化処理を実行するモジュールと、前記全体制
御を実行するモジュールに接続され、文構造解析処理を
実行するモジュールと、前記全体制御を実行するモジュ
ールに接続され、CBR処理を実行するモジュールと、
前記全体制御を実行するモジュールに接続され、自然言
語による問い返し処理を管理するDM(Discourse Mana
ger)のモジュールと、を具備するものである。
【0008】また、請求項2に係るインテリジェント・
インターフェイス・システムにあっては、前記文正規化
処理を実行するモジュールは、形態素辞書を用いて形態
素解析、数詞の統制、形態素単位の解析(モーダル情
報)などの表記レベルの正規化、統制辞書を用いて語彙
統制処理、文節単位の解析(機能情報)などの語彙レベ
ルの正規化、言い換え規則を用いる表現の正規化、など
の処理を実行するものである。
【0009】また、請求項3に係るインテリジェント・
インターフェイス・システムにあっては、前記文構造解
析処理を実行するモジュールは、属性辞書を用いた属性
処理、すなわち、時間、人名、地名の認識、時間に対す
る、文節補正、数値化、係り受け関係仮説の作成、など
の処理を実行するものである。
【0010】また、請求項4に係るインテリジェント・
インターフェイス・システムにあっては、前記CBR処
理を実行するモジュールは、事例とのマッチング、入力
文の意図を解析するための事例辞書を用いての事例処
理、ルールに従って、スクリプト(コマンド・パラメー
タ列)の作成、などの処理を実行するものである。
【0011】また、請求項5に係るインテリジェント・
インターフェイス・システムにあっては、前記DM(Di
scourse Manager)のモジュールは、ユーザの入力が曖昧
であったり、十分な情報が含まれていない場合には、そ
れを補うために問い返しを行うために、一回あるいは複
数回の問い返しを、自然な形で行うための制御を実行す
るものである。
【0012】また、請求項6に係る文書検索方法にあっ
ては、インテリジェント・インターフェイス・システム
を用いた文書検索方法において、ユーザにより入力され
た文に対して、形態素辞書を用いて形態素解析を行う第
1工程と、前記第1工程により生成された形態素リスト
(原型)に対し表記レベル正規化を行う第2工程と、前
記第2工程により生成された形態素リスト(丸め表記追
加)に対し、統制辞書を用いて語彙レベル正規化を行う
第3工程と、言い換え規則を用いて表現の正規化を行う
第4工程と、前記第4工程により生成された文節リスト
に対して、属性辞書を用いて属性処理を行う第5工程
と、前記第5工程により生成された節リストに対して、
文法ヒューリスティックによる係り受けの処理を実行す
る第6工程と、前記第6工程により生成された仮説グラ
フに対して、事例辞書を用いて事例検索を行う第7工程
と、前記第7工程により生成された解析候補を得て、解
析結果の確定処理を実行する第8工程と、前記第8工程
により生成された解析結果に対して、スクリプト生成ル
ールに基づきスクリプト生成処理を行い、スクリプトを
生成する第9工程と、を含むものである。
【0013】
【発明の実施の形態】以下、添付の図を参照してこの発
明に係るインテリジェント・インターフェイス・システ
ム(以下、IIFシステムと略記する)およびそれを用
いた文書検索方法の実施の形態を、 1.IIFシステムの概要 2.IIFシステムの機能 3.IIFシステムの制限 4.IIFシステムの動作 5.IIFシステムの構成 6.IIFシステムの発展 の順に詳細に説明する。
【0014】〔1.IIFシステムの概要〕IIFシス
テムの目的は、多機能なアプリケーションの操作に対す
るユーザの負荷をできる限り軽減することであり、アプ
リケーションの操作をユーザが憶えるのではなく、ユー
ザが一般的に使用している自然言語の表現でアプリケー
ションの操作を行えるようにするものである。
【0015】すなわち、ユーザの平易な言葉を受理し、
アプリケーション独特の用語を知らなくても、一般的な
表現で指示をすることができるようにするものである。
例えば、「昨日作ったIIFの文書を見たい」というよ
うな場合には、 コマンド :検索 と入力する。
【0016】また、機能を探す手間を省力化するもので
ある。すなわち、機能が増えたり、バージョンアップし
た場合など、必要な機能をメニューなどから探さなくと
も、自然言語入力から実行することができるようにする
ものである。
【0017】さらに、曖昧な入力に対する問い返しを行
うものである。すなわち、人間は必ずしも完全な入力を
するとは限らない。情報が不十分な入力であったり、曖
昧な表現をすることが予想される。その場合には、問い
返しによって入力を促し、解析に必要な情報を補うよう
にする。
【0018】 例えば、ユーザ:「文書を見たい。」 ↓ IIF:「どのような文書ですか?」 ↓ ユーザ:「昨日作成したIIFの文書を見たい」 ↓ 実 行 というようにである。
【0019】図1は、IIFの、他のアプリケーション
等の関連・位置付けを示したブロック図である。IIF
1は、複数のアプリケーション2a、2bを接続したイ
ンフォメーションマネージャ(以下、IMと略記する)
3に搭載される。ここで、IM3はシステム全体の制御
を行う。また、必要に応じて、IIF1、類義語4など
を呼び出す。また、アプリケーション(一太郎2a、三
四郎2b)は、IM3からの指示に従って、動作を行
う。また、IIF1は、IM3から受け取った自然言語
文を解析して、スクリプト(コマンド−パラメータ列)
を返し、類義語4はIM3から渡された語彙(検索キー
ワード)を展開して類義語展開済みキーワードを返す動
作を行う。
【0020】〔2.IIFシステムの機能〕 (基本アルゴリズム)IIFシステムの提供する機能に
ついて説明する。まず基本アルゴリズムとして、IIF
は「CBR=Case Based Reasoning(事例に基づく問題
解決)」によって、自然言語入力を解析する。ここで、
事例とは、ユーザが入力することを想定した自然言語文
とその解析結果を用意する、これを事例と呼ぶ。また、
CBRとは、実際の入力と事例を比較し、もっとも近い
事例の解析結果を抽出し、調整を加えることで、入力文
に対する解析結果を得ることができるものである。
【0021】(自然言語入力の解析)つぎに、自然言語
入力の解析に関しては、IIFでは、自然言語入力によ
ってアプリケーションに指示を出すことができる。以下
に、IIFでの自然言語解析の特長を提示する。
【0022】第1に、日本語の表現の揺れを吸収し、対
象を正確に認識する。図2の例は、属性名と属性値の位
置が入れ替わっているが、同じ意味を表現している。ど
ちらの場合にも、属性名=送信者、属性値=細川 を認
識することができる。
【0023】第2に、語彙による係り受けの違いを認識
し、文を正しく解析する。図3の例は、文の形は同じで
あるが、語彙の違いによって係り受け関係が異なる。こ
れらを解析し、正しい係り受け関係を抽出することがで
きる。
【0024】第3に、ユーザの深層的な意図を理解する
事ができる。図4に示すように、直接的な表現の場合に
は、動作を確定することは容易である。一方、間接的な
表現の場合には、その意図をくみ取った動作をする必要
がある。
【0025】第4に、異なる語彙でも同じことを表現し
ている場合には、それを認識する。例えば、図5(a)
は動作を表している場合、図5(b)は目的格の場合、
図5(c)は修飾節の場合をそれぞれ示している。
【0026】第5に、様々な言い回しを吸収して、文の
意味を理解する。例えば、図6(a)、(b)に示す例
があげられる。
【0027】第6に、文の型は同じでも、語彙の特性に
よって、異なる動作をする事を認識できる。例えば、図
7に示す例があげられる。
【0028】(コマンドの抽出)述語動詞および語彙の
特性などによってコマンドを抽出する(このことに関し
ては(自然言語入力の解析)を参照)。
【0029】(パラメータの抽出)つぎに、IIFシス
テムは、以下のような場合のパラメータの抽出を行うこ
とができる。
【0030】第1に、明示的なパラメータ名の提示、例
えば、「重要度が1の文書を検索したい」→ パラメー
タ名=重要度 値=1である。
【0031】第2に、属性情報の利用、例えば、「細川
の文書を検索したい」=人名属性→ パラメータ名=作
成者 値=細川である。
【0032】さらに、属性情報の利用、例えば、「昨日
のメールを検索したい」=時間属性→ パラメータ名=
作成日時 値=昨日
【0033】第3に、特徴的な表現、例えば、「通知メ
ールを検索したい」→ パラメータ名=補助属性 値
=通知
【0034】第4に、その他として、パラメータとして
認識されないもののうち、文意から検索のキーワードと
なりうる項目を抽出、例えば、「ニューヨークの文書を
検索したい」→ “ニューヨーク”がパラメータとして
切り出される。
【0035】(問い返し)自然言語での入力は、必ずし
も完全ではなく、コマンド実行に必要な情報が欠落する
ことがあったり、複数の解釈がある曖昧な表現を含むこ
とがある。このような場合には、直ちにコマンド実行を
することはできない。
【0036】この場合、IIFで何らかの解釈を与える
ことは可能であるが、ユーザの意図とは異なる解釈をす
ることもあり得る。その場合に、取り返しのつかない事
態が起こる可能性(削除など)がある。そこで、上記の
ような場合には、ユーザに問い返しを行い、意図の確認
あるいは追加情報の入力を促す必要がある。
【0037】その方法としては、次のような形態が考え
らる。第1に、自然言語による問い返し、すなわち、ユ
ーザとの対話によって意図を確認する。第2に、ダイア
ログによる問い返し、すなわち、ユーザに、必要な情報
を追加設定してもらう。これらは、それぞれ排他的なも
のではなく、必要な場面に応じてそれぞれを使い分ける
べきであると考えられる。特に、アプリケーションとの
親和性を考慮した場合、主に、第2に係るダイアログに
よる問い返しを採用する局面が多くなる。
【0038】〔3.IIFシステムの制限〕 (受付可能な入力)IIFシステムでは、予想される自
然言語入力文を事例として持っている。入力文と事例を
比較することで、適切な解析結果を得ることが可能にな
る。IIFシステムで解析可能であるために以下に示す
ようないくつかの条件がある。
【0039】第1に、図8(a)、(b)に示すよう
に、述語動詞が明確であり、文末にあること。なお、ユ
ーザの柔軟な入力への対応のために、「文末がサ変動詞
の言い切り」も解析可能になっている。
【0040】第2に、図9に示すように、必要な助詞、
活用形を含んでいること。
【0041】第3に、図10に示すように単文および複
文であること(重文は解析対象外)。なお、重文が入力
された場合には、不完全ながらできる限りの解析を行お
うとする。ただし、その解析結果が妥当であるという保
証はない。
【0042】第4に、図11に示すように、ある表現を
(解析せずに)単なる文字列として扱いたい場合には、
その区間を「″」あるいは「′」で囲む。
【0043】第5に、その他として、標準語であるこ
と、一般的な言い回しであることなどがある。
【0044】(抽出できる情報)IIFでは、事例を参
照することで、必要な情報を抽出することが可能とな
る。その場合には、前述の条件に当てはまるような文で
ある必要がある。事例中に、どの情報をどのように扱う
かについての記述があり、それに基づいて情報を抽出す
ることができる。
【0045】図1を参照すると、文を解析した結果、ス
クリプト(コマンド−パラメータ列)を抽出し、IM3
に渡す。
【0046】〔4.IIFシステムの動作〕 (搭載対象)IIFシステムでは、IMの次の以下の3
つの機能を実現可能なものとしている。すなわち、 第1に、コマンド実行 第2に、絞り込み 第3に、アイテム生成(アクションパッド) である。以下では、それぞれの動作について詳しく説明
する。
【0047】(コマンド実行)コマンド実行として、ま
ず、対象機能について説明する。対象機能としては、つ
ぎの2種類の機能を実行できる。IIFシステムはIM
とのみ連携しているので、基本的にIMに実行可能なこ
とのみが対象となる。 IMの機能 IMから呼び出すことのできるアプリケーションの
機能
【0048】つぎに、対象コマンドについて説明する。
IMで実行可能な全ての機能を対象とするわけではな
い。つぎのような方針にしたがって、対象コマンドを絞
り込んでいる。 対処語彙の範囲をできる限り限定する。すなわち、
事例記述の整合性を保つために、人間に管理できる範囲
に抑える。この事例の整合性管理は、将来的には何らか
の自動化が必要となる。また、事例辞書が膨大になり、
速度、精度が低下することを回避する。事例が増加した
場合の辞書サイズの増加は避けられない。 自然言語で入力することが予想されるコマンドを中
心に対象を絞り込む。IMの主要な機能(メール送信な
ど)をメインにして、その他の機能を追加してある。
【0049】(絞り込み)第1に、『絞込』で予想され
るユーザの入力については、『絞込』では、絞込条件を
指定することでパラメータの抽出を行う。自由な入力が
許されてしまうので、つぎのような入力が考えられる。 絞込条件のみの入力、例えば、「未読のメール」 述語動詞として“絞り込む”をつける、例えば、
「昨日のメールを絞り込みたい」 述語動詞として“絞り込む" 以外のものをつける、
例えば、「細川の文書を印刷したい」
【0050】第2に、文の解析については、上記の3つ
の入力パターンは、全てIIFとして受け付け可能とす
る。ただし、『絞込』の実行ということを考慮して、内
部的にはつぎのような動作を行う。
【0051】 絞込条件のみの入力、「を絞り込む」
を補って解析を行う。この結果、コマンド実行と同じ処
理で対応できる。例えば、「未読のメール」→「未読の
メールを絞り込みたい」として解析する。 述語動詞として「絞り込む」をつける。そのままの
形で解析すれば、コマンド実行と同じ処理で対応でき
る。例えば、「昨日のメールを絞り込みたい」→そのま
ま解析する。 述語動詞として「絞り込む」以外のものをつける。
そのままの形で解析する。解析結果として、『絞込』に
該当するコマンドが含まれていた場合にのみ、それを結
果として返す。例えば、「細川の文書を印刷したい」→
絞込コマンド+印刷コマンドが解析によって得られる。
結果として『絞込』を返す。さらに、例えば、「新着チ
ェックをしたい」→新着チェックコマンドが解析によっ
て得られる。これは、解析失敗と判断する。
【0052】(アイテム生成)第1に、『アイテム生
成』で予想されるユーザの入力については、『アイテム
生成』では、メモアイテムに文字を入力する。メモアイ
テムへの入力はその性質上かなり自由なものとなる。上
記『コマンド実行』の場合とは異なり、入力内容が文と
して成立しない場合が多いことが考えらる。すなわち、
コマンド実行の場合は受け付ける文としての条件が整っ
ているが、アイテム生成の場合には、メモとしての入力
であり、受け付けられないことが多いのである。
【0053】第2に、属性の抽出については、IIFが
受け付ける文としての条件が整っていても、メモとして
記述される表現は多種にわたることが予想される。その
ような全ての事例を記述することは、辞書としての整合
性を保つことが難しく、現実的ではない。
【0054】しかしながら、解析の途中段階で検出され
る時間属性、人名属性を抽出することは可能である。た
だし、この場合には、事例による解析ではないので、そ
れらの情報がどのような意図で記述されたものであるか
について判断することはできない。もし、これ以外の情
報を抽出しようとするか、あるいは、ユーザの意図を少
しでも理解するためには、専用の機構を用意する必要が
ある。
【0055】この専用の機構としては、テンプレートマ
ッチングを用いた属性抽出機構を想定することができ
る。これは、IIFの事例検索と自然言語ヘルプのキー
ワード検索の中間的な機構である。
【0056】第3に、『アイテム生成』におけるIIF
の役割としては、本発明にあっては、上記専用の機構を
用意せずに、 時間属性 人名属性 を抽出することにする。抽出した属性は、パラメータと
してIMに引き渡すことが可能である。
【0057】一部の事例を作成することで、必要なコマ
ンド(例えば、メール送信)の実行を行うことも考えら
れるが、例えば、「細川に連絡する」のような文が、→
メール送信→ メモにTODO属性をつけるのどちら
の意図であるかを判定することは不可能である。
【0058】コマンド実行の場合とは異なり、この時点
で複数コマンド選択を行わせるのは、メニューから選択
するのと違いが無くなってしまう。逆から考えると、複
数選択の可能性が残った形で事例解析を行わせても、通
常の処理(メニュー)とIIFの処理とで同じような選
択画面が提示されることになり、ユーザにとっては混乱
の原因になる可能性がある。「ユーザの負荷を軽減す
る」という目的から見て、ここで事例解析を導入するメ
リットは少ないと判断できる。
【0059】(『絞込』と類義語展開)絞込で得られた
検索キーワードは、ユーザが入力したものではあるが、
必ずしもそのままの語彙で検索するだけでは十分な情報
を得ることができない場合がある。例えば、 検索したいキーワードを曖昧な記憶に基づいて入力
した場合、 他人の文書を検索する場合(必ずしも期待する語彙
を使用していないことがある)、がある。これを解決す
るために、類義語展開を行う。類義語展開の方法として
はつぎの3つの方法が考えられる。
【0060】第1に、検索用類義語辞書(システム辞
書)を用いる。この検索用類義語辞書(システム辞書)
には、幅広く収集された類義語が格納されている。不特
定多数ユーザを考慮しているので、必ずしも使用されな
い語彙も含まれている。例えば、ニューヨークを例にと
ると、→ ニューヨーク州、ニューヨーク、NY、N.
Y.Empire State、紐育等である。
【0061】第2に、検索用類義語辞書(ユーザ辞書)
を用いる。この検索用類義語辞書(ユーザ辞書)には、
ユーザが登録した類義語が格納されている。これによっ
て、個々の事情によって必要な類義語を使用することが
可能になる。例えば、個々のユーザに必要な類義語に絞
り込みたい場合には、上記ニューヨークを例にとると、
→ ニューヨーク州、ニューヨークとなる。
【0062】また、検索用類義語辞書(ユーザ辞書)を
用いて独自の類義語グループを作成することができる。
例えば、本発明を開発している高藤チームを例にとる
と、→ 自然言語ヘルプ、IIF、サマライザ等の類義
語展開ができる。
【0063】第3に、事例記述での対応する。すなわ
ち、状況に依存した類義語が存在する場合がある。この
場合は、検索用類義語辞書では対応できないので、事例
中に検索キーワードを記述することで対応する。ただ
し、事例中の記述はユーザが確認できないし、登録もで
きない。そのため、多くの語彙を対象にしてしまうと、
逆に、ユーザの便宜を損なうおそれがある。
【0064】したがって、本発明においては、事例中へ
の記述は、必要最低限に絞り込んで対処している。IM
においては文書類の管理が重要なファクターの一つと考
えらる。そこで、本発明は、ターゲットを「文書」に絞
って対処するものである。
【0065】事例記述と類義語辞書を連携することで、
ユーザに必要な展開を行うことができるようにする。例
えば、「会議の資料」を例にとると、 となる。
【0066】〔5.IIFシステムの構成〕 (モジュール構成)図12にIIFシステム1のモジュ
ール構成を示す。図12に示すように、IIF1は、全
体制御を実行するモジュール11と、該全体制御を実行
するモジュール11に接続されている文正規化を実行す
るモジュール12と、文構造解析を実行するモジュール
13と、CBR処理を実行するモジュール14と、DM
(Discourse Manager)のモジュール15とから構成され
ており、ユーザはIM3を介して上記全体制御を実行す
るモジュール11にアクセスするものである。
【0067】(各モジュールの役割と辞書構成)上記文
正規化を実行するモジュール12は、形態素辞書を用
いて形態素解析、数詞の統制、形態素単位の解析(モ
ーダル情報)などの表記レベルの正規化、統制辞書を
用いて語彙統制処理、文節単位の解析(機能情報)など
の語彙レベルの正規化、言い換え規則を用いる表現の
正規化、などの処理を実行する。
【0068】上記文構造解析を実行するモジュール13
は、属性辞書を用いた属性処理、すなわち、時間、人
名、地名の認識、時間に対する、文節補正、数値化、
係り受け関係仮説の作成、などの処理を実行する。
【0069】上記CBR処理を実行するモジュール14
は、事例とのマッチング→入力文の意図を解析するた
めの事例辞書を用いての事例処理、ルールに従って、
スクリプト(コマンド・パラメータ列)の作成、などの
処理を実行する。
【0070】(処理の流れ)各モジュール間での処理の
流れとそこで使用される辞書の関係は、図13に示すよ
うになる。すなわち、ユーザが文を入力すると、第1
に、文正規化処理、第2に、文構造解析処理、第3に、
CBR処理がそれぞれ実行される。
【0071】第1の文正規化処理として、ユーザにより
入力された文に対して、まず、形態素辞書20を用いて
形態素解析を行う。形態素解析による形態素リスト(原
型)は、つぎに表記レベル正規化処理を行う。表記レベ
ル正規化処理語の形態素リストは、統制辞書21を用い
て語彙レベル正規化処理を行い、つぎに、言い換え規則
22に基づいて表現の正規化を実行する。
【0072】つぎに、第2の文構造解析処理として、表
現の正規化処理のの結果、生成された文節リストに対し
ては、属性辞書23を用いた属性処理を実行し、その結
果の節リストに対しては、文法ヒューリスティック24
による係り受けの処理を実行する。
【0073】つぎに、第3のCBR処理として、係り受
けの処理による仮説グラフに対して事例辞書25を用い
た事例検索を行い、解析候補を得て、解析結果の確定処
理を実行する。該確定処理後の解析結果に対してスクリ
プト生成ルール26に基づきスクリプト生成処理を行
い、スクリプトを生成する。
【0074】(DMの処理の流れ)DM(Discourse Ma
nager )15は、自然言語による問い返し処理を管理す
るものである。すなわち、ユーザの入力が曖昧であった
り、十分な情報が含まれていない場合には、それを補う
ために問い返しを行う。DM15は、一回あるいは複数
回の問い返しを、自然な形で行うための制御を実行す
る。
【0075】この処理の中で、CBR処理で不明点が見
つかった場合には、「なにを問い返すべきか」を記述し
た「DMスクリプト」が渡される。DM15では、図1
4に示すように、その指示に基づきユーザへの問い返し
文を作成する。
【0076】また、DM15の問い返しに対する応答へ
の対応として、ユーザへの問い返しが1度で終了しなか
った場合には、図15に示すように、引き続き問い返し
文を作成する。
【0077】さらに、DM15がどのような判断に基づ
いて動作するかは、辞書中に記述されることになる。
【0078】IM3では、主にダイアログを用いた問い
返しが用いられる。一部、自然言語の問い返しが必要な
場面で、DM15が使用されることがある。
【0079】(辞書)本発明で用いられる辞書には、第
1に形態素辞書20、第2に統制辞書21、第3に属性
辞書23、第4に事例辞書25がある。以下、それぞれ
を詳細に説明する。
【0080】第1の形態素辞書20は、形態素解析を行
う場合に参照する辞書である。この中には、表記、読
み、品詞、属性(人名属性、地名属性、その他)等、基
本的な語彙に関する情報が格納されている。
【0081】自然言語では、同じことを表すのに複数の
表現方法がある。それらをできる限りまとめておくの
が、第2の統制辞書21であり、それにより、事例記述
を簡素化し、記述量を減らすことができる。例えば、 作る → 作成する 探す → 検索する などである。
【0082】従来(事例版自然言語ヘルプでの構想)に
あっては、様々な概念を表す表現を概念辞書に格納して
いた。これらの概念記述は、本バージョンにおいては、
そのほとんどが事例として記述することが可能となっ
た。しかしながら、表現のバリエーションが多いため
に、事例として記述することが現実的ではないものが存
在する。例えば、時間、人名、地名などである。これら
は、その表現のバリエーションを、上記第3の属性辞書
23として記述し、事例辞書の記述量を減らす。
【0083】第4の事例辞書25は、ユーザの入力を想
定した事例を格納しておく。従来(事例版自然言語ヘル
プ)にあっては、それぞれの事例間の関連が薄いもので
あったために、一方の事例で記述された表現が、別の事
例からは使用できないという状況になっていた。本発明
にあっては、事例間の関連を強化し、記述を共有するこ
とができるようにする。そのため、記述形式は複雑にな
るが、より少ない記述量で柔軟な解析ができるようにな
っている。
【0084】なお、辞書は、対応するアプリケーション
ごとに用意する必要がある。本発明にあっては、IMに
搭載するということなので、IMに対応した辞書になっ
ている。アプリケーションが異なる場合、一般に辞書は
共通で使用することはできないと考えらる。作業として
は、全く新しい辞書を構築することになる。
【0085】〔6.IIFシステムの発展〕本発明に係
るIIFシステムには、以下の発展機能を想定し、追加
することができる。
【0086】第1に、重文への対応ができる。第2に、
不完全な入力文への対応、すなわち、簡略化された表記
が入力される状況にも対応できる。これには、例えば、
テンプレートマッチングを用いる。ただし、予想される
入力のパターン分析が必要であり、文の意図を完全に抽
出できる場合には、全ての局面に適用することが可能と
なる。
【0087】第3に、学習機能を追加できる。すなわ
ち、どのような局面での学習が、ユーザにとって有効で
あるかの検討をしたうえで、学習機能を追加することが
できる。第4に、ユーザカスタマイズを追加できる。こ
れもどのようなカスタマイズが、ユーザにとって有効で
あるか検討する必要がある。
【0088】第5に、自然言語による問い返しの強化、
すなわち、主にダイアログによる問い返しを実行する。
ただし、必ずしも全ての場合にダイアログが有効である
とは限らない。自然言語による問い返しが適している局
面も存在する。また、自然言語による問い返しの強化が
必要である。
【0089】第6に、アプリケーションとの連携の強化
であり、本発明は、アプリケーションからは、その時点
の状況についての一部の情報を得て、それに基づいて動
作を切り分けている。アプリケーションとの連携の強化
を考慮する場合には、より詳細な状況に細分化すること
が必要である。また、事例が膨大になることが予想さ
れ、事例間の整合性を確保するための手段を設ける必要
がある。
【0090】
【発明の効果】以上説明したとおり、本発明に係るイン
テリジェント・インターフェイス・システムにあって
は、自然言語フロントエンドとして多機能なアプリケー
ションの操作に対するユーザの負荷を軽減することがで
きるインテリジェント・インターフェイス(IIF:In
telligent Interface )システムを得ることができる。
【図面の簡単な説明】
【図1】IIFとインフォメーションマネージャ(I
M)および関連するプログラムとの関係を示すブロック
図である。
【図2】自然言語入力の解析例を示す説明図である。
【図3】自然言語入力の解析例を示す説明図である。
【図4】自然言語入力の解析例を示す説明図である。
【図5】自然言語入力の解析例を示す説明図である。
【図6】自然言語入力の解析例を示す説明図である。
【図7】自然言語入力の解析例を示す説明図である。
【図8】IIFの解析可能であるための条件を示す説明
図である。
【図9】IIFの解析可能であるための条件を示す説明
図である。
【図10】IIFの解析可能であるための条件を示す説
明図である。
【図11】IIFの解析可能であるための条件を示す説
明図である。
【図12】IIFシステムのモジュール構成を示す説明
図である。
【図13】IIFシステムの処理の流れを示すフローチ
ャートである。
【図14】DMの自然言語による問い返し処理を示す説
明図である。
【図15】DMの自然言語による問い返し処理を示す説
明図である。
【符号の説明】
1 IIFシステム 2a,2b アプリケーション 3 インフォメーションマネージャ(IM) 4 類義語 11 全体制御を実行するモジュール 12 文正規化を実行するモジュール 13 文構造解析を実行するモジュール 14 CBR処理を実行するモジュール 15 DM 20 形態素辞書 21 統制辞書 22 言い換え規則 23 属性辞書 24 文法ヒューリスティック 25 事例辞書 26 スクリプト生成ルール

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 全体制御を実行するモジュールと、 前記全体制御を実行するモジュールに接続され、文正規
    化処理を実行するモジュールと、 前記全体制御を実行するモジュールに接続され、文構造
    解析処理を実行するモジュールと、 前記全体制御を実行するモジュールに接続され、CBR
    処理を実行するモジュールと、 前記全体制御を実行するモジュールに接続され、自然言
    語による問い返し処理を管理するDM(Discourse Mana
    ger)のモジュールと、 を具備することを特徴とするインテリジェント・インタ
    ーフェイス・システム。
  2. 【請求項2】 前記文正規化処理を実行するモジュール
    は、形態素辞書を用いて形態素解析、数詞の統制、形態
    素単位の解析(モーダル情報)などの表記レベルの正規
    化、統制辞書を用いて語彙統制処理、文節単位の解析
    (機能情報)などの語彙レベルの正規化、言い換え規則
    を用いる表現の正規化、などの処理を実行することを特
    徴とする請求項1に記載のインテリジェント・インター
    フェイス・システム。
  3. 【請求項3】 前記文構造解析処理を実行するモジュー
    ルは、属性辞書を用いた属性処理、すなわち、時間、人
    名、地名の認識、時間に対する、文節補正、数値化、係
    り受け関係仮説の作成、などの処理を実行することを特
    徴とする請求項1に記載のインテリジェント・インター
    フェイス・システム。
  4. 【請求項4】 前記CBR処理を実行するモジュール
    は、事例とのマッチング、入力文の意図を解析するため
    の事例辞書を用いての事例処理、ルールに従って、スク
    リプト(コマンド・パラメータ列)の作成、などの処理
    を実行することを特徴とする請求項1に記載のインテリ
    ジェント・インターフェイス・システム。
  5. 【請求項5】 前記DM(Discourse Manager)のモジュ
    ールは、ユーザの入力が曖昧であったり、十分な情報が
    含まれていない場合には、それを補うために問い返しを
    行うために、一回あるいは複数回の問い返しを、自然な
    形で行うための制御を実行することを特徴とする請求項
    1に記載のインテリジェント・インターフェイス・シス
    テム。
  6. 【請求項6】 インテリジェント・インターフェイス・
    システムを用いた文書検索方法において、 ユーザにより入力された文に対して、形態素辞書を用い
    て形態素解析を行う第1工程と、 前記第1工程により生成された形態素リスト(原型)に
    対し表記レベル正規化を行う第2工程と、 前記第2工程により生成された形態素リスト(丸め表記
    追加)に対し、統制辞書を用いて語彙レベル正規化を行
    う第3工程と、 言い換え規則を用いて表現の正規化を行う第4工程と、 前記第4工程により生成された文節リストに対して、属
    性辞書を用いて属性処理を行う第5工程と、 前記第5工程により生成された節リストに対して、文法
    ヒューリスティックによる係り受けの処理を実行する第
    6工程と、 前記第6工程により生成された仮説グラフに対して、事
    例辞書を用いて事例検索を行う第7工程と、 前記第7工程により生成された解析候補を得て、解析結
    果の確定処理を実行する第8工程と、 前記第8工程により生成された解析結果に対して、スク
    リプト生成ルールに基づきスクリプト生成処理を行い、
    スクリプトを生成する第9工程と、 を含むことを特徴とする文書検索方法。
JP9184222A 1997-07-09 1997-07-09 インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法 Pending JPH1131149A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9184222A JPH1131149A (ja) 1997-07-09 1997-07-09 インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9184222A JPH1131149A (ja) 1997-07-09 1997-07-09 インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法

Publications (2)

Publication Number Publication Date
JPH1131149A true JPH1131149A (ja) 1999-02-02
JPH1131149A5 JPH1131149A5 (ja) 2005-05-19

Family

ID=16149512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9184222A Pending JPH1131149A (ja) 1997-07-09 1997-07-09 インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法

Country Status (1)

Country Link
JP (1) JPH1131149A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003079188A1 (fr) * 2002-03-19 2003-09-25 Shuichi Araki Procede de fonctionnement d'un objet logiciel au moyen d'une langue naturelle et programme correspondant
WO2004097703A1 (ja) * 2003-05-02 2004-11-11 Fujitsu Limited 製造工程解析支援方法、その方法をコンピュータに実行させるプログラム、プログラムプロダクトおよび記録媒体
JP2019050552A (ja) * 2018-06-20 2019-03-28 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003079188A1 (fr) * 2002-03-19 2003-09-25 Shuichi Araki Procede de fonctionnement d'un objet logiciel au moyen d'une langue naturelle et programme correspondant
WO2004097703A1 (ja) * 2003-05-02 2004-11-11 Fujitsu Limited 製造工程解析支援方法、その方法をコンピュータに実行させるプログラム、プログラムプロダクトおよび記録媒体
US6973363B2 (en) 2003-05-02 2005-12-06 Fujitsu Limited Method for assisting analysis of production process, program for making computer execute that method, program product, and storage medium
JPWO2004097703A1 (ja) * 2003-05-02 2006-07-13 富士通株式会社 製造工程解析支援方法、その方法をコンピュータに実行させるプログラム、プログラムプロダクトおよび記録媒体
JP2019050552A (ja) * 2018-06-20 2019-03-28 富士ゼロックス株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US12229499B1 (en) Computer-implemented presentation of synonyms based on syntactic dependency
JP3009215B2 (ja) 自然語処理方法および自然語処理システム
US11210468B2 (en) System and method for comparing plurality of documents
CN1618064B (zh) 翻译方法与计算机设备
Chai et al. Natural language assistant: A dialog system for online product recommendation
US20060235690A1 (en) Intent-based information processing and updates
US20090024385A1 (en) Semantic parser
Arora et al. Requirement boilerplates: Transition from manually-enforced to automatically-verifiable natural language patterns
JP2003228564A (ja) 自然言語テキストにおける情報のコンテキストセンシティブなフラグ設定、およびコンピュータネットワークを介する当該の情報に関連するメタデータの中央管理のためのサービス
KR20120009446A (ko) 자연 언어 텍스트의 자동화 의미적 라벨링 시스템 및 방법
CN118313460B (zh) 一种在资源受限环境中使用大模型进行查询的方法
CN114528840A (zh) 融合上下文信息的中文实体识别方法、终端及存储介质
Orosz et al. PurePos: An Open Source Morphological Disambiguator
CN118113806A (zh) 一种大模型检索增强生成的可解释事件脉络生成方法
WO2025260856A1 (zh) 用于信息处理的方法、装置、设备和介质
Bernsen Towards a tool for predicting speech functionality
JP2020181529A (ja) 調査支援方法、調査支援用コンピュータプログラムおよび調査支援システム
US20050165712A1 (en) Method for operating software object using natural language and program for the same
Atzeni et al. What is the cube root of 27? Question answering over CodeOntology
JPH1131149A (ja) インテリジェント・インターフェイス・システムおよびそれを用いた文書検索方法
US20060155673A1 (en) Method and apparatus for robust input interpretation by conversation systems
CN113761919A (zh) 一种口语化短文本的实体属性提取方法及电子装置
Danenas et al. Enhancing the extraction of SBVR business vocabularies and business rules from UML use case diagrams with natural language processing
JPH1131149A5 (ja)
CN112735465A (zh) 无效信息确定方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070723

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080108