JPH0567138A - 自然言語解析方式 - Google Patents
自然言語解析方式Info
- Publication number
- JPH0567138A JPH0567138A JP3226993A JP22699391A JPH0567138A JP H0567138 A JPH0567138 A JP H0567138A JP 3226993 A JP3226993 A JP 3226993A JP 22699391 A JP22699391 A JP 22699391A JP H0567138 A JPH0567138 A JP H0567138A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- metaphor
- natural language
- expression
- metaphorical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 93
- 238000006243 chemical reaction Methods 0.000 claims abstract description 58
- 230000014509 gene expression Effects 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 4
- 241000282461 Canis lupus Species 0.000 description 17
- 238000010586 diagram Methods 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 241001648859 Lilium candidum Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 隠喩が使われている文をも正しく解析できる
自然言語解析方式を実現する。 【構成】 入力文が隠喩表現を含む文か否かを検出でき
る情報を格納した隠喩候補パターンテーブルと、隠喩表
現を含む入力文を同じ概念の隠喩表現を含まない文に変
換できる情報を格納した連想概念・変換ルールテーブル
を設けておく。入力文に対して解析を行なって解析結果
を得る(101〜103)。この解析結果に基づいて隠
喩候補パターンテーブルを検索し、隠喩表現を含む文の
可能性を判別する(104)。可能性がある場合に隠喩
されている文字列を認識し、隠喩候補パターン及び文字
列の組合わせに基づいて、連想概念・変換ルールテーブ
ルを検索して、隠喩を含む文か否かを確定し、含む場合
に入力文を同じ概念の隠喩表現を含まない文に変換する
(105〜107)。そして、変換文に対する解析結果
を出力する。
自然言語解析方式を実現する。 【構成】 入力文が隠喩表現を含む文か否かを検出でき
る情報を格納した隠喩候補パターンテーブルと、隠喩表
現を含む入力文を同じ概念の隠喩表現を含まない文に変
換できる情報を格納した連想概念・変換ルールテーブル
を設けておく。入力文に対して解析を行なって解析結果
を得る(101〜103)。この解析結果に基づいて隠
喩候補パターンテーブルを検索し、隠喩表現を含む文の
可能性を判別する(104)。可能性がある場合に隠喩
されている文字列を認識し、隠喩候補パターン及び文字
列の組合わせに基づいて、連想概念・変換ルールテーブ
ルを検索して、隠喩を含む文か否かを確定し、含む場合
に入力文を同じ概念の隠喩表現を含まない文に変換する
(105〜107)。そして、変換文に対する解析結果
を出力する。
Description
【0001】
【産業上の利用分野】本発明は自然言語文を解析する自
然言語解析方式に関し、特に、比喩が使われていること
が文構造からは直接判らない隠喩を含む自然言語文の解
析に適用して好適なものである。
然言語解析方式に関し、特に、比喩が使われていること
が文構造からは直接判らない隠喩を含む自然言語文の解
析に適用して好適なものである。
【0002】
【従来の技術】自然言語処理システムには、機械翻訳シ
ステム、文書要約システム、質問応答システム、自然言
語によるデータ検索システム等の様々なシステムがあ
る。これらのシステムでは、一般的に、入力された自然
言語文に対して、辞書データを参照し、文法ルールを適
用しながら各種の解析を行なって、最終的にその入力さ
れた自然言語文が有する意味情報を目的とする形式で得
る処理が行われる。なお、この後の処理は対象システム
によって異なる。
ステム、文書要約システム、質問応答システム、自然言
語によるデータ検索システム等の様々なシステムがあ
る。これらのシステムでは、一般的に、入力された自然
言語文に対して、辞書データを参照し、文法ルールを適
用しながら各種の解析を行なって、最終的にその入力さ
れた自然言語文が有する意味情報を目的とする形式で得
る処理が行われる。なお、この後の処理は対象システム
によって異なる。
【0003】このように利用される単語辞書は、具体的
レベルでみればシステムによって異なる構成を有するこ
ともあるが、基本的な記述内容は異なるシステム用のも
のであっても同様である。すなわち、単語辞書であれ
ば、文の構文構造を把握したり構文構造を生成したりす
るための手掛かりとなる文法的特性やその単語の概念
(意味)を記述したものである。また、文法ルールも、
具体的レベルでみればシステムによって異なる構成を有
することもあるが、基本的な記述内容は異なるシステム
用のものであっても同様である。すなわち、一般的な所
定の文法に従ったものである。
レベルでみればシステムによって異なる構成を有するこ
ともあるが、基本的な記述内容は異なるシステム用のも
のであっても同様である。すなわち、単語辞書であれ
ば、文の構文構造を把握したり構文構造を生成したりす
るための手掛かりとなる文法的特性やその単語の概念
(意味)を記述したものである。また、文法ルールも、
具体的レベルでみればシステムによって異なる構成を有
することもあるが、基本的な記述内容は異なるシステム
用のものであっても同様である。すなわち、一般的な所
定の文法に従ったものである。
【0004】
【発明が解決しようとする課題】しかし、このような辞
書や文法ルールを用いても自然言語文の解析を正しくで
きない場合がある。例えば、「彼は狼だ」や「彼女は白
ゆりだ」や「彼は計算機です」のような比喩(上記例は
隠喩)が使われている文を正しく解析することは不可能
である。従って、隠喩を含む文章をシステムが正しく解
釈することができない。
書や文法ルールを用いても自然言語文の解析を正しくで
きない場合がある。例えば、「彼は狼だ」や「彼女は白
ゆりだ」や「彼は計算機です」のような比喩(上記例は
隠喩)が使われている文を正しく解析することは不可能
である。従って、隠喩を含む文章をシステムが正しく解
釈することができない。
【0005】そのため、例えば機械翻訳システムで翻訳
する場合でも直訳しかできない。例えば、「彼は狼だ」
という文を翻訳すると、「He is a wolf」という直訳の
文章しか得られず、仮に英語圏で「獰猛」という意味に
「狼」を例えることがなされていない場合には問題が大
きい。
する場合でも直訳しかできない。例えば、「彼は狼だ」
という文を翻訳すると、「He is a wolf」という直訳の
文章しか得られず、仮に英語圏で「獰猛」という意味に
「狼」を例えることがなされていない場合には問題が大
きい。
【0006】本発明は、以上の点を考慮してなされたも
のであり、比喩が使われている自然言語文をも正しく解
析することができる自然言語解析方式を提供しようとす
るものである。
のであり、比喩が使われている自然言語文をも正しく解
析することができる自然言語解析方式を提供しようとす
るものである。
【0007】
【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、入力された自然言語文が比喩文
であることを検出するための比喩検出情報、及び、比喩
文であると検出された自然言語文を同じ概念の比喩表現
を含まない自然言語文に変換するための変換用情報を格
納している連想データベースを備えている。そして、入
力された自然言語文に対して1回目の解析を行ない、こ
の解析結果に基づいて上記連想データベースの検索を行
ない、その結果、比喩表現を含まない文の解析結果であ
ると判定されたときにその解析結果を出力し、比喩表現
を含む文の解析結果と判定されたときに、その文を同じ
概念の比喩表現を含まない自然言語文に変換して再解析
し、その解析結果を出力することとした。
め、本発明においては、入力された自然言語文が比喩文
であることを検出するための比喩検出情報、及び、比喩
文であると検出された自然言語文を同じ概念の比喩表現
を含まない自然言語文に変換するための変換用情報を格
納している連想データベースを備えている。そして、入
力された自然言語文に対して1回目の解析を行ない、こ
の解析結果に基づいて上記連想データベースの検索を行
ない、その結果、比喩表現を含まない文の解析結果であ
ると判定されたときにその解析結果を出力し、比喩表現
を含む文の解析結果と判定されたときに、その文を同じ
概念の比喩表現を含まない自然言語文に変換して再解析
し、その解析結果を出力することとした。
【0008】ここで、上記連想データベースに格納され
ている情報が、隠喩表現を含む比喩文用のものであるこ
とが好ましい。
ている情報が、隠喩表現を含む比喩文用のものであるこ
とが好ましい。
【0009】この場合において、連想データベースに、
文脈に関係なく隠喩表現が使われていることが判る比喩
文用情報と、文脈によっては隠喩表現を含むと捕らえら
れる比喩文用の情報とを区別して格納しておき、モード
に応じて、いずれかの情報だけを利用して解析処理する
ことが好ましい。
文脈に関係なく隠喩表現が使われていることが判る比喩
文用情報と、文脈によっては隠喩表現を含むと捕らえら
れる比喩文用の情報とを区別して格納しておき、モード
に応じて、いずれかの情報だけを利用して解析処理する
ことが好ましい。
【0010】
【作用】本発明においては、入力された自然言語文が比
喩文であることを検出するための比喩検出情報、及び、
比喩文であると検出された自然言語文を同じ概念の比喩
表現を含まない自然言語文に変換するための変換用情報
を格納している連想データベースを予め作成して用意し
ておく。
喩文であることを検出するための比喩検出情報、及び、
比喩文であると検出された自然言語文を同じ概念の比喩
表現を含まない自然言語文に変換するための変換用情報
を格納している連想データベースを予め作成して用意し
ておく。
【0011】そして、自然言語文が入力されてくると、
まず解析を行なって解析結果を得る。このようにして得
られた解析結果に基づいて上記連想データベースの検索
を行なう。その結果、比喩表現を含まない文の解析結果
であると判定されたときにその解析結果をそのまま出力
する。他方、比喩表現を含む文の解析結果と判定された
ときに、連想データベースの格納内容を利用して、入力
された自然言語文を同じ概念の比喩表現を含まない自然
言語文に変換して再解析し、その解析結果を出力する。
まず解析を行なって解析結果を得る。このようにして得
られた解析結果に基づいて上記連想データベースの検索
を行なう。その結果、比喩表現を含まない文の解析結果
であると判定されたときにその解析結果をそのまま出力
する。他方、比喩表現を含む文の解析結果と判定された
ときに、連想データベースの格納内容を利用して、入力
された自然言語文を同じ概念の比喩表現を含まない自然
言語文に変換して再解析し、その解析結果を出力する。
【0012】実際上、比喩文で問題となることの多く
は、隠喩表現を含む文であるので、上記連想データベー
スに格納されている情報が、隠喩表現を含む比喩文用の
ものであることが好ましい。
は、隠喩表現を含む文であるので、上記連想データベー
スに格納されている情報が、隠喩表現を含む比喩文用の
ものであることが好ましい。
【0013】この場合において、隠喩表現を含む文とし
ては、文脈に関係なく隠喩表現が使われていることが判
る比喩文(例えば「彼は狼だ」)と、文脈によっては隠
喩表現を含むと捕らえられる比喩文(例えば「彼は哲学
者だ」)とがある。そこで、連想データベースに、文脈
に関係なく隠喩表現が使われていることが判る比喩文用
情報と、文脈によっては隠喩表現を含むと捕らえられる
比喩文用の情報とを区別して格納しておき、モードに応
じて、いずれかの情報だけを利用して解析処理すること
が好ましい。
ては、文脈に関係なく隠喩表現が使われていることが判
る比喩文(例えば「彼は狼だ」)と、文脈によっては隠
喩表現を含むと捕らえられる比喩文(例えば「彼は哲学
者だ」)とがある。そこで、連想データベースに、文脈
に関係なく隠喩表現が使われていることが判る比喩文用
情報と、文脈によっては隠喩表現を含むと捕らえられる
比喩文用の情報とを区別して格納しておき、モードに応
じて、いずれかの情報だけを利用して解析処理すること
が好ましい。
【0014】
(A)第1実施例 以下、本発明を機械翻訳システムに適用した第1実施例
を図面を参照しながら詳述する。
を図面を参照しながら詳述する。
【0015】図2は、この第1実施例が適用される計算
機システムの構成例を示すものである。図2において、
この計算機システム1は、CPU2と、キーボード3
と、ディスプレイ4と、主メモリ5と、磁気ディスク装
置6とから構成されている。磁気ディスク装置6には、
入力文解析プログラム(図1参照)、文変換プログラ
ム、翻訳文生成プログラム、ユーザインタフェースプロ
グラム、連想データベース、辞書データ及び文法ルール
等が格納されている。上述した各種プログラムは主メモ
リ5にロードされてCPU2によって実行される。CP
U2が利用する辞書データや文法ルールや連想データベ
ースは、主メモリ5にロードされる場合もあり、また主
メモリ5の容量が不足する場合には磁気ディスク装置6
に格納されたまま利用される。なお、キーボード3は入
力文等の入力用であり、ディスプレイ4は翻訳文等の表
示用である。
機システムの構成例を示すものである。図2において、
この計算機システム1は、CPU2と、キーボード3
と、ディスプレイ4と、主メモリ5と、磁気ディスク装
置6とから構成されている。磁気ディスク装置6には、
入力文解析プログラム(図1参照)、文変換プログラ
ム、翻訳文生成プログラム、ユーザインタフェースプロ
グラム、連想データベース、辞書データ及び文法ルール
等が格納されている。上述した各種プログラムは主メモ
リ5にロードされてCPU2によって実行される。CP
U2が利用する辞書データや文法ルールや連想データベ
ースは、主メモリ5にロードされる場合もあり、また主
メモリ5の容量が不足する場合には磁気ディスク装置6
に格納されたまま利用される。なお、キーボード3は入
力文等の入力用であり、ディスプレイ4は翻訳文等の表
示用である。
【0016】このような構成の計算機システム1で実現
されている機械翻訳システムは、機能的には、図3に示
す構成を有する。すなわち、入力文解析部11、変換部
12、翻訳文生成部13、連想データベース14、辞書
データ15及び文法ルール16からなり、入力文(原言
語の文)に対応した翻訳文(目的言語の文)を得る。
されている機械翻訳システムは、機能的には、図3に示
す構成を有する。すなわち、入力文解析部11、変換部
12、翻訳文生成部13、連想データベース14、辞書
データ15及び文法ルール16からなり、入力文(原言
語の文)に対応した翻訳文(目的言語の文)を得る。
【0017】入力文解析部11は、入力された文を単語
に分割し、各単語の品詞、活用等の文法属性を認識し、
各単語間の係り受け関係や意味的関係を認識する。この
ときに、辞書データ(原言語の単語辞書)15や文法ル
ール(原言語についてのルール)16を参照する。入力
文解析部11は、入力文に隠喩表現がある場合には連想
データベース14を参照してそれを認識し、隠喩表現で
ない通常の表現に変換してから、解析処理を初めからや
り直す。
に分割し、各単語の品詞、活用等の文法属性を認識し、
各単語間の係り受け関係や意味的関係を認識する。この
ときに、辞書データ(原言語の単語辞書)15や文法ル
ール(原言語についてのルール)16を参照する。入力
文解析部11は、入力文に隠喩表現がある場合には連想
データベース14を参照してそれを認識し、隠喩表現で
ない通常の表現に変換してから、解析処理を初めからや
り直す。
【0018】図1は、この入力文解析部11による処理
を示すフローチャートであり、これについては後述す
る。
を示すフローチャートであり、これについては後述す
る。
【0019】変換部12は、入力文解析部11からの結
果を受け取り、各単語を目的言語の単語に置き換え、文
体等の変換等を行なう。このときにも、辞書データ(原
言語と目的言語の単語間の対応関係を記述した辞書)1
5や文法ルール16を参照する。
果を受け取り、各単語を目的言語の単語に置き換え、文
体等の変換等を行なう。このときにも、辞書データ(原
言語と目的言語の単語間の対応関係を記述した辞書)1
5や文法ルール16を参照する。
【0020】翻訳文生成部13は、変換部12からの結
果を受け取り、単語の語順を変更したり、単語の語尾処
理等を行ない、目的言語の文(翻訳文)を生成する。こ
のときにも、辞書データ(目的言語の単語辞書)15や
文法ルール(目的言語についてのルール)16を参照す
る。
果を受け取り、単語の語順を変更したり、単語の語尾処
理等を行ない、目的言語の文(翻訳文)を生成する。こ
のときにも、辞書データ(目的言語の単語辞書)15や
文法ルール(目的言語についてのルール)16を参照す
る。
【0021】辞書データ15及び文法ルール16は、従
来と同様なものであるので、その説明は省略する。
来と同様なものであるので、その説明は省略する。
【0022】従来とは異なって、解析時にこの実施例で
初めて利用される連想データベース14は、隠喩候補パ
ターンテーブル41と、連想概念・変換ルールテーブル
42とからなる。
初めて利用される連想データベース14は、隠喩候補パ
ターンテーブル41と、連想概念・変換ルールテーブル
42とからなる。
【0023】隠喩候補パターンテーブル41は、入力文
が隠喩を含む文であるか否かを検出するための隠喩候補
パターンを格納しているものである。後述するように、
意味解析結果をこのパターンと比較することで、隠喩を
含む文である可能性及び隠喩されている可能性を有する
単語情報を得ることができる。
が隠喩を含む文であるか否かを検出するための隠喩候補
パターンを格納しているものである。後述するように、
意味解析結果をこのパターンと比較することで、隠喩を
含む文である可能性及び隠喩されている可能性を有する
単語情報を得ることができる。
【0024】図4は、隠喩候補パターンテーブル41の
構成を示すものである。隠喩候補パターンテーブル41
は、パターン識別情報41aと、パターン本体41bか
らなる。パターン本体41bは、例えば入力文の各構成
要素(例えば形態素)に対して文字、品詞、意味カテゴ
リのいずれか1個以上で規定した組み合わせでなる。こ
こで、意味カテゴリは単語の意味を抽象化させた上位概
念である。例えば、パターン識別情報41aが「P1」
の隠喩候補パターンは、最初の要素が人間を意味する名
詞で、2番目の要素が文字「は」で、3番目の要素が動
物を意味する名詞で、最後の要素が文字「だ」、「であ
る」、「です」のいずれかであるパターンを示してお
り、3番目の要素が隠喩されている可能性がある候補で
あることを示している。
構成を示すものである。隠喩候補パターンテーブル41
は、パターン識別情報41aと、パターン本体41bか
らなる。パターン本体41bは、例えば入力文の各構成
要素(例えば形態素)に対して文字、品詞、意味カテゴ
リのいずれか1個以上で規定した組み合わせでなる。こ
こで、意味カテゴリは単語の意味を抽象化させた上位概
念である。例えば、パターン識別情報41aが「P1」
の隠喩候補パターンは、最初の要素が人間を意味する名
詞で、2番目の要素が文字「は」で、3番目の要素が動
物を意味する名詞で、最後の要素が文字「だ」、「であ
る」、「です」のいずれかであるパターンを示してお
り、3番目の要素が隠喩されている可能性がある候補で
あることを示している。
【0025】連想概念・変換ルールテーブル42は、隠
喩を含む文を、意味(概念)が同じで隠喩を含まない文
にどのように変換するかを示す情報が格納されているも
のであり、この連想概念・変換ルールテーブル42の格
納内容を利用して、入力文解析部11は、隠喩を含む文
を意味が同じで隠喩を含まない文に変換する。
喩を含む文を、意味(概念)が同じで隠喩を含まない文
にどのように変換するかを示す情報が格納されているも
のであり、この連想概念・変換ルールテーブル42の格
納内容を利用して、入力文解析部11は、隠喩を含む文
を意味が同じで隠喩を含まない文に変換する。
【0026】図5は、連想概念・変換ルールテーブル4
2の構成を示すものである。連想概念・変換ルールテー
ブル42は、隠喩候補パターンテーブル41に格納され
ている隠喩候補パターンのパターン識別情報42aと、
そのパターンで隠喩候補であると検出された要素になり
える隠喩候補単語42bと、この隠喩候補単語から連想
される連想概念42cと、隠喩候補単語を含む比喩文を
連想概念を利用して隠喩表現を含まない文にどのように
変換するかを示す変換ルール42dとからなる。実際
上、ある単語が隠喩される場合、その単語はその単語か
ら連想される概念で利用されている。例えば、最初の要
素が人間を意味する名詞で、2番目の要素が文字「は」
で、3番目の要素が動物を意味する名詞で、最後の要素
が文字「だ」、「である」、「です」のいずれかである
パターンP1に該当する文は多数あるが、図4の連想概
念・変換ルールテーブル42の例では、そこで、隠喩さ
れている動物を表す単語が「狼」であればこれは「獰猛
だ」という概念で利用されており、入力文の「狼だ」、
「狼である」又は「狼です」の部分を「獰猛だ」に変換
すれば隠喩を使わない同じ意味の文になることが規定さ
れている。
2の構成を示すものである。連想概念・変換ルールテー
ブル42は、隠喩候補パターンテーブル41に格納され
ている隠喩候補パターンのパターン識別情報42aと、
そのパターンで隠喩候補であると検出された要素になり
える隠喩候補単語42bと、この隠喩候補単語から連想
される連想概念42cと、隠喩候補単語を含む比喩文を
連想概念を利用して隠喩表現を含まない文にどのように
変換するかを示す変換ルール42dとからなる。実際
上、ある単語が隠喩される場合、その単語はその単語か
ら連想される概念で利用されている。例えば、最初の要
素が人間を意味する名詞で、2番目の要素が文字「は」
で、3番目の要素が動物を意味する名詞で、最後の要素
が文字「だ」、「である」、「です」のいずれかである
パターンP1に該当する文は多数あるが、図4の連想概
念・変換ルールテーブル42の例では、そこで、隠喩さ
れている動物を表す単語が「狼」であればこれは「獰猛
だ」という概念で利用されており、入力文の「狼だ」、
「狼である」又は「狼です」の部分を「獰猛だ」に変換
すれば隠喩を使わない同じ意味の文になることが規定さ
れている。
【0027】図1は、上述したように、入力文解析部1
1の処理フローチャートを示すものである。この図1を
用いて、入力文解析部11の処理を説明する。
1の処理フローチャートを示すものである。この図1を
用いて、入力文解析部11の処理を説明する。
【0028】入力文が入力されると、入力文解析部11
は、辞書データ15及び文法ルール16を参照して、従
来と同様にして、形態素解析処理、構文解析処理、意味
解析処理を順次行ない、解析結果を得る(ステップ10
1〜103)。
は、辞書データ15及び文法ルール16を参照して、従
来と同様にして、形態素解析処理、構文解析処理、意味
解析処理を順次行ない、解析結果を得る(ステップ10
1〜103)。
【0029】次いで、入力文解析部11は、得られた解
析結果に合致する隠喩候補パターンが存在するかを隠喩
候補パターンテーブル41を検索することで判別する
(ステップ104)。
析結果に合致する隠喩候補パターンが存在するかを隠喩
候補パターンテーブル41を検索することで判別する
(ステップ104)。
【0030】ここで、否定結果を得ると、入力文解析部
11は一連の処理を終了して解析結果を変換部12に引
き渡す。これに対して、肯定結果を得ると、検出された
隠喩候補パターンが規定している隠喩候補の位置情報に
基づいて、隠喩候補の具体的な文字列を認識し、検出さ
れた隠喩候補パターンと隠喩候補の文字列の組み合わせ
が連想概念・変換ルールテーブル42に存在しているか
を検索する(ステップ105、106)。
11は一連の処理を終了して解析結果を変換部12に引
き渡す。これに対して、肯定結果を得ると、検出された
隠喩候補パターンが規定している隠喩候補の位置情報に
基づいて、隠喩候補の具体的な文字列を認識し、検出さ
れた隠喩候補パターンと隠喩候補の文字列の組み合わせ
が連想概念・変換ルールテーブル42に存在しているか
を検索する(ステップ105、106)。
【0031】ここで、否定結果を得た場合にも、入力文
解析部11は一連の処理を終了して解析結果を変換部1
2に引き渡す。他方、検出された隠喩候補パターンと隠
喩候補の文字列の組み合わせが連想概念・変換ルールテ
ーブル42に存在していると、その変換ルール42dに
従い、入力文を隠喩を含まない同じ意味の文に変換して
上述したステップ101に戻る(ステップ107)。
解析部11は一連の処理を終了して解析結果を変換部1
2に引き渡す。他方、検出された隠喩候補パターンと隠
喩候補の文字列の組み合わせが連想概念・変換ルールテ
ーブル42に存在していると、その変換ルール42dに
従い、入力文を隠喩を含まない同じ意味の文に変換して
上述したステップ101に戻る(ステップ107)。
【0032】かくして、隠喩を含まない、入力文と同じ
意味の文に対して、再び形態素解析処理、構文解析処
理、意味解析処理が順次行なわれ、解析結果が得られ
る。このときには、ステップ104で否定結果が得ら
れ、隠喩を含まない、入力文と同じ意味の文に対する解
析結果が変換部12に引き渡される。
意味の文に対して、再び形態素解析処理、構文解析処
理、意味解析処理が順次行なわれ、解析結果が得られ
る。このときには、ステップ104で否定結果が得ら
れ、隠喩を含まない、入力文と同じ意味の文に対する解
析結果が変換部12に引き渡される。
【0033】次に、隠喩文「彼は狼だ。」が入力された
として入力文解析部11による処理を具体的に説明す
る。
として入力文解析部11による処理を具体的に説明す
る。
【0034】この文「彼は狼だ。」に対して、形態素解
析処理、構文解析処理、意味解析処理を順次行なうと、
図6に示す解析結果が得られる。
析処理、構文解析処理、意味解析処理を順次行なうと、
図6に示す解析結果が得られる。
【0035】この実施例の場合、解析結果は、文字、品
詞、意味ナンバ、意味カテゴリ、係り受け関係、意味関
係で記述されているものとする。なお、意味ナンバは、
一つの単語でも複数の意味がある場合があるのでそれを
識別するための番号である。意味カテゴリは上述したよ
うに単語の意味を抽象化させた上位概念である。係り受
け関係とは、どの語とどの語が係り受け関係になってい
るかを示すものであり、意味関係とは、係り受け関係に
ある2語がどのような意味関係(例えばある語が他の語
の目的語である等)にあるかを示すものである。この実
施例の場合、解析結果の情報の内、文字、品詞及び意味
カテゴリが隠喩候補パターンの検索に利用される。
詞、意味ナンバ、意味カテゴリ、係り受け関係、意味関
係で記述されているものとする。なお、意味ナンバは、
一つの単語でも複数の意味がある場合があるのでそれを
識別するための番号である。意味カテゴリは上述したよ
うに単語の意味を抽象化させた上位概念である。係り受
け関係とは、どの語とどの語が係り受け関係になってい
るかを示すものであり、意味関係とは、係り受け関係に
ある2語がどのような意味関係(例えばある語が他の語
の目的語である等)にあるかを示すものである。この実
施例の場合、解析結果の情報の内、文字、品詞及び意味
カテゴリが隠喩候補パターンの検索に利用される。
【0036】この例文の場合、最初の要素「彼」が人間
を意味する名詞で、2番目の要素「は」が文字「は」
で、3番目の要素「狼」が動物を意味する名詞で、最後
の要素が文字「だ」であるので、隠喩候補パターンテー
ブル41の検索の結果、隠喩候補パターンP1に該当す
ると判別される(図4参照)。従って、隠喩候補として
単語「狼」が取り出される。
を意味する名詞で、2番目の要素「は」が文字「は」
で、3番目の要素「狼」が動物を意味する名詞で、最後
の要素が文字「だ」であるので、隠喩候補パターンテー
ブル41の検索の結果、隠喩候補パターンP1に該当す
ると判別される(図4参照)。従って、隠喩候補として
単語「狼」が取り出される。
【0037】隠喩候補パターンP1及び隠喩候補「狼」
で、連想概念・変換ルールテーブル42を検索すると、
これに応じた変換ルールが存在することが判り、この変
換ルールに従って変換すると、入力文「彼は狼だ。」は
隠喩を含まない「彼は獰猛だ。」に変換される。そし
て、この「彼は獰猛だ。」が解析される。
で、連想概念・変換ルールテーブル42を検索すると、
これに応じた変換ルールが存在することが判り、この変
換ルールに従って変換すると、入力文「彼は狼だ。」は
隠喩を含まない「彼は獰猛だ。」に変換される。そし
て、この「彼は獰猛だ。」が解析される。
【0038】従って、入力文が「彼は狼だ。」の場合、
変換文「彼は獰猛だ。」に対する解析結果が変換部12
に与えられる。
変換文「彼は獰猛だ。」に対する解析結果が変換部12
に与えられる。
【0039】なお、文「人間は哺乳類だ。」を解析した
場合には、隠喩候補パターンテーブル41の検索では該
当する隠喩候補パターン(P1)が見付かるが、連想概
念・変換ルールテーブル42の検索では該当するものが
なく、「人間は哺乳類だ。」に対する当初の解析結果が
変換部12に引き渡される。すなわち、文のパターンが
隠喩候補パターンに合致しても隠喩を含まないものに対
しては、そのままの解析結果が変換部12に引き渡され
る。
場合には、隠喩候補パターンテーブル41の検索では該
当する隠喩候補パターン(P1)が見付かるが、連想概
念・変換ルールテーブル42の検索では該当するものが
なく、「人間は哺乳類だ。」に対する当初の解析結果が
変換部12に引き渡される。すなわち、文のパターンが
隠喩候補パターンに合致しても隠喩を含まないものに対
しては、そのままの解析結果が変換部12に引き渡され
る。
【0040】上述した図1は、基本的な流れを示すもの
であり、連想概念が2個以上あるような場合には、以下
のように処理する。例えば、「彼は計算機だ。」という
文章の場合、「計算機」を「計算が速い」という概念で
用いていることも、また「冷淡だ」という概念で用いて
いることもある。そのため、図5に示すように、「計算
機」に対する連想概念として「計算が速い」と「冷淡
だ」と2個用意している場合がある。この場合、変換に
よって「彼は計算が速い。」という文と「彼は冷淡だ」
という文とを2個共作り、これをディスプレイに表示し
てユーザに選択させるようにしても良く、また、2個の
変換文に対する解析結果を変換部12に与えて、最終的
に翻訳された2個の文をディスプレイに表示させてユー
ザに選択させるようにしても良い。
であり、連想概念が2個以上あるような場合には、以下
のように処理する。例えば、「彼は計算機だ。」という
文章の場合、「計算機」を「計算が速い」という概念で
用いていることも、また「冷淡だ」という概念で用いて
いることもある。そのため、図5に示すように、「計算
機」に対する連想概念として「計算が速い」と「冷淡
だ」と2個用意している場合がある。この場合、変換に
よって「彼は計算が速い。」という文と「彼は冷淡だ」
という文とを2個共作り、これをディスプレイに表示し
てユーザに選択させるようにしても良く、また、2個の
変換文に対する解析結果を変換部12に与えて、最終的
に翻訳された2個の文をディスプレイに表示させてユー
ザに選択させるようにしても良い。
【0041】従って、上述した第1実施例によれば、隠
喩候補パターンと当初の解析結果とを比較して隠喩を含
む可能性があるか否かを判断し、隠喩を含む可能性があ
る場合には連想概念・変換ルールテーブルを検索して隠
喩を含む文であるか否かを確定し、隠喩を含む文である
場合には同じ意味の隠喩を含まない文に変換して再度解
析するようにしたので、隠喩表現が使われている自然言
語文をも正しく解析することができる。
喩候補パターンと当初の解析結果とを比較して隠喩を含
む可能性があるか否かを判断し、隠喩を含む可能性があ
る場合には連想概念・変換ルールテーブルを検索して隠
喩を含む文であるか否かを確定し、隠喩を含む文である
場合には同じ意味の隠喩を含まない文に変換して再度解
析するようにしたので、隠喩表現が使われている自然言
語文をも正しく解析することができる。
【0042】その結果、目的言語を扱う人々に正しく意
味を伝えることができる翻訳文が得られる。
味を伝えることができる翻訳文が得られる。
【0043】(B)第2実施例 次に、本発明を機械翻訳システムに適用した第2実施例
を図面を参照しながら詳述する。
を図面を参照しながら詳述する。
【0044】なお、この第2実施例が適用される計算機
システムの構成例は、第1実施例の場合と同様であるの
でその説明は省略する。
システムの構成例は、第1実施例の場合と同様であるの
でその説明は省略する。
【0045】図7は、この第2実施例の機能構成を示す
ものであり、図3との対応部分には同一符号を付して示
している。この図7に示すように、この第2実施例の場
合、モード選択部17が設けられている点、入力文解析
部11Aでの解析処理が後述する図12に従って行われ
る点、連想データベース14Aにモード別の情報が格納
されている点が第1実施例とは異なる。
ものであり、図3との対応部分には同一符号を付して示
している。この図7に示すように、この第2実施例の場
合、モード選択部17が設けられている点、入力文解析
部11Aでの解析処理が後述する図12に従って行われ
る点、連想データベース14Aにモード別の情報が格納
されている点が第1実施例とは異なる。
【0046】モード選択部17は、入力文に通常モード
か強制モードかを指示するモード情報を付与して入力文
解析部11Aに与えるものである。なお、いずれのモー
ドを指示するかはユーザから与えられるようになされて
いる。ここで、強制モードとは入力文を強制的に隠喩表
現を含む文とみなして入力文解析部11Aに解析処理を
実行させるモードである。
か強制モードかを指示するモード情報を付与して入力文
解析部11Aに与えるものである。なお、いずれのモー
ドを指示するかはユーザから与えられるようになされて
いる。ここで、強制モードとは入力文を強制的に隠喩表
現を含む文とみなして入力文解析部11Aに解析処理を
実行させるモードである。
【0047】この実施例の連想データベース14Aは、
通常モード用の隠喩候補パターンテーブル41H及び連
想概念・変換ルールテーブル42Hと、強制モード用の
隠喩候補パターンテーブル41K及び連想概念・変換ル
ールテーブル42Kとを備えている。
通常モード用の隠喩候補パターンテーブル41H及び連
想概念・変換ルールテーブル42Hと、強制モード用の
隠喩候補パターンテーブル41K及び連想概念・変換ル
ールテーブル42Kとを備えている。
【0048】入力文解析部11Aは、通常モードにおい
ては通常モード用の隠喩候補パターンテーブル41H及
び連想概念・変換ルールテーブル42Hを参照して解析
処理を行ない、強制モードにおいては強制モード用の隠
喩候補パターンテーブル41K及び連想概念・変換ルー
ルテーブル42Kを参照して解析処理を行なう。
ては通常モード用の隠喩候補パターンテーブル41H及
び連想概念・変換ルールテーブル42Hを参照して解析
処理を行ない、強制モードにおいては強制モード用の隠
喩候補パターンテーブル41K及び連想概念・変換ルー
ルテーブル42Kを参照して解析処理を行なう。
【0049】例えば、「彼は狼だ」や「彼女は白ゆり
だ」のような文は、人間であれば文脈を考えなくても隠
喩が使われていることが判る文章であるが、「彼は哲学
者だ」や「彼女は芸術家だ」のような文章は文脈を考え
ないで見た場合には隠喩が使われているとも考えられる
し、隠喩が使われていないとも考えられる。
だ」のような文は、人間であれば文脈を考えなくても隠
喩が使われていることが判る文章であるが、「彼は哲学
者だ」や「彼女は芸術家だ」のような文章は文脈を考え
ないで見た場合には隠喩が使われているとも考えられる
し、隠喩が使われていないとも考えられる。
【0050】このような特定の文脈では隠喩が使われて
いることになる文章をも考慮して、連想データベースに
格納する隠喩候補パターンや連想概念・変換ルール等を
用意すると非常に多くなり、検索等に非常に多くの時間
が割かれ、最終的に解析結果を得るまでに多くの時間が
かかる。また、このようにすると隠喩を意図していない
文の場合にも、隠喩が含まれている文として解析処理さ
れてしまう。
いることになる文章をも考慮して、連想データベースに
格納する隠喩候補パターンや連想概念・変換ルール等を
用意すると非常に多くなり、検索等に非常に多くの時間
が割かれ、最終的に解析結果を得るまでに多くの時間が
かかる。また、このようにすると隠喩を意図していない
文の場合にも、隠喩が含まれている文として解析処理さ
れてしまう。
【0051】そこで、この第2実施例の場合、文脈に関
係なく隠喩が使われていることが判る文に対する隠喩候
補パターンや連想概念・変換ルール等を、通常モード用
の隠喩候補パターンテーブル41H及び連想概念・変換
ルールテーブル42Hに格納し、特定の文脈では隠喩が
使われていることになる文に対する隠喩候補パターンや
連想概念・変換ルール等を、強制モード用の隠喩候補パ
ターンテーブル41K及び連想概念・変換ルールテーブ
ル42Kに格納することとした。そして、モードに応じ
てテーブルを選択することとし、解析処理時での検索時
間を押え、最終的に解析結果を得るまでの時間を短くす
ると共に、隠喩がなされている場合にのみ隠喩を含まな
い文への変換を実行することとした。
係なく隠喩が使われていることが判る文に対する隠喩候
補パターンや連想概念・変換ルール等を、通常モード用
の隠喩候補パターンテーブル41H及び連想概念・変換
ルールテーブル42Hに格納し、特定の文脈では隠喩が
使われていることになる文に対する隠喩候補パターンや
連想概念・変換ルール等を、強制モード用の隠喩候補パ
ターンテーブル41K及び連想概念・変換ルールテーブ
ル42Kに格納することとした。そして、モードに応じ
てテーブルを選択することとし、解析処理時での検索時
間を押え、最終的に解析結果を得るまでの時間を短くす
ると共に、隠喩がなされている場合にのみ隠喩を含まな
い文への変換を実行することとした。
【0052】図8は通常モード用の隠喩候補パターンテ
ーブル41Hの構成を示すものであり、図9は強制モー
ド用の隠喩候補パターンテーブル41Kの構成を示すも
のである。通常モード用の隠喩候補パターンテーブル4
1Hは、第1実施例の隠喩候補パターンテーブル41
(図4)の構成と同様な構成を有しており、格納パター
ンもほぼ同様である。しかし、パターン識別情報に、通
常モード用であることを表す情報(例えばH)が含まれ
ている点が第1実施例の隠喩候補パターンテーブル41
と異なる。強制モード用の隠喩候補パターンテーブル4
1Kは、第1実施例の隠喩候補パターンテーブル41
(図4)の構成と同様な構成を有しているが、格納パタ
ーンの種類が大きく異なっている。上述したように、特
定の文脈では隠喩が使われていることになる文章を考慮
したものであるからである。なお、このように使われる
文としては、「彼はぬるま湯に使っている」や「彼は泥
沼にはまっている」等があり、文脈に関係しない隠喩表
現より複雑な文章が多く、そのため規定する情報が多い
パターンがある。また、パターン識別情報に、強制モー
ド用であることを表す情報(例えばK)が含まれている
点も第1実施例の隠喩候補パターンテーブル41と異な
る。
ーブル41Hの構成を示すものであり、図9は強制モー
ド用の隠喩候補パターンテーブル41Kの構成を示すも
のである。通常モード用の隠喩候補パターンテーブル4
1Hは、第1実施例の隠喩候補パターンテーブル41
(図4)の構成と同様な構成を有しており、格納パター
ンもほぼ同様である。しかし、パターン識別情報に、通
常モード用であることを表す情報(例えばH)が含まれ
ている点が第1実施例の隠喩候補パターンテーブル41
と異なる。強制モード用の隠喩候補パターンテーブル4
1Kは、第1実施例の隠喩候補パターンテーブル41
(図4)の構成と同様な構成を有しているが、格納パタ
ーンの種類が大きく異なっている。上述したように、特
定の文脈では隠喩が使われていることになる文章を考慮
したものであるからである。なお、このように使われる
文としては、「彼はぬるま湯に使っている」や「彼は泥
沼にはまっている」等があり、文脈に関係しない隠喩表
現より複雑な文章が多く、そのため規定する情報が多い
パターンがある。また、パターン識別情報に、強制モー
ド用であることを表す情報(例えばK)が含まれている
点も第1実施例の隠喩候補パターンテーブル41と異な
る。
【0053】図10は通常モード用の連想概念・変換ル
ールテーブル42Hの構成を示すものであり、図11は
強制モード用の連想概念・変換ルールテーブル42Kの
構成を示すものである。これらテーブル42H及び42
Kは共に、第1実施例の連想概念・変換ルールテーブル
42(図5)と同様な構成を有しており、そこで、説明
は省略する。
ールテーブル42Hの構成を示すものであり、図11は
強制モード用の連想概念・変換ルールテーブル42Kの
構成を示すものである。これらテーブル42H及び42
Kは共に、第1実施例の連想概念・変換ルールテーブル
42(図5)と同様な構成を有しており、そこで、説明
は省略する。
【0054】図12は、この第2実施例の入力文解析部
11Aが実行する処理を示すフローチャートである。な
お、第1実施例に係る図1との対応ステップには、同一
又は類似した符号を付して示している。この図12を用
いて入力文解析部11Aによる処理を簡単に説明する。
11Aが実行する処理を示すフローチャートである。な
お、第1実施例に係る図1との対応ステップには、同一
又は類似した符号を付して示している。この図12を用
いて入力文解析部11Aによる処理を簡単に説明する。
【0055】入力文が入力されると、各種の解析処理を
行なって一旦解析結果を得る(ステップ101〜10
3)。その後、指示モードを判別する(ステップ10
8)。
行なって一旦解析結果を得る(ステップ101〜10
3)。その後、指示モードを判別する(ステップ10
8)。
【0056】通常モードが指示されていると、通常モー
ド用の隠喩候補パターンテーブル41H及び連想概念・
変換ルールテーブル42Hを参照した、隠喩を含む文の
判別や隠喩を含む文を同じ意味の隠喩を含まない文への
変換等を行なう(ステップ104H〜108H)。隠喩
を含まない文への変換が行われた場合には、ステップ1
01に戻る。
ド用の隠喩候補パターンテーブル41H及び連想概念・
変換ルールテーブル42Hを参照した、隠喩を含む文の
判別や隠喩を含む文を同じ意味の隠喩を含まない文への
変換等を行なう(ステップ104H〜108H)。隠喩
を含まない文への変換が行われた場合には、ステップ1
01に戻る。
【0057】他方、強制モードが指示されていると、強
制モード用の隠喩候補パターンテーブル41K及び連想
概念・変換ルールテーブル42Kを参照した、隠喩を含
む文の判別や隠喩を含む文を同じ意味の隠喩を含まない
文への変換等を行なう(ステップ104K〜108
K)。隠喩を含まない文への変換が行われた場合には、
ステップ101に戻る。
制モード用の隠喩候補パターンテーブル41K及び連想
概念・変換ルールテーブル42Kを参照した、隠喩を含
む文の判別や隠喩を含む文を同じ意味の隠喩を含まない
文への変換等を行なう(ステップ104K〜108
K)。隠喩を含まない文への変換が行われた場合には、
ステップ101に戻る。
【0058】この第2実施例によって翻訳を実行させる
場合、ユーザは通常、モードを通常モードにしておく。
このような状態で、隠喩を含まない例えば「彼は哲学者
だ」という文が入力されると、ステップ101〜103
を経て得られた当初の解析結果がそのまま変換部12に
与えられる。
場合、ユーザは通常、モードを通常モードにしておく。
このような状態で、隠喩を含まない例えば「彼は哲学者
だ」という文が入力されると、ステップ101〜103
を経て得られた当初の解析結果がそのまま変換部12に
与えられる。
【0059】通常モード状態において、次に隠喩を含む
とも含まないともとれる文が対象となり、しかも、その
文が隠喩表現である場合にはユーザは強制モードとす
る。例えば、「彼は哲学者だ」という文が隠喩であると
判断したときに強制モードとする。この場合には、ステ
ップ101〜103、108、104H〜107Hを経
て「彼は勤勉だ」という隠喩を含まない文に変換され
て、再度解析されて文「彼は勤勉だ」に対する解析結果
が変換部12に与えられる。
とも含まないともとれる文が対象となり、しかも、その
文が隠喩表現である場合にはユーザは強制モードとす
る。例えば、「彼は哲学者だ」という文が隠喩であると
判断したときに強制モードとする。この場合には、ステ
ップ101〜103、108、104H〜107Hを経
て「彼は勤勉だ」という隠喩を含まない文に変換され
て、再度解析されて文「彼は勤勉だ」に対する解析結果
が変換部12に与えられる。
【0060】従って、第2実施例によっても、隠喩候補
パターンと当初の解析結果とを比較して隠喩を含む可能
性があるか否かを判断し、隠喩を含む可能性がある場合
には連想概念・変換ルールテーブルを検索して隠喩を含
む文であるか否かを確定し、隠喩を含む文である場合に
は同じ意味の隠喩を含まない文に変換して再度解析する
ようにしたので、隠喩が使われている自然言語文をも正
しく解析することができる。
パターンと当初の解析結果とを比較して隠喩を含む可能
性があるか否かを判断し、隠喩を含む可能性がある場合
には連想概念・変換ルールテーブルを検索して隠喩を含
む文であるか否かを確定し、隠喩を含む文である場合に
は同じ意味の隠喩を含まない文に変換して再度解析する
ようにしたので、隠喩が使われている自然言語文をも正
しく解析することができる。
【0061】その結果、目的言語を扱う人々に正しく意
味を伝えることができる翻訳文が得られる。
味を伝えることができる翻訳文が得られる。
【0062】この効果に加えて、文脈によっては隠喩を
含むことにもなる文であっても、モードを指定すること
によって、隠喩を含むように処理することもでき、隠喩
を含まないように処理することもできるという効果が得
られる。
含むことにもなる文であっても、モードを指定すること
によって、隠喩を含むように処理することもでき、隠喩
を含まないように処理することもできるという効果が得
られる。
【0063】(C)他の実施例 本発明は、自然言語文の解析までに特徴を有するもので
あるので、機械翻訳システム以外の他の自然言語処理シ
ステムに対しても適用することができる。
あるので、機械翻訳システム以外の他の自然言語処理シ
ステムに対しても適用することができる。
【0064】また、上記第1及び第2の実施例では、隠
喩を含む文だけを隠喩を含まない文に変換して再解析す
るものを示したが、直喩文(文構造から比喩文であるこ
とが明らかな文)を対象とするようにしても良い。すな
わち、所定パターンとの比較や直喩表現に係る文字列の
変換等を行なって比喩を使わない文に変換して再解析し
て、最終的な解析結果を得るようにしても良い。
喩を含む文だけを隠喩を含まない文に変換して再解析す
るものを示したが、直喩文(文構造から比喩文であるこ
とが明らかな文)を対象とするようにしても良い。すな
わち、所定パターンとの比較や直喩表現に係る文字列の
変換等を行なって比喩を使わない文に変換して再解析し
て、最終的な解析結果を得るようにしても良い。
【0065】第2実施例を変形した実施例としては、文
脈解釈部を設けてこの解釈結果に応じて通常モード及び
強制モードを切り替えるものを挙げることができる。
脈解釈部を設けてこの解釈結果に応じて通常モード及び
強制モードを切り替えるものを挙げることができる。
【0066】
【発明の効果】以上のように、本発明によれば、比喩検
出情報と当初の解析結果とを比較して比喩を含むか否か
を判断し、比喩を含む場合には変換用情報を適用して同
じ意味の比喩を含まない文に変換して再解析し、その解
析結果を最終的な解析結果とするようにしたので、比喩
が使われている自然言語文をも正しく解析することがで
きる。
出情報と当初の解析結果とを比較して比喩を含むか否か
を判断し、比喩を含む場合には変換用情報を適用して同
じ意味の比喩を含まない文に変換して再解析し、その解
析結果を最終的な解析結果とするようにしたので、比喩
が使われている自然言語文をも正しく解析することがで
きる。
【図1】第1実施例の解析処理のフローチャートであ
る。
る。
【図2】第1実施例が適用される計算機システムのブロ
ック図である。
ック図である。
【図3】第1実施例の機能構成を示すブロック図であ
る。
る。
【図4】第1実施例の隠喩候補パターンテーブルの構成
を示す説明図である。
を示す説明図である。
【図5】第1実施例の連想概念・変換ルールテーブルの
構成を示す説明図である。
構成を示す説明図である。
【図6】第1実施例の当初の解析結果例を示す説明図で
ある。
ある。
【図7】第2実施例の機能構成を示すブロック図であ
る。
る。
【図8】第2実施例の通常モード用の隠喩候補パターン
テーブルの構成を示す説明図である。
テーブルの構成を示す説明図である。
【図9】第2実施例の強制モード用の隠喩候補パターン
テーブルの構成を示す説明図である。
テーブルの構成を示す説明図である。
【図10】第2実施例の通常モード用の連想概念・変換
ルールテーブルの構成を示す説明図である。
ルールテーブルの構成を示す説明図である。
【図11】第2実施例の強制モード用の連想概念・変換
ルールテーブルの構成を示す説明図である。
ルールテーブルの構成を示す説明図である。
【図12】第2実施例の解析処理のフローチャートであ
る。
る。
11、11A…入力文解析部、12…変換部、13…翻
訳文生成部、14、14A…連想データベース、15…
辞書データ、16…文法ルール、17…モード選択部、
41、41H、41K…隠喩候補パターンテーブル、4
2、42H、42K…連想概念・変換ルールテーブル。
訳文生成部、14、14A…連想データベース、15…
辞書データ、16…文法ルール、17…モード選択部、
41、41H、41K…隠喩候補パターンテーブル、4
2、42H、42K…連想概念・変換ルールテーブル。
Claims (3)
- 【請求項1】 入力された自然言語文が比喩文であるこ
とを検出するための比喩検出情報、及び、比喩文である
と検出された自然言語文を同じ概念の比喩表現を含まな
い自然言語文に変換するための変換用情報を格納してい
る連想データベースを備え、 入力された自然言語文に対して1回目の解析を行ない、
この解析結果に基づいて上記連想データベースの検索を
行ない、 その結果、比喩表現を含まない文の解析結果であると判
定されたときにその解析結果を出力し、 比喩表現を含む文の解析結果と判定されたときに、上記
連想データベースの格納内容を利用して、入力された自
然言語文を同じ概念の比喩表現を含まない自然言語文に
変換して再解析し、その解析結果を出力することを特徴
とした自然言語解析方式。 - 【請求項2】 上記連想データベースに格納されている
情報が、隠喩表現を含む比喩文用のものであることを特
徴とする請求項1に記載の自然言語解析方式。 - 【請求項3】 上記連想データベースに、文脈に関係な
く隠喩表現が使われていることが判る比喩文用情報と、
文脈によっては隠喩表現を含むと捕らえられる比喩文用
の情報とを区別して格納しておき、モードに応じて、い
ずれかの情報だけを利用して解析処理することを特徴と
した請求項2に記載の自然言語解析方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3226993A JPH0567138A (ja) | 1991-09-06 | 1991-09-06 | 自然言語解析方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3226993A JPH0567138A (ja) | 1991-09-06 | 1991-09-06 | 自然言語解析方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0567138A true JPH0567138A (ja) | 1993-03-19 |
Family
ID=16853834
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3226993A Pending JPH0567138A (ja) | 1991-09-06 | 1991-09-06 | 自然言語解析方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0567138A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111324214A (zh) * | 2018-12-17 | 2020-06-23 | 北京搜狗科技发展有限公司 | 一种语句纠错方法和装置 |
-
1991
- 1991-09-06 JP JP3226993A patent/JPH0567138A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111324214A (zh) * | 2018-12-17 | 2020-06-23 | 北京搜狗科技发展有限公司 | 一种语句纠错方法和装置 |
| CN111324214B (zh) * | 2018-12-17 | 2024-05-24 | 北京搜狗科技发展有限公司 | 一种语句纠错方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7567902B2 (en) | Generating speech recognition grammars from a large corpus of data | |
| US8024175B2 (en) | Computer program, apparatus, and method for searching translation memory and displaying search result | |
| KR20170106308A (ko) | 어노테이션 보조 장치 및 그것을 위한 컴퓨터 프로그램 | |
| US20020077806A1 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
| JPH0447364A (ja) | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 | |
| KR102900193B1 (ko) | 질의 문장 분석을 위한 질의 자질 추출 장치 및 방법 | |
| JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
| WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
| CN110020024B (zh) | 一种科技文献中链接资源的分类方法、系统、设备 | |
| JP2957875B2 (ja) | 文書情報検索装置及び文書検索結果表示方法 | |
| JPH0567138A (ja) | 自然言語解析方式 | |
| KR20200122089A (ko) | 지역 색인을 이용한 전자문서 검색 방법 및 장치 | |
| KR19990047859A (ko) | 도서 문헌 데이터베이스 검색을 위한 자연언어 대화 시스템 | |
| JP3825645B2 (ja) | 表現変換方法及び表現変換装置 | |
| JP3780556B2 (ja) | 自然言語事例検索装置及び自然言語事例検索方法 | |
| JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
| KR100463376B1 (ko) | 원시언어를 대상언어로 번역하기 위한 번역엔진 장치 및 그 번역방법 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JPH02253474A (ja) | テキストベース検索方法 | |
| JPH07244669A (ja) | 文書検索方式 | |
| Colton | Text classification using Python | |
| JP2004164672A (ja) | 表現変換方法及び表現変換装置 | |
| JPS62267872A (ja) | 言語解析装置 | |
| Inamzhanovna et al. | Automatic POS Tagging of Verbs in the Uzbek Language and the Algorithm for Identifying Person-Number and Tense Categories | |
| JP2006331246A (ja) | 意見分析処理方法、意見分析処理装置およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |