JPH1021243A - 翻訳装置および翻訳方法 - Google Patents
翻訳装置および翻訳方法Info
- Publication number
- JPH1021243A JPH1021243A JP9046140A JP4614097A JPH1021243A JP H1021243 A JPH1021243 A JP H1021243A JP 9046140 A JP9046140 A JP 9046140A JP 4614097 A JP4614097 A JP 4614097A JP H1021243 A JPH1021243 A JP H1021243A
- Authority
- JP
- Japan
- Prior art keywords
- word
- translation
- language
- unit
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 シソーラスの構成によらず、2つの単語間の
意味的な類似性を、的確に求めることができるようにす
る。 【解決手段】 入力と最も類似する用例を、シソーラス
を用いて検出する場合において、入力における単語と、
用例における単語との間の意味的な類似性を表す単語類
似度が、シソーラスにおいて、その2つの単語の共通の
概念が包含する単語の数に基づいて決定される。
意味的な類似性を、的確に求めることができるようにす
る。 【解決手段】 入力と最も類似する用例を、シソーラス
を用いて検出する場合において、入力における単語と、
用例における単語との間の意味的な類似性を表す単語類
似度が、シソーラスにおいて、その2つの単語の共通の
概念が包含する単語の数に基づいて決定される。
Description
【0001】
【発明の属する技術分野】本発明は、翻訳装置および翻
訳方法に関する。特に、用例を用いて、第1の言語で表
現された第1言語文を、第2の言語で表現された第2言
語文に翻訳する翻訳装置および翻訳方法に関する。
訳方法に関する。特に、用例を用いて、第1の言語で表
現された第1言語文を、第2の言語で表現された第2言
語文に翻訳する翻訳装置および翻訳方法に関する。
【0002】
【従来の技術】第1の言語で表現された第1言語文を、
第2の言語で表現された第2言語文に翻訳する、従来の
翻訳装置は、大きくは、例えば、規則主導型翻訳装置、
用例利用型翻訳装置、用例主導型翻訳装置などの3つに
分類することができる。
第2の言語で表現された第2言語文に翻訳する、従来の
翻訳装置は、大きくは、例えば、規則主導型翻訳装置、
用例利用型翻訳装置、用例主導型翻訳装置などの3つに
分類することができる。
【0003】図13は、従来の規則主導型翻訳装置の一
例の構成を示している。入力部1は、例えばキーボード
や、音声認識装置、文字認識装置などで構成され、そこ
には、第1言語文が入力され、例えばテキストデータな
どの形に変換されて出力される。即ち、入力部1がキー
ボードで構成される場合には、第1言語文は、そのキー
ボードを操作することにより入力され、その操作に対応
したテキストデータが出力される。また、入力部1が音
声認識装置で構成される場合には、第1言語文が音声で
入力され、その音声が音声認識される。そして、その音
声認識結果に対応したテキストデータが出力される。さ
らに、入力部1が文字認識装置で構成される場合には、
例えば紙などに書かれた第1言語文が入力され(読み取
られ)、その第1言語文が文字認識される。そして、そ
の文字認識結果に対応したテキストデータが出力され
る。
例の構成を示している。入力部1は、例えばキーボード
や、音声認識装置、文字認識装置などで構成され、そこ
には、第1言語文が入力され、例えばテキストデータな
どの形に変換されて出力される。即ち、入力部1がキー
ボードで構成される場合には、第1言語文は、そのキー
ボードを操作することにより入力され、その操作に対応
したテキストデータが出力される。また、入力部1が音
声認識装置で構成される場合には、第1言語文が音声で
入力され、その音声が音声認識される。そして、その音
声認識結果に対応したテキストデータが出力される。さ
らに、入力部1が文字認識装置で構成される場合には、
例えば紙などに書かれた第1言語文が入力され(読み取
られ)、その第1言語文が文字認識される。そして、そ
の文字認識結果に対応したテキストデータが出力され
る。
【0004】入力部1から出力される第1言語文に対応
するテキストデータは、解析部31に供給される。解析
部31では、入力部1からの第1言語文が、第1言語
(第1の言語)に関する知識、規則に基づいて言語処理
(解析)され、その解析結果が、変換部32に供給され
る。変換部32は、第1言語および第2言語(第2の言
語)に関する知識、規則に基づいて、解析部31からの
解析結果を、所定の中間言語による中間言語文に変換
し、生成部33に出力する。生成部33は、第2の言語
に関する知識、規則に基づいて、変換部32より供給さ
れた中間言語文から、それに対応する第2言語文、即
ち、第1言語文を第2言語に翻訳した翻訳文(第2言語
文)を生成し、出力部16に供給する。
するテキストデータは、解析部31に供給される。解析
部31では、入力部1からの第1言語文が、第1言語
(第1の言語)に関する知識、規則に基づいて言語処理
(解析)され、その解析結果が、変換部32に供給され
る。変換部32は、第1言語および第2言語(第2の言
語)に関する知識、規則に基づいて、解析部31からの
解析結果を、所定の中間言語による中間言語文に変換
し、生成部33に出力する。生成部33は、第2の言語
に関する知識、規則に基づいて、変換部32より供給さ
れた中間言語文から、それに対応する第2言語文、即
ち、第1言語文を第2言語に翻訳した翻訳文(第2言語
文)を生成し、出力部16に供給する。
【0005】出力部16は、例えばディスプレイ、ある
いは音声合成装置およびスピーカなどで構成され、生成
部33から供給される第2言語文を表示し、あるいは合
成音で出力する。
いは音声合成装置およびスピーカなどで構成され、生成
部33から供給される第2言語文を表示し、あるいは合
成音で出力する。
【0006】図14は、従来の用例利用型翻訳装置の一
例の構成を示している。なお、図中、図13における場
合と対応する部分については、同一の符号を付してあ
り、以下では、その説明は、適宜省略する。即ち、用例
利用型翻訳装置は、照合部41および置換部42が新た
に設けられている他は、図13の規則主導型翻訳装置と
同様に構成されている。
例の構成を示している。なお、図中、図13における場
合と対応する部分については、同一の符号を付してあ
り、以下では、その説明は、適宜省略する。即ち、用例
利用型翻訳装置は、照合部41および置換部42が新た
に設けられている他は、図13の規則主導型翻訳装置と
同様に構成されている。
【0007】用例利用型翻訳装置は、第1言語で表現さ
れた文単位の用例と、その用例を第2言語に翻訳した訳
文とを対応付け(以下、適宜、用例と、それに対応付け
られた訳文とを、対訳用例データという)、この対訳用
例データを、例えば変数化して記憶しており、照合部4
1では、入力部1が出力する第1言語文が、用例と照合
され、これにより、第1言語文と一致する用例が検索さ
れる。そして、第1言語文と一致する用例が存在する場
合、照合部41は、その第1言語文を、それに一致する
用例に対応付けられた訳文に置換するように置換部42
を制御する。これに対応して、置換部42では、第1言
語文が、それと一致する用例の訳文に置換され、出力部
16に供給される。
れた文単位の用例と、その用例を第2言語に翻訳した訳
文とを対応付け(以下、適宜、用例と、それに対応付け
られた訳文とを、対訳用例データという)、この対訳用
例データを、例えば変数化して記憶しており、照合部4
1では、入力部1が出力する第1言語文が、用例と照合
され、これにより、第1言語文と一致する用例が検索さ
れる。そして、第1言語文と一致する用例が存在する場
合、照合部41は、その第1言語文を、それに一致する
用例に対応付けられた訳文に置換するように置換部42
を制御する。これに対応して、置換部42では、第1言
語文が、それと一致する用例の訳文に置換され、出力部
16に供給される。
【0008】一方、第1言語文と一致する用例が存在し
ない場合、照合部41は、その第1言語文を解析部31
に出力する。以下、解析部31、変換部32、および生
成部33において、図13における場合と同様の処理が
行われ、その結果得られる第2言語文が、出力部16に
供給される。
ない場合、照合部41は、その第1言語文を解析部31
に出力する。以下、解析部31、変換部32、および生
成部33において、図13における場合と同様の処理が
行われ、その結果得られる第2言語文が、出力部16に
供給される。
【0009】なお、このような用例利用型翻訳装置につ
いては、例えば特開平6−68134号公報などに、そ
の詳細が開示されている。
いては、例えば特開平6−68134号公報などに、そ
の詳細が開示されている。
【0010】次に、図15は、従来の用例主導型翻訳装
置の一例の構成を示している。なお、図中、図13にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。
置の一例の構成を示している。なお、図中、図13にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。
【0011】用例主導型翻訳装置51では、入力部1が
出力する第1言語文が、変換部51に供給されるように
なされており、変換部51は、入力部1より第1言語文
を受信すると、その第1言語文に最も類似する用例を、
検索部52に検索させる。
出力する第1言語文が、変換部51に供給されるように
なされており、変換部51は、入力部1より第1言語文
を受信すると、その第1言語文に最も類似する用例を、
検索部52に検索させる。
【0012】即ち、対訳用例記憶部53には、文単位の
対訳用例データが記憶されており、検索部52は、ま
ず、対訳用例記憶部53を参照して、第1言語文と一致
する用例を検索する。そして、第1言語文と一致する用
例を検索することができた場合、検索部52は、その用
例と対応付けられている訳文を、変換部51に出力す
る。この場合、変換部51は、検索部52からの訳文
を、そのまま第2言語文として、出力部16に供給す
る。
対訳用例データが記憶されており、検索部52は、ま
ず、対訳用例記憶部53を参照して、第1言語文と一致
する用例を検索する。そして、第1言語文と一致する用
例を検索することができた場合、検索部52は、その用
例と対応付けられている訳文を、変換部51に出力す
る。この場合、変換部51は、検索部52からの訳文
を、そのまま第2言語文として、出力部16に供給す
る。
【0013】一方、第1言語文と一致する用例を検索す
ることができなかった場合、検索部52は、対訳用例記
憶部53に記憶されている用例を順次読み出し、類似度
計算部54に供給する。そして、検索部52は、用例そ
れぞれと、第1言語文との、概念的(意味的な)な類似
性を表す類似度を、例えばシソーラスなどの外部知識を
用いて、類似度計算部54に計算させる。
ることができなかった場合、検索部52は、対訳用例記
憶部53に記憶されている用例を順次読み出し、類似度
計算部54に供給する。そして、検索部52は、用例そ
れぞれと、第1言語文との、概念的(意味的な)な類似
性を表す類似度を、例えばシソーラスなどの外部知識を
用いて、類似度計算部54に計算させる。
【0014】即ち、シソーラス記憶部55には、単語
を、その概念に基づいて木構造に階層化したシソーラス
が記憶されている。なお、シソーラスにおいては、木構
造のノードの部分が意味概念に相当し、いわゆる葉の部
分が単語に相当する。類似度計算部54は、このシソー
ラスを参照し、第1言語文を構成する単語と、用例を構
成する単語との共通の概念が属する階層に基づいて、第
1言語文と用例との類似度を算出する。そして、検索部
52は、類似度計算部54が算出した類似度が最も高い
用例を、対訳用例記憶部53から検索し、その用例に対
応付けられている訳文を、変換部51に供給する。
を、その概念に基づいて木構造に階層化したシソーラス
が記憶されている。なお、シソーラスにおいては、木構
造のノードの部分が意味概念に相当し、いわゆる葉の部
分が単語に相当する。類似度計算部54は、このシソー
ラスを参照し、第1言語文を構成する単語と、用例を構
成する単語との共通の概念が属する階層に基づいて、第
1言語文と用例との類似度を算出する。そして、検索部
52は、類似度計算部54が算出した類似度が最も高い
用例を、対訳用例記憶部53から検索し、その用例に対
応付けられている訳文を、変換部51に供給する。
【0015】変換部51は、検索部52から訳文を受信
すると、その訳文を構成する単語のうち、第1言語文を
構成する単語と一致(対応)しないものを、その単語の
対訳に置き換え、これを、第2言語文として、出力部1
6に供給する。
すると、その訳文を構成する単語のうち、第1言語文を
構成する単語と一致(対応)しないものを、その単語の
対訳に置き換え、これを、第2言語文として、出力部1
6に供給する。
【0016】なお、このような用例主導型翻訳装置につ
いては、例えば特開平3−276367号公報などに、
その詳細が開示されている。また、第1言語文と用例と
の類似度の算出方法については、上述の特開平3−27
6367号公報の他、例えば特開平4−188276号
公報や、特開平6−274546号公報、特開平6−2
74548号公報などにも、その詳細が開示されてい
る。
いては、例えば特開平3−276367号公報などに、
その詳細が開示されている。また、第1言語文と用例と
の類似度の算出方法については、上述の特開平3−27
6367号公報の他、例えば特開平4−188276号
公報や、特開平6−274546号公報、特開平6−2
74548号公報などにも、その詳細が開示されてい
る。
【0017】
【発明が解決しようとする課題】ところで、以上のよう
な従来の翻訳装置には、以下のような課題があった。
な従来の翻訳装置には、以下のような課題があった。
【0018】即ち、規則主導型翻訳装置においては、第
1言語文の解析の過程で、翻訳に必要な情報が失われる
場合があり、これにより、挨拶その他の決まり文句を翻
訳した翻訳結果(第2言語文)が、逐語調になる課題が
あった。さらに、第1言語文が、例えばことわざその他
の慣用的な表現(慣用語)を含む場合には、それを正確
に翻訳するのは困難であった。また、規則主導型翻訳装
置で用いる第1言語および第2言語に関する知識、規則
を、データベースとして構築し、維持することは、容易
ではなかった。
1言語文の解析の過程で、翻訳に必要な情報が失われる
場合があり、これにより、挨拶その他の決まり文句を翻
訳した翻訳結果(第2言語文)が、逐語調になる課題が
あった。さらに、第1言語文が、例えばことわざその他
の慣用的な表現(慣用語)を含む場合には、それを正確
に翻訳するのは困難であった。また、規則主導型翻訳装
置で用いる第1言語および第2言語に関する知識、規則
を、データベースとして構築し、維持することは、容易
ではなかった。
【0019】一方、用例利用型翻訳装置によれば、第1
言語文が、それと一致する用例に対応付けられている訳
文に翻訳されるので、挨拶その他の決まり文句や、慣用
語などが、用例として記憶されていれば、自然な表現の
第2言語文を得ることができる。しかしながら、用例利
用型翻訳装置では、第1言語文と一致する用例が記憶さ
れていない場合には、結局、規則主導型翻訳装置と同様
の処理が行われるため、上述したような問題が生じるこ
ととなり、さらに、入力されることが予想される第1言
語文を構成する文字列と完全に一致する用例をすべて記
憶しておくことは困難であった。
言語文が、それと一致する用例に対応付けられている訳
文に翻訳されるので、挨拶その他の決まり文句や、慣用
語などが、用例として記憶されていれば、自然な表現の
第2言語文を得ることができる。しかしながら、用例利
用型翻訳装置では、第1言語文と一致する用例が記憶さ
れていない場合には、結局、規則主導型翻訳装置と同様
の処理が行われるため、上述したような問題が生じるこ
ととなり、さらに、入力されることが予想される第1言
語文を構成する文字列と完全に一致する用例をすべて記
憶しておくことは困難であった。
【0020】そこで、用例主導型翻訳装置によれば、い
かなる第1言語文であっても、用例を用いて翻訳が行わ
れるため、規則主導型翻訳装置における場合の問題が生
じることはなく、また、第1言語文と完全に一致する用
例をすべて記憶しておく必要もない。
かなる第1言語文であっても、用例を用いて翻訳が行わ
れるため、規則主導型翻訳装置における場合の問題が生
じることはなく、また、第1言語文と完全に一致する用
例をすべて記憶しておく必要もない。
【0021】しかしながら、用例主導型翻訳装置では、
第1言語文に一致する用例が存在しない場合には、それ
に最も類似する用例が検索され、その用例に対応付けら
れた訳文を構成する単語のうち、第1言語文を構成する
単語と一致しないものが、その単語の対訳に、単純に置
き換えられて、これが、翻訳結果、即ち、第2言語文と
される。従って、用例主導型翻訳装置には、言語学上の
知識、規則が一般化された形で反映されることがなく、
このため、その翻訳の質(翻訳の精度や、翻訳結果の自
然さ)は、対訳用例記憶部53に記憶させる用例の数
(種類)を増加することのみによって向上させることが
できる(これに対し、規則主導型翻訳装置による翻訳の
質は、言語に関する知識、規則の記述の仕方によっても
向上させることができる)。そして、対訳用例記憶部5
3に記憶させる用例の数を増加することは、第1言語文
に一致または類似する用例の検索処理に時間を要するこ
ととなる。
第1言語文に一致する用例が存在しない場合には、それ
に最も類似する用例が検索され、その用例に対応付けら
れた訳文を構成する単語のうち、第1言語文を構成する
単語と一致しないものが、その単語の対訳に、単純に置
き換えられて、これが、翻訳結果、即ち、第2言語文と
される。従って、用例主導型翻訳装置には、言語学上の
知識、規則が一般化された形で反映されることがなく、
このため、その翻訳の質(翻訳の精度や、翻訳結果の自
然さ)は、対訳用例記憶部53に記憶させる用例の数
(種類)を増加することのみによって向上させることが
できる(これに対し、規則主導型翻訳装置による翻訳の
質は、言語に関する知識、規則の記述の仕方によっても
向上させることができる)。そして、対訳用例記憶部5
3に記憶させる用例の数を増加することは、第1言語文
に一致または類似する用例の検索処理に時間を要するこ
ととなる。
【0022】また、用例主導型翻訳装置における第1言
語文Iと用例Eとの類似度D(I,E)の計算は、第1
言語文Iを構成する単語を、i1,i2,・・・,itと
表すとともに、用例Eを構成する単語を、e1,e2,・
・・,etと表すとき(但し、tは、第1言語文、用例
それぞれを構成する単語数を表す)、式(1)に示すよ
うに、第1言語文Iを構成する単語ikと、用例Eの中
の対応する単語ekとの意味的な(概念的な)距離word-
distance(ik,ek)を求め、それに対し、単語ekの重要性
に応じた重みweightkを付けたものの総和をとることに
より行われていた。
語文Iと用例Eとの類似度D(I,E)の計算は、第1
言語文Iを構成する単語を、i1,i2,・・・,itと
表すとともに、用例Eを構成する単語を、e1,e2,・
・・,etと表すとき(但し、tは、第1言語文、用例
それぞれを構成する単語数を表す)、式(1)に示すよ
うに、第1言語文Iを構成する単語ikと、用例Eの中
の対応する単語ekとの意味的な(概念的な)距離word-
distance(ik,ek)を求め、それに対し、単語ekの重要性
に応じた重みweightkを付けたものの総和をとることに
より行われていた。
【0023】
【数1】 ・・・(1)
【0024】そして、このような類似度の計算方法に
は、以下のような課題があった。
は、以下のような課題があった。
【0025】即ち、例えば、ある用例の意味内容の発話
がなされる場合においては、その用例のとおりに発話が
なされることもあるが、多くの場合、その用例における
主語となる単語などが省略されたり、また、余分な単語
が挿入されたりする。そして、上述の計算手法は、第1
言語文と用例とが、同一の単語数で構成されることを前
提とするため、両者の単語数が異なる場合には、第1言
語文に対する用例の類似性を正しく反映した類似度が得
られるかどうか不明であった。
がなされる場合においては、その用例のとおりに発話が
なされることもあるが、多くの場合、その用例における
主語となる単語などが省略されたり、また、余分な単語
が挿入されたりする。そして、上述の計算手法は、第1
言語文と用例とが、同一の単語数で構成されることを前
提とするため、両者の単語数が異なる場合には、第1言
語文に対する用例の類似性を正しく反映した類似度が得
られるかどうか不明であった。
【0026】さらに、仮に、第1言語文と用例とが同一
の単語数で構成されていたとしても、その語順が異なっ
ている場合には、やはり、第1言語文に対する用例の類
似性を正しく反映した類似度が得られるかどうか不明で
あった。即ち、例えば、日本語のように、単語が比較的
自由な順番で並べられる言語を第1言語とする場合に
は、第1言語文として、例えば「りんごを私は食べた
い」が入力されたときに、用例として、例えば「私はみ
かんを食べたい」が記憶されていたとしても、第1言語
文の「りんご」または「私」が、用例の「私」または
「みかん」にそれぞれ対応することとなり、両者が類似
していることを認識するのが困難であった。
の単語数で構成されていたとしても、その語順が異なっ
ている場合には、やはり、第1言語文に対する用例の類
似性を正しく反映した類似度が得られるかどうか不明で
あった。即ち、例えば、日本語のように、単語が比較的
自由な順番で並べられる言語を第1言語とする場合に
は、第1言語文として、例えば「りんごを私は食べた
い」が入力されたときに、用例として、例えば「私はみ
かんを食べたい」が記憶されていたとしても、第1言語
文の「りんご」または「私」が、用例の「私」または
「みかん」にそれぞれ対応することとなり、両者が類似
していることを認識するのが困難であった。
【0027】また、例えば、入力部1を音声認識装置で
構成した場合においては、話者がはっきり発話しなかっ
たり、音声認識装置で認識が正しく行われず、助詞など
が欠落したテキストデータが出力されることがある。即
ち、例えば、話者が意図した第1言語文が「私は、あな
たのみかんが食べたい」というものであったとしても、
入力部1の出力が「私、あなた、みかん、食べたい」と
なることがある。このような場合において、用例とし
て、例えば「私はみかんを食べたい」が記憶されていた
ときには、入力部1の出力の「あなた」および「みか
ん」を結合した複合名詞「あなたのみかん」を、用例の
「みかん」に対応させて類似度を計算する必要がある
が、式(1)による方法では困難であった。
構成した場合においては、話者がはっきり発話しなかっ
たり、音声認識装置で認識が正しく行われず、助詞など
が欠落したテキストデータが出力されることがある。即
ち、例えば、話者が意図した第1言語文が「私は、あな
たのみかんが食べたい」というものであったとしても、
入力部1の出力が「私、あなた、みかん、食べたい」と
なることがある。このような場合において、用例とし
て、例えば「私はみかんを食べたい」が記憶されていた
ときには、入力部1の出力の「あなた」および「みか
ん」を結合した複合名詞「あなたのみかん」を、用例の
「みかん」に対応させて類似度を計算する必要がある
が、式(1)による方法では困難であった。
【0028】そして、以上のように意味内容が用例と一
致するが、いわば表層(表面)上異なる入力に対応する
ためには、そのような表層上のバリエーションに対応し
た用例を、対訳用例記憶部53に追加する必要があり、
この場合、上述したように、検索処理に時間を要するこ
ととなる。
致するが、いわば表層(表面)上異なる入力に対応する
ためには、そのような表層上のバリエーションに対応し
た用例を、対訳用例記憶部53に追加する必要があり、
この場合、上述したように、検索処理に時間を要するこ
ととなる。
【0029】さらに、単語ikと単語ekとの距離word-d
istance(ik,ek)は、シソーラス記憶部55に記憶されて
いるシソーラスにおいて、単語ikと単語ekとの共通の
概念(単語ikおよびekを包含する概念であって、最も
下位の階層に属するもの)が属する階層に基づいて決定
されるようになされていた。即ち、シソーラスは、例え
ば、最も大きい概念が属する階層を第0階層とし、以
下、小さい概念を、第1乃至第3階層に順次分類し、さ
らに、第3階層に属する概念に、対応する単語を分類す
る(割り当てる)ことで構成され、このようなシソーラ
スを参照して、単語ikと単語ekとの共通の概念が、第
0乃至第3階層のうちのいずれに属しているかが検出さ
れる(以下、適宜、第C階層におけるCを、レベルとい
う)。そして、その概念が第0乃至第3階層に属してい
るとき、距離word-distance(ik,ek)は、0,1/3,2
/3、または1にそれぞれ決定されるようになされてい
た。
istance(ik,ek)は、シソーラス記憶部55に記憶されて
いるシソーラスにおいて、単語ikと単語ekとの共通の
概念(単語ikおよびekを包含する概念であって、最も
下位の階層に属するもの)が属する階層に基づいて決定
されるようになされていた。即ち、シソーラスは、例え
ば、最も大きい概念が属する階層を第0階層とし、以
下、小さい概念を、第1乃至第3階層に順次分類し、さ
らに、第3階層に属する概念に、対応する単語を分類す
る(割り当てる)ことで構成され、このようなシソーラ
スを参照して、単語ikと単語ekとの共通の概念が、第
0乃至第3階層のうちのいずれに属しているかが検出さ
れる(以下、適宜、第C階層におけるCを、レベルとい
う)。そして、その概念が第0乃至第3階層に属してい
るとき、距離word-distance(ik,ek)は、0,1/3,2
/3、または1にそれぞれ決定されるようになされてい
た。
【0030】この場合、シソーラスは、各単語から上位
の階層を見たときに、同一の数の階層(上述の場合は、
第0乃至第3の4階層)が存在するように構成する必要
があり、従って、全体として、いわば規則的な構造をし
ている必要があった。
の階層を見たときに、同一の数の階層(上述の場合は、
第0乃至第3の4階層)が存在するように構成する必要
があり、従って、全体として、いわば規則的な構造をし
ている必要があった。
【0031】さらに、2つの単語の間の距離word-dista
nce(ik,ek)は、その2つの単語の共通の概念が属する階
層のレベルにより決定されるため(概念が属する階層
が、第0乃至第3の階層のうちのいずれであるかにより
決定されるため)、ある階層に属する概念を共通の概念
とする2つの単語どうしの距離と、その階層と同一階層
に属する、異なる概念を共通の概念とする2つの単語ど
うしの距離とが一致するように、シソーラスを構成する
必要があった。
nce(ik,ek)は、その2つの単語の共通の概念が属する階
層のレベルにより決定されるため(概念が属する階層
が、第0乃至第3の階層のうちのいずれであるかにより
決定されるため)、ある階層に属する概念を共通の概念
とする2つの単語どうしの距離と、その階層と同一階層
に属する、異なる概念を共通の概念とする2つの単語ど
うしの距離とが一致するように、シソーラスを構成する
必要があった。
【0032】即ち、図16は、単語の概念が第0乃至第
2の3つの階層に分類された従来のシソーラスの一例を
示している。なお、同図においては、四角形が概念を、
丸印が単語を表している。
2の3つの階層に分類された従来のシソーラスの一例を
示している。なお、同図においては、四角形が概念を、
丸印が単語を表している。
【0033】このようなシソーラスにおいては、例え
ば、単語WaとWbとの共通の概念C1は、単語Wcと
Wdとの共通の概念C2とは異なるが、この概念C1お
よびC2は、いずれも第1階層に属するから、従来の距
離word-distance(ik,ek)の計算方法によれば、単語Wa
とWbとの距離、および単語WcとWdとの距離は同一
とされる。このことは、線で結ばれている概念どうしの
意味的な距離が、任意の概念間で同一であることを意味
し、従って、そのようになるように、シソーラスを構成
する必要があった。
ば、単語WaとWbとの共通の概念C1は、単語Wcと
Wdとの共通の概念C2とは異なるが、この概念C1お
よびC2は、いずれも第1階層に属するから、従来の距
離word-distance(ik,ek)の計算方法によれば、単語Wa
とWbとの距離、および単語WcとWdとの距離は同一
とされる。このことは、線で結ばれている概念どうしの
意味的な距離が、任意の概念間で同一であることを意味
し、従って、そのようになるように、シソーラスを構成
する必要があった。
【0034】しかしながら、シソーラスを、上述したよ
うに、規則的に、かつ概念間の距離が同一となるように
構成することは、小規模のものはともかく、ある程度の
規模のものについては、困難である。即ち、シソーラス
を規則的に構成しようとすれば、概念間の距離を一定に
することは困難であり、また、シソーラスを、概念間の
距離が一定になるように構成しようとすれば、その規則
性を維持するのが困難となる。
うに、規則的に、かつ概念間の距離が同一となるように
構成することは、小規模のものはともかく、ある程度の
規模のものについては、困難である。即ち、シソーラス
を規則的に構成しようとすれば、概念間の距離を一定に
することは困難であり、また、シソーラスを、概念間の
距離が一定になるように構成しようとすれば、その規則
性を維持するのが困難となる。
【0035】従って、規則的でないシソーラスや、概念
間の距離が一定でないシソーラスを用いても、質の高い
翻訳が可能となることが要望されている。
間の距離が一定でないシソーラスを用いても、質の高い
翻訳が可能となることが要望されている。
【0036】本発明は、このような状況に鑑みてなされ
たものであり、容易に、質の高い翻訳を行うことができ
るようにするものである。
たものであり、容易に、質の高い翻訳を行うことができ
るようにするものである。
【0037】
【課題を解決するための手段】請求項1に記載の翻訳装
置は、第1言語文を、所定の構文上の単位である構文単
位に分割する分割手段と、分割手段より出力される第1
言語文の構文単位に類似する用例を検出する検出手段
と、検出手段により検出された用例と対応付けられてい
る訳文に基づいて、第1言語文を、構文単位で翻訳する
翻訳手段と、翻訳手段による構文単位の翻訳結果を合成
し、第2言語文を生成する生成手段とを備えることを特
徴とする。
置は、第1言語文を、所定の構文上の単位である構文単
位に分割する分割手段と、分割手段より出力される第1
言語文の構文単位に類似する用例を検出する検出手段
と、検出手段により検出された用例と対応付けられてい
る訳文に基づいて、第1言語文を、構文単位で翻訳する
翻訳手段と、翻訳手段による構文単位の翻訳結果を合成
し、第2言語文を生成する生成手段とを備えることを特
徴とする。
【0038】請求項25に記載の翻訳方法は、第1言語
文を、所定の構文上の単位である構文単位に分割するス
テップと、第1言語文の構文単位に類似する用例を検出
するステップと、その検出された用例と対応付けられて
いる訳文に基づいて、第1言語文を、構文単位で翻訳す
るステップと、その構文単位の翻訳結果を合成し、第2
言語文を生成するステップとを備えることを特徴とす
る。
文を、所定の構文上の単位である構文単位に分割するス
テップと、第1言語文の構文単位に類似する用例を検出
するステップと、その検出された用例と対応付けられて
いる訳文に基づいて、第1言語文を、構文単位で翻訳す
るステップと、その構文単位の翻訳結果を合成し、第2
言語文を生成するステップとを備えることを特徴とす
る。
【0039】請求項26に記載の翻訳方法は、第1言語
文を、所定の構文上の単位である構文単位あって、大き
な構文単位から小さな構文単位に、段階的に分割しなが
ら、各段階において得られた構文単位と、用例とを照合
するステップと、その照合結果に基づいて、構文単位に
対応する用例を検出するステップと、その検出された用
例と対応付けられている訳文に基づいて、第1言語文
を、構文単位で翻訳するステップと、その構文単位の翻
訳結果を合成し、第2言語文を生成するステップとを備
えることを特徴とする。
文を、所定の構文上の単位である構文単位あって、大き
な構文単位から小さな構文単位に、段階的に分割しなが
ら、各段階において得られた構文単位と、用例とを照合
するステップと、その照合結果に基づいて、構文単位に
対応する用例を検出するステップと、その検出された用
例と対応付けられている訳文に基づいて、第1言語文
を、構文単位で翻訳するステップと、その構文単位の翻
訳結果を合成し、第2言語文を生成するステップとを備
えることを特徴とする。
【0040】請求項27に記載の翻訳装置は、単語をそ
の概念に基づいて木構造に階層化したシソーラスにおい
て、第1言語文を構成する単語と、用例を構成する単語
との共通の概念に包含される単語の数に基づいて、第1
言語文を構成する単語と、用例を構成する単語との類似
性を表す単語類似度を算出する算出手段を備えることを
特徴とする。
の概念に基づいて木構造に階層化したシソーラスにおい
て、第1言語文を構成する単語と、用例を構成する単語
との共通の概念に包含される単語の数に基づいて、第1
言語文を構成する単語と、用例を構成する単語との類似
性を表す単語類似度を算出する算出手段を備えることを
特徴とする。
【0041】請求項28に記載の翻訳方法は、単語をそ
の概念に基づいて木構造に階層化したシソーラスにおい
て、第1言語文を構成する単語と、用例を構成する単語
との共通の概念に包含される単語の数に基づいて、第1
言語文を構成する単語と、用例を構成する単語との類似
性を表す単語類似度を算出するステップを備えることを
特徴とする。
の概念に基づいて木構造に階層化したシソーラスにおい
て、第1言語文を構成する単語と、用例を構成する単語
との共通の概念に包含される単語の数に基づいて、第1
言語文を構成する単語と、用例を構成する単語との類似
性を表す単語類似度を算出するステップを備えることを
特徴とする。
【0042】請求項29に記載の翻訳装置は、用例が第
1言語文を翻訳するために用いられる事前確率と、用例
が第1言語文に変形されて用いられる変形確率とに基づ
いて、第1言語文に類似する用例を検出する検出手段
と、検出手段により検出された用例と対応付けられてい
る訳文に基づいて、第1言語文を翻訳する翻訳手段とを
備えることを特徴とする。
1言語文を翻訳するために用いられる事前確率と、用例
が第1言語文に変形されて用いられる変形確率とに基づ
いて、第1言語文に類似する用例を検出する検出手段
と、検出手段により検出された用例と対応付けられてい
る訳文に基づいて、第1言語文を翻訳する翻訳手段とを
備えることを特徴とする。
【0043】請求項40に記載の翻訳方法は、用例が第
1言語文を翻訳するために用いられる事前確率と、用例
が第1言語文に変形されて用いられる変形確率とに基づ
いて、第1言語文に類似する用例を検出するステップ
と、その検出された用例と対応付けられている訳文に基
づいて、第1言語文を翻訳するステップとを備えること
を特徴とする。
1言語文を翻訳するために用いられる事前確率と、用例
が第1言語文に変形されて用いられる変形確率とに基づ
いて、第1言語文に類似する用例を検出するステップ
と、その検出された用例と対応付けられている訳文に基
づいて、第1言語文を翻訳するステップとを備えること
を特徴とする。
【0044】請求項41に記載の翻訳装置は、第1言語
文を構文解析することにより、その文法属性を抽出する
抽出手段と、第1言語文に類似する用例を、その第1言
語文および用例が有する文法属性を考慮して検出する検
出手段と、検出手段により検出された用例と対応付けら
れている訳文に基づいて、第1言語文を翻訳する翻訳手
段とを備えることを特徴とする。
文を構文解析することにより、その文法属性を抽出する
抽出手段と、第1言語文に類似する用例を、その第1言
語文および用例が有する文法属性を考慮して検出する検
出手段と、検出手段により検出された用例と対応付けら
れている訳文に基づいて、第1言語文を翻訳する翻訳手
段とを備えることを特徴とする。
【0045】請求項42に記載の翻訳方法は、第1言語
文を構文解析することにより、その文法属性を抽出する
ステップと、第1言語文に類似する用例を、その第1言
語文および用例が有する文法属性を考慮して検出するス
テップと、その検出された用例と対応付けられている訳
文に基づいて、第1言語文を翻訳するステップとを備え
ることを特徴とする。
文を構文解析することにより、その文法属性を抽出する
ステップと、第1言語文に類似する用例を、その第1言
語文および用例が有する文法属性を考慮して検出するス
テップと、その検出された用例と対応付けられている訳
文に基づいて、第1言語文を翻訳するステップとを備え
ることを特徴とする。
【0046】請求項1に記載の翻訳装置においては、分
割手段は、第1言語文を、所定の構文上の単位である構
文単位に分割し、検出手段は、分割手段より出力される
第1言語文の構文単位に類似する用例を検出するように
なされている。翻訳手段は、検出手段により検出された
用例と対応付けられている訳文に基づいて、第1言語文
を、構文単位で翻訳し、生成手段は、翻訳手段による構
文単位の翻訳結果を合成し、第2言語文を生成するよう
になされている。
割手段は、第1言語文を、所定の構文上の単位である構
文単位に分割し、検出手段は、分割手段より出力される
第1言語文の構文単位に類似する用例を検出するように
なされている。翻訳手段は、検出手段により検出された
用例と対応付けられている訳文に基づいて、第1言語文
を、構文単位で翻訳し、生成手段は、翻訳手段による構
文単位の翻訳結果を合成し、第2言語文を生成するよう
になされている。
【0047】請求項25に記載の翻訳方法においては、
第1言語文を、所定の構文上の単位である構文単位に分
割し、第1言語文の構文単位に類似する用例を検出する
ようになされている。そして、その検出された用例と対
応付けられている訳文に基づいて、第1言語文を、構文
単位で翻訳し、その構文単位の翻訳結果を合成し、第2
言語文を生成するようになされている。
第1言語文を、所定の構文上の単位である構文単位に分
割し、第1言語文の構文単位に類似する用例を検出する
ようになされている。そして、その検出された用例と対
応付けられている訳文に基づいて、第1言語文を、構文
単位で翻訳し、その構文単位の翻訳結果を合成し、第2
言語文を生成するようになされている。
【0048】請求項26に記載の翻訳方法においては、
第1言語文を、所定の構文上の単位である構文単位あっ
て、大きな構文単位から小さな構文単位に、段階的に分
割しながら、各段階において得られた構文単位と、用例
とを照合し、その照合結果に基づいて、構文単位に対応
する用例を検出するようになされている。そして、その
検出された用例と対応付けられている訳文に基づいて、
第1言語文を、構文単位で翻訳し、その構文単位の翻訳
結果を合成し、第2言語文を生成するようになされてい
る。
第1言語文を、所定の構文上の単位である構文単位あっ
て、大きな構文単位から小さな構文単位に、段階的に分
割しながら、各段階において得られた構文単位と、用例
とを照合し、その照合結果に基づいて、構文単位に対応
する用例を検出するようになされている。そして、その
検出された用例と対応付けられている訳文に基づいて、
第1言語文を、構文単位で翻訳し、その構文単位の翻訳
結果を合成し、第2言語文を生成するようになされてい
る。
【0049】請求項27に記載の翻訳装置においては、
算出手段が、単語をその概念に基づいて木構造に階層化
したシソーラスにおいて、第1言語文を構成する単語
と、用例を構成する単語との共通の概念に包含される単
語の数に基づいて、第1言語文を構成する単語と、用例
を構成する単語との類似性を表す単語類似度を算出する
ようになされている。
算出手段が、単語をその概念に基づいて木構造に階層化
したシソーラスにおいて、第1言語文を構成する単語
と、用例を構成する単語との共通の概念に包含される単
語の数に基づいて、第1言語文を構成する単語と、用例
を構成する単語との類似性を表す単語類似度を算出する
ようになされている。
【0050】請求項28に記載の翻訳方法においては、
単語をその概念に基づいて木構造に階層化したシソーラ
スにおいて、第1言語文を構成する単語と、用例を構成
する単語との共通の概念に包含される単語の数に基づい
て、第1言語文を構成する単語と、用例を構成する単語
との類似性を表す単語類似度を算出するようになされて
いる。
単語をその概念に基づいて木構造に階層化したシソーラ
スにおいて、第1言語文を構成する単語と、用例を構成
する単語との共通の概念に包含される単語の数に基づい
て、第1言語文を構成する単語と、用例を構成する単語
との類似性を表す単語類似度を算出するようになされて
いる。
【0051】請求項29に記載の翻訳装置においては、
検出手段は、用例が第1言語文を翻訳するために用いら
れる事前確率と、用例が第1言語文に変形されて用いら
れる変形確率とに基づいて、第1言語文に類似する用例
を検出し、翻訳手段は、検出手段により検出された用例
と対応付けられている訳文に基づいて、第1言語文を翻
訳するようになされている。
検出手段は、用例が第1言語文を翻訳するために用いら
れる事前確率と、用例が第1言語文に変形されて用いら
れる変形確率とに基づいて、第1言語文に類似する用例
を検出し、翻訳手段は、検出手段により検出された用例
と対応付けられている訳文に基づいて、第1言語文を翻
訳するようになされている。
【0052】請求項40に記載の翻訳方法においては、
用例が第1言語文を翻訳するために用いられる事前確率
と、用例が第1言語文に変形されて用いられる変形確率
とに基づいて、第1言語文に類似する用例を検出し、そ
の検出された用例と対応付けられている訳文に基づい
て、第1言語文を翻訳するようになされている。
用例が第1言語文を翻訳するために用いられる事前確率
と、用例が第1言語文に変形されて用いられる変形確率
とに基づいて、第1言語文に類似する用例を検出し、そ
の検出された用例と対応付けられている訳文に基づい
て、第1言語文を翻訳するようになされている。
【0053】請求項41に記載の翻訳装置においては、
抽出手段は、第1言語文を構文解析することにより、そ
の文法属性を抽出し、検出手段は、第1言語文に類似す
る用例を、その第1言語文および用例が有する文法属性
を考慮して検出するようになされている。翻訳手段は、
検出手段により検出された用例と対応付けられている訳
文に基づいて、第1言語文を翻訳するようになされてい
る。
抽出手段は、第1言語文を構文解析することにより、そ
の文法属性を抽出し、検出手段は、第1言語文に類似す
る用例を、その第1言語文および用例が有する文法属性
を考慮して検出するようになされている。翻訳手段は、
検出手段により検出された用例と対応付けられている訳
文に基づいて、第1言語文を翻訳するようになされてい
る。
【0054】請求項42に記載の翻訳方法においては、
第1言語文を構文解析することにより、その文法属性を
抽出し、第1言語文に類似する用例を、その第1言語文
および用例が有する文法属性を考慮して検出するように
なされている。そして、その検出された用例と対応付け
られている訳文に基づいて、第1言語文を翻訳するよう
になされている。
第1言語文を構文解析することにより、その文法属性を
抽出し、第1言語文に類似する用例を、その第1言語文
および用例が有する文法属性を考慮して検出するように
なされている。そして、その検出された用例と対応付け
られている訳文に基づいて、第1言語文を翻訳するよう
になされている。
【0055】
【発明の実施の形態】以下に、本発明の実施の形態を説
明するが、その前に、特許請求の範囲に記載の発明の各
手段と以下の実施の形態との対応関係を明らかにするた
めに、各手段の後の括弧内に、対応する実施の形態(但
し、一例)を付加して、本発明の特徴を記述すると、次
のようになる。
明するが、その前に、特許請求の範囲に記載の発明の各
手段と以下の実施の形態との対応関係を明らかにするた
めに、各手段の後の括弧内に、対応する実施の形態(但
し、一例)を付加して、本発明の特徴を記述すると、次
のようになる。
【0056】即ち、請求項1に記載の翻訳装置は、第1
の言語で表現された第1言語文を、第2の言語で表現さ
れた第2言語文に翻訳する翻訳装置であって、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す決まり文句対訳用例記憶部3、節分割パ
ターン対訳用例記憶部5、名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)と、第1言語文を、所定の構文上の単位である
構文単位に分割する分割手段(例えば、図1に示す節分
割処理部4および単純構文解析処理部6など)と、分割
手段より出力される第1言語文の構文単位に類似する用
例を検出する検出手段(例えば、図1に示す変換部7な
ど)と、検出手段により検出された用例と対応付けられ
ている訳文に基づいて、第1言語文を、構文単位で翻訳
する翻訳手段(例えば、図1に示す変換部7など)と、
翻訳手段による構文単位の翻訳結果を合成し、第2言語
文を生成する生成手段(例えば、図1に示す句合成処理
部14および節合成処理部15など)とを備えることを
特徴とする。
の言語で表現された第1言語文を、第2の言語で表現さ
れた第2言語文に翻訳する翻訳装置であって、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す決まり文句対訳用例記憶部3、節分割パ
ターン対訳用例記憶部5、名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)と、第1言語文を、所定の構文上の単位である
構文単位に分割する分割手段(例えば、図1に示す節分
割処理部4および単純構文解析処理部6など)と、分割
手段より出力される第1言語文の構文単位に類似する用
例を検出する検出手段(例えば、図1に示す変換部7な
ど)と、検出手段により検出された用例と対応付けられ
ている訳文に基づいて、第1言語文を、構文単位で翻訳
する翻訳手段(例えば、図1に示す変換部7など)と、
翻訳手段による構文単位の翻訳結果を合成し、第2言語
文を生成する生成手段(例えば、図1に示す句合成処理
部14および節合成処理部15など)とを備えることを
特徴とする。
【0057】請求項4に記載の翻訳装置は、分割手段
が、第1言語文を、節単位に分割する節分割手段(例え
ば、図1に示す節分割処理部4など)と、節分割手段よ
り出力される第1言語文の節単位を、句単位に分割する
句分割手段(例えば、図1に示す単純構文解析処理部6
など)とを有することを特徴とする。
が、第1言語文を、節単位に分割する節分割手段(例え
ば、図1に示す節分割処理部4など)と、節分割手段よ
り出力される第1言語文の節単位を、句単位に分割する
句分割手段(例えば、図1に示す単純構文解析処理部6
など)とを有することを特徴とする。
【0058】請求項5に記載の翻訳装置は、用例記憶手
段が、節単位の用例を記憶している節単位用例記憶手段
(例えば、図1に示す節分割パターン対訳用例記憶部5
など)と、句単位の用例を記憶している句単位用例記憶
手段(例えば、図1に示す名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)とを有することを特徴とする。
段が、節単位の用例を記憶している節単位用例記憶手段
(例えば、図1に示す節分割パターン対訳用例記憶部5
など)と、句単位の用例を記憶している句単位用例記憶
手段(例えば、図1に示す名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)とを有することを特徴とする。
【0059】請求項14に記載の翻訳装置は、単語を、
その概念に基づいて木構造に階層化したシソーラスを記
憶しているシソーラス記憶手段(例えば、図1に示すシ
ソーラス記憶部12など)と、構文単位を構成する単語
と、用例を構成する単語との類似性を表す単語類似度
を、シソーラスに基づいて算出し、単語置換確率として
出力する単語類似度算出手段(例えば、図1に示す類似
度計算部11など)とをさらに備えることを特徴とす
る。
その概念に基づいて木構造に階層化したシソーラスを記
憶しているシソーラス記憶手段(例えば、図1に示すシ
ソーラス記憶部12など)と、構文単位を構成する単語
と、用例を構成する単語との類似性を表す単語類似度
を、シソーラスに基づいて算出し、単語置換確率として
出力する単語類似度算出手段(例えば、図1に示す類似
度計算部11など)とをさらに備えることを特徴とす
る。
【0060】請求項20に記載の翻訳装置は、最適な変
形経路を求めるのに際し、用例を構成する単語を真に省
略することに対応する真省略経路に代えて、用例を構成
する単語を仮に省略する仮省略経路を用いるとともに、
構文単位を構成する単語を真に付加することに対応する
真付加経路に代えて、構文単位を構成する単語を仮に付
加することに対応する仮付加経路を用い、仮省略経路ま
たは仮付加経路にしたがって仮に省略または付加される
単語である仮省略単語または仮付加単語それぞれを記憶
する単語記憶手段(例えば、図11に示すキャッシュ7
Aなど)をさらに備えることを特徴とする。
形経路を求めるのに際し、用例を構成する単語を真に省
略することに対応する真省略経路に代えて、用例を構成
する単語を仮に省略する仮省略経路を用いるとともに、
構文単位を構成する単語を真に付加することに対応する
真付加経路に代えて、構文単位を構成する単語を仮に付
加することに対応する仮付加経路を用い、仮省略経路ま
たは仮付加経路にしたがって仮に省略または付加される
単語である仮省略単語または仮付加単語それぞれを記憶
する単語記憶手段(例えば、図11に示すキャッシュ7
Aなど)をさらに備えることを特徴とする。
【0061】請求項25に記載の翻訳方法は、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す決まり文句対訳用例記憶部3、節分割パ
ターン対訳用例記憶部5、名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)を用いて、第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
方法であって、第1言語文を、所定の構文上の単位であ
る構文単位に分割するステップと、第1言語文の構文単
位に類似する用例を検出するステップと、その検出され
た用例と対応付けられている訳文に基づいて、第1言語
文を、構文単位で翻訳するステップと、その構文単位の
翻訳結果を合成し、第2言語文を生成するステップとを
備えることを特徴とする。
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す決まり文句対訳用例記憶部3、節分割パ
ターン対訳用例記憶部5、名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)を用いて、第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
方法であって、第1言語文を、所定の構文上の単位であ
る構文単位に分割するステップと、第1言語文の構文単
位に類似する用例を検出するステップと、その検出され
た用例と対応付けられている訳文に基づいて、第1言語
文を、構文単位で翻訳するステップと、その構文単位の
翻訳結果を合成し、第2言語文を生成するステップとを
備えることを特徴とする。
【0062】請求項26に記載の翻訳方法は、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す決まり文句対訳用例記憶部3、節分割パ
ターン対訳用例記憶部5、名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)を用いて、第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
方法であって、第1言語文を、所定の構文上の単位であ
る構文単位あって、大きな構文単位から小さな構文単位
に、段階的に分割しながら、各段階において得られた構
文単位と、用例とを照合するステップと、その照合結果
に基づいて、構文単位に対応する用例を検出するステッ
プと、その検出された用例と対応付けられている訳文に
基づいて、第1言語文を、構文単位で翻訳するステップ
と、その構文単位の翻訳結果を合成し、第2言語文を生
成するステップとを備えることを特徴とする。
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す決まり文句対訳用例記憶部3、節分割パ
ターン対訳用例記憶部5、名詞句対訳用例記憶部8、動
詞句対訳用例記憶部9、およびその他対訳用例記憶部1
0など)を用いて、第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
方法であって、第1言語文を、所定の構文上の単位であ
る構文単位あって、大きな構文単位から小さな構文単位
に、段階的に分割しながら、各段階において得られた構
文単位と、用例とを照合するステップと、その照合結果
に基づいて、構文単位に対応する用例を検出するステッ
プと、その検出された用例と対応付けられている訳文に
基づいて、第1言語文を、構文単位で翻訳するステップ
と、その構文単位の翻訳結果を合成し、第2言語文を生
成するステップとを備えることを特徴とする。
【0063】請求項27に記載の翻訳装置は、第1の言
語で表現された第1言語文を、第2の言語で表現された
第2言語文に翻訳する翻訳装置であって、第1の言語で
表現された用例と、その用例を第2の言語に翻訳した訳
文とを対応付けて記憶している用例記憶手段(例えば、
図1に示す名詞句対訳用例記憶部8、動詞句対訳用例記
憶部9、およびその他対訳用例記憶部10など)と、単
語を、その概念に基づいて木構造に階層化したシソーラ
スを記憶しているシソーラス記憶手段(例えば、図1に
示すシソーラス記憶部12など)と、第1言語文を構成
する単語と、用例を構成する単語との類似性を表す単語
類似度を、シソーラスに基づいて算出する算出手段(例
えば、図1に示す類似度計算部11など)と、算出手段
により算出された単語類似度に基づいて、第1言語文に
類似する用例を検出する検出手段(例えば、図1に示す
変換部7など)と、検出手段により検出された用例と対
応付けられている訳文に基づいて、第1言語文を翻訳す
る翻訳手段(例えば、図1に示す変換部7など)とを備
え、算出手段が、シソーラスにおいて、第1言語文を構
成する単語と、用例を構成する単語との共通の概念に包
含される単語の数に基づいて、単語類似度を算出するこ
とを特徴とする。
語で表現された第1言語文を、第2の言語で表現された
第2言語文に翻訳する翻訳装置であって、第1の言語で
表現された用例と、その用例を第2の言語に翻訳した訳
文とを対応付けて記憶している用例記憶手段(例えば、
図1に示す名詞句対訳用例記憶部8、動詞句対訳用例記
憶部9、およびその他対訳用例記憶部10など)と、単
語を、その概念に基づいて木構造に階層化したシソーラ
スを記憶しているシソーラス記憶手段(例えば、図1に
示すシソーラス記憶部12など)と、第1言語文を構成
する単語と、用例を構成する単語との類似性を表す単語
類似度を、シソーラスに基づいて算出する算出手段(例
えば、図1に示す類似度計算部11など)と、算出手段
により算出された単語類似度に基づいて、第1言語文に
類似する用例を検出する検出手段(例えば、図1に示す
変換部7など)と、検出手段により検出された用例と対
応付けられている訳文に基づいて、第1言語文を翻訳す
る翻訳手段(例えば、図1に示す変換部7など)とを備
え、算出手段が、シソーラスにおいて、第1言語文を構
成する単語と、用例を構成する単語との共通の概念に包
含される単語の数に基づいて、単語類似度を算出するこ
とを特徴とする。
【0064】請求項28に記載の翻訳方法は、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、およびその他対訳用例記憶部10など)を
用いて、第1の言語で表現された第1言語文を、第2の
言語で表現された第2言語文に翻訳する翻訳方法であっ
て、単語を、その概念に基づいて木構造に階層化したシ
ソーラスに基づいて、第1言語文を構成する単語と、用
例を構成する単語との類似性を表す単語類似度を算出す
るステップと、その単語類似度に基づいて、第1言語文
に類似する用例を検出するステップと、その検出された
用例と対応付けられている訳文に基づいて、第1言語文
を翻訳するステップとを備え、単語類似度が、シソーラ
スにおいて、第1言語文を構成する単語と、用例を構成
する単語との共通の概念に包含される単語の数に基づい
て算出されることを特徴とする。
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、およびその他対訳用例記憶部10など)を
用いて、第1の言語で表現された第1言語文を、第2の
言語で表現された第2言語文に翻訳する翻訳方法であっ
て、単語を、その概念に基づいて木構造に階層化したシ
ソーラスに基づいて、第1言語文を構成する単語と、用
例を構成する単語との類似性を表す単語類似度を算出す
るステップと、その単語類似度に基づいて、第1言語文
に類似する用例を検出するステップと、その検出された
用例と対応付けられている訳文に基づいて、第1言語文
を翻訳するステップとを備え、単語類似度が、シソーラ
スにおいて、第1言語文を構成する単語と、用例を構成
する単語との共通の概念に包含される単語の数に基づい
て算出されることを特徴とする。
【0065】請求項29に記載の翻訳装置は、第1の言
語で表現された第1言語文を、第2の言語で表現された
第2言語文に翻訳する翻訳装置であって、第1の言語で
表現された用例と、その用例を第2の言語に翻訳した訳
文とを対応付けて記憶している用例記憶手段(例えば、
図1に示す名詞句対訳用例記憶部8、動詞句対訳用例記
憶部9、およびその他対訳用例記憶部10など)と、用
例が第1言語文を翻訳するために用いられる事前確率
と、用例が第1言語文に変形されて用いられる変形確率
とに基づいて、第1言語文に類似する用例を検出する検
出手段(例えば、図1に示す変換部7など)と、検出手
段により検出された用例と対応付けられている訳文に基
づいて、第1言語文を翻訳する翻訳手段(例えば、図1
に示す変換部7など)とを備えることを特徴とする。
語で表現された第1言語文を、第2の言語で表現された
第2言語文に翻訳する翻訳装置であって、第1の言語で
表現された用例と、その用例を第2の言語に翻訳した訳
文とを対応付けて記憶している用例記憶手段(例えば、
図1に示す名詞句対訳用例記憶部8、動詞句対訳用例記
憶部9、およびその他対訳用例記憶部10など)と、用
例が第1言語文を翻訳するために用いられる事前確率
と、用例が第1言語文に変形されて用いられる変形確率
とに基づいて、第1言語文に類似する用例を検出する検
出手段(例えば、図1に示す変換部7など)と、検出手
段により検出された用例と対応付けられている訳文に基
づいて、第1言語文を翻訳する翻訳手段(例えば、図1
に示す変換部7など)とを備えることを特徴とする。
【0066】請求項37に記載の翻訳装置は、最適な変
形経路を求めるのに際し、用例を構成する単語を真に省
略することに対応する真省略経路に代えて、用例を構成
する単語を仮に省略する仮省略経路を用いるとともに、
構文単位を構成する単語を真に付加することに対応する
真付加経路に代えて、構文単位を構成する単語を仮に付
加することに対応する仮付加経路を用い、仮省略経路ま
たは仮付加経路にしたがって仮に省略または付加される
単語である仮省略単語または仮付加単語それぞれを記憶
する単語記憶手段(例えば、図11に示すキャッシュ7
Aなど)をさらに備えることを特徴とする。
形経路を求めるのに際し、用例を構成する単語を真に省
略することに対応する真省略経路に代えて、用例を構成
する単語を仮に省略する仮省略経路を用いるとともに、
構文単位を構成する単語を真に付加することに対応する
真付加経路に代えて、構文単位を構成する単語を仮に付
加することに対応する仮付加経路を用い、仮省略経路ま
たは仮付加経路にしたがって仮に省略または付加される
単語である仮省略単語または仮付加単語それぞれを記憶
する単語記憶手段(例えば、図11に示すキャッシュ7
Aなど)をさらに備えることを特徴とする。
【0067】請求項40に記載の翻訳方法は、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、およびその他対訳用例記憶部10など)を
用いて、第1の言語で表現された第1言語文を、第2の
言語で表現された第2言語文に翻訳する翻訳方法であっ
て、用例が第1言語文を翻訳するために用いられる事前
確率と、用例が第1言語文に変形されて用いられる変形
確率とに基づいて、第1言語文に類似する用例を検出す
るステップと、その検出された用例と対応付けられてい
る訳文に基づいて、第1言語文を翻訳するステップとを
備えることを特徴とする。
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段(例え
ば、図1に示す名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、およびその他対訳用例記憶部10など)を
用いて、第1の言語で表現された第1言語文を、第2の
言語で表現された第2言語文に翻訳する翻訳方法であっ
て、用例が第1言語文を翻訳するために用いられる事前
確率と、用例が第1言語文に変形されて用いられる変形
確率とに基づいて、第1言語文に類似する用例を検出す
るステップと、その検出された用例と対応付けられてい
る訳文に基づいて、第1言語文を翻訳するステップとを
備えることを特徴とする。
【0068】請求項41に記載の翻訳装置は、第1の言
語で表現された第1言語文を、第2の言語で表現された
第2言語文に翻訳する翻訳装置であって、第1の言語で
表現された用例と、その用例を第2の言語に翻訳した訳
文とを対応付け、用例が有する文法属性とともに記憶し
ている用例記憶手段(例えば、図1に示す名詞句対訳用
例記憶部8、動詞句対訳用例記憶部9、およびその他対
訳用例記憶部10など)と、第1言語文を構文解析する
ことにより、その文法属性を抽出する抽出手段(例え
ば、図1に示す単純構文解析処理部6など)と、第1言
語文に類似する用例を、その第1言語文および用例が有
する文法属性を考慮して検出する検出手段(例えば、図
1に示す変換部7など)と、検出手段により検出された
用例と対応付けられている訳文に基づいて、第1言語文
を翻訳する翻訳手段(例えば、図1に示す変換部7な
ど)とを備えることを特徴とする。
語で表現された第1言語文を、第2の言語で表現された
第2言語文に翻訳する翻訳装置であって、第1の言語で
表現された用例と、その用例を第2の言語に翻訳した訳
文とを対応付け、用例が有する文法属性とともに記憶し
ている用例記憶手段(例えば、図1に示す名詞句対訳用
例記憶部8、動詞句対訳用例記憶部9、およびその他対
訳用例記憶部10など)と、第1言語文を構文解析する
ことにより、その文法属性を抽出する抽出手段(例え
ば、図1に示す単純構文解析処理部6など)と、第1言
語文に類似する用例を、その第1言語文および用例が有
する文法属性を考慮して検出する検出手段(例えば、図
1に示す変換部7など)と、検出手段により検出された
用例と対応付けられている訳文に基づいて、第1言語文
を翻訳する翻訳手段(例えば、図1に示す変換部7な
ど)とを備えることを特徴とする。
【0069】請求項42に記載の翻訳方法は、第1の言
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付け、用例が有する文法属性とともに記
憶している用例記憶手段(例えば、図1に示す名詞句対
訳用例記憶部8、動詞句対訳用例記憶部9、およびその
他対訳用例記憶部10など)を用いて、第1の言語で表
現された第1言語文を、第2の言語で表現された第2言
語文に翻訳する翻訳方法であって、第1言語文を構文解
析することにより、その文法属性を抽出するステップ
と、第1言語文に類似する用例を、その第1言語文およ
び用例が有する文法属性を考慮して検出するステップ
と、その検出された用例と対応付けられている訳文に基
づいて、第1言語文を翻訳するステップとを備えること
を特徴とする。
語で表現された用例と、その用例を第2の言語に翻訳し
た訳文とを対応付け、用例が有する文法属性とともに記
憶している用例記憶手段(例えば、図1に示す名詞句対
訳用例記憶部8、動詞句対訳用例記憶部9、およびその
他対訳用例記憶部10など)を用いて、第1の言語で表
現された第1言語文を、第2の言語で表現された第2言
語文に翻訳する翻訳方法であって、第1言語文を構文解
析することにより、その文法属性を抽出するステップ
と、第1言語文に類似する用例を、その第1言語文およ
び用例が有する文法属性を考慮して検出するステップ
と、その検出された用例と対応付けられている訳文に基
づいて、第1言語文を翻訳するステップとを備えること
を特徴とする。
【0070】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。
ものに限定することを意味するものではない。
【0071】図1は、本発明を適用した翻訳装置の一実
施の形態の構成を示している。なお、図中、図13にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。また、
この翻訳装置は、後述するように、第1言語文を、所定
の構文上の単位である構文単位あって、大きな構文単位
から小さな構文単位に、段階的に分割しながら、各段階
において得られた構文単位を用例を用いて翻訳するよう
になされており、この意味で、段階的用例利用型翻訳装
置ということができる。さらに、ここでは、第1言語文
として、例えば日本語の文が入力され、その翻訳結果で
ある第2言語文として、例えば英語の文が出力されるも
のとする。
施の形態の構成を示している。なお、図中、図13にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。また、
この翻訳装置は、後述するように、第1言語文を、所定
の構文上の単位である構文単位あって、大きな構文単位
から小さな構文単位に、段階的に分割しながら、各段階
において得られた構文単位を用例を用いて翻訳するよう
になされており、この意味で、段階的用例利用型翻訳装
置ということができる。さらに、ここでは、第1言語文
として、例えば日本語の文が入力され、その翻訳結果で
ある第2言語文として、例えば英語の文が出力されるも
のとする。
【0072】入力部1は、前述したように、例えば、キ
ーボードや、音声認識装置、文字認識装置などで構成さ
れ、そこに入力される第1言語文を、テキストデータな
どの形で出力するようになされている。なお、ここで
は、入力部1は、第1言語文を、例えば形態素解析など
することで、第1言語文を構成する各単語(形態素)の
区切りや、その品詞、語根、漢字の読みなど(以下、適
宜、これらの、形態素解析により得られる情報を、形態
素情報という)を検出し、テキストデータの形の第1言
語文とともに出力するようにもなされている。
ーボードや、音声認識装置、文字認識装置などで構成さ
れ、そこに入力される第1言語文を、テキストデータな
どの形で出力するようになされている。なお、ここで
は、入力部1は、第1言語文を、例えば形態素解析など
することで、第1言語文を構成する各単語(形態素)の
区切りや、その品詞、語根、漢字の読みなど(以下、適
宜、これらの、形態素解析により得られる情報を、形態
素情報という)を検出し、テキストデータの形の第1言
語文とともに出力するようにもなされている。
【0073】入力部1の出力は、照合部2に供給される
ようになされている。照合部2は、決まり文句対訳用例
記憶部3に記憶されている用例と、入力部1からの第1
言語文とを照合し、決まり文句対訳用例記憶部3に記憶
されている用例の中に、第1言語文と一致するものがあ
るかどうかを判定するようになされている。そして、照
合部2は、入力部1からの第1言語文と一致する用例
が、決まり文句対訳用例記憶部3に記憶されている場
合、その用例に対応付けられている訳文を、決まり文句
対訳用例記憶部2から読み出し、出力部16に供給する
ようになされている。従って、この場合、後段の節分割
処理部4乃至節合成処理部15では処理は行われず、出
力部16では、照合部2からの訳文が、第2言語文とし
て出力される。
ようになされている。照合部2は、決まり文句対訳用例
記憶部3に記憶されている用例と、入力部1からの第1
言語文とを照合し、決まり文句対訳用例記憶部3に記憶
されている用例の中に、第1言語文と一致するものがあ
るかどうかを判定するようになされている。そして、照
合部2は、入力部1からの第1言語文と一致する用例
が、決まり文句対訳用例記憶部3に記憶されている場
合、その用例に対応付けられている訳文を、決まり文句
対訳用例記憶部2から読み出し、出力部16に供給する
ようになされている。従って、この場合、後段の節分割
処理部4乃至節合成処理部15では処理は行われず、出
力部16では、照合部2からの訳文が、第2言語文とし
て出力される。
【0074】また、照合部2は、入力部1からの第1言
語文と一致する用例が、決まり文句対訳用例記憶部3に
記憶されていない場合、入力部1からの第1言語文およ
びその形態素情報を、節分割処理部4に出力するように
なされている。
語文と一致する用例が、決まり文句対訳用例記憶部3に
記憶されていない場合、入力部1からの第1言語文およ
びその形態素情報を、節分割処理部4に出力するように
なされている。
【0075】決まり文句対訳用例記憶部3は、第1言語
(ここでは、上述したように日本語)で表現された、例
えば、挨拶その他の、いわゆる決まり文句の用例と、そ
の用例を第2言語(ここでは、上述したように英語)に
翻訳した訳文とを対応付けた対訳用例データを記憶して
いる。従って、第1言語文が、決まり文句(決まり文句
対訳用例記憶部3に用例として記憶されている決まり文
句)である場合は、その決まり文句の用例と対応付けら
れている訳文が、照合部2から出力部16に供給され、
第1言語文が、決まり文句でない場合は、その第1言語
文および形態素情報が、照合部2から節分割処理部4に
供給される。
(ここでは、上述したように日本語)で表現された、例
えば、挨拶その他の、いわゆる決まり文句の用例と、そ
の用例を第2言語(ここでは、上述したように英語)に
翻訳した訳文とを対応付けた対訳用例データを記憶して
いる。従って、第1言語文が、決まり文句(決まり文句
対訳用例記憶部3に用例として記憶されている決まり文
句)である場合は、その決まり文句の用例と対応付けら
れている訳文が、照合部2から出力部16に供給され、
第1言語文が、決まり文句でない場合は、その第1言語
文および形態素情報が、照合部2から節分割処理部4に
供給される。
【0076】節分割処理部4は、照合部2から第1言語
文および形態素情報を受信すると、第1言語文の中に、
節分割パターン対訳用例記憶部5に記憶されている用例
のいずれかと一致する節(clause)が存在するかどうか
を判定し、存在する場合には、その節の部分で第1言語
文を区切り、これにより、第1言語文を大きな構文単位
としての節に分割するようになされている。そして、節
分割処理部4は、第1言語文の分割結果(節)のうち、
節分割パターン対訳用例記憶部5に記憶されている用例
のいずれかと一致する節を除く部分を、形態素情報とと
もに、単純構文解析処理部6に供給するようになされて
いる。さらに、節分割処理部4は、第1言語文を分割す
るのに用いた節の用例に対応付けられている訳文を、節
分割パターン対訳用例記憶部5から読み出し、第1言語
文をどのように分割したかに関する情報(以下、適宜、
節分割情報という)とともに、節合成処理部15に供給
するようになされている。
文および形態素情報を受信すると、第1言語文の中に、
節分割パターン対訳用例記憶部5に記憶されている用例
のいずれかと一致する節(clause)が存在するかどうか
を判定し、存在する場合には、その節の部分で第1言語
文を区切り、これにより、第1言語文を大きな構文単位
としての節に分割するようになされている。そして、節
分割処理部4は、第1言語文の分割結果(節)のうち、
節分割パターン対訳用例記憶部5に記憶されている用例
のいずれかと一致する節を除く部分を、形態素情報とと
もに、単純構文解析処理部6に供給するようになされて
いる。さらに、節分割処理部4は、第1言語文を分割す
るのに用いた節の用例に対応付けられている訳文を、節
分割パターン対訳用例記憶部5から読み出し、第1言語
文をどのように分割したかに関する情報(以下、適宜、
節分割情報という)とともに、節合成処理部15に供給
するようになされている。
【0077】また、節分割処理部4は、第1言語文の中
に、節分割パターン対訳用例記憶部5に記憶されている
用例のいずれかと一致する節が存在しない場合、即ち、
第1言語文が単節で構成されている場合、第1言語文
を、そのまま、形態素情報とともに、単純構文解析処理
部6に供給するようになされている。
に、節分割パターン対訳用例記憶部5に記憶されている
用例のいずれかと一致する節が存在しない場合、即ち、
第1言語文が単節で構成されている場合、第1言語文
を、そのまま、形態素情報とともに、単純構文解析処理
部6に供給するようになされている。
【0078】節分割パターン対訳用例記憶部5は、第1
言語で表現された、節単位の用例と、その用例を第2言
語に翻訳した訳文とを対応付けた対訳用例データを記憶
している。なお、ここでは、節分割パターン対訳用例記
憶部5には、例えば、「できましたら」などの、いわば
パターン化した節の用例が記憶されている。
言語で表現された、節単位の用例と、その用例を第2言
語に翻訳した訳文とを対応付けた対訳用例データを記憶
している。なお、ここでは、節分割パターン対訳用例記
憶部5には、例えば、「できましたら」などの、いわば
パターン化した節の用例が記憶されている。
【0079】単純構文解析処理部6は、節分割処理部4
からの第1言語文を構成する節に対し、同じく節分割処
理部4からの形態素情報に基づき、例えば、正規文法と
して記述されている第1言語の統語的規則(知識)を用
いて、いわば浅い構文解析を施すことで、節(節分割処
理部4から複数の節が供給される場合には、それぞれの
節)を句(phrase)単位に分割するようになされてい
る。即ち、ここでは、単純構文解析処理部6は、節分割
処理部4からの第1言語文の節を、例えば名詞句、動詞
句、およびその他の句(例えば、副詞句や、文修飾語な
ど)などに分割し、変換部7に供給するようになされて
いる。
からの第1言語文を構成する節に対し、同じく節分割処
理部4からの形態素情報に基づき、例えば、正規文法と
して記述されている第1言語の統語的規則(知識)を用
いて、いわば浅い構文解析を施すことで、節(節分割処
理部4から複数の節が供給される場合には、それぞれの
節)を句(phrase)単位に分割するようになされてい
る。即ち、ここでは、単純構文解析処理部6は、節分割
処理部4からの第1言語文の節を、例えば名詞句、動詞
句、およびその他の句(例えば、副詞句や、文修飾語な
ど)などに分割し、変換部7に供給するようになされて
いる。
【0080】なお、単純構文解析処理部6は、構文解析
を行うことで、各句についての、例えば、構文的ヘッド
(syntactic head)(各句の主要語(例えば、名詞句の
重要な部分(被修飾語など)や、名詞句が1の名詞から
なる場合はその名詞など)に関する情報)や、モダリテ
ィ(modality)(例えば、可能法(potential)や、仮
定法(conditional)、願望形(desiderative)などに
関する情報)などの文法属性の抽出も行うようになされ
ている。さらに、単純構文解析処理部6は、節を構成す
る句どうしの係り受け関係その他の構文情報(以下、節
構文情報という)を検出するようにもなされている。文
法属性および節構文情報は、上述したようにして得られ
た句とともに、変換部7に供給されるようになされてい
る。
を行うことで、各句についての、例えば、構文的ヘッド
(syntactic head)(各句の主要語(例えば、名詞句の
重要な部分(被修飾語など)や、名詞句が1の名詞から
なる場合はその名詞など)に関する情報)や、モダリテ
ィ(modality)(例えば、可能法(potential)や、仮
定法(conditional)、願望形(desiderative)などに
関する情報)などの文法属性の抽出も行うようになされ
ている。さらに、単純構文解析処理部6は、節を構成す
る句どうしの係り受け関係その他の構文情報(以下、節
構文情報という)を検出するようにもなされている。文
法属性および節構文情報は、上述したようにして得られ
た句とともに、変換部7に供給されるようになされてい
る。
【0081】変換部7は、単純構文解析処理部6からの
第1言語文の句に最も類似する句単位の用例を、名詞句
対訳用例記憶部8、動詞句対訳用例記憶部9、またはそ
の他対訳用例記憶部10から検出し、その用例と対応付
けられている訳文に基づいて、句単位で翻訳を行うよう
になされている。
第1言語文の句に最も類似する句単位の用例を、名詞句
対訳用例記憶部8、動詞句対訳用例記憶部9、またはそ
の他対訳用例記憶部10から検出し、その用例と対応付
けられている訳文に基づいて、句単位で翻訳を行うよう
になされている。
【0082】即ち、変換部7は、名詞句対訳用例記憶部
8、動詞句対訳用例記憶部9、またはその他対訳用例記
憶部10に記憶されている用例を構成する単語と、単純
構文解析処理部6からの句を構成する単語との意味的な
類似性を表す単語類似度を、類似度計算部11に計算さ
せ、その単語類似度その他(例えば、単純構文解析処理
部6が出力する文法属性など)に基づいて、単純構文解
析処理部6からの句に最も類似する用例を検出する。な
お、変換部7では、単純構文解析処理部6からの句と一
致する用例が、名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、またはその他対訳用例記憶部10に記憶さ
れている場合には、その用例を、単純構文解析処理部6
からの句と最も類似する用例として検出するようになさ
れている。
8、動詞句対訳用例記憶部9、またはその他対訳用例記
憶部10に記憶されている用例を構成する単語と、単純
構文解析処理部6からの句を構成する単語との意味的な
類似性を表す単語類似度を、類似度計算部11に計算さ
せ、その単語類似度その他(例えば、単純構文解析処理
部6が出力する文法属性など)に基づいて、単純構文解
析処理部6からの句に最も類似する用例を検出する。な
お、変換部7では、単純構文解析処理部6からの句と一
致する用例が、名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、またはその他対訳用例記憶部10に記憶さ
れている場合には、その用例を、単純構文解析処理部6
からの句と最も類似する用例として検出するようになさ
れている。
【0083】さらに、変換部7は、対訳辞書13を参照
することで、その用例に対応付けられている訳文を構成
する単語のうち、第1言語文を構成する単語と対応しな
いものを、その単語の対訳に置き換え、これにより得ら
れる句の訳文を、単純構文解析処理部6からの節構文情
報とともに、句合成処理部14に出力するようになされ
ている。
することで、その用例に対応付けられている訳文を構成
する単語のうち、第1言語文を構成する単語と対応しな
いものを、その単語の対訳に置き換え、これにより得ら
れる句の訳文を、単純構文解析処理部6からの節構文情
報とともに、句合成処理部14に出力するようになされ
ている。
【0084】なお、変換部7は、以上の処理を、単純構
文解析処理部6から供給される名詞句、動詞句、その他
の句それぞれに対して行う。また、名詞句、動詞句、そ
の他の句に最も類似する句単位の用例の検出は、それぞ
れ名詞句対訳用例記憶部8、動詞句対訳用例記憶部9、
またはその他対訳用例記憶部10のみを参照して行われ
る。
文解析処理部6から供給される名詞句、動詞句、その他
の句それぞれに対して行う。また、名詞句、動詞句、そ
の他の句に最も類似する句単位の用例の検出は、それぞ
れ名詞句対訳用例記憶部8、動詞句対訳用例記憶部9、
またはその他対訳用例記憶部10のみを参照して行われ
る。
【0085】名詞句対訳用例記憶部8、動詞句対訳用例
記憶部9、またはその他対訳用例記憶部10は、用例
を、名詞句単位、動詞句単位、その他の句単位で、それ
ぞれ記憶している。
記憶部9、またはその他対訳用例記憶部10は、用例
を、名詞句単位、動詞句単位、その他の句単位で、それ
ぞれ記憶している。
【0086】類似度計算部11は、変換部7の制御の
下、シソーラス記憶部12に記憶されているシソーラス
に基づき、名詞句対訳用例記憶部8、動詞句対訳用例記
憶部9、またはその他対訳用例記憶部10に記憶されて
いる用例を構成する単語と、単純構文解析処理部6が出
力する句を構成する単語との単語類似度を計算するよう
になされている。シソーラス記憶部12は、単語を、そ
の概念に基づいて木構造に階層化したシソーラスを記憶
している。対訳辞書13は、第1言語の単語と、それに
対応する第2言語の単語(第1言語の単語を第2言語に
訳したもの(対訳))とを対応付けて記憶している。
下、シソーラス記憶部12に記憶されているシソーラス
に基づき、名詞句対訳用例記憶部8、動詞句対訳用例記
憶部9、またはその他対訳用例記憶部10に記憶されて
いる用例を構成する単語と、単純構文解析処理部6が出
力する句を構成する単語との単語類似度を計算するよう
になされている。シソーラス記憶部12は、単語を、そ
の概念に基づいて木構造に階層化したシソーラスを記憶
している。対訳辞書13は、第1言語の単語と、それに
対応する第2言語の単語(第1言語の単語を第2言語に
訳したもの(対訳))とを対応付けて記憶している。
【0087】句合成処理部14は、変換部7から供給さ
れる名詞句、動詞句、およびその他の句の訳文を、同じ
く変換部7から供給される節構文情報と、第2言語の統
語的規則とに基づいて合成することにより、第1言語文
の節に対応する、第2言語の節を生成し、節合成処理部
15に供給するようになされている。節合成処理部15
は、節を合成し、これにより、第1言語文の翻訳結果と
しての第2言語文を生成するようになされている。
れる名詞句、動詞句、およびその他の句の訳文を、同じ
く変換部7から供給される節構文情報と、第2言語の統
語的規則とに基づいて合成することにより、第1言語文
の節に対応する、第2言語の節を生成し、節合成処理部
15に供給するようになされている。節合成処理部15
は、節を合成し、これにより、第1言語文の翻訳結果と
しての第2言語文を生成するようになされている。
【0088】即ち、第1言語文が複数の節で構成される
場合、節合成処理部15に対しては、句合成処理部14
から複数の節の翻訳結果が供給される。あるいは、ま
た、節合成処理部15に対しては、句合成処理部14か
らだけではなく、節分割処理部4からも、節の翻訳結果
が供給される。節合成処理部15は、このようにして供
給される複数の節の翻訳結果を合成する(組み合わせ
る)ことで、第2言語文を生成する。節合成処理部15
において生成された第2言語文は、出力部16に供給さ
れて出力されるようになされている。
場合、節合成処理部15に対しては、句合成処理部14
から複数の節の翻訳結果が供給される。あるいは、ま
た、節合成処理部15に対しては、句合成処理部14か
らだけではなく、節分割処理部4からも、節の翻訳結果
が供給される。節合成処理部15は、このようにして供
給される複数の節の翻訳結果を合成する(組み合わせ
る)ことで、第2言語文を生成する。節合成処理部15
において生成された第2言語文は、出力部16に供給さ
れて出力されるようになされている。
【0089】なお、節分割処理部4からは、上述したよ
うに、節の翻訳結果(訳文)の他、節分割情報も供給さ
れるが、この場合は、この節分割情報に基づいて、句合
成処理部14が出力する節の訳文と、節分割処理部4が
出力する節の訳文とが合成される。
うに、節の翻訳結果(訳文)の他、節分割情報も供給さ
れるが、この場合は、この節分割情報に基づいて、句合
成処理部14が出力する節の訳文と、節分割処理部4が
出力する節の訳文とが合成される。
【0090】次に、図2を参照して、シソーラス記憶部
12に記憶されているシソーラスについて説明する。シ
ソーラス記憶部12には、単語が、例えば、EDR(Ja
panElectronic Dictionary Research Institute)(日
本電子化辞書研究所)の概念辞書における場合と同様に
階層化されたシソーラスが記憶されており、図2は、そ
のシソーラスの一部を示している(出典「日本電子化辞
書研究所、EDR電子化辞書製品版(第1.0版)、1
995年」)。即ち、同図は、シソーラス記憶部12に
記憶されているシソーラスのうちの、「いく」と表現さ
れ得る単語(図中、楕円で囲んである部分)(但し、同
図においては、単語そのものではなく、その意義を示し
てある)、およびその上位概念(図中、四角で囲んであ
る部分)を表している。
12に記憶されているシソーラスについて説明する。シ
ソーラス記憶部12には、単語が、例えば、EDR(Ja
panElectronic Dictionary Research Institute)(日
本電子化辞書研究所)の概念辞書における場合と同様に
階層化されたシソーラスが記憶されており、図2は、そ
のシソーラスの一部を示している(出典「日本電子化辞
書研究所、EDR電子化辞書製品版(第1.0版)、1
995年」)。即ち、同図は、シソーラス記憶部12に
記憶されているシソーラスのうちの、「いく」と表現さ
れ得る単語(図中、楕円で囲んである部分)(但し、同
図においては、単語そのものではなく、その意義を示し
てある)、およびその上位概念(図中、四角で囲んであ
る部分)を表している。
【0091】このシソーラスは、各単語から上位の階層
を見た場合に、同一の数の階層が存在するようにはなさ
れていない。即ち、例えば、図16における場合と同様
に、最上位の概念が属する階層を、第0階層とし、以
下、その下位階層を順次、第1階層、第2階層、・・・
というとすると、「時が経過する」という意味内容(意
義)の単語W1は、第3階層の概念「時間経過」に属し
ており、「次第にする」という意味内容の単語W2は、
第7階層の概念「今までいた場所から立ち去る」に属し
ている。また、このシソーラスにおいては、例えば、
「動物や人が死ぬ」という意味内容の単語W3や、「目
的の場所に到着する」という意味内容の単語W4は、同
一階層の複数の概念に包含されるようになされている。
即ち、単語W3は、第4階層の概念「動物の生理現象」
および「生命の命が消えること」の両方に包含されてお
り、また、単語W4は、第7階層の概念「主体が終点へ
移動する」および「到着」の両方に包含されている。
を見た場合に、同一の数の階層が存在するようにはなさ
れていない。即ち、例えば、図16における場合と同様
に、最上位の概念が属する階層を、第0階層とし、以
下、その下位階層を順次、第1階層、第2階層、・・・
というとすると、「時が経過する」という意味内容(意
義)の単語W1は、第3階層の概念「時間経過」に属し
ており、「次第にする」という意味内容の単語W2は、
第7階層の概念「今までいた場所から立ち去る」に属し
ている。また、このシソーラスにおいては、例えば、
「動物や人が死ぬ」という意味内容の単語W3や、「目
的の場所に到着する」という意味内容の単語W4は、同
一階層の複数の概念に包含されるようになされている。
即ち、単語W3は、第4階層の概念「動物の生理現象」
および「生命の命が消えること」の両方に包含されてお
り、また、単語W4は、第7階層の概念「主体が終点へ
移動する」および「到着」の両方に包含されている。
【0092】以上のように、このシソーラスは、規則的
には構成されていない。
には構成されていない。
【0093】さらに、このシソーラスは、線で結ばれて
いる概念間の距離が同一となるようにも構成されていな
い。即ち、例えば、概念C1(「主体が終点へ移動す
る」)は、概念C2(「主体の移動」)およびC3
(「終点への帰着」)のいずれとも結ばれているが、概
念C1とC2との距離と、概念C1とC3との距離とは
同一とはいえない。
いる概念間の距離が同一となるようにも構成されていな
い。即ち、例えば、概念C1(「主体が終点へ移動す
る」)は、概念C2(「主体の移動」)およびC3
(「終点への帰着」)のいずれとも結ばれているが、概
念C1とC2との距離と、概念C1とC3との距離とは
同一とはいえない。
【0094】図1の類似度計算部11では、シソーラス
が、以上のように構成されるものであっても、後述する
ようにして、単語間の類似性を精度良く反映した単語類
似度が計算されるようになされている。
が、以上のように構成されるものであっても、後述する
ようにして、単語間の類似性を精度良く反映した単語類
似度が計算されるようになされている。
【0095】次に、図3のフローチャートを参照して、
図1の翻訳装置の動作について説明する。入力部1に第
1言語文が入力されると、ステップS0において、入力
部1は、その第1言語文をテキストデータの形に変換す
るとともに、その第1言語文の形態素情報を生成し、照
合部2に供給する。照合部2は、ステップS1におい
て、決まり文句対訳用例記憶部3に記憶されている用例
と、入力部1からの第1言語文とを照合し、これによ
り、決まり文句対訳用例記憶部3に記憶されている用例
の中に、入力部1からの第1言語文と一致するものがあ
るかどうかを判定する。
図1の翻訳装置の動作について説明する。入力部1に第
1言語文が入力されると、ステップS0において、入力
部1は、その第1言語文をテキストデータの形に変換す
るとともに、その第1言語文の形態素情報を生成し、照
合部2に供給する。照合部2は、ステップS1におい
て、決まり文句対訳用例記憶部3に記憶されている用例
と、入力部1からの第1言語文とを照合し、これによ
り、決まり文句対訳用例記憶部3に記憶されている用例
の中に、入力部1からの第1言語文と一致するものがあ
るかどうかを判定する。
【0096】ステップS1において、入力部1からの第
1言語文と一致する用例が、決まり文句対訳用例記憶部
3に記憶されていると判定された場合、ステップS2に
進み、第1言語文が、その一致する用例に対応付けられ
ている訳文に置換され、ステップS13に進む。ステッ
プS13では、ステップS1で得られた訳文が、照合部
2から出力部16に供給され、これにより、第1言語文
を第2言語に翻訳した第2言語文が出力され、処理を終
了する。
1言語文と一致する用例が、決まり文句対訳用例記憶部
3に記憶されていると判定された場合、ステップS2に
進み、第1言語文が、その一致する用例に対応付けられ
ている訳文に置換され、ステップS13に進む。ステッ
プS13では、ステップS1で得られた訳文が、照合部
2から出力部16に供給され、これにより、第1言語文
を第2言語に翻訳した第2言語文が出力され、処理を終
了する。
【0097】一方、ステップS1において、入力部1か
らの第1言語文と一致する用例が、決まり文句対訳用例
記憶部3に記憶されていないと判定された場合、その第
1言語文は、形態素情報とととも、照合部2から節分割
処理部4に供給される。そして、節分割処理部4では、
ステップS3において、第1言語文を構成する節の中
に、節分割パターン対訳用例記憶部5に記憶されている
節単位の用例のいずれかと一致するものがあるかどうか
が判定される。
らの第1言語文と一致する用例が、決まり文句対訳用例
記憶部3に記憶されていないと判定された場合、その第
1言語文は、形態素情報とととも、照合部2から節分割
処理部4に供給される。そして、節分割処理部4では、
ステップS3において、第1言語文を構成する節の中
に、節分割パターン対訳用例記憶部5に記憶されている
節単位の用例のいずれかと一致するものがあるかどうか
が判定される。
【0098】ステップS3において、第1言語文を構成
する節の中に、節分割パターン対訳用例記憶部5に記憶
されている節単位の用例のいずれかと一致するものがあ
ると判定された場合、ステップS4に進み、節分割処理
部4は、その節の部分で第1言語文を区切り、これによ
り、第1言語文を、節単位に分割するとともに、節分割
情報を生成する。そして、節分割処理部4は、第1言語
文を構成する節のうち、節分割パターン対訳用例記憶部
5に記憶されている節単位の用例と一致するものの訳文
を、節分割パターン対訳用例記憶部5から読み出し、節
分割情報とともに、節合成処理部15に出力する。さら
に、節分割処理部4は、第1言語文を構成する節のうち
の残ったものを、形態素情報とともに、単純構文解析処
理部6に供給し、ステップS5に進む。
する節の中に、節分割パターン対訳用例記憶部5に記憶
されている節単位の用例のいずれかと一致するものがあ
ると判定された場合、ステップS4に進み、節分割処理
部4は、その節の部分で第1言語文を区切り、これによ
り、第1言語文を、節単位に分割するとともに、節分割
情報を生成する。そして、節分割処理部4は、第1言語
文を構成する節のうち、節分割パターン対訳用例記憶部
5に記憶されている節単位の用例と一致するものの訳文
を、節分割パターン対訳用例記憶部5から読み出し、節
分割情報とともに、節合成処理部15に出力する。さら
に、節分割処理部4は、第1言語文を構成する節のうち
の残ったものを、形態素情報とともに、単純構文解析処
理部6に供給し、ステップS5に進む。
【0099】一方、ステップS3において、第1言語文
を構成する節の中に、節分割パターン対訳用例記憶部5
に記憶されている節単位の用例と一致するものがないと
判定された場合、即ち、例えば、第1言語文が単節で構
成されている場合、節分割処理部4は、第1言語文を、
形態素情報とともに、単純構文解析処理部6に出力し、
ステップS4をスキップして、ステップS5に進む。
を構成する節の中に、節分割パターン対訳用例記憶部5
に記憶されている節単位の用例と一致するものがないと
判定された場合、即ち、例えば、第1言語文が単節で構
成されている場合、節分割処理部4は、第1言語文を、
形態素情報とともに、単純構文解析処理部6に出力し、
ステップS4をスキップして、ステップS5に進む。
【0100】ステップS5では、単純構文解析処理部6
において、節分割処理部4からの第1言語文を構成する
節に対し、同じく節分割処理部4からの形態素情報に基
づき、第1言語の統語的規則(知識)を用いて、構文解
析処理が施され、これにより、第1言語文の節が、名詞
句や、動詞句、その他の句に分割されるとともに、各句
の文法属性、および節を構成する句どうしの係り受け関
係などの節構文情報が生成される。これらの句、文法属
性、および節構文情報は、単純構文解析処理部6から変
換部7に供給され、ステップS6に進む。
において、節分割処理部4からの第1言語文を構成する
節に対し、同じく節分割処理部4からの形態素情報に基
づき、第1言語の統語的規則(知識)を用いて、構文解
析処理が施され、これにより、第1言語文の節が、名詞
句や、動詞句、その他の句に分割されるとともに、各句
の文法属性、および節を構成する句どうしの係り受け関
係などの節構文情報が生成される。これらの句、文法属
性、および節構文情報は、単純構文解析処理部6から変
換部7に供給され、ステップS6に進む。
【0101】ステップS6では、変換部7において、単
純構文解析処理部6から供給された句と、名詞句対訳用
例記憶部8、動詞句対訳用例記憶部9、またはその他対
訳用例記憶部10の記憶内容とが照合され、これによ
り、単純構文解析処理部6から供給された句と一致する
句単位の用例が、名詞句対訳用例記憶部8、動詞句対訳
用例記憶部9、またはその他対訳用例記憶部10に記憶
されているかどうかが判定される。ステップS6におい
て、単純構文解析処理部6から供給された句と一致する
用例が、名詞句対訳用例記憶部8、動詞句対訳用例記憶
部9、またはその他対訳用例記憶部10に記憶されてい
ると判定された場合、ステップS7に進み、変換部7
は、その一致する用例に対応付けられた訳文を、名詞句
対訳用例記憶部8、動詞句対訳用例記憶部9、またはそ
の他対訳用例記憶部10から読み出し、句合成処理部1
4に出力して、ステップS10に進む。
純構文解析処理部6から供給された句と、名詞句対訳用
例記憶部8、動詞句対訳用例記憶部9、またはその他対
訳用例記憶部10の記憶内容とが照合され、これによ
り、単純構文解析処理部6から供給された句と一致する
句単位の用例が、名詞句対訳用例記憶部8、動詞句対訳
用例記憶部9、またはその他対訳用例記憶部10に記憶
されているかどうかが判定される。ステップS6におい
て、単純構文解析処理部6から供給された句と一致する
用例が、名詞句対訳用例記憶部8、動詞句対訳用例記憶
部9、またはその他対訳用例記憶部10に記憶されてい
ると判定された場合、ステップS7に進み、変換部7
は、その一致する用例に対応付けられた訳文を、名詞句
対訳用例記憶部8、動詞句対訳用例記憶部9、またはそ
の他対訳用例記憶部10から読み出し、句合成処理部1
4に出力して、ステップS10に進む。
【0102】ここで、名詞句対訳用例記憶部8、動詞句
対訳用例記憶部9、またはその他対訳用例記憶部10に
は、例えば、文単位の用例を入力部1に入力することに
より、単純構文解析処理部6から得られる名詞句、動詞
句、またはその他の句それぞれが記憶されている。さら
に、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10には、上述のよう
にして得られる名詞句、動詞句、またはその他の句それ
ぞれが、対応する文法属性と関係付けられて記憶されて
いる。
対訳用例記憶部9、またはその他対訳用例記憶部10に
は、例えば、文単位の用例を入力部1に入力することに
より、単純構文解析処理部6から得られる名詞句、動詞
句、またはその他の句それぞれが記憶されている。さら
に、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10には、上述のよう
にして得られる名詞句、動詞句、またはその他の句それ
ぞれが、対応する文法属性と関係付けられて記憶されて
いる。
【0103】即ち、名詞句対訳用例記憶部8、動詞句対
訳用例記憶部9、およびその他対訳用例記憶部10に
は、句単位の用例が、その文法属性という、いわば構文
解析の結果得られる抽象的なものとともに記憶されてい
る。従って、変換部7には、一般化された言語学上の知
識を与え、単純構文解析処理部6からの句(以下、適
宜、入力句という)と、名詞句対訳用例記憶部8、動詞
句対訳用例記憶部9、またはその他対訳用例記憶部10
に記憶されている句(以下、適宜、用例句という)との
照合を、これらの句が有する文法属性(入力句および用
例句が有する文法属性)を考慮して行わせるようにする
ことができ、これにより、効率的な処理が可能となる。
訳用例記憶部9、およびその他対訳用例記憶部10に
は、句単位の用例が、その文法属性という、いわば構文
解析の結果得られる抽象的なものとともに記憶されてい
る。従って、変換部7には、一般化された言語学上の知
識を与え、単純構文解析処理部6からの句(以下、適
宜、入力句という)と、名詞句対訳用例記憶部8、動詞
句対訳用例記憶部9、またはその他対訳用例記憶部10
に記憶されている句(以下、適宜、用例句という)との
照合を、これらの句が有する文法属性(入力句および用
例句が有する文法属性)を考慮して行わせるようにする
ことができ、これにより、効率的な処理が可能となる。
【0104】具体的には、例えば、動詞句「予約をして
いただきたいのですが」が、単純構文解析処理部6に入
力されたときに、文法属性(slot-name value)とし
て、例えば(gerund-suffix ITADAKU)(desiderative
+)(extended-predicate +)(s-part GA)(formal
+)が得られたとする。ここで、動詞句「予約をしてい
ただきたいのですが」の最も簡潔な表現(いわば、語根
に相当する表現)は、「予約をする」であるが、文法属
性(gerund-suffix ITADAKU)は、この「予約をする」
に、「いただく」というのがサフィックス的に付加され
ていることを、文法属性(desiderative +)は、願望を
表す表現(ここでは、「たい」)が付加されていること
を、文法属性(extended-predicate +)は、述語を付加
するための表現(ここでは、「のです」)が付加されて
いることを、(s-part GA)は、終助詞「が」が付加さ
れていることを、文法属性(formal +)は、文末が丁寧
な表現となっていること(ここでは、文末として、例え
ば、「のだ」などでなはく、「のです」が用いられてい
ること)を、それぞれ意味する。
いただきたいのですが」が、単純構文解析処理部6に入
力されたときに、文法属性(slot-name value)とし
て、例えば(gerund-suffix ITADAKU)(desiderative
+)(extended-predicate +)(s-part GA)(formal
+)が得られたとする。ここで、動詞句「予約をしてい
ただきたいのですが」の最も簡潔な表現(いわば、語根
に相当する表現)は、「予約をする」であるが、文法属
性(gerund-suffix ITADAKU)は、この「予約をする」
に、「いただく」というのがサフィックス的に付加され
ていることを、文法属性(desiderative +)は、願望を
表す表現(ここでは、「たい」)が付加されていること
を、文法属性(extended-predicate +)は、述語を付加
するための表現(ここでは、「のです」)が付加されて
いることを、(s-part GA)は、終助詞「が」が付加さ
れていることを、文法属性(formal +)は、文末が丁寧
な表現となっていること(ここでは、文末として、例え
ば、「のだ」などでなはく、「のです」が用いられてい
ること)を、それぞれ意味する。
【0105】この場合、一般化された言語学上の知識と
して、例えば文法属性(extended-predicate +)に対応
する表現の「の」が「ん」になることがあるということ
を、単純構文解析処理部6に与えておいたとき、入力句
として、例えば、上述の動詞句の中の「の」が「ん」と
なった「予約をしていただきたいんですが」が入力され
ても、単純構文解析処理部6からは、やはり、上述の場
合と同様の文法属性(gerund-suffix ITADAKU)(desid
erative +)(extended-predicate +)(s-part GA)
(formal +)が出力される。
して、例えば文法属性(extended-predicate +)に対応
する表現の「の」が「ん」になることがあるということ
を、単純構文解析処理部6に与えておいたとき、入力句
として、例えば、上述の動詞句の中の「の」が「ん」と
なった「予約をしていただきたいんですが」が入力され
ても、単純構文解析処理部6からは、やはり、上述の場
合と同様の文法属性(gerund-suffix ITADAKU)(desid
erative +)(extended-predicate +)(s-part GA)
(formal +)が出力される。
【0106】従って、動詞句「予約をしていただきたい
のですが」が、用例句として、その文法属性とともに、
動詞句対訳用例記憶部9に記憶されているとすると、変
換部7では、用例句「予約をしていただきたいのです
が」は、入力句「予約をしていただきたいんですが」と
一致すると判定される。
のですが」が、用例句として、その文法属性とともに、
動詞句対訳用例記憶部9に記憶されているとすると、変
換部7では、用例句「予約をしていただきたいのです
が」は、入力句「予約をしていただきたいんですが」と
一致すると判定される。
【0107】また、例えば、上述の動詞句「予約をして
いただきたいのですが」のうちの文法属性(extended-p
redicate +)と(formal +)に対応する表現を省略した
「予約をしていただきたいが」が、入力句として入力さ
れた場合には、文法属性(gerund-suffix ITADAKU)(d
esiderative +)(s-part GA)が、単純構文解析処理部
6から出力される。
いただきたいのですが」のうちの文法属性(extended-p
redicate +)と(formal +)に対応する表現を省略した
「予約をしていただきたいが」が、入力句として入力さ
れた場合には、文法属性(gerund-suffix ITADAKU)(d
esiderative +)(s-part GA)が、単純構文解析処理部
6から出力される。
【0108】いま、一般化された言語学上の知識とし
て、例えば、文法属性(extended-predicate +)や(fo
rmal +)に対応する表現は無視することができるという
ものを、変換部7に与えておいたとする。そして、上述
の動詞句「予約をしていただきたいのですが」が、用例
句として、その文法属性とともに、動詞句対訳用例記憶
部9に記憶されているとすると、変換部7では、用例句
「予約をしていただきたいのですが」の文法属性のうち
の(extended-predicate +)および(formal +)を無視
して照合が行われ、これにより、用例句「予約をしてい
ただきたいのですが」は、入力句「予約をしていただき
たいが」と一致すると判定される。
て、例えば、文法属性(extended-predicate +)や(fo
rmal +)に対応する表現は無視することができるという
ものを、変換部7に与えておいたとする。そして、上述
の動詞句「予約をしていただきたいのですが」が、用例
句として、その文法属性とともに、動詞句対訳用例記憶
部9に記憶されているとすると、変換部7では、用例句
「予約をしていただきたいのですが」の文法属性のうち
の(extended-predicate +)および(formal +)を無視
して照合が行われ、これにより、用例句「予約をしてい
ただきたいのですが」は、入力句「予約をしていただき
たいが」と一致すると判定される。
【0109】以上のように、入力句が、用例句と完全に
一致しなくても、同一の意味内容を表す用例句を得るこ
とができる。即ち、文法属性を考慮することで、変換部
7では、用例句における「のです」を無視して処理を行
うことができる。
一致しなくても、同一の意味内容を表す用例句を得るこ
とができる。即ち、文法属性を考慮することで、変換部
7では、用例句における「のです」を無視して処理を行
うことができる。
【0110】さらに、その結果、表層上のバリエーショ
ンに対応した用例句を用意しておく必要がなくなり、即
ち、例えば、動詞句対訳用例記憶部9には、用例句とし
て、動詞句「予約をしていただきたいのですが」の他
に、例えば、その中の「のです」を除いた動詞句「予約
をしていただきたいが」や、「の」を除いた動詞句「予
約をしていただきたいですが」、あるいは、「の」を
「ん」に変えた動詞句「予約をしていただきたいんです
が」などを記憶させておく必要はなくなり、従って、名
詞句対訳用例記憶部8や、動詞句対訳用例記憶部9、そ
の他対訳用例記憶部10に、用例句を、効率的に記憶さ
せておくことができる。また、名詞句対訳用例記憶部8
や、動詞句対訳用例記憶部9、その他対訳用例記憶部1
0は、用例句のデータベースということができるが、こ
のデータベースの作成、維持、改良も容易に行うことが
可能となる。
ンに対応した用例句を用意しておく必要がなくなり、即
ち、例えば、動詞句対訳用例記憶部9には、用例句とし
て、動詞句「予約をしていただきたいのですが」の他
に、例えば、その中の「のです」を除いた動詞句「予約
をしていただきたいが」や、「の」を除いた動詞句「予
約をしていただきたいですが」、あるいは、「の」を
「ん」に変えた動詞句「予約をしていただきたいんです
が」などを記憶させておく必要はなくなり、従って、名
詞句対訳用例記憶部8や、動詞句対訳用例記憶部9、そ
の他対訳用例記憶部10に、用例句を、効率的に記憶さ
せておくことができる。また、名詞句対訳用例記憶部8
や、動詞句対訳用例記憶部9、その他対訳用例記憶部1
0は、用例句のデータベースということができるが、こ
のデータベースの作成、維持、改良も容易に行うことが
可能となる。
【0111】一方、ステップS6において、入力句(単
純構文解析処理部6から供給された句)と一致する用例
句が、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10に記憶されていな
いと判定された場合、ステップS8に進み、変換部7
は、類似度計算部11を制御することにより、単語類似
度を計算させ、この単語類似度その他に基づいて、入力
句と、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10に記憶されている
用例句との類似性(意味的な類似性)を表す、後述する
翻訳適正率を算出する。そして、変換部7は、その翻訳
適正率が最も高い用例句を検出し、ステップS9に進
む。
純構文解析処理部6から供給された句)と一致する用例
句が、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10に記憶されていな
いと判定された場合、ステップS8に進み、変換部7
は、類似度計算部11を制御することにより、単語類似
度を計算させ、この単語類似度その他に基づいて、入力
句と、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10に記憶されている
用例句との類似性(意味的な類似性)を表す、後述する
翻訳適正率を算出する。そして、変換部7は、その翻訳
適正率が最も高い用例句を検出し、ステップS9に進
む。
【0112】ステップS9では、変換部7は、ステップ
S8で検出された用例句に対応付けられている訳文に基
づき、対訳辞書13を参照しながら、入力句の訳文(以
下、適宜、入力句訳という)を生成し、単純構文解析処
理部6からの節構文情報とともに、句合成処理部14に
出力する。
S8で検出された用例句に対応付けられている訳文に基
づき、対訳辞書13を参照しながら、入力句の訳文(以
下、適宜、入力句訳という)を生成し、単純構文解析処
理部6からの節構文情報とともに、句合成処理部14に
出力する。
【0113】ここで、以上のステップS6乃至S9の処
理は、入力句が、名詞句、動詞句、またはその他の句で
ある場合には、名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、またはその他対訳用例記憶部10にそれぞ
れ記憶されている用例句を対象に行われる。従って、入
力句の種類によって、処理の対象とされる用例句が制限
されるので、翻訳処理速度の向上を図ることができる。
理は、入力句が、名詞句、動詞句、またはその他の句で
ある場合には、名詞句対訳用例記憶部8、動詞句対訳用
例記憶部9、またはその他対訳用例記憶部10にそれぞ
れ記憶されている用例句を対象に行われる。従って、入
力句の種類によって、処理の対象とされる用例句が制限
されるので、翻訳処理速度の向上を図ることができる。
【0114】句合成処理部14は、変換部7から、ある
節を構成する入力句の訳文(入力句訳)をすべてを受信
すると、ステップS10において、その入力句訳を、同
じく変換部7から供給される節構文情報に基づいて合成
することにより、第2言語の節を生成し、節合成処理部
15に供給する。
節を構成する入力句の訳文(入力句訳)をすべてを受信
すると、ステップS10において、その入力句訳を、同
じく変換部7から供給される節構文情報に基づいて合成
することにより、第2言語の節を生成し、節合成処理部
15に供給する。
【0115】その後、ステップS11に進み、節合成処
理部15は、第1言語文が複数の節から構成されている
かどうかを判定する。ステップS11において、第1言
語文が複数の節から構成されていると判定された場合、
即ち、句合成処理部14から節合成処理部15に対し、
複数の節(第2言語の節)が供給された場合、あるい
は、節分割処理部4および句合成処理部14の両方から
節合成処理部15に対し、節が供給された場合、ステッ
プS12に進み、節合成処理部15は、それらの節を合
成することにより、第2言語文を生成し、出力部16に
供給して、ステップS13に進む。
理部15は、第1言語文が複数の節から構成されている
かどうかを判定する。ステップS11において、第1言
語文が複数の節から構成されていると判定された場合、
即ち、句合成処理部14から節合成処理部15に対し、
複数の節(第2言語の節)が供給された場合、あるい
は、節分割処理部4および句合成処理部14の両方から
節合成処理部15に対し、節が供給された場合、ステッ
プS12に進み、節合成処理部15は、それらの節を合
成することにより、第2言語文を生成し、出力部16に
供給して、ステップS13に進む。
【0116】また、ステップS11において、第1言語
文が複数の節から構成されていないと判定された場合、
即ち、句合成処理部14から節合成処理部15に対し、
節が1つだけ供給された場合、節合成処理部15は、そ
の節(第2言語文)を、そのまま、出力部16に供給
し、ステップS12をスキップして、ステップS13に
進む。ステップS13では、節合成処理部15から供給
された第2言語文が出力され、処理を終了する。
文が複数の節から構成されていないと判定された場合、
即ち、句合成処理部14から節合成処理部15に対し、
節が1つだけ供給された場合、節合成処理部15は、そ
の節(第2言語文)を、そのまま、出力部16に供給
し、ステップS12をスキップして、ステップS13に
進む。ステップS13では、節合成処理部15から供給
された第2言語文が出力され、処理を終了する。
【0117】以上のように、節分割処理部4および単純
構文解析処理部6において、第1言語文を、節という大
きな構文単位から、句という小さな構文単位に、段階的
に分割しながら、各段階において得られた構文単位、即
ち、節や句を対象に、用例を用いて翻訳を行うようにし
たので、第1言語文全体を対象に翻訳を行う場合に比較
して、翻訳処理速度を向上させることが可能となる。
構文解析処理部6において、第1言語文を、節という大
きな構文単位から、句という小さな構文単位に、段階的
に分割しながら、各段階において得られた構文単位、即
ち、節や句を対象に、用例を用いて翻訳を行うようにし
たので、第1言語文全体を対象に翻訳を行う場合に比較
して、翻訳処理速度を向上させることが可能となる。
【0118】なお、上述の場合、節への分割は、第1言
語文を構成する節の中に、節分割パターン対訳用例記憶
部5に記憶されている節単位の用例と一致するものが存
在する場合に、その節に基づいて行うようにしたが、節
への分割は、そのようなことと無関係に行うようにする
ことも可能である。
語文を構成する節の中に、節分割パターン対訳用例記憶
部5に記憶されている節単位の用例と一致するものが存
在する場合に、その節に基づいて行うようにしたが、節
への分割は、そのようなことと無関係に行うようにする
ことも可能である。
【0119】次に、第1言語文として、例えば、「でき
ましたらイチゴのアイスクリームをお願いしたいんです
が」が入力された場合の図1の翻訳装置の処理を、図4
乃至図6を参照して説明する。
ましたらイチゴのアイスクリームをお願いしたいんです
が」が入力された場合の図1の翻訳装置の処理を、図4
乃至図6を参照して説明する。
【0120】この第1言語文「できましたらイチゴのア
イスクリームをお願いしたいんですが」からは、入力部
1において形態素解析が行われることにより、例えば、
図4(A)に示すような形態素情報が抽出される。な
お、図4(A)においては、参考として、第1言語文が
有する文法属性の中のモダリティ格情報も図示してあ
る。
イスクリームをお願いしたいんですが」からは、入力部
1において形態素解析が行われることにより、例えば、
図4(A)に示すような形態素情報が抽出される。な
お、図4(A)においては、参考として、第1言語文が
有する文法属性の中のモダリティ格情報も図示してあ
る。
【0121】第1言語文「できましたらイチゴのアイス
クリームをお願いしたいんですが」と、その形態素情報
は、入力部1から照合部2に供給される。いま、決まり
文句対訳用例記憶部3に、「できましたらイチゴのアイ
スクリームをお願いしたいんですが」が用例として記憶
されていないとすると、第1言語文「できましたらイチ
ゴのアイスクリームをお願いしたいんですが」、および
形態素情報は、照合部2から節分割処理部4に供給され
る。
クリームをお願いしたいんですが」と、その形態素情報
は、入力部1から照合部2に供給される。いま、決まり
文句対訳用例記憶部3に、「できましたらイチゴのアイ
スクリームをお願いしたいんですが」が用例として記憶
されていないとすると、第1言語文「できましたらイチ
ゴのアイスクリームをお願いしたいんですが」、および
形態素情報は、照合部2から節分割処理部4に供給され
る。
【0122】節分割処理部4では、第1言語文「できま
したらイチゴのアイスクリームをお願いしたいんです
が」と、節分割パターン対訳用例記憶部5に記憶されて
いる節単位の用例との照合が行われる。ここで、例え
ば、いま、節分割パターン対訳用例記憶部5に、図4
(B)に示すような用例「できましたら X」と、その
訳文「X, if possible」とが対応付けられた対訳用例デ
ータが記憶されているとすると、第1言語文「できまし
たらイチゴのアイスクリームをお願いしたいんですが」
の中に、用例「できましたら」と一致する節が存在する
ので(この場合、「イチゴのアイスクリームをお願いし
たいんですが」は、Xの部分に一致するものと認識され
る)、第1言語文「できましたらイチゴのアイスクリー
ムをお願いしたいんですが」は、節分割処理部4におい
て、節「できましたら」と「イチゴのアイスクリームを
お願いしたいんですが」とに分割される。
したらイチゴのアイスクリームをお願いしたいんです
が」と、節分割パターン対訳用例記憶部5に記憶されて
いる節単位の用例との照合が行われる。ここで、例え
ば、いま、節分割パターン対訳用例記憶部5に、図4
(B)に示すような用例「できましたら X」と、その
訳文「X, if possible」とが対応付けられた対訳用例デ
ータが記憶されているとすると、第1言語文「できまし
たらイチゴのアイスクリームをお願いしたいんですが」
の中に、用例「できましたら」と一致する節が存在する
ので(この場合、「イチゴのアイスクリームをお願いし
たいんですが」は、Xの部分に一致するものと認識され
る)、第1言語文「できましたらイチゴのアイスクリー
ムをお願いしたいんですが」は、節分割処理部4におい
て、節「できましたら」と「イチゴのアイスクリームを
お願いしたいんですが」とに分割される。
【0123】そして、節分割パターン対訳用例記憶部5
に記憶されている節単位の用例と一致する節「できまし
たら」に対応付けられている訳文「X, if possible」
は、節分割処理部4から節合成処理部15に供給され
る。また、第1言語文の残りの節「イチゴのアイスクリ
ームをお願いしたいんですが」は、節分割処理部4から
単純構文解析処理部6に供給される。
に記憶されている節単位の用例と一致する節「できまし
たら」に対応付けられている訳文「X, if possible」
は、節分割処理部4から節合成処理部15に供給され
る。また、第1言語文の残りの節「イチゴのアイスクリ
ームをお願いしたいんですが」は、節分割処理部4から
単純構文解析処理部6に供給される。
【0124】単純構文解析処理部6では、節「イチゴの
アイスクリームをお願いしたいんですが」が構文解析さ
れることにより、「イチゴのアイスクリームを」が1つ
の名詞句を構成し、「お願いしたいんですが」が1つの
動詞句を構成することが認識される。さらに、この場
合、動詞句「お願いしたいんですが」にかかっている名
詞句が「アイスクリームを」であることが認識される。
そして、これらの認識結果に基づいて、節「イチゴのア
イスクリームをお願いしたいんですが」が句単位に分割
される。
アイスクリームをお願いしたいんですが」が構文解析さ
れることにより、「イチゴのアイスクリームを」が1つ
の名詞句を構成し、「お願いしたいんですが」が1つの
動詞句を構成することが認識される。さらに、この場
合、動詞句「お願いしたいんですが」にかかっている名
詞句が「アイスクリームを」であることが認識される。
そして、これらの認識結果に基づいて、節「イチゴのア
イスクリームをお願いしたいんですが」が句単位に分割
される。
【0125】ここで、例えば文「お金をとる」における
動詞「とる」の対訳は、「take」や「get」となるが、
文「朝食をとる」における動詞「とる」の対訳は、「ha
ve」や「eat」となる。従って、動詞(動詞句)につい
ては、目的語や、主語、補語などがわからないと、その
対訳を決定することが困難な場合がある。そこで、単純
構文解析処理部6では、そのような場合には、動詞(述
部)に、必要に応じて、目的語や、主語、補語などを含
めて、1つの動詞句とするようになされている。
動詞「とる」の対訳は、「take」や「get」となるが、
文「朝食をとる」における動詞「とる」の対訳は、「ha
ve」や「eat」となる。従って、動詞(動詞句)につい
ては、目的語や、主語、補語などがわからないと、その
対訳を決定することが困難な場合がある。そこで、単純
構文解析処理部6では、そのような場合には、動詞(述
部)に、必要に応じて、目的語や、主語、補語などを含
めて、1つの動詞句とするようになされている。
【0126】即ち、この場合、節「イチゴのアイスクリ
ームをお願いしたいんですが」は、名詞句「イチゴのア
イスクリームを」と、目的語を含んだ動詞句「アイスク
リームをお願いしたいんですが」とに分割される。
ームをお願いしたいんですが」は、名詞句「イチゴのア
イスクリームを」と、目的語を含んだ動詞句「アイスク
リームをお願いしたいんですが」とに分割される。
【0127】さらに、単純構文解析処理部6では、各句
の文法属性が生成(認識)され、各句に対して対応付け
られる。
の文法属性が生成(認識)され、各句に対して対応付け
られる。
【0128】即ち、名詞句「イチゴのアイスクリーム
を」については、例えば、「イチゴの」が「アイスクリ
ームを」の修飾語で、「アイスクリームを」が「イチゴ
の」の被修飾語であるという文法属性が生成される(但
し、この場合、この文法属性は、後段の処理に用いられ
ないため、以下では、特に言及しない)。
を」については、例えば、「イチゴの」が「アイスクリ
ームを」の修飾語で、「アイスクリームを」が「イチゴ
の」の被修飾語であるという文法属性が生成される(但
し、この場合、この文法属性は、後段の処理に用いられ
ないため、以下では、特に言及しない)。
【0129】また、動詞句「アイスクリームをお願いし
たいんですが」については、図5(A)に示すように、
「お願いしたいんですが」が語根「お願いする」の願望
形であるという文法属性(root「お願いする」+deside
rative)と、その目的語がアイスクリーム(食べ物)で
あるという文法属性(NP1「アイスクリームを」)とが
生成される。
たいんですが」については、図5(A)に示すように、
「お願いしたいんですが」が語根「お願いする」の願望
形であるという文法属性(root「お願いする」+deside
rative)と、その目的語がアイスクリーム(食べ物)で
あるという文法属性(NP1「アイスクリームを」)とが
生成される。
【0130】以上のようにして得られた名詞句「イチゴ
のアイスクリームを」および動詞句「アイスクリームを
お願いしたいんですが」、並びにそれらの文法属性は、
単純構文解析処理部6から変換部7に供給される。
のアイスクリームを」および動詞句「アイスクリームを
お願いしたいんですが」、並びにそれらの文法属性は、
単純構文解析処理部6から変換部7に供給される。
【0131】変換部7では、単純構文解析処理部6から
供給された句と、名詞句対訳用例記憶部8、動詞句対訳
用例記憶部9、またはその他対訳用例記憶部10の記憶
内容とが照合され、単純構文解析処理部6から供給され
た句と最も類似する用例句が、名詞句対訳用例記憶部
8、動詞句対訳用例記憶部9、またはその他対訳用例記
憶部10から検出(検索)される。
供給された句と、名詞句対訳用例記憶部8、動詞句対訳
用例記憶部9、またはその他対訳用例記憶部10の記憶
内容とが照合され、単純構文解析処理部6から供給され
た句と最も類似する用例句が、名詞句対訳用例記憶部
8、動詞句対訳用例記憶部9、またはその他対訳用例記
憶部10から検出(検索)される。
【0132】即ち、例えば、いま、動詞句対訳用例記憶
部9に、用例「田中さんをお願いしたいんですが」が、
図5(B)に示すように、文法属性root「お願いする」
+desiderative)、およびNP1「田中さんを」と関係付
けられ、さらに、その訳文「may I speak to NP1 ?」と
対応付けられて記憶されているとともに、用例「コーヒ
ーを1杯お願いしたいんですが」が、図5(C)に示す
ように、文法属性root「お願いする」+desiderativ
e)、およびNP1「コーヒーを1杯」と関係付けられ、さ
らに、その訳文「may I have NP1 ?」と対応付けられて
記憶されているとした場合、目的語「アイスクリーム
を」と「田中さんを」との意味的な距離と、目的語「ア
イスクリームを」と「コーヒーを1杯」との意味的な距
離との比較から、用例「コーヒーを1杯お願いしたいん
ですが」が、動詞句「アイスクリームをお願いしたいん
ですが」に最も類似する用例として検出される。
部9に、用例「田中さんをお願いしたいんですが」が、
図5(B)に示すように、文法属性root「お願いする」
+desiderative)、およびNP1「田中さんを」と関係付
けられ、さらに、その訳文「may I speak to NP1 ?」と
対応付けられて記憶されているとともに、用例「コーヒ
ーを1杯お願いしたいんですが」が、図5(C)に示す
ように、文法属性root「お願いする」+desiderativ
e)、およびNP1「コーヒーを1杯」と関係付けられ、さ
らに、その訳文「may I have NP1 ?」と対応付けられて
記憶されているとした場合、目的語「アイスクリーム
を」と「田中さんを」との意味的な距離と、目的語「ア
イスクリームを」と「コーヒーを1杯」との意味的な距
離との比較から、用例「コーヒーを1杯お願いしたいん
ですが」が、動詞句「アイスクリームをお願いしたいん
ですが」に最も類似する用例として検出される。
【0133】そして、この用例「コーヒーを1杯お願い
したいんですが」に対応付けられている訳文「may I ha
ve NP1 ?」が、動詞句対訳用例記憶部8から読み出さ
れ、動詞句「アイスクリームをお願いしたいんですが」
の対訳として、変換部7から句合成処理部14に供給さ
れる。
したいんですが」に対応付けられている訳文「may I ha
ve NP1 ?」が、動詞句対訳用例記憶部8から読み出さ
れ、動詞句「アイスクリームをお願いしたいんですが」
の対訳として、変換部7から句合成処理部14に供給さ
れる。
【0134】さらに、変換部7では、例えば図6(A)
に示すように、用例「昨日の牛乳」と訳文「yesterday'
s milk」とが、用例「私の本」と訳文「my book」と
が、用例「コーヒーのアイスクリーム」と訳文「coffee
flavored ice cream」とが、それぞれ対応付けられ
て、名詞句対訳用例記憶部8に記憶されているとする
と、単純構文解析処理部6からの名詞句「イチゴのアイ
スクリームを」に最も類似する用例として、「コーヒー
のアイスクリーム」が検出され、それに対応付けられて
いる訳文「coffee flavored ice cream」が、名詞句対
訳用例記憶部8から読み出される。
に示すように、用例「昨日の牛乳」と訳文「yesterday'
s milk」とが、用例「私の本」と訳文「my book」と
が、用例「コーヒーのアイスクリーム」と訳文「coffee
flavored ice cream」とが、それぞれ対応付けられ
て、名詞句対訳用例記憶部8に記憶されているとする
と、単純構文解析処理部6からの名詞句「イチゴのアイ
スクリームを」に最も類似する用例として、「コーヒー
のアイスクリーム」が検出され、それに対応付けられて
いる訳文「coffee flavored ice cream」が、名詞句対
訳用例記憶部8から読み出される。
【0135】そして、この場合、変換部7では、名詞句
「イチゴのアイスクリームを」は、用例「コーヒーのア
イスクリーム」の中の「コーヒー」が「イチゴ」となっ
たものであることが認識され、対訳辞書13を参照する
ことにより、用例にない「イチゴ」が検索される。
「イチゴのアイスクリームを」は、用例「コーヒーのア
イスクリーム」の中の「コーヒー」が「イチゴ」となっ
たものであることが認識され、対訳辞書13を参照する
ことにより、用例にない「イチゴ」が検索される。
【0136】ここで、対訳辞書13には、図6(B)に
示すように、「イチゴ」とその対訳「strawberry」とが
対応付けられて記憶されているものとする。
示すように、「イチゴ」とその対訳「strawberry」とが
対応付けられて記憶されているものとする。
【0137】変換部7は、対訳辞書13から「イチゴ」
を検索すると、それに対応付けられている「strawberr
y」を読み出す。そして、名詞句対訳用例記憶部8から
読み出した訳文「coffee flavored ice cream」の中
の、「イチゴ」に対応する「コーヒー」の対訳「coffe
e」が、対訳辞書13から読み出された「strawberry」
に置換され、これにより、名詞句「イチゴのアイスクリ
ームを」の訳文「strawberryflavored ice cream」が生
成される。この訳文「strawberry flavored ice crea
m」は、変換部7から句合成処理部14に供給される。
を検索すると、それに対応付けられている「strawberr
y」を読み出す。そして、名詞句対訳用例記憶部8から
読み出した訳文「coffee flavored ice cream」の中
の、「イチゴ」に対応する「コーヒー」の対訳「coffe
e」が、対訳辞書13から読み出された「strawberry」
に置換され、これにより、名詞句「イチゴのアイスクリ
ームを」の訳文「strawberryflavored ice cream」が生
成される。この訳文「strawberry flavored ice crea
m」は、変換部7から句合成処理部14に供給される。
【0138】句合成処理部14では、名詞句「イチゴの
アイスクリームを」の訳文「strawberry flavored ice
cream」、および動詞句「アイスクリームをお願いした
いんですが」の訳文「may I have NP1 ?」が合成され、
これにより、節「イチゴのアイスクリームをお願いした
いんですが」の訳文「may I have strawberry flavored
ice cream ?」が生成されて、節合成処理部15に供給
される。
アイスクリームを」の訳文「strawberry flavored ice
cream」、および動詞句「アイスクリームをお願いした
いんですが」の訳文「may I have NP1 ?」が合成され、
これにより、節「イチゴのアイスクリームをお願いした
いんですが」の訳文「may I have strawberry flavored
ice cream ?」が生成されて、節合成処理部15に供給
される。
【0139】節合成処理部15は、節「イチゴのアイス
クリームをお願いしたいんですが」の訳文「may I have
strawberry flavored ice cream ?」、および節「でき
ましたら」の訳文「X, if possible」を受信すると、こ
れらを合成する。これにより、第1言語文「できました
らイチゴのアイスクリームをお願いしたいんですが」を
第2言語に訳した第2言語文「may I have strawberry
flavored ice cream,if possible ?」が生成される。
クリームをお願いしたいんですが」の訳文「may I have
strawberry flavored ice cream ?」、および節「でき
ましたら」の訳文「X, if possible」を受信すると、こ
れらを合成する。これにより、第1言語文「できました
らイチゴのアイスクリームをお願いしたいんですが」を
第2言語に訳した第2言語文「may I have strawberry
flavored ice cream,if possible ?」が生成される。
【0140】次に、変換部7において行われる、入力句
に最も類似する用例句の検出の方法について詳述する。
いま、入力句Iを構成する単語を、その先頭からi
w1,iw2,・・・,iwNと表し、その有する文法属
性を、if1,if2,・・・,ifQと表す。同様に、
用例句Eを構成する単語を、その先頭からew1,e
w2,・・・,ewMと表し、その有する文法属性を、e
f1,ef2,・・・,efPと表す。ここで、Mまたは
Nは、用例句Eまたは入力句Iそれぞれを構成する単語
数を表し、PまたはQは、用例句Eまたは入力句Iそれ
ぞれが有する(それぞれから抽出された)文法属性の数
を表す。
に最も類似する用例句の検出の方法について詳述する。
いま、入力句Iを構成する単語を、その先頭からi
w1,iw2,・・・,iwNと表し、その有する文法属
性を、if1,if2,・・・,ifQと表す。同様に、
用例句Eを構成する単語を、その先頭からew1,e
w2,・・・,ewMと表し、その有する文法属性を、e
f1,ef2,・・・,efPと表す。ここで、Mまたは
Nは、用例句Eまたは入力句Iそれぞれを構成する単語
数を表し、PまたはQは、用例句Eまたは入力句Iそれ
ぞれが有する(それぞれから抽出された)文法属性の数
を表す。
【0141】入力句に最も類似(意味的に類似する)す
る用例句というのは、その入力句の翻訳処理に利用する
のに最も適したものである。いま、ある用例句Eが、入
力句Iの翻訳のために適している確率を、翻訳適正率と
いうとすると、この翻訳適正率は、用例句の条件付き確
率として、P(Example|Input)と表すこ
とができる。但し、P()は確率を表し、Exampl
eまたはInputは、用例句の集合または入力句の集
合をそれぞれ意味する。
る用例句というのは、その入力句の翻訳処理に利用する
のに最も適したものである。いま、ある用例句Eが、入
力句Iの翻訳のために適している確率を、翻訳適正率と
いうとすると、この翻訳適正率は、用例句の条件付き確
率として、P(Example|Input)と表すこ
とができる。但し、P()は確率を表し、Exampl
eまたはInputは、用例句の集合または入力句の集
合をそれぞれ意味する。
【0142】入力句に最も類似する用例句とは、この翻
訳適正率P(Example|Input)が最も高い
ものであり、これを、Emaxと表すとすると、この用例
句Em axは、式(2)により求めることができる。
訳適正率P(Example|Input)が最も高い
ものであり、これを、Emaxと表すとすると、この用例
句Em axは、式(2)により求めることができる。
【0143】
【数2】 ・・・(2) 但し、式(2)の右辺は、[]内の値が最大となるEを
求める演算を意味する。
求める演算を意味する。
【0144】ところで、翻訳適正率P(Example
|Input)は、ベイズ(Bayes)の法則により、式
(3)のように表すことができる。
|Input)は、ベイズ(Bayes)の法則により、式
(3)のように表すことができる。
【0145】 P(Example|Input)=P(Example)P(Input|Example)/P(Input) ・・・(3)
【0146】ここで、ある入力句Iに最も類似する用例
句E(Emax)を求める場合、その入力句は1つである
から、即ち、Input=Iであるから、式(3)の分
母P(Input)は1であり、無視することができ
る。従って、式(2)および(3)から、次の式(4)
により、入力句Iに最も類似する用例句Emaxを求める
ことができる。
句E(Emax)を求める場合、その入力句は1つである
から、即ち、Input=Iであるから、式(3)の分
母P(Input)は1であり、無視することができ
る。従って、式(2)および(3)から、次の式(4)
により、入力句Iに最も類似する用例句Emaxを求める
ことができる。
【0147】
【数3】 ・・・(4)
【0148】式(4)から、入力句に対する翻訳適正率
が最大の用例句を求めるためには、確率P(E)および
P(I|E)を求める必要がある。
が最大の用例句を求めるためには、確率P(E)および
P(I|E)を求める必要がある。
【0149】ここで、確率P(E)は、用例E(E∈E
xample)が翻訳に用いられる事前確率を表す。ま
た、確率(条件付き確率)P(I|E)は、用例句E
が、入力句Iのように変形されて用いられる確率(以
下、適宜、変形確率という)を表す。
xample)が翻訳に用いられる事前確率を表す。ま
た、確率(条件付き確率)P(I|E)は、用例句E
が、入力句Iのように変形されて用いられる確率(以
下、適宜、変形確率という)を表す。
【0150】事前確率P(E)は、任意の入力句に対し
て、用例句Eが用いられることの適正さに対応している
必要があり、従って、例えば、以下のような要素が反映
されるべきである。即ち、事前確率P(E)には、ま
ず、翻訳装置が適用されるドメイン(翻訳装置に入力さ
れる表現(文章)のタイプ(例えば、機械のマニュアル
に記載された文章であるとか、新聞記事であるとかな
ど)において、どのような表現が頻繁に用いられるかと
いう要素を反映させる必要がある。
て、用例句Eが用いられることの適正さに対応している
必要があり、従って、例えば、以下のような要素が反映
されるべきである。即ち、事前確率P(E)には、ま
ず、翻訳装置が適用されるドメイン(翻訳装置に入力さ
れる表現(文章)のタイプ(例えば、機械のマニュアル
に記載された文章であるとか、新聞記事であるとかな
ど)において、どのような表現が頻繁に用いられるかと
いう要素を反映させる必要がある。
【0151】具体的には、ドメインで頻繁に用いられる
表現に対応する用例句Eには、稀にしか用いられない表
現や、ドメインにあまり関係のない意味内容を持つ表現
に対応する用例句Eよりも高い事前確率P(E)を与え
る必要がある。
表現に対応する用例句Eには、稀にしか用いられない表
現や、ドメインにあまり関係のない意味内容を持つ表現
に対応する用例句Eよりも高い事前確率P(E)を与え
る必要がある。
【0152】次に、事前確率P(E)には、その用例句
Eの他に、翻訳装置にどのような用例句が記憶されてい
るのかという要素(図1の翻訳装置では、用例句は、名
詞句、動詞句、またはその他の句に分けて、名詞句対訳
用例記憶部8、動詞句対訳用例記憶部9、またはその他
対訳用例記憶部10にそれぞれ記憶されているので、入
力句が、名詞句、動詞句、またはその他の句である場合
には、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10に、それぞれどの
ような用例句が記憶されているのかという要素というこ
とになる)を反映させる必要がある。具体的には、例え
ば、非常に一般的で他に類似した用例句がほとんど存在
しない用例句Eに対しては、特殊な用例句や、類似する
用例句が数多く存在する用例句よりも高い事前確率P
(E)を与える必要がある。
Eの他に、翻訳装置にどのような用例句が記憶されてい
るのかという要素(図1の翻訳装置では、用例句は、名
詞句、動詞句、またはその他の句に分けて、名詞句対訳
用例記憶部8、動詞句対訳用例記憶部9、またはその他
対訳用例記憶部10にそれぞれ記憶されているので、入
力句が、名詞句、動詞句、またはその他の句である場合
には、名詞句対訳用例記憶部8、動詞句対訳用例記憶部
9、またはその他対訳用例記憶部10に、それぞれどの
ような用例句が記憶されているのかという要素というこ
とになる)を反映させる必要がある。具体的には、例え
ば、非常に一般的で他に類似した用例句がほとんど存在
しない用例句Eに対しては、特殊な用例句や、類似する
用例句が数多く存在する用例句よりも高い事前確率P
(E)を与える必要がある。
【0153】以上のような要素を、適切に反映させた事
前確率P(E)は、例えば、翻訳装置が適用されるドメ
インで典型的に使われる言語表現の集合であるコーパス
データ(訓練コーパスデータ)を用いて求めることがで
きる。
前確率P(E)は、例えば、翻訳装置が適用されるドメ
インで典型的に使われる言語表現の集合であるコーパス
データ(訓練コーパスデータ)を用いて求めることがで
きる。
【0154】即ち、例えば、翻訳装置に記憶されている
用例句のうち、コーパスデータを翻訳するのに最適なも
のを、人手などにより正確に選択することを、コーパス
データすべてについて行う。この場合、翻訳装置に記憶
されている用例句の数をNEと、それらの用例句が選択
された延べ回数(総数)をTと、用例Ei(但し、i=
1,2,・・・,NE)が選択された回数をfreq
(Ei)と、それぞれ表すと、各用例Eiについての事前
確率P(Ei)は、例えば、式(5)により求めること
ができる。
用例句のうち、コーパスデータを翻訳するのに最適なも
のを、人手などにより正確に選択することを、コーパス
データすべてについて行う。この場合、翻訳装置に記憶
されている用例句の数をNEと、それらの用例句が選択
された延べ回数(総数)をTと、用例Ei(但し、i=
1,2,・・・,NE)が選択された回数をfreq
(Ei)と、それぞれ表すと、各用例Eiについての事前
確率P(Ei)は、例えば、式(5)により求めること
ができる。
【0155】
【数4】 ・・・(5)
【0156】ここで、コーパスデータの翻訳に最も適し
ている用例句を、人手により選択するのが困難である場
合には、図1の翻訳装置にコーパスデータの翻訳を行わ
せることにより、式(5)における事前確率P(Ei)
の近似値を求めることができる。
ている用例句を、人手により選択するのが困難である場
合には、図1の翻訳装置にコーパスデータの翻訳を行わ
せることにより、式(5)における事前確率P(Ei)
の近似値を求めることができる。
【0157】即ち、図7のフローチャートに示すよう
に、まず最初に、ステップS21において、事前確率P
(Ei)を、すべて、例えば1/NEなどに初期化し、ス
テップS22に進む。ステップS22では、事前確率P
(Ei)を用いて、コーパスデータすべてを、図1の翻
訳装置に翻訳させ、その際に、用例句Eiが用いられる
回数F(Ei)をカウントする。そして、ステップS2
3において、事前確率P(Ei)を、例えば、式P
(Ei)=F(Ei)/Σにしたがって更新する。但し、
Σは、F(Ei)についての、iを1からNEに代えての
サメーションを意味する。
に、まず最初に、ステップS21において、事前確率P
(Ei)を、すべて、例えば1/NEなどに初期化し、ス
テップS22に進む。ステップS22では、事前確率P
(Ei)を用いて、コーパスデータすべてを、図1の翻
訳装置に翻訳させ、その際に、用例句Eiが用いられる
回数F(Ei)をカウントする。そして、ステップS2
3において、事前確率P(Ei)を、例えば、式P
(Ei)=F(Ei)/Σにしたがって更新する。但し、
Σは、F(Ei)についての、iを1からNEに代えての
サメーションを意味する。
【0158】事前確率P(Ei)を、すべての用例句Ei
について更新した後は、ステップS24に進み、最大の
事前確率を与える用例句Ei(max)を検出する。そして、
ステップS25に進み、その用例句Ei(max)についての
事前確率P(Ei(max))が所定の閾値より小さいかどう
かを判定し、小さくない場合には、ステップS22に戻
り、ステップS22乃至S25の処理を繰り返す。ま
た、事前確率P(Ei(max))が所定の閾値より小さい場
合、その時点における事前確率P(Ei)を、各用例句
Eiについての事前確率として出力し、処理を終了す
る。
について更新した後は、ステップS24に進み、最大の
事前確率を与える用例句Ei(max)を検出する。そして、
ステップS25に進み、その用例句Ei(max)についての
事前確率P(Ei(max))が所定の閾値より小さいかどう
かを判定し、小さくない場合には、ステップS22に戻
り、ステップS22乃至S25の処理を繰り返す。ま
た、事前確率P(Ei(max))が所定の閾値より小さい場
合、その時点における事前確率P(Ei)を、各用例句
Eiについての事前確率として出力し、処理を終了す
る。
【0159】次に、コーパスデータを入手することが困
難な場合には、例えば、翻訳装置に記憶されている用例
句を用い、次のようにして事前確率P(Ei)を求める
ことも可能である。
難な場合には、例えば、翻訳装置に記憶されている用例
句を用い、次のようにして事前確率P(Ei)を求める
ことも可能である。
【0160】即ち、事前確率P(Ei)を求める用例句
Eiを構成する単語のうち、他の用例句を構成する単語
と一致するものの数をWNと、用例句Eiが有する文法属
性のうち、他の用例が有する文法属性と一致するものの
数をFNと、それぞれ表すとすると、その用例句Eiの一
般性、あるいは他の用例に対する類似性sim−sco
re(Ei)は、例えば、(WN+FN)/(用例句Eiを
構成する単語数)で見積もることができる。この場合、
事前確率P(Ei)は、例えば、式(6)にしたがって
求めることができる。
Eiを構成する単語のうち、他の用例句を構成する単語
と一致するものの数をWNと、用例句Eiが有する文法属
性のうち、他の用例が有する文法属性と一致するものの
数をFNと、それぞれ表すとすると、その用例句Eiの一
般性、あるいは他の用例に対する類似性sim−sco
re(Ei)は、例えば、(WN+FN)/(用例句Eiを
構成する単語数)で見積もることができる。この場合、
事前確率P(Ei)は、例えば、式(6)にしたがって
求めることができる。
【0161】
【数5】 ・・・(6)
【0162】次に、変形確率P(I|E)は、次のよう
にして求めることができる。即ち、ユーザが、用例句E
の意味内容を表現しようとする場合、ある高い確率で、
ユーザは、用例句Eと一語一句変わらない表現を用い、
また、それより少し低い確率で、用例句Eと、少しだけ
異なる表現を用い、さらに、より低い確率で、用例Eと
は大きく異なる表現を用いると考えることができる。
にして求めることができる。即ち、ユーザが、用例句E
の意味内容を表現しようとする場合、ある高い確率で、
ユーザは、用例句Eと一語一句変わらない表現を用い、
また、それより少し低い確率で、用例句Eと、少しだけ
異なる表現を用い、さらに、より低い確率で、用例Eと
は大きく異なる表現を用いると考えることができる。
【0163】従って、入力句Iは、ユーザにおける言語
生成過程で、用例句Eの表現が歪められた変異型である
とみなすことができる。そこで、用例句Eを変形する
(歪める)ための変形オペレータとして、以下のような
ものを導入する。
生成過程で、用例句Eの表現が歪められた変異型である
とみなすことができる。そこで、用例句Eを変形する
(歪める)ための変形オペレータとして、以下のような
ものを導入する。
【0164】即ち、用例句Eを構成する単語に対するオ
ペレータとして、単語複写オペレータecho−wor
d(ewm,iwn)、単語省略オペレータdelete
−word(ewm)、単語挿入オペレータadd−w
ord(iwn)、および単語置換オペレータalte
r−word(ewm,iwn)を導入する。さらに、用
例句Eが有する文法属性に対するオペレータとして、文
法属性複写オペレータecho−feature(ef
p,ifq)、文法属性省略オペレータdelete−f
eature(efp)、文法属性挿入オペレータad
d−feature(ifq)、および文法属性置換オ
ペレータalter−feature(efp,ifq)
を導入する。
ペレータとして、単語複写オペレータecho−wor
d(ewm,iwn)、単語省略オペレータdelete
−word(ewm)、単語挿入オペレータadd−w
ord(iwn)、および単語置換オペレータalte
r−word(ewm,iwn)を導入する。さらに、用
例句Eが有する文法属性に対するオペレータとして、文
法属性複写オペレータecho−feature(ef
p,ifq)、文法属性省略オペレータdelete−f
eature(efp)、文法属性挿入オペレータad
d−feature(ifq)、および文法属性置換オ
ペレータalter−feature(efp,ifq)
を導入する。
【0165】ここで、単語複写オペレータecho−w
ord(ewm,iwn)は、用例句Eを構成するm番目
(先頭からm番目)の単語ewmを、そのまま、入力句
Iを構成するn番目の単語iwnとするオペレータであ
る。単語省略オペレータdelete−word(ew
m)は、用例句Eを構成するm番目の単語ewmを省略
(削除)するオペレータである。単語挿入オペレータa
dd−word(iwn)は、入力句Iを構成するn番
目の単語iwnを、用例句Eに挿入(追加)するオペレ
ータである。単語置換オペレータalter−word
(ewm,iwn)は、用例句Eを構成するm番目の単語
ewmを、入力句Iを構成するn番目の単語iwn(但
し、ここでは、単語iwnは、単語ewmと意味的には近
いが異なるものであるとする)と置換するオペレータで
ある。
ord(ewm,iwn)は、用例句Eを構成するm番目
(先頭からm番目)の単語ewmを、そのまま、入力句
Iを構成するn番目の単語iwnとするオペレータであ
る。単語省略オペレータdelete−word(ew
m)は、用例句Eを構成するm番目の単語ewmを省略
(削除)するオペレータである。単語挿入オペレータa
dd−word(iwn)は、入力句Iを構成するn番
目の単語iwnを、用例句Eに挿入(追加)するオペレ
ータである。単語置換オペレータalter−word
(ewm,iwn)は、用例句Eを構成するm番目の単語
ewmを、入力句Iを構成するn番目の単語iwn(但
し、ここでは、単語iwnは、単語ewmと意味的には近
いが異なるものであるとする)と置換するオペレータで
ある。
【0166】また、文法属性複写オペレータecho−
feature(efp,ifq)は、用例句Eが有する
p番目の文法属性efp(文法属性の場合、それが何番
目のものであるかは、特に、処理に影響するものではな
く、従って、文法属性の順番は、ここでは、便宜的なも
のである)を、そのまま、入力句Iが有するq番目の文
法属性ifqとするオペレータである。文法属性省略オ
ペレータdelete−feature(efp)は、
用例句Eが有するp番目の文法属性efpを省略するオ
ペレータである。文法属性挿入オペレータadd−fe
ature(ifq)は、入力句Iが有するq番目の文
法属性ifqを、用例句Eに挿入するオペレータであ
る。文法属性置換オペレータalter−featur
e(efp,ifq)は、用例句Eが有するp番目の単語
efpを、入力句Iが有するq番目の文法属性ifq(但
し、ここでは、文法属性ifqは、文法属性efpと意味
的には近いが異なるものであるとする)と置換するオペ
レータである。
feature(efp,ifq)は、用例句Eが有する
p番目の文法属性efp(文法属性の場合、それが何番
目のものであるかは、特に、処理に影響するものではな
く、従って、文法属性の順番は、ここでは、便宜的なも
のである)を、そのまま、入力句Iが有するq番目の文
法属性ifqとするオペレータである。文法属性省略オ
ペレータdelete−feature(efp)は、
用例句Eが有するp番目の文法属性efpを省略するオ
ペレータである。文法属性挿入オペレータadd−fe
ature(ifq)は、入力句Iが有するq番目の文
法属性ifqを、用例句Eに挿入するオペレータであ
る。文法属性置換オペレータalter−featur
e(efp,ifq)は、用例句Eが有するp番目の単語
efpを、入力句Iが有するq番目の文法属性ifq(但
し、ここでは、文法属性ifqは、文法属性efpと意味
的には近いが異なるものであるとする)と置換するオペ
レータである。
【0167】いま、上述の変形オペレータまとめてを、
distortzと表し、用例句Eに対し、Z個の変形
オペレータdistort1,distort2,・・
・,distortZが適用されて得られるものが、入
力句Iであるとすると、入力句Iは、式(7)に示すよ
うに、これらの変形オペレータの集合として定義するこ
とができる。
distortzと表し、用例句Eに対し、Z個の変形
オペレータdistort1,distort2,・・
・,distortZが適用されて得られるものが、入
力句Iであるとすると、入力句Iは、式(7)に示すよ
うに、これらの変形オペレータの集合として定義するこ
とができる。
【0168】 I={distort1,distort2,・・・,distortZ} ・・・(7)
【0169】なお、用例句Eから入力句Iへの変形の仕
方は、複数存在するかもしれないが、ここでは確率性が
最も高い直接的な経路にしたがった変形だけを考慮すれ
ば充分である。
方は、複数存在するかもしれないが、ここでは確率性が
最も高い直接的な経路にしたがった変形だけを考慮すれ
ば充分である。
【0170】式(7)から、変形確率P(I|E)は、
式(8)のように表すことができる。
式(8)のように表すことができる。
【0171】 P(I|E)=P({distort1,distort2,・・・,distortZ}|E) ・・・(8)
【0172】ここで、式(9)に示すように、各変形オ
ペレータは独立しているとみなすことができる。
ペレータは独立しているとみなすことができる。
【0173】
【数6】 ・・・(9)
【0174】従って、式(9)から、式(8)は、式
(10)に示すように単純化することができ、その結
果、変形確率P(I|E)は、式(11)に示すように
なる。
(10)に示すように単純化することができ、その結
果、変形確率P(I|E)は、式(11)に示すように
なる。
【0175】
【数7】 ・・・(10)
【数8】 ・・・(11)
【0176】さらに、用例句Eは、単語ewm(m=
1,2,・・・,M)、および文法属性efp(p=
1,2,・・・,P)の集合で表すことができるから、
式(11)は、式(12)に示すようになる。
1,2,・・・,M)、および文法属性efp(p=
1,2,・・・,P)の集合で表すことができるから、
式(11)は、式(12)に示すようになる。
【0177】
【数9】 ・・・(12)
【0178】式(12)から、変形オペレータdist
ortkが、単語複写オペレータecho−word
(ewm,iwn)、単語省略オペレータdelete−
word(ewm)、単語挿入オペレータadd−wo
rd(iwn)、単語置換オペレータalter−wo
rd(ewm,iwn)、文法属性複写オペレータech
o−feature(efp,ifq)、文法属性省略オ
ペレータdelete−feature(efp)、文
法属性挿入オペレータadd−feature(i
fq)、または文法属性置換オペレータalter−f
eature(efp,ifq)それぞれである場合の確
率P(distortk|ew1,ew2,・・・,e
wM;ef1,ef2,・・・,efP)がわかれば、変形
確率P(I|E)を求めることができる。
ortkが、単語複写オペレータecho−word
(ewm,iwn)、単語省略オペレータdelete−
word(ewm)、単語挿入オペレータadd−wo
rd(iwn)、単語置換オペレータalter−wo
rd(ewm,iwn)、文法属性複写オペレータech
o−feature(efp,ifq)、文法属性省略オ
ペレータdelete−feature(efp)、文
法属性挿入オペレータadd−feature(i
fq)、または文法属性置換オペレータalter−f
eature(efp,ifq)それぞれである場合の確
率P(distortk|ew1,ew2,・・・,e
wM;ef1,ef2,・・・,efP)がわかれば、変形
確率P(I|E)を求めることができる。
【0179】ここで、各変形オペレータについては、次
のような仮定をすることができ、その結果、各変形オペ
レータについての確率P(distortk|ew1,e
w2,・・・,ewM;ef1,ef2,・・・,efP)
は簡単化することができる。
のような仮定をすることができ、その結果、各変形オペ
レータについての確率P(distortk|ew1,e
w2,・・・,ewM;ef1,ef2,・・・,efP)
は簡単化することができる。
【0180】即ち、単語複写オペレータecho−wo
rd(ewm,iwn)については、用例句Eを構成する
m番目の単語ewmが、そのまま入力句Iを構成する単
語iwnとされる確率は、それらの単語ewm,iwnに
のみ依存すると仮定することができる。従って、確率P
(echo−word(ewm,iwn)|ew1,e
w2,・・・,ewM;ef1,ef2,・・・,efP)
は、式(13)に示すように簡単化することができる。
rd(ewm,iwn)については、用例句Eを構成する
m番目の単語ewmが、そのまま入力句Iを構成する単
語iwnとされる確率は、それらの単語ewm,iwnに
のみ依存すると仮定することができる。従って、確率P
(echo−word(ewm,iwn)|ew1,e
w2,・・・,ewM;ef1,ef2,・・・,efP)
は、式(13)に示すように簡単化することができる。
【0181】
【数10】 ・・・(13) なお、式(13)で示される確率は、単語ewmが、そ
のまま入力句Iを構成する単語として、いわば複写され
る確率を表すから、以下、適宜、単語複写確率という。
のまま入力句Iを構成する単語として、いわば複写され
る確率を表すから、以下、適宜、単語複写確率という。
【0182】単語省略オペレータdelete−wor
d(ewm)については、用例句Eを構成するm番目の
単語ewmが省略される確率は、その単語ewmにのみ依
存すると仮定することができる。従って、確率P(de
lete−word(ewm)|ew1,ew2,・・
・,ewM;ef1,ef2,・・・,efP)は、式(1
4)に示すように簡単化することができる。
d(ewm)については、用例句Eを構成するm番目の
単語ewmが省略される確率は、その単語ewmにのみ依
存すると仮定することができる。従って、確率P(de
lete−word(ewm)|ew1,ew2,・・
・,ewM;ef1,ef2,・・・,efP)は、式(1
4)に示すように簡単化することができる。
【0183】
【数11】 ・・・(14) なお、式(14)で示される確率は、単語ewmが省略
される確率を表すから、以下、適宜、単語省略確率とい
う。
される確率を表すから、以下、適宜、単語省略確率とい
う。
【0184】単語挿入オペレータadd−word(i
wn)については、用例句Eに、入力句Iを構成するn
番目の単語iwmが挿入される確率は、その単語iwmに
のみ依存すると仮定することができる。従って、確率P
(add−word(iwn)|ew1,ew2,・・
・,ewM;ef1,ef2,・・・,efP)は、式(1
5)に示すように簡単化することができる。
wn)については、用例句Eに、入力句Iを構成するn
番目の単語iwmが挿入される確率は、その単語iwmに
のみ依存すると仮定することができる。従って、確率P
(add−word(iwn)|ew1,ew2,・・
・,ewM;ef1,ef2,・・・,efP)は、式(1
5)に示すように簡単化することができる。
【0185】
【数12】 ・・・(15) なお、式(15)で示される確率は、単語iwnが挿入
(付加)される確率を表すから、以下、適宜、単語挿入
確率(あるいは、単語付加確率)という。
(付加)される確率を表すから、以下、適宜、単語挿入
確率(あるいは、単語付加確率)という。
【0186】単語置換オペレータalter−word
(ewm,iwn)については、用例句Eを構成するm番
目の単語ewmが、入力句Iを構成するn番目の単語i
wnと置換される確率は、それらの単語ewmおよびiw
nにのみ依存すると仮定することができる。従って、確
率P(alter−word(ewm,iwn)|e
w1,ew2,・・・,ewM;ef1,ef2,・・・,
efP)は、式(16)に示すように簡単化することが
できる。
(ewm,iwn)については、用例句Eを構成するm番
目の単語ewmが、入力句Iを構成するn番目の単語i
wnと置換される確率は、それらの単語ewmおよびiw
nにのみ依存すると仮定することができる。従って、確
率P(alter−word(ewm,iwn)|e
w1,ew2,・・・,ewM;ef1,ef2,・・・,
efP)は、式(16)に示すように簡単化することが
できる。
【0187】
【数13】 ・・・(16) なお、式(16)で示される確率は、単語ewmが単語
iwnと置換される確率を表すから、以下、適宜、単語
置換確率という。
iwnと置換される確率を表すから、以下、適宜、単語
置換確率という。
【0188】文法属性の複写、省略、挿入、または置換
を表す文法属性複写オペレータecho−featur
e(efp,ifq)、文法属性省略オペレータdele
te−feature(efp)、文法属性挿入オペレ
ータadd−feature(ifq)、または文法属
性置換オペレータalter−feature(e
fp,ifq)についても、単語の複写、省略、挿入、ま
たは置換を表す単語複写オペレータecho−word
(ewm,iwn)、単語省略オペレータdelete−
word(ewm)、単語挿入オペレータadd−wo
rd(iwn)、または単語置換オペレータalter
−word(ewm,iwn)における単語を、文法属性
に置き換えた場合と同様の仮定をすることができる。
を表す文法属性複写オペレータecho−featur
e(efp,ifq)、文法属性省略オペレータdele
te−feature(efp)、文法属性挿入オペレ
ータadd−feature(ifq)、または文法属
性置換オペレータalter−feature(e
fp,ifq)についても、単語の複写、省略、挿入、ま
たは置換を表す単語複写オペレータecho−word
(ewm,iwn)、単語省略オペレータdelete−
word(ewm)、単語挿入オペレータadd−wo
rd(iwn)、または単語置換オペレータalter
−word(ewm,iwn)における単語を、文法属性
に置き換えた場合と同様の仮定をすることができる。
【0189】その結果、文法属性efpが複写される確
率(以下、適宜、文法属性複写確率という)P(ech
o−feature(efp,ifq)|ew1,ew2,
・・・,ewM;ef1,ef2,・・・,efP)、文法
属性efpが省略される確率(以下、適宜、文法属性省
略確率という)P(delete−feature(e
fp)|ew1,ew2,・・・,ewM;ef1,ef2,
・・・,efP)、文法属性ifqが挿入される確率(以
下、適宜、文法属性挿入確率という)P(add−fe
ature(ifq)|ew1,ew2,・・・,ewM;
ef1,ef2,・・・,efP)、または文法属性efp
が文法属性ifqと置換される確率(以下、適宜、文法
属性置換確率という)P(alter−feature
(efp,ifq)|ew1,ew2,・・・,ewM;e
f1,ef2,・・・,efP)は、それぞれ式(17)
乃至(20)に示すように簡単化することができる。
率(以下、適宜、文法属性複写確率という)P(ech
o−feature(efp,ifq)|ew1,ew2,
・・・,ewM;ef1,ef2,・・・,efP)、文法
属性efpが省略される確率(以下、適宜、文法属性省
略確率という)P(delete−feature(e
fp)|ew1,ew2,・・・,ewM;ef1,ef2,
・・・,efP)、文法属性ifqが挿入される確率(以
下、適宜、文法属性挿入確率という)P(add−fe
ature(ifq)|ew1,ew2,・・・,ewM;
ef1,ef2,・・・,efP)、または文法属性efp
が文法属性ifqと置換される確率(以下、適宜、文法
属性置換確率という)P(alter−feature
(efp,ifq)|ew1,ew2,・・・,ewM;e
f1,ef2,・・・,efP)は、それぞれ式(17)
乃至(20)に示すように簡単化することができる。
【0190】
【数14】 ・・・(17)
【数15】 ・・・(18)
【数16】 ・・・(19)
【数17】 ・・・(20)
【0191】以上から、単語についての変形オペレータ
(以下、適宜、単語変形オペレータという)である単語
複写オペレータecho−word(ewm,iwn)、
単語省略オペレータdelete−word(e
wm)、単語挿入オペレータadd−word(i
wn)、および単語置換オペレータalter−wor
d(ewm,iwn)をまとめて、distort−wo
rdx(ewm,iwn)と表すとともに、文法属性につ
いての変形オペレータ(以下、適宜、文法属性変形オペ
レータという)である文法属性複写オペレータecho
−feature(efp,ifq)、文法属性省略オペ
レータdelete−feature(efp)、文法
属性挿入オペレータadd−feature(i
fq)、および文法属性置換オペレータalter−f
eature(efp,ifq)をまとめて、disto
rt−featurey(efp,ifq)と表すとする
と、式(11)で表される変形確率P(I|E)は、式
(21)に示すように、単語変形オペレータdisto
rt−wordx(ewm,iwn)による変形確率(以
下、適宜、単語変形確率という)P(distort−
wordx(ewm,iwn))の積と、文法属性変形オ
ペレータdistort−featurey(efp,i
fq)による変形確率(以下、適宜、文法属性変形確率
という)P(distort−featurey(e
fp,ifq))の積とで表すことができる。
(以下、適宜、単語変形オペレータという)である単語
複写オペレータecho−word(ewm,iwn)、
単語省略オペレータdelete−word(e
wm)、単語挿入オペレータadd−word(i
wn)、および単語置換オペレータalter−wor
d(ewm,iwn)をまとめて、distort−wo
rdx(ewm,iwn)と表すとともに、文法属性につ
いての変形オペレータ(以下、適宜、文法属性変形オペ
レータという)である文法属性複写オペレータecho
−feature(efp,ifq)、文法属性省略オペ
レータdelete−feature(efp)、文法
属性挿入オペレータadd−feature(i
fq)、および文法属性置換オペレータalter−f
eature(efp,ifq)をまとめて、disto
rt−featurey(efp,ifq)と表すとする
と、式(11)で表される変形確率P(I|E)は、式
(21)に示すように、単語変形オペレータdisto
rt−wordx(ewm,iwn)による変形確率(以
下、適宜、単語変形確率という)P(distort−
wordx(ewm,iwn))の積と、文法属性変形オ
ペレータdistort−featurey(efp,i
fq)による変形確率(以下、適宜、文法属性変形確率
という)P(distort−featurey(e
fp,ifq))の積とで表すことができる。
【0192】
【数18】 ・・・(21) 但し、XまたはYは、適用される単語変形オペレータま
たは文法属性変形オペレータそれぞれの総数を表し、X
+Y=Z(式(11))である。
たは文法属性変形オペレータそれぞれの総数を表し、X
+Y=Z(式(11))である。
【0193】次に、単語複写確率P(echo−wor
d(ewm,iwn))、単語省略確率P(delete
−word(ewm))、単語挿入確率P(add−w
ord(iwn))、単語置換確率P(alter−w
ord(ewm,iwn))、文法属性複写確率P(ec
ho−feature(efp,ifq))、文法属性省
略確率P(delete−feature(e
fp))、文法属性挿入確率P(add−featur
e(ifq)|)、または文法属性置換確率P(alt
er−feature(efp,ifq))それぞれの算
出方法について説明する。
d(ewm,iwn))、単語省略確率P(delete
−word(ewm))、単語挿入確率P(add−w
ord(iwn))、単語置換確率P(alter−w
ord(ewm,iwn))、文法属性複写確率P(ec
ho−feature(efp,ifq))、文法属性省
略確率P(delete−feature(e
fp))、文法属性挿入確率P(add−featur
e(ifq)|)、または文法属性置換確率P(alt
er−feature(efp,ifq))それぞれの算
出方法について説明する。
【0194】まず、単語複写確率P(echo−wor
d(ewm,iwn))、単語省略確率P(delete
−word(ewm))、および単語挿入確率P(ad
d−word(iwn))は、人間の言語生成行動を反
映するものであるとみなすことができる。即ち、ある種
の単語は、他の単語よりも、複写、省略、または挿入さ
れる確率が高かったり、また、低かったりする。従っ
て、翻訳装置が適用されるドメインのコーパスデータが
入手可能な場合には、単語が複写、省略、置換される確
率分布をコーパスデータから算出し、これにより、単語
複写確率P(echo−word(ewm,iwn))、
単語省略確率P(delete−word(e
wm))、または単語挿入確率P(add−word
(iwn))それぞれを求めることができる。
d(ewm,iwn))、単語省略確率P(delete
−word(ewm))、および単語挿入確率P(ad
d−word(iwn))は、人間の言語生成行動を反
映するものであるとみなすことができる。即ち、ある種
の単語は、他の単語よりも、複写、省略、または挿入さ
れる確率が高かったり、また、低かったりする。従っ
て、翻訳装置が適用されるドメインのコーパスデータが
入手可能な場合には、単語が複写、省略、置換される確
率分布をコーパスデータから算出し、これにより、単語
複写確率P(echo−word(ewm,iwn))、
単語省略確率P(delete−word(e
wm))、または単語挿入確率P(add−word
(iwn))それぞれを求めることができる。
【0195】一方、コーパスデータを入手することが困
難な場合には、言語生成中における各単語の動向(単語
の取扱いの傾向(例えば、そのまま用いられ易いとか、
省略、または挿入され易いなどの傾向))に基づいて、
単語を、幾つかのグループに分類し、各グループごと
に、単語複写確率P(echo−word(ewm,i
wn))、単語省略確率P(delete−word
(ewm))、または単語挿入確率P(add−wor
d(iwn))それぞれを与えるようにすることができ
る。
難な場合には、言語生成中における各単語の動向(単語
の取扱いの傾向(例えば、そのまま用いられ易いとか、
省略、または挿入され易いなどの傾向))に基づいて、
単語を、幾つかのグループに分類し、各グループごと
に、単語複写確率P(echo−word(ewm,i
wn))、単語省略確率P(delete−word
(ewm))、または単語挿入確率P(add−wor
d(iwn))それぞれを与えるようにすることができ
る。
【0196】本実施の形態では、単語を、強自立語(例
えば、動詞や名詞など)、軽自立語(例えば、形容詞
や、一部の副詞(例えば、「また」など)など)、機能
語(例えば、助詞や接続詞など)、および修飾語(例え
ば、程度を表す副詞(例えば、「とても」など)など)
(付属語も含む)の4つのグループに分類し、単語変形
オペレータが適用される単語が、いずれのグループに属
するかによって、単語複写確率P(echo−word
(ewm,iwn))、単語省略確率P(delete−
word(ewm))、または単語挿入確率P(add
−word(iwn))として、式(22)乃至(2
4)それぞれに示すような定数を与えることとする。
えば、動詞や名詞など)、軽自立語(例えば、形容詞
や、一部の副詞(例えば、「また」など)など)、機能
語(例えば、助詞や接続詞など)、および修飾語(例え
ば、程度を表す副詞(例えば、「とても」など)など)
(付属語も含む)の4つのグループに分類し、単語変形
オペレータが適用される単語が、いずれのグループに属
するかによって、単語複写確率P(echo−word
(ewm,iwn))、単語省略確率P(delete−
word(ewm))、または単語挿入確率P(add
−word(iwn))として、式(22)乃至(2
4)それぞれに示すような定数を与えることとする。
【0197】
【数19】 ・・・(22) なお、echo−strong−content,ec
ho−light−content,echo−gra
mmatical−function,echo−mo
difierは、それぞれ0以上1以下の所定の定数で
ある。また、単語複写確率P(echo−word(e
wm,iwn))が式(22)で与えられるのは、単語e
wmとiwnとが一致している場合で、これらが一致して
いない場合には0とされる(このことは、単語複写確率
に対応する文法属性複写確率についても同様である)。
ho−light−content,echo−gra
mmatical−function,echo−mo
difierは、それぞれ0以上1以下の所定の定数で
ある。また、単語複写確率P(echo−word(e
wm,iwn))が式(22)で与えられるのは、単語e
wmとiwnとが一致している場合で、これらが一致して
いない場合には0とされる(このことは、単語複写確率
に対応する文法属性複写確率についても同様である)。
【0198】
【数20】 ・・・(23) なお、delete−strong−content,
delete−light−content,dele
te−grammatical−function,d
elete−modifierは、それぞれ0以上1以
下の所定の定数である。
delete−light−content,dele
te−grammatical−function,d
elete−modifierは、それぞれ0以上1以
下の所定の定数である。
【0199】
【数21】 ・・・(24) なお、add−strong−content,add
−light−content,add−gramma
tical−function,add−modifi
erは、それぞれ0以上1以下の所定の定数である。
−light−content,add−gramma
tical−function,add−modifi
erは、それぞれ0以上1以下の所定の定数である。
【0200】なお、本実施の形態においては、同様にし
て、文法属性変形確率、即ち、文法属性複写確率P(e
cho−feature(efp,ifq))、文法属性
省略確率P(delete−feature(e
fp))、文法属性挿入確率P(add−featur
e(ifq)|)、および文法属性置換確率P(alt
er−feature(efp,ifq))も、定数で与
えられるものとする。
て、文法属性変形確率、即ち、文法属性複写確率P(e
cho−feature(efp,ifq))、文法属性
省略確率P(delete−feature(e
fp))、文法属性挿入確率P(add−featur
e(ifq)|)、および文法属性置換確率P(alt
er−feature(efp,ifq))も、定数で与
えられるものとする。
【0201】次に、単語置換確率P(alter−wo
rd(ewm,iwn))についてであるが、これは、単
語ewmとiwnとの意味的近さに基づいて算出すること
ができる。即ち、単語iwnが単語ewmと同義語であれ
ば、高確率を、単語iwnが単語ewmと意味的に似てい
れば、それより多少低めの確率を、単語iwnが単語e
wmと意味的に無関係であれば、より低確率を、それぞ
れ単語置換確率P(alter−word(ewm,i
wn))として与えるようにすれば良い。
rd(ewm,iwn))についてであるが、これは、単
語ewmとiwnとの意味的近さに基づいて算出すること
ができる。即ち、単語iwnが単語ewmと同義語であれ
ば、高確率を、単語iwnが単語ewmと意味的に似てい
れば、それより多少低めの確率を、単語iwnが単語e
wmと意味的に無関係であれば、より低確率を、それぞ
れ単語置換確率P(alter−word(ewm,i
wn))として与えるようにすれば良い。
【0202】単語ewmとiwnとについての、このよう
な確率分布は、コーパスデータを用いて求めることがで
きる。即ち、文脈類似性を利用し、コーパスデータの中
の類似する文脈で、2つの単語が使われている場合は、
その2つの単語どうし類似性は高いとみなし、また、異
なる文脈の中で使われている場合には、その2つの単語
どうしの類似性は低いとみなす。そして、この類似性が
高い2つの単語については、高い単語置換確率を与える
ようにすれば良い。
な確率分布は、コーパスデータを用いて求めることがで
きる。即ち、文脈類似性を利用し、コーパスデータの中
の類似する文脈で、2つの単語が使われている場合は、
その2つの単語どうし類似性は高いとみなし、また、異
なる文脈の中で使われている場合には、その2つの単語
どうしの類似性は低いとみなす。そして、この類似性が
高い2つの単語については、高い単語置換確率を与える
ようにすれば良い。
【0203】一方、コーパスデータの入手が困難な場合
には、例えば、図2に示したようなシソーラスを用いて
単語置換確率を計算することができる。
には、例えば、図2に示したようなシソーラスを用いて
単語置換確率を計算することができる。
【0204】ここで、シソーラスにおいては、2つの単
語間の意味的距離は、その2つの単語の共通の概念(親
ノード)の情報含有量として反映される。即ち、共通の
概念が、例えば「もの」などのように非常に一般的な概
念である場合、その概念からは、それに包含される具体
的な単語に関する情報はほとんど得ることができない
が、共通の概念が、例えば「エンジンの付いた車両」の
ようにかなり限定的な概念である場合には、その概念か
ら、そこに包含される具体的な単語に関して、多くの情
報を得ることができる。言い換えれば、ある概念(シソ
ーラスにおけるノード)の情報含有量は、その概念に包
含される単語数(number-dominated)に反比例する。
語間の意味的距離は、その2つの単語の共通の概念(親
ノード)の情報含有量として反映される。即ち、共通の
概念が、例えば「もの」などのように非常に一般的な概
念である場合、その概念からは、それに包含される具体
的な単語に関する情報はほとんど得ることができない
が、共通の概念が、例えば「エンジンの付いた車両」の
ようにかなり限定的な概念である場合には、その概念か
ら、そこに包含される具体的な単語に関して、多くの情
報を得ることができる。言い換えれば、ある概念(シソ
ーラスにおけるノード)の情報含有量は、その概念に包
含される単語数(number-dominated)に反比例する。
【0205】従って、単語置換確率P(alter−w
ord(ewm,iwn))は、2つの単語ewmとiwn
との共通の概念の情報含有量、即ち、シソーラスにおい
て、その概念に包含される単語の数に基づいて、例え
ば、式(25)にしたがって求めることができる。
ord(ewm,iwn))は、2つの単語ewmとiwn
との共通の概念の情報含有量、即ち、シソーラスにおい
て、その概念に包含される単語の数に基づいて、例え
ば、式(25)にしたがって求めることができる。
【0206】
【数22】 ・・・(25) なお、上式において、Kは、次式で定義される。
【数23】 ・・・(26) 但し、C(ewm,iwn)は、単語ewmとiwnとの共
通の概念を表し、number−dominated
(C(ewm,iwn))は、概念C(ewm,iwn)に
包含される単語(上位の概念として、概念C(ewm,
iwn)を有する単語)の数を表す。また、Vocab
は、シソーラスにおける単語の集合を意味する。従っ
て、式(26)の右辺の最初または2番目のΣは、それ
ぞれ、単語ewmまたはiwnを、シソーラス中の単語に
順次代えてのサメーションを意味する。
通の概念を表し、number−dominated
(C(ewm,iwn))は、概念C(ewm,iwn)に
包含される単語(上位の概念として、概念C(ewm,
iwn)を有する単語)の数を表す。また、Vocab
は、シソーラスにおける単語の集合を意味する。従っ
て、式(26)の右辺の最初または2番目のΣは、それ
ぞれ、単語ewmまたはiwnを、シソーラス中の単語に
順次代えてのサメーションを意味する。
【0207】以上のような2つの単語ewmとiwnとの
共通の概念の情報含有量に基づいて、それらの距離を求
める手法によれば、シソーラスの構造によらず、単語間
の距離(相対的な距離)を、正確に求めることができ
る。即ち、従来のように、シソーラスが、規則的に構成
されておらず、また、概念間の距離が異なっていても良
い。さらに、単語の分類の細かいシソーラスに対して
も、また、粗いシソーラスに対しても、対応することが
できる。また、一部において、細かいまたは粗い分類が
なされているシソーラスにも、対応することができる。
さらに、シソーラスは、ある特定のドメイン専用のもの
であっても、また、一般的なものであっても良い。
共通の概念の情報含有量に基づいて、それらの距離を求
める手法によれば、シソーラスの構造によらず、単語間
の距離(相対的な距離)を、正確に求めることができ
る。即ち、従来のように、シソーラスが、規則的に構成
されておらず、また、概念間の距離が異なっていても良
い。さらに、単語の分類の細かいシソーラスに対して
も、また、粗いシソーラスに対しても、対応することが
できる。また、一部において、細かいまたは粗い分類が
なされているシソーラスにも、対応することができる。
さらに、シソーラスは、ある特定のドメイン専用のもの
であっても、また、一般的なものであっても良い。
【0208】ところで、変形確率P(I|E)は、式
(21)に示したように、単語変形確率P(disto
rt−wordx(ewm,iwn))の積と、文法属性
変形確率P(distort−wordy(efp,if
q))の積とで求めることができる。この単語変形確率
P(distort−wordx(ewm,iwn))の
積、または文法属性変形確率P(distort−wo
rdy(efp,ifq))の積のうち、文法属性変形確
率P(distort−wordy(efp,ifq))
の積は、上述したようにして得られる文法属性複写確率
P(echo−feature(efp,ifq))、文
法属性省略確率P(delete−feature(e
fp))、文法属性挿入確率P(add−featur
e(ifq)|)、文法属性置換確率P(alter−
feature(efp,ifq))の積として、比較的
単純に求めることができる。
(21)に示したように、単語変形確率P(disto
rt−wordx(ewm,iwn))の積と、文法属性
変形確率P(distort−wordy(efp,if
q))の積とで求めることができる。この単語変形確率
P(distort−wordx(ewm,iwn))の
積、または文法属性変形確率P(distort−wo
rdy(efp,ifq))の積のうち、文法属性変形確
率P(distort−wordy(efp,ifq))
の積は、上述したようにして得られる文法属性複写確率
P(echo−feature(efp,ifq))、文
法属性省略確率P(delete−feature(e
fp))、文法属性挿入確率P(add−featur
e(ifq)|)、文法属性置換確率P(alter−
feature(efp,ifq))の積として、比較的
単純に求めることができる。
【0209】即ち、文法属性については、入力句の文法
属性(以下、適宜、入力属性という)と、用例句との文
法属性(以下、適宜、用例属性という)とを比較し、入
力属性と同一の用例属性、入力属性にない用例属性、用
例属性にない入力属性、および入力属性と置換可能な用
例属性を検出する。そして、入力属性と同一の用例属
性、入力属性にない用例属性、用例属性にない入力属
性、または入力属性と置換可能な用例属性が存在する場
合には、それぞれの文法属性についての文法属性複写確
率P(echo−feature(efp,ifq))、
文法属性省略確率P(delete−feature
(efp))、文法属性挿入確率P(add−feat
ure(ifq)|)、または文法属性置換確率P(a
lter−feature(efp,ifq))を求め
(但し、本実施の形態では、これらは、上述したよう
に、すべて定数で与えられるので、計算をする必要はな
い)、これらの積を計算することにより、文法属性変形
確率P(distort−wordy(efp,i
fq))の積を得ることができる。
属性(以下、適宜、入力属性という)と、用例句との文
法属性(以下、適宜、用例属性という)とを比較し、入
力属性と同一の用例属性、入力属性にない用例属性、用
例属性にない入力属性、および入力属性と置換可能な用
例属性を検出する。そして、入力属性と同一の用例属
性、入力属性にない用例属性、用例属性にない入力属
性、または入力属性と置換可能な用例属性が存在する場
合には、それぞれの文法属性についての文法属性複写確
率P(echo−feature(efp,ifq))、
文法属性省略確率P(delete−feature
(efp))、文法属性挿入確率P(add−feat
ure(ifq)|)、または文法属性置換確率P(a
lter−feature(efp,ifq))を求め
(但し、本実施の形態では、これらは、上述したよう
に、すべて定数で与えられるので、計算をする必要はな
い)、これらの積を計算することにより、文法属性変形
確率P(distort−wordy(efp,i
fq))の積を得ることができる。
【0210】具体的には、例えば、入力句が「予約をし
たいのですが」で、その文法属性が(desiderative +)
(extended-predicate +)(s-part GA)(formal +)
であり、用例句が「予約をしていただきたいのですが」
で、その文法属性が(gerund-suffix ITADAKU)(desid
erative +)(extended-predicate +)(s-part GA)
(formal +)であった場合には、文法属性(desiderati
ve +),(extended-predicate +),(s-part GA)、
および(formal +)が、入力属性と同一の用例属性とし
て、文法属性(gerund-suffix ITADAKU)が、入力属性
にない用例属性として検出される。
たいのですが」で、その文法属性が(desiderative +)
(extended-predicate +)(s-part GA)(formal +)
であり、用例句が「予約をしていただきたいのですが」
で、その文法属性が(gerund-suffix ITADAKU)(desid
erative +)(extended-predicate +)(s-part GA)
(formal +)であった場合には、文法属性(desiderati
ve +),(extended-predicate +),(s-part GA)、
および(formal +)が、入力属性と同一の用例属性とし
て、文法属性(gerund-suffix ITADAKU)が、入力属性
にない用例属性として検出される。
【0211】この場合、文法属性(desiderative +),
(extended-predicate +),(s-part GA)、または(f
ormal +)それぞれについての文法属性複写確率P(e
cho−feature(efp,ifq))と、文法属
性(gerund-suffix ITADAKU)についての文法属性省略
確率P(delete−feature(efp))と
の積を計算することで、文法属性変形確率P(dist
ort−wordy(efp,ifq))の積を得ること
ができる。
(extended-predicate +),(s-part GA)、または(f
ormal +)それぞれについての文法属性複写確率P(e
cho−feature(efp,ifq))と、文法属
性(gerund-suffix ITADAKU)についての文法属性省略
確率P(delete−feature(efp))と
の積を計算することで、文法属性変形確率P(dist
ort−wordy(efp,ifq))の積を得ること
ができる。
【0212】一方、単語変形確率P(distort−
wordx(ewm,iwn))の積を求めるにあたって
は、数ある変形経路の中から、用例句Eから入力句Iへ
の、いわば最も直接的な変形経路を見つけ出す必要があ
る。
wordx(ewm,iwn))の積を求めるにあたって
は、数ある変形経路の中から、用例句Eから入力句Iへ
の、いわば最も直接的な変形経路を見つけ出す必要があ
る。
【0213】即ち、例えば、用例句Eとして、「ここに
3時に電話する」が、訳文「call here at 3 o'clock」
と対応付けられており、この用例句Eが、入力句「レス
トランに電話をする」の翻訳に用いられる場合、例え
ば、次のような2つの変形経路(変形方法)が考えられ
る。
3時に電話する」が、訳文「call here at 3 o'clock」
と対応付けられており、この用例句Eが、入力句「レス
トランに電話をする」の翻訳に用いられる場合、例え
ば、次のような2つの変形経路(変形方法)が考えられ
る。
【0214】第1に、用例句E「ここに3時に電話す
る」について、その先頭の単語から、「ここ」を省略
し、「に」を省略し、「3時」を「レストラン」に置換
し、「に」を複写し、「電話」を複写し、「を」を挿入
し、「する」を複写すると、入力句「レストランに電話
をする」が得られる。従って、この場合、訳文「call h
ere at 3 o'clock」について、「ここに」に対応する
「here」を省略し、「3時」に対応する「3 o'clock」
を、「レストラン」に対応する「the restaurant」に置
換した訳文「call at the restaurant」が得られる。
る」について、その先頭の単語から、「ここ」を省略
し、「に」を省略し、「3時」を「レストラン」に置換
し、「に」を複写し、「電話」を複写し、「を」を挿入
し、「する」を複写すると、入力句「レストランに電話
をする」が得られる。従って、この場合、訳文「call h
ere at 3 o'clock」について、「ここに」に対応する
「here」を省略し、「3時」に対応する「3 o'clock」
を、「レストラン」に対応する「the restaurant」に置
換した訳文「call at the restaurant」が得られる。
【0215】第2に、用例句E「ここに3時に電話す
る」について、その先頭の単語から、「ここ」を「レス
トラン」に置換し、「に」を複写し、「3時」を省略
し、「に」を省略し、「電話」を複写し、「を」を挿入
し、「する」を複写すると、入力句「レストランに電話
をする」が得られる。従って、この場合、訳文「call h
ere at 3 o'clock」について、「ここに」に対応する
「here」を、「レストランに」に対応する「the restau
rant」に置換し、「3時に」に対応する「at 3 o'cloc
k」を省略した訳文「call the restaurant」が得られ
る。
る」について、その先頭の単語から、「ここ」を「レス
トラン」に置換し、「に」を複写し、「3時」を省略
し、「に」を省略し、「電話」を複写し、「を」を挿入
し、「する」を複写すると、入力句「レストランに電話
をする」が得られる。従って、この場合、訳文「call h
ere at 3 o'clock」について、「ここに」に対応する
「here」を、「レストランに」に対応する「the restau
rant」に置換し、「3時に」に対応する「at 3 o'cloc
k」を省略した訳文「call the restaurant」が得られ
る。
【0216】この場合、第2の変形経路による訳文「ca
ll the restaurant」が正しく、従って、単語変形確率
P(distort−wordx(ewm,iwn))の
積を求めるにあたっては、第2の変形経路のような、い
わば最も直接的な変形経路(以下、適宜、最適経路とい
う)を見つけ出す必要がある。
ll the restaurant」が正しく、従って、単語変形確率
P(distort−wordx(ewm,iwn))の
積を求めるにあたっては、第2の変形経路のような、い
わば最も直接的な変形経路(以下、適宜、最適経路とい
う)を見つけ出す必要がある。
【0217】このためには、用例句Eと入力句Iとの長
さが異なっている場合でも、即ち、用例句Eまたは入力
句Iそれぞれを構成する単語数が異なっている場合で
も、対応する単語どうしを認識し、用例句Eと入力句I
との最良の対応関係(アラインメント)を見つけ出して
から、用例句Eから入力句Iへの変形に適用されるべき
最も確からしい変形オペレータ(単語変形オペレータ)
の集合を見つけることが必要である。
さが異なっている場合でも、即ち、用例句Eまたは入力
句Iそれぞれを構成する単語数が異なっている場合で
も、対応する単語どうしを認識し、用例句Eと入力句I
との最良の対応関係(アラインメント)を見つけ出して
から、用例句Eから入力句Iへの変形に適用されるべき
最も確からしい変形オペレータ(単語変形オペレータ)
の集合を見つけることが必要である。
【0218】いま、単語変形オペレータの集合をDis
tort(={distort−word1(ewm,i
wn),distort−word2(ewm,iwn),
・・・,distort−wordX(ewm,i
wn)})と表すとすると、用例句Eから入力句Iへの
変形に適用されるべき最も確からしい単語変形オペレー
タ(以下、適宜、最適単語変形オペレータという)の集
合Distortmaxは、式(27)により求めること
ができる。
tort(={distort−word1(ewm,i
wn),distort−word2(ewm,iwn),
・・・,distort−wordX(ewm,i
wn)})と表すとすると、用例句Eから入力句Iへの
変形に適用されるべき最も確からしい単語変形オペレー
タ(以下、適宜、最適単語変形オペレータという)の集
合Distortmaxは、式(27)により求めること
ができる。
【0219】
【数24】 ・・・(27) 但し、式(27)の右辺は、[]内の値が最大となるD
istortを求める演算を意味する。
istortを求める演算を意味する。
【0220】ここでは、最適単語変形オペレータの集合
を、例えば、DP(Dynamic Programming)(ダイナミ
ックプログラミング)を用いて求める。即ち、まず、確
率P(Distort|E,I)から、DPにおける距
離を求めるため、その負対数−log(P(Disto
rt|E,I))を考える。いま、D=−log(P
(Distort|E,I))とおくと、単語変形オペ
レータの集合Distortを構成する各オペレータは
独立していると仮定することで、Dは、式(28)に示
すように単純化することができる。
を、例えば、DP(Dynamic Programming)(ダイナミ
ックプログラミング)を用いて求める。即ち、まず、確
率P(Distort|E,I)から、DPにおける距
離を求めるため、その負対数−log(P(Disto
rt|E,I))を考える。いま、D=−log(P
(Distort|E,I))とおくと、単語変形オペ
レータの集合Distortを構成する各オペレータは
独立していると仮定することで、Dは、式(28)に示
すように単純化することができる。
【0221】
【数25】 ・・・(28)
【0222】そして、単語変形オペレータが、入力句I
を構成する単語のうち、それが直接影響を及ぼす単語以
外の単語とは独立していると仮定すると、式(28)
は、式(29)に示すように、さらに単純化することが
できる。
を構成する単語のうち、それが直接影響を及ぼす単語以
外の単語とは独立していると仮定すると、式(28)
は、式(29)に示すように、さらに単純化することが
できる。
【0223】
【数26】 ・・・(29)
【0224】さらに、式(29)を、個々の変形オペレ
ータについて分割することにより、式(30)が得られ
る。
ータについて分割することにより、式(30)が得られ
る。
【0225】
【数27】 ・・・(30)
【0226】式(30)における右辺の−log(P
(distort−wordx(ewm,iwn)))
は、用例句のm番目の単語ewmと、入力句のn番目の
単語iwnとを対応させたときの、単語ewmとiwnと
の間の距離であり、これは、ダイナミックプログラミン
グ方程式で用いられる個々のペナルティ(パスに対する
重み)(コスト)に直接対応しているとみることができ
る。従って、distort−wordx(ewm,iw
n)を、単語複写オペレータecho−word(e
wm,iwn)、単語省略オペレータdelete−wo
rd(ewm)、単語挿入オペレータadd−word
(iwn)、または単語置換オペレータalter−w
ord(ewm,iwn)に書き換え、用例句のm番目の
単語ewmと、入力句のn番目の単語iwnとまでを対応
させたときの距離の総和(累積距離)をG(m,n)と
表すとすると、この累積距離G(m,n)は、式(3
1)に示す漸化式にしたがい、回帰的に求めることがで
きる。
(distort−wordx(ewm,iwn)))
は、用例句のm番目の単語ewmと、入力句のn番目の
単語iwnとを対応させたときの、単語ewmとiwnと
の間の距離であり、これは、ダイナミックプログラミン
グ方程式で用いられる個々のペナルティ(パスに対する
重み)(コスト)に直接対応しているとみることができ
る。従って、distort−wordx(ewm,iw
n)を、単語複写オペレータecho−word(e
wm,iwn)、単語省略オペレータdelete−wo
rd(ewm)、単語挿入オペレータadd−word
(iwn)、または単語置換オペレータalter−w
ord(ewm,iwn)に書き換え、用例句のm番目の
単語ewmと、入力句のn番目の単語iwnとまでを対応
させたときの距離の総和(累積距離)をG(m,n)と
表すとすると、この累積距離G(m,n)は、式(3
1)に示す漸化式にしたがい、回帰的に求めることがで
きる。
【0227】
【数28】 ・・・(31) なお、初期値は、適当な値を与えるものとする。
【0228】式(31)を、例えば、m=Mとなるまで
計算することにより、入力句Iと用例句Eとの距離(最
短距離)を求めることができ、そのとき得られたパス
(DPパス)が、入力句Iと用例句Eとの間の最良の
(最適な)対応関係、即ち、最適経路を表すことにな
る。そして、その最適経路(対応関係)にしたがって、
用例句Eを、入力句Iと一致するように変形する単語変
形オペレータの集合が、最適単語変形オペレータの集合
ということになる。
計算することにより、入力句Iと用例句Eとの距離(最
短距離)を求めることができ、そのとき得られたパス
(DPパス)が、入力句Iと用例句Eとの間の最良の
(最適な)対応関係、即ち、最適経路を表すことにな
る。そして、その最適経路(対応関係)にしたがって、
用例句Eを、入力句Iと一致するように変形する単語変
形オペレータの集合が、最適単語変形オペレータの集合
ということになる。
【0229】以上のようにすることで、用例句Eと入力
句Iとの長さが異なっている場合であっても、最適単語
変形オペレータの集合を求めることができる。
句Iとの長さが異なっている場合であっても、最適単語
変形オペレータの集合を求めることができる。
【0230】なお、確率P(Distort|E,I)
は、入力句Iと用例句Eとを照合し、両者の表現上の差
異をなくすために単語変形オペレータの集合Disto
rtが用いられる確率を表すから、この確率により規定
される確率モデルは、確率的表現照合モデルということ
ができ、さらに、入力句Iと用例句Eとの距離は、この
確率的表現照合モデルに基づいて求められるから、確率
的表現照合モデルに基づく距離ということができる。
は、入力句Iと用例句Eとを照合し、両者の表現上の差
異をなくすために単語変形オペレータの集合Disto
rtが用いられる確率を表すから、この確率により規定
される確率モデルは、確率的表現照合モデルということ
ができ、さらに、入力句Iと用例句Eとの距離は、この
確率的表現照合モデルに基づいて求められるから、確率
的表現照合モデルに基づく距離ということができる。
【0231】以上のようにして最適単語変形オペレータ
の集合を求めた後は、単語変形確率P(distort
−wordx(ewm,iwn))の積を求めることがで
き、これと、文法属性変形確率P(distort−w
ordy(efp,ifq))の積から、式(21)にし
たがって、変形確率P(I|E)を求めることができ
る。そして、この変形確率P(I|E)と、事前確率P
(E)との積を計算することで、翻訳適正率(P(I|
E)P(E))を求めることができ、この翻訳適正率を
最大にする用例句Eが、入力句Iに最も類似する用例句
ということになる。
の集合を求めた後は、単語変形確率P(distort
−wordx(ewm,iwn))の積を求めることがで
き、これと、文法属性変形確率P(distort−w
ordy(efp,ifq))の積から、式(21)にし
たがって、変形確率P(I|E)を求めることができ
る。そして、この変形確率P(I|E)と、事前確率P
(E)との積を計算することで、翻訳適正率(P(I|
E)P(E))を求めることができ、この翻訳適正率を
最大にする用例句Eが、入力句Iに最も類似する用例句
ということになる。
【0232】変換部7では、以上のようにして、入力句
Iに最も類似する用例句Eが検出される。即ち、事前確
率P(E)または変形確率P(I|E)によりそれぞれ
規定される確率モデルである事前確率モデルまたは変形
確率モデルを用いて、入力句Iに最も類似する用例句E
が検出される。この場合、変形確率モデルを用いること
により、既に用意されている用例句に対して、表層上の
バリエーションや、いわゆる話し言葉における格助詞や
名詞句などの省略、言い淀みなどのある用例句をむやみ
に追加しなくても、入力句を翻訳するのに最適な用例句
を検出することができ、その結果、翻訳の質を向上させ
ることができる。
Iに最も類似する用例句Eが検出される。即ち、事前確
率P(E)または変形確率P(I|E)によりそれぞれ
規定される確率モデルである事前確率モデルまたは変形
確率モデルを用いて、入力句Iに最も類似する用例句E
が検出される。この場合、変形確率モデルを用いること
により、既に用意されている用例句に対して、表層上の
バリエーションや、いわゆる話し言葉における格助詞や
名詞句などの省略、言い淀みなどのある用例句をむやみ
に追加しなくても、入力句を翻訳するのに最適な用例句
を検出することができ、その結果、翻訳の質を向上させ
ることができる。
【0233】次に、図8のフローチャートを参照して、
変換部7における、入力句Iに最も類似する用例句Eの
検出処理について、さらに説明する。なお、事前確率P
(E)は、用例句Eに対応付けられて、名詞句対訳用例
記憶部8、動詞句対訳用例記憶部9、およびその他対訳
用例記憶部10に記憶されているものとする。また、定
数で与えられる単語複写確率P(echo−word
(ewm,iwn))、単語省略確率P(delete−
word(ewm))、および単語挿入確率P(add
−word(iwn))、並びに文法属性複写確率P
(echo−feature(efp,ifq))、文法
属性省略確率P(delete−feature(ef
p))、文法属性挿入確率P(add−feature
(ifq)|)、および文法属性置換確率P(alte
r−feature(efp,ifq))は、変換部7が
内蔵するメモリに記憶されているものとする。さらに、
ここでは、入力句として、例えば名詞句が、変換部7に
入力されたものとし、従って、名詞句対訳用例記憶部8
に記憶されている用例句のみを対象として処理が行われ
るものとする。但し、入力句として、動詞句またはその
他の句が、変換部7に入力された場合には、処理の対象
となる用例句が、動詞句対訳用例記憶部9またはその他
対訳用例記憶部10に記憶されているものとなるだけ
で、処理方法は、以下説明する名詞句における場合と同
様である。
変換部7における、入力句Iに最も類似する用例句Eの
検出処理について、さらに説明する。なお、事前確率P
(E)は、用例句Eに対応付けられて、名詞句対訳用例
記憶部8、動詞句対訳用例記憶部9、およびその他対訳
用例記憶部10に記憶されているものとする。また、定
数で与えられる単語複写確率P(echo−word
(ewm,iwn))、単語省略確率P(delete−
word(ewm))、および単語挿入確率P(add
−word(iwn))、並びに文法属性複写確率P
(echo−feature(efp,ifq))、文法
属性省略確率P(delete−feature(ef
p))、文法属性挿入確率P(add−feature
(ifq)|)、および文法属性置換確率P(alte
r−feature(efp,ifq))は、変換部7が
内蔵するメモリに記憶されているものとする。さらに、
ここでは、入力句として、例えば名詞句が、変換部7に
入力されたものとし、従って、名詞句対訳用例記憶部8
に記憶されている用例句のみを対象として処理が行われ
るものとする。但し、入力句として、動詞句またはその
他の句が、変換部7に入力された場合には、処理の対象
となる用例句が、動詞句対訳用例記憶部9またはその他
対訳用例記憶部10に記憶されているものとなるだけ
で、処理方法は、以下説明する名詞句における場合と同
様である。
【0234】変換部7は、入力句I(ここでは、上述し
たように名詞句とする)を受信すると、まず、ステップ
S31において、名詞句対訳用例記憶部8から、用例句
(名詞句)Eを読み出す(以下、適宜、この読み出され
た用例句Eを、注目用例句という)。さらに、変換部7
は、ステップS32において、入力句Iに対する注目用
例句Eの変形確率P(I|E)を計算し、ステップS3
3に進む。ステップS33では、変換部7において、注
目用例句Eに対応付けられている事前確率P(E)が、
名詞句対訳用例記憶部8から読み出され、それと、ステ
ップS32で計算された変形確率P(I|E)とが乗算
される。これにより、入力句Iに対する注目用例句Eの
翻訳適正率が求められる。
たように名詞句とする)を受信すると、まず、ステップ
S31において、名詞句対訳用例記憶部8から、用例句
(名詞句)Eを読み出す(以下、適宜、この読み出され
た用例句Eを、注目用例句という)。さらに、変換部7
は、ステップS32において、入力句Iに対する注目用
例句Eの変形確率P(I|E)を計算し、ステップS3
3に進む。ステップS33では、変換部7において、注
目用例句Eに対応付けられている事前確率P(E)が、
名詞句対訳用例記憶部8から読み出され、それと、ステ
ップS32で計算された変形確率P(I|E)とが乗算
される。これにより、入力句Iに対する注目用例句Eの
翻訳適正率が求められる。
【0235】翻訳適正率が求められた後は、ステップS
34に進み、名詞句対訳用例記憶部8に記憶されている
すべての用例句を対象に、翻訳適正率の計算が行われた
かどうかが、変換部7によって判定される。ステップS
34において、名詞句対訳用例記憶部8に記憶されてい
るすべての用例句を対象に、翻訳適正率の計算が、まだ
行われていないと判定された場合、ステップS31に戻
り、名詞句対訳用例記憶部8から、まだ翻訳適正率を計
算していない用例句Eが読み出され、これを、新たな注
目用例句Eとして、ステップS32以下の処理を繰り返
す。
34に進み、名詞句対訳用例記憶部8に記憶されている
すべての用例句を対象に、翻訳適正率の計算が行われた
かどうかが、変換部7によって判定される。ステップS
34において、名詞句対訳用例記憶部8に記憶されてい
るすべての用例句を対象に、翻訳適正率の計算が、まだ
行われていないと判定された場合、ステップS31に戻
り、名詞句対訳用例記憶部8から、まだ翻訳適正率を計
算していない用例句Eが読み出され、これを、新たな注
目用例句Eとして、ステップS32以下の処理を繰り返
す。
【0236】一方、ステップS34において、名詞句対
訳用例記憶部8に記憶されているすべての用例句を対象
に、翻訳適正率の計算が行われたと判定された場合、ス
テップS35に進み、変換部7において、入力句Iに対
して、最大の翻訳適正率を与える用例が検出され、処理
を終了する。
訳用例記憶部8に記憶されているすべての用例句を対象
に、翻訳適正率の計算が行われたと判定された場合、ス
テップS35に進み、変換部7において、入力句Iに対
して、最大の翻訳適正率を与える用例が検出され、処理
を終了する。
【0237】次に、図8のステップS32の変形確率の
計算処理について、図9および図10のフローチャート
を参照して説明する。
計算処理について、図9および図10のフローチャート
を参照して説明する。
【0238】まず、図9は、変形確率のうちの文法属性
変形確率の計算処理を説明するフローチャートである。
変換部7は、まず最初に、ステップS41において、入
力句Iと注目用例句Eとを比較し、文法属性複写確率、
文法属性変形確率、文法属性挿入確率、文法属性置換確
率を求める。そして、ステップS42において、変換部
7は、これらを乗算することにより、文法属性変形確率
を求め、処理を終了する。
変形確率の計算処理を説明するフローチャートである。
変換部7は、まず最初に、ステップS41において、入
力句Iと注目用例句Eとを比較し、文法属性複写確率、
文法属性変形確率、文法属性挿入確率、文法属性置換確
率を求める。そして、ステップS42において、変換部
7は、これらを乗算することにより、文法属性変形確率
を求め、処理を終了する。
【0239】次に、図10は、変形確率のうちの単語変
形確率の計算処理を説明するフローチャートである。変
換部7は、まず最初に、ステップS51において、式
(31)にしたがい、入力句Iと注目用例句Eとの間の
累積距離G(m,n)を求め、ステップS52に進み、
mがM(注目用例句Eを構成する単語数)未満であるか
どうかを判定する。ステップS52に進み、mがM未満
であると判定された場合、ステップS51に戻り、変換
部7は、mを増加させ、nを変えながら、式(31)を
計算する。そして、ステップS52において、mがM未
満でないと判定された場合、即ち、mがMに等しい場
合、累積距離G(M,n)が得られたときのパス、即
ち、最適経路が検出され、ステップS53に進む。
形確率の計算処理を説明するフローチャートである。変
換部7は、まず最初に、ステップS51において、式
(31)にしたがい、入力句Iと注目用例句Eとの間の
累積距離G(m,n)を求め、ステップS52に進み、
mがM(注目用例句Eを構成する単語数)未満であるか
どうかを判定する。ステップS52に進み、mがM未満
であると判定された場合、ステップS51に戻り、変換
部7は、mを増加させ、nを変えながら、式(31)を
計算する。そして、ステップS52において、mがM未
満でないと判定された場合、即ち、mがMに等しい場
合、累積距離G(M,n)が得られたときのパス、即
ち、最適経路が検出され、ステップS53に進む。
【0240】ステップS53では、変換部7において、
得られた最適経路にしたがって、単語変形確率が計算さ
れる。即ち、単語複写確率、単語省略確率、単語挿入確
率、単語置換確率が求められ、これらを乗算すること
で、単語変形確率が求められる。なお、変換部7は、単
語置換確率については、類似度計算部11を制御するこ
とにより、式(25)にしたがって算出させるようにな
されている。即ち、類似度計算部11は、シソーラス記
憶部12に記憶されているシソーラスにおいて、入力句
Iを構成するある単語と、注目用例句Eを構成するある
単語との共通の概念に包含される単語の数を求め、その
単語数に基づいて、2つの単語間の意味的な類似性を表
す単語類似度、即ち、式(25)を計算することにより
得られる単語置換確率を求めるようになされている。
得られた最適経路にしたがって、単語変形確率が計算さ
れる。即ち、単語複写確率、単語省略確率、単語挿入確
率、単語置換確率が求められ、これらを乗算すること
で、単語変形確率が求められる。なお、変換部7は、単
語置換確率については、類似度計算部11を制御するこ
とにより、式(25)にしたがって算出させるようにな
されている。即ち、類似度計算部11は、シソーラス記
憶部12に記憶されているシソーラスにおいて、入力句
Iを構成するある単語と、注目用例句Eを構成するある
単語との共通の概念に包含される単語の数を求め、その
単語数に基づいて、2つの単語間の意味的な類似性を表
す単語類似度、即ち、式(25)を計算することにより
得られる単語置換確率を求めるようになされている。
【0241】次に、図11は、本発明を適用した翻訳装
置の他の実施の形態の構成を示している。なお、図中、
図1における場合と対応する部分については、同一の符
号を付してあり、以下では、その説明は、適宜省略す
る。即ち、この翻訳装置は、変換部7がキャッシュ7A
を内蔵している他は、図1における場合と基本的に同様
に構成されている。
置の他の実施の形態の構成を示している。なお、図中、
図1における場合と対応する部分については、同一の符
号を付してあり、以下では、その説明は、適宜省略す
る。即ち、この翻訳装置は、変換部7がキャッシュ7A
を内蔵している他は、図1における場合と基本的に同様
に構成されている。
【0242】キャッシュ7Aは、後述する仮省略単語お
よび仮付加単語を一時記憶するようになされている。な
お、キャッシュ7Aは、CPUとメインメモリとの間に
設けられるキャッシュメモリ(cache memory)のよう
に、情報を一時記憶することから、「キャッシュ」と呼
んでいるだけであり、一般的なキャッシュメモリのよう
に、高速なものである必要は、必ずしもない。
よび仮付加単語を一時記憶するようになされている。な
お、キャッシュ7Aは、CPUとメインメモリとの間に
設けられるキャッシュメモリ(cache memory)のよう
に、情報を一時記憶することから、「キャッシュ」と呼
んでいるだけであり、一般的なキャッシュメモリのよう
に、高速なものである必要は、必ずしもない。
【0243】ここで、上述の場合においては、用例句E
を構成する単語に対する変形オペレータとして、単語複
写オペレータecho−word(ewm,iwn)、単
語省略オペレータdelete−word(ewm)、
単語挿入オペレータadd−word(iwn)、およ
び単語置換オペレータalter−word(ewm,
iwn)を用いたが、この4つのオペレータでは、用例
句Eを構成する単語が、そのまま配置位置だけを変える
ことにより、入力句Iに変形される場合(例えば、用例
句Eが「私はみかんを食べたい」である場合に、「みか
んをわたしは食べたい」という入力句Iに変形すると
き)、および用例句Eを構成する単語が、入力句Iを構
成する単語と置換され、さらにその配置位置を変えるこ
とにより、入力句Iに変形される場合(例えば、用例句
Eが「私はみかんを食べたい」である場合に、「りんご
をわたしは食べたい」という入力句Iに変形するとき)
に対処するのが困難である。
を構成する単語に対する変形オペレータとして、単語複
写オペレータecho−word(ewm,iwn)、単
語省略オペレータdelete−word(ewm)、
単語挿入オペレータadd−word(iwn)、およ
び単語置換オペレータalter−word(ewm,
iwn)を用いたが、この4つのオペレータでは、用例
句Eを構成する単語が、そのまま配置位置だけを変える
ことにより、入力句Iに変形される場合(例えば、用例
句Eが「私はみかんを食べたい」である場合に、「みか
んをわたしは食べたい」という入力句Iに変形すると
き)、および用例句Eを構成する単語が、入力句Iを構
成する単語と置換され、さらにその配置位置を変えるこ
とにより、入力句Iに変形される場合(例えば、用例句
Eが「私はみかんを食べたい」である場合に、「りんご
をわたしは食べたい」という入力句Iに変形するとき)
に対処するのが困難である。
【0244】また、用例句Eを構成する単語に、入力句
Iを構成する単語のうちの修飾語として使用されている
ものが付加された複合語(例えば、複合名詞など)が、
入力句Iに含まれている場合(例えば、用例句Eが「電
話を見つける」であるのに対して、入力句Iが「公衆電
話を見つける」である場合)や、用例句Eを構成する単
語を、入力句Iを構成する単語と置換したものに、その
入力句Iを構成する単語のうちの修飾語として使用され
ているものが付加された複合語が、入力句Iに含まれて
いる場合(例えば、用例句Eが「電話を見つける」であ
るのに対して、入力句Iが「公衆トイレを見つける」で
ある場合)、用例句Eを構成する単語と、入力句Iを構
成する複合語とを対応付ける必要があることがあるが
(上述の例では、「電話」と「公衆電話」や、「電話」
と「公衆トイレ」)、このようなことを行うのも、上述
の4つのオペレータでは困難である。
Iを構成する単語のうちの修飾語として使用されている
ものが付加された複合語(例えば、複合名詞など)が、
入力句Iに含まれている場合(例えば、用例句Eが「電
話を見つける」であるのに対して、入力句Iが「公衆電
話を見つける」である場合)や、用例句Eを構成する単
語を、入力句Iを構成する単語と置換したものに、その
入力句Iを構成する単語のうちの修飾語として使用され
ているものが付加された複合語が、入力句Iに含まれて
いる場合(例えば、用例句Eが「電話を見つける」であ
るのに対して、入力句Iが「公衆トイレを見つける」で
ある場合)、用例句Eを構成する単語と、入力句Iを構
成する複合語とを対応付ける必要があることがあるが
(上述の例では、「電話」と「公衆電話」や、「電話」
と「公衆トイレ」)、このようなことを行うのも、上述
の4つのオペレータでは困難である。
【0245】そこで、用例句Eを構成する単語ewmを
真に省略する単語省略オペレータ(その時点で、省略を
確定してしまうオペレータ)delete−word
(ewm)に代えて、その単語ewmを仮に省略するオペ
レータである仮省略オペレータを導入する。この仮省略
オペレータは、仮に省略する単語(以下、適宜、仮省略
単語という)ewmを、キャッシュ7Aに一時退避(記
憶)させるので、cache−as−deleted
(ewm)と記述する。
真に省略する単語省略オペレータ(その時点で、省略を
確定してしまうオペレータ)delete−word
(ewm)に代えて、その単語ewmを仮に省略するオペ
レータである仮省略オペレータを導入する。この仮省略
オペレータは、仮に省略する単語(以下、適宜、仮省略
単語という)ewmを、キャッシュ7Aに一時退避(記
憶)させるので、cache−as−deleted
(ewm)と記述する。
【0246】また、入力句Iを構成する単語iwnを、
用例句Eに真に挿入する単語挿入オペレータ(その時点
で、挿入を確定してしまう)add−word(i
wn)に代えて、その単語iwnを仮に用例句Eに挿入す
るオペレータである仮挿入オペレータを導入する。この
仮挿入オペレータは、仮に挿入する単語(以下、適宜、
仮挿入単語という)iwnを、キャッシュ7Aに一時退
避させるので、cache−as−added(i
wn)と記述する。
用例句Eに真に挿入する単語挿入オペレータ(その時点
で、挿入を確定してしまう)add−word(i
wn)に代えて、その単語iwnを仮に用例句Eに挿入す
るオペレータである仮挿入オペレータを導入する。この
仮挿入オペレータは、仮に挿入する単語(以下、適宜、
仮挿入単語という)iwnを、キャッシュ7Aに一時退
避させるので、cache−as−added(i
wn)と記述する。
【0247】さらに、用例句Eを構成する単語ew
mを、入力句Iを構成する単語のうち、単語ewmと対応
させている単語以外の単語iwnとして、そのまま複写
し、若しくはそのような単語iwnと置換するオペレー
タ、即ち、用例句Eを構成する単語の配置位置だけを変
えたり、用例句Eを構成する単語を入力句Iを構成する
単語と置換し、その配置位置を変えるオペレータである
スクランブルオペレータscramble(ewm,i
wn)を導入する。
mを、入力句Iを構成する単語のうち、単語ewmと対応
させている単語以外の単語iwnとして、そのまま複写
し、若しくはそのような単語iwnと置換するオペレー
タ、即ち、用例句Eを構成する単語の配置位置だけを変
えたり、用例句Eを構成する単語を入力句Iを構成する
単語と置換し、その配置位置を変えるオペレータである
スクランブルオペレータscramble(ewm,i
wn)を導入する。
【0248】また、入力句Iを構成する連続する2つの
単語iwn-1とiwnとが、それぞれ修飾語または被修飾
語であり、これらが複合語を構成しているとするオペレ
ータである複合オペレータcompound(i
wn-1,iwn)を導入する。この場合、用例句Eを構成
する単語ewmを、入力句Iを構成する単語iwnとして
そのまま複写し、その1つ前の単語iwn-1と複合語を
構成させるのは、単語複写オペレータecho−wor
d(ewm,iwn)と、複合オペレータcompoun
d(iwn-1,iwn)との組合せ(以下、適宜、複写/
複合オペレータという)で表すことができる。また、用
例句Eを構成する単語ewmを、入力句Iを構成する単
語iwnに置換し、その1つ前の単語iwn-1と複合語を
構成させるのは、単語置換オペレータalter−wo
rd(ewm,iwn)と、複合オペレータcompou
nd(iwn-1,iwn)との組合せ(以下、適宜、置換
/複合オペレータという)で表すことができる。
単語iwn-1とiwnとが、それぞれ修飾語または被修飾
語であり、これらが複合語を構成しているとするオペレ
ータである複合オペレータcompound(i
wn-1,iwn)を導入する。この場合、用例句Eを構成
する単語ewmを、入力句Iを構成する単語iwnとして
そのまま複写し、その1つ前の単語iwn-1と複合語を
構成させるのは、単語複写オペレータecho−wor
d(ewm,iwn)と、複合オペレータcompoun
d(iwn-1,iwn)との組合せ(以下、適宜、複写/
複合オペレータという)で表すことができる。また、用
例句Eを構成する単語ewmを、入力句Iを構成する単
語iwnに置換し、その1つ前の単語iwn-1と複合語を
構成させるのは、単語置換オペレータalter−wo
rd(ewm,iwn)と、複合オペレータcompou
nd(iwn-1,iwn)との組合せ(以下、適宜、置換
/複合オペレータという)で表すことができる。
【0249】図11の実施の形態では、用例句Eを構成
する単語に対するオペレータとして、単語複写オペレー
タecho−word(ewm,iwn)、単語置換オペ
レータalter−word(ewm,iwn)、仮省略
オペレータcache−as−deleted(e
wm)、仮挿入オペレータcache−as−adde
d(iwn)、スクランブルオペレータscrambl
e(ewm,iwn)、および複合オペレータcompo
und(iwn-1,iwn)の6つのオペレータを採用す
る。但し、この6つのオペレータのうち、複合オペレー
タcompound(iwn-1,iwn)だけは単独で用
いられず、上述のように、単語複写オペレータecho
−word(ewm,iwn)または単語置換オペレータ
alter−word(ewm,iwn)それぞれとの組
合せで、複写/複合オペレータまたは置換/複合オペレ
ータとして用いられる。
する単語に対するオペレータとして、単語複写オペレー
タecho−word(ewm,iwn)、単語置換オペ
レータalter−word(ewm,iwn)、仮省略
オペレータcache−as−deleted(e
wm)、仮挿入オペレータcache−as−adde
d(iwn)、スクランブルオペレータscrambl
e(ewm,iwn)、および複合オペレータcompo
und(iwn-1,iwn)の6つのオペレータを採用す
る。但し、この6つのオペレータのうち、複合オペレー
タcompound(iwn-1,iwn)だけは単独で用
いられず、上述のように、単語複写オペレータecho
−word(ewm,iwn)または単語置換オペレータ
alter−word(ewm,iwn)それぞれとの組
合せで、複写/複合オペレータまたは置換/複合オペレ
ータとして用いられる。
【0250】なお、新たに導入したオペレータのうち、
仮省略オペレータcache−as−deleted
(ewm)または仮挿入オペレータcache−as−
added(iwn)は、それぞれ、単語省略オペレー
タdelete−word(ewm)または単語挿入オ
ペレータadd−word(iwn)と同様に使用する
ことができるが(但し、単語をキャッシュ7Aに記憶さ
せることにより、その単語を仮に省略または挿入する点
で、単語の省略または挿入を確定してしまう単語省略オ
ペレータdelete−word(ewm)または単語
挿入オペレータadd−word(iwn)と異な
る)、スクランブルオペレータscramble(ew
m,iwn)、並びに複写/複合オペレータおよび置換/
複合オペレータについては、その使用に際して以下のよ
うな制限がある。
仮省略オペレータcache−as−deleted
(ewm)または仮挿入オペレータcache−as−
added(iwn)は、それぞれ、単語省略オペレー
タdelete−word(ewm)または単語挿入オ
ペレータadd−word(iwn)と同様に使用する
ことができるが(但し、単語をキャッシュ7Aに記憶さ
せることにより、その単語を仮に省略または挿入する点
で、単語の省略または挿入を確定してしまう単語省略オ
ペレータdelete−word(ewm)または単語
挿入オペレータadd−word(iwn)と異な
る)、スクランブルオペレータscramble(ew
m,iwn)、並びに複写/複合オペレータおよび置換/
複合オペレータについては、その使用に際して以下のよ
うな制限がある。
【0251】即ち、用例句Eを構成する単語の配置位置
だけを変えたり、用例句Eを構成する単語を入力句Iを
構成する単語と置換し、その配置位置を変えて、用例句
Eを入力句Iに変形することは、その配置位置を変える
単語を省略し、その後、所定の位置に挿入するか、また
は配置位置を変える単語を所定の位置に挿入し、その
後、元の位置にある単語を省略することで実現すること
ができる。
だけを変えたり、用例句Eを構成する単語を入力句Iを
構成する単語と置換し、その配置位置を変えて、用例句
Eを入力句Iに変形することは、その配置位置を変える
単語を省略し、その後、所定の位置に挿入するか、また
は配置位置を変える単語を所定の位置に挿入し、その
後、元の位置にある単語を省略することで実現すること
ができる。
【0252】従って、用例句Eから入力句Iへ変形する
場合において、単語の配置位置を変えるには、過去にお
いて、その単語が、用例句Eから省略または入力句Iに
挿入されている必要がある。このため、スクランブルオ
ペレータscramble(ewm,iwn)は、過去
に、用例句Eを構成する単語ewmが仮に省略された状
態になっているとき、または入力句Iを構成する単語i
wnが仮に挿入された状態になっているとき、即ち、仮
省略単語ewmまたは仮挿入単語iwnがキャッシュ7A
に記憶されているときのみ使用される。
場合において、単語の配置位置を変えるには、過去にお
いて、その単語が、用例句Eから省略または入力句Iに
挿入されている必要がある。このため、スクランブルオ
ペレータscramble(ewm,iwn)は、過去
に、用例句Eを構成する単語ewmが仮に省略された状
態になっているとき、または入力句Iを構成する単語i
wnが仮に挿入された状態になっているとき、即ち、仮
省略単語ewmまたは仮挿入単語iwnがキャッシュ7A
に記憶されているときのみ使用される。
【0253】具体的には、最適経路の算出にあたって、
用例句Eを構成するm番目の単語ewmから、入力句I
を構成するn番目の単語iwnへの変形経路が問題とな
っている場合において、k<mとして、キャッシュ7A
に仮省略単語ewkが記憶されているときは、スクラン
ブルオペレータscramble(ewk,iwn)を使
用することができる(入力句Iを構成するn番目の単語
iwnは、用例句Eを構成するm番目の単語ewmを変形
したものではなく、用例句Eを構成するk番目の単語e
wkを、そのまま、若しくは置換して、その配置位置を
変える変形をしたものとすることができる)。
用例句Eを構成するm番目の単語ewmから、入力句I
を構成するn番目の単語iwnへの変形経路が問題とな
っている場合において、k<mとして、キャッシュ7A
に仮省略単語ewkが記憶されているときは、スクラン
ブルオペレータscramble(ewk,iwn)を使
用することができる(入力句Iを構成するn番目の単語
iwnは、用例句Eを構成するm番目の単語ewmを変形
したものではなく、用例句Eを構成するk番目の単語e
wkを、そのまま、若しくは置換して、その配置位置を
変える変形をしたものとすることができる)。
【0254】また、上述の場合において、s<nとし
て、キャッシュ7Aに仮挿入単語iwsが記憶されてい
るときにも、スクランブルオペレータscramble
(ewm,iws)を使用することができる(用例句Eを
構成するm番目の単語ewmは、入力句Iを構成するn
番目の単語iwnに変形されたのではなく、そのまま、
若しくは置換され、その配置位置を変えて、入力句Iを
構成するs番目の単語iwsに変形されたものとするこ
とができる)。
て、キャッシュ7Aに仮挿入単語iwsが記憶されてい
るときにも、スクランブルオペレータscramble
(ewm,iws)を使用することができる(用例句Eを
構成するm番目の単語ewmは、入力句Iを構成するn
番目の単語iwnに変形されたのではなく、そのまま、
若しくは置換され、その配置位置を変えて、入力句Iを
構成するs番目の単語iwsに変形されたものとするこ
とができる)。
【0255】なお、スクランブルオペレータscram
ble(ewk,iwn)またはscramble(ew
m,iws)が使用された場合(最適経路の算出の過程に
おいて、これらに対応する変形経路が、最適経路を構成
する経路として選択された場合)、仮省略単語ewkま
たは仮挿入単語iwsは、その時点で、省略または挿入
されたものでないことが確定するので、即ち、配置位置
が変えられたものであることが確定するので、キャッシ
ュ7Aから削除される。
ble(ewk,iwn)またはscramble(ew
m,iws)が使用された場合(最適経路の算出の過程に
おいて、これらに対応する変形経路が、最適経路を構成
する経路として選択された場合)、仮省略単語ewkま
たは仮挿入単語iwsは、その時点で、省略または挿入
されたものでないことが確定するので、即ち、配置位置
が変えられたものであることが確定するので、キャッシ
ュ7Aから削除される。
【0256】次に、複写/複合オペレータおよび置換/
複合オペレータについては、その使用に際して以下のよ
うな制限がある。
複合オペレータについては、その使用に際して以下のよ
うな制限がある。
【0257】即ち、用例句Eを構成する単語ewmを、
入力句Iを構成する単語iwnとしてそのまま複写し、
その1つ前の単語iwn-1と複合語を構成させたり、用
例句Eを構成する単語ewmを、入力句Iを構成する単
語iwnに置換し、その1つ前の単語iwn-1と複合語を
構成させるには、修飾語となる単語iwn-1が、過去に
おいて、入力句Iに挿入されている必要がある。このた
め、複写/複合オペレータおよび置換/複合オペレータ
は、過去に、入力句Iを構成する単語iwn-1が仮に挿
入された状態になっているとき、即ち、仮挿入単語iw
n-1がキャッシュ7Aに記憶されているときのみ使用さ
れる。
入力句Iを構成する単語iwnとしてそのまま複写し、
その1つ前の単語iwn-1と複合語を構成させたり、用
例句Eを構成する単語ewmを、入力句Iを構成する単
語iwnに置換し、その1つ前の単語iwn-1と複合語を
構成させるには、修飾語となる単語iwn-1が、過去に
おいて、入力句Iに挿入されている必要がある。このた
め、複写/複合オペレータおよび置換/複合オペレータ
は、過去に、入力句Iを構成する単語iwn-1が仮に挿
入された状態になっているとき、即ち、仮挿入単語iw
n-1がキャッシュ7Aに記憶されているときのみ使用さ
れる。
【0258】具体的には、最適経路の算出にあたって、
用例句Eを構成するm番目の単語ewmから、入力句I
を構成するn番目の単語iwnへの変形経路が問題とな
っている場合において、キャッシュ7Aに仮挿入単語i
wn-1が記憶されているとき、即ち、単語iwnの1つ前
に、単語iwn-1が仮挿入されているときは、複写/複
合オペレータおよび置換/複合オペレータを使用するこ
とができる。
用例句Eを構成するm番目の単語ewmから、入力句I
を構成するn番目の単語iwnへの変形経路が問題とな
っている場合において、キャッシュ7Aに仮挿入単語i
wn-1が記憶されているとき、即ち、単語iwnの1つ前
に、単語iwn-1が仮挿入されているときは、複写/複
合オペレータおよび置換/複合オペレータを使用するこ
とができる。
【0259】なお、複写/複合オペレータまたは置換/
複合オペレータが使用された場合、仮挿入単語iwn-1
は、その時点で、挿入されたものでないことが確定する
ので、即ち、複合語を構成することが確定するので、キ
ャッシュ7Aから削除される。
複合オペレータが使用された場合、仮挿入単語iwn-1
は、その時点で、挿入されたものでないことが確定する
ので、即ち、複合語を構成することが確定するので、キ
ャッシュ7Aから削除される。
【0260】次に、以上のような6つの変形オペレータ
(単語複写オペレータecho−word(ewm,i
wn)、単語置換オペレータalter−word(e
wm,iwn)、仮省略オペレータcache−as−d
eleted(ewm)、仮挿入オペレータcache
−as−added(iwn)、スクランブルオペレー
タscramble(ewm,iwn)、および複合オペ
レータcompound(iwn-1,iwn))を用い
て、単語の変形を行う場合の単語変形確率を求めるため
に、各変形オペレータについての確率(各変形オペレー
タによる変形がなされる確率)が必要となるが、これ
は、例えば、次のように定義することができる。
(単語複写オペレータecho−word(ewm,i
wn)、単語置換オペレータalter−word(e
wm,iwn)、仮省略オペレータcache−as−d
eleted(ewm)、仮挿入オペレータcache
−as−added(iwn)、スクランブルオペレー
タscramble(ewm,iwn)、および複合オペ
レータcompound(iwn-1,iwn))を用い
て、単語の変形を行う場合の単語変形確率を求めるため
に、各変形オペレータについての確率(各変形オペレー
タによる変形がなされる確率)が必要となるが、これ
は、例えば、次のように定義することができる。
【0261】即ち、まず、単語複写オペレータecho
−word(ewm,iwn)についての確率(単語複写
確率)P(echo−word(ewm,iwn))、ま
たは単語置換オペレータalter−word(e
wm,iwn)についての確率(単語置換確率)P(al
ter−word(ewm,iwn))は、例えば、上述
した場合と同様に、式(22)または(25)でそれぞ
れ与えられる。
−word(ewm,iwn)についての確率(単語複写
確率)P(echo−word(ewm,iwn))、ま
たは単語置換オペレータalter−word(e
wm,iwn)についての確率(単語置換確率)P(al
ter−word(ewm,iwn))は、例えば、上述
した場合と同様に、式(22)または(25)でそれぞ
れ与えられる。
【0262】次に、仮省略オペレータcache−as
−deleted(ewm)についての確率(以下、適
宜、仮省略確率という)P(cache−as−del
eted(ewm))は、例えば、単語省略確率P(d
elete−word(ewm))および単語複写確率
P(echo−word(ewm,iwn))を用い
て、次式を満たすように与えられる。
−deleted(ewm)についての確率(以下、適
宜、仮省略確率という)P(cache−as−del
eted(ewm))は、例えば、単語省略確率P(d
elete−word(ewm))および単語複写確率
P(echo−word(ewm,iwn))を用い
て、次式を満たすように与えられる。
【0263】 P(delete-word(ewm))<P(cache-as-deleted(ewm))<P(echo-word(ewm,iwn)) ・・・(32)
【0264】なお、ここでは、仮省略確率P(cach
e−as−deleted(ewm))は、式(32)
を満足し、かつ、例えば、類似する単語についての単語
置換確率P(alter−word(ewm,iwn)よ
りは低く、類似しない単語についての単語置換確率P
(alter−word(ewm,iwn)よりは高い値
とする。
e−as−deleted(ewm))は、式(32)
を満足し、かつ、例えば、類似する単語についての単語
置換確率P(alter−word(ewm,iwn)よ
りは低く、類似しない単語についての単語置換確率P
(alter−word(ewm,iwn)よりは高い値
とする。
【0265】仮挿入オペレータcache−as−ad
ded(iwn)についての確率(以下、適宜、仮挿入
確率という)P(cache−as−added(iw
n))は、例えば、単語挿入確率P(add−word
(iwn))および単語複写確率P(echo−wor
d(ewm,iwn))を用いて、次式を満たすように与
えられる。
ded(iwn)についての確率(以下、適宜、仮挿入
確率という)P(cache−as−added(iw
n))は、例えば、単語挿入確率P(add−word
(iwn))および単語複写確率P(echo−wor
d(ewm,iwn))を用いて、次式を満たすように与
えられる。
【0266】 P(add-word(iwn))<P(cache-as-added(iwn))<P(echo-word(ewm,iwn)) ・・・(33)
【0267】なお、ここでは、仮挿入確率P(cach
e−as−added(iwn))は、式(33)を満
足し、かつ、例えば、類似する単語についての単語置換
確率P(alter−word(ewm,iwn)よりは
低く、類似しない単語についての単語置換確率P(al
ter−word(ewm,iwn)よりは高い値とす
る。
e−as−added(iwn))は、式(33)を満
足し、かつ、例えば、類似する単語についての単語置換
確率P(alter−word(ewm,iwn)よりは
低く、類似しない単語についての単語置換確率P(al
ter−word(ewm,iwn)よりは高い値とす
る。
【0268】また、式(32)および(33)における
単語複写確率P(echo−word(ewm,i
wn))は、単語ewmとiwnとが一致している場合に
式(22)で与えられるものとする(単語ewmとiwn
とが一致していない場合、上述したように、単語複写確
率P(echo−word(ewm,iwn))は0とな
るので、この場合、仮省略確率P(cache−as−
deleted(ewm))および仮挿入確率P(ca
che−as−added(iwn))の上限は、単語
複写確率P(echo−word(ewm,iwn))に
よっては制限されないものとする)。
単語複写確率P(echo−word(ewm,i
wn))は、単語ewmとiwnとが一致している場合に
式(22)で与えられるものとする(単語ewmとiwn
とが一致していない場合、上述したように、単語複写確
率P(echo−word(ewm,iwn))は0とな
るので、この場合、仮省略確率P(cache−as−
deleted(ewm))および仮挿入確率P(ca
che−as−added(iwn))の上限は、単語
複写確率P(echo−word(ewm,iwn))に
よっては制限されないものとする)。
【0269】スクランブルオペレータscramble
(ewm,iwn)についての確率(以下、適宜、スクラ
ンブル確率という)P(scramble(ewm,i
wn))は、例えば、次式で与えられる。
(ewm,iwn)についての確率(以下、適宜、スクラ
ンブル確率という)P(scramble(ewm,i
wn))は、例えば、次式で与えられる。
【0270】 P(scramble(ewm,iwn))=f(P(alter-word(ewm,iwn)),iwn) ewm≠iwnの場合 P(scramble(ewm,iwn))=f(P(echo-word(ewm,iwn)),iwn) ewm=iwnの場合 ・・・(35)
【0271】式(35)において、関数f()は、単語
や句などの順番が入れ替わる現象(スクランブル)の起
こり易さを求めるものであり、例えば、キャッシュ7A
に記憶されている単語の性質(例えば、品詞など)や、
入力句Iの言語や、入力句Iが用いられる状況などを考
慮して設定することができる。即ち、関数f()は、例
えば、英語などよりも語順の入れ替えが自由な日本語の
入力句Iに対しては、英語の入力句Iよりも高い確率を
与えるように設定することができる。また、関数f()
は、書き言葉に比較して、倒置などの語順の入れ替えが
起こり易い話し言葉に対して、高い確率を与えるように
設定することができる。
や句などの順番が入れ替わる現象(スクランブル)の起
こり易さを求めるものであり、例えば、キャッシュ7A
に記憶されている単語の性質(例えば、品詞など)や、
入力句Iの言語や、入力句Iが用いられる状況などを考
慮して設定することができる。即ち、関数f()は、例
えば、英語などよりも語順の入れ替えが自由な日本語の
入力句Iに対しては、英語の入力句Iよりも高い確率を
与えるように設定することができる。また、関数f()
は、書き言葉に比較して、倒置などの語順の入れ替えが
起こり易い話し言葉に対して、高い確率を与えるように
設定することができる。
【0272】なお、式(35)では、関数f()の引数
として、ewm≠iwnの場合には単語置換確率P(al
ter−word(ewm,iwn))を、ewm=iwn
の場合には単語複写確率P(echo−word(ew
m,iwn))を用いているが、これは、単語ewmとi
wnとが一致していない場合(ewm≠iwnの場合)に
は、用例句Eを構成する単語が置換されて語順が入れ替
えられたと考えられ、単語ewmとiwnとが一致してい
る場合(ewm=iwnの場合)には、用例句Eを構成す
る単語が、そのまま複写され、語順だけが入れ替えられ
たと考えられるからである。
として、ewm≠iwnの場合には単語置換確率P(al
ter−word(ewm,iwn))を、ewm=iwn
の場合には単語複写確率P(echo−word(ew
m,iwn))を用いているが、これは、単語ewmとi
wnとが一致していない場合(ewm≠iwnの場合)に
は、用例句Eを構成する単語が置換されて語順が入れ替
えられたと考えられ、単語ewmとiwnとが一致してい
る場合(ewm=iwnの場合)には、用例句Eを構成す
る単語が、そのまま複写され、語順だけが入れ替えられ
たと考えられるからである。
【0273】また、式(35)では、ewm≠iwnの場
合、およびewm=iwnの場合のいずれの場合にも、関
数f()の引数として、入力句Iを構成する単語iwn
を用いているが、これは、単語iwnによって、語順の
入れ替わり易さが異なると考えられるからである。即
ち、例えば、日本語では、動詞が先頭に移動される場合
はほとんどなく、従って、単語iwnが動詞である場合
には、関数f()は、スクランブル確率P(scram
ble(ewm,iwn))が小さくなるような値とな
る。
合、およびewm=iwnの場合のいずれの場合にも、関
数f()の引数として、入力句Iを構成する単語iwn
を用いているが、これは、単語iwnによって、語順の
入れ替わり易さが異なると考えられるからである。即
ち、例えば、日本語では、動詞が先頭に移動される場合
はほとんどなく、従って、単語iwnが動詞である場合
には、関数f()は、スクランブル確率P(scram
ble(ewm,iwn))が小さくなるような値とな
る。
【0274】次に、複合オペレータcompound
(iwn-1,iwn)についての確率(以下、適宜、複合
確率という)P(compound(iwn-1,i
wn))は、例えば、次式で与えられる。
(iwn-1,iwn)についての確率(以下、適宜、複合
確率という)P(compound(iwn-1,i
wn))は、例えば、次式で与えられる。
【0275】 P(compound(iwn-1,iwn))=g(iwn-1,iwn) ・・・(36)
【0276】式(36)において、関数g(iwn-1,
iwn)は、連続する単語iwn-1およびiwnが複合語
を形成する確率を表すもので、これは、例えば、次のよ
うにして計算することができる。即ち、例えば、複合語
の用例を多数記憶しておき、その中から、単語i
wn-1,iwnの並びに最も類似するものを求め、その類
似度を正規化するなどして、複合語を形成する確率とす
ることなどが可能である。
iwn)は、連続する単語iwn-1およびiwnが複合語
を形成する確率を表すもので、これは、例えば、次のよ
うにして計算することができる。即ち、例えば、複合語
の用例を多数記憶しておき、その中から、単語i
wn-1,iwnの並びに最も類似するものを求め、その類
似度を正規化するなどして、複合語を形成する確率とす
ることなどが可能である。
【0277】なお、記憶している複合語の用例との類似
度が充分大きい場合には、複合確率P(compoun
d(iwn-1,iwn))は、単語挿入確率P(add−
word(iwn))よりも高くなる。
度が充分大きい場合には、複合確率P(compoun
d(iwn-1,iwn))は、単語挿入確率P(add−
word(iwn))よりも高くなる。
【0278】そして、用例句Eを構成する単語ew
mが、入力句Iを構成する単語iwnとしてそのまま複写
され、その1つ前の単語iwn-1と複合語を構成する確
率(以下、適宜、複写/複合確率という)は、単語複写
確率P(echo−word(ewm,iwn))と、複
合確率P(compound(iwn-1,iwn))との
積で表され、用例句Eを構成する単語ewmが、入力句
Iを構成する単語iwnに置換され、その1つ前の単語
iwn-1と複合語を構成する確率(以下、適宜、置換/
複合確率という)は、単語置換確率P(alter−w
ord(ewm,iwn))と複合確率P(compou
nd(iwn-1,iwn))との積で表される。
mが、入力句Iを構成する単語iwnとしてそのまま複写
され、その1つ前の単語iwn-1と複合語を構成する確
率(以下、適宜、複写/複合確率という)は、単語複写
確率P(echo−word(ewm,iwn))と、複
合確率P(compound(iwn-1,iwn))との
積で表され、用例句Eを構成する単語ewmが、入力句
Iを構成する単語iwnに置換され、その1つ前の単語
iwn-1と複合語を構成する確率(以下、適宜、置換/
複合確率という)は、単語置換確率P(alter−w
ord(ewm,iwn))と複合確率P(compou
nd(iwn-1,iwn))との積で表される。
【0279】次に、単語複写オペレータecho−wo
rd(ewm,iwn)、単語置換オペレータalter
−word(ewm,iwn)、仮省略オペレータcac
he−as−deleted(ewm)、仮挿入オペレ
ータcache−as−added(iwn)、スクラ
ンブルオペレータscramble(ewm,iwn)、
および複合オペレータcompound(iwn-1,i
wn)の6つの変形オペレータによれば、用例句Eに対
して、次のような8種類の変形を施すことができる。
rd(ewm,iwn)、単語置換オペレータalter
−word(ewm,iwn)、仮省略オペレータcac
he−as−deleted(ewm)、仮挿入オペレ
ータcache−as−added(iwn)、スクラ
ンブルオペレータscramble(ewm,iwn)、
および複合オペレータcompound(iwn-1,i
wn)の6つの変形オペレータによれば、用例句Eに対
して、次のような8種類の変形を施すことができる。
【0280】即ち、第1に、単語複写オペレータech
o−word(ewm,iwn)によれば、用例句Eを構
成する単語ewmを、そのまま、入力句Iを構成する単
語iwnとすることができる。第2に、単語置換オペレ
ータalter−word(ewm,iwn)によれば、
用例句Eを構成する単語ewmを、入力句Iを構成する
単語iwnに置換することができる。第3に、仮省略オ
ペレータcache−as−deleted(ewm)
によれば、用例句Eを構成する単語ewmを仮に省略す
ることができ、第4に、仮挿入オペレータcache−
as−added(iwn)によれば、入力句Iを構成
する単語iwnを仮に挿入することができる。
o−word(ewm,iwn)によれば、用例句Eを構
成する単語ewmを、そのまま、入力句Iを構成する単
語iwnとすることができる。第2に、単語置換オペレ
ータalter−word(ewm,iwn)によれば、
用例句Eを構成する単語ewmを、入力句Iを構成する
単語iwnに置換することができる。第3に、仮省略オ
ペレータcache−as−deleted(ewm)
によれば、用例句Eを構成する単語ewmを仮に省略す
ることができ、第4に、仮挿入オペレータcache−
as−added(iwn)によれば、入力句Iを構成
する単語iwnを仮に挿入することができる。
【0281】さらに、スクランブルオペレータscra
mble(ewm,iwn)によれば、次の2通りの語順
の入れ替えを行うことができる。即ち、第5に、スクラ
ンブルオペレータscramble(ewk,iwn)に
よれば、キャッシュ7Aに記憶されている仮省略単語e
wkを、入力句Iのn番目の単語iwnとして挿入して、
語順を入れ替えることができる。第6に、スクランブル
オペレータscramble(ewm,iws)によれ
ば、キャッシュ7Aに記憶されている仮挿入単語iws
を、用例句Eのm番目の単語ewmの語順が入れ替えら
れたものとすることができる。
mble(ewm,iwn)によれば、次の2通りの語順
の入れ替えを行うことができる。即ち、第5に、スクラ
ンブルオペレータscramble(ewk,iwn)に
よれば、キャッシュ7Aに記憶されている仮省略単語e
wkを、入力句Iのn番目の単語iwnとして挿入して、
語順を入れ替えることができる。第6に、スクランブル
オペレータscramble(ewm,iws)によれ
ば、キャッシュ7Aに記憶されている仮挿入単語iws
を、用例句Eのm番目の単語ewmの語順が入れ替えら
れたものとすることができる。
【0282】そして、第7に、単語複写オペレータec
ho−word(ewm,iwn)と複合オペレータco
mpound(iwn-1,iwn)との組合せ(複写/複
合オペレータ)によれば、用例句Eを構成する単語ew
mを、入力句Iを構成する単語iwnとしてそのまま複写
し、その1つ前の単語iwn-1と複合語を構成させるこ
とができ、第8に、単語置換オペレータalter−w
ord(ewm,iwn)と複合オペレータcompou
nd(iwn-1,iwn)との組合せ(置換/複合オペレ
ータ)によれば、用例句Eを構成する単語ewmを、入
力句Iを構成する単語iwnに置換し、その1つ前の単
語iwn-1と複合語を構成させることができる。
ho−word(ewm,iwn)と複合オペレータco
mpound(iwn-1,iwn)との組合せ(複写/複
合オペレータ)によれば、用例句Eを構成する単語ew
mを、入力句Iを構成する単語iwnとしてそのまま複写
し、その1つ前の単語iwn-1と複合語を構成させるこ
とができ、第8に、単語置換オペレータalter−w
ord(ewm,iwn)と複合オペレータcompou
nd(iwn-1,iwn)との組合せ(置換/複合オペレ
ータ)によれば、用例句Eを構成する単語ewmを、入
力句Iを構成する単語iwnに置換し、その1つ前の単
語iwn-1と複合語を構成させることができる。
【0283】以上の8つの変形を施すことのできる変形
オペレータの最適な集合、即ち、最適経路を、DPマッ
チングによって求めることを考えると、これは、例え
ば、式(31)における場合と同様の式(37)に示
す、8つの変形に対応するパス(経路)の重みを用いた
累積距離G(m,n)を計算することで求めることがで
きる。
オペレータの最適な集合、即ち、最適経路を、DPマッ
チングによって求めることを考えると、これは、例え
ば、式(31)における場合と同様の式(37)に示
す、8つの変形に対応するパス(経路)の重みを用いた
累積距離G(m,n)を計算することで求めることがで
きる。
【0284】
【数29】 ・・・(37)
【0285】図11の実施の形態では、変換部7におい
て、キャッシュ7Aを必要に応じて用いながら、m=M
となるまで、式(37)を計算することにより、最適経
路が求められ、単語変形確率が算出されるようになされ
ている。
て、キャッシュ7Aを必要に応じて用いながら、m=M
となるまで、式(37)を計算することにより、最適経
路が求められ、単語変形確率が算出されるようになされ
ている。
【0286】即ち、図12のフローチャートに示すよう
に、変換部7では、まず最初に、ステップS61におい
て、式(37)にしたがい、注目用例句Eを構成する単
語ewmと、入力句Iを構成する単語iwnとを対応させ
たときの累積距離G(m,n)が求められる。
に、変換部7では、まず最初に、ステップS61におい
て、式(37)にしたがい、注目用例句Eを構成する単
語ewmと、入力句Iを構成する単語iwnとを対応させ
たときの累積距離G(m,n)が求められる。
【0287】そして、ステップS62に進み、変換部7
において、ステップS61における累積距離G(m,
n)の計算にあたって、仮省略オペレータcache−
as−deleted(ewm)に対応する経路、即
ち、式(37)における右辺の式のうち、上から3行目
の式が選択されたかどうかが判定され、選択されたと判
定された場合、ステップS63に進む。ステップS63
では、仮省略オペレータcache−as−delet
ed(ewm)により仮省略された単語ewmが、キャッ
シュ7Aに退避(記憶)され、ステップS64に進む。
において、ステップS61における累積距離G(m,
n)の計算にあたって、仮省略オペレータcache−
as−deleted(ewm)に対応する経路、即
ち、式(37)における右辺の式のうち、上から3行目
の式が選択されたかどうかが判定され、選択されたと判
定された場合、ステップS63に進む。ステップS63
では、仮省略オペレータcache−as−delet
ed(ewm)により仮省略された単語ewmが、キャッ
シュ7Aに退避(記憶)され、ステップS64に進む。
【0288】また、ステップS62において、仮省略オ
ペレータcache−as−deleted(ewm)
に対応する経路が選択されていないと判定された場合、
ステップS63をスキップして、ステップS64に進
み、累積距離G(m,n)の計算にあたって、仮挿入オ
ペレータcache−as−added(iwn)に対
応する経路、即ち、式(37)における右辺の式のう
ち、上から4行目の式が選択されたかどうかが判定され
る。ステップS64において、仮挿入オペレータcac
he−as−added(iwn)に対応する経路が選
択されたと判定された場合、ステップS65に進み、仮
挿入オペレータcache−as−added(i
wn)により仮挿入された単語iwnが、キャッシュ7A
に退避され、ステップS66に進む。
ペレータcache−as−deleted(ewm)
に対応する経路が選択されていないと判定された場合、
ステップS63をスキップして、ステップS64に進
み、累積距離G(m,n)の計算にあたって、仮挿入オ
ペレータcache−as−added(iwn)に対
応する経路、即ち、式(37)における右辺の式のう
ち、上から4行目の式が選択されたかどうかが判定され
る。ステップS64において、仮挿入オペレータcac
he−as−added(iwn)に対応する経路が選
択されたと判定された場合、ステップS65に進み、仮
挿入オペレータcache−as−added(i
wn)により仮挿入された単語iwnが、キャッシュ7A
に退避され、ステップS66に進む。
【0289】また、ステップS64において、仮挿入オ
ペレータcache−as−added(iwn)に対
応する経路が選択されていないと判定された場合、ステ
ップS65をスキップして、ステップS66に進み、累
積距離G(m,n)の計算にあたって、複写/複合オペ
レータまたは置換/複合オペレータに対応する経路、即
ち、式(37)のおける右辺の式のうち、上から7行目
または8行目の式が選択されたかどうかが判定される。
ステップS66において、複写/複合オペレータまたは
置換/複合オペレータに対応する経路が選択されたと判
定された場合、ステップS67に進み、複写/複合オペ
レータまたは置換/複合オペレータにより複合語を構成
する修飾語とされた仮挿入単語iwn-1がキャッシュ7
Aに記憶されているので、それが削除され、ステップS
68に進む。
ペレータcache−as−added(iwn)に対
応する経路が選択されていないと判定された場合、ステ
ップS65をスキップして、ステップS66に進み、累
積距離G(m,n)の計算にあたって、複写/複合オペ
レータまたは置換/複合オペレータに対応する経路、即
ち、式(37)のおける右辺の式のうち、上から7行目
または8行目の式が選択されたかどうかが判定される。
ステップS66において、複写/複合オペレータまたは
置換/複合オペレータに対応する経路が選択されたと判
定された場合、ステップS67に進み、複写/複合オペ
レータまたは置換/複合オペレータにより複合語を構成
する修飾語とされた仮挿入単語iwn-1がキャッシュ7
Aに記憶されているので、それが削除され、ステップS
68に進む。
【0290】また、ステップS66において、複写/複
合オペレータまたは置換/複合オペレータに対応する経
路のいずれも選択されていないと判定された場合、ステ
ップS67をスキップして、ステップS68に進み、累
積距離G(m,n)の計算にあたって、スクランブルオ
ペレータscramble(ewk,iwn)またはsc
ramble(ewm,iws)に対応する経路、即ち、
式(37)のおける右辺の式のうち、上から5行目また
は6行目の式が選択されたかどうかが判定される。ステ
ップS68において、スクランブルオペレータscra
mble(ewk,iwn)またはscramble(e
wm,iws)に対応する経路が選択されたと判定された
場合、ステップS69に進み、語順の入れ替えがされた
仮省略単語ewkまたは仮挿入単語iwsが、キャッシュ
7Aに記憶されているので、それが削除され、ステップ
S70に進む。
合オペレータまたは置換/複合オペレータに対応する経
路のいずれも選択されていないと判定された場合、ステ
ップS67をスキップして、ステップS68に進み、累
積距離G(m,n)の計算にあたって、スクランブルオ
ペレータscramble(ewk,iwn)またはsc
ramble(ewm,iws)に対応する経路、即ち、
式(37)のおける右辺の式のうち、上から5行目また
は6行目の式が選択されたかどうかが判定される。ステ
ップS68において、スクランブルオペレータscra
mble(ewk,iwn)またはscramble(e
wm,iws)に対応する経路が選択されたと判定された
場合、ステップS69に進み、語順の入れ替えがされた
仮省略単語ewkまたは仮挿入単語iwsが、キャッシュ
7Aに記憶されているので、それが削除され、ステップ
S70に進む。
【0291】一方、ステップS68において、スクラン
ブルオペレータscramble(ewk,iwn)また
はscramble(ewm,iws)に対応する経路の
いずれも選択されていないと判定された場合、ステップ
S69をスキップして、ステップS70に進み、mがM
(注目用例句Eを構成する単語数)未満であるかどうか
が判定され。mがM未満であると判定された場合、ステ
ップS61に戻り、変換部7は、m,nを増加させ、以
下、同様の処理を繰り返す。そして、ステップS70に
おいて、mがM未満でないと判定された場合、即ち、m
がMに等しい場合、ステップS71に進み、キャッシュ
7Aに仮省略単語ewmまたは仮挿入単語iwnが記憶さ
れているかどうかが判定される。
ブルオペレータscramble(ewk,iwn)また
はscramble(ewm,iws)に対応する経路の
いずれも選択されていないと判定された場合、ステップ
S69をスキップして、ステップS70に進み、mがM
(注目用例句Eを構成する単語数)未満であるかどうか
が判定され。mがM未満であると判定された場合、ステ
ップS61に戻り、変換部7は、m,nを増加させ、以
下、同様の処理を繰り返す。そして、ステップS70に
おいて、mがM未満でないと判定された場合、即ち、m
がMに等しい場合、ステップS71に進み、キャッシュ
7Aに仮省略単語ewmまたは仮挿入単語iwnが記憶さ
れているかどうかが判定される。
【0292】ステップS71において、キャッシュ7A
に仮省略単語ewmまたは仮挿入単語iwnが記憶されて
いると判定された場合、ステップS72に進み、累積距
離G(M,n)が得られたときのパスのうち、キャッシ
ュ7Aに記憶されている仮省略単語ewmを仮省略した
仮省略オペレータcache−as−deleted
(ewm)に対応する経路、またはキャッシュ7Aに記
憶されている仮挿入単語iwnを仮挿入した仮挿入オペ
レータcache−as−added(iwn)に対応
する経路が、単語省略オペレータdelete−wor
d(ewm)に対応する経路、または単語挿入オペレー
タadd−word(iwn)に対応する経路にそれぞ
れ変換され、その結果得られるパスが、最適経路とされ
て、ステップS73に進む。
に仮省略単語ewmまたは仮挿入単語iwnが記憶されて
いると判定された場合、ステップS72に進み、累積距
離G(M,n)が得られたときのパスのうち、キャッシ
ュ7Aに記憶されている仮省略単語ewmを仮省略した
仮省略オペレータcache−as−deleted
(ewm)に対応する経路、またはキャッシュ7Aに記
憶されている仮挿入単語iwnを仮挿入した仮挿入オペ
レータcache−as−added(iwn)に対応
する経路が、単語省略オペレータdelete−wor
d(ewm)に対応する経路、または単語挿入オペレー
タadd−word(iwn)に対応する経路にそれぞ
れ変換され、その結果得られるパスが、最適経路とされ
て、ステップS73に進む。
【0293】また、ステップS71において、キャッシ
ュ7Aに仮省略単語ewmまたは仮挿入単語iwnのいず
れも記憶されていないと判定された場合、累積距離G
(M,n)が得られたときのパスがそのまま最適経路と
され、ステップS73に進み、その最適経路にしたがっ
て、単語変形確率が計算される。
ュ7Aに仮省略単語ewmまたは仮挿入単語iwnのいず
れも記憶されていないと判定された場合、累積距離G
(M,n)が得られたときのパスがそのまま最適経路と
され、ステップS73に進み、その最適経路にしたがっ
て、単語変形確率が計算される。
【0294】なお、この場合、最適経路は、キャッシュ
7Aから削除された仮省略単語ewmまたは仮挿入単語
iwnをそれぞれ仮省略または仮挿入した仮省略オペレ
ータcache−as−deleted(ewm)また
は仮挿入オペレータcache−as−added(i
wn)に対応する経路を含むが、この経路は、単語変形
確率の計算にあたって無視するようにすることができ
る。
7Aから削除された仮省略単語ewmまたは仮挿入単語
iwnをそれぞれ仮省略または仮挿入した仮省略オペレ
ータcache−as−deleted(ewm)また
は仮挿入オペレータcache−as−added(i
wn)に対応する経路を含むが、この経路は、単語変形
確率の計算にあたって無視するようにすることができ
る。
【0295】以上のように、仮省略オペレータcach
e−as−deleted(ewm)および仮挿入オペ
レータcache−as−added(iwn)とも
に、スクランブルオペレータscramble(e
wm,iwn)を導入したので、類似する入力句Iと用例
句Eとの間の語順が異なっていても、その類似性を正し
く判定することが可能となる。
e−as−deleted(ewm)および仮挿入オペ
レータcache−as−added(iwn)とも
に、スクランブルオペレータscramble(e
wm,iwn)を導入したので、類似する入力句Iと用例
句Eとの間の語順が異なっていても、その類似性を正し
く判定することが可能となる。
【0296】さらに、複合オペレータcompound
(iwn-1,iwn)も導入したので、複合語にも対処す
ることが可能となる。
(iwn-1,iwn)も導入したので、複合語にも対処す
ることが可能となる。
【0297】なお、仮省略単語および仮挿入単語を一時
記憶するキャッシュ7Aのような記憶手段を用いて確率
を計算する方法は、例えば、Roland Kuhn and Renato D
e Mori, "A Cache-based Natural Language Model for
Speech Recognition", IEEETransactions on Pattern A
nalysis and Machine Intelligence, vol.12, No.6,jun
e 1990などにおいて、音声認識のための言語モデルに適
用されている。
記憶するキャッシュ7Aのような記憶手段を用いて確率
を計算する方法は、例えば、Roland Kuhn and Renato D
e Mori, "A Cache-based Natural Language Model for
Speech Recognition", IEEETransactions on Pattern A
nalysis and Machine Intelligence, vol.12, No.6,jun
e 1990などにおいて、音声認識のための言語モデルに適
用されている。
【0298】ここでは、最近用いられた単語が再び現れ
る(発話される)確率は、その単語が初めて現れる確率
よりも高いという仮説に基づく言語モデルが提案されて
おり、最近用いられた単語を記憶手段に記憶させてお
き、その記憶手段を参照して、i番目の単語Wiが、所
定の単語Wである確率が計算されるようになされてい
る。
る(発話される)確率は、その単語が初めて現れる確率
よりも高いという仮説に基づく言語モデルが提案されて
おり、最近用いられた単語を記憶手段に記憶させてお
き、その記憶手段を参照して、i番目の単語Wiが、所
定の単語Wである確率が計算されるようになされてい
る。
【0299】即ち、例えば、普通の3g−gramモデ
ルでは、i−1またはi−2番目の単語の品詞をgi-1
またはgi-2とそれぞれ表すときに、i番目の単語W
iが、所定の単語Wである確率P(Wi=W|gi-2,g
i-1)は、例えば、次式で計算される。
ルでは、i−1またはi−2番目の単語の品詞をgi-1
またはgi-2とそれぞれ表すときに、i番目の単語W
iが、所定の単語Wである確率P(Wi=W|gi-2,g
i-1)は、例えば、次式で計算される。
【0300】
【数30】 ・・・(38) なお、Gは、音声認識の対象とする言語における品詞の
集合を意味する。
集合を意味する。
【0301】そして、上述の文献では、式(38)の右
辺におけるP(Wi=W|gi=gj)を、記憶手段に最
近現れた単語を記憶することにより、次の式(39)に
したがって計算する方法が提案されている。
辺におけるP(Wi=W|gi=gj)を、記憶手段に最
近現れた単語を記憶することにより、次の式(39)に
したがって計算する方法が提案されている。
【0302】
【数31】 ・・・(39) なお、kM,j+kC,j=1で、kM,jおよびkC,jは、いず
れもjのみをインデックスとする変数である。
れもjのみをインデックスとする変数である。
【0303】式(39)の右辺におけるCj(W,i)
が、記憶手段を参照することにより計算される確率で、
単語Wが最近現れたかどうかで変化するようになされて
いる。
が、記憶手段を参照することにより計算される確率で、
単語Wが最近現れたかどうかで変化するようになされて
いる。
【0304】従って、図11の実施の形態における手法
は、単語をキャッシュ7Aに記憶させ、それを参照しな
がら確率を計算していく点で、単語を記憶手段に記憶さ
せて、それを参照しながら確率を計算していく上述の文
献の手法と共通するが、キャッシュ7Aには仮省略また
は仮挿入された単語のみを記憶させる点で、最近現れた
単語を記憶手段に記憶させる上述の文献の手法とは異な
る。
は、単語をキャッシュ7Aに記憶させ、それを参照しな
がら確率を計算していく点で、単語を記憶手段に記憶さ
せて、それを参照しながら確率を計算していく上述の文
献の手法と共通するが、キャッシュ7Aには仮省略また
は仮挿入された単語のみを記憶させる点で、最近現れた
単語を記憶手段に記憶させる上述の文献の手法とは異な
る。
【0305】また、複合オペレータcompound
(iwn-1,iwn)によれば、上述したような複合名詞
に対処することができる他、例えば、用例句Eが「犬は
かわいい」であるのに対して、入力句Iが「私の犬はか
わいい」である場合のように、入力句Iを構成する単語
「犬」に修飾語「私の」が付加された複合語「私の犬」
と、用例句Eを構成する単語「犬」とが対応するときな
ども対処することが可能である。但し、「私の犬」のよ
うに、「私の」が「犬」を修飾することが明かな場合
は、用例句Eの「犬」と入力句I「私の犬」とについ
て、置換オペレータalter−word(「犬」,
「私の犬」)を適用し、さらに、「私の×」(ここの×
は名詞を表す)という名詞句用例を用いることにより、
正しく、かつ複合オペレータcompound(iw
n-1,iwn)を用いるときよりも効率的に処理すること
ができる。
(iwn-1,iwn)によれば、上述したような複合名詞
に対処することができる他、例えば、用例句Eが「犬は
かわいい」であるのに対して、入力句Iが「私の犬はか
わいい」である場合のように、入力句Iを構成する単語
「犬」に修飾語「私の」が付加された複合語「私の犬」
と、用例句Eを構成する単語「犬」とが対応するときな
ども対処することが可能である。但し、「私の犬」のよ
うに、「私の」が「犬」を修飾することが明かな場合
は、用例句Eの「犬」と入力句I「私の犬」とについ
て、置換オペレータalter−word(「犬」,
「私の犬」)を適用し、さらに、「私の×」(ここの×
は名詞を表す)という名詞句用例を用いることにより、
正しく、かつ複合オペレータcompound(iw
n-1,iwn)を用いるときよりも効率的に処理すること
ができる。
【0306】即ち、複合オペレータcompound
(iwn-1,iwn)は、修飾関係が不明な、例えば「私
の犬」などの助詞「の」を伴うものでないもの(例え
ば、複合名詞)が入力部1に入力された場合や、また、
入力部1における音声認識装置で助詞を認識することが
できず、例えば、実際の入力「私の犬はかわいい」に対
して、入力部1から「私、犬はかわいい」などが出力さ
れた場合などに有効である。
(iwn-1,iwn)は、修飾関係が不明な、例えば「私
の犬」などの助詞「の」を伴うものでないもの(例え
ば、複合名詞)が入力部1に入力された場合や、また、
入力部1における音声認識装置で助詞を認識することが
できず、例えば、実際の入力「私の犬はかわいい」に対
して、入力部1から「私、犬はかわいい」などが出力さ
れた場合などに有効である。
【0307】以上、本発明を、日本語から英語への翻訳
を行う翻訳装置に適用した場合ついて説明したが、本発
明は、その他の言語間の翻訳を行う翻訳装置にも適用可
能である。
を行う翻訳装置に適用した場合ついて説明したが、本発
明は、その他の言語間の翻訳を行う翻訳装置にも適用可
能である。
【0308】なお、翻訳装置には、出力部16から出力
される翻訳結果を訂正または確認するためのボタン(以
下、適宜、それぞれを訂正ボタンまたは確認ボタンとい
う)などを設けるようにすることが可能である。そし
て、翻訳装置には、確認ボタンが操作された場合には、
翻訳結果が正しいものとして、次の処理を行わせるよう
にすることができる。また、訂正ボタンが操作された場
合には、翻訳結果が誤っているものとして、再度、翻訳
処理を行わせるようにすることができる。即ち、例え
ば、翻訳適正率が次に高い用例を検出させ、その用例に
基づいて、翻訳を行わせるようにすることなどができ
る。さらに、翻訳装置には、出力部16から出力される
翻訳結果を訂正するための操作部などを設けるようにす
ることも可能である。この場合、操作部が操作されるこ
とにより翻訳結果が訂正されたときには、その訂正結果
に対応する用例を、名詞句対訳用例記憶部8、動詞句対
訳用例記憶部9、またはその他対訳用例記憶部10に記
憶させるようにすることも可能である。
される翻訳結果を訂正または確認するためのボタン(以
下、適宜、それぞれを訂正ボタンまたは確認ボタンとい
う)などを設けるようにすることが可能である。そし
て、翻訳装置には、確認ボタンが操作された場合には、
翻訳結果が正しいものとして、次の処理を行わせるよう
にすることができる。また、訂正ボタンが操作された場
合には、翻訳結果が誤っているものとして、再度、翻訳
処理を行わせるようにすることができる。即ち、例え
ば、翻訳適正率が次に高い用例を検出させ、その用例に
基づいて、翻訳を行わせるようにすることなどができ
る。さらに、翻訳装置には、出力部16から出力される
翻訳結果を訂正するための操作部などを設けるようにす
ることも可能である。この場合、操作部が操作されるこ
とにより翻訳結果が訂正されたときには、その訂正結果
に対応する用例を、名詞句対訳用例記憶部8、動詞句対
訳用例記憶部9、またはその他対訳用例記憶部10に記
憶させるようにすることも可能である。
【0309】また、本実施の形態では、例えば式(5)
にしたがって、あるいは、図7で説明したようにして、
各用例Eiの事前確率P(Ei)を求めるようにしたが、
この事前確率P(Ei)は、例えば用例数NEの逆数1/
NEなど、各用例Eiについて同一の値を用いることも可
能である。
にしたがって、あるいは、図7で説明したようにして、
各用例Eiの事前確率P(Ei)を求めるようにしたが、
この事前確率P(Ei)は、例えば用例数NEの逆数1/
NEなど、各用例Eiについて同一の値を用いることも可
能である。
【0310】さらに、本実施の形態では、類似度計算部
11において、2つの単語の共通の概念に包含される単
語の数に基づいて、単語置換確率を求めるようにした
が、単語置換確率は、従来の同様に、シソーラスにおい
て、2つの単語の共通の概念が属する階層のレベルに基
づいて求めるようにすることも可能である。即ち、シソ
ーラスの階層数をCとするとともに、入力句Iの単語i
wnと用例句Eの単語ewmとの共通の概念が属する階層
のレベルをLとするとき、単語置換確率P(alter
−word(ewm,iwn))は、例えば次式にしたが
って求めるようにすることも可能である。
11において、2つの単語の共通の概念に包含される単
語の数に基づいて、単語置換確率を求めるようにした
が、単語置換確率は、従来の同様に、シソーラスにおい
て、2つの単語の共通の概念が属する階層のレベルに基
づいて求めるようにすることも可能である。即ち、シソ
ーラスの階層数をCとするとともに、入力句Iの単語i
wnと用例句Eの単語ewmとの共通の概念が属する階層
のレベルをLとするとき、単語置換確率P(alter
−word(ewm,iwn))は、例えば次式にしたが
って求めるようにすることも可能である。
【0311】
【数32】 ・・・(40)
【0312】また、本実施の形態では、単語省略確率な
どを、単語の品詞(単語が自立語であるかどうかや、機
能語であるかどうかなど)に基づいて決定するようにし
たが、翻訳装置が適用されるドメインによっては、品詞
以外の情報に基づいて決定するようにすることが有効な
場合もある。即ち、例えば、話し言葉などにおいては、
第1人称や第2人称などの代名詞が省略され易いこと
や、文脈上トピックとなっている単語は、会話をする者
の間で明らかであるため省略され易いことなどを考慮し
て、単語省略確率などを決定するようにすることが可能
である。
どを、単語の品詞(単語が自立語であるかどうかや、機
能語であるかどうかなど)に基づいて決定するようにし
たが、翻訳装置が適用されるドメインによっては、品詞
以外の情報に基づいて決定するようにすることが有効な
場合もある。即ち、例えば、話し言葉などにおいては、
第1人称や第2人称などの代名詞が省略され易いこと
や、文脈上トピックとなっている単語は、会話をする者
の間で明らかであるため省略され易いことなどを考慮し
て、単語省略確率などを決定するようにすることが可能
である。
【0313】さらに、単語挿入確率または単語省略確率
は、式(41)または(42)にそれぞれ示すように、
場合分けせずに、所定の一定値とするようにすることも
可能である。
は、式(41)または(42)にそれぞれ示すように、
場合分けせずに、所定の一定値とするようにすることも
可能である。
【0314】
【数33】 ・・・(41)
【数34】 ・・・(42)
【0315】また、単語省略確率などは、所定の計算式
にしたがって与えるようにすることも可能である。
にしたがって与えるようにすることも可能である。
【0316】さらに、本実施の形態では、節または句の
単位で、翻訳を行うようにしたが、その他の構文単位で
翻訳を行うようにすることも可能である。また、そのよ
うな構文単位に分割せずに翻訳を行うようにすることも
可能である。さらに、本実施の形態では、用例句を、名
詞句、動詞句、およびその他の句に分けて記憶しておく
ようにしたが、用例句の分類方法は、これに限定される
ものではない。
単位で、翻訳を行うようにしたが、その他の構文単位で
翻訳を行うようにすることも可能である。また、そのよ
うな構文単位に分割せずに翻訳を行うようにすることも
可能である。さらに、本実施の形態では、用例句を、名
詞句、動詞句、およびその他の句に分けて記憶しておく
ようにしたが、用例句の分類方法は、これに限定される
ものではない。
【0317】
【発明の効果】請求項1に記載の翻訳装置および請求項
25に記載の翻訳方法によれば、第1言語文が、所定の
構文上の単位である構文単位に分割され、第1言語文の
構文単位に類似する用例が検出される。そして、その検
出された用例と対応付けられている訳文に基づいて、第
1言語文が、構文単位で翻訳され、その構文単位の翻訳
結果が合成されて、第2言語文が生成される。従って、
効率的な翻訳処理が可能となり、その結果、翻訳処理速
度を向上させることが可能となる。
25に記載の翻訳方法によれば、第1言語文が、所定の
構文上の単位である構文単位に分割され、第1言語文の
構文単位に類似する用例が検出される。そして、その検
出された用例と対応付けられている訳文に基づいて、第
1言語文が、構文単位で翻訳され、その構文単位の翻訳
結果が合成されて、第2言語文が生成される。従って、
効率的な翻訳処理が可能となり、その結果、翻訳処理速
度を向上させることが可能となる。
【0318】請求項26に記載の翻訳方法によれば、第
1言語文を、所定の構文上の単位である構文単位あっ
て、大きな構文単位から小さな構文単位に、段階的に分
割しながら、各段階において得られた構文単位と、用例
とが照合され、その照合結果に基づいて、構文単位に対
応する用例が検出される。そして、その検出された用例
と対応付けられている訳文に基づいて、第1言語文が、
構文単位で翻訳され、その構文単位の翻訳結果が合成さ
れて、第2言語文が生成される。従って、効率的な翻訳
処理が可能となり、その結果、翻訳処理速度を向上させ
ることが可能となる。
1言語文を、所定の構文上の単位である構文単位あっ
て、大きな構文単位から小さな構文単位に、段階的に分
割しながら、各段階において得られた構文単位と、用例
とが照合され、その照合結果に基づいて、構文単位に対
応する用例が検出される。そして、その検出された用例
と対応付けられている訳文に基づいて、第1言語文が、
構文単位で翻訳され、その構文単位の翻訳結果が合成さ
れて、第2言語文が生成される。従って、効率的な翻訳
処理が可能となり、その結果、翻訳処理速度を向上させ
ることが可能となる。
【0319】請求項27に記載の翻訳装置および請求項
28に記載の翻訳方法によれば、単語をその概念に基づ
いて木構造に階層化したシソーラスにおいて、第1言語
文を構成する単語と、用例を構成する単語との共通の概
念に包含される単語の数に基づいて、第1言語文を構成
する単語と、用例を構成する単語との類似性を表す単語
類似度が算出される。従って、シソーラスの構造によら
ず、的確な単語類似度の算出が可能となり、その結果、
翻訳精度を向上させることが可能となる。
28に記載の翻訳方法によれば、単語をその概念に基づ
いて木構造に階層化したシソーラスにおいて、第1言語
文を構成する単語と、用例を構成する単語との共通の概
念に包含される単語の数に基づいて、第1言語文を構成
する単語と、用例を構成する単語との類似性を表す単語
類似度が算出される。従って、シソーラスの構造によら
ず、的確な単語類似度の算出が可能となり、その結果、
翻訳精度を向上させることが可能となる。
【0320】請求項29に記載の翻訳装置および請求項
40に記載の翻訳方法によれば、用例が第1言語文を翻
訳するために用いられる事前確率と、用例が第1言語文
に変形されて用いられる変形確率とに基づいて、第1言
語文に類似する用例が検出され、その検出された用例と
対応付けられている訳文に基づいて、第1言語文が翻訳
される。従って、確率的に適切な翻訳処理を行うことが
可能となる。
40に記載の翻訳方法によれば、用例が第1言語文を翻
訳するために用いられる事前確率と、用例が第1言語文
に変形されて用いられる変形確率とに基づいて、第1言
語文に類似する用例が検出され、その検出された用例と
対応付けられている訳文に基づいて、第1言語文が翻訳
される。従って、確率的に適切な翻訳処理を行うことが
可能となる。
【0321】請求項41に記載の翻訳装置および請求項
42に記載の翻訳方法によれば、第1言語文を構文解析
することにより、その文法属性が抽出され、第1言語文
に類似する用例が、その第1言語文および用例が有する
文法属性を考慮して検出される。そして、その検出され
た用例と対応付けられている訳文に基づいて、第1言語
文が翻訳される。従って、意味内容が同一の、表層上異
なる用例を複数記憶させておかずに済むようにすること
が可能となる。
42に記載の翻訳方法によれば、第1言語文を構文解析
することにより、その文法属性が抽出され、第1言語文
に類似する用例が、その第1言語文および用例が有する
文法属性を考慮して検出される。そして、その検出され
た用例と対応付けられている訳文に基づいて、第1言語
文が翻訳される。従って、意味内容が同一の、表層上異
なる用例を複数記憶させておかずに済むようにすること
が可能となる。
【図1】本発明を適用した翻訳装置の一実施の形態の構
成例を示すブロック図である。
成例を示すブロック図である。
【図2】図1のシソーラス記憶部12に記憶されている
シソーラスを示す図である。
シソーラスを示す図である。
【図3】図1の翻訳装置の動作を説明するためのフロー
チャートである。
チャートである。
【図4】図1の翻訳装置の動作を説明するための図であ
る。
る。
【図5】図1の翻訳装置の動作を説明するための図であ
る。
る。
【図6】図1の翻訳装置の動作を説明するための図であ
る。
る。
【図7】事前確率P(Ei)を求める方法を説明するた
めのフローチャートである。
めのフローチャートである。
【図8】図1の変換部7の処理を説明するためのフロー
チャートである。
チャートである。
【図9】図8のステップS32の処理の詳細を説明する
ためのフローチャートである。
ためのフローチャートである。
【図10】図8のステップS32の処理の詳細を説明す
るためのフローチャートである。
るためのフローチャートである。
【図11】本発明を適用した翻訳装置の他の実施の形態
の構成例を示すブロック図である。
の構成例を示すブロック図である。
【図12】図11の変換部7の処理を説明するためのフ
ローチャートである。
ローチャートである。
【図13】従来の翻訳装置の一例の構成を示すブロック
図である。
図である。
【図14】従来の翻訳装置の他の一例の構成を示すブロ
ック図である。
ック図である。
【図15】従来の翻訳装置の、さらに他の一例の構成を
示すブロック図である。
示すブロック図である。
【図16】従来の翻訳装置において用いられるシソーラ
スを示す図である。
スを示す図である。
1 入力部, 2 照合部, 3 決まり文句対訳用例
記憶部, 4 節分割処理部, 5 節分割パターン対
訳用例記憶部, 6 単純構文解析処理部,7 変換
部, 7A キャッシュ, 8 名詞句対訳用例記憶
部, 9 動詞句対訳用例記憶部, 10 その他対訳
用例記憶部, 11 類似度計算部, 12 シソーラ
ス記憶部, 13 対訳辞書, 14 句合成処理部,
15 節合成処理部, 16 出力部
記憶部, 4 節分割処理部, 5 節分割パターン対
訳用例記憶部, 6 単純構文解析処理部,7 変換
部, 7A キャッシュ, 8 名詞句対訳用例記憶
部, 9 動詞句対訳用例記憶部, 10 その他対訳
用例記憶部, 11 類似度計算部, 12 シソーラ
ス記憶部, 13 対訳辞書, 14 句合成処理部,
15 節合成処理部, 16 出力部
Claims (42)
- 【請求項1】 第1の言語で表現された第1言語文を、
第2の言語で表現された第2言語文に翻訳する翻訳装置
であって、 前記第1の言語で表現された用例と、その用例を前記第
2の言語に翻訳した訳文とを対応付けて記憶している用
例記憶手段と、 前記第1言語文を、所定の構文上の単位である構文単位
に分割する分割手段と、 前記分割手段より出力される前記第1言語文の前記構文
単位に類似する前記用例を検出する検出手段と、 前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第1言語文を、前記構
文単位で翻訳する翻訳手段と、 前記翻訳手段による前記構文単位の翻訳結果を合成し、
前記第2言語文を生成する生成手段とを備えることを特
徴とする翻訳装置。 - 【請求項2】 前記用例記憶手段は、前記用例およびそ
の訳文を、前記構文単位で記憶していることを特徴とす
る請求項1に記載の翻訳装置。 - 【請求項3】 前記分割手段は、前記第1言語文を、大
きな構文単位から小さな構文単位に、段階的に分割する
ことを特徴とする請求項1に記載の翻訳装置。 - 【請求項4】 前記分割手段は、 前記第1言語文を、節単位に分割する節分割手段と、 前記節分割手段より出力される前記第1言語文の前記節
単位を、句単位に分割する句分割手段とを有することを
特徴とする請求項3に記載の翻訳装置。 - 【請求項5】 前記用例記憶手段は、 節単位の用例を記憶している節単位用例記憶手段と、 句単位の用例を記憶している句単位用例記憶手段とを有
することを特徴とする請求項4に記載の翻訳装置。 - 【請求項6】 前記句単位用例記憶手段は、前記用例
を、少なくとも名詞句と動詞句とに区分して記憶してい
ることを特徴とする請求項5に記載の翻訳装置。 - 【請求項7】 前記分割手段は、前記第1言語文を、大
きな構文単位に分割し、その大きな構文単位に一致する
前記用例がない場合、その大きな構文単位を、より小さ
な構文単位に分割することを特徴とする請求項3に記載
の翻訳装置。 - 【請求項8】 前記用例記憶手段は、前記用例を、その
文法属性とともに記憶していることを特徴とする請求項
1に記載の翻訳装置。 - 【請求項9】 前記分割手段は、前記第1言語文を構文
解析することにより、前記構文単位に分割するととも
に、その文法属性を抽出し、 前記検出手段は、前記構文単位および用例が有する文法
属性を考慮して、前記構文単位に類似する前記用例を検
出することを特徴とする請求項8に記載の翻訳装置。 - 【請求項10】 前記検出手段は、前記用例が前記構文
単位を翻訳するために用いられる事前確率と、前記用例
が前記構文単位に変形されて用いられる変形確率とに基
づいて、前記構文単位に類似する前記用例を検出するこ
とを特徴とする請求項1に記載の翻訳装置。 - 【請求項11】 前記変形確率は、前記用例が有する文
法属性が変形される文法属性変形確率と、前記用例を構
成する単語が変形される単語変形確率とから計算される
ことを特徴とする請求項10に記載の翻訳装置。 - 【請求項12】 前記文法属性変形確率は、 前記用例が有する文法属性がそのまま用いられる文法属
性複写確率と、 前記用例が有する文法属性が省略される文法属性省略確
率と、 前記構文単位が有する文法属性が付加される文法属性付
加確率と、 前記用例が有する文法属性が、前記構文単位が有する文
法属性と置換される文法属性置換確率とから計算される
ことを特徴とする請求項11に記載の翻訳装置。 - 【請求項13】 前記単語変形確率は、 前記用例を構成する単語がそのまま用いられる単語複写
確率と、 前記用例を構成する単語が省略される単語省略確率と、 前記構文単位を構成する単語が付加される単語付加確率
と、 前記用例を構成する単語が、前記構文単位を構成する単
語と置換される単語置換確率とから計算されることを特
徴とする請求項11に記載の翻訳装置。 - 【請求項14】 単語を、その概念に基づいて木構造に
階層化したシソーラスを記憶しているシソーラス記憶手
段と、 前記構文単位を構成する単語と、前記用例を構成する単
語との類似性を表す単語類似度を、前記シソーラスに基
づいて算出し、前記単語置換確率として出力する単語類
似度算出手段とをさらに備えることを特徴とする請求項
13に記載の翻訳装置。 - 【請求項15】 前記単語類似度算出手段は、前記シソ
ーラスにおいて、前記構文単位を構成する単語と、前記
用例を構成する単語との共通の概念に包含される単語の
数に基づいて、前記単語類似度を算出することを特徴と
する請求項14に記載の翻訳装置。 - 【請求項16】 前記単語変形確率は、前記用例が前記
構文単位に変形されるときの最適な変形経路にしたがっ
て計算されることを特徴とする請求項11に記載の翻訳
装置。 - 【請求項17】 前記最適な変形経路は、ダイナミック
プログラミング法により求められることを特徴とする請
求項16に記載の翻訳装置。 - 【請求項18】 前記単語変形確率は、 前記用例を構成する単語が、そのまま若しくは前記構文
単位を構成する単語と置換され、配置位置を変えて用い
られる単語スクランブル確率と、 前記用例を構成する単語に、修飾語が付加されて複合語
として用いられる単語複写/複合確率と、 前記用例を構成する単語を、前記構文単位を構成する単
語と置換したものに、修飾語が付加されて複合語として
用いられる単語置換/複合確率とのうちの1以上を、さ
らに用いて計算されることを特徴とする請求項13に記
載の翻訳装置。 - 【請求項19】 前記単語変形確率は、前記用例が前記
構文単位に変形されるときの最適な変形経路にしたがっ
て計算されることを特徴とする請求項18に記載の翻訳
装置。 - 【請求項20】 前記最適な変形経路を求めるのに際
し、前記用例を構成する単語を真に省略することに対応
する真省略経路に代えて、前記用例を構成する単語を仮
に省略する仮省略経路を用いるとともに、前記構文単位
を構成する単語を真に付加することに対応する真付加経
路に代えて、前記構文単位を構成する単語を仮に付加す
ることに対応する仮付加経路を用い、 前記仮省略経路または仮付加経路にしたがって仮に省略
または付加される単語である仮省略単語または仮付加単
語それぞれを記憶する単語記憶手段をさらに備えること
を特徴とする請求項19に記載の翻訳装置。 - 【請求項21】 前記用例を構成する単語を、そのまま
若しくは前記構文単位を構成する単語と置換し、配置位
置を変えて用いることに対応するスクランブル経路は、
前記用例を構成する単語が前記仮省略単語として前記単
語記憶手段に記憶されているか、または前記構文単語を
構成する単語が前記仮付加単語として前記単語記憶手段
に記憶されているときのみ選択され、その後、前記仮省
略単語として記憶されていた前記用例を構成する単語、
または前記仮付加単語として記憶されていた前記構文単
語を構成する単語は、前記単語記憶手段から削除され、 前記用例を構成する単語に、修飾語を付加して複合語と
して用いることに対応する複写/複合経路、および前記
用例を構成する単語を、前記構文単位を構成する単語と
置換したものに、修飾語を付加して複合語として用いる
ことに対応する置換/複合経路は、前記修飾語となる単
語が、前記仮付加単語として前記単語記憶手段に記憶さ
れているときのみ選択され、その後、前記仮付加単語と
して記憶されていた修飾語となる単語は、前記単語記憶
手段から削除されることを特徴とする請求項20に記載
の翻訳装置。 - 【請求項22】 前記用例を前記構文単位に変形する変
形経路の終点に到達後に、前記単語記憶手段に記憶され
ている前記仮省略単語または仮付加単語を仮に省略また
は付加する仮省略経路または仮付加経路を、それぞれ真
省略経路または真付加経路にそれぞれ変換したものを、
前記最適な変形経路とすることを特徴とする請求項21
に記載の翻訳装置。 - 【請求項23】 前記事前確率または変形確率は、所定
のコーパスデータに基づいて計算されることを特徴とす
る請求項10に記載の翻訳装置。 - 【請求項24】 前記事前確率または変形確率は、前記
用例記憶手段に記憶されている前記用例に基づいて計算
されることを特徴とする請求項10に記載の翻訳装置。 - 【請求項25】 第1の言語で表現された用例と、その
用例を第2の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第1の言語で表現さ
れた第1言語文を、前記第2の言語で表現された第2言
語文に翻訳する翻訳方法であって、 前記第1言語文を、所定の構文上の単位である構文単位
に分割するステップと、 前記第1言語文の前記構文単位に類似する前記用例を検
出するステップと、 その検出された用例と対応付けられている前記訳文に基
づいて、前記第1言語文を、前記構文単位で翻訳するス
テップと、 その構文単位の翻訳結果を合成し、前記第2言語文を生
成するステップとを備えることを特徴とする翻訳方法。 - 【請求項26】 第1の言語で表現された用例と、その
用例を第2の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第1の言語で表現さ
れた第1言語文を、前記第2の言語で表現された第2言
語文に翻訳する翻訳方法であって、 前記第1言語文を、所定の構文上の単位である構文単位
あって、大きな構文単位から小さな構文単位に、段階的
に分割しながら、各段階において得られた構文単位と、
前記用例とを照合するステップと、 その照合結果に基づいて、前記構文単位に対応する前記
用例を検出するステップと、 その検出された用例と対応付けられている前記訳文に基
づいて、前記第1言語文を、前記構文単位で翻訳するス
テップと、 その構文単位の翻訳結果を合成し、前記第2言語文を生
成するステップとを備えることを特徴とする翻訳方法。 - 【請求項27】 第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
装置であって、 前記第1の言語で表現された用例と、その用例を前記第
2の言語に翻訳した訳文とを対応付けて記憶している用
例記憶手段と、 単語を、その概念に基づいて木構造に階層化したシソー
ラスを記憶しているシソーラス記憶手段と、 前記第1言語文を構成する単語と、前記用例を構成する
単語との類似性を表す単語類似度を、前記シソーラスに
基づいて算出する算出手段と、 前記算出手段により算出された前記単語類似度に基づい
て、前記第1言語文に類似する前記用例を検出する検出
手段と、 前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第1言語文を翻訳する
翻訳手段とを備え、 前記算出手段は、前記シソーラスにおいて、前記第1言
語文を構成する単語と、前記用例を構成する単語との共
通の概念に包含される単語の数に基づいて、前記単語類
似度を算出することを特徴とする翻訳装置。 - 【請求項28】 第1の言語で表現された用例と、その
用例を第2の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第1の言語で表現さ
れた第1言語文を、前記第2の言語で表現された第2言
語文に翻訳する翻訳方法であって、 単語を、その概念に基づいて木構造に階層化したシソー
ラスに基づいて、前記第1言語文を構成する単語と、前
記用例を構成する単語との類似性を表す単語類似度を算
出するステップと、 その単語類似度に基づいて、前記第1言語文に類似する
前記用例を検出するステップと、 その検出された前記用例と対応付けられている前記訳文
に基づいて、前記第1言語文を翻訳するステップとを備
え、 前記単語類似度は、前記シソーラスにおいて、前記第1
言語文を構成する単語と、前記用例を構成する単語との
共通の概念に包含される単語の数に基づいて算出される
ことを特徴とする翻訳方法。 - 【請求項29】 第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
装置であって、 前記第1の言語で表現された用例と、その用例を前記第
2の言語に翻訳した訳文とを対応付けて記憶している用
例記憶手段と、 前記用例が前記第1言語文を翻訳するために用いられる
事前確率と、前記用例が前記第1言語文に変形されて用
いられる変形確率とに基づいて、前記第1言語文に類似
する前記用例を検出する検出手段と、 前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第1言語文を翻訳する
翻訳手段とを備えることを特徴とする翻訳装置。 - 【請求項30】 前記変形確率は、前記用例が有する文
法属性が変形される文法属性変形確率と、前記用例を構
成する単語が変形される単語変形確率とから計算される
ことを特徴とする請求項29に記載の翻訳装置。 - 【請求項31】 前記文法属性変形確率は、 前記用例が有する文法属性がそのまま用いられる文法属
性複写確率と、 前記用例が有する文法属性が省略される文法属性省略確
率と、 前記第1言語文が有する文法属性が付加される文法属性
付加確率と、 前記用例が有する文法属性が、前記第1言語文が有する
文法属性と置換される文法属性置換確率とから計算され
ることを特徴とする請求項30に記載の翻訳装置。 - 【請求項32】 前記単語変形確率は、 前記用例を構成する単語がそのまま用いられる単語複写
確率と、 前記用例を構成する単語が省略される単語省略確率と、 前記第1言語文を構成する単語が付加される単語付加確
率と、 前記用例を構成する単語が、前記第1言語文を構成する
単語と置換される単語置換確率とから計算されることを
特徴とする請求項30に記載の翻訳装置。 - 【請求項33】 前記単語変形確率は、前記用例が前記
第1言語文に変形されるときの最適な変形経路にしたが
って計算されることを特徴とする請求項29に記載の翻
訳装置。 - 【請求項34】 前記最適な変形経路は、ダイナミック
プログラミング法により求められることを特徴とする請
求項33に記載の翻訳装置。 - 【請求項35】 前記単語変形確率は、 前記用例を構成する単語が、そのまま若しくは前記構文
単位を構成する単語と置換され、配置位置を変えて用い
られる単語スクランブル確率と、 前記用例を構成する単語に、修飾語が付加されて複合語
として用いられる単語複写/複合確率と、 前記用例を構成する単語を、前記構文単位を構成する単
語と置換したものに、修飾語が付加されて複合語として
用いられる単語置換/複合確率とのうちの1以上を、さ
らに用いて計算されることを特徴とする請求項32に記
載の翻訳装置。 - 【請求項36】 前記単語変形確率は、前記用例が前記
構文単位に変形されるときの最適な変形経路にしたがっ
て計算されることを特徴とする請求項35に記載の翻訳
装置。 - 【請求項37】 前記最適な変形経路を求めるのに際
し、前記用例を構成する単語を真に省略することに対応
する真省略経路に代えて、前記用例を構成する単語を仮
に省略する仮省略経路を用いるとともに、前記構文単位
を構成する単語を真に付加することに対応する真付加経
路に代えて、前記構文単位を構成する単語を仮に付加す
ることに対応する仮付加経路を用い、 前記仮省略経路または仮付加経路にしたがって仮に省略
または付加される単語である仮省略単語または仮付加単
語それぞれを記憶する単語記憶手段をさらに備えること
を特徴とする請求項36に記載の翻訳装置。 - 【請求項38】 前記用例を構成する単語を、そのまま
若しくは前記構文単位を構成する単語と置換し、配置位
置を変えて用いることに対応するスクランブル経路は、
前記用例を構成する単語が前記仮省略単語として前記単
語記憶手段に記憶されているか、または前記構文単語を
構成する単語が前記仮付加単語として前記単語記憶手段
に記憶されているときのみ選択され、その後、前記仮省
略単語として記憶されていた前記用例を構成する単語、
または前記仮付加単語として記憶されていた前記構文単
語を構成する単語は、前記単語記憶手段から削除され、 前記用例を構成する単語に、修飾語を付加して複合語と
して用いることに対応する複写/複合経路、および前記
用例を構成する単語を、前記構文単位を構成する単語と
置換したものに、修飾語を付加して複合語として用いる
ことに対応する置換/複合経路は、前記修飾語となる単
語が、前記仮付加単語として前記単語記憶手段に記憶さ
れているときのみ選択され、その後、前記仮付加単語と
して記憶されていた修飾語となる単語は、前記単語記憶
手段から削除されることを特徴とする請求項37に記載
の翻訳装置。 - 【請求項39】 前記用例を前記構文単位に変形する変
形経路の終点に到達後に、前記単語記憶手段に記憶され
ている前記仮省略単語または仮付加単語を仮に省略また
は付加する仮省略経路または仮付加経路を、それぞれ真
省略経路または真付加経路にそれぞれ変換したものを、
前記最適な変形経路とすることを特徴とする請求項38
に記載の翻訳装置。 - 【請求項40】 第1の言語で表現された用例と、その
用例を第2の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第1の言語で表現さ
れた第1言語文を、前記第2の言語で表現された第2言
語文に翻訳する翻訳方法であって、 前記用例が前記第1言語文を翻訳するために用いられる
事前確率と、前記用例が前記第1言語文に変形されて用
いられる変形確率とに基づいて、前記第1言語文に類似
する前記用例を検出するステップと、 その検出された前記用例と対応付けられている前記訳文
に基づいて、前記第1言語文を翻訳するステップとを備
えることを特徴とする翻訳方法。 - 【請求項41】 第1の言語で表現された第1言語文
を、第2の言語で表現された第2言語文に翻訳する翻訳
装置であって、 前記第1の言語で表現された用例と、その用例を前記第
2の言語に翻訳した訳文とを対応付け、前記用例が有す
る文法属性とともに記憶している用例記憶手段と、 前記第1言語文を構文解析することにより、その文法属
性を抽出する抽出手段と、 前記第1言語文に類似する前記用例を、その第1言語文
および用例が有する文法属性を考慮して検出する検出手
段と、 前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第1言語文を翻訳する
翻訳手段とを備えることを特徴とする翻訳装置。 - 【請求項42】 第1の言語で表現された用例と、その
用例を第2の言語に翻訳した訳文とを対応付け、前記用
例が有する文法属性とともに記憶している用例記憶手段
を用いて、前記第1の言語で表現された第1言語文を、
前記第2の言語で表現された第2言語文に翻訳する翻訳
方法であって、 前記第1言語文を構文解析することにより、その文法属
性を抽出するステップと、 前記第1言語文に類似する前記用例を、その第1言語文
および用例が有する文法属性を考慮して検出するステッ
プと、 その検出された前記用例と対応付けられている前記訳文
に基づいて、前記第1言語文を翻訳するステップとを備
えることを特徴とする翻訳方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9046140A JPH1021243A (ja) | 1996-05-02 | 1997-02-28 | 翻訳装置および翻訳方法 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11144296 | 1996-05-02 | ||
| JP8-111442 | 1996-05-02 | ||
| JP9046140A JPH1021243A (ja) | 1996-05-02 | 1997-02-28 | 翻訳装置および翻訳方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1021243A true JPH1021243A (ja) | 1998-01-23 |
Family
ID=26386260
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9046140A Withdrawn JPH1021243A (ja) | 1996-05-02 | 1997-02-28 | 翻訳装置および翻訳方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1021243A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007072594A (ja) * | 2005-09-05 | 2007-03-22 | Sharp Corp | 翻訳装置、翻訳方法および翻訳プログラム、媒体 |
| JP2013186673A (ja) * | 2012-03-07 | 2013-09-19 | Nippon Hoso Kyokai <Nhk> | 機械翻訳装置及び機械翻訳プログラム |
-
1997
- 1997-02-28 JP JP9046140A patent/JPH1021243A/ja not_active Withdrawn
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007072594A (ja) * | 2005-09-05 | 2007-03-22 | Sharp Corp | 翻訳装置、翻訳方法および翻訳プログラム、媒体 |
| JP2013186673A (ja) * | 2012-03-07 | 2013-09-19 | Nippon Hoso Kyokai <Nhk> | 機械翻訳装置及び機械翻訳プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6161083A (en) | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation | |
| JP2745370B2 (ja) | 機械翻訳方法及び機械翻訳装置 | |
| US6278968B1 (en) | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
| JP3768205B2 (ja) | 形態素解析装置、形態素解析方法及び形態素解析プログラム | |
| US10552533B2 (en) | Phrase-based dialogue modeling with particular application to creating recognition grammars for voice-controlled user interfaces | |
| US6442524B1 (en) | Analyzing inflectional morphology in a spoken language translation system | |
| US6266642B1 (en) | Method and portable apparatus for performing spoken language translation | |
| US6223150B1 (en) | Method and apparatus for parsing in a spoken language translation system | |
| US6243669B1 (en) | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation | |
| US6233544B1 (en) | Method and apparatus for language translation | |
| US6282507B1 (en) | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection | |
| JP2000353161A (ja) | 自然言語生成における文体制御方法及び装置 | |
| JP2001100781A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
| WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
| JP3992348B2 (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
| Pichl et al. | Alquist 3.0: Alexa prize bot using conversational knowledge graph | |
| KR101929509B1 (ko) | 형태소 합성 장치 및 방법 | |
| Liu | Computational morphology with neural network approaches | |
| Galley et al. | Hybrid natural language generation for spoken dialogue systems | |
| Oflazer et al. | Turkish and its challenges for language and speech processing | |
| Lane et al. | Interactive word completion for morphologically complex languages | |
| JP3441400B2 (ja) | 言語変換規則作成装置、及びプログラム記録媒体 | |
| JPH1021243A (ja) | 翻訳装置および翻訳方法 | |
| Babhulgaonkar et al. | Experimenting with factored language model and generalized back-off for Hindi | |
| JP3059504B2 (ja) | 品詞選択システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20040511 |