JPH0658672B2

JPH0658672B2 - 機械翻訳システム

Info

Publication number: JPH0658672B2
Application number: JP62296675A
Authority: JP
Inventors: 好昭内田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-11-25
Filing date: 1987-11-25
Publication date: 1994-08-03
Anticipated expiration: 2009-08-03
Also published as: JPH01137368A

Description

【発明の詳細な説明】〔概要〕原文の並列・対比表現を利用して機械翻訳する機械翻訳
システムに関し、原文中に現れる並列・対比表現を抽出して文の解析およ
び訳文の生成に利用して質の高い訳文を迅速に生成する
ことを目的とし、原文を単語に分解し、句を生成する単語分解・句生成部
と、この単語分解・句生成部によって生成された句に対
し、並列した態様で現れる並列・対比表現を検出する並
列・対比表現検出部と、この並列・対比表現検出部によ
って検出された並列・対比表現を構成する単語の対応付
けおよび属性を補う対応付け・属性補正部と、この対応
付け・属性補正部によって単語の対応付けおよび属性が
補われた並列・対比表現を利用して置き換える態様で訳
文を生成する訳文生成部とを備え、この訳文生成部によ
って、生成された訳文を出力するように構成する。

〔産業上の利用分野〕

本発明は、原文の並列・対比表現を利用して機械翻訳す
る機械翻訳システムに関するものである。

〔従来の技術と発明が解決しようとする問題点〕

一般に、機械翻訳システムは、まず、原文を文節・単語
に分解し、文法や知識を用いて原文で述べられているこ
とを解析する。解析結果は、システムそれぞれの中間表
現で表す。次に、原文の解析結果に沿って、目的とする
言語に応じた訳文を生成している。

しかし、従来、原文の解析段階では、各々の時点で、原
文の１部分だけで見て解析をすすめているため、文の全
体としての構造が反映されないことがある。また、ほぼ
同じ構造の部分が繰り返し現われるいわゆる並列・対比
表現があっても、従来のシステムは、これらの繰り返し
部分に対しても、同じ処理を繰り返し行っていたため、
翻訳速度を向上し得ないという問題点があった。また、
文単位などに翻訳を行っていたため、関連する他の文中
で用いられる代名詞などが指示する内容を判断すること
が困難となり、質の良い訳文を作成し難いという問題点
もあった。

本発明は、原文中に現れる並列・対比表現を抽出して文
の解析および訳文の生成に利用して質の高い訳文を迅速
に生成することを目的としている。

〔問題点を解決するための手段〕

第１図を参照して問題点を解決するための手段を説明す
る。

第１図において、単語分解・句生成部１は、入力された
原文を単語に分解し、この単語をまとめて句を生成する
ものである。

並列・対比表現検出部２は、単語分解・句生成部１によ
って生成された句に対して、繰り返して現れる句のあつ
まりであるいわゆる並列・対比表現を検出するものであ
る。

対応付け・属性補正部３は、並列・対比表現検出部２に
よって検出された並列・対比表現中の対応する単語の対
応付けおよびこの単語の意味を補う（あるいは制限す
る）ものである。

訳文生成部４は、対応付け・属性補正部３によって対応
付け・補正された並列・対比表現を利用し、第２回目以
降に現れる文に対して、いわば置き換える態様で訳文を
生成するものである。

〔作用〕

本発明は、第１図に示すように、単語分解・句生成部１
が入力された原文を単語に分解して句を生成し、並列・
対比表現検出部２がこの句のあつまりが繰り返し現れる
並列・対比表現を見つけ出し、対応付け・属性補正部３
がこの並列・対比表現によって対応付けられた単語の属
性（訳語など）を補正するようにしている。この補正後
に、この並列・対比表現によって対応付けされた文を、
対比に注意して置き換える態様で訳文を生成するように
している。

従って、原文中の並列・対比表現に対応する第２回目以
降の訳文については、構文解析などを省略し、置き換え
る態様で質の高い訳文を迅速に生成することが可能とな
ると共に、代名詞などの指示内容を容易に推定すること
が可能となる。

〔実施例〕

次に、第２図フローチャートに示す手順に従って、第３
図ないし第５図を用いて第１図構成および動作を順次詳
細に説明する。

第２図において、図中は、原文を読み込む状態を示
す。これは、例えば第３図（イ）に示す英語の原文を読
み込むことを意味している。

図中は、単語をまとめて句を生成する状態を示す。こ
れは、第３図（イ）原文に対して、形態素解析して単語
に分割し、この分割した単語に対して下記ルール(1)を
適用して例えば第３図（ロ）（ステップ１）および
（ハ）（ステップ２）に示すような句に順次まとめるこ
とを意味している。

以下詳述する。

ルール(1)： (1)副詞・間投詞は省く。

(2)冠詞＋名詞はnoun（名詞）とする。

(3)形容詞は、その直後に名詞があれば限定用法と考
え、後の名詞とつないでnoun（名詞）とする。そうでな
く、前にbe動詞に類するもの（become,come,goなど）が
あれば、叙述用法と考え、前の動詞と合わせてbe＋adj
とする。

(4)動詞は、その活用法により、以下のように分ける。

(4-1)分詞（過去分詞、現在分詞） (4-2)to-不定詞、動名詞 (4-3)原型不定視 (4-4)助動詞＋原型（未来形を含む）、現在形、過去
形、過去完了形、現在完了形 (5)冠詞、所有格は、後の句と合わせてnounとする。但
し、後の語が形容詞である場合は、その形に応じて比較
級、最上級の印を付ける(noun＋est)。

(6)前置詞＋名詞は、その前が名詞であれば、前の名詞
と合わせて名詞句とする。そうでなく、前の語がbe動詞
に類するものであれば、形容詞の叙述用法として扱う。
そうでなければ、副詞として扱う。

第３図（ロ）に示すステップ１：これは上記ルール(1)
を第３図（イ）原文から分離した単語に適用した第１ス
テップのものである。簡単に説明すると、第３図（ロ）
図中原文を矩形で囲んだ句が、上記ルール(1)を適用し
て得られたものである。例えば原文の先頭の句“to se
e”に対しては、ルール(1)の第(4)項を適用し、to-inf
（不定詞）として生成したものである。以下同様に図中
に示すように生成する。尚、図中（）はこれに囲まれ
た単語を無視して適用することを表し、＊は未だルール
が適用されていないことを表す。

第３図（ハ）に示すステップ２：これは第３図（ロ）中
の未適用の単語（図中＊を用いて示す単語）に対して、
更にルール(1)を適用して生成したものである。簡単に
説明すると、第３図（ハ）図中原文を二重に矩形で囲ん
だ句が、更に上記ルール(1)を適用して得られたもので
ある。例えば原文the fanlt of othefs”に対してofで
接続（所有格）されているので、図示のように全体をno
unとする。以下同様に、those of your own"についても
全体をnounとする。このようにして生成した第３図
（ハ）を木構造（リスト構造）を用いて表すと、第３図
（ニ）に示すようになる。

以上の手段によって第３図（ニ）に示すように表現する
ことにより、第３図（イ）原文中から繰り返し現れる句
のあつまりであるいわゆる並列・対比表現を容易に抽出
し易くなる。

図中は、くり返し対比表現の検出を行う状態を示す。
これは、第３図（ニ）から繰り返し現れる句のあつまり
である並列・対比表現、図中(a-1)、(a-2)に示すような
to-inf→noun→be+adj"を検出することを意味してい
る。この検出は、第３図（ニ）木構造中のリストの見出
し部（最上段の行）に注目し、これを一次元リストとみ
なし、２つのポインタｐ、ｑを準備し、これらが木構造
のリストを夫々指すようにする。ポインタｐから始まる
部分リストと、ポインタｑから始まる部分リストとが一
致するか否かを調べる。この時、より長い部分リストか
ら順次検査し、一致するもののうち、最も長いものを、
並列・対比表現として検出する。このようにして検出し
た並列・対比表現が、上記to-inf→noun→be+adj"とな
る。

図中は、原文中の単語の対応付けを行う状態を示す。
これは、図中で検出した並列・対比表現例えば第３図
（ニ）木構造中の並列・対比表現to-inf→noun→be+ad
j"について、第４図に示すように、対応付けることを意
味している。具体的に言えば、並列・対比表現to-inf→
noun→be+adj"の第１番目のto-inf"に対しては、原文中
でto see"とto find"とが対応していることが判明す
る。以下同様に、第２番目のnoun"および第３図番目のb
e+adj"についても第４図に示すように対応付けする。
尚、第４図図中下線を引いたものは、更に幾つかの単語
を代表していることを示す。これら下線を引いたものに
ついては、更に子リストについて照合を繰り返すように
する。また、（）を用いて囲んだ単語は、照合を無視
すべきものである。

図中、は、単語の属性を補う、あるいは単語を限定す
る状態を示す。これは、図中で対応付けした単語につ
いて、表記が同じでも、文法上の機能や意味・訳語の異
なる語があり、単語辞書には同一の表記について複数の
語があるので、これらのうちより質の高い訳文を生成す
るために、並列・対比表現の特性を活かして適切な訳語
を選択するものである。具体的に説明すると、第４図最
下段に示す。並列・対比表現中の単語easy"とhard"とに
対して、 easy"の訳語：易しい、気楽な、こだわらない・・・な
ど hard"の訳語：硬い、難しい、酷しい・・などがある。
この両者の訳語から並列・対比表現be-adj"としては、
用法が最も類似する訳語として易しい”および難しい”
を選択する。このように、並列・対比表現の特質を活か
して単語の属性（意味など）を補ったり、更に限定した
りすることにより、質の高い訳文を生成することが可能
となる。尚、訳語を選択する基準として、上述した類似
のものを選択する外に、対語例集を予め設けて選択させ
てもよい。また、第４図中段の並列・対比表現中のothe
rs"に対しては、人を表す語の所有格”といった情報を
設定する。

次に、図中およびの手順によって、訳文を例えば第
５図に示すように生成する。

図中は、最初の部分を訳出する状態を示す。これは、
第３図（ニ）に示すルール(1)適用結果から抽出した並
列・対比表現中の例えば(a-1)の部分の訳出を行い、第
５図上段に示すような木構造に表すことを意味してい
る。

図中は、対比表現に注意して当てはめる（置き換え
る）態様で訳出する状態を示す。これは、第５図下段中
の楕円で囲んで示すように、第２回目以降に現れる並列
・対比表現に対し、構文解析などを行わず、第４図並列
・対比表現の対の関係を利用して単に置き換える態様で
訳出することを意味している。

図中は、訳文として出力する状態を示す。これは、第
５図に点線を用いて示すように、図中start"の位置から
上段の木構造表現で表されている訳文を“他人の欠点を
見ることは易しい”と訳出し、次に、原文中に存在した
接続詞but"をが”と訳出した後、下段の木構造表現で表
されている訳文をあなた自身のそれを見つけることは
まったく難しい。”と訳出することを意味している。

以上のように、原文中から繰り返し現れる並列・対比表
現を抽出し、第２回目以降の訳出の際に構文解析などを
行わず、単に当てはめる態様で訳出することが可能とな
る。

〔発明の効果〕

以上説明したように、本発明によれば、原文中に繰り返
し現れる並列・対比表現を抽出し、この並列・対比表現
に基づいて、第２回目以降の訳出の際に置き換える態様
で訳出する構成を採用しているため、原文中に現れる２
回目以降の並列・対比表現の訳文については、構文解析
などを省略して置き換える態様で質の高い訳文を迅速に
生成することができる。更に、並列・対比表現中の単語
を相互に比較することにより、ある文中における意味内
容を他の文に反映させること、例えば代名詞などの指示
内容（人、物など）を容易に反映させることができ、質
の高い訳文を生成することができる。

【図面の簡単な説明】

第１図は本発明の１実施例構成図、第２図は本発明の動
作説明フローチャート、第３図は本発明に係わる具体例
説明図、第４図は並列・対比表現の比較説明図、第５図
は訳文の木構造表現例を示す。図中、１は単語分解・句生成部、２は並列・対比表現検
出部、３は対応付け・属性補正部、４は訳文生成部を表
す。

Claims

【特許請求の範囲】

【請求項１】原文の並列・対比表現を利用して機械翻訳
する機械翻訳システムにおいて、原文を単語に分解し、句を生成する単語分解・句生成部
(1)と、この単語分解・句生成部(1)によって生成された句に対
し、並列した態様で現れる並列・対比表現を検出する並
列・対比表現検出部(2)と、この並列・対比表現検出部(2)によって検出された並列
・対比表現を構成する単語の対応付けおよび属性を補う
対応付け・属性補正部(3)と、この対応付け・属性補正部(3)によって単語の対応付け
および属性が補われた並列・対比表現を利用して置き換
える態様で訳文を生成する訳文生成部(4)とを備え、この訳文生成部(4)によって、生成された訳文を出力す
るように構成したことを特徴とする機械翻訳システム。