JPH0351022B2

JPH0351022B2 -

Info

Publication number: JPH0351022B2
Application number: JP57075287A
Authority: JP
Inventors: Hiroyuki Kaji; Yoshihiko Nitsuta
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1982-05-07
Filing date: 1982-05-07
Publication date: 1991-08-05
Also published as: JPS58192173A

Description

【発明の詳細な説明】本発明は、第１言語による文章を第２言語によ
る文章に翻訳するシステムに係り、特に、構文や
意味の解析だけでは訳語を１つに絞ることができ
ない語句に対する訳語を選択する方式に関する。

一般に、機械翻訳システムでは、入力文の構文
を解析し、語や句のような文構成要素および文の
構造を認識したあと、文構造の変換および語句に
対する訳語の付与を経て出力文が生成される。こ
の際、複数の意味を持つ語、いわゆる多義語に対
しては、その語自身および構文に関する情報から
だけでは訳語を決定することが困難なことが多
い。そのため、構文解析に加えて文の表わす意味
内容を解析するシステムも考えられるが、現在の
技術では100パーセント正しい意味を認識するこ
とは不可能である。また、意味が正しく認識され
たとしても、第２言語でその意味を表わす語句は
複数ある場合が多い。このような場合、最終的に
は訳語選択を利用者に委ねざるを得ないが、複数
の訳語を並べて表示し、利用者に選択させる方式
では、毎回選択操作が必要になるため利用者の負
担が大きい。また、統計的に使用頻度の高い訳語
を優先的に用いることも１の方法であるが、翻訳
中の文章における頻度統計と一般的な統計とは必
ずしも一致しないという問題点がある。

本発明は、構文や意味の解析からだけでは単一
の訳語を決定することが不可能な場合に訳語を決
定する方式を提供するもので、利用者による修正
が必要な割合を小さくすることを目的とする。

本発明では、相互につながりのある一連の文を
続けて翻訳する場合を対象としている。一連の文
から成るテキストにおいては、通常、同一の語句
が何度も出現するが、そのテキストの文脈におい
ては特定の１つの意味で用いられることが多い。
また、翻訳結果のテキストとしての一貫性を保つ
という点から、同じ意味で用いられている同一の
語句に対する訳語は１つに統一することが必要で
ある。このようなことから、構文や意味の解析か
らだけでは１つの訳語に絞れない語句に対して、
該語句が以前の文中にも出現しているときには、
前回に用いられた訳語を充てるのが望ましい。こ
れにより、利用者が訳語を変更する回数を減少す
ることができる。

以下、本発明の一実施例を説明する。第１図は
本発明方式による翻訳システムの構成を示したも
ので、処理装置１、テキストメモリ２、辞書メモ
リ３、CRTデイスプレイ等の表示装置４、キー
ボード等の入力装置５から構成される。処理装置
１は、システム全体の制御と翻訳処理の実行を行
なう。テキストメモリ２は、翻訳すべき第１言語
によるテキストを格納する入力テキストエリアと
翻訳結果である第２言語によるテキストを格納す
る出力テキストエリアから成る。辞書メモリは、
第１言語における単語を見出しとするレコードの
集合であり、レコードには見出し語および見出し
語を含む複合語について、訳語、文法情報、さら
に後述する最新使用訳語を示す情報が記憶され
る。表示装置４は、翻訳結果を表示するもので、
通常、入力テキストと出力テキストが対照表示さ
れる。入力装置５は、翻訳結果を修正するための
コマンド入力に用いられる。もちろん、入力テキ
ストをテキストメモリ２に格納する際の入力装置
としても用いられる。

第２図は、辞書メモリ３内のレコードの構成を
示す図である。この例では、第１言語は日本語、
第２言語は英語である。レコードへのアクセスは
見出し語をキーとして行なわれる。レコードには
見出し語１１のほか、見出し語の文法情報（品
詞、活用形、格構造パターン等）１２、訳語情報
１３が含まれる。訳語情報フイールド１３は、訳
語の数だけの繰り返しフイールドであり、１つの
フイールドは、該訳語が該見出し語に対する訳語
として最もあとに用いられたものであることを示
す最新使用訳語フラグ１３−１，訳語１３−２，
該訳語の文法情報（品詞，変化形等）１３−３か
ら成る。最新使用訳語フラグ１３−１は、最もあ
とに用いられた訳語に対応するもののみオン(1)で
あり、それ以外の訳語に対応するものはオフ
（０）である。第２図の例では、「扱う」に対する
訳語として「treat」，「deal with」，「handle」の
３つが辞書に発録されており、このうち、「deal
with」が最もあとに使用された訳語であること
を示している。

第３図は、処理装置１の翻訳処理を示すフロー
図である。翻訳処理は１文づつ順に行なわれる。
まず第１ステツプ（101）で、翻訳すべき文をテ
キストフアイル２から読み出す。次に第２ステツ
プ（102）で、文が語句に区切られ、文中の語を
見出し語とするレコードが辞書メモリ３から読み
出される。第３ステツプ（103）では、第１言語
の文法規則や第２ステツプで読み出した文中の語
に付随する文法情報を参照して、文の構造が解析
される。第４ステツプ（104）では、第１言語か
ら第２言語への構造変換規則を参照して、第２言
語の文として可能な構造に変換する。第５ステツ
プ（105では、第１言語の語句に対して適切な訳
語を与える。第５ステツプの詳細は第４図に示す
とおりである。第５ステツプにはいる時点では、
文法的に許される訳語り絞られているが、さらに
他の語との意味的接続性により、可能性のない訳
語は棄てられる（1051）。この結果、１つの訳語
に絞られれば、該訳語が選択される（1052）。２
つ以上の訳語が候補として残つている場合、候補
のうちで最新使用訳語フラグがオンである訳語が
あるかどうか調べ、もしあれば該訳語が選択され
る（1053）。例えば、第２図に示す辞書があると
し、「扱う」に対する訳語の候補として「deal
with」と「handle」が残つている場合には、
「deal with」が選択される。なお、上記のよう
な訳語がない場合には、候補のうち辞書の中で先
に登録されている訳語が選択される（1054）。以
上の各ステツプの結果、第２言語による文の構造
と訳語が決定される。なお、第４，第５ステツプ
はこの順に直列的に実行されるのではなく、相互
に情報をやりとりしながら実行される。第６ステ
ツプ（106）では、形態素合成等により第２言語
の文を生成し、表示装置４に表示する。ここで、
利用者が表示された翻訳結果をチエツクする。ス
テツプ７，（107）は利用者の入力による処理であ
り、入力装置５から入力されるコマンドに応じて
翻訳を修正する。修正が終了すれば（修正がない
場合はステツプ６から直ちに）、ステツプ８，
（108）で、修正済の翻訳文をテキストフアイル２
に出力する。最後にステツプ９，（109）で、最新
使用訳語情報を更新する。すなわち、入力文中の
語句に対する最新使用訳語フラグのうち、翻訳文
（修正があつた場合は修正後の文）に使用された
訳語に対応するもののみオンに、他はオフにす
る。例えば、第２図の辞書を参照して「扱う」の
訳語として「deal with」が用いられた翻訳文に
対して、利用者が「handle」に修正したとする
と、「hendle」に対する最新使用訳語フラグがオ
ンに、「deal with」に対する最新使用訳語フラ
グがオフにそれぞれ変更される。以上、第１〜９
ステツプで１つの文の翻訳が終了し、次の文の翻
訳へ進む。

本実施例の変形として、最新使用翻訳を考える
際、派生語をグループとして扱うと、訳出の一貫
性という点でいつそう望ましい結果を得ることが
できる。すなわち、第１言語のある語句Ａに対す
る訳語として第２言語の語αが使用されたとす
る。ここで、第１言語の語句Ｂがαの派生語βを
訳語として持つておれば、Ｂに対する最新使用訳
語情報を、あたかもβが使用されたかのごとく更
新する。例えば、「treatment」という訳語が用
いられたとすれば、第２図の「扱う」に対する最
新使用用語フラグは「treat」に対応するものが
オンに、他はオフにそれぞれ変更される。

また、実施例では、１つの見出し語に対する訳
語のうち１つの訳語しか最新使用訳語フラグがオ
ンにならないようにしたが、１つの見出し語に対
する訳語を文法的，意味的に異なるグループにわ
けることができる場合、グループごとに最新使用
訳語を考れることもできる。

本発明によれば、文単独の構文・意味解析では
１つの訳語に絞れない場合にも、１つの訳語を選
択することができ、選択された訳語は現在翻訳中
のテキストにおいて適切である確率の高いもので
ある。従つて、利用者が翻訳結果を修正する頻度
を減少することができ、利用者の負担を著しく軽
減することができる。

【図面の簡単な説明】

第１図は本発明の翻訳システムの構成図、第２
図は本発明方式における辞書メモリのレコードの
構成を示す図、第３図は翻訳処理の流れ図、第４
図は本発明方式の一実施例を示す訳語選択処理の
流れ図である。１…処理装置、２…テキストメモリ、３…辞書
メモリ、４…表示装置、５…入力装置、１１…見
出し語、１２…見出し語文法情報、１３…訳語情
報、１３−１…最新使用訳語フラグ、１３−２…
訳語、１３−３…訳語文法情報。

Claims

【特許請求の範囲】１第１言語による文を対応する第２言語の文に
翻訳する機械翻訳装置であつて、前記第１言語の
文中の語句に対応する前記第２言語の文中の訳語
を修正する手段を有する機械翻訳装置において、
前記第２言語の文中で最もあとに用いられた訳語
を対応する前記第１言語の文中の語句の最新使用
訳語として他の訳語と区別する情報を記憶する記
憶手段と、入力された第１言語の文の構文解析お
よび意味解析の少なくともいずれか一方により、
前記入力された第１言語の文を構成する語句に対
応する第２言語による訳語の候補を生成する手段
と、前記生成した訳語の候補が複数個あるとき
に、上記記憶手段に記憶された前記情報を用い
て、前記複数の候補の中から前記最新使用訳語を
選択する手段とを設けたことを特徴とする機械翻
訳装置。２特許請求の範囲第１項記載の機械翻訳装置に
おいて、前記修正手段により修正された前記第２
言語の文中の訳語を対応する前記第１言語の文中
の語句の最新使用訳語とするように上記記憶手段
に記憶された情報を更新する手段を設けたことを
特徴とする機械翻訳装置。３特許請求の範囲第１項記載の機械翻訳装置に
おいて、前記第２言語における派生語同志をグル
ープとみなし、前記第２言語のある訳語が使用さ
れたとき、該訳語の派生語を訳語として持つ前記
第１言語の語句についても、該派生語が使用され
たかのごとく前記記憶手段に記憶された前記最新
使用訳語に関する情報を更新する手段を設けたこ
とを特徴とする機械翻訳装置。