JPH0351022B2 - - Google Patents

Info

Publication number
JPH0351022B2
JPH0351022B2 JP57075287A JP7528782A JPH0351022B2 JP H0351022 B2 JPH0351022 B2 JP H0351022B2 JP 57075287 A JP57075287 A JP 57075287A JP 7528782 A JP7528782 A JP 7528782A JP H0351022 B2 JPH0351022 B2 JP H0351022B2
Authority
JP
Japan
Prior art keywords
word
language
sentence
translation
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57075287A
Other languages
English (en)
Other versions
JPS58192173A (ja
Inventor
Hiroyuki Kaji
Yoshihiko Nitsuta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57075287A priority Critical patent/JPS58192173A/ja
Publication of JPS58192173A publication Critical patent/JPS58192173A/ja
Publication of JPH0351022B2 publication Critical patent/JPH0351022B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 本発明は、第1言語による文章を第2言語によ
る文章に翻訳するシステムに係り、特に、構文や
意味の解析だけでは訳語を1つに絞ることができ
ない語句に対する訳語を選択する方式に関する。
一般に、機械翻訳システムでは、入力文の構文
を解析し、語や句のような文構成要素および文の
構造を認識したあと、文構造の変換および語句に
対する訳語の付与を経て出力文が生成される。こ
の際、複数の意味を持つ語、いわゆる多義語に対
しては、その語自身および構文に関する情報から
だけでは訳語を決定することが困難なことが多
い。そのため、構文解析に加えて文の表わす意味
内容を解析するシステムも考えられるが、現在の
技術では100パーセント正しい意味を認識するこ
とは不可能である。また、意味が正しく認識され
たとしても、第2言語でその意味を表わす語句は
複数ある場合が多い。このような場合、最終的に
は訳語選択を利用者に委ねざるを得ないが、複数
の訳語を並べて表示し、利用者に選択させる方式
では、毎回選択操作が必要になるため利用者の負
担が大きい。また、統計的に使用頻度の高い訳語
を優先的に用いることも1の方法であるが、翻訳
中の文章における頻度統計と一般的な統計とは必
ずしも一致しないという問題点がある。
本発明は、構文や意味の解析からだけでは単一
の訳語を決定することが不可能な場合に訳語を決
定する方式を提供するもので、利用者による修正
が必要な割合を小さくすることを目的とする。
本発明では、相互につながりのある一連の文を
続けて翻訳する場合を対象としている。一連の文
から成るテキストにおいては、通常、同一の語句
が何度も出現するが、そのテキストの文脈におい
ては特定の1つの意味で用いられることが多い。
また、翻訳結果のテキストとしての一貫性を保つ
という点から、同じ意味で用いられている同一の
語句に対する訳語は1つに統一することが必要で
ある。このようなことから、構文や意味の解析か
らだけでは1つの訳語に絞れない語句に対して、
該語句が以前の文中にも出現しているときには、
前回に用いられた訳語を充てるのが望ましい。こ
れにより、利用者が訳語を変更する回数を減少す
ることができる。
以下、本発明の一実施例を説明する。第1図は
本発明方式による翻訳システムの構成を示したも
ので、処理装置1、テキストメモリ2、辞書メモ
リ3、CRTデイスプレイ等の表示装置4、キー
ボード等の入力装置5から構成される。処理装置
1は、システム全体の制御と翻訳処理の実行を行
なう。テキストメモリ2は、翻訳すべき第1言語
によるテキストを格納する入力テキストエリアと
翻訳結果である第2言語によるテキストを格納す
る出力テキストエリアから成る。辞書メモリは、
第1言語における単語を見出しとするレコードの
集合であり、レコードには見出し語および見出し
語を含む複合語について、訳語、文法情報、さら
に後述する最新使用訳語を示す情報が記憶され
る。表示装置4は、翻訳結果を表示するもので、
通常、入力テキストと出力テキストが対照表示さ
れる。入力装置5は、翻訳結果を修正するための
コマンド入力に用いられる。もちろん、入力テキ
ストをテキストメモリ2に格納する際の入力装置
としても用いられる。
第2図は、辞書メモリ3内のレコードの構成を
示す図である。この例では、第1言語は日本語、
第2言語は英語である。レコードへのアクセスは
見出し語をキーとして行なわれる。レコードには
見出し語11のほか、見出し語の文法情報(品
詞、活用形、格構造パターン等)12、訳語情報
13が含まれる。訳語情報フイールド13は、訳
語の数だけの繰り返しフイールドであり、1つの
フイールドは、該訳語が該見出し語に対する訳語
として最もあとに用いられたものであることを示
す最新使用訳語フラグ13−1,訳語13−2,
該訳語の文法情報(品詞,変化形等)13−3か
ら成る。最新使用訳語フラグ13−1は、最もあ
とに用いられた訳語に対応するもののみオン(1)で
あり、それ以外の訳語に対応するものはオフ
(0)である。第2図の例では、「扱う」に対する
訳語として「treat」,「deal with」,「handle」の
3つが辞書に発録されており、このうち、「deal
with」が最もあとに使用された訳語であること
を示している。
第3図は、処理装置1の翻訳処理を示すフロー
図である。翻訳処理は1文づつ順に行なわれる。
まず第1ステツプ(101)で、翻訳すべき文をテ
キストフアイル2から読み出す。次に第2ステツ
プ(102)で、文が語句に区切られ、文中の語を
見出し語とするレコードが辞書メモリ3から読み
出される。第3ステツプ(103)では、第1言語
の文法規則や第2ステツプで読み出した文中の語
に付随する文法情報を参照して、文の構造が解析
される。第4ステツプ(104)では、第1言語か
ら第2言語への構造変換規則を参照して、第2言
語の文として可能な構造に変換する。第5ステツ
プ(105では、第1言語の語句に対して適切な訳
語を与える。第5ステツプの詳細は第4図に示す
とおりである。第5ステツプにはいる時点では、
文法的に許される訳語り絞られているが、さらに
他の語との意味的接続性により、可能性のない訳
語は棄てられる(1051)。この結果、1つの訳語
に絞られれば、該訳語が選択される(1052)。2
つ以上の訳語が候補として残つている場合、候補
のうちで最新使用訳語フラグがオンである訳語が
あるかどうか調べ、もしあれば該訳語が選択され
る(1053)。例えば、第2図に示す辞書があると
し、「扱う」に対する訳語の候補として「deal
with」と「handle」が残つている場合には、
「deal with」が選択される。なお、上記のよう
な訳語がない場合には、候補のうち辞書の中で先
に登録されている訳語が選択される(1054)。以
上の各ステツプの結果、第2言語による文の構造
と訳語が決定される。なお、第4,第5ステツプ
はこの順に直列的に実行されるのではなく、相互
に情報をやりとりしながら実行される。第6ステ
ツプ(106)では、形態素合成等により第2言語
の文を生成し、表示装置4に表示する。ここで、
利用者が表示された翻訳結果をチエツクする。ス
テツプ7,(107)は利用者の入力による処理であ
り、入力装置5から入力されるコマンドに応じて
翻訳を修正する。修正が終了すれば(修正がない
場合はステツプ6から直ちに)、ステツプ8,
(108)で、修正済の翻訳文をテキストフアイル2
に出力する。最後にステツプ9,(109)で、最新
使用訳語情報を更新する。すなわち、入力文中の
語句に対する最新使用訳語フラグのうち、翻訳文
(修正があつた場合は修正後の文)に使用された
訳語に対応するもののみオンに、他はオフにす
る。例えば、第2図の辞書を参照して「扱う」の
訳語として「deal with」が用いられた翻訳文に
対して、利用者が「handle」に修正したとする
と、「hendle」に対する最新使用訳語フラグがオ
ンに、「deal with」に対する最新使用訳語フラ
グがオフにそれぞれ変更される。以上、第1〜9
ステツプで1つの文の翻訳が終了し、次の文の翻
訳へ進む。
本実施例の変形として、最新使用翻訳を考える
際、派生語をグループとして扱うと、訳出の一貫
性という点でいつそう望ましい結果を得ることが
できる。すなわち、第1言語のある語句Aに対す
る訳語として第2言語の語αが使用されたとす
る。ここで、第1言語の語句Bがαの派生語βを
訳語として持つておれば、Bに対する最新使用訳
語情報を、あたかもβが使用されたかのごとく更
新する。例えば、「treatment」という訳語が用
いられたとすれば、第2図の「扱う」に対する最
新使用用語フラグは「treat」に対応するものが
オンに、他はオフにそれぞれ変更される。
また、実施例では、1つの見出し語に対する訳
語のうち1つの訳語しか最新使用訳語フラグがオ
ンにならないようにしたが、1つの見出し語に対
する訳語を文法的,意味的に異なるグループにわ
けることができる場合、グループごとに最新使用
訳語を考れることもできる。
本発明によれば、文単独の構文・意味解析では
1つの訳語に絞れない場合にも、1つの訳語を選
択することができ、選択された訳語は現在翻訳中
のテキストにおいて適切である確率の高いもので
ある。従つて、利用者が翻訳結果を修正する頻度
を減少することができ、利用者の負担を著しく軽
減することができる。
【図面の簡単な説明】
第1図は本発明の翻訳システムの構成図、第2
図は本発明方式における辞書メモリのレコードの
構成を示す図、第3図は翻訳処理の流れ図、第4
図は本発明方式の一実施例を示す訳語選択処理の
流れ図である。 1…処理装置、2…テキストメモリ、3…辞書
メモリ、4…表示装置、5…入力装置、11…見
出し語、12…見出し語文法情報、13…訳語情
報、13−1…最新使用訳語フラグ、13−2…
訳語、13−3…訳語文法情報。

Claims (1)

  1. 【特許請求の範囲】 1 第1言語による文を対応する第2言語の文に
    翻訳する機械翻訳装置であつて、前記第1言語の
    文中の語句に対応する前記第2言語の文中の訳語
    を修正する手段を有する機械翻訳装置において、
    前記第2言語の文中で最もあとに用いられた訳語
    を対応する前記第1言語の文中の語句の最新使用
    訳語として他の訳語と区別する情報を記憶する記
    憶手段と、入力された第1言語の文の構文解析お
    よび意味解析の少なくともいずれか一方により、
    前記入力された第1言語の文を構成する語句に対
    応する第2言語による訳語の候補を生成する手段
    と、前記生成した訳語の候補が複数個あるとき
    に、上記記憶手段に記憶された前記情報を用い
    て、前記複数の候補の中から前記最新使用訳語を
    選択する手段とを設けたことを特徴とする機械翻
    訳装置。 2 特許請求の範囲第1項記載の機械翻訳装置に
    おいて、前記修正手段により修正された前記第2
    言語の文中の訳語を対応する前記第1言語の文中
    の語句の最新使用訳語とするように上記記憶手段
    に記憶された情報を更新する手段を設けたことを
    特徴とする機械翻訳装置。 3 特許請求の範囲第1項記載の機械翻訳装置に
    おいて、前記第2言語における派生語同志をグル
    ープとみなし、前記第2言語のある訳語が使用さ
    れたとき、該訳語の派生語を訳語として持つ前記
    第1言語の語句についても、該派生語が使用され
    たかのごとく前記記憶手段に記憶された前記最新
    使用訳語に関する情報を更新する手段を設けたこ
    とを特徴とする機械翻訳装置。
JP57075287A 1982-05-07 1982-05-07 機械翻訳装置 Granted JPS58192173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57075287A JPS58192173A (ja) 1982-05-07 1982-05-07 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57075287A JPS58192173A (ja) 1982-05-07 1982-05-07 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPS58192173A JPS58192173A (ja) 1983-11-09
JPH0351022B2 true JPH0351022B2 (ja) 1991-08-05

Family

ID=13571859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57075287A Granted JPS58192173A (ja) 1982-05-07 1982-05-07 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPS58192173A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61105670A (ja) * 1984-10-29 1986-05-23 Fujitsu Ltd 機械翻訳装置
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
JPS61223980A (ja) * 1985-03-29 1986-10-04 Toshiba Corp 翻訳処理装置
JP2848593B2 (ja) * 1985-05-07 1999-01-20 株式会社東芝 翻訳処理方法
JPS61260367A (ja) * 1985-05-14 1986-11-18 Sharp Corp 機械翻訳システム
JPS61260366A (ja) * 1985-05-14 1986-11-18 Sharp Corp 学習機能付機械翻訳システム
CA1270063A (en) * 1985-05-14 1990-06-05 Kouji Miyao Translating apparatus
JPS62139076A (ja) * 1985-12-13 1987-06-22 Agency Of Ind Science & Technol 言語解析方式
JPS62297972A (ja) * 1986-06-17 1987-12-25 Nec Corp 翻訳辞書自動生成方式
JPS635470A (ja) * 1986-06-25 1988-01-11 Nec Corp 翻訳学習方式
JPS6373374A (ja) * 1986-09-16 1988-04-02 Brother Ind Ltd 漢字・外国語の対応付け可能な語句変換装置

Also Published As

Publication number Publication date
JPS58192173A (ja) 1983-11-09

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
EP0836144A2 (en) Method and system for identifying and resolving commonly confused words in a natural language parser
US4964044A (en) Machine translation system including semantic information indicative of plural and singular terms
JPS62163173A (ja) 機械翻訳方法
JPS62203273A (ja) 機械翻訳システム
JPS6244877A (ja) 機械翻訳装置
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
US4833611A (en) Machine translation system
JPH0351022B2 (ja)
US5283737A (en) Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
GB2240645A (en) Translation machine
KR900008402B1 (ko) 기계번역장치
JP3236027B2 (ja) 機械翻訳装置
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JPS62267872A (ja) 言語解析装置
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JPH0410665B2 (ja)
JPH0444981B2 (ja)
JPS6190268A (ja) 翻訳方式
JPH07122876B2 (ja) 機械翻訳装置
JPS6244872A (ja) 機械翻訳装置
JPH07182342A (ja) 機械翻訳装置
JPS62198961A (ja) 概念解析装置
JPS63136264A (ja) 機械翻訳装置