JPH0765007A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH0765007A
JPH0765007A JP5237239A JP23723993A JPH0765007A JP H0765007 A JPH0765007 A JP H0765007A JP 5237239 A JP5237239 A JP 5237239A JP 23723993 A JP23723993 A JP 23723993A JP H0765007 A JPH0765007 A JP H0765007A
Authority
JP
Japan
Prior art keywords
translation
sentence
translated
unit
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5237239A
Other languages
English (en)
Inventor
Hirosuke Nakasa
博裕 仲佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central Research Institute of Electric Power Industry
Original Assignee
Central Research Institute of Electric Power Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central Research Institute of Electric Power Industry filed Critical Central Research Institute of Electric Power Industry
Priority to JP5237239A priority Critical patent/JPH0765007A/ja
Publication of JPH0765007A publication Critical patent/JPH0765007A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 自己の所有する翻訳対象分野の理解力や語学
力などの総合的な翻訳力を反映させて良質な翻訳結果が
得られる機械翻訳システムを提供すること。 【構成】 機械翻訳システムは、辞書部101、適語選
択部102、訳文構築部103、訳文推敲部104、画
面表示手段105、データ修正手段106からなる。辞
書部101は入力文を単語や熟語に分解して訳語情報を
得る。適語選択部102は複数個の訳語情報から最適な
訳語を決定する。訳文構築部103は選択された訳語を
結合して翻訳文を構築する。訳文推敲部104は翻訳文
を推敲し、より適切な翻訳文する。画面表示手段105
は、各部101,102,103,104の翻訳過程を
画面上に表示する。データ修正手段106は画面上をモ
ニタし訳文が不都合なときに、辞書部101の辞書デー
タ111や各部102,103,104の規則データ1
12,113,114の修正、追加、削除を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳の利用者自ら
が翻訳過程における諸規則を改良して行くことによっ
て、機械翻訳性能を向上させて行くことができる機械翻
訳システムに関するものである。
【0002】
【従来の技術】この種の機械翻訳システムは、翻訳対象
の入力文を単語や熟語に分解し、複数個の訳語情報があ
る場合に最適な訳語を決定し、選択された訳語を結合し
て翻訳文を構築し、かつ生成された翻訳文を推敲し、よ
り適切な翻訳文に仕上げるようにしたものであり、数年
前までは、処理性能の関係から大型計算機でしか実現す
ることができなかった。
【0003】一方、最近では、パーソナルコンピュータ
等の小型計算機の処理性能が著しく向上したため、これ
らの小型計算機による機械翻訳システムが構築されるよ
うになってきている。
【0004】このような機械翻訳システムは、例えば市
販の機械翻訳アプリケーションを小型計算機に格納して
実行することにより得られるものや、あるいは小型計算
機と機械翻訳プログラムとが一体化されて製品として販
売されているものが提供されている。いずれの機械翻訳
システムにしても、例えばキーボード等の入力装置から
外国文を小型計算機等に入力し、機械翻訳プログラムを
実行することにより、日本文を得るようにしたものであ
る。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の機械翻訳システムでは、翻訳過程の内容が利用
者に公開されておらず、単にユーザー辞書の単語登録や
修正しか利用者には開放されていず、利用者が要求する
レベルまでの翻訳性能が得られず、低品質の機械翻訳結
果をそのまま受け入れざるを得ないという欠点があっ
た。
【0006】そこで、本発明の目的は、上記欠点を解消
し、機械翻訳の利用者が自己の所有する翻訳対象分野の
理解力や語学力などの総合的な翻訳力を反映させ得て良
質な翻訳結果が得られるように翻訳過程の内容の修正が
できるような機械翻訳システムを提供することにある。
【0007】
【課題を解決するための手段】かかる目的を達成するた
め、本発明の機械翻訳システムは、翻訳対象の入力文を
単語や熟語に分解して訳語情報を得る辞書部と、複数個
の訳語情報がある場合に最適な訳語を決定する適語選択
部と、選択された訳語を結合して翻訳文を構築する訳文
構築部と、生成された翻訳文を推敲し、より適切な翻訳
文に仕上げる訳文推敲部と、前記辞書部、前記適語選択
部、前記訳文構築部及び前記訳文推敲部のそれぞれの翻
訳過程における実行状況が表示装置の画面上に表示でき
る画面表示手段と、前記画面上に表示された訳文に不都
合があるときには、前記辞書部、前記適語選択部、前記
訳文構築部及び前記訳文推敲部の規則データ内容の修
正、追加、削除をするデータ修正手段とを備えるように
している。
【0008】
【作用】本発明の機械翻訳システムは、翻訳処理の過程
が表示装置の画面上で目視できるようにしてあるため、
表示装置の画面上に表示された翻訳に、仮に翻訳異常が
生じたときには、前記辞書部、前記適語選択部、前記訳
文構築部及び前記訳文推敲部での翻訳過程の実行状況の
どの時点で間違いが起きているのかを探索できる。ま
た、本発明の機械翻訳システムは、翻訳過程の実行状況
の翻訳誤りが発生している箇所の規則等のデータを改良
して誤翻訳の修正ができ、さらに学習機能によって翻訳
性能が恒久的に向上する。
【0009】
【実施例】以下、本発明の構成を図面に示す実施例に基
づいて詳細に説明する。
【0010】図1に本発明の機械翻訳システムの一実施
例を示す。この機械翻訳システム100は、例えばキー
ボードやOCR等の入力手段から入力された翻訳対象の
入力文を単語や熟語に分解して訳語情報を得る辞書部1
01と、複数個の訳語情報がある場合に最適な訳語を決
定する適語選択部102と、選択された訳語を結合して
翻訳文を構築する訳文構築部103と、生成された翻訳
文を推敲し、より適切な翻訳文に仕上げる訳文推敲部1
04と、前記辞書部101、前記適語選択部102、前
記訳文構築部103及び前記訳文推敲部104のそれぞ
れの翻訳過程における実行状況が表示装置15の画面上
に表示できる画面表示手段105と、表示装置15の画
面上に表示された訳文に不都合があるときには、前記辞
書部101の辞書データ111、前記適語選択部102
の適語選択規則データ112、前記訳文構築部103の
構文規則データ113及び前記訳文推敲部104の訳文
推敲規則データ114の各内容を修正、追加、削除でき
るデータ修正手段106とからなる。この機械翻訳シス
テムは、例えば図8に示すような構成のパーソナルコン
ピュータ等の小型計算機10における処理装置11とそ
れを実行させるプログラムによって構成されている。
【0011】小型計算機10は、図8に示すように、例
えば処理装置11と、キーボード12と、マウス13
と、光学式文字読取装置(OCR)14と、表示装置1
5と、プリンタ16とを備えている。処理装置11に
は、キーボード12、マウス13、OCR14、表示装
置15及びプリンタ16が電気的に接続されている。処
理装置11は、図示しないが、各種の演算や処理を実行
する中央演算処理装置(CPU)と、機械翻訳プログラ
ム、各種のプログラム及び作業用のデータを常駐させる
主メモリと、作業RAM、所定の処理プログラムを記憶
している読出専用メモリ(ROM)と、各種外部機器と
の接続を行う入出力装置(I/O)等からなる。また、
処理装置11は、多量のデータや機械翻訳プログラム及
び各種の処理プログラムを記憶させたハードデスク装置
17を内蔵しており、ハードデスク装置17から機械翻
訳プログラムを読み出し又は退避させ、あるいは必要な
処理プログラムやデータを読み出し又は書き込むことが
できる。処理装置11は、機械翻訳プログラムを主メモ
リ上に記憶させ、そのプログラムを実行させることによ
り、図1に示す機械翻訳システムが実現することにな
る。
【0012】この機械翻訳システム100は、入力され
た英原文に対し、(1)辞書部101による単語・熟語
の検索→(2)適語選択部102における多義語に対す
る適語選択規則による訳語決定→(3)訳文構築部10
3における訳語結合のための構文規則による訳文構築→
(4)訳文推敲部104における訳文推敲規則による訳
文の表現修正と洗練化→(5)表示装置15への訳文の
出力という流れで翻訳処理を行う。
【0013】(1)辞書部101における単語・熟語の
検索 キーボード12あるいは予めOCR14等によって入力
された英文のテキストファイルデータに対し、辞書部1
01において英文内のスペースを判断基準にして、一語
一語の単語に分解処理を行う。そして、単数・複数、現
在形・過去形、動名詞などの語尾変化の認識をして原形
に変換する。分解された単語は、次の単語との連語処理
などを含めて、「英和辞書」を検索する。以上の検索は
例えば公知の翻訳ソフトの辞書機能によって行われる。
【0014】ここで、辞書部101には単語と熟語の訳
語が品詞と属性の2種のコードを付帯させて格納されて
いる。尚、熟語は記号を代用語句として、例えば4種類
の記号を代用語句として使われている。また、この辞書
部101には新たな訳語や熟語がキーボード12などを
使って入力可能であり、そのときには上述の品詞コード
200と属性コード210及び必要あれば代用記号22
0が付帯されて所定のフォーマットで格納される。
【0015】品詞コード200の一覧を図2(a)に示
す。この品詞コード200は、例えば0〜9の数字とア
ルファベットのXによって表される。即ち、
〔0〕は句
読点、〔1〕は名詞、〔2〕は代名詞、〔3〕は動詞、
〔4〕は助動詞、〔5〕は形容詞、〔6〕は副詞、
〔7〕は前置詞、〔8〕は冠詞、
〔9〕は接続詞、
〔X〕は間投詞・文を、それぞれ割り当てるものとす
る。
【0016】属性コード210の一覧を図2(b)に示
す。この属性コード210は、例えばアルファベットの
大小文字1字で表されている。また、辞書データは、”
英語;品詞(+)訳語;属性”のフォーマットで表示さ
れている。図2(B)において、属性コード210は例
えば次のようになっている。すなわち、〔a〕は文頭、
〔b〕は“a”,“an”,“the ”、〔c〕は商用、
〔f〕は未来、〔g〕は場所、〔h〕は人間・動物、
〔i〕は不完全他動詞、〔j〕は自動詞、〔k〕は知覚
動詞、〔m〕は生理用語、〔n〕は数、〔o〕は代名詞
目的格、〔p〕は過去、〔q〕は疑問、〔r〕は関係代
名詞・関係副詞、〔s〕は心理用語、〔t〕は時、
〔v〕はbe動詞、〔w〕は気象、〔A〕は専門用語、
〔C〕は比較級、〔E〕は“there be”、〔F〕は“an
d ”“or”“but ”、〔FF〕は順接続の接続詞、
〔G〕は現在分詞、〔H〕は“have ”, “let ”、
〔I〕は“it”、〔K〕は仮定、〔M〕は当為、〔N〕
は否定、〔P〕は過去分詞、〔T〕は“to”不定詞、
〔U〕は最上級、〔&〕は関係代名詞・関係副詞の先行
詞、〔¥〕は#で代用された語句の品詞(0〜9,X)
指示を、それぞれ割り当てるものとする。属性コード2
10は上述のものに特に限定されず、翻訳文の分野など
に応じて適宜変更される。
【0017】代用記号220の一覧を図2(c)に示
す。この代用記号220は、〔#〕に中間部代用の英語
句、〔>〕に右隣の英語句・訳語句、〔<〕に左隣の訳
語句、〔$〕に右隣の訳語句を、それぞれ割り当てるも
のとする。
【0018】これら品詞コード200、属性コード21
0及び代用記号220を用いて辞書データ111が“英
語;品詞(+)訳語;属性”のフォーマットで格納され
ている。
【0019】(2)適語選択部102における多義語に
対する適語選択規則による訳語決定 多義語に対する適語選択規則データ112には、語句の
前後関係や前述の属性・品詞コード指定などの情報から
の選択条件を示す規則データが格納されており、多義語
の中の2語づつ、その条件を満たす規則データを探索
し、適語選択を行って訳語と品詞を決定する。その際、
当該語(M)の文頭か文末かの位置 (FT,LT)、左右2
語(LL,L; R,RR )の品詞や属性などの必要条件(=)
・禁止条件(<>)に関する記号を使用する。この適語
選択規則データ112は、”2つの選択対象語句;棄却
(無印)か採用(*印)語句;選択条件;”のフォーマ
ットで格納されている。尚、この適語選択部102には
必要に応じて新たな適語選択規則データ112がキーボ
ード12などを使って所定のフォーマットで入力され格
納される。
【0020】適語選択規則で用いられる記号の一覧を図
3に示す。適語選択部102の適語選択規則で使用され
る記号300は、〔*〕に採用(無印の場合は「削
除」)、〔=〕に必要条件、〔<>〕に禁止条件、〔F
T〕に文頭、〔LT〕に文末、〔LL〕に一つ置いた左隣の
英語句、〔L〕に左隣の英語句、〔M〕に当該英語句、
〔R〕に右隣の英語句、〔RR〕に一つ置いた右隣の英語
句をそれぞれ割り当てるものとする。
【0021】これらの記号を使用して適語選択規則デー
タ112には、英単語の品詞、属性、代用記号等の前後
条件を基に適語が選択できるような規則が文法や経験則
などに基づいて用意され格納されている。この多数の適
語選択規則データ112を頭から検索して該当する選択
規則を確定する。例えば、”are ”を例に挙げて説明す
ると、当該語(M)たる”are ”にはbe動詞(品詞コー
ド:3、属性:v)と面積単位の名詞(品詞コード:
1、属性:n)との2義語である。そこで、当該語
(M)がbe動詞であり、左語(L)には数値属性(n)
を持つ語を含まないときには属性nを持つ名詞の方が棄
却され、be動詞の方が選択されるという適語選択規則が
用意されており、左語に数値属性を持つ語を含むか否か
によって訳語とその品詞コードが決定される。そして、
訳文はそれを構成する単語あるいは熟語の出現順序で表
わされる品詞コードの数列として確定される。
【0022】尚、代用語句や挿入語句がある場合は、語
尾の2個の数字例えば”…001 ”によって代用語句が、
句読点”0”の後に、コード数字”0”(属性”#”)
を前に付けて置かれ、訳語結合後に”#”の位置に代用
語句の訳語が挿入されることになる。即ち、”…+0(句
読点の".")+0(属性"#")+1("代用語句"の訳語)”の
形である。
【0023】(3)訳文構築部103における訳語結合
のための構文規則による訳文構築 訳語を結合して訳文を構築するプロセスでは、上記の出
現順序を表す品詞コード数列の中から、構文規則データ
113中に含まれる品詞コード数列を探索し、適用可能
な規則を使って訳語句を結合し、数列の長さを減らして
行く。構文規則データ113による訳文構築は、翻訳処
理プロセスの中核を成すものであり、図4に示す種々の
記号を用いて、適用条件の設定や語尾変化等を行い、過
去、受身、否定、命令などの語尾も作成する。訳語句の
結合順序は、基本的には、「名詞句生成(冠詞・形容詞
・接続詞処理)→前置詞句生成→副詞句生成→動詞処理
→助動詞処理→文節形成→訳文作成」というような流れ
で行う。また、各構文規則データ113は、「ダミー数
字;被結合語順;結合句の品詞;正逆順;適用条件;訳
語作用;」のフォーマットで格納される。ここで、ダミ
ー数字は、多くの構文規則データ113の検索を容易に
するため複数の群に分けて格納する場合に規則データ群
の配置順序を示す0,1,2,…,9,Xの1桁の数字
値であり、被結合語順は、結合すべき訳語の品詞コード
数列である。これらに引き続いて、結合された訳語句の
品詞コードと、その結合の方向を指示する0(左から右
に結合する順方向)か1(その逆方向)の数値、さらに
当該規則が成立するための条件と語尾変化などの操作条
件とが表示される。
【0024】図4に訳文構築部103の構文規則で使用
される記号の一覧を示す。訳文構築部103の構文規則
で使用される記号400には次のようなものがある。例
えば、〔J〕は訳語、〔T〕は属性、〔=〕は必要条
件、〔<>〕は禁止条件、〔#〕は訳語に対する操作、
〔N〕は訳語の消去、〔+〕は右端に付加、〔−〕は右
端から削除、〔<−>〕は訳語交換、〔>>>〕は他動
詞と副詞の結合時の助詞の先頭移動、〔−()〕は付加
情報の除去、〔−をにとが〕は他動詞の先頭助詞の除
去、〔を+〕は先頭に「を」を付加、〔KAKO〕は過去終
止形の語尾の生成、〔ONBIN 〕は接続連用句の生成、
〔UKEMI 〕は受動態の訳語の生成、〔CONJ〕は接続語尾
の生成、〔HITEI 〕は否定形の訳語の生成、〔MUST〕は
当為の訳語の生成、〔SIEKI 〕は使役の訳語の生成、
〔ROOT〕は動詞の現在終止形に復帰、〔MEIR〕は命令形
の訳語の生成、をそれぞれ割り当てるものとする。
【0025】構文規則データ113は、上記記号を使用
して、「冠詞と名詞を順方向に結合して名詞とする」と
か、「動詞と名詞を逆方向に結合し動詞にする」、「名
詞+代名詞+動詞で、第2語の属性(T1)にrがあり、
後続の第4語(J3)が句読点であれば、第2語の訳語
(J1)を消去(#N)し、第3語の訳語(J2)の他動詞の
先頭助詞除去(#−をにとが)して、逆方向に結合して
名詞とする」、「動詞+名詞で、第1語の属性(T0)に
E,j,及びNがなく、後続の第2語の訳語(J2)が動
詞・助動詞・前置詞でなく、その属性(T2)にrとFが
なければ、逆方向に結合して動詞とする」、「名詞+動
詞で、後続の第3語(J2)が句読点ならば、第1語の訳
語(J0)の語尾に“は、”を付けて(#+は、)、順方
向に結合し文節(X)とする」などの訳文が構築できる
規則データが用意されている。
【0026】これら構文規則データ113を用いて訳文
構築部103において訳文が決定される。尚、この訳文
構築部103には必要に応じて新たな構文規則データ1
13がキーボード12などを使って所定のフォーマット
で入力され格納される。
【0027】(4)訳文推敲部における訳文推敲規則に
よる訳文の表現修正と洗練化 訳文推敲部104には、より洗練された訳文を作成する
ための訳文推敲規則データ114が格納されている。こ
の訳文推敲規則データ114は、「推敲前の訳文,推敲
後の訳文」のフォーマットで格納されている。そして、
生成された訳文の中にコンマの左側の文字列が含まれて
いれば、その部分が右側の文字列に置き代わる。また、
いずれの文字列にも任意の位置に代用語句“#”が使え
るようになっている。尚、この訳文推敲部104には必
要に応じて新たな訳文推敲規則データ114がキーボー
ド12などを使って所定のフォーマットで入力され格納
される。
【0028】(5)訳文の出力 以上の翻訳処理を終了すると、翻訳結果の和文が英原文
とともに画面上に表示される。このとき、処理過程も表
示され、いずれの箇所で誤訳が生じたのかを判別でき
る。
【0029】次に、翻訳性能の向上を図る本実施例の動
作を図1〜図4、図8を基に、図5〜図7に沿って別の
具体例を挙げて説明する。
【0030】まず、次のような英文をOCR14から処
理装置11に入力したとする(図5及び図6、ステップ
500)。これら英文は、処理装置11内に格納される
ことになる(図7(a)参照)。 “If you move it, put it back."
【0031】この英文は、処理装置11において機械翻
訳プログラムが実行されて機械翻訳システムが動作する
ことにより、機械翻訳をされることになる(ステップ5
01)。
【0032】すると、機械翻訳システムは、処理装置1
1において図6に示すフローチャートを実行し、まず、
これら英文の単語・熟語の分解処理を実行する(ステッ
プ5011、5012)。具体的には、入力された英文
の単語分解処理を行い、次語との連語処理も含めて辞書
データ111を検索する。このとき、辞書データ111
は、「英語;品詞・訳語;属性;」のフォーマットで表
示されている。したがって、上記英文は、辞書データ1
11を検索した結果、下記のようになる(図7(b)参
照)。 「“If;9かどうか;r;、9ならば、;K;”」 「“you;2あなた;oh;”」 「“ move;3動く;j;、3を動かす;、1動き;”」 「“it;2それ;Io;”」 「“,;0、;”」 「“put # back;3#を元に戻す;jpP\1;”」 「“.;0;”」 「“#1;0;#1;”」 「“it;2それ;Io;”」 これらの処理結果は、処理装置11の主メモリの所定の
エリア等に記憶しておくものとする。
【0033】上記処理が終了すると、機械翻訳システム
の適語選択部102が作動して、多義語に対する適語選
択を実行する(ステップ5013)。具体的には、適語
選択部102は、適語選択規則データ112を参照して
適語を選択することになる。ここで、適語選択規則デー
タ112には、語句の前後関係や属性・品詞コードなど
の情報からの選択条件を示す規則データがあり、多義語
の中の2語づつ、その条件を満たす規則データを探索
し、適語選択を行って訳語と品詞を決定する。そして、
適語選択規則データ112は、「二つの選択対象語句;
棄却語句;選択条件;」のフォーマットで表示されるこ
とになる。したがって、上記英文単語・熟語の分解、辞
書データ111の検索で得た単語の内、多義語となって
いた以下の単語等が、それぞれ次のように処理される
(図7(c)参照)。なお、この適語選択部102によ
る適語選択処理の際に使用されている記号は、図3に示
したとおりである。 「“If” ; “99;*K;FT;”」 「“move ”; “13;1;M=j;L=12NT;R<>3;”」 「“move ”; “33;j;R<>0;R<>5;R<>6;R<>7;R<>8;”」
【0034】そして、“ If ”の品詞は
〔9〕(ならば
;K; )に、“move”の品詞は〔3〕(を動かす)に、
それぞれ決定されることになる。
【0035】以上のようにして、各語の訳語とその品詞
コードが決定されると、それらの出現順序を表す品詞コ
ードの数列ができ、英文が数列として次のように表示さ
れることになる。 「
〔9〕〔2〕〔3〕〔2〕
〔0〕〔3〕
〔0〕
〔0〕
〔2〕」 なお、次の訳文構築部103では、各品詞に〔〕を付す
ことをやめ、単に数字で表すことにする。
【0036】このようにして得られた英文の数列に対し
て、機械翻訳システムにおける訳文構築部103は、構
文規則データ113を参照しながら、訳文を構築する処
理を実行する(ステップ5014)。この訳文構築処理
で使用される記号の意味は、図4に示したとおりであ
る。
【0037】そして、訳語を結合して訳文を構築する過
程では、上記の出現順序を表す品詞コード数列の中か
ら、構文規則データ113中に含まれる数列を探索し、
適用可能な規則を使って訳語句を結合し、数列の長さを
減らしてゆく。訳語句の結合操作は、「名詞句生成(冠
詞・形容詞・接続詞処理)→前置詞句生成→副詞句生成
→動詞処理→助動詞処理→文節形成→訳文作成」という
ような流れで行い、過去、受身、否定、命令などの語尾
も作成する。なお、各構文規則データは、「ダミー数
字;被結合語順;結合句の品詞;正逆順;適用条件;訳
語作用;」のフォーマットで表示される。したがって、
訳文構築部103は、図7(d)に示すように、品詞コ
ード数列に構文規則データ113の規則を当てはめて、
“923203002”→“92303002”→“6
03002”→“X002”というように順次数列を減
少させる処理をしてゆくことにより、「それを動かす」
→「あなたがそれを動かすならば」→「あなたがそれを
動かすならば、、#1を元に戻して下さい」と順次日本
文が構築されてゆくことになる。
【0038】上記処理が終了すると、訳文推敲部104
が動作し、訳文の表現修正と洗練化の処理を実行する
(ステップ5015)。
【0039】訳文推敲部104は、訳文推敲規則データ
114を用いて、より洗練した訳文を作成する。この訳
文推敲規則データ114は、「推敲前の訳文、推敲後の
訳文」のフォーマットで表示され、生成された訳文の中
にはコンマの左側の文字列が含まれていれば、その部分
が右側の文字列に置き代わる。上記の場合には、 「、、,#、」 「あなたがそれを#ならば、それを,#ならば、」 の二つの訳文推敲規則データが適用されることになる。
そして、訳文推敲部104は、次のような文章を推敲し
て出力する。 「動かすならば、元に戻して下さい。」
【0040】以上のような機械翻訳過程が終了すると、
翻訳結果の和文が英文原文と共に、表示装置15の画面
上に表示される(ステップ5016)。なお、上記辞書
部101での処理過程、適語選択部102での処理過
程、訳文構築部103での処理過程、及び訳文推敲部1
04での処理過程全てを、処理装置11内の例えば主メ
モリの所定のエリアに記憶させておく。
【0041】表示装置15の画面上の和文が英文原文を
モニタして満足ゆくときには(図5のステップ502;
Y)、これらを保存し、また必要に応じて入出力文の印
刷をして処理を終了する(ステップ503)。
【0042】一方、翻訳結果を表示装置15の画面上で
モニタして満足ゆくものでないときには(図5のステッ
プ502;N)、キーボード12等から画面表示手段1
05に指示し、各辞書部101での処理過程を表示装置
15の画面上に表示させる(ステップ502)。この表
示装置15の画面をモニタして、辞書データ111の変
更が必要であると判断したときには(ステップ504;
Y)、データ修正手段106により辞書データ111の
修正を実行する(ステップ505)。この辞書データ1
11の修正が完了した時点で、再び機械翻訳処理を実行
させる(ステップ501)。再度機械翻訳処理をし(ス
テップ501)、その翻訳結果が満足ゆくものであれば
(ステップ502;Y)、処理を終了する(ステップ5
03)。
【0043】しかし、機械翻訳処理をして(ステップ5
01)、その翻訳結果が満足ゆくものでなく(ステップ
502;N)、しかも辞書データ111に変更の必要が
ないときには(ステップ504;N)、画面表示手段1
05により適語選択部102の処理過程を表示装置15
の画面上に表示させる(ステップ506)。この表示装
置15の画面をモニタして、適語選択規則データ112
の変更が必要であると判断したときには(ステップ50
6;Y)、データ修正手段106を介して適語選択規則
データ112の修正を実行する(ステップ507)。こ
の適語選択規則データ112の修正が完了した時点で、
再び機械翻訳処理を実行させる(ステップ501)。再
度機械翻訳処理をし(ステップ501)、その翻訳結果
が満足ゆくものであれば(ステップ502;Y)、処理
を終了する(ステップ503)。
【0044】しかし、機械翻訳処理をして(ステップ5
01)、その翻訳結果が満足ゆくものではなく(ステッ
プ502;N)、しかも辞書データ111に変更の必要
がなく(ステップ504;N)、かつ適語選択規則デー
タ112にも変更が必要でないときには(ステップ50
6;N)、画面表示手段105により訳文構築部103
の処理過程を表示装置15の画面上に表示させる(ステ
ップ508)。この表示装置15の画面をモニタして、
構文規則データ113の変更が必要であると判断したと
きには(ステップ508;Y)、データ修正手段106
を動作させて構文規則データ113の修正を実行する
(ステップ509)。この構文規則データ113の修正
が完了した時点で、再び機械翻訳処理を実行させる(ス
テップ501)。再度機械翻訳処理をし(ステップ50
1)、その翻訳結果が満足ゆくものであれば(ステップ
502;Y)、処理を終了する(ステップ503)。
【0045】しかし、機械翻訳処理をして(ステップ5
01)、その翻訳結果が満足ゆくものではなく(ステッ
プ502;N)、しかも辞書データ111に変更の必要
がなく(ステップ504;N)、また適語選択規則デー
タ112に変更の必要がなく(ステップ506;N)、
構文規則データ113にも変更の必要がないときには
(ステップ508;N)、画面表示手段105により訳
文推敲部104の処理過程を表示装置15の画面上に表
示させる(ステップ510)。この表示装置15の画面
をモニタしながら、データ修正手段106を動作させて
訳文推敲規則データ114の修正を実行する(ステップ
510)。訳文推敲規則データ114の修正が完了した
時点で、再び機械翻訳処理を実行させる(ステップ50
1)。再度機械翻訳処理をし(ステップ501)、その
翻訳結果が満足ゆくものであれば(ステップ502;
Y)、処理を終了する(ステップ503)。なお、その
翻訳結果が満足ゆくものでなければ(ステップ502;
N)、再び上記データ修正手段106による処理を実行
することになる。
【0046】したがって、本機械翻訳システムによれ
ば、画面表示手段105及びデータ修正手段106によ
り、辞書データ111、適語選択規則データ112、構
文規則データ113、訳文推敲規則データ114の内容
を、訳文をモニタしながら修正、追加、削除等の処理が
できるため、利用者が多くの文例に関する翻訳経験を集
積することによって、機械翻訳性能を強化し、向上させ
てゆくことができることになる。
【0047】次に、翻訳が満足ゆくものでなく、これを
修正して行く具体例として上記英文例に対して実施した
修正例について説明する。
【0048】この場合、辞書データ111には“put 〜
back”が登録されていず、また、適語選択規則データ1
12、構文規則データ113及び訳文推敲規則データ1
14の一部にそれぞれ条件不備があるものとする。
【0049】まず、OCR14等により処理装置11内
に下記の英文を入力する(ステップ500)。 「If you move it, put it back.」
【0050】この英文に対して、機械翻訳システムは、
処理装置11の機械翻訳プログラムを実行して、辞書部
101、適語選択部102、訳文構築部103、及び訳
文推敲部104が動作して機械翻訳処理が実行される
(ステップ501)。
【0051】その結果が、表示装置15の画面上に下記
のとおり表示されたとする。 「*かどうか(ならば)*あなた*動き*それ*、*後
にそれを置く*」 前記訳文をモニタした利用者は、翻訳文が満足ゆくもの
でないので(ステップ502;N)、まず辞書部101
の処理過程を表示装置15の画面上に表示させる(ステ
ップ504)。
【0052】表示装置15の画面上で辞書部101の処
理過程をモニタした結果、利用者は、“put 〜back”が
登録されていないことが判り、辞書データ111の不整
備であるので(ステップ504;Y)、データ修正手段
106を介してキーボード12等を所定の操作をするこ
とにより、辞書データ111の変更を実行して、“put
〜back”について「〜を元に戻す」、その他の必要な事
項を辞書登録する(ステップ505)。これにより、図
7(a)に示すような“put 〜back”に関するデータが
辞書データ111に登録されることになる。
【0053】次に、再度機械翻訳を実行して翻訳過程の
画面表示をモニタする(ステップ501)。その結果、
辞書部101による辞書データ111の検索過程は正常
であるが、他の翻訳部分が悪いと判定されることになる
と(ステップ502;N、ステップ504;N)、引き
続く適語選択部102の処理過程を画面表示手段105
により表示装置15の画面上に表示させる(ステップ5
06)。
【0054】この処理過程(ステップ506)では、
“if”が接続詞としての「ならば」と、「かどうか」の
二義語の適語選択規則のタイプミス、また“move”が自
動詞の「動く」と、他動詞の「を動かす」と、名詞の
「動き」の三義語の中の名詞・動詞選択規則の条件不備
のために、適語選択に失敗していることが、処理過程を
モニタすることにより判る(ステップ506;Y)。し
たがって、データ修正手段106を介して、キーボード
12等を所定の操作をすることにより、これらの適語選
択規則データ112を修正する(ステップ507)。こ
れにより、図7(c)に示すような適語選択規則データ
とすることができる。
【0055】再び、機械翻訳を実行して翻訳過程の画面
表示をモニタする(ステップ501)。その結果、辞書
部101による辞書データ111の検索過程は正常であ
ると判定でき(ステップ504;N)、適語選択部10
2による適語選択規則データ112の検索過程も正常で
あると判定できたとき(ステップ506;N)、訳文構
築部103の処理過程を画面表示手段105により表示
装置15の画面上に表示させる(ステップ508)。
【0056】この処理過程をモニタした利用者は、訳文
構築部103における処理過程で、辞書登録した“put
it back ”が現在形と、過去・過去分詞形の同形のため
に、命令形にならないことが判るので(ステップ50
8;Y)、関連の構文規則データ113において原型復
帰変換後に命令形変換をするように修正を行う(ステッ
プ509)。
【0057】再び、機械翻訳を実行して翻訳過程の画面
表示をモニタする(ステップ501)。すると、次ぎの
ような訳文出力が表示装置15の画面上に得られるよう
になる。 「あなたがそれを動かすならば、それを元に戻して下さ
い。」 利用者は、上記訳文出力をモニタした結果、いまだ、日
本語らしい表現になっていないことが判るので(ステッ
プ502;N)、訳文推敲部104の訳文推敲規則デー
タ114の変更を行う(ステップ504;N→ステップ
506;N→ステップ508;N→ステップ510)。
すなわち、この訳文のより日本語らしい表現修正を行う
ために、訳文推敲規則データ114に、「あなたが」
と、「それを」とを削除するためのデータを追加する
(ステップ510)。
【0058】そして、再び、機械翻訳を実行して翻訳過
程の画面表示をモニタする(ステップ501)。する
と、表示装置15の画面上には、次のような訳文出力が
得られるようになる。 「動かすならば、元に戻して下さい。」
【0059】以上の英文による翻訳処理例は、当初の翻
訳失敗の機械翻訳出力に対して、辞書データ111、適
語選択規則データ112、構文規則データ113、及び
訳文推敲規則データ114の全てについて、本機械翻訳
システムによる修正を実施した代表的な例であるが、同
様な方式によって、翻訳処理過程の画面上での目視か
ら、翻訳異常が生じる時点とその原因が探索でき、その
箇所の規則データの改良によって誤翻訳の修正ができる
ことになる。
【0060】さらに、このような修正を一度実行すれ
ば、類似の翻訳には学習効果によって正常な翻訳ができ
ることになり、翻訳性能が恒久的に向上することにな
る。
【0061】上記実施例では、辞書部101の処理過
程、適語選択部102の処理過程、訳文構築部103の
処理過程、訳文推敲部104の処理過程を指定して表示
装置15に表示させていたが、各処理過程をサイクリッ
クに表示装置15上に表示し、キーボード12の例えば
ESCキーを押下することにより、必要な処理過程を表
示させるようにしてもよい。
【0062】なお、上記実施例は、英文を和文に翻訳し
た例で説明したが、これに限定されるものではなく、辞
書データ、適語選択規則データ、構文規則データ、訳文
推敲規則データの各処理過程を画面表示手段により表示
して、データ修正手段により前記各データの必要部分を
修正するという思想については、他の外国語文を和文に
翻訳する場合、さらにはその逆の和文を外国語文に翻訳
する場合にも適用することができる。
【0063】
【発明の効果】以上説明したように本発明によれば、機
械翻訳システムにおいて、翻訳過程を表示できるととも
に規則データを修正できるようにしたので、利用者が多
くの文例に関する翻訳経験を集積することによって、機
械翻訳性能を強化し、向上させてゆくことが可能とな
る。
【図面の簡単な説明】
【図1】本発明の機械翻訳システムの実施例を示すブロ
ック図である。
【図2】同実施例の辞書部で使用される記号の説明図で
ある。
【図3】同実施例の適語選択部で使用される記号の説明
図である。
【図4】同実施例の訳文構築部で使用される記号の説明
図である。
【図5】同実施例の動作を示すフローチャートである。
【図6】同実施例の翻訳過程を示すフローチャートであ
る。
【図7】同実施例の処理状況の説明図である。
【図8】同実施例を実現する小型計算機の構成例を示す
ブロック図である。
【符号の説明】
10 小型計算機 11 処理装置 12 キーボード 13 マウス 14 OCR 15 表示装置 16 プリンタ 17 ハードデスク装置 100 機械翻訳システム 101 辞書部 102 適語選択部 103 訳文構築部 104 訳文推敲部 105 画面表示手段 106 データ修正手段 111 辞書データ 112 適語選択規則データ 113 構文規則データ 114 訳文推敲規則データ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 翻訳対象の入力文を単語や熟語に分解し
    て訳語情報を得る辞書部と、複数個の訳語情報がある場
    合に最適な訳語を決定する適語選択部と、選択された訳
    語を結合して翻訳文を構築する訳文構築部と、生成され
    た翻訳文を推敲し、より適切な翻訳文に仕上げる訳文推
    敲部と、前記辞書部、前記適語選択部、前記訳文構築部
    及び前記訳文推敲部のそれぞれの翻訳過程における実行
    状況が表示装置の画面上に表示できる画面表示手段と、
    前記画面上に表示された訳文に不都合があるときには、
    前記辞書部、前記適語選択部、前記訳文構築部及び前記
    訳文推敲部の規則データ内容の修正、追加、削除をする
    データ修正手段とを備えたことを特徴とする機械翻訳シ
    ステム。
JP5237239A 1993-08-31 1993-08-31 機械翻訳システム Pending JPH0765007A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5237239A JPH0765007A (ja) 1993-08-31 1993-08-31 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5237239A JPH0765007A (ja) 1993-08-31 1993-08-31 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH0765007A true JPH0765007A (ja) 1995-03-10

Family

ID=17012455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5237239A Pending JPH0765007A (ja) 1993-08-31 1993-08-31 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH0765007A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191430A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191430A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Similar Documents

Publication Publication Date Title
US5200893A (en) Computer aided text generation method and system
Jensen et al. Natural language processing: the PLNLP approach
US5895446A (en) Pattern-based translation method and system
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
JPS62163173A (ja) 機械翻訳方法
EP0247395B2 (en) Machine translation system
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
JPS62203273A (ja) 機械翻訳システム
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
Gakis et al. Design and construction of the Greek grammar checker
JPH10312382A (ja) 類似用例翻訳システム
JPH0765007A (ja) 機械翻訳システム
L’haire FipsOrtho: A spell checker for learners of French
Dione Finite-state tokenization for a deep wolof lfg grammar
JP3300131B2 (ja) 自然言語解析装置
Kempen et al. Author environments: Fifth generation text processors
JP2938897B2 (ja) 文書作成処理装置
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JP2859661B2 (ja) 機械翻訳装置
Narayan et al. Pre-Neural Approaches
JP2819766B2 (ja) 外国語電子辞書検索方式
Fraj et al. Parsing Arabic Texts Using Real Patterns of Syntactic Trees