JPH0765007A

JPH0765007A - 機械翻訳システム

Info

Publication number: JPH0765007A
Application number: JP5237239A
Authority: JP
Inventors: Hirosuke Nakasa; 博裕仲佐
Original assignee: Central Research Institute of Electric Power Industry
Current assignee: Central Research Institute of Electric Power Industry
Priority date: 1993-08-31
Filing date: 1993-08-31
Publication date: 1995-03-10

Abstract

(57)【要約】【目的】自己の所有する翻訳対象分野の理解力や語学
力などの総合的な翻訳力を反映させて良質な翻訳結果が
得られる機械翻訳システムを提供すること。【構成】機械翻訳システムは、辞書部１０１、適語選
択部１０２、訳文構築部１０３、訳文推敲部１０４、画
面表示手段１０５、データ修正手段１０６からなる。辞
書部１０１は入力文を単語や熟語に分解して訳語情報を
得る。適語選択部１０２は複数個の訳語情報から最適な
訳語を決定する。訳文構築部１０３は選択された訳語を
結合して翻訳文を構築する。訳文推敲部１０４は翻訳文
を推敲し、より適切な翻訳文する。画面表示手段１０５
は、各部１０１，１０２，１０３，１０４の翻訳過程を
画面上に表示する。データ修正手段１０６は画面上をモ
ニタし訳文が不都合なときに、辞書部１０１の辞書デー
タ１１１や各部１０２，１０３，１０４の規則データ１
１２，１１３，１１４の修正、追加、削除を行う。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、機械翻訳の利用者自ら
が翻訳過程における諸規則を改良して行くことによっ
て、機械翻訳性能を向上させて行くことができる機械翻
訳システムに関するものである。

【０００２】

【従来の技術】この種の機械翻訳システムは、翻訳対象
の入力文を単語や熟語に分解し、複数個の訳語情報があ
る場合に最適な訳語を決定し、選択された訳語を結合し
て翻訳文を構築し、かつ生成された翻訳文を推敲し、よ
り適切な翻訳文に仕上げるようにしたものであり、数年
前までは、処理性能の関係から大型計算機でしか実現す
ることができなかった。

【０００３】一方、最近では、パーソナルコンピュータ
等の小型計算機の処理性能が著しく向上したため、これ
らの小型計算機による機械翻訳システムが構築されるよ
うになってきている。

【０００４】このような機械翻訳システムは、例えば市
販の機械翻訳アプリケーションを小型計算機に格納して
実行することにより得られるものや、あるいは小型計算
機と機械翻訳プログラムとが一体化されて製品として販
売されているものが提供されている。いずれの機械翻訳
システムにしても、例えばキーボード等の入力装置から
外国文を小型計算機等に入力し、機械翻訳プログラムを
実行することにより、日本文を得るようにしたものであ
る。

【０００５】

【発明が解決しようとする課題】しかしながら、上述し
た従来の機械翻訳システムでは、翻訳過程の内容が利用
者に公開されておらず、単にユーザー辞書の単語登録や
修正しか利用者には開放されていず、利用者が要求する
レベルまでの翻訳性能が得られず、低品質の機械翻訳結
果をそのまま受け入れざるを得ないという欠点があっ
た。

【０００６】そこで、本発明の目的は、上記欠点を解消
し、機械翻訳の利用者が自己の所有する翻訳対象分野の
理解力や語学力などの総合的な翻訳力を反映させ得て良
質な翻訳結果が得られるように翻訳過程の内容の修正が
できるような機械翻訳システムを提供することにある。

【０００７】

【課題を解決するための手段】かかる目的を達成するた
め、本発明の機械翻訳システムは、翻訳対象の入力文を
単語や熟語に分解して訳語情報を得る辞書部と、複数個
の訳語情報がある場合に最適な訳語を決定する適語選択
部と、選択された訳語を結合して翻訳文を構築する訳文
構築部と、生成された翻訳文を推敲し、より適切な翻訳
文に仕上げる訳文推敲部と、前記辞書部、前記適語選択
部、前記訳文構築部及び前記訳文推敲部のそれぞれの翻
訳過程における実行状況が表示装置の画面上に表示でき
る画面表示手段と、前記画面上に表示された訳文に不都
合があるときには、前記辞書部、前記適語選択部、前記
訳文構築部及び前記訳文推敲部の規則データ内容の修
正、追加、削除をするデータ修正手段とを備えるように
している。

【０００８】

【作用】本発明の機械翻訳システムは、翻訳処理の過程
が表示装置の画面上で目視できるようにしてあるため、
表示装置の画面上に表示された翻訳に、仮に翻訳異常が
生じたときには、前記辞書部、前記適語選択部、前記訳
文構築部及び前記訳文推敲部での翻訳過程の実行状況の
どの時点で間違いが起きているのかを探索できる。ま
た、本発明の機械翻訳システムは、翻訳過程の実行状況
の翻訳誤りが発生している箇所の規則等のデータを改良
して誤翻訳の修正ができ、さらに学習機能によって翻訳
性能が恒久的に向上する。

【０００９】

【実施例】以下、本発明の構成を図面に示す実施例に基
づいて詳細に説明する。

【００１０】図１に本発明の機械翻訳システムの一実施
例を示す。この機械翻訳システム１００は、例えばキー
ボードやＯＣＲ等の入力手段から入力された翻訳対象の
入力文を単語や熟語に分解して訳語情報を得る辞書部１
０１と、複数個の訳語情報がある場合に最適な訳語を決
定する適語選択部１０２と、選択された訳語を結合して
翻訳文を構築する訳文構築部１０３と、生成された翻訳
文を推敲し、より適切な翻訳文に仕上げる訳文推敲部１
０４と、前記辞書部１０１、前記適語選択部１０２、前
記訳文構築部１０３及び前記訳文推敲部１０４のそれぞ
れの翻訳過程における実行状況が表示装置１５の画面上
に表示できる画面表示手段１０５と、表示装置１５の画
面上に表示された訳文に不都合があるときには、前記辞
書部１０１の辞書データ１１１、前記適語選択部１０２
の適語選択規則データ１１２、前記訳文構築部１０３の
構文規則データ１１３及び前記訳文推敲部１０４の訳文
推敲規則データ１１４の各内容を修正、追加、削除でき
るデータ修正手段１０６とからなる。この機械翻訳シス
テムは、例えば図８に示すような構成のパーソナルコン
ピュータ等の小型計算機１０における処理装置１１とそ
れを実行させるプログラムによって構成されている。

【００１１】小型計算機１０は、図８に示すように、例
えば処理装置１１と、キーボード１２と、マウス１３
と、光学式文字読取装置（ＯＣＲ）１４と、表示装置１
５と、プリンタ１６とを備えている。処理装置１１に
は、キーボード１２、マウス１３、ＯＣＲ１４、表示装
置１５及びプリンタ１６が電気的に接続されている。処
理装置１１は、図示しないが、各種の演算や処理を実行
する中央演算処理装置（ＣＰＵ）と、機械翻訳プログラ
ム、各種のプログラム及び作業用のデータを常駐させる
主メモリと、作業ＲＡＭ、所定の処理プログラムを記憶
している読出専用メモリ（ＲＯＭ）と、各種外部機器と
の接続を行う入出力装置（Ｉ／Ｏ）等からなる。また、
処理装置１１は、多量のデータや機械翻訳プログラム及
び各種の処理プログラムを記憶させたハードデスク装置
１７を内蔵しており、ハードデスク装置１７から機械翻
訳プログラムを読み出し又は退避させ、あるいは必要な
処理プログラムやデータを読み出し又は書き込むことが
できる。処理装置１１は、機械翻訳プログラムを主メモ
リ上に記憶させ、そのプログラムを実行させることによ
り、図１に示す機械翻訳システムが実現することにな
る。

【００１２】この機械翻訳システム１００は、入力され
た英原文に対し、（１）辞書部１０１による単語・熟語
の検索→（２）適語選択部１０２における多義語に対す
る適語選択規則による訳語決定→（３）訳文構築部１０
３における訳語結合のための構文規則による訳文構築→
（４）訳文推敲部１０４における訳文推敲規則による訳
文の表現修正と洗練化→（５）表示装置１５への訳文の
出力という流れで翻訳処理を行う。

【００１３】（１）辞書部１０１における単語・熟語の
検索キーボード１２あるいは予めＯＣＲ１４等によって入力
された英文のテキストファイルデータに対し、辞書部１
０１において英文内のスペースを判断基準にして、一語
一語の単語に分解処理を行う。そして、単数・複数、現
在形・過去形、動名詞などの語尾変化の認識をして原形
に変換する。分解された単語は、次の単語との連語処理
などを含めて、「英和辞書」を検索する。以上の検索は
例えば公知の翻訳ソフトの辞書機能によって行われる。

【００１４】ここで、辞書部１０１には単語と熟語の訳
語が品詞と属性の２種のコードを付帯させて格納されて
いる。尚、熟語は記号を代用語句として、例えば４種類
の記号を代用語句として使われている。また、この辞書
部１０１には新たな訳語や熟語がキーボード１２などを
使って入力可能であり、そのときには上述の品詞コード
２００と属性コード２１０及び必要あれば代用記号２２
０が付帯されて所定のフォーマットで格納される。

【００１５】品詞コード２００の一覧を図２（ａ）に示
す。この品詞コード２００は、例えば０〜９の数字とア
ルファベットのＸによって表される。即ち、

〔０〕は句
読点、〔１〕は名詞、〔２〕は代名詞、〔３〕は動詞、
〔４〕は助動詞、〔５〕は形容詞、〔６〕は副詞、
〔７〕は前置詞、〔８〕は冠詞、

〔９〕は接続詞、
〔Ｘ〕は間投詞・文を、それぞれ割り当てるものとす
る。

【００１６】属性コード２１０の一覧を図２（ｂ）に示
す。この属性コード２１０は、例えばアルファベットの
大小文字１字で表されている。また、辞書データは、”
英語；品詞（＋）訳語；属性”のフォーマットで表示さ
れている。図２（Ｂ）において、属性コード２１０は例
えば次のようになっている。すなわち、〔ａ〕は文頭、
〔ｂ〕は“ａ”，“an”，“the ”、〔ｃ〕は商用、
〔ｆ〕は未来、〔ｇ〕は場所、〔ｈ〕は人間・動物、
〔ｉ〕は不完全他動詞、〔ｊ〕は自動詞、〔ｋ〕は知覚
動詞、〔ｍ〕は生理用語、〔ｎ〕は数、〔ｏ〕は代名詞
目的格、〔ｐ〕は過去、〔ｑ〕は疑問、〔ｒ〕は関係代
名詞・関係副詞、〔ｓ〕は心理用語、〔ｔ〕は時、
〔ｖ〕はbe動詞、〔ｗ〕は気象、〔Ａ〕は専門用語、
〔Ｃ〕は比較級、〔Ｅ〕は“there be”、〔Ｆ〕は“an
d ”“or”“but ”、〔ＦＦ〕は順接続の接続詞、
〔Ｇ〕は現在分詞、〔Ｈ〕は“have ”， “let ”、
〔Ｉ〕は“it”、〔Ｋ〕は仮定、〔Ｍ〕は当為、〔Ｎ〕
は否定、〔Ｐ〕は過去分詞、〔Ｔ〕は“to”不定詞、
〔Ｕ〕は最上級、〔＆〕は関係代名詞・関係副詞の先行
詞、〔￥〕は＃で代用された語句の品詞（０〜９，Ｘ）
指示を、それぞれ割り当てるものとする。属性コード２
１０は上述のものに特に限定されず、翻訳文の分野など
に応じて適宜変更される。

【００１７】代用記号２２０の一覧を図２（ｃ）に示
す。この代用記号２２０は、〔＃〕に中間部代用の英語
句、〔＞〕に右隣の英語句・訳語句、〔＜〕に左隣の訳
語句、〔＄〕に右隣の訳語句を、それぞれ割り当てるも
のとする。

【００１８】これら品詞コード２００、属性コード２１
０及び代用記号２２０を用いて辞書データ１１１が“英
語；品詞（＋）訳語；属性”のフォーマットで格納され
ている。

【００１９】（２）適語選択部１０２における多義語に
対する適語選択規則による訳語決定多義語に対する適語選択規則データ１１２には、語句の
前後関係や前述の属性・品詞コード指定などの情報から
の選択条件を示す規則データが格納されており、多義語
の中の２語づつ、その条件を満たす規則データを探索
し、適語選択を行って訳語と品詞を決定する。その際、
当該語（Ｍ）の文頭か文末かの位置（FT,LT）、左右２
語（LL,L; R,RR ）の品詞や属性などの必要条件（＝）
・禁止条件（＜＞）に関する記号を使用する。この適語
選択規則データ１１２は、”２つの選択対象語句；棄却
（無印）か採用（＊印）語句；選択条件；”のフォーマ
ットで格納されている。尚、この適語選択部１０２には
必要に応じて新たな適語選択規則データ１１２がキーボ
ード１２などを使って所定のフォーマットで入力され格
納される。

【００２０】適語選択規則で用いられる記号の一覧を図
３に示す。適語選択部１０２の適語選択規則で使用され
る記号３００は、〔＊〕に採用（無印の場合は「削
除」）、〔＝〕に必要条件、〔＜＞〕に禁止条件、〔F
T〕に文頭、〔LT〕に文末、〔LL〕に一つ置いた左隣の
英語句、〔Ｌ〕に左隣の英語句、〔Ｍ〕に当該英語句、
〔Ｒ〕に右隣の英語句、〔RR〕に一つ置いた右隣の英語
句をそれぞれ割り当てるものとする。

【００２１】これらの記号を使用して適語選択規則デー
タ１１２には、英単語の品詞、属性、代用記号等の前後
条件を基に適語が選択できるような規則が文法や経験則
などに基づいて用意され格納されている。この多数の適
語選択規則データ１１２を頭から検索して該当する選択
規則を確定する。例えば、”are ”を例に挙げて説明す
ると、当該語（Ｍ）たる”are ”にはbe動詞（品詞コー
ド：３、属性：ｖ）と面積単位の名詞（品詞コード：
１、属性：ｎ）との２義語である。そこで、当該語
（Ｍ）がbe動詞であり、左語（Ｌ）には数値属性（ｎ）
を持つ語を含まないときには属性ｎを持つ名詞の方が棄
却され、be動詞の方が選択されるという適語選択規則が
用意されており、左語に数値属性を持つ語を含むか否か
によって訳語とその品詞コードが決定される。そして、
訳文はそれを構成する単語あるいは熟語の出現順序で表
わされる品詞コードの数列として確定される。

【００２２】尚、代用語句や挿入語句がある場合は、語
尾の２個の数字例えば”…001 ”によって代用語句が、
句読点”０”の後に、コード数字”０”（属性”＃”）
を前に付けて置かれ、訳語結合後に”＃”の位置に代用
語句の訳語が挿入されることになる。即ち、”…+0（句
読点の"."）+0（属性"#"）+1（"代用語句"の訳語）”の
形である。

【００２３】（３）訳文構築部１０３における訳語結合
のための構文規則による訳文構築訳語を結合して訳文を構築するプロセスでは、上記の出
現順序を表す品詞コード数列の中から、構文規則データ
１１３中に含まれる品詞コード数列を探索し、適用可能
な規則を使って訳語句を結合し、数列の長さを減らして
行く。構文規則データ１１３による訳文構築は、翻訳処
理プロセスの中核を成すものであり、図４に示す種々の
記号を用いて、適用条件の設定や語尾変化等を行い、過
去、受身、否定、命令などの語尾も作成する。訳語句の
結合順序は、基本的には、「名詞句生成（冠詞・形容詞
・接続詞処理）→前置詞句生成→副詞句生成→動詞処理
→助動詞処理→文節形成→訳文作成」というような流れ
で行う。また、各構文規則データ１１３は、「ダミー数
字；被結合語順；結合句の品詞；正逆順；適用条件；訳
語作用；」のフォーマットで格納される。ここで、ダミ
ー数字は、多くの構文規則データ１１３の検索を容易に
するため複数の群に分けて格納する場合に規則データ群
の配置順序を示す０，１，２，…，９，Ｘの１桁の数字
値であり、被結合語順は、結合すべき訳語の品詞コード
数列である。これらに引き続いて、結合された訳語句の
品詞コードと、その結合の方向を指示する０（左から右
に結合する順方向）か１（その逆方向）の数値、さらに
当該規則が成立するための条件と語尾変化などの操作条
件とが表示される。

【００２４】図４に訳文構築部１０３の構文規則で使用
される記号の一覧を示す。訳文構築部１０３の構文規則
で使用される記号４００には次のようなものがある。例
えば、〔Ｊ〕は訳語、〔Ｔ〕は属性、〔＝〕は必要条
件、〔＜＞〕は禁止条件、〔＃〕は訳語に対する操作、
〔Ｎ〕は訳語の消去、〔＋〕は右端に付加、〔−〕は右
端から削除、〔＜−＞〕は訳語交換、〔＞＞＞〕は他動
詞と副詞の結合時の助詞の先頭移動、〔−（）〕は付加
情報の除去、〔−をにとが〕は他動詞の先頭助詞の除
去、〔を＋〕は先頭に「を」を付加、〔KAKO〕は過去終
止形の語尾の生成、〔ONBIN 〕は接続連用句の生成、
〔UKEMI 〕は受動態の訳語の生成、〔CONJ〕は接続語尾
の生成、〔HITEI 〕は否定形の訳語の生成、〔MUST〕は
当為の訳語の生成、〔SIEKI 〕は使役の訳語の生成、
〔ROOT〕は動詞の現在終止形に復帰、〔MEIR〕は命令形
の訳語の生成、をそれぞれ割り当てるものとする。

【００２５】構文規則データ１１３は、上記記号を使用
して、「冠詞と名詞を順方向に結合して名詞とする」と
か、「動詞と名詞を逆方向に結合し動詞にする」、「名
詞＋代名詞＋動詞で、第２語の属性（T1）にｒがあり、
後続の第４語（J3）が句読点であれば、第２語の訳語
（J1）を消去（#N）し、第３語の訳語（J2）の他動詞の
先頭助詞除去（＃−をにとが）して、逆方向に結合して
名詞とする」、「動詞＋名詞で、第１語の属性（T0）に
Ｅ，ｊ，及びＮがなく、後続の第２語の訳語（J2）が動
詞・助動詞・前置詞でなく、その属性（T2）にｒとＦが
なければ、逆方向に結合して動詞とする」、「名詞＋動
詞で、後続の第３語（J2）が句読点ならば、第１語の訳
語（J0）の語尾に“は、”を付けて（＃＋は、）、順方
向に結合し文節（Ｘ）とする」などの訳文が構築できる
規則データが用意されている。

【００２６】これら構文規則データ１１３を用いて訳文
構築部１０３において訳文が決定される。尚、この訳文
構築部１０３には必要に応じて新たな構文規則データ１
１３がキーボード１２などを使って所定のフォーマット
で入力され格納される。

【００２７】（４）訳文推敲部における訳文推敲規則に
よる訳文の表現修正と洗練化訳文推敲部１０４には、より洗練された訳文を作成する
ための訳文推敲規則データ１１４が格納されている。こ
の訳文推敲規則データ１１４は、「推敲前の訳文，推敲
後の訳文」のフォーマットで格納されている。そして、
生成された訳文の中にコンマの左側の文字列が含まれて
いれば、その部分が右側の文字列に置き代わる。また、
いずれの文字列にも任意の位置に代用語句“＃”が使え
るようになっている。尚、この訳文推敲部１０４には必
要に応じて新たな訳文推敲規則データ１１４がキーボー
ド１２などを使って所定のフォーマットで入力され格納
される。

【００２８】（５）訳文の出力以上の翻訳処理を終了すると、翻訳結果の和文が英原文
とともに画面上に表示される。このとき、処理過程も表
示され、いずれの箇所で誤訳が生じたのかを判別でき
る。

【００２９】次に、翻訳性能の向上を図る本実施例の動
作を図１〜図４、図８を基に、図５〜図７に沿って別の
具体例を挙げて説明する。

【００３０】まず、次のような英文をＯＣＲ１４から処
理装置１１に入力したとする（図５及び図６、ステップ
５００）。これら英文は、処理装置１１内に格納される
ことになる（図７（ａ）参照）。 “If you move it, put it back."

【００３１】この英文は、処理装置１１において機械翻
訳プログラムが実行されて機械翻訳システムが動作する
ことにより、機械翻訳をされることになる（ステップ５
０１）。

【００３２】すると、機械翻訳システムは、処理装置１
１において図６に示すフローチャートを実行し、まず、
これら英文の単語・熟語の分解処理を実行する（ステッ
プ５０１１、５０１２）。具体的には、入力された英文
の単語分解処理を行い、次語との連語処理も含めて辞書
データ１１１を検索する。このとき、辞書データ１１１
は、「英語；品詞・訳語；属性；」のフォーマットで表
示されている。したがって、上記英文は、辞書データ１
１１を検索した結果、下記のようになる（図７（ｂ）参
照）。「“If；９かどうか；ｒ；、９ならば、；Ｋ；”」「“you；２あなた；oh；”」「“ move；３動く；ｊ；、３を動かす；、１動き；”」「“it；２それ；Io；”」「“，；０、；”」「“put ＃ back；３＃を元に戻す；jpP\1；”」「“．；０；”」「“＃１；０；＃１；”」「“it；２それ；Io；”」これらの処理結果は、処理装置１１の主メモリの所定の
エリア等に記憶しておくものとする。

【００３３】上記処理が終了すると、機械翻訳システム
の適語選択部１０２が作動して、多義語に対する適語選
択を実行する（ステップ５０１３）。具体的には、適語
選択部１０２は、適語選択規則データ１１２を参照して
適語を選択することになる。ここで、適語選択規則デー
タ１１２には、語句の前後関係や属性・品詞コードなど
の情報からの選択条件を示す規則データがあり、多義語
の中の２語づつ、その条件を満たす規則データを探索
し、適語選択を行って訳語と品詞を決定する。そして、
適語選択規則データ１１２は、「二つの選択対象語句；
棄却語句；選択条件；」のフォーマットで表示されるこ
とになる。したがって、上記英文単語・熟語の分解、辞
書データ１１１の検索で得た単語の内、多義語となって
いた以下の単語等が、それぞれ次のように処理される
（図７（ｃ）参照）。なお、この適語選択部１０２によ
る適語選択処理の際に使用されている記号は、図３に示
したとおりである。「“If” ； “99;＊K;FT;”」「“move ”； “13;1;M=j;L＝12NT;R<>3;”」「“move ”； “33;j;R<>0;R<>5;R<>6;R<>7;R<>8;”」

【００３４】そして、“ If ”の品詞は

〔９〕（ならば
;K; ）に、“move”の品詞は〔３〕（を動かす）に、
それぞれ決定されることになる。

【００３５】以上のようにして、各語の訳語とその品詞
コードが決定されると、それらの出現順序を表す品詞コ
ードの数列ができ、英文が数列として次のように表示さ
れることになる。「

〔９〕〔２〕〔３〕〔２〕

〔０〕〔３〕

〔０〕

〔０〕
〔２〕」なお、次の訳文構築部１０３では、各品詞に〔〕を付す
ことをやめ、単に数字で表すことにする。

【００３６】このようにして得られた英文の数列に対し
て、機械翻訳システムにおける訳文構築部１０３は、構
文規則データ１１３を参照しながら、訳文を構築する処
理を実行する（ステップ５０１４）。この訳文構築処理
で使用される記号の意味は、図４に示したとおりであ
る。

【００３７】そして、訳語を結合して訳文を構築する過
程では、上記の出現順序を表す品詞コード数列の中か
ら、構文規則データ１１３中に含まれる数列を探索し、
適用可能な規則を使って訳語句を結合し、数列の長さを
減らしてゆく。訳語句の結合操作は、「名詞句生成（冠
詞・形容詞・接続詞処理）→前置詞句生成→副詞句生成
→動詞処理→助動詞処理→文節形成→訳文作成」という
ような流れで行い、過去、受身、否定、命令などの語尾
も作成する。なお、各構文規則データは、「ダミー数
字；被結合語順；結合句の品詞；正逆順；適用条件；訳
語作用；」のフォーマットで表示される。したがって、
訳文構築部１０３は、図７（ｄ）に示すように、品詞コ
ード数列に構文規則データ１１３の規則を当てはめて、
“９２３２０３００２”→“９２３０３００２”→“６
０３００２”→“Ｘ００２”というように順次数列を減
少させる処理をしてゆくことにより、「それを動かす」
→「あなたがそれを動かすならば」→「あなたがそれを
動かすならば、、＃１を元に戻して下さい」と順次日本
文が構築されてゆくことになる。

【００３８】上記処理が終了すると、訳文推敲部１０４
が動作し、訳文の表現修正と洗練化の処理を実行する
（ステップ５０１５）。

【００３９】訳文推敲部１０４は、訳文推敲規則データ
１１４を用いて、より洗練した訳文を作成する。この訳
文推敲規則データ１１４は、「推敲前の訳文、推敲後の
訳文」のフォーマットで表示され、生成された訳文の中
にはコンマの左側の文字列が含まれていれば、その部分
が右側の文字列に置き代わる。上記の場合には、「、、，＃、」「あなたがそれを＃ならば、それを，＃ならば、」の二つの訳文推敲規則データが適用されることになる。
そして、訳文推敲部１０４は、次のような文章を推敲し
て出力する。「動かすならば、元に戻して下さい。」

【００４０】以上のような機械翻訳過程が終了すると、
翻訳結果の和文が英文原文と共に、表示装置１５の画面
上に表示される（ステップ５０１６）。なお、上記辞書
部１０１での処理過程、適語選択部１０２での処理過
程、訳文構築部１０３での処理過程、及び訳文推敲部１
０４での処理過程全てを、処理装置１１内の例えば主メ
モリの所定のエリアに記憶させておく。

【００４１】表示装置１５の画面上の和文が英文原文を
モニタして満足ゆくときには（図５のステップ５０２；
Ｙ）、これらを保存し、また必要に応じて入出力文の印
刷をして処理を終了する（ステップ５０３）。

【００４２】一方、翻訳結果を表示装置１５の画面上で
モニタして満足ゆくものでないときには（図５のステッ
プ５０２；Ｎ）、キーボード１２等から画面表示手段１
０５に指示し、各辞書部１０１での処理過程を表示装置
１５の画面上に表示させる（ステップ５０２）。この表
示装置１５の画面をモニタして、辞書データ１１１の変
更が必要であると判断したときには（ステップ５０４；
Ｙ）、データ修正手段１０６により辞書データ１１１の
修正を実行する（ステップ５０５）。この辞書データ１
１１の修正が完了した時点で、再び機械翻訳処理を実行
させる（ステップ５０１）。再度機械翻訳処理をし（ス
テップ５０１）、その翻訳結果が満足ゆくものであれば
（ステップ５０２；Ｙ）、処理を終了する（ステップ５
０３）。

【００４３】しかし、機械翻訳処理をして（ステップ５
０１）、その翻訳結果が満足ゆくものでなく（ステップ
５０２；Ｎ）、しかも辞書データ１１１に変更の必要が
ないときには（ステップ５０４；Ｎ）、画面表示手段１
０５により適語選択部１０２の処理過程を表示装置１５
の画面上に表示させる（ステップ５０６）。この表示装
置１５の画面をモニタして、適語選択規則データ１１２
の変更が必要であると判断したときには（ステップ５０
６；Ｙ）、データ修正手段１０６を介して適語選択規則
データ１１２の修正を実行する（ステップ５０７）。こ
の適語選択規則データ１１２の修正が完了した時点で、
再び機械翻訳処理を実行させる（ステップ５０１）。再
度機械翻訳処理をし（ステップ５０１）、その翻訳結果
が満足ゆくものであれば（ステップ５０２；Ｙ）、処理
を終了する（ステップ５０３）。

【００４４】しかし、機械翻訳処理をして（ステップ５
０１）、その翻訳結果が満足ゆくものではなく（ステッ
プ５０２；Ｎ）、しかも辞書データ１１１に変更の必要
がなく（ステップ５０４；Ｎ）、かつ適語選択規則デー
タ１１２にも変更が必要でないときには（ステップ５０
６；Ｎ）、画面表示手段１０５により訳文構築部１０３
の処理過程を表示装置１５の画面上に表示させる（ステ
ップ５０８）。この表示装置１５の画面をモニタして、
構文規則データ１１３の変更が必要であると判断したと
きには（ステップ５０８；Ｙ）、データ修正手段１０６
を動作させて構文規則データ１１３の修正を実行する
（ステップ５０９）。この構文規則データ１１３の修正
が完了した時点で、再び機械翻訳処理を実行させる（ス
テップ５０１）。再度機械翻訳処理をし（ステップ５０
１）、その翻訳結果が満足ゆくものであれば（ステップ
５０２；Ｙ）、処理を終了する（ステップ５０３）。

【００４５】しかし、機械翻訳処理をして（ステップ５
０１）、その翻訳結果が満足ゆくものではなく（ステッ
プ５０２；Ｎ）、しかも辞書データ１１１に変更の必要
がなく（ステップ５０４；Ｎ）、また適語選択規則デー
タ１１２に変更の必要がなく（ステップ５０６；Ｎ）、
構文規則データ１１３にも変更の必要がないときには
（ステップ５０８；Ｎ）、画面表示手段１０５により訳
文推敲部１０４の処理過程を表示装置１５の画面上に表
示させる（ステップ５１０）。この表示装置１５の画面
をモニタしながら、データ修正手段１０６を動作させて
訳文推敲規則データ１１４の修正を実行する（ステップ
５１０）。訳文推敲規則データ１１４の修正が完了した
時点で、再び機械翻訳処理を実行させる（ステップ５０
１）。再度機械翻訳処理をし（ステップ５０１）、その
翻訳結果が満足ゆくものであれば（ステップ５０２；
Ｙ）、処理を終了する（ステップ５０３）。なお、その
翻訳結果が満足ゆくものでなければ（ステップ５０２；
Ｎ）、再び上記データ修正手段１０６による処理を実行
することになる。

【００４６】したがって、本機械翻訳システムによれ
ば、画面表示手段１０５及びデータ修正手段１０６によ
り、辞書データ１１１、適語選択規則データ１１２、構
文規則データ１１３、訳文推敲規則データ１１４の内容
を、訳文をモニタしながら修正、追加、削除等の処理が
できるため、利用者が多くの文例に関する翻訳経験を集
積することによって、機械翻訳性能を強化し、向上させ
てゆくことができることになる。

【００４７】次に、翻訳が満足ゆくものでなく、これを
修正して行く具体例として上記英文例に対して実施した
修正例について説明する。

【００４８】この場合、辞書データ１１１には“put 〜
back”が登録されていず、また、適語選択規則データ１
１２、構文規則データ１１３及び訳文推敲規則データ１
１４の一部にそれぞれ条件不備があるものとする。

【００４９】まず、ＯＣＲ１４等により処理装置１１内
に下記の英文を入力する（ステップ５００）。「If you move it, put it back．」

【００５０】この英文に対して、機械翻訳システムは、
処理装置１１の機械翻訳プログラムを実行して、辞書部
１０１、適語選択部１０２、訳文構築部１０３、及び訳
文推敲部１０４が動作して機械翻訳処理が実行される
（ステップ５０１）。

【００５１】その結果が、表示装置１５の画面上に下記
のとおり表示されたとする。「＊かどうか（ならば）＊あなた＊動き＊それ＊、＊後
にそれを置く＊」前記訳文をモニタした利用者は、翻訳文が満足ゆくもの
でないので（ステップ５０２；Ｎ）、まず辞書部１０１
の処理過程を表示装置１５の画面上に表示させる（ステ
ップ５０４）。

【００５２】表示装置１５の画面上で辞書部１０１の処
理過程をモニタした結果、利用者は、“put 〜back”が
登録されていないことが判り、辞書データ１１１の不整
備であるので（ステップ５０４；Ｙ）、データ修正手段
１０６を介してキーボード１２等を所定の操作をするこ
とにより、辞書データ１１１の変更を実行して、“put
〜back”について「〜を元に戻す」、その他の必要な事
項を辞書登録する（ステップ５０５）。これにより、図
７（ａ）に示すような“put 〜back”に関するデータが
辞書データ１１１に登録されることになる。

【００５３】次に、再度機械翻訳を実行して翻訳過程の
画面表示をモニタする（ステップ５０１）。その結果、
辞書部１０１による辞書データ１１１の検索過程は正常
であるが、他の翻訳部分が悪いと判定されることになる
と（ステップ５０２；Ｎ、ステップ５０４；Ｎ）、引き
続く適語選択部１０２の処理過程を画面表示手段１０５
により表示装置１５の画面上に表示させる（ステップ５
０６）。

【００５４】この処理過程（ステップ５０６）では、
“if”が接続詞としての「ならば」と、「かどうか」の
二義語の適語選択規則のタイプミス、また“move”が自
動詞の「動く」と、他動詞の「を動かす」と、名詞の
「動き」の三義語の中の名詞・動詞選択規則の条件不備
のために、適語選択に失敗していることが、処理過程を
モニタすることにより判る（ステップ５０６；Ｙ）。し
たがって、データ修正手段１０６を介して、キーボード
１２等を所定の操作をすることにより、これらの適語選
択規則データ１１２を修正する（ステップ５０７）。こ
れにより、図７（ｃ）に示すような適語選択規則データ
とすることができる。

【００５５】再び、機械翻訳を実行して翻訳過程の画面
表示をモニタする（ステップ５０１）。その結果、辞書
部１０１による辞書データ１１１の検索過程は正常であ
ると判定でき（ステップ５０４；Ｎ）、適語選択部１０
２による適語選択規則データ１１２の検索過程も正常で
あると判定できたとき（ステップ５０６；Ｎ）、訳文構
築部１０３の処理過程を画面表示手段１０５により表示
装置１５の画面上に表示させる（ステップ５０８）。

【００５６】この処理過程をモニタした利用者は、訳文
構築部１０３における処理過程で、辞書登録した“put
it back ”が現在形と、過去・過去分詞形の同形のため
に、命令形にならないことが判るので（ステップ５０
８；Ｙ）、関連の構文規則データ１１３において原型復
帰変換後に命令形変換をするように修正を行う（ステッ
プ５０９）。

【００５７】再び、機械翻訳を実行して翻訳過程の画面
表示をモニタする（ステップ５０１）。すると、次ぎの
ような訳文出力が表示装置１５の画面上に得られるよう
になる。「あなたがそれを動かすならば、それを元に戻して下さ
い。」利用者は、上記訳文出力をモニタした結果、いまだ、日
本語らしい表現になっていないことが判るので（ステッ
プ５０２；Ｎ）、訳文推敲部１０４の訳文推敲規則デー
タ１１４の変更を行う（ステップ５０４；Ｎ→ステップ
５０６；Ｎ→ステップ５０８；Ｎ→ステップ５１０）。
すなわち、この訳文のより日本語らしい表現修正を行う
ために、訳文推敲規則データ１１４に、「あなたが」
と、「それを」とを削除するためのデータを追加する
（ステップ５１０）。

【００５８】そして、再び、機械翻訳を実行して翻訳過
程の画面表示をモニタする（ステップ５０１）。する
と、表示装置１５の画面上には、次のような訳文出力が
得られるようになる。「動かすならば、元に戻して下さい。」

【００５９】以上の英文による翻訳処理例は、当初の翻
訳失敗の機械翻訳出力に対して、辞書データ１１１、適
語選択規則データ１１２、構文規則データ１１３、及び
訳文推敲規則データ１１４の全てについて、本機械翻訳
システムによる修正を実施した代表的な例であるが、同
様な方式によって、翻訳処理過程の画面上での目視か
ら、翻訳異常が生じる時点とその原因が探索でき、その
箇所の規則データの改良によって誤翻訳の修正ができる
ことになる。

【００６０】さらに、このような修正を一度実行すれ
ば、類似の翻訳には学習効果によって正常な翻訳ができ
ることになり、翻訳性能が恒久的に向上することにな
る。

【００６１】上記実施例では、辞書部１０１の処理過
程、適語選択部１０２の処理過程、訳文構築部１０３の
処理過程、訳文推敲部１０４の処理過程を指定して表示
装置１５に表示させていたが、各処理過程をサイクリッ
クに表示装置１５上に表示し、キーボード１２の例えば
ＥＳＣキーを押下することにより、必要な処理過程を表
示させるようにしてもよい。

【００６２】なお、上記実施例は、英文を和文に翻訳し
た例で説明したが、これに限定されるものではなく、辞
書データ、適語選択規則データ、構文規則データ、訳文
推敲規則データの各処理過程を画面表示手段により表示
して、データ修正手段により前記各データの必要部分を
修正するという思想については、他の外国語文を和文に
翻訳する場合、さらにはその逆の和文を外国語文に翻訳
する場合にも適用することができる。

【００６３】

【発明の効果】以上説明したように本発明によれば、機
械翻訳システムにおいて、翻訳過程を表示できるととも
に規則データを修正できるようにしたので、利用者が多
くの文例に関する翻訳経験を集積することによって、機
械翻訳性能を強化し、向上させてゆくことが可能とな
る。

【図面の簡単な説明】

【図１】本発明の機械翻訳システムの実施例を示すブロ
ック図である。

【図２】同実施例の辞書部で使用される記号の説明図で
ある。

【図３】同実施例の適語選択部で使用される記号の説明
図である。

【図４】同実施例の訳文構築部で使用される記号の説明
図である。

【図５】同実施例の動作を示すフローチャートである。

【図６】同実施例の翻訳過程を示すフローチャートであ
る。

【図７】同実施例の処理状況の説明図である。

【図８】同実施例を実現する小型計算機の構成例を示す
ブロック図である。

【符号の説明】

１０小型計算機１１処理装置１２キーボード１３マウス１４ＯＣＲ１５表示装置１６プリンタ１７ハードデスク装置１００機械翻訳システム１０１辞書部１０２適語選択部１０３訳文構築部１０４訳文推敲部１０５画面表示手段１０６データ修正手段１１１辞書データ１１２適語選択規則データ１１３構文規則データ１１４訳文推敲規則データ

Claims

【特許請求の範囲】

【請求項１】翻訳対象の入力文を単語や熟語に分解し
て訳語情報を得る辞書部と、複数個の訳語情報がある場
合に最適な訳語を決定する適語選択部と、選択された訳
語を結合して翻訳文を構築する訳文構築部と、生成され
た翻訳文を推敲し、より適切な翻訳文に仕上げる訳文推
敲部と、前記辞書部、前記適語選択部、前記訳文構築部
及び前記訳文推敲部のそれぞれの翻訳過程における実行
状況が表示装置の画面上に表示できる画面表示手段と、
前記画面上に表示された訳文に不都合があるときには、
前記辞書部、前記適語選択部、前記訳文構築部及び前記
訳文推敲部の規則データ内容の修正、追加、削除をする
データ修正手段とを備えたことを特徴とする機械翻訳シ
ステム。