JPH07253982A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH07253982A
JPH07253982A JP6070136A JP7013694A JPH07253982A JP H07253982 A JPH07253982 A JP H07253982A JP 6070136 A JP6070136 A JP 6070136A JP 7013694 A JP7013694 A JP 7013694A JP H07253982 A JPH07253982 A JP H07253982A
Authority
JP
Japan
Prior art keywords
language
translation
character string
english
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6070136A
Other languages
English (en)
Inventor
Masaharu Nii
正治 仁井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP6070136A priority Critical patent/JPH07253982A/ja
Priority to US08/403,958 priority patent/US5659765A/en
Priority to EP95301677A priority patent/EP0672989A3/en
Publication of JPH07253982A publication Critical patent/JPH07253982A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 ユーザにより翻訳能力を向上させるととも
に、自然な訳を出力可能な機械翻訳システムを提供す
る。 【構成】 翻訳例の学習登録を行う対訳データ登録手段
21、翻訳処理を行う翻訳手段22、辞書管理およびデ
ータベースの送受信を行う辞書管理手段23を構成す
る。対訳データ登録部211によって英文および邦文等
の対訳を登録し、対訳学習部212によって対訳をパー
ツ単位で対応づける。そして、英日翻訳部221等は学
習登録されたパーツ等に基づき、翻訳対象となる原文の
訳を生成する。また、辞書データベース送受信部236
は、他の機械翻訳システムとの間でデータベースの送受
信を行うことも可能である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は機械翻訳システム、詳し
くは翻訳例を学習することにより翻訳能力を向上可能な
機械翻訳システムに関する。
【0002】
【従来の技術】近年のコンピュータ技術の発展は、自動
翻訳を行う機械翻訳システムを生み出した。現在、実用
化されている機械翻訳システムの多くは、構文変換方式
と呼ばれる翻訳方式を採用したものである。構文変換方
式を用いた機械翻訳システムの処理の概要を図31を用
いながら説明する。
【0003】例えば、「Development of
・・・・」という英文が機械翻訳システムに入力された
とする。入力された英文は単語に分解され、分解した単
語の品詞(名詞(n)、他動詞(vt)、・・・)が決
定される(形態素解析)。そして、予め定められた文法
規則に基づき入力英文の構造が解析され、入力英文は名
詞句(NP)、動詞句(VP)等に分解される(構文解
析)。このように解析された構文は他の言語(日本語)
に変換され、形態素生成を経て「計算機科学と言語学の
発展は機械翻訳に対して道を開けた」という邦文が生成
される。
【0004】しかしながら、構文変換方式による機械翻
訳システムは、文法規則のみによって翻訳を行うため、
文法規則から離れた表現を行うことはできず、上述した
ように不自然な訳が出力されるという問題がある。ま
た、翻訳品質を向上させようとした場合、文法規則を追
加しなければならないが、文法規則が干渉し合って逆に
翻訳品質が低下するという問題も生じる。
【0005】そこで、近年、実例(翻訳例)に基づく翻
訳を行うEBMT(Example-BasedMachine Translatio
n)方式の機械翻訳システムが提案された(Nagao,M A F
ramework of a Mechanical Translation between Japan
ese and English by Analogy Principle, in ARTIFICIA
L AND HUMAN INTELLIG-ENCE(Elithorn & Banerji,Ed
s.),Elsevier Science Publishers,pp173-180,1984)。
このEBMT方式の機械翻訳システムは、翻訳対象とな
る原文に最も類似した翻訳例を検索し、この翻訳例に基
づき翻訳を行うというものである。このEBMT方式に
よる機械翻訳システムを実現するための具体的な実現手
段は未だ案出されていないが、およそ図32に示される
ような処理を行うものと考えられる。
【0006】EBMT方式による機械翻訳システムにあ
っては、構文解析の処理において、過去の翻訳例に基づ
き原文の構文解析(NP、VP等)を行い、構文解析結
果に基づき構文変換を行うことにより原文の訳を生成す
るものである。
【0007】
【発明が解決しようとする課題】上述した従来の機械翻
訳システムは以下に示すように種々の問題を抱えてい
た。
【0008】第1に、ユーザが翻訳能力を向上させるこ
とは困難であった。構文変換方式による機械翻訳システ
ムにあっては、翻訳能力の向上を行うためには、文法規
則および構文規則を書き換える必要がある。ところが、
文法規則および構文規則はプログラムとして機械翻訳シ
ステムに組み込まれているため、文法規則および構文規
則の書換えを行うことができる者はシステム開発者に限
定されていた。したがって、ユーザは翻訳品質を向上さ
せることはできず、ユーザが機械翻訳システムに所望の
翻訳を行わせることは不可能であった。例えば、不所望
の翻訳結果が出力された場合に、ユーザが翻訳結果を修
正したとしても、同一の原文に対しては繰り返し不所望
の翻訳結果が出力されてしまう。このため、ユーザは過
大な修正作業を強いられていた。
【0009】また、EBMT方式による機械翻訳システ
ムは具体的には実現されていないが、理論的には翻訳例
を追加登録することにより翻訳能力を向上させることは
可能である。ところが、オペレータは、追加登録された
翻訳例の文法解析(NP、VP)等を行わなければなら
ず、オペレータの作業負担が大きくなるという問題が生
じる。
【0010】第2に、翻訳品質の向上には限界があっ
た。構文変換方式による機械翻訳システムにおいて、翻
訳品質を向上させるために文法規則および構文規則を追
加すると、規則の数が増加し、規則同士が干渉しやすく
なる。このため、翻訳品質の向上には限界があり、逆に
規則を追加することにより翻訳品質が低下することもあ
った。
【0011】一方、EBMT方式による機械翻訳システ
ムにあっては、翻訳例を追加することによって翻訳品質
を向上させることは理論的には可能であるが、EBMT
方式による機械翻訳システムの具体的な実現手段は未だ
案出されていない。
【0012】第3に、自然な翻訳を行うことが困難であ
った。実際の文章は必ずしも文法規則のみにとらわれず
に作成されることが多い。しかしながら、構文変換方式
の機械翻訳システムにあっては、文法規則および構文規
則のみに従い翻訳を行っていたため、翻訳結果は不自然
なものになりやすかった。例えば、上述した英文「De
velopment of・・・・」に対しては、本来
「計算機科学と言語学の発展により機械翻訳への道が開
けた」と訳されるべきであるにも拘らず、「計算機科学
と言語学の発展は機械翻訳に対して道を開けた」という
不自然な訳がなされてしまう。
【0013】EBMT方式による機械翻訳システムは、
過去の翻訳例に基づき翻訳を行うため、比較的に自然な
訳を出力することが可能である。ところが、EBMT方
式による機械翻訳システムといえども、過去の翻訳例に
基づき文法解析を行っているため、文法から大きく離れ
た慣用的表現に対して自然な訳を出力できない場合が生
じ得る。
【0014】本発明は上述した課題に鑑みてなされたも
のであり、本発明の目的は上述した課題を解決すること
にある。
【0015】
【課題を解決するための手段】請求項1記載の発明は、
第1言語で表された原文字列を、対訳データベース2に
基づき第2言語に翻訳する翻訳手段1を備えた機械翻訳
システムにおいて、第1言語文字列、および、当該第1
言語文字列を第2言語に訳した第2言語文字列を入力す
る入力手段5と、第1言語文字列を構成する第1言語パ
ーツ、および、第2言語文字列を構成する第2言語パー
ツの対応付けを示すパーツリンク情報を生成するパーツ
リンク情報生成手段4と、生成されたパーツリンク情報
を、第1言語文字列および第2言語文字列に対応付けな
がら上記対訳データベースに登録する登録手段3とを備
えたことを特徴とする機械翻訳システムである。
【0016】請求項2記載の発明は、上記パーツリンク
情報生成手段は、過去に生成された他のパーツリンク情
報に基づき、第1言語文字列を構成する第1言語パー
ツ、および、第2言語文字列を構成する第2言語パーツ
を対応付けることにより、新たなパーツリンク情報を生
成することを特徴とする請求項1記載の機械翻訳システ
ムである。
【0017】請求項3記載の発明は、第1言語で表され
た原文字列を、対訳データベースに基づき第2言語に翻
訳する翻訳手段を備えた機械翻訳システムにおいて、第
1言語で表された第1言語文字列、および、当該第1言
語文字列を第2言語に訳した第2言語文字列を入力する
入力手段と、第1言語パーツ、および、当該第1言語パ
ーツを第2言語に訳した第2言語パーツが登録された対
訳パーツ解析辞書と、対訳パーツ解析辞書に基づき、第
1言語文字列を構成する第1言語パーツ、および、第2
言語文字列を構成する第2言語パーツの対応付けを示す
パーツリンク情報を生成するパーツリンク情報生成手段
と、生成されたパーツリンク情報を、第1言語文字列お
よび第2言語文字列に対応付けながら上記対訳データベ
ースに登録する登録手段とを備えたことを特徴とする機
械翻訳システムである。
【0018】請求項4記載の発明は、第1言語で表され
た原文字列を、対訳データベースに基づき第2言語に翻
訳する翻訳手段を備えた機械翻訳システムにおいて、第
1言語文字列、および、当該第1言語文字列を第2言語
に訳した第2言語文字列を入力する入力手段と、第1言
語パーツ、および、当該第1言語パーツを第2言語に訳
した第2言語パーツが登録された対訳パーツ解析辞書
と、第1言語で表された単語、および、当該単語の第2
言語の訳が登録された単語辞書と、第1言語文字列およ
び第2言語文字列中に、対訳パーツ解析辞書に登録済み
の第1言語パーツおよび第2言語パーツが存在する場合
には、対訳パーツ解析辞書に基づき、第1言語文字列を
構成する第1言語パーツ、および、第2言語文字列を構
成する第2言語パーツの対応付けを行い、第1言語文字
列および第2言語文字列中に、対訳パーツ解析辞書に未
登録の第1言語パーツおよび第2言語パーツが存在する
場合には、単語辞書に基づき、第1言語文字列を構成す
る第1言語パーツ、および、第2言語文字列を構成する
第2言語パーツの対応付けを行うことにより、パーツリ
ンク情報を生成するパーツリンク情報生成手段と、生成
されたパーツリンク情報を、第1言語文字列および第2
言語文字列に対応付けながら上記対訳データベースに登
録する登録手段とを備えたことを特徴とする機械翻訳シ
ステム。
【0019】請求項5記載の発明は、第1言語文字列お
よび第2言語文字列中に、対訳パーツ解析辞書および単
語辞書の双方に未登録の第1言語パーツおよび第2言語
パーツが存在する場合に、当該第1言語パーツおよび第
2言語パーツが未登録である旨を表示する表示手段を備
えたことを特徴とする請求項4記載の機械翻訳システム
である。
【0020】請求項6記載の発明は、第1言語文字列お
よび第2言語文字列中に、対訳パーツ解析辞書および単
語辞書の双方に未登録の第1言語パーツおよび第2言語
パーツが存在する場合に、当該第1言語パーツおよび第
2言語パーツの対応付けを指示する対話入力手段を備
え、対応付けが指示された第1言語パーツおよび第2言
語パーツを対訳パーツ解析辞書に登録することを特徴と
する請求項4または請求項5のいずれかに記載の機械翻
訳システムである。
【0021】
【作用】請求項1記載の発明において、入力手段は、第
1言語文字列、および、当該第1言語文字列を第2言語
に訳した第2言語文字列を入力する。そして、パーツリ
ンク情報生成手段は、第1言語文字列を構成する第1言
語パーツ、および、第2言語文字列を構成する第2言語
パーツの対応付けを示すパーツリンク情報を生成する。
登録手段は、このパーツリンク情報を、第1言語文字列
および第2言語文字列に対応付けながら対訳データベー
スに登録する。すなわち、パーツの対訳が、そのパーツ
を含む文字列と関連づけられながら対訳データベースに
登録される。
【0022】翻訳時においては、翻訳手段は、翻訳対象
となる原文字列に類似した第1言語文字列を検索し、こ
の第1言語文字列中の第1言語パーツと同一のものが原
文字列に存在するか否かを判断する。そして、翻訳手段
は、この第1言語パーツの対訳である第2言語パーツを
抽出する。このようにして、原文字列を構成する第1言
語パーツの対訳を順次決定し、原文字列の翻訳を行う。
したがって、本発明によれば、文字列(文章)中におけ
るパーツ(語句等)の位置づけを考慮しながら翻訳を行
うことができるため、自然な翻訳結果を出力することが
可能となる。
【0023】請求項2記載の発明において、パーツリン
ク情報生成手段は、過去に生成された他のパーツリンク
情報に基づき、第1言語文字列を構成する第1言語パー
ツ、および、第2言語文字列を構成する第2言語パーツ
を対応付けることにより、新たなパーツリンク情報を生
成する。すなわち、過去に生成されたパーツリンク情報
に基づき、新たなパーツリンク情報を自動的に生成する
ことができるため、パーツリンク情報の生成(対訳学
習)の作業を軽減することが可能となる。
【0024】請求項3記載の発明において、作成済みの
第1言語パーツおよび第2言語パーツを予め対訳パーツ
解析辞書に登録しておく。パーツリンク情報は、対訳パ
ーツ解析辞書に基づき、第1言語文字列を構成する第1
言語パーツ、および、第2言語文字列を構成する第2言
語パーツの対応付けを行い、パーツリンク情報を自動的
に生成する。そして、登録手段は、生成されたパーツリ
ンク情報を、第1言語文字列および第2言語文字列に対
応付けながら対訳データベースに登録する。したがっ
て、本発明によれば、対訳パーツ解析辞書に基づきパー
ツリンク情報を自動的に生成することができ、対訳学習
の作業を容易に行うことが可能となる。
【0025】請求項4記載の発明において、作成済みの
第1言語パーツおよび第2言語パーツを予め対訳パーツ
解析辞書に登録しておく。また、単語の対訳を単語辞書
に登録しておく。第1言語文字列および第2言語文字列
中に、対訳パーツ解析辞書に登録済みの第1言語パーツ
および第2言語パーツが存在する場合には、パーツリン
ク情報生成手段は、対訳パーツ解析辞書に基づき、第1
言語文字列を構成する第1言語パーツ、および、第2言
語文字列を構成する第2言語パーツの対応付けを行う。
一方、第1言語文字列および第2言語文字列中に、対訳
パーツ解析辞書に未登録の第1言語パーツおよび第2言
語パーツが存在する場合には、パーツリンク情報生成手
段は、単語辞書に基づき、第1言語文字列を構成する第
1言語パーツ、および、第2言語文字列を構成する第2
言語パーツの対応付けを行う。そして、これらの対応付
けに基づきパーツリンク情報が生成される。登録手段
は、生成されたパーツリンク情報を、第1言語文字列お
よび第2言語文字列に対応付けながら上記対訳データベ
ースに登録する。
【0026】すなわち、対訳学習しようとする文字列中
に、対訳パーツ解析辞書に未登録のパーツがある場合に
は、パーツリンク情報生成手段は単語辞書に基づき対訳
学習を行う。したがって、対訳パーツ解析辞書に未登録
のパーツがあったとしても、パーツリンク情報を自動的
に生成でき、対訳学習の作業を容易に行うことが可能で
ある。
【0027】請求項5記載の発明において、第1言語文
字列および第2言語文字列中に、対訳パーツ解析辞書お
よび単語辞書の双方に未登録の第1言語パーツおよび第
2言語パーツが存在する場合に、表示手段は、当該第1
言語パーツおよび第2言語パーツが未登録である旨を表
示する。これにより、オペレータは未登録のパーツを把
握することができる。
【0028】請求項6記載の発明において、第1言語文
字列および第2言語文字列中に、対訳パーツ解析辞書お
よび単語辞書の双方に未登録の第1言語パーツおよび第
2言語パーツが存在したとする。この場合に、オペレー
タは対話入力手段を用いることにより、未登録の第1言
語パーツおよび第2言語パーツの対応付け作業を容易に
行うことができる。
【0029】
【実施例】以下に、本発明の一実施例に係る機械翻訳シ
ステムを図面を参照しながら説明する。
【0030】図2は本発明の一実施例に係る機械翻訳シ
ステムを表すブロック図である。本実施例に係る機械翻
訳システムは、翻訳例に基づく翻訳を行うEBMT(Ex
ample-Based Machine Translation)方式によるもの
である。この機械翻訳システムは複数のワークステーシ
ョン等により構成されている。それぞれのワークステー
ションはイーサネット等の通信系2eを介してオンライ
ン接続され、ワークステーション間において後述する辞
書等のデータベース24を送受信可能なものである。図
3にワークステーションの機能ブロック図を示す。この
ワークステーションは、プロセッサおよびメモリ等によ
り構成されたメインフレーム2a、キーボードあるいは
OCR(光学読み取り装置)等の入力部2b、ディスプ
レイ等の表示部2c、辞書データベース24、文書ファ
イル25を備えている。
【0031】メインフレーム2aは、翻訳例の学習登録
を行う対訳データ登録手段21、翻訳処理を行う翻訳手
段22、辞書管理およびデータベースの送受信を行う辞
書管理手段23の3つの機能を実現するものである。以
下、これらの手段を説明する。
【0032】(1)対訳データ登録手段21 対訳データ登録手段21は、翻訳例(実例)を登録学習
するための手段であって、以下の構成要素を備えてい
る。 対訳データ登録部211 対訳データ登録部211は、翻訳例として、文書ファイ
ル25内の英文および邦文を対応づけて登録(対訳デー
タ登録)するものである。このように、英文および邦文
を対応づけて登録することにより、後の翻訳処理におい
て同一の英文に対して同一の邦文を出力することが可能
となる。
【0033】対訳データ登録の方法は、以下の2通りが
ある。第1は、同一ファイル中の邦文および英文を登録
する方法であり、第2は、別ファイルに収められた邦文
および英文を登録する方法である。
【0034】先ず、同一ファイル中の邦文および英文を
登録する第1の方法について説明する。日英文書ファイ
ル251には、邦文および英文が対になって書き込まれ
ており、メインフレーム2aは日英文書ファイル251
から対になった邦文および英文を読み出す。読み出され
た邦文および英文は図4に示すように表示部2bに表示
される。
【0035】英文41「Selectively ・・
・ in section 6.3.1.」に対する邦
文42「6.3.1の項の計算方法により、・・・施さ
れていること。」は、翻訳者により既に翻訳済みのもの
である。オペレータは、この表示画面を見ながら英文4
1および邦文42を対に登録する旨をメインフレーム2
aに指示する。この指示により、対訳データ登録部21
1は英文41および邦文42をデータベース管理部21
5を介して対訳データベース246に登録する。このと
き、翻訳時において対訳データを検索するために用いら
れるキーデータも併せて対訳データ246に登録され
る。また、登録を指示すると、当該対訳に対して、”文
番号3646で登録.OK?[y/n]”と表示さ
れ、”y”を選択すると内部で自動発生させた固有の文
番号3646が登録される。
【0036】対訳データ登録部211は、単語および品
詞の情報が登録された英語形態素解析辞書243および
日本語形態素解析辞書244に基づき、英文41および
邦文42の対訳データ登録を行う。すなわち、対訳登録
しようとする英文41中に英語形態素解析辞書243に
登録されていない単語がある場合には、この単語が英語
未登録語表示欄43に表示される。同様に、対訳登録し
ようとする邦文42中に日本語形態素解析辞書244に
登録されていない単語がある場合には、この単語が日本
語未登録語表示欄44に表示される。これらの未登録語
表示欄43、44に未登録語が表示されている限り、対
訳登録を行うことはできない。オペレータが未登録語を
登録することにより、未登録語表示欄43、44は空欄
となり、対訳登録が可能となる。
【0037】第2の方法は、別ファイルに収められた英
文および邦文の対訳登録を行う方法である。英文ファイ
ル252には英文が収められ、邦文ファイル253には
英文の対訳である邦文が邦文ファイル253に収められ
ている。このように、英文および邦文が別ファイルに収
められている場合には、英文と邦文との対応関係が不明
であるため、以下の処理を行う必要がある。先ず、メイ
ンフレーム2aは、英文ファイル252、邦文ファイル
253から英文および邦文を読み出し、これらの英文お
よび邦文を図5に示すように同一画面上に表示する。オ
ペレータは、コマンド53を入力することにより、対訳
データとして登録しようとする英文および邦文を指示す
る。例えば、英文51に対する邦文52を指示すると、
対訳データ登録部211は英文51および邦文52より
なる対訳データを対訳データベース246に登録する。
このとき、対訳文番号およびキーデータもまた対訳デー
タベース246に登録される。
【0038】なお、必ずしも1文毎に対訳登録を行う必
要はなく、単語毎、あるいは、センテンス毎に行っても
よい。また、一つの単語に対して一つの文章全体を対応
させて対訳登録を行ってもよい。
【0039】対訳学習部212 対訳学習部212は、対訳データ登録部によって登録さ
れた対訳データの対訳学習処理を行うものである。対訳
学習処理は、対訳データ登録された英文および邦文をパ
ーツに分解し、英文のパーツと邦文のパーツとを対応さ
せる処理である。このように対訳学習処理を行うことに
より、対訳登録された英文の中から翻訳対象となる英文
に最も類似した英文を検索し、自然な邦文訳を行うこと
が可能となるものである。
【0040】図6に、対訳学習処理時の表示画面の一例
を示す。この表示画面は、対訳文番号3646の英文6
1および邦文62の対訳学習を行う際の画面である。対
訳学習部212は、英文61をパーツと呼ばれる語句の
単位に分解し、英語パーツ情報66を生成する。同様
に、対訳学習部212は、邦文62から日本語パーツ情
報67を生成する。英語パーツ情報66、日本語パーツ
情報67中の「:」の前の数値は、英文61および邦文
62中のパーツの順序を表している。
【0041】対訳学習部212は、英語パーツ情報6
6、日本語パーツ情報67、過去の学習例に基づき推論
を行い、英文61および邦文62をパーツ単位で自動的
に対応づける(リンクする)。例えば過去の対訳学習処
理において[Selectively plated]
というパーツと[部分メッキが施されていること]とい
うパーツとがリンクされているとする。すなわち、両パ
ーツが対訳として対訳パーツ解析辞書245上に登録さ
れているとする。この場合、対訳学習部212は、[1:
Selectively 2:plated]のパーツを
[18;部分 19:メッキが 20:施さ 21:れて 22:いる
23:こと]のパーツに自動的に対応づけることが可能
である。パーツリンク情報63中の<<1:Select
ively2:plated 18;部分 19:メッキが 2
0:施さ 21:れて 22:いる 23:こと>>は、両者が対
応づけられたことを表している。
【0042】同様に、過去の対訳学習処理において[m
inimum of]のパーツが、[最低]のパーツに
既に対応づけられ、そして両パーツが対訳パーツ解析辞
書245上に登録されているとする。対訳学習部212
は英文61中の[minimum of]というパーツ
と、邦文62中の[最低]という邦文のパーツとを自動
的にリンクすることが可能となる。
【0043】ところが、英文61および邦文62中に過
去の学習例において対応づけがなされていないパーツが
あった場合には、パーツリンク情報63において<<3:
with ****>>のような表示がなされる。オペ
レータは、この表示を見ることにより対応づけがなされ
ていないパーツを把握することが可能となる。未登録の
パーツの対応づけは、オペレータによって行われる。例
えば、オペレータが、[3:wth]のパーツの順序番号
「3」を入力し、このパーツに対応する[16:厚さ 17:
で]のパーツの順序番号「16、17」を入力する(符
号68)ことにより、[3:wth]のパーツと[16:厚
さ 17:で]のパーツとの対応づけを行うことができ
る。同様に、[13:measured 14:as]のパー
ツの順序番号「13、14」を入力し、このパーツに対
応する[3:計測 4:方法 5:により]の順序番号「3、
4、5」を入力することによって、[13:measur
ed14:as]のパーツと[3:計測 4:方法 5:によ
り]のパーツとの対応づけを行うことができる。これら
の[13:measured 14:as]のパーツと[3:計
測 4:方法 5:により]のパーツとは、対訳パーツ解析
辞書245に登録される。
【0044】このようにして、英文61および邦文62
の各パーツの対応づけを表すパーツリンク情報63が生
成される。生成されたパーツリンク情報63は、英文6
1および邦文62に対応付けられながら対訳データベー
ス246に登録される。このパーツリンク情報63は後
述する翻訳処理において使用されるものである。
【0045】また、対訳学習の際には、パーツリンク情
報の他、各パーツの文法解析に関する情報等も生成され
る。図8、図9に、英文「In the beginn
ing God created the heave
ns and the earth」と、邦文[初めに
神は天地を創造された]を例に説明する。
【0046】[In the beginning]に
は[In]という前置詞が含まれている。このため、
[In the beginning]は、[In]に
対応する[〜に]という助詞を含む[初めに]という副
詞的なパーツに対応させられる。また、[God]は、
文中において主格として使用されているため、単語リン
ク情報93に基づき[神は]に対応させられる。[cr
eated]は、動作を表すとともに受身形である[創
造された]に対応させられる。さらに、[thehea
vens and the earth]は名詞である
が、主格ではないので([God]が主格であるので)
対象を表す[天地を]に対応させられる。以上の文法解
析結果は、パーツリンク情報96とともに対訳データベ
ース246に登録される。そして、後述する翻訳処理に
おいては、これらの情報に基づき訳文生成が行われる。
すなわち、主格を表すパーツは訳文の主格の位置に配置
され、動作を表すパーツは訳文の述部の位置に配置され
る。
【0047】登録テスト部213 登録テスト部213は、対訳データベース246上に登
録された対訳データの管理(メンテナンス)を行うため
のものである。すなわち、登録テスト部213は、対訳
データベース246に登録された対訳データの表示、削
除、追加、検索等の機能を備えている。
【0048】学習テスト部214 学習テスト部214は、対訳データベース246に登録
されたパーツリンク情報等の表示、削除、追加、検索等
の管理を行うためのものである。学習テスト時における
表示画面を図9に示す。この表示画面は、英語形態素9
1、日本語形態素92、単語リンク情報93、英語パー
ツ情報94、日本語パーツ情報95、パーツリンク情報
96を表している。これらの情報91〜96は、英文
「In the ・・・ the earth」および
邦文「初めに・・・創造された」についてのものであ
る。
【0049】英語形態素91および日本語形態素92
は、単語と品詞等の情報よりなるものである。図8に示
す英文「In the beginning God
created the heavens and t
he earth」は、[In前置詞][the 冠
詞][beginning 名詞][God 名詞]
[created 他動詞][the 冠詞][hea
vens 名詞][and接続詞][the 冠詞]
[earth 名詞]のように、単語と品詞が対になっ
た英語形態素に分解可能である。同様に、日本文「神は
初めに天地を創造された。」は、[初め:名詞][に]
[、][神:名詞][は][天地:名詞][を][創造
さ:名サ][れ][た]のように単語と品詞が対になっ
た日本語形態素に分解可能である。
【0050】単語リンク情報93は、英語形態素91お
よび日本語形態素92中の語句のうち、英和辞書241
および和英辞書242に登録されている語句と同一のも
のを表したものである。すなわち、単語リンク情報93
に表示された語句は、過去の学習例を用いることなく、
辞書241、242のみで対応づけ(リンク)可能であ
ることを意味している。ただし、これらの語句と同一の
パーツが対訳パーツ解析辞書245に登録済みである場
合には、これらの語句の対訳学習においてパーツリンク
情報93に基づき対応付けが行われる。
【0051】単語リンク情報93において、[4:他動詞
created :7]は、英語形態素91の配列の4番
目(0番目から起算)の形態素[created 他動
詞]が日本語形態素92の7番目(0番目から起算)の
形態素[創造さ:名サ]に対応することを示している。
【0052】英語パーツ情報94、日本語パーツ情報9
5、パーツリンク情報96は上述したものと同様であ
る。すなわち、英語パーツ情報94、日本語パーツ情報
95は、英文および日本文を過去の学習例等に基づき分
解された語句を表し、パーツリンク情報96は分解され
た語句同士の対応づけを表している。
【0053】データベース管理部215 データベース管理部215は、対訳データベース246
に対する各種データのアクセスを制御するためのもので
ある。したがって、対訳データ登録時、対訳学習時、翻
訳時における対訳データベース246に対するデータの
アクセスは全てデータベース管理部215を介して行わ
れる。ただし、後述するデータベースの送受信時におい
ては、対訳データベース246に対するデータのアクセ
スは辞書データベース送受信部236によって行われ
る。
【0054】(2)翻訳手段22 翻訳手段22は、英日翻訳を行う英日翻訳部221、日
英翻訳を行う日英翻訳部222、英日翻訳結果をプリン
トアウトする英日翻訳印書部223、日英翻訳結果をプ
リントアウトする日英翻訳印書部224により構成され
ている。
【0055】英日翻訳部221、日英翻訳部222 英日翻訳部221は、対訳データベース246に登録さ
れたパーツリンク情報およびキーデータ等に基づき英文
を邦文に翻訳する処理を行うものである。また、日英翻
訳部222は邦文を英文に翻訳する処理を行うものであ
る。
【0056】図7に日英翻訳処理の概要を表す。例え
ば、原文71が日英翻訳部222に与えられると、日英
翻訳部222は対訳データベース246に登録された対
訳データの中から原文71に最も類似した邦文(訳文番
号3646)73を検索する。このようにして検索され
た邦文73の対訳(英訳)は、英文72として登録され
ている。日英翻訳部222は、対訳文番号3646のパ
ーツリンク情報74を対訳データベース246から読み
出し、パーツリンク情報74中の邦文の各パーツと原文
71中の各パーツとを比較する。
【0057】比較の結果をリスト75として例示する。
リスト75中の<****>の表示は、両パーツが一致
しないことを示している。パーツリンク情報74のうち
「150」「計測方法により」「項の」「6.3.1
の」の各パーツが原文71のパーツと一致していないた
め、こららのパーツには<****>が付与される。こ
の場合には、<****>の付与されたパーツは原文に
は不要なのでこれらを削除し、かつ数字を置き換えて翻
訳結果として出力する。
【0058】なお、原文に最も類似した文字列(類似度
の高い文字列)の検索は以下の手順により行われる。例
えば、[進歩が著しい]という原文が与えられたとす
る。この原文の自立語は[進歩]と[著し]である。そ
して、対訳データベース246の中から自立語[進歩]
と[著し]を含む文字列を検索する。ここで、以下の3
つの文字列が検索されたとする。
【0059】文字列1:[機械翻訳の進歩が著しい] 文字列2:[著しく進歩した技術] 文字列3:[技術の進歩と製品の価格]
【0060】次に、これらの文字列を以下の集合に分類
する。なお、集合Aの類似度が最も高く、以下集合B、
集合Cの順に類似度が低くなるものとする。
【0061】集合A:原文が文字列に現れているもの。 集合B:原文の全構成語を文字列に含んでいるもの。 集合C:原文の全機械語の一部を文字列に含んでいるも
の。
【0062】集合Aに該当するのが文1であり、集合B
に該当するのが文2である。また、集合Cに該当するの
が文3である。すなわち、原文との類似度が最も大きい
ものは文1である。同一の集合に複数の文字列が分類さ
れた場合には、さらに以下の方法により類似度を決定す
る。
【0063】原文の複数の構成語が他の語を挟むことな
く連続して含んでいる文字列を、1番目に類似度が高い
文字列とする。次に、文字列の自立語の個数に対する原
文の構成語の個数の比が高い文字列を、2番目に類似度
が高い文字列とする。さらに、原文の構成語をより多く
含んでいる文字列を、3番目に類似度が高い文字列とす
る。なお、類似度の決定方法は上述した方法に限定され
ることなく、他の方法を用いて類似度を決定してもよ
い。ここでは、類似度計算により対訳データベースより
抽出された複数の対訳の文番号を類似度順に並べ、上位
から順に比較する方法を採るが、比較の都度に類似度計
算を行い、対訳を読みだしてもよい。
【0064】英日翻訳印書部223、日英翻訳印書部
224 英日翻訳印書部223、日英翻訳印書部224は、翻訳
された邦文または英文のテキストデータを所定の形式で
プリンタ2dに出力し、印字を行うためのものである。
英日翻訳印書部223による印字例を図10に、日英翻
訳印書部224による印字例を図11に示す。これらの
図において、左欄の文が原文を表し、右欄の文が翻訳文
を表している。翻訳結果が不十分であると翻訳手段22
が判断した場合には、翻訳文の先頭に「◇」のマークが
表示される。
【0065】(3)辞書管理手段23 辞書管理手段23は、英和辞書管理部231、和英辞書
管理部232、英語形態素解析辞書管理部233、日本
語形態素解析辞書管理部234、対訳パーツ解析辞書管
理部235、辞書データベース送受信部236により構
成されている。
【0066】英和辞書管理部231、和英辞書管理部
232は、英和辞書241および和英辞書242の管理
を行うものである。すなわち、和英辞書241、英和辞
書242に対する単語の登録、削除等は英和辞書管理部
231、和英辞書管理部232によって行われる。
【0067】英語形態素解析辞書管理部233、日本
語形態素解析辞書管理部234 英語形態素解析辞書管理部233、日本語形態素解析辞
書管理部234は、英語形態素解析辞書243および日
本語形態素解析辞書244の管理(登録、表示、削除)
を行うものである。
【0068】対訳パーツ解析辞書管理部235 対訳パーツ解析辞書管理部235は、学習済みの対訳パ
ーツが登録された対訳パーツ解析辞書245の管理(登
録、表示、削除)を行うものである。
【0069】辞書データベース送受信部236 辞書データベース送受信部236は、辞書データベース
24上の各種情報を、通信系2eを介して他のワークス
テーションとの間で送受信を行うものである。図12
に、辞書データベース送受信の概念図を示す。送受信の
対象となるものは、辞書データベース24上の各種情
報、すなわち、英和辞書241、和英辞書242、英語
形態素解析辞書243、日本語形態素解析辞書244、
対訳パーツ解析辞書245、対訳データベース246上
の情報である。例えば、ワークステーション12aから
ワークステーション12bに送信された各種辞書および
対訳データベースは、ワークステーション12b側の辞
書データベース24に追加される。受信した情報のう
ち、自己の辞書データベース24に登録されていない情
報のみが、辞書データベース24に書き込まれる。これ
により、辞書データベース24への書き込み作業を短時
間で行うことが可能となる。
【0070】なお、ワークステーション12bからワー
クステーション12aに各種辞書および対訳データベー
スを送信することもでき、あるいは、同図に示されてい
ない他のワークステーションとの間で送受信を行うこと
も可能である。これにより、複数のワークステーション
の辞書データベース24を共有でき、対訳学習等の効率
化を図ることが可能となる。
【0071】(4)辞書データベース24 上述したように辞書データベース24は、英和辞書24
1、和英辞書242、英語形態素解析辞書243、日本
語形態素解析辞書244、対訳パーツ解析辞書245、
対訳データベース246から構成されている。対訳パー
ツ解析辞書245には学習済みの対訳パーツが保存され
ている。対訳データベース246には、対訳データ、英
語形態素情報、日本語形態素情報、対訳パーツ同士の対
応を示すパーツリンク情報、翻訳時の検索のためのキー
データが保存されている。
【0072】続いて本実施例に係る機械翻訳システムの
動作をフローチャートを参照しながら説明する。
【0073】(メインフローチャート)図15は本実施
例に係る機械翻訳システムの作用を表すメインフローチ
ャートである。先ず、オペレータは、表示部2cに表示
されたメニュー画面の中から所望の処理を選択する。対
訳データの登録学習の処理がオペレータによって選択さ
れた場合(S1でYES)には、対訳データ登録手段2
1は対訳データの登録学習の処理を実行する(S2)。
対訳データの登録学習の処理が選択されなかった場合
(S1でNO)には、翻訳処理が選択されたか否かをメ
インフレーム2aが判断する(S3)。翻訳処理が選択
された場合(S3でYES)には、翻訳部22は翻訳処
理(S4)を実行する。翻訳処理が選択されなかった場
合(S3でNO)には、辞書管理の処理が選択されたか
否かをメインフレーム2aが判断する(S5)。辞書管
理の処理が選択された場合(S5でYES)には、辞書
管理部23は辞書管理の処理(S6)を実行する。辞書
管理の処理が選択されなかった場合(S5でNO)に
は、メインフローチャートの処理が終了する。
【0074】(対訳データの登録学習)図16は、図1
5中の対訳データの登録学習処理(S2)を表すフロー
チャートである。オペレータは、表示部2cに表示され
たメニューを見ながら対訳データ登録、対訳学習、登録
テスト、学習テストのいずれかの処理を選択する。オペ
レータが対訳データ登録の処理を選択した場合(S10
1でYES)には、対訳データ登録部211は翻訳済み
の英文および邦文を用いて対訳データ登録を行う(S1
02)。この処理によって生成された対訳データは対訳
データベース246に保存される。後の翻訳処理におい
て、対訳データと同一の文(語句)が翻訳対象となる文
章中に存在する場合には、対訳データと同一の訳文を出
力することが可能となる。
【0075】対訳データ登録の処理が選択されなかった
場合(S101でNO)には、対訳学習の処理が選択さ
れたか否かをメインフレーム2aが判断する(S10
3)。対訳学習処理が選択された場合(S103でYE
S)には、対訳学習部212は対訳学習の処理を実行す
る(S104)。すなわち、対訳データをパーツに分解
し、英文のパーツと邦文のパーツとを対応づける。これ
により、後の翻訳処理において、対訳データに類似する
文に対して自然な翻訳を行うことが可能となる。
【0076】対訳学習の処理が選択されなかった場合
(S103でNO)には、登録テストの処理が選択され
たか否かをメインフレーム2aが判断する(S10
5)。登録テストの処理が選択された場合(S105で
YES)には、登録テスト部213は登録テストの処理
を実行する(S106)。すなわち、登録テスト部21
3は登録された対訳データの表示、削除、追加、検索等
の管理(メンテナンス)を行う。
【0077】登録テストの処理が選択されなかった場合
(S105でNO)には、学習テストの処理が選択され
たか否かをメインフレーム2aが判断する(S10
6)。学習テストの処理が選択された場合(S107で
YES)には、学習テスト部214は学習テストの処理
を実行する(S108)。すなわち、学習テスト部21
4は、登録されたパーツリンク情報等の表示、削除、追
加、検索等の管理を行う。以上の処理が終了すると、図
15のメインフローチャートに戻る。
【0078】(翻訳)図17は、図15中の翻訳処理
(S4)を表すフローチャートである。オペレータは、
表示部2cに表示されたメニューを見ながら英日翻訳、
日英翻訳のいずれかの処理を選択する。オペレータが英
日翻訳の処理を選択した場合(S201でYES)に
は、英日翻訳部221は対訳データおよびパーツリンク
情報等に基づき英日翻訳を行う(S202)。翻訳が終
了すると、オペレータは翻訳結果を印字するか否かを判
断する(S203)。印字するとオペレータが判断した
場合(S203でYES)には、英日翻訳印書部223
は翻訳結果をプリンタ2dに出力する。この結果、図1
0に示すような書式による印字が行われる。一方、印字
しないとオペレータが判断した場合(S203でNO)
には、印字を行うことなく図15のメインフローチャー
トに戻る。
【0079】英日翻訳の処理が選択されなかった場合
(S201でNO)には、日英翻訳の処理が選択された
か否かをメインフレーム2aが判断する(S205)。
日英翻訳の処理が選択された場合(S205でYES)
には、日英翻訳部222は対訳データおよびパーツリン
ク情報等に基づき日英翻訳を行う(S206)。翻訳が
終了すると、オペレータは翻訳結果を印字するか否かを
判断する(S207)。印字するとオペレータが判断し
た場合(S207でYES)には、日英翻訳印書部22
4は翻訳結果をプリンタ2dに出力する。この結果、図
11に示すような書式による印字が行われる。一方、印
字しないとオペレータが判断した場合(S207でN
O)には、印字を行うことなく図15のメインフローチ
ャートに戻る。
【0080】(辞書管理)図18は、図15中の辞書管
理処理(S6)を表すフローチャートである。オペレー
タは、表示部2cに表示されたメニューを見ながら英和
辞書管理、和英辞書管理、英語形態素解析辞書管理、日
本語形態素解析辞書管理、対訳パーツ解析辞書管理、辞
書データベース送受信のいずれかの処理を選択する。オ
ペレータが英和辞書管理の処理を選択した場合(S30
1でYES)には、英和辞書管理部231は英和辞書2
41の登録、表示、削除、検索等を行う(S302)。
英和辞書管理の処理が選択されなかった場合(S301
でNO)には、和英辞書管理の処理が選択されたか否か
をメインフレーム2aが判断する(S303)。そし
て、和英辞書管理の処理が選択された場合(S303で
YES)には、和英辞書管理部232は和英辞書242
の登録、表示、削除、検索等を行う(S304)。
【0081】和英辞書管理の処理が選択されなかった場
合(S303でNO)には、英語形態素解析辞書管理の
処理が選択されたか否かをメインフレーム2aが判断す
る(S305)。英語形態素解析辞書管理の処理が選択
された場合(S305でYES)には、英語形態素解析
辞書管理部233は英語形態素解析辞書243の登録、
表示、削除、検索等を行う(S306)。同様に、日本
語形態素解析辞書管理の処理が選択された場合(S30
7でYES)には、日本語形態素解析辞書管理部234
は日本語形態素解析辞書244の登録、表示、削除、検
索等を行う(S308)。また、対訳パーツ解析辞書管
理の処理が選択された場合(S309でYES)には、
対訳パーツ解析辞書管理部235は対訳パーツ解析辞書
245の登録、表示、削除、検索等の処理を実行する
(S310)。
【0082】辞書データベース送受信処理が選択された
場合(S311でYES)には、辞書データベース送受
信部236は各種辞書および対訳データベースの送受信
を行う(S312)。すなわち、辞書データベース送受
信部236は、図12に示すように英和辞書241、和
英辞書242、英語形態素解析辞書243、日本語形態
素解析辞書244、対訳パーツ解析辞書245、対訳デ
ータベース246上の各種情報を他のワークステーショ
ン12に送信する。これにより、各ワークステーション
の辞書データベースを共有化することが可能となる。
【0083】(対訳データ登録の詳細)図20、図21
は、対訳データ登録(図16のS102)の詳細を表す
フローチャートである。
【0084】対訳データ登録しようとする英文および邦
文が同一ファイルに存在する場合(S401でYES)
には、オペレータは、英文および邦文を有する日英文書
ファイル名を入力する(S402)。メインフレーム2
aは日英文書ファイル251を読み込み(S403)、
対になった英文および邦文を図4に示すように表示部2
cに表示する(S404)。対訳データ登録部211
は、表示された英文中に、英語形態素解析辞書243に
登録されていない単語があるか否かを判断する(S40
5)。同様に、対訳データ登録部211は、表示された
邦文中に、日本語形態素解析辞書244に登録されてい
ない単語があるか否かを判断する(S406)。未登録
の単語が存在する場合(S407でYES)には、未登
録単語を英語未登録語表示欄43、日本語未登録語表示
欄44(図4)に表示する(S408)。
【0085】この後、所定のコマンドを入力し(S40
9)、他の英文および邦文の対訳データ登録を行うか否
かを判断する(S410)。他の英文および邦文の対訳
データ登録を行う場合(S410でYES)には、新た
な英文および邦文を選択し(S422)、S404以降
の処理を実行する。一方、他の英文および邦文に変更す
る必要がない場合(S410でNO)には、さらに表示
中の英文および邦文を対訳データとして登録するか否か
をオペレータが判断する(S411)。対訳データ登録
を行う場合(S411でYES)にはS412以降の処
理を実行し、対訳データ登録を行わない場合(S411
でNO)にはS417以降の処理を実行する。
【0086】S412において、英語および邦文中に未
登録語が存在する場合(S412でYES)には、S4
08に戻り未登録語を表示する。一方、英語および邦文
中に未登録語が存在しない場合(S412でNO)に
は、英文および邦文の固有番号である対訳番号を生成
し、対訳番号を英文および邦文に付加する(S41
3)。そして、対訳データ登録部211は、英文および
邦文の対訳データを検索するためのキーデータを生成し
(S414)、このキーデータとともに英文および邦文
を対訳データとして対訳データベース246に登録する
(S415)。この後、対訳データ登録部211は、日
英文書ファイル251中の他の英文および邦文を用意し
(S418)、表示部2cに表示する(S404)。以
下、S405以降の処理が繰り返される。
【0087】一方、S411において登録を行わない場
合には、英語未登録語表示欄43に表示された英語の未
登録単語を登録するか否かをオペレータが判断する(S
417)。英語の未登録語を登録すると判断した場合
(S417でYES)には、英語の未登録単語を英語形
態素解析辞書243に登録し(S418)、S404に
戻る。登録しないと判断した場合(S417でNO)に
は、さらに日本語の未登録単語を登録するか否かを判断
する(S419)。日本語の未登録語を登録すると判断
した場合(S419でYES)には、日本語の未登録語
を日本語形態素解析辞書244に登録し(S420)、
S404に戻る。登録しないと判断した場合(S419
でNO)には、さらに対訳データ登録の処理を終了する
か否かを判断する(S421)。対訳データ登録の処理
を終了しないと判断した場合(S421でNO)にはS
404以降の処理を実行し、対訳データ登録の処理を終
了すると判断した場合(S421でYES)には、対訳
データ登録の処理は全て終了する。
【0088】S431以降の処理は、対訳データ登録の
対象となる英文および邦文が別ファイルにある場合(S
401でNO)の処理である。オペレータは、英文ファ
イル名および邦文ファイル名を入力部2bからメインフ
レーム2aに入力する(S431、S432)。する
と、メインフレーム2aは、文書ファイル25から英文
ファイル252および邦文ファイル253を読み込む
(S433、S434)。読み込まれた英文ファイル2
52中の英文、および邦文ファイル253中の邦文は表
示部2cに表示される(S435)。
【0089】例えば、図5に示されるように、同一画面
上に英文51「Selectively ・・・ in
section 6.3.1.」と、邦文52「6.
3.1の項の計算方法により、・・・施されているこ
と。」が対となって表示される。このように対になった
英文および邦文をそのまま対訳データ登録するとオペレ
ータが判断した場合(S436でYES)には、S43
7以降の処理を実行する。一方、この対のまま英文およ
び邦文を登録しないとオペレータが判断した場合(S4
36でNO)には、S445以降の処理を実行する。
【0090】S437において、対訳データ登録部21
1は、英文51中に英語形態素解析辞書243に登録さ
れていない単語があるか否かを調べる。同様に、対訳デ
ータ登録部211は、邦文52中に日本語形態素解析辞
書244に登録されていない単語があるか否かを調べる
(S438)。英文51および邦文52に未登録単語が
存在する場合(S439でYES)には、対訳データ登
録部211は表示部2bに未登録単語を表示する(S4
40)。オペレータは、この表示に基づき英語の未登録
語を登録するか否かを判断する(S441)。英語の未
登録語を登録すると判断した場合(S441でYES)
には、英語の未登録語を英語形態素解析辞書243に登
録し(S442)、S435に戻る。登録しないと判断
した場合(S441でNO)には、さらに日本語の未登
録語を登録するか否かをオペレータは判断する(S44
3)。日本語の未登録語を登録すると判断した場合(S
443でYES)には、日本語の未登録語を日本語形態
素解析辞書244に登録し(S444)、S435に戻
る。登録しないと判断した場合(S443でNO)に
は、未登録語の登録を行うことなくS435に戻る。
【0091】S439において、未登録語がないと対訳
データ登録部221が判断した場合には、S457以降
の処理を実行する。すなわち、対訳データ登録部221
は、英文および邦文の固有番号である対訳番号を生成
し、対訳番号を英文および邦文に付加する(S45
7)。そして、対訳データ登録部211は、英文および
邦文の対訳データを検索するためのキーデータを生成し
(S458)、このキーデータとともに英文および邦文
を対訳データとして対訳データベース246に登録する
(S459)。この後、オペレータは表示された他の英
文および邦文を選択し(S460)、S435以降の処
理が実行される。
【0092】S436において、表示された英文および
邦文の対訳を登録しないとオペレータが判断した場合
(S436でNO)には、コマンド53を入力すること
により他の英文を選択する(S445、S446)。同
様に、コマンド53を入力することにより他の邦文を選
択する(S447、S448)。英文および邦文の対を
変更しない場合(S445でNO、S447でNO)に
は、S449以降の処理を実行する。
【0093】S449において、英文51を他の英文に
結合するか否かをオペレータが判断する(S449)。
他の英文に結合する場合(S449でYES)には、英
文51と、英文51に続く英文54とを結合し(S45
0)、S435以降の処理を実行する。英文51を分割
する場合(S451でYES)、指定箇所において英文
51を分割し(S452)、S435以降の処理を実行
する。
【0094】また、邦文についても同様の処理を行う。
すなわち、邦文52と、邦文52に続く邦文55とを結
合するとオペレータが判断した場合(S453でYE
S)には、邦文52と邦文55とを結合し(S45
4)、S435以降の処理を実行する。邦文52を分割
する場合(S455でYES)には、指定箇所において
邦文52を分割し(S456)、S435以降の処理を
実行する。したがって、英文51および邦文52中の所
望の部分同士を対訳登録することもでき、また、複数の
英文と複数の邦文とを結合して対訳登録することも可能
である。英文51、邦文52の結合および分割を行わな
い場合(S449、S451、S453、S455でN
O)には、対訳データ登録の処理が終了する。
【0095】(対訳データ学習の詳細)図22は、対訳
学習(図16のS104)の詳細を表すフローチャート
である。オペレータは、入力部2bを介してメインフレ
ーム2aに対訳文番号を入力する(S501)。この対
訳文番号は、対訳データ登録された文に付加された固有
番号である。例えば、図6に示すように対訳文番号36
46が入力されたとすると、メインフレーム2aは英文
61および邦文62を表示部2cに表示する。
【0096】対訳学習部212は、過去の学習例(対訳
パーツ解析辞書245)に基づき英文61および邦文6
2をパーツ単位で自動的に対応づけ、パーツリンク情報
63を生成する。すなわち、英文61および邦文62中
に、対訳パーツ解析辞書245に登録された対訳パーツ
と同一のパーツが存在する場合には、登録された対訳パ
ーツに基づきパーツリンク情報63を生成する。英文6
1および邦文62中に、対訳パーツ解析辞書245に未
登録のパーツが存在する場合には、英和辞書241およ
び和英辞書242に登録された単語を用いることにより
パーツリンク情報63を生成する(S502)。
【0097】生成されたパーツリンク情報63は表示部
2cに表示される(S503)。パーツリンク情報63
が正しく生成されたとオペレータが判断した場合(S5
04でYES)には、表示欄64において「y]を入力
する。これにより、対訳学習部212は生成されたパー
ツリンク情報63を対訳データベース24内の対訳パー
ツ解析辞書245に自動的に追加登録し(S511)、
対訳学習の処理を終了する。
【0098】一方、パーツリンク情報63が正しく生成
されていないとオペレータが判断した場合(S504で
NO)には、S505以降の処理が実行される。S50
5において、パーツリンクリストを表示するとオペレー
タが判断した場合(S505でYES)には、表示欄6
5において「y]を入力する。これにより、パーツリン
ク情報、英語パーツ情報、日本語パーツ情報のリストが
プリンタ2dから出力される。例えば、英文61および
邦文62中に過去の学習例において対応づけがなされて
いないパーツがあった場合には、パーツリンク情報63
において<<3:with ****>>のような表示が
なされる。オペレータはこの表示を見ることにより、対
応づけがなされていないパーツを把握することが可能と
なる。
【0099】パーツリンクリストを出力しない場合(S
505でNO)においても、英語パーツ情報66および
日本語パーツ情報67は表示部2cに表示される(S5
07、S508)。オペレータは、これらの表示もしく
はプリントアウトされたリストを見ながら修正事項を把
握し、英語パーツと日本語パーツとをどのように対応づ
けるかを対訳学習部212に指示する(S509)。図
6の表示例においては、[3:with]、[13:mea
sured 14:as]の対応づけがなされていない。
したがって、オペレータは[3:with]のパーツの順
序番号「3」を入力し、このパーツに対応する[16:厚
さ 17:で]のパーツの順序番号「16、17」を入力
する(符号68)。同様に、[13:measured 1
4:as]のパーツの順序番号「13、14」を入力し、
このパーツに対応する[3:計測 4:方法 5:により]の
順序番号「3、4、5」を入力する(符号69)。
【0100】このようにして、パーツリンク情報63の
修正が終了するまで(S510でYES)、S509の
処理を繰り返し実行する。表示されたパーツリンク情報
63の修正が終了した後、S503以降の処理を繰り返
すことにより修正後のパーツリンク情報の表示、登録等
の処理を行う。
【0101】(英日翻訳の詳細)図23は、英日翻訳
(図17のS202)の詳細を表すフローチャートであ
る。オペレータは、入力部2bを介してメインフレーム
2aに翻訳対象となる英文ファイル名を入力する(S6
01)。メインフレーム2aは英文ファイルを内部メモ
リの作業領域に読み込み(S602)、読み込んだ英文
ファイルを表示部2cに表示する(S603)。
【0102】オペレータは、コマンドをメインフレーム
2aに入力し(S604)、一文毎の翻訳あるいは一括
翻訳のいずれを行うかを英日翻訳部221に指示する。
原文を一文毎に翻訳する場合(S605でYES)に
は、S606の処理により一文の翻訳を行った後、S6
04以降の処理を繰り返す。
【0103】一方、原文を一括して翻訳する場合には
(S607でYES)には、オペレータは、翻訳を開始
する文番号(翻訳開始文番号)と翻訳を終了する文番号
(翻訳終了文番号)とを英日翻訳部221に指示する
(S608)。英日翻訳部221は、先ず翻訳開始文番
号の一文を日本語に翻訳する(S609)。そして、英
日翻訳部221は翻訳終了文番号の英文の翻訳が終了し
たか否かを判断し(S610)、終了した場合(S61
0でYES)には、S604以降の処理を繰り返し実行
する。翻訳終了文番号の英文の翻訳が終了していない場
合(S610でNO)には、第2文の英文を表示し(S
611)、S609以降の処理を繰り返し実行する。こ
のようにして、翻訳開始文番号から翻訳終了文番号まで
の複数の英文を一括して邦文に翻訳することができる。
【0104】S607において、一括翻訳を行わないと
オペレータが判断した場合(S607)には、翻訳結果
を印字するか否かを判断する(S612)。翻訳結果を
印字する場合(S612でYES)には、オペレータ
は、印字開始文番号と印字終了文番号とを英日翻訳印書
部223に指示する。英日翻訳印書部223は印字開始
文番号の第1文の対訳(英文および邦文)をプリンタ2
dに出力し、プリンタ2dは第1文の対訳を所定の書式
で印字する(S614)。英日翻訳印書部223は、印
字終了文番号の対訳の印字が終了するまで(S615で
YES)、印字を続ける。印字終了文番号の対訳の印字
が終了すると(S615でYES)、S604以降の処
理を繰り返し実行する。
【0105】S612において、印字を行わないとオペ
レータが判断した場合(S612でNO)には、訳文を
ファイルに出力するか否かを判断する(S617)。訳
文をファイルに出力するとオペレータが判断した場合
(S617でYES)には、訳文をファイルに出力し、
図17のフローチャートに戻る。
【0106】図24は、上述したS606、S609の
一文翻訳の処理を表すフローチャートである。先ず、英
日翻訳部221は、翻訳対象として与えられた原文のキ
ーデータを生成する(S651)。キーデータは対訳デ
ータベース246検索用のデータである。英日翻訳部2
21は、このキーデータに従い対訳データベース246
上の対訳データのうち、原文に最も類似した英文を有す
る対訳データを検索し(S652)、この対訳データを
読み込む(S653)。
【0107】例えば、図13に示されるように、[Wh
en I fell into the river
he came to my aid.]という原文1
31が与えられたとする。英日翻訳部221は、対訳デ
ータベース246の中から原文131に最も類似した英
文を備えた対訳データ132を検索する。すなわち、英
文[When it came to voting,
he abstained]を備えた対訳データ132
が検索される。
【0108】英日翻訳部221は、対訳データ132の
パーツのうち、原文131のパーツと一致するものを調
べる。すなわち、対訳データ132のパーツのうち、原
文131の翻訳に使用可能なパーツが存在するか否かを
判断する(S654)。判断の結果、使用可能なパーツ
が対訳データ132中に存在する場合(S654でYE
S)には、このパーツを内部メモリ上の作業領域の取り
込む(S655)。対訳データ132のパーツのうち、
使用可能なパーツは[When][he]の2つのパー
ツである。
【0109】次に、英日翻訳部221は、原文131中
の全てのパーツが揃ったか否かを判断する(S65
7)。このとき、原文131のパーツのうち、[I f
ellinto my river]および[came
to my aid]のパーツが揃っていない(訳が
なされていない)ため(S657でNO)、英日翻訳部
221は、原文131に2番目に類似した英文を有する
対訳データ133を対訳データベース246から読み出
す(S658)。対訳データ133のパーツリンク情報
のうち、[came][to my aid]の2つの
パーツが原文131のパーツと一致している(S65
4)。したがって、英日翻訳部221はこれらの2つの
パーツを作業領域に取り込み(S655)、さらに原文
131のパーツが揃ったか否かを判断する(S65
7)。このとき、原文131のパーツのうち[I fe
ll into my aid]のパーツが揃っていな
いため(S657でNO)、英日翻訳部221は、原文
131に3番目に類似した英文を有する対訳データ13
4を読み込む(S658)。
【0110】対訳データ134(図15)のパーツリン
ク情報のうち、[I]のみが原文131のパーツに一致
し、原文131の[fell into my ai
d]のパーツは未だ一致したものが検索されていない。
さらに、英日翻訳部221は、原文131に4番目に類
似した英文を有する対訳データ135を読み込み、使用
可能なパーツを探す。この結果、原文131の全てのパ
ーツが揃い、原文131の英文の各パーツに対応した日
本語の各パーツ136が生成される。英日翻訳部221
は、日本語のパーツ136を並べ変え、訳文137を生
成および表示する(S659、S660)。
【0111】一方、S654において、読み込まれた対
訳データについてのパーツリンク情報中に使用可能なパ
ーツが存在せず(S654でNO)、かつ、原文131
に類似した英文を有する対訳データが存在しない場合
(S656でYES)には、英和辞書241に基づき和
訳を行う(S661)。すなわち、英日翻訳部221
は、原文131のパーツのうち、対訳が検索されていな
いパーツ(単語)の和訳を英和辞書241から読み込
み、原文131の訳文を完成する。以上の処理により、
原文131の訳文が完成すると、図23のフローチャー
トに戻る。
【0112】(日英翻訳の詳細)図25は、日英翻訳
(図17のS206)の詳細を表すフローチャートであ
る。このフローチャートに示された日英翻訳の処理は、
図23のフローチャートに示された英日翻訳の処理と略
同様である。
【0113】すなわち、オペレータは、入力部2bを介
してメインフレーム2aに翻訳対象となる邦文ファイル
名を入力する(S701)。メインフレーム2aは邦文
ファイルを内部メモリの作業領域に読み込み(S70
2)、読み込んだ邦文ファイルを表示部2cに表示する
(S703)。
【0114】オペレータは、コマンドをメインフレーム
2aに入力し(S704)、一文毎の翻訳あるいは一括
翻訳のいずれを行うかを日英翻訳部222に指示する。
原文を一文毎に翻訳する場合(S705でYES)に
は、S706の処理により一文の翻訳を行った後、S7
04以降の処理を繰り返す。
【0115】一方、原文を一括して翻訳する場合には
(S707でYES)には、オペレータは、翻訳を開始
する文番号(翻訳開始文番号)と翻訳を終了する文番号
(翻訳終了文番号)とを日英翻訳部222に指示する
(S708)。日英翻訳部222は、先ず翻訳開始文番
号の一文を英語に翻訳する(S709)。そして、日英
翻訳部222は翻訳終了文番号の邦文の翻訳が終了した
か否かを判断し(S710)、終了した場合(S710
でYES)には、S704以降の処理を繰り返し実行す
る。翻訳終了文番号の邦文の翻訳が終了していない場合
(S710でNO)には、第2文の邦文を表示し(S7
11)、S709以降の処理を繰り返し実行する。この
ようにして、翻訳開始文番号から翻訳終了文番号までの
複数の邦文を一括して英文に翻訳することができる。
【0116】S707において、一括翻訳を行わないと
オペレータが判断した場合(S707)には、翻訳結果
を印字するか否かを判断する(S712)。翻訳結果を
印字する場合(S712でYES)には、オペレータ
は、印字開始文番号と印字終了文番号とを日英翻訳印書
部224に指示する。日英翻訳印書部224は印字開始
文番号の第1文の対訳(英文および邦文)をプリンタ2
dに出力し、プリンタ2dは第1文の対訳を所定の書式
で印字する(S714)。日英翻訳印書部224は、印
字終了文番号の対訳の印字が終了するまで(S715で
YES)、印字を続ける。印字終了文番号の対訳の印字
が終了すると(S715でYES)、S704以降の処
理を繰り返し実行する。
【0117】S712において、印字を行わないとオペ
レータが判断した場合(S712でNO)には、訳文を
ファイルに出力するか否かを判断する(S717)。訳
文をファイルに出力するとオペレータが判断した場合
(S717でYES)には、訳文をファイルに出力し、
図17のフローチャートに戻る。
【0118】図26は、上述したS706、S709の
一文翻訳の処理を表すフローチャートである。この処理
は、上述した図24の処理と略同様のものである。すな
わち、先ず、日英翻訳部222は、翻訳対象として与え
られた原文のキーデータを生成する(S751)。日英
翻訳部222は、このキーデータに従い対訳データベー
ス246上の対訳データのうち、原文に最も類似した邦
文を有する対訳データを検索し(S752)、この対訳
データを読み込む(S753)。
【0119】例えば、図7に示されるように、[ボンデ
ィング部分に・・・・施されていること]という原文7
1が与えられたとする。日英翻訳部222は、対訳デー
タベース246の中から、原文71に最も類似した邦文
を備えた対訳データ73を検索する。日英翻訳部222
は、対訳データ73のパーツのうち、原文71のパーツ
と一致するものを調べる。すなわち、対訳データ73の
パーツのうち、原文71の翻訳に使用可能なパーツが存
在するか否かを判断する(S754)。使用可能なパー
ツが対訳データ73中に存在する場合(S754でYE
S)には、このパーツを内部メモリ上の作業領域の取り
込む(S755)。なお、使用不可能なパーツ[15
0][計測方法により][項の][6.3.1の]につ
いては、使用不可能を示すマーク<****>が内部的
に付与される。
【0120】この例では、対訳データ73を構成するパ
ーツで原文71のパーツを全て満たすことができるの
で、その結果を翻訳結果として出力する。仮に、原文7
1のパーツが揃っていない場合(S757でNO)に
は、日英翻訳部222は、原文71に2番目に類似した
邦文を有する対訳データを対訳データベース246から
読み出す(S758)。そして、日英翻訳部222は、
S754以降の処理を繰り返し実行し、対訳データの中
から使用可能なパーツを探し出す。対訳データベース2
46から、原文71に類似した対訳データを検索し尽く
した場合(S756でYES)には、和英辞書242に
基づき和訳を行う(S761)。和英辞書242から検
索された単語の人称、時制等は、原文71に合わせられ
る(S762)。このようにして検索されたパーツ(単
語)は、所定の順序に並べ変えられ、原文71の訳文7
6が完成する。完成した訳文76は表示部2cに表示さ
れる(S760)。以上の処理が終了すると、図25の
処理に戻る。
【0121】(辞書データベース送受信の詳細)図27
〜図30は、辞書データベース24の送受信の処理(図
18のS312)の詳細を表すフローチャートである。
【0122】図27のフローチャートにおいて、オペレ
ータは表示部2cに表示されたメニューを見ながら辞書
データベースの送信あるいは受信のいずれを行うかを選
択する。送信処理が選択された場合(S801でYE
S)には、辞書データベース送受信部236はS803
以降の処理を実行し、受信処理が選択された場合(S8
02でYES)には辞書データベース送受信部236は
S901(図29)以降の処理を実行する。
【0123】辞書データベースの送信処理 オペレータが送信処理を選択した場合(S801でYE
S)には、さらに図19に示す辞書データベース送信メ
インメニューの中から所望の処理を選択する。オペレー
タが英和辞書の送信処理を選択した場合(S803でY
ES)には、辞書データベース送受信部236は英和辞
書241から英和辞書データを1件分取り出す(S80
4)。そして、辞書データベース送受信部236は、取
り出したデータを送信用ファイルに書き込む(S80
5)。このようにして、英和辞書241からの全ての辞
書データの読み込みが終了するまで(S806でYE
S)、S804〜S805の処理を繰り返し実行する。
全ての辞書データの読み込みが終了すると(S806で
YES)、辞書データベース送受信部236は送信用フ
ァイル内の辞書データを通信系2eを介して他のワーク
ステーションに送信する。以上により、英和辞書データ
の送信処理が終了し、図18のフローチャートに戻る。
【0124】オペレータが和英辞書の送信処理を選択し
た場合(S810でYES)には、辞書データベース送
受信部236は和英辞書242から和英辞書データを1
件分取り出す(S811)。そして、辞書データベース
送受信部236は、取り出したデータを送信用ファイル
に書き込む(S812)。このようにして、和英辞書2
42からの全ての辞書データの読み込みが終了するまで
(S813でYES)、S811〜S812の処理を繰
り返し実行する。全ての辞書データの読み込みが終了す
ると(S813でYES)、辞書データベース送受信部
236は送信用ファイル内の辞書データを通信系2eを
介して他のワークステーションに送信する。以上によ
り、和英辞書データの送信処理が終了し、図18のフロ
ーチャートに戻る。
【0125】オペレータが英語形態素解析辞書の送信処
理を選択した場合(図28のS821でYES)には、
辞書データベース送受信部236は英語形態素解析辞書
243内のデータを送信用ファイルに取り込む(S82
2〜S824)。そして、辞書データベース送受信部2
36は送信用ファイル内の辞書データを他のワークステ
ーションに送信し、図18のフローチャートに戻る。以
下、同様に日本語形態素解析辞書244、対訳パーツ解
析辞書245、対訳データベース246の送信処理が実
行される。すなわち、日本語形態素解析辞書244の送
信を行う場合には辞書データベース送受信部236はS
826〜S830の処理を実行し、対訳パーツ解析辞書
245の送信を行う場合にはS831〜S835の処理
を実行する。また、対訳データベース246の送信を行
う場合には辞書データベース送受信部236はS836
〜S840の処理を実行する。以上により、辞書データ
ベース24の各種データを他のワークステーションに送
信することが可能となる。
【0126】辞書データベースの受信処理 オペレータが受信処理を選択した場合(S802でYE
S)には、辞書データベース受信メインメニューの中か
ら所望の処理を選択する。オペレータが英和辞書の受信
処理を選択したとする(S901でYES)。この後、
他のワークステーションから辞書データが通信系2eを
介して当該ワークステーションに送信され、辞書データ
が英和辞書受信ファイルに蓄えられる。辞書データベー
ス送受信部236は英和辞書受信ファイルから1件分の
辞書データを取り出し(S902)、取り出した辞書デ
ータと同一のものが英和辞書241に存在するか否かを
判断する(S903)。同一の辞書データが英和辞書2
41に存在しない場合(S903でNO)には、辞書デ
ータベース送受信部236はこの辞書データを英和辞書
241に追加する。一方、同一の辞書データが英和辞書
241に存在する場合(S903でYES)には、辞書
データベース送受信部236は辞書データの追加(S9
04)を行うことなく、S905の処理を実行する。
【0127】S905において、辞書データベース送受
信部236は英和辞書受信ファイル中に辞書データが残
っているか否かを判断し、辞書データが残っている場合
(S905でNO)には、S902〜S904の処理を
繰り返す。そして、英和辞書受信ファイル中の辞書デー
タを全て取り出した場合(S905でYES)には、図
27のフローチャートを介して図18のフローチャート
に戻る。
【0128】以下、同様に和英辞書242、英語形態素
解析辞書243、日本語形態素解析辞書244、対訳パ
ーツ解析辞書245の受信処理が実行される。すなわ
ち、和英辞書242の受信を行う場合にはS906〜S
910の処理を実行し、英語形態素解析辞書243の受
信を行う場合にはS911〜S915の処理を実行す
る。また、対訳パーツ解析辞書245の受信を行う場合
にはS916〜S920の処理を実行し、日本語形態素
解析辞書244の受信を行う場合にはS921〜S92
5の処理を実行する。
【0129】対訳データベースの受信を行う場合(S9
26でYES)には、S927〜S931の処理を実行
する。先ず、他のワークステーションから対訳データ等
が通信系2eを介して当該ワークステーションに送信さ
れ、これらのデータが対訳データベース受信ファイルに
蓄えられたとする。辞書データベース送受信部236は
対訳データベース受信ファイルから1件分のデータを取
り出し(S927)、取り出したデータと同一のものが
対訳データベース246に存在するか否かを判断する
(S928)。同一のデータが対訳データベース246
に存在しない場合(S928でNO)には、辞書データ
ベース送受信部236はこのデータの対訳文番号を生成
する(S929)。そして、辞書データベース送受信部
236は受信したデータを対訳文番号とともに対訳デー
タベース246に追加する(S930)。
【0130】一方、同一のデータが対訳データベース2
46に存在する場合(S928でYES)には、辞書デ
ータベース送受信部236はデータの追加(S929、
S930)を行うことなく、S931の処理を実行す
る。S931においては、辞書データベース送受信部2
36は対訳データベース受信ファイル中にデータが残っ
ているか否かを判断し、データが残っている場合(S9
31でNO)には、S927〜S930の処理を繰り返
す。そして、対訳データベース受信ファイル中のデータ
を全て取り出した場合(S931でYES)には、図2
7のフローチャートを介して図18のフローチャートに
戻る。
【0131】以上の処理により、他のワークステーショ
ンにおいて登録された辞書および学習登録された対訳デ
ータ等を受信し、辞書データベース24上に追加するこ
とが可能となる。これにより、複数のワークステーショ
ン間において辞書データベースを共有化することが可能
となる。
【0132】なお、本発明は、上述した実施例に限定さ
れることなく、本発明の趣旨を逸脱しない範囲において
実施可能である。例えば、対訳データベースの検索を行
うために、並列処理型のプロセッサ等を用いてもよい。
これにより、短時間で検索を行うことができ、翻訳速度
を大幅に向上させることが可能となる。また、翻訳例を
OCR(光学的読み取り装置)を用いて読み取ることに
より、大量の翻訳例を効率よく入力することができる。
【0133】
【発明の効果】以上説明してきたように、本発明によれ
ば、以下の効果を得ることが可能である。
【0134】第1に、オペレータによって翻訳能力を向
上させることが可能である。すなわち、対訳データ登録
および対訳学習(パーツリンク情報生成)を行うことに
より、翻訳例を学習させることができる。したがって、
ユーザが所望の翻訳例を機械翻訳システムに学習させる
ことにより、ユーザ自身によって機械翻訳システムの翻
訳能力を向上させることが可能である。また、過去の学
習例(対訳パーツ)に基づき自動的に学習登録を行うこ
とができるため、学習登録におけるオペレータの作業負
担を軽減することができる。
【0135】第2に、本発明によれば、文法規則を追加
せずに翻訳品質を向上させることができるため、追加さ
れた文法規則同士が干渉し合うことによる翻訳品質の低
下を回避することが可能となる。
【0136】第3に、自然な翻訳を行うことが可能とな
る。すなわち、本発明によれば、文法規則によらずに過
去の翻訳例に基づき翻訳例を行っているため、文法規則
から離れた慣用的な表現等に対して自然な訳を出力する
ことが可能である。また、本発明にあっては、一般のE
BMT方式による機械翻訳システムと異なり、原文と、
原文に類似した翻訳例とをパーツ毎に比較しながら原文
の各パーツの訳を行っている。これにより、原文の各パ
ーツを文法規則によらずに、翻訳することができ、より
自然な訳を出力することが可能となる。
【図面の簡単な説明】
【図1】本発明の機械翻訳システムの機能ブロック図で
ある。
【図2】本発明の一実施例に係る機械翻訳システムの概
要を表す図である。
【図3】本発明の一実施例に係る機械翻訳システムの機
能ブロック図である。
【図4】本発明の一実施例に係る対訳登録時の表示画面
を表す図である。
【図5】本発明の一実施例に係る対訳登録時の表示画面
を表す図である。
【図6】本発明の一実施例に係る対訳学習時の表示画面
を表す図である。
【図7】本発明の一実施例に係る翻訳処理の概要を表す
図である。
【図8】本発明の一実施例に係る対訳の一例を表す図で
ある。
【図9】本発明の一実施例に係る単語リンク情報等の一
例を表す図である。
【図10】本発明の一実施例に係る英日翻訳例を表す図
である。
【図11】本発明の一実施例に係る日英翻訳例を表す図
である。
【図12】本発明の一実施例に係る辞書データベースの
送受信の概念図である。
【図13】本発明の一実施例に係る翻訳処理の概要を表
す図である。
【図14】本発明の一実施例に係る翻訳処理の概要を表
す図である。
【図15】本発明の一実施例に係る機械翻訳システムの
作用を表すメインフローチャートである。
【図16】本発明の一実施例に係る対訳学習登録の処理
を表すメインフローチャートである。
【図17】本発明の一実施例に係る翻訳の処理を表すメ
インフローチャートである。
【図18】本発明の一実施例に係る辞書管理の処理を表
すメインフローチャートである。
【図19】本発明の一実施例に係る辞書データベース送
信メインメニューの表示例である。
【図20】本発明の一実施例に係る対訳データ登録の処
理の詳細を表すフローチャートである。
【図21】本発明の一実施例に係る対訳データ登録の処
理の詳細を表すフローチャートである。
【図22】本発明の一実施例に係る対訳学習の処理の詳
細を表すフローチャートである。
【図23】本発明の一実施例に係る英日翻訳の処理の詳
細を表すフローチャートである。
【図24】本発明の一実施例に係る英日翻訳の処理の詳
細を表すフローチャートである。
【図25】本発明の一実施例に係る日英翻訳の処理の詳
細を表すフローチャートである。
【図26】本発明の一実施例に係る日英翻訳の処理の詳
細を表すフローチャートである。
【図27】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
【図28】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
【図29】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
【図30】本発明の一実施例に係る辞書データベース送
受信の処理の詳細を表すフローチャートである。
【図31】従来の構文変換方式の機械翻訳システムの処
理の概要を説明するための図である。
【図32】従来のEBMT方式の機械翻訳システムの処
理の概要を説明するための図である。
【符号の説明】
2b 入力手段(対話入力手段) 2c 表示手段 21 対訳データ登録手段 22 翻訳手段 24 辞書データベース 212 対訳学習部(パーツリンク情報生成手段、登録
部) 215 データベース管理部(入力手段) 241 英和辞書(単語辞書) 242 和英辞書(単語辞書) 245 対訳パーツ解析辞書

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 第1言語で表された原文字列を、対訳デ
    ータベースに基づき第2言語に翻訳する翻訳手段を備え
    た機械翻訳システムにおいて、 第1言語文字列、および、当該第1言語文字列を第2言
    語に訳した第2言語文字列を入力する入力手段と、 第1言語文字列を構成する第1言語パーツ、および、第
    2言語文字列を構成する第2言語パーツの対応付けを示
    すパーツリンク情報を生成するパーツリンク情報生成手
    段と、 生成されたパーツリンク情報を、第1言語文字列および
    第2言語文字列に対応付けながら上記対訳データベース
    に登録する登録手段とを備えたことを特徴とする機械翻
    訳システム。
  2. 【請求項2】 上記パーツリンク情報生成手段は、過去
    に生成された他のパーツリンク情報に基づき、第1言語
    文字列を構成する第1言語パーツ、および、第2言語文
    字列を構成する第2言語パーツを対応付けることによ
    り、新たなパーツリンク情報を生成することを特徴とす
    る請求項1記載の機械翻訳システム。
  3. 【請求項3】 第1言語で表された原文字列を、対訳デ
    ータベースに基づき第2言語に翻訳する翻訳手段を備え
    た機械翻訳システムにおいて、 第1言語で表された第1言語文字列、および、当該第1
    言語文字列を第2言語に訳した第2言語文字列を入力す
    る入力手段と、 第1言語パーツ、および、当該第1言語パーツを第2言
    語に訳した第2言語パーツが登録された対訳パーツ解析
    辞書と、 対訳パーツ解析辞書に基づき、第1言語文字列を構成す
    る第1言語パーツ、および、第2言語文字列を構成する
    第2言語パーツの対応付けを示すパーツリンク情報を生
    成するパーツリンク情報生成手段と、 生成されたパーツリンク情報を、第1言語文字列および
    第2言語文字列に対応付けながら上記対訳データベース
    に登録する登録手段とを備えたことを特徴とする機械翻
    訳システム。
  4. 【請求項4】 第1言語で表された原文字列を、対訳デ
    ータベースに基づき第2言語に翻訳する翻訳手段を備え
    た機械翻訳システムにおいて、 第1言語文字列、および、当該第1言語文字列を第2言
    語に訳した第2言語文字列を入力する入力手段と、 第1言語パーツ、および、当該第1言語パーツを第2言
    語に訳した第2言語パーツが登録された対訳パーツ解析
    辞書と、 第1言語で表された単語、および、当該単語の第2言語
    の訳が登録された単語辞書と、 第1言語文字列および第2言語文字列中に、対訳パーツ
    解析辞書に登録済みの第1言語パーツおよび第2言語パ
    ーツが存在する場合には、対訳パーツ解析辞書に基づ
    き、第1言語文字列を構成する第1言語パーツ、およ
    び、第2言語文字列を構成する第2言語パーツの対応付
    けを行い、 第1言語文字列および第2言語文字列中に、対訳パーツ
    解析辞書に未登録の第1言語パーツおよび第2言語パー
    ツが存在する場合には、単語辞書に基づき、第1言語文
    字列を構成する第1言語パーツ、および、第2言語文字
    列を構成する第2言語パーツの対応付けを行うことによ
    り、パーツリンク情報を生成するパーツリンク情報生成
    手段と、 生成されたパーツリンク情報を、第1言語文字列および
    第2言語文字列に対応付けながら上記対訳データベース
    に登録する登録手段とを備えたことを特徴とする機械翻
    訳システム。
  5. 【請求項5】 第1言語文字列および第2言語文字列中
    に、対訳パーツ解析辞書および単語辞書の双方に未登録
    の第1言語パーツおよび第2言語パーツが存在する場合
    に、当該第1言語パーツおよび第2言語パーツが未登録
    である旨を表示する表示手段を備えたことを特徴とする
    請求項4記載の機械翻訳システム。
  6. 【請求項6】 第1言語文字列および第2言語文字列中
    に、対訳パーツ解析辞書および単語辞書の双方に未登録
    の第1言語パーツおよび第2言語パーツが存在する場合
    に、当該第1言語パーツおよび第2言語パーツの対応付
    けを指示する対話入力手段を備え、 対応付けが指示された第1言語パーツおよび第2言語パ
    ーツを対訳パーツ解析辞書に登録することを特徴とする
    請求項4または請求項5のいずれかに記載の機械翻訳シ
    ステム。
JP6070136A 1994-03-15 1994-03-15 機械翻訳システム Pending JPH07253982A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP6070136A JPH07253982A (ja) 1994-03-15 1994-03-15 機械翻訳システム
US08/403,958 US5659765A (en) 1994-03-15 1995-03-14 Machine translation system
EP95301677A EP0672989A3 (en) 1994-03-15 1995-03-14 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6070136A JPH07253982A (ja) 1994-03-15 1994-03-15 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH07253982A true JPH07253982A (ja) 1995-10-03

Family

ID=13422860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6070136A Pending JPH07253982A (ja) 1994-03-15 1994-03-15 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH07253982A (ja)

Similar Documents

Publication Publication Date Title
US5659765A (en) Machine translation system
JP3960562B2 (ja) 機械翻訳の学習方法
US5675815A (en) Language conversion system and text creating system using such
EP0247395B1 (en) Machine translation system
EP0230339A2 (en) Machine translation system
GB2175718A (en) A translating apparatus
JPH02140868A (ja) 機械翻訳システム
ITUD20000228A1 (it) Sistema e metodo di traduzione automatica o semiautomatica con posteditazione per la correzione degli errori
JP3657338B2 (ja) 翻訳装置
Chang et al. A corpus-based statistics-oriented transfer and generation model for machine translation
KR900008402B1 (ko) 기계번역장치
JPH07253982A (ja) 機械翻訳システム
JPH0332106B2 (ja)
JPH07253983A (ja) 機械翻訳システム
JPH07253984A (ja) 機械翻訳システム
JPH07253981A (ja) 機械翻訳システム
Ranta Explainable machine translation with interlingual trees as certificates
JP3982726B2 (ja) 翻訳知識学習装置及び機械翻訳装置
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JP3305953B2 (ja) 翻訳パターン作成方法および装置
JPS6180360A (ja) 翻訳方式
JPH0410665B2 (ja)
JP2938897B2 (ja) 文書作成処理装置
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JPS63136265A (ja) 機械翻訳装置