JPH07200602A - Machine translation device - Google Patents

Machine translation device

Info

Publication number
JPH07200602A
JPH07200602A JP5349525A JP34952593A JPH07200602A JP H07200602 A JPH07200602 A JP H07200602A JP 5349525 A JP5349525 A JP 5349525A JP 34952593 A JP34952593 A JP 34952593A JP H07200602 A JPH07200602 A JP H07200602A
Authority
JP
Japan
Prior art keywords
translation
sentence
natural language
translated
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5349525A
Other languages
Japanese (ja)
Inventor
Miwako Shimazu
美和子 島津
Satoshi Kinoshita
聡 木下
Hideki Hirakawa
秀樹 平川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5349525A priority Critical patent/JPH07200602A/en
Publication of JPH07200602A publication Critical patent/JPH07200602A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】自然言語の文に対する翻訳結果の確信度を算出
し、この値により後編集の対象となる訳文の提示順序を
制御して後編集作業を効率化する機械翻訳装置を提供す
ること。 【構成】第1の自然言語の文章を異なる別の自然言語の
文章に翻訳する機械翻訳装置において、翻訳処理を行う
ために利用する知識を記憶した翻訳辞書 105と、入力さ
れた第1の自然言語の文章を前記翻訳辞書を利用して前
記別の自然言語に翻訳すると共に、その翻訳結果に対す
る確信度を求める翻訳処理手段 104と、翻訳結果に対す
る確信度の低い順もしくは高い順に、前記翻訳された自
然言語とその元の文章である第1の自然言語の文章の各
対を並べ換え手段 103と、この並べ換えられた文章の対
を後編集時に順に表示する表示手段 106とを具備する。
(57) [Summary] [Purpose] A machine translation device that calculates the certainty factor of a translation result for a natural language sentence and controls the presentation order of translated sentences to be post-edited by this value to make post-editing work more efficient. To provide. [Structure] In a machine translation device for translating a first natural language sentence into another different natural language sentence, a translation dictionary 105 storing knowledge used for performing a translation process, and a first natural language input. A translation processing unit 104 for translating a sentence of a language into the other natural language using the translation dictionary and obtaining a certainty factor for the translation result, and the translation process in order of low or high confidence factor for the translation result. Further, there is provided a rearrangement means 103 for each pair of the natural language and the first natural language sentence which is the original sentence thereof, and a display means 106 for sequentially displaying the rearranged sentence pairs at the time of post-editing.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、自然言語処理技術に関
わり、特に複数の言語を扱う文書を解析の対象とする機
械翻訳装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a natural language processing technique and, more particularly, to a machine translation device for analyzing a document handling a plurality of languages.

【0002】[0002]

【従来の技術】近年、多くの機械翻訳システムが開発さ
れ、利用されている。しかし、いかなる機械翻訳システ
ムも、現状においては常に正しい翻訳ができると云うわ
けではなく、利用者は、後編集により翻訳結果を修正す
る作業を強いられる。その際、明らかに翻訳が失敗して
いる場合を除き、機械翻訳システムの出力が正しいの
か、間違っているかは、原文と訳文の双方を読み比べな
ければ分からないため、後編集に時間がかかると云う問
題があった。
2. Description of the Related Art In recent years, many machine translation systems have been developed and used. However, it cannot be said that any machine translation system can always perform a correct translation under the present circumstances, and the user is forced to correct the translation result by post-editing. At that time, unless the translation fails obviously, it is not possible to know whether the output of the machine translation system is correct or incorrect without reading and comparing both the original sentence and the translated sentence, so it is said that post-editing will take time. There was a problem.

【0003】この問題を解決するには、翻訳結果がどの
程度正しいかを、結果と共に利用者に提示するシステム
が必要となる。
To solve this problem, it is necessary to provide a system that presents to the user how accurate the translation result is together with the result.

【0004】文献「Kwangseob ,Shim and Yung Taek K
im “ Towards a MachineTranslation System with Se
lf-Critiquing Capability,” Proceedings ofthe Fift
h International Conference on Theoretical and Meth
odologicalIssues in Machine Translation , July 1
4-16, 1993, pp. 276-299」では、機械翻訳の訳文の確
信度を自己判定して、それを提示する必要性を説いてい
る。
Reference “Kwangseob, Shim and Yung Taek K
im “Towards a MachineTranslation System with Se
lf-Critiquing Capability, ”Proceedings of the Fift
h International Conference on Theoretical and Meth
odologicalIssues in Machine Translation, July 1
4-16, 1993, pp. 276-299 ”explains the necessity of self-determining the certainty factor of machine translation and presenting it.

【0005】しかし、この文献で示されている機械翻訳
の訳文の確信度に対する自己判定の実験では構造的に曖
昧な英語の“to不定詞”の係り先の決定、と云うごく限
られた現象しか扱っておらず、訳文の妥当性ではない。
つまり、機械翻訳は通常、解析(形態素、構文)、変換
(構造、語彙)、生成と云う複数の過程からなってお
り、それぞれが訳文の品質に関わっているのであるか
ら、厳密にはこれらの過程全てを考慮する必要がある
が、そこまでは触れてはおらず、従って、本来最も重要
である訳文の妥当性を判定してその確信度を示すもので
はない。
However, in the experiment of self-judgment with respect to the certainty factor of the translated text of machine translation shown in this document, structurally ambiguous English "to infinitive" is a very limited phenomenon called the determination of the contact destination. It only deals with it, not the validity of the translated text.
In other words, machine translation usually consists of multiple processes such as analysis (morpheme, syntax), conversion (structure, vocabulary), and generation, and each of them is related to the quality of the translated text. It is necessary to consider all the processes, but this is not touched upon, so it is not intended to judge the validity of the most important translated sentence and show its certainty.

【0006】また、上記文献の筆者らの手法は、訳文に
対する確信度の数値を算出するにとどまっており、せい
ぜい訳文毎に確信度の数値を示す程度のことしか行えな
い。そして、翻訳結果の当該確信度の数値は、原文書の
順番に従って提示されていた。そのため、後編集の作業
者はそれぞれの訳文に対する確信度を知ることができる
のみで、得られた確信度の数値の他への応用は全くでき
ず、編集作業の効率化にはあまり繋がらなかった。
Further, the authors' method of the above-mentioned document is limited to the calculation of the numerical value of the certainty factor for the translated text, and at the most, it can only show the numerical value of the certainty factor for each translated text. Then, the numerical value of the certainty factor of the translation result is presented in the order of the original document. Therefore, the post-editing worker can only know the certainty factor for each translated sentence, and cannot apply the obtained certainty factor to any other value, which does not lead to efficient editing work. .

【0007】例えば、全く同じ原文が原文書に繰り返し
出てくることがある。この場合、同一原文に対する一括
処理が可能な機械翻訳システムであれば、これを利用す
ることで後編集は簡単に済む筈であるが、上記文献の手
法は同一原文であるか否かのチェック機能はないので、
全く同じ内容の原文が後から繰り返し出てきた場合に
も、後編集の際にはその訳文が繰り返し表示されてい
た。このため、作業者は、同じ修正作業を何度も行う必
要があった。訳文のチェックは本来一度で良い筈である
が、このように後編集の際にも繰り返し表示されていた
ことから、作業者は、同じ修正作業を何度も行う必要が
あった。
For example, the exact same original sentence may appear repeatedly in the original document. In this case, if it is a machine translation system capable of batch processing of the same original sentence, post-editing should be easy by using this, but the method of the above document has a check function for checking whether the same original sentence is included or not. Because there is no
Even if the original text with exactly the same content repeatedly appeared, the translated text was repeatedly displayed during post-editing. Therefore, the worker has to perform the same correction work many times. Originally, the translation should be checked only once, but since it was repeatedly displayed during post-editing as described above, the operator had to perform the same correction work many times.

【0008】特に翻訳の対象がマニュアルである場合に
は随所に同じ文を用いているので、その傾向が強かっ
た。非常に類似した文についても同じようなことが云え
る。例えば、文型は同一で、動詞も同じであり、目的
語、主語などの名詞句のみが異なっている場合がそうで
ある。
Especially when the translation target is a manual, the same sentence is used everywhere, so that tendency is strong. The same can be said for very similar sentences. For example, the sentence patterns are the same, the verbs are the same, and only the noun phrases such as the object and the subject are different.

【0009】また、後編集に費やす時間に制約がある場
合には、同じ作業時間内での成果を比較した場合、訳文
の確信度の低いものから修正作業をした方が、訳文を上
から順番に後編集してゆくよりも、訳文文書全体の質は
高くなると云えるが、単に訳文毎の確信度が表示される
だけでは、利用者がその表示結果に基づいて、低い確信
度が示された訳文を自ら検索して該当のものを一つ一つ
見付けてゆかなければならないから時間節約効果には寄
与しにくく、また、見落としなども生じて作業効率が悪
いと云う問題があった。
When the time spent for post-editing is limited, when the results in the same working time are compared, it is better to correct the translated sentences in order from the one with lower certainty. It can be said that the quality of the translated document as a whole will be higher than that after post-editing, but if the confidence level for each translated sentence is simply displayed, the user will be shown a low confidence level based on the display result. It is difficult to contribute to the time-saving effect because it is necessary to search for translated texts one by one to find each one, and there are also problems such as oversights and poor work efficiency.

【0010】[0010]

【発明が解決しようとする課題】機械翻訳装置で翻訳処
理することにより得られた翻訳文は完全なものでないか
ら、後編集により、原文の文意に沿うように修正する必
要がある。そして、この後編集は人手に頼る作業とな
る。その際に訳文の確信度を算出して数値で示すと、後
編集をする人が原文の参照をしなくとも、後編集すべき
訳文とそうでない訳文を容易に見分けることができるよ
うになり、後編集作業のバックアップとなる。
Since the translated sentence obtained by the translation process by the machine translation device is not perfect, it is necessary to correct it by post-editing so as to conform to the meaning of the original sentence. And, after this, editing becomes a work relying on human labor. At that time, by calculating the certainty factor of the translated text and showing it by a numerical value, it becomes possible to easily distinguish the translated text that should be post-edited and the translated text that is not, even if the post-editor does not refer to the original text, It will be a backup for post-editing work.

【0011】上記従来技術では、システム全体としての
訳文に対する確信度を算出して利用すると云ったことを
行うが、その利用は単に、訳文毎の確信度の表示であ
り、後編集作業時ではその数値で後編集者はその訳文の
手直しをすべきか、否かの判断の目安に利用する程度の
利用法しかなく、システム側で翻訳の最適化処理に直接
利用できるようにはなっていなかった。また、システム
側での翻訳の最適化処理にどのように利用できるのか、
その指針すらも、示されていない。
In the above-mentioned conventional technique, the certainty factor for the translated sentence as the whole system is calculated and used. However, the use is merely the display of the certainty factor for each translated sentence, and at the time of the post-editing work, the certainty factor is displayed. The post-editor can only be used as a guideline for judging whether or not the translated text should be modified by a numerical value, and the system cannot directly use it for the translation optimization process. Also, how can it be used for optimization processing of translation on the system side,
Even that guideline is not shown.

【0012】そのために、確信度を得ても、後編集作業
が必要であることが判るだけであり、原文と訳文の対を
丹念に読み返し、原文と訳文の対応箇所を見比べなが
ら、訳文をチェックし、適切な表現に書き換えると云う
後編集作業は、すべて人手により行わなければならず、
後編集者は精神的・肉体的負担の改善には殆ど寄与しな
かった。
Therefore, even if the certainty factor is obtained, it is only understood that the post-editing work is necessary. Carefully read back the pair of the original sentence and the translated sentence, and check the translated sentence while comparing the corresponding portions of the original sentence and the translated sentence. However, all post-editing work, such as rewriting to an appropriate expression, must be done manually.
The post-editor did little to improve mental and physical burden.

【0013】特に、編集対象の文書が数十頁またはそれ
以上の長文にわたるときには、修正・編集作業に多大な
時間とエネルギを要することから、作業の能率を著しく
低下させることになるが、上述の従来の技術はこの改善
を図ることに何の効果も期待できなかった。
In particular, when the document to be edited has a long sentence of several tens of pages or more, a great deal of time and energy are required for the correction / editing work, which significantly reduces the work efficiency. The conventional technology could not expect any effect to achieve this improvement.

【0014】そこで、この発明の目的とするところは、
自然言語の文を他の種類の自然言語の文に翻訳するにあ
たり、訳出された文に対する後編集作業を効率化して作
業者の負担を軽減させることができるようにした機械翻
訳装置を提供することにある。
Therefore, the object of the present invention is to
To provide a machine translation device capable of streamlining post-editing work for a translated sentence to reduce the burden on an operator when translating a natural language sentence into another type of natural language sentence. It is in.

【0015】[0015]

【課題を解決するための手段】上記目的を達成するため
の本発明の機械翻訳装置はつぎのように構成する。すな
わち、第1の自然言語の文章を異なる別の自然言語の文
章に翻訳する機械翻訳装置において、第1には翻訳処理
を行うために利用する知識を記憶した翻訳辞書と、入力
された第1の自然言語の文章を前記翻訳辞書を利用して
前記別の自然言語に翻訳すると共に、その翻訳結果に対
する確信度を求める翻訳処理手段と、翻訳結果に対する
確信度の低い順もしくは高い順に、前記翻訳された自然
言語とその元の文章である第1の自然言語の文章の各対
を並べ換え手段と、この並べ換えられた文章の対を後編
集時に順に表示する表示手段とを具備する。
The machine translation apparatus of the present invention for achieving the above object is configured as follows. That is, in a machine translation device that translates a first natural language sentence into another different natural language sentence, first, a translation dictionary that stores knowledge used for performing a translation process, and a first input dictionary. A translation processing means for translating a sentence in the natural language into another natural language using the translation dictionary, and obtaining a certainty factor for the translation result, and the translation process in ascending or descending order of the certainty factor for the translation result. Each of the pair of the natural language and the first natural language sentence which is the original sentence thereof is rearranged, and the pair of rearranged sentences is sequentially displayed at the time of post-editing.

【0016】また、第2には、翻訳処理を行うために利
用する知識を記憶した翻訳辞書と、原文と訳文を保持す
るデータベースと、入力された第1の自然言語の文章を
前記翻訳辞書を利用して前記別の自然言語に翻訳すると
共に訳出しようとする文と類似した文の翻訳例がデータ
ベースにあるときは、その訳を模倣して翻訳し、また、
その翻訳結果に対する確信度を求める翻訳処理手段と、
前記翻訳結果に対するシステムの確信度を測定して、確
信度の高いものを第一言語の原文ともにデータとして蓄
積することにより、知識データベース作成を支援する制
御手段と、翻訳結果に対する確信度の低い順もしくは高
い順に、前記翻訳された自然言語とその元の文章である
第1の自然言語の文章の各対を並べ換え手段と、この並
べ換えられた文章の対を後編集時に順に表示する表示手
段とを具備する。
Secondly, a translation dictionary in which knowledge used for performing the translation process is stored, a database holding the original sentence and the translated sentence, and the input first natural language sentence is stored in the translation dictionary. When there is a translation example of a sentence similar to the sentence to be translated and translated into another natural language using the database, the translation is imitated, and
Translation processing means for obtaining a certainty factor for the translation result,
The confidence measure of the system for the translation result is measured, and the high confidence factor is accumulated as data together with the original sentence of the first language to control the knowledge database, and the order of low confidence factor for the translation result. Or, in descending order, a means for rearranging each pair of the translated natural language and a sentence of the first natural language which is the original sentence thereof, and a display means for sequentially displaying the pair of rearranged sentences at the time of post-editing. To have.

【0017】[0017]

【作用】このような構成において、第1の構成の場合、
翻訳処理手段は入力された第1の自然言語の文章を前記
翻訳辞書を利用して前記別の自然言語に翻訳すると共
に、その翻訳結果に対する確信度を求め、並べ換え手段
はこの得られた翻訳結果に対する確信度の低い順もしく
は高い順に、前記翻訳された自然言語とその元の文章で
ある第1の自然言語の文章の各対を並べ換え、後編集時
に表示手段はこの並べ換えられた文章の対を順に表示す
る。
In such a structure, in the case of the first structure,
The translation processing means translates the input first natural language sentence into the other natural language by using the translation dictionary, obtains the certainty factor for the translation result, and the rearrangement means obtains the obtained translation result. The translated natural language and each original text sentence of the first natural language sentence are rearranged in the order of low or high degree of certainty with respect to each other, and the display means displays the rearranged sentence pairs during post-editing. Display in order.

【0018】また、第2の構成の場合、原文と訳文を保
持するデータベースがあり、翻訳手段は、入力された第
1の自然言語の文章を前記翻訳辞書を利用して前記別の
自然言語に翻訳すると共に訳出しようとする文と類似し
た文の翻訳例がデータベースにあるときは、その訳を模
倣して翻訳し、また、その翻訳結果に対する確信度を求
める。そして、制御手段は確信度の高いものを第1の自
然言語の原文ともに前記データベースにデータとして蓄
積することにより、知識データベース作成を支援する。
また、並べ換え手段は、翻訳結果に対する確信度の低い
順もしくは高い順に、前記翻訳された自然言語とその元
の文章である第1の自然言語の文章の各対を並べ換え、
表示手段は後編集時に、この並べ換えられた文章の対を
順に表示する。
Further, in the case of the second configuration, there is a database for holding the original sentence and the translated sentence, and the translating means converts the input first natural language sentence into the different natural language by using the translation dictionary. When a translation example of a sentence similar to the sentence to be translated and translated is present in the database, the translation is imitated and translated, and the certainty factor for the translation result is obtained. Then, the control means supports the creation of the knowledge database by accumulating, with high confidence, the original text of the first natural language as data in the database.
Further, the rearrangement means rearranges each pair of the translated natural language and the sentence of the first natural language which is the original sentence thereof in ascending or descending order of confidence in the translation result,
The display means sequentially displays the rearranged pairs of sentences at the time of post-editing.

【0019】この結果、本発明によれば、原文を第2の
自然言語に翻訳した際に、算出したその訳文に対する確
信度の数値に応じて原文と訳文の対を表示できるので、
文書修正・編集に人間が関与する割合と人間に課せられ
る労力を大幅に軽減でき、また、対訳データベースを作
成する支援を行うことから、機械翻訳の後編集の作業の
効率を格段に向上させることが可能になる。
As a result, according to the present invention, when the original sentence is translated into the second natural language, the pair of the original sentence and the translated sentence can be displayed according to the calculated value of the certainty factor for the translated sentence.
Significantly improve the efficiency of post-editing work of machine translation by significantly reducing the rate of human involvement in manipulating and editing documents and the labor that is imposed on humans, and by supporting the creation of parallel translation databases. Will be possible.

【0020】[0020]

【実施例】以下、本発明の実施例を図面に従い説明す
る。
Embodiments of the present invention will be described below with reference to the drawings.

【0021】本発明は自然言語の文に対するシステムの
処理の確信度を算出し、この値に応じて原文と訳文の対
を対訳ベースに蓄積する際の支援を行うと共に、前記確
信度の値に応じ、後編集の対象となる訳文の提示順序を
制御して後編集作業を効率化する機械翻訳装置を提供す
るもので、以下、詳細を説明する。
The present invention calculates the certainty factor of the processing of the system for a natural language sentence, and assists in accumulating a pair of an original sentence and a translated sentence in a bilingual base according to this value, and at the same time, calculates the certainty factor value. Accordingly, a machine translation device that controls the presentation order of the translated sentences to be post-edited to improve the efficiency of the post-editing work is provided, and the details will be described below.

【0022】(第1の実施例)まず、本発明の一実施例
に係わる機械翻訳装置のブロック構成図を図1に示す。
図1において、101 はキーボードやマウス、OCR、磁
気テープ装置、磁気フロッピーディスク装置などからな
る入力部であり、この入力部101 は、言語処理の対象と
なる文書(例えば、日本語文、英文、中国語文など)を
入力するのを始め、各種編集・修正のためのコマンドや
データなどを入力するためのものである。
(First Embodiment) First, FIG. 1 shows a block diagram of a machine translation apparatus according to an embodiment of the present invention.
In FIG. 1, reference numeral 101 denotes an input unit including a keyboard, a mouse, an OCR, a magnetic tape device, a magnetic floppy disk device, etc. The input unit 101 is a document to be subjected to language processing (for example, Japanese sentence, English sentence, Chinese sentence). It is for inputting commands and data for various edits and corrections as well as inputting (words, etc.).

【0023】102 はシステム制御部であり、本システム
全体の制御の中枢を担うものである。制御内容として
は、例えば、入力部101 からの言語データや辞書データ
を後述する各部に送ったり、入力部101 の指示に基づい
て翻訳すべき文書の選択、辞書の選択などを行うもので
ある。
Reference numeral 102 denotes a system control unit, which plays a central role in controlling the entire system. The control contents include, for example, sending language data and dictionary data from the input unit 101 to each unit described later, selecting a document to be translated based on an instruction from the input unit 101, and selecting a dictionary.

【0024】103 は編集部であって、この編集部103 は
システム制御部102 で選択された第1言語のデータや、
翻訳部104 で訳出された第2言語のデータに対して編集
を行うものである。
Reference numeral 103 denotes an editing unit, which edits data in the first language selected by the system control unit 102,
The translation unit 104 edits the data of the second language translated.

【0025】また、104 は翻訳部であり、この翻訳部10
4 は前記システム制御部102 で選択された第1言語のデ
ータに対して、システム制御部102 で選択された翻訳辞
書部105 の辞書を参照しながら翻訳処理を行う。
Further, 104 is a translation unit, and this translation unit 10
4 performs translation processing on the data in the first language selected by the system control unit 102 while referring to the dictionary of the translation dictionary unit 105 selected by the system control unit 102.

【0026】翻訳辞書部105 は前記翻訳部104 が翻訳処
理を行う際に使用する各種辞書データを収容している。
この翻訳辞書部105 の内容は後述する。
The translation dictionary unit 105 accommodates various dictionary data used when the translation unit 104 performs translation processing.
The contents of the translation dictionary unit 105 will be described later.

【0027】106 は表示部であり、この表示部106 は前
記入力部101 より入力した第1言語の文・句や翻訳部10
4 により訳出された第2言語の文・句を表示するもので
ある。この表示部106 は、文字表示が可能なものとし
て、通常CRTや液晶ディスプレイ等が使われる。
Reference numeral 106 denotes a display unit, which is a sentence / phrase in the first language input by the input unit 101 and the translation unit 10.
The sentence / phrase in the second language translated by 4 is displayed. As the display unit 106, a CRT, a liquid crystal display or the like is usually used as a unit capable of displaying characters.

【0028】文書記憶部107 は、第1言語のデータと第
2言語のデータをそれぞれ独立して記憶すると共に、第
1言語のデータとその翻訳結果としての第2言語のデー
タを対応付けて記憶することができる。
The document storage unit 107 stores the data of the first language and the data of the second language independently of each other, and stores the data of the first language and the data of the second language as the translation result in association with each other. can do.

【0029】次に翻訳辞書部105 の内容について、図1
の翻訳辞書部105 を参照しながら説明する。翻訳辞書部
105 は、語尾等に変化のある単語・熟語をその原形に変
換する活用変換辞書105a、第1言語の単語・熟語に対応
する第2言語の訳語がその品詞情報と共に記憶される単
語・熟語辞書105b、第1言語を解析するための文法が記
憶された解析文法辞書105c、第1言語から第2言語への
変換情報が記憶された変換文法辞書105d、変換された第
2言語の文の構造を決定する生成文法辞書105e、第2言
語の語尾等の語形を変化させて翻訳文を完成させる形態
素生成文法辞書105f等を収容したものである。
Next, the contents of the translation dictionary unit 105 are shown in FIG.
This will be described with reference to the translation dictionary unit 105 of. Translation dictionary
Reference numeral 105 denotes an inflection conversion dictionary 105a for converting a word or phrase having a change in word ending or the like into its original form, and a word or phrase dictionary in which a translated word in the second language corresponding to the word or phrase in the first language is stored together with its part-of-speech information. 105b, an analysis grammar dictionary 105c in which a grammar for analyzing the first language is stored, a conversion grammar dictionary 105d in which conversion information from the first language to the second language is stored, and a converted sentence structure of the second language It contains a generative grammar dictionary 105e for deciding, a morpheme grammar dictionary 105f for changing a word form such as the ending of the second language to complete a translated sentence, and the like.

【0030】次に、以上のように構成した本実施例装置
の動作を説明する。
Next, the operation of the apparatus of this embodiment having the above-mentioned structure will be described.

【0031】ここでは入力部101 からの入力文書に対す
る翻訳処理の流れを日本語を英語に翻訳する場合を例に
とりながら、図2ないし図7のフローチャートに従い説
明する。
Here, the flow of the translation process for the input document from the input unit 101 will be described with reference to the flowcharts of FIGS. 2 to 7, taking the case where Japanese is translated into English as an example.

【0032】ここでは簡単化のために、形態素解析部、
構文解析部、構造変換部、構文生成部のうち、構造変換
部の確信度を重点的に用いて翻訳結果を後編集用に調整
する場合を考える。文書の具体例としては、図8に示す
ような動詞「あげる」を含む文を集めた文書を翻訳し、
後編集する場合を考える。
Here, for simplification, the morphological analysis unit,
Consider a case where the certainty factor of the structure conversion unit among the syntax analysis unit, the structure conversion unit, and the syntax generation unit is mainly used to adjust the translation result for post-editing. As a specific example of the document, a document in which sentences including the verb “Ageru” as shown in FIG.
Consider the case of post-editing.

【0033】図9は活用変化辞書105aに登録される知識
の一例を、また、図10は単語・熟語辞書105bに登録さ
れる知識の一例を、そして、図11は変換文法辞書105d
に登録される知識の一例をそれぞれ示している。
FIG. 9 is an example of knowledge registered in the inflection change dictionary 105a, FIG. 10 is an example of knowledge registered in the word / idiom dictionary 105b, and FIG. 11 is a conversion grammar dictionary 105d.
Each of the examples of knowledge registered in is shown.

【0034】図9に示す翻訳辞書部105 の活用変化辞書
105aにおいて「あげる」と云う見出し語が登録されてお
り、変換文法辞書105dにはこの動詞の必須格として、
「が」,「を」,「に」,「で」,「から」が登録さ
れ、さらに4つの変換規則が登録されているとする。
Utilization change dictionary of the translation dictionary unit 105 shown in FIG.
In 105a, the headword "Aruru" is registered, and in the conversion grammar dictionary 105d, as an indispensable case of this verb,
It is assumed that “ga”, “o”, “ni”, “de”, and “kara” are registered, and further four conversion rules are registered.

【0035】これらの変換規則は適用条件の厳しい順に
並べられており、この順序で規則の適用が試みられるも
のとする。
These conversion rules are arranged in order of strict application conditions, and application of the rules shall be attempted in this order.

【0036】これらを簡単に説明すると、第一の規則は
原文に「を」格を必ず含み、「が」格は任意で、他の
「に」,「で」,「から」格はないと云う構造をしてお
り、この「を」格の目的語が「性能」、「成績」、「能
力」、「能率」、「腕」のいずれかである場合、「が」
格は主語、「を」格は目的語とし、「あげる」に対する
訳語は“improve ”または“increase”とする、とした
ものである。
To briefly explain these, the first rule always includes the "wa" case in the original sentence, the "ga" case is arbitrary, and there are no other "ni", "de", and "kara" cases. If the object of the "wa" case is any of "performance", "performance", "ability", "efficiency", or "arm", it has a "ga"
The case is the subject, the "wa" case is the object, and the translation for "raise" is "improve" or "increase".

【0037】第二の規則は「を」格および「に」格を必
ず含み、「が」格は任意で、他の「で」格および「か
ら」格はないと云う構造をしており、「に」格の目的語
が人を意味するものである場合、「が」格を主語、
「を」格を直接目的語、「に」格を間接目的語に構造変
換し、「あげる」の訳語は“give”とする、としたもの
である。
The second rule has a structure in which the "wa" and "ni" cases are always included, the "ga" case is arbitrary, and the other "de" and "from" cases are absent. If the object of the "ni" case means a person, the subject of the "ga" case,
The case of "wa" is structurally transformed into the direct object, the case of "ni" into the indirect object, and the translated word of "ageru" is defined as "give".

【0038】第三の規則は第二の規則で参照している構
造と同じ構造をしているが、「を」格の目的語が物を、
「に」格の目的語が場所をそれぞれ意味するものである
場合、「が」格を主語、「を」格を目的語、「に」格を
“on”で始まる前置詞句に構造変換し、「あげる」の訳
語は“put ”とする、としたものである。
The third rule has the same structure as the structure referred to in the second rule, but the object of the "o" case is
If the object of the "ni" case means a place, the "ga" case is the subject, the "o" case is the object, and the "ni" case is transformed into a prepositional phrase starting with "on", The translation of "give up" is "put".

【0039】最後の規則はデフォルト規則であり、上の
5つの必須格は文の中に含まれていなくても良く、もし
含まれていた場合には、「が」格を主語、「を」格を目
的語、「に」格をtoで始まる前置詞句、「で」格を“wi
th”で始まる前置詞句、「から」格を“from”で始まる
前置詞句に構造変換し、訳語は“raise ”,“lift”,
“fry ”,“land”,“get ”,“vomit ”のいずれか
にする、と云うものである。
The last rule is the default rule, and the above five essential cases need not be included in the sentence, and if they are, the "ga" case is the subject and the "wo" case is Case is the object, "ni" is a preposition that starts with to, and "de" is "wi."
The prepositional phrase that begins with “th”, the “from” case is structurally transformed into the prepositional phrase that begins with “from”, and the translated words are “raise”, “lift”,
It is said to be one of "fry", "land", "get", and "vomit".

【0040】入力部101 より、言語処理の対象となる文
書を入力する。すると、システム制御部102 はこの文書
を文書記憶部107 に第1言語のデータとして記憶する。
つぎに入力部101 より、翻訳のコマンドを入力する。例
えば、日本語文を入力し、英文に翻訳する場合を説明す
ると、このコマンドにより、システム制御部102 は文書
記憶部107 に記憶された第1言語のデータを編集部103
を介して翻訳部104 に入力し、この翻訳部104 は前記シ
ステム制御部102 で選択された第1言語のデータに対し
て、システム制御部102 で選択された翻訳辞書部105 の
辞書を参照しながら翻訳処理を実施する。
The input unit 101 inputs a document to be subjected to language processing. Then, the system control unit 102 stores this document in the document storage unit 107 as data in the first language.
Next, a translation command is input from the input unit 101. For example, the case of inputting a Japanese sentence and translating it into an English sentence will be described. With this command, the system control unit 102 causes the data in the first language stored in the document storage unit 107 to be edited by the editing unit 103.
Via the translation unit 104, and the translation unit 104 refers to the dictionary of the translation dictionary unit 105 selected by the system control unit 102 for the data of the first language selected by the system control unit 102. While performing the translation process.

【0041】図2は原文書(第1言語)を指定言語(第
2言語)に翻訳する処理全体の流れである。
FIG. 2 is a flow of the whole process of translating an original document (first language) into a designated language (second language).

【0042】まず、入力部101 より原文書の翻訳対象領
域が指定されると、システム制御部102 はその指定領域
の文についてチェックして文の数を調べる。そして、シ
ステム制御部102 はステップS1においてその調べた文
の数を変数Bにセットし、ステップS2で変数Cに
“1”をセットする。そして、システム制御部102 はス
テップS4でB番目の文に対して翻訳を行うべくその文
を翻訳部104 へ渡すと共に翻訳指令を与える。
First, when the translation target region of the original document is designated by the input unit 101, the system control unit 102 checks the sentences in the designated region to check the number of sentences. Then, the system control unit 102 sets the number of the examined sentences in the variable B in step S1, and sets "1" in the variable C in step S2. Then, in step S4, the system control unit 102 transfers the sentence to the translation unit 104 and gives a translation instruction in order to translate the Bth sentence.

【0043】これにより、翻訳部104 は、この前記シス
テム制御部102 から渡された文であつ第1言語のデータ
に対して、システム制御部102 で選択された翻訳辞書部
105の辞書を参照しながら翻訳処理を行う。この翻訳処
理を、入力された文の数だけ繰り返すためにシステム制
御部102 はステップS5で変数Cに“1”を加える。ス
テップS3では変数Cが変数Bより大きいか否かを判断
する。その結果、変数Cが、文の数を設定してある変数
Bの値より小さければステップS4に移り、翻訳部104
にB番目(変数B)に相当する文を文書記憶部107 より
読出して与え、翻訳部104 はこれを翻訳辞書部105 の辞
書を参照しながら翻訳処理する。
As a result, the translation unit 104 selects the translation dictionary unit selected by the system control unit 102 for the first language data which is the sentence passed from the system control unit 102.
The translation process is performed with reference to the 105 dictionary. In order to repeat this translation processing for the number of input sentences, the system control unit 102 adds "1" to the variable C in step S5. In step S3, it is determined whether the variable C is larger than the variable B. As a result, if the variable C is smaller than the value of the variable B in which the number of sentences is set, the process proceeds to step S4 and the translation unit 104
, The sentence corresponding to the B-th (variable B) is read from the document storage unit 107 and given, and the translation unit 104 translates it by referring to the dictionary of the translation dictionary unit 105.

【0044】そして、つぎにシステム制御部102 は変数
Cに“1”を加算し、ステップS3の判定を行う。この
処理を変数Cが変数Bより大きくなるまで行うことで、
指定された原文書を翻訳部104 にすべて翻訳させること
ができる。システム制御部102 は翻訳部104 によって翻
訳されて得られた第2言語を文書記憶部107 に保存させ
る。
Then, the system control unit 102 adds "1" to the variable C and makes a determination in step S3. By performing this process until the variable C becomes larger than the variable B,
The specified original document can be completely translated by the translation unit 104. The system control unit 102 stores the second language translated by the translation unit 104 in the document storage unit 107.

【0045】ここで、ステップS4における翻訳処理に
ついて図3〜図7までを参照しながら詳しく説明する。
いま、入力部101 より直接、言語処理対象の文が入力さ
れ、かつ、処理コマンドが与えられるか、あるいは指定
する原文が文書記憶部107 から読み出されて、言語処理
対象の文が入力され、かつ、処理コマンドが与えられる
と、まず、システム制御部102 は翻訳部104 にこれらを
渡す。翻訳部104 ではステップS201で処理確信度を
“0”にセットし、つぎに翻訳部104 ではステップS2
02で形態素解析を入力文に対して行う。
Here, the translation process in step S4 will be described in detail with reference to FIGS.
Now, a language processing target sentence is directly input from the input unit 101, and a processing command is given, or a specified original sentence is read from the document storage unit 107, and a language processing target sentence is input. When a processing command is given, the system control unit 102 first passes these to the translation unit 104. The translation unit 104 sets the processing certainty factor to “0” in step S201, and the translation unit 104 then executes step S2.
In 02, morphological analysis is performed on the input sentence.

【0046】ここでは、翻訳部104 は翻訳辞書部105 内
の活用変化辞書105aを参照して、入力原文を構成する各
単語・熟語についての形態素解析を行い、つぎにステッ
プS203でこの形態素解析結果に従って単語・熟語辞
書105bを辞書検索することにより、入力文中の単語の品
詞や訳語の情報を求める。なお、形態素解析の手法に関
しては、既に様々なものが提案されているので、説明は
省略する。後述する構文解析等についても同様である。
Here, the translation unit 104 refers to the inflection change dictionary 105a in the translation dictionary unit 105 to perform a morpheme analysis on each word or idiom constituting the input original sentence, and then at step S203, this morpheme analysis result. By searching the word / phrase dictionary 105b in accordance with the dictionary, information on the part of speech and the translated word of the word in the input sentence is obtained. Note that various morphological analysis methods have already been proposed, so description thereof will be omitted. The same applies to syntax analysis and the like described later.

【0047】ステップS204で入力文に未知語が含ま
れていた場合、ステップS205でその未知語の語数分
だけ処理確信度から減じる。図03の例ではどれにも未
知語が含まれていないため、何も行われない。
If the input sentence includes an unknown word in step S204, the processing certainty factor is subtracted by the number of words of the unknown word in step S205. In the example of FIG. 03, since nothing is included in the unknown word, nothing is done.

【0048】次に、翻訳部104 はステップS206にお
いて、ステップS203の辞書検索で得られた品詞情報
と解析文法辞書105cを用いて入力文の構文解析を行う。
Next, in step S206, the translation unit 104 performs syntax analysis of the input sentence using the part-of-speech information obtained in the dictionary search in step S203 and the analysis grammar dictionary 105c.

【0049】この結果、文(1) は「[老人<が>][大
きな鯛<を>][あげる]」という構造を持つことがわ
かり、文(2) は「[私<が>][鉛筆<を>][あなた
<に>][あげる]」という構造を持つことがわかり、
文(3) は「[メーカー<が>][自動車の性能<を>]
[あげる]」という構造を持つことがわかり、文(4)は
「[彼<が>][棚<に>][物<を>][あげる]」
という構造を持つことがわかり、そして、文(5) は
「[会社<が>][汎用機の性能<を>][あげる]」
という構造を持つことがわかる。なお、文(2) と文(6)
は同一の文となっている。
As a result, it can be seen that the sentence (1) has a structure of "[elderly person <was] [big sea bream <was>] [raises], and the sentence (2)" [me <ga>] [ You can see that it has the structure of "pencil <>>] [you <to>] [given]".
Sentence (3) is "[manufacturer <is>] [car performance <is>]
It turns out that it has a structure of "[Give up]", and sentence (4) reads "[He <is>] [Shelf <to>] [Object <">] [Give] "
It is understood that the structure has the following, and the sentence (5) is "[Company <is>] [Performance of general-purpose machine <">] [Raise].
You can see that it has the structure. Note that sentence (2) and sentence (6)
Are the same sentence.

【0050】構文解析が終わったならば、翻訳部104 は
つぎにステップS207に移り、ここで構文解析処理が
成功したか否かを判定する。その結果、解析に成功して
いたならばステップS209に進み、解析に失敗したな
らばステップS208に進む。ステップS208では処
理確信度の値を“20”減じる。そして、ステップS2
09に進む。
When the syntactic analysis is completed, the translation unit 104 then moves to step S207 and determines whether the syntactic analysis process is successful. As a result, if the analysis is successful, the process proceeds to step S209, and if the analysis is unsuccessful, the process proceeds to step S208. In step S208, the value of the processing certainty factor is reduced by "20". And step S2
Go to 09.

【0051】続いて、翻訳部104 はステップS209で
これらの処理対象が、句(タイトル)であるのか、ある
いは文であるのかを判定する。一般に句の方が構造が単
純であることから、正しい訳が得られる確率が高いの
で、句の場合はステップS232において処理確信度の
値を“1”だけ加算処理する(インクリメント処理)。
その後、ステップS212bで構造変換を行い、構造変
換が終わったならば、この構造変換が成功したか、否か
をステップS213bでチェックする。
Subsequently, the translation unit 104 determines in step S209 whether these processing targets are phrases (titles) or sentences. In general, since the phrase has a simpler structure, the probability that a correct translation is obtained is higher. Therefore, in the case of the phrase, the value of the processing certainty factor is incremented by "1" in step S232 (increment process).
After that, the structure conversion is performed in step S212b, and when the structure conversion is completed, it is checked in step S213b whether or not this structure conversion is successful.

【0052】その結果、変換に成功したならば翻訳部10
4 はステップS233に進み、変換に失敗している場合
には翻訳部104 はステップS214bで確信度の値から
“20”を減じる処理をしてステップS233に進む。
図03の例はすべて文であるのでステップS210に進
むことになる。
As a result, if the conversion is successful, the translation unit 10
4 proceeds to step S233, and if the conversion is unsuccessful, the translation unit 104 performs processing of subtracting “20” from the certainty factor value at step S214b, and proceeds to step S233.
Since all the examples in FIG. 03 are sentences, the process proceeds to step S210.

【0053】ここで文と判定されると、翻訳部104 は次
はステップS210で文の種類、すなわち、複文である
のか、重文であるのか、あるいは単文であるのかを判定
し、複文または重文の場合には節の数を数え、ステップ
S211でその数から“1”を引いた分だけ処理確信度
の値を減点する。図8の例はすべて単文であるので、処
理確信度は変化しない。
When it is determined that the sentence is a sentence, the translation unit 104 next determines in step S210 the type of sentence, that is, whether the sentence is a compound sentence, a compound sentence, or a simple sentence. In this case, the number of nodes is counted, and the value of the processing certainty factor is deducted by the amount obtained by subtracting "1" from the number in step S211. Since all the examples in FIG. 8 are simple sentences, the processing certainty factor does not change.

【0054】次いで、翻訳部104 はステップS212a
に進み、構造変換を行う。ここでは、構文解析結果に従
い、翻訳辞書部105 の変換文法辞書105dを使って、入力
原文に対する構造変換を行い、訳文の構造候補を求め
る。そしてステップS213aで訳文の構造生成が成功
したか否かをステップS213aで判断する。構造変換
に成功した場合は、ステップS215に進む。そうでな
い場合はステップS214aで処理確信度の値を20減
じる。
Next, the translation unit 104 performs step S212a.
Proceed to and perform structural conversion. Here, according to the result of the syntactic analysis, the conversion grammar dictionary 105d of the translation dictionary unit 105 is used to perform structure conversion on the input original sentence to obtain a structure candidate of the translated sentence. Then, in step S213a, it is determined whether or not the structure of the translated sentence has been successfully generated in step S213a. If the structure conversion is successful, the process proceeds to step S215. If not, the value of the processing certainty factor is decreased by 20 in step S214a.

【0055】ちなみに、図8の例文に対しては、図11
の規則に従うと、文(1) は第一の規則、第二の規則、第
三の規則の適用条件には当てはまらず、デフォルト規則
である第四の規則が適用されることになる。文(2) は構
造上、第二の規則と第三の規則に一致するが、「に」格
で示される「あなた」が人を意味し、場所を意味しない
ため、適用条件としては第二のもののみ適合する。
By the way, for the example sentence of FIG.
According to the rule of (1), sentence (1) does not apply to the conditions of application of the first rule, the second rule, and the third rule, and the fourth rule, which is the default rule, applies. Sentence (2) structurally matches the second rule and the third rule, but since the "you" shown in the "ni" case means a person, not a place, the second condition is Only those that match

【0056】従って、第二の規則が適用される。文(3)
と文(5) は「を」格で示される「性能」が第一の規則の
適用条件に適合するため、この規則が適用される。文
(4) は「を」格で示される「物」が物を意味し、「に」
格で示される「棚」が場所を意味しているため、第三の
規則が適用される。このように、文(1) には第四の規
則、文(2) には第二の規則、文(3) と文(5) には第一の
規則、文(4) には第三の規則がそれぞれ適用されること
になる。
Therefore, the second rule applies. Sentence (3)
This sentence applies because the sentence "(5)" and "performance" indicated by the case "wa" meet the conditions of application of the first rule. Sentence
In (4), the "thing" indicated by the "wo" case means the thing, and the "ni"
The third rule applies because the "shelf" shown on the case means a place. Thus, sentence (1) has the fourth rule, sentence (2) has the second rule, sentences (3) and (5) have the first rule, and sentence (4) has the third rule. Rules will be applied respectively.

【0057】さて、続くステップS215〜S225で
は、より多くの情報を参照している規則を使って構造変
換した方が、より正確な訳文になるという前提に立ち、
それぞれに適用された規則に応じて確信度に加算する点
数を計算する。
In the subsequent steps S215 to S225, it is assumed that a more accurate translation will be obtained if the structure conversion is performed using a rule that refers to more information.
The score to be added to the certainty factor is calculated according to the rule applied to each.

【0058】翻訳部104 はまず、ステップS215で各
々の文の中に含まれる述語の数を計算し、その数を変数
i にセットする。そして、ステップS216で変数j に
“0”を、変数k に“1”をそれぞれセットする。そし
て、入力文中の各述語に対して、適用された規則に応じ
て処理確信度を以下のように加算してゆく。
First, the translation unit 104 calculates the number of predicates included in each sentence in step S215, and the number is used as a variable.
Set to i. Then, in step S216, the variable j is set to "0" and the variable k is set to "1". Then, for each predicate in the input sentence, the processing certainty factor is added as follows according to the applied rule.

【0059】すなわち、ステップS218で入力文の先
頭からj 番目の述語に対して適用された規則がデフォル
ト規則か否かを判断し、ステップS219でデフォルト
規則でない場合は変数k に“1”を加算する。
That is, in step S218, it is determined whether or not the rule applied to the j-th predicate from the beginning of the input sentence is the default rule, and if it is not the default rule, "1" is added to the variable k. To do.

【0060】次に翻訳部104 はステップS220で規則
適用にあたって原語そのものを参照しているか否かを調
べ、その結果、参照している場合にはステップS221
で変数k に“2”を加算する。さらにステップS222
で規則適用にあたって意味情報を参照しているか否かを
調べ、その結果、参照している場合にはステップS22
3で変数k に“1”を加算する。
Next, the translation unit 104 checks in step S220 whether or not the original word itself is referred to when applying the rule. As a result, if it is referred to, the step S221 is performed.
Add "2" to the variable k with. Further step S222
In step S22, it is checked whether or not the semantic information is referred to when the rule is applied.
In step 3, "1" is added to the variable k.

【0061】そして、この一連の操作を述語の数だけ繰
り返すために、翻訳部104 はステップS224で変数j
に“1”を加える。そして、翻訳部104 は変数j の値と
変数i の値の比較をするステップS217での判断条件
に従い、これを変数j の値が変数i の値より大きくなる
まで行う。ループから出た後、翻訳部104 はステップS
225で合計の数k を述語の数i で割り、加算された平
均値を出し、これを構造変換における処理確信度とし、
構造変換の前に得られた処理確信度に加算する。
Then, in order to repeat this series of operations for the number of predicates, the translation unit 104 determines the variable j in step S224.
Add “1” to. Then, the translation unit 104 performs this according to the determination condition in step S217 for comparing the value of the variable j with the value of the variable i until the value of the variable j becomes larger than the value of the variable i. After exiting the loop, the translation unit 104 performs step S.
In 225, the total number k is divided by the number i of predicates, the added average value is obtained, and this is taken as the processing certainty factor in the structural transformation,
It is added to the processing certainty factor obtained before the structural conversion.

【0062】以上の処理を図8の例文に対して行うと、
文(1) の処理確信度は変化せず、文(2) と文(4) と文
(6) はデフォルト規則でないことと、意味情報が参照さ
れていることから“2”点加算され、文(3) と文(5) は
デフォルト規則でないことと、原語そのものが参照され
ていることから“3”点加算されることになる。
When the above processing is performed on the example sentence of FIG.
The processing confidence of sentence (1) does not change, and sentence (2) and sentence (4)
(6) is not a default rule, and because semantic information is referenced, "2" is added, sentence (3) and sentence (5) are not a default rule, and the original language itself is referenced. Therefore, "3" points will be added.

【0063】次に、ステップS233に進み、生成文法
辞書105eに基づき、構文生成が行われる。ここでは、原
文の構造から訳文の語順が決定され、続いて単語列に変
換される。また、ステップS234で構文生成処理が成
功したか否かを調べて、その結果、失敗していた場合に
はステップS235で処理確信度の値を“20”減じ
る。そして、ステップS236に進み、形態素文法辞書
105fを適用して形態素生成が行われ、単語の語尾などを
変化させて翻訳文が完成する。
Next, in step S233, syntax generation is performed based on the generation grammar dictionary 105e. Here, the word order of the translated sentence is determined from the structure of the original sentence, and then converted into a word string. Further, in step S234, it is checked whether or not the syntax generation processing has succeeded. If the result is that the processing has failed, the value of the processing certainty factor is reduced by "20" in step S235. Then, the process proceeds to step S236, and the morpheme grammar dictionary.
Morphological generation is performed by applying 105f, and the ending of the word is changed to complete the translated sentence.

【0064】以上が文毎の翻訳処理動作である。The above is the translation processing operation for each sentence.

【0065】ここで図2の説明に戻る。システム制御部
102 はC>Bに達するまで文を逐次翻訳部104 に送り、
上述のような翻訳処理をこの翻訳部104 に行わせるが、
C>Bに達するとシステム制御部102 は編集部103 に処
理を移し、編集部103 にステップS6の処理を実施させ
る。
Returning to the explanation of FIG. System control unit
102 successively sends sentences to the translation unit 104 until C> B is reached,
Although the translation processing as described above is performed by the translation unit 104,
When C> B is reached, the system control unit 102 shifts the processing to the editing unit 103 and causes the editing unit 103 to perform the processing of step S6.

【0066】ステップS6では、システム制御部102 の
制御のもとに編集部103 は翻訳部104 が翻訳したものの
うち、原文が同一であるものは一つに纏め、同じものは
繰り返し表示しないように調整する処理を行う。
In step S6, under the control of the system control unit 102, the editing unit 103 collects the ones having the same original text, which are translated by the translation unit 104, so that the same ones are not repeatedly displayed. Perform adjustment processing.

【0067】また、原文が“X=A/(B+C) ”であるような
場合や、“1.1 Introduction”であるような場合の如
く、すべて英語、または記号で記述されていた場合には
後編集が不要であるため、後編集用の画面には表示しな
いように処理する。
When the original text is written in English or symbols, such as "X = A / (B + C)" or "1.1 Introduction" Since post-editing is unnecessary, it is processed so that it is not displayed on the post-editing screen.

【0068】さらに編集部103 はシステム制御部102 の
制御のもとに上述のようにして翻訳部104 が求めた各文
毎の処理確信度に従って、翻訳の精度が低い順に訳文を
並べ換え、最後にステップS7で原文書並びにその文番
号と共に翻訳文を表示部106における後編集用画面に表
示するように制御する。
Further, under the control of the system control unit 102, the editing unit 103 rearranges the translated sentences in the order of low translation accuracy according to the processing certainty factor for each sentence obtained by the translation unit 104 as described above, and finally, In step S7, control is performed so that the translated text together with the original document and its sentence number are displayed on the post-editing screen on the display unit 106.

【0069】例えば、図8に示す文書の場合、最終的な
確信度の値は文(1) は“0”、文(2) と文(4) と文(6)
は“2”、文(3) と文(5) は“3”となるので、図12
に示す如き表示状態になる。
For example, in the case of the document shown in FIG. 8, the final confidence value is "0" for sentence (1), sentence (2), sentence (4) and sentence (6).
12 is "2" and sentences (3) and (5) are "3".
The display state is as shown in.

【0070】一方、確信度の値が高い順に表示した場合
は図13のようになる。ここで、確信度の値を低い順に
表示させるようにするか、高い順に表示させるようにす
るかの選択は作業者に問い合わせて行うようにしても良
い。
On the other hand, when the confidence values are displayed in descending order, the result is as shown in FIG. Here, the operator may be inquired to select whether the confidence factor values are displayed in the ascending order or in the descending order.

【0071】この後、作業者はステップS8で後編集を
行う。
After this, the worker performs post-editing in step S8.

【0072】この結果、上述した実施例によれば、翻訳
の各処理段階における翻訳の処理確信度を計算し、その
値に応じて、誤訳の可能性が低いものから優先して、ま
たは誤訳の可能性が高いものから優先して表示し、同一
の文は表示を一回に限り、翻訳不要の文は表示対象から
外すことにより、作業者は効率良く訳文の見直しをする
ことができる。
As a result, according to the above-mentioned embodiment, the processing reliability of the translation in each processing stage of the translation is calculated, and according to the calculated value, priority is given to the one having a low possibility of mistranslation, or the mistranslation is selected. The operator can review the translated sentence efficiently by giving priority to the display with the highest possibility, displaying the same sentence only once, and excluding the sentence that does not need translation from the display target.

【0073】なお、本発明は、上記実施例に限定される
ものではなく、その要旨を変更しない範囲で適宜変形し
て実施できる。まず、図14のように、確信度の数値を
加点・減点の理由と一緒に画面表示させ、作業者の便宜
を図るようにすることもできる。また、あるいは図15
に示すように加点・減点の理由別に、その同じ理由を持
つ原文と訳文を確信度の値の高低順に従って表示するよ
うにすることもできる。
The present invention is not limited to the above embodiments, and can be carried out by appropriately modifying it within the scope of the invention. First, as shown in FIG. 14, the numerical value of the certainty factor may be displayed on the screen together with the reason for adding or subtracting points, for the convenience of the operator. Alternatively, FIG.
As shown in, it is possible to display the original sentence and the translated sentence having the same reason according to the reason of the point addition / deduction according to the order of the confidence value.

【0074】また、訳文を読み易いように編集する際、
作業者がより良い訳文を作ることのできるよう、図16
に示すように日本語文の前後の文脈を画面に表示する構
成とすることもできる。さらに、順番ではなく、確信度
が“-10 ”以下のもの、“-9〜0 ”のもの、“1 〜9 ”
のもの、と云うように、確信度の数値範囲に応じて、訳
文を選択・表示できるようにすることも可能である。そ
の例を図17に示す。
When editing the translated text so that it is easy to read,
Figure 16 to help operators create better translations
As shown in, the context before and after the Japanese sentence can be displayed on the screen. Furthermore, not in order, but with confidence of “-10” or less, “-9 to 0”, and “1 to 9”
It is also possible to select and display the translated sentence according to the numerical range of the certainty factor. An example thereof is shown in FIG.

【0075】また、確信度を算出するにあたって加点・
減点している実際の点数は絶対的なものではなく、翻訳
のどの部分に正確さを求めるかと云う重要度に応じてユ
ーザが変更できるようにしても良い。
In addition, there are additional points in calculating the certainty factor.
The actual points deducted are not absolute, and may be changed by the user depending on the importance of which part of the translation is required to be accurate.

【0076】次に、確信度の算出にあたって実施例で挙
げていない別のパラメータも翻訳の精度に関わるもので
あれば追加することができる。
Next, in calculating the certainty factor, other parameters not mentioned in the embodiment can be added as long as they are related to the accuracy of translation.

【0077】第一に、上記の説明では単語・熟語辞書と
して標準用語辞書のみを使用することを想定していた
が、ユーザ辞書や専門用語辞書を併用したり、概念と概
念の種々の関係を記述した概念辞書を意味分類辞書とし
て用いたりすることも考えられる。そこで、使用した辞
書の種類によって確信度を変更しても良い。
First, although it has been assumed in the above description that only the standard term dictionary is used as the word / idiom dictionary, a user dictionary or a technical term dictionary may be used together, and various relationships between concepts may be used. It is also possible to use the described concept dictionary as a semantic classification dictionary. Therefore, the certainty factor may be changed depending on the type of dictionary used.

【0078】ユーザ辞書は構文解析の時点で翻訳対象の
文の中に一致するものがあれば適用される。この辞書で
は標準用語辞書にはない任意格についても指定できるな
ど、ユーザ特有の詳細な訳出情報を付加することができ
る。
The user dictionary is applied if there is a match in the sentence to be translated at the time of parsing. In this dictionary, it is possible to add detailed translation information unique to the user, such as the specification of arbitrary cases not included in the standard term dictionary.

【0079】図18はユーザ辞書に登録された知識の一
例である。
FIG. 18 shows an example of knowledge registered in the user dictionary.

【0080】最初の例は原文「...機械に...油
を...施す」を英文の訳文“applyoil to the machin
e”と訳出するための規則である。このように、特定の
言葉に対して特定の訳文を生成させるためにユーザ辞書
を用いることで、標準用語辞書を用いる場合に比べてよ
りユーザの好みに合った訳出が可能となる。従って、ユ
ーザ辞書内の規則が適用された場合は、処理確信度の値
を例えば2点加算することが考えられる。さらに、ユー
ザが指定した専門用語辞書が使用された場合も訳語の精
度が向上する確率が高いため、このときも処理確信度を
加算することが考えられる。
In the first example, the original sentence "... apply oil to a machine ..." is translated into English by "apply oil to the machin".
This is a rule for translating as “e.” In this way, by using the user dictionary to generate a specific translated sentence for a specific word, it is possible for the user to have more preference than using the standard term dictionary. Therefore, if the rules in the user dictionary are applied, it is conceivable to add, for example, 2 points to the value of the processing certainty factor, and the technical term dictionary specified by the user is used. In this case, the accuracy of the translated word is likely to be improved, and therefore the processing certainty factor may be added at this time as well.

【0081】さらに、表示に関して、個々の単語が異な
るだけで、同一の規則が適用されていたり、文型が同一
であると云う点で類似している文を隣り合わせて近くに
表示することにより、作業者は効率良く訳文の見直しを
することができる。
Further, regarding the display, by displaying the sentences which are similar to each other in that the same rule is applied or the sentence patterns are the same, only the individual words are different from each other, they are displayed close to each other. The person can efficiently review the translated text.

【0082】以上、第1実施例は原文を訳出する際に、
各訳文毎に正しい内容での訳出が行われた可能性の度合
いである確信度を数値で求め、後編集時にその数値が高
い順若しくは低い順に、原文と訳文および処理確信度の
値を表示するようにしたものであり、従って、後編集時
に処理確信度の数値が低い順ものから順に表示させて手
直しすることにより、質の高い翻訳をすることができる
ようになるなど、後編集者の目的に応じて誤訳の可能性
が高いものから優先して表示させて手直ししたり、誤訳
の可能性が低いものから優先して表示させたて手直しし
たりすることができ、また、同一の文は表示を一回だけ
にしたり、翻訳不要の文は表示対象から外などすること
ができるなど、様々な選択に処理確信度の数値を活用す
ることができるようになり、従って、後編集者は効率良
く訳文の見直し作業をすることができて、負担の軽減を
図ることができるようになる。
As described above, in the first embodiment, when translating the original sentence,
For each translated sentence, the certainty factor, which is the degree of possibility that the content was translated correctly, is calculated as a numerical value, and at the time of post-editing, the original sentence, the translated sentence, and the processing certainty value are displayed in ascending or descending order. Therefore, at the time of post-editing, it is possible to perform high-quality translations by displaying the numerical values of the processing certainty factors in order from the one with the lowest processing certainty factor, and making adjustments. Depending on the, the items with a high possibility of mistranslation can be displayed with priority and reworked, or the items with a low possibility of mistranslation can be displayed with priority and reworked. It is possible to utilize the numerical value of the processing certainty factor in various selections, such as displaying only once and excluding sentences that do not need to be translated. Review of translated text It has been able to be, so that it is possible to reduce the burden.

【0083】故に、自然言語の文を他の種類の自然言語
の文に翻訳するにあたり、訳出された文に対する後編集
作業を効率化して作業者の負担を軽減させることができ
るようになる機械翻訳装置が得られる。
Therefore, when translating a natural language sentence into another type of natural language sentence, it is possible to make the post-editing work for the translated sentence efficient and reduce the burden on the operator. The device is obtained.

【0084】(第2の実施例)次に第2の実施例とし
て、用例に基づく翻訳を組み込んだ場合を考える。
(Second Embodiment) As a second embodiment, consider the case where a translation based on an example is incorporated.

【0085】現在、機械翻訳の方式として規則に基づく
もの(rule-based)と、実例に基づくもの(example-base
d) の2つの流れがある。
Currently, the machine translation methods are rule-based and example-base.
There are two streams of d).

【0086】上記の例はすべて規則に基づくものであっ
た。ここで、実例に基づく翻訳とは、抽象化された規則
に頼ることなく、訳出しようとする文と類似した文の翻
訳例を探し、その訳を模倣して訳出すると云うものであ
り、ハードウエアおよびソフトウエアの基本的構造は第
1の実施例と同じである。
All of the above examples were rule-based. Here, the translation based on an example means that a translation example of a sentence similar to a sentence to be translated is searched without depending on an abstract rule, and the translation is imitated and translated. The basic structure of the software is the same as that of the first embodiment.

【0087】入力部101 からの入力文書に対する翻訳処
理を実例に基づいて行った場合の流れを図19のフロー
チャートに従い説明する。
The flow in the case where the translation process for the input document from the input unit 101 is performed based on an example will be described with reference to the flowchart of FIG.

【0088】今、入力部101 より直接、言語処理対象の
文が入力され、かつ、処理コマンドが与えられるか、あ
るいは指定する原文が文書記憶部107 から読み出され
て、言語処理対象の文が入力され、かつ、処理コマンド
が与えられると、まず、システム制御部102 は翻訳部10
4 にこれらを渡す。
Now, a sentence to be language processed is directly input from the input unit 101, and a processing command is given, or an original sentence to be designated is read from the document storage unit 107, and a sentence to be language processed is obtained. When input and a processing command is given, first, the system control unit 102 causes the translation unit 10 to
Pass these to 4.

【0089】翻訳部104 では、ステップA1で形態素解
析を実行する。ここでは、単語辞書105 の活用変化辞書
105aと単語・熟語辞書105bとを検索することにより、入
力文書中の単語の品詞、原形、活用情報が求められる。
そして、ステップA2に進み、構文解析が行われる。
The translation unit 104 executes morphological analysis in step A1. Here, the use dictionary of the word dictionary 105
By searching 105a and the word / phrase dictionary 105b, the part of speech, original form, and utilization information of the word in the input document can be obtained.
Then, in step A2, the syntax analysis is performed.

【0090】このステップA2では、ステップA1の形
態素解析で得られた品詞情報を用いて解析文法辞書105c
を参照しながら入力文の構文解析が行われ、第1言語の
構文構造が生成される。ここまでの処理は規則に基づく
翻訳方式の場合と共通している。
At this step A2, the grammatical dictionary 105c is analyzed by using the part-of-speech information obtained by the morphological analysis at step A1.
While parsing the input sentence with reference to, the syntactic structure of the first language is generated. The processing up to this point is common to the case of the rule-based translation method.

【0091】次いで、翻訳部104 ではステップA3で、
最適照合検索を行う。ここでは、与えられた入力文によ
く似た文とその訳文を対訳データベース1201から検索す
る。類似文が検索された場合はステップA4に進む。
Next, in the translation unit 104, in step A3,
Perform an optimum matching search. Here, a sentence similar to the given input sentence and its translated sentence are searched from the parallel translation database 1201. If similar sentences are found, the process proceeds to step A4.

【0092】ステップA4では適用調整が行われる。す
なわち、検索された類似対訳を参照して翻訳しようとす
る文に合うよう調整を行って翻訳を行う。
In step A4, application adjustment is performed. That is, the translation is performed with reference to the retrieved similar bilingual translation, adjusting the sentence to be translated.

【0093】類似文が検索されなかった場合は図3〜図
7のフローチャートで説明した規則による翻訳がステッ
プA6で行われる。
If a similar sentence is not retrieved, translation according to the rules described in the flowcharts of FIGS. 3 to 7 is performed in step A6.

【0094】以上のようにして翻訳文が完成する。The translated sentence is completed as described above.

【0095】ここで用いる対訳データベースは人間の訳
した翻訳例であるので、機械出力の翻訳調に引きずられ
ることのない表現となっており、用例を用いることによ
り、こなれた訳が出力できる。つまり、用例方式は従来
の方式に比べより細かいレベルの規則、あるいは、より
精密な規則を利用して翻訳していることになる。
Since the parallel translation database used here is a translation example translated by humans, the expression is not influenced by the translation tone of the machine output, and the translation can be output by using the example. In other words, the example system translates using a finer level rule or a more precise rule than the conventional system.

【0096】一方、欠点としては、常に類似した対訳例
があるとは限らない点である。従ってここでは、類似文
が存在しないときは、規則に基づいて翻訳するとしてい
る。そこで、類似した文が探索できた場合は処理確信度
を例えば10点加算することが考えられる。さらに実例
に基づく翻訳方式の変形として次のようなものも考えら
れる。
On the other hand, a drawback is that there is not always a similar parallel translation example. Therefore, here, when there is no similar sentence, it is translated based on the rule. Therefore, when a similar sentence can be searched, it is conceivable to add 10 points to the processing certainty factor, for example. Furthermore, the following may be considered as a modification of the translation method based on an actual example.

【0097】この方式に基づいて行った場合の処理の流
れを図20のフローチャートに従い説明する。
The flow of the processing performed based on this method will be described with reference to the flowchart of FIG.

【0098】いま、言語処理対象の文書が入力される
と、翻訳部104 では図19で説明したステップA1とス
テップA2と同様のことがステップB1とステップB2
で行われる。
When a document to be language processed is input, the translation unit 104 performs the same steps as Steps A1 and A2 described with reference to FIG. 19 in Steps B1 and B2.
Done in.

【0099】次に翻訳部104 はステップB3で変換文法
辞書105dを使って、入力原文に対する構造変換を行い、
訳文の構造候補を求める。ステップB4でこの構造候補
が複数あるか否かを判断し、あった場合はステップB5
に進む。ステップB5では、対訳データベース1201の中
に見られる構造を持ったものを第一の訳文構造として、
構文生成を行う。
Next, the translation unit 104 uses the transformation grammar dictionary 105d in step B3 to perform the structural transformation on the input original sentence,
Find a candidate structure for a translated sentence. In step B4, it is judged whether or not there are a plurality of structure candidates, and if there is, a step B5.
Proceed to. In step B5, the one having the structure found in the parallel translation database 1201 is set as the first translated sentence structure.
Generate syntax.

【0100】例えば、「閉じられたCSCW環境を新た
に導入すれば、協同作業に伴うオーバーヘッドは増え
る。」と云う文は「従属節+主節」構造(この場合、訳
は例えば“If we newly introduce closed CSCW enviro
nments, overhead incooperation will increase.”の
ようになる)と「無生物主語+述語」構造(この場合、
訳は例えば“Introducing closed CSCW environments w
ill increaseoverhead in cooperation. ”のようにな
る)の2つの可能性がある、とステップB4で判定され
たとする。
For example, the sentence "Introducing a new closed CSCW environment increases the overhead associated with cooperative work." Is a "subordinate clause + main clause" structure (in this case, the translation is "If we newly introduce closed CSCW enviro
nments, overhead incooperation will increase. ”and" inanimate subject + predicate "structure (in this case,
For example, “Introducing closed CSCW environments w
ill increaseoverhead in cooperation. ”), there are two possibilities.

【0101】すると、翻訳部104 はステップB5で対訳
データベース1201を検索し、日本語文が「−は、−す
る」となっており、その訳文として「無生物主語+述
語」となっている原文と訳文の対が存在すれば、後者の
訳を出力することになる。
Then, the translation unit 104 searches the parallel translation database 1201 in step B5, and the Japanese sentence is "-is-is", and the original sentence and the translated sentence are "inanimate subject + predicate" as the translated sentence. If there is a pair of, the latter translation will be output.

【0102】ステップB4で構造候補が一つであると判
定されると、ステップB6で生成文法辞書105eに基づき
構文生成が行われる。最後にステップB7に進み、形態
素生成文法辞書105fを適用して形態素生成が行われ、単
語の語尾などを変化させて翻訳文が完成する。
If it is determined in step B4 that there is one structure candidate, syntax generation is performed based on the generation grammar dictionary 105e in step B6. Finally, in step B7, morpheme generation is performed by applying the morpheme generation grammar dictionary 105f, the ending of the word is changed, and the translated sentence is completed.

【0103】このようにステップB5を経て翻訳された
場合もまた処理確信度を例えば10点加算することが考
えられる。
Also in the case where translation is performed through step B5 as described above, it is conceivable to add 10 points to the processing certainty factor.

【0104】最後に、このようにして翻訳部104 が生成
した翻訳結果に対するシステムの確信度を測定して、確
信度が特定の基準値を越えるものを第1の自然言語の原
文とともにデータとして蓄積することにより、知識デー
タベースを作成する処理の流れを説明する。
Finally, the confidence factor of the system for the translation result generated by the translation unit 104 in this way is measured, and if the confidence factor exceeds a specific reference value, it is stored as data together with the original text of the first natural language. By doing so, the flow of processing for creating a knowledge database will be described.

【0105】この場合、行われる処理は最終段階を除
き、第1実施例での後編集と全く同じである。相違点は
次の通りである。図21のフローチャートに従って人間
によって自然で読みやすい文に仕上げられた訳文と原文
の対が指定されると、それが対訳データベースに蓄積さ
れてゆく点である。
In this case, the processing performed is exactly the same as the post-editing in the first embodiment except for the final stage. The differences are as follows. The point is that, when a pair of a translated sentence and an original sentence that is completed in a natural and easy-to-read sentence is designated by a human according to the flowchart of FIG. 21, it is accumulated in the parallel translation database.

【0106】そこで前記入力部101 には新たに蓄積確定
キー、蓄積取消キー、登録切替モードキーを設けておく
ものとする。
Therefore, the input section 101 is newly provided with an accumulation confirmation key, an accumulation cancellation key, and a registration switching mode key.

【0107】入力部101 における蓄積確定キーは対訳デ
ータベースに蓄積したい対訳を指定するためのものであ
り、蓄積取消キーは一度対訳データベースに蓄積した対
訳を対訳データベースから削除または、後編集が終了し
た対訳であるが対訳データベースに蓄積することを希望
しない対訳を指定するためのものである。
The accumulation confirmation key in the input unit 101 is for designating the parallel translations to be stored in the parallel translation database, and the accumulation cancel key is for deleting the parallel translations once accumulated in the parallel translation database from the parallel translation database, or the parallel translations for which post-editing has been completed. However, it is for designating parallel translations that are not desired to be stored in the parallel translation database.

【0108】入力部101 における登録切替モードキー
は、後編集が終了すると自動的に対訳データベースに送
られる自動モードと、対訳データベースに登録するため
には後編集の終了後、作業者の確認を要する確認モード
とを切り替えるためのものである。
The registration switching mode key in the input section 101 is an automatic mode that is automatically sent to the bilingual database when post-editing is completed, and an operator's confirmation is required after post-editing to register in the bilingual database. It is for switching to the confirmation mode.

【0109】すなわち、入力部101 を操作して後編集の
指示を出すと、システム制御部102は編集部103 を動作
させて編集部103 による後編集処理が実施される(ステ
ップC1)。これは表示部106 に表示された内容に基づ
き、後編集者による入力部101 の操作により編集部103
の処理制御のもとで手直し作業を実施する。そして、編
集部103 による後編集処理が終わると、システム制御部
102 はステップC2で登録モードが自動であるか否かを
チェックして登録モードが自動であった場合にはシステ
ム制御部102 はステップC3で上記後編集処理結果をそ
のまま対訳データベースへ格納する。
That is, when the input section 101 is operated to issue an instruction for post-editing, the system control section 102 operates the editing section 103 and the post-editing processing is carried out by the editing section 103 (step C1). This is based on the contents displayed on the display unit 106 and is edited by the post-editor by operating the input unit 101.
Repair work is performed under the processing control of. When the post-editing process by the editing unit 103 is completed, the system control unit
At step C2, whether or not the registration mode is automatic is checked at step C2. If the registration mode is automatic, the system control unit 102 at step C3 stores the post-editing processing result as it is in the parallel translation database.

【0110】一方、確認モードの場合はシステム制御部
102 は、ステップC4で後編集者に登録するか否かの確
認を求める動作を行う。これは、表示部106 に登録する
か否かの確認メッセージを表示させて指示待ちとなる動
作を行うことで実施する。その結果、後編集者が入力部
101 の操作により確定キーを押したとすると(ステップ
C5)、システム制御部102 は対訳データベースへ格納
する。
On the other hand, in the confirmation mode, the system control unit
The step 102 performs an operation for asking the post editor to confirm whether or not to register in step C4. This is performed by displaying a confirmation message asking whether or not to register on the display unit 106 and waiting for an instruction. As a result, the post-editor
If the confirmation key is pressed by the operation of 101 (step C5), the system control unit 102 stores it in the parallel translation database.

【0111】確定キーが押されず、ステップC6で取消
キーが押されると、システム制御部102 は対訳データベ
ースへ何も格納せずに終了する。
If the confirm key is not pressed and the cancel key is pressed in step C6, the system control unit 102 ends without storing anything in the parallel translation database.

【0112】以上のように第2の実施例は、訳出しよう
とする文と類似した文の翻訳例をデータベースから探
し、その訳を模倣して訳出するようにしたものであり、
また、翻訳の各処理における確信度を算出し、その数値
と文の類似性・同一性を考慮して、原文と訳文の対を数
値の高い順あるいは低い順に並べ替えて表示することが
できるようにしたものである。これにより、誤訳の可能
性のある文を検索する手間を省き、また、無駄な訳文チ
ェックを最小限にとどめるなど、修正作業を効率良く行
うことができるようになる。
As described above, in the second embodiment, a translation example of a sentence similar to the sentence to be translated is searched from the database, and the translation is imitated and translated.
In addition, it is possible to calculate the certainty factor in each process of translation and display the pairs of the original sentence and the translated sentence in descending numerical order or in descending numerical order in consideration of the similarity and identity between the numerical value and the sentence. It is the one. As a result, it is possible to save the trouble of searching for a sentence that may be mistranslated, and to perform correction work efficiently, such as minimizing unnecessary translation check.

【0113】具体的には、一定の時間内である程度の正
確さが要求されている場合は、処理確信度の低い順に表
示するのが得策である。また、機械翻訳システムの開発
者が自身のシステムの弱点を知り、その部分を改良して
ゆく上でも、処理確信度の低いものから順に表示するこ
とにより、効率良い開発が期待できる。
Specifically, when a certain degree of accuracy is required within a certain period of time, it is a good idea to display the processing in ascending order. In addition, even if the developer of the machine translation system knows the weaknesses of his own system and improves the weaknesses, it is possible to expect efficient development by displaying the weakest processing confidences in order.

【0114】一方、翻訳の量が多く、訳が出来上がった
ものから納入してゆくことが要求されている場合には、
修正に時間のかからない処理確信度の高いものから順に
表示するのが得策である。
On the other hand, when the amount of translation is large and it is required to deliver the translation after it has been completed,
It is a good idea to display in order from the one with the highest processing certainty, which does not take a long time to correct.

【0115】従来の機械翻訳では、人間による翻訳には
ない後編集によって、かえって作業時間が延びることも
あったが、本方式により翻訳作業の能率を挙げることに
より、作業者は生産性の高い翻訳に従事することができ
る。
In conventional machine translation, post-editing, which human translation does not have, sometimes lengthened the work time. However, by improving the efficiency of the translation work by this method, the operator can perform highly productive translation. Can be engaged in.

【0116】また、この後編集作業の応用として、処理
確信度の高いものから順に表示することにより、作業者
が編集・修正した原文と訳文の対を対訳データベースに
効率良く、かつ容易に蓄積できる。このようにして対訳
データベースを蓄積することにより、ユーザ辞書を強化
したり、実例に基づく翻訳方式に不可欠な実例を増やす
ことができ、前記の後編集作業を削減することができ
る。
Further, as an application of the editing work after this, by displaying in order from the one with the highest processing certainty, the pair of the original sentence and the translated sentence edited and corrected by the worker can be efficiently and easily accumulated in the parallel translation database. . By accumulating the bilingual database in this way, it is possible to strengthen the user dictionary, increase the number of actual examples that are indispensable for the actual example-based translation method, and reduce the post-editing work.

【0117】なお、本発明は上記し、かつ、図面に示す
実施例に限定することなく、その要旨を変更しない範囲
内で適宜変形して実施し得るものである。
The present invention is not limited to the embodiments described above and shown in the drawings, but can be appropriately modified and implemented within the scope of the invention.

【0118】[0118]

【発明の効果】以上、詳述したように本発明によれば、
少なくともある2組の言語の文章及びシステムに対する
指示を入力する入力手段と、入力された第一言語の文章
を形態素解析し、翻訳処理する翻訳処理手段と、翻訳処
理を行うために利用する知識を記憶した翻訳辞書と、翻
訳された第2言語で記述された文章及びシステムからの
情報を表示するための表示手段を具備し、得られた翻訳
結果に対する確信度を測定して、後編集時には確信度の
低い順、または高い順に原文と訳文を対として表示部に
表示することができるようにし、これに基づいて後編集
処理ができるように構成した機械翻訳装置であるから、
後編集作業者の肉体的・精神的負担を最小限にとどめ、
効率良く後編集作業を行うことができるようになり、ま
た編集・修正された訳文を原文と共に効率良く、かつ容
易に対訳データベースに蓄積することが可能になる。
As described above in detail, according to the present invention,
Input means for inputting texts in at least two languages and instructions for the system, translation processing means for performing morphological analysis of the input texts in the first language and performing translation processing, and knowledge used for performing the translation processing. It has a stored translation dictionary and a display means for displaying the translated sentence written in the second language and information from the system, measures the certainty factor for the obtained translation result, and confirms it at the time of post-editing. Since it is a machine translation device configured to be able to display the original sentence and the translated sentence as a pair on the display unit in the ascending order or the high order, and to perform the post-editing process based on this,
Minimize the physical and mental burden on post-editing workers,
The post-editing work can be performed efficiently, and the edited / corrected translated text can be efficiently and easily stored together with the original text in the parallel translation database.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例を説明するための図であって、
本発明装置のシステム構成を示すブロック図。
FIG. 1 is a diagram for explaining an embodiment of the present invention,
The block diagram which shows the system configuration of the device of this invention.

【図2】本発明の実施例を説明するための図であって、
本発明の第1の実施例におけるシステムの全体的な処理
の流れを示すフローチャート。
FIG. 2 is a diagram for explaining an embodiment of the present invention,
3 is a flowchart showing the overall processing flow of the system in the first embodiment of the present invention.

【図3】本発明の実施例を説明するための図であって、
日本語を英語に翻訳する場合の同実施例の翻訳処理の流
れを示すフローチャート。
FIG. 3 is a diagram for explaining an embodiment of the present invention,
The flowchart which shows the flow of the translation process of the same Example when translating Japanese into English.

【図4】本発明の実施例を説明するための図であって、
日本語を英語に翻訳する場合の同実施例の翻訳処理の流
れを示すフローチャート。
FIG. 4 is a diagram for explaining an embodiment of the present invention,
The flowchart which shows the flow of the translation process of the same Example when translating Japanese into English.

【図5】本発明の実施例を説明するための図であって、
日本語を英語に翻訳する場合の同実施例の翻訳処理の流
れを示すフローチャート。
FIG. 5 is a diagram for explaining an embodiment of the present invention,
The flowchart which shows the flow of the translation process of the same Example when translating Japanese into English.

【図6】本発明の実施例を説明するための図であって、
日本語を英語に翻訳する場合の同実施例の翻訳処理の流
れを示すフローチャート。
FIG. 6 is a diagram for explaining an embodiment of the present invention,
The flowchart which shows the flow of the translation process of the same Example when translating Japanese into English.

【図7】本発明の実施例を説明するための図であって、
日本語を英語に翻訳する場合の同実施例の翻訳処理の流
れを示すフローチャート。
FIG. 7 is a diagram for explaining an embodiment of the present invention,
The flowchart which shows the flow of the translation process of the same Example when translating Japanese into English.

【図8】本発明の実施例を説明するための図であって、
本発明の実施例を説明するための文書の具体例を示す
図。
FIG. 8 is a diagram for explaining an embodiment of the present invention,
The figure which shows the specific example of the document for describing the Example of this invention.

【図9】本発明の実施例を説明するための図であって、
本発明の実施例に用いられる単語辞書中の活用変化辞書
の一例を示す図。
FIG. 9 is a view for explaining the embodiment of the present invention,
The figure which shows an example of the utilization change dictionary in the word dictionary used for the Example of this invention.

【図10】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる単語辞書中の単語・熟
語辞書の一例を示す図。
FIG. 10 is a diagram for explaining the embodiment of the present invention, showing an example of the word / idiom dictionary in the word dictionary used in the embodiment of the present invention.

【図11】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる単語辞書中の変換文法
辞書の一例を示す図。
FIG. 11 is a diagram for explaining an embodiment of the present invention, showing an example of a conversion grammar dictionary in a word dictionary used in the embodiment of the present invention.

【図12】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる表示部の画面のレイア
ウトの一例を示す図。
FIG. 12 is a diagram for explaining the embodiment of the present invention, showing an example of the layout of the screen of the display unit used in the embodiment of the present invention.

【図13】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる表示部の画面のレイア
ウトの一例を示す図。
FIG. 13 is a diagram for explaining the embodiment of the present invention, showing an example of the layout of the screen of the display unit used in the embodiment of the present invention.

【図14】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる表示部の画面のレイア
ウトの一例を示す図。
FIG. 14 is a diagram for explaining the embodiment of the present invention, showing an example of the layout of the screen of the display unit used in the embodiment of the present invention.

【図15】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる表示部の画面のレイア
ウトの一例を示す図。
FIG. 15 is a diagram for explaining the embodiment of the present invention, showing an example of the layout of the screen of the display unit used in the embodiment of the present invention.

【図16】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる表示部の画面のレイア
ウトの一例を示す図。
FIG. 16 is a diagram for explaining the embodiment of the present invention, showing an example of the layout of the screen of the display unit used in the embodiment of the present invention.

【図17】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられる表示部の画面のレイア
ウトの一例を示す図。
FIG. 17 is a diagram for explaining the embodiment of the present invention, showing an example of the layout of the screen of the display unit used in the embodiment of the present invention.

【図18】本発明の実施例を説明するための図であっ
て、本発明の実施例に用いられるユーザ辞書の一例を示
す図。
FIG. 18 is a diagram for explaining the embodiment of the present invention and is a diagram showing an example of a user dictionary used in the embodiment of the present invention.

【図19】本発明の実施例を説明するための図であっ
て、本発明の実施例における日本語を英語に翻訳する場
合の翻訳処理の流れを示すフローチャート。
FIG. 19 is a diagram for explaining the embodiment of the present invention and is a flowchart showing a flow of a translation process when translating Japanese into English in the embodiment of the present invention.

【図20】本発明の実施例を説明するための図であっ
て、本発明の実施例における日本語を英語に翻訳する場
合の翻訳処理の流れを示すフローチャート。
FIG. 20 is a diagram for explaining the embodiment of the present invention and is a flowchart showing a flow of a translation process when translating Japanese into English in the embodiment of the present invention.

【図21】本発明の第2の実施例を説明するための図で
あって、翻訳を行い、結果をデータベースに蓄積する場
合の同実施例の処理の流れを示すフローチャート。
FIG. 21 is a diagram for explaining the second embodiment of the present invention and is a flowchart showing the flow of processing of the same embodiment when performing translation and storing the result in a database.

【符号の説明】[Explanation of symbols]

101 …入力部 102 …システム制御部 103 …編集部 104 …翻訳部 105 …翻訳辞書部 106 …表示部 107 …文書記憶部 1201…対訳データベース 101 ... input section 102 ... system control section 103 ... editing section 104 ... translation section 105 ... translation dictionary section 106 ... display section 107 ... document storage section 1201 ... parallel translation database

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 第1の自然言語の文章を異なる別の自然
言語の文章に翻訳する機械翻訳装置において、 翻訳処理を行うために利用する知識を記憶した翻訳辞書
と、 入力された第1の自然言語の文章を前記翻訳辞書を利用
して前記別の自然言語に翻訳すると共に、その翻訳結果
に対する確信度を求める翻訳処理手段と、 翻訳結果に対する確信度の低い順もしくは高い順に、前
記翻訳された自然言語とその元の文章である第1の自然
言語の文章の各対を並べ換え手段と、 この並べ換えられた文章の対を後編集時に順に表示する
表示手段と、を具備することを特徴とした機械翻訳装
置。
1. A machine translation device for translating a first natural language sentence into another different natural language sentence, and a translation dictionary storing knowledge used for performing a translation process, and a first input dictionary. A translation processing unit that translates a sentence in a natural language into the other natural language by using the translation dictionary, obtains a certainty factor for the translation result, and the translation is performed in ascending or descending order of the certainty factor for the translation result. A natural language and a first natural language sentence that is the original sentence thereof are rearranged, and a display unit that sequentially displays the rearranged sentence pairs during post-editing. Machine translation device.
【請求項2】 第1の自然言語の文章を異なる別の自然
言語の文章に翻訳する機械翻訳装置において、 翻訳処理を行うために利用する知識を記憶した翻訳辞書
と、 原文と訳文を保持するデータベースと、 入力された第1の自然言語の文章を前記翻訳辞書を利用
して前記別の自然言語に翻訳すると共に訳出しようとす
る文と類似した文の翻訳例がデータベースにあるとき
は、その訳を模倣して翻訳し、また、その翻訳結果に対
する確信度を求める翻訳処理手段と、 前記翻訳結果に対するシステムの確信度を測定して、確
信度の高いものを第一言語の原文とともにデータとして
蓄積することにより、知識データベース作成を支援する
制御手段と、 翻訳結果に対する確信度の低い順もしくは高い順に、前
記翻訳された自然言語とその元の文章である第1の自然
言語の文章の各対を並べ換え手段と、 この並べ換えられた文章の対を後編集時に順に表示する
表示手段と、を具備することを特徴とした機械翻訳装
置。
2. A machine translation device for translating a first natural language sentence into another different natural language sentence, which holds a translation dictionary storing knowledge used for performing a translation process, and an original sentence and a translated sentence. If a database and a translation example of a sentence similar to the sentence to be translated and translated from the input first natural language sentence into the other natural language using the translation dictionary are stored in the database, A translation processing unit that imitates a translation and obtains a certainty factor for the translation result, and a certainty factor of the system for the translation result is measured, and a high certainty factor is stored as data together with the original text of the first language. By accumulating, a control means for supporting the creation of the knowledge database, and the translated natural language and its original sentence are arranged in ascending or descending order of confidence in the translation result. Means reorders each pair of sentences in the first natural language, machine translation apparatus that was characterized by having a display means for displaying sequentially at the rear edit pairs of reordered sentence.
JP5349525A 1993-12-28 1993-12-28 Machine translation device Pending JPH07200602A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5349525A JPH07200602A (en) 1993-12-28 1993-12-28 Machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5349525A JPH07200602A (en) 1993-12-28 1993-12-28 Machine translation device

Publications (1)

Publication Number Publication Date
JPH07200602A true JPH07200602A (en) 1995-08-04

Family

ID=18404323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5349525A Pending JPH07200602A (en) 1993-12-28 1993-12-28 Machine translation device

Country Status (1)

Country Link
JP (1) JPH07200602A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190976A (en) * 2012-03-13 2013-09-26 Yahoo Japan Corp Translation candidate presentation device, translation candidate presentation method and translation candidate presentation program
JP2019003433A (en) * 2017-06-15 2019-01-10 株式会社リクルートライフスタイル Program, display method, and information processing device
JP7764079B1 (en) * 2025-04-16 2025-11-05 株式会社川村インターナショナル Translation support system and translation support method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190976A (en) * 2012-03-13 2013-09-26 Yahoo Japan Corp Translation candidate presentation device, translation candidate presentation method and translation candidate presentation program
JP2019003433A (en) * 2017-06-15 2019-01-10 株式会社リクルートライフスタイル Program, display method, and information processing device
JP7764079B1 (en) * 2025-04-16 2025-11-05 株式会社川村インターナショナル Translation support system and translation support method

Similar Documents

Publication Publication Date Title
JP4504555B2 (en) Translation support system
US4831529A (en) Machine translation system
US5214583A (en) Machine language translation system which produces consistent translated words
US5311429A (en) Maintenance support method and apparatus for natural language processing system
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
US7124073B2 (en) Computer-assisted memory translation scheme based on template automaton and latent semantic index principle
JP2006012168A (en) How to improve coverage and quality in a translation memory system
JPH07200602A (en) Machine translation device
JP2003006191A (en) Foreign language document creation support device, foreign language document creation support method, and program recording medium
JP3136973B2 (en) Language analysis system and method
JP3085394B2 (en) Translated word selection method in multi-sentence translation and machine translation system using the same
JPH0561902A (en) Mechanical translation system
JPS62163174A (en) Mechanical translating device
JPH0554063A (en) Interactive English-Japanese machine translation system
JPH0652151A (en) Common starting learning device and kana@(3754/24)japanese syllabary)-kanji@(3754/24)chinese character) conversion device using it
JPH1031676A (en) Bilingual example sentence search device
JP3873299B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JP4088144B2 (en) Translation support device
JP5032453B2 (en) Machine translation apparatus and machine translation program
JPS61260367A (en) Mechanical translating system
JPH05225232A (en) Automatic text pre-editor
JP2000242643A (en) English text creation support apparatus and method, and storage medium
JP2001202365A (en) Device and method for machine translation and storage medium with recorded machine translation program therefor
JP2010020436A (en) Machine translation device and machine translation program
Jaiswal et al. Towards a unified approach to include Translation Memory in MT system