JPH05108705A - Machine translation device - Google Patents

Machine translation device

Info

Publication number
JPH05108705A
JPH05108705A JP3269240A JP26924091A JPH05108705A JP H05108705 A JPH05108705 A JP H05108705A JP 3269240 A JP3269240 A JP 3269240A JP 26924091 A JP26924091 A JP 26924091A JP H05108705 A JPH05108705 A JP H05108705A
Authority
JP
Japan
Prior art keywords
translation
language
unit
words
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3269240A
Other languages
Japanese (ja)
Inventor
Yuji Ito
雄二 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3269240A priority Critical patent/JPH05108705A/en
Publication of JPH05108705A publication Critical patent/JPH05108705A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 原言語から相手言語への翻訳を行う際に、語
の多義性による訳し分けに、語と語の関係を集めた知識
ベースを利用することによってより正確に、また効率的
に翻訳処理を行うことを目的とする。 【構成】 入力手段1により入力された原言語文字列を
相手言語に翻訳するにあたり、語の多義性による訳し分
けの必要が生じた場合に、6の多義性解消部が、5の知
識ベースに記載されている、一般の文章中に現われる語
と語の関係を集めたデータを参照して多義性の解消を行
い、訳し分けを行う。
(57) [Summary] [Purpose] When translating from a source language into a partner language, it is more accurate by using a knowledge base that collects the relationships between words to distinguish between words based on polysemy. Moreover, it aims at performing translation processing efficiently. When the source language character string input by the input means 1 is translated into a partner language and it is necessary to perform transcribing based on the polysemy of words, the polysemy resolution unit 6 makes the knowledge base 5 Refer to the data that describes the relations between words that appear in ordinary sentences to resolve polysemy and perform translation.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、原言語の文字列を相手
言語の文字列に翻訳する機械翻訳装置に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device for translating a source language character string into a partner language character string.

【0002】[0002]

【従来の技術】近年、機械翻訳に代表されるように自然
言語処理技術への要請が高まってきている。
2. Description of the Related Art In recent years, there has been an increasing demand for natural language processing technology as represented by machine translation.

【0003】2言語間の翻訳を考えるとき、多義性の解
消が大きな問題となる。例えば、日英間の翻訳を考える
とき、「問題を解く」「荷物を解く」を英語に翻訳しよ
うとする場合、上の例では「解く」にあたる英語はso
lveであり、下の例ではuntieが適当である。
「解く」の多義性によるこのような訳し分けを行うため
に、従来は動詞(この場合は「解く」)の目的語(この
場合は「問題」と「荷物」)を意味的に分類しておき、
ある意味範疇に入る場合はある訳語を、また他の意味範
疇に入る場合は他の訳語を当てる、というような処理を
行っていた。
When considering translation between two languages, resolution of polysemy becomes a big problem. For example, when thinking about translating between Japanese and English, when trying to translate "solve a problem" and "unravel a package" into English, in the above example, the word "solve" is so
lve, and untie is suitable in the example below.
In order to perform such translation based on the polysemy of "solve," the object of the verb (in this case, "solve") (in this case, "problem" and "luggage") is semantically classified. Every
When a certain semantic category is entered, a certain translated word is applied, and when another semantic category is entered, another translated word is applied.

【0004】[0004]

【発明が解決しようとする課題】上記のように意味分類
により多義性を解消し、適切な語を選ぶという方法で
は、非常に多くの語について意味の分類を行わなければ
ならず、また、矛盾を起こさないようにその意味分類の
基準をつくることにも困難が伴うと考えられる。さら
に、そのような意味分類ですべての多義性が解消できる
わけではない。
In the method of eliminating polysemy by means of semantic classification and selecting an appropriate word as described above, it is necessary to classify meanings for a very large number of words, and inconsistencies. It may be difficult to create a criterion for the semantic classification so that the above does not occur. Moreover, such semantic classification does not eliminate all ambiguities.

【0005】[0005]

【課題を解決するための手段】上記のような問題を解決
するために、単語間の共起関係を集めた知識ベースを利
用することを考える。すなわち、実際に使われている文
の中から、語と語の共起の情報(例えば、上記の例のよ
うな「問題を解く」,「荷物を解く」など)を取り出
し、それに対応する相手言語での表現(この例では“s
olve a problem”,“untie a
package”など)を含めたデータを大量に準備し
ておく。そして、多義性の問題が生じた場合、この蓄え
られたデータを参照することによって適切な訳し分けを
行うことができる。先の例では、「解く」の多義性に対
して、「問題を解く」という文ならば、solveが訳
語として適切であるということがわかる。
[Means for Solving the Problems] In order to solve the above problems, consider using a knowledge base that collects co-occurrence relationships between words. In other words, information about co-occurrence of words (for example, “solve a problem”, “unravel a package”, etc.) is extracted from the sentence that is actually used, and the corresponding partner Expression in language (in this example, "s
"olve a problem", "untie a"
A large amount of data including "package" and the like) is prepared. When a problem of polysemy occurs, appropriate translation can be performed by referring to the stored data. Then, with respect to the polysemy of “solve”, it can be seen that if the sentence “solve a problem”, solve is appropriate as a translation.

【0006】[0006]

【作用】2言語間の翻訳を行うにあたり、語と語の関係
を集めた知識ベースを準備しておき、語の多義性による
訳し分けに利用することにより、効率的な翻訳処理を行
うことができるようになる。
When a translation between two languages is performed, a knowledge base that collects the relations between words is prepared and used for differentiating according to the polysemy of words, so that efficient translation processing can be performed. become able to.

【0007】[0007]

【実施例】以下、図面を参照しながら説明を行う。DESCRIPTION OF THE PREFERRED EMBODIMENTS A description will be given below with reference to the drawings.

【0008】図1は、本発明の一実施例における機械翻
訳装置の機能ブロック図である。同図において、1は原
言語の文字列の入力手段である。2は入力手段1から入
力される原言語の文字列を記憶する入力文字列記憶部、
3はそれぞれの言語に関する情報及び2言語間の対訳情
報等を持つ翻訳辞書部、4は翻訳辞書から解析対象の単
語を検索する辞書検索部である。5は原言語の語と語の
関係、及びその対訳を集めた知識ベース部、6は知識ベ
ース5を用いて、語の多義性による訳し分けを行う多義
性解消部である。7は解析結果を出力する解析結果出力
部、8は翻訳処理を制御する翻訳処理制御部である。
FIG. 1 is a functional block diagram of a machine translation device according to an embodiment of the present invention. In the figure, reference numeral 1 is an input means for inputting a character string in the source language. Reference numeral 2 denotes an input character string storage unit that stores a character string in the source language input from the input means 1.
Reference numeral 3 is a translation dictionary unit having information about each language and bilingual translation information, and the like, and 4 is a dictionary search unit that searches a translation dictionary for a word to be analyzed. Reference numeral 5 is a knowledge base unit that collects relations between words in the source language and their translations, and 6 is a ambiguity resolution unit that uses the knowledge base 5 to perform translation according to the polysemy of the words. Reference numeral 7 is an analysis result output unit that outputs an analysis result, and 8 is a translation processing control unit that controls translation processing.

【0009】図2は本発明の一実施例における処理の流
れを表わすフローチャートである。以下、本発明の一実
施例として日英の翻訳を取り上げ、このフローチャート
に従って本装置の動作について説明する。
FIG. 2 is a flow chart showing the flow of processing in one embodiment of the present invention. A Japanese-English translation will be taken up as an embodiment of the present invention, and the operation of the present apparatus will be described with reference to this flowchart.

【0010】まずステップ1で、入力された日本語文字
列に対し、翻訳処理制御部8が辞書検索部4により、翻
訳辞書部3を公知の検索法を使って検索して語に関する
情報を獲得し、翻訳処理を進めていく。
First, in step 1, the translation processing control unit 8 searches the translation dictionary unit 3 for the input Japanese character string by the dictionary search unit 4 using a known search method to obtain information about words. And proceed with the translation process.

【0011】次にステップ2では、翻訳処理の過程で、
ある語の多義性のために訳し分けを行う必要のあるとこ
ろがあるかどうかを判断する。訳し分けを行うべきとこ
ろがあればステップ3の処理を行い、なければそのまま
ステップ7の処理に進む。
Next, in step 2, in the process of translation processing,
Determine whether there is a need for translation due to the polysemy of a word. If there is a place to be translated, the process of step 3 is performed, and if not, the process proceeds to step 7 as it is.

【0012】ステップ3では多義性解消部6が、訳し分
けの必要な部分に対して図4の知識ベース部5に記載さ
れた知識データの中に、問題となっている語の訳し分け
に利用できるものがあるかどうかを判断する。ここで適
用できるデータがない場合はそのままステップ5に進
む。
In step 3, the disambiguation unit 6 is used for translating the word in question in the knowledge data described in the knowledge base unit 5 of FIG. Determine if there is something you can do. If there is no applicable data here, the process directly proceeds to step 5.

【0013】適用可能な知識があれば、ステップ4で多
義性の解消処理を行う。次に、ステップ6で多義性解消
の処理がすべて終ったかどうかを判断し、終っていれば
ステップ7へ進み、終っていなければ、ステップ3の処
理を繰り返す。
If there is applicable knowledge, ambiguousness resolution processing is performed in step 4. Next, in step 6, it is judged whether or not the processing for disambiguation has been completed. If completed, the processing proceeds to step 7, and if not completed, the processing in step 3 is repeated.

【0014】ステップ5では、翻訳処理制御部8が、使
用頻度などの情報を使って訳語をひとつに決定する。
In step 5, the translation processing control unit 8 determines one translated word by using information such as the frequency of use.

【0015】さらに、ステップ6では残りの処理を行
い、次のステップ7で翻訳結果を翻訳結果出力部7に出
力する。
Further, in step 6, the remaining processing is performed, and in the next step 7, the translation result is output to the translation result output unit 7.

【0016】さらに具体例を挙げて実際の処理を詳細に
説明する。次の例文を考える。「彼は、昨日、その問題
を解いた。」まずステップ1で辞書検索部4により翻訳
辞書部3を単語単位に検索しながら翻訳処理を進める。
この例では図3のように、「解いた」の部分に多義性に
よる訳し分けの必要が生じる(ステップ2)。
The actual processing will be described in more detail with reference to specific examples. Consider the following example sentence. "He solved the problem yesterday." First, in step 1, the dictionary search unit 4 searches the translation dictionary unit 3 word by word to proceed with the translation process.
In this example, as shown in FIG. 3, it is necessary to separately translate the "solved" portion due to polysemy (step 2).

【0017】次にステップ3で図4の知識ベース部の中
で「解く」に関するデータを検索する。ここで、「解
く」に関する知識データがみつかるので、ステップ4
で、多義性解消部6はそのデータを使って、この部分の
多義性解消処理を行う。この場合は、「解く」に対して
は「問題を解く」,「荷物を解く」の2つのデータがあ
り、入力文は「問題を解く」に該当するので、「解く」
の対訳としてはsolveが適当であると判断する。こ
こで、適当な知識データが無い場合は、前述のように使
用頻度などの情報によりどれかひとつを選択することに
なる(ステップ5)。次に、ステップ6で多義性の解消
が必要な部分が他にあるかどうかを判断する。この例で
は、他にないので次のステップ7に進み、残った処理を
行う。
Next, in step 3, the data regarding "solve" are searched in the knowledge base section of FIG. Here, since knowledge data about "solving" is found, step 4
Then, the ambiguity resolution unit 6 uses the data to perform the ambiguity resolution processing of this portion. In this case, there are two data for “solve” and “solve luggage” for “solve”, and the input sentence corresponds to “solve the problem”, so “solve”
It is determined that solve is appropriate as a parallel translation of. Here, if there is no appropriate knowledge data, one of them is selected according to the information such as the frequency of use as described above (step 5). Next, in step 6, it is determined whether or not there is another portion that needs to be disambiguated. In this example, since there is nothing else, the process proceeds to the next step 7, and the remaining processing is performed.

【0018】さらに次のステップで、翻訳の最終的な結
果を翻訳結果出力部7に出力する。この例では図5のよ
うな結果が出力されることになる。
In the next step, the final result of the translation is output to the translation result output unit 7. In this example, the result shown in FIG. 5 is output.

【0019】今は日英の翻訳を例として多義性解消の動
作を説明したが、逆に英日の場合でも同様に行うことが
できる。図3のtakeの例のように目的語が“act
ion”,“an examination”によって
訳が変わってくるが、このような場合にも知識データを
使って訳語選択を行うことができる。
Although the operation of disambiguation has been described by taking a Japanese-English translation as an example, it can be similarly performed in the case of English-Japanese. As in the example of take in FIG. 3, the object is “act.
Although the translation varies depending on "ion" and "an examination", the translated word can be selected using the knowledge data even in such a case.

【0020】[0020]

【発明の効果】上記のように、2言語間の翻訳を行うに
あたり、語と語の関係を集めた知識ベースを準備してお
き、語の多義性による訳し分けに利用することにより、
効率的な翻訳処理を行うことができるようになる。
As described above, in translating between two languages, a knowledge base that collects relations between words is prepared and used for transcribing according to the polysemy of words.
It becomes possible to perform efficient translation processing.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における、機械翻訳装置の機
能ブロック図
FIG. 1 is a functional block diagram of a machine translation device according to an embodiment of the present invention.

【図2】本発明の一実施例における、翻訳処理の動作を
表わすフローチャート
FIG. 2 is a flowchart showing an operation of a translation process in the embodiment of the present invention.

【図3】本発明の一実施例における、多義性が生じる例
を示す図
FIG. 3 is a diagram showing an example in which polysemy occurs in one embodiment of the present invention.

【図4】本発明の一実施例における、知識ベースのデー
タの例を示す図
FIG. 4 is a diagram showing an example of knowledge base data according to an embodiment of the present invention.

【図5】本発明の一実施例における、多義性解消の結果
を示す図
FIG. 5 is a diagram showing a result of disambiguation according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 入力手段 2 入力文字列記憶部 3 翻訳辞書部 4 辞書検索部 5 知識ベース部 6 多義性解消部 7 解析結果出力部 8 翻訳処理制御部 DESCRIPTION OF SYMBOLS 1 Input means 2 Input character string storage unit 3 Translation dictionary unit 4 Dictionary search unit 5 Knowledge base unit 6 Ambiguity resolution unit 7 Analysis result output unit 8 Translation processing control unit

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】原言語文字列を入力する入力手段と、入力
された文字列を記憶する入力文字列記憶部と、原言語単
語と相手言語の形態素情報、原言語と相手言語の対訳情
報等を保持している翻訳辞書部と、前記翻訳辞書を検索
する辞書検索部と、原言語における単語間の共起関係
と、それに対応する相手言語の表現を集めた知識ベース
部と、前記知識ベース部を用いて、入力文字列を相手言
語に翻訳する際に生じる多義性を解消する多義性解消部
と、翻訳処理結果を出力する翻訳結果出力部と、原言語
と相手言語間の翻訳処理を制御する翻訳処理実行制御部
とを備えたことを特徴とする機械翻訳装置。
1. An input means for inputting a source language character string, an input character string storage section for storing the input character string, a morpheme information of a source language word and a partner language, a bilingual information of a source language and a partner language, and the like. A translation dictionary unit that holds the translation dictionary, a dictionary search unit that searches the translation dictionary, a co-occurrence relationship between words in the source language, and a knowledge base unit that collects corresponding expressions in the other language, and the knowledge base. Section, the ambiguity resolution unit that resolves the ambiguity that occurs when translating an input character string into the partner language, the translation result output unit that outputs the translation processing result, and the translation process between the source language and the partner language. A machine translation device comprising a translation process execution control unit for controlling.
JP3269240A 1991-10-17 1991-10-17 Machine translation device Pending JPH05108705A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3269240A JPH05108705A (en) 1991-10-17 1991-10-17 Machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3269240A JPH05108705A (en) 1991-10-17 1991-10-17 Machine translation device

Publications (1)

Publication Number Publication Date
JPH05108705A true JPH05108705A (en) 1993-04-30

Family

ID=17469609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3269240A Pending JPH05108705A (en) 1991-10-17 1991-10-17 Machine translation device

Country Status (1)

Country Link
JP (1) JPH05108705A (en)

Similar Documents

Publication Publication Date Title
US7565281B2 (en) Machine translation
JP3906356B2 (en) Syntax analysis method and apparatus
US7447623B2 (en) Machine translation
JP3114181B2 (en) Interlingual communication translation method and system
US20050137853A1 (en) Machine translation
JP2006012168A (en) How to improve coverage and quality in a translation memory system
JPS6299865A (en) How to maintain a natural language co-occurrence relationship dictionary
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
JP2632806B2 (en) Language analyzer
JP2838984B2 (en) General-purpose reference device
Rikters et al. Combining machine translated sentence chunks from multiple MT systems
JPH05108705A (en) Machine translation device
Sandha et al. Machine Translation from English to Regional Languages Using Transformer Model
JPH0561902A (en) Mechanical translation system
Nasukawa Discourse constraint in computer manuals
Karibayeva et al. The Translation Quality Problems of Machine Translation Systems for the Kazakh Language
JP4033089B2 (en) Natural language processing system, natural language processing method, and computer program
JP2008077512A (en) Document analysis device, document analysis method and computer program
Kaur et al. Machine Translation: An Analytical Study
JPH05158970A (en) Machine translation system
JP2003308319A (en) Device for selecting translation, translator, program for selecting translation, and translation program
MR Role of Natural Language Processing and Machine Learning on (MTS)-Machine Translation System for Indian Languages: A Review.
JP3388393B2 (en) Translation device for tense, aspect or modality using database
JPH0320866A (en) Text base retrieval system
JP4023384B2 (en) Natural language translation method and apparatus and natural language translation program