JPH0683861A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH0683861A JPH0683861A JP3119837A JP11983791A JPH0683861A JP H0683861 A JPH0683861 A JP H0683861A JP 3119837 A JP3119837 A JP 3119837A JP 11983791 A JP11983791 A JP 11983791A JP H0683861 A JPH0683861 A JP H0683861A
- Authority
- JP
- Japan
- Prior art keywords
- proverb
- idiom
- intermediate structure
- dictionary
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 本発明は、単語間に混じている諺や慣用句及
びそれらに関連する多義性を同時に解決することができ
る演算処理方法、且つ参照できる諺慣用句辞書により品
質の高い機械翻訳装置を提供することを目的とする。 【構成】 中間構造生成部200は入力された文に対し
て、解析辞書250を参照しながら、構文、語意の解析
を行い、原始言語に依存する中間構造を獲得する。原始
言語諺慣用句処理部300はバッフア900から原始言
語の中間構造を読み出して、諺慣用句辞書350を参照
し、中間構造に含まれている諺や慣用句のノードを一つ
の形態素として、一つのノードにする。そして、改めて
新しい意味コードを与え、該当諺や慣用句に関連するノ
ードを削除してから、処理結果をバッファ900に記憶
する。
びそれらに関連する多義性を同時に解決することができ
る演算処理方法、且つ参照できる諺慣用句辞書により品
質の高い機械翻訳装置を提供することを目的とする。 【構成】 中間構造生成部200は入力された文に対し
て、解析辞書250を参照しながら、構文、語意の解析
を行い、原始言語に依存する中間構造を獲得する。原始
言語諺慣用句処理部300はバッフア900から原始言
語の中間構造を読み出して、諺慣用句辞書350を参照
し、中間構造に含まれている諺や慣用句のノードを一つ
の形態素として、一つのノードにする。そして、改めて
新しい意味コードを与え、該当諺や慣用句に関連するノ
ードを削除してから、処理結果をバッファ900に記憶
する。
Description
【0001】
【産業上の利用分野】本発明は定型文ではない、単語間
に混じている諺や慣用句及びその関連の多義性を自動的
に処理することができる機械翻訳装置に関するものであ
る。
に混じている諺や慣用句及びその関連の多義性を自動的
に処理することができる機械翻訳装置に関するものであ
る。
【0002】
【従来の技術】二十世紀は新しい情報がどんどん出てき
ており、知識爆発時代といえるだろう。皆、時代に淘汰
されないように絶えず知識を吸収しなければならない。
だが、できた知識は国内だけではなく、外国からもあ
る。尚、普通の人は母国語を読むスピードが外国語より
早いから、翻訳の重要性は言うまでもないことである。
翻訳の質及び効率を向上するために、人手の代わりに機
械による何らかの方法、つまり機械翻訳システムを考え
なければならない時代になってきたわけである。機械翻
訳システムでは、入力され翻訳される言語を原始言語
と、翻訳され出力される言語を目的言語とする。中間転
換方式を採用する機械翻訳装置は一般的に図8に示すよ
うに、 (1)原始言語解析部 (2)中間構造転換部 (3)目的言語生成部 (4)参照用字典、辞書 という四つの部分から構成される。機械翻訳の品質は、
原始言語解析部で入力された語句を正確的に解析した
か、また中間構造転換部で原始言語と目的言語との差異
を解消したか、目的言語生成部で目的言語の生成文法規
則に基づいて正確的に目的言語を生成したか、というこ
とによくかかっている。とりわけ、翻訳の対象が諺、慣
用句などの定型文である場合、各語句が文法正しい掛り
受け関係を満足しないものが多く、その結果、翻訳不可
となったり、形式的に文法上の掛り受けを満足しても各
語句毎の訳語句に基づき生成された訳文がまったく意味
をなさない訳文となってしまったりすることが多く、翻
訳の品質が低下する。例えば、 How do you do?(慣用句) に対して、慣用句の解析処理を無視し、普通の英文解析
を行うと、解析結果は図14のようになる。
ており、知識爆発時代といえるだろう。皆、時代に淘汰
されないように絶えず知識を吸収しなければならない。
だが、できた知識は国内だけではなく、外国からもあ
る。尚、普通の人は母国語を読むスピードが外国語より
早いから、翻訳の重要性は言うまでもないことである。
翻訳の質及び効率を向上するために、人手の代わりに機
械による何らかの方法、つまり機械翻訳システムを考え
なければならない時代になってきたわけである。機械翻
訳システムでは、入力され翻訳される言語を原始言語
と、翻訳され出力される言語を目的言語とする。中間転
換方式を採用する機械翻訳装置は一般的に図8に示すよ
うに、 (1)原始言語解析部 (2)中間構造転換部 (3)目的言語生成部 (4)参照用字典、辞書 という四つの部分から構成される。機械翻訳の品質は、
原始言語解析部で入力された語句を正確的に解析した
か、また中間構造転換部で原始言語と目的言語との差異
を解消したか、目的言語生成部で目的言語の生成文法規
則に基づいて正確的に目的言語を生成したか、というこ
とによくかかっている。とりわけ、翻訳の対象が諺、慣
用句などの定型文である場合、各語句が文法正しい掛り
受け関係を満足しないものが多く、その結果、翻訳不可
となったり、形式的に文法上の掛り受けを満足しても各
語句毎の訳語句に基づき生成された訳文がまったく意味
をなさない訳文となってしまったりすることが多く、翻
訳の品質が低下する。例えば、 How do you do?(慣用句) に対して、慣用句の解析処理を無視し、普通の英文解析
を行うと、解析結果は図14のようになる。
【0003】中国語の訳語は「
【0004】
【外1】
【0005】如何作?(あなたはどうするか)」とな
り、「
り、「
【0006】
【外2】
【0007】好!(こんにちは)」と正しく翻訳される
ことができない。この問題点を解決するために、従来の
技術、例えば日本特開昭 62−82464 号公報の機械翻訳
システムにおいて、諺、慣用句などの定型文の翻訳がよ
り適切に行えるようにしたシステムが提案されている。
この機械翻訳システムは図9に示すようなものである。
図9において、入力部1は原始言語の入力を行う。編集
制御部4は翻訳処理前、後の二種言語の編集を処理す
る。原文記憶部2及び訳文記憶部3はそれぞれ処理中の
原文及び訳文を記憶する。翻訳部5は翻訳の処理をす
る。翻訳辞書6は図12に示しているように、6a〜6
gの七部分に分けられ、翻訳処理に検索の必要のある辞
書である。表示制御部7は表示部8の画面表示を処理す
る。印刷部9はファイルや画面の内容をプリントする。
翻訳部5の処理流れは図10のように、s71は翻訳辞
書6の定型文辞書6gを参照して、入力された原始言語
は定型文であるかを判定する。定型文であれば、s72
の処理を行い、すなわち、定型文辞書6gから日本語の
訳文を取り出して、次にs73により訳文を出力する。
s71により定型文ではないと判定される場合は、s7
4により一般の翻訳処理を行う。詳細な流れは図11に
示す。まず形態素解析s51により規則・不規則変化辞
書6aを参照して、形態素の解析を行う。次に辞書検索
s52により単語・熟語辞書6bを参照して、処理の必
要のある形態素を探し出してから、s53、s54、s
55により解析文法6c、変換文法6dを参照して、構
文解析及び構造変換を繰り返して行い、適当な目的言語
の中間構造を見つける。そして、構文生成s56により
生成文法6eを参照しながら、目的言語の表層構造を生
成する。最後に、形態素生成s57により形態素生成文
法6fを参照して、適当な訳語を選び出す。以上の処理
ステップは一般の翻訳処理と言われる。下記の英文を例
として、この従来例により図13に示している定型文辞
書を参照しながら、図10のs71では下記の英文を定
型文と判定するので、s72により定型文辞書から、マ
ッチングを行い、訳語を取り出してから、s73を介し
て翻訳結果を出力する。下記のような正しい処理結果が
得られる。
ことができない。この問題点を解決するために、従来の
技術、例えば日本特開昭 62−82464 号公報の機械翻訳
システムにおいて、諺、慣用句などの定型文の翻訳がよ
り適切に行えるようにしたシステムが提案されている。
この機械翻訳システムは図9に示すようなものである。
図9において、入力部1は原始言語の入力を行う。編集
制御部4は翻訳処理前、後の二種言語の編集を処理す
る。原文記憶部2及び訳文記憶部3はそれぞれ処理中の
原文及び訳文を記憶する。翻訳部5は翻訳の処理をす
る。翻訳辞書6は図12に示しているように、6a〜6
gの七部分に分けられ、翻訳処理に検索の必要のある辞
書である。表示制御部7は表示部8の画面表示を処理す
る。印刷部9はファイルや画面の内容をプリントする。
翻訳部5の処理流れは図10のように、s71は翻訳辞
書6の定型文辞書6gを参照して、入力された原始言語
は定型文であるかを判定する。定型文であれば、s72
の処理を行い、すなわち、定型文辞書6gから日本語の
訳文を取り出して、次にs73により訳文を出力する。
s71により定型文ではないと判定される場合は、s7
4により一般の翻訳処理を行う。詳細な流れは図11に
示す。まず形態素解析s51により規則・不規則変化辞
書6aを参照して、形態素の解析を行う。次に辞書検索
s52により単語・熟語辞書6bを参照して、処理の必
要のある形態素を探し出してから、s53、s54、s
55により解析文法6c、変換文法6dを参照して、構
文解析及び構造変換を繰り返して行い、適当な目的言語
の中間構造を見つける。そして、構文生成s56により
生成文法6eを参照しながら、目的言語の表層構造を生
成する。最後に、形態素生成s57により形態素生成文
法6fを参照して、適当な訳語を選び出す。以上の処理
ステップは一般の翻訳処理と言われる。下記の英文を例
として、この従来例により図13に示している定型文辞
書を参照しながら、図10のs71では下記の英文を定
型文と判定するので、s72により定型文辞書から、マ
ッチングを行い、訳語を取り出してから、s73を介し
て翻訳結果を出力する。下記のような正しい処理結果が
得られる。
【0008】 How do you do?(英文原文) はじめまして (日文訳文)
【0009】
【本発明が解決しようとする課題】入力された原文は語
順の自由度のため、諺や慣用句は定型文ではなくて、単
語間に混じている場合は、例えば、「身に付ける」とい
う定型文を辞書に「穿上」という中国語訳語として登録
すれば、下記のような誤りが出る。 第1例 彼は身にコートを付ける。(原文) 他在身上穿大衣。 (従来技術の中国語訳語) 他*穿上*大衣。 (適切な中国語訳語) 第2例 彼は技術を身に付ける。 (原文) 他穿上技術。 (従来技術の中国語訳語) 他*学習*技術。 (適切な中国語訳語) 第1例は語順の自由度のためで、定型文のマッチングを
することができないので、適当な訳語を獲得することが
できない。第2例は慣用句や諺の多義性 (polysemy) に
したがって発生した誤りである。
順の自由度のため、諺や慣用句は定型文ではなくて、単
語間に混じている場合は、例えば、「身に付ける」とい
う定型文を辞書に「穿上」という中国語訳語として登録
すれば、下記のような誤りが出る。 第1例 彼は身にコートを付ける。(原文) 他在身上穿大衣。 (従来技術の中国語訳語) 他*穿上*大衣。 (適切な中国語訳語) 第2例 彼は技術を身に付ける。 (原文) 他穿上技術。 (従来技術の中国語訳語) 他*学習*技術。 (適切な中国語訳語) 第1例は語順の自由度のためで、定型文のマッチングを
することができないので、適当な訳語を獲得することが
できない。第2例は慣用句や諺の多義性 (polysemy) に
したがって発生した誤りである。
【0010】本発明は上記の欠点に鑑み、単語間に混じ
ている諺や慣用句及びそれらに関連する多義性を同時に
解決することができる演算処理方法、且つ参照できる諺
慣用句辞書により品質の高い機械翻訳装置を提供するこ
とを目的とする。
ている諺や慣用句及びそれらに関連する多義性を同時に
解決することができる演算処理方法、且つ参照できる諺
慣用句辞書により品質の高い機械翻訳装置を提供するこ
とを目的とする。
【0011】
【課題を解決するための手段】本発明は、原始言語の各
諺や慣用句に対して該当諺や慣用句の主形態素を検索キ
ーとして主形態素、主形態素及び副形態素の関連情報、
該当主形態素のすべての諺や慣用句及びそれらに対応す
る意味コードを記憶する諺慣用句辞書と、入力された原
始言語を解析して得られた中間構造を前記諺慣用句辞書
に記憶されている情報と比較して所定条件に合う諺や慣
用句の文を一つのノードにする諺慣用句処理部と、処理
された中間構造のノード数などの情報により入力された
文が単純な諺や慣用句であるかを判断する中間構造判別
部と、該当原始言語の各諺及び慣用句に対応する品詞コ
ード、意味コード、意味支配コード及び対応する目的言
語の訳語を記憶する訳語選択辞書を備えたことを特徴と
する機械翻訳装置である。
諺や慣用句に対して該当諺や慣用句の主形態素を検索キ
ーとして主形態素、主形態素及び副形態素の関連情報、
該当主形態素のすべての諺や慣用句及びそれらに対応す
る意味コードを記憶する諺慣用句辞書と、入力された原
始言語を解析して得られた中間構造を前記諺慣用句辞書
に記憶されている情報と比較して所定条件に合う諺や慣
用句の文を一つのノードにする諺慣用句処理部と、処理
された中間構造のノード数などの情報により入力された
文が単純な諺や慣用句であるかを判断する中間構造判別
部と、該当原始言語の各諺及び慣用句に対応する品詞コ
ード、意味コード、意味支配コード及び対応する目的言
語の訳語を記憶する訳語選択辞書を備えたことを特徴と
する機械翻訳装置である。
【0012】
【作用】本発明は機械翻訳装置の原始言語解析部及び中
間構造転換部のうちに、諺慣用句処理部を設けて、原始
言語の中間構造(解析結果)にの諺や慣用句について処
理を行い、定型文のマッチング処理の欠点を解決する。
それから、他の処理が必要であるかを判断する中間構造
判別部を設けているにつれて無駄な処理を減らす。本機
械翻訳装置は単に単語間に混じている慣用句や諺を処理
するだけではなく、処理中に意味コードを修正したり、
無駄な、長すぎるノードを削除するなどの手段により、
慣用句や諺の多義性を解決することができる。更に、原
始言語の中間構造をよりきれいに且つ適当に修正するこ
とができるので、翻訳の品質及び効率を向上することが
できる。
間構造転換部のうちに、諺慣用句処理部を設けて、原始
言語の中間構造(解析結果)にの諺や慣用句について処
理を行い、定型文のマッチング処理の欠点を解決する。
それから、他の処理が必要であるかを判断する中間構造
判別部を設けているにつれて無駄な処理を減らす。本機
械翻訳装置は単に単語間に混じている慣用句や諺を処理
するだけではなく、処理中に意味コードを修正したり、
無駄な、長すぎるノードを削除するなどの手段により、
慣用句や諺の多義性を解決することができる。更に、原
始言語の中間構造をよりきれいに且つ適当に修正するこ
とができるので、翻訳の品質及び効率を向上することが
できる。
【0013】
【実施例】図1は本発明の一実施例における機械翻訳装
置の構成を示すブロック図である。図1において、10
0は処理しようとする原始言語をシステムに入力する入
力部である。200は入力された文に対して、解析辞書
250を参照しながら、構文、語意の解析を行い、原始
言語に依存する中間構造を獲得する原始言語解析中間構
造生成部である。300はバッフア900から原始言語
の中間構造を読み出して、諺慣用句辞書350を参照
し、中間構造に含まれている諺や慣用句のノードを一つ
の形態素として、一つのノードにする。そして、改めて
新しい意味コードを与え、該当諺や慣用句に関連するノ
ードを削除してから、処理結果をバッファ900に記憶
する諺慣用句処理部である。諺慣用句処理部300の処
理流れは図2、図3に示す。図5は諺慣用句辞書350
の構造の一部を示す説明図である。諺慣用句辞書350
には主形態素、主形態素制限要素、補助検索要素、慣用
句、関連意味コードなどの情報を載っている。中間構造
判別部400はバッファ900から原始言語の中間構造
を取り出して、図4に示している処理流れにより、単純
な諺或いは慣用句であるかを判定して、判定結果(IDOM
フラグ値)をバッファ900に記憶する。概念構造転換
部500は上記中間構造判別部400の判定結果によ
り、下記の動作を行う。(1)判定結果が単純な諺や慣用句である場合 目的言語の生成処理をする必要がなくて、訳語選択部6
00により直接的に諺や慣用句を目的言語に変換するこ
とができる。(2)判定結果が単純な諺や慣用句でない場合 バッファ900から原始言語の中間構造を取り出して、
差異調整転換辞書550を参照して、原始言語の語意、
構文に依存する中間構造を目的言語に依存する中間構造
に転換してから、転換結果をバッファ900に記憶す
る。訳語選択部600はバッファ900から目的言語の
中間構造を取り出して、訳語選択辞書650を参照し
て、中間構造の各ノードの訳語を決定してから、その処
理結果をバッファ900に記憶する。目的言語生成部7
00は上記の中間構造判別部400の判定結果が単純な
諺や慣用句である場合は、処理する必要がない。だが、
単純な諺や慣用句でない場合はバッファ900から中間
構造を取り出して、目的言語の生成文法により目的言語
を生成し、翻訳結果をバッファ900に記憶する。最後
にバッファ900の翻訳結果をプリント等組当てた出力
部800により出力する。
置の構成を示すブロック図である。図1において、10
0は処理しようとする原始言語をシステムに入力する入
力部である。200は入力された文に対して、解析辞書
250を参照しながら、構文、語意の解析を行い、原始
言語に依存する中間構造を獲得する原始言語解析中間構
造生成部である。300はバッフア900から原始言語
の中間構造を読み出して、諺慣用句辞書350を参照
し、中間構造に含まれている諺や慣用句のノードを一つ
の形態素として、一つのノードにする。そして、改めて
新しい意味コードを与え、該当諺や慣用句に関連するノ
ードを削除してから、処理結果をバッファ900に記憶
する諺慣用句処理部である。諺慣用句処理部300の処
理流れは図2、図3に示す。図5は諺慣用句辞書350
の構造の一部を示す説明図である。諺慣用句辞書350
には主形態素、主形態素制限要素、補助検索要素、慣用
句、関連意味コードなどの情報を載っている。中間構造
判別部400はバッファ900から原始言語の中間構造
を取り出して、図4に示している処理流れにより、単純
な諺或いは慣用句であるかを判定して、判定結果(IDOM
フラグ値)をバッファ900に記憶する。概念構造転換
部500は上記中間構造判別部400の判定結果によ
り、下記の動作を行う。(1)判定結果が単純な諺や慣用句である場合 目的言語の生成処理をする必要がなくて、訳語選択部6
00により直接的に諺や慣用句を目的言語に変換するこ
とができる。(2)判定結果が単純な諺や慣用句でない場合 バッファ900から原始言語の中間構造を取り出して、
差異調整転換辞書550を参照して、原始言語の語意、
構文に依存する中間構造を目的言語に依存する中間構造
に転換してから、転換結果をバッファ900に記憶す
る。訳語選択部600はバッファ900から目的言語の
中間構造を取り出して、訳語選択辞書650を参照し
て、中間構造の各ノードの訳語を決定してから、その処
理結果をバッファ900に記憶する。目的言語生成部7
00は上記の中間構造判別部400の判定結果が単純な
諺や慣用句である場合は、処理する必要がない。だが、
単純な諺や慣用句でない場合はバッファ900から中間
構造を取り出して、目的言語の生成文法により目的言語
を生成し、翻訳結果をバッファ900に記憶する。最後
にバッファ900の翻訳結果をプリント等組当てた出力
部800により出力する。
【0014】図2、図3は原始言語諺慣用句処理部30
0の処理流れ図である。図2、図3において、ステップ
201は原始言語の中間構造に対してマッチング処理を
して、PROCフラグ(PROCフラグにより中間構造のあるノ
ードは処理されたかを判断する)は1ではないノードを
捜し出す。そういうノードがなかったら、原始言語諺慣
用句処理部300の動作を終えて、図1の中間構造判別
部400に入る。もし、PROCフラグは1ではないノード
があれば、続いてステップ202により、このノードの
属性は修飾語であるかを判断する。修飾語である場合
は、ステップ230の処理に入り、このノードのPROCフ
ラグを1に設定する。そして、ステップ201の処理に
戻る。修飾語ではない場合は、ステップ203により判
定して葉ノード(子ノードがないノード)と判定する
と、204の処理に入り、該当ノードの形態素により、
図1の諺慣用句辞書350を参照し、諺や慣用句がある
かどうかを判定する。諺や慣用句がないと判定すると、
ステップ230の処理をを行う。諺や慣用句がある場合
はステップ205の処理を行い、諺慣用句辞書350か
ら、関連のあるすべての諺や慣用句集合S(i)を捜し出し
てから、ステップ206の処理に入る。処理されている
ノードに子ノードが葉ノードであるノードを取り出して
集合Yとする。そして、集合Yと集合S(i)との論理積演算
をして、獲得する可能性のある諺や慣用句の集合をM(i)
とする。それから、ステップ208の判断処理を行い、
すべてのM(i)は空集合であれば、諺や慣用句がないこと
を意味するので、諺慣用句処理部300の処理を終え
て、図1の中間構造判別部400の処理に入る。空集合
ではない場合は、ステップ209の処理を行い、上記の
諺慣用句辞書350を参照して主形態素制限要素L(i)を
取り出して、そしてステップ210の主形態素のノード
属性値から助動詞情報Aを取り出してから、L(i)と集合A
との論理積演算を行い、判断用の集合J(i)を獲得するよ
うにする。図2のステップ201では、上記得られた集
合J(i)が空集合であるかどうかを判断する。空集合であ
れば、ステップ230の処理を行い、空集合ではない場
合は、上記の諺慣用句辞書350を参照して、M(i)を検
索キーとして、慣用句X及び新しい意味コードYを捜し出
す。ステップ216、217の処理により、中間構造に
対して修正したり、長すぎるノードを削除してから、上
記のステップ230の処理に戻る。図4は中間構造判別
部400の処理を示すフロチャートである。図4におい
て、ステップ301は中間構造に対して、該当ノードは
単純な諺や慣用句であるかを判断するために、単一なノ
ードであるかを検査して、単一なノードであれば、ステ
ップ302の処理を行い、IDOMフラグ値を1に設定し
て、単一なノードでない場合は、ステップ303の処理
を行い、IDOMフラグ値をゼロに設定する。日中翻訳を例
として本発明の機械翻訳装置の動作を説明する。
0の処理流れ図である。図2、図3において、ステップ
201は原始言語の中間構造に対してマッチング処理を
して、PROCフラグ(PROCフラグにより中間構造のあるノ
ードは処理されたかを判断する)は1ではないノードを
捜し出す。そういうノードがなかったら、原始言語諺慣
用句処理部300の動作を終えて、図1の中間構造判別
部400に入る。もし、PROCフラグは1ではないノード
があれば、続いてステップ202により、このノードの
属性は修飾語であるかを判断する。修飾語である場合
は、ステップ230の処理に入り、このノードのPROCフ
ラグを1に設定する。そして、ステップ201の処理に
戻る。修飾語ではない場合は、ステップ203により判
定して葉ノード(子ノードがないノード)と判定する
と、204の処理に入り、該当ノードの形態素により、
図1の諺慣用句辞書350を参照し、諺や慣用句がある
かどうかを判定する。諺や慣用句がないと判定すると、
ステップ230の処理をを行う。諺や慣用句がある場合
はステップ205の処理を行い、諺慣用句辞書350か
ら、関連のあるすべての諺や慣用句集合S(i)を捜し出し
てから、ステップ206の処理に入る。処理されている
ノードに子ノードが葉ノードであるノードを取り出して
集合Yとする。そして、集合Yと集合S(i)との論理積演算
をして、獲得する可能性のある諺や慣用句の集合をM(i)
とする。それから、ステップ208の判断処理を行い、
すべてのM(i)は空集合であれば、諺や慣用句がないこと
を意味するので、諺慣用句処理部300の処理を終え
て、図1の中間構造判別部400の処理に入る。空集合
ではない場合は、ステップ209の処理を行い、上記の
諺慣用句辞書350を参照して主形態素制限要素L(i)を
取り出して、そしてステップ210の主形態素のノード
属性値から助動詞情報Aを取り出してから、L(i)と集合A
との論理積演算を行い、判断用の集合J(i)を獲得するよ
うにする。図2のステップ201では、上記得られた集
合J(i)が空集合であるかどうかを判断する。空集合であ
れば、ステップ230の処理を行い、空集合ではない場
合は、上記の諺慣用句辞書350を参照して、M(i)を検
索キーとして、慣用句X及び新しい意味コードYを捜し出
す。ステップ216、217の処理により、中間構造に
対して修正したり、長すぎるノードを削除してから、上
記のステップ230の処理に戻る。図4は中間構造判別
部400の処理を示すフロチャートである。図4におい
て、ステップ301は中間構造に対して、該当ノードは
単純な諺や慣用句であるかを判断するために、単一なノ
ードであるかを検査して、単一なノードであれば、ステ
ップ302の処理を行い、IDOMフラグ値を1に設定し
て、単一なノードでない場合は、ステップ303の処理
を行い、IDOMフラグ値をゼロに設定する。日中翻訳を例
として本発明の機械翻訳装置の動作を説明する。
【0015】「彼は借金で首が回らぬ」という原始言語
の文を入力部100により入力されて、原始言語解析中
間構造生成部200の処理を経て、図6に示している原
始言語中間構造を獲得することができる。次に、原始言
語諺慣用句処理部300により、図2、図3の流れのよ
うに処理する。図2のステップ201では、図6に示し
ている中間構造に対して、上から下まで、また右から左
まで中間構造の PROCフラグ値は1ではないノードを捜
し出す。すると、ノード「回る」が見つかれる。したが
って、ステップ202の判断処理により、このノードは
修飾語ではない(例えば、埋め込文など)ので、ステッ
プ203の処理に入る。図6の中間構造により「回る」
ノードは葉ノードではないことがよく判断できるので、
ステップ204の処理に入る。図1の諺慣用句辞書35
0には形態素「回る」を検索キーとしての諺慣用句情報
を記憶されているので、ノード「回る」には関連する
諺、慣用句があるという判断を行ない、ステップ205
の処理に入る。図5に示している諺慣用句辞書に、形態
素「回る」を検索キーとしてのすべての関連諺慣用句の
補助検索要素集合Sは下記のようになる。
の文を入力部100により入力されて、原始言語解析中
間構造生成部200の処理を経て、図6に示している原
始言語中間構造を獲得することができる。次に、原始言
語諺慣用句処理部300により、図2、図3の流れのよ
うに処理する。図2のステップ201では、図6に示し
ている中間構造に対して、上から下まで、また右から左
まで中間構造の PROCフラグ値は1ではないノードを捜
し出す。すると、ノード「回る」が見つかれる。したが
って、ステップ202の判断処理により、このノードは
修飾語ではない(例えば、埋め込文など)ので、ステッ
プ203の処理に入る。図6の中間構造により「回る」
ノードは葉ノードではないことがよく判断できるので、
ステップ204の処理に入る。図1の諺慣用句辞書35
0には形態素「回る」を検索キーとしての諺慣用句情報
を記憶されているので、ノード「回る」には関連する
諺、慣用句があるという判断を行ない、ステップ205
の処理に入る。図5に示している諺慣用句辞書に、形態
素「回る」を検索キーとしてのすべての関連諺慣用句の
補助検索要素集合Sは下記のようになる。
【0016】 S(1)=((首が)(借金で)) S(2)=((手が)) S(3)=((目が)) S(4)=((頭が)) S(5)=((舌が)) S(6)=((気が)) 次に、図2のステップ206の処理に入り、図6の中間
構造により下記のように葉ノード集合Yを獲得すること
ができる。
構造により下記のように葉ノード集合Yを獲得すること
ができる。
【0017】Y=((首が)(借金で)(彼は)) そして、図2のステップ207の処理に入る。ここで、
M(i)=S(i)∩Y,i=1〜6である。その処理結果は下記の
ようになる。
M(i)=S(i)∩Y,i=1〜6である。その処理結果は下記の
ようになる。
【0018】 M(1)=((首が)(借金で)) M(2)=Ф : M(6)=Ф そして、ステップ206の処理に入り、M(i)は空集合で
はないので、ステップ209の処理に入る。諺慣用句辞
書によると、下のようになる。
はないので、ステップ209の処理に入る。諺慣用句辞
書によると、下のようになる。
【0019】L(1)=(ない ん ぬ まい ず) 次に、図3のステップ210の処理に入り、形態素「回
る」の助動詞属性集合A=(ん)ので、J(i)=L(1)。腆の処
理を行うと、J(1)だけは空集合ではないという結果が見
つかれる。続いて、図3のステップ211の判断処理で
ある。J(1)は空集合ではないので、ステップ215に入
る。諺慣用句辞書及び補助検索キーM(1)により、 X(慣用句)=借金で首が回らぬ Y(新意味コード)=M371 という処理結果が得られる。ステップ216に入り、
X、Yにより図6の中間構造の形態素「回る」ノードの形
態素及び意味コード属性値を代わってから、ステップ2
17の処理により、M(1)及びL(1)に含まれているノー
ド、属性値が既にステップ216に処理されたので、無
駄な、長過ぎるなノード及び属性値はここで削除するこ
とができる。図6の例によれば、この処理結果が図6の
右の説明例のように、「借金」及び「首」という二つの
ノード、及び形態素「回る」の助動詞属性「ん」等が削
除されるわけである。次に、図3のステップ230に入
り、形態素「回る」ノードの属性PROCを1に設定する
と、ステップ210に戻って、中間構造からPROCは1で
はないノード「彼」を見つけてからステップ202に入
り、ノード「彼」は修飾語ではないので、ステップ23
0に入り、このノードのPROCを1に設定してから、ステ
ップ201に戻って、このとき、中間構造にのPROCは1
ではないノードがないので、図1の原始言語諺慣用句処
理部300の処理が終わる。続いて、図4の処理流れの
ように中間構造判別部400の処理に入る。図4におい
て、まずステップ301の判別処理に入り、図6の右の
説明例に示すように、中間構造はただ二つのノードが残
っているので、この入力文は定型文ではないことを判定
することができるので、ステップ303に入り、フラグ
IDOMをゼロに設定してから、中間構造判別部400の処
理を終える。そして、図1の概念構造転換部500の処
理に入る。図6に示しているノードのフラグIDON値はゼ
ロであるので、図1の差異調整転換辞書550を参照を
して、中国語と日本語との語意、構文などの差異を調整
する。その後、図1の訳語選択部600により、図7に
示すような訳語選択辞書650を参照して、中間構造の
各ノードの形態素を決める。例えば、「彼」の訳語は
「他」で、「借金で首が回らぬ」の訳語は「債臺高築」
である。続いて、目的言語生成部700により、中文の
表層構造を生成して、この例の生成訳文「他債臺高築」
となる。最後に、図1の出力部800により、翻訳結果
を出力する。
る」の助動詞属性集合A=(ん)ので、J(i)=L(1)。腆の処
理を行うと、J(1)だけは空集合ではないという結果が見
つかれる。続いて、図3のステップ211の判断処理で
ある。J(1)は空集合ではないので、ステップ215に入
る。諺慣用句辞書及び補助検索キーM(1)により、 X(慣用句)=借金で首が回らぬ Y(新意味コード)=M371 という処理結果が得られる。ステップ216に入り、
X、Yにより図6の中間構造の形態素「回る」ノードの形
態素及び意味コード属性値を代わってから、ステップ2
17の処理により、M(1)及びL(1)に含まれているノー
ド、属性値が既にステップ216に処理されたので、無
駄な、長過ぎるなノード及び属性値はここで削除するこ
とができる。図6の例によれば、この処理結果が図6の
右の説明例のように、「借金」及び「首」という二つの
ノード、及び形態素「回る」の助動詞属性「ん」等が削
除されるわけである。次に、図3のステップ230に入
り、形態素「回る」ノードの属性PROCを1に設定する
と、ステップ210に戻って、中間構造からPROCは1で
はないノード「彼」を見つけてからステップ202に入
り、ノード「彼」は修飾語ではないので、ステップ23
0に入り、このノードのPROCを1に設定してから、ステ
ップ201に戻って、このとき、中間構造にのPROCは1
ではないノードがないので、図1の原始言語諺慣用句処
理部300の処理が終わる。続いて、図4の処理流れの
ように中間構造判別部400の処理に入る。図4におい
て、まずステップ301の判別処理に入り、図6の右の
説明例に示すように、中間構造はただ二つのノードが残
っているので、この入力文は定型文ではないことを判定
することができるので、ステップ303に入り、フラグ
IDOMをゼロに設定してから、中間構造判別部400の処
理を終える。そして、図1の概念構造転換部500の処
理に入る。図6に示しているノードのフラグIDON値はゼ
ロであるので、図1の差異調整転換辞書550を参照を
して、中国語と日本語との語意、構文などの差異を調整
する。その後、図1の訳語選択部600により、図7に
示すような訳語選択辞書650を参照して、中間構造の
各ノードの形態素を決める。例えば、「彼」の訳語は
「他」で、「借金で首が回らぬ」の訳語は「債臺高築」
である。続いて、目的言語生成部700により、中文の
表層構造を生成して、この例の生成訳文「他債臺高築」
となる。最後に、図1の出力部800により、翻訳結果
を出力する。
【0020】
【発明の効果】本発明によれば、下記のような効果が得
られる。 (1)定型文ではない諺や慣用句でも、正確に処理でき
るので、適切な訳語が得られる。したがって、翻訳の品
質を向上することができる。 (2)処理中の不用な、長過ぎる構造を削除したり、ま
た不適当な意味コードを修正することなどにより、中間
構造を簡単にし、機械翻訳のスピードを速めることがで
きる。 (3)機械翻訳の品質の向上に連れて、再編集の必要性
を著しく低くすることができるので、人手による修正も
減少し、自動的な機械翻訳を達成することができる。
られる。 (1)定型文ではない諺や慣用句でも、正確に処理でき
るので、適切な訳語が得られる。したがって、翻訳の品
質を向上することができる。 (2)処理中の不用な、長過ぎる構造を削除したり、ま
た不適当な意味コードを修正することなどにより、中間
構造を簡単にし、機械翻訳のスピードを速めることがで
きる。 (3)機械翻訳の品質の向上に連れて、再編集の必要性
を著しく低くすることができるので、人手による修正も
減少し、自動的な機械翻訳を達成することができる。
【0021】このように、本発明は従来定型文の諺や慣
用句しか処理できないという問題点を解決することがで
きる上に、実行する際の効率もよく、実用性がはるかに
大きい。
用句しか処理できないという問題点を解決することがで
きる上に、実行する際の効率もよく、実用性がはるかに
大きい。
【0022】
【0023】
【図1】本発明の一実施例における機械翻訳装置の構成
を示すブロック図である。
を示すブロック図である。
【0024】
【図2】同実施例における原始言語諺慣用句処理部の処
理を示すフローチャートである。
理を示すフローチャートである。
【0025】
【図3】同実施例における原始言語諺慣用句処理部の図
2の続きの処理を示すフローチャートである。
2の続きの処理を示すフローチャートである。
【0026】
【図4】同実施例における中間構造判別部の処理を示す
フロチャートである。
フロチャートである。
【0027】
【図5】同実施例における諺慣用句辞書の一部の構造を
示す図である。
示す図である。
【0028】
【図6】同実施例に使用した例文の原始言語の中間構造
を示す図である。
を示す図である。
【0029】
【図7】同実施例における訳語選択辞書の一部の構造を
示す図である。
示す図である。
【0030】
【図8】一般の中間構造方式における機械翻訳装置の翻
訳処理過程を示す流れ図である。
訳処理過程を示す流れ図である。
【0031】
【図9】従来の機械翻訳装置の構成例を示すブロック図
である。
である。
【0032】
【図10】従来の機械翻訳装置の処理を示すフローチャ
ートである。
ートである。
【0033】
【図11】従来例の翻訳処理を示すフローチャートであ
る。
る。
【0034】
【図12】従来例の参照用辞書の構成を示す図である。
【0035】
【図13】従来例の定型文辞書の一部の構成を示す図で
ある。
ある。
【0036】
【図14】従来のノード解析を慣用句について行なった
例を示す図である。
例を示す図である。
【0037】
100 入力部 200 原始言語解析中間構造生成部 250 解析辞書 300 原始言語諺慣用句処理部 350 諺慣用句辞書 400 中間構造判別部 500 概念構造転換部 550 差異調整転換部 600 訳語選択部 650 訳語選択辞書 700 目的言語生成部 800 出力部 900 バッファ
Claims (1)
- 【請求項1】 原始言語の各諺や慣用句に対して該当諺
や慣用句の主形態素を検索キーとして主形態素、主形態
素及び副形態素の関連情報、該当主形態素のすべての諺
や慣用句及びそれらに対応する意味コードを記憶する諺
慣用句辞書と、入力された原始言語を解析して得られた
中間構造を前記諺慣用句辞書に記憶されている情報と比
較して所定条件に合う諺や慣用句の文を一つのノードに
する諺慣用句処理部と、処理された中間構造のノード数
などの情報により入力された文が単純な諺や慣用句であ
るかを判断する中間構造判別部と、該当原始言語の各諺
及び慣用句に対応する品詞コード、意味コード、意味支
配コード及び対応する目的言語の訳語を記憶する訳語選
択辞書を備えたことを特徴とする機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3119837A JPH0683861A (ja) | 1991-05-24 | 1991-05-24 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3119837A JPH0683861A (ja) | 1991-05-24 | 1991-05-24 | 機械翻訳装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0683861A true JPH0683861A (ja) | 1994-03-25 |
Family
ID=14771488
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3119837A Pending JPH0683861A (ja) | 1991-05-24 | 1991-05-24 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0683861A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109657252A (zh) * | 2018-12-25 | 2019-04-19 | 北京微播视界科技有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
-
1991
- 1991-05-24 JP JP3119837A patent/JPH0683861A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109657252A (zh) * | 2018-12-25 | 2019-04-19 | 北京微播视界科技有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5099425A (en) | Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase | |
| US5010486A (en) | System and method for language translation including replacement of a selected word for future translation | |
| JP3960562B2 (ja) | 機械翻訳の学習方法 | |
| KR900008769B1 (ko) | 기계번역시스템 | |
| JP2654001B2 (ja) | 機械翻訳方法 | |
| US5161105A (en) | Machine translation apparatus having a process function for proper nouns with acronyms | |
| JP2732563B2 (ja) | 機械翻訳方法及び装置 | |
| GB2175718A (en) | A translating apparatus | |
| US4931936A (en) | Language translation system with means to distinguish between phrases and sentence and number discrminating means | |
| JPH0683861A (ja) | 機械翻訳装置 | |
| JPH0332106B2 (ja) | ||
| KR100420474B1 (ko) | 부분문틀을 이용한 장문 번역 장치 및 그 방법 | |
| JP3244286B2 (ja) | 翻訳処理装置 | |
| GB2208730A (en) | A translating apparatus | |
| JP2719453B2 (ja) | 機械翻訳装置 | |
| JP3895797B2 (ja) | 変換候補生成方法 | |
| JPS6344276A (ja) | 生成文法自動生成装置 | |
| JP2856736B2 (ja) | 辞書参照装置及び辞書参照方法 | |
| JP2002297585A (ja) | 英文名詞句の区分方法,英文構文情報生成方法および装置 | |
| JPS62271065A (ja) | 機械翻訳システム | |
| JPH06243163A (ja) | 文書解析装置 | |
| JPH0773185A (ja) | 機械翻訳装置及び方法 | |
| JPH07122876B2 (ja) | 機械翻訳装置 | |
| JPH05197752A (ja) | 機械翻訳装置 | |
| JPH05342260A (ja) | 単語綴りチェック装置 |