JPH04349571A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH04349571A
JPH04349571A JP3152458A JP15245891A JPH04349571A JP H04349571 A JPH04349571 A JP H04349571A JP 3152458 A JP3152458 A JP 3152458A JP 15245891 A JP15245891 A JP 15245891A JP H04349571 A JPH04349571 A JP H04349571A
Authority
JP
Japan
Prior art keywords
translation
priority
correction
machine translation
solution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3152458A
Other languages
English (en)
Inventor
Shigeya Senda
滋也 千田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3152458A priority Critical patent/JPH04349571A/ja
Publication of JPH04349571A publication Critical patent/JPH04349571A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は機械翻訳装置に係り、詳
細には、文書編集機能の別訳文の表示を選択する機能を
備えた機械翻訳装置に関する。
【0002】
【従来の技術】例えば日本語の文章を機械的に英語やフ
ランス語に翻訳したり、その逆の翻訳を行う機械翻訳装
置が実用化されている。この機械翻訳装置は、例えば入
力された英語の文章について、その構文や文法等を文法
規則、単語辞書等の翻訳辞書に基づいて解析し、日本語
の文章に翻訳するものである。このような機械翻訳装置
では、例えば特開昭60−247786号公報に示され
るように、原文の多義、解析の不完全さから一般に複数
の訳文を生成し、その解の優先度を判定して上位数個の
複数の訳文を生成するようにしているものがある。
【0003】
【発明が解決しようとする課題】このような従来の機械
翻訳装置で行われる優先度の判定は、解の確からしさを
何らかの方法で判定するのみであった。従って、多くの
解釈の可能性のある場合、例えば長文にはは同じような
解析結果が出易く、結果的に同じような別解が出易くな
る。これは、多くの解の中からある共通の特徴を持つも
のが優先度の高い解として選びだされるためである。こ
のため、優先度の解釈が適当でない場合や、原文が元々
曖昧な場合、使用者は全く違う解釈の解の参照を希望し
ても、別訳文リストには同様な内容の解があるだけで結
局利用できない。このように、せっかく複数の解を生成
したとても、解釈の違った解を使用者が参照することが
できないことがあった。そこで本発明の目的は、できる
だけ解釈の違った複数の解が得られる機械翻訳装置を提
供することにある。
【0004】
【課題を解決するための手段】請求項1記載の発明では
、原文を入力する入力手段と、この入力手段で入力され
た原文を解析して対応する訳文を得る翻訳手段と、この
翻訳手段で対応する訳文が複数得られた場合に各訳文に
優先度を付加する優先度付加手段と、この優先度付加手
段で付加された優先度に対して異なった訳文となるよう
な補正を行う補正手段と、この補正手段で補正された後
の優先度により所定数の訳文を出力する訳文出力手段と
を機械翻訳装置に具備させる。請求項2記載の機械翻訳
装置では、補正手段で、個々の訳文の内部表現の類似度
を判定して補正を行う。請求項3記載の機械翻訳装置で
は、補正手段で、個々の訳文の元となった構文解析結果
において使用したルールの異なりを判定して補正を行う
。請求項4記載の機械翻訳装置では、補正手段で、個々
の訳文の内部表現の動詞の格パターンの異なりを判別し
て補正を行う。
【0005】
【作用】すなわち、請求項1乃至4記載の発明では、従
来の確からしさを用いた優先度だけでなく解相互が出来
るだけ異なったものであるような補正を補正手段で行う
ものである。
【0006】
【実施例】以下、本発明の機械翻訳装置における一実施
例を図1ないし図5を参照して詳細に説明する。なお、
本実施例では、英語文を入力して日本語文の訳文を得る
、英日機械翻訳について説明する。図1は機械翻訳装置
の概略構成を表したものである。この図において、1は
原文入力部、2は形態素解析部、3は単語辞書、4は構
文解析部、5は文法規則、6は構文変換部、7は形態素
生成部、8は生成規則、9は訳文出力部である。
【0007】原文入力部1から入力された原文は、図示
しない前処理部でスペルェック等の前処理された後、形
態素解析部2に供給される。供給された原文は、形態素
解析部2で単語辞書3を用いて形態素解析がなされる。 そして、文法規則5を用いて構文解析部4で構文解析が
行われ、複数の解の構文解析結果が得られる。これら複
数の解のうち、優先度解釈が行われて、特定個数のもの
が内部表現に構文変換部6で変換され、生成規則8をも
ちいて形態素生成部7で形態素生成される。つまり、複
数の構文解析の結果、内部表現がそれぞれのフェーズで
受け渡される。
【0008】それぞれのフェーズで解析された解に対す
る優先度の計算には様々な方法が提案されており、例え
ば、特開平2−122370号公報で示されるデンプス
タ−シェーファ(Dempster−Shafer )
 理論による優先度の計算を行う。これらの計算によっ
て得られた解順位に対して、本実施例では、更に次の各
制約を課すことにより解の優先順位を変更し、最終的な
別訳文に色々なタイプの解釈が現れるようにする。
【0009】図2は構文解析と構文変換の動作の流れを
表したものである。すなわち、構文変換部6は、通常の
構文解析結果に対して、解順位を変更するために木構造
、ルール、および格パターンの類似度を解同士比較する
。そして、全解リストが構文解析結果として得られる全
ての解候補を保持し、上位解リストが結果的に得られる
本方式で絞り込んだ上位の解となる。解の類似度を数値
化したものを合計し解同士の類似度がある閥値以上の場
合その解が上位解として現れないようにする。
【0010】以下図2に従って、説明する。構文解析部
4で従来と同様に構文解析が行われると(ステップ1)
構文変換部6は、全解リストから最上位の解を1つ選択
しこれを解Iとし(ステップ2)、上位解リストの1つ
解を取りこれを解Jとして(ステップ3)、両者の類似
度の計算を行う。すなわち、解Iと解Jの木構造の類似
度Aを求め(ステップ4)、解Iと解Jのルールの一致
度Bを求め(ステップ5)、更に解Iと解Jの格パター
ンの一致度Cを求める(ステップ6)。そして、木構造
の類似度A、ルールの一致度B、格パターンの一致度C
の合計値がある閥値を越えたか否かをチェックする(ス
テップ7)。上位解リストの全てについてステップ3か
らステップ7の処理が終了し、(ステップ8;Y)、閥
値を越えた場合がある時には(ステップ9;Y)、解I
を上位解リストに登録する(ステップ10)。以上の動
作により、上位解リストが全て埋まると(ステップ11
;Y)、処理を終了する。
【0011】図3は、図2のステップ4で木構造の類似
度を算出する流れを表したものである。木構造の類似度
の計算は、定数からTreediff(I,J,1) 
を減ずることによって計算される。構文木構造はノード
(非終端記号)とリーフ(終端記号)で構成される。木
のルート(解析された文全体の非終端記号)からそれぞ
れ枝分れしながら比較していく。減点法で0(ゼロ)に
近いほど良いとして異なっていれば減点していく。ルー
トの近いところで異なっているほど減点が高い。図3に
おいて木の比較を行う関数を Treediff(N1
,N2,L) で表す。ここでN1 はある木構造のノ
ード、N2 は別の木構造のノード、Lはルートノード
からの距離を示している。また、Treediffは、
異なり度を示す関数である。
【0012】図4は、図2のステップ5でルールの一致
度を判定する流れを表したものである。英語の解析を文
脈自由文法によって行っているとすると、I、Jのルー
ルを最右導出の順序で並べ、これをルール列T、Sとす
る(ステップ1)。そして、ルール列T、Sを動的マッ
チングで比較し(ステップ2)、比較の結果で異なって
いる箇所をカウントし負の定数倍したものを一致度とし
て(ステップ3)、処理を終了する。つまり、それぞれ
の解について最右導出形のルール適応順にしたがってル
ールを並べることにより比較される。比較方法はUNI
XのコマンドのDIFFで使われているような動的マッ
チングを行えばよい(“An O(ND) Diffe
rence Algorithm and its V
ariations”,Eugene Myers, 
Algorithmica Vol.1 No.2 1
986 P251)。一致しなかった箇所の個数で減点
される。
【0013】図5は、図2のステップ6で格パターンの
一致度を判定する流れを表したものである。I、Jの主
動詞を持つ動詞句を見つけ(ステップ1)、各項目と比
較して点数を変化させ(ステップ2)、その点数を合計
して一致度とする(ステップ3)。つまり、文の主動詞
の格パターンを比較する場合、簡単に動詞の文型を比較
する。主動詞を木構造から選び出しその主動詞を持つ動
詞句が支配する目的語、補語に相当する語を比較するも
のである。なお、構文解析部4で行われる格解析により
格の素性を比較することも可能である。
【0014】
【発明の効果】請求項1記載の発明によれば、優先度付
加手段で付加された優先度に対して異なった訳文となる
ような補正を行う補正手段有するので、複数解とし解釈
の違った解を得ることができる。請求項2記載の発明に
よれば、翻訳処理において個々の解の内部表現の類似度
を判定し、解相互の異なり度を優先順位付けに利用する
ことにより、解釈の異なった解の解リストを得ることが
できる。請求項3記載の発明によれば、翻訳処理におい
て個々の解の元となった構文解析結果において使用した
ルールの異なりを判定し、解相互の異なり度を優先順位
付けに利用することにより、解釈の異なった解の解リス
トを得ることができる。請求項4記載の発明によれば、
翻訳処理において個々の解の内部表現の動詞の格パター
ンの異なりを判定し、解相互の異なり度を優先順位付け
に利用することにより、解釈の異なった解の解リストを
得ることができる。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置における一実施例の概略
構成図である。
【図2】同上、機械翻訳装置における構文解析と構文変
換の動作を示す流れ図である。
【図3】同上、構文変換動作で木構造の類似度を算出す
る動作を示す流れ図である。
【図4】同上、構文変換動作でルールの一致度を判定す
る動作を示す流れ図である。
【図5】同上、構文変換動作で格パターンの一致度を判
定する動作を示す流れ図である。
【符号の説明】
1  原文入力部 2  形態素解析部 3  単語辞書 4  構文解析部 5  文法規則 6  構文変換部 7  形態素生成部 8  生成規則 9  訳文出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  原文を入力する入力手段と、この入力
    手段で入力された原文を解析して対応する訳文を得る翻
    訳手段と、この翻訳手段で対応する訳文が複数得られた
    場合に各訳文に優先度を付加する優先度付加手段と、こ
    の優先度付加手段で付加された優先度に対して異なった
    訳文となるような補正を行う補正手段と、この補正手段
    で補正された後の優先度により所定数の訳文を出力する
    訳文出力手段とを具備することを特徴とする機械翻訳装
    置。
  2. 【請求項2】  補正手段は、個々の訳文の内部表現の
    類似度を判定して補正を行う請求項1記載の機械翻訳装
    置。
  3. 【請求項3】  補正手段は、個々の訳文の元となった
    構文解析結果において使用したルールの異なりを判定し
    て補正を行う請求項1記載の機械翻訳装置。
  4. 【請求項4】  補正手段は、個々の訳文の内部表現の
    動詞の格パターンの異なりを判別して補正を行う請求項
    1記載の機械翻訳装置。
JP3152458A 1991-05-27 1991-05-27 機械翻訳装置 Pending JPH04349571A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3152458A JPH04349571A (ja) 1991-05-27 1991-05-27 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3152458A JPH04349571A (ja) 1991-05-27 1991-05-27 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH04349571A true JPH04349571A (ja) 1992-12-04

Family

ID=15540961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3152458A Pending JPH04349571A (ja) 1991-05-27 1991-05-27 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH04349571A (ja)

Similar Documents

Publication Publication Date Title
JP3189186B2 (ja) パターンに基づく翻訳装置
US5895446A (en) Pattern-based translation method and system
US20080040095A1 (en) System for Multiligual Machine Translation from English to Hindi and Other Indian Languages Using Pseudo-Interlingua and Hybridized Approach
US12175193B2 (en) System and method for lookup source segmentation scoring in a natural language understanding (NLU) framework
JP2000112938A5 (ja)
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH07244666A (ja) 自然言語自動翻訳方法及び自然言語自動翻訳装置
Das et al. Comparative analysis of subword tokenization approaches for indian languages
JPH0261763A (ja) 機械翻訳装置
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JP2632806B2 (ja) 言語解析装置
JPH04349571A (ja) 機械翻訳装置
KR100286649B1 (ko) 연어패턴에 기초한 어휘 변환방법
Gdaniec et al. Derivational morphology to the rescue: how it can help resolve unfound words in MT
Arefin et al. A machine translation framework for translating Bangla assertive, interrogative and imperative sentences into English
JP3892227B2 (ja) 機械翻訳システム
Chen et al. A New Prosodic Phrasing Model for Chinese TTS Systems.
Nirenburg et al. HUHU: the hebrew university hebrew understander
Yıldırım et al. Pronoun resolution in Turkish using decision tree and rule-based learning algorithms
JP2004145433A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0833895B2 (ja) 機械翻訳システムにおける文生成処理方式
JP4103311B2 (ja) 自然言語処理装置及び方法
Mirdjanovna et al. Algorithm of Word Order and Syntactic Analysis in Uzbek Language Sentences
JP2004326584A (ja) 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム
Koval et al. Morphological representation in PC-based text processing systems