JPH0658672B2 - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH0658672B2
JPH0658672B2 JP62296675A JP29667587A JPH0658672B2 JP H0658672 B2 JPH0658672 B2 JP H0658672B2 JP 62296675 A JP62296675 A JP 62296675A JP 29667587 A JP29667587 A JP 29667587A JP H0658672 B2 JPH0658672 B2 JP H0658672B2
Authority
JP
Japan
Prior art keywords
parallel
contrast
words
sentence
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62296675A
Other languages
English (en)
Other versions
JPH01137368A (ja
Inventor
好昭 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62296675A priority Critical patent/JPH0658672B2/ja
Publication of JPH01137368A publication Critical patent/JPH01137368A/ja
Publication of JPH0658672B2 publication Critical patent/JPH0658672B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔概要〕 原文の並列・対比表現を利用して機械翻訳する機械翻訳
システムに関し、 原文中に現れる並列・対比表現を抽出して文の解析およ
び訳文の生成に利用して質の高い訳文を迅速に生成する
ことを目的とし、 原文を単語に分解し、句を生成する単語分解・句生成部
と、この単語分解・句生成部によって生成された句に対
し、並列した態様で現れる並列・対比表現を検出する並
列・対比表現検出部と、この並列・対比表現検出部によ
って検出された並列・対比表現を構成する単語の対応付
けおよび属性を補う対応付け・属性補正部と、この対応
付け・属性補正部によって単語の対応付けおよび属性が
補われた並列・対比表現を利用して置き換える態様で訳
文を生成する訳文生成部とを備え、この訳文生成部によ
って、生成された訳文を出力するように構成する。
〔産業上の利用分野〕
本発明は、原文の並列・対比表現を利用して機械翻訳す
る機械翻訳システムに関するものである。
〔従来の技術と発明が解決しようとする問題点〕
一般に、機械翻訳システムは、まず、原文を文節・単語
に分解し、文法や知識を用いて原文で述べられているこ
とを解析する。解析結果は、システムそれぞれの中間表
現で表す。次に、原文の解析結果に沿って、目的とする
言語に応じた訳文を生成している。
しかし、従来、原文の解析段階では、各々の時点で、原
文の1部分だけで見て解析をすすめているため、文の全
体としての構造が反映されないことがある。また、ほぼ
同じ構造の部分が繰り返し現われるいわゆる並列・対比
表現があっても、従来のシステムは、これらの繰り返し
部分に対しても、同じ処理を繰り返し行っていたため、
翻訳速度を向上し得ないという問題点があった。また、
文単位などに翻訳を行っていたため、関連する他の文中
で用いられる代名詞などが指示する内容を判断すること
が困難となり、質の良い訳文を作成し難いという問題点
もあった。
本発明は、原文中に現れる並列・対比表現を抽出して文
の解析および訳文の生成に利用して質の高い訳文を迅速
に生成することを目的としている。
〔問題点を解決するための手段〕
第1図を参照して問題点を解決するための手段を説明す
る。
第1図において、単語分解・句生成部1は、入力された
原文を単語に分解し、この単語をまとめて句を生成する
ものである。
並列・対比表現検出部2は、単語分解・句生成部1によ
って生成された句に対して、繰り返して現れる句のあつ
まりであるいわゆる並列・対比表現を検出するものであ
る。
対応付け・属性補正部3は、並列・対比表現検出部2に
よって検出された並列・対比表現中の対応する単語の対
応付けおよびこの単語の意味を補う(あるいは制限す
る)ものである。
訳文生成部4は、対応付け・属性補正部3によって対応
付け・補正された並列・対比表現を利用し、第2回目以
降に現れる文に対して、いわば置き換える態様で訳文を
生成するものである。
〔作用〕
本発明は、第1図に示すように、単語分解・句生成部1
が入力された原文を単語に分解して句を生成し、並列・
対比表現検出部2がこの句のあつまりが繰り返し現れる
並列・対比表現を見つけ出し、対応付け・属性補正部3
がこの並列・対比表現によって対応付けられた単語の属
性(訳語など)を補正するようにしている。この補正後
に、この並列・対比表現によって対応付けされた文を、
対比に注意して置き換える態様で訳文を生成するように
している。
従って、原文中の並列・対比表現に対応する第2回目以
降の訳文については、構文解析などを省略し、置き換え
る態様で質の高い訳文を迅速に生成することが可能とな
ると共に、代名詞などの指示内容を容易に推定すること
が可能となる。
〔実施例〕
次に、第2図フローチャートに示す手順に従って、第3
図ないし第5図を用いて第1図構成および動作を順次詳
細に説明する。
第2図において、図中は、原文を読み込む状態を示
す。これは、例えば第3図(イ)に示す英語の原文を読
み込むことを意味している。
図中は、単語をまとめて句を生成する状態を示す。こ
れは、第3図(イ)原文に対して、形態素解析して単語
に分割し、この分割した単語に対して下記ルール(1)を
適用して例えば第3図(ロ)(ステップ1)および
(ハ)(ステップ2)に示すような句に順次まとめるこ
とを意味している。
以下詳述する。
ルール(1): (1)副詞・間投詞は省く。
(2)冠詞+名詞はnoun(名詞)とする。
(3)形容詞は、その直後に名詞があれば限定用法と考
え、後の名詞とつないでnoun(名詞)とする。そうでな
く、前にbe動詞に類するもの(become,come,goなど)が
あれば、叙述用法と考え、前の動詞と合わせてbe+adj
とする。
(4)動詞は、その活用法により、以下のように分ける。
(4-1)分詞(過去分詞、現在分詞) (4-2)to-不定詞、動名詞 (4-3)原型不定視 (4-4)助動詞+原型(未来形を含む)、現在形、過去
形、過去完了形、現在完了形 (5)冠詞、所有格は、後の句と合わせてnounとする。但
し、後の語が形容詞である場合は、その形に応じて比較
級、最上級の印を付ける(noun+est)。
(6)前置詞+名詞は、その前が名詞であれば、前の名詞
と合わせて名詞句とする。そうでなく、前の語がbe動詞
に類するものであれば、形容詞の叙述用法として扱う。
そうでなければ、副詞として扱う。
第3図(ロ)に示すステップ1:これは上記ルール(1)
を第3図(イ)原文から分離した単語に適用した第1ス
テップのものである。簡単に説明すると、第3図(ロ)
図中原文を矩形で囲んだ句が、上記ルール(1)を適用し
て得られたものである。例えば原文の先頭の句“to se
e”に対しては、ルール(1)の第(4)項を適用し、to-inf
(不定詞)として生成したものである。以下同様に図中
に示すように生成する。尚、図中( )はこれに囲まれ
た単語を無視して適用することを表し、*は未だルール
が適用されていないことを表す。
第3図(ハ)に示すステップ2:これは第3図(ロ)中
の未適用の単語(図中*を用いて示す単語)に対して、
更にルール(1)を適用して生成したものである。簡単に
説明すると、第3図(ハ)図中原文を二重に矩形で囲ん
だ句が、更に上記ルール(1)を適用して得られたもので
ある。例えば原文the fanlt of othefs”に対してofで
接続(所有格)されているので、図示のように全体をno
unとする。以下同様に、those of your own"についても
全体をnounとする。このようにして生成した第3図
(ハ)を木構造(リスト構造)を用いて表すと、第3図
(ニ)に示すようになる。
以上の手段によって第3図(ニ)に示すように表現する
ことにより、第3図(イ)原文中から繰り返し現れる句
のあつまりであるいわゆる並列・対比表現を容易に抽出
し易くなる。
図中は、くり返し対比表現の検出を行う状態を示す。
これは、第3図(ニ)から繰り返し現れる句のあつまり
である並列・対比表現、図中(a-1)、(a-2)に示すような
to-inf→noun→be+adj"を検出することを意味してい
る。この検出は、第3図(ニ)木構造中のリストの見出
し部(最上段の行)に注目し、これを一次元リストとみ
なし、2つのポインタp、qを準備し、これらが木構造
のリストを夫々指すようにする。ポインタpから始まる
部分リストと、ポインタqから始まる部分リストとが一
致するか否かを調べる。この時、より長い部分リストか
ら順次検査し、一致するもののうち、最も長いものを、
並列・対比表現として検出する。このようにして検出し
た並列・対比表現が、上記to-inf→noun→be+adj"とな
る。
図中は、原文中の単語の対応付けを行う状態を示す。
これは、図中で検出した並列・対比表現例えば第3図
(ニ)木構造中の並列・対比表現to-inf→noun→be+ad
j"について、第4図に示すように、対応付けることを意
味している。具体的に言えば、並列・対比表現to-inf→
noun→be+adj"の第1番目のto-inf"に対しては、原文中
でto see"とto find"とが対応していることが判明す
る。以下同様に、第2番目のnoun"および第3図番目のb
e+adj"についても第4図に示すように対応付けする。
尚、第4図図中下線を引いたものは、更に幾つかの単語
を代表していることを示す。これら下線を引いたものに
ついては、更に子リストについて照合を繰り返すように
する。また、( )を用いて囲んだ単語は、照合を無視
すべきものである。
図中、は、単語の属性を補う、あるいは単語を限定す
る状態を示す。これは、図中で対応付けした単語につ
いて、表記が同じでも、文法上の機能や意味・訳語の異
なる語があり、単語辞書には同一の表記について複数の
語があるので、これらのうちより質の高い訳文を生成す
るために、並列・対比表現の特性を活かして適切な訳語
を選択するものである。具体的に説明すると、第4図最
下段に示す。並列・対比表現中の単語easy"とhard"とに
対して、 easy"の訳語:易しい、気楽な、こだわらない・・・な
ど hard"の訳語:硬い、難しい、酷しい・・などがある。
この両者の訳語から並列・対比表現be-adj"としては、
用法が最も類似する訳語として易しい”および難しい”
を選択する。このように、並列・対比表現の特質を活か
して単語の属性(意味など)を補ったり、更に限定した
りすることにより、質の高い訳文を生成することが可能
となる。尚、訳語を選択する基準として、上述した類似
のものを選択する外に、対語例集を予め設けて選択させ
てもよい。また、第4図中段の並列・対比表現中のothe
rs"に対しては、人を表す語の所有格”といった情報を
設定する。
次に、図中およびの手順によって、訳文を例えば第
5図に示すように生成する。
図中は、最初の部分を訳出する状態を示す。これは、
第3図(ニ)に示すルール(1)適用結果から抽出した並
列・対比表現中の例えば(a-1)の部分の訳出を行い、第
5図上段に示すような木構造に表すことを意味してい
る。
図中は、対比表現に注意して当てはめる(置き換え
る)態様で訳出する状態を示す。これは、第5図下段中
の楕円で囲んで示すように、第2回目以降に現れる並列
・対比表現に対し、構文解析などを行わず、第4図並列
・対比表現の対の関係を利用して単に置き換える態様で
訳出することを意味している。
図中は、訳文として出力する状態を示す。これは、第
5図に点線を用いて示すように、図中start"の位置から
上段の木構造表現で表されている訳文を“他人の欠点を
見ることは易しい”と訳出し、次に、原文中に存在した
接続詞but"をが”と訳出した後、下段の木構造表現で表
されている訳文を あなた自身のそれを見つけることは
まったく難しい。”と訳出することを意味している。
以上のように、原文中から繰り返し現れる並列・対比表
現を抽出し、第2回目以降の訳出の際に構文解析などを
行わず、単に当てはめる態様で訳出することが可能とな
る。
〔発明の効果〕
以上説明したように、本発明によれば、原文中に繰り返
し現れる並列・対比表現を抽出し、この並列・対比表現
に基づいて、第2回目以降の訳出の際に置き換える態様
で訳出する構成を採用しているため、原文中に現れる2
回目以降の並列・対比表現の訳文については、構文解析
などを省略して置き換える態様で質の高い訳文を迅速に
生成することができる。更に、並列・対比表現中の単語
を相互に比較することにより、ある文中における意味内
容を他の文に反映させること、例えば代名詞などの指示
内容(人、物など)を容易に反映させることができ、質
の高い訳文を生成することができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図は本発明の動
作説明フローチャート、第3図は本発明に係わる具体例
説明図、第4図は並列・対比表現の比較説明図、第5図
は訳文の木構造表現例を示す。 図中、1は単語分解・句生成部、2は並列・対比表現検
出部、3は対応付け・属性補正部、4は訳文生成部を表
す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】原文の並列・対比表現を利用して機械翻訳
    する機械翻訳システムにおいて、 原文を単語に分解し、句を生成する単語分解・句生成部
    (1)と、 この単語分解・句生成部(1)によって生成された句に対
    し、並列した態様で現れる並列・対比表現を検出する並
    列・対比表現検出部(2)と、 この並列・対比表現検出部(2)によって検出された並列
    ・対比表現を構成する単語の対応付けおよび属性を補う
    対応付け・属性補正部(3)と、 この対応付け・属性補正部(3)によって単語の対応付け
    および属性が補われた並列・対比表現を利用して置き換
    える態様で訳文を生成する訳文生成部(4)とを備え、 この訳文生成部(4)によって、生成された訳文を出力す
    るように構成したことを特徴とする機械翻訳システム。
JP62296675A 1987-11-25 1987-11-25 機械翻訳システム Expired - Fee Related JPH0658672B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62296675A JPH0658672B2 (ja) 1987-11-25 1987-11-25 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62296675A JPH0658672B2 (ja) 1987-11-25 1987-11-25 機械翻訳システム

Publications (2)

Publication Number Publication Date
JPH01137368A JPH01137368A (ja) 1989-05-30
JPH0658672B2 true JPH0658672B2 (ja) 1994-08-03

Family

ID=17836618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62296675A Expired - Fee Related JPH0658672B2 (ja) 1987-11-25 1987-11-25 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH0658672B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005295968A (ja) * 2004-04-16 2005-10-27 Trans Force:Kk 機能食品

Also Published As

Publication number Publication date
JPH01137368A (ja) 1989-05-30

Similar Documents

Publication Publication Date Title
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
US5099425A (en) Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
JPH07282055A (ja) 文解析方法および装置
JPH05120324A (ja) 言語処理方式
JPS6318458A (ja) 感情情報抽出装置
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0658672B2 (ja) 機械翻訳システム
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4088681B2 (ja) 複数言語入力での言語処理装置
JP2005092615A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3244286B2 (ja) 翻訳処理装置
JP2901977B2 (ja) 翻訳装置
JP2817497B2 (ja) 辞書編集装置
JP2926745B2 (ja) 機械翻訳装置
JP3505422B2 (ja) 自然言語処理用辞書生成装置
JP3132563B2 (ja) 文書作成支援装置
JP3972698B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3277560B2 (ja) 機械翻訳装置
JPH10105552A (ja) 機械翻訳システム
JPH0619966A (ja) 言語翻訳装置における翻訳文生成方式及び表示・編集方式
JPH04558A (ja) 機械翻訳システム
JPH07249044A (ja) 機械翻訳装置
JPH03240876A (ja) 機械翻訳装置
JPH09146959A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees