JPH02281374A - 機械翻訳装置におけるハイフン合成語処理方法 - Google Patents

機械翻訳装置におけるハイフン合成語処理方法

Info

Publication number
JPH02281374A
JPH02281374A JP1104237A JP10423789A JPH02281374A JP H02281374 A JPH02281374 A JP H02281374A JP 1104237 A JP1104237 A JP 1104237A JP 10423789 A JP10423789 A JP 10423789A JP H02281374 A JPH02281374 A JP H02281374A
Authority
JP
Japan
Prior art keywords
hyphen
dictionary
word
compound word
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1104237A
Other languages
English (en)
Other versions
JPH0719260B2 (ja
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Nakamura
中村 いち子
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1104237A priority Critical patent/JPH0719260B2/ja
Priority to US07/513,254 priority patent/US5065318A/en
Priority to EP90304350A priority patent/EP0398513B1/en
Priority to DE69025091T priority patent/DE69025091T2/de
Publication of JPH02281374A publication Critical patent/JPH02281374A/ja
Publication of JPH0719260B2 publication Critical patent/JPH0719260B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は機械翻訳装置のハイフン合成語処理方法にに関
するものである。
〈従来技術〉 従来の機械翻訳装置において、入力された文章中にハイ
フンで合成された合成語が含まれている場合は、ハイフ
ン合成語が辞書に含まれていないため名詞として処理さ
れ、該合成語をハイフン前後で分割し、ハイフン前とハ
イフン後の単語毎に辞書引きして夫々の訳語を生成し、
該訳語を単に並べて出力していた。
又、別の方法として使用者が予めユーザー辞書にハイフ
ン合成語を登録しておき、該合成語を翻訳する際には前
記ユーザー辞書を参照させる方法があった。
〈発明が解決しようとする課題〉 上述したように上記機械翻訳装置では入力されたハイフ
ン合成語に対して辞書に含まれていなければ名詞として
処理を行う。それ故、例えばハイフンによって名詞と現
在分詞或いは名詞と過去分詞が合成され、形容詞句とな
るハイフン合成語に対しては、翻訳に失敗して誤まった
結果を出すか、原語のtま出力して正しい翻訳結果が得
られなかった。
一方、ハイフン合成語をユーザー辞書に予め登録してお
けば正しい翻訳結果が得られるものの、この場合使用者
に登録作業の負担がかかり、又出現する合成語の全てを
推測して漏らさずユーザー辞書に登録することは非常に
困難であった。
そこで本発明の目的は、機械翻訳装置において予め辞書
登録しなくてもハイフンによって名詞と現在分詞或いは
名詞と過去分詞が合成されたハイフン合成語を正しく翻
訳できるハイフン合成語処理方法を提供することにある
く課題を解決するための手段〉 本発明は、上記目的を達成するために、入力された文章
中の各単語を辞書引きし、該辞書引き情報から前記入力
文章の形態素列を得る辞書引き形態素解析部と、 該形態素解析部によって得られた形態素列の構文を辞書
と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、前記辞書引き形態素解
析部は、入力された文章中にハイフンによって合成され
たハイフン合成語があれば、該合成語をハイフン前後の
単語に分割て岸噂中判保持し、更に前記合成語の分割さ
れたハイフン前の単語が名詞であり、且つハイフン後の
単語が現在分詞又は過去分詞である場合は、辞書引きに
よって得られた情報に従って該ハイフン前後の単語だけ
で翻訳を行い、該翻訳結果を前記合成語に対応させて壽
七≠=#好保持するものである。
〈作 用〉 本発明によれば、辞書引き形態素解析部は入力された任
意の文章中にハイフンで合成された合成語があれば該合
成語をハイフン前後の単語に分割して夫々の単語に対し
て辞書引きを行い、得られた情報を前記合成語に対応さ
せて保持する。
そして、上記辞書引きの結果、前記合成語のハイフン前
の単語が名詞でハイフン後の単語が現在分詞或いは過去
分詞であれば、該ハイフン前後の単語だけで保持した前
記情報を基に翻訳を行い、該翻訳結果を前記合成語に対
応させて保持する。
翻訳文生成部は前記合成語の訳語を生成する際には前記
辞書引き部が前記合成語に対応して保持する前記翻訳結
果を読み出して訳語を生成する。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明を適用する機械翻訳装置における一実
施例のブロック図である。lはメインCPU(中央処理
装置)、2はメインメモリー3はCRT(カソード・レ
イ・チューブ)、4はキーボード、5は翻訳モジュール
、6は翻訳用の辞書、文法規則および木構造変換規則等
を格納しているメモリーである。
上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してターゲット言語を出力するものである。
すなわち、キーボード4から入力されたソース言語はメ
インCPUIの制御により翻訳モジュール5に送られる
。翻訳モジュール5は、メモリー6に記憶されている辞
書、文法規則および木構造変換規則等を用いて、後に詳
述するようにして入力されたソース言語をターゲット言
語に翻訳する。その結果は、メインメモリー2に一旦記
憶されると共に、CRT3に表示される。
翻訳モジュール5で行われる機械翻訳には、−船釣に第
2図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルL1の辞書引き、レ
ベルL2の形態素解析、レベルL3の構文解析、・・・
と、解析が進められる。
機械翻訳はこの解析レベルにより、大きく次の2つに分
けられる。1つは、レベルL6のソース言語およびター
ゲット言語のどちらKも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL9の構文生成、レベルL
IOの形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
もう一つは、上述のレベルL2の形態素解析、レベルL
3の構文解析、レベルL4の意味解析およびL5の文脈
解析のいずれかまで解析を行ってソース言語の内部構造
を得、次に、この得られたソース言語の内部構造と同レ
ベルのターゲット言語の内部構造に変換した後、ターゲ
ット言語を生成するトランスファ一方式である。
ここで、上記各解析について説明する。
・辞書引き、形態素解析−第1図に示すメモリー6の辞
書を引き、入力された文章を各形態素列(単語列)に分
割し、この各単語に対する品詞などの文法情報および訳
語を得、さらに、時制・人称・数などを解析する。
・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造(構造解析木)を決定する。
・意味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを判別する。
・文脈解析−話題を理解し、省略やあい昧さを取り去る
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構文解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな部分からなる翻訳モジュールを考える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図は[’rhis is a pen
、Jという英文を日本語に翻訳する場合の、第4図に示
す各バッファA−Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAK格納される。翻訳プログラム16に基づく
翻訳CPU15の制御の下に、第3図の辞書引き形態素
解析部11により、バッフ7Aに格納された原文に従っ
てメモリー6の辞書を用いて各単語の必要な情報が得ら
れ、第4図のバッファBに格納される。ここで、Th1
sは多品詞語であるが、次の第3図の構文解析部12に
より一意に決定される。構文解析部12ではメモI) 
−6の辞書と文法規則にしたがって、各単語間の係り受
は関係を示す構造解析木が第7図に示すように決定され
て、第4図のバッファCに格納される。
この構造解析木は、次のようにして決定される。
すなわち、メモリー6の文法規則から 文→主部、述部 主部→名詞句 述部→動詞、名詞句 名詞句→代名詞 名詞句→冠詞、名詞 の規則が得られる。この規則は、例えば、1つめの規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則にしたがって構造解析木が決定さ
れるのである。
第3図の変換部13では、上述の構文解析部同様、メモ
リー6の木構造変換規則を用いて、入力された英文に対
する構文解析木(第7図参照)の構造が、第8図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第4図のバッフIDに格納される。第3図の
翻訳文生成部14は、得られた日本語文字列「これペン
である。」に適切な助詞「は」や助動詞をつけて、第9
図のような日本語の形にして、第4図のバッフIEに格
納する。この日本文「これはペンである。」は、翻訳モ
ジュール5から出力され、メインメモリー2に格納され
ると共に、CRT8に表示される。
次に本発明に係る辞書引き形態素解析部11のハイフン
合成語の処理動作を第10図のフローチャートに示す。
以下このフローチャートに従って辞書引き形態素解析部
11の処理動作を説明する。
ステップS1において入力された単語がハイフンを含ん
でいるか否かを判別する。ハイフンを含んだ合成語であ
ればステップS3に進みそうでなければステップS2に
進む。ステップ53〜ステツプS7においてハイフン合
成語をハイフンの前後の単語に分割し、夫々の単語毎に
辞書引きを行い、得られた結果を前記合成語に対応させ
てバッファBに保持する。
そしてステップS8で上記辞書引きした結果、ハイフン
前の単語が名詞で且つハイフン後の単語が現在分詞或い
は過去分詞であればステップS9に進み、そうでなけれ
ばステップS14に進む。ステップS9では上記辞書引
きの結果を保持したバッファBの内容を別のバッファに
退避させる。ステップSIOで別のバッファに退避させ
た辞書引きの結果に基づいてハイフン前とハイフン後の
単語の順番を置き換えてこの2つの単語だけで翻訳処理
を行い、ステップSllでその翻訳結果を前記合成語に
対応させてバッファBに保持する。更にステップ512
で先に退避させていた辞書引きの結果をバッフIBに戻
す。
一方、ステップS2においては通常の辞書引きを行ない
、ステップStaでその結果を単語対応させてバッフ1
Bに保持する。
ステップS14において入力文章中の全ての単語に対し
て上述した処理を終了したかを判別し、終了していなけ
ればステップS1に戻り、終了しておれば辞書引き形態
素解析部11の処理を終了する。そして翻訳文生成部1
4においてハイフン合成語の訳語を生成する際には該合
成語に対応してバッフ7Bに保持されている前記翻訳結
果情報に基づいて訳語を出力し、訳文を生成する。
第11図は本実施例の機械翻訳装置に入力したハイフン
合成語を含む文章とこの機械翻訳装置から出力された日
本文の例である。
入力されたハイフン合成語[stem−mounted
 Jはハイフンの前後で分割されて夫々辞書引きされ、
順番を置き換えてこの2つの単語だけを翻訳して「ステ
ムを搭載する」という訳語を得て、該訳語を合成語「s
tem−mounted Jに対応させてバッファBに
保持する。
翻訳文生成部14では上記翻訳結果情報に従って入力文
の翻訳文を生成し、その結果「ステムを搭載したデバイ
ス」という日本文を得る。
〈発明の効果〉 本発明のハイフン合成語処理方法を適用した機械翻訳装
置においては、入力文章中に)・イフンを含む合成語で
且つハイフンによって名詞と現在分詞或いは名詞と過去
分詞が合成されている語を含むものに対してユーザー辞
書に該合成語を登録しなくても正しい翻訳結果が得られ
て効率的な翻訳が実現できる。
【図面の簡単な説明】
第1図はこの発明を適用する機械翻訳装置の一実施例の
ブロック図、第2図は自動翻訳における翻訳レベルの説
明図、第3図は上記実施例における翻訳モジュールのブ
ロック図、第5図乃至第9図は第4図における各バッフ
ァの内容例を示す図、第10図はハイフン合成語の処理
の動作を示すフローチャート、第11図は本発明におけ
る機械翻訳装置への入力語例とそれに対する出力語(翻
訳語)例を示す図である。 1・・・メインCPU  2・・・メインメモリー 3
・・・CRT  4・・・キーボード 5・・・翻訳モ
ジュール6・・・メモリ11・・・辞書引き形態素解析
部 12・・・構文解析部 13変換部 14・・・翻
訳文生成部15・・・翻訳CPU  16・・・翻訳プ
ログラム A〜E・・・バッファ 4列文 Th1s S en ・ 、(−/)了A −一−、!文′バ′ツブ了

Claims (1)

  1. 【特許請求の範囲】 1、入力された文章中の各単語を辞書引きし、該辞書引
    き情報から前記入力文章の形態素列を得る辞書引き形態
    素解析部と、 該形態素解析部によって得られた形態素列の構文を辞書
    と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
    構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
    前記辞書引き情報から翻訳文を生成する翻訳文生成部と
    を有する機械翻訳装置において、 前記辞書引き形態素解析部は、入力された文章中にハイ
    フンによって合成されたハイフン合成語があれば、該合
    成語をハイフン前後の単語に分割して該分割された2つ
    の単語に対して夫々辞書引きを行い、得られた辞書引き
    情報を前記合成語に対応させて保持し、 更に前記辞書引きの結果前記合成語の分割されたハイフ
    ン前の単語が名詞であり、且つハイフン後の単語が現在
    分詞又は過去分詞である場合は、前記合成語に対応させ
    て保持した前記辞書引き情報に基づいて前記ハイフン前
    後の単語だけで翻訳を行い、該翻訳結果を前記合成語に
    対応させて保持し、 前記翻訳文生成部は、当該翻訳結果を前記合成語の訳語
    として出力することを特徴とする機械翻訳装置における
    ハイフン合成語処理方法。
JP1104237A 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法 Expired - Fee Related JPH0719260B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1104237A JPH0719260B2 (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法
US07/513,254 US5065318A (en) 1989-04-24 1990-04-20 Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
EP90304350A EP0398513B1 (en) 1989-04-24 1990-04-23 Method and apparatus for translating a sentence including a compound word formed by hyphenation
DE69025091T DE69025091T2 (de) 1989-04-24 1990-04-23 Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1104237A JPH0719260B2 (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法

Publications (2)

Publication Number Publication Date
JPH02281374A true JPH02281374A (ja) 1990-11-19
JPH0719260B2 JPH0719260B2 (ja) 1995-03-06

Family

ID=14375355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1104237A Expired - Fee Related JPH0719260B2 (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン合成語処理方法

Country Status (1)

Country Link
JP (1) JPH0719260B2 (ja)

Also Published As

Publication number Publication date
JPH0719260B2 (ja) 1995-03-06

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPS61163467A (ja) 機械翻訳システム
JPH05314166A (ja) 電子化辞書および辞書検索装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
JPH03222065A (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JP2626722B2 (ja) 日本語生成装置
JP2719453B2 (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JP2926745B2 (ja) 機械翻訳装置
JPH01112368A (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JP3233800B2 (ja) 機械翻訳装置
JP3255294B2 (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH01112367A (ja) 機械翻訳装置
JPH03222066A (ja) 機械翻訳装置
JPH04235671A (ja) 機械翻訳装置
JPH07295985A (ja) 機械翻訳装置
JPH03217971A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080306

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090306

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees