JPH02281374A

JPH02281374A - 機械翻訳装置におけるハイフン合成語処理方法

Info

Publication number: JPH02281374A
Application number: JP1104237A
Authority: JP
Inventors: Hidezo Kugimiya; 釘宮　秀造; Youji Fukumochi; 福持　陽士; Ichiko Nakamura; 中村　いち子; Noriyuki Hirai; 平井　徳行; Hitoshi Suzuki; 等鈴木
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1989-04-24
Filing date: 1989-04-24
Publication date: 1990-11-19
Anticipated expiration: 2010-03-06
Also published as: JPH0719260B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈産業上の利用分野〉本発明は機械翻訳装置のハイフン合成語処理方法にに関
するものである。

〈従来技術〉従来の機械翻訳装置において、入力された文章中にハイ
フンで合成された合成語が含まれている場合は、ハイフ
ン合成語が辞書に含まれていないため名詞として処理さ
れ、該合成語をハイフン前後で分割し、ハイフン前とハ
イフン後の単語毎に辞書引きして夫々の訳語を生成し、
該訳語を単に並べて出力していた。

又、別の方法として使用者が予めユーザー辞書にハイフ
ン合成語を登録しておき、該合成語を翻訳する際には前
記ユーザー辞書を参照させる方法があった。

〈発明が解決しようとする課題〉上述したように上記機械翻訳装置では入力されたハイフ
ン合成語に対して辞書に含まれていなければ名詞として
処理を行う。それ故、例えばハイフンによって名詞と現
在分詞或いは名詞と過去分詞が合成され、形容詞句とな
るハイフン合成語に対しては、翻訳に失敗して誤まった
結果を出すか、原語のｔま出力して正しい翻訳結果が得
られなかった。

一方、ハイフン合成語をユーザー辞書に予め登録してお
けば正しい翻訳結果が得られるものの、この場合使用者
に登録作業の負担がかかり、又出現する合成語の全てを
推測して漏らさずユーザー辞書に登録することは非常に
困難であった。

そこで本発明の目的は、機械翻訳装置において予め辞書
登録しなくてもハイフンによって名詞と現在分詞或いは
名詞と過去分詞が合成されたハイフン合成語を正しく翻
訳できるハイフン合成語処理方法を提供することにある
。

く課題を解決するための手段〉本発明は、上記目的を達成するために、入力された文章
中の各単語を辞書引きし、該辞書引き情報から前記入力
文章の形態素列を得る辞書引き形態素解析部と、該形態素解析部によって得られた形態素列の構文を辞書
と文法規則を用いて解析する構文解析部と、該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、前記辞書引き形態素解
析部は、入力された文章中にハイフンによって合成され
たハイフン合成語があれば、該合成語をハイフン前後の
単語に分割て岸噂中判保持し、更に前記合成語の分割さ
れたハイフン前の単語が名詞であり、且つハイフン後の
単語が現在分詞又は過去分詞である場合は、辞書引きに
よって得られた情報に従って該ハイフン前後の単語だけ
で翻訳を行い、該翻訳結果を前記合成語に対応させて壽
七≠＝＃好保持するものである。

〈作　用〉本発明によれば、辞書引き形態素解析部は入力された任
意の文章中にハイフンで合成された合成語があれば該合
成語をハイフン前後の単語に分割して夫々の単語に対し
て辞書引きを行い、得られた情報を前記合成語に対応さ
せて保持する。

そして、上記辞書引きの結果、前記合成語のハイフン前
の単語が名詞でハイフン後の単語が現在分詞或いは過去
分詞であれば、該ハイフン前後の単語だけで保持した前
記情報を基に翻訳を行い、該翻訳結果を前記合成語に対
応させて保持する。

翻訳文生成部は前記合成語の訳語を生成する際には前記
辞書引き部が前記合成語に対応して保持する前記翻訳結
果を読み出して訳語を生成する。

〈実施例〉以下、この発明を図示の実施例により詳細に説明する。

第１図はこの発明を適用する機械翻訳装置における一実
施例のブロック図である。ｌはメインＣＰＵ（中央処理
装置）、２はメインメモリー３はＣＲＴ（カソード・レ
イ・チューブ）、４はキーボード、５は翻訳モジュール
、６は翻訳用の辞書、文法規則および木構造変換規則等
を格納しているメモリーである。

上記翻訳モジュール５は、ソース言語が入力されると、
それを翻訳してターゲット言語を出力するものである。

すなわち、キーボード４から入力されたソース言語はメ
インＣＰＵＩの制御により翻訳モジュール５に送られる
。翻訳モジュール５は、メモリー６に記憶されている辞
書、文法規則および木構造変換規則等を用いて、後に詳
述するようにして入力されたソース言語をターゲット言
語に翻訳する。その結果は、メインメモリー２に一旦記
憶されると共に、ＣＲＴ３に表示される。

翻訳モジュール５で行われる機械翻訳には、−船釣に第
２図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルＬ１の辞書引き、レ
ベルＬ２の形態素解析、レベルＬ３の構文解析、・・・
と、解析が進められる。

機械翻訳はこの解析レベルにより、大きく次の２つに分
けられる。１つは、レベルＬ６のソース言語およびター
ゲット言語のどちらＫも依存しない概念（中間言語とよ
ぶ）まで解析し、そこから、レベルＬ７の文脈生成、レ
ベルＬ８の意味生成、レベルＬ９の構文生成、レベルＬ
ＩＯの形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。

もう一つは、上述のレベルＬ２の形態素解析、レベルＬ
３の構文解析、レベルＬ４の意味解析およびＬ５の文脈
解析のいずれかまで解析を行ってソース言語の内部構造
を得、次に、この得られたソース言語の内部構造と同レ
ベルのターゲット言語の内部構造に変換した後、ターゲ
ット言語を生成するトランスファ一方式である。

ここで、上記各解析について説明する。

・辞書引き、形態素解析−第１図に示すメモリー６の辞
書を引き、入力された文章を各形態素列（単語列）に分
割し、この各単語に対する品詞などの文法情報および訳
語を得、さらに、時制・人称・数などを解析する。

・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造（構造解析木）を決定する。

・意味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを判別する。

・文脈解析−話題を理解し、省略やあい昧さを取り去る
。

この発明で用いる翻訳モジュール５は、少なくともレベ
ルＬ３の構文解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール５は第３図のよ
うな部分からなる翻訳モジュールを考える。

第４図は上記翻訳モジュール５のブロック図である。ま
た、第５図〜第９図は［’ｒｈｉｓ　ｉｓ　ａ　ｐｅｎ
、Ｊという英文を日本語に翻訳する場合の、第４図に示
す各バッファＡ−Ｅの内容を例示する。

以下、第３図〜第９図を用いて英日翻訳の動作を説明す
る。

まず、読み込まれた原文は第５図に示すように第４図の
バッファＡＫ格納される。翻訳プログラム１６に基づく
翻訳ＣＰＵ１５の制御の下に、第３図の辞書引き形態素
解析部１１により、バッフ７Ａに格納された原文に従っ
てメモリー６の辞書を用いて各単語の必要な情報が得ら
れ、第４図のバッファＢに格納される。ここで、Ｔｈ１
ｓは多品詞語であるが、次の第３図の構文解析部１２に
より一意に決定される。構文解析部１２ではメモＩ）　
−６の辞書と文法規則にしたがって、各単語間の係り受
は関係を示す構造解析木が第７図に示すように決定され
て、第４図のバッファＣに格納される。

この構造解析木は、次のようにして決定される。

すなわち、メモリー６の文法規則から文→主部、述部主部→名詞句述部→動詞、名詞句名詞句→代名詞名詞句→冠詞、名詞の規則が得られる。この規則は、例えば、１つめの規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則にしたがって構造解析木が決定さ
れるのである。

第３図の変換部１３では、上述の構文解析部同様、メモ
リー６の木構造変換規則を用いて、入力された英文に対
する構文解析木（第７図参照）の構造が、第８図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第４図のバッフＩＤに格納される。第３図の
翻訳文生成部１４は、得られた日本語文字列「これペン
である。」に適切な助詞「は」や助動詞をつけて、第９
図のような日本語の形にして、第４図のバッフＩＥに格
納する。この日本文「これはペンである。」は、翻訳モ
ジュール５から出力され、メインメモリー２に格納され
ると共に、ＣＲＴ８に表示される。

次に本発明に係る辞書引き形態素解析部１１のハイフン
合成語の処理動作を第１０図のフローチャートに示す。

以下このフローチャートに従って辞書引き形態素解析部
１１の処理動作を説明する。

ステップＳ１において入力された単語がハイフンを含ん
でいるか否かを判別する。ハイフンを含んだ合成語であ
ればステップＳ３に進みそうでなければステップＳ２に
進む。ステップ５３〜ステツプＳ７においてハイフン合
成語をハイフンの前後の単語に分割し、夫々の単語毎に
辞書引きを行い、得られた結果を前記合成語に対応させ
てバッファＢに保持する。

そしてステップＳ８で上記辞書引きした結果、ハイフン
前の単語が名詞で且つハイフン後の単語が現在分詞或い
は過去分詞であればステップＳ９に進み、そうでなけれ
ばステップＳ１４に進む。ステップＳ９では上記辞書引
きの結果を保持したバッファＢの内容を別のバッファに
退避させる。ステップＳＩＯで別のバッファに退避させ
た辞書引きの結果に基づいてハイフン前とハイフン後の
単語の順番を置き換えてこの２つの単語だけで翻訳処理
を行い、ステップＳｌｌでその翻訳結果を前記合成語に
対応させてバッファＢに保持する。更にステップ５１２
で先に退避させていた辞書引きの結果をバッフＩＢに戻
す。

一方、ステップＳ２においては通常の辞書引きを行ない
、ステップＳｔａでその結果を単語対応させてバッフ１
Ｂに保持する。

ステップＳ１４において入力文章中の全ての単語に対し
て上述した処理を終了したかを判別し、終了していなけ
ればステップＳ１に戻り、終了しておれば辞書引き形態
素解析部１１の処理を終了する。そして翻訳文生成部１
４においてハイフン合成語の訳語を生成する際には該合
成語に対応してバッフ７Ｂに保持されている前記翻訳結
果情報に基づいて訳語を出力し、訳文を生成する。

第１１図は本実施例の機械翻訳装置に入力したハイフン
合成語を含む文章とこの機械翻訳装置から出力された日
本文の例である。

入力されたハイフン合成語［ｓｔｅｍ−ｍｏｕｎｔｅｄ
　Ｊはハイフンの前後で分割されて夫々辞書引きされ、
順番を置き換えてこの２つの単語だけを翻訳して「ステ
ムを搭載する」という訳語を得て、該訳語を合成語「ｓ
ｔｅｍ−ｍｏｕｎｔｅｄ　Ｊに対応させてバッファＢに
保持する。

翻訳文生成部１４では上記翻訳結果情報に従って入力文
の翻訳文を生成し、その結果「ステムを搭載したデバイ
ス」という日本文を得る。

〈発明の効果〉本発明のハイフン合成語処理方法を適用した機械翻訳装
置においては、入力文章中に）・イフンを含む合成語で
且つハイフンによって名詞と現在分詞或いは名詞と過去
分詞が合成されている語を含むものに対してユーザー辞
書に該合成語を登録しなくても正しい翻訳結果が得られ
て効率的な翻訳が実現できる。

【図面の簡単な説明】

第１図はこの発明を適用する機械翻訳装置の一実施例の
ブロック図、第２図は自動翻訳における翻訳レベルの説
明図、第３図は上記実施例における翻訳モジュールのブ
ロック図、第５図乃至第９図は第４図における各バッフ
ァの内容例を示す図、第１０図はハイフン合成語の処理
の動作を示すフローチャート、第１１図は本発明におけ
る機械翻訳装置への入力語例とそれに対する出力語（翻
訳語）例を示す図である。１・・・メインＣＰＵ　　２・・・メインメモリー　３
・・・ＣＲＴ　　４・・・キーボード　５・・・翻訳モ
ジュール６・・・メモリ１１・・・辞書引き形態素解析
部　１２・・・構文解析部　１３変換部　１４・・・翻
訳文生成部１５・・・翻訳ＣＰＵ　　１６・・・翻訳プ
ログラム　Ａ〜Ｅ・・・バッファ４列文Ｔｈ１ｓＳｅｎ・　、（−／）了Ａ −一−、！文′バ′ツブ了

Claims

【特許請求の範囲】１、入力された文章中の各単語を辞書引きし、該辞書引
き情報から前記入力文章の形態素列を得る辞書引き形態
素解析部と、該形態素解析部によって得られた形態素列の構文を辞書
と文法規則を用いて解析する構文解析部と、該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、前記辞書引き形態素解析部は、入力された文章中にハイ
フンによって合成されたハイフン合成語があれば、該合
成語をハイフン前後の単語に分割して該分割された２つ
の単語に対して夫々辞書引きを行い、得られた辞書引き
情報を前記合成語に対応させて保持し、更に前記辞書引きの結果前記合成語の分割されたハイフ
ン前の単語が名詞であり、且つハイフン後の単語が現在
分詞又は過去分詞である場合は、前記合成語に対応させ
て保持した前記辞書引き情報に基づいて前記ハイフン前
後の単語だけで翻訳を行い、該翻訳結果を前記合成語に
対応させて保持し、前記翻訳文生成部は、当該翻訳結果を前記合成語の訳語
として出力することを特徴とする機械翻訳装置における
ハイフン合成語処理方法。