JPH03214355A

JPH03214355A - 機械翻訳装置

Info

Publication number: JPH03214355A
Application number: JP2011053A
Authority: JP
Inventors: Hidezo Kugimiya; 釘宮　秀造; Hitoshi Suzuki; 等鈴木; Youji Fukumochi; 福持　陽士; Ichiko Nakamura; 中村　いち子; Noriyuki Hirai; 平井　徳行
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1990-01-19
Filing date: 1990-01-19
Publication date: 1991-09-19

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈産業上の利用分野〉この発明は、自然な翻訳文を生成できる機械翻訳装置に
関する。

く従来の技術〉従来、ｍｗ翻訳装置としては次のようなものがある。こ
の機械翻訳装置は、キーホートから入力されたソース言
語を、メインＣＰＵの制御により翻訳モジュールに入力
し、この入力されたソース言語を、メモリに記憶されて
いるメイン辞書やユーザ辞書から成る辞書，文法規則お
よび木構造変換規則を利用して、翻訳モジュールによっ
てターゲット言語に翻訳するものである。

上述のような機械翻訳装置によって英語から日本語へ翻
訳する場合において、上記辞書のうちユーザが独自に作
成するユーザ辞書に新たな単語を登録する際には、次の
ような情報を入力する必要かある。

■　英単語の見出し２　英単語の品詞３．英単語の語尾変化形４　英単語の訳語５　訳語の品詞６　訳語の活用形このように、英９１語およびその訳語のみならず、英単
語や訳語の品詞．英煩語の語尾変化形および訳語の活用
形をも辞書に登録することによって、より自然な翻訳文
を得ることかてきるのてある。

〈発明か解決しようとする課題〉このように、上記入力された英文を日本文に翻訳するｖ
ｉ械翻訳装置におけるユーザ辞書に新たＴＪ単語を登録
する際には、登録英単語の訳語の活用形を入力する必要
がある。したかって、ユーザは日本語文法の知識を有す
る必要かあり、誰でも簡単に効率良くユーザ辞書作成処
理を行うことができないという問題かある。

そこで、この発明の目的は、誰でも簡単に効率良くユー
ザ辞書作成処理を行うことかできろ機械翻訳装置を提供
することにある。

〈課題を解決するための手段〉上記目的を達成するため、この発明は、入力された文章
を形態素に分割してユーザ辞書を含む辞書を用いてその
形聾素の訳語等を得る形態素解析部と、上記形態素解析
部によって分割された形態素列の構文を辞書と文法規則
を用いて解析する構文解析部と、上記構文解析部で得ら
れた構文の構造を日本語における構文の構造に変換する
変換部と、上記変換部によって得られた日本語の構文構
造に従って日本語による翻訳文を生成する翻訳文生成部
を有する機械翻訳装置において、上記ユーザ辞書に登録
する単語に対応する日本語の訳語を構成する文字列にお
ける所定位置の文字が予め指定された文字であるか否か
を判別する訳語文字判別手段と、上記訳語文字判別手段
による判別結果に基づいて所定の規則に従って上記訳語
の活用形を自動的に推定すると共に、推定結果を上記ユ
ーザ辞書に登録する訳語活用形推定・登録手段を備えた
ことを特徴としている。

く作用〉形態素解析部に文章が人力されると、この入力された文
章は上記形態素解析部によって形態素列に分割されて日
本語による訳語等が得られる。こうして、入力文章か形
態素列に分割されると、構文解析部によって上起形態素
列の構文が解析される。そして、上記構文解析部によっ
て得られた構文の構造か変換部によって日本語の構文構
造に変換され、得られた日本語の構文構造に従って翻訳
文生成郎によって日本語による翻訳文が生成される。

上述の形態素解析部における形態素解析および構文解析
部における構文解析の際に用いられる辞書のーってある
ユーザ辞書に新たな単語を登録する際に、上記ユーザ辞
書に登録する単語に対応する日本語の訳語か入力される
。そうすると、この訳語を構成する文字列における所定
位置の文字が予め指定された文字であるか否かが訳語文
字判別手段によって判別される。そして、上記訳語文字
判別手段による判別結果に基づいて、訳語活用形推定・
登録手段によって、所定の規則に従って上記訳語の活用
形か推定されると共に、得られた推定結果が上記ユーザ
辞書に登録される。

したがって、ユーザがユーザ辞書に新たな単語を登録す
る際に、登録する単語の日本語による訳語の活用形が自
動的に推定されて上記ユーザ辞書に登録される。

〈実施例〉以下、この発明を図示の実施例により詳細に説明する。

第１図はこの発明の機械翻訳装置における一実施例のブ
ロック図である。１はメインＣＰＵ（中央処理装置）、
２はメインメモリ、３はＣＲＴ（カソード・レイ・ヂュ
ーブ）、４はキーボード、５は翻訳モジュール、６はメ
イン辞書やユーザ辞書等から成る翻訳用の辞書．文法規
則および木構造変換規則等を格納しているメモリである
。

上記翻訳モジュール５は、ソース言語に上る文章が入力
されると、それを翻訳してターゲット言語である日本語
の文章を出力するものである。すなわち、キーホート４
から入力されたソース言語はメインＣＰＵＩの制御によ
り翻訳モジュール５に送られる。翻訳モジュール５はメ
モリ６に記憶されている辞書．文法規ｆｉｌｌおよび木
構造変換規則等を用いて、入力されたソース言語を後に
詳述するようにしてターゲット言語に翻訳する。その結
果は、メインメモリ２に一旦記憶されると共に、ＣＲＴ
３に表示される。

上記翻訳モジュール５て行われる自動翻訳．には、般に
第２図に示すような解析レベルがある。図中左上におい
てソース言語が入力されると、レヘルＬ１の辞書引き，
レベルＬ，の形態素解析．レベルＬ３の構文解析，・・
・と解析が進められる。

機械翻訳はこの解析レベルにより、大きく次の２つにわ
けられる。１つは、レベルＬ６のソース言語およびター
ケット言語のどちらにも依存しない概念（中間言語とよ
ぶ）まで解析し、そこから、レベルＬ７の文脈生成．レ
ベルＬ８の意味生成，レベルＬｌｌの構文生成，レベル
Ｌ＋ｏの形態素生成と生成を進めて、ターゲット言語を
生成していくピボット方式である。

もうｌ−）は、上述のレベルＬ，の形態素解析，レベル
し，の構文解析，レベルＬ４の意味解析およびレベルＬ
，の文脈解析のいずれかまで解析を行ってソース言語の
内部構造を得、次に、この得られたソース言語の内部構
造と同レベルのターゲット言語の内部構造に変換した後
、ターゲット言語を生成するトランスファ一方式である
。

ここで、上記各解析について説明する。

・辞書引き・形態素解析入力された文章を各形態素列（単語列）に分割し、第１図に示すメモリ６の辞書を引いてこの各単語に対する品詞などの文法情報おび訳語を得、さらに、時制・人称・数などを解析する。

・構文解析一後述するようにして単語間の係り受けなど
の、文章の構造（構造解析木）を決定する。

・意味解析−複敢の構文解析の結果から意味的に正しい
ものとそうでないものを判別する。

・文脈解析一話題を理解し、省略やあい昧さを取り去る
。

この発明で用いる翻訳モジュール５は、少なくともレベ
ルＬ３の構來解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール５は第３図のよ
うな辞書引き形態素解析部ｌｌ．構文解析部１２，変換
部ｌ３および翻訳文生成部１４の各機能部分から成る翻
訳モジュールを考える。

第４図は上記翻訳モジュール５の具体的なブロック図で
ある。また、第５図〜第９図はｒＴｈｉｓ　ｉｓａｐｅ
ｎ．Ｊという英文を日本語に翻訳する場合における第４
図に示す各バッファＡ−Ｅの内容を例示する。

以下、第３図〜第９図を用いて英日翻訳処理について説
明する。

まず、読み込まれた原文は第５図に示すように第４図の
バッファＡに洛納される。そうすると、翻訳プログラム
ｌ６に基づく翻訳ＣＰＵＩ５の制御ノ下に、バッファＡ
に格納された原文に従ってメモリ６の辞書を用いて各単
語の訳語等の必要な情報が得られ、バッファＢに格納さ
れる（第３図の辞書引き形態素解析部２による辞書引き
・形態素解析）。その結果、例えば上記情報の一部であ
る品詞情報は第６図のように格納される。ここで、ｒｔ
ｈｉｓＪは多品詞語であるが、次の構文解析により一意
に決定される。すなわち、メモリ６の辞書と文法規則に
従って、各単語間の係り受け関係を示す構造解析木が第
７図に示すように決定されて、第４図のバッファＣに格
納される（第３図の構文解析部ｌ２による構文解析）。

この構造解析木は、次のようにして決定される。すなわ
ち、メモリ６の文法規則から文→主部，述部主部→名詞句述部一動詞，名詞句名詞句一代名詞名詞旬一冠詞．名詞の規則か得られる。この規則は、例えば、１つ目の蜆１
’ｌｌｌは“文とは、主部と述部からできている”とい
うことを表わす。以下、この規則にしたがって構造解析
木が決定されるのである。

次に、上述の構文解析の場合と同様にメモリ６の木構造
変換規ＩＩＩを世いて、入力された英文に対する構文解
析木（第７図参照）の構造か第８図に示すような日本文
に対する構造に変換される。そして、得られた結果か第
４図のバソファＤに格納される（第３図の変換部１３に
よる構文変換）。最後に、得られた日本文字「これベン
である。」に適切な助詞「は」や助動詞か付けられて、
第９図のような日本語の形にして第４図のバッファＥに
格納される（第３図の翻訳文生成部１４による翻訳文生
成）。こうして得られた日本文「これはベンである。」
は、翻訳モジュール５から出力され、メインメモリ２に
格納されると共に、ＣＲＴ３に表示される。

上述のような翻訳処理の際に、辞書引き・形態素解析に
おいて使用される辞書として、予め用化されたメイン辞
書と、このメイン辞訂にはない特殊な単語等を必要に応
してユーザが登録して作成するユーザ辞書とかある。ユ
ーザか」二記ユーザ辞書に新たな英語の単語およびこの
英単語に対応する日本語の訳語を登録する際には、翻訳
ＣＰＵＩ５によってユーザ辞書登録処理が実行される。

第ｌＯ図は第４図の翻訳ＣＰＵｌ５によって行われるユ
ーザ辞書登録処理動作のフローチャートである。以下、
第ＩＯ図に従ってユーザ辞書登録処理動作について詳細
に述へる。

ステノプＳ１て、ユーザ辞書に登録すべき英単語の見出
しが入力され、ユーザ辞書に登録される。

ステソプＳ２て、上記ステソプＳ１において入力された
英単語の品詞か入力され、ユーザ辞書に登録される。

ステップＳ３て、上記ステソプＳｌにおいて入力された
英単語の語尾変化形が入力され、ユーザ辞書に登録され
る。

ステップＳ４で、上記ステップＳ１において入力された
英単語の日本語による訳語か入力され、ユーザ辞書に登
録される。

ステップＳ５て、上記ステップＳ４において入力された
訳語の品詞か入力され、ユーザ辞書に登録される。

ステップＳ６で、上記ステップＳ４において人力された
訳語の活用形公入力されてユーザ辞書に登録され、ユー
ザ辞書登録処理動作を終了する。

その際に、上記ステソプＳ５において入力された訳語の
品詞が動詞である場合には、上記ステップＳ６において
実施される訳語活用形入力に際して、翻訳ＣＰＵｌ５の
制御の下に上記ステソプＳ４において入力された訳語の
文字に基づいて訳語の活用形が自動的に推定されるので
ある。

第１１図は翻訳ＣＰＵ１５によって実施される動詞に対
する訳語活用形推定・登録処理動作のフローチャートで
ある。以下、第１１図に従って訳語活用形推定・登録処
理動作について詳細に説明する。

ステップＳｌｌて、上記ユーザ辞書登録処理動作のフロ
ーヂャートにおけるステップＳ４において人力されてユ
ーザ辞書に登録されている訳語のＤ後の文字が読み出さ
れて人力される。

ステップＳ１２で、入力された訳語の最後の文字が「う
／＜／ぐ／す／つ／ぬ／ふ／む」のいずれかであるか否
かが判別される。その結果「う／＜／＜／す／っ／ぬ／
ふ／む」のいずれかである場合にはステップＳ１３に進
み、そうでなければステップＳｌ４に進む。

ステソプＳｌ３て、登録された訳語の活用形は五段活用
であると推定され、この推定結果がバッファ（図示せず
）に格納される。

ステップＳｌ４て、入力されｆ二訳語の最後の文字が「
る」であるか否かが判別される。その結果「る」である
場合にはステップＳＩ５に進み、そうでなければ訳語活
用形推定・登録処理動作を終了する。

ステップＳ１５で、上記ユーザ辞書に登録されている訳
語の最後から２文字目の文字が読み出されて入力される
。

ステップＳ１６で、入力された訳語の最後から２文字目
の文字か「来／＜」のいずれかであるか否かか判別され
る。その結果「来／＜」のいずれかである場合にはステ
ップＳｌ７に進み、そうでなければステップＳ１８に進
む。

ステノプＳ１７て、登録された訳語の活用形は力行変格
活用であると推定され、この推定結果か上記バノファに
格納される。

ステノプＳ１８で、呑力された訳語の最後から２文字目
の文字が「す／ず」のいずれかであるか否かが判別され
ろ。その結果「す／ず」のいずれかである場合にはステ
ップＳＩ９に進み、そうでなければステノプＳ２０に進
む。

ステップＳ１９で、登録された訳語の活用形はサ行変烙
活用であると推定され、この推定結果が上記バッファに
格納される。

ステップＳ２０で、人力された訳語の最後から２文字目
の文字が［け／げ／什／ぜ／て／て／ね／へ／べ／ぺ／
め／れ」のいずれかであるか否かが判別される。

その結果「け／げ／せ／ぜ／て／で／ね／へ／べ／ぺ／
め／れ」のいずれかである場合にはステップＳ２１に進
み、そうでなければステップＳ２２に進む。

ステップＳ２１で、登録された訳語の活用形は下一段活
用であると推定され、この推定結果が上記バッファに格
納される。

ステップＳ２２で、登録された訳語の活用形は五段活用
，上一段活用１下一段活用のうちのいずれかであると推
定され、ＣＲＴ３によってユーザによる正しい活用形の
選定が促される。

ステップＳ２３で、上記ステップＳ２２において推定さ
れた五段活用．上一段活用．下一段活用のうちいずれの
活用形であるかがユーザによって選定され、この選定さ
れた活用形が上記バッファに格納される。

ステップＳ２４で、上記各ステップにおいて推定されて
上記バッファに格納されている活用形がメモリ６のユー
ザ辞書に登録されて、訳語活用形推定・登録処理動作を
終了する。

上述のユーザ辞書登録処理動作における英単語見出し．
品詞，語尾変化形，訳語および訳語品詞の入力と訳語活
用形推定・登録処理動作における活用形の選定は、翻訳
ＣＰＵ１５の制御に基づいてＣＲＴ３に表示される指示
内容に従ってキーボート４から必要事項を人力すること
によって実施される。

このように、本実施例において、入力英文を日本文に翻
訳する際に用いるユーザ辞書に新たな単語を登録する際
に、入力された日本語による訳語か動詞の場合には、訳
語の最後の文字および最後から２番目の文字に基づいて
上記訳語の活用形を自動的に推定してユーザ辞書に登録
するようにしたので、日本語の文法に関する知識を持た
ないユーザであっても、簡単に効率良く訳語活用形入力
処理を実行できるのである。

上記実施例においては、動詞の活用形の推定を例に訳語
活用形推定・登録処理動作を説明しているが、他の品詞
の活用形を推定するようにしても何等差し支えない。

この発明における動詞に対する訳語活用形推定のアルゴ
リズムは上記実施例に限定されるものてはない。

また、この発明における翻訳モジュール５の各バソファ
の構成および内容は、本実施例に限定されるものではな
い。

上記実施例におけるソース言語は英語であるが、この発
明はこれに限定されるものではないことは言うまでもな
い。

〈発明の効果〉以上より明らかなように、この発明の機械翻訳装置は、
訳語文字判別手段および訳語活用形推定・登録手段を備
えて、ユーザ辞書に新たな単語を登録する際に、登録単
語に対応する日本語の訳語を構成する文字列における所
定位置の文字が予め指定された文字であるか否かを上記
訳語文字判別手段によって判別し、上記訳語活用形推定
・登録手段によって、上記訳語文字判別手段による判別
結果に基づいて所定の規則に従って上記訳語の活用形を
自動的に推定し、推定結果を上記ユーザ辞書に登録する
ようにしたので、上記ユーザ辞書に新たな単語を登録す
る際に、ユーザによってこの登録単語に対応する日本語
の訳語が入力されると自動的にこの訳語の活用形が推定
されて登録される。

したがって、この発明によれば、日本語の文法に関する
知識を持たないユーザであっても、簡単に効率良く訳語
の活用形を登録できる。

【図面の簡単な説明】

第１図はこの発明の機械翻訳装置の一実施例のブロソク
図、第２図は自動翻訳における翻訳レベルの説明図、第
３図（声上記実施例における翻訳モジュールの機能部分
構成図、第４図は上記翻訳モジュールのブロノク図、第
５図〜第９図は第４図における各バッフ７の内容例を示
す図、第ｌＯ図はユーザ辞書登録処理動作のフローヂャ
ート、第１１図は訳語活用形推定・登録処理動作のフロ
ーヂャートである。ｌ　メインＣＰＴＪ，　　　２・・メインメモリ、３　
　ＣＲ　Ｔ、　　　　　　　４・キーホート、５・・翻
訳モノユール、　　　６　メモリ、ＩＩ・・辞書引き形
性素解析部、ｌ２　構文解析部、Ｉ３・変換部、　　　
　Ｉ４・翻訳文生成部、ｌ５・・・翻訳ＣＰＵ、　　１
６・・翻訳プログラム、Ａ−Ｅ・・バッファ。築５ｙ例文ｆＴｈｉｓｐｅｎ．》＠；６［２ｌ

Claims

【特許請求の範囲】

（１）入力された文章を形態素に分割してユーザ辞書を
含む辞書を用いてその形態素の訳語等を得る形態素解析
部と、上記形態素解析部によって分割された形態素列の
構文を辞書と文法規則を用いて解析する構文解析部と、
上記構文解析部で得られた構文の構造を日本語における
構文の構造に変換する変換部と、上記変換部によって得
られた日本語の構文構造に従って日本語による翻訳文を
生成する翻訳文生成部を有する機械翻訳装置において、
上記ユーザ辞書に登録する単語に対応する日本語の訳語
を構成する文字列における所定位置の文字が予め指定さ
れた文字であるか否かを判別する訳語文字判別手段と、上記訳語文字判別手段による判別結果に基づいて所定の
規則に従って上記訳語の活用形を自動的に推定すると共
に、推定結果を上記ユーザ辞書に登録する訳語活用形推
定・登録手段を備えたことを特徴とする機械翻訳装置。