JPH05108710A

JPH05108710A - 英日機械翻訳装置

Info

Publication number: JPH05108710A
Application number: JP3269242A
Authority: JP
Inventors: Hitomi Kinoshita; ひとみ木下
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1991-10-17
Filing date: 1991-10-17
Publication date: 1993-04-30

Abstract

(57)【要約】（修正有）【目的】名詞連続及びハイフンで連結された単語を、
まとめて一つの単語と見なし、他の単語同様に未登録処
理を行う。【構成】原文中の名詞連続及びハイフンで連結された
複合語を熟語、すなわち、一つの単語として認識する熟
語認識部７、辞書に未登録の熟語を登録する未登録熟語
リスト８、未登録熟語リスト８に登録された熟語の訳語
をユーザより得る訳語入力部１１、並びに未登録熟語リ
スト８に登録された熟語及びその訳語を登録するユーザ
辞書５を持つことにより、原文中の名詞連続及びハイフ
ンで連結された複合語をすべて熟語と見なし、その熟語
が辞書に未登録であれば、熟語として登録する。【効果】名詞連続及びハイフンで連結された複合語に
対してユーザが設定した訳語を活用できるので翻訳の質
の向上が期待できる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、英文を日本文に翻訳す
る英日機械翻訳装置に関するものである。

【０００２】

【従来の技術】機械翻訳装置にとって、未知語は、必ず
といってよいほど出現する。その時必要となるのが、ユ
ーザによる未知語の登録である。その方法としては、原
文を解析する段階で未知語が現れる度に、必要な情報を
ユーザから登録してもらう方法と、未知語だけ検出し
て、未知語リストを作り、ユーザからまとめて登録して
もらう方法が考えられる。ユーザに与える煩わしさから
考えて、後者の方法がより良いと思われるが、いずれの
方法も単語単位の登録であり、熟語は、扱っていない。

【０００３】熟語として認識されなければならないにも
関わらず、辞書には、登録されてなく、個々の単語は、
辞書に登録されていたとする。例えば、データ構造を説
明する文書中にｌｅａｆｎｏｄｅという名詞連続があ
ったとする。これは、ツリー構造における“子のいない
ノード（葉）”のことをいっている。しかし、辞書中に
「ｌｅａｆｎｏｄｅ」として登録されていなくて、ｌｅａｆ＝葉ｎｏｄｅ＝節と登録されていたなら、「ｌｅａｆ」と「ｎｏｄｅ」
に、それぞれ「葉」「節」という訳語が与えられ、その
２つの訳語を単純につないで、ｌｅａｆｎｏｄｅ＝葉節という訳語になってしまう。

【０００４】また、ａｒｉｔｈｍｅｔｉｃ−ｌｏｇｉｃ
ｕｎｉｔという単語の並びがあったとする。この単語
列に対して、算術論理演算ユニットという訳語が正しい
のだが、これもまた、辞書中に「ａｒｉｔｈｍｅｔｉｃ
−ｌｏｇｉｃｕｎｉｔ」として登録されていなくて、ａｒｉｔｈｍｅｔｉｃ＝算術ｌｏｇｉｃ＝論理ｕｎｉｔ＝ユニットと登録されていたら、算術論理ユニットまたは、ハイフ
ンまで表層化されて、算術−論理ユニットという訳語に
なってしまう。

【０００５】

【発明が解決しようとする課題】以上述べた従来の技術
の未知語処理では、単語単位の登録にとどまり、熟語を
未知語として扱うことはできない。また、本来は、「ｌ
ｅａｆｎｏｄｅ」「ａｒｉｔｈｍｅｔｉｃ−ｌｏｇｉ
ｃｕｎｉｔ」のように、熟語として扱われるべき名詞
連続、ハイフンで連結された複合語であっても、それが
熟語として見なされず、「ｌｅａｆｎｏｄｅ＝葉
節」のように、不自然な訳出を行ってしまう。

【０００６】

【課題を解決するための手段】本発明は、上記問題点を
解決するために、翻訳対象英文を文字列として入力する
英文入力部と、英単語、及びその単語情報が登録されて
いる解析辞書と、解析辞書を用いて、上記英文入力部よ
り入力された英文を解析する英文解析部と、単語を登録
するためのユーザ辞書と、英文解析部で検出された未知
語、及び、その訳語を登録する未知語登録部と、英文解
析部で解析された解析結果をもとに、句を認定し、英文
解析部では、個々の単語として解析された名詞連続、ま
たは、ハイフンで連結された複合語を一つの単語として
まとめあげる熟語認識部と、熟語認識部で認識された熟
語を登録する未登録熟語リストと、未登録熟語リストに
登録された熟語をユーザに示し、その訳語を入力しても
らう訳語入力部と、ユーザ辞書に、未登録熟語、及び、
その訳語を登録する熟語登録部とを有することにより、
原文中の名詞連続、ハイフンで連結された複合語をすべ
て一つの単語と見なし、その熟語が、辞書に未登録であ
れば、未知語処理を行い、熟語として登録する構成でな
る。

【０００７】

【作用】本発明は、上記構成により、名詞連続、及び、
ハイフンで連結された複合語を、熟語、すなわち、一つ
の単語として認識するため、辞書に未登録であれば、未
知語として処理することができる。その結果、ユーザが
設定した訳語を、翻訳に役立てることにより、翻訳の質
の向上が期待できる。

【０００８】

【実施例】図１は本発明の一実施例における機械翻訳装
置のブロック図である。

【０００９】１は、キーボード、ＯＣＲ等により、英文
を文字列として入力する英文入力部である。２は、英単
語、及び、その単語情報が登録されている辞書である。
３は、英単語をキーとして、辞書２を検索する辞書検索
部である。４は、辞書２を用いて英文入力部１で入力さ
れた英文を解析する英文解析部である。この時、辞書２
に登録されていない単語は、未知語として検出してお
く。また、解析結果は、１４の記憶部に記憶しておく。
５は、英文解析部４で検出された未知語、及び、その訳
語を登録するユーザ辞書である。６は、ユーザ辞書５
に、未知語、及び、その訳語を登録する未知語登録部で
ある。７は、英文解析部４で解析された結果を用いて、
句を認定し、英文解析部４では、個々の単語として解析
された名詞連続、または、ハイフンで連結された複合語
を熟語、すなわち、一つの単語としてまとめあげる熟語
認識部である。８は、熟語認識部でまとめあげられた熟
語を未登録熟語として登録する未登録熟語リストであ
る。９は、未登録熟語リスト８に熟語を登録する未登録
熟語リスト作成部である。１０は、未登録熟語リスト８
に登録された熟語をユーザに示す未登録熟語リスト表示
部である。１１は、未登録熟語リスト表示部１０で表示
された熟語の訳語をユーザから入力してもらう訳語入力
部である。１２は、未登録熟語リスト８に登録された熟
語、および、その訳語をユーザ辞書５へ登録する熟語登
録部である。１３は、英文入力部１、辞書検索部３、英
文解析部４、未知語登録部６、熟語認識部７、未登録熟
語リスト作成部９、未登録熟語リスト表示部１０、訳語
入力部１１、熟語登録部１２を制御する制御部である。

【００１０】以上のように構成された本実施例の機械翻
訳装置における熟語の未知語処理について、以下その動
作を、図２のフローチャートに基づいて説明する。

【００１１】まずステップ（イ）で、英文入力部１よ
り、英文を入力する。ここで、ａ）Ｔｈｅｄａｔａｉｓｔｒａｎｓｆｅｒｒｅｄ
ｔｏａｎａｒｉｔｈｍｅｔｉｃ−ｌｏｇｉｃｕｎ
ｉｔ．という英文を挙げる。

【００１２】次にステップ（ロ）で、辞書２を用いて、
入力文ａを解析し、各々の単語について、品詞等の単語
情報を調べる（ここでは、多品詞解消は行われな
い。）。そして、辞書２に登録されていない単語は、未
知語処理を行い、その英単語、及び、訳語をユーザ辞書
５に登録する。ここで、解析された結果は、記憶部１４
に記憶しておく。

【００１３】ステップ（ハ）では、ステップ（ロ）の結
果をもとに、入力文ａの句構造を解析する。ステップ
（ロ）では、入力文ａ中の下線部「ａｒｉｔｈｍｅｔｉ
ｃ−ｌｏｇｉｃｕｎｉｔ」は、ａｒｉｔｈｍｅｔｉｃ：名詞 − ：記号ｌｏｇｉｃ：名詞ｕｎｉｔ：名詞と解析されている。これは、「ａｒｉｔｈｍｅｔｉｃ−
ｌｏｇｉｃｕｎｉｔ」が、辞書２中の１エントリとな
っていないために、名詞連続や、ハイフンで連結された
複合語が、単語毎に解析されてしまったためである。普
通、名詞連続や、ハイフンで連結された複合語は、一つ
の単語、すなわち、辞書の１エントリとなっていてもお
かしくないものである。その証拠に、「ｍａｃｈｉｎｅｔｒａｎｓｒａｔｅｒ＝機械翻
訳」のように、既に、名詞連続が、熟語として辞書中に登録
されているものは、ステップ（ロ）で一つの単語とし
て、解析されている（これは、「最長一致」という考え
に基づいて、解析しているため、「ｍａｃｈｉｎｅ」と
「ｔｒａｎｓｒａｔｅｒ」に分解されないからであ
る。）し、また、分解された名詞連続、ハイフンで連結
された複合語も、句構造を解析した段階で、「ａｒｉｔ
ｈｍｅｔｉｃ−ｌｏｇｉｃｕｎｉｔ」は、名詞句とし
て、まとめられる。ただ一つの単語であれば、それが、
辞書に登録されていなければ、未知語として、ユーザよ
り訳語を指定してもらうことになるのだが、現在の機械
翻訳技術では、熟語は、未知語として扱われない。そこ
で、ステップ（ロ）では、別々の単語として解析された
名詞連続や、ハイフンで連結された複合語は、句構造を
解析した段階で、熟語としてまとめあげると同時に、未
登録熟語として、未登録熟語リスト８に登録する。

【００１４】ステップ（ニ）では、未登録熟語があった
かどうかチェックして、未登録熟語があればステップ
（ホ）へ、なければ、処理を終わる。

【００１５】ステップ（ホ）では、ステップ（ハ）で登
録された未登録熟語を表示し図３、ステップ（ニ）で、
ユーザに訳語を入力してもらう。

【００１６】例えば、図３の未登録熟語リストに表示さ
れた熟語ａｒｉｔｈｍｅｔｉｃ−ｌｏｇｉｃｕｎｉｔ
は、現在、「ａｒｉｔｈｍｅｔｉｃ」「−」「ｌｏｇｉ
ｃ」「ｕｎｉｔ」という別の単語として解析されてい
る。そのため、このままでは、それぞれの単語毎に、
「算術」「−」「論理」「ユニット」と訳語が与えられ
て、算術−論理ユニットとなってしまう。この熟語に対
する訳語は、算術論理演算ユニットである。そこで、ユ
ーザは、図４のように、訳語を入力する。

【００１７】現在、翻訳処理中の文書には、この他に、
「ｌｅａｆｎｏｄｅ」「ｌｅｖｅｌ−ｓｈｉｆｔｖ
ｏｌｔａｇｅ」という名詞連続も存在する。そこでこれ
らの名詞連続も、同様に、「子のいないノード」「レベ
ル変更電圧」と入力する。

【００１８】ステップ（ト）では、未登録熟語リストの
内容を、ユーザ辞書へ登録する。この様な方法で、未登
録熟語の登録を行うことにより、複数の単語からなる熟
語も、一つの単語同様に未知語として扱うことができ、
その熟語をユーザ辞書に登録しておくことにより、翻訳
に役立てることができ、翻訳の質を向上させることにな
る。

【００１９】

【発明の効果】名詞連続、及び、ハイフンで連結された
複合語を、熟語、すなわち、一つの単語として認識する
ため、辞書に未登録であれば、未知語として処理するこ
とができる。その結果、ユーザが設定した訳語を、翻訳
に役立てることにより、翻訳の質の向上が期待できる。

【図面の簡単な説明】

【図１】本発明の機械翻訳装置の一実施例におけるブロ
ック図

【図２】同実施例における動作の流れを示すフローチャ
ート

【図３】ユーザに示される未登録熟語リストの例を示す
図

【図４】熟語に対する正しい訳語をユーザより入力され
た後の未登録熟語リストを示す図

【符号の説明】

１英文入力部２辞書３辞書検索部４英文解析部５ユーザ辞書６未知語登録部７熟語認識部８未登録熟語リスト９未登録熟語リスト作成部１０未登録熟語リスト表示部１１訳語入力部１２熟語登録部１３制御部

Claims

【特許請求の範囲】

【請求項１】翻訳対象英文を文字列として入力する英文
入力部と、英単語、及びその単語情報が登録されている
解析辞書と、上記解析辞書を用いて、上記英文入力部よ
り入力された英文を解析する英文解析部と、単語を登録
するためのユーザ辞書と、上記英文解析部で検出された
未知語、及び、その訳語を登録する未知語登録部と、上
記英文解析部で解析された解析結果をもとに、句を認定
し、上記英文解析部では、個々の単語として解析された
名詞連続、または、ハイフンで連結された複合語を一つ
の単語として認識する熟語認識部と、上記熟語認識部で
認識された熟語を登録する未登録熟語リストと、上記未
登録熟語リストに登録された熟語をユーザに示し、その
訳語を入力してもらう訳語入力部と、上記ユーザ辞書
に、未登録熟語、及び、その訳語を登録する熟語登録部
とを有することにより、原文中の名詞連続、ハイフンで
連結された複合語をすべて一つの単語と見なし、その語
が、辞書に未登録であれば、未知語処理を行い、熟語と
して登録することを特徴とした英日機械翻訳装置。