JPH1166068A - 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 - Google Patents

機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Info

Publication number
JPH1166068A
JPH1166068A JP9223283A JP22328397A JPH1166068A JP H1166068 A JPH1166068 A JP H1166068A JP 9223283 A JP9223283 A JP 9223283A JP 22328397 A JP22328397 A JP 22328397A JP H1166068 A JPH1166068 A JP H1166068A
Authority
JP
Japan
Prior art keywords
translation
parentheses
original sentence
sentence
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9223283A
Other languages
English (en)
Inventor
Junzo Ikuta
淳三 生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9223283A priority Critical patent/JPH1166068A/ja
Publication of JPH1166068A publication Critical patent/JPH1166068A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 入力原文中に、括弧書きで略号を示す記号が
与えられている場合、正しい翻訳結果を出力することが
できる機械翻訳装置および機械翻訳方法ならびに機械翻
訳プログラムを記録した記録媒体を提供すること。 【解決手段】 原文・訳文記憶部2に記憶された原文
を、原言語解析部8で解析する際に、括弧部認定部5
は、括弧内に記された文字列と、括弧書きよりも前に存
在する複数の単語との関連を認識することにより、当該
複数の単語を名詞句として認定し、その情報を利用して
解析を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば英語から日
本語への翻訳など、ある言語を他の言語に翻訳する機械
翻訳装置および機械翻訳方法ならびに機械翻訳プログラ
ムを記録した記録媒体に関するものである。
【0002】
【従来の技術】近年、パーソナルコンピュータの普及や
情報通信ネットワークの発達に伴い、情報の国際化が急
速に進展してきており、他国語の情報を目にすることが
非常に多くなってきている。また、自ら情報を発信する
ために他国語の文書を作成する機会も増えてきている。
かかる情報の活用、発信を行うために、機械翻訳装置の
利用機会が増大している。
【0003】従来の機械翻訳装置では、入力文中に括弧
記号が含まれている場合の解析機能を高めるために、特
開平4−283864号公報に、括弧付きの文を括弧内
部と括弧外部に別けて翻訳処理することが開示されてい
る。また、特開平7−200588号公報には、括弧部
の括弧外での役割を解析することが開示されている。
【0004】
【発明が解決しようとする課題】インターネットなどで
流れる情報は、企業や製品に関するものが多く、固有名
詞が多く現れる。また、文章の冗長さをなくすためにそ
の略号を併記して、以降その略号を使用して文章が書か
れていることが多い。
【0005】しかしながら、従来の機械翻訳装置におい
ては、文章中に括弧書きで略号を示す記号が与えられて
いる場合、その情報を利用することができず、誤った翻
訳結果を出力することがあった。
【0006】例えば、図26に示すように、”Security
Protocol Council (SPC) Information”という英文を
日本語文に翻訳する英日の機械翻訳装置について考え
る。
【0007】まず、原文の形態素解析が行われ、単語単
位に区切られ、図27に示すような解析結果が得られ
る。
【0008】次に、形態素解析された各単語の辞書引き
が行われ、図28に示すような辞書引き結果が得られ
る。その結果、図29に示すような解析状態が得られ、
これを基に、単語の複数の品詞を特定する多品詞解消が
行われる。”protocol”という単語は、動詞(立案す
る)と名詞(議定書)の2通りの可能性があるが、文全
体の構成を考えると、S(Security)+V(Protocol)
+O(Council (SPC) Information)の可能性が高く、
動詞である可能性が高い。したがって、図30に示すよ
うな解析結果が得られる。
【0009】この解析結果を基に翻訳を進めると、図3
1に示すような構文解析結果が得られる。したがって、
図32に示すごとく、「安全は、評議会(SPC)情報
を立案する」といったような、誤った翻訳結果が出力さ
れてしまう。
【0010】本発明は、原文中に括弧書きで略号を示す
記号が与えられている場合に、正しい翻訳結果を出力す
ることができる機械翻訳装置および機械翻訳方法ならび
に機械翻訳プログラムを記録した記録媒体を提供するこ
とを目的とする。
【0011】
【課題を解決するための手段】この課題を解決するため
に本発明は、入力される原文を記憶する原文記憶手段
と、原文記憶手段に記憶された原文を形態素に分割する
分割手段と、単語辞書を参照して、分割手段により分割
された形態素の品詞や訳語を検索する辞書検索手段と、
括弧書き中の文字列が、括弧書きよりも前に存在する幾
つかの単語の先頭の文字であるとき、当該単語部分を名
詞句として認定する括弧部認定手段と、分割手段、辞書
検索手段および括弧部認定手段の結果に基づき、ルール
辞書を参照して、原文の構文を解析する原文解析手段
と、原文解析手段の解析結果に基づいて目的言語の訳文
を生成する目的言語生成手段と、目的言語生成手段によ
り生成された訳文を出力する出力手段と、を有する構成
とした。
【0012】これにより、原文中に括弧書きで略号を示
す記号が与えられている場合に、正しい翻訳結果を出力
することができる機械翻訳装置が得られる。
【0013】
【発明の実施の形態】本発明の請求項1に記載の発明
は、入力される原文を記憶する原文記憶手段と、原文記
憶手段に記憶された原文を形態素に分割する分割手段
と、単語辞書を参照して、分割手段により分割された形
態素の品詞や訳語を検索する辞書検索手段と、括弧書き
中の文字列が、括弧書きよりも前に存在する幾つかの単
語の先頭の文字であるとき、当該単語部分を名詞句とし
て認定する括弧部認定手段と、分割手段、辞書検索手段
および括弧部認定手段の結果に基づき、ルール辞書を参
照して、原文の構文を解析する原文解析手段と、原文解
析手段の解析結果に基づいて目的言語の訳文を生成する
目的言語生成手段と、目的言語生成手段により生成され
た訳文を出力する出力手段と、を有する構成としたこと
により、入力原文中に括弧書きで略号を示す記号が与え
られている場合に、その略号が対応する単語群を名詞句
として取り扱う。
【0014】本発明の請求項2に記載の発明は、入力さ
れる原文を記憶する原文記憶手段と、原文記憶手段に記
憶された全原文中において、括弧書き中の文字列が、括
弧書きよりも前に存在する幾つかの単語の先頭の文字で
あるとき、当該単語部分を名詞句として括弧書きテーブ
ルに登録する括弧部登録手段と、原文記憶手段に記憶さ
れた原文を形態素に分割する分割手段と、単語辞書を参
照して、分割手段により分割された形態素の品詞や訳語
を検索する辞書検索手段と、括弧部登録手段によって、
括弧書きテーブルに登録された単語を名詞句として認定
する括弧部認定手段と、分割手段、辞書検索手段および
括弧部認定手段の結果に基づき、ルール辞書を参照し
て、原文の構文を解析する原文解析手段と、原文解析手
段の解析結果に基づいて目的言語の訳文を生成する目的
言語生成手段と、目的言語生成手段により生成された訳
文を出力する出力手段と、を有する構成としたことによ
り、翻訳対象の1文中に、括弧書き中の略語に対応する
部分が無くとも、文章中に対応する部分があれば、対応
する部分を名詞句として取り扱う。
【0015】本発明の請求項3に記載の発明は、請求項
1または請求項2に記載の発明において、目的言語生成
手段は、原文解析手段の解析した結果に基づいて目的言
語の訳文を生成するとき、括弧書きに対応する部分の訳
語をカタカナ語として生成する、構成としたことによ
り、括弧書き中の略語に対応する部分の訳文がカタカナ
で表される。
【0016】
【実施例】以下、本発明の実施例について、図面を参照
しながら説明する。
【0017】(実施例1)図1は本発明の第1の実施例
における機械翻訳装置の機能ブロック図であり、本実施
例の機械翻訳装置を機能手段によって示したものであ
る。
【0018】なお、本実施例では、原言語を英語とし、
目的言語を日本語として機械翻訳を行う英日の機械翻訳
装置を例として説明しているが、原言語、目的言語はこ
れらに何ら限定されるものではなく、他の言語であって
も良い。
【0019】図1において、1は原文の入力や、翻訳の
指示などを行う入力手段、2は原文と翻訳結果である訳
文とを対応付けて記憶する原文・訳文記憶部である。
【0020】3は原文に対して形態素解析を行う形態素
解析部、4は形態素解析部3により形態素解析された個
々の形態素に関して、単語辞書12(後述)に登録され
ている語を検索する辞書検索部である。5は括弧書き中
の文字列が、括弧書きよりも前に存在する幾つかの単語
の先頭の文字であるとき、その部分を名詞句として認定
する括弧部認定部である。6は複数の品詞が候補となっ
た単語について、どの品詞による解釈によって解析を進
めるかを決定する多品詞解消部、7は翻訳対象文の構文
を解析する構文解析部である。
【0021】8は形態素解析部3、辞書検索部4、括弧
部認定部5、多品詞解消部6、構文解析部7に基づき、
原言語の解析を行う原言語解析部である。
【0022】9は原言語の構文を目的言語の構文に変換
する変換部、10は目的言語による訳文を生成する目的
言語生成部である。
【0023】11は翻訳結果を出力する出力手段、12
は翻訳に必要な単語に関する情報を格納している単語辞
書、13は翻訳に必要な文法に関する情報を格納してい
るルール辞書である。
【0024】14は原言語解析部8、変換部9、目的言
語生成部10の各機能の動作、および原文・訳文記憶部
2に格納されたデータの流れを制御する翻訳制御部であ
る。
【0025】図2は本発明の第1の実施例における機械
翻訳装置の回路ブロック図であり、本実施例の機械翻訳
装置をハードウェアによって示したものである。
【0026】図2において、15はキーボードやポイン
ティング・デバイスなど、データを入力する入力装置、
16はプログラムを実行することにより、装置を制御す
る中央処理演算装置(CPU)、17は陰極線管ディス
プレイや液晶ディスプレイなど、データを表示する表示
装置、18はデータを記憶するリード・オンリー・メモ
リ(ROM)、19はデータを一時的に記憶するランダ
ム・アクセス・メモリ(RAM)、20はプリンタや写
植機など、データを印字する印字装置、21はデータを
記憶するハードディスク、22は記録媒体からデータを
読み取る読取装置、23はデータバスである。
【0027】なお、ROM18は、CPU16が実行す
るプログラムを記憶するプログラム記憶領域を有する。
【0028】また、CPU16が実行するプログラム
は、ROM18に記憶されていることとしているが、プ
ログラムは、携帯性のあるCD−ROMなどの記録媒体
に記録され、読取装置22により読み取るようにしても
良い。このようにすることで、本発明が汎用コンピュー
タにより実現できることになる。
【0029】ここで、図1と図2との対応関係を説明す
る。図1および図2において、入力手段1はキーボード
15により実現される。原文・訳文記憶部2はRAM1
9により実現される。単語辞書12、ルール辞書13は
ハードディスク21により実現される。出力手段11は
表示装置17または印字装置20により実現される。
【0030】形態素解析部3、辞書検索部4、括弧部認
定部5、多品詞解消部6、構文解析部7、原言語解析部
8、変換部9、目的言語生成部10、翻訳制御部14
は、CPU16がROM18およびRAM19とデータ
のやりとりを行いながら、ROM18のプログラム記憶
領域に記憶されている制御プログラムを実行することに
より実現される。
【0031】なお、後述する各動作フローチャートは、
CPU16がROM18のプログラム記憶領域に記憶さ
れている各プログラムを実行する様子について表したも
のである。
【0032】以上のように構成された機械翻訳装置につ
いて、以下に動作を説明する。図3は本発明の第1の実
施例における機械翻訳装置の動作フローチャートであ
り、原文一文を翻訳する動作について示している。な
お、本実施例では、翻訳対象文である原文が、既に原文
・訳文記憶部2に格納されているものとする。
【0033】図3に示すように、まず、入力手段1から
翻訳実行の指示があると、翻訳制御部14は、原文・訳
文記憶部2から翻訳対象とする一文を取り出し、形態素
解析部3に送る(ステップ1)。ここでは、前述した図
26に示す”Security Protocol Council (SPC) Inform
ation”を翻訳対象文として説明を行なう。
【0034】形態素解析部3は、翻訳対象文の形態素解
析を行い、翻訳対象文を個々の形態素に分割する(ステ
ップ2)。その結果は図27に示す解析結果となる。
【0035】辞書検索部4は、ステップ2において解析
された個々の形態素に対して、単語辞書12に登録され
ている語を検索し、単語の訳や品詞の種類などのデータ
を取得する(ステップ3)。その結果は図28である。
図28において、訳文の情報が存在しないものは、辞書
に存在しない単語、すなわち”SPC”や、記号の左括
弧”(”や、右括弧”)”である。
【0036】括弧部認定部5は、括弧書き中の文字列が
括弧書きよりも前に存在する幾つかの単語の先頭の文字
であるとき、その部分を名詞句として扱う(ステップ
4)。このステップ4における、括弧部認定部5による
括弧部認定の処理について、図4に示すフローチャート
を用いて詳細に説明する。
【0037】図4は本発明の第1の実施例における括弧
部認定部の動作フローチャートであり、括弧部認定部5
による括弧部認定の処理について示したものである。
【0038】図4に示すように、まず、ステップ41に
おいて、文中に括弧で囲まれている部分が存在するのか
どうかを判断する。括弧で囲まれている部分が存在して
いればステップ42へ進む。ここでは、”SPC”が括弧
で囲まれている部分として存在しているから、ステップ
42へ進む。
【0039】ステップ42では、括弧内に存在する部分
は、大文字で構成される単語であるのかどうかを判断
し、括弧内が大文字で構成される単語であれば、ステッ
プ43へ進む。これは、括弧内の文字が大文字で構成さ
れていれば、略語の可能性が高いからである。ここで
は、”SPC”が大文字で構成された単語であるので、ス
テップ43へ進む。
【0040】ステップ43では、括弧内の文字列を1文
字ずつ後端より取り出す。ここでは、まず、”SPC”の
最後の文字”C”が取り出される。
【0041】ステップ44に進み、ステップ43で取り
出された文字は、括弧部分の直前の単語の先頭の文字と
同じであるのかどうかを判断する。ここでは、直前の単
語は”Council”であり、取り出した文字は”C”である
から、ステップ45へ進む。
【0042】ステップ45では、括弧内の全ての文字列
について処理が終了したのかどうかを判断する。ここで
は、まだ、”S”と”P”の文字が処理されていないの
で、ステップ43へ戻る。
【0043】ステップ43に戻ると、括弧内の文字列を
1文字ずつ後端より取り出す作業により、次の文字”
P”が取り出される。
【0044】ステップ44に進み、ステップ43で取り
出された文字は、括弧部分の直前の単語の先頭の文字と
同じであるのかどうかを判断する。ここでは、直前の単
語は”Protocol”、取り出した文字は”P”であるか
ら、ステップ45へ進む。
【0045】ステップ45では、括弧内の全ての文字列
について処理が終了したのかどうかを判断する。ここで
は、まだ”S”の文字が処理されていないので、ステッ
プ43へ戻る。
【0046】ステップ43に戻ると、括弧内の文字列を
1文字ずつ後端より取り出す作業により、次の文字”
S”が取り出される。
【0047】ステップ44に進み、ステップ43で取り
出された文字は、括弧部分の直前の単語の先頭の文字と
同じであるのかどうかを判断する。ここでは、直前の単
語は”Security”、取り出した文字は”S”であるか
ら、ステップ45へ進む。
【0048】ステップ45では、括弧内の全ての文字列
について処理が終了したのかどうかを判断する。ここで
は、全ての文字列について処理が終了したので、ステッ
プ46へ進む。
【0049】ステップ46では、括弧内の文字列”SP
C”に対応する部分が”Security Protocol Council”で
あることがわかったので、”Security Protocol Counci
l”の部分を名詞句として取り扱い、括弧書きの部分を
括弧書きとわかるように構造化する。その結果、図5に
示す解析結果が得られる。
【0050】図4のフローチャートに示す処理を終える
と、図3に示すフローチャートの処理に戻り、ステップ
5に進む。
【0051】多品詞解消部6は、ステップ4における括
弧部認定の結果、ある形態素に複数の品詞の可能性があ
るならば、どの解釈に基づき解析を行うかをルール辞書
13のルールを用いて決定する(ステップ5)。ここで
は、”Protocol”に動詞と名詞との2通りの解釈がある
が、ステップ4での”Security Protocol Council”が
名詞句であると判断したことを利用し、”Protocol”は
名詞であると決定される。その結果を図6に示す。
【0052】ステップ5の多品詞解消を行った後、構文
解析部7は、ルール辞書13のルールに従って、翻訳対
象文の構文を特定する(ステップ6)。その結果は、図
7に示すように、名詞が連続した構文であると判断され
る。
【0053】ステップ6の構文解析を行った後、変換部
9により、解析を終えた原言語による翻訳対象文を、目
的言語の形式に変換する(ステップ7)。この結果を図
8に示す。
【0054】ステップ7の変換を行った後、目的言語生
成部10は、変換部9の出力に基づいて、目的言語によ
る訳文を生成する(ステップ8)。その結果は、図9に
示すごとく、訳文は「安全議定所評議会(SPC)情
報」となる。
【0055】翻訳制御部14は、ステップ8で生成した
訳文を原文・訳文記憶部2に格納し、処理を終了する
(ステップ9)。
【0056】以上のように本実施例では、”Security P
rotocol Council (SPC) Information”の訳文が、従来
「安全は、評議会(SPC)情報を立案する」となって
いたものが、「安全議定所評議会(SPC)情報」とな
り、括弧書きされた略語に対して正しい訳文を得ること
ができるようになる。
【0057】(実施例2)以下、本発明の第2の実施例
について、図面を参照しながら説明する。なお、本実施
例の機械翻訳装置の機能手段による構成、ハードウェア
による構成は、第1の実施例において示した図1および
図2を参照する。
【0058】本実施例は、第1の実施例に示した発明
を、文章全体の解析に応用したものであり、図10に示
す文章を翻訳する場合を例として考える。
【0059】本発明の第1の実施例に基づき、図10の
1文目”Security Protocol Council”を解析すると、
図11に示すような形態素解析の出力を得る。これに対
して多品詞解消を行えば、図12のような形態素解析結
果が得られる。この結果に基づき構文解析を行うと図1
3の解析結果が得られ、訳文としては図14に示すごと
く、「安全は、評議会情報を立案する」が得られる。
【0060】図10の文章では、文章中に、”Security
Protocol Council”がひとまとまりの言葉であり、そ
の略号が”SPC”であるということが書かれているにも
かかわらずその知識を利用できないのである。本実施例
は、この知識を利用可能にするものである。
【0061】図15は本発明の第2の実施例における機
械翻訳装置の動作フローチャートであり、括弧部分の括
弧書きテーブルへの登録動作について示している。本実
施例では、翻訳対象文である原文(図10を参照)が、
すでに原文・訳文記憶部2に記憶されているものとす
る。
【0062】図15に示すように、まず、入力手段1か
ら翻訳を実行する指示があると、翻訳制御部14は、原
文・訳文記憶部2から翻訳対象とする一文を取り出す
(ステップ11)。ここでは、”Security Protocol Co
uncil Information”が取り出される。
【0063】括弧部認定部5は、取り出された1文の中
から括弧部分と認定されるものを、内部に保有する括弧
書きテーブルに登録する(ステップ12)。ステップ1
2における括弧部認定部5による括弧部登録処理につい
て、図16に示すフローチャートを用いて詳細に説明す
る。
【0064】図16に示すように、ステップ121にお
いて、原文中に括弧で囲まれている部分があるのかどう
か判断する。ここでは、”Security Protocol Council
Information”には括弧で囲まれている部分が存在しな
いため、直ちに処理を終了する。
【0065】図15に示すフローチャートに戻り、ステ
ップ13に進む。ステップ13では全ての文を処理した
か判断する。まだ全ての文を処理していないため、ステ
ップ11に戻る。
【0066】翻訳制御部14は、原文・訳文記憶部2か
ら翻訳対象とする次の一文を取り出す(ステップ1
1)。ここでは、”Security Protocol Council (SPC)
is the organization fordiscussing security protoco
ls.”が取り出される。
【0067】括弧部認定部5は、取り出された1文の中
から括弧部分と認定されるものを、内部に保有する括弧
書きテーブルに登録する(ステップ12)。ステップ1
2における括弧部認定部5による括弧部登録処理につい
て、図16に示すフローチャートを用いて詳細に説明す
る。
【0068】図16に示すように、ステップ121にお
いて、文中に括弧で囲まれている部分があるのかどうか
判断する。ここでは、”SPC”が括弧で囲まれている部
分であるため、ステップ122に進む。
【0069】ステップ122において、括弧内は大文字
で構成される単語であるかを判断する。括弧内が大文字
で構成される単語であればステップ123へ進む。”SP
C”が大文字で構成されているのでステップ123へ進
む。
【0070】ステップ123において、括弧内の文字列
を1文字ずつ後端より取り出す。まず、”SPC”の最後
の文字”C”が取り出される。
【0071】ステップ124に進み、括弧書きの直前の
単語の先頭の文字が、ステップ123において取り出し
た文字であるのかどうかを判断する。ここでは、直前の
単語は”Council”、取り出した文字は”C”であるか
ら、ステップ125へ進む。
【0072】ステップ125では、括弧内の文字を全て
処理したのかどうかを判断する。まだ”S”と”P”が残
っているので、ステップ123へ戻る。
【0073】ステップ123において、括弧内の文字列
を1文字ずつ後端より取り出す。次の文字”P”が取り
出される。
【0074】ステップ124に進み、括弧書きの直前の
単語の先頭の文字が、ステップ123において取り出し
た文字であるのかどうかを判断する。ここでは、直前の
単語は”Protocol”、取り出した文字は”P”であるか
ら、ステップ125へ進む。
【0075】ステップ125では、括弧内の文字を全て
処理したのかどうかを判断する。まだ”S”が残ってい
るので、ステップ123へ戻る。
【0076】ステップ123において、括弧内の文字列
を1文字ずつ後端より取り出す。次の文字”S”が取り
出される。
【0077】ステップ124に進み、括弧書きの直前の
単語の先頭の文字が、ステップ123において取り出し
た文字であるのかどうかを判断する。ここでは、直前の
単語は”Security”、取り出した文字は”S”であるか
ら、ステップ125へ進む。
【0078】ステップ125では、括弧内の文字を全て
処理したのかどうかを判断する。全て処理したので、ス
テップ126へ進む。
【0079】ステップ126において、括弧内の”SP
C”に対応する部分が”Security Protocol Council”で
あることがわかったので、”Security Protocol Counci
l”を括弧書きテーブルの括弧部対応語の欄に登録
し、”SPC”を括弧内語として登録する。その結果、括
弧書きテーブルは図18に示す状態になる。
【0080】次に、ステップ121に戻り、他に処理し
ていない括弧で囲まれている部分があるのかどうかを判
断する。ここでは存在しないので、図16に示すフロー
チャートを終了し、図15のステップ12を終了する。
【0081】図15に示すフローチャートに戻り、ステ
ップ13に進む。ステップ13では全ての文を処理した
のかどうか判断する。まだ全ての文を処理していないた
め、ステップ11に戻り、以降、同様に文章中の全ての
文に対してステップ11からステップ13を繰り返し実
行する。
【0082】文章中の全ての文を処理したら、ステップ
14に進み、翻訳処理を始める。図15に示すように、
翻訳制御部14は、原文・訳文記憶部2から翻訳対象と
する一文を取り出す(ステップ14)。ここでは、”Se
curity Protocol Council Information”が取り出され
る。
【0083】次に、ステップ15に進み、1文翻訳が行
われる。ステップ15における一文翻訳処理は、図3に
示すフローチャートに従って実行される。ステップ1か
らステップ3までは、第1の実施例に示したものと同様
の処理であるので説明を省略する。
【0084】ステップ4の括弧部認定に関しては、第1
の実施例とは異なり、括弧書きテーブルに登録された文
字列に関しては名詞句として扱うように処理を行う。こ
の処理を図17に示すフローチャートを用いて詳細に説
明する。
【0085】図17に示すように、ステップ151にお
いて、括弧書きテーブルより括弧部対応語を1つ取り出
す。ここでは、”Security Protocol Council”が取り
出される。
【0086】次に、翻訳対象となる文”Security Proto
col Council Information”の中に、取り出した文字
列”Security Protocol Council”が存在するのかどう
かを判断する(ステップ152)。存在するので、ステ
ップ153へ進む。
【0087】ステップ153では、”Security Protoco
l Council”が名詞句として構造化される。その結果、
図19に示すような解析結果が得られる。
【0088】次に、ステップ154において、文中の直
後の文字列がテーブル中の括弧内語と同じ文字列かどう
かを判断する。直後の文字列は”Information”であ
り、括弧内語は”SPC”であるから、ステップ152に
戻る。
【0089】同様にして、ステップ152からステップ
155を繰り返し、文中の全ての単語を処理したらステ
ップ156に進む。
【0090】また、ステップ151からステップ156
を繰り返し、括弧書きテーブルの全てのデータを処理す
るまで同様の処理を繰り返し、処理するデータが無くな
るとこのフローチャートによる処理を終了し、すなわち
図3のステップ4を終了し、その結果として図19に示
す解析結果が得られる。
【0091】図3のステップ5に戻り、多品詞解消部6
は、ステップ4における括弧部認定の結果、ある形態素
に複数の品詞の可能性があるならば、どの解釈に基づき
解析を行うかをルール辞書13に記されたルールを用い
て決定する(ステップ5)。ここでは、”Protocol”に
動詞と名詞の2通りの解釈があるが、”Security Proto
col Council”が名詞句であることを利用し、”Protoco
l”は名詞であると決定する。その結果を図20に示
す。
【0092】ステップ5の多品詞解消を行った後、構文
解析部7は、ルール辞書13に記されたルールを用いて
翻訳対象文の構文を特定する(ステップ6)。その結
果、図21に示すように、名詞が連続した構文であると
判断される。
【0093】ステップ6の構文解析を行った後、変換部
9により、解析を終えた原言語による翻訳対象文を、目
的言語の形式に変換する(ステップ7)。この結果を図
22に示す。
【0094】ステップ7の変換を行った後、目的言語生
成部10は、変換部9の出力を基に、目的言語による訳
文を生成する(ステップ8)。その結果、図23に示す
如く、訳文は「安全議定所評議会情報」となる。
【0095】翻訳制御部14は、ステップ8において生
成した訳文を原文・訳文記憶部2に格納し、処理を終了
する(ステップ9)。
【0096】以上により図15のステップ15を終了
し、ステップ16に進む。同様に、全ての文の処理が終
るまで、ステップ14からステップ16を繰り返し、処
理を終了する。
【0097】以上のように本実施例では、文書中に存在
する括弧書き部分に対応する単語を名詞句として取り扱
い、括弧書きテーブルに記憶させることで、翻訳する一
文に括弧書き部分が無くとも、文書中に存在する括弧書
き中の略語に対応する部分の単語を名詞句として取り扱
うことができ、複数の文を対象に翻訳を行う場合にも適
用できる。
【0098】(実施例3)以下、本発明の第3の実施例
について、図面を参照しながら説明する。なお、本実施
例の機械翻訳装置の機能手段による構成、ハードウェア
による構成は、第1の実施例において示した図1および
図2を参照する。
【0099】本実施例は、第1の実施例において、原言
語解析部8の解析結果に基づいて目的言語の訳文を生成
する際、括弧書きに対応する部分の訳語はカタカナ語を
選択するように変換部9を構成することにより、さらに
読みやすい訳文を得るようにしたものであり、以下に説
明する。
【0100】第2の実施例では、第1の実施例おける変
換部9が、括弧書きに対応する部分の訳語は、カタカナ
語を選択するように構成する。
【0101】第2の実施例は、図3に示すフローチャー
トにおいて、ステップ6までは第1の実施例と同様であ
り、説明を省略する。
【0102】ステップ7において、変換部9は、括弧書
きに対応する部分の訳語はカタカナ語を選択するように
構成するため、図7に示す構文解析部の出力を図28に
示す辞書検索結果の中からカタカナ語を選択するように
する。その結果、図24に示す変換結果を得る。
【0103】ステップ7の変換を行った後、目的言語生
成部10は、変換部9の出力を基に、目的言語による訳
文を生成する(ステップ8)。その結果、図25に示す
如く、訳文は「セキュリティプロトコルカウンシル(S
PC)情報」となる。
【0104】翻訳制御部14は、ステップ8において生
成した訳文を原文・訳文記憶部2に格納し、処理を終了
する(ステップ9)。
【0105】なお、本実施例は、第2の実施例にも適用
できることは言うまでもない。以上のように本実施例で
は、”Security Protocol Council (SPC) Informatio
n”の訳文が、第1の実施例では「安全議定所評議会
(SPC)情報」となっていたものが、「セキュリティ
プロトコルカウンシル(SPC)情報」となり、より読
み易い訳文を得ることができる。これは、固有名詞や専
門用語はカタカナ語で表現した方が一般に読みやすいた
めである。
【0106】以上、第1の実施例、第2の実施例および
第3の実施例に関して詳しく説明したが、本発明は、こ
の説明のアルゴリズムに限定されないのは言うまでもな
い。例えば、”the Council of Secure Protocol (CS
P)”のように、冠詞が先頭に付いたり、前置詞が挿入さ
れた場合に対応するように変更することも容易に可能で
ある。
【0107】
【発明の効果】以上のように本発明によれば、請求項1
に記載の発明は、入力される原文を記憶する原文記憶手
段と、原文記憶手段に記憶された原文を形態素に分割す
る分割手段と、単語辞書を参照して、分割手段により分
割された形態素の品詞や訳語を検索する辞書検索手段
と、括弧書き中の文字列が、括弧書きよりも前に存在す
る幾つかの単語の先頭の文字であるとき、当該単語部分
を名詞句として認定する括弧部認定手段と、分割手段、
辞書検索手段および括弧部認定手段の結果に基づき、ル
ール辞書を参照して、原文の構文を解析する原文解析手
段と、原文解析手段の解析結果に基づいて目的言語の訳
文を生成する目的言語生成手段と、目的言語生成手段に
より生成された訳文を出力する出力手段と、を有する構
成としたことにより、入力原文中に括弧書きで略号を示
す記号が与えられている場合に、その略号が対応する単
語群を名詞句として取り扱うので、正しい翻訳結果が得
られる。
【0108】また、請求項2に記載の発明は、入力され
る原文を記憶する原文記憶手段と、原文記憶手段に記憶
された全原文中において、括弧書き中の文字列が、括弧
書きよりも前に存在する幾つかの単語の先頭の文字であ
るとき、当該単語部分を名詞句として括弧書きテーブル
に登録する括弧部登録手段と、原文記憶手段に記憶され
た原文を形態素に分割する分割手段と、単語辞書を参照
して、分割手段により分割された形態素の品詞や訳語を
検索する辞書検索手段と、括弧部登録手段によって、括
弧書きテーブルに登録された単語を名詞句として認定す
る括弧部認定手段と、分割手段、辞書検索手段および括
弧部認定手段の結果に基づき、ルール辞書を参照して、
原文の構文を解析する原文解析手段と、原文解析手段の
解析結果に基づいて目的言語の訳文を生成する目的言語
生成手段と、目的言語生成手段により生成された訳文を
出力する出力手段と、を有する構成としたことにより、
翻訳対象の1文中に、括弧書き中の略語に対応する部分
が無くとも、文章中に対応する部分があれば、対応する
部分を名詞句として取り扱うので、より正しい翻訳結果
が得られる。
【0109】また、請求項3に記載の発明は、請求項1
または請求項2に記載の発明において、目的言語生成手
段は、原文解析手段の解析した結果に基づいて目的言語
の訳文を生成するとき、括弧書きに対応する部分の訳語
をカタカナ語として生成する、という構成としたことに
より、括弧書き中の略語に対応する部分の訳文がカタカ
ナで表されるので、操作者にとって違和感のない訳文が
得られる。
【図面の簡単な説明】
【図1】本発明の第1の実施例における機械翻訳装置の
機能ブロック図
【図2】本発明の第1の実施例における機械翻訳装置の
回路ブロック図
【図3】本発明の第1の実施例における機械翻訳装置の
動作フローチャート
【図4】本発明の第1の実施例における括弧部認定手段
の動作フローチャート
【図5】本発明の第1の実施例における括弧部認定後の
解析状態を示す図
【図6】本発明の第1の実施例における多品詞解消後の
解析状態を示す図
【図7】本発明の第1の実施例における構文解析後の解
析状態を示す図
【図8】本発明の第1の実施例における変換後の解析状
態を示す図
【図9】本発明の第1の実施例における訳文を示す図
【図10】本発明の第2の実施例における原文を示す図
【図11】本発明の第2の実施例における従来の辞書検
索後の解析状態を示す図
【図12】本発明の第2の実施例における従来の多品詞
解消後の解析状態を示す図
【図13】本発明の第2の実施例における従来の構文解
析後の解析状態を示す図
【図14】本発明の第2の実施例における従来の訳文を
示す図
【図15】本発明の第2の実施例における機械翻訳装置
の動作フローチャート
【図16】本発明の第2の実施例における括弧部認定手
段の動作フローチャート
【図17】本発明の第2の実施例における括弧部認定手
段の動作フローチャート
【図18】本発明の第2の実施例における括弧書きテー
ブルの説明図
【図19】本発明の第2の実施例における括弧部認定後
の解析状態を示す図
【図20】本発明の第2の実施例における多品詞解消後
の解析状態を示す図
【図21】本発明の第2の実施例における構文解析後の
解析状態を示す図
【図22】本発明の第2の実施例における変換後の解析
状態を示す図
【図23】本発明の第2の実施例における訳文を示す図
【図24】本発明の第3の実施例における変換後の解析
状態を示す図
【図25】本発明の第3の実施例における訳文を示す図
【図26】従来例における入力文を示す図
【図27】従来例における形態素解析後の解析状態を示
す図
【図28】従来例における辞書検索結果を示す図
【図29】従来例における辞書検索後の解析状態を示す
【図30】従来例における多品詞解消後の解析状態を示
す図
【図31】従来例における構文解析後の解析状態を示す
【図32】従来例における訳文を示す図
【符号の説明】
1 入力手段 2 原文・訳文記憶部 3 形態素解析部 4 辞書検索部 5 括弧部認定部(括弧書きテーブル) 6 多品詞解消部 7 構文解析部 8 原言語解析部 9 変換部 10 目的言語生成部 11 出力手段 12 単語辞書 13 ルール辞書 14 翻訳制御部 15 入力装置 16 中央処理装置(CPU) 17 表示装置 18 リード・オンリー・メモリ(ROM) 19 ランダム・アクセス・メモリ(RAM) 20 印字装置 21 ハードディスク 22 読取装置 23 データバス

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】入力される原文を記憶する原文記憶手段
    と、 前記原文記憶手段に記憶された原文を形態素に分割する
    分割手段と、 単語辞書を参照して、前記分割手段により分割された形
    態素の品詞や訳語を検索する辞書検索手段と、 括弧書き中の文字列が、括弧書きよりも前に存在する幾
    つかの単語の先頭の文字であるとき、当該単語部分を名
    詞句として認定する括弧部認定手段と、 前記分割手段、前記辞書検索手段および前記括弧部認定
    手段の結果に基づき、ルール辞書を参照して、原文の構
    文を解析する原文解析手段と、 前記原文解析手段の解析結果に基づいて目的言語の訳文
    を生成する目的言語生成手段と、 前記目的言語生成手段により生成された訳文を出力する
    出力手段と、を有することを特徴とする機械翻訳装置。
  2. 【請求項2】入力される原文を記憶する原文記憶手段
    と、 前記原文記憶手段に記憶された全原文中において、括弧
    書き中の文字列が、括弧書きよりも前に存在する幾つか
    の単語の先頭の文字であるとき、当該単語部分を名詞句
    として括弧書きテーブルに登録する括弧部登録手段と、 前記原文記憶手段に記憶された原文を形態素に分割する
    分割手段と、 単語辞書を参照して、前記分割手段により分割された形
    態素の品詞や訳語を検索する辞書検索手段と、 前記括弧部登録手段によって、括弧書きテーブルに登録
    された単語を名詞句として認定する括弧部認定手段と、 前記分割手段、前記辞書検索手段および前記括弧部認定
    手段の結果に基づき、ルール辞書を参照して、原文の構
    文を解析する原文解析手段と、 前記原文解析手段の解析結果に基づいて目的言語の訳文
    を生成する目的言語生成手段と、 前記目的言語生成手段により生成された訳文を出力する
    出力手段と、を有することを特徴とする機械翻訳装置。
  3. 【請求項3】前記目的言語生成手段は、前記原文解析手
    段の解析した結果に基づいて目的言語の訳文を生成する
    とき、括弧書きに対応する部分の訳語をカタカナ語とし
    て生成する、ことを特徴とする請求項1または請求項2
    記載の機械翻訳装置。
  4. 【請求項4】データを入力する入力装置と、データを記
    憶する記憶装置と、データを表示する表示装置とを有す
    る装置を制御する機械翻訳方法であって、 記憶装置に記憶された原文を取り出す第1のステップ
    と、 取り出した原文を形態素に分割し、単語辞書およびルー
    ル辞書を参照して、個々の形態素の品詞や訳語を解析
    し、括弧書き中の文字列が括弧書きよりも前に存在する
    幾つかの単語の先頭の文字であるとき、当該単語部分を
    名詞句として扱い、原文の構文を解析する第2のステッ
    プと、 前記第2のステップにおける解析結果に基づいて目的言
    語の訳文を生成する第3のステップと、 前記第3のステップで生成された訳文を表示させる第4
    のステップとを備えることを特徴とする機械翻訳方法。
  5. 【請求項5】データを入力する入力装置と、データを記
    憶する記憶装置と、データを表示する表示装置とを備え
    る装置を制御する機械翻訳方法であって、 記憶装置に記憶された原文を取り出す第1のステップ
    と、 取り出した全原文を解析し、括弧書き中の文字列が括弧
    書きよりも前に存在する幾つかの単語の先頭の文字であ
    るとき、当該単語部分を名詞句として括弧書きテーブル
    に登録する第2のステップと、 取り出した原文を形態素に分割し、単語辞書及びルール
    辞書を参照して、個々の形態素の品詞や訳語を解析し、
    前記第2のステップによって括弧書きテーブルに登録さ
    れた文字列に関しては名詞句として扱い、原文の構文を
    解析する第3のステップと、 前記第3のステップにおける解析結果に基づいて目的言
    語の訳文を生成する第4のステップと、 前記第4のステップで生成された訳文を表示させる第4
    のステップとを備えることを特徴とする機械翻訳方法。
  6. 【請求項6】データを入力する入力装置と、データを記
    憶する記憶装置と、データを表示する表示装置とを備え
    る装置を制御する機械翻訳プログラムを記録した記録媒
    体であって、 記憶装置に記憶された原文を取り出す第1のステップ
    と、 取り出した原文を形態素に分割し、単語辞書及びルール
    辞書を参照して、個々の形態素の品詞や訳語を解析し、
    括弧書き中の文字列が括弧書きよりも前に存在する幾つ
    かの単語の先頭の文字であるとき、当該単語部分を名詞
    句として扱い、原文の構文を解析する第2のステップ
    と、 前記第2のステップにおける解析結果に基づいて目的言
    語の訳文を生成する第3のステップと、 前記第3のステップで生成された訳文を表示させる第4
    のステップとを備えることを特徴とする機械翻訳プログ
    ラムを記録した記録媒体。
  7. 【請求項7】データを入力する入力装置と、データを記
    憶する記憶装置と、データを表示する表示装置とを備え
    る装置を制御する機械翻訳プログラムを記録した記録媒
    体であって、 記憶装置に記憶された原文を取り出す第1のステップ
    と、 取り出した全原文を解析し、括弧書き中の文字列が括弧
    書きよりも前に存在する幾つかの単語の先頭の文字であ
    るとき、当該単語部分を名詞句として括弧書きテーブル
    に登録する第2のステップと、 取り出した原文を形態素に分割し、単語辞書及びルール
    辞書を参照して、個々の形態素の品詞や訳語を解析し、
    前記第2のステップによって括弧書きテーブルに登録さ
    れた文字列に関しては名詞句として扱い、原文の構文を
    解析する第3のステップと、 前記第3のステップにおける解析結果に基づいて目的言
    語の訳文を生成する第4のステップと、 前記第4のステップで生成された訳文を表示させる第4
    のステップとを備えることを特徴とする機械翻訳プログ
    ラムを記録した記録媒体。
JP9223283A 1997-08-20 1997-08-20 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 Pending JPH1166068A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9223283A JPH1166068A (ja) 1997-08-20 1997-08-20 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9223283A JPH1166068A (ja) 1997-08-20 1997-08-20 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH1166068A true JPH1166068A (ja) 1999-03-09

Family

ID=16795710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9223283A Pending JPH1166068A (ja) 1997-08-20 1997-08-20 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH1166068A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7643986B2 (en) * 2005-03-25 2010-01-05 Fuji Xerox Co., Ltd. Language translation device, method and storage medium for translating abbreviations
JP2010272079A (ja) * 2009-05-25 2010-12-02 Toshiba Corp 機械翻訳装置、方法及びプログラム
JP2011227749A (ja) * 2010-04-21 2011-11-10 Nippon Telegr & Teleph Corp <Ntt> 略語完全語復元装置とその方法と、プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7643986B2 (en) * 2005-03-25 2010-01-05 Fuji Xerox Co., Ltd. Language translation device, method and storage medium for translating abbreviations
JP2010272079A (ja) * 2009-05-25 2010-12-02 Toshiba Corp 機械翻訳装置、方法及びプログラム
JP2011227749A (ja) * 2010-04-21 2011-11-10 Nippon Telegr & Teleph Corp <Ntt> 略語完全語復元装置とその方法と、プログラム

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
EP1482414B1 (en) Translating method for emphasised words
JPH0344764A (ja) 機械翻訳装置
Klemen et al. Neural spell-checker: Beyond words with synthetic data generation
JPH1166068A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
JP2632806B2 (ja) 言語解析装置
JPS61260366A (ja) 学習機能付機械翻訳システム
JPS62271057A (ja) 翻訳装置における辞書登録方式
JP2938897B2 (ja) 文書作成処理装置
JP3244286B2 (ja) 翻訳処理装置
JP2655922B2 (ja) 機械翻訳装置
JP2926745B2 (ja) 機械翻訳装置
JPH01126767A (ja) 辞書参照装置
JPH10269221A (ja) 未登録語処理方式
JPH05290030A (ja) 文書処理装置
JP3353873B2 (ja) 機械翻訳装置
JP2994539B2 (ja) 機械翻訳装置
JP4061001B2 (ja) 機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JP2002007393A (ja) 機械翻訳装置
JPH10105552A (ja) 機械翻訳システム
JP2008226115A (ja) 機械翻訳装置
JPH05120329A (ja) 機械翻訳装置
JPH0612448A (ja) 機械翻訳方法及び機械翻訳装置
JPH07121542A (ja) 機械翻訳装置