JPH10320391A

JPH10320391A - 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number: JPH10320391A
Application number: JP9126807A
Authority: JP
Inventors: Akiko Niimi; 晶子新美
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 1997-05-16
Filing date: 1997-05-16
Publication date: 1998-12-04

Abstract

(57)【要約】【課題】構文解析中に他に複数の漢字表記を持つあい
まいな見出し語を検出し、再度かな漢字変換処理を行う
ことにより、正確な翻訳結果文を得ることが可能な機械
翻訳装置を提供すること。【解決手段】漢字化処理においては、判断処理が、先
に行われた形態素解析で付与された複数漢字表記フラグ
３９が入力文中に付与されている箇所があるか否かを検
出し（Ｓ４１０）、該当する箇所については、その箇所
の文字列を切り出して（Ｓ４２０）、かな漢字変換処理
（Ｓ４３０）を行い、そして、漢字かな混じり文字列を
元の入力文に戻して（Ｓ４６０）、変換処理を続行し、
翻訳文を生成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、第一言語である日
本語から成る原文を第二言語に翻訳する機械翻訳装置及
び機械翻訳処理プログラムを記録したコンピュータ読み
取り可能な記録媒体に関するものである。

【０００２】

【従来の技術】従来、例えば、日本語（第一言語）から
英語（第二言語）に翻訳する場合には、べた書きの日本
語を単語（形態素）に分割するための形態素解析を行う
必要がある。機械翻訳を行う時は、ほとんどの場合入力
文が既にかなと漢字の混じり文字列（以下、漢字かな混
じり文字列と称す）である。機械翻訳装置として、かな
漢字変換用の辞書と、翻訳用の辞書とを重複して持つこ
とは大容量を必要とするので非効率であり、かつ日本語
の表記の揺れがあるため、これら２つの辞書を一体にす
るための研究も盛んである。そして、出来上がった形態
素解析結果を用いて構文解析を行う。この結果を利用し
て、英語に翻訳する時に、個々の日本語の単語の訳語を
決定したり、日本語と英語の構文の差を吸収して構造変
換を行う。このかな漢字変換、構文解析の技術は、音声
認識や音声合成、日本語文章推敲支援、情報検索や大規
模データベースの開発等、日本語を処理する上で必須の
技術である。

【０００３】

【発明が解決しようとする課題】しかしながら、日本語
の表記は、ひらがな、カタカナ、漢字及びローマ字等、
文字種が多く、清書法も特にないため、揺れが大きい。
カタカナの場合なら、長音の有無、曖昧母音や撥音、拗
音等の表記の揺れ等がある。また、和語はひらがな、漢
語は漢字、自立語は漢字、付属語・助詞・助動詞はひら
がな、といった漠然としたルールがあるが、これらも確
実なものではない。勿論、「大抵ひらがなで書かれる単
語」と「めったにひらがなで書かれず、もっぱら漢字で
書かれる単語」の区別が漠然とあるため、機械翻訳シス
テムでも、辞書の見出し語にひらがなを許しているもの
は多い。例えば、動詞「つく」は「付く、着く、突く、
就く、附く、衝く」等、漢字表記が多い単語である。そ
の中で、「嘘をつく」の「つく」は、通常ひらがなで書
かれ、漢字で敢えて書き表そうとすることはないといっ
ても良い。また、「嘘を突く」とあった場合、慣用的に
用いられる「嘘をつく」とは異なった意味になり、そう
いう意味でも正しい表記は必要である。

【０００４】一方で、漢字で書かれていれば、動詞の意
味を決めることができるのに、ひらがなで書かれている
と、多くのかな漢字変換システムが行っているように、
「つく」の必須格との共起情報を調べなければ、正しい
意味（この場合は表記に代表される）を得ることはでき
ない。即ち、入力文が「ついた。」であった場合の翻訳
の確からしさと、入力文が「就いた」、「付いた」、
「着いた」等であった場合の翻訳の確からしさは比較に
ならないほど低い。このことに対して、かな漢字変換、
機械翻訳では様々な技術が利用されている。通常利用さ
れるのが共起情報であり、また、利用頻度の情報であ
り、そして、膨大な辞書情報が双方で蓄積されている。
機械翻訳の場合、例えば「着く」ならば、訳語は”ａｒ
ｒｉｖｅ”、「就く」ならば”ｇｅｔａｊｏｂ”と
いうように、訳語を決めることができるが、「つく」に
対して訳し分けの情報を付与することは、即ち、「就
く」も「着く」もすべて包括した情報を付与しなければ
ならず、無駄が多いし、辞書を構築するのもメンテナン
スも大変困難であり、かな漢字変換の情報を利用できる
ことが望まれる。

【０００５】処が、かな漢字変換と機械翻訳とでは、視
点が異なるため、双方の技術が融合されるのは、かな漢
字変換の結果の漢字かな混じり文字列を翻訳の見出し語
とすることで、表記の揺れを吸収するという技術が中心
であった。これは、「あつい」を必ず「厚い、暑い、熱
い、篤い」のうちの一つに決めるとか、送り仮名、長音
の表記、語尾のハイフンの有無等に対して表記を統一す
るには有効である。しかし、ひらなが表記も自然である
が、意味を特定するためには漢字表記が必要である、前
記「つく」の様な例には対応できない。また、現在の機
械翻訳システムは、必ずしもテキストの作成の直後に翻
訳を行うよりも、既に存在しているオンラインのテキス
トをそのまま入力文として機械翻訳システムに取り込む
形の利用が多いため、このように入力文を入力する際に
しか利用できない技術では、有効でないことが多かっ
た。

【０００６】本発明は、上述した問題点を解決するため
になされたものであり、第二言語から成る訳語を決定
し、第二言語の構文へ構造変換する際に、検索された見
出し語がひらがなであり、複数の漢字表記を有すると判
断された箇所を検出し、その箇所の文字列を抽出して、
再度かな漢字変換処理を行うことにより、正確な翻訳結
果文を得ることが可能な機械翻訳装置及び機械翻訳処理
プログラムを記録したコンピュータ読み取り可能な記録
媒体を提供することを目的としている。

【０００７】

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項１に記載の機械翻訳装置は、少なく
とも第一言語を日本語とする見出し語と、読みと、その
見出し語に対応する第二言語の訳語と、形態素解析処理
に必要な接続情報とを含み、翻訳処理において参照され
る各種辞書登録情報を格納している辞書を有し、その辞
書を用いて、前記第一言語から成る原文を第二言語に翻
訳するものを対象とするものである。

【０００８】そして、特に、前記辞書を用いて、第一原
語の形態素解析及び構文解析を行った結果に対して、前
記第二言語から成る訳語を決定し、前記第二言語の構文
へ構造変換する構造変換手段と、前記辞書を用いて、第
一言語から成る文字列をかな漢字変換するかな漢字変換
手段とを備え、前記構造変換手段は、与えられた第一言
語の原文の形態素解析が行われた結果に対して、検索さ
れた見出し語がひらがなであり、複数の漢字表記を有す
るか否かを判断する判断手段と、前記第二言語から成る
訳語を決定し、前記第二言語の構文へ構造変換する際
に、前記判断手段により判断された結果に基づいて、検
索された見出し語がひらがなであり、複数の漢字表記を
有すると判断された箇所を検出すると共に、その箇所の
文字列を抽出して、前記かな漢字変換手段によってかな
漢字変換させる漢字化処理手段とを備えたことを特徴と
している。

【０００９】前記構成を有する請求項１に記載の機械翻
訳装置によれば、与えられた第一言語の原文に対して、
先ず、辞書を用いて形態素解析及び構文解析を行う。そ
して、前記構造変換手段が前記構文解析結果に対して訳
語の決定と構文の構造変換を行う。その際、その構造変
換手段に設けられた判断手段が、構文解析が行われた結
果に対して、検索された見出し語がひらがなであり、複
数の漢字表記を有するか否かを判断し、構造変換手段に
設けられた漢字化処理手段が、前記判断手段により判断
された結果に基づいて、検索された見出し語がひらがな
であり、複数の漢字表記を有すると判断された箇所を検
出すると共に、その箇所の文字列を抽出して、かな漢字
変換手段によりかな漢字変換させることができる。

【００１０】従って、見出し語の検出が不適切な可能性
のある箇所については、その文字列を抽出してかな漢字
変換手段によるかな漢字変換を行ってから、構造変換手
段による訳語の決定と構文の構造変換が続行され、最終
的に第二言語が生成されて翻訳が完成する。

【００１１】また、請求項２に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、少なくとも第一言語を日本語とする見出し語と、読
みと、その見出し語に対応する第二言語の訳語と、形態
素解析処理に必要な接続情報とを含み、翻訳処理におい
て参照される各種辞書登録情報を格納している辞書を有
し、その辞書を用いて、前記第一言語から成る原文を第
二言語に翻訳するための機械翻訳処理プログラムを記録
したコンピュータ読み取り可能な記録媒体を対象として
いる。

【００１２】そして、特に、前記辞書を用いて、第一原
語の形態素解析及び構文解析を行った結果に対して、前
記第二言語から成る訳語を決定し、前記第二言語の構文
へ構造変換する構造変換プログラムと、前記辞書を用い
て、第一言語から成る文字列をかな漢字変換するかな漢
字変換プログラムとを備え、前記構造変換プログラム
は、与えられた第一言語の原文の形態素解析が行われた
結果に対して、検索された見出し語がひらがなであり、
複数の漢字表記を有するか否かを判断する判断プログラ
ムと、前記第二言語から成る訳語を決定し、前記第二言
語の構文へ構造変換する際に、前記判断プログラムによ
り判断された結果に基づいて、検索された見出し語がひ
らがなであり、複数の漢字表記を有すると判断された箇
所を検出すると共に、その箇所の文字列を抽出して、前
記かな漢字変換プログラムによりかな漢字変換させる漢
字化処理プログラムとを備える。

【００１３】従って、請求項２に記載の機械翻訳処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体によれば、前記各種のプログラムをフロッピーディス
クやＣＤ−ＲＯＭ等の各種の記録媒体の中から機械翻訳
装置に適した記録媒体に記録することができる。

【００１４】そして、この記録媒体を用いてプログラム
を実行することにより、与えられた第一言語の原文に対
して、先ず、辞書を用いて見出し語を検索することによ
り形態素解析を行い、その形態素解析結果に対して、構
文解析を行い、そして、前記解析結果に対して訳語の決
定と構文の構造変換を行う。その際、その構文解析が行
われた結果に対して、検索された見出し語がひらがなで
あり、複数の漢字表記を有するか否かを判断し、その判
断された結果に基づいて、検索された見出し語がひらが
なであり、複数の漢字表記を有すると判断された箇所を
検出すると共に、その箇所の文字列を抽出して、かな漢
字変換させることができる。

【００１５】

【発明の実施の形態】以下に、本発明の機械翻訳装置を
具体化した実施の形態について図面を参照して説明す
る。尚、本実施の形態では、日本語（第一言語）から英
語（第二言語）に翻訳する場合を例として説明する。

【００１６】先ず、本実施の形態の機械翻訳装置の概略
基本構成をブロック図として図１に示す。

【００１７】図１に示すように、本実施の形態の機械翻
訳装置は、翻訳対象となる日本語の原文や各種操作指示
等を入力するためのキーボード等から成る入力部２と、
翻訳処理に利用される各種辞書が格納され、ハードディ
スクや光ディスク等から成る外部記憶装置４と、入力さ
れた日本語の原文や翻訳結果である英語の訳文等を表示
するためのＣＲＴ等から成る表示部６と、その表示部６
に表示するデータを制御する表示制御部７と、翻訳結果
である英語の訳文等を印刷して出力するためのレーザー
プリンタ等から成る印刷部８と、前記入力部２や外部翻
訳装置４から入力されるデータに基づいて翻訳処理を行
い、その翻訳結果を表示部６に表示したり、印刷部８か
ら出力する等の制御を行う制御部１０とから構成されて
いる。

【００１８】前記入力部２には、文字を入力するための
文字キー、各種処理を起動するための入力文編集キー、
翻訳実行キー、出力文編集キー、終了キー、及びユーザ
辞書編集キー、印字実行キー等の各種機能キー、入力文
や出力文の編集や、表示部６に表示されている画面操作
等に使用するカーソルキー、挿入キー、削除キー、確定
キー、及び次候補選択キー等が設けられている。

【００１９】また、前記外部記憶装置４には、翻訳処理
に利用される辞書１２が格納されている。

【００２０】機械翻訳装置が利用する辞書としては、機
械翻訳装置が予め保有している基本辞書、専門分野毎に
編集された専門辞書、及びユーザが独自に構築するユー
ザ辞書がある。専門辞書、ユーザ辞書は利用しても、利
用しなくてもよい。また、専門辞書は、各種専門分野毎
に、ユーザ辞書は、例えば、ユーザ毎や利用分野毎にそ
れぞれ複数個の辞書が同時に存在可能に構成されていて
もよい。本実施の形態では、これらの利用については特
に明言しない。

【００２１】図２に、前記した辞書のデータ構成の一例
を示す。個々の辞書登録情報は、それぞれ見出し語３０
と、各見出し語の品詞３２と、各見出し語の読み３４
と、各見出し語に対する訳語３６と、前後の接続情報や
意味情報等を含む様々な辞書情報３８と、見出し語３０
がひらがなであり、複数の漢字表記が存在していること
を示す複数漢字表記フラグ３９とから構成されている。

【００２２】次に、前記制御部１０は、ＣＰＵ１８、Ｒ
ＯＭ２０、ＲＡＭ２２、入出力ポート２４、及びこれら
各部を結ぶパスライン２６を備えた周知のマイクロコン
ピュータにより構成されている。そして、制御部１０に
おいては、ＲＯＭ２０に格納されたプログラムによって
各種処理が実行される。例えば、前記入力部２から入力
された日本語の原文を英語に翻訳すると共に、原文や翻
訳文の編集等を行う翻訳・編集処理、また、翻訳時に利
用するユーザ辞書を構築するための辞書編集処理等が実
行される。

【００２３】また、前記ＲＯＭ２０には、後述する翻訳
処理において使用される各種情報が格納されている。こ
のＲＯＭ２０が、本発明の形態素解析プログラム、構文
解析プログラム、構文変換プログラム、かな漢字変換プ
ログラム、判断プログラム及び漢字化処理プログラムを
それぞれ記録した記録媒体を構成している。

【００２４】前記ＲＡＭ２２には、入力部から入力され
る日本語の原文、及び翻訳・編集処理により翻訳、編集
された英語の訳文が格納される。

【００２５】続いて、制御部１０が実行する翻訳・編集
処理について図３〜図４に示すフローチャートに従って
説明する。

【００２６】図３に示すように、翻訳・編集処理が実行
されると、先ず、ステップ１１０（以下、ステップをＳ
と略称する。他のステップも同様）において、ユーザに
より入力部２の文字キー等が操作され、翻訳対象となる
日本語の原文が入力されるのを待つ。ここで、原文の入
力は、既に作成されている原文のファイルを読み込むよ
うに構成してもよい。そして、日本語の原文（以下、入
力文）が入力されると、Ｓ１２０に進み、この入力文
を、表示部６の所定のエリアに表示する。

【００２７】次に、Ｓ１３０では、入力部２に設けられ
た入力文編集キーが操作されたか否かを判断し、もし、
操作されていなければ（Ｓ１３０：Ｎ）、Ｓ１５０に移
行する。また、入力文編集キーが操作されていれば（Ｓ
１３０：Ｙ）、Ｓ１４０に移行し、入力文編集処理を実
行する。尚、入力文編集処理が実行されると、ユーザは
表示部６の所定のエリアに表示された入力文を、入力部
２に設けられたカーソルキー、削除キー、挿入キー及び
文字キー等を使用して直接修正することが可能となる。
Ｓ１５０では、入力部２に設けられた翻訳実行キーが操
作されたか否かを判断し、もし、操作されていなければ
（Ｓ１５０：Ｎ）、Ｓ１９０に移行し、また、翻訳実行
キーが操作されていれば（Ｓ１５０：Ｙ）、Ｓ１６０に
移行し、日本語の入力文を英語の訳文（以下、出力文と
する）に翻訳する翻訳処理を実行し、続くＳ１７０にお
いて、翻訳処理により得られた出力文を入力文と対にし
てＲＡＭ２２に格納すると共に、Ｓ１８０において、表
示部６に設けられた所定のエリアにそれぞれ入力文と出
力文とを表示する。

【００２８】尚、翻訳処理は、入力文全部を一括して実
行しても良いし、文章単位で範囲を指定し、指定された
範囲の文章のみについて実行するようにしてもよい。

【００２９】Ｓ１９０では、入力部２に設けられた出力
文編集キーが操作されたか否かを判断し、操作されてい
なければ（Ｓ１９０：Ｎ）、Ｓ２１０に移行する。ま
た、出力文編集キーが操作されていれば（Ｓ１９０：
Ｙ）、Ｓ２００に移行し、出力文編集処理を実行する。
尚、出力文編集処理が実行されると、ユーザは先のＳ１
６０において翻訳処理が実行されることにより表示部６
の所定のエリアに表示される出力文（英語の訳文）を、
Ｓ１４０の入力文編集処理と同様に、入力部２に設けら
れたカーソルキー、削除キー、挿入キー及び文字キー等
を使用して、直接修正することが可能となる。

【００３０】Ｓ２１０では、入力部２に設けられた終了
キーが操作されたか否かを判断し、操作されていなけれ
ば（Ｓ２２０：Ｎ）、Ｓ２２０に移行し、例えば、ユー
ザ辞書登録をするためのユーザ辞書編集キー、翻訳され
た出力文を印刷部８に出力し印刷させる印刷実行キー
等、その他のキー操作を検出すると共に、操作されたキ
ーに応じた処理を実行する。

【００３１】そして、先のＳ１４０、Ｓ１８０、Ｓ２０
０、Ｓ２２０が処理された後は、Ｓ１３０に戻り、同様
の処理を繰り返し実行する。

【００３２】また、Ｓ２１０にて、終了キーが操作され
たと判断されると（Ｓ２１０：Ｙ）、本処理を終了す
る。

【００３３】このように翻訳・編集処理においては、日
本語の原文が入力された後、入力部２に設けられた各種
キーの操作に従って、入力文の編集処理、翻訳処理、辞
書編集処理、及び出力文編集処理といった各種処理が実
行される。そして、もし、翻訳実行キーを操作し翻訳処
理を実行したが、得られた出力文（英語の訳文）が不正
確であったり不自然であったりする場合には、入力文編
集キーを操作して入力文編集処理を実行し、入力文であ
る日本語の原文を再編集した後、またはユーザ辞書編集
キーを操作してユーザ辞書を編集した後、再度、翻訳実
行キーを操作して再翻訳させるか、あるいは出力文編集
キーを操作して出力文編集処理を実行し、出力文である
英語の訳文を直接編集する。

【００３４】このような処理を繰り返すことにより、ユ
ーザが求める翻訳結果を得ることができれば、印刷キー
を操作して、翻訳結果を印刷部８から出力したり、テキ
ストデータとしてＲＡＭ２２や外部記憶装置４に保存
し、その後、終了キーを操作して、処理を終了する。

【００３５】次に、図３に示すフローチャート中のＳ１
６０において実行され、入力文（日本語の原文）から出
力文（英語の訳文）に翻訳する翻訳処理について、図４
に示すフローチャートに従って説明する。

【００３６】まず、Ｓ２５０では、形態素解析処理内の
予め定められた判断規則と辞書内の接続情報を用いて、
入力文を構成する単語について辞書１２を検索し、見出
し語が検索できたものに対して、品詞３２、読み３４、
訳語３６、辞書情報３８、複数漢字表記フラグ３９から
成る辞書１２内の情報等を形態素解析結果に付与する形
態素解析処理を実行する。ここでは、もし、ユーザ辞書
や専門辞書が利用されていれば、同じ文字列に対して、
ユーザ辞書が最も優先される。ついで専門辞書、システ
ム内部の基本辞書の順に辞書が利用される。そして、入
力文の文末まで処理した後、Ｓ２６０へ移行する。Ｓ２
６０では、Ｓ２５０における形態素解析処理の結果を受
け取り、ＲＯＭ２０に格納されている予め定められた解
析文法を用いて、日本語の構造を解析する構文解析処理
を実行する。

【００３７】続いて、Ｓ２７０では、ＲＯＭ２０に格納
されている予め定められた変換文法を用いて、解析処理
により解析された日本語の構造に対して、個々の見出し
語に対して英語の訳語を決定すると共に、英語の構文に
構造変換する構造変換処理を実行する。この時、漢字化
処理Ｓ４００で、形態素解析処理Ｓ２５０において複数
漢字表記フラグ３９が付与されている箇所を修正しなが
ら、変換処理を続行する。このＳ４００の処理が、本発
明の漢字化処理手段として機能する。また、前記Ｓ２７
０の処理が、本発明の構造変手段として機能する。

【００３８】続くＳ２８０では、ＲＯＭ２０に格納され
ている予め定められた生成文法を用いて、構造変換処理
により変換された英語の構造から英語の語順を決定した
り、英語に特有の冠詞を生成したり、入力文に存在しな
くても出力文には必須の主語を補充したり、テンス、ア
スペクト、人称及び数素性等を処理し、英語の単語列か
ら成る出力文を生成する生成処理を実行する。そして、
Ｓ２９０では、ＲＯＭ２０に格納されている予め定めら
れた形態素生成規則を用いて、Ｓ２８０の生成処理によ
り生成された英語の単語列に対して、名詞の複数形、動
詞の過去、過去分詞等の活用形を生成して、出力文を得
る形態素生成処理を実行して翻訳処理を終了する。

【００３９】次に、図４中のＳ４００において実行され
る漢字化処理について、図５に示すフローチャートに従
って説明する。

【００４０】まず、漢字化処理は、フラグ判断処理Ｓ４
１０において、入力文中に複数漢字表記フラグ３９が付
与されてる箇所が存在するか否かを検出する。このＳ４
１０の処理が、本発明の判断手段として機能する。存在
していれば（Ｓ４１０：Ｙ）、Ｓ４２０へ移行する。Ｓ
４２０では、解析処理を経て格情報が付与されている係
受け関係を切り出して、Ｓ４３０へ移行する。係受け関
係で抽出するのは、かな漢字変換の時に確実に共起情報
を利用するためである。

【００４１】Ｓ４３０では、送られてきた文字列に対し
て、漢字表記になっている係受け関係にある他の単語を
利用して、かな漢字変換処理を行い、次のＳ４４０へ移
行する。Ｓ４４０では、かな漢字変換処理が成功して、
文字列が漢字かな混じり文字列に書き換えられたか否か
を検出する。成功して書き換えられた場合には（Ｓ４４
０：Ｙ）、Ｓ４５０へ移行し、戻された漢字かな混じり
文字列の見出し語について辞書１２を検索し、解析処理
に必要な品詞３２と、訳語３６と、辞書情報３８をつけ
直して、Ｓ４６０へ移行する。Ｓ４６０では、新しく出
来上がった漢字かな混じり文字列を元の入力文に戻し
て、Ｓ４１０へ移行する。即ち、Ｓ４１０において切り
出された文字列の部分へ、新しく出来上がった漢字かな
混じり文字列が戻されることになる。尚、前記Ｓ４３０
の処理が、本発明のかな漢字変換手段として機能してい
る。

【００４２】また、前記Ｓ４４０において、かな漢字変
換処理が成功しなかった場合（Ｓ４４０：Ｎ）、Ｓ４７
０へ移行し、かな漢字変換処理に利用した文字列をＳ４
１０で切り出してきた元の文字列に戻して、さらに後方
の文字列の検出のためにＳ４１０へ移行する。そして、
前記Ｓ４１０において、何も検出されなかった時は（Ｓ
４１０：Ｎ）、形態素解析結果検出処理を終了して、Ｓ
２７０の解析処理に戻る。

【００４３】ここで、上述した漢字化処理においてなさ
れる処理について、例文を挙げて説明する。

【００４４】例えば、入力文が「３時に東京につい
た。」である場合を例に挙げる。この場合、動詞部分
「つく」は時点を表わす格「３時に」と、場所を表わす
格「東京に」を持つ。この入力文の解析結果であり、Ｓ
４２０で切り出される係受け関係を図６に示す。「つ
く」は「付く、着く、突く、就く、附く、衝く」等があ
り、あいまいである。Ｓ４２０で切り出された係受け
は、「に」格に場所を取り、しかも、地名（＝東京）で
あること、時点を表わす格を持つことから、Ｓ４３０に
おいて、「３時に東京に着いた」に変換される。この漢
字かな混じり文字列が入力文中に戻されて、形態素解析
処理による正しい構文解析が続行された結果、出力文”
ＩｔａｒｒｉｖｅｄａｔＴｏｋｙｏａｔ３
ｏ’ｃｌｏｃｋ．”を得ることができる。

【００４５】尚、本発明は前記した実施の形態に限定さ
れるものではなく、種々の変更を加えることができる。
例えば、今回は係受けの見出し語の読みの情報を、辞書
の情報から持ってきて、かな漢字変換処理を行ったが、
例えば、特開昭６１−２６０３５３号公報に示されてい
る技術と併せて、係受け関係にある単語の漢字表記をか
な文字列に戻すことができれば、より精度の高いかな漢
字変換結果を得ることができる。

【００４６】また、今回は複数漢字表記フラグ３９を辞
書１２の中にデータとして持たせたが、形態素解析処理
で、見出し語がひらがなであるものと漢字であるものと
を同時に検索し、漢字の見出し語を予め形態素解析結果
に持たせておき、後で、その候補の中からかな漢字変換
の候補を選ぶようにしても良い。この方法であれば、
「いる」が「居る＝一段活用」と「要る＝ラ行五段活
用」になるような場合でも、入力文中の活用形から予め
候補を絞り込むことが可能である。

【００４７】さらに、このように強制的にかな漢字変換
を行った漢字かな混じり文字列を、ユーザに分かるよう
に、出力文中で強調表示したりすれば、間違ったかな漢
字変換をした場合でも、速やかに入力文を編集すること
ができるので、より精度の高い翻訳結果を得ることがで
きる。

【００４８】尚、本実施の形態の機械翻訳装置は、翻訳
のための各プログラムが前記ＲＯＭ２０に予め記憶され
たものであるが、本発明は必ずしもこれに限定されるも
のではない。例えば、これ等のプログラムをフロッピー
ディスクやＣＤ−ＲＯＭ等の各種の記録媒体に記録した
ものを読み取り装置により読み取ってインストールさせ
て動作させることができる。また、有線もしくは無線回
線を使用して外部情報処理装置からプログラムを読み込
んで動作させることができる。この場合、前記フロッピ
ーディスクやＣＤ−ＲＯＭ等の各種の記録媒体や、外部
情報処理装置の該当プログラムを記録したＲＯＭ等の記
憶手段が本発明の記録媒体を構成することになる。

【００４９】

【発明の効果】以上説明したことから明かなように、本
発明の請求項１に記載の機械翻訳装置によれば、構造変
換手段に設けられた判断手段が、形態素解析が行われた
結果に対して、構造変換手段に設けられた漢字化処理手
段が、判断手段により、見出し語がひらがなであり、複
数の漢字表記を有するか否かが判断された結果に基づい
て、見出し語がひらがなであり、複数の漢字表記を有す
ると判断された箇所を検出すると共に、その箇所の文字
列を抽出して、前記かな漢字変換手段によってかな漢字
変換させ、その後、構造変換手段による訳語の決定と構
文の構造変換とが続行されることになり、より正確な構
文解析結果を得ることができ、さらに、それを用いるこ
とで最終的に精度の高い翻訳結果を得ることができる。

【００５０】また、請求項２に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
によれば、機械翻訳するための各種のプログラムをフロ
ッピーディスクやＣＤ−ＲＯＭ等の各種の記録媒体の中
から機械翻訳装置に適した記録媒体に記録して提供する
ことができる。

【００５１】そして、この記録媒体を用いてプログラム
を実行することにより、形態素解析が行われた後、その
見出し語がひらがなであり、複数の漢字表記を有するか
否かが判断された結果に基づいて、見出し語がひらがな
であり、複数の漢字表記を有すると判断された箇所を検
出すると共に、その箇所の文字列を抽出して、かな漢字
変換させ、その後、訳語の決定と構文の構造変換とが続
行されることになり、より正確な構文解析結果を得るこ
とができ、さらに、それを用いることで最終的に精度の
高い翻訳結果を得ることができる。

【図面の簡単な説明】

【図１】本実施の形態の機械翻訳装置の全体構成を示す
ブロック図である。

【図２】本実施の形態の辞書のデータの構成の説明図で
ある。

【図３】本実施の形態の機械翻訳装置の動作を表わすフ
ローチャートである。

【図４】本実施の形態の機械翻訳装置の翻訳処理の流れ
を表わすフローチャートである。

【図５】本実施の形態の機械翻訳装置の漢字化処理の流
れを表わすフローチャートである。

【図６】本実施の形態の漢字化処理で、切り出された係
受け構造の構成の説明図である。

【符号の説明】

４外部記憶装置１０制御部１８ＣＰＵ２０ＲＯＭ２２ＲＡＭ

Claims

【特許請求の範囲】

【請求項１】少なくとも第一言語を日本語とする見出
し語と、読みと、その見出し語に対応する第二言語の訳
語と、形態素解析処理に必要な接続情報とを含み、翻訳
処理において参照される各種辞書登録情報を格納してい
る辞書を有し、その辞書を用いて、前記第一言語から成
る原文を第二言語に翻訳する機械翻訳装置において、前記辞書を用いて、第一原語の形態素解析及び構文解析
を行った結果に対して、前記第二言語から成る訳語を決
定し、前記第二言語の構文へ構造変換する構造変換手段
と、前記辞書を用いて、第一言語から成る文字列をかな漢字
変換するかな漢字変換手段とを備え、前記構造変換手段は、与えられた第一言語の原文の形態
素解析が行われた結果に対して、検索された見出し語が
ひらがなであり、複数の漢字表記を有するか否かを判断
する判断手段と、前記第二言語から成る訳語を決定し、
前記第二言語の構文へ構造変換する際に、前記判断手段
により判断された結果に基づいて、検索された見出し語
がひらがなであり、複数の漢字表記を有すると判断され
た箇所を検出すると共に、その箇所の文字列を抽出し
て、前記かな漢字変換手段によってかな漢字変換させる
漢字化処理手段とを備えたことを特徴とする機械翻訳装
置。
【請求項２】少なくとも第一言語を日本語とする見出
し語と、読みと、その見出し語に対応する第二言語の訳
語と、形態素解析処理に必要な接続情報とを含み、翻訳
処理において参照される各種辞書登録情報を格納してい
る辞書を有し、その辞書を用いて、前記第一言語から成
る原文を第二言語に翻訳するための機械翻訳処理プログ
ラムを記録したコンピュータ読み取り可能な記録媒体に
おいて、前記辞書を用いて、第一原語の形態素解析及び構文解析
を行った結果に対して、前記第二言語から成る訳語を決
定し、前記第二言語の構文へ構造変換する構造変換プロ
グラムと、前記辞書を用いて、第一言語から成る文字列をかな漢字
変換するかな漢字変換プログラムとを備え、前記構造変換プログラムは、与えられた第一言語の原文
の形態素解析が行われた結果に対して、検索された見出
し語がひらがなであり、複数の漢字表記を有するか否か
を判断する判断プログラムと、前記第二言語から成る訳
語を決定し、前記第二言語の構文へ構造変換する際に、
前記判断プログラムにより判断された結果に基づいて、
検索された見出し語がひらがなであり、複数の漢字表記
を有すると判断された箇所を検出すると共に、その箇所
の文字列を抽出して、前記かな漢字変換プログラムによ
ってかな漢字変換させる漢字化処理プログラムとを備え
たことを特徴とする機械翻訳処理プログラムを記録した
コンピュータ読み取り可能な記録媒体。