JPH10320391A - 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH10320391A
JPH10320391A JP9126807A JP12680797A JPH10320391A JP H10320391 A JPH10320391 A JP H10320391A JP 9126807 A JP9126807 A JP 9126807A JP 12680797 A JP12680797 A JP 12680797A JP H10320391 A JPH10320391 A JP H10320391A
Authority
JP
Japan
Prior art keywords
language
kanji
kana
translation
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9126807A
Other languages
English (en)
Inventor
Akiko Niimi
晶子 新美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP9126807A priority Critical patent/JPH10320391A/ja
Publication of JPH10320391A publication Critical patent/JPH10320391A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 構文解析中に他に複数の漢字表記を持つあい
まいな見出し語を検出し、再度かな漢字変換処理を行う
ことにより、正確な翻訳結果文を得ることが可能な機械
翻訳装置を提供すること。 【解決手段】 漢字化処理においては、判断処理が、先
に行われた形態素解析で付与された複数漢字表記フラグ
39が入力文中に付与されている箇所があるか否かを検
出し(S410)、該当する箇所については、その箇所
の文字列を切り出して(S420)、かな漢字変換処理
(S430)を行い、そして、漢字かな混じり文字列を
元の入力文に戻して(S460)、変換処理を続行し、
翻訳文を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、第一言語である日
本語から成る原文を第二言語に翻訳する機械翻訳装置及
び機械翻訳処理プログラムを記録したコンピュータ読み
取り可能な記録媒体に関するものである。
【0002】
【従来の技術】従来、例えば、日本語(第一言語)から
英語(第二言語)に翻訳する場合には、べた書きの日本
語を単語(形態素)に分割するための形態素解析を行う
必要がある。機械翻訳を行う時は、ほとんどの場合入力
文が既にかなと漢字の混じり文字列(以下、漢字かな混
じり文字列と称す)である。機械翻訳装置として、かな
漢字変換用の辞書と、翻訳用の辞書とを重複して持つこ
とは大容量を必要とするので非効率であり、かつ日本語
の表記の揺れがあるため、これら2つの辞書を一体にす
るための研究も盛んである。そして、出来上がった形態
素解析結果を用いて構文解析を行う。この結果を利用し
て、英語に翻訳する時に、個々の日本語の単語の訳語を
決定したり、日本語と英語の構文の差を吸収して構造変
換を行う。このかな漢字変換、構文解析の技術は、音声
認識や音声合成、日本語文章推敲支援、情報検索や大規
模データベースの開発等、日本語を処理する上で必須の
技術である。
【0003】
【発明が解決しようとする課題】しかしながら、日本語
の表記は、ひらがな、カタカナ、漢字及びローマ字等、
文字種が多く、清書法も特にないため、揺れが大きい。
カタカナの場合なら、長音の有無、曖昧母音や撥音、拗
音等の表記の揺れ等がある。また、和語はひらがな、漢
語は漢字、自立語は漢字、付属語・助詞・助動詞はひら
がな、といった漠然としたルールがあるが、これらも確
実なものではない。勿論、「大抵ひらがなで書かれる単
語」と「めったにひらがなで書かれず、もっぱら漢字で
書かれる単語」の区別が漠然とあるため、機械翻訳シス
テムでも、辞書の見出し語にひらがなを許しているもの
は多い。例えば、動詞「つく」は「付く、着く、突く、
就く、附く、衝く」等、漢字表記が多い単語である。そ
の中で、「嘘をつく」の「つく」は、通常ひらがなで書
かれ、漢字で敢えて書き表そうとすることはないといっ
ても良い。また、「嘘を突く」とあった場合、慣用的に
用いられる「嘘をつく」とは異なった意味になり、そう
いう意味でも正しい表記は必要である。
【0004】一方で、漢字で書かれていれば、動詞の意
味を決めることができるのに、ひらがなで書かれている
と、多くのかな漢字変換システムが行っているように、
「つく」の必須格との共起情報を調べなければ、正しい
意味(この場合は表記に代表される)を得ることはでき
ない。即ち、入力文が「ついた。」であった場合の翻訳
の確からしさと、入力文が「就いた」、「付いた」、
「着いた」等であった場合の翻訳の確からしさは比較に
ならないほど低い。このことに対して、かな漢字変換、
機械翻訳では様々な技術が利用されている。通常利用さ
れるのが共起情報であり、また、利用頻度の情報であ
り、そして、膨大な辞書情報が双方で蓄積されている。
機械翻訳の場合、例えば「着く」ならば、訳語は”ar
rive”、「就く」ならば”get a job”と
いうように、訳語を決めることができるが、「つく」に
対して訳し分けの情報を付与することは、即ち、「就
く」も「着く」もすべて包括した情報を付与しなければ
ならず、無駄が多いし、辞書を構築するのもメンテナン
スも大変困難であり、かな漢字変換の情報を利用できる
ことが望まれる。
【0005】処が、かな漢字変換と機械翻訳とでは、視
点が異なるため、双方の技術が融合されるのは、かな漢
字変換の結果の漢字かな混じり文字列を翻訳の見出し語
とすることで、表記の揺れを吸収するという技術が中心
であった。これは、「あつい」を必ず「厚い、暑い、熱
い、篤い」のうちの一つに決めるとか、送り仮名、長音
の表記、語尾のハイフンの有無等に対して表記を統一す
るには有効である。しかし、ひらなが表記も自然である
が、意味を特定するためには漢字表記が必要である、前
記「つく」の様な例には対応できない。また、現在の機
械翻訳システムは、必ずしもテキストの作成の直後に翻
訳を行うよりも、既に存在しているオンラインのテキス
トをそのまま入力文として機械翻訳システムに取り込む
形の利用が多いため、このように入力文を入力する際に
しか利用できない技術では、有効でないことが多かっ
た。
【0006】本発明は、上述した問題点を解決するため
になされたものであり、第二言語から成る訳語を決定
し、第二言語の構文へ構造変換する際に、検索された見
出し語がひらがなであり、複数の漢字表記を有すると判
断された箇所を検出し、その箇所の文字列を抽出して、
再度かな漢字変換処理を行うことにより、正確な翻訳結
果文を得ることが可能な機械翻訳装置及び機械翻訳処理
プログラムを記録したコンピュータ読み取り可能な記録
媒体を提供することを目的としている。
【0007】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の機械翻訳装置は、少なく
とも第一言語を日本語とする見出し語と、読みと、その
見出し語に対応する第二言語の訳語と、形態素解析処理
に必要な接続情報とを含み、翻訳処理において参照され
る各種辞書登録情報を格納している辞書を有し、その辞
書を用いて、前記第一言語から成る原文を第二言語に翻
訳するものを対象とするものである。
【0008】そして、特に、前記辞書を用いて、第一原
語の形態素解析及び構文解析を行った結果に対して、前
記第二言語から成る訳語を決定し、前記第二言語の構文
へ構造変換する構造変換手段と、前記辞書を用いて、第
一言語から成る文字列をかな漢字変換するかな漢字変換
手段とを備え、前記構造変換手段は、与えられた第一言
語の原文の形態素解析が行われた結果に対して、検索さ
れた見出し語がひらがなであり、複数の漢字表記を有す
るか否かを判断する判断手段と、前記第二言語から成る
訳語を決定し、前記第二言語の構文へ構造変換する際
に、前記判断手段により判断された結果に基づいて、検
索された見出し語がひらがなであり、複数の漢字表記を
有すると判断された箇所を検出すると共に、その箇所の
文字列を抽出して、前記かな漢字変換手段によってかな
漢字変換させる漢字化処理手段とを備えたことを特徴と
している。
【0009】前記構成を有する請求項1に記載の機械翻
訳装置によれば、与えられた第一言語の原文に対して、
先ず、辞書を用いて形態素解析及び構文解析を行う。そ
して、前記構造変換手段が前記構文解析結果に対して訳
語の決定と構文の構造変換を行う。その際、その構造変
換手段に設けられた判断手段が、構文解析が行われた結
果に対して、検索された見出し語がひらがなであり、複
数の漢字表記を有するか否かを判断し、構造変換手段に
設けられた漢字化処理手段が、前記判断手段により判断
された結果に基づいて、検索された見出し語がひらがな
であり、複数の漢字表記を有すると判断された箇所を検
出すると共に、その箇所の文字列を抽出して、かな漢字
変換手段によりかな漢字変換させることができる。
【0010】従って、見出し語の検出が不適切な可能性
のある箇所については、その文字列を抽出してかな漢字
変換手段によるかな漢字変換を行ってから、構造変換手
段による訳語の決定と構文の構造変換が続行され、最終
的に第二言語が生成されて翻訳が完成する。
【0011】また、請求項2に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
は、少なくとも第一言語を日本語とする見出し語と、読
みと、その見出し語に対応する第二言語の訳語と、形態
素解析処理に必要な接続情報とを含み、翻訳処理におい
て参照される各種辞書登録情報を格納している辞書を有
し、その辞書を用いて、前記第一言語から成る原文を第
二言語に翻訳するための機械翻訳処理プログラムを記録
したコンピュータ読み取り可能な記録媒体を対象として
いる。
【0012】そして、特に、前記辞書を用いて、第一原
語の形態素解析及び構文解析を行った結果に対して、前
記第二言語から成る訳語を決定し、前記第二言語の構文
へ構造変換する構造変換プログラムと、前記辞書を用い
て、第一言語から成る文字列をかな漢字変換するかな漢
字変換プログラムとを備え、前記構造変換プログラム
は、与えられた第一言語の原文の形態素解析が行われた
結果に対して、検索された見出し語がひらがなであり、
複数の漢字表記を有するか否かを判断する判断プログラ
ムと、前記第二言語から成る訳語を決定し、前記第二言
語の構文へ構造変換する際に、前記判断プログラムによ
り判断された結果に基づいて、検索された見出し語がひ
らがなであり、複数の漢字表記を有すると判断された箇
所を検出すると共に、その箇所の文字列を抽出して、前
記かな漢字変換プログラムによりかな漢字変換させる漢
字化処理プログラムとを備える。
【0013】従って、請求項2に記載の機械翻訳処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体によれば、前記各種のプログラムをフロッピーディス
クやCD−ROM等の各種の記録媒体の中から機械翻訳
装置に適した記録媒体に記録することができる。
【0014】そして、この記録媒体を用いてプログラム
を実行することにより、与えられた第一言語の原文に対
して、先ず、辞書を用いて見出し語を検索することによ
り形態素解析を行い、その形態素解析結果に対して、構
文解析を行い、そして、前記解析結果に対して訳語の決
定と構文の構造変換を行う。その際、その構文解析が行
われた結果に対して、検索された見出し語がひらがなで
あり、複数の漢字表記を有するか否かを判断し、その判
断された結果に基づいて、検索された見出し語がひらが
なであり、複数の漢字表記を有すると判断された箇所を
検出すると共に、その箇所の文字列を抽出して、かな漢
字変換させることができる。
【0015】
【発明の実施の形態】以下に、本発明の機械翻訳装置を
具体化した実施の形態について図面を参照して説明す
る。尚、本実施の形態では、日本語(第一言語)から英
語(第二言語)に翻訳する場合を例として説明する。
【0016】先ず、本実施の形態の機械翻訳装置の概略
基本構成をブロック図として図1に示す。
【0017】図1に示すように、本実施の形態の機械翻
訳装置は、翻訳対象となる日本語の原文や各種操作指示
等を入力するためのキーボード等から成る入力部2と、
翻訳処理に利用される各種辞書が格納され、ハードディ
スクや光ディスク等から成る外部記憶装置4と、入力さ
れた日本語の原文や翻訳結果である英語の訳文等を表示
するためのCRT等から成る表示部6と、その表示部6
に表示するデータを制御する表示制御部7と、翻訳結果
である英語の訳文等を印刷して出力するためのレーザー
プリンタ等から成る印刷部8と、前記入力部2や外部翻
訳装置4から入力されるデータに基づいて翻訳処理を行
い、その翻訳結果を表示部6に表示したり、印刷部8か
ら出力する等の制御を行う制御部10とから構成されて
いる。
【0018】前記入力部2には、文字を入力するための
文字キー、各種処理を起動するための入力文編集キー、
翻訳実行キー、出力文編集キー、終了キー、及びユーザ
辞書編集キー、印字実行キー等の各種機能キー、入力文
や出力文の編集や、表示部6に表示されている画面操作
等に使用するカーソルキー、挿入キー、削除キー、確定
キー、及び次候補選択キー等が設けられている。
【0019】また、前記外部記憶装置4には、翻訳処理
に利用される辞書12が格納されている。
【0020】機械翻訳装置が利用する辞書としては、機
械翻訳装置が予め保有している基本辞書、専門分野毎に
編集された専門辞書、及びユーザが独自に構築するユー
ザ辞書がある。専門辞書、ユーザ辞書は利用しても、利
用しなくてもよい。また、専門辞書は、各種専門分野毎
に、ユーザ辞書は、例えば、ユーザ毎や利用分野毎にそ
れぞれ複数個の辞書が同時に存在可能に構成されていて
もよい。本実施の形態では、これらの利用については特
に明言しない。
【0021】図2に、前記した辞書のデータ構成の一例
を示す。個々の辞書登録情報は、それぞれ見出し語30
と、各見出し語の品詞32と、各見出し語の読み34
と、各見出し語に対する訳語36と、前後の接続情報や
意味情報等を含む様々な辞書情報38と、見出し語30
がひらがなであり、複数の漢字表記が存在していること
を示す複数漢字表記フラグ39とから構成されている。
【0022】次に、前記制御部10は、CPU18、R
OM20、RAM22、入出力ポート24、及びこれら
各部を結ぶパスライン26を備えた周知のマイクロコン
ピュータにより構成されている。そして、制御部10に
おいては、ROM20に格納されたプログラムによって
各種処理が実行される。例えば、前記入力部2から入力
された日本語の原文を英語に翻訳すると共に、原文や翻
訳文の編集等を行う翻訳・編集処理、また、翻訳時に利
用するユーザ辞書を構築するための辞書編集処理等が実
行される。
【0023】また、前記ROM20には、後述する翻訳
処理において使用される各種情報が格納されている。こ
のROM20が、本発明の形態素解析プログラム、構文
解析プログラム、構文変換プログラム、かな漢字変換プ
ログラム、判断プログラム及び漢字化処理プログラムを
それぞれ記録した記録媒体を構成している。
【0024】前記RAM22には、入力部から入力され
る日本語の原文、及び翻訳・編集処理により翻訳、編集
された英語の訳文が格納される。
【0025】続いて、制御部10が実行する翻訳・編集
処理について図3〜図4に示すフローチャートに従って
説明する。
【0026】図3に示すように、翻訳・編集処理が実行
されると、先ず、ステップ110(以下、ステップをS
と略称する。他のステップも同様)において、ユーザに
より入力部2の文字キー等が操作され、翻訳対象となる
日本語の原文が入力されるのを待つ。ここで、原文の入
力は、既に作成されている原文のファイルを読み込むよ
うに構成してもよい。そして、日本語の原文(以下、入
力文)が入力されると、S120に進み、この入力文
を、表示部6の所定のエリアに表示する。
【0027】次に、S130では、入力部2に設けられ
た入力文編集キーが操作されたか否かを判断し、もし、
操作されていなければ(S130:N)、S150に移
行する。また、入力文編集キーが操作されていれば(S
130:Y)、S140に移行し、入力文編集処理を実
行する。尚、入力文編集処理が実行されると、ユーザは
表示部6の所定のエリアに表示された入力文を、入力部
2に設けられたカーソルキー、削除キー、挿入キー及び
文字キー等を使用して直接修正することが可能となる。
S150では、入力部2に設けられた翻訳実行キーが操
作されたか否かを判断し、もし、操作されていなければ
(S150:N)、S190に移行し、また、翻訳実行
キーが操作されていれば(S150:Y)、S160に
移行し、日本語の入力文を英語の訳文(以下、出力文と
する)に翻訳する翻訳処理を実行し、続くS170にお
いて、翻訳処理により得られた出力文を入力文と対にし
てRAM22に格納すると共に、S180において、表
示部6に設けられた所定のエリアにそれぞれ入力文と出
力文とを表示する。
【0028】尚、翻訳処理は、入力文全部を一括して実
行しても良いし、文章単位で範囲を指定し、指定された
範囲の文章のみについて実行するようにしてもよい。
【0029】S190では、入力部2に設けられた出力
文編集キーが操作されたか否かを判断し、操作されてい
なければ(S190:N)、S210に移行する。ま
た、出力文編集キーが操作されていれば(S190:
Y)、S200に移行し、出力文編集処理を実行する。
尚、出力文編集処理が実行されると、ユーザは先のS1
60において翻訳処理が実行されることにより表示部6
の所定のエリアに表示される出力文(英語の訳文)を、
S140の入力文編集処理と同様に、入力部2に設けら
れたカーソルキー、削除キー、挿入キー及び文字キー等
を使用して、直接修正することが可能となる。
【0030】S210では、入力部2に設けられた終了
キーが操作されたか否かを判断し、操作されていなけれ
ば(S220:N)、S220に移行し、例えば、ユー
ザ辞書登録をするためのユーザ辞書編集キー、翻訳され
た出力文を印刷部8に出力し印刷させる印刷実行キー
等、その他のキー操作を検出すると共に、操作されたキ
ーに応じた処理を実行する。
【0031】そして、先のS140、S180、S20
0、S220が処理された後は、S130に戻り、同様
の処理を繰り返し実行する。
【0032】また、S210にて、終了キーが操作され
たと判断されると(S210:Y)、本処理を終了す
る。
【0033】このように翻訳・編集処理においては、日
本語の原文が入力された後、入力部2に設けられた各種
キーの操作に従って、入力文の編集処理、翻訳処理、辞
書編集処理、及び出力文編集処理といった各種処理が実
行される。そして、もし、翻訳実行キーを操作し翻訳処
理を実行したが、得られた出力文(英語の訳文)が不正
確であったり不自然であったりする場合には、入力文編
集キーを操作して入力文編集処理を実行し、入力文であ
る日本語の原文を再編集した後、またはユーザ辞書編集
キーを操作してユーザ辞書を編集した後、再度、翻訳実
行キーを操作して再翻訳させるか、あるいは出力文編集
キーを操作して出力文編集処理を実行し、出力文である
英語の訳文を直接編集する。
【0034】このような処理を繰り返すことにより、ユ
ーザが求める翻訳結果を得ることができれば、印刷キー
を操作して、翻訳結果を印刷部8から出力したり、テキ
ストデータとしてRAM22や外部記憶装置4に保存
し、その後、終了キーを操作して、処理を終了する。
【0035】次に、図3に示すフローチャート中のS1
60において実行され、入力文(日本語の原文)から出
力文(英語の訳文)に翻訳する翻訳処理について、図4
に示すフローチャートに従って説明する。
【0036】まず、S250では、形態素解析処理内の
予め定められた判断規則と辞書内の接続情報を用いて、
入力文を構成する単語について辞書12を検索し、見出
し語が検索できたものに対して、品詞32、読み34、
訳語36、辞書情報38、複数漢字表記フラグ39から
成る辞書12内の情報等を形態素解析結果に付与する形
態素解析処理を実行する。ここでは、もし、ユーザ辞書
や専門辞書が利用されていれば、同じ文字列に対して、
ユーザ辞書が最も優先される。ついで専門辞書、システ
ム内部の基本辞書の順に辞書が利用される。そして、入
力文の文末まで処理した後、S260へ移行する。S2
60では、S250における形態素解析処理の結果を受
け取り、ROM20に格納されている予め定められた解
析文法を用いて、日本語の構造を解析する構文解析処理
を実行する。
【0037】続いて、S270では、ROM20に格納
されている予め定められた変換文法を用いて、解析処理
により解析された日本語の構造に対して、個々の見出し
語に対して英語の訳語を決定すると共に、英語の構文に
構造変換する構造変換処理を実行する。この時、漢字化
処理S400で、形態素解析処理S250において複数
漢字表記フラグ39が付与されている箇所を修正しなが
ら、変換処理を続行する。このS400の処理が、本発
明の漢字化処理手段として機能する。また、前記S27
0の処理が、本発明の構造変手段として機能する。
【0038】続くS280では、ROM20に格納され
ている予め定められた生成文法を用いて、構造変換処理
により変換された英語の構造から英語の語順を決定した
り、英語に特有の冠詞を生成したり、入力文に存在しな
くても出力文には必須の主語を補充したり、テンス、ア
スペクト、人称及び数素性等を処理し、英語の単語列か
ら成る出力文を生成する生成処理を実行する。そして、
S290では、ROM20に格納されている予め定めら
れた形態素生成規則を用いて、S280の生成処理によ
り生成された英語の単語列に対して、名詞の複数形、動
詞の過去、過去分詞等の活用形を生成して、出力文を得
る形態素生成処理を実行して翻訳処理を終了する。
【0039】次に、図4中のS400において実行され
る漢字化処理について、図5に示すフローチャートに従
って説明する。
【0040】まず、漢字化処理は、フラグ判断処理S4
10において、入力文中に複数漢字表記フラグ39が付
与されてる箇所が存在するか否かを検出する。このS4
10の処理が、本発明の判断手段として機能する。存在
していれば(S410:Y)、S420へ移行する。S
420では、解析処理を経て格情報が付与されている係
受け関係を切り出して、S430へ移行する。係受け関
係で抽出するのは、かな漢字変換の時に確実に共起情報
を利用するためである。
【0041】S430では、送られてきた文字列に対し
て、漢字表記になっている係受け関係にある他の単語を
利用して、かな漢字変換処理を行い、次のS440へ移
行する。S440では、かな漢字変換処理が成功して、
文字列が漢字かな混じり文字列に書き換えられたか否か
を検出する。成功して書き換えられた場合には(S44
0:Y)、S450へ移行し、戻された漢字かな混じり
文字列の見出し語について辞書12を検索し、解析処理
に必要な品詞32と、訳語36と、辞書情報38をつけ
直して、S460へ移行する。S460では、新しく出
来上がった漢字かな混じり文字列を元の入力文に戻し
て、S410へ移行する。即ち、S410において切り
出された文字列の部分へ、新しく出来上がった漢字かな
混じり文字列が戻されることになる。尚、前記S430
の処理が、本発明のかな漢字変換手段として機能してい
る。
【0042】また、前記S440において、かな漢字変
換処理が成功しなかった場合(S440:N)、S47
0へ移行し、かな漢字変換処理に利用した文字列をS4
10で切り出してきた元の文字列に戻して、さらに後方
の文字列の検出のためにS410へ移行する。そして、
前記S410において、何も検出されなかった時は(S
410:N)、形態素解析結果検出処理を終了して、S
270の解析処理に戻る。
【0043】ここで、上述した漢字化処理においてなさ
れる処理について、例文を挙げて説明する。
【0044】例えば、入力文が「3時に東京につい
た。」である場合を例に挙げる。この場合、動詞部分
「つく」は時点を表わす格「3時に」と、場所を表わす
格「東京に」を持つ。この入力文の解析結果であり、S
420で切り出される係受け関係を図6に示す。「つ
く」は「付く、着く、突く、就く、附く、衝く」等があ
り、あいまいである。S420で切り出された係受け
は、「に」格に場所を取り、しかも、地名(=東京)で
あること、時点を表わす格を持つことから、S430に
おいて、「3時に東京に着いた」に変換される。この漢
字かな混じり文字列が入力文中に戻されて、形態素解析
処理による正しい構文解析が続行された結果、出力文”
It arrived at Tokyo at 3
o’clock.”を得ることができる。
【0045】尚、本発明は前記した実施の形態に限定さ
れるものではなく、種々の変更を加えることができる。
例えば、今回は係受けの見出し語の読みの情報を、辞書
の情報から持ってきて、かな漢字変換処理を行ったが、
例えば、特開昭61−260353号公報に示されてい
る技術と併せて、係受け関係にある単語の漢字表記をか
な文字列に戻すことができれば、より精度の高いかな漢
字変換結果を得ることができる。
【0046】また、今回は複数漢字表記フラグ39を辞
書12の中にデータとして持たせたが、形態素解析処理
で、見出し語がひらがなであるものと漢字であるものと
を同時に検索し、漢字の見出し語を予め形態素解析結果
に持たせておき、後で、その候補の中からかな漢字変換
の候補を選ぶようにしても良い。この方法であれば、
「いる」が「居る=一段活用」と「要る=ラ行五段活
用」になるような場合でも、入力文中の活用形から予め
候補を絞り込むことが可能である。
【0047】さらに、このように強制的にかな漢字変換
を行った漢字かな混じり文字列を、ユーザに分かるよう
に、出力文中で強調表示したりすれば、間違ったかな漢
字変換をした場合でも、速やかに入力文を編集すること
ができるので、より精度の高い翻訳結果を得ることがで
きる。
【0048】尚、本実施の形態の機械翻訳装置は、翻訳
のための各プログラムが前記ROM20に予め記憶され
たものであるが、本発明は必ずしもこれに限定されるも
のではない。例えば、これ等のプログラムをフロッピー
ディスクやCD−ROM等の各種の記録媒体に記録した
ものを読み取り装置により読み取ってインストールさせ
て動作させることができる。また、有線もしくは無線回
線を使用して外部情報処理装置からプログラムを読み込
んで動作させることができる。この場合、前記フロッピ
ーディスクやCD−ROM等の各種の記録媒体や、外部
情報処理装置の該当プログラムを記録したROM等の記
憶手段が本発明の記録媒体を構成することになる。
【0049】
【発明の効果】以上説明したことから明かなように、本
発明の請求項1に記載の機械翻訳装置によれば、構造変
換手段に設けられた判断手段が、形態素解析が行われた
結果に対して、構造変換手段に設けられた漢字化処理手
段が、判断手段により、見出し語がひらがなであり、複
数の漢字表記を有するか否かが判断された結果に基づい
て、見出し語がひらがなであり、複数の漢字表記を有す
ると判断された箇所を検出すると共に、その箇所の文字
列を抽出して、前記かな漢字変換手段によってかな漢字
変換させ、その後、構造変換手段による訳語の決定と構
文の構造変換とが続行されることになり、より正確な構
文解析結果を得ることができ、さらに、それを用いるこ
とで最終的に精度の高い翻訳結果を得ることができる。
【0050】また、請求項2に記載の機械翻訳処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
によれば、機械翻訳するための各種のプログラムをフロ
ッピーディスクやCD−ROM等の各種の記録媒体の中
から機械翻訳装置に適した記録媒体に記録して提供する
ことができる。
【0051】そして、この記録媒体を用いてプログラム
を実行することにより、形態素解析が行われた後、その
見出し語がひらがなであり、複数の漢字表記を有するか
否かが判断された結果に基づいて、見出し語がひらがな
であり、複数の漢字表記を有すると判断された箇所を検
出すると共に、その箇所の文字列を抽出して、かな漢字
変換させ、その後、訳語の決定と構文の構造変換とが続
行されることになり、より正確な構文解析結果を得るこ
とができ、さらに、それを用いることで最終的に精度の
高い翻訳結果を得ることができる。
【図面の簡単な説明】
【図1】本実施の形態の機械翻訳装置の全体構成を示す
ブロック図である。
【図2】本実施の形態の辞書のデータの構成の説明図で
ある。
【図3】本実施の形態の機械翻訳装置の動作を表わすフ
ローチャートである。
【図4】本実施の形態の機械翻訳装置の翻訳処理の流れ
を表わすフローチャートである。
【図5】本実施の形態の機械翻訳装置の漢字化処理の流
れを表わすフローチャートである。
【図6】本実施の形態の漢字化処理で、切り出された係
受け構造の構成の説明図である。
【符号の説明】
4 外部記憶装置 10 制御部 18 CPU 20 ROM 22 RAM

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも第一言語を日本語とする見出
    し語と、読みと、その見出し語に対応する第二言語の訳
    語と、形態素解析処理に必要な接続情報とを含み、翻訳
    処理において参照される各種辞書登録情報を格納してい
    る辞書を有し、その辞書を用いて、前記第一言語から成
    る原文を第二言語に翻訳する機械翻訳装置において、 前記辞書を用いて、第一原語の形態素解析及び構文解析
    を行った結果に対して、前記第二言語から成る訳語を決
    定し、前記第二言語の構文へ構造変換する構造変換手段
    と、 前記辞書を用いて、第一言語から成る文字列をかな漢字
    変換するかな漢字変換手段とを備え、 前記構造変換手段は、与えられた第一言語の原文の形態
    素解析が行われた結果に対して、検索された見出し語が
    ひらがなであり、複数の漢字表記を有するか否かを判断
    する判断手段と、前記第二言語から成る訳語を決定し、
    前記第二言語の構文へ構造変換する際に、前記判断手段
    により判断された結果に基づいて、検索された見出し語
    がひらがなであり、複数の漢字表記を有すると判断され
    た箇所を検出すると共に、その箇所の文字列を抽出し
    て、前記かな漢字変換手段によってかな漢字変換させる
    漢字化処理手段とを備えたことを特徴とする機械翻訳装
    置。
  2. 【請求項2】 少なくとも第一言語を日本語とする見出
    し語と、読みと、その見出し語に対応する第二言語の訳
    語と、形態素解析処理に必要な接続情報とを含み、翻訳
    処理において参照される各種辞書登録情報を格納してい
    る辞書を有し、その辞書を用いて、前記第一言語から成
    る原文を第二言語に翻訳するための機械翻訳処理プログ
    ラムを記録したコンピュータ読み取り可能な記録媒体に
    おいて、 前記辞書を用いて、第一原語の形態素解析及び構文解析
    を行った結果に対して、前記第二言語から成る訳語を決
    定し、前記第二言語の構文へ構造変換する構造変換プロ
    グラムと、 前記辞書を用いて、第一言語から成る文字列をかな漢字
    変換するかな漢字変換プログラムとを備え、 前記構造変換プログラムは、与えられた第一言語の原文
    の形態素解析が行われた結果に対して、検索された見出
    し語がひらがなであり、複数の漢字表記を有するか否か
    を判断する判断プログラムと、前記第二言語から成る訳
    語を決定し、前記第二言語の構文へ構造変換する際に、
    前記判断プログラムにより判断された結果に基づいて、
    検索された見出し語がひらがなであり、複数の漢字表記
    を有すると判断された箇所を検出すると共に、その箇所
    の文字列を抽出して、前記かな漢字変換プログラムによ
    ってかな漢字変換させる漢字化処理プログラムとを備え
    たことを特徴とする機械翻訳処理プログラムを記録した
    コンピュータ読み取り可能な記録媒体。
JP9126807A 1997-05-16 1997-05-16 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH10320391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9126807A JPH10320391A (ja) 1997-05-16 1997-05-16 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9126807A JPH10320391A (ja) 1997-05-16 1997-05-16 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH10320391A true JPH10320391A (ja) 1998-12-04

Family

ID=14944455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9126807A Pending JPH10320391A (ja) 1997-05-16 1997-05-16 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH10320391A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116453132A (zh) * 2023-06-14 2023-07-18 成都锦城学院 基于机器翻译的日语假名和汉字识别方法、设备及存储器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116453132A (zh) * 2023-06-14 2023-07-18 成都锦城学院 基于机器翻译的日语假名和汉字识别方法、设备及存储器
CN116453132B (zh) * 2023-06-14 2023-09-05 成都锦城学院 基于机器翻译的日语假名和汉字识别方法、设备及存储器

Similar Documents

Publication Publication Date Title
US4831529A (en) Machine translation system
EP0244871A2 (en) Machine translation system
EP0370774A2 (en) Machine translation system
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH10320391A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10232863A (ja) かな漢字変換装置および方法、並びに記録媒体
JP2011175306A (ja) 情報処理装置
JP2838984B2 (ja) 汎用参照装置
JP3244286B2 (ja) 翻訳処理装置
JPH10171804A (ja) 機械翻訳装置
JP3692711B2 (ja) 機械翻訳装置
JP2938897B2 (ja) 文書作成処理装置
JP2000029882A (ja) 要約文作成装置
JP3135221B2 (ja) 用例主導型言語構造解析装置
JP3826071B2 (ja) 文章作成支援装置及び方法並びにプログラム
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0821031B2 (ja) 言語解析装置
JPH0531186B2 (ja)
JP2608384B2 (ja) 機械翻訳装置及びその方法
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP3313810B2 (ja) アスペクト処理装置
JPH07200605A (ja) 翻訳装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH04296970A (ja) 文章検査装置