JPH03214355A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH03214355A
JPH03214355A JP2011053A JP1105390A JPH03214355A JP H03214355 A JPH03214355 A JP H03214355A JP 2011053 A JP2011053 A JP 2011053A JP 1105390 A JP1105390 A JP 1105390A JP H03214355 A JPH03214355 A JP H03214355A
Authority
JP
Japan
Prior art keywords
translated
word
dictionary
japanese
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011053A
Other languages
English (en)
Inventor
Hidezo Kugimiya
釘宮 秀造
Hitoshi Suzuki
等 鈴木
Youji Fukumochi
福持 陽士
Ichiko Nakamura
中村 いち子
Noriyuki Hirai
平井 徳行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2011053A priority Critical patent/JPH03214355A/ja
Priority to US07/641,732 priority patent/US5329446A/en
Priority to GB9101267A priority patent/GB2241094A/en
Publication of JPH03214355A publication Critical patent/JPH03214355A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、自然な翻訳文を生成できる機械翻訳装置に
関する。
く従来の技術〉 従来、mw翻訳装置としては次のようなものがある。こ
の機械翻訳装置は、キーホートから入力されたソース言
語を、メインCPUの制御により翻訳モジュールに入力
し、この入力されたソース言語を、メモリに記憶されて
いるメイン辞書やユーザ辞書から成る辞書,文法規則お
よび木構造変換規則を利用して、翻訳モジュールによっ
てターゲット言語に翻訳するものである。
上述のような機械翻訳装置によって英語から日本語へ翻
訳する場合において、上記辞書のうちユーザが独自に作
成するユーザ辞書に新たな単語を登録する際には、次の
ような情報を入力する必要かある。
■ 英単語の見出し 2 英単語の品詞 3.英単語の語尾変化形 4 英単語の訳語 5 訳語の品詞 6 訳語の活用形 このように、英91語およびその訳語のみならず、英単
語や訳語の品詞.英煩語の語尾変化形および訳語の活用
形をも辞書に登録することによって、より自然な翻訳文
を得ることかてきるのてある。
〈発明か解決しようとする課題〉 このように、上記入力された英文を日本文に翻訳するv
i械翻訳装置におけるユーザ辞書に新たTJ単語を登録
する際には、登録英単語の訳語の活用形を入力する必要
がある。したかって、ユーザは日本語文法の知識を有す
る必要かあり、誰でも簡単に効率良くユーザ辞書作成処
理を行うことができないという問題かある。
そこで、この発明の目的は、誰でも簡単に効率良くユー
ザ辞書作成処理を行うことかできろ機械翻訳装置を提供
することにある。
〈課題を解決するための手段〉 上記目的を達成するため、この発明は、入力された文章
を形態素に分割してユーザ辞書を含む辞書を用いてその
形聾素の訳語等を得る形態素解析部と、上記形態素解析
部によって分割された形態素列の構文を辞書と文法規則
を用いて解析する構文解析部と、上記構文解析部で得ら
れた構文の構造を日本語における構文の構造に変換する
変換部と、上記変換部によって得られた日本語の構文構
造に従って日本語による翻訳文を生成する翻訳文生成部
を有する機械翻訳装置において、上記ユーザ辞書に登録
する単語に対応する日本語の訳語を構成する文字列にお
ける所定位置の文字が予め指定された文字であるか否か
を判別する訳語文字判別手段と、上記訳語文字判別手段
による判別結果に基づいて所定の規則に従って上記訳語
の活用形を自動的に推定すると共に、推定結果を上記ユ
ーザ辞書に登録する訳語活用形推定・登録手段を備えた
ことを特徴としている。
く作用〉 形態素解析部に文章が人力されると、この入力された文
章は上記形態素解析部によって形態素列に分割されて日
本語による訳語等が得られる。こうして、入力文章か形
態素列に分割されると、構文解析部によって上起形態素
列の構文が解析される。そして、上記構文解析部によっ
て得られた構文の構造か変換部によって日本語の構文構
造に変換され、得られた日本語の構文構造に従って翻訳
文生成郎によって日本語による翻訳文が生成される。
上述の形態素解析部における形態素解析および構文解析
部における構文解析の際に用いられる辞書のーってある
ユーザ辞書に新たな単語を登録する際に、上記ユーザ辞
書に登録する単語に対応する日本語の訳語か入力される
。そうすると、この訳語を構成する文字列における所定
位置の文字が予め指定された文字であるか否かが訳語文
字判別手段によって判別される。そして、上記訳語文字
判別手段による判別結果に基づいて、訳語活用形推定・
登録手段によって、所定の規則に従って上記訳語の活用
形か推定されると共に、得られた推定結果が上記ユーザ
辞書に登録される。
したがって、ユーザがユーザ辞書に新たな単語を登録す
る際に、登録する単語の日本語による訳語の活用形が自
動的に推定されて上記ユーザ辞書に登録される。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の機械翻訳装置における一実施例のブ
ロック図である。1はメインCPU(中央処理装置)、
2はメインメモリ、3はCRT(カソード・レイ・ヂュ
ーブ)、4はキーボード、5は翻訳モジュール、6はメ
イン辞書やユーザ辞書等から成る翻訳用の辞書.文法規
則および木構造変換規則等を格納しているメモリである
上記翻訳モジュール5は、ソース言語に上る文章が入力
されると、それを翻訳してターゲット言語である日本語
の文章を出力するものである。すなわち、キーホート4
から入力されたソース言語はメインCPUIの制御によ
り翻訳モジュール5に送られる。翻訳モジュール5はメ
モリ6に記憶されている辞書.文法規fillおよび木
構造変換規則等を用いて、入力されたソース言語を後に
詳述するようにしてターゲット言語に翻訳する。その結
果は、メインメモリ2に一旦記憶されると共に、CRT
3に表示される。
上記翻訳モジュール5て行われる自動翻訳.には、般に
第2図に示すような解析レベルがある。図中左上におい
てソース言語が入力されると、レヘルL1の辞書引き,
レベルL,の形態素解析.レベルL3の構文解析,・・
・と解析が進められる。
機械翻訳はこの解析レベルにより、大きく次の2つにわ
けられる。1つは、レベルL6のソース言語およびター
ケット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成.レ
ベルL8の意味生成,レベルLllの構文生成,レベル
L+oの形態素生成と生成を進めて、ターゲット言語を
生成していくピボット方式である。
もうl−)は、上述のレベルL,の形態素解析,レベル
し,の構文解析,レベルL4の意味解析およびレベルL
,の文脈解析のいずれかまで解析を行ってソース言語の
内部構造を得、次に、この得られたソース言語の内部構
造と同レベルのターゲット言語の内部構造に変換した後
、ターゲット言語を生成するトランスファ一方式である
ここで、上記各解析について説明する。
・辞書引き・形態素解析 入力された文章を各形態素列(単 語列)に分割し、第1図に示すメ モリ6の辞書を引いてこの各単語 に対する品詞などの文法情報おび 訳語を得、さらに、時制・人称・ 数などを解析する。
・構文解析一後述するようにして単語間の係り受けなど
の、文章の構造(構造解 析木)を決定する。
・意味解析−複敢の構文解析の結果から意味的に正しい
ものとそうでないものを 判別する。
・文脈解析一話題を理解し、省略やあい昧さを取り去る
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構來解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな辞書引き形態素解析部ll.構文解析部12,変換
部l3および翻訳文生成部14の各機能部分から成る翻
訳モジュールを考える。
第4図は上記翻訳モジュール5の具体的なブロック図で
ある。また、第5図〜第9図はrThis isape
n.Jという英文を日本語に翻訳する場合における第4
図に示す各バッファA−Eの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳処理について説
明する。
まず、読み込まれた原文は第5図に示すように第4図の
バッファAに洛納される。そうすると、翻訳プログラム
l6に基づく翻訳CPUI5の制御ノ下に、バッファA
に格納された原文に従ってメモリ6の辞書を用いて各単
語の訳語等の必要な情報が得られ、バッファBに格納さ
れる(第3図の辞書引き形態素解析部2による辞書引き
・形態素解析)。その結果、例えば上記情報の一部であ
る品詞情報は第6図のように格納される。ここで、rt
hisJは多品詞語であるが、次の構文解析により一意
に決定される。すなわち、メモリ6の辞書と文法規則に
従って、各単語間の係り受け関係を示す構造解析木が第
7図に示すように決定されて、第4図のバッファCに格
納される(第3図の構文解析部l2による構文解析)。
この構造解析木は、次のようにして決定される。すなわ
ち、メモリ6の文法規則から 文→主部,述部 主部→名詞句 述部一動詞,名詞句 名詞句一代名詞 名詞旬一冠詞.名詞 の規則か得られる。この規則は、例えば、1つ目の蜆1
’lllは“文とは、主部と述部からできている”とい
うことを表わす。以下、この規則にしたがって構造解析
木が決定されるのである。
次に、上述の構文解析の場合と同様にメモリ6の木構造
変換規IIIを世いて、入力された英文に対する構文解
析木(第7図参照)の構造か第8図に示すような日本文
に対する構造に変換される。そして、得られた結果か第
4図のバソファDに格納される(第3図の変換部13に
よる構文変換)。最後に、得られた日本文字「これベン
である。」に適切な助詞「は」や助動詞か付けられて、
第9図のような日本語の形にして第4図のバッファEに
格納される(第3図の翻訳文生成部14による翻訳文生
成)。こうして得られた日本文「これはベンである。」
は、翻訳モジュール5から出力され、メインメモリ2に
格納されると共に、CRT3に表示される。
上述のような翻訳処理の際に、辞書引き・形態素解析に
おいて使用される辞書として、予め用化されたメイン辞
書と、このメイン辞訂にはない特殊な単語等を必要に応
してユーザが登録して作成するユーザ辞書とかある。ユ
ーザか」二記ユーザ辞書に新たな英語の単語およびこの
英単語に対応する日本語の訳語を登録する際には、翻訳
CPUI5によってユーザ辞書登録処理が実行される。
第lO図は第4図の翻訳CPUl5によって行われるユ
ーザ辞書登録処理動作のフローチャートである。以下、
第IO図に従ってユーザ辞書登録処理動作について詳細
に述へる。
ステノプS1て、ユーザ辞書に登録すべき英単語の見出
しが入力され、ユーザ辞書に登録される。
ステソプS2て、上記ステソプS1において入力された
英単語の品詞か入力され、ユーザ辞書に登録される。
ステップS3て、上記ステソプSlにおいて入力された
英単語の語尾変化形が入力され、ユーザ辞書に登録され
る。
ステップS4で、上記ステップS1において入力された
英単語の日本語による訳語か入力され、ユーザ辞書に登
録される。
ステップS5て、上記ステップS4において入力された
訳語の品詞か入力され、ユーザ辞書に登録される。
ステップS6で、上記ステップS4において人力された
訳語の活用形公入力されてユーザ辞書に登録され、ユー
ザ辞書登録処理動作を終了する。
その際に、上記ステソプS5において入力された訳語の
品詞が動詞である場合には、上記ステップS6において
実施される訳語活用形入力に際して、翻訳CPUl5の
制御の下に上記ステソプS4において入力された訳語の
文字に基づいて訳語の活用形が自動的に推定されるので
ある。
第11図は翻訳CPU15によって実施される動詞に対
する訳語活用形推定・登録処理動作のフローチャートで
ある。以下、第11図に従って訳語活用形推定・登録処
理動作について詳細に説明する。
ステップSllて、上記ユーザ辞書登録処理動作のフロ
ーヂャートにおけるステップS4において人力されてユ
ーザ辞書に登録されている訳語のD後の文字が読み出さ
れて人力される。
ステップS12で、入力された訳語の最後の文字が「う
/</ぐ/す/つ/ぬ/ふ/む」のいずれかであるか否
かが判別される。その結果「う/</</す/っ/ぬ/
ふ/む」のいずれかである場合にはステップS13に進
み、そうでなければステップSl4に進む。
ステソプSl3て、登録された訳語の活用形は五段活用
であると推定され、この推定結果がバッファ(図示せず
)に格納される。
ステップSl4て、入力されf二訳語の最後の文字が「
る」であるか否かが判別される。その結果「る」である
場合にはステップSI5に進み、そうでなければ訳語活
用形推定・登録処理動作を終了する。
ステップS15で、上記ユーザ辞書に登録されている訳
語の最後から2文字目の文字が読み出されて入力される
ステップS16で、入力された訳語の最後から2文字目
の文字か「来/<」のいずれかであるか否かか判別され
る。その結果「来/<」のいずれかである場合にはステ
ップSl7に進み、そうでなければステップS18に進
む。
ステノプS17て、登録された訳語の活用形は力行変格
活用であると推定され、この推定結果か上記バノファに
格納される。
ステノプS18で、呑力された訳語の最後から2文字目
の文字が「す/ず」のいずれかであるか否かが判別され
ろ。その結果「す/ず」のいずれかである場合にはステ
ップSI9に進み、そうでなければステノプS20に進
む。
ステップS19で、登録された訳語の活用形はサ行変烙
活用であると推定され、この推定結果が上記バッファに
格納される。
ステップS20で、人力された訳語の最後から2文字目
の文字が[け/げ/什/ぜ/て/て/ね/へ/べ/ぺ/
め/れ」のいずれかであるか否かが判別される。
その結果「け/げ/せ/ぜ/て/で/ね/へ/べ/ぺ/
め/れ」のいずれかである場合にはステップS21に進
み、そうでなければステップS22に進む。
ステップS21で、登録された訳語の活用形は下一段活
用であると推定され、この推定結果が上記バッファに格
納される。
ステップS22で、登録された訳語の活用形は五段活用
,上一段活用1下一段活用のうちのいずれかであると推
定され、CRT3によってユーザによる正しい活用形の
選定が促される。
ステップS23で、上記ステップS22において推定さ
れた五段活用.上一段活用.下一段活用のうちいずれの
活用形であるかがユーザによって選定され、この選定さ
れた活用形が上記バッファに格納される。
ステップS24で、上記各ステップにおいて推定されて
上記バッファに格納されている活用形がメモリ6のユー
ザ辞書に登録されて、訳語活用形推定・登録処理動作を
終了する。
上述のユーザ辞書登録処理動作における英単語見出し.
品詞,語尾変化形,訳語および訳語品詞の入力と訳語活
用形推定・登録処理動作における活用形の選定は、翻訳
CPU15の制御に基づいてCRT3に表示される指示
内容に従ってキーボート4から必要事項を人力すること
によって実施される。
このように、本実施例において、入力英文を日本文に翻
訳する際に用いるユーザ辞書に新たな単語を登録する際
に、入力された日本語による訳語か動詞の場合には、訳
語の最後の文字および最後から2番目の文字に基づいて
上記訳語の活用形を自動的に推定してユーザ辞書に登録
するようにしたので、日本語の文法に関する知識を持た
ないユーザであっても、簡単に効率良く訳語活用形入力
処理を実行できるのである。
上記実施例においては、動詞の活用形の推定を例に訳語
活用形推定・登録処理動作を説明しているが、他の品詞
の活用形を推定するようにしても何等差し支えない。
この発明における動詞に対する訳語活用形推定のアルゴ
リズムは上記実施例に限定されるものてはない。
また、この発明における翻訳モジュール5の各バソファ
の構成および内容は、本実施例に限定されるものではな
い。
上記実施例におけるソース言語は英語であるが、この発
明はこれに限定されるものではないことは言うまでもな
い。
〈発明の効果〉 以上より明らかなように、この発明の機械翻訳装置は、
訳語文字判別手段および訳語活用形推定・登録手段を備
えて、ユーザ辞書に新たな単語を登録する際に、登録単
語に対応する日本語の訳語を構成する文字列における所
定位置の文字が予め指定された文字であるか否かを上記
訳語文字判別手段によって判別し、上記訳語活用形推定
・登録手段によって、上記訳語文字判別手段による判別
結果に基づいて所定の規則に従って上記訳語の活用形を
自動的に推定し、推定結果を上記ユーザ辞書に登録する
ようにしたので、上記ユーザ辞書に新たな単語を登録す
る際に、ユーザによってこの登録単語に対応する日本語
の訳語が入力されると自動的にこの訳語の活用形が推定
されて登録される。
したがって、この発明によれば、日本語の文法に関する
知識を持たないユーザであっても、簡単に効率良く訳語
の活用形を登録できる。
【図面の簡単な説明】
第1図はこの発明の機械翻訳装置の一実施例のブロソク
図、第2図は自動翻訳における翻訳レベルの説明図、第
3図(声上記実施例における翻訳モジュールの機能部分
構成図、第4図は上記翻訳モジュールのブロノク図、第
5図〜第9図は第4図における各バッフ7の内容例を示
す図、第lO図はユーザ辞書登録処理動作のフローヂャ
ート、第11図は訳語活用形推定・登録処理動作のフロ
ーヂャートである。 l メインCPTJ,   2・・メインメモリ、3 
 CR T、       4・キーホート、5・・翻
訳モノユール、   6 メモリ、II・・辞書引き形
性素解析部、l2 構文解析部、I3・変換部、   
 I4・翻訳文生成部、l5・・・翻訳CPU、  1
6・・翻訳プログラム、A−E・・バッファ。 築5y 例文 fThis pen. 》 @;6[2l

Claims (1)

    【特許請求の範囲】
  1. (1)入力された文章を形態素に分割してユーザ辞書を
    含む辞書を用いてその形態素の訳語等を得る形態素解析
    部と、上記形態素解析部によって分割された形態素列の
    構文を辞書と文法規則を用いて解析する構文解析部と、
    上記構文解析部で得られた構文の構造を日本語における
    構文の構造に変換する変換部と、上記変換部によって得
    られた日本語の構文構造に従って日本語による翻訳文を
    生成する翻訳文生成部を有する機械翻訳装置において、
    上記ユーザ辞書に登録する単語に対応する日本語の訳語
    を構成する文字列における所定位置の文字が予め指定さ
    れた文字であるか否かを判別する訳語文字判別手段と、 上記訳語文字判別手段による判別結果に基づいて所定の
    規則に従って上記訳語の活用形を自動的に推定すると共
    に、推定結果を上記ユーザ辞書に登録する訳語活用形推
    定・登録手段を備えたことを特徴とする機械翻訳装置。
JP2011053A 1990-01-19 1990-01-19 機械翻訳装置 Pending JPH03214355A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011053A JPH03214355A (ja) 1990-01-19 1990-01-19 機械翻訳装置
US07/641,732 US5329446A (en) 1990-01-19 1991-01-14 Translation machine
GB9101267A GB2241094A (en) 1990-01-19 1991-01-21 Translation machine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011053A JPH03214355A (ja) 1990-01-19 1990-01-19 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH03214355A true JPH03214355A (ja) 1991-09-19

Family

ID=11767280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011053A Pending JPH03214355A (ja) 1990-01-19 1990-01-19 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH03214355A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62212767A (ja) * 1986-03-14 1987-09-18 Hitachi Ltd 辞書更新機能付き自然言語処理方式
JPH01142865A (ja) * 1987-11-30 1989-06-05 Toshiba Corp 機械翻訳方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62212767A (ja) * 1986-03-14 1987-09-18 Hitachi Ltd 辞書更新機能付き自然言語処理方式
JPH01142865A (ja) * 1987-11-30 1989-06-05 Toshiba Corp 機械翻訳方法

Similar Documents

Publication Publication Date Title
JP2745370B2 (ja) 機械翻訳方法及び機械翻訳装置
JP3161942B2 (ja) 訳振り機械翻訳装置
US5146406A (en) Computer method for identifying predicate-argument structures in natural language text
US20080040095A1 (en) System for Multiligual Machine Translation from English to Hindi and Other Indian Languages Using Pseudo-Interlingua and Hybridized Approach
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
JPS62163173A (ja) 機械翻訳方法
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH04235673A (ja) 翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH03222065A (ja) 機械翻訳装置
KR100327114B1 (ko) 문장골격을 기반으로 한 자동번역 시스템 및 그 방법
JPS6180362A (ja) 翻訳装置
JPH03214355A (ja) 機械翻訳装置
JPS6190269A (ja) 翻訳方式
JP3892227B2 (ja) 機械翻訳システム
JP3113257B2 (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
Anwaya et al. Natural Language Processing Model for Hindi to Tulu Translation
JP3174664B2 (ja) 機械翻訳装置
JP2007102530A (ja) 特定言語の文法を生成する装置
JPH01112367A (ja) 機械翻訳装置
JP2752025B2 (ja) 機械翻訳装置