JPH07146864A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07146864A
JPH07146864A JP5292305A JP29230593A JPH07146864A JP H07146864 A JPH07146864 A JP H07146864A JP 5292305 A JP5292305 A JP 5292305A JP 29230593 A JP29230593 A JP 29230593A JP H07146864 A JPH07146864 A JP H07146864A
Authority
JP
Japan
Prior art keywords
word
sentence
notation
translated
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5292305A
Other languages
English (en)
Inventor
Michifumi Nagao
理史 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KOBE NIPPON DENKI SOFTWARE KK
NEC Software Kobe Ltd
Original Assignee
KOBE NIPPON DENKI SOFTWARE KK
NEC Software Kobe Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KOBE NIPPON DENKI SOFTWARE KK, NEC Software Kobe Ltd filed Critical KOBE NIPPON DENKI SOFTWARE KK
Priority to JP5292305A priority Critical patent/JPH07146864A/ja
Publication of JPH07146864A publication Critical patent/JPH07146864A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】機械翻訳システムにおいて、大文字,小文字な
どの表記形により文中のタイトル語の切り分けを行い、
翻訳せずに原文中の表記形のまま訳出する。 【構成】入力ファイル1又はキーボード2から入力され
た原文は入力制御部3を介して形態素分割部4に渡さ
れ、辞書ファイル12を参照して形態素(単語)に分割
され辞書情報(訳語,品詞など)が抽出れる。パターン
情報付与部5は、原文中の各単語の表記形と辞書登録原
形とを比較し、内蔵されているパターン分類表を参照し
表記パターン情報を付与する。構文解析処理部6は、知
識ベース13を参照して構文解析処理を行うと共に、一
文章中の各単語の表記パターン情報を比較解析し、翻訳
しない単語を指定するタイトル指定を行う。訳文生成処
理部7は、指定された単語は翻訳せずに原文中の表記形
のままで訳文コードを生成し、出力制御部8は表示装置
9,出力ファイル10,プリンタ11に出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はある言語を別の言語に翻
訳する機械翻訳装置に関し、特に英語などの欧文を日本
語などの他の言語に翻訳する機械翻訳装置に関する。
【0002】
【従来の技術】機械翻訳装置では、入力された翻訳対象
の原文は、まず辞書の登録単位である形態素(単語)に
分割される。従来の機械翻訳装置では、分割された形態
素については、各形態素の持つ辞書情報(訳語を含む)
と知識ベースとを用いてすべて相手方言語に翻訳し、相
手方言語の文法に従った訳文を生成するように翻訳処理
を行っている。この際、原文中に辞書に存在しない辞書
未登録語があった場合に限り、翻訳処理を行う情報がな
いために原文の文字列をそのまま訳文中に出力してい
る。
【0003】
【発明が解決しようとする課題】上述した従来の機械翻
訳装置は、辞書登録語はすべて辞書情報に従って相手方
言語に訳出するような処理を行っているため、原文中に
タイトルや製品名などが存在し、原文文字列をそのまま
表示した方が文意に添った訳文を生成できるような場合
でも、辞書登録されている単語であれば翻訳してしま
い、原文の文意を反映させた翻訳結果が得られないとい
う問題点があった。
【0004】本発明の目的は、原文中の各単語の表記形
と辞書登録された原形との関係を解析して、原文中の翻
訳が不要なタイトルなどを分類し、原文の文意に添った
より高度な翻訳が行える機械翻訳装置を提供することに
ある。
【0005】
【課題を解決するための手段】請求項1の機械翻訳装置
は、翻訳対象の原文を辞書登録語単位に分割し辞書情報
と共に出力する形態素分割部と、この形態素分割部の出
力を基に知識ベースを参照して構文解析処理を行う構文
解析処理部と、構文解析結果に基づいて相手方言語の訳
文を生成する訳文生成処理部とを備えた機械翻訳装置に
おいて、原文中の単語の各文字が大文字であるか小文字
であるかの表記形とその単語の辞書登録表記形との相違
により分類された表記パターン情報を前記形態素分割部
の出力に付加する表記パターン情報付与手段と、一つの
文章中の各単語に付与された前記表記パターン情報を比
較してあらかじめ定めた条件に合致する特定の単語は翻
訳せずに原文のまま出力する指示を前記訳文生成処理部
に与えるタイトル処理手段とを備えて構成されている。
【0006】請求項2の機械翻訳装置は、請求項1記載
の機械翻訳装置において、英語を日本語に翻訳する機械
翻訳装置であり、前記タイトル処理手段が、原文の表記
形が小文字を使用した通常の文章であり、その中にすべ
て大文字で表記されている単語があれば、その単語をタ
イトルと見なして前記訳文生成処理部に指示することを
特徴としている。
【0007】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0008】図1は本発明の一実施例の構成を示すブロ
ック図である。
【0009】本実施例の機械翻訳装置は、図1に示すよ
うに、入力ファイル1又はキーボード2からの原文入力
を制御する入力制御部3と、辞書ファイル12を参照し
て原文を辞書登録語単位の形態素に分割し辞書情報(訳
語,品詞など)を抽出する形態素分割部4と、内蔵され
ているパターン分類表を参照して分割された形態素に表
記パターン情報を付与するパターン情報付与部5と、知
識ベース13を参照して構文解析処理を行うと共に、一
文章中の各単語の表記パターン情報を比較解析してあら
かじめ定めた基準により翻訳しない単語を指定するタイ
トル処理機能を有する構文解析処理部6と、解析された
情報をもとに訳文コードの生成処理を行い出力制御部8
に渡す訳文生成処理部7と、生成された訳文コードを利
用者の指定により表示装置9,出力ファイル10又はプ
リンタ11に出力する出力制御部8とで構成されてい
る。
【0010】図2は、図1の実施例の動作を示す流れ図
である。以下、図1を参照しながら図2に従って各部の
動作を詳細に説明する。
【0011】まず、入力制御部3が翻訳対象原文の入力
源を判定し(ステップ201)、入力ファイル1又はキ
ーボード2から原文を入力し形態素分割部4に渡す(ス
テップ202,203)。形態素分割部4は、辞書ファ
イル12を参照して原文を形態素(単語)に分割し、各
形態素の辞書情報を抽出する(ステップ204)。
【0012】パターン情報付与部5は、図3に示すよう
なパターン分類表を持っており、各単語の表記形(各文
字が大文字であるか小文字であるか)を判定し、辞書に
登録されている原形(登録表記形)と比較して表記パタ
ーン情報を付与し(ステップ205)、構文解析処理部
6に渡す。パターン分類表は、図3に示すように、原文
表記形とそれに対応する辞書登録原形との関係から表記
パターン情報が決定できるように構成されている。文頭
にある単語で先頭の一文字のみが大文字の場合は辞書登
録原形に関係なくパターン1に、単語がすべて小文字で
辞書登録原形も小文字のみの場合はパターン2に、単語
がすべて大文字であり辞書登録原形は小文字のみの場合
はパターン3にそれぞれ分類されることを示している。
【0013】構文解析処理部6は、各単語の辞書情報を
基に知識ベース13を用いて構文解析処理を行うと共に
(ステップ206)、一文章中の各単語の表記パターン
情報の相互比較を行い、あらかじめ定められている判定
基準に合致する単語があった場合には、その単語に対し
ては相手方言語の訳文コードが生成されないようにタイ
トル識別符号を付し(ステップ207)、訳文生成処理
部7に渡す。判定基準の典型的な例としては、原文の表
記形が小文字を使用した通常の文章であり、その中にす
べて大文字で表記されている単語(パターン3)があれ
ば、その単語をタイトルと見なすものであり、全文が大
文字で表記されている場合には、タイトル識別符号は付
与されない。これらの判定基準は、知識ベース13の一
部として登録することができ、複数の判定基準を登録し
ておいて、原文の状況を判断して利用者が実行時に任意
に指定できるようにすることも可能である。
【0014】訳文生成処理部7は、解析された情報をも
とに訳文コードの生成処理を行い出力制御部8に渡す
(ステップ208)。このとき、タイトル識別符号が付
与された単語については、相手方言語に翻訳することな
く、単にコード体系の違いによる変換(例えば、1バイ
トコードを2バイトコードに変換)のみを行って原文文
字列をそのまま表示するように処理される。
【0015】出力制御部8は、利用者の指定により(ス
テップ209,210,211)、生成された訳文コー
ドを表示装置9,出力ファイル10,プリンタ11に出
力する(ステップ212,213,214)。
【0016】次に、実際の例文を用いて本実施例の動作
を説明する。
【0017】いま、英文「The title of movies is "BI
G DREAM".」がキーボード2から入力され、日本語文へ
の翻訳が要求されたとする。
【0018】辞書ファイル12には、「The」「title」「of」
「movies」「is」「"」「BIG」「DREAM」「.」の各形態素が、それぞ
れ「the」「title」「of」「movies」「is」「"」「big」「dream」「.」と
して登録されていた場合、従来のタイトルの判断なしの
翻訳結果では、「その映画のタイトルは "大きな夢”で
ある。」となることが予想される。しかし、文中に他の
単語が小文字で記述されているにもかかわらず、特定の
単語が大文字で記述されているような場合には、その大
文字で記述されている単語はタイトルや製品名などであ
る場合が多い。従って、辞書ファイルには原形として小
文字で登録されている単語が、原文中に原形以外の大文
字の表記形で記述され、且つ、原文中の他の単語が辞書
ファイルの原形で記述されているような場合には、その
原形以外で記述された単語は、タイトルや製品名と判断
し、辞書ファイルに登録されていても原文に記述されて
いる形のまま訳文とする方が、原文の文意を反映させた
訳文を作成することができる。
【0019】例えば、上述の原文「The title of movie
s is "BIG DREAM". 」を辞書登録単位に分割すると、「T
he」「title」「of」「movies」「is」「"」「BIG」「DREAM」「"」「.」 の
10個の形態素が得られる。それぞれの形態素に対し
て、辞書ファイルに登録されている原形と、原文に現れ
る表記形との関係を図3のパターン情報を参照して判断
する。上記10個の形態素の中で文字で記述されている
7形態素を図3のパターン分類表で分類すると、「The:
パターン1」 「title:パターン2」「of:パターン2」
「movies:パターン2」 「is:パターン2」 「BIG:パタ
ーン3」 「DREAM:パターン3」となり、文頭で大文字表
記である「The 」を除けば、辞書ファイル中の原形が小
文字で原文中の表記も小文字であるパターン2と、辞書
ファイル中の原形が小文字で原文中の表記が大文字であ
るパターン3とが混在することが分かる。このような場
合に、パターン3に当てはまる「BIG」「DREAM」はタイトル
と判断され、「その映画のタイトルは "BIG DREAM"であ
る。」と翻訳される。
【0020】原文が「A TITLE OF THE MOVIES IS "BIG
DREAM". 」ならば、文頭の 「A」以外はすべてパターン3
となるので、この原文中にはタイトルは存在しないと判
断され、翻訳結果は「その映画のタイトルは "大きな
夢" である。」となる。
【0021】以上の実施例では、英語を日本語に翻訳す
る機械翻訳装置につき説明したが、英語でなくても同様
な性質を持つドイツ語,フランス語等の欧文から日本語
文を作成する場合にも同様な技術思想を適用することが
できる。又、必ずしも日本語に限定されるものではな
く、日本語以外の言語に翻訳する場合、例えば英語から
ドイツ語に翻訳する場合でも適用可能である。
【0022】なお、実施例では表記パターン情報を付与
するパターン情報付与部を形態素分割部とは別に設け、
この表記パターン情報を利用して行うタイトル処理を構
文解析処理部で行うように説明したが、前者を形態素分
割部で行い、後者を構文解析処理部と別に行うように構
成することも可能である。
【0023】
【発明の効果】以上説明したように、本発明の機械翻訳
装置によれば、大文字,小文字の区別のある英語などの
文章に対して、ある単語の原文中の表記と辞書ファイル
中の原形とを比較し、相手方言語に翻訳したりタイトル
として原文中の表記のまま訳出したりすることができる
ようになるため、原文の意図に応じた適切な訳文を生成
することが可能となる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】本実施例の動作を示す流れ図である。
【図3】本実施例で使用するパターン分類表の構成内容
の説明図である。
【符号の説明】
1 入力ファイル 2 キーボード 3 入力制御部 4 形態素分割部 5 タイトルマーク付与部 6 構文解析処理部 7 訳文生成処理部 8 出力制御部 9 表示装置 10 出力ファイル 11 プリンタ 12 辞書ファイル 13 知識ベース

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 翻訳対象の原文を辞書登録語単位に分割
    し辞書情報と共に出力する形態素分割部と、この形態素
    分割部の出力を基に知識ベースを参照して構文解析処理
    を行う構文解析処理部と、構文解析結果に基づいて相手
    方言語の訳文を生成する訳文生成処理部とを備えた機械
    翻訳装置において、原文中の単語の各文字が大文字であ
    るか小文字であるかの表記形とその単語の辞書登録表記
    形との相違により分類された表記パターン情報を前記形
    態素分割部の出力に付加する表記パターン情報付与手段
    と、一つの文章中の各単語に付与された前記表記パター
    ン情報を比較してあらかじめ定めた条件に合致する特定
    の単語は翻訳せずに原文のまま出力する指示を前記訳文
    生成処理部に与えるタイトル処理手段とを備えたことを
    特徴とする機械翻訳装置。
  2. 【請求項2】 英語を日本語に翻訳する機械翻訳装置で
    あり、前記タイトル処理手段が、原文の表記形が小文字
    を使用した通常の文章であり、その中にすべて大文字で
    表記されている単語があれば、その単語をタイトルと見
    なして前記訳文生成処理部に指示することを特徴とする
    請求項1記載の機械翻訳装置。
JP5292305A 1993-11-24 1993-11-24 機械翻訳装置 Withdrawn JPH07146864A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5292305A JPH07146864A (ja) 1993-11-24 1993-11-24 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5292305A JPH07146864A (ja) 1993-11-24 1993-11-24 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH07146864A true JPH07146864A (ja) 1995-06-06

Family

ID=17780047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5292305A Withdrawn JPH07146864A (ja) 1993-11-24 1993-11-24 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH07146864A (ja)

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
WO2003065245A1 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
JPS61255469A (ja) 言語生成装置
JPH07146864A (ja) 機械翻訳装置
JP2838984B2 (ja) 汎用参照装置
JP2003330926A (ja) 翻訳方法、翻訳装置及び翻訳プログラム
JP3034295B2 (ja) 機械翻訳方法及び機械翻訳装置
JP2715419B2 (ja) 翻訳装置
JP2006011842A (ja) 翻訳装置および翻訳プログラム
JP2817497B2 (ja) 辞書編集装置
JP2894064B2 (ja) 機械翻訳装置
JPH1166068A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP4092861B2 (ja) 自然言語パターン作成装置及び方法
JPS62203266A (ja) 機械翻訳システム
JPS62229472A (ja) 機械翻訳システム
JP2655922B2 (ja) 機械翻訳装置
JPH06131327A (ja) 文字処理方法及び装置
JPH0773185A (ja) 機械翻訳装置及び方法
JPH05303589A (ja) 翻訳装置
JPS62271065A (ja) 機械翻訳システム
JP2004157688A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JPH1173413A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH03282874A (ja) 文書作成装置
JPS63311473A (ja) 文書作成装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010130