JPH03225468A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH03225468A JPH03225468A JP2021298A JP2129890A JPH03225468A JP H03225468 A JPH03225468 A JP H03225468A JP 2021298 A JP2021298 A JP 2021298A JP 2129890 A JP2129890 A JP 2129890A JP H03225468 A JPH03225468 A JP H03225468A
- Authority
- JP
- Japan
- Prior art keywords
- information
- translation
- original text
- keyword
- grammatical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 49
- 238000012937 correction Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 4
- 230000000877 morphologic effect Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 claims description 2
- 238000007689 inspection Methods 0.000 abstract 1
- 238000012795 verification Methods 0.000 abstract 1
- 230000014616 translation Effects 0.000 description 37
- 238000010586 diagram Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 241001385733 Aesculus indica Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は機械翻訳装置に関し、特にコンピュータを用い
て翻訳支援並びに翻訳を行う機械翻訳装置に関する。
て翻訳支援並びに翻訳を行う機械翻訳装置に関する。
自然言語には数多くの言語現象があり、そのすべてを機
械翻訳装置で取扱うことは難しい。従来の機械翻訳装置
では、限定された範囲内の言語現象を取扱っており、取
扱えない言語現象については、翻訳や操作に精通した使
用者が、翻訳前に原文を読み、正しく取扱われないと考
えられる部分を判断し、機械翻訳装置が解析しやすいよ
うに修正する前編集という作業を行っている。適切な前
編集は、品質の良い翻訳文を得るために不可欠であり、
使用者の技術や経験によって、作業効率にばらつきが生
じている。また、前編集は、−度翻訳してみないと、要
修正個所が解り難いという面がある。
械翻訳装置で取扱うことは難しい。従来の機械翻訳装置
では、限定された範囲内の言語現象を取扱っており、取
扱えない言語現象については、翻訳や操作に精通した使
用者が、翻訳前に原文を読み、正しく取扱われないと考
えられる部分を判断し、機械翻訳装置が解析しやすいよ
うに修正する前編集という作業を行っている。適切な前
編集は、品質の良い翻訳文を得るために不可欠であり、
使用者の技術や経験によって、作業効率にばらつきが生
じている。また、前編集は、−度翻訳してみないと、要
修正個所が解り難いという面がある。
上述した従来の機械翻訳装置は、前編集を使用者の推定
に頼っており、使用者が装置の能力や翻訳に精通してい
る者でなければならないという欠点を有している。
に頼っており、使用者が装置の能力や翻訳に精通してい
る者でなければならないという欠点を有している。
また、従来の機械翻訳装置は、使用者の熟練度により、
作業の速度や翻訳の品質に違いが生ずるとともに、実際
に翻訳してみて初めて問題個所が発見されたり、逆に修
正を加える必要がないにもかかわらず修正を加えてしま
ったりするなど、前編集作業が無駄の多いものとなると
いう問題点を有している。
作業の速度や翻訳の品質に違いが生ずるとともに、実際
に翻訳してみて初めて問題個所が発見されたり、逆に修
正を加える必要がないにもかかわらず修正を加えてしま
ったりするなど、前編集作業が無駄の多いものとなると
いう問題点を有している。
本発明の目的は、出現頻度の高い語やその装置では処置
の対象とされている語など、原文中で修正や検査を行う
べきキーワードを機械的に抽出して、使用者に入力を促
進することにより、重要な要修正個所の見落しを減少し
、前編集の効率を向上する機械翻訳装置を提供すること
にある。
の対象とされている語など、原文中で修正や検査を行う
べきキーワードを機械的に抽出して、使用者に入力を促
進することにより、重要な要修正個所の見落しを減少し
、前編集の効率を向上する機械翻訳装置を提供すること
にある。
第1の発明の機械翻訳装置は、
(A)翻訳対象の原文を読込んで入力する原文入力手段
、 (B)翻訳機械が処理の対象としていない制約事項や翻
訳の際に注意しなければならない語句などのキーワード
の抽出基準となる情報を記憶するキーワード情報知識ベ
ース、 (C)前記原文入力手段で入力された原文を単語に区切
り、前記キーワード情報知識ベースの情報を使用して、
原文中のキーワードを抽出するキーワード抽出手段、 (D)原文言語の語案や文法情報を記憶する言語情報デ
ータベース、 (E)前記キーワード抽出手段により抽出されたキーワ
ードの文法情報を、前記言語情報データベースから取出
して、使用者のために出力する文法情報出力手段、 (F)前記文法情報出力手段により出力されたキーワー
ドの文法情報を、使用者が修正したり変更したりして、
前記言語情報データベースに記憶させる文法情報修正手
段、 (G)前記文法情報修正手段で必要な修正を行った後に
、修正済みの前記言語情報データベースの情報を用いて
、構文解析、形態素解析。
、 (B)翻訳機械が処理の対象としていない制約事項や翻
訳の際に注意しなければならない語句などのキーワード
の抽出基準となる情報を記憶するキーワード情報知識ベ
ース、 (C)前記原文入力手段で入力された原文を単語に区切
り、前記キーワード情報知識ベースの情報を使用して、
原文中のキーワードを抽出するキーワード抽出手段、 (D)原文言語の語案や文法情報を記憶する言語情報デ
ータベース、 (E)前記キーワード抽出手段により抽出されたキーワ
ードの文法情報を、前記言語情報データベースから取出
して、使用者のために出力する文法情報出力手段、 (F)前記文法情報出力手段により出力されたキーワー
ドの文法情報を、使用者が修正したり変更したりして、
前記言語情報データベースに記憶させる文法情報修正手
段、 (G)前記文法情報修正手段で必要な修正を行った後に
、修正済みの前記言語情報データベースの情報を用いて
、構文解析、形態素解析。
意味解析などにより翻訳を行う構文解析・意味解析手段
、 を備えて構成されている。
、 を備えて構成されている。
また、第2の発明の機械翻訳装置は、
(A)あらかじめキーワード情報知識ベースに、翻訳機
械が処理の対象としていない制約事項や翻訳の際に注意
しなければならない語句などのキーワードの抽出基準と
なる情報を記憶し、 (B)あらかじめ言語情報データベースに、原文言語の
語雲や文法情報を記憶し、 (C)翻訳対象の原文を読込んで入力し、(D)入力さ
れた原文を単語に区切り、前記キーワード情報知識ベー
スの情報を使用して、入力された原文中のキーワードを
抽出し、(E)抽出されたキーワードの文法情報を、前
記言語情報データベースから取出して、使用者のために
出力し、 (F)出力されたキーワードの文法情報を、使用者が修
正したり変更したりして、前記言語情報データベースに
記憶させ、 (G)修正済みの前記言語情報データベースの情報を用
いて、構文解析、形態素解析、意味解析などにより翻訳
を行う、 ことにより構成されている。
械が処理の対象としていない制約事項や翻訳の際に注意
しなければならない語句などのキーワードの抽出基準と
なる情報を記憶し、 (B)あらかじめ言語情報データベースに、原文言語の
語雲や文法情報を記憶し、 (C)翻訳対象の原文を読込んで入力し、(D)入力さ
れた原文を単語に区切り、前記キーワード情報知識ベー
スの情報を使用して、入力された原文中のキーワードを
抽出し、(E)抽出されたキーワードの文法情報を、前
記言語情報データベースから取出して、使用者のために
出力し、 (F)出力されたキーワードの文法情報を、使用者が修
正したり変更したりして、前記言語情報データベースに
記憶させ、 (G)修正済みの前記言語情報データベースの情報を用
いて、構文解析、形態素解析、意味解析などにより翻訳
を行う、 ことにより構成されている。
次に、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の機械翻訳装置の一実施例を示すブロッ
ク図である。
ク図である。
第1図に示すように、まず、光学文字読取装置(OCR
)などの原文入力手段1は、翻訳対象の原文を読込んで
入力している。
)などの原文入力手段1は、翻訳対象の原文を読込んで
入力している。
また、キーワード情報知識ベース3は、翻訳機械が処理
の対象としていない制約事項や翻訳の際に注意しなけれ
ばならない語句などのキーワードの抽出基準となる情報
を記憶している。
の対象としていない制約事項や翻訳の際に注意しなけれ
ばならない語句などのキーワードの抽出基準となる情報
を記憶している。
そして、キーワード抽出手段2は、原文入力手段1で入
力された原文を単語に区切り、キーワード情報知識ベー
ス3の情報を使用して、原文中のキーワードを抽出して
いる。
力された原文を単語に区切り、キーワード情報知識ベー
ス3の情報を使用して、原文中のキーワードを抽出して
いる。
一方、言語情報データベース4は、原文言語の語禦や文
法情報を記憶している。
法情報を記憶している。
そこで、デイスプレィなどの文法情報出力手段5は、キ
ーワード抽出手段2により抽出されたキーワードの文法
情報を、言語情報データベース4から取出して、使用者
のために出力している。
ーワード抽出手段2により抽出されたキーワードの文法
情報を、言語情報データベース4から取出して、使用者
のために出力している。
また、文法情報修正手段6は、文法情報出力手段5によ
り出力されたキーワードの文法情報を、使用者が修正し
たり変更したりして、言語情報データベース4に記憶さ
せている。
り出力されたキーワードの文法情報を、使用者が修正し
たり変更したりして、言語情報データベース4に記憶さ
せている。
そして、構文解析・意味解析手段7は、文法情報修正手
段6で必要な修正を行った後に、修正済みの言語情報デ
ータベース4の情報を用いて、構文解析、形態素解析、
意味解析などにより翻訳を行っている。
段6で必要な修正を行った後に、修正済みの言語情報デ
ータベース4の情報を用いて、構文解析、形態素解析、
意味解析などにより翻訳を行っている。
次に、「この文章はオペレーティングシステムについて
述べたものである。オペレーティングシステムは、次の
3つからなる。・・・・・・・・・(以下文章が続く)
・・・・・・・・・」という記述で始まる文章を例にし
て、本実施例の機械翻訳装置の動作について説明する。
述べたものである。オペレーティングシステムは、次の
3つからなる。・・・・・・・・・(以下文章が続く)
・・・・・・・・・」という記述で始まる文章を例にし
て、本実施例の機械翻訳装置の動作について説明する。
まず、この文章を光学文字読取装置(OCR)などの原
文入力手段1で読込んで、キーワード抽出手段2は、入
力された原文を単語に区切り、この文章の中で翻訳上の
キーワードとなると思われる語を抽出する。
文入力手段1で読込んで、キーワード抽出手段2は、入
力された原文を単語に区切り、この文章の中で翻訳上の
キーワードとなると思われる語を抽出する。
キーワード抽出手段2は、自立語(名詞、動詞、形容詞
、形容動詞)の出現頻度分布により選定した重要キーワ
ードの検証を行い、言語情報データベース4に登録され
ていない未登録語のチエツクを行うととも°に、処理の
対象としていない制約事項や翻訳の際に修正しなければ
ならない語句および原文記述上の注意点などを格納した
キーワード情報知識ベース3を参照している。
、形容動詞)の出現頻度分布により選定した重要キーワ
ードの検証を行い、言語情報データベース4に登録され
ていない未登録語のチエツクを行うととも°に、処理の
対象としていない制約事項や翻訳の際に修正しなければ
ならない語句および原文記述上の注意点などを格納した
キーワード情報知識ベース3を参照している。
なお、これらの抽出基準は、使用者がパラメータの設定
で変更することも可能である。
で変更することも可能である。
この例では、出現頻度が高い自立語として「述べる」、
未登録語として「オペレーティングシステム」、曖昧性
の大きい要注意語句として「なる」が抽出される。
未登録語として「オペレーティングシステム」、曖昧性
の大きい要注意語句として「なる」が抽出される。
そして、「述べる」、「オペレーティングシステム」、
「なる」をキーワードとして、言語情報データベース4
に記憶された文法情報が検索され、デイスプレィなどの
文法情報出力手段5に一語ずつ出力される。
「なる」をキーワードとして、言語情報データベース4
に記憶された文法情報が検索され、デイスプレィなどの
文法情報出力手段5に一語ずつ出力される。
第2図は本実施例の言語情報データベースの文法情報の
一例を示す情報構成図である。
一例を示す情報構成図である。
第2図に示すように、最初に、使用者は、「述べる」に
対応する訳語として、rstate J xrtell
J 、 reXpress J 、 rdescr
lbeJを選択でき、rstate Jで翻訳されるよ
うになっていることを確認できる。
対応する訳語として、rstate J xrtell
J 、 reXpress J 、 rdescr
lbeJを選択でき、rstate Jで翻訳されるよ
うになっていることを確認できる。
この例では、「述べる」をr descrIbeJと翻
訳した方が適切であるので、使用者は、文法情報修正手
段6により、マウスとキーボードとによる入力で、最優
先言語をr descrlbeJにして、言語情報デー
タベース4の情報を変更する。
訳した方が適切であるので、使用者は、文法情報修正手
段6により、マウスとキーボードとによる入力で、最優
先言語をr descrlbeJにして、言語情報デー
タベース4の情報を変更する。
第3図は本実施例の文法情報修正手段6の文法情報編集
画面の一例を示す情報構成図である。
画面の一例を示す情報構成図である。
次に、文法情報出力手段5で、「オペレーティングシス
テム」が未登録語であることが表示され、続いて、第3
図の文法情報修正手段6の文法情報編集画面が表示され
て、使用者の入力を促す。
テム」が未登録語であることが表示され、続いて、第3
図の文法情報修正手段6の文法情報編集画面が表示され
て、使用者の入力を促す。
そこで、使用者が訳語のroperating sys
temJをキーボードから入力して、マウスで品詞、意
味分類などの文法情報を選択することにより、これらが
言語情報データベース4の情報として記憶される。
temJをキーボードから入力して、マウスで品詞、意
味分類などの文法情報を選択することにより、これらが
言語情報データベース4の情報として記憶される。
続いて、文法情報出力手段5で、「なる」が曖昧性の高
い語であることが警告として表示され、“漢字による再
入力または訳語指定”という入力促進メツセージが出力
されるので、使用者は、文法情報修正手段6により、漢
字による再入力、または訳語指定を行う。
い語であることが警告として表示され、“漢字による再
入力または訳語指定”という入力促進メツセージが出力
されるので、使用者は、文法情報修正手段6により、漢
字による再入力、または訳語指定を行う。
そして、このような修正がすべて行われた言語情報デー
タベース4を用いて、構文解析・意味解析手段7は、翻
訳を行う。なお、構文解析・意味解析手段7の参考文献
としては、特願昭58−183435がある。
タベース4を用いて、構文解析・意味解析手段7は、翻
訳を行う。なお、構文解析・意味解析手段7の参考文献
としては、特願昭58−183435がある。
以上説明したように、本発明の機械翻訳装置は、キーワ
ード情報知識ベースを用いて入力原文のキーワードを自
動的に抽出し、そのキーワードのデータベース情報を使
用者に出力表示して修正の入力を促進するので、翻訳上
重要で修正や検査を行うべき個所を網羅して処置するこ
とができるという効果を有している。
ード情報知識ベースを用いて入力原文のキーワードを自
動的に抽出し、そのキーワードのデータベース情報を使
用者に出力表示して修正の入力を促進するので、翻訳上
重要で修正や検査を行うべき個所を網羅して処置するこ
とができるという効果を有している。
また、本発明の機械翻訳装置は、使用者の熟練度による
作業能率の大幅な相違や不注意による要修正項目の見落
しなどがな・くなり、統一性のある前編集結果を得て、
翻訳品質が向上するとともに、不十分な前編集による翻
訳のやり直しが減少して翻訳効率が向上するという効果
を有している。
作業能率の大幅な相違や不注意による要修正項目の見落
しなどがな・くなり、統一性のある前編集結果を得て、
翻訳品質が向上するとともに、不十分な前編集による翻
訳のやり直しが減少して翻訳効率が向上するという効果
を有している。
第1図は本発明の機械翻訳装置の一実施例を示すブロッ
ク図、第2図は本実施例の言語情報データベースの文法
情報の一例を示す情報構成図、第3図は本実施例の文法
情報修正手段6の文法情報編集画面の一例を示す情報構
成図である。 1・・・・・・原文入力手段、2・・・・・・キーワー
ド抽出手段、3・・・・・・キーワード情報知識ベース
、4・・・・・・言語情報データベース、5・・・・・
・文法情報出力手段、6・・・・・・文法情報修正手段
、7・・・・・・構文解析・意味解析手段。
ク図、第2図は本実施例の言語情報データベースの文法
情報の一例を示す情報構成図、第3図は本実施例の文法
情報修正手段6の文法情報編集画面の一例を示す情報構
成図である。 1・・・・・・原文入力手段、2・・・・・・キーワー
ド抽出手段、3・・・・・・キーワード情報知識ベース
、4・・・・・・言語情報データベース、5・・・・・
・文法情報出力手段、6・・・・・・文法情報修正手段
、7・・・・・・構文解析・意味解析手段。
Claims (1)
- 【特許請求の範囲】 1、(A)翻訳対象の原文を読込んで入力する原文入力
手段、 (B)翻訳機械が処理の対象としていない制約事項や翻
訳の際に注意しなければならない語句などのキーワード
の抽出基準となる情報を記憶するキーワード情報知識ベ
ース、 (C)前記原文入力手段で入力された原文を単語に区切
り、前記キーワード情報知識ベースの情報を使用して、
原文中のキーワードを抽出するキーワード抽出手段、 (D)原文言語の語彙や文法情報を記憶する言語情報デ
ータベース、 (E)前記キーワード抽出手段により抽出されたキーワ
ードの文法情報を、前記言語情報データベースから取出
して、使用者のために出力する文法情報出力手段、 (F)前記文法情報出力手段により出力されたキーワー
ドの文法情報を、使用者が修正したり変更したりして、
前記言語情報データベースに記憶させる文法情報修正手
段、 (G)前記文法情報修正手段で必要な修正を行った後に
、修正済みの前記言語情報データベースの情報を用いて
、構文解析、形態素解析、意味解析などにより翻訳を行
う構文解 析、意味解析手段、 を備えることを特徴とする機械翻訳装置。 2、(A)あらかじめキーワード情報知識ベースに、翻
訳機械が処理の対象としていない制約事項や翻訳の際に
注意しなければならない語句などのキーワードの抽出基
準となる情報を記憶し、 (B)あらかじめ言語情報データベースに、原文言語の
語彙や文法情報を記憶し、 (C)翻訳対象の原文を読込んで入力し、 (D)入力された原文を単語に区切り、前記キーワード
情報知識ベースの情報を使用し て、入力された原文中のキーワードを抽出し、 (E)抽出されたキーワードの文法情報を、前記言語情
報データベースから取出して、使用者のために出力し、 (F)出力されたキーワードの文法情報を、使用者が修
正したり変更したりして、前記言語情報データベースに
記憶させ、 (G)修正済みの前記言語情報データベースの情報を用
いて、構文解析、形態素解析、意味解析などにより翻訳
を行う、 ことを特徴とする機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021298A JPH03225468A (ja) | 1990-01-30 | 1990-01-30 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021298A JPH03225468A (ja) | 1990-01-30 | 1990-01-30 | 機械翻訳装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03225468A true JPH03225468A (ja) | 1991-10-04 |
Family
ID=12051240
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021298A Pending JPH03225468A (ja) | 1990-01-30 | 1990-01-30 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03225468A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06259466A (ja) * | 1993-03-08 | 1994-09-16 | Nec Corp | 機械翻訳装置 |
| KR20150070019A (ko) * | 2013-12-13 | 2015-06-24 | 주식회사 플리토 | 장문 번역 서비스 장치 및 방법 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6118074A (ja) * | 1984-07-04 | 1986-01-25 | Hitachi Ltd | プレ・エデイツト方式 |
| JPS6435661A (en) * | 1987-07-30 | 1989-02-06 | Hitachi Ltd | Pre-edition supporting system |
-
1990
- 1990-01-30 JP JP2021298A patent/JPH03225468A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6118074A (ja) * | 1984-07-04 | 1986-01-25 | Hitachi Ltd | プレ・エデイツト方式 |
| JPS6435661A (en) * | 1987-07-30 | 1989-02-06 | Hitachi Ltd | Pre-edition supporting system |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06259466A (ja) * | 1993-03-08 | 1994-09-16 | Nec Corp | 機械翻訳装置 |
| KR20150070019A (ko) * | 2013-12-13 | 2015-06-24 | 주식회사 플리토 | 장문 번역 서비스 장치 및 방법 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0682377B2 (ja) | 感情情報抽出装置 | |
| JPH03225468A (ja) | 機械翻訳装置 | |
| JPH0682376B2 (ja) | 感情情報抽出装置 | |
| JP4007630B2 (ja) | 対訳例文登録装置 | |
| JP2838984B2 (ja) | 汎用参照装置 | |
| JP2966473B2 (ja) | 文書作成装置 | |
| JP2817497B2 (ja) | 辞書編集装置 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JP3244286B2 (ja) | 翻訳処理装置 | |
| JPH09185629A (ja) | 機械翻訳方法 | |
| JPH0635964A (ja) | 機械翻訳装置 | |
| JPH06243163A (ja) | 文書解析装置 | |
| JP2004199519A (ja) | 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム | |
| JPH05225232A (ja) | テキスト自動前編集装置 | |
| JPH05197752A (ja) | 機械翻訳装置 | |
| JPH01207873A (ja) | 翻訳支援装置 | |
| JPH07192011A (ja) | 多言語要約生成装置 | |
| JPH07191996A (ja) | 辞書作成支援装置 | |
| JPH07249044A (ja) | 機械翻訳装置 | |
| JPH08129546A (ja) | 文書作成装置及び方法 | |
| JPH09190440A (ja) | 機械翻訳装置 | |
| JPH05342260A (ja) | 単語綴りチェック装置 | |
| JPS63136264A (ja) | 機械翻訳装置 | |
| JPS63136268A (ja) | 機械翻訳装置 | |
| JPH0855121A (ja) | 文対応装置及び原文と訳文の対応付け方法 |