JP4135316B2 - 機械翻訳装置 - Google Patents
機械翻訳装置 Download PDFInfo
- Publication number
- JP4135316B2 JP4135316B2 JP2000382406A JP2000382406A JP4135316B2 JP 4135316 B2 JP4135316 B2 JP 4135316B2 JP 2000382406 A JP2000382406 A JP 2000382406A JP 2000382406 A JP2000382406 A JP 2000382406A JP 4135316 B2 JP4135316 B2 JP 4135316B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- dictionary
- translated
- input
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 99
- 238000012545 processing Methods 0.000 claims description 33
- 238000013500 data storage Methods 0.000 claims description 21
- 230000014616 translation Effects 0.000 description 84
- 238000000034 method Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 36
- 230000006870 function Effects 0.000 description 8
- 238000013479 data entry Methods 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
【発明の属する技術分野】
本発明は、入力された第1言語を、辞書を参照して第2言語に翻訳するものにあって、音声入力を可能とした機械翻訳装置に関する。
【0002】
【発明が解決しようとする課題】
近年、コンピュータの演算処理能力の向上に伴い、様々な辞書検索ソフトや翻訳ソフトが開発されてきており、人による翻訳の手助けをする点で、かなり役立つものが供されてきている。このような機械翻訳装置としては、パソコンシステムを用いるもの、あるいは、持ち運び可能な大きさの本体に、表示部やキー操作部をコンパクトに設けた携帯型の専用機などが供されてきている。
【0003】
ところで、例えば話し言葉を通訳する通訳者が、知らない専門用語が出てきたとき等に、通訳の助けとなるように、上記したような機械翻訳装置を使用することが考えられる。ところが、上記した従来の機械翻訳装置では、キー操作等により文字入力されたテキストデータを翻訳するものであるため、通訳のような即時性が必要な場合の使用に適したものとはなっていなかった。
【0004】
一方、例えばパソコンシステム等にあって、音声認識の機能についても向上が図られており、音声によりコマンドを入力するようにしたものが既に一部実現されてきている。そこで、上記した機械翻訳装置と音声認識機能とを組合わせる構成が考えられる。
【0005】
しかしながら、単純に機械翻訳装置と音声認識機能とを組合わせたものでは、翻訳ソフトが立上がっている状態で、ユーザがコマンドを音声入力しようとしても、コマンドの語を第2言語に翻訳してしまうといった不具合の発生が予想され、これを回避するためには、例えば翻訳すべき第1言語を音声入力するときには翻訳キーをオン操作するといったことが考えられるが、ユーザに面倒な操作を強いることになると共に、その分翻訳処理の迅速性にも劣るものとなり、ユーザにとっての利便性向上といった点では不十分である。
【0006】
本発明は上記事情に鑑みてなされたもので、その目的は、入力された第1言語を第2言語に翻訳するものにあって、音声入力を可能として利便性を向上することができる機械翻訳装置を提供するにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明の請求項1の機械翻訳装置は、音声入力手段により第1言語の語句或いは装置の駆動制御用の制御コマンドが音声入力されると、その入力データが特定のコマンド語であるかどうかの判断に基づき、いずれかのコマンド語であれば制御コマンドを示すデータであると識別され、コマンド語以外であれば翻訳すべき第1言語の語句を示すデータであると識別され、その入力データが制御コマンドと識別された場合には、その制御コマンドに対応した処理が実行され、前記入力データが翻訳すべき第1言語の語句であると識別された場合には、さらにその第1言語の語句を第2言語に翻訳して出力するか或いはその第1言語の語句の辞書内容を出力するかが出力設定手段により設定され、前記出力設定手段により第1言語の語句を第2言語に翻訳して出力すると設定された場合には、前記第1言語の語句を辞書を参照して第2言語に翻訳してその結果が出力され、前記出力設定手段により第1言語の語句の辞書内容を出力すると設定された場合には、辞書を参照して前記第1言語の語句に対応する辞書内容が前記音声入力手段による入力順に出力され、また、翻訳すべき第1言語の語句が辞書にない未知語である場合に、その未知語データが辞書登録候補として未知語データ記憶手段に記憶保存されるように構成したものである。
【0008】
これによれば、翻訳すべき第1言語の語句及び制御コマンドを音声入力することが可能となるのであるが、このとき、音声入力された入力データが、翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかが自動で識別され、制御コマンドに対応した処理の実行、あるいは、翻訳又は辞書引きがなされるようになる。この場合、翻訳すべき第1言語の語句か制御コマンドかが自動で識別されるので、それらの区別のためにユーザに面倒な操作を強いることもなく、迅速な処理が可能となる。
【0009】
そして、入力データが翻訳すべき第1言語の語句を示すデータである場合において、第2言語に翻訳して出力するかそれとも辞書内容を出力するかを、出力設定手段により設定することができるので、ユーザは、どちらか希望する出力を選択することができ、使いやすく利便性の高いものとなる。さらに、翻訳すべき第1言語の語句が辞書の見出語に存在しない未知語であるケースが考えられるが、そのような場合には、その未知語データが辞書登録候補として未知語データ記憶手段に記憶保存されるようになるので、後にその未知語をユーザ辞書に登録するといった作業を容易に行うことができる。
【0010】
本発明の請求項2の機械翻訳装置は、識別モード設定手段により、音声入力される入力データが特定のコマンド語であるかどうかをまず判断しいずれかのコマンド語であれば制御コマンドと識別しそれ以外であれば翻訳すべき第1言語の語句であると識別するコマンド優先モード、及び、前記入力データの全てを翻訳すべき第1言語の語句であると識別する翻訳優先モードを含むモードの中から識別基準となるモードが設定され、音声入力手段により第1言語の語句或いは装置の駆動制御用の制御コマンドが音声入力されると、前記識別モード設定手段により設定された識別基準に基づいて、その入力データが翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかが識別され、入力データが制御コマンドと識別された場合には、その制御コマンドに対応した処理が実行され、前記入力データが翻訳すべき第1言語の語句であると識別された場合には、その第1言語の語句を辞書を参照して第2言語に翻訳してその結果が出力され、また、翻訳すべき第1言語の語句が辞書にない未知語である場合に、その未知語データが辞書登録候補として未知語データ記憶手段に記憶保存されるように構成したところに特徴を有する。
【0011】
これによれば、やはり、翻訳すべき第1言語の語句及び制御コマンドを音声入力することが可能となるのであるが、このとき、音声入力された入力データが、翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかが自動で識別され、制御コマンドに対応した処理の実行あるいは翻訳がなされるようになる。この場合、翻訳すべき第1言語の語句か制御コマンドかが自動で識別されるので、それらの区別のためにユーザに面倒な操作を強いることもなく、迅速な処理が可能となる。
【0012】
そして、その入力データを識別する際の識別基準を識別モード設定手段により設定できるので、ユーザが例えば用途などに応じて、所望の識別基準を設定することが可能となる。さらに、翻訳すべき第1言語の語句が辞書の見出語に存在しない未知語であるケースが考えられるが、そのような場合には、その未知語データが辞書登録候補として未知語データ記憶手段に記憶保存されるようになるので、後にその未知語をユーザ辞書に登録するといった作業を容易に行うことができる。
【0013】
本発明の請求項3の機械翻訳装置は、識別モード設定手段により、音声入力される入力データが特定のコマンド語であるかどうかをまず判断しいずれかのコマンド語であれば制御コマンドと識別しそれ以外であれば翻訳すべき第1言語の語句であると識別するコマンド優先モード、及び、前記入力データの全てを翻訳すべき第1言語の語句であると識別する翻訳優先モードを含むモードの中から識別基準となるモードが設定され、音声入力手段により第1言語の語句或いは装置の駆動制御用の制御コマンドが音声入力されると、前記識別モード設定手段により設定された識別基準に基づいて、その入力データが翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかが識別され、入力データが制御コマンドと識別された場合には、その制御コマンドに対応した処理が実行され、前記入力データが翻訳すべき第1言語の語句であると識別された場合には、さらにその第1言語の語句を第2言語に翻訳して出力するか或いはその第1言語の語句の辞書内容を出力するかが出力設定手段により設定され、前記出力設定手段により第1言語の語句を第2言語に翻訳して出力すると設定された場合には、前記第1言語の語句を辞書を参照して第2言語に翻訳してその結果が出力され、前記出力設定手段により第1言語の語句の辞書内容を出力すると設定された場合には、辞書を参照して前記第1言語の語句に対応する辞書内容が前記音声入力手段による入力順に出力され、また、翻訳すべき第1言語の語句が辞書にない未知語である場合に、その未知語データが辞書登録候補として未知語データ記憶手段に記憶保存されるように構成したところに特徴を有する。
【0014】
これによれば、やはり、翻訳すべき第1言語の語句及び制御コマンドを音声入力することが可能となるのであるが、このとき、音声入力された入力データが、翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかが自動で識別され、制御コマンドに対応した処理の実行あるいは翻訳がなされるようになる。この場合、翻訳すべき第1言語の語句か制御コマンドかが自動で識別されるので、それらの区別のためにユーザに面倒な操作を強いることもなく、迅速な処理が可能となる。
【0015】
そして、その入力データを識別する際の識別基準を識別モード設定手段により設定できるので、ユーザが例えば用途などに応じて、所望の識別基準を設定することが可能となる。これと共に、入力データが翻訳すべき第1言語の語句を示すデータである場合において、第2言語に翻訳して出力するかそれとも辞書内容を出力するかを、出力設定手段により設定することができるので、ユーザは、どちらか希望する出力を選択することができ、使いやすく利便性の高いものとなる。さらに、翻訳すべき第1言語の語句が辞書の見出語に存在しない未知語であるケースが考えられるが、そのような場合には、その未知語データが辞書登録候補として未知語データ記憶手段に記憶保存されるようになるので、後にその未知語をユーザ辞書に登録するといった作業を容易に行うことができる。
【0016】
また、識別モード設定手段により識別基準を設定する場合、音声入力手段により入力される第1言語のうち、特定語句あるいは所定語句に続く語句を制御コマンドとして識別し、特定語句あるいは所定語句がなければ翻訳すべき第1言語として識別する形式指定モードの設定が可能に構成することができる(請求項4の発明)。これによれば、形式指定モードを設定することにより、入力データを識別する際に、制御コマンドかどうかの識別をより確実に行うことが可能となる。
【0017】
そして、未知語があった場合に、その未知語をその音声データと訳語データとを対にして未知語データ記憶手段に記憶するように構成しても良い(請求項5の発明)。これによれば、読みデータと訳語データとを対にして記憶する場合と異なり、ユーザの発声,発音等の癖にも対応することができ、より利用しやすい形態で未知語データを記憶させることができる。
【0018】
さらには、翻訳結果及び辞書内容を表示手段に表示させると共に、その際に、翻訳結果の出力内容と辞書内容の出力内容とを異なる形態で表示させるように構成しても良く(請求項6の発明)、これにより、翻訳結果及び辞書内容を、それらを区別した状態で、ユーザに対して判りやすく出力(表示)することができる。
【0019】
【発明の実施の形態】
以下、本発明の第1の実施の形態について、図1ないし図6を参照しながら説明する。尚、この第1の実施形態では、本発明を汎用のパーソナルコンピュータ(パソコンと略す)システムにより実現する場合に適用したものである。また、ここでは、第1言語としての日本語から第2言語としての英語に翻訳する場合を例としている。
【0020】
図2は、本実施形態に係る機械翻訳装置たるパソコンシステム1の外観構成を示しており、図3は、その要部の電気的構成をブロックにより概略的に示している。ここで、図2に示すように、このパソコンシステム1は、パソコン本体2に、例えば液晶ディスプレイからなり、後述のように入力された日本語の原文や翻訳された英語の翻訳文さらには制御コマンド等のアイコンが表示される表示手段たる表示部3、各種の設定、原文の入力や制御コマンドの指示等の各種の入力等を行うための入力操作装置であるキーボード4及びマウス5、音声入力手段としてのマイクロホン6(以下単にマイク6という)等を接続して構成されている。
【0021】
前記パソコン本体2内には、図3に示すように、全体の制御などを行う制御部7、外部記憶装置たるハードディスク装置8、前記表示部3の表示を制御する表示制御部9、前記マイク6から入力された音声信号を認識する音声認識部10、CD−ROMドライブ11等が設けられている。前記制御部7は、マイコンを主体として構成され、周知のように、CPU12、ROM13、メモリとしてのRAM14、入出力インタフェース15をバス16により相互に接続して構成されている。前記入出力インタフェース15に、前記表示制御部9、キーボード4、マウス5、音声認識部10、CD−ROMドライブ11、ハードディスク装置8が接続されている。
【0022】
前記CD−ROMドライブ11には、後述する機械翻訳処理プログラムを記録した記録媒体としてのCD−ROM17がセットされ、そのプログラムを読込むようになっている。また、前記ハードディスク装置8には、翻訳処理用の辞書(辞書データ)が格納されている。この場合、この辞書は、基本辞書18、専門分野毎に編集された専門辞書19、ユーザが独自に構築するユーザ辞書20を含んで構成される。
【0023】
図4(a),(b),(c)には、それら辞書データつまり基本辞書18,専門辞書19,ユーザ辞書20のデータ構造の一例をそれぞれイメージで示している。これら辞書データは、例えば、日本語による見出語情報(読みデータ)、品詞情報、英語による訳語情報及び、分野,活用形,用法等の構文・意味情報を含む辞書情報から構成されている。尚、翻訳の処理にあたっては、同一の見出語に対しては、ユーザ辞書20が最優先され、次いで専門辞書19、基本辞書18の順に辞書が利用(辞書引き)されるようになっている。これらユーザ辞書20、専門辞書19の使用は、ユーザの設定によるものである。
【0024】
そして、前記制御部7は、前記CD−ROM17から読込んだ機械翻訳処理プログラムの実行により、翻訳に係る各種の処理を実行するようになっている。具体的には、後の作用説明でも述べるように、入力された日本語の原文(入力文)を英語に翻訳して出力(表示部3に表示)する翻訳処理、入力された日本語の語句に対応する辞書内容(例えば複数個の英語の訳語)を出力(表示部3に表示)する辞書内容出力(辞書引き)処理、入力された原文の編集を行う入力文編集処理、翻訳処理された英語の翻訳文の編集を行う翻訳文編集処理、ユーザ辞書を構築するための辞書編集処理等の処理を実行する。
【0025】
このとき、この機械翻訳処理においては、日本語の原文の入力をテキストデータ(文字データ)により行うテキスト入力モードと、翻訳(あるいは辞書引き)すべき日本語の語句や、実行させたい駆動制御用の制御コマンド(例えば「ファイル」、「ヘルプ」、「閉じる」、「編集」、「検索」といった処理)を、前記マイク6からの音声入力により受付ける音声入力モードとの実行が可能とされている。
【0026】
さて、後の作用説明でも述べるように、前記音声入力モードにあっては、制御部7は、マイク6から音声入力され音声認識部10により認識された入力データを、翻訳すべき日本語の語句であるか制御コマンドであるかを識別し、入力データを制御コマンドと識別した場合にはその処理を実行し、入力データを翻訳すべき日本語の語句と識別した場合には翻訳処理を行って英語に翻訳(あるいは辞書引き)して出力(表示部3に表示)するようになっている。従って、制御部7が、識別手段、制御コマンド実行手段、翻訳手段、辞書内容出力手段として機能するようになっている。
【0027】
このとき、本実施形態では、前記入力データを、翻訳すべき日本語の語句であるか制御コマンドであるかを識別する際の識別基準として、コマンド優先モード、翻訳優先モード、形式指定モードのいずれかを、予めユーザのキーボード4(あるいはマウス5)の操作によりモード設定(選択)することができるようになっている。尚、何ら設定操作を行わなくても、コマンド優先モードが初期設定される。従って、キーボード4及びマウス5が識別モード設定手段として機能する。
【0028】
そのうちコマンド優先モードは、入力データが、特定の形式の第1言語(特定の語句)であるか、つまり「ファイル」、「ヘルプ」、「閉じる」といったコマンド語であるかどうかをまず判断し、いずれかのコマンド語であれば制御コマンドと識別し、それ以外であれば翻訳すべき第1言語の語句であると識別するものである。翻訳優先モードは、入力データの全てを翻訳すべき第1言語の語句であると識別するものであり、従ってこのモードにおいて制御コマンドを実行させたい場合には、キー操作によるコマンド入力が必要となる。形式指定モードは、特定の形式である、所定語句に続いて入力された語句を制御コマンドと識別するものであり、例えば所定語句である「##(シャープシャープ)」の後にコマンド語を入力すれば、制御コマンドと識別し、所定語句がなければ、翻訳すべき第1言語の語句であると識別するものである。
【0029】
そして、本実施形態では、入力データが翻訳すべき日本語の語句であると識別されたときには、基本的には翻訳結果を出力(表示)するのであるが、ユーザがキーボード4(あるいはマウス5)を操作して辞書内容の出力を指示することにより、入力された第1言語の語句の辞書内容が出力されるようになっている。従って、キーボード4及びマウス5が出力設定手段としても機能するのである。
【0030】
またこの場合、図示はしないが、表示部3には、例えば左側に位置して入力データを表示する領域(ウインドウ)が設けられ、その右側に翻訳文(翻訳語)を表示する領域(ウインドウ)が設けられるのであるが、辞書内容の表示は、それらとは別のウインドウを重ねるように設けることにより行われるようになっており、もって、翻訳内容と辞書内容とは異なる形態で表示されるようになっている。尚、辞書内容を出力する際には、入力データの順に表示が行われる。
【0031】
さらに、音声入力された日本語の語句が、辞書の見出語にも存在しない未知語であったときに、その未知語データをユーザ辞書20に登録する辞書登録候補として、RAM14に記憶保存するようになっている。このとき、RAM14には、データ保存ファイルが設けられ、未知語データ記憶手段として機能するようになっている。
【0032】
尚、上記した音声認識部10による音声認識の手法としては、公知の様々な手法を用いることができる。例えば、マイク6から入力された音声信号を所定周期(4〜20ms)毎に分析し、音声に含まれるスペクトルをバンドパスフィルタバンクによって抽出した特徴パラメータを、音声認識用辞書に記憶されている標準パターンと比較して、距離が最小となる標準パターンを認識結果として出力する手法や、有音隠れマルコフモデルを用いる手法等を採用することができる。
【0033】
次に、上記構成の作用について、図1及び図5,図6も参照して述べる。まず、図5のフローチャートは、制御部7による機械翻訳処理プログラムの実行時のうち、テキスト入力モードにおける翻訳,編集の処理手順の概略を示している。即ち、ステップS1では、日本語による原文の入力が行われる。この入力は、ユーザがキーボード4を操作して日本語の原文を入力することにより行われ、また、既に作成されている原文のファイルを読込むことにより行うようにしても良い。日本語の原文が入力されると、ステップS2にて、その入力文が表示部3に表示されるようになる。
【0034】
ここで、ユーザが、入力文の編集を行いたい場合には、キーボード4のキー入力操作あるいはマウス5の操作により入力文編集を指示する(ステップS3にてYes)。すると、ステップS4にて、入力文編集の処理が実行される。この入力文編集の処理では、ユーザのキーボード4やマウス5の操作に基づいて、表示部3に表示された入力文に対して、削除、加入、訂正等の編集が行えるようになっている。
【0035】
入力された(あるいは編集された)原文の翻訳を行わせる場合には、ユーザはキーボード4のキー入力操作あるいはマウス5の操作により入力文編集を指示する(ステップS5にてYes)。すると、入力文を英語の翻訳文に翻訳する翻訳処理が行われる(ステップS6)。この翻訳処理については後述(図6)する。翻訳処理が行われると、ステップS7にて、入力文と翻訳文とが対応付けられた状態でRAM14に格納され、ステップS8にて、それら入力文と翻訳文とが表示部3に表示される。
【0036】
また、ユーザが、出力された翻訳文の編集を行いたい場合には、キーボード4のキー入力操作あるいはマウス5の操作により翻訳文編集を指示する(ステップS9にてYes)。すると、ステップS10にて、表示部3に表示された翻訳文に対する、削除、加入、訂正等の編集編集の処理が実行される。ユーザが翻訳の処理を終了させたい場合には、終了の指示操作を行えば(ステップS11にてYes)、処理が終了する。例えばユーザ辞書の編集などの他の処理の指示を行えば(ステップS11にてNo)、それに応じた処理が実行される(ステップS12)。図示はしないが、他の処理として、入力文や翻訳文をフロッピーディスク等の記録媒体に保存したり、印刷したりすることができることは勿論である。
【0037】
ここで、図6は、上記した翻訳の処理の手順(図5のステップS6の処理の詳細)を示している。即ち、まずステップS21では、予め定められた形態素解析規則を用いて、入力文を構成する単語について辞書を検索して単語を切出し、訳語、品詞といった検索情報を形態素解析結果に付与する形態素解析処理が実行される。ステップS22では、形態素解析処理の結果に基づき、予め定められた解析文法を用いて、日本語の構造を解析する解析処理が実行される。
【0038】
次のステップS23では、予め定められた変換文法を用いて、解析処理により解析された日本語の構造を英語の構造に変換すると共に、個々の単語を英語に置換える変換処理が実行される。引続き、ステップS24では、予め定められた生成文法を用いて、変換処理により変換された英語の構造から英語の語順を決定したり、英語に特有の冠詞を生成したり、英語文に必要な主語を補充したり、テンス,アスペクト,人称及び数素性等を処理し、英語の単語列からなる出力文を生成する生成する生成処理が実行される。
【0039】
そして、ステップS25にて、予め定められた形態素生成規則を用いて、生成処理により生成された英語の単語列に対して、名詞の複数形、動詞の過去,過去分詞などの活用形を生成して翻訳文を得る形態素生成が実行され、もって翻訳処理が完了するのである。
【0040】
さて、図1のフローチャートは、制御部7による機械翻訳処理プログラムの実行時のうち、音声入力モードにおける処理手順を示している。ここでは、図示はしていないが、予め識別基準の設定が行われるようになっており(識別設定工程)、コマンド優先モードが設定されているもの(ユーザによる設定操作が行われず初期設定のまま)としている。
【0041】
この音声入力モードでは、上述のように、翻訳すべき日本語の語句(単語やフレーズ)及び、例えば「ファイル」、「ヘルプ」、「閉じる」、「編集」、「検索」といった制御コマンドを、マイク6からの音声入力により受付けるようになっており(音声入力工程)、ステップS31では、ユーザによる音声入力を待つ。音声入力があると(ステップS31にてYes)、入力音声が音声認識部10により認識処理され、読みデータとされる(ステップS32)。
【0042】
次のステップS33では、入力データ(読みデータ)が、制御コマンドかどうか、つまりコマンド語にあるかどうかが判断される(識別工程)。入力データを制御コマンドと識別した場合には(ステップS33にてYes)、ステップS34にて、その制御コマンドに応じた処理が実行されるようになっている(制御コマンド実行工程)。
【0043】
一方、入力データが制御コマンドではないと識別した場合には(ステップS33にてNo)、入力データが翻訳すべき日本語の語句であると判断して、次のステップS35にて、その読みデータと辞書の見出語とのマッチングが行われる。読みデータが辞書の見出語に存在する場合には(ステップS36にてYes)、ステップS37にて、翻訳して出力するか、辞書内容を出力(辞書引き)するかが判断される。
【0044】
ここで、上述のように、ユーザが何ら操作を行わなければそのまま翻訳がなされ、ユーザがキー操作を行うことにより、辞書引きがなされるようになっており(出力設定工程)、翻訳の場合には、ステップS38にて、入力データが翻訳されてその結果(英語の訳語(訳文))が表示部3に表示されるようになるのである(翻訳工程)。また、辞書内容の出力(辞書引き)が設定されている場合には、ステップS39にて、辞書内容が入力順に表示部3に表示されるようになるのである(辞書内容出力工程)。
【0045】
これに対し、音声入力された入力データ(読みデータ)が、辞書データの見出語に存在しない未知語である場合には(ステップS36にてNo)、ステップS40にて、その未知語となる読みデータが、辞書登録候補として、RAM14のデータ保存ファイルに書込まれて記憶保存される(未知語データ記憶工程)。また、本実施形態では、入力データが辞書データの見出語に存在し、翻訳されたものであっても、例えばユーザの操作により、その入力データ(及び訳語データ)を、辞書登録候補としてRAM14のデータ保存ファイルに記憶保存させることができるようになっている(ステップS41)。
【0046】
これにより、音声入力モードにおいては、ユーザは、英語に翻訳すべき日本語の語句あるいは制御コマンドをマイク6から音声により入力することが可能となるのであるが、このとき、音声入力されたデータが、翻訳すべき日本語の語句であるか制御コマンドであるかが自動的に識別され、翻訳(辞書引き)あるいはコマンドの実行がなされるようになる。
【0047】
このため、翻訳すべき語句か制御コマンドかを区別するための特別な操作が不要となり、ユーザに面倒な操作を強いることがなくなると共に、処理の迅速性を高めることができる。従って、日本語の語句の翻訳を簡便且つ迅速に行うことができ、例えば話し言葉を通訳する通訳者が、知らない専門用語が出てきたとき等の通訳の補助に用いるといった使い方に好適なものとなるのである。
【0048】
そして、入力データが翻訳すべき第1言語の語句を示すデータである場合において、第2言語に翻訳して出力するかそれとも辞書内容を出力するかを、ユーザが設定することができるので、ユーザは、どちらか希望する出力を選択することができ、使いやすく利便性の高いものとなる。これと共に、制御コマンドかどうかを識別する識別基準もユーザにより3つのモードのうちから設定(選択)できるので、所望の識別基準を設定することが可能となる。
【0049】
この場合、詳しい説明は省略するが、所定語句(「例えば##(シャープシャープ)」)の音声入力に続けてコマンド語を音声入力することにより、制御コマンドを識別する形式指定モードを設定することにより、制御コマンドか翻訳すべく第1言語の語句かの識別をより確実に行うことができるようになる。ユーザが、制御コマンドの音声入力を行うことがないと判断すれば、翻訳優先モードを設定すれば、全ての入力データに対して直ぐに翻訳処理を行うことができ、音声入力から出力までの処理時間(応答性)を高めることが可能となる。
【0050】
しかも、翻訳すべき日本語の語句が辞書データの見出語に存在しない未知語である場合等に、その入力データを辞書登録候補としてRAM14のデータ保存ファイルに記憶保存できるようにしたので、後に、ユーザがRAM14のデータ保存ファイルを呼出すことにより、その未知語をユーザ辞書20に登録するなどの作業を容易に行うことができるものである。
【0051】
このように本実施形態によれば、入力された日本語を英語に翻訳するものにあって、音声入力を可能とすると共に、音声入力された入力データが翻訳すべき日本語の語句であるか制御コマンドであるかを自動的に識別する構成を備えるので、日本語の語句の翻訳を簡便且つ迅速に行うことができ、ユーザにとっての利便性を向上することができるという優れた効果を奏する。
【0052】
しかも、特に本実施形態では、入力データが翻訳すべき日本語である場合において、翻訳するか辞書引きをするかをユーザが設定することができ、これと共に、制御コマンドかどうかを識別するための識別基準もユーザが設定できるので、使いやすく利便性の高いものとなり、さらには、翻訳すべき日本語の語句が辞書の見出語に存在しない未知語である場合に、その未知語データを辞書登録候補として記憶保存する構成としたので、ユーザ辞書20の登録作業が容易となるなどのメリットも併せて得ることができるものである。
【0053】
図7は、本発明の第2の実施形態に係る機械翻訳装置21の外観構成を示している。この機械翻訳装置21は、上記第1の実施形態のようなパソコンシステムを用いたものと異なり、入力された第1言語(日本語)を第2言語(英語)に翻訳する携帯型の専用機として構成されている。この機械翻訳装置21は、持運び可能な大きさの薄形矩形状をなす本体ケース22の表面部に、入力された日本語の原文(入力文)や英語の翻訳文を表示するためのLCDからなる表示部23や、ユーザが必要な操作を行うための多数のキーを有するキー操作部24を設けて構成される。
【0054】
前記キー操作部24には、原文を入力するための多数個の文字入力キー24aや、リターンキー24b、機能を設定するためのメニューキー24c、取消しキー24d、コマンド優先モードと翻訳優先モードとを切替えるための識別モード設定手段としての切替スイッチ24e、辞書引きを指示するための出力設定手段としての辞書引きキー24f等が設けられている。また、前記本体ケース22には、音声入力手段としてのマイク25が接続されると共に、例えば商用電源に接続される充電用の端子26、外部(パソコン等)とのデータのやり取りを行うためのデータ伝送用のコネクタ27なども設けられている。このコネクタ27を利用すれば、専門辞書19のデータをパソコン等から予め取込んでおくことも可能であるる。
【0055】
そして、図示はしないが、前記本体ケース22内には、マイコンを主体として構成され装置全体を制御する制御部や、音声認識処理やデータ入出力処理などの各種の処理回路、電源となる二次電池等が配設されている。このとき、前記制御部(マイコン)のメモリ(ROM)内には、機械翻訳処理プログラム及び翻訳処理用の辞書データ等が格納されている。また、制御部のRAMには、未知語データ等を記憶保存するためのデータ保存ファイルが設けられる。
【0056】
この場合、メニューキー24cの操作により、上記第1の実施形態と同様に、日本語の原文の入力をテキストデータ(文字データ)により行うテキスト入力モードと、翻訳すべき日本語の語句や実行させたい駆動制御用の制御コマンドを前記マイク25からの音声入力により受付ける音声入力モードとの実行が可能とされている。
【0057】
さらに、前記音声入力モードにあっては、切替スイッチ24eの操作により、コマンド優先モードと翻訳優先モードとを切替えることができるようになっている。そのうち翻訳優先モードにおいては、マイク25から音声入力され音声認識された入力データを、全て翻訳すべき日本語の語句であるとして翻訳処理(原文の語句及び訳語を表示部23に表示)するようになっている。従って、このモードにおいてコマンドを実行させたい場合には、キー操作部24によるコマンド入力が必要となる。
【0058】
そして、前記コマンド優先モードにあっては、上記第1の実施形態と同様に、制御部は、マイク25から音声入力され音声認識された入力データを、翻訳すべき日本語の語句であるか制御コマンドであるかを識別し、入力データを制御コマンドと識別した場合にはその処理を実行し、入力データを翻訳すべき日本語の語句と識別した場合には翻訳処理を行って英語に翻訳して出力(表示部23に表示)するようになっている。
【0059】
このとき、通常時には翻訳がなされてその結果が出力されるのであるが、ユーザにより辞書引きキー24fがオン操作されたときには、辞書内容が出力(表示)されるようになっている。さらに、音声入力された日本語の語句が、辞書データの見出語に存在しない未知語であったときに、その未知語データをユーザ辞書に登録する辞書登録候補として、RAMのデータ保存ファイルに記憶保存するようになっている。また、この未知語の情報などは、コネクタ27を通じてパソコンの方に取込むことも可能である。
【0060】
従って、この第2の実施形態においても、上記第1の実施形態と同様に、入力された日本語を英語に翻訳するものにあって、音声入力を可能とすると共に、音声入力された入力データが翻訳すべき日本語の語句であるか制御コマンドであるかを自動的に識別する構成を備えるので、日本語の語句の翻訳を簡便且つ迅速に行うことができ、ユーザにとっての利便性を向上することができる等の優れた効果を奏する。しかも、本実施形態では、装置を携帯型として構成したことにより、通訳を行う際などの携帯性に優れるといった利点も得ることができる。
【0061】
尚、上記各実施形態では、未知語をRAMのデータ保存ファイルに記憶保存するにあたり、その読みデータを記憶するようにしたが、未知語をその音声データと訳語データとを対にして記憶するように構成しても良く、これにより、ユーザの発声,発音等の癖にも対応することができ、より利用しやすいデータとすることができる。また、上記各実施形態では、翻訳結果を出力するか辞書内容を出力するかを、キー操作により設定するようにしたが、予めモード設定により出力設定を行うようにしても良い。
【0062】
その他、機械翻訳処理プログラムを記録した記録媒体としては、CD−ROM17に限らず、磁気ディスク、半導体メモリ、CD−R、MD,MO,PD,DVD,磁気テープなど様々な媒体を用いることができ、また、日本語から英語への翻訳に限らず、英語から日本語への翻訳はもとより、第1言語及び第2言語としては世界各国の言語に適用することができ、さらには、音声合成機能を設けて翻訳文あるいは訳語を合成音声により出力する構成としても良い等、本発明は要旨を逸脱しない範囲内で適宜変更して実施し得るものである。
【0063】
【発明の効果】
以上の説明にて明らかなように、本発明によれば、音声入力手段により音声入力された入力データが、翻訳すべき第1言語の語句であるか制御コマンドであるかを識別し、入力データが制御コマンドと識別された場合にはその処理を実行し、前記入力データが翻訳すべき第1言語の語句と識別された場合には第2言語に翻訳して出力し、翻訳すべき第1言語の語句が辞書データの見出語に存在しない未知語である場合に、その未知語データを辞書登録候補としてメモリに記憶保存するように構成したので、音声入力を可能とすると共に、ユーザにとっての利便性を向上することができるという優れた効果を奏するものである。
【図面の簡単な説明】
【図1】 本発明の第1の実施形態を示すもので、音声入力時の処理手順を示すフローチャート
【図2】 機械翻訳装置の外観を示す図
【図3】 機械翻訳装置の電気的構成を概略的に示すブロック図
【図4】 辞書データの構造を模式的に示す図
【図5】 テキスト入力モードにおける翻訳,編集の処理手順を示すフローチャート
【図6】 翻訳処理の手順を示すフローチャート
【図7】 本発明の第2の実施形態に係る機械翻訳装置の外観を示す斜視図
【符号の説明】
図面中、1はパーソナルコンピュータシステム(機械翻訳装置)、2はパソコン本体、3,23は表示部(表示手段)、4はキーボード(識別モード設定手段、出力設定手段)、6,25はマイクロホン(音声入力手段)、7は制御部(識別手段、制御コマンド実行手段、翻訳手段、辞書内容出力手段)、10は音声認識部、11はCD−ROMドライブ、12はCPU、13はROM、14はRAM(未知語データ記憶手段)、17はCD−ROM(記録媒体)、20はユーザ辞書、21は機械翻訳装置、22は本体ケース、24はキー操作部、24eは切替スイッチ(識別モード設定手段)、24fは辞書引きキー(出力設定手段)を示す。
Claims (6)
- 入力された第1言語を、辞書を参照して第2言語に翻訳する機械翻訳装置であって、
前記第1言語の語句或いは装置の駆動制御用の制御コマンドを音声入力するための音声入力手段と、
この音声入力手段による入力データが特定のコマンド語であるかどうかを判断し、いずれかのコマンド語であれば制御コマンドを示すデータであると識別し、コマンド語以外であれば翻訳すべき第1言語の語句を示すデータであると識別する識別手段と、
この識別手段により、前記入力データが制御コマンドであると識別された場合には、その制御コマンドに対応した処理を実行する制御コマンド実行手段と、
前記識別手段により、前記入力データが翻訳すべき第1言語の語句であると識別された場合に、この第1言語の語句を第2言語に翻訳して出力するか或いはこの第1言語の語句の辞書内容を出力するかを設定する出力設定手段と、
この出力設定手段により第1言語の語句を第2言語に翻訳して出力すると設定された場合に、前記第1言語の語句を前記辞書を参照して第2言語に翻訳し、その結果を出力する翻訳手段と、
前記出力設定手段により第1言語の語句の辞書内容を出力すると設定された場合には、前記辞書を参照して前記第1言語の語句に対応する辞書内容を前記音声入力手段による入力順に出力する辞書内容出力手段と、
翻訳すべき第1言語の語句が前記辞書にない未知語である場合に、その未知語データを辞書登録候補として記憶保存する未知語データ記憶手段とを具備することを特徴とする機械翻訳装置。 - 入力された第1言語を、辞書を参照して第2言語に翻訳する機械翻訳装置であって、
前記第1言語の語句或いは装置の駆動制御用の制御コマンドを音声入力するための音声入力手段と、
この音声入力手段による入力データが翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかを識別する識別手段と、
この識別手段が識別を行う際の識別基準となるモードを、前記入力データが特定のコマンド語であるかどうかをまず判断しいずれかのコマンド語であれば制御コマンドと識別しそれ以外であれば翻訳すべき第1言語の語句であると識別するコマンド優先モード、及び、前記入力データの全てを翻訳すべき第1言語の語句であると識別する翻訳優先モードを含むモードの中から設定する識別モード設定手段と、
前記識別手段により、前記入力データが制御コマンドであると識別された場合には、その制御コマンドに対応した処理を実行する制御コマンド実行手段と、
前記識別手段により、前記入力データが翻訳すべき第1言語の語句であると識別された場合には、前記第1言語の語句を前記辞書を参照して第2言語に翻訳し、その結果を出力する翻訳手段と、
翻訳すべき第1言語の語句が前記辞書にない未知語である場合に、その未知語データを辞書登録候補として記憶保存する未知語データ記憶手段とを具備することを特徴とする機械翻訳装置。 - 入力された第1言語を、辞書を参照して第2言語に翻訳する機械翻訳装置であって、
前記第1言語の語句或いは装置の駆動制御用の制御コマンドを音声入力するための音声入力手段と、
この音声入力手段による入力データが翻訳すべき第1言語の語句を示すデータであるか制御コマンドを示すデータであるかを識別する識別手段と、
この識別手段が識別を行う際の識別基準となるモードを、前記入力データが特定のコマンド語であるかどうかをまず判断しいずれかのコマンド語であれば制御コマンドと識別しそれ以外であれば翻訳すべき第1言語の語句であると識別するコマンド優先モード、及び、前記入力データの全てを翻訳すべき第1言語の語句であると識別する翻訳優先モードを含むモードの中から設定する識別モード設定手段と、
前記識別手段により、前記入力データが制御コマンドであると識別された場合には、その制御コマンドに対応した処理を実行する制御コマンド実行手段と、
前記識別手段により、前記入力データが翻訳すべき第1言語の語句であると識別された場合に、この第1言語の語句を第2言語に翻訳して出力するか或いはこの第1言語の語句の辞書内容を出力するかを設定する出力設定手段と、
この出力設定手段により第1言語の語句を第2言語に翻訳して出力すると設定された場合に、前記第1言語の語句を前記辞書を参照して第2言語に翻訳し、その結果を出力する翻訳手段と、
前記出力設定手段により第1言語の語句の辞書内容を出力すると設定された場合には、前記辞書を参照して前記第1言語の語句に対応する辞書内容を前記音声入力手段による入力順に出力する辞書内容出力手段と、
翻訳すべき第1言語の語句が前記辞書にない未知語である場合に、その未知語データを辞書登録候補として記憶保存する未知語データ記憶手段とを具備することを特徴とする機械翻訳装置。 - 前記識別モード設定手段は、前記音声入力手段により入力される第1言語のうち、特定語句あるいは所定語句に続く語句を制御コマンドとして識別し、特定語句あるいは所定語句がなければ翻訳すべき第1言語として識別する形式指定モードの設定が可能に構成されていることを特徴とする請求項2又は3記載の機械翻訳装置。
- 前記未知語データ記憶手段は、前記未知語を、その音声データと訳語データとを対にして記憶することを特徴とする請求項1ないし4のいずれかに記載の機械翻訳装置。
- 前記翻訳手段及び辞書内容出力手段の出力内容を表示する表示手段を具備し、この表示手段は翻訳手段の出力内容と辞書内容出力手段の出力内容とを異なる形態で表示することを特徴とする請求項1ないし5のいずれかに記載の機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000382406A JP4135316B2 (ja) | 2000-12-15 | 2000-12-15 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000382406A JP4135316B2 (ja) | 2000-12-15 | 2000-12-15 | 機械翻訳装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002183136A JP2002183136A (ja) | 2002-06-28 |
| JP4135316B2 true JP4135316B2 (ja) | 2008-08-20 |
Family
ID=18850237
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000382406A Expired - Fee Related JP4135316B2 (ja) | 2000-12-15 | 2000-12-15 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4135316B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11222185B2 (en) | 2006-10-26 | 2022-01-11 | Meta Platforms, Inc. | Lexicon development via shared translation database |
| US9128926B2 (en) | 2006-10-26 | 2015-09-08 | Facebook, Inc. | Simultaneous translation of open domain lectures and speeches |
| US8972268B2 (en) | 2008-04-15 | 2015-03-03 | Facebook, Inc. | Enhanced speech-to-speech translation system and methods for adding a new word |
| EP2274742A1 (en) * | 2008-04-15 | 2011-01-19 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
| US8279052B2 (en) * | 2009-11-04 | 2012-10-02 | Immersion Corporation | Systems and methods for haptic confirmation of commands |
| WO2021044461A1 (ja) * | 2019-09-02 | 2021-03-11 | 株式会社オシエテ | 通訳サービス提供サーバ |
-
2000
- 2000-12-15 JP JP2000382406A patent/JP4135316B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2002183136A (ja) | 2002-06-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN102165437B (zh) | 信息处理装置及信息处理方法 | |
| JP2001306067A (ja) | 歌詞作成装置及び歌詞作成方法並びに歌詞作成プログラムを記録した記録媒体 | |
| JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
| JPH1125098A (ja) | 情報処理装置、リンク先ファイルの取得方法および記憶媒体 | |
| JP4135316B2 (ja) | 機械翻訳装置 | |
| JP3927800B2 (ja) | 音声認識装置及び方法、プログラム、並びに記憶媒体 | |
| US20080172226A1 (en) | Voice output device and voice output program | |
| JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
| JP2004272363A (ja) | 音声入出力装置 | |
| JP7711406B2 (ja) | 情報検索装置、情報検索支援方法及びプログラム | |
| US20130080144A1 (en) | Machine translation apparatus, a method and a non-transitory computer readable medium thereof | |
| CN112541071A (zh) | 电子辞典、学习单词判断方法、以及记录介质 | |
| JP4305515B2 (ja) | 音声出力装置及び音声出力プログラム | |
| JP2006011842A (ja) | 翻訳装置および翻訳プログラム | |
| JP2010002830A (ja) | 音声認識装置 | |
| JPH08329059A (ja) | 汎用参照装置 | |
| JPH0944502A (ja) | 情報受信装置及び機械翻訳装置 | |
| JPH1145243A (ja) | 索引作成支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2008158630A (ja) | 画像出力装置及び画像出力方法 | |
| JPH08194494A (ja) | 文解析方法および装置 | |
| JP2008171208A (ja) | 音声出力装置及び音声出力プログラム | |
| JP2007034504A (ja) | 情報処理装置 | |
| JP2002073602A (ja) | 自然言語処理装置 | |
| JPH11232003A (ja) | ドキュメント表示装置,表示方法および記憶媒体 | |
| JP2004170577A (ja) | 文章読み上げ装置、読み上げのためのプログラム、及び、記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070926 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071030 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071225 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080122 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080219 |
|
| A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080407 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080513 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080526 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |