JPH1097538A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH1097538A JPH1097538A JP8252122A JP25212296A JPH1097538A JP H1097538 A JPH1097538 A JP H1097538A JP 8252122 A JP8252122 A JP 8252122A JP 25212296 A JP25212296 A JP 25212296A JP H1097538 A JPH1097538 A JP H1097538A
- Authority
- JP
- Japan
- Prior art keywords
- semantic feature
- sentence
- input
- variable
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 入力文から、その入力文に近いと思われる例
文およびその翻訳文を表示することによりコミュニケー
ションを図る装置において、その例文中に特定の単語に
置換可能な可変部を設けることにより、ひとつの例文で
多くの文に対応することが可能となるが、可変部に備え
られた単語に該当しない場合、閾値より低くなり、近い
例文であっても候補として選出されないという問題があ
る。 【解決手段】 可変部以外の文構成要素がほとんど一致
しており、可変部のみが一致してない場合の状態を正し
く判断し、可変部は一致していないが、意味的に近い例
文を確実に表示する。
文およびその翻訳文を表示することによりコミュニケー
ションを図る装置において、その例文中に特定の単語に
置換可能な可変部を設けることにより、ひとつの例文で
多くの文に対応することが可能となるが、可変部に備え
られた単語に該当しない場合、閾値より低くなり、近い
例文であっても候補として選出されないという問題があ
る。 【解決手段】 可変部以外の文構成要素がほとんど一致
しており、可変部のみが一致してない場合の状態を正し
く判断し、可変部は一致していないが、意味的に近い例
文を確実に表示する。
Description
【0001】
【発明の属する技術分野】本発明は、第一言語による会
話文を第二言語に翻訳する際に、予め登録されている会
話用例文を利用して翻訳を行う機械翻訳装置に関する。
話文を第二言語に翻訳する際に、予め登録されている会
話用例文を利用して翻訳を行う機械翻訳装置に関する。
【0002】
【従来の技術】観光等で海外に出かける機械が多くなっ
た現在では、外国での会話に困らないように多くの会話
表現を集めた会話用例集が多く出版されている。また、
これらの会話用例集を電子化し、キー操作等で会話用例
文を選び出して選び出された会話用例文の翻訳文を表示
する機械翻訳装置が提案されている。例えば、特願昭5
6−147263号公報の発明がそれに当たる。また、
この機械翻訳装置においては、あらかじめ会話用例文に
可変部をもうけ、入力された自由文の一部の単語が入れ
替わっても同じ例文を用いることによって、メモリを節
約しつつ例文のバリエーションを増やすことができる。
た現在では、外国での会話に困らないように多くの会話
表現を集めた会話用例集が多く出版されている。また、
これらの会話用例集を電子化し、キー操作等で会話用例
文を選び出して選び出された会話用例文の翻訳文を表示
する機械翻訳装置が提案されている。例えば、特願昭5
6−147263号公報の発明がそれに当たる。また、
この機械翻訳装置においては、あらかじめ会話用例文に
可変部をもうけ、入力された自由文の一部の単語が入れ
替わっても同じ例文を用いることによって、メモリを節
約しつつ例文のバリエーションを増やすことができる。
【0003】また、翻訳したい文を自由に入力すること
によって最適な会話用例文を自動的に選択してその翻訳
文を表示する機械翻訳装置が提案されている。この機械
翻訳装置も可変部を備えており、入力された語句に自動
的に置換することによって、入力文に近い文を生成し、
出力する構成となっている。
によって最適な会話用例文を自動的に選択してその翻訳
文を表示する機械翻訳装置が提案されている。この機械
翻訳装置も可変部を備えており、入力された語句に自動
的に置換することによって、入力文に近い文を生成し、
出力する構成となっている。
【0004】この方式では、会話用例文と、各例文を特
徴づける語句で類語ごとにグルーピングされたものを、
多数記憶している。前者を定型文、後者を意味素性と呼
んでいる。また、可変である意味素性を可変意味素性と
呼んでいる。
徴づける語句で類語ごとにグルーピングされたものを、
多数記憶している。前者を定型文、後者を意味素性と呼
んでいる。また、可変である意味素性を可変意味素性と
呼んでいる。
【0005】この方式では、入力文から意味素性を抽出
し、それらの組み合わせのパターンの近い定型文を検索
する。その際、入力文と各定型文が、意味素性の組み合
わせのパターンとしてどのくらい一致しているかを判定
する必要がある。従来の技術では、入力文と各定型文の
一致度を各単語単位の一致によって算出し、ある閾値以
上の定型文だけを表示する方法を採っている。
し、それらの組み合わせのパターンの近い定型文を検索
する。その際、入力文と各定型文が、意味素性の組み合
わせのパターンとしてどのくらい一致しているかを判定
する必要がある。従来の技術では、入力文と各定型文の
一致度を各単語単位の一致によって算出し、ある閾値以
上の定型文だけを表示する方法を採っている。
【0006】
【発明が解決しようとする課題】しかしながら、入力文
とある定型文が、可変意味素性だけ一致せず、文の他の
部分はすべて一致するような場合に、一致度を計算する
と閾値を超えず、意味は非常に近いのに表示されない場
合がある。しかし、可変意味素性だけ異なるような文に
対しては、翻訳結果として表示すると、そこだけユーザ
が自分で置き換えて相手に伝えることも可能であり、よ
りコミュニケーションの機会が広がることになる。
とある定型文が、可変意味素性だけ一致せず、文の他の
部分はすべて一致するような場合に、一致度を計算する
と閾値を超えず、意味は非常に近いのに表示されない場
合がある。しかし、可変意味素性だけ異なるような文に
対しては、翻訳結果として表示すると、そこだけユーザ
が自分で置き換えて相手に伝えることも可能であり、よ
りコミュニケーションの機会が広がることになる。
【0007】例として、「添乗員とはぐれました」とい
う入力があったとする。これに対してその通りの文意の
定型文は存在せず、「友人とはぐれました」という定型
文が最も近いものとしてあったとする。ここで、「友
人」にあたる部分は可変意味素性で、かつ「添乗員」な
る要素は登録されていないとする。
う入力があったとする。これに対してその通りの文意の
定型文は存在せず、「友人とはぐれました」という定型
文が最も近いものとしてあったとする。ここで、「友
人」にあたる部分は可変意味素性で、かつ「添乗員」な
る要素は登録されていないとする。
【0008】「添乗員」の部分が違っていても、「はぐ
れました」という表現の訳が分かれば、その部分をコミ
ュニケーションに役立てられる可能性は高い。しかし
「添乗員とはぐれました」と「友人とはぐれました」の
一致度を計算すると、閾値より低くなってしまい、従来
方式では表示されないことがありうる。従って「友人と
はぐれました」という検索結果は得られず、「友人」の
部分だけ「添乗員」に置き換えて伝えることもできな
い。
れました」という表現の訳が分かれば、その部分をコミ
ュニケーションに役立てられる可能性は高い。しかし
「添乗員とはぐれました」と「友人とはぐれました」の
一致度を計算すると、閾値より低くなってしまい、従来
方式では表示されないことがありうる。従って「友人と
はぐれました」という検索結果は得られず、「友人」の
部分だけ「添乗員」に置き換えて伝えることもできな
い。
【0009】本発明では、可変意味素性以外の文構成要
素がほとんど一致していて、可変意味素性が一致してい
ない状態を正しく把握することによって、可変意味素性
が一致していないが意味的に近い定型文を確実に表示す
る。
素がほとんど一致していて、可変意味素性が一致してい
ない状態を正しく把握することによって、可変意味素性
が一致していないが意味的に近い定型文を確実に表示す
る。
【0010】また、旅行の場面において、地名、人名な
どの固有名詞が話題にのぼる頻度は非常に高い。また、
外国の地名、人名などは日本語でカタカナ表示されるこ
とが多い。しかし、カタカナ文字列の一部をある意味素
性と誤解して、意味のかけ離れた定型文を表示すること
がある。
どの固有名詞が話題にのぼる頻度は非常に高い。また、
外国の地名、人名などは日本語でカタカナ表示されるこ
とが多い。しかし、カタカナ文字列の一部をある意味素
性と誤解して、意味のかけ離れた定型文を表示すること
がある。
【0011】例として、「サンフランシスコまで幾らで
すか」という入力があったとする。ここで「サンフラン
シスコ」という意味素性は存在せず、その一部の「フラ
ン」のみを「貨幣単位」なる可変意味素性として抽出し
たとする。すると、「フランで幾らですか」などの意味
的にかけ離れた定型文との一致度が高くなり、この文を
表示してしまう。
すか」という入力があったとする。ここで「サンフラン
シスコ」という意味素性は存在せず、その一部の「フラ
ン」のみを「貨幣単位」なる可変意味素性として抽出し
たとする。すると、「フランで幾らですか」などの意味
的にかけ離れた定型文との一致度が高くなり、この文を
表示してしまう。
【0012】本発明は、カタカナなどのように文の他の
部分と字種が異なる部分列でかつ意味素性として登録さ
れていない文字列を一つの未知語とみなすことによっ
て、意味のかけ離れた文を表示することを抑制し、確実
に意味の近い文を表示するものである。
部分と字種が異なる部分列でかつ意味素性として登録さ
れていない文字列を一つの未知語とみなすことによっ
て、意味のかけ離れた文を表示することを抑制し、確実
に意味の近い文を表示するものである。
【0013】同じように、カタカナで示される地名など
の固有名詞を含んだ文の入力があり、その固有名詞を除
いた他の部分はすべて一致している定型文が存在するに
もかかわらず、その部分が一致しないがために全体の一
致度が低くなり、意味は非常に近いのに表示されない。
また、定型文において固有名詞に相当する部分は、多く
の場合可変意味素性である。
の固有名詞を含んだ文の入力があり、その固有名詞を除
いた他の部分はすべて一致している定型文が存在するに
もかかわらず、その部分が一致しないがために全体の一
致度が低くなり、意味は非常に近いのに表示されない。
また、定型文において固有名詞に相当する部分は、多く
の場合可変意味素性である。
【0014】例として、「サンフランシスコまで幾らで
すか」という入力があったとする。これに対して「ニュ
ーヨークまで幾らですか」という定型文が存在するが、
「ニューヨーク」が「地名」可変意味素性であり、それ
には「サンフランシスコ」なる要素は含まれないとす
る。これらは明らかに同様の文意を持つが、一致度を計
算すると閾値より低くなり、従来の方式では表示されな
い。
すか」という入力があったとする。これに対して「ニュ
ーヨークまで幾らですか」という定型文が存在するが、
「ニューヨーク」が「地名」可変意味素性であり、それ
には「サンフランシスコ」なる要素は含まれないとす
る。これらは明らかに同様の文意を持つが、一致度を計
算すると閾値より低くなり、従来の方式では表示されな
い。
【0015】本発明では、カタカナなどのように文の他
の部分と字種が異なる部分文字列でかつ意味素性として
登録されていない文字列を、任意の可変意味素性、もし
くは特定の可変意味素性とみなすことによって、可変意
味素性の要素として登録されていない固有名詞などの入
力の場合にでも、確実に意味の近い文を表示する。
の部分と字種が異なる部分文字列でかつ意味素性として
登録されていない文字列を、任意の可変意味素性、もし
くは特定の可変意味素性とみなすことによって、可変意
味素性の要素として登録されていない固有名詞などの入
力の場合にでも、確実に意味の近い文を表示する。
【0016】また、第一言語において人名などの固有名
詞が入力された場合など、それが可変意味素性の要素と
して登録してあることはまれであり、入力された文その
ままの訳文を得ることはほとんど不可能である。
詞が入力された場合など、それが可変意味素性の要素と
して登録してあることはまれであり、入力された文その
ままの訳文を得ることはほとんど不可能である。
【0017】例として、「私の名前はキムラです」とい
う入力があったとする。これに対して「私の名前は鈴木
です」という定形文が存在するが、「鈴木」が「人名」
可変意味素性であり、それには「キムラ」なる要素が含
まれていない場合、この文が翻訳結果として表示されて
も、使用者が「鈴木」に相当する部分を「キムラ」に置
き換える必要があり不便である。
う入力があったとする。これに対して「私の名前は鈴木
です」という定形文が存在するが、「鈴木」が「人名」
可変意味素性であり、それには「キムラ」なる要素が含
まれていない場合、この文が翻訳結果として表示されて
も、使用者が「鈴木」に相当する部分を「キムラ」に置
き換える必要があり不便である。
【0018】よって、本発明では、カタカナなどのよう
に文の他の部分と字種が異なる部分列でかつ意味素性と
して登録されていない文字列を、ローマ字などのように
第二言語で使用される辞書に変換して訳語として表示す
ることによって、第一言語の固有名詞も第二言語に即し
た形で翻訳する。
に文の他の部分と字種が異なる部分列でかつ意味素性と
して登録されていない文字列を、ローマ字などのように
第二言語で使用される辞書に変換して訳語として表示す
ることによって、第一言語の固有名詞も第二言語に即し
た形で翻訳する。
【0019】さらに、翻訳結果が表示される際、可変意
味素性が一致しておらず入力していない単語が挿入され
ている場合に、表示されている文と入力文が意味的に近
いのかどうか分かりにくい場合がある。
味素性が一致しておらず入力していない単語が挿入され
ている場合に、表示されている文と入力文が意味的に近
いのかどうか分かりにくい場合がある。
【0020】例として、「サンフランシスコまでバスで
幾らですか」と入力し、「ニューヨークまでバスで幾ら
ですか」という定型文が検索されたとする。この定型文
が翻訳(検索)結果として表示された際、入力文と定型文
は、文頭の「ニューヨーク」と「サンフランシスコ」
で、文字面が大きく異なっており、文意は非常に近いに
もかかわらず、それがぱっと見た目では分かりにくい。
意味の近い文は検索されなかった、と誤解してしまう可
能性がある。
幾らですか」と入力し、「ニューヨークまでバスで幾ら
ですか」という定型文が検索されたとする。この定型文
が翻訳(検索)結果として表示された際、入力文と定型文
は、文頭の「ニューヨーク」と「サンフランシスコ」
で、文字面が大きく異なっており、文意は非常に近いに
もかかわらず、それがぱっと見た目では分かりにくい。
意味の近い文は検索されなかった、と誤解してしまう可
能性がある。
【0021】そこで、本発明においては、定型文中の可
変意味素性が入力文と一致しなかった場合に、その可変
意味素性の要素ではないある特定の文字または文字列を
挿入して表示することによって、可変意味素性が一致し
なかったことを明示し、文の他の構成要素の一致の如何
を分かりやすくする。
変意味素性が入力文と一致しなかった場合に、その可変
意味素性の要素ではないある特定の文字または文字列を
挿入して表示することによって、可変意味素性が一致し
なかったことを明示し、文の他の構成要素の一致の如何
を分かりやすくする。
【0022】また、例えば日本語から英語に訳す場合の
Mr./Ms.等の敬称等、第二言語では必ず表現されるが、
第一言語では必ずしも表現されない言語表現の入力があ
った場合、第二言語として躍出する場合どの単語を用い
ればよいかの情報が第一言語中にないために、適切な第
二言語の文を生成できない。
Mr./Ms.等の敬称等、第二言語では必ず表現されるが、
第一言語では必ずしも表現されない言語表現の入力があ
った場合、第二言語として躍出する場合どの単語を用い
ればよいかの情報が第一言語中にないために、適切な第
二言語の文を生成できない。
【0023】例として、「鈴木さんを呼び出してもらえ
ますか」という入力があったとする。これを英訳する場
合には、「Mr. Suzuki」なのか「Ms. Suzuki」なのかを
明示する必要がある。しかし入力にはそれを判断するた
めの情報が存在しない。
ますか」という入力があったとする。これを英訳する場
合には、「Mr. Suzuki」なのか「Ms. Suzuki」なのかを
明示する必要がある。しかし入力にはそれを判断するた
めの情報が存在しない。
【0024】そこで、本発明においては、第二言語で必
須の表現を第一言語中にも可変意味素性として存在さ
せ、翻訳結果が表示された後に使用者に正しい要素を選
択させることによって、常に第二言語の文化に沿った表
現を生成する。
須の表現を第一言語中にも可変意味素性として存在さ
せ、翻訳結果が表示された後に使用者に正しい要素を選
択させることによって、常に第二言語の文化に沿った表
現を生成する。
【0025】
<請求項1の手段> 第一言語の会話の用例文と、その
翻訳文である第二言語の文とを対にして登録している対
訳データベースと、意味素性とその意味素性として抽出
する表記を定義して記憶した意味素性辞書と、同一の意
味素性であり、置換可能な単語を登録している可変意味
素性辞書と、前記対訳データベースを検索するための入
力文を入力する入力手段と、前記入力手段から入力され
た入力文に基づいて、前記対訳データベース、前記意味
素性辞書及び前記可変意味素性辞書を検索する検索手段
と、前記検索手段により前記対訳データベース及び前記
意味素性辞書から検索された例文に対し、前記可変意味
素性辞書に基づいて置換を行う置換手段と、前記検索手
段及び置換手段によって抽出された例文と、前記入力手
段から入力された入力文との一致度を算出する解析手段
と、記解析手段に基づいて、例文の翻訳文を出力する出
力手段を備えた装置であって、前記解析手段において、
前記検索された翻訳文中に可変意味素性が存在し、前記
入力手段の入力において該可変意味素性に対応する素性
が存在せず、さらに一致しない意味素性が唯一である場
合は、該可変意味素性を一致したものとして一致度を求
めることによって、上記課題を解決する。
翻訳文である第二言語の文とを対にして登録している対
訳データベースと、意味素性とその意味素性として抽出
する表記を定義して記憶した意味素性辞書と、同一の意
味素性であり、置換可能な単語を登録している可変意味
素性辞書と、前記対訳データベースを検索するための入
力文を入力する入力手段と、前記入力手段から入力され
た入力文に基づいて、前記対訳データベース、前記意味
素性辞書及び前記可変意味素性辞書を検索する検索手段
と、前記検索手段により前記対訳データベース及び前記
意味素性辞書から検索された例文に対し、前記可変意味
素性辞書に基づいて置換を行う置換手段と、前記検索手
段及び置換手段によって抽出された例文と、前記入力手
段から入力された入力文との一致度を算出する解析手段
と、記解析手段に基づいて、例文の翻訳文を出力する出
力手段を備えた装置であって、前記解析手段において、
前記検索された翻訳文中に可変意味素性が存在し、前記
入力手段の入力において該可変意味素性に対応する素性
が存在せず、さらに一致しない意味素性が唯一である場
合は、該可変意味素性を一致したものとして一致度を求
めることによって、上記課題を解決する。
【0026】<請求項2の手段> 前記解析手段におい
て、前記入力文において、他の部分と字種が異なる部分
文字列であり、意味素性として前記意味素性辞書及び可
変意味素性辞書に登録されていない文字列を未知語とし
て認識し、一致度を求めることにより上記課題を解決す
る。
て、前記入力文において、他の部分と字種が異なる部分
文字列であり、意味素性として前記意味素性辞書及び可
変意味素性辞書に登録されていない文字列を未知語とし
て認識し、一致度を求めることにより上記課題を解決す
る。
【0027】<請求項3の手段> 前記解析手段におい
て、前記入力文中の、他の部分と字種が異なる部分文字
列であり、意味素性として前記意味素性辞書及び可変意
味素性辞書に登録されていない文字列を、特定の可変意
味素性として認識し、一致度を求めることにより上記課
題を解決する。
て、前記入力文中の、他の部分と字種が異なる部分文字
列であり、意味素性として前記意味素性辞書及び可変意
味素性辞書に登録されていない文字列を、特定の可変意
味素性として認識し、一致度を求めることにより上記課
題を解決する。
【0028】<請求項4の手段> 前記置換手段におい
て、前記入力文中の、他の部分と字種が異なる部分文字
列であり、意味素性として前記意味素性辞書及び可変意
味素性辞書に登録されていない文字列を、特定の字種に
変換することにより上記課題を解決する。
て、前記入力文中の、他の部分と字種が異なる部分文字
列であり、意味素性として前記意味素性辞書及び可変意
味素性辞書に登録されていない文字列を、特定の字種に
変換することにより上記課題を解決する。
【0029】<請求項5の手段> 前記置換手段におい
て、前記検索された翻訳文中の可変意味素性に相当する
文字列が、前記入力文に存在しない場合に、可変意味素
性内に特定の文字列を挿入して表示することにより上記
課題を解決する。
て、前記検索された翻訳文中の可変意味素性に相当する
文字列が、前記入力文に存在しない場合に、可変意味素
性内に特定の文字列を挿入して表示することにより上記
課題を解決する。
【0030】<請求項6の手段> 前記置換手段におい
て、第二言語では必ず表現されるが、第一言語では必ず
しも表現されない言語表現に対して、第二言語における
表現を可変意味素性とし、翻訳結果に対して付与して表
示することにより上記課題を解決する。
て、第二言語では必ず表現されるが、第一言語では必ず
しも表現されない言語表現に対して、第二言語における
表現を可変意味素性とし、翻訳結果に対して付与して表
示することにより上記課題を解決する。
【0031】
【発明の実施の形態】以下に、図面を用いて本願発明を
詳細に説明する。以下の例では第一言語として日本語
を、第二言語として英語を用いる。特にこれらの言語に
限定されるのではないことは明らかである。図2は本発
明の一実施形態における機械翻訳装置の外観を表したも
のである。日本語と英語の文例を対にして多数格納して
おり、これらを液晶ディスプレイ2に表示できるように
なっている。また、この装置は入力インタフェースとし
て専用ペン15による手書き文字認識を用いている。デ
ィスプレイはCRTなど液晶以外のものを用いるのも可
能であるし、入力手段は音声やキーボード入力などの他
の手段も可能である。
詳細に説明する。以下の例では第一言語として日本語
を、第二言語として英語を用いる。特にこれらの言語に
限定されるのではないことは明らかである。図2は本発
明の一実施形態における機械翻訳装置の外観を表したも
のである。日本語と英語の文例を対にして多数格納して
おり、これらを液晶ディスプレイ2に表示できるように
なっている。また、この装置は入力インタフェースとし
て専用ペン15による手書き文字認識を用いている。デ
ィスプレイはCRTなど液晶以外のものを用いるのも可
能であるし、入力手段は音声やキーボード入力などの他
の手段も可能である。
【0032】図1はこのような機械翻訳装置の回路構成
の概要を表したものである。機械翻訳装置は各種制御の
中枢的な機能を果たすためのCPU(中央処理装置)1
を配置している。CPU1はデータバス等のバス18を
通じてROM6、作業用メモリ5、表示用ドライバ3、
入力認識部4のそれぞれと接続されている。
の概要を表したものである。機械翻訳装置は各種制御の
中枢的な機能を果たすためのCPU(中央処理装置)1
を配置している。CPU1はデータバス等のバス18を
通じてROM6、作業用メモリ5、表示用ドライバ3、
入力認識部4のそれぞれと接続されている。
【0033】ROM6はこの機械翻訳装置の各種制御を
行うためのプログラムや、多数のフレーズ等を格納した
大容量のリードオンリメモリである。作業用メモリ5は
プログラムの実行に際して必要とされるデータを一時的
に格納するためのランダムアクセスメモリである。表示
用ドライバ3は液晶ディスプレイ2に対訳文などを表示
する際のドライバである。入力認識部4は、図2の手書
き入力ボード14からの専用ペン15による入力データ
を認識する。
行うためのプログラムや、多数のフレーズ等を格納した
大容量のリードオンリメモリである。作業用メモリ5は
プログラムの実行に際して必要とされるデータを一時的
に格納するためのランダムアクセスメモリである。表示
用ドライバ3は液晶ディスプレイ2に対訳文などを表示
する際のドライバである。入力認識部4は、図2の手書
き入力ボード14からの専用ペン15による入力データ
を認識する。
【0034】また、ROM6内には、対訳データベース
7、意味素性辞書8、可変意味素性辞書9が格納されて
いる。対訳データベース7は例えば番地0〜5000
0、意味素性辞書8は番地50001〜70000、可
変意味素性辞書9は番地70001〜100000とい
うように格納されている。
7、意味素性辞書8、可変意味素性辞書9が格納されて
いる。対訳データベース7は例えば番地0〜5000
0、意味素性辞書8は番地50001〜70000、可
変意味素性辞書9は番地70001〜100000とい
うように格納されている。
【0035】CPU1は動作の性質から解析部10、検
索部11、置換部12、制御部13に分けられる。解析
部10は入力認識部によって認識された入力データを解
析する。検索部11はROM6に格納されている対訳デ
ータベース7、意味素性辞書8、可変意味素性辞書9を
検索する。置換部12は可変意味素性要素を置換する。
制御部13は画面表示の制御など、上記以外の制御を行
う。
索部11、置換部12、制御部13に分けられる。解析
部10は入力認識部によって認識された入力データを解
析する。検索部11はROM6に格納されている対訳デ
ータベース7、意味素性辞書8、可変意味素性辞書9を
検索する。置換部12は可変意味素性要素を置換する。
制御部13は画面表示の制御など、上記以外の制御を行
う。
【0036】以下、対訳データベース7、意味素性辞書
8、可変意味素性辞書9のデータ構造の一実施形態を説
明する。これらは以下の説明において、一部を除いて共
通である。
8、可変意味素性辞書9のデータ構造の一実施形態を説
明する。これらは以下の説明において、一部を除いて共
通である。
【0037】対訳データベース7には、海外旅行の際に
翻訳して現地の人に伝えたい有用な文例が次のような形
で多数定義されている。
翻訳して現地の人に伝えたい有用な文例が次のような形
で多数定義されている。
【0038】 文例1 {ニューヨーク}まで幾らですか。 How much is it to {New York}? {地名} まで 幾ら ですか 文例2 {ニューヨーク}から{シカゴ}まで幾らですか。 How much is it from {New York}$1$ to {Chicago}$2$ ? {地名} から {地名} まで 幾ら ですか ここで、文例の一行目は表示される日本文、二行目はそ
の訳文であり、翻訳結果として日本文と一緒に表示され
る英文、三行目はこの対訳文に対応づけられている意味
素性の集合である。これを意味素性列と呼ぶ。ま
た、{}で囲まれた部分は可変意味素性である。
の訳文であり、翻訳結果として日本文と一緒に表示され
る英文、三行目はこの対訳文に対応づけられている意味
素性の集合である。これを意味素性列と呼ぶ。ま
た、{}で囲まれた部分は可変意味素性である。
【0039】意味素性とは、文例を検索する際のキーワ
ードとなる文字列であり、各日本文の一文節にひとつず
つ割当てられることが多い。文例1の「ニューヨークま
で幾らですか」においては、「ニューヨーク」「まで」
「幾ら」「ですか」がこの文の意味素性となっている。
正確にはこれらは意味素性の名称であり、どういう文字
列をこれらの意味素性として定義するかは意味素性辞書
8に記述してある。
ードとなる文字列であり、各日本文の一文節にひとつず
つ割当てられることが多い。文例1の「ニューヨークま
で幾らですか」においては、「ニューヨーク」「まで」
「幾ら」「ですか」がこの文の意味素性となっている。
正確にはこれらは意味素性の名称であり、どういう文字
列をこれらの意味素性として定義するかは意味素性辞書
8に記述してある。
【0040】また、文例1の「ニューヨーク」は可変意
味素性である。文例1のこの箇所には「ロンドン」「オ
ックスフォード」など色々な地名が入り得ると、翻訳で
きる文章が倍増して非常に有効である。そこでこの箇所
に入りうる日本語文字列とその訳語を可変意味素性辞書
9に定義し、その集合を「地名」というひとつの可変意
味素性として扱う。
味素性である。文例1のこの箇所には「ロンドン」「オ
ックスフォード」など色々な地名が入り得ると、翻訳で
きる文章が倍増して非常に有効である。そこでこの箇所
に入りうる日本語文字列とその訳語を可変意味素性辞書
9に定義し、その集合を「地名」というひとつの可変意
味素性として扱う。
【0041】対訳データベース7においては、意味素性
列部に{}で囲って可変意味素性の名称を記述し、その
一要素を一行目の日本文中の{}内に書く。また、二行
目の英文中の{}内にその訳語を書く。日本文、英文の
{}内は可変意味素性辞書9に対訳として定義されてい
る。また、これらはこの文例における当該可変意味素性
の代表値の役割をする。つまり、入力に当該可変意味素
性にあたる文字列がなければ、この要素を表示する。
列部に{}で囲って可変意味素性の名称を記述し、その
一要素を一行目の日本文中の{}内に書く。また、二行
目の英文中の{}内にその訳語を書く。日本文、英文の
{}内は可変意味素性辞書9に対訳として定義されてい
る。また、これらはこの文例における当該可変意味素性
の代表値の役割をする。つまり、入力に当該可変意味素
性にあたる文字列がなければ、この要素を表示する。
【0042】例えば、文例1は「地名」という名称の可
変意味素性をひとつ持ち、この文における当該可変意味
素性の代表値は「ニューヨーク」であり、その訳語は
「NewYork」である。
変意味素性をひとつ持ち、この文における当該可変意味
素性の代表値は「ニューヨーク」であり、その訳語は
「NewYork」である。
【0043】一文中に複数個可変意味素性がある場合、
日本文中での可変意味素性の出現順と意味素性列の可変
意味素性の出現順が一致している。同様に文例2は「地
名」という名称の可変意味素性をふたつ持ち、この文に
おけるひとつめの「地名」可変意味素性の代表値は「ニ
ューヨーク」であり、その訳語は「New York」である。
ふたつめの「地名」可変意味素性の代表値は「シカゴ」
であり、その訳語は「Chicago」である。
日本文中での可変意味素性の出現順と意味素性列の可変
意味素性の出現順が一致している。同様に文例2は「地
名」という名称の可変意味素性をふたつ持ち、この文に
おけるひとつめの「地名」可変意味素性の代表値は「ニ
ューヨーク」であり、その訳語は「New York」である。
ふたつめの「地名」可変意味素性の代表値は「シカゴ」
であり、その訳語は「Chicago」である。
【0044】また、文例2の{}記号の後ろの$1$、$2$
は、それぞれ当該「地名」可変意味属性が日本文におけ
るひとつめ、ふたつめの可変意味素性に対応しているこ
とを示している。
は、それぞれ当該「地名」可変意味属性が日本文におけ
るひとつめ、ふたつめの可変意味素性に対応しているこ
とを示している。
【0045】つまり、「ニューヨーク」が入っているひ
とつめの「地名」可変意味素性は{New York}$1$に、
「シカゴ」が入っているふたつめの「地名」可変意味素
性は{Chicago}$2$に対応している。
とつめの「地名」可変意味素性は{New York}$1$に、
「シカゴ」が入っているふたつめの「地名」可変意味素
性は{Chicago}$2$に対応している。
【0046】また、可変でない意味素性を可変意味素性
から区別するときは、不変意味素性という。
から区別するときは、不変意味素性という。
【0047】意味素性辞書8内には、意味素性の名称
と、その意味素性として抽出する日本語文字列が定義さ
れている。例えば「から」「まで」「幾ら」「ですか」
という意味素性は意味素性辞書8内に次のように定義さ
れている。
と、その意味素性として抽出する日本語文字列が定義さ
れている。例えば「から」「まで」「幾ら」「ですか」
という意味素性は意味素性辞書8内に次のように定義さ
れている。
【0048】[意味素性辞書8] から から まで まで 幾ら 幾ら いくら ですか ですか なのですか これは、右側の日本語文字列を、左側の名称の意味素性
として定義している、という意味である。例えば、「い
くら」という文字列は「幾ら」という名称の意味素性と
して定義されている。
として定義している、という意味である。例えば、「い
くら」という文字列は「幾ら」という名称の意味素性と
して定義されている。
【0049】可変意味素性辞書9内には、可変意味素性
の名称と、それに含まれる要素としての日本語文字列、
それらに対応する英語訳語が定義されている。例えば
「地名」という可変意味素性の要素とその訳語の集合は
可変意味素性辞書9内に次のように定義されている。
の名称と、それに含まれる要素としての日本語文字列、
それらに対応する英語訳語が定義されている。例えば
「地名」という可変意味素性の要素とその訳語の集合は
可変意味素性辞書9内に次のように定義されている。
【0050】[可変意味素性辞書9] 地名 ニューヨーク New York シカゴ Chicago ロンドン London オックスフォード Oxford これは、左側の日本語文字列(「ニューヨーク」など)
を、「地名」という可変意味素性の要素として定義し、
その訳語を当該文字列の右側の英語文字列(「New Yor
k」など)と定義する、という意味である。
を、「地名」という可変意味素性の要素として定義し、
その訳語を当該文字列の右側の英語文字列(「New Yor
k」など)と定義する、という意味である。
【0051】以下、この機械翻訳装置の動作を説明す
る。以下は請求項に共通の処理の説明である。この機械
翻訳装置の基本動作は、ユーザが被翻訳文を入力し、そ
の文から意味素性を検出し、その意味素性から定型文を
検出し、その定型文中の可変意味素性を置換し表示す
る、というものである。
る。以下は請求項に共通の処理の説明である。この機械
翻訳装置の基本動作は、ユーザが被翻訳文を入力し、そ
の文から意味素性を検出し、その意味素性から定型文を
検出し、その定型文中の可変意味素性を置換し表示す
る、というものである。
【0052】以下、ユーザが入力した被翻訳文を入力
文、機械翻訳装置が格納している日本文を定型文とい
う。定型文とその翻訳文の英語文の対を言う際は対訳文
という。
文、機械翻訳装置が格納している日本文を定型文とい
う。定型文とその翻訳文の英語文の対を言う際は対訳文
という。
【0053】この機械翻訳装置の動作を図3のフローチ
ャートに沿って説明する。説明は図3のフローチャート
の各ステップについて詳細を示す形で行う。「ロンドン
までいくらですか」という文を翻訳する過程を例にとる
(以下、この文を入力文1と呼ぶ)。
ャートに沿って説明する。説明は図3のフローチャート
の各ステップについて詳細を示す形で行う。「ロンドン
までいくらですか」という文を翻訳する過程を例にとる
(以下、この文を入力文1と呼ぶ)。
【0054】<ステップA1>CPU1の制御部13
が、表示用ドライバ3を通じて液晶ディスプレイ14に
図4の「被翻訳文入力画面」を表示する。
が、表示用ドライバ3を通じて液晶ディスプレイ14に
図4の「被翻訳文入力画面」を表示する。
【0055】<ステップA2>ユーザが図4の被翻訳文
入力画面において、手書き入力ボード16に専用ペン1
5によって「ロンドンまでいくらですか」と手書きで入
力する。図5は入力途中の図、図6は入力が終了した状
態である。
入力画面において、手書き入力ボード16に専用ペン1
5によって「ロンドンまでいくらですか」と手書きで入
力する。図5は入力途中の図、図6は入力が終了した状
態である。
【0056】<ステップA3>ユーザが図6の通訳アイ
コン17を押す。この入力文は入力認識部4によって認
識され、作業用メモリ5に格納される。その後、ステッ
プA4に移る。
コン17を押す。この入力文は入力認識部4によって認
識され、作業用メモリ5に格納される。その後、ステッ
プA4に移る。
【0057】<ステップA4>CPU1の解析部10
が、ステップA3で作業用メモリ5に格納した入力文1
から、部分文字列を作成し、作業用メモリ5に格納す
る。次に、ステップA5に移る。入力文1の部分文字列
には以下のようなものがある。
が、ステップA3で作業用メモリ5に格納した入力文1
から、部分文字列を作成し、作業用メモリ5に格納す
る。次に、ステップA5に移る。入力文1の部分文字列
には以下のようなものがある。
【0058】 これらを作業用メモリ5に格納しておく。
【0059】<ステップA5>CPU1の検索部11
が、ステップA4において作業用メモリ5に格納した入
力文1の部分文字列をキーに、ROM6に格納されてい
る意味素性辞書8と可変意味素性辞書9内を検索する。
部分文字列のうち意味素性辞書8に意味素性として定義
されている文字列があれば、CPU1の検索部11はそ
の文字列と意味素性の名称を対で作業用メモリ5に格納
し、ステップA6に移る。なければステップA16に移
る。
が、ステップA4において作業用メモリ5に格納した入
力文1の部分文字列をキーに、ROM6に格納されてい
る意味素性辞書8と可変意味素性辞書9内を検索する。
部分文字列のうち意味素性辞書8に意味素性として定義
されている文字列があれば、CPU1の検索部11はそ
の文字列と意味素性の名称を対で作業用メモリ5に格納
し、ステップA6に移る。なければステップA16に移
る。
【0060】また、この時、部分文字列を前から順番に
検索し、その順序を保存しておくことによって、各意味
素性の入力文での出現順も保存しておく。
検索し、その順序を保存しておくことによって、各意味
素性の入力文での出現順も保存しておく。
【0061】以下、入力文1の部分文字列「いくら」を
キーとして意味素性辞書8、可変意味属性辞書9を検索
する過程を説明する。
キーとして意味素性辞書8、可変意味属性辞書9を検索
する過程を説明する。
【0062】CPU1の検索部11が、ROM6に格納
されている意味素性辞書8内を50001番地から順に
一行ずつ読み込み作業用メモリ5に格納する。意味素性
辞書8の各行には左側に各意味素性の名称が、右側にそ
の意味素性として定義される文字列が記述してある。意
味素性辞書8に以下のような行があるとする。
されている意味素性辞書8内を50001番地から順に
一行ずつ読み込み作業用メモリ5に格納する。意味素性
辞書8の各行には左側に各意味素性の名称が、右側にそ
の意味素性として定義される文字列が記述してある。意
味素性辞書8に以下のような行があるとする。
【0063】[意味素性辞書8] 幾ら 幾ら いくら いま、文字列「いくら」が意味素性辞書8内に定義され
ているので、CPU1の検索部11はその左側にある意
味素性の名称「幾ら」と、入力文の部分文字列「いく
ら」を対で作業用メモリ5に格納しなおす。
ているので、CPU1の検索部11はその左側にある意
味素性の名称「幾ら」と、入力文の部分文字列「いく
ら」を対で作業用メモリ5に格納しなおす。
【0064】意味素性辞書8内には、他の箇所に「いく
ら」という文字列は定義されていないので、意味素性辞
書8の検索を終了する。
ら」という文字列は定義されていないので、意味素性辞
書8の検索を終了する。
【0065】次にCPU1の検索部11は「いくら」を
キーに可変意味素性辞書9内を検索する。いま可変意味
素性辞書9内に「いくら」という文字列は現れないの
で、「いくら」をキーにした検索は終了し、次の部分文
字列をキーに設定する。
キーに可変意味素性辞書9内を検索する。いま可変意味
素性辞書9内に「いくら」という文字列は現れないの
で、「いくら」をキーにした検索は終了し、次の部分文
字列をキーに設定する。
【0066】以下、「ロンドン」をキーとして意味素性
辞書8、可変意味素性辞書9を検索する過程を説明す
る。いま文字列「ロンドン」が作業用メモリ5に格納さ
れているとする。
辞書8、可変意味素性辞書9を検索する過程を説明す
る。いま文字列「ロンドン」が作業用メモリ5に格納さ
れているとする。
【0067】CPU1の検索部11が、ROM6に格納
されている意味素性辞書8内に「ロンドン」という文字
列が定義されているかどうか調べる。いま、意味素性辞
書8内には「ロンドン」という文字列は現れないので、
次に可変意味素性辞書9を検索する。可変意味素性辞書
9には以下のような記述があるとする。
されている意味素性辞書8内に「ロンドン」という文字
列が定義されているかどうか調べる。いま、意味素性辞
書8内には「ロンドン」という文字列は現れないので、
次に可変意味素性辞書9を検索する。可変意味素性辞書
9には以下のような記述があるとする。
【0068】[可変意味素性辞書9] 地名 ニューヨーク New York シカゴ Chicago ロンドン London オックスフォード Oxford 文字列「ロンドン」が可変意味素性辞書9内に定義され
ているので、CPU1の検索部11はそれが含まれる可
変意味素性の名称「地名」と、当該要素の訳語「Londo
n」を作業用メモリ5に格納する。
ているので、CPU1の検索部11はそれが含まれる可
変意味素性の名称「地名」と、当該要素の訳語「Londo
n」を作業用メモリ5に格納する。
【0069】可変意味素性辞書9内には、他の箇所に
「ロンドン」という文字列は定義されていないので、可
変意味素性辞書9の検索を終了する。
「ロンドン」という文字列は定義されていないので、可
変意味素性辞書9の検索を終了する。
【0070】以上の作業を入力文1のすべての部分文字
列について行う。入力文1から以下の可変/不変意味素
性が検出されたとする。
列について行う。入力文1から以下の可変/不変意味素
性が検出されたとする。
【0071】[部分文字列と対応する意味素性] 「ロンドン」=「地名」: 可変意味素性 「まで」=「まで」 : 不変意味素性 「いくら」=「幾ら」 : 不変意味素性 「ですか」=「ですか」: 不変意味素性 ここで、=の右辺は意味素性の名称であり、それぞれ左
辺の文字列は右辺の名称の可変/不変意味素性として検
出されたことを意味する。また、可変意味素性要素「ロ
ンドン」の訳語「London」も格納しておく。
辺の文字列は右辺の名称の可変/不変意味素性として検
出されたことを意味する。また、可変意味素性要素「ロ
ンドン」の訳語「London」も格納しておく。
【0072】[可変意味素性要素] 「ロンドン」=「London」 ここで、=の右辺は可変意味素性の当該要素の訳語であ
り、右辺の語句がそれぞれ左辺の語句の訳語として検出
されたことを意味する。また、入力文から検出された各
意味素性は、上の対応表の上から下の順番で検出された
ものとする。この順序は作業用メモリ5内で保存されて
いる。以上で例によるステップA5の説明を終わる。こ
の例では意味素性が検索されたので、次にステップA6
に移る。
り、右辺の語句がそれぞれ左辺の語句の訳語として検出
されたことを意味する。また、入力文から検出された各
意味素性は、上の対応表の上から下の順番で検出された
ものとする。この順序は作業用メモリ5内で保存されて
いる。以上で例によるステップA5の説明を終わる。こ
の例では意味素性が検索されたので、次にステップA6
に移る。
【0073】<ステップA6>CPU1の検索部11
が、ステップA5において作業用メモリ5に格納した可
変/不変意味素性の名称をキーに、ROM6に格納され
ている対訳データベース7内を検索する。可変/不変意
味素性の名称のうち、対訳データベース7に現れるもの
があれば、その意味素性が現れている定型文を、その翻
訳文の英文、意味素性列と共に作業用メモリ5に格納
し、ステップA7に移る。なければステップA16に移
る。
が、ステップA5において作業用メモリ5に格納した可
変/不変意味素性の名称をキーに、ROM6に格納され
ている対訳データベース7内を検索する。可変/不変意
味素性の名称のうち、対訳データベース7に現れるもの
があれば、その意味素性が現れている定型文を、その翻
訳文の英文、意味素性列と共に作業用メモリ5に格納
し、ステップA7に移る。なければステップA16に移
る。
【0074】入力文1を例にとって、ステップA6の詳
細を説明する。まずCPU1はステップA5で作業用メ
モリ5に格納した意味素性の集合のうちのひとつをキー
に、対訳データベース7を検索する。まず、意味素性
「地名」をキーに対訳データベース7を検索する。い
ま、対訳データベース7には以下のような記述があると
する。
細を説明する。まずCPU1はステップA5で作業用メ
モリ5に格納した意味素性の集合のうちのひとつをキー
に、対訳データベース7を検索する。まず、意味素性
「地名」をキーに対訳データベース7を検索する。い
ま、対訳データベース7には以下のような記述があると
する。
【0075】[対訳データベース7] 文例1には意味素性列の中に「地名」意味素性が含まれ
ている。よって、CPU1の検索部11は文例1を作業
用メモリ5に格納する。対訳データベース7において、
他の箇所に「地名」意味素性は含まれない。よって「地
名」をキーとした検索を終了する。
ている。よって、CPU1の検索部11は文例1を作業
用メモリ5に格納する。対訳データベース7において、
他の箇所に「地名」意味素性は含まれない。よって「地
名」をキーとした検索を終了する。
【0076】CPU1の検索部11は、以上の作業を作
業用メモリ5に格納されているすべての意味属性につい
て行う。いま、すべての意味素性についての検索が終了
した後、次の文例1、3が作業用メモリ5に格納されて
いるとする。
業用メモリ5に格納されているすべての意味属性につい
て行う。いま、すべての意味素性についての検索が終了
した後、次の文例1、3が作業用メモリ5に格納されて
いるとする。
【0077】 文例3は意味素性「幾ら」によって検索された。以上
で、例によるステップA6の説明を終わる。この例では
定型文が検索されたので、次にステップA7に移る。
で、例によるステップA6の説明を終わる。この例では
定型文が検索されたので、次にステップA7に移る。
【0078】<ステップA7>CPU1の解析部10
は、ステップA6において作業用メモリ5に格納した定
型文のうち、先頭に格納されている1文を選択する。選
択した定型文にはフラグを立てておく。ここでは、文例
1を選択し、フラグを立てておく。
は、ステップA6において作業用メモリ5に格納した定
型文のうち、先頭に格納されている1文を選択する。選
択した定型文にはフラグを立てておく。ここでは、文例
1を選択し、フラグを立てておく。
【0079】<ステップA8>CPU1の解析部10
は、ステップA7またはA12において選択した定型文
の入力文との一致度を計算する。ここでは、定型文の各
意味素性のうち入力文中の意味素性と一致しているもの
の個数を用いて計算する。そして、定型文と一致度の対
を作業用メモリ5に格納し、一致度がある閾値以上であ
れば、ステップA9に移り、未満であればステップA1
3に移る。ここでは閾値を200点とする。いま、文例
1が選択されている。
は、ステップA7またはA12において選択した定型文
の入力文との一致度を計算する。ここでは、定型文の各
意味素性のうち入力文中の意味素性と一致しているもの
の個数を用いて計算する。そして、定型文と一致度の対
を作業用メモリ5に格納し、一致度がある閾値以上であ
れば、ステップA9に移り、未満であればステップA1
3に移る。ここでは閾値を200点とする。いま、文例
1が選択されている。
【0080】 文例1の意味素性「地名」「まで」「幾ら」「ですか」
は全て入力文中にある。一致している個数に100を掛
けて、この定型文の入力文との一致度を400点とす
る。よって文例1と一致度400点を作業用メモリ5に
格納する。文例1の一致度400点は閾値200点を超
えているので、ステップA9に移る。
は全て入力文中にある。一致している個数に100を掛
けて、この定型文の入力文との一致度を400点とす
る。よって文例1と一致度400点を作業用メモリ5に
格納する。文例1の一致度400点は閾値200点を超
えているので、ステップA9に移る。
【0081】<ステップA9>CPU1の解析部10
は、ステップA8において作業用メモリ5に格納した定
型文が可変意味素性を持つかどうか判定する。あればス
テップA10に移り、なければステップA11に移る。
は、ステップA8において作業用メモリ5に格納した定
型文が可変意味素性を持つかどうか判定する。あればス
テップA10に移り、なければステップA11に移る。
【0082】文例1は可変意味素性「地名」を持つの
で、ステップA10に移る。
で、ステップA10に移る。
【0083】<ステップA10>CPU1の置換部12
は、作業用メモリ5に格納した定型文の日本文中の可変
意味属性要素を入力文1中の可変意味素性要素に置換す
る。また、英文中の可変意味属性要素を、作業用メモリ
5に格納されている当該要素の訳語に置換する。置換し
た形で対訳文を作業用メモリ5に格納する。その後、ス
テップA11に移る。
は、作業用メモリ5に格納した定型文の日本文中の可変
意味属性要素を入力文1中の可変意味素性要素に置換す
る。また、英文中の可変意味属性要素を、作業用メモリ
5に格納されている当該要素の訳語に置換する。置換し
た形で対訳文を作業用メモリ5に格納する。その後、ス
テップA11に移る。
【0084】いま、文例1の「地名」可変意味素性には
要素「ニューヨーク」が入っている。一方、入力文1か
ら検出された「地名」可変意味素性要素は「ロンドン」
である。同時に、「ロンドン」の訳語「London」も作業
用メモリ5に格納されている。
要素「ニューヨーク」が入っている。一方、入力文1か
ら検出された「地名」可変意味素性要素は「ロンドン」
である。同時に、「ロンドン」の訳語「London」も作業
用メモリ5に格納されている。
【0085】従って、CPU1の置換部12は文例1の
「ニューヨーク」を「ロンドン」と置き換え、「New Yo
rk」を「London」に置き換える。以下のようになる。
「ニューヨーク」を「ロンドン」と置き換え、「New Yo
rk」を「London」に置き換える。以下のようになる。
【0086】 この形で作業用メモリ5に格納し、ステップA11に移
る。
る。
【0087】<ステップA11>CPU1の解析部10
は、作業用メモリ5に、フラグの立っていない定型文が
存在するかどうか調べる。存在すればステップA12
に、存在しなければステップA14に移る。いま、文例
3にはフラグが立っていないので、ステップA12に移
る。
は、作業用メモリ5に、フラグの立っていない定型文が
存在するかどうか調べる。存在すればステップA12
に、存在しなければステップA14に移る。いま、文例
3にはフラグが立っていないので、ステップA12に移
る。
【0088】<ステップA12>CPU1の解析部10
は、作業用メモリ5内のフラグの立っていない定型文を
1文選択し、フラグを立てる。然るのち、ステップA8
に移る。ここでは文例3を選択しフラグを立て、ステッ
プA8に移る。
は、作業用メモリ5内のフラグの立っていない定型文を
1文選択し、フラグを立てる。然るのち、ステップA8
に移る。ここでは文例3を選択しフラグを立て、ステッ
プA8に移る。
【0089】<ステップA8>CPU1の解析部10
は、文例3の一致度を計算する。
は、文例3の一致度を計算する。
【0090】 文例3: 今日の為替レートはいくらですか。 What's the exchange rate today? 今日 為替 レート 幾ら ですか 文例3の意味素性のうち、入力文中にあるのは「幾ら」
「ですか」の2つである。残りの「今日」「為替」「レ
ート」は入力文中には存在しない。また、入力文中の
「地名」「まで」の2つの意味素性は文例3に存在しな
い。よって、一致している個数2に100を掛けたもの
から、一致していない個数5に50を掛けたものを引い
た−50点を、この定型文の入力文との一致度とする。
よって文例3と一致度−50点を作業用メモリ5に格納
する。文例3の一致度−50点は閾値200点より低い
ので、ステップA13に移る。
「ですか」の2つである。残りの「今日」「為替」「レ
ート」は入力文中には存在しない。また、入力文中の
「地名」「まで」の2つの意味素性は文例3に存在しな
い。よって、一致している個数2に100を掛けたもの
から、一致していない個数5に50を掛けたものを引い
た−50点を、この定型文の入力文との一致度とする。
よって文例3と一致度−50点を作業用メモリ5に格納
する。文例3の一致度−50点は閾値200点より低い
ので、ステップA13に移る。
【0091】<ステップA13>CPU1の解析部10
は、ステップA8で作業用メモリ5に格納された、一致
度が閾値未満の定型文を、作業用メモリ5から消去す
る。然るのち、ステップA11に移る。
は、ステップA8で作業用メモリ5に格納された、一致
度が閾値未満の定型文を、作業用メモリ5から消去す
る。然るのち、ステップA11に移る。
【0092】いま、一致度が−50点である文例3を、
作業用メモリ5から消去し、ステップA11に移る。
作業用メモリ5から消去し、ステップA11に移る。
【0093】<ステップA11>CPU1の解析部10
は、作業用メモリ5に、まだフラグの立っていない定型
文が存在しないことを察知し、ステップA14に移る。
は、作業用メモリ5に、まだフラグの立っていない定型
文が存在しないことを察知し、ステップA14に移る。
【0094】<ステップA14>CPU1の制御部13
は、表示用ドライバ3を通じて液晶ディスプレイ14を
図6の自由文通訳入力画面から図7の対訳文表示画面に
切り換える。その後、ステップA15に移る。
は、表示用ドライバ3を通じて液晶ディスプレイ14を
図6の自由文通訳入力画面から図7の対訳文表示画面に
切り換える。その後、ステップA15に移る。
【0095】<ステップA15>CPU1の制御部13
は、作業用メモリ5に格納してある文例の日本文と英文
を、表示用ドライバ3を通じて液晶ディスプレイ14に
図8のように対訳で表示する。この時、可変意味素性に
は下線を引いて表示する。また、表示する際には一致度
の高い定型文から順に表示する。いま、作業用メモリ5
に格納されているのは文例1のみである。この日本文と
英文を図8のように表示する。
は、作業用メモリ5に格納してある文例の日本文と英文
を、表示用ドライバ3を通じて液晶ディスプレイ14に
図8のように対訳で表示する。この時、可変意味素性に
は下線を引いて表示する。また、表示する際には一致度
の高い定型文から順に表示する。いま、作業用メモリ5
に格納されているのは文例1のみである。この日本文と
英文を図8のように表示する。
【0096】以上で、入力文1を例にとった機械翻訳装
置の動作の説明を終える。次に、上で辿らなかった図3
のフローチャート中のステップについて説明する。
置の動作の説明を終える。次に、上で辿らなかった図3
のフローチャート中のステップについて説明する。
【0097】ステップA5あるいはA6において意味素
性あるいは定型文が検索されなかった場合、翻訳不能と
して、その旨表示する。その処理が下のステップA16
である。
性あるいは定型文が検索されなかった場合、翻訳不能と
して、その旨表示する。その処理が下のステップA16
である。
【0098】<ステップA16>CPU1の制御部13
は、表示用ドライバ3を通じて液晶ディスプレイ14を
図6の自由文通訳入力画面から、図9の翻訳不可能画面
に切り換える。以上が、本発明の機械翻訳装置の共通の
動作である。
は、表示用ドライバ3を通じて液晶ディスプレイ14を
図6の自由文通訳入力画面から、図9の翻訳不可能画面
に切り換える。以上が、本発明の機械翻訳装置の共通の
動作である。
【0099】本実施形態では検索された文は対訳で表示
したが、日本文のみ、英文のみ表示してもよい。また、
表示する画面のデザインとしても図面は一例であり、用
途に応じて様々なデザインが考えられる。
したが、日本文のみ、英文のみ表示してもよい。また、
表示する画面のデザインとしても図面は一例であり、用
途に応じて様々なデザインが考えられる。
【0100】また、本実施形態では入力文と定型文の一
致度として、一致している意味素性の数に100を掛け
たものから、一致していない意味素性の数に50を掛け
たものを引いた数字を用いたが、これ以外にも、入力文
中の意味素性の個数で割って100点満点の相対評価に
する、など様々な方法が考えられる。
致度として、一致している意味素性の数に100を掛け
たものから、一致していない意味素性の数に50を掛け
たものを引いた数字を用いたが、これ以外にも、入力文
中の意味素性の個数で割って100点満点の相対評価に
する、など様々な方法が考えられる。
【0101】以下、各請求項について実施形態を説明す
る。各実施形態は上記の基本実施形態と同様に、ある入
力文に対する対訳文を表示する過程を例にとって説明す
る。
る。各実施形態は上記の基本実施形態と同様に、ある入
力文に対する対訳文を表示する過程を例にとって説明す
る。
【0102】以下、請求項1に記載の機械翻訳装置につ
いて実施形態を述べる。請求項1に記載の機械翻訳装置
で入力文を翻訳する過程は、ステップA8を除いて、上
述の基本実施形態と同様である。従って、ここではステ
ップA8の差異のみ詳細に説明する。また、動作フロー
は基本実施形態と同様なので、図3のフローチャートを
もとに説明する。
いて実施形態を述べる。請求項1に記載の機械翻訳装置
で入力文を翻訳する過程は、ステップA8を除いて、上
述の基本実施形態と同様である。従って、ここではステ
ップA8の差異のみ詳細に説明する。また、動作フロー
は基本実施形態と同様なので、図3のフローチャートを
もとに説明する。
【0103】いま、ステップA1〜A2においてユーザ
が「添乗員とはぐれました」と入力し、ステップA3〜
A6において以下の文例が検索されたとする。
が「添乗員とはぐれました」と入力し、ステップA3〜
A6において以下の文例が検索されたとする。
【0104】 ここで、「人称」可変意味素性は「添乗員」という要素
を持たないとする。この時、基本実施形態のステップA
8に基づいて文例4の入力文との一致度を計算すると、
文例4の意味素性、「人称」「はぐれる」「ました」の
うち、「はぐれる」「ました」は入力文中にある。残り
の「人称」可変意味素性は入力文中には存在しない。ま
た、入力文中の「添乗員」なる意味素性は文例4に存在
しない。
を持たないとする。この時、基本実施形態のステップA
8に基づいて文例4の入力文との一致度を計算すると、
文例4の意味素性、「人称」「はぐれる」「ました」の
うち、「はぐれる」「ました」は入力文中にある。残り
の「人称」可変意味素性は入力文中には存在しない。ま
た、入力文中の「添乗員」なる意味素性は文例4に存在
しない。
【0105】よって、一致している個数2に100を掛
けたものから、一致していない個数2に50を掛けたも
のを引いた100点が、この文例4の入力文との一致度
になる。ところが、文例4の一致度100点は、閾値2
00点より低いので、次のステップA13において、消
去されてしまう。
けたものから、一致していない個数2に50を掛けたも
のを引いた100点が、この文例4の入力文との一致度
になる。ところが、文例4の一致度100点は、閾値2
00点より低いので、次のステップA13において、消
去されてしまう。
【0106】本請求項は、このように可変意味素性に相
当する部分のみが異なるだけで、意味的に入力文に似通
っている定型文に対して、上のように単純に不一致とし
て計算するのでなく、特別な処理を行って、確実に表示
できるようにしたものである。
当する部分のみが異なるだけで、意味的に入力文に似通
っている定型文に対して、上のように単純に不一致とし
て計算するのでなく、特別な処理を行って、確実に表示
できるようにしたものである。
【0107】本請求項において、基本実施形態のステッ
プA8に“もし、定型文中に可変意味素性が存在し、入
力文中にそれにあたる要素が存在せず、かつ、入力文中
に、定型文の意味素性と一致しない意味素性が唯一であ
る場合には、定型文中の一致していない可変意味素性
と、入力文中の一致していない意味素性を、一致したも
のとみなして計算する”をいう処理を追加する。
プA8に“もし、定型文中に可変意味素性が存在し、入
力文中にそれにあたる要素が存在せず、かつ、入力文中
に、定型文の意味素性と一致しない意味素性が唯一であ
る場合には、定型文中の一致していない可変意味素性
と、入力文中の一致していない意味素性を、一致したも
のとみなして計算する”をいう処理を追加する。
【0108】いま、文例4には、入力文と一致していな
い可変意味素性「人称」が存在する。また、入力文中に
は、定型文の意味素性と一致しない意味素性が「添乗
員」が唯一存在する。よって、この「人称」と「添乗
員」は一致したものとみなして計算する。
い可変意味素性「人称」が存在する。また、入力文中に
は、定型文の意味素性と一致しない意味素性が「添乗
員」が唯一存在する。よって、この「人称」と「添乗
員」は一致したものとみなして計算する。
【0109】すると、文例4と入力文は、お互いすべて
の意味素性が一致する。一致している個数3に100を
掛けて、文例4の入力文との一致度は300点となる。
文例4と一致度300点を作業用メモリ5に格納する。
文例4の一致度300点は閾値200点を超えているの
で、ステップA9に移る。
の意味素性が一致する。一致している個数3に100を
掛けて、文例4の入力文との一致度は300点となる。
文例4と一致度300点を作業用メモリ5に格納する。
文例4の一致度300点は閾値200点を超えているの
で、ステップA9に移る。
【0110】これ以降は基本実施形態と同様である。ス
テップA9〜A15において、文例4が液晶ディスプレ
イ4に図15のように表示され、一連の翻訳の動作を終
了する。
テップA9〜A15において、文例4が液晶ディスプレ
イ4に図15のように表示され、一連の翻訳の動作を終
了する。
【0111】本実施形態は「添乗員」が意味素性として
登録してある場合であるが、していない場合にも例えば
「添乗員と」の四文字を未知語として、「人称」可変意
味素性と一致させることもできる。
登録してある場合であるが、していない場合にも例えば
「添乗員と」の四文字を未知語として、「人称」可変意
味素性と一致させることもできる。
【0112】次に、請求項2に記載の機械翻訳装置につ
いて実施形態を述べる。本請求項では、文の他の部分と
字種が異なる部分列で意味素性として登録されていない
文字列を一つの未知語とみなすことであるが、本実施形
態では、カタカナ文字列を例にとって説明する。
いて実施形態を述べる。本請求項では、文の他の部分と
字種が異なる部分列で意味素性として登録されていない
文字列を一つの未知語とみなすことであるが、本実施形
態では、カタカナ文字列を例にとって説明する。
【0113】請求項2に記載の機械翻訳装置で入力文を
翻訳する過程は、ステップA4,5を除いて基本実施形
態と同様である。従って、ここではステップA4,5と
置き換わるステップC1〜C5を図10のフローチャー
トを用いて説明する。それ以外のステップは図3と同様
である。
翻訳する過程は、ステップA4,5を除いて基本実施形
態と同様である。従って、ここではステップA4,5と
置き換わるステップC1〜C5を図10のフローチャー
トを用いて説明する。それ以外のステップは図3と同様
である。
【0114】いま、ステップA1〜A3においてユーザ
が「サンフランシスコまで幾らですか」と入力し、通訳
アイコン17を押したとする。次にステップC1に移
る。ここで、もし、基本実施形態のA4,A5に従って
処理すれば、「サンフランシスコ」なる文字列の一部
「フラン」を意味素性として抽出して、「フランで幾ら
ですか」などの意味のかけ離れた定型文を検索してしま
う。以下のステップC1〜C5はそれを防ぐための処理
である。
が「サンフランシスコまで幾らですか」と入力し、通訳
アイコン17を押したとする。次にステップC1に移
る。ここで、もし、基本実施形態のA4,A5に従って
処理すれば、「サンフランシスコ」なる文字列の一部
「フラン」を意味素性として抽出して、「フランで幾ら
ですか」などの意味のかけ離れた定型文を検索してしま
う。以下のステップC1〜C5はそれを防ぐための処理
である。
【0115】<ステップC1>CPU1の解析部10
が、ステップA3で作業用メモリ5に格納した入力文1
について、各文字の文字種を調べる。入力文中にカタカ
ナがあればステップC2へ、なければステップA4に移
る。いま、入力文「サンフランシスコまで幾らですか」
にはカタカナが含まれるので、ステップC2へ移る。
が、ステップA3で作業用メモリ5に格納した入力文1
について、各文字の文字種を調べる。入力文中にカタカ
ナがあればステップC2へ、なければステップA4に移
る。いま、入力文「サンフランシスコまで幾らですか」
にはカタカナが含まれるので、ステップC2へ移る。
【0116】<ステップC2>CPU1の解析部10
が、ステップA3で作業用メモリ5に格納した入力文1
から、部分文字列を作成し、作業用メモリ5に格納す
る。次に、ステップC3に移る。その際、カタカナの文
字列については、その途中で始まる部分文字列は作らな
い。また、カタカナのみの部分文字列には、フラグを立
てておく。
が、ステップA3で作業用メモリ5に格納した入力文1
から、部分文字列を作成し、作業用メモリ5に格納す
る。次に、ステップC3に移る。その際、カタカナの文
字列については、その途中で始まる部分文字列は作らな
い。また、カタカナのみの部分文字列には、フラグを立
てておく。
【0117】いま、「サンフランシスコまで幾らです
か」はカタカナ列「サンフランシスコ」が含まれるの
で、「ンシスコまで」や「フランシスコまで幾らです」
などの部分文字列は作成しない。また、部分文字列「サ
ンフランシスコ」にはフラグを立てておく。
か」はカタカナ列「サンフランシスコ」が含まれるの
で、「ンシスコまで」や「フランシスコまで幾らです」
などの部分文字列は作成しない。また、部分文字列「サ
ンフランシスコ」にはフラグを立てておく。
【0118】<ステップC3>CPU1の検索部11
が、ステップC2において作業用メモリ5に格納した入
力文1の部分文字列をキーに、ROM6に格納されてい
る意味素性辞書8と可変意味素性辞書9内を検索する。
部分文字列のうち意味素性辞書8に意味素性として定義
されている文字列があれば、CPU1の検索部11はそ
の文字列と意味素性の名称を対で作業用メモリ5に格納
し、ステップA6に移る。なければステップA16に移
る。また、この時、可変意味素性要素の訳語も作業用メ
モリ5に格納しておく。
が、ステップC2において作業用メモリ5に格納した入
力文1の部分文字列をキーに、ROM6に格納されてい
る意味素性辞書8と可変意味素性辞書9内を検索する。
部分文字列のうち意味素性辞書8に意味素性として定義
されている文字列があれば、CPU1の検索部11はそ
の文字列と意味素性の名称を対で作業用メモリ5に格納
し、ステップA6に移る。なければステップA16に移
る。また、この時、可変意味素性要素の訳語も作業用メ
モリ5に格納しておく。
【0119】いま、「まで」「幾ら」「ですか」などの
意味素性が検索され、「サンフランシスコ」なる文字列
から意味素性や可変意味素性が検索されなかったとす
る。
意味素性が検索され、「サンフランシスコ」なる文字列
から意味素性や可変意味素性が検索されなかったとす
る。
【0120】<ステップC4>CPU1の解析部10
が、ステップC2でフラグを立てたカタカナ文字列か
ら、ステップC3において意味素性あるいは可変意味素
性が検索されたかどうか調べる。検索された場合はカタ
カナ文字列に立っているフラグを消去し、ステップA6
に移る。検索されなかった場合はステップC5に移る。
が、ステップC2でフラグを立てたカタカナ文字列か
ら、ステップC3において意味素性あるいは可変意味素
性が検索されたかどうか調べる。検索された場合はカタ
カナ文字列に立っているフラグを消去し、ステップA6
に移る。検索されなかった場合はステップC5に移る。
【0121】いま、ステップC2において、「サンフラ
ンシスコ」なる文字列にフラグを立て、また「サンフラ
ンシスコ」から意味素性や可変意味素性は検索されなか
った。よってフラグを消去せずにステップC5に移る。
ンシスコ」なる文字列にフラグを立て、また「サンフラ
ンシスコ」から意味素性や可変意味素性は検索されなか
った。よってフラグを消去せずにステップC5に移る。
【0122】<ステップC5>CPU1の解析部10
は、フラグの立っているカタカナ文字列を、「未知語」
なる名称の意味素性として、これらを対で作業用メモリ
5に格納する。次に、ステップA6に移る。
は、フラグの立っているカタカナ文字列を、「未知語」
なる名称の意味素性として、これらを対で作業用メモリ
5に格納する。次に、ステップA6に移る。
【0123】いま、「サンフランシスコ」にフラグが立
っている。よって「サンフランシスコ」は「未知語」な
る意味素性であるとし、「サンフランシスコ」と意味素
性の名称「未知語」を作業用メモリ5に格納する。その
後、ステップA6に移る。
っている。よって「サンフランシスコ」は「未知語」な
る意味素性であるとし、「サンフランシスコ」と意味素
性の名称「未知語」を作業用メモリ5に格納する。その
後、ステップA6に移る。
【0124】これ以降は基本実施形態と同様である。ス
テップA6において以下の文例が検索されたとする。
テップA6において以下の文例が検索されたとする。
【0125】文例1: {ニューヨーク}まで幾らですか。 How much is it to {New York}? {地名} まで 幾ら ですか ここで、「地名」可変意味素性には「サンフランシス
コ」なる要素は存在しないとする。
コ」なる要素は存在しないとする。
【0126】次にステップA8において一致度を計算す
る。入力文と定型文は、「まで」「幾ら」「ですか」の
3つの意味素性が一致しており、「地名」「未知語」の
2つの意味素性が一致していない。従って一致度は20
0点となり、消去されない。よってステップA15で、
文例1が液晶ディスプレイ14に図16のように表示さ
れる。
る。入力文と定型文は、「まで」「幾ら」「ですか」の
3つの意味素性が一致しており、「地名」「未知語」の
2つの意味素性が一致していない。従って一致度は20
0点となり、消去されない。よってステップA15で、
文例1が液晶ディスプレイ14に図16のように表示さ
れる。
【0127】これで、文字列「サンフランシスコ」の一
部「フラン」を、フランスの貨幣単位「フラン」と誤解
して、貨幣に関する文を検索する可能性は、完全になく
なることになる。
部「フラン」を、フランスの貨幣単位「フラン」と誤解
して、貨幣に関する文を検索する可能性は、完全になく
なることになる。
【0128】次に、請求項3に記載の機械翻訳装置につ
いて実施形態を述べる。本請求項は、文の他の部分と字
種が異なる部分列で意味素性として登録されていない文
字列を任意の可変意味素性とみなすことであるが、本実
施形態では、カタカナ文字列を例にとって説明する。
いて実施形態を述べる。本請求項は、文の他の部分と字
種が異なる部分列で意味素性として登録されていない文
字列を任意の可変意味素性とみなすことであるが、本実
施形態では、カタカナ文字列を例にとって説明する。
【0129】請求項3に記載の機械翻訳装置で入力文を
翻訳する過程は、ステップC3,A8を除いて請求項2
の実施形態と同様である。従って、ここではステップA
8での処理の違いと、ステップC3に置き換わるステッ
プD5を図17のフローチャートを用いて説明する。そ
れ以外のステップは図3と同様である。
翻訳する過程は、ステップC3,A8を除いて請求項2
の実施形態と同様である。従って、ここではステップA
8での処理の違いと、ステップC3に置き換わるステッ
プD5を図17のフローチャートを用いて説明する。そ
れ以外のステップは図3と同様である。
【0130】いま、ステップA1〜A3においてユーザ
が「サンフランシスコまで幾らですか」と入力し、通訳
アイコン17を押したとする。次にステップC1〜C4
において、入力文から「まで」「幾ら」「ですか」など
の意味素性が検索され、「サンフランシスコ」なるカタ
カナ文字列にフラグが立っている。請求項2のステップ
C5と置き換わるのが下のステップD5である。
が「サンフランシスコまで幾らですか」と入力し、通訳
アイコン17を押したとする。次にステップC1〜C4
において、入力文から「まで」「幾ら」「ですか」など
の意味素性が検索され、「サンフランシスコ」なるカタ
カナ文字列にフラグが立っている。請求項2のステップ
C5と置き換わるのが下のステップD5である。
【0131】<ステップD5>CPU1の解析部10
は、フラグの立っているカタカナ文字列を、「任意」な
る名称の可変意味素性として、これらを対で作業用メモ
リ5に格納する。また、空文字列を訳語として作業用メ
モリ5に格納し、ステップA6に移る。
は、フラグの立っているカタカナ文字列を、「任意」な
る名称の可変意味素性として、これらを対で作業用メモ
リ5に格納する。また、空文字列を訳語として作業用メ
モリ5に格納し、ステップA6に移る。
【0132】いま、「サンフランシスコ」なる文字列に
フラグが立っている。よって「サンフランシスコ」は
「任意」なる可変意味素性であるとし、「サンフランシ
スコ」と可変意味素性意味素性の名称「任意」を作業用
メモリ5に格納する。さらに空文字列を訳語として格納
し、ステップA6に移る。ステップA6,7は上記の処
理と同様である。
フラグが立っている。よって「サンフランシスコ」は
「任意」なる可変意味素性であるとし、「サンフランシ
スコ」と可変意味素性意味素性の名称「任意」を作業用
メモリ5に格納する。さらに空文字列を訳語として格納
し、ステップA6に移る。ステップA6,7は上記の処
理と同様である。
【0133】ステップA6において、入力文から抽出さ
れた意味素性から定型文を検索する。入力文「サンフラ
ンシスコまで幾らですか」から、次の文が検索されたと
する。
れた意味素性から定型文を検索する。入力文「サンフラ
ンシスコまで幾らですか」から、次の文が検索されたと
する。
【0134】 ステップA7において、この文を選択し、ステップA8
において一致度を計算する。いま、入力文と文例1は
「まで」「幾ら」「ですか」の意味素性が一致してい
る。
において一致度を計算する。いま、入力文と文例1は
「まで」「幾ら」「ですか」の意味素性が一致してい
る。
【0135】ここで、本請求項においては、請求項2の
実施形態(基本実施形態)のステップA8に“入力文中
に「任意」なる名称の可変意味素性が存在すれば、それ
は定型文中のすべての可変意味素性と一致しているとみ
なす”という処理を追加する。
実施形態(基本実施形態)のステップA8に“入力文中
に「任意」なる名称の可変意味素性が存在すれば、それ
は定型文中のすべての可変意味素性と一致しているとみ
なす”という処理を追加する。
【0136】いま、入力文に「任意」可変意味素性が存
在し、文例1には「地名」なる可変意味素性が存在する
ので、これらを一致するとみなす。よって、4つすべて
が一致していることになり、一致している個数に100
を掛けて、この定型文の入力文との一致度を400点と
する。よって文例1と一致度400点を作業用メモリ5
に格納する。
在し、文例1には「地名」なる可変意味素性が存在する
ので、これらを一致するとみなす。よって、4つすべて
が一致していることになり、一致している個数に100
を掛けて、この定型文の入力文との一致度を400点と
する。よって文例1と一致度400点を作業用メモリ5
に格納する。
【0137】文例1の一致度400点は閾値200点を
超えているので、ステップA9に移る。ここで、「任
意」可変意味素性は、定型文の任意の可変意味素性と一
致しているものとして計算したが、その処理はこのステ
ップ内だけのものとする。従って、ステップA10にお
いて、「任意」可変意味素性と一致している可変意味素
性の要素置換は行わない。
超えているので、ステップA9に移る。ここで、「任
意」可変意味素性は、定型文の任意の可変意味素性と一
致しているものとして計算したが、その処理はこのステ
ップ内だけのものとする。従って、ステップA10にお
いて、「任意」可変意味素性と一致している可変意味素
性の要素置換は行わない。
【0138】これ以降は請求項2の実施形態(基本実施
形態)と同様である。ステップA9〜A15において、
文例1が液晶ディスプレイ4に、図16のように表示さ
れて、一連の翻訳の動作を終了する。
形態)と同様である。ステップA9〜A15において、
文例1が液晶ディスプレイ4に、図16のように表示さ
れて、一連の翻訳の動作を終了する。
【0139】また、文の他の部分と字種が異なる部分列
で意味素性として登録されていない文字列を特定の可変
意味素性とみなすように構成してもよい。例えば、旅行
での場面におけるカタカナ固有名詞は、ほとんどの場
合、地名か人名を表すものであるとして、「地名」もし
くは「人名」なる可変意味素性とみなす。
で意味素性として登録されていない文字列を特定の可変
意味素性とみなすように構成してもよい。例えば、旅行
での場面におけるカタカナ固有名詞は、ほとんどの場
合、地名か人名を表すものであるとして、「地名」もし
くは「人名」なる可変意味素性とみなす。
【0140】以下にその例を説明する。ステップC5を
除いて請求項2の実施形態と同様である。従って、ここ
ではステップC5に置き換わるステップE5を図18の
フローチャートを用いて説明する。それ以外のステップ
は図3と同様である。
除いて請求項2の実施形態と同様である。従って、ここ
ではステップC5に置き換わるステップE5を図18の
フローチャートを用いて説明する。それ以外のステップ
は図3と同様である。
【0141】いま、ステップA1〜A3においてユーザ
が「サンフランシスコまで幾らですか」と入力し、通訳
アイコン17を押したとする。次にステップC1〜C4
において、入力文から「まで」「幾ら」「ですか」など
の意味素性が検索され、「サンフランシスコ」なるカタ
カナ文字列にフラグが立っている。請求項2のステップ
C5に置き換わるのが、次のステップE5である。
が「サンフランシスコまで幾らですか」と入力し、通訳
アイコン17を押したとする。次にステップC1〜C4
において、入力文から「まで」「幾ら」「ですか」など
の意味素性が検索され、「サンフランシスコ」なるカタ
カナ文字列にフラグが立っている。請求項2のステップ
C5に置き換わるのが、次のステップE5である。
【0142】<ステップE5>CPU1の解析部10
は、フラグの立っているカタカナ文字列を「地名」かつ
「人名」なる名称の可変意味素性であるとして、これら
の名称と、カタカナ文字列をそれぞれ対にして作業用メ
モリ5に格納する。また、空文字列を訳語として作業用
メモリ5に格納し、ステップA6に移る。
は、フラグの立っているカタカナ文字列を「地名」かつ
「人名」なる名称の可変意味素性であるとして、これら
の名称と、カタカナ文字列をそれぞれ対にして作業用メ
モリ5に格納する。また、空文字列を訳語として作業用
メモリ5に格納し、ステップA6に移る。
【0143】いま、「サンフランシスコ」なる文字列に
フラグが立っている。よって「サンフランシスコ」は
「地名」かつ「人名」可変意味素性であるとし、「サン
フランシスコ」と可変意味素性意味素性の名称「地名」
「人名」を作業用メモリ5に格納する。さらに、空文字
列を訳語として格納し、ステップA6に移る。以降は基
本実施形態と同様である。ステップA6において、以下
の文例が検索されたとする。
フラグが立っている。よって「サンフランシスコ」は
「地名」かつ「人名」可変意味素性であるとし、「サン
フランシスコ」と可変意味素性意味素性の名称「地名」
「人名」を作業用メモリ5に格納する。さらに、空文字
列を訳語として格納し、ステップA6に移る。以降は基
本実施形態と同様である。ステップA6において、以下
の文例が検索されたとする。
【0144】 入力文と文例1はすべての意味素性が一致しているの
で、一致度は400点である。従ってステップA15に
おいて、文例1が液晶ディスプレイ14に図16のよう
に表示され、一連の翻訳の動作を終了する。
で、一致度は400点である。従ってステップA15に
おいて、文例1が液晶ディスプレイ14に図16のよう
に表示され、一連の翻訳の動作を終了する。
【0145】次に、請求項4に記載の機械翻訳装置につ
いて実施形態を述べる。本請求項は、文の他の部分と字
種が異なる部分列で意味素性として登録されていない文
字列を、第二外国語で用いられる字種に変換することで
あるが、本実施形態では、カタカナ文字列をアルファベ
ット(ローマ字)に変換する場合を例にとって説明す
る。ここでは請求項3の機械翻訳装置の実施形態を元
に、それとの差異のみを述べる。
いて実施形態を述べる。本請求項は、文の他の部分と字
種が異なる部分列で意味素性として登録されていない文
字列を、第二外国語で用いられる字種に変換することで
あるが、本実施形態では、カタカナ文字列をアルファベ
ット(ローマ字)に変換する場合を例にとって説明す
る。ここでは請求項3の機械翻訳装置の実施形態を元
に、それとの差異のみを述べる。
【0146】本請求項の一実施形態では、可変意味素性
辞書9内に、カタカナをローマ字に変換するための情報
を格納しておく。これは、以下のように、すべてのカタ
カナと、そのローマ字とを対応させたものである。
辞書9内に、カタカナをローマ字に変換するための情報
を格納しておく。これは、以下のように、すべてのカタ
カナと、そのローマ字とを対応させたものである。
【0147】[可変意味素性辞書9] ア a イ i : : 以下、請求項4の動作を説明する。請求項4に記載の機
械翻訳装置で入力文を翻訳する過程は、ひとつのステッ
プを除いて請求項3の実施形態と同様である。従って、
追加されるステップのみ図19のフローチャートを使っ
て説明する。それ以外のステップは図3と同様である。
械翻訳装置で入力文を翻訳する過程は、ひとつのステッ
プを除いて請求項3の実施形態と同様である。従って、
追加されるステップのみ図19のフローチャートを使っ
て説明する。それ以外のステップは図3と同様である。
【0148】いま、ステップA1〜A3,C1〜C2に
おいてユーザが「私の名前はキムラです」と入力し、
「キムラ」なるカタカナ列にフラグが立てられ、それは
「地名」「人名」可変意味素性として記憶されたとす
る。また、入力文から、次の定型文が検索されたとす
る。
おいてユーザが「私の名前はキムラです」と入力し、
「キムラ」なるカタカナ列にフラグが立てられ、それは
「地名」「人名」可変意味素性として記憶されたとす
る。また、入力文から、次の定型文が検索されたとす
る。
【0149】 この定型文と入力文は「私」「名前」「人名」「です」
の4つすべてが一致している。よって、ステップA9に
おいて、一致している個数4に100を掛けた400点
が一致度となり、これは閾値200点以上であるので消
去されない。
の4つすべてが一致している。よって、ステップA9に
おいて、一致している個数4に100を掛けた400点
が一致度となり、これは閾値200点以上であるので消
去されない。
【0150】本請求項において、基本請求項3の実施形
態(基本実施形態)のステップA10の直前に次のステ
ップを追加する。
態(基本実施形態)のステップA10の直前に次のステ
ップを追加する。
【0151】<ステップF1>CPU1の解析部10
が、作業用メモリ5に格納されているフラグの立ってい
るカタカナ列に対して、可変意味素性辞書9を参照して
文字列中の全てのカタカナをローマ字に変換する。この
時、先頭文字を大文字にする。変換された文字列を、こ
の要素の訳語として作業用メモリ5に格納し、ステップ
A10に移る。
が、作業用メモリ5に格納されているフラグの立ってい
るカタカナ列に対して、可変意味素性辞書9を参照して
文字列中の全てのカタカナをローマ字に変換する。この
時、先頭文字を大文字にする。変換された文字列を、こ
の要素の訳語として作業用メモリ5に格納し、ステップ
A10に移る。
【0152】いま、「キムラ」なるカタカナ列にフラグ
が立っている。これを可変意味素性9を参照して「kimu
ra」なるローマ時に変換し、さらに先頭を大文字にして
「Kimura」として作業用メモリ5に格納する。
が立っている。これを可変意味素性9を参照して「kimu
ra」なるローマ時に変換し、さらに先頭を大文字にして
「Kimura」として作業用メモリ5に格納する。
【0153】以降は請求項3の実施形態(基本実施形
態)と同様である。ステップA10において文例8の
「鈴木」を「キムラ」と置き換え、「Suzuki」を「Kimu
ra」に置き換える。実際には、以下のようになる。
態)と同様である。ステップA10において文例8の
「鈴木」を「キムラ」と置き換え、「Suzuki」を「Kimu
ra」に置き換える。実際には、以下のようになる。
【0154】 ステップA11〜A15において、文例8が液晶ディス
プレイ14に図11のように表示され、一連の翻訳の動
作を終了する。
プレイ14に図11のように表示され、一連の翻訳の動
作を終了する。
【0155】以下、請求項5に記載の機械翻訳装置につ
いて実施形態を述べる。本請求項は、定型文の可変意味
素性に相当する文字列の入力がない場合に、可変意味素
性内に一定の文字または文字列を挿入して表示すること
であるが、本実施形態では「〜」を挿入して表示する場
合を例にとって説明する。
いて実施形態を述べる。本請求項は、定型文の可変意味
素性に相当する文字列の入力がない場合に、可変意味素
性内に一定の文字または文字列を挿入して表示すること
であるが、本実施形態では「〜」を挿入して表示する場
合を例にとって説明する。
【0156】請求項5に記載の機械翻訳装置で入力文を
翻訳する過程は、G1、G2のふたつのステップを除い
て基本実施形態と同様である。従って、追加されるステ
ップのみ図20のフローチャートを使って詳しく説明す
る。それ以外のステップは図3と同様である。いま、ユ
ーザが「木村さんを呼び出してもらえますか」と入力
し、対訳データベース7内の文例5が検索されたとす
る。
翻訳する過程は、G1、G2のふたつのステップを除い
て基本実施形態と同様である。従って、追加されるステ
ップのみ図20のフローチャートを使って詳しく説明す
る。それ以外のステップは図3と同様である。いま、ユ
ーザが「木村さんを呼び出してもらえますか」と入力
し、対訳データベース7内の文例5が検索されたとす
る。
【0157】[対訳データベース7] また、「人名」可変意味素性は「木村」なる要素を持た
ないとする。
ないとする。
【0158】この定型文と入力文は「さん」「呼び出
す」「もらえますか」の3つが一致しており、「人名」
「キムラ」の2つが一致していない。よって一致してい
る個数3に100を掛けたものから、一致していない個
数2に50を掛けたものを引いて、一致度は200点に
なる。これは閾値200点以上であるので消去されな
い。
す」「もらえますか」の3つが一致しており、「人名」
「キムラ」の2つが一致していない。よって一致してい
る個数3に100を掛けたものから、一致していない個
数2に50を掛けたものを引いて、一致度は200点に
なる。これは閾値200点以上であるので消去されな
い。
【0159】次にステップA10において可変意味素性
置換を行うが、文例5の「人名」可変意味素性に相当す
る文字列が入力文中に存在しないので、置換は行われな
い。本請求項において、基本実施形態のステップA11
の直前に次のふたつのステップを追加する。
置換を行うが、文例5の「人名」可変意味素性に相当す
る文字列が入力文中に存在しないので、置換は行われな
い。本請求項において、基本実施形態のステップA11
の直前に次のふたつのステップを追加する。
【0160】<ステップG1>CPU1の解析部12
は、作業用メモリ5に格納した定型文中に、ステップA
10で置換しなかった可変意味素性が存在するかどうか
調べる。存在する場合はステップG2に移り、しない場
合はステップA11に移る。
は、作業用メモリ5に格納した定型文中に、ステップA
10で置換しなかった可変意味素性が存在するかどうか
調べる。存在する場合はステップG2に移り、しない場
合はステップA11に移る。
【0161】いま、文例5の「人名」可変意味素性は、
ステップA10で置換されなかった。よってステップG
2に移る。
ステップA10で置換されなかった。よってステップG
2に移る。
【0162】<ステップG2>CPU1の置換部12
は、作業用メモリ5に格納した定型文の日本文・英文中
の、ステップA10で置換しなかった可変意味素性に相
当する部分に、文字列「〜」を挿入する。その形で作業
用メモリ5に格納し、ステップA11に移る。
は、作業用メモリ5に格納した定型文の日本文・英文中
の、ステップA10で置換しなかった可変意味素性に相
当する部分に、文字列「〜」を挿入する。その形で作業
用メモリ5に格納し、ステップA11に移る。
【0163】いま、文例5の日本文中の「人名」可変意
味素性に相当する「鈴木」の部分と、英文中の「Mr. Su
zuki」の部分を、「〜」に置き換える。結果として以下
のようになる。
味素性に相当する「鈴木」の部分と、英文中の「Mr. Su
zuki」の部分を、「〜」に置き換える。結果として以下
のようになる。
【0164】 この形で作業用メモリ5に格納し、ステップA11に移
る。
る。
【0165】これ以降は基本実施形態と同様である。ス
テップA11〜A15において、文例5が液晶ディスプ
レイ14に図12のように表示され、一連の翻訳の動作
を終了する。
テップA11〜A15において、文例5が液晶ディスプ
レイ14に図12のように表示され、一連の翻訳の動作
を終了する。
【0166】また、定型文の可変意味素性に相当する文
字列の入力がない場合に、その含まれる要素を説明する
名称(上位概念)を挿入して表示してもよい。例えば、
当該可変意味素性の名称を挿入して表示する場合を例に
とって、説明する。
字列の入力がない場合に、その含まれる要素を説明する
名称(上位概念)を挿入して表示してもよい。例えば、
当該可変意味素性の名称を挿入して表示する場合を例に
とって、説明する。
【0167】いま、ユーザが「木村さんを呼び出しても
らえますか」と入力し、対訳データベース7内の文例5
が検索されたとする。
らえますか」と入力し、対訳データベース7内の文例5
が検索されたとする。
【0168】[対訳データベース7] また、「人名」可変意味素性は「木村」なる要素を持た
ないとする。
ないとする。
【0169】この定型文と入力文は「さん」「呼び出
す」「もらえますか」の3つが一致しており、「人名」
「キムラ」の2つが一致していない。よって一致してい
る個数3に100を掛けたものから、一致していない個
数2に50を掛けたものを引いて、一致度は200点に
なる。これは閾値200点以上であるので消去されな
い。
す」「もらえますか」の3つが一致しており、「人名」
「キムラ」の2つが一致していない。よって一致してい
る個数3に100を掛けたものから、一致していない個
数2に50を掛けたものを引いて、一致度は200点に
なる。これは閾値200点以上であるので消去されな
い。
【0170】次にステップA10において可変意味素性
置換を行うが、文例5の「人名」可変意味素性に相当す
る文字列が入力文中に存在しないので、置換は行われな
い。基本実施形態のステップA11の直前に次のふたつ
のステップを追加する(図21)。
置換を行うが、文例5の「人名」可変意味素性に相当す
る文字列が入力文中に存在しないので、置換は行われな
い。基本実施形態のステップA11の直前に次のふたつ
のステップを追加する(図21)。
【0171】<ステップH1>CPU1の解析部12
は、作業用メモリ5に格納した定型文中に、ステップA
10で置換しなかった可変意味素性が存在するかどうか
調べる。存在する場合はステップH2に移り、しない場
合はステップA11に移る。
は、作業用メモリ5に格納した定型文中に、ステップA
10で置換しなかった可変意味素性が存在するかどうか
調べる。存在する場合はステップH2に移り、しない場
合はステップA11に移る。
【0172】いま、文例5の「人名」可変意味素性は、
ステップA10で置換されなかった。よってステップH
2に移る。
ステップA10で置換されなかった。よってステップH
2に移る。
【0173】<ステップH2>CPU1の置換部12
は、作業用メモリ5に格納した定型文の日本文・英文中
の、ステップA10で置換しなかった可変意味素性に相
当する部分に、その可変意味素性の名称を挿入する。そ
の形で作業用メモリ5に格納し、ステップA11に移
る。
は、作業用メモリ5に格納した定型文の日本文・英文中
の、ステップA10で置換しなかった可変意味素性に相
当する部分に、その可変意味素性の名称を挿入する。そ
の形で作業用メモリ5に格納し、ステップA11に移
る。
【0174】いま、文例5の日本文中の「人名」可変意
味素性に相当する「鈴木」の部分と、英文中の「Mr. Su
zuki」の部分を、可変意味素性の名称「人名」に置き換
える。実際は以下のようになる。
味素性に相当する「鈴木」の部分と、英文中の「Mr. Su
zuki」の部分を、可変意味素性の名称「人名」に置き換
える。実際は以下のようになる。
【0175】 この形で作業用メモリ5に格納し、ステップA11に移
る。
る。
【0176】これ以降は基本実施形態と同様である。ス
テップA11〜A15において、文例5が液晶ディスプ
レイ14に図13のように表示され、一連の翻訳の動作
を終了する。
テップA11〜A15において、文例5が液晶ディスプ
レイ14に図13のように表示され、一連の翻訳の動作
を終了する。
【0177】<請求項6の実施形態>以下、請求項6に
記載の機械翻訳装置について実施形態を述べる。本請求
項は、人名に対して、第二言語が敬称(Mr./Ms.など)
をつけることを必須とし、かつ、第一言語では特に区別
しなくていい場合に、確実に正しい敬称をつけられる機
構を用意することであるが、本実施形態では、これを
「敬称」なる可変意味素性で実現する場合を例にとって
説明する。「敬称」可変意味素性は、可変意味素性辞書
9内で以下のように定義する。
記載の機械翻訳装置について実施形態を述べる。本請求
項は、人名に対して、第二言語が敬称(Mr./Ms.など)
をつけることを必須とし、かつ、第一言語では特に区別
しなくていい場合に、確実に正しい敬称をつけられる機
構を用意することであるが、本実施形態では、これを
「敬称」なる可変意味素性で実現する場合を例にとって
説明する。「敬称」可変意味素性は、可変意味素性辞書
9内で以下のように定義する。
【0178】敬称 男性 Mr. 女性 Ms. 入力文を翻訳する過程は、ステップA8を除いて基本実
施形態と同様である。従って、ここではステップA8の
差異のみ詳細に説明する。また、動作フローは基本実施
形態と同様なので、図3のフローチャートと同様であ
る。いま、ユーザが「鈴木さんを呼び出してもらえます
か」と入力し、対訳データベース7内の文例7が検索さ
れたとする。
施形態と同様である。従って、ここではステップA8の
差異のみ詳細に説明する。また、動作フローは基本実施
形態と同様なので、図3のフローチャートと同様であ
る。いま、ユーザが「鈴木さんを呼び出してもらえます
か」と入力し、対訳データベース7内の文例7が検索さ
れたとする。
【0179】[対訳データベース7] 文例7: {鈴木}さん({男性})を呼び出してもらえますか。 Would you page {Mr.} {Suzuki}? {人名} さん {敬称} 呼び出す もらえますか 本請求項において、基本実施形態のステップA8に“定
型文中に「敬称」可変意味素性が存在すれば、入力文に
それに相当する意味素性が存在しなくても、点数を下げ
ない”という処理を追加する。
型文中に「敬称」可変意味素性が存在すれば、入力文に
それに相当する意味素性が存在しなくても、点数を下げ
ない”という処理を追加する。
【0180】いま、文例7と入力文において、「人名」
「さん」「呼び出す」「もらえますか」の4つの意味素
性が一致する。一致しないのは定型文中の「敬称」可変
意味素性のみであるが、これに対しては点数を下げな
い。よって、一致している個数4に100を掛けて、一
致度を400点とする。
「さん」「呼び出す」「もらえますか」の4つの意味素
性が一致する。一致しないのは定型文中の「敬称」可変
意味素性のみであるが、これに対しては点数を下げな
い。よって、一致している個数4に100を掛けて、一
致度を400点とする。
【0181】以降は基本実施形態と同様である。ステッ
プA9〜A15において、文例7が液晶ディスプレイ1
4に図14のように表示され、一連の翻訳の動作を終了
する。
プA9〜A15において、文例7が液晶ディスプレイ1
4に図14のように表示され、一連の翻訳の動作を終了
する。
【0182】また、使用者が可変意味素性を置き換えら
れる場合、図14の翻訳結果表示の状態から、使用者が
下線部の可変意味素性要素を置き換えることができる。
「鈴木さん」が女性である場合、日本文の「男性」の部
分を「女性」に変えることにより、英文の「Mr.」も「M
s.」に置き換わり、その状況に合致した訳文を得ること
ができる。
れる場合、図14の翻訳結果表示の状態から、使用者が
下線部の可変意味素性要素を置き換えることができる。
「鈴木さん」が女性である場合、日本文の「男性」の部
分を「女性」に変えることにより、英文の「Mr.」も「M
s.」に置き換わり、その状況に合致した訳文を得ること
ができる。
【0183】
<請求項1の効果>請求項1に係る発明では、可変意味
素性以外の文構成要素がほとんど一致していて、可変意
味素性が一致していない状態を正しく把握することによ
って、使用者が入力した文に対して、可変意味素性が一
致していないが意味的に近い定型文でも確実に表示する
ことができる。
素性以外の文構成要素がほとんど一致していて、可変意
味素性が一致していない状態を正しく把握することによ
って、使用者が入力した文に対して、可変意味素性が一
致していないが意味的に近い定型文でも確実に表示する
ことができる。
【0184】<請求項2の効果>請求項2に係る発明で
は、入力文中の他の部分と字種が異なる部分列でかつ意
味素性として登録されていない文字列を一つの未知語と
みなすことによって、使用者が入力した文と意味のかけ
離れた文を表示することを抑制し、確実に意味の近い文
を表示することができる。
は、入力文中の他の部分と字種が異なる部分列でかつ意
味素性として登録されていない文字列を一つの未知語と
みなすことによって、使用者が入力した文と意味のかけ
離れた文を表示することを抑制し、確実に意味の近い文
を表示することができる。
【0185】<請求項3の効果>請求項3に係る発明で
は、入力文中の他の部分と字種が異なる部分列でかつ意
味素性として登録されていない文字列を任意の可変意味
素性とみなすことによって、使用者が固有名詞など可変
意味素性の要素として登録されていない単語を入力した
場合でも、確実に意味の近い文を表示することができ
る。
は、入力文中の他の部分と字種が異なる部分列でかつ意
味素性として登録されていない文字列を任意の可変意味
素性とみなすことによって、使用者が固有名詞など可変
意味素性の要素として登録されていない単語を入力した
場合でも、確実に意味の近い文を表示することができ
る。
【0186】<請求項4の効果>請求項4に係る発明で
は、入力文中の他の部分と字種が異なる部分列でかつ意
味素性として登録されていない文字列を第二言語で用い
られる字種に変換して訳語として表示することによっ
て、使用者が第一言語の固有名詞を入力した場合でも、
第二言語に即した形で翻訳できる。
は、入力文中の他の部分と字種が異なる部分列でかつ意
味素性として登録されていない文字列を第二言語で用い
られる字種に変換して訳語として表示することによっ
て、使用者が第一言語の固有名詞を入力した場合でも、
第二言語に即した形で翻訳できる。
【0187】<請求項5の効果>請求項5に係る発明で
は、可変意味素性が一致していない場合にある特定の文
字または文字列を挿入して表示することによって、使用
者にとって、可変意味素性が一致しなかったことが一目
瞭然となり、文の他の構成要素の一致の如何の視認性が
向上する。また、当可変意味素性にどんな要素が入りう
るかを把握できる利点がある。
は、可変意味素性が一致していない場合にある特定の文
字または文字列を挿入して表示することによって、使用
者にとって、可変意味素性が一致しなかったことが一目
瞭然となり、文の他の構成要素の一致の如何の視認性が
向上する。また、当可変意味素性にどんな要素が入りう
るかを把握できる利点がある。
【0188】<請求項6の効果>請求項6に係る発明で
は、第二言語で必須の表現を第一言語中にも可変意味素
性として存在ることによって、使用者がその後正しい要
素を選択することで、常に第二言語の表現に沿った表現
を生成することができる。
は、第二言語で必須の表現を第一言語中にも可変意味素
性として存在ることによって、使用者がその後正しい要
素を選択することで、常に第二言語の表現に沿った表現
を生成することができる。
【図1】本発明の機械翻訳装置の一実施の形態のブロッ
ク図である。
ク図である。
【図2】本発明の機械翻訳装置の一実施の形態の外観図
である。
である。
【図3】本発明の翻訳処理の一実施の形態のフローチャ
ートである。
ートである。
【図4】本発明の翻訳処理の一実施の形態における表示
画面の例である。
画面の例である。
【図5】本発明の翻訳処理の一実施の形態における表示
画面の例である。
画面の例である。
【図6】本発明の翻訳処理の一実施の形態における表示
画面の例である。
画面の例である。
【図7】本発明の翻訳処理の一実施の形態における表示
画面の例である。
画面の例である。
【図8】本発明の翻訳処理の一実施の形態における表示
画面の例である。
画面の例である。
【図9】本発明の翻訳処理の一実施の形態における表示
画面の例である。
画面の例である。
【図10】本発明の一実施の形態のフローチャートであ
る。
る。
【図11】本発明の翻訳処理の一実施の形態における表
示画面の例である。
示画面の例である。
【図12】本発明の翻訳処理の一実施の形態における表
示画面の例である。
示画面の例である。
【図13】本発明の翻訳処理の一実施の形態における表
示画面の例である。
示画面の例である。
【図14】本発明の翻訳処理の一実施の形態における表
示画面の例である。
示画面の例である。
【図15】本発明の翻訳処理の一実施の形態における表
示画面の例である。
示画面の例である。
【図16】本発明の翻訳処理の一実施の形態における表
示画面の例である。
示画面の例である。
【図17】本発明の一実施の形態のフローチャートであ
る。
る。
【図18】本発明の一実施の形態のフローチャートであ
る。
る。
【図19】本発明の一実施の形態のフローチャートであ
る。
る。
【図20】本発明の一実施の形態のフローチャートであ
る。
る。
【図21】本発明の一実施の形態のフローチャートであ
る。
る。
1 CPU 2 液晶ディスプレイ 3 表示用ドライバ 4 入力認識部 5 作業用メモリ 6 ROM 7 対訳データベース 8 意味素性辞書 9 可変意味素性辞書 10 解析部 11 検索部 12 置換部 13 制御部 14 液晶ディスプレイ 15 専用ペン 16 手書き認識ボード 17 通訳アイコン 18 バス
Claims (6)
- 【請求項1】 第一言語の会話の用例文と、その翻訳文
である第二言語の文とを対にして登録している対訳デー
タベースと、 意味素性とその意味素性として抽出する表記を定義して
記憶した意味素性辞書と、 同一の意味素性であり、置換可能な単語を登録している
可変意味素性辞書と、 前記対訳データベースを検索するための入力文を入力す
る入力手段と、 前記入力手段から入力された入力文に基づいて、前記対
訳データベース、前記意味素性辞書及び前記可変意味素
性辞書を検索する検索手段と、 前記検索手段により前記対訳データベース及び前記意味
素性辞書から検索された例文に対し、前記可変意味素性
辞書に基づいて置換を行う置換手段と、 前記検索手段及び置換手段によって抽出された例文と、
前記入力手段から入力された入力文との一致度を算出す
る解析手段と、 前記解析手段に基づいて、例文の翻訳文を出力する出力
手段を備えた装置であって、 前記解析手段において、前記検索された翻訳文中に可変
意味素性が存在し、前記入力手段の入力において該可変
意味素性に対応する素性が存在せず、さらに一致しない
意味素性が唯一である場合は、該可変意味素性を一致し
たものとして一致度を求めることを特徴とする機械翻訳
装置。 - 【請求項2】 前記解析手段において、前記入力文にお
いて、他の部分と字種が異なる部分文字列であり、意味
素性として前記意味素性辞書及び可変意味素性辞書に登
録されていない文字列を未知語として認識し、一致度を
求めることを特徴とする前記請求項1記載の機械翻訳装
置。 - 【請求項3】 前記解析手段において、前記入力文中
の、他の部分と字種が異なる部分文字列であり、意味素
性として前記意味素性辞書及び可変意味素性辞書に登録
されていない文字列を、特定の可変意味素性として認識
し、一致度を求めることを特徴とする前記請求項1記載
の機械翻訳装置。 - 【請求項4】 前記置換手段において、前記入力文中
の、他の部分と字種が異なる部分文字列であり、意味素
性として前記意味素性辞書及び可変意味素性辞書に登録
されていない文字列を、特定の字種に変換することを特
徴とする前記請求項1記載の機械翻訳装置。 - 【請求項5】 前記置換手段において、前記検索された
翻訳文中の可変意味素性に相当する文字列が、前記入力
文に存在しない場合に、可変意味素性内に特定の文字列
を挿入して表示することを特徴とする前記請求項1記載
の機械翻訳装置。 - 【請求項6】 前記置換手段において、第二言語では必
ず表現されるが、第一言語では必ずしも表現されない言
語表現に対して、第二言語における表現を可変意味素性
とし、翻訳結果に対して付与して表示することを特徴と
する前記請求項1記載の機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8252122A JPH1097538A (ja) | 1996-09-25 | 1996-09-25 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8252122A JPH1097538A (ja) | 1996-09-25 | 1996-09-25 | 機械翻訳装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1097538A true JPH1097538A (ja) | 1998-04-14 |
Family
ID=17232786
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8252122A Pending JPH1097538A (ja) | 1996-09-25 | 1996-09-25 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1097538A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000049523A1 (fr) * | 1999-02-18 | 2000-08-24 | Sony Corporation | Procede de traduction et dispositif de traduction |
| JP2010113722A (ja) * | 2002-02-27 | 2010-05-20 | Neil D Sater | メディアのカスタマイズを促進するシステムおよび方法 |
| US9165542B2 (en) | 2002-02-27 | 2015-10-20 | Y Indeed Consulting L.L.C. | System and method that facilitates customizing media |
-
1996
- 1996-09-25 JP JP8252122A patent/JPH1097538A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000049523A1 (fr) * | 1999-02-18 | 2000-08-24 | Sony Corporation | Procede de traduction et dispositif de traduction |
| JP2010113722A (ja) * | 2002-02-27 | 2010-05-20 | Neil D Sater | メディアのカスタマイズを促進するシステムおよび方法 |
| US9165542B2 (en) | 2002-02-27 | 2015-10-20 | Y Indeed Consulting L.L.C. | System and method that facilitates customizing media |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5640575A (en) | Method and apparatus of translation based on patterns | |
| JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
| JPH05314166A (ja) | 電子化辞書および辞書検索装置 | |
| EP0797157A2 (en) | Machine interpreter | |
| JPH1097538A (ja) | 機械翻訳装置 | |
| JP3393173B2 (ja) | 機械翻訳装置 | |
| JPS6210763A (ja) | 仮名漢字変換処理装置 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JP3752535B2 (ja) | 訳語選択装置、及び翻訳装置 | |
| JP3388153B2 (ja) | 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JPH06266770A (ja) | 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置 | |
| JPH10320399A (ja) | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 | |
| JP7711406B2 (ja) | 情報検索装置、情報検索支援方法及びプログラム | |
| JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
| JPH0612453A (ja) | 未知語抽出登録装置 | |
| JPH01229369A (ja) | 文字処理装置 | |
| JPH0793345A (ja) | 文書検索装置 | |
| JP2007122660A (ja) | 文書データ処理装置および文書データ処理プログラム | |
| JPH0350668A (ja) | 文字処理装置 | |
| JPH11203281A (ja) | 電子辞書検索装置及び電子辞書検索装置制御プログラムを記憶した媒体 | |
| JP5338482B2 (ja) | 漢文例文検索装置およびプログラム | |
| JP3537888B2 (ja) | かな漢字変換装置 | |
| JP2000137710A (ja) | 会話文翻訳装置 | |
| JPS63136264A (ja) | 機械翻訳装置 | |
| JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 |