JPH07200604A - 文脈ベースの翻訳モデルを使用する言語翻訳の装置とその方法 - Google Patents
文脈ベースの翻訳モデルを使用する言語翻訳の装置とその方法Info
- Publication number
- JPH07200604A JPH07200604A JP6227645A JP22764594A JPH07200604A JP H07200604 A JPH07200604 A JP H07200604A JP 6227645 A JP6227645 A JP 6227645A JP 22764594 A JP22764594 A JP 22764594A JP H07200604 A JPH07200604 A JP H07200604A
- Authority
- JP
- Japan
- Prior art keywords
- word
- target
- source
- hypothesis
- match score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims description 30
- 230000006870 function Effects 0.000 claims description 48
- 230000007246 mechanism Effects 0.000 claims description 48
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 230000014616 translation Effects 0.000 description 61
- 238000012549 training Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000035558 fertility Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000003517 fume Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 第1言語の一連の原始単語を第2言語の一連
の目標単語に翻訳するための装置を提供する。 【構成】 入力された一連の原始単語について、それぞ
れ一連の目標単語を含む、少なくとも2つの目標仮説を
生成する。各目標単語は、目標仮説の少なくとも1つの
他の単語を含む文脈を有する。各目標仮説について、言
語モデル合致スコアは、一連の単語の発生確率の推定値
を含む。各原始単語を目標仮説の少なくとも1つの目標
単語に結合する少なくとも1つのアラインメントを識別
する。各原始単語と各目標仮説について、翻訳合致スコ
アは、原始単語に結合された目標仮説の目標単語が与え
られかつ原始単語に結合された目標単語の目標仮説の文
脈が与えられた場合の原始単語の条件付き発生確率の推
定値を含む。各目標仮説について、翻訳合致スコアは、
目標仮説の単語合致スコアと入力された一連の原始単語
の原始単語との組合せを含む。目標仮説合致スコアは、
目標仮説の言語モデル合致スコアと目標仮説の翻訳合致
スコアとの組合せを含む。最良の目標仮説合致スコアを
有する目標仮説が出力される。
の目標単語に翻訳するための装置を提供する。 【構成】 入力された一連の原始単語について、それぞ
れ一連の目標単語を含む、少なくとも2つの目標仮説を
生成する。各目標単語は、目標仮説の少なくとも1つの
他の単語を含む文脈を有する。各目標仮説について、言
語モデル合致スコアは、一連の単語の発生確率の推定値
を含む。各原始単語を目標仮説の少なくとも1つの目標
単語に結合する少なくとも1つのアラインメントを識別
する。各原始単語と各目標仮説について、翻訳合致スコ
アは、原始単語に結合された目標仮説の目標単語が与え
られかつ原始単語に結合された目標単語の目標仮説の文
脈が与えられた場合の原始単語の条件付き発生確率の推
定値を含む。各目標仮説について、翻訳合致スコアは、
目標仮説の単語合致スコアと入力された一連の原始単語
の原始単語との組合せを含む。目標仮説合致スコアは、
目標仮説の言語モデル合致スコアと目標仮説の翻訳合致
スコアとの組合せを含む。最良の目標仮説合致スコアを
有する目標仮説が出力される。
Description
【0001】
【産業上の利用分野】本発明は、フランス文から英文へ
のコンピュータによる翻訳などのコンピュータ言語翻訳
に関する。
のコンピュータによる翻訳などのコンピュータ言語翻訳
に関する。
【0002】
【従来の技術】ピーター・F・ブラウン(Peter F. Bro
wn)他の"Method and system For Natural Language Tr
anslation"と題する1991年7月25日出願の米国特
許出願第07/736278号(この内容のすべてを参
照により本明細書に組み込む)に、原始言語のテキスト
Fを目標言語のテキストEに翻訳するためのコンピュー
タ翻訳システムが記載されている。そこに記載されたシ
ステムは、いくつかの仮定目標言語テキストEの各々に
ついて、原始言語テキストFが与えられた場合の目標言
語テキストEの条件付き確率P(E|F)を評価する。
最高の条件付き確率P(E|F)を有する仮定目標言語
テキストEハットが、原始言語テキストFの翻訳として
選択される。
wn)他の"Method and system For Natural Language Tr
anslation"と題する1991年7月25日出願の米国特
許出願第07/736278号(この内容のすべてを参
照により本明細書に組み込む)に、原始言語のテキスト
Fを目標言語のテキストEに翻訳するためのコンピュー
タ翻訳システムが記載されている。そこに記載されたシ
ステムは、いくつかの仮定目標言語テキストEの各々に
ついて、原始言語テキストFが与えられた場合の目標言
語テキストEの条件付き確率P(E|F)を評価する。
最高の条件付き確率P(E|F)を有する仮定目標言語
テキストEハットが、原始言語テキストFの翻訳として
選択される。
【数1】 をEハットで表す。
【0003】ベイズの定理を用いて、原始言語テキスト
Fが与えられた場合の目標言語テキストEの条件付き確
率P(E|F)は下記のように表すことができる。
Fが与えられた場合の目標言語テキストEの条件付き確
率P(E|F)は下記のように表すことができる。
【数2】 P(E|F)=P(F|E)P(E)/P(F) (1)
【0004】数式1の分母である原始言語テキストFの
確率P(F)は目標言語テキストEとは独立であるの
で、最高の条件付き確率P(E|F)を有する仮定目標
言語テキストEハットが、最高の積P(F|E)P
(E)をも有することになる。したがって次式が得られ
る。
確率P(F)は目標言語テキストEとは独立であるの
で、最高の条件付き確率P(E|F)を有する仮定目標
言語テキストEハットが、最高の積P(F|E)P
(E)をも有することになる。したがって次式が得られ
る。
【数3】
【0005】数式2では、目標言語テキストEの確率P
(E)は言語モデル適合スコアであり、目標言語モデル
から推定される。目標言語テキストEの確率P(E)を
推定するためにどのような既知の言語モデルを使用して
もよいが、上記の関連米国特許出願第07/73627
号では、補間推定でその値が得られるパラメータによっ
て組み合わされた1グラム・モデル、2グラム・モデ
ル、及び3グラム・モデルを含むnグラム言語モデルを
記載している。
(E)は言語モデル適合スコアであり、目標言語モデル
から推定される。目標言語テキストEの確率P(E)を
推定するためにどのような既知の言語モデルを使用して
もよいが、上記の関連米国特許出願第07/73627
号では、補間推定でその値が得られるパラメータによっ
て組み合わされた1グラム・モデル、2グラム・モデ
ル、及び3グラム・モデルを含むnグラム言語モデルを
記載している。
【0006】式2における条件付き確率P(F|E)
は、翻訳適合スコアである。上記の関連特許出願に記載
されているように、一連の目標単語を含む目標仮説Eが
与えられた場合の一連の原始単語を含む原始テキストF
の翻訳適合スコアP(F|E)は、原始テキストF中の
原始単語を目標テキストE中の目標単語に結合するすべ
ての可能なアラインメントを見つけることによって推定
され、これらのアラインメントには、1つまたは複数の
原始単語がどの目標単語にも結合されていないようなア
ラインメントは含まれるが、原始単語が複数の目標単語
に結合されているアラインメントは含まれない。原始テ
キストF中のφ原始単語に結合された目標テキストE中
の各アラインメント及び各目標単語eについて、目標単
語eがアラインメント中のφ原始単語に結合される、フ
ァーティリティ確率n(φ|e)が推定される。また、
原始テキストF中の各原始単語fとアラインメントによ
って原始単語fに結合された目標テキストE中の各目標
単語eについて、結合された目標単語eの発生が与えら
れた場合に原始単語fが発生する、語彙確率t(f|
e)が推定される。
は、翻訳適合スコアである。上記の関連特許出願に記載
されているように、一連の目標単語を含む目標仮説Eが
与えられた場合の一連の原始単語を含む原始テキストF
の翻訳適合スコアP(F|E)は、原始テキストF中の
原始単語を目標テキストE中の目標単語に結合するすべ
ての可能なアラインメントを見つけることによって推定
され、これらのアラインメントには、1つまたは複数の
原始単語がどの目標単語にも結合されていないようなア
ラインメントは含まれるが、原始単語が複数の目標単語
に結合されているアラインメントは含まれない。原始テ
キストF中のφ原始単語に結合された目標テキストE中
の各アラインメント及び各目標単語eについて、目標単
語eがアラインメント中のφ原始単語に結合される、フ
ァーティリティ確率n(φ|e)が推定される。また、
原始テキストF中の各原始単語fとアラインメントによ
って原始単語fに結合された目標テキストE中の各目標
単語eについて、結合された目標単語eの発生が与えら
れた場合に原始単語fが発生する、語彙確率t(f|
e)が推定される。
【0007】各アラインメント及び各原始単語fについ
て、上記の関連特許出願ではさらに、原始単語fに結合
された目標単語eが目標テキストE中の位置ajにある
と仮定し、かつ原始テキストF中にm個の単語があると
仮定して、原始単語fが原始テキストFの位置jにあ
る、ひずみ確率a(j|aj,m)を推定している。
て、上記の関連特許出願ではさらに、原始単語fに結合
された目標単語eが目標テキストE中の位置ajにある
と仮定し、かつ原始テキストF中にm個の単語があると
仮定して、原始単語fが原始テキストFの位置jにあ
る、ひずみ確率a(j|aj,m)を推定している。
【0008】アラインメントのファーティリティ確率と
目標テキストE中のすべての目標単語eのファーティリ
ティ確率とを組み合わせ、その結果にアラインメント中
のどの原始単語とも結合されていない目標単語の数φ0
の確率
目標テキストE中のすべての目標単語eのファーティリ
ティ確率とを組み合わせ、その結果にアラインメント中
のどの原始単語とも結合されていない目標単語の数φ0
の確率
【数4】 を掛けることにより、アラインメント中の目標テキスト
E中のすべての目標単語のファーティリティの和φが与
えられているものとして、目標テキストEとアラインメ
ントのファーティリティ・スコアが得られる。
E中のすべての目標単語のファーティリティの和φが与
えられているものとして、目標テキストEとアラインメ
ントのファーティリティ・スコアが得られる。
【0009】アラインメントの語彙確率と原始テキスト
F中のすべての原始単語の語彙確率とを組み合わせて、
アラインメントの語彙スコアが得られる。
F中のすべての原始単語の語彙確率とを組み合わせて、
アラインメントの語彙スコアが得られる。
【0010】アラインメントのひずみ確率とアラインメ
ント中の目標単語に結合されている原始テキストF中の
すべての原始単語のひずみ確率とを組み合わせ、その結
果に1/φ0!(ただし、φ0はどの原始単語とも結合さ
れていない目標テキストE中の目標単語の数)を掛ける
ことにより、アラインメントのひずみスコアが得られ
る。
ント中の目標単語に結合されている原始テキストF中の
すべての原始単語のひずみ確率とを組み合わせ、その結
果に1/φ0!(ただし、φ0はどの原始単語とも結合さ
れていない目標テキストE中の目標単語の数)を掛ける
ことにより、アラインメントのひずみスコアが得られ
る。
【0011】結局、アラインメントのファーティリティ
スコア、語彙スコア、及びひずみスコアを組み合わせ、
その結果に組合せ係数
スコア、語彙スコア、及びひずみスコアを組み合わせ、
その結果に組合せ係数
【数5】 を掛けることによって、アラインメントの翻訳合致スコ
アが得られる。(上記の関連特許出願のセクション8.
2.を参照)
アが得られる。(上記の関連特許出願のセクション8.
2.を参照)
【0012】原始テキストFと目標仮説Eの翻訳合致ス
コアP(F|E)は、原始テキストFと目標仮説Eとの
間の許されるすべてのアラインメントの翻訳合致スコア
の和でもよい。原始テキストFと目標仮説Eの翻訳合致
スコアP(F/E)は、最も確率が高いと推定されたア
ラインメントの翻訳合致スコアであることが好ましい。
コアP(F|E)は、原始テキストFと目標仮説Eとの
間の許されるすべてのアラインメントの翻訳合致スコア
の和でもよい。原始テキストFと目標仮説Eの翻訳合致
スコアP(F/E)は、最も確率が高いと推定されたア
ラインメントの翻訳合致スコアであることが好ましい。
【0013】数式2を使って、仮説目標言語テキストE
と原始言語テキストFの目標仮説合致スコアP(F|
E)P(E)を直接推定することもできる。しかし、言
語モデルP(E)と翻訳モデルP(F|E)を簡単にす
るため、また管理可能な量の訓練データからこれらのモ
デルのパラメータを推定するために、上記の関連特許出
願では、目標言語テキストEと原始言語テキストFそれ
ぞれの簡略化された中間形式E'とF'の目標仮説合致ス
コアP(F|E)P(E)を推定している。各中間目標
言語単語e'は関係する目標言語単語のクラスを表す。
各中間原始言語単語f'は関係する原始言語単語のクラ
スを表す。原始言語変換機構が原始言語テキストFを中
間形式F'に変換する。最高の仮説合致スコアP(F'|
E')P(E')を有する仮説中間形式の目標言語テキス
トEハット'が、数式2から推定される。目標言語変換
機構が、最良に合致した中間目標言語テキストEハッ
ト'を目標言語テキストEハットに変換する。
と原始言語テキストFの目標仮説合致スコアP(F|
E)P(E)を直接推定することもできる。しかし、言
語モデルP(E)と翻訳モデルP(F|E)を簡単にす
るため、また管理可能な量の訓練データからこれらのモ
デルのパラメータを推定するために、上記の関連特許出
願では、目標言語テキストEと原始言語テキストFそれ
ぞれの簡略化された中間形式E'とF'の目標仮説合致ス
コアP(F|E)P(E)を推定している。各中間目標
言語単語e'は関係する目標言語単語のクラスを表す。
各中間原始言語単語f'は関係する原始言語単語のクラ
スを表す。原始言語変換機構が原始言語テキストFを中
間形式F'に変換する。最高の仮説合致スコアP(F'|
E')P(E')を有する仮説中間形式の目標言語テキス
トEハット'が、数式2から推定される。目標言語変換
機構が、最良に合致した中間目標言語テキストEハッ
ト'を目標言語テキストEハットに変換する。
【0014】上記の関連特許出願の言語翻訳システムで
は、各原始単語fの語彙確率を、アラインメント中の原
始単語に結合された目標単語eだけが与えられた場合の
各原始単語fの条件付き確率t(f|e)として推定し
ている。したがって語彙確率は原始単語fの確率の粗い
推定を提供するにすぎない。
は、各原始単語fの語彙確率を、アラインメント中の原
始単語に結合された目標単語eだけが与えられた場合の
各原始単語fの条件付き確率t(f|e)として推定し
ている。したがって語彙確率は原始単語fの確率の粗い
推定を提供するにすぎない。
【0015】
【発明が解決しようとする課題】本発明の目的は、改善
された原始単語語彙確率の推定を与える、第1言語の一
連の原始単語を第1言語とは異なる第2言語の一連の目
標単語に翻訳するための装置と方法を提供することであ
る。
された原始単語語彙確率の推定を与える、第1言語の一
連の原始単語を第1言語とは異なる第2言語の一連の目
標単語に翻訳するための装置と方法を提供することであ
る。
【0016】本発明の他の目的は、原始単語の語彙確率
が、アラインメント中の原始単語に結合された目標単語
が与えられかつ原始単語に結合された目標単語の文脈が
与えられた場合の条件付き確率として推定される、第1
言語の一連の原始単語を第1言語とは異なる第2言語の
一連の目標単語に翻訳するための装置と方法を提供する
ことである。
が、アラインメント中の原始単語に結合された目標単語
が与えられかつ原始単語に結合された目標単語の文脈が
与えられた場合の条件付き確率として推定される、第1
言語の一連の原始単語を第1言語とは異なる第2言語の
一連の目標単語に翻訳するための装置と方法を提供する
ことである。
【0017】
【課題を解決するための手段】本発明によれば、第1言
語の一連の原始単語を第1言語とは異なる第2言語の一
連の目標単語に翻訳するための装置は、一連の原始単語
を入力する手段を含む。また、少なくとも2つの目標仮
説を生成する手段も設けられる。各目標仮説は、第2言
語の語彙から選択された一連の目標単語を含む。各目標
単語は、目標仮説の少なくとも1つの他の単語を含む文
脈を有する。
語の一連の原始単語を第1言語とは異なる第2言語の一
連の目標単語に翻訳するための装置は、一連の原始単語
を入力する手段を含む。また、少なくとも2つの目標仮
説を生成する手段も設けられる。各目標仮説は、第2言
語の語彙から選択された一連の目標単語を含む。各目標
単語は、目標仮説の少なくとも1つの他の単語を含む文
脈を有する。
【0018】言語モデル合致スコア生成機構は、各目標
仮説について、目標仮説の一連の単語の発生確率の推定
値を含む言語モデル合致スコアを生成する。アラインメ
ント識別機構が、入力された一連の原始単語と各目標仮
説との間の少なくとも1つのアラインメントを識別す
る。アラインメントは、各原始単語を目標仮説の少なく
とも1つの目標単語に結合する。
仮説について、目標仮説の一連の単語の発生確率の推定
値を含む言語モデル合致スコアを生成する。アラインメ
ント識別機構が、入力された一連の原始単語と各目標仮
説との間の少なくとも1つのアラインメントを識別す
る。アラインメントは、各原始単語を目標仮説の少なく
とも1つの目標単語に結合する。
【0019】単語合致スコア生成機構は、各原始単語及
び各目標仮説について、原始単語に結合された目標仮説
の目標単語が与えられかつ原始単語に結合された目標仮
説の目標単語の文脈が与えられた場合の原始単語の条件
付き発生確率の推定値を含む、単語合致スコアを生成す
るために設けられる。翻訳合致スコア生成機構は、各目
標仮説について、その目標仮説の単語合致スコアと入力
された一連の原始単語中の原始単語との組合せを含む翻
訳合致スコアを生成する。
び各目標仮説について、原始単語に結合された目標仮説
の目標単語が与えられかつ原始単語に結合された目標仮
説の目標単語の文脈が与えられた場合の原始単語の条件
付き発生確率の推定値を含む、単語合致スコアを生成す
るために設けられる。翻訳合致スコア生成機構は、各目
標仮説について、その目標仮説の単語合致スコアと入力
された一連の原始単語中の原始単語との組合せを含む翻
訳合致スコアを生成する。
【0020】仮説合致スコア生成機構は、各目標仮説の
目標仮説合致スコアを生成するために設けられる。各目
標仮説合致スコアは、目標仮説の言語モデル合致スコア
と目標仮説の翻訳合致スコアとの組合せを含む。最良の
目標仮説合致スコアを有する目標仮説が出力部で提供さ
れる。
目標仮説合致スコアを生成するために設けられる。各目
標仮説合致スコアは、目標仮説の言語モデル合致スコア
と目標仮説の翻訳合致スコアとの組合せを含む。最良の
目標仮説合致スコアを有する目標仮説が出力部で提供さ
れる。
【0021】各目標仮説は、第2言語の単語を含む語彙
から選択された一連の目標単語と単語がないことを示す
空白単語とを含むことが好ましい。
から選択された一連の目標単語と単語がないことを示す
空白単語とを含むことが好ましい。
【0022】アラインメント識別機構は、入力された一
連の原始単語と各目標単語との間の2つまたはそれ以上
のアラインメントを識別する手段を含むこともできる。
各アラインメントは、各原始単語を目標仮説の少なくと
も1つの目標単語と結合する。単語合致スコア生成機構
は、各原始単語及び各アラインメント及び各目標仮説に
ついて、原始単語に結合された目標単語が与えられかつ
目標単語の文脈が与えられた場合の原始単語の条件付き
発生確率の推定値を含む、単語合致スコアを生成する。
翻訳合致スコア生成機構は、各目標仮説について、目標
仮説の単語合致スコアと入力された一連の原始単語中の
原始単語との組合せを含む、翻訳合致スコアを生成す
る。
連の原始単語と各目標単語との間の2つまたはそれ以上
のアラインメントを識別する手段を含むこともできる。
各アラインメントは、各原始単語を目標仮説の少なくと
も1つの目標単語と結合する。単語合致スコア生成機構
は、各原始単語及び各アラインメント及び各目標仮説に
ついて、原始単語に結合された目標単語が与えられかつ
目標単語の文脈が与えられた場合の原始単語の条件付き
発生確率の推定値を含む、単語合致スコアを生成する。
翻訳合致スコア生成機構は、各目標仮説について、目標
仮説の単語合致スコアと入力された一連の原始単語中の
原始単語との組合せを含む、翻訳合致スコアを生成す
る。
【0023】原始テキスト入力装置は、入力された一連
の原始単語を一連の変換原始単語に変換する手段を含
む。アラインメント手段は、一連の変換原始単語と各目
標仮説との間の少なくとも1つのアラインメントを識別
する。各アラインメントは、各変換原始単語を目標仮説
の少なくとも1つの目標単語に結合する。単語合致スコ
ア生成機構は、各変換原始単語及び各目標仮説につい
て、変換単語に結合された目標仮説の目標単語が与えら
れかつ変換原始単語に結合された目標仮説の目標単語の
文脈が与えられた場合の変換原始単語の条件付き発生確
率の推定値を含む、単語合致スコアを生成する。
の原始単語を一連の変換原始単語に変換する手段を含
む。アラインメント手段は、一連の変換原始単語と各目
標仮説との間の少なくとも1つのアラインメントを識別
する。各アラインメントは、各変換原始単語を目標仮説
の少なくとも1つの目標単語に結合する。単語合致スコ
ア生成機構は、各変換原始単語及び各目標仮説につい
て、変換単語に結合された目標仮説の目標単語が与えら
れかつ変換原始単語に結合された目標仮説の目標単語の
文脈が与えられた場合の変換原始単語の条件付き発生確
率の推定値を含む、単語合致スコアを生成する。
【0024】翻訳合致スコア生成機構は、各目標仮説に
ついて、目標仮説の単語合致スコアと変換原始単語との
組合せを含む翻訳合致スコアを生成する。最良の目標仮
説合致スコアを有する目標仮説から一連の出力単語を合
成するため、及び出力単語を出力するために出力手段が
設けられる。
ついて、目標仮説の単語合致スコアと変換原始単語との
組合せを含む翻訳合致スコアを生成する。最良の目標仮
説合致スコアを有する目標仮説から一連の出力単語を合
成するため、及び出力単語を出力するために出力手段が
設けられる。
【0025】目標仮説の翻訳合致スコアは、目標仮説の
単語合致スコアと入力された一連の原始単語中の原始単
語との積を含むことができる。目標仮説の目標仮説合致
スコアは、目標仮説の言語モデル合致スコアに目標仮説
のための翻訳合致スコアを掛けた積を含むことができ
る。
単語合致スコアと入力された一連の原始単語中の原始単
語との積を含むことができる。目標仮説の目標仮説合致
スコアは、目標仮説の言語モデル合致スコアに目標仮説
のための翻訳合致スコアを掛けた積を含むことができ
る。
【0026】原始単語に結合された目標仮説中の目標単
語の文脈は、2つまたはそれ以上の文脈クラスの少なく
とも1つ中に含まれることができる。原始単語に結合さ
れた目標単語が与えられかつ目標単語の文脈が与えられ
た場合の原始単語の推定条件付き発生確率は、目標単語
の文脈を含むクラスに依存する値を有する少なくとも1
つの関数を含む。
語の文脈は、2つまたはそれ以上の文脈クラスの少なく
とも1つ中に含まれることができる。原始単語に結合さ
れた目標単語が与えられかつ目標単語の文脈が与えられ
た場合の原始単語の推定条件付き発生確率は、目標単語
の文脈を含むクラスに依存する値を有する少なくとも1
つの関数を含む。
【0027】あるいは、原始単語の推定条件付き発生確
率は、原始単語に結合された目標単語の文脈における少
なくとも1つの単語の目標仮説における品詞に依存する
値、または原始単語に結合された目標単語の文脈におけ
る少なくとも1つの単語の識別に依存する値を有する関
数を含むことができる。
率は、原始単語に結合された目標単語の文脈における少
なくとも1つの単語の目標仮説における品詞に依存する
値、または原始単語に結合された目標単語の文脈におけ
る少なくとも1つの単語の識別に依存する値を有する関
数を含むことができる。
【0028】最良の合致スコアを有する目標仮説を出力
する手段は、ディスプレイを含むことができる。入力手
段は、キーボード、コンピュータ・ディスク駆動機構、
またはコンピュータ・テープ駆動機構を含むことができ
る。
する手段は、ディスプレイを含むことができる。入力手
段は、キーボード、コンピュータ・ディスク駆動機構、
またはコンピュータ・テープ駆動機構を含むことができ
る。
【0029】原始単語の語彙確率を、アラインメントの
原始単語に結合された目標単語が与えられかつ原始単語
に結合された目標単語の文脈が与えられた場合の原始単
語の条件付き確率として推定することにより、本発明で
は、精度が改善された翻訳合致スコアが得られる。
原始単語に結合された目標単語が与えられかつ原始単語
に結合された目標単語の文脈が与えられた場合の原始単
語の条件付き確率として推定することにより、本発明で
は、精度が改善された翻訳合致スコアが得られる。
【0030】
【実施例】図1は、本発明による第1言語から第2言語
に単語を翻訳する装置の一例のブロック図である。この
装置は、一連の原始単語を入力するための原始テキスト
入力装置10を含む。原始テキスト入力装置10は、例
えばキーボード、コンピュータ・ディスク駆動機構、ま
たはコンピュータ・テープ駆動機構を含むことができ
る。
に単語を翻訳する装置の一例のブロック図である。この
装置は、一連の原始単語を入力するための原始テキスト
入力装置10を含む。原始テキスト入力装置10は、例
えばキーボード、コンピュータ・ディスク駆動機構、ま
たはコンピュータ・テープ駆動機構を含むことができ
る。
【0031】原始テキスト入力装置10はさらに、入力
された一連の原始単語を一連の変換原始単語に変換する
手段を含むことができる。各変換原始単語は1組の関連
入力原始単語を表すことができる。例えば、このセット
の各入力原始単語{etre, etant, ete, suis, es, est.
sommes, etes, sont, fus, fumes, serai, serons,soi
s, soit, soyons, soyez, soient}はフランス語不定動
詞"etre"の変化形であり、元来の入力原始単語の時制を
表すタグ付きの"etre"に変換できる。
された一連の原始単語を一連の変換原始単語に変換する
手段を含むことができる。各変換原始単語は1組の関連
入力原始単語を表すことができる。例えば、このセット
の各入力原始単語{etre, etant, ete, suis, es, est.
sommes, etes, sont, fus, fumes, serai, serons,soi
s, soit, soyons, soyez, soient}はフランス語不定動
詞"etre"の変化形であり、元来の入力原始単語の時制を
表すタグ付きの"etre"に変換できる。
【0032】入力された一連の原始単語を一連の変換原
始単語に変換する手段は、上記の関連特許出願のセクシ
ョン3、4、11に記載の原始変換機構を含むことがで
きる。基本的に、これらの変換機構は入力原始単語のス
ペルの検査と訂正、入力原始単語の格の検査と訂正、入
力された一連の原始単語における文書タイトルの検出、
及び入力された一連の原始単語における名前の検出を行
う。変換機構はまた、各入力原始単語を原始単語の最も
確からしい品詞でタグ付けし、未知の原始単語(記憶さ
れた原始単語語彙に含まれいないもの)をフラグ付けす
る。入力された一連の原始単語を変換する手段はまた、
入力された原始単語の複数単語単位を単一の変換原始単
語に分解し、複合入力原始単語を2つ以上の変換原始単
語に分割する。入力された一連の原始単語を一連の変換
原始単語に変換する手段はさらに、1単語の様々な形の
単一基本形への言語的変換または形態的変換を実施す
る。最後に、入力された一連の原始単語を変換する手段
はまた、各入力原始単語の意味を推定し、この意味を変
換された原始単語に割り当てる。
始単語に変換する手段は、上記の関連特許出願のセクシ
ョン3、4、11に記載の原始変換機構を含むことがで
きる。基本的に、これらの変換機構は入力原始単語のス
ペルの検査と訂正、入力原始単語の格の検査と訂正、入
力された一連の原始単語における文書タイトルの検出、
及び入力された一連の原始単語における名前の検出を行
う。変換機構はまた、各入力原始単語を原始単語の最も
確からしい品詞でタグ付けし、未知の原始単語(記憶さ
れた原始単語語彙に含まれいないもの)をフラグ付けす
る。入力された一連の原始単語を変換する手段はまた、
入力された原始単語の複数単語単位を単一の変換原始単
語に分解し、複合入力原始単語を2つ以上の変換原始単
語に分割する。入力された一連の原始単語を一連の変換
原始単語に変換する手段はさらに、1単語の様々な形の
単一基本形への言語的変換または形態的変換を実施す
る。最後に、入力された一連の原始単語を変換する手段
はまた、各入力原始単語の意味を推定し、この意味を変
換された原始単語に割り当てる。
【0033】表1は、本発明による入力された一連の原
始単語の仮説例である。この例では、原始単語はフラン
ス語の単語である。
始単語の仮説例である。この例では、原始単語はフラン
ス語の単語である。
【表1】入力された一連の原始単語、F f1 f2 f3 f4 f5 f6 La clef est dans la porte
【0034】本発明による翻訳装置は、目標仮説生成機
構12をさらに含む。この目標仮説生成機構12は、少
なくとも2つの目標仮説を生成する。各目標仮説は、第
2言語の単語語彙から選択された一連の目標単語を含
む。第2言語の単語語彙を、目標言語語彙記憶域14に
記憶することができる。目標仮説の各目標単語は、目標
仮説の少なくとも1つの他の単語を含む文脈を持つ。
構12をさらに含む。この目標仮説生成機構12は、少
なくとも2つの目標仮説を生成する。各目標仮説は、第
2言語の単語語彙から選択された一連の目標単語を含
む。第2言語の単語語彙を、目標言語語彙記憶域14に
記憶することができる。目標仮説の各目標単語は、目標
仮説の少なくとも1つの他の単語を含む文脈を持つ。
【0035】目標仮説生成機構の一例は、前記特許出願
のセクション14に記載されている。
のセクション14に記載されている。
【0036】表2に、目標仮説E1、E2、E3の一仮説
例を示す。この例では、目標単語は単語である。
例を示す。この例では、目標単語は単語である。
【表2】
【0037】各目標仮説は、第2言語の単語を含む語彙
から選択された一連の目標単語と、単語が存在しないこ
とを表す空白単語を含む。表2では、目標仮説Ehの全
部が「空白」単語を含むものと見なされる。
から選択された一連の目標単語と、単語が存在しないこ
とを表す空白単語を含む。表2では、目標仮説Ehの全
部が「空白」単語を含むものと見なされる。
【0038】再び図1を見ると、翻訳装置は、各目標仮
説について、目標仮説の一連の単語の発生確率の推定値
を含む言語モデル合致スコアを生成するための、言語モ
デル合致スコア生成機構16を含む。上記の関連特許出
願のセクション6と7に言語モデル合致スコア生成機構
の一例が記載されている。どんな既知のモデルでも目標
仮説の一連の単語の発生確率を推定するのに使用できる
が、上記の関連特許出願では、補間推定によってその値
が得られるパラメータによって組み合わされた1グラム
・モデル、2グラム・モデル、及び3グラム・モデルを
含むnグラム言語モデルを記載している。
説について、目標仮説の一連の単語の発生確率の推定値
を含む言語モデル合致スコアを生成するための、言語モ
デル合致スコア生成機構16を含む。上記の関連特許出
願のセクション6と7に言語モデル合致スコア生成機構
の一例が記載されている。どんな既知のモデルでも目標
仮説の一連の単語の発生確率を推定するのに使用できる
が、上記の関連特許出願では、補間推定によってその値
が得られるパラメータによって組み合わされた1グラム
・モデル、2グラム・モデル、及び3グラム・モデルを
含むnグラム言語モデルを記載している。
【0039】翻訳装置はさらに、入力された一連の原始
単語と各目標仮説の間の少なくとも1つのアラインメン
トを識別するための、アラインメント識別機構18を含
む。アラインメントは、各原始単語を目標仮説の少なく
とも1つの目標単語に結合する。
単語と各目標仮説の間の少なくとも1つのアラインメン
トを識別するための、アラインメント識別機構18を含
む。アラインメントは、各原始単語を目標仮説の少なく
とも1つの目標単語に結合する。
【0040】図2、3、4に、表1における一連の仮説
入力原始単語と表2における目標仮説E1の一連の仮説
入力目標単語との間の可能なアラインメントの例を概略
的に示す。各アラインメントにおいて、入力された一連
の原始単語F中の各原始単語は、目標仮説E1の少なく
とも1つの目標単語に実線で結合されている。図4のア
ラインメントでは、原始単語の第2の発生"La"からの実
線はなく、したがって「空白」単語に結合されるものと
見なされる。
入力原始単語と表2における目標仮説E1の一連の仮説
入力目標単語との間の可能なアラインメントの例を概略
的に示す。各アラインメントにおいて、入力された一連
の原始単語F中の各原始単語は、目標仮説E1の少なく
とも1つの目標単語に実線で結合されている。図4のア
ラインメントでは、原始単語の第2の発生"La"からの実
線はなく、したがって「空白」単語に結合されるものと
見なされる。
【0041】表3、4、5は、それぞれ図2、3、4の
アラインメントを別の形で示したものである。
アラインメントを別の形で示したものである。
【表3】
【表4】
【表5】
【0042】各表で、1からm(mは入力された一連の
原始単語における単語の数)の範囲の各パラメータjに
ついて、0〜lの範囲にある単一の値を持つ他のパラメ
ータajがある(ただし、lは目標仮説における単語の
数)。
原始単語における単語の数)の範囲の各パラメータjに
ついて、0〜lの範囲にある単一の値を持つ他のパラメ
ータajがある(ただし、lは目標仮説における単語の
数)。
【0043】所与のアラインメントについて、入力され
た一連の原始単語中の各単語fjが、目標仮説の単語ea
jに結合されている。
た一連の原始単語中の各単語fjが、目標仮説の単語ea
jに結合されている。
【0044】一般に、一連のm個の原始単語と一連のl
個の非空白目標単語との間には2lm通りの可能なアライ
ンメントがあり、この場合、各原始単語は空白原始単語
または1つまたは複数の非空白目標単語のいずれかに結
合される。各原始単語がただ1つの空白または非空白目
標単語に結合されるように制約されている場合には、m
(l+1)通りの可能なアラインメントがある。
個の非空白目標単語との間には2lm通りの可能なアライ
ンメントがあり、この場合、各原始単語は空白原始単語
または1つまたは複数の非空白目標単語のいずれかに結
合される。各原始単語がただ1つの空白または非空白目
標単語に結合されるように制約されている場合には、m
(l+1)通りの可能なアラインメントがある。
【0045】入力された一連の原始単語と各目標仮説と
の間のただ1つのアラインメントが、あとで説明するよ
うに、各原始単語について単語合致スコアを得るために
識別されることが好ましい。一連の原始単語と各目標仮
説のための1つの識別されたアラインメントは、上記の
関連特許出願のセクション14に記載されているよう
に、目標仮説生成機構によって生成されることが好まし
い。
の間のただ1つのアラインメントが、あとで説明するよ
うに、各原始単語について単語合致スコアを得るために
識別されることが好ましい。一連の原始単語と各目標仮
説のための1つの識別されたアラインメントは、上記の
関連特許出願のセクション14に記載されているよう
に、目標仮説生成機構によって生成されることが好まし
い。
【0046】原始テキスト入力装置10が、入力された
一連の原始単語を一連の変換原始単語に変換するための
手段を含む場合には、アラインメント識別機構18は、
一連の変換原始単語と各目標仮説との間の少なくとも1
つのアラインメントを識別する。アラインメントは、各
変換原始単語を目標仮説の少なくとも1つの目標単語に
結合する。
一連の原始単語を一連の変換原始単語に変換するための
手段を含む場合には、アラインメント識別機構18は、
一連の変換原始単語と各目標仮説との間の少なくとも1
つのアラインメントを識別する。アラインメントは、各
変換原始単語を目標仮説の少なくとも1つの目標単語に
結合する。
【0047】再び図1を見ると、翻訳装置はさらに単語
合致スコア生成機構20を含む。単語合致スコア生成機
構20は、各原始単語及び各目標仮説について、原始単
語fに結合された目標仮説の目標単語eが与えられかつ
原始単語fに結合された目標仮説の目標単語eの文脈X
が与えられた場合の原始単語fの条件付き発生確率P
(f|e,X)の推定値を含む、単語合致スコアを生成
する。
合致スコア生成機構20を含む。単語合致スコア生成機
構20は、各原始単語及び各目標仮説について、原始単
語fに結合された目標仮説の目標単語eが与えられかつ
原始単語fに結合された目標仮説の目標単語eの文脈X
が与えられた場合の原始単語fの条件付き発生確率P
(f|e,X)の推定値を含む、単語合致スコアを生成
する。
【0048】表6は、表1の入力された一連の原始単語
Fによる表3のアラインメントA1,1についての表2の
目標仮説E1の各目標単語eajの文脈Xの仮説例を示
す。
Fによる表3のアラインメントA1,1についての表2の
目標仮説E1の各目標単語eajの文脈Xの仮説例を示
す。
【表6】
【0049】表6に示すように、この仮説例では、選択
された目標単語の文脈Xは、目標仮説における選択され
た目標単語に先行する3つの目標単語と選択された目標
単語に続く3つの目標単語から成る。この文脈は句読点
と単語不在も含む。
された目標単語の文脈Xは、目標仮説における選択され
た目標単語に先行する3つの目標単語と選択された目標
単語に続く3つの目標単語から成る。この文脈は句読点
と単語不在も含む。
【0050】一般に、原始単語fjに結合された目標仮
説Eの目標単語eajの文脈は、2つ以上の文脈クラスの
少なくとも1つに含まれる。原始単語に結合された目標
仮説の目標単語が与えられかつ原始単語に結合された目
標単語の文脈が与えられた場合の原始単語の推定条件付
き発生確率は、原始単語に結合された目標単語の文脈を
含むクラスに依存する値を有する少なくとも1つの関数
を含むことができる。
説Eの目標単語eajの文脈は、2つ以上の文脈クラスの
少なくとも1つに含まれる。原始単語に結合された目標
仮説の目標単語が与えられかつ原始単語に結合された目
標単語の文脈が与えられた場合の原始単語の推定条件付
き発生確率は、原始単語に結合された目標単語の文脈を
含むクラスに依存する値を有する少なくとも1つの関数
を含むことができる。
【0051】あるいは、文脈は、目標仮説の品詞を有す
る少なくとも1つの単語を含むことができる。原始単語
に結合された目標仮説の目標単語が与えられかつ原始単
語に結合された目標単語の文脈が与えられた場合の原始
単語の推定条件付き発生確率は、原始単語に結合された
目標単語の文脈の少なくとも1つの単語の目標仮説の品
詞に依存する値を有する、少なくとも1つの関数を含む
ことができる。
る少なくとも1つの単語を含むことができる。原始単語
に結合された目標仮説の目標単語が与えられかつ原始単
語に結合された目標単語の文脈が与えられた場合の原始
単語の推定条件付き発生確率は、原始単語に結合された
目標単語の文脈の少なくとも1つの単語の目標仮説の品
詞に依存する値を有する、少なくとも1つの関数を含む
ことができる。
【0052】他の例では、原始単語に結合された目標仮
説の目標単語の文脈は、識別を有する少なくとも1つの
単語を含む。原始単語に結合された目標仮説の目標単語
が与えられかつ原始単語に結合された目標単語の文脈が
与えられた場合の原始単語の推定条件付き発生確率は、
原始単語に結合された目標単語の文脈の少なくとも1つ
の単語の識別に依存する値を有する、少なくとも1つの
関数を含む。
説の目標単語の文脈は、識別を有する少なくとも1つの
単語を含む。原始単語に結合された目標仮説の目標単語
が与えられかつ原始単語に結合された目標単語の文脈が
与えられた場合の原始単語の推定条件付き発生確率は、
原始単語に結合された目標単語の文脈の少なくとも1つ
の単語の識別に依存する値を有する、少なくとも1つの
関数を含む。
【0053】数式3、4、5および6は、原始単語に結
合された目標単語の文脈に依存する値を有する関数の仮
説例である。
合された目標単語の文脈に依存する値を有する関数の仮
説例である。
【数6】 g1(f,e=key,X)=1, f="clef"、かつ"key"の直前にあるX中の単 語x3が"the"である場合 (3) =0, 上記でない場合
【数7】 g2(f,e=key,X)=1, f="clef"、かつ"key"の直前にあるX中の単 語x3が"car"である場合 (4) =0, 上記でない場合
【数8】 g3(f,e=key,X)=1, f="ton"、かつ"key"の直前にあるXの単語 x3が"the"である場合 (5 ) =0, 上記でない場合
【数9】 g4(f,e=key,X)=1, f="ton"、かつ"key"の直後にくるX中の単 語x4または"key"の次の次にくるX中の単語x5が、集合{A、B、C、D、E 、FG}の一要素である場合 ( 6) =0, 上記でない場合
【0054】数式3において、関数g1は、原始単語f
が"clef"であり、目標単語eが"key"であり、"key"の直
線にある文脈X中の単語が"the"である場合、1の値を
持つ。これらの条件に合っていない場合には、文脈関数
g1は0の値を持つ。
が"clef"であり、目標単語eが"key"であり、"key"の直
線にある文脈X中の単語が"the"である場合、1の値を
持つ。これらの条件に合っていない場合には、文脈関数
g1は0の値を持つ。
【0055】数式4の仮説文脈関数g2は、原始単語f
が"clef"であり、目標単語eが"key"であり、"key"の直
前にある文脈X中の単語が"car"である場合、1の値を
持つ。これらの条件に合っていない場合には、関数g2
は0の値を持つ。
が"clef"であり、目標単語eが"key"であり、"key"の直
前にある文脈X中の単語が"car"である場合、1の値を
持つ。これらの条件に合っていない場合には、関数g2
は0の値を持つ。
【0056】数式5において、文脈関数g3は、原始単
語fが"ton"であり、目標単語eが"key"であり、"key"
の直前にある文脈X中の単語が"the"である場合、1の
値を持つ。これらの条件に合っていない場合には、文脈
関数g3は0の値を持つ。
語fが"ton"であり、目標単語eが"key"であり、"key"
の直前にある文脈X中の単語が"the"である場合、1の
値を持つ。これらの条件に合っていない場合には、文脈
関数g3は0の値を持つ。
【0057】最後に、数式6における仮説文脈関数g4
は、原始単語fが"ton"であり、目標単語eが"key"であ
り、"key"の直後にくる文脈X中の単語、または"key"の
次の次にくる文脈X中の単語が、集合{A、B、C、
D、E、F、G}の一要素である場合、1の値を持つ。
これらの条件に合っていない場合には、文脈関数g4は
0の値を持つ。
は、原始単語fが"ton"であり、目標単語eが"key"であ
り、"key"の直後にくる文脈X中の単語、または"key"の
次の次にくる文脈X中の単語が、集合{A、B、C、
D、E、F、G}の一要素である場合、1の値を持つ。
これらの条件に合っていない場合には、文脈関数g4は
0の値を持つ。
【0058】表7は、原始単語f="clef"、目標単語e
="key"の場合の、表2の目標仮説E1の目標単語"key"
の文脈Xに関する文脈関数g(f,e,X)の評価を示
す。
="key"の場合の、表2の目標仮説E1の目標単語"key"
の文脈Xに関する文脈関数g(f,e,X)の評価を示
す。
【表7】
【0059】表7に示すように、文脈関数g1は1の値
を持ち、文脈関数g2、g3、g4は0の値を持つ。
を持ち、文脈関数g2、g3、g4は0の値を持つ。
【0060】上述のように、各原始単語及び各目標仮説
の単語合致スコアは、原始単語fに結合された目標仮説
の目標単語eが与えられかつ原始単語fに結合された目
標単語eの文脈Xが与えられた場合の原始単語fの条件
付き発生確率P(f|e,X)の推定値を含む。単語合
致スコアは、例えば次の数式によって定義されたモデル
を用いて得ることができる。
の単語合致スコアは、原始単語fに結合された目標仮説
の目標単語eが与えられかつ原始単語fに結合された目
標単語eの文脈Xが与えられた場合の原始単語fの条件
付き発生確率P(f|e,X)の推定値を含む。単語合
致スコアは、例えば次の数式によって定義されたモデル
を用いて得ることができる。
【数10】
【0061】数式7では、関数gi(f,e,X)は、
入力された一連の原始単語と目標仮説との間のアライン
メントにおける原始単語fの結合された目標単語eの文
脈Xに依存する値を有する関数である。パラメータλ
(e,i)は、文脈Xにおける目標単語eから原始単語fを
予測する際の各文脈関数giの相対的強度を表すパラメ
ータである。数量N(e,X)は、数式8に示すよう
に、目標単語eと目標単語eの文脈Xに依存する正規化
係数である。
入力された一連の原始単語と目標仮説との間のアライン
メントにおける原始単語fの結合された目標単語eの文
脈Xに依存する値を有する関数である。パラメータλ
(e,i)は、文脈Xにおける目標単語eから原始単語fを
予測する際の各文脈関数giの相対的強度を表すパラメ
ータである。数量N(e,X)は、数式8に示すよう
に、目標単語eと目標単語eの文脈Xに依存する正規化
係数である。
【数11】
【0062】目標単語e="key"の場合、上記の数式3
〜6の仮説文脈関数g1〜g4について、数式9は、原始
単語fのための単語合致スコアを生成する仮説モデルで
ある。
〜6の仮説文脈関数g1〜g4について、数式9は、原始
単語fのための単語合致スコアを生成する仮説モデルで
ある。
【数12】
【0063】数式9に関して、正規化N(e,X)は数
式10によって与えられる。
式10によって与えられる。
【数13】 (10)
【0064】このモデルの使い方を説明するために、モ
デル・パラメータの仮説値をλ(e=key,1)=0.12、λ(e=
key,2)=0.34、λ(e=key,3)=0.09、λ(e=key,4)=0.40
とする。
デル・パラメータの仮説値をλ(e=key,1)=0.12、λ(e=
key,2)=0.34、λ(e=key,3)=0.09、λ(e=key,4)=0.40
とする。
【0065】表8は、原始単語"clef"、目標単語"key"
の場合に、表2の目標仮説E1における"key"の文脈Xに
ついての数式7、9からの単語合致スコアの計算を示す
ものである。
の場合に、表2の目標仮説E1における"key"の文脈Xに
ついての数式7、9からの単語合致スコアの計算を示す
ものである。
【表8】
【数14】
【0066】この仮説例では、原始単語"clef"に結合さ
れた目標仮説の目標単語"key"が与えられかつ原始単語"
clef"に結合された目標仮説の目標単語"key"の文脈が与
えられた場合の原始単語の条件付き発生確率P("clef"
|"key",X)は、(数式9と10から)0.507となる。
れた目標仮説の目標単語"key"が与えられかつ原始単語"
clef"に結合された目標仮説の目標単語"key"の文脈が与
えられた場合の原始単語の条件付き発生確率P("clef"
|"key",X)は、(数式9と10から)0.507となる。
【0067】アラインメント識別機構18が、入力され
た一連の原始単語と各目標仮説との間の2つ以上のアラ
インメントを識別する場合、単語合致スコア生成機構
は、各原始単語及び各アラインメント及び各目標仮説に
ついて単語合致スコアを生成する。各単語合致スコアは
数式7のモデルを用いて推定できる。
た一連の原始単語と各目標仮説との間の2つ以上のアラ
インメントを識別する場合、単語合致スコア生成機構
は、各原始単語及び各アラインメント及び各目標仮説に
ついて単語合致スコアを生成する。各単語合致スコアは
数式7のモデルを用いて推定できる。
【0068】原始テキスト入力装置10が入力された一
連の原始単語を一連の変換原始単語に変換する手段を含
む場合には、単語合致スコア生成機構は、各変換原始単
語及び各目標仮説について単語合致スコアを生成する。
単語合致スコアは、変換原始単語に結合された目標仮説
の目標単語が与えられかつ変換原始単語に結合された目
標仮説の目標単語の文脈が与えられた場合の変換原始単
語の条件付き発生確率の推定値を含む。変換された単語
の単語合致スコアも数式7のモデルを用いて推定でき
る。
連の原始単語を一連の変換原始単語に変換する手段を含
む場合には、単語合致スコア生成機構は、各変換原始単
語及び各目標仮説について単語合致スコアを生成する。
単語合致スコアは、変換原始単語に結合された目標仮説
の目標単語が与えられかつ変換原始単語に結合された目
標仮説の目標単語の文脈が与えられた場合の変換原始単
語の条件付き発生確率の推定値を含む。変換された単語
の単語合致スコアも数式7のモデルを用いて推定でき
る。
【0069】本発明による翻訳装置さらには、翻訳合致
スコア生成機構22を含む。翻訳合致スコア生成機構2
2は、各目標仮説について、目標仮説と入力された一連
の原始単語中の原始単語の単語合致スコアの組合せを含
む、翻訳合致スコアを生成する。目標仮説のための翻訳
合致スコアは例えば、目標仮説と入力された一連の原始
単語中の原始単語の単語合致スコアの積を含む。
スコア生成機構22を含む。翻訳合致スコア生成機構2
2は、各目標仮説について、目標仮説と入力された一連
の原始単語中の原始単語の単語合致スコアの組合せを含
む、翻訳合致スコアを生成する。目標仮説のための翻訳
合致スコアは例えば、目標仮説と入力された一連の原始
単語中の原始単語の単語合致スコアの積を含む。
【0070】表9は、表1の入力された一連の原始単語
fj、及び表2の目標仮説E1の目標単語eajについて翻
訳合致スコアの計算を示す。
fj、及び表2の目標仮説E1の目標単語eajについて翻
訳合致スコアの計算を示す。
【表9】
【数15】 (本発明を説明するために、この例ではファーティリテ
ィスコアとひずみスコアを想定し、組合せ係数はすべて
1である)
ィスコアとひずみスコアを想定し、組合せ係数はすべて
1である)
【0071】各単語合致スコアP(fj|eaj,X)は
数式7から得られる。表9の数は仮説の数である。本発
明を説明するために、上記の関連特許出願のファーティ
リティスコアとひずみスコアは1に想定されている。
数式7から得られる。表9の数は仮説の数である。本発
明を説明するために、上記の関連特許出願のファーティ
リティスコアとひずみスコアは1に想定されている。
【0072】図1を再び見ると、翻訳装置は、各目標仮
説について目標仮説合致スコアを生成する仮説合致スコ
ア生成機構24を含む。各目標仮説合致スコアは、目標
仮説の言語モデル合致スコアと目標仮説の翻訳合致スコ
アの組合せ(たとえば積)を含む。上述のように、言語
モデル合致スコアは、上記の関連特許出願によって記載
されたnグラム言語モデルなどの既知の言語モデルから
得ることもできる。
説について目標仮説合致スコアを生成する仮説合致スコ
ア生成機構24を含む。各目標仮説合致スコアは、目標
仮説の言語モデル合致スコアと目標仮説の翻訳合致スコ
アの組合せ(たとえば積)を含む。上述のように、言語
モデル合致スコアは、上記の関連特許出願によって記載
されたnグラム言語モデルなどの既知の言語モデルから
得ることもできる。
【0073】アラインメント識別機構18が、入力され
た一連の原始単語と各目標仮説との間の2つ以上のアラ
インメントを識別する場合には、各目標仮説の翻訳合致
スコアは、目標仮説の単語合致スコアとアラインメント
と入力された一連の原始単語中の原始単語との組合せを
含む。
た一連の原始単語と各目標仮説との間の2つ以上のアラ
インメントを識別する場合には、各目標仮説の翻訳合致
スコアは、目標仮説の単語合致スコアとアラインメント
と入力された一連の原始単語中の原始単語との組合せを
含む。
【0074】原始テキスト入力装置10が、入力された
一連の原始単語を一連の変換原始単語に変換する手段を
含む場合には、翻訳合致スコアは、目標仮説の単語合致
スコアと変換原始単語との組合せを含む。
一連の原始単語を一連の変換原始単語に変換する手段を
含む場合には、翻訳合致スコアは、目標仮説の単語合致
スコアと変換原始単語との組合せを含む。
【0075】本発明による翻訳装置はさらに出力部26
を含む。出力部26は最良の目標仮説合致スコアを持つ
目標仮説を出力する。出力部26は、例えば表示装置ま
たはプリンタを含むことができる。
を含む。出力部26は最良の目標仮説合致スコアを持つ
目標仮説を出力する。出力部26は、例えば表示装置ま
たはプリンタを含むことができる。
【0076】原始テキスト入力装置10が入力された一
連の原始単語を一連の変換原始単語に変換する手段を含
む場合には、出力部26は、最良の目標仮説合致スコア
を持つ目標仮説から一連の出力単語を合成する手段を含
む。目標仮説合致スコアを持つ目標仮説から一連の出力
単語を合成する手段は、上記の関連特許出願のセクショ
ン5に記載されているような目標変換機構を含むことが
できる。例えば、元の原始入力単語の時制を示すタグ付
きの目標単語"be"は、不定詞"be"の変化形である合成出
力単語 {be, was, were, been, am, are, is, being} の1つに変換される。
連の原始単語を一連の変換原始単語に変換する手段を含
む場合には、出力部26は、最良の目標仮説合致スコア
を持つ目標仮説から一連の出力単語を合成する手段を含
む。目標仮説合致スコアを持つ目標仮説から一連の出力
単語を合成する手段は、上記の関連特許出願のセクショ
ン5に記載されているような目標変換機構を含むことが
できる。例えば、元の原始入力単語の時制を示すタグ付
きの目標単語"be"は、不定詞"be"の変化形である合成出
力単語 {be, was, were, been, am, are, is, being} の1つに変換される。
【0077】上述のように、数式7は、本発明に従って
単語合致スコアを得るために使用できるモデルの一例で
ある。単語合致スコア・モデルの文脈関数gi(f,
e,X)及び単語合致スコア・モデルのパラメータλ
(e,i)は下記のようにして得ることができる。
単語合致スコアを得るために使用できるモデルの一例で
ある。単語合致スコア・モデルの文脈関数gi(f,
e,X)及び単語合致スコア・モデルのパラメータλ
(e,i)は下記のようにして得ることができる。
【0078】候補文脈関数gi(f,e,X)は例え
ば、前記の表6の例に示すように、目標仮説における目
標単語の文脈Xを目標単語eの左側3単語と目標単語e
の右側3単語に制限することによって、得ることができ
る。
ば、前記の表6の例に示すように、目標仮説における目
標単語の文脈Xを目標単語eの左側3単語と目標単語e
の右側3単語に制限することによって、得ることができ
る。
【0079】次に、相互の翻訳である原始言語文と目標
言語文の訓練テキストが得られる。相互の翻訳である対
応する原始言語文と目標言語文を、例えば熟練した翻訳
者が固定することができる。相互の翻訳である対応する
原始言語文と目標言語文は、例えば上記の関連特許出願
のセクション12と13に記載の方法によって、自動的
に識別できることが好ましい。
言語文の訓練テキストが得られる。相互の翻訳である対
応する原始言語文と目標言語文を、例えば熟練した翻訳
者が固定することができる。相互の翻訳である対応する
原始言語文と目標言語文は、例えば上記の関連特許出願
のセクション12と13に記載の方法によって、自動的
に識別できることが好ましい。
【0080】訓練テキストにおける対応する原始文と目
標文の各対について、原始単語と目標単語との間の推定
された最も確率の高いアラインメントを、アラインメン
ト識別機構18によって使用される前記の方法を用いて
見つける。次に、訓練テキストにおける目標単語eajの
各発生を識別し、各アラインメントにおける目標単語e
ajに結合された原始単語fjでタグ付けする。目標単語
eajも各目標文における文脈Xでタグ付けする。
標文の各対について、原始単語と目標単語との間の推定
された最も確率の高いアラインメントを、アラインメン
ト識別機構18によって使用される前記の方法を用いて
見つける。次に、訓練テキストにおける目標単語eajの
各発生を識別し、各アラインメントにおける目標単語e
ajに結合された原始単語fjでタグ付けする。目標単語
eajも各目標文における文脈Xでタグ付けする。
【0081】表10は、整列された原始言語文と目標言
語文の訓練テキストにおける目標単語eaj="key"に関
する、訓練イベントの仮説例を示す。
語文の訓練テキストにおける目標単語eaj="key"に関
する、訓練イベントの仮説例を示す。
【表10】
【0082】候補文脈関数gi(f,e,X)は、訓練
テキストからの目標単語eajの訓練イベントを用いて、
まず文脈関数の形式を識別することによって得られる。
例えば、ある形式の文脈関数は、文脈中の1つまたは複
数の位置における特定単語の存在をテストする。別の形
式の文脈関数は、文脈中の1つまたは複数の位置におけ
る特定の単語クラス(例えば品詞)の存在をテストす
る。目標単語eの文脈関数においてテストすべき特定の
単語または単語クラスは、訓練テキスト中の目標単語e
の文脈における単語または単語クラスから得ることがで
きる。
テキストからの目標単語eajの訓練イベントを用いて、
まず文脈関数の形式を識別することによって得られる。
例えば、ある形式の文脈関数は、文脈中の1つまたは複
数の位置における特定単語の存在をテストする。別の形
式の文脈関数は、文脈中の1つまたは複数の位置におけ
る特定の単語クラス(例えば品詞)の存在をテストす
る。目標単語eの文脈関数においてテストすべき特定の
単語または単語クラスは、訓練テキスト中の目標単語e
の文脈における単語または単語クラスから得ることがで
きる。
【0083】あるいは、候補文脈関数gi(f,e,
X)を、上記の関連特許出願のセクション7に記載の方
法を使用して、文脈Xに従って訓練イベントをクラス化
することによって得ることができる。
X)を、上記の関連特許出願のセクション7に記載の方
法を使用して、文脈Xに従って訓練イベントをクラス化
することによって得ることができる。
【0084】最初に、数式7の単語合致スコア・モデル
のパラメータλ(e,i)をすべてゼロに設定する。
のパラメータλ(e,i)をすべてゼロに設定する。
【0085】各候補文脈関数gi(f,e,X)につい
て、「メリットの尺度」G(i)を数式11に従って算
出する。
て、「メリットの尺度」G(i)を数式11に従って算
出する。
【数16】
【数17】
【数18】
【数19】
【0086】数式11ないし14では、結合目標単語e
の文脈Xが与えられた場合の原始単語fの条件付き確率
P(f|X)が、モデル・パラメータの最も新しい値を
用いて、数式7から得られる。文脈Xの確率P(X)
は、表10に示す形式の訓練テキスト・イベントにおけ
る目標単語eと文脈Xの発生をカウントし、そのカウン
トを、目標単語をeとする訓練テキストにおけるイベン
トの全数で割ることによって得られる。原始単語fと文
脈Xの確率P(f,X)は、表10に示す形式の訓練テ
キスト・イベントにおける目標単語e、文脈X、及び原
始単語fの発生をカウントし、各カウントを、目標単語
をeとする訓練テキストにおけるイベントの全数で割る
ことによって得られる。
の文脈Xが与えられた場合の原始単語fの条件付き確率
P(f|X)が、モデル・パラメータの最も新しい値を
用いて、数式7から得られる。文脈Xの確率P(X)
は、表10に示す形式の訓練テキスト・イベントにおけ
る目標単語eと文脈Xの発生をカウントし、そのカウン
トを、目標単語をeとする訓練テキストにおけるイベン
トの全数で割ることによって得られる。原始単語fと文
脈Xの確率P(f,X)は、表10に示す形式の訓練テ
キスト・イベントにおける目標単語e、文脈X、及び原
始単語fの発生をカウントし、各カウントを、目標単語
をeとする訓練テキストにおけるイベントの全数で割る
ことによって得られる。
【0087】数式11からの「メリットの尺度」G
(i)が最高の文脈関数gi(f,e,X)が、数式7
で使用すべき文脈関数として選択される。パラメータλ
(e,i)は、まずλ(e,i)=0を設定し、次に数量Δλ(e,
i)について下記の数式15を解くことによって得られ
る。
(i)が最高の文脈関数gi(f,e,X)が、数式7
で使用すべき文脈関数として選択される。パラメータλ
(e,i)は、まずλ(e,i)=0を設定し、次に数量Δλ(e,
i)について下記の数式15を解くことによって得られ
る。
【数20】
【0088】λ(e,i)の新しい値は、前のλ(e,i)にΔλ
(e,i)を加えることによって得られる。次いでλ(e,i)の
新しい値を用いてΔλ(e,i)の新しい値について数式1
5を解く。このプロセスを、Δλ(e,i)の値が選択され
た限界値以下になるまで繰り返す。この方法は反復スケ
ーリングとして知られる。
(e,i)を加えることによって得られる。次いでλ(e,i)の
新しい値を用いてΔλ(e,i)の新しい値について数式1
5を解く。このプロセスを、Δλ(e,i)の値が選択され
た限界値以下になるまで繰り返す。この方法は反復スケ
ーリングとして知られる。
【0089】単語合致スコアの新しいモデル(数式7)
を使用して、残りの候補文脈関数gi(f,e,X)に
ついて数式11の「メリットの尺度」G(i)を再計算
し、最高の「メリットの尺度」G(i)を有する残りの
文脈関数を識別する。最良の残りの文脈関数を数式7の
単語合致スコア・モデルに加え、パラメータλ(e,i)の
すべての新しい値を、反復スケーリング法と数式15を
用いて計算する。数式7の単語合致スコアが2つ以上の
パラメータλ(e,i)を含むときは、各パラメータλ(e,i)
は反復毎にちょうど一回だけ更新され、したがってすべ
てのパラメータλ(e,i)同じ反復で収斂する。最良の文
脈関数の「メリットの尺度」が選択された限界値以下に
なるまで、このプロセスが残りの候補文脈関数gi
(f,e,X)で反復される。
を使用して、残りの候補文脈関数gi(f,e,X)に
ついて数式11の「メリットの尺度」G(i)を再計算
し、最高の「メリットの尺度」G(i)を有する残りの
文脈関数を識別する。最良の残りの文脈関数を数式7の
単語合致スコア・モデルに加え、パラメータλ(e,i)の
すべての新しい値を、反復スケーリング法と数式15を
用いて計算する。数式7の単語合致スコアが2つ以上の
パラメータλ(e,i)を含むときは、各パラメータλ(e,i)
は反復毎にちょうど一回だけ更新され、したがってすべ
てのパラメータλ(e,i)同じ反復で収斂する。最良の文
脈関数の「メリットの尺度」が選択された限界値以下に
なるまで、このプロセスが残りの候補文脈関数gi
(f,e,X)で反復される。
【0090】まとめとして、本発明の構成に関して以下
の事項を開示する。
の事項を開示する。
【0091】(1)第1言語の一連の原始単語を第1言
語とは異なる第2言語の一連の目標単語に翻訳するため
の装置であって、一連の原始単語を入力する手段と、各
目標仮説が第2言語の単語の語彙から選択された一連の
目標単語を含み、各目標単語が目標仮説の少なくとも1
つの他の単語を含む文脈を有する、少なくとも2つの目
標仮説を発生させる手段と、各目標仮説について、目標
仮説の一連の単語の発生確率の推定値を含む言語モデル
合致スコアを生成する手段と、各原始単語を目標仮説の
少なくとも1つの目標単語に結合する、入力された一連
の原始単語と各目標仮説との間の少なくとも1つのアラ
インメントを識別する手段と、各原始単語及び各目標仮
説について、原始単語に結合された目標仮説の目標単語
が与えられ、かつ原始単語に結合された目標仮説の目標
単語の文脈が与えられた場合の原始単語の条件付き発生
確率の推定値を含む、単語合致スコアを生成する手段
と、各目標仮説について、目標仮説の単語合致スコアと
入力された一連の原始単語中の原始単語との組合せを含
む、翻訳合致スコアを生成する手段と、各目標仮説合致
スコアが目標仮説の言語モデル合致スコアと目標仮説の
翻訳合致スコアとの組合せを含む、各目標仮説の目標仮
説合致スコアを生成する手段と、最良の目標仮説合致ス
コアを有する目標仮説を出力する手段とを含む装置。 (2)各目標仮説が、第2言語の単語を含む語彙から選
択された一連の目標単語と単語がないことを示す空白単
語を含むことを特徴とする、上記(1)に記載の装置。 (3)少なくとも1つのアラインメントを識別する手段
が、それぞれが各原始単語を目標仮説の少なくとも1つ
の目標単語と結合する、入力された一連の原始単語と各
目標単語との間の2つ以上のアラインメントを識別し、
単語合致スコア生成機構が、各原始単語及び各アライン
メント及び各目標仮説について、原始単語に結合された
目標単語が与えられかつ目標単語の文脈が与えられた場
合の原始単語の条件付き発生確率の推定値を含む、単語
合致スコアを生成し、翻訳合致スコア生成機構が、各目
標仮説について、目標仮説の単語合致スコアと入力され
た一連の原始単語中の原始単語との組合せを含む、翻訳
合致スコアを生成することを特徴とする、上記(2)に
記載の装置。 (4)入力手段が、入力された一連の原始単語を一連の
変換原始単語に変換する手段を含み、アラインメント手
段が、各変換原始単語を目標仮説の少なくとも1つの目
標単語に結合する、一連の変換原始単語と各目標仮説と
の間の少なくとも1つのアラインメントを識別し、単語
合致スコア生成機構が、各変換原始単語及び各目標仮説
について、変換単語に結合された目標仮説の目標単語が
与えられかつ変換原始単語に結合された目標仮説の目標
単語の文脈が与えられた場合の変換原始単語の条件付き
発生確率の推定値を含む、単語合致スコアを生成し、翻
訳合致スコア生成機構が、各目標仮説について、目標仮
説の単語合致スコアと変換原始単語との組合せを含む、
翻訳合致スコアを生成し、出力手段が、最良の目標仮説
合致スコアを有する目標仮説から一連の出力単語を合成
する手段と、合成出力単語を出力する出力手段とを含む
ことを特徴とする、上記(2)に記載の装置。 (5)目標仮説の翻訳合致スコアが、目標仮説の単語合
致スコアと入力された一連の原始単語中の原始単語との
積を含み、目標仮説の目標仮説合致スコアが、目標仮説
の言語モデル合致スコアに目標仮説の翻訳合致スコアを
掛けた積を含むことを特徴とする、上記(2)に記載の
装置。 (6)原始単語に結合された目標仮説における目標単語
文脈が、2つ以上の文脈クラスの少なくとも1つ中に含
まれ、原始単語に結合された目標単語が与えられかつ目
標単語の文脈が与えられた場合の原始単語の推定条件付
き発生確率が、目標単語の文脈を含むクラスに依存する
値を有する少なくとも1つの関数を含むことを特徴とす
る、上記(2)に記載の装置。 (7)原始単語に結合された目標仮説の目標単語の文脈
が、目標仮説の品詞を有する少なくとも1つの単語を含
み、原始単語に結合された目標単語が与えられかつ目標
単語の文脈が与えられた、原始単語の推定付き発生確率
が、原始単語に結合された目標単語の文脈における少な
くとも1つの単語の目標仮説の品詞に依存する値を有す
る少なくとも1つの関数を含むことを特徴とする、上記
(2)に記載の装置。 (8)原始単語に結合された目標仮説の目標単語の文脈
が、識別を有する少なくとも1つの単語を含み、原始単
語に結合された目標単語が与えられかつ目標単語の文脈
が与えられた場合の原始単語の推定条件付き発生確率
が、原始単語に結合された目標単語の文脈における少な
くとも1つの単語の識別に依存する値を有する少なくと
も1つの関数を含むことを特徴とする、上記(2)に記
載の装置。 (9)最良の合致スコアを有する目標仮説を出力する手
段がディスプレイを含むことを特徴とする、上記(2)
に記載の装置。 (10)入力手段がキーボードを含むことを特徴とす
る、上記(2)に記載の装置。 (11)入力手段がコンピュータ・ディスク駆動機構を
含むことを特徴とする、上記(2)に記載の装置。 (12)入力手段がコンピュータ・テープ駆動機構を含
むことを特徴とする、上記(2)に記載の装置。 (13)第1言語の一連の原始単語を第1言語とは異な
る第2言語の一連の目標単語に翻訳する方法であって、
一連の原始単語を入力するステップと、各目標仮説が第
2言語の単語の語彙から選択された一連の目標単語を含
み、各目標単語が目標仮説の少なくとも1つの他の単語
を含む文脈を有する、少なくとも2つの目標仮説を生成
するステップと、各目標仮説について、目標仮説の一連
の単語の発生確率の推定値を含む言語モデル合致スコア
を生成するステップと、各原始単語を目標仮説の少なく
とも1つの目標単語に結合する、入力された一連の原始
単語と各目標仮説との間の少なくとも1つのアラインメ
ントを識別するステップと、各原始単語及び各目標仮説
について、原始単語に結合された目標仮説の目標単語が
与えられかつ原始単語に結合された目標仮説の目標単語
の文脈が与えられた場合の原始単語の条件付き発生確率
の推定値を含む、単語合致スコアを生成するステップ
と、各目標仮説について、目標仮説の単語合致スコアと
入力された一連の原始単語の原始単語との組合せを含む
翻訳合致スコアを生成するステップと、目標仮説の言語
モデル合致スコアと目標仮説の翻訳合致スコアとの組合
せを含む、各目標仮説の目標仮説合致スコアを生成する
ステップと、最良の目標仮説合致スコアを有する目標仮
説を出力するステップとを含む方法。 (14)各目標仮説が、第2言語の単語を含む語彙から
選択された一連の目標単語と単語がないことを示す空白
単語を含むことを特徴とする、上記(13)に記載の方
法。 (15)少なくとも1つのアラインメントを識別するス
テップが、各原始単語を目標仮説の少なくとも1つの目
標単語と結合する、入力された一連の原始単語と各目標
単語との間の2つ以上のアラインメントを識別するステ
ップを含み、単語合致スコア生成ステップが、各原始単
語及び各アラインメント及び各目標仮説について、原始
単語に結合された目標単語が与えられかつ目標単語の文
脈が与えられた場合の原始単語の条件付き発生確率の推
定値を含む、単語合致スコアの生成を含み、翻訳合致ス
コア生成ステップが、各目標仮説について、目標仮説の
単語合致スコアと入力された一連の原始単語の原始単語
との組合せを含む翻訳合致スコアを生成するステップを
含むこと、を特徴とする、上記(14)に記載の方法。 (16)入力ステップが、入力された一連の原始単語を
一連の変換原始単語に変換するステップを含み、アライ
ンメント・ステップが、各変換原始単語を目標仮説の少
なくとも1つの目標単語に結合する、一連の変換原始単
語と各目標仮説との間の少なくとも1つのアラインメン
トを識別するステップを含み、単語合致スコア生成ステ
ップが、各変換原始単語及び各目標仮説について、変換
単語に結合された目標仮説の目標単語が与えられかつ変
換原始単語に結合された目標仮説の目標単語の文脈が与
えられた場合の変換原始単語の条件付き発生確率の推定
値を含む、単語合致スコアを生成するステップを含み、
翻訳合致スコア生成ステップが、各目標仮説について、
目標仮説の単語合致スコアと変換原始単語との組合せを
含む翻訳合致スコアを生成するステップを含み、出力ス
テップが、最良の目標仮説合致スコアを有する目標仮説
から一連の出力単語を合成するステップと、合成出力単
語を出力する出力ステップを含むことを特徴とする、上
記(14)に記載の方法。 (17)目標仮説の翻訳合致スコアが、目標仮説の単語
合致スコアと入力された一連の原始単語中の原始単語と
の積を含み、目標仮説の目標仮説合致スコアが、目標仮
説の言語モデル合致スコアに目標仮説の翻訳合致スコア
を掛けた積を含むことを特徴とする、上記(14)に記
載の方法。 (18)原始単語に結合された目標仮説における目標単
語文脈が、2つ以上の文脈クラスの少なくとも1つ中に
含まれ、原始単語に結合された目標単語が与えられかつ
目標単語の文脈が与えられた場合の原始単語の推定条件
付き発生確率が、目標単語の文脈を含むクラスに依存す
る値を有する少なくとも1つの関数を含むことを特徴と
する、上記(14)に記載の方法。 (19)原始単語に結合された目標仮説の目標単語の文
脈が、目標仮説の品詞を有する少なくとも1つの単語を
含み、原始単語に結合された目標単語が与えられかつ目
標単語の文脈が与えられた場合の原始単語の推定条件付
き発生確率が、原始単語に結合された目標単語の文脈に
おける少なくとも1つの単語の目標仮説の品詞に依存す
る値を有する少なくとも1つの関数を含むことを特徴と
する、上記(14)に記載の方法。 (20)原始単語に結合された目標仮説の目標単語の文
脈が、識別を有する少なくとも1つの単語を含み、原始
単語に結合された目標単語が与えられかつ目標単語の文
脈が与えられた場合の原始単語の推定条件付き発生確率
が、原始単語に結合された目標単語の文脈における少な
くとも1つの単語の識別に依存する値を有する少なくと
も1つの関数を含むことを特徴とする、上記(14)に
記載の方法。 (21)最良の合致スコアを有する目標仮説を出力する
ステップが、最良の合致スコアを有する目標仮説を表示
するステップを含むことを特徴とする、上記(14)に
記載の方法。
語とは異なる第2言語の一連の目標単語に翻訳するため
の装置であって、一連の原始単語を入力する手段と、各
目標仮説が第2言語の単語の語彙から選択された一連の
目標単語を含み、各目標単語が目標仮説の少なくとも1
つの他の単語を含む文脈を有する、少なくとも2つの目
標仮説を発生させる手段と、各目標仮説について、目標
仮説の一連の単語の発生確率の推定値を含む言語モデル
合致スコアを生成する手段と、各原始単語を目標仮説の
少なくとも1つの目標単語に結合する、入力された一連
の原始単語と各目標仮説との間の少なくとも1つのアラ
インメントを識別する手段と、各原始単語及び各目標仮
説について、原始単語に結合された目標仮説の目標単語
が与えられ、かつ原始単語に結合された目標仮説の目標
単語の文脈が与えられた場合の原始単語の条件付き発生
確率の推定値を含む、単語合致スコアを生成する手段
と、各目標仮説について、目標仮説の単語合致スコアと
入力された一連の原始単語中の原始単語との組合せを含
む、翻訳合致スコアを生成する手段と、各目標仮説合致
スコアが目標仮説の言語モデル合致スコアと目標仮説の
翻訳合致スコアとの組合せを含む、各目標仮説の目標仮
説合致スコアを生成する手段と、最良の目標仮説合致ス
コアを有する目標仮説を出力する手段とを含む装置。 (2)各目標仮説が、第2言語の単語を含む語彙から選
択された一連の目標単語と単語がないことを示す空白単
語を含むことを特徴とする、上記(1)に記載の装置。 (3)少なくとも1つのアラインメントを識別する手段
が、それぞれが各原始単語を目標仮説の少なくとも1つ
の目標単語と結合する、入力された一連の原始単語と各
目標単語との間の2つ以上のアラインメントを識別し、
単語合致スコア生成機構が、各原始単語及び各アライン
メント及び各目標仮説について、原始単語に結合された
目標単語が与えられかつ目標単語の文脈が与えられた場
合の原始単語の条件付き発生確率の推定値を含む、単語
合致スコアを生成し、翻訳合致スコア生成機構が、各目
標仮説について、目標仮説の単語合致スコアと入力され
た一連の原始単語中の原始単語との組合せを含む、翻訳
合致スコアを生成することを特徴とする、上記(2)に
記載の装置。 (4)入力手段が、入力された一連の原始単語を一連の
変換原始単語に変換する手段を含み、アラインメント手
段が、各変換原始単語を目標仮説の少なくとも1つの目
標単語に結合する、一連の変換原始単語と各目標仮説と
の間の少なくとも1つのアラインメントを識別し、単語
合致スコア生成機構が、各変換原始単語及び各目標仮説
について、変換単語に結合された目標仮説の目標単語が
与えられかつ変換原始単語に結合された目標仮説の目標
単語の文脈が与えられた場合の変換原始単語の条件付き
発生確率の推定値を含む、単語合致スコアを生成し、翻
訳合致スコア生成機構が、各目標仮説について、目標仮
説の単語合致スコアと変換原始単語との組合せを含む、
翻訳合致スコアを生成し、出力手段が、最良の目標仮説
合致スコアを有する目標仮説から一連の出力単語を合成
する手段と、合成出力単語を出力する出力手段とを含む
ことを特徴とする、上記(2)に記載の装置。 (5)目標仮説の翻訳合致スコアが、目標仮説の単語合
致スコアと入力された一連の原始単語中の原始単語との
積を含み、目標仮説の目標仮説合致スコアが、目標仮説
の言語モデル合致スコアに目標仮説の翻訳合致スコアを
掛けた積を含むことを特徴とする、上記(2)に記載の
装置。 (6)原始単語に結合された目標仮説における目標単語
文脈が、2つ以上の文脈クラスの少なくとも1つ中に含
まれ、原始単語に結合された目標単語が与えられかつ目
標単語の文脈が与えられた場合の原始単語の推定条件付
き発生確率が、目標単語の文脈を含むクラスに依存する
値を有する少なくとも1つの関数を含むことを特徴とす
る、上記(2)に記載の装置。 (7)原始単語に結合された目標仮説の目標単語の文脈
が、目標仮説の品詞を有する少なくとも1つの単語を含
み、原始単語に結合された目標単語が与えられかつ目標
単語の文脈が与えられた、原始単語の推定付き発生確率
が、原始単語に結合された目標単語の文脈における少な
くとも1つの単語の目標仮説の品詞に依存する値を有す
る少なくとも1つの関数を含むことを特徴とする、上記
(2)に記載の装置。 (8)原始単語に結合された目標仮説の目標単語の文脈
が、識別を有する少なくとも1つの単語を含み、原始単
語に結合された目標単語が与えられかつ目標単語の文脈
が与えられた場合の原始単語の推定条件付き発生確率
が、原始単語に結合された目標単語の文脈における少な
くとも1つの単語の識別に依存する値を有する少なくと
も1つの関数を含むことを特徴とする、上記(2)に記
載の装置。 (9)最良の合致スコアを有する目標仮説を出力する手
段がディスプレイを含むことを特徴とする、上記(2)
に記載の装置。 (10)入力手段がキーボードを含むことを特徴とす
る、上記(2)に記載の装置。 (11)入力手段がコンピュータ・ディスク駆動機構を
含むことを特徴とする、上記(2)に記載の装置。 (12)入力手段がコンピュータ・テープ駆動機構を含
むことを特徴とする、上記(2)に記載の装置。 (13)第1言語の一連の原始単語を第1言語とは異な
る第2言語の一連の目標単語に翻訳する方法であって、
一連の原始単語を入力するステップと、各目標仮説が第
2言語の単語の語彙から選択された一連の目標単語を含
み、各目標単語が目標仮説の少なくとも1つの他の単語
を含む文脈を有する、少なくとも2つの目標仮説を生成
するステップと、各目標仮説について、目標仮説の一連
の単語の発生確率の推定値を含む言語モデル合致スコア
を生成するステップと、各原始単語を目標仮説の少なく
とも1つの目標単語に結合する、入力された一連の原始
単語と各目標仮説との間の少なくとも1つのアラインメ
ントを識別するステップと、各原始単語及び各目標仮説
について、原始単語に結合された目標仮説の目標単語が
与えられかつ原始単語に結合された目標仮説の目標単語
の文脈が与えられた場合の原始単語の条件付き発生確率
の推定値を含む、単語合致スコアを生成するステップ
と、各目標仮説について、目標仮説の単語合致スコアと
入力された一連の原始単語の原始単語との組合せを含む
翻訳合致スコアを生成するステップと、目標仮説の言語
モデル合致スコアと目標仮説の翻訳合致スコアとの組合
せを含む、各目標仮説の目標仮説合致スコアを生成する
ステップと、最良の目標仮説合致スコアを有する目標仮
説を出力するステップとを含む方法。 (14)各目標仮説が、第2言語の単語を含む語彙から
選択された一連の目標単語と単語がないことを示す空白
単語を含むことを特徴とする、上記(13)に記載の方
法。 (15)少なくとも1つのアラインメントを識別するス
テップが、各原始単語を目標仮説の少なくとも1つの目
標単語と結合する、入力された一連の原始単語と各目標
単語との間の2つ以上のアラインメントを識別するステ
ップを含み、単語合致スコア生成ステップが、各原始単
語及び各アラインメント及び各目標仮説について、原始
単語に結合された目標単語が与えられかつ目標単語の文
脈が与えられた場合の原始単語の条件付き発生確率の推
定値を含む、単語合致スコアの生成を含み、翻訳合致ス
コア生成ステップが、各目標仮説について、目標仮説の
単語合致スコアと入力された一連の原始単語の原始単語
との組合せを含む翻訳合致スコアを生成するステップを
含むこと、を特徴とする、上記(14)に記載の方法。 (16)入力ステップが、入力された一連の原始単語を
一連の変換原始単語に変換するステップを含み、アライ
ンメント・ステップが、各変換原始単語を目標仮説の少
なくとも1つの目標単語に結合する、一連の変換原始単
語と各目標仮説との間の少なくとも1つのアラインメン
トを識別するステップを含み、単語合致スコア生成ステ
ップが、各変換原始単語及び各目標仮説について、変換
単語に結合された目標仮説の目標単語が与えられかつ変
換原始単語に結合された目標仮説の目標単語の文脈が与
えられた場合の変換原始単語の条件付き発生確率の推定
値を含む、単語合致スコアを生成するステップを含み、
翻訳合致スコア生成ステップが、各目標仮説について、
目標仮説の単語合致スコアと変換原始単語との組合せを
含む翻訳合致スコアを生成するステップを含み、出力ス
テップが、最良の目標仮説合致スコアを有する目標仮説
から一連の出力単語を合成するステップと、合成出力単
語を出力する出力ステップを含むことを特徴とする、上
記(14)に記載の方法。 (17)目標仮説の翻訳合致スコアが、目標仮説の単語
合致スコアと入力された一連の原始単語中の原始単語と
の積を含み、目標仮説の目標仮説合致スコアが、目標仮
説の言語モデル合致スコアに目標仮説の翻訳合致スコア
を掛けた積を含むことを特徴とする、上記(14)に記
載の方法。 (18)原始単語に結合された目標仮説における目標単
語文脈が、2つ以上の文脈クラスの少なくとも1つ中に
含まれ、原始単語に結合された目標単語が与えられかつ
目標単語の文脈が与えられた場合の原始単語の推定条件
付き発生確率が、目標単語の文脈を含むクラスに依存す
る値を有する少なくとも1つの関数を含むことを特徴と
する、上記(14)に記載の方法。 (19)原始単語に結合された目標仮説の目標単語の文
脈が、目標仮説の品詞を有する少なくとも1つの単語を
含み、原始単語に結合された目標単語が与えられかつ目
標単語の文脈が与えられた場合の原始単語の推定条件付
き発生確率が、原始単語に結合された目標単語の文脈に
おける少なくとも1つの単語の目標仮説の品詞に依存す
る値を有する少なくとも1つの関数を含むことを特徴と
する、上記(14)に記載の方法。 (20)原始単語に結合された目標仮説の目標単語の文
脈が、識別を有する少なくとも1つの単語を含み、原始
単語に結合された目標単語が与えられかつ目標単語の文
脈が与えられた場合の原始単語の推定条件付き発生確率
が、原始単語に結合された目標単語の文脈における少な
くとも1つの単語の識別に依存する値を有する少なくと
も1つの関数を含むことを特徴とする、上記(14)に
記載の方法。 (21)最良の合致スコアを有する目標仮説を出力する
ステップが、最良の合致スコアを有する目標仮説を表示
するステップを含むことを特徴とする、上記(14)に
記載の方法。
【0092】
【発明の効果】本発明による翻訳装置では、目標仮説生
成機構12、言語モデル合致スコア生成機構16、アラ
インメント識別機構18、単語合致スコア生成機構2
0、翻訳合致スコア生成機構22、及び仮説合致スコア
生成機構24は、適切にプログラムされた汎用または専
用のディジタル信号プロセッサとすることができる。目
標言語語彙記憶域14は、ランダム・アクセス・メモリ
などのコンピュータ記憶装置でよい。入力された一連の
原始単語を原始テキスト入力装置10における一連の変
換原始単語に変換する手段と、出力部26の最良目標仮
説合致スコアを有する目標仮説から一連の出力単語を合
成する手段も、適切にプログラムされた汎用または専用
のディジタル信号プロセッサでよい。
成機構12、言語モデル合致スコア生成機構16、アラ
インメント識別機構18、単語合致スコア生成機構2
0、翻訳合致スコア生成機構22、及び仮説合致スコア
生成機構24は、適切にプログラムされた汎用または専
用のディジタル信号プロセッサとすることができる。目
標言語語彙記憶域14は、ランダム・アクセス・メモリ
などのコンピュータ記憶装置でよい。入力された一連の
原始単語を原始テキスト入力装置10における一連の変
換原始単語に変換する手段と、出力部26の最良目標仮
説合致スコアを有する目標仮説から一連の出力単語を合
成する手段も、適切にプログラムされた汎用または専用
のディジタル信号プロセッサでよい。
【図1】本発明による第1言語から第2言語に単語を翻
訳するための装置の一例のブロック図である。
訳するための装置の一例のブロック図である。
【図2】一連の仮説原始単語と一連の仮説目標単語との
間のアラインメントの例を示す概略図である。
間のアラインメントの例を示す概略図である。
【図3】図2における一連の仮説原始単語と一連の仮説
目標単語との間の第2アラインメントの例を示す概略図
である。
目標単語との間の第2アラインメントの例を示す概略図
である。
【図4】図2における一連の仮説原始単語と一連の仮説
目標単語との間の第3アラインメントの例を示す概略図
である。
目標単語との間の第3アラインメントの例を示す概略図
である。
10 原始テキスト入力装置 12 目標仮説生成機構 14 目標言語語彙記憶域 16 言語モデル合致スコア生成機構 18 アラインメント識別機構 20 単語合致スコア生成機構 22 翻訳合致スコア生成機構 24 仮説合致スコア生成機構 26 出力部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ピーター・フィッツヒュー・ブラウン アメリカ合衆国10025 ニューヨーク州ニ ューヨーク リバーサイド・ドライブ390 アパートメント12エイ−エフ (72)発明者 スティーブ・アンドリュー・デラ・ピエト ラ アメリカ合衆国10965 ニューヨーク州パ ール・リバー メイヤー・オーバル113 (72)発明者 ビンセント・ジョセフ・デラ・ピエトラ アメリカ合衆国10913 ニューヨーク州ブ ラウベルト サンセット・ロード129 (72)発明者 アンドリュー・スコット・ケーラー アメリカ合衆国02143 マサチューセッツ 州ソマービル ビーコン・ストリート326 ナンバー2 (72)発明者 ロバート・レロイ・マーサー アメリカ合衆国10598 ニューヨーク州ヨ ークタウン・ハイツ ビューランド・ドラ イブ669
Claims (21)
- 【請求項1】第1言語の一連の原始単語を第1言語とは
異なる第2言語の一連の目標単語に翻訳するための装置
であって、 一連の原始単語を入力する手段と、 各目標仮説が第2言語の単語の語彙から選択された一連
の目標単語を含み、各目標単語が目標仮説の少なくとも
1つの他の単語を含む文脈を有する、少なくとも2つの
目標仮説を発生させる手段と、 各目標仮説について、目標仮説の一連の単語の発生確率
の推定値を含む言語モデル合致スコアを生成する手段
と、 各原始単語を目標仮説の少なくとも1つの目標単語に結
合する、入力された一連の原始単語と各目標仮説との間
の少なくとも1つのアラインメントを識別する手段と、 各原始単語及び各目標仮説について、原始単語に結合さ
れた目標仮説の目標単語が与えられ、かつ原始単語に結
合された目標仮説の目標単語の文脈が与えられた場合の
原始単語の条件付き発生確率の推定値を含む、単語合致
スコアを生成する手段と、 各目標仮説について、目標仮説の単語合致スコアと入力
された一連の原始単語中の原始単語との組合せを含む、
翻訳合致スコアを生成する手段と、 各目標仮説合致スコアが目標仮説の言語モデル合致スコ
アと目標仮説の翻訳合致スコアとの組合せを含む、各目
標仮説の目標仮説合致スコアを生成する手段と、 最良の目標仮説合致スコアを有する目標仮説を出力する
手段とを含む装置。 - 【請求項2】各目標仮説が、第2言語の単語を含む語彙
から選択された一連の目標単語と単語がないことを示す
空白単語を含むことを特徴とする、請求項1に記載の装
置。 - 【請求項3】少なくとも1つのアラインメントを識別す
る手段が、それぞれが各原始単語を目標仮説の少なくと
も1つの目標単語と結合する、入力された一連の原始単
語と各目標単語との間の2つ以上のアラインメントを識
別し、 単語合致スコア生成機構が、各原始単語及び各アライン
メント及び各目標仮説について、原始単語に結合された
目標単語が与えられかつ目標単語の文脈が与えられた場
合の原始単語の条件付き発生確率の推定値を含む、単語
合致スコアを生成し、 翻訳合致スコア生成機構が、各目標仮説について、目標
仮説の単語合致スコアと入力された一連の原始単語中の
原始単語との組合せを含む、翻訳合致スコアを生成する
ことを特徴とする、請求項2に記載の装置。 - 【請求項4】入力手段が、入力された一連の原始単語を
一連の変換原始単語に変換する手段を含み、 アラインメント手段が、各変換原始単語を目標仮説の少
なくとも1つの目標単語に結合する、一連の変換原始単
語と各目標仮説との間の少なくとも1つのアラインメン
トを識別し、 単語合致スコア生成機構が、各変換原始単語及び各目標
仮説について、変換単語に結合された目標仮説の目標単
語が与えられかつ変換原始単語に結合された目標仮説の
目標単語の文脈が与えられた場合の変換原始単語の条件
付き発生確率の推定値を含む、単語合致スコアを生成
し、 翻訳合致スコア生成機構が、各目標仮説について、目標
仮説の単語合致スコアと変換原始単語との組合せを含
む、翻訳合致スコアを生成し、 出力手段が、最良の目標仮説合致スコアを有する目標仮
説から一連の出力単語を合成する手段と、合成出力単語
を出力する出力手段とを含むことを特徴とする、請求項
2に記載の装置。 - 【請求項5】目標仮説の翻訳合致スコアが、目標仮説の
単語合致スコアと入力された一連の原始単語中の原始単
語との積を含み、 目標仮説の目標仮説合致スコアが、目標仮説の言語モデ
ル合致スコアに目標仮説の翻訳合致スコアを掛けた積を
含むことを特徴とする、請求項2に記載の装置。 - 【請求項6】原始単語に結合された目標仮説における目
標単語文脈が、2つ以上の文脈クラスの少なくとも1つ
中に含まれ、 原始単語に結合された目標単語が与えられかつ目標単語
の文脈が与えられた場合の原始単語の推定条件付き発生
確率が、目標単語の文脈を含むクラスに依存する値を有
する少なくとも1つの関数を含むことを特徴とする、請
求項2に記載の装置。 - 【請求項7】原始単語に結合された目標仮説の目標単語
の文脈が、目標仮説の品詞を有する少なくとも1つの単
語を含み、 原始単語に結合された目標単語が与えられかつ目標単語
の文脈が与えられた、原始単語の推定付き発生確率が、
原始単語に結合された目標単語の文脈における少なくと
も1つの単語の目標仮説の品詞に依存する値を有する少
なくとも1つの関数を含むことを特徴とする、請求項2
に記載の装置。 - 【請求項8】原始単語に結合された目標仮説の目標単語
の文脈が、識別を有する少なくとも1つの単語を含み、 原始単語に結合された目標単語が与えられかつ目標単語
の文脈が与えられた場合の原始単語の推定条件付き発生
確率が、原始単語に結合された目標単語の文脈における
少なくとも1つの単語の識別に依存する値を有する少な
くとも1つの関数を含むことを特徴とする、請求項2に
記載の装置。 - 【請求項9】最良の合致スコアを有する目標仮説を出力
する手段がディスプレイを含むことを特徴とする、請求
項2に記載の装置。 - 【請求項10】入力手段がキーボードを含むことを特徴
とする、請求項2に記載の装置。 - 【請求項11】入力手段がコンピュータ・ディスク駆動
機構を含むことを特徴とする、請求項2に記載の装置。 - 【請求項12】入力手段がコンピュータ・テープ駆動機
構を含むことを特徴とする、請求項2に記載の装置。 - 【請求項13】第1言語の一連の原始単語を第1言語と
は異なる第2言語の一連の目標単語に翻訳する方法であ
って、 一連の原始単語を入力するステップと、 各目標仮説が第2言語の単語の語彙から選択された一連
の目標単語を含み、各目標単語が目標仮説の少なくとも
1つの他の単語を含む文脈を有する、少なくとも2つの
目標仮説を生成するステップと、 各目標仮説について、目標仮説の一連の単語の発生確率
の推定値を含む言語モデル合致スコアを生成するステッ
プと、 各原始単語を目標仮説の少なくとも1つの目標単語に結
合する、入力された一連の原始単語と各目標仮説との間
の少なくとも1つのアラインメントを識別するステップ
と、 各原始単語及び各目標仮説について、原始単語に結合さ
れた目標仮説の目標単語が与えられかつ原始単語に結合
された目標仮説の目標単語の文脈が与えられた場合の原
始単語の条件付き発生確率の推定値を含む、単語合致ス
コアを生成するステップと、 各目標仮説について、目標仮説の単語合致スコアと入力
された一連の原始単語の原始単語との組合せを含む翻訳
合致スコアを生成するステップと、 目標仮説の言語モデル合致スコアと目標仮説の翻訳合致
スコアとの組合せを含む、各目標仮説の目標仮説合致ス
コアを生成するステップと、 最良の目標仮説合致スコアを有する目標仮説を出力する
ステップとを含む方法。 - 【請求項14】各目標仮説が、第2言語の単語を含む語
彙から選択された一連の目標単語と単語がないことを示
す空白単語を含むことを特徴とする、請求項13に記載
の方法。 - 【請求項15】少なくとも1つのアラインメントを識別
するステップが、各原始単語を目標仮説の少なくとも1
つの目標単語と結合する、入力された一連の原始単語と
各目標単語との間の2つ以上のアラインメントを識別す
るステップを含み、 単語合致スコア生成ステップが、各原始単語及び各アラ
インメント及び各目標仮説について、原始単語に結合さ
れた目標単語が与えられかつ目標単語の文脈が与えられ
た場合の原始単語の条件付き発生確率の推定値を含む、
単語合致スコアの生成を含み、 翻訳合致スコア生成ステップが、各目標仮説について、
目標仮説の単語合致スコアと入力された一連の原始単語
の原始単語との組合せを含む翻訳合致スコアを生成する
ステップを含むこと、 を特徴とする、請求項14に記載の方法。 - 【請求項16】入力ステップが、入力された一連の原始
単語を一連の変換原始単語に変換するステップを含み、 アラインメント・ステップが、各変換原始単語を目標仮
説の少なくとも1つの目標単語に結合する、一連の変換
原始単語と各目標仮説との間の少なくとも1つのアライ
ンメントを識別するステップを含み、 単語合致スコア生成ステップが、各変換原始単語及び各
目標仮説について、変換単語に結合された目標仮説の目
標単語が与えられかつ変換原始単語に結合された目標仮
説の目標単語の文脈が与えられた場合の変換原始単語の
条件付き発生確率の推定値を含む、単語合致スコアを生
成するステップを含み、 翻訳合致スコア生成ステップが、各目標仮説について、
目標仮説の単語合致スコアと変換原始単語との組合せを
含む翻訳合致スコアを生成するステップを含み、 出力ステップが、最良の目標仮説合致スコアを有する目
標仮説から一連の出力単語を合成するステップと、合成
出力単語を出力する出力ステップを含むことを特徴とす
る、請求項14に記載の方法。 - 【請求項17】目標仮説の翻訳合致スコアが、目標仮説
の単語合致スコアと入力された一連の原始単語中の原始
単語との積を含み、 目標仮説の目標仮説合致スコアが、目標仮説の言語モデ
ル合致スコアに目標仮説の翻訳合致スコアを掛けた積を
含むことを特徴とする、請求項14に記載の方法。 - 【請求項18】原始単語に結合された目標仮説における
目標単語文脈が、2つ以上の文脈クラスの少なくとも1
つ中に含まれ、 原始単語に結合された目標単語が与えられかつ目標単語
の文脈が与えられた場合の原始単語の推定条件付き発生
確率が、目標単語の文脈を含むクラスに依存する値を有
する少なくとも1つの関数を含むことを特徴とする、請
求項14に記載の方法。 - 【請求項19】原始単語に結合された目標仮説の目標単
語の文脈が、目標仮説の品詞を有する少なくとも1つの
単語を含み、 原始単語に結合された目標単語が与えられかつ目標単語
の文脈が与えられた場合の原始単語の推定条件付き発生
確率が、原始単語に結合された目標単語の文脈における
少なくとも1つの単語の目標仮説の品詞に依存する値を
有する少なくとも1つの関数を含むことを特徴とする、
請求項14に記載の方法。 - 【請求項20】原始単語に結合された目標仮説の目標単
語の文脈が、識別を有する少なくとも1つの単語を含
み、 原始単語に結合された目標単語が与えられかつ目標単語
の文脈が与えられた場合の原始単語の推定条件付き発生
確率が、原始単語に結合された目標単語の文脈における
少なくとも1つの単語の識別に依存する値を有する少な
くとも1つの関数を含むことを特徴とする、請求項14
に記載の方法。 - 【請求項21】最良の合致スコアを有する目標仮説を出
力するステップが、最良の合致スコアを有する目標仮説
を表示するステップを含むことを特徴とする、請求項1
4に記載の方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US1449193A | 1993-10-28 | 1993-10-28 | |
| US14491 | 1993-10-28 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07200604A true JPH07200604A (ja) | 1995-08-04 |
Family
ID=21765813
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6227645A Pending JPH07200604A (ja) | 1993-10-28 | 1994-09-22 | 文脈ベースの翻訳モデルを使用する言語翻訳の装置とその方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07200604A (ja) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05189481A (ja) * | 1991-07-25 | 1993-07-30 | Internatl Business Mach Corp <Ibm> | 翻訳用コンピュータ操作方法、字句モデル生成方法、モデル生成方法、翻訳用コンピュータシステム、字句モデル生成コンピュータシステム及びモデル生成コンピュータシステム |
-
1994
- 1994-09-22 JP JP6227645A patent/JPH07200604A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05189481A (ja) * | 1991-07-25 | 1993-07-30 | Internatl Business Mach Corp <Ibm> | 翻訳用コンピュータ操作方法、字句モデル生成方法、モデル生成方法、翻訳用コンピュータシステム、字句モデル生成コンピュータシステム及びモデル生成コンピュータシステム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0651340B1 (en) | Language translation apparatus and method using context-based translation models | |
| US5495413A (en) | Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes | |
| KR100911621B1 (ko) | 한영 자동번역 방법 및 장치 | |
| US5161105A (en) | Machine translation apparatus having a process function for proper nouns with acronyms | |
| JP3998668B2 (ja) | 形態素解析装置、方法及びプログラム | |
| JP2002215617A (ja) | 品詞タグ付けをする方法 | |
| Roche | Parsing with finite-state transducers | |
| US4964030A (en) | Apparatus for translating sentences containing punctuation marks | |
| US5088039A (en) | System for translating adverb phrases placed between two commas through a converter using tree-structured conversion rules | |
| EP0398513A2 (en) | Method and apparatus for translating a sentence including a compound word formed by hyphenation | |
| KR100958340B1 (ko) | 실시간 대화식 기계 번역 장치 및 방법 | |
| US5075851A (en) | System for translating a source language word with a prefix into a target language word with multiple forms | |
| GB2194084A (en) | Translation system | |
| KR101092356B1 (ko) | 상호 정보를 이용한 형태소 품사 태깅 장치 및 방법 | |
| JPH07200604A (ja) | 文脈ベースの翻訳モデルを使用する言語翻訳の装置とその方法 | |
| KR100282610B1 (ko) | 부분 문자열별 기분석에 기반한 한국어 형태소 분석장치 및 그방법 | |
| KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 | |
| JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
| JP2719453B2 (ja) | 機械翻訳装置 | |
| JP3219937B2 (ja) | 翻訳変換学習装置 | |
| JP2608384B2 (ja) | 機械翻訳装置及びその方法 | |
| JP2798683B2 (ja) | 自然言語処理システム | |
| JP3197110B2 (ja) | 自然言語解析装置および機械翻訳装置 | |
| CN119514528A (zh) | 语音识别结果的纠错方法、装置、电子设备及存储介质 | |
| JPH01185766A (ja) | かな漢字変換装置 |