JPH08101837A - 機械翻訳装置における翻訳規則学習方法 - Google Patents
機械翻訳装置における翻訳規則学習方法Info
- Publication number
- JPH08101837A JPH08101837A JP6259705A JP25970594A JPH08101837A JP H08101837 A JPH08101837 A JP H08101837A JP 6259705 A JP6259705 A JP 6259705A JP 25970594 A JP25970594 A JP 25970594A JP H08101837 A JPH08101837 A JP H08101837A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- case
- correspondence
- translation rule
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 対訳文から両言語の文の対応関係に基づいて
翻訳規則を学習する際に、ユーザの介在により効率良く
翻訳規則を学習することを目的とする。 【構成】 対訳文間の対応付けを行ない両言語の用言と
格情報の対応を推定し、翻訳規則学習に先だってユーザ
が学習条件を設定し、対応付けを補正し、翻訳規則の候
補を生成し、その中からユーザが学習する翻訳規則を選
択してユーザ規則辞書に登録する。
翻訳規則を学習する際に、ユーザの介在により効率良く
翻訳規則を学習することを目的とする。 【構成】 対訳文間の対応付けを行ない両言語の用言と
格情報の対応を推定し、翻訳規則学習に先だってユーザ
が学習条件を設定し、対応付けを補正し、翻訳規則の候
補を生成し、その中からユーザが学習する翻訳規則を選
択してユーザ規則辞書に登録する。
Description
【0001】
【産業上の利用分野】本発明は、電子計算機を用いて自
然言語文書を翻訳する機械翻訳装置における翻訳規則学
習方法に関する。
然言語文書を翻訳する機械翻訳装置における翻訳規則学
習方法に関する。
【0002】
【従来の技術】近年、計算機による自然言語処理技術が
高まり、各種の文書処理システムが開発されている。特
に、大量の文書を他の言語の文書に自動的に翻訳する機
械翻訳システムなどが実用化されている。
高まり、各種の文書処理システムが開発されている。特
に、大量の文書を他の言語の文書に自動的に翻訳する機
械翻訳システムなどが実用化されている。
【0003】自然言語文書を翻訳するためには、数万語
ないし数十万語の語彙を備える大規模な自然言語用辞書
と、言語現象を規則的に整理した文法知識等が必要であ
るが、ユーザや文書の違いによって翻訳出力をカスタマ
イズする必要のある場合も多い。このためユーザ登録辞
書やユーザ規則辞書を用意して、ユーザに翻訳出力をカ
スタマイズする機能を提供している。
ないし数十万語の語彙を備える大規模な自然言語用辞書
と、言語現象を規則的に整理した文法知識等が必要であ
るが、ユーザや文書の違いによって翻訳出力をカスタマ
イズする必要のある場合も多い。このためユーザ登録辞
書やユーザ規則辞書を用意して、ユーザに翻訳出力をカ
スタマイズする機能を提供している。
【0004】従来はこのユーザ辞書を人手で構築してい
たため、ユーザに多大な労力を強いるという問題があっ
た。この問題を解決するために、人間が翻訳した大量の
翻訳文とその原文の対(対訳文書と呼ばれる)を利用し
て、そこから翻訳規則を自動的に学習する方法が近年提
案されている。これらの方法では対訳文の原言語と目的
言語をそれぞれ解析し、双方の解析結果の単語や句、格
フレームなどの対応関係を求め、求められた対応関係を
もとに翻訳を自動的に学習する。
たため、ユーザに多大な労力を強いるという問題があっ
た。この問題を解決するために、人間が翻訳した大量の
翻訳文とその原文の対(対訳文書と呼ばれる)を利用し
て、そこから翻訳規則を自動的に学習する方法が近年提
案されている。これらの方法では対訳文の原言語と目的
言語をそれぞれ解析し、双方の解析結果の単語や句、格
フレームなどの対応関係を求め、求められた対応関係を
もとに翻訳を自動的に学習する。
【0005】
【発明が解決しようとする課題】しかしながら、翻訳規
則を自動的に学習する方法では、システムが求めた対応
関係が間違っていると、そこから得られた翻訳規則も間
違ったものになってしまう問題があった。またシステム
が正しく対応関係を定めていたとしても、そこから学習
できる翻訳規則が複数個ある場合、どれを学習すべきか
システムが判断できないという問題があった。
則を自動的に学習する方法では、システムが求めた対応
関係が間違っていると、そこから得られた翻訳規則も間
違ったものになってしまう問題があった。またシステム
が正しく対応関係を定めていたとしても、そこから学習
できる翻訳規則が複数個ある場合、どれを学習すべきか
システムが判断できないという問題があった。
【0006】本発明の目的はこのような従来の課題を解
決することにある。すなわち、本発明はシステムが求め
た対訳文間の対応関係に誤りであったり不完全であった
場合にその対応関係をユーザやシステム自身が修正でき
るようにすることを第1の目的とする。また、システム
が定めた対応関係から複数の翻訳規則が学習できる場合
にどの翻訳規則を学習するかユーザが指定できるように
することを第2の目的とする。また学習すべき翻訳規則
の条件設定をユーザが行なうことによって、ユーザが希
望する種類の翻訳規則を学習することを第3の目的とす
る。
決することにある。すなわち、本発明はシステムが求め
た対訳文間の対応関係に誤りであったり不完全であった
場合にその対応関係をユーザやシステム自身が修正でき
るようにすることを第1の目的とする。また、システム
が定めた対応関係から複数の翻訳規則が学習できる場合
にどの翻訳規則を学習するかユーザが指定できるように
することを第2の目的とする。また学習すべき翻訳規則
の条件設定をユーザが行なうことによって、ユーザが希
望する種類の翻訳規則を学習することを第3の目的とす
る。
【0007】
【課題を解決するための手段】上記第1の目的を達成す
るため、本発明は、予め翻訳された翻訳文とその原文と
の対からなる対訳文書を予め格納しておく記憶手段と、
この記憶手段から読み出した前記対訳文書に基づいてそ
の対訳文間の単語の対応関係を推定するステップと、前
記単語の対応関係に基づいて前記対訳文書における両言
語の用言と格情報との対応を推定するステップと、推定
された両言語の用言と格情報との対応関係から翻訳規則
を抽出するステップとを順次実行して翻訳規則を学習す
る翻訳規則学習手段と、を備えた機械翻訳装置に適用さ
れる翻訳規則学習方法であり、前記翻訳規則抽出のステ
ップでは、前記対訳文書における両言語の格情報を比較
して該格情報の対応関係の誤りや不完全さを検出し、こ
の検出後にこの検出結果に応じて一方の言語の正しい格
情報が推定された場合、正しいと推定された格情報を、
翻訳規則を抽出するための格情報として用いることを特
徴とする。
るため、本発明は、予め翻訳された翻訳文とその原文と
の対からなる対訳文書を予め格納しておく記憶手段と、
この記憶手段から読み出した前記対訳文書に基づいてそ
の対訳文間の単語の対応関係を推定するステップと、前
記単語の対応関係に基づいて前記対訳文書における両言
語の用言と格情報との対応を推定するステップと、推定
された両言語の用言と格情報との対応関係から翻訳規則
を抽出するステップとを順次実行して翻訳規則を学習す
る翻訳規則学習手段と、を備えた機械翻訳装置に適用さ
れる翻訳規則学習方法であり、前記翻訳規則抽出のステ
ップでは、前記対訳文書における両言語の格情報を比較
して該格情報の対応関係の誤りや不完全さを検出し、こ
の検出後にこの検出結果に応じて一方の言語の正しい格
情報が推定された場合、正しいと推定された格情報を、
翻訳規則を抽出するための格情報として用いることを特
徴とする。
【0008】また、前記翻訳規則抽出のステップにおい
て、前記対訳文書における両言語の格情報の対応関係の
誤りや不完全さを検出した内容を表示手段で表示する一
方、この表示された内容を正しいと推定された格情報に
置き換える処理を前記機械翻訳装置での所定操作でなし
得るようにすることを特徴とする。
て、前記対訳文書における両言語の格情報の対応関係の
誤りや不完全さを検出した内容を表示手段で表示する一
方、この表示された内容を正しいと推定された格情報に
置き換える処理を前記機械翻訳装置での所定操作でなし
得るようにすることを特徴とする。
【0009】更に、上記第2の目的を達成するため、前
記翻訳規則抽出のステップにおいて、前記対訳文書にお
ける両言語の用言と格情報の対応から用言とその格に関
する翻訳規則の候補を1つあるいは複数個生成し、この
生成後にこの生成された翻訳規則を表示手段で表示する
一方、表示された翻訳規則の中から任意の翻訳規則を前
記機械翻訳装置での所定操作でなし得るようにすること
を特徴とする。
記翻訳規則抽出のステップにおいて、前記対訳文書にお
ける両言語の用言と格情報の対応から用言とその格に関
する翻訳規則の候補を1つあるいは複数個生成し、この
生成後にこの生成された翻訳規則を表示手段で表示する
一方、表示された翻訳規則の中から任意の翻訳規則を前
記機械翻訳装置での所定操作でなし得るようにすること
を特徴とする。
【0010】また、前記翻訳規則抽出のステップにおい
て、翻訳規則の候補が複数個生成された場合には、既存
の翻訳規則を一部修正して得られる翻訳規則の候補を優
先的に翻訳規則として選択して学習することを特徴とす
る。
て、翻訳規則の候補が複数個生成された場合には、既存
の翻訳規則を一部修正して得られる翻訳規則の候補を優
先的に翻訳規則として選択して学習することを特徴とす
る。
【0011】更に、上記第3の目的を達成するため、前
記翻訳規則学習手段の学習ステップの中に、翻訳規則の
学習条件を設定するステップを設け、この翻訳規則の学
習条件を設定するステップでは、前記機械翻訳装置での
所定入力操作でユーザが学習する翻訳規則についてのテ
ンプレートを指定できるようにしたことを特徴とする。
記翻訳規則学習手段の学習ステップの中に、翻訳規則の
学習条件を設定するステップを設け、この翻訳規則の学
習条件を設定するステップでは、前記機械翻訳装置での
所定入力操作でユーザが学習する翻訳規則についてのテ
ンプレートを指定できるようにしたことを特徴とする。
【0012】また、前記翻訳規則の学習条件を設定する
ステップでは、前記機械翻訳装置での所定入力操作でユ
ーザが学習する単語、品詞を指定できることを特徴とす
る。
ステップでは、前記機械翻訳装置での所定入力操作でユ
ーザが学習する単語、品詞を指定できることを特徴とす
る。
【0013】
【作用】本発明の第1の目的を達成するための方法によ
れば、システムが求めた両言語間の対応関係に誤りがあ
る場合や、対応関係に不完全な部分がある場合に、対応
関係をユーザやシステムが修正、補正できるようにな
る。また第2の目的を達成するための方法によれば、必
要に応じて修正された対応関係から複数の翻訳規則が学
習できる場合に、その中から翻訳の品質の向上に効果的
な翻訳規則を選択できるようになる。また第3の目的を
達成するための方法によれば、ユーザが学習すべき翻訳
規則の条件設定を行なうことによって、ユーザが希望す
る種類の翻訳規則を学習することができるようになる。
れば、システムが求めた両言語間の対応関係に誤りがあ
る場合や、対応関係に不完全な部分がある場合に、対応
関係をユーザやシステムが修正、補正できるようにな
る。また第2の目的を達成するための方法によれば、必
要に応じて修正された対応関係から複数の翻訳規則が学
習できる場合に、その中から翻訳の品質の向上に効果的
な翻訳規則を選択できるようになる。また第3の目的を
達成するための方法によれば、ユーザが学習すべき翻訳
規則の条件設定を行なうことによって、ユーザが希望す
る種類の翻訳規則を学習することができるようになる。
【0014】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は翻訳規則学習システムの構成図である。図
1で入力部1はユーザがシステムに操作指定を行なうた
めのもので、マウス、キーボード等が用いられる。表示
部2はユーザにシステムの情報を提示したり、ユーザに
以後の処理を問い合わせるためのもので、CRTやCR
T上のウィンドウシステムが用いられる。記憶部3はメ
モリ、磁気ディスク等で構成され、機械翻訳システムの
辞書・文法・翻訳規則、学習を行なうための対訳文書、
学習結果の翻訳規則を格納するためのユーザ規則辞書が
入っている。そして、このような入力部1、表示部2、
記憶部3は制御部4の制御下に置かれており、制御部4
では後述するように翻訳規則を学習する処理を実行す
る。
する。図1は翻訳規則学習システムの構成図である。図
1で入力部1はユーザがシステムに操作指定を行なうた
めのもので、マウス、キーボード等が用いられる。表示
部2はユーザにシステムの情報を提示したり、ユーザに
以後の処理を問い合わせるためのもので、CRTやCR
T上のウィンドウシステムが用いられる。記憶部3はメ
モリ、磁気ディスク等で構成され、機械翻訳システムの
辞書・文法・翻訳規則、学習を行なうための対訳文書、
学習結果の翻訳規則を格納するためのユーザ規則辞書が
入っている。そして、このような入力部1、表示部2、
記憶部3は制御部4の制御下に置かれており、制御部4
では後述するように翻訳規則を学習する処理を実行す
る。
【0015】図2は図1の表示部2に表示される画面
で、上部には各種ボタン、下部には対訳文が表示され
る。上部のボタンはユーザがボタンを押した時、制御部
に対しイベントを発生するようになっている。
で、上部には各種ボタン、下部には対訳文が表示され
る。上部のボタンはユーザがボタンを押した時、制御部
に対しイベントを発生するようになっている。
【0016】図3は図1の表示部2で発生したイベント
の処理の流れを表すフローチャートである。ステップS
T1ではイベントが入力される。ステップST2ではイ
ベントが「終了」であるかどうか検査される。「終了」
の場合には終了する。そうでなかった場合にはステップ
ST3に進む。ステップST3ではイベントが「ファイ
ル読み込み」であるかどうか検査される。「ファイル読
み込み」の場合にはステップST4に進む。そうでない
場合にはステップST5に進む。ステップST4ではユ
ーザが読み込む対訳文書のファイル名を指定しステップ
ST4Aに進む。ステップST4AではステップST4
で指定された対訳文書のファイルを読み込み、ステップ
ST1に戻る。ステップST5ではイベントが「条件設
定」を表すものであるかどうかが検査される。イベント
が「条件設定」の場合にはステップST6に進む。そう
でない場合にはステップST7に進む。ステップST6
ではユーザにより学習の対象となる品詞、単語の学習条
件の設定が行なわれ、ステップST6Aに進む。ステッ
プST6Aではユーザにより学習の対象となる翻訳規則
のテンプレートの設定が行なわれ、ステップST1に戻
る。ステップST7ではイベントが「学習」を表すもの
かどうかが検査される。イベントが「学習」の場合には
ステップST8に進む。そうでなかった場合にはステッ
プST9に進む。ステップST8では翻訳規則の学習が
行なわれる。ステップST9ではその他の処理(学習の
対象となる対訳文の選択等)が行なわれステップST1
に戻る。
の処理の流れを表すフローチャートである。ステップS
T1ではイベントが入力される。ステップST2ではイ
ベントが「終了」であるかどうか検査される。「終了」
の場合には終了する。そうでなかった場合にはステップ
ST3に進む。ステップST3ではイベントが「ファイ
ル読み込み」であるかどうか検査される。「ファイル読
み込み」の場合にはステップST4に進む。そうでない
場合にはステップST5に進む。ステップST4ではユ
ーザが読み込む対訳文書のファイル名を指定しステップ
ST4Aに進む。ステップST4AではステップST4
で指定された対訳文書のファイルを読み込み、ステップ
ST1に戻る。ステップST5ではイベントが「条件設
定」を表すものであるかどうかが検査される。イベント
が「条件設定」の場合にはステップST6に進む。そう
でない場合にはステップST7に進む。ステップST6
ではユーザにより学習の対象となる品詞、単語の学習条
件の設定が行なわれ、ステップST6Aに進む。ステッ
プST6Aではユーザにより学習の対象となる翻訳規則
のテンプレートの設定が行なわれ、ステップST1に戻
る。ステップST7ではイベントが「学習」を表すもの
かどうかが検査される。イベントが「学習」の場合には
ステップST8に進む。そうでなかった場合にはステッ
プST9に進む。ステップST8では翻訳規則の学習が
行なわれる。ステップST9ではその他の処理(学習の
対象となる対訳文の選択等)が行なわれステップST1
に戻る。
【0017】図3のステップ6Aでは翻訳規則のテンプ
レートとしてどのような格パターンを取るものを学習対
象とするかが指定される。例えば (1)「が」格と「を」格の両方をとるもの (2)「が」格をとるもの (3)「を」格をとるもの の中でどの格パターンをとるものを学習対象とするか等
が指定される。
レートとしてどのような格パターンを取るものを学習対
象とするかが指定される。例えば (1)「が」格と「を」格の両方をとるもの (2)「が」格をとるもの (3)「を」格をとるもの の中でどの格パターンをとるものを学習対象とするか等
が指定される。
【0018】図4は翻訳規則の学習の処理の流れを表す
フローチャートである。ステップST11では対訳文書
から対訳文が1文読み込まれる。ステップST12では
対訳文の原文側が解析され、原文側の依存構造が作成さ
れる。ステップST13では対訳文の訳文側が解析さ
れ、訳文側の遺贈構造が作成される。ステップST14
では原文側の依存構造と訳文側の依存構造が照合され、
格フレーム対応候補が作成される。作成された格フレー
ム対応候補は図6に示すデータ構造の格フレーム対応バ
ッファに保存される。ステップST15ではまだ翻訳規
則の抽出が行なわれていない格フレーム対応候補がある
かどうかが検査される。ない場合には終了し、親ルーチ
ンに戻る。ある場合にはステップST16に進む。ステ
ップST16では図3のステップST6で指定された品
詞、単語の条件を格フレームの用言が満たしているかど
うかが調べられ、満たしていればステップST17に進
む。条件を満たしていない場合はステップST15に戻
る。ステップST17では格フレーム対応修正ルーチン
が呼ばれ、ステップST18に進む。ステップST18
では翻訳規則抽出ルーチンが呼ばれ、格フレーム対応か
らユーザ翻訳規則が作成され、翻訳規則登録バッファに
書き込まれる。ステップST19では翻訳規則登録バッ
ファにあるユーザ翻訳規則がユーザ規則辞書に出力さ
れ、ステップST15に戻る。
フローチャートである。ステップST11では対訳文書
から対訳文が1文読み込まれる。ステップST12では
対訳文の原文側が解析され、原文側の依存構造が作成さ
れる。ステップST13では対訳文の訳文側が解析さ
れ、訳文側の遺贈構造が作成される。ステップST14
では原文側の依存構造と訳文側の依存構造が照合され、
格フレーム対応候補が作成される。作成された格フレー
ム対応候補は図6に示すデータ構造の格フレーム対応バ
ッファに保存される。ステップST15ではまだ翻訳規
則の抽出が行なわれていない格フレーム対応候補がある
かどうかが検査される。ない場合には終了し、親ルーチ
ンに戻る。ある場合にはステップST16に進む。ステ
ップST16では図3のステップST6で指定された品
詞、単語の条件を格フレームの用言が満たしているかど
うかが調べられ、満たしていればステップST17に進
む。条件を満たしていない場合はステップST15に戻
る。ステップST17では格フレーム対応修正ルーチン
が呼ばれ、ステップST18に進む。ステップST18
では翻訳規則抽出ルーチンが呼ばれ、格フレーム対応か
らユーザ翻訳規則が作成され、翻訳規則登録バッファに
書き込まれる。ステップST19では翻訳規則登録バッ
ファにあるユーザ翻訳規則がユーザ規則辞書に出力さ
れ、ステップST15に戻る。
【0019】図5は対訳文の日本語文「ピッチャーがボ
ールを持つ。」と英語文“Thepitcher ho
lds a ball.”をそれぞれ解析して得られる
依存構造である。これらのような文字列を解析し、上記
に示すような依存構造を求める方法については、従来様
々な手法が提案されているので詳しい説明は省略する。
また図5に示すような2つの依存構造を入力とし、対応
する語のペア(例えば日本語の「ピッチャー」と英語の
“pitcher”)を求めるにあたっては、文献「翻
訳テンプレート学習方式および翻訳テンプレート学習シ
ステム(特開平5−151260)」、「日英対訳文間
の素性構造照合による統語的曖昧性の解消(情報処理学
会論文誌、Vol.33 No.12, pp.1555)」、「二
言語対訳コーバスからの動詞の格フレーム獲得(情報処
理学会論文誌、Vol.34 No.5, pp.913)」、「対
訳文書を用いた訳語の学習(情報処理学会第48回全国
大会予稿集、3−153)」、「Lerning Tr
anslation Templetes from
Bilingual Text,(Proc of C
OLING−92, pp.672)」等に記述された手法
を用いることができる。これらの文献で述べられた手法
は、対訳辞書を用いて語の対応を推定するため、後述す
る例のように翻訳規則の抽出に必要な格情報が全て得ら
れないことがある。これらの手法により日本後側の「持
つ」が英語側の“hold”に、日本後側の「ピッチャ
ー」が英語側の“pitcher”に、日本後側の「ボ
ール」が英語側の“ball”に対応し、また2つの依
存構造が全体として対応する格フレームとなっているこ
とが得られる。図4のステップST14ではこのような
対応する格フレームを格フレーム対応候補として、図6
の格フレーム対応バッファに保存する。
ールを持つ。」と英語文“Thepitcher ho
lds a ball.”をそれぞれ解析して得られる
依存構造である。これらのような文字列を解析し、上記
に示すような依存構造を求める方法については、従来様
々な手法が提案されているので詳しい説明は省略する。
また図5に示すような2つの依存構造を入力とし、対応
する語のペア(例えば日本語の「ピッチャー」と英語の
“pitcher”)を求めるにあたっては、文献「翻
訳テンプレート学習方式および翻訳テンプレート学習シ
ステム(特開平5−151260)」、「日英対訳文間
の素性構造照合による統語的曖昧性の解消(情報処理学
会論文誌、Vol.33 No.12, pp.1555)」、「二
言語対訳コーバスからの動詞の格フレーム獲得(情報処
理学会論文誌、Vol.34 No.5, pp.913)」、「対
訳文書を用いた訳語の学習(情報処理学会第48回全国
大会予稿集、3−153)」、「Lerning Tr
anslation Templetes from
Bilingual Text,(Proc of C
OLING−92, pp.672)」等に記述された手法
を用いることができる。これらの文献で述べられた手法
は、対訳辞書を用いて語の対応を推定するため、後述す
る例のように翻訳規則の抽出に必要な格情報が全て得ら
れないことがある。これらの手法により日本後側の「持
つ」が英語側の“hold”に、日本後側の「ピッチャ
ー」が英語側の“pitcher”に、日本後側の「ボ
ール」が英語側の“ball”に対応し、また2つの依
存構造が全体として対応する格フレームとなっているこ
とが得られる。図4のステップST14ではこのような
対応する格フレームを格フレーム対応候補として、図6
の格フレーム対応バッファに保存する。
【0020】図7は格フレーム対応修正ルーチンの処理
の手順を示すフローチャートである。ステップST21
では格フレーム対応補正ルーチンが呼ばれ、対訳辞書を
用いた語の対応では推定しきれなかった語の対応を求
め、格フレーム対応を修正する。ステップST22では
格フレーム対応候補バッファの内容が表示フォーマット
に変換され、表示部を用いて図10のようにユーザに提
示される。ステップST23ではユーザがイベントを入
力する。ステップST24ではイベントが「OK」であ
るかどうかが検査される。「OK」の場合はステップS
T25に進む。そうでない場合はステップST26に進
む。ステップST25では表示部の内容が格フレーム対
応バッファのフォーマットに変換され、格フレーム対応
バッファに書き込まれて終了し、親ルーチンに戻る。
の手順を示すフローチャートである。ステップST21
では格フレーム対応補正ルーチンが呼ばれ、対訳辞書を
用いた語の対応では推定しきれなかった語の対応を求
め、格フレーム対応を修正する。ステップST22では
格フレーム対応候補バッファの内容が表示フォーマット
に変換され、表示部を用いて図10のようにユーザに提
示される。ステップST23ではユーザがイベントを入
力する。ステップST24ではイベントが「OK」であ
るかどうかが検査される。「OK」の場合はステップS
T25に進む。そうでない場合はステップST26に進
む。ステップST25では表示部の内容が格フレーム対
応バッファのフォーマットに変換され、格フレーム対応
バッファに書き込まれて終了し、親ルーチンに戻る。
【0021】例を用いて説明する。対訳文が 日本語:「この問題に質問があります。」 英語 :I have a question abo
ut it. であるとする。この場合図4のST11〜ST14で次
のような誤った格フレーム対応候補が得られたとする。
(図8に格フレーム対応バッファの内容を示す) ある=have | 問題(に)=question(obj) この場合、正しくは ある=have | 質問(が)=question(obj) | 問題(に)=problem(abuut) となるべきである。この場合の修正処理の流れを以下に
説明する。ステップST11では格フレーム対応候補ル
ーチンが呼ばれるが、格フレーム対応候補ルーチンでは
正しい格フレーム対応の候補が可能でないので、そのま
まステップST12に進む。ステップST13では格フ
レーム対応候補が表示フォーマットに変換され、表示部
に図10のように表示されてユーザの入力待ちの状態に
なる。間違った対応付けがなされているのは格1のとこ
ろであるのでユーザはマウス等を用いて格1のところに
カーソルを持っていきマウス等をクリック等する。ステ
ップST14に進むが、このイベントは「OK」ではな
いので、ステップST16に進む。ステップST16で
は格1のところがクリックされたので格1の等号の両側
がラインエディットモードに入る。ここでユーザは図1
1のように「問題(に)」を「質問(が)」に修正す
る。次にユーザは同様にマウス等を用いて格2のところ
にカーソルを持っていきマウス等をクリックする。さら
に図12に示すように格2の情報を入力する。以上で必
要な修正は終ったのでユーザは「OK」ボタンを押す。
ステップ14ではイベントが「OK」であるのでステッ
プST5に進む。ステップST15では画面の表示内容
が格フレーム対応バッファのフォーマットに変換され格
フレーム対応バッファに書き込まれる。(図9は修正さ
れた格フレーム対応バッファの内容である) 図13は図7のST21で行なう格フレーム対応補正の
処理の流れを表すフローチャートである。ステップST
31では格フレーム対応バッファの中で、片方の言語で
欠落している格情報があるかどうかが検査される。ない
場合には終了して親ルーチンに戻る。ある場合にはステ
ップST32に進む。ステップST32では日英格対応
テーブル(図14)を参照し、片方の言語で欠落してい
る格を推定する。ステップST33では辞書引きを行な
い欠落している格の格フィラーが推定され、ステップS
T31に戻る。
ut it. であるとする。この場合図4のST11〜ST14で次
のような誤った格フレーム対応候補が得られたとする。
(図8に格フレーム対応バッファの内容を示す) ある=have | 問題(に)=question(obj) この場合、正しくは ある=have | 質問(が)=question(obj) | 問題(に)=problem(abuut) となるべきである。この場合の修正処理の流れを以下に
説明する。ステップST11では格フレーム対応候補ル
ーチンが呼ばれるが、格フレーム対応候補ルーチンでは
正しい格フレーム対応の候補が可能でないので、そのま
まステップST12に進む。ステップST13では格フ
レーム対応候補が表示フォーマットに変換され、表示部
に図10のように表示されてユーザの入力待ちの状態に
なる。間違った対応付けがなされているのは格1のとこ
ろであるのでユーザはマウス等を用いて格1のところに
カーソルを持っていきマウス等をクリック等する。ステ
ップST14に進むが、このイベントは「OK」ではな
いので、ステップST16に進む。ステップST16で
は格1のところがクリックされたので格1の等号の両側
がラインエディットモードに入る。ここでユーザは図1
1のように「問題(に)」を「質問(が)」に修正す
る。次にユーザは同様にマウス等を用いて格2のところ
にカーソルを持っていきマウス等をクリックする。さら
に図12に示すように格2の情報を入力する。以上で必
要な修正は終ったのでユーザは「OK」ボタンを押す。
ステップ14ではイベントが「OK」であるのでステッ
プST5に進む。ステップST15では画面の表示内容
が格フレーム対応バッファのフォーマットに変換され格
フレーム対応バッファに書き込まれる。(図9は修正さ
れた格フレーム対応バッファの内容である) 図13は図7のST21で行なう格フレーム対応補正の
処理の流れを表すフローチャートである。ステップST
31では格フレーム対応バッファの中で、片方の言語で
欠落している格情報があるかどうかが検査される。ない
場合には終了して親ルーチンに戻る。ある場合にはステ
ップST32に進む。ステップST32では日英格対応
テーブル(図14)を参照し、片方の言語で欠落してい
る格を推定する。ステップST33では辞書引きを行な
い欠落している格の格フィラーが推定され、ステップS
T31に戻る。
【0022】例を用いて説明する。対訳文が 日本語:「ピッチャーはボールを持ったまま空を見上げ
た。」 英語 :Holding the ball,he l
ooked upthe sky. であるとする。この場合図4のST11〜ST14で次
のような格フレーム対応候補が得られる。(図15に格
フレーム対応バッファの内容を示す) 持つ=hold | ボール(を) =ball(obj) | ピッチャー(が)=未対応 ステップST31で欠落している格情報があるかどうか
検査され、この場合あるので、ステップST32に進
む。ステップST32では日英格対応テーブルが参照さ
れる。日英格対応テーブルを先頭から順に参照した結果
日本語格「が」に対しては英語格“subj”が対応す
ることがわかるので、英語格“subj”が補われる。
ステップST33では日本語「ピッチャー」に対する辞
書引きが行なわれる。辞書引きの結果「ピッチャー」の
訳語は“pitcher”であることがわかるので英語
側の格フィラー“pitcher”が補われ、ステップ
ST31に戻る。ステップST31ではこれ以上欠落し
ている格情報がないので終了する。(図16は補正され
た格フレーム対応バッファの内容である) 図17は図4のST18に示す翻訳規則抽出ルーチンの
処理の手順を示すフローチャートである。ステップST
41では格フレーム対応バッファの内容を参照して、格
の全ての組合せについての翻訳規則の候補が求められ、
得られた1つあるいは複数個の翻訳規則候補が翻訳規則
候補バッファに書き込まれる。ステップST42では翻
訳規則候補バッファに格納されている全ての翻訳規則の
候補についてそれと類似の翻訳規則が標準翻訳規則辞書
あるいはユーザ規則辞書に既に存在しているかどうかが
調べられ、存在しているものについては、マークが付け
られる。ステップST43では表示部を用いて翻訳規則
候補バッファのうち、図3のステップST6Aで指定さ
れた翻訳規則のテンプレートに一致する翻訳規則がユー
ザに提示される。指定された翻訳規則のテンプレートが
ない場合は全ての翻訳規則がユーザに提示される。その
際にマークが付いているものがマークの付いていないも
のよりも上の位置に提示される。ステップST44では
ユーザがマウス等を用いて提示された翻訳規則の中から
1つ選択し、翻訳規則登録バッファに格納して、親ルー
チンに戻る。
た。」 英語 :Holding the ball,he l
ooked upthe sky. であるとする。この場合図4のST11〜ST14で次
のような格フレーム対応候補が得られる。(図15に格
フレーム対応バッファの内容を示す) 持つ=hold | ボール(を) =ball(obj) | ピッチャー(が)=未対応 ステップST31で欠落している格情報があるかどうか
検査され、この場合あるので、ステップST32に進
む。ステップST32では日英格対応テーブルが参照さ
れる。日英格対応テーブルを先頭から順に参照した結果
日本語格「が」に対しては英語格“subj”が対応す
ることがわかるので、英語格“subj”が補われる。
ステップST33では日本語「ピッチャー」に対する辞
書引きが行なわれる。辞書引きの結果「ピッチャー」の
訳語は“pitcher”であることがわかるので英語
側の格フィラー“pitcher”が補われ、ステップ
ST31に戻る。ステップST31ではこれ以上欠落し
ている格情報がないので終了する。(図16は補正され
た格フレーム対応バッファの内容である) 図17は図4のST18に示す翻訳規則抽出ルーチンの
処理の手順を示すフローチャートである。ステップST
41では格フレーム対応バッファの内容を参照して、格
の全ての組合せについての翻訳規則の候補が求められ、
得られた1つあるいは複数個の翻訳規則候補が翻訳規則
候補バッファに書き込まれる。ステップST42では翻
訳規則候補バッファに格納されている全ての翻訳規則の
候補についてそれと類似の翻訳規則が標準翻訳規則辞書
あるいはユーザ規則辞書に既に存在しているかどうかが
調べられ、存在しているものについては、マークが付け
られる。ステップST43では表示部を用いて翻訳規則
候補バッファのうち、図3のステップST6Aで指定さ
れた翻訳規則のテンプレートに一致する翻訳規則がユー
ザに提示される。指定された翻訳規則のテンプレートが
ない場合は全ての翻訳規則がユーザに提示される。その
際にマークが付いているものがマークの付いていないも
のよりも上の位置に提示される。ステップST44では
ユーザがマウス等を用いて提示された翻訳規則の中から
1つ選択し、翻訳規則登録バッファに格納して、親ルー
チンに戻る。
【0023】例を用いて説明する。格フレーム対応バッ
ファに格フレーム対応 持つ=hold | ボール(を) =ball(obj) | ピッチャー(が)=pitcher(subj) が入っているとする。ステップ1では全ての格の組合せ
について翻訳規則の候補が求められ、翻訳規則候補バッ
ファに格納される。この場合 (1)持つ |ピッチャー(が) hold | pitcher(subj) |ボールを(を) → | ball(obj) (2)持つ |ピッチャー(が)→hold | pitcher(subj) (3)持つ |ボール(を) →hold | ball(obj) の3つの翻訳規則の候補が翻訳規則候補バッファに格納
される。ステップST2では(1)、(2)、(3)の
それぞれの翻訳規則候補について、それと類似の翻訳規
則が既に存在しているかどうかが調べられる。ここで規
則の類似性とは、例えば、標準翻訳規則辞書に 持つ | 物(を) → have | thing(obj) という翻訳規則が存在したとすると、翻訳規則の格パタ
ーンにより、(3)との類似性があるとされ、(3)に
マークが付けられる。
ファに格フレーム対応 持つ=hold | ボール(を) =ball(obj) | ピッチャー(が)=pitcher(subj) が入っているとする。ステップ1では全ての格の組合せ
について翻訳規則の候補が求められ、翻訳規則候補バッ
ファに格納される。この場合 (1)持つ |ピッチャー(が) hold | pitcher(subj) |ボールを(を) → | ball(obj) (2)持つ |ピッチャー(が)→hold | pitcher(subj) (3)持つ |ボール(を) →hold | ball(obj) の3つの翻訳規則の候補が翻訳規則候補バッファに格納
される。ステップST2では(1)、(2)、(3)の
それぞれの翻訳規則候補について、それと類似の翻訳規
則が既に存在しているかどうかが調べられる。ここで規
則の類似性とは、例えば、標準翻訳規則辞書に 持つ | 物(を) → have | thing(obj) という翻訳規則が存在したとすると、翻訳規則の格パタ
ーンにより、(3)との類似性があるとされ、(3)に
マークが付けられる。
【0024】ステップST3では表示部を用いて翻訳規
則候補バッファにある翻訳規則の候補がユーザに提示さ
れる。図3のステップST61で、翻訳規則のテンプレ
ートとして、「が」格と「を」格を両方とるものと、
「を」格をとるもの、の2つが指定されていたとする。
これは翻訳規則としては、以下の2つの形式の規則を意
味する。
則候補バッファにある翻訳規則の候補がユーザに提示さ
れる。図3のステップST61で、翻訳規則のテンプレ
ートとして、「が」格と「を」格を両方とるものと、
「を」格をとるもの、の2つが指定されていたとする。
これは翻訳規則としては、以下の2つの形式の規則を意
味する。
【0025】 動詞 | 名詞1(が) verb | noun1(subj) 名詞2(を) → | noun2(obj) 動詞 | 名詞(を) → verb | noun(obj) 従って、(1)、(2)、(3)の翻訳規則の候補の
内、翻訳規則のテンプレートに一致するものとして、
(1)、(3)が選択される。
内、翻訳規則のテンプレートに一致するものとして、
(1)、(3)が選択される。
【0026】最後にマークの付いているものを上の位置
にしてユーザに提示される。すなわちこの場合(3)
(1)の順にユーザに提示される。(図18) ステップST4ではユーザが2つの規則の中からマウス
等を用いて選択する。ここでは(3)を選択したとす
る。選択された翻訳規則は、翻訳規則登録バッファに格
納される。
にしてユーザに提示される。すなわちこの場合(3)
(1)の順にユーザに提示される。(図18) ステップST4ではユーザが2つの規則の中からマウス
等を用いて選択する。ここでは(3)を選択したとす
る。選択された翻訳規則は、翻訳規則登録バッファに格
納される。
【0027】なお本発明は、上記実施例に限定されるも
のではない。
のではない。
【0028】まず第一に、図3のステップST6、ステ
ップST6Aで設定できる学習条件はあくまで例であ
り、同様の学習条件は適宜追加可能である。
ップST6Aで設定できる学習条件はあくまで例であ
り、同様の学習条件は適宜追加可能である。
【0029】また図14の日英格対応テーブルはあくま
で一例であり、格対応とその順序は別のものを用いても
良い。
で一例であり、格対応とその順序は別のものを用いても
良い。
【0030】
【発明の効果】本発明によれば、対訳文からシステムが
定めた対応関係をユーザやシステム自身が修正、補正で
きる。また対応関係から複数の翻訳規則が学習できる場
合に、翻訳の品質向上に効果的な翻訳規則を学習でき
る。またユーザが学習すべき翻訳規則の条件設定を行な
い、その条件に一致した翻訳規則だけを学習することが
可能になる。
定めた対応関係をユーザやシステム自身が修正、補正で
きる。また対応関係から複数の翻訳規則が学習できる場
合に、翻訳の品質向上に効果的な翻訳規則を学習でき
る。またユーザが学習すべき翻訳規則の条件設定を行な
い、その条件に一致した翻訳規則だけを学習することが
可能になる。
【図1】翻訳規則学習システムの構成図である。
【図2】表示部のメインメニューである。
【図3】表示部で発生したイベントの処理の流れを示す
フローチャートである。
フローチャートである。
【図4】翻訳規則の学習の処理の流れを表すフローチャ
ートである。
ートである。
【図5】対訳文の依存構造の例である。
【図6】格フレーム対応バッファの説明図である。
【図7】格フレーム対応修正ルーチンの処理の手順を表
すフローチャートである。
すフローチャートである。
【図8】対訳文の依存構造の例に対する格フレーム対応
バッファの修正前の内容である。
バッファの修正前の内容である。
【図9】対訳文の依存構造の例に対する格フレーム対応
バッファの修正後の内容である。
バッファの修正後の内容である。
【図10】対訳文の依存構造の例に対する格フレーム対
応修正の際の修正前の表示部の表示内容である。
応修正の際の修正前の表示部の表示内容である。
【図11】対訳文の依存構造の例に対する格フレーム対
応修正の際の修正中の表示部の表示内容である。
応修正の際の修正中の表示部の表示内容である。
【図12】対訳文の依存構造の例に対する格フレーム対
応修正の際の修正後の表示部の表示内容である。
応修正の際の修正後の表示部の表示内容である。
【図13】格フレーム対応補正の処理の流れを表すフロ
ーチャートである。
ーチャートである。
【図14】日英格対応テーブルの説明図である。
【図15】対訳文の依存構造の例に対する格フレーム対
応バッファの補正前の内容である。
応バッファの補正前の内容である。
【図16】対訳文の依存構造の例に対する格フレーム対
応バッファの修正後の内容である。
応バッファの修正後の内容である。
【図17】翻訳規則抽出ルーチンの処理の流れを表すフ
ローチャートである。
ローチャートである。
【図18】ユーザによる翻訳規則選択の際の表示部であ
る。
る。
1 入力部 2 表示部 3 記憶部 4 制御部
Claims (2)
- 【請求項1】 予め翻訳された翻訳文とその原文との対
からなる対訳文書を予め格納しておく記憶手段と、 この記憶手段から読み出した前記対訳文書に基づいてそ
の対訳文間の単語の対応関係を推定するステップと、前
記単語の対応関係に基づいて前記対訳文書における両言
語の用言と格情報との対応を推定するステップと、推定
された両言語の用言と格情報との対応関係から翻訳規則
を抽出するステップとを順次実行して翻訳規則を学習す
る翻訳規則学習手段と、を備えた機械翻訳装置に適用さ
れる翻訳規則学習方法であり、 前記翻訳規則抽出のステップでは、前記対訳文書におけ
る両言語の格情報を比較して該格情報の対応関係の誤り
や不完全さを検出し、この検出後にこの検出結果に応じ
て一方の言語の正しい格情報が推定された場合、正しい
と推定された格情報を、翻訳規則を抽出するための格情
報として用いることを特徴とする機械翻訳装置における
翻訳規則学習方法。 - 【請求項2】 前記翻訳規則抽出のステップにおいて、
前記対訳文書における両言語の格情報の対応関係の誤り
や不完全さを検出した内容を表示手段で表示する一方、
この表示された内容を正しいと推定された格情報に置き
換える処置を前記機械翻訳装置での所定操作でなし得る
ようにすることを特徴とする請求項1記載の機械翻訳装
置における翻訳規則学習方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6259705A JPH08101837A (ja) | 1994-09-30 | 1994-09-30 | 機械翻訳装置における翻訳規則学習方法 |
| US08/536,756 US5687383A (en) | 1994-09-30 | 1995-09-29 | Translation rule learning scheme for machine translation |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6259705A JPH08101837A (ja) | 1994-09-30 | 1994-09-30 | 機械翻訳装置における翻訳規則学習方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08101837A true JPH08101837A (ja) | 1996-04-16 |
Family
ID=17337794
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6259705A Pending JPH08101837A (ja) | 1994-09-30 | 1994-09-30 | 機械翻訳装置における翻訳規則学習方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5687383A (ja) |
| JP (1) | JPH08101837A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010122982A (ja) * | 2008-11-20 | 2010-06-03 | Nec Corp | 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム |
| US10198435B2 (en) | 2015-11-17 | 2019-02-05 | Samsung Electronics Co., Ltd. | Apparatus and method for generating translation model, apparatus and method for automatic translation |
| US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
| US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
| US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
| US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
| CN117597711A (zh) * | 2021-05-04 | 2024-02-23 | 泰雷兹数字安全法国简易股份公司 | 基于生物特征识别融合的识别的准确度提高 |
Families Citing this family (70)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5848386A (en) * | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
| JP3272288B2 (ja) * | 1997-12-24 | 2002-04-08 | 日本アイ・ビー・エム株式会社 | 機械翻訳装置および機械翻訳方法 |
| US6173250B1 (en) | 1998-06-03 | 2001-01-09 | At&T Corporation | Apparatus and method for speech-text-transmit communication over data networks |
| US6363337B1 (en) * | 1999-01-19 | 2002-03-26 | Universal Ad Ltd. | Translation of data according to a template |
| US7016829B2 (en) * | 2001-05-04 | 2006-03-21 | Microsoft Corporation | Method and apparatus for unsupervised training of natural language processing units |
| WO2003005166A2 (en) | 2001-07-03 | 2003-01-16 | University Of Southern California | A syntax-based statistical translation model |
| EP1306775A1 (en) | 2001-10-29 | 2003-05-02 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
| US20030101044A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
| AU2003269808A1 (en) | 2002-03-26 | 2004-01-06 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
| EP1349079A1 (en) * | 2002-03-28 | 2003-10-01 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
| EP1351158A1 (en) * | 2002-03-28 | 2003-10-08 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
| US7318022B2 (en) * | 2003-06-12 | 2008-01-08 | Microsoft Corporation | Method and apparatus for training a translation disambiguation classifier |
| US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
| US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
| US8666725B2 (en) * | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
| US7853473B2 (en) | 2004-08-31 | 2010-12-14 | Revionics, Inc. | Market-based price optimization system |
| DE112005002534T5 (de) | 2004-10-12 | 2007-11-08 | University Of Southern California, Los Angeles | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
| JP2006276915A (ja) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | 翻訳処理方法、文書翻訳装置およびプログラム |
| US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
| US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
| US20070043553A1 (en) * | 2005-08-16 | 2007-02-22 | Microsoft Corporation | Machine translation models incorporating filtered training data |
| WO2007088538A2 (en) * | 2006-01-31 | 2007-08-09 | Ramot At Tel Aviv University Ltd. | Method and apparatus for translating utterances |
| US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
| US7865352B2 (en) * | 2006-06-02 | 2011-01-04 | Microsoft Corporation | Generating grammatical elements in natural language sentences |
| US8209163B2 (en) * | 2006-06-02 | 2012-06-26 | Microsoft Corporation | Grammatical element generation in machine translation |
| US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
| US9075864B2 (en) | 2006-10-10 | 2015-07-07 | Abbyy Infopoisk Llc | Method and system for semantic searching using syntactic and semantic analysis |
| US9588958B2 (en) | 2006-10-10 | 2017-03-07 | Abbyy Infopoisk Llc | Cross-language text classification |
| US9098489B2 (en) | 2006-10-10 | 2015-08-04 | Abbyy Infopoisk Llc | Method and system for semantic searching |
| US8892423B1 (en) | 2006-10-10 | 2014-11-18 | Abbyy Infopoisk Llc | Method and system to automatically create content for dictionaries |
| US9069750B2 (en) | 2006-10-10 | 2015-06-30 | Abbyy Infopoisk Llc | Method and system for semantic searching of natural language texts |
| US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
| US9892111B2 (en) | 2006-10-10 | 2018-02-13 | Abbyy Production Llc | Method and device to estimate similarity between documents having multiple segments |
| US8145473B2 (en) * | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
| US9471562B2 (en) | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
| US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
| US9053090B2 (en) | 2006-10-10 | 2015-06-09 | Abbyy Infopoisk Llc | Translating texts between languages |
| US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
| US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
| US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
| US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
| US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
| US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
| US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
| US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
| US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
| US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
| US20090013268A1 (en) * | 2007-07-02 | 2009-01-08 | Universal Ad Ltd. | Creation Of Visual Composition Of Product Images |
| KR100912501B1 (ko) * | 2007-08-09 | 2009-08-17 | 한국전자통신연구원 | 번역 지식 구축 방법 및 장치 |
| WO2009107456A1 (ja) * | 2008-02-29 | 2009-09-03 | シャープ株式会社 | 情報処理装置、方法、およびプログラム |
| US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
| JP4985689B2 (ja) * | 2009-03-30 | 2012-07-25 | ブラザー工業株式会社 | 印刷装置 |
| US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
| US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
| KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
| US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
| US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
| US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
| US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
| US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
| US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
| WO2014098640A1 (en) * | 2012-12-19 | 2014-06-26 | Abbyy Infopoisk Llc | Translation and dictionary selection by context |
| US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
| JP6226321B2 (ja) * | 2013-10-23 | 2017-11-08 | 株式会社サン・フレア | 翻訳支援システム、翻訳支援システムのサーバー、翻訳支援システムのクライアント、翻訳支援システムの制御方法、及びそのプログラム |
| RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
| RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
| RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
| US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
| CN106383818A (zh) | 2015-07-30 | 2017-02-08 | 阿里巴巴集团控股有限公司 | 一种机器翻译方法及装置 |
| US10769386B2 (en) * | 2017-12-05 | 2020-09-08 | Sap Se | Terminology proposal engine for determining target language equivalents |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05151260A (ja) * | 1991-11-29 | 1993-06-18 | Hitachi Ltd | 翻訳テンプレート学習方法および翻訳テンプレート学習システム |
| JP3326646B2 (ja) * | 1994-03-04 | 2002-09-24 | 日本電信電話株式会社 | 機械翻訳システム用辞書・ルール学習装置 |
-
1994
- 1994-09-30 JP JP6259705A patent/JPH08101837A/ja active Pending
-
1995
- 1995-09-29 US US08/536,756 patent/US5687383A/en not_active Expired - Lifetime
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
| JP2010122982A (ja) * | 2008-11-20 | 2010-06-03 | Nec Corp | 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム |
| US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
| US10984429B2 (en) | 2010-03-09 | 2021-04-20 | Sdl Inc. | Systems and methods for translating textual content |
| US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
| US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
| US10402498B2 (en) | 2012-05-25 | 2019-09-03 | Sdl Inc. | Method and system for automatic management of reputation of translators |
| US10198435B2 (en) | 2015-11-17 | 2019-02-05 | Samsung Electronics Co., Ltd. | Apparatus and method for generating translation model, apparatus and method for automatic translation |
| CN117597711A (zh) * | 2021-05-04 | 2024-02-23 | 泰雷兹数字安全法国简易股份公司 | 基于生物特征识别融合的识别的准确度提高 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5687383A (en) | 1997-11-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH08101837A (ja) | 機械翻訳装置における翻訳規則学習方法 | |
| US5652896A (en) | Language conversion system and text creating system using such | |
| Brockett et al. | Correcting ESL errors using phrasal SMT techniques | |
| US8423346B2 (en) | Device and method for interactive machine translation | |
| EP1482414B1 (en) | Translating method for emphasised words | |
| JP2002297588A (ja) | 訳例辞書の自動生成方法およびプログラムおよび装置 | |
| KR100918338B1 (ko) | 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트 생성 방법, 장치 및 프로그램을 저장한 기록 매체 | |
| Liu | Research on the development of computer intelligent proofreading system based on the perspective of English translation application | |
| CN114722842A (zh) | 一种计算机人工智能外文翻译方法及其翻译系统 | |
| US8078451B2 (en) | Interface and methods for collecting aligned editorial corrections into a database | |
| Bhatti et al. | Managing contextual shifts: Pragmatics and semantics in AI dialogue systems for Pakistani language documentation | |
| CN113822053B (zh) | 一种语法错误检测方法、装置、电子设备及存储介质 | |
| Li et al. | Chinese spelling check based on neural machine translation | |
| US20100076943A1 (en) | Foreign-Language Learning Method Utilizing An Original Language to Review Corresponding Foreign Languages and Foreign-Language Learning Database System Thereof | |
| CN110782899B (zh) | 信息处理装置、存储介质及信息处理方法 | |
| JPH08212216A (ja) | 自然言語処理装置および自然言語処理方法 | |
| JP2003006191A (ja) | 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体 | |
| CN115965017B (zh) | 一种基于开发平台的多语言录入和解析系统及方法 | |
| JPH11282844A (ja) | 文書作成方法および情報処理装置および記録媒体 | |
| Chen et al. | Chinese Spelling Check based on Neural Machine Translation | |
| JP3316884B2 (ja) | 言語翻訳装置 | |
| JP3939151B2 (ja) | 訳語選択装置および訳語選択プログラムおよび訳語選択プログラムを記憶した媒体 | |
| Brown | Improving embedded machine translation with user interaction | |
| Winiwarter | JETCAT-Japanese-English Translation using Corpus-based Acquisition of Transfer rules | |
| JP2023146547A (ja) | 抽出プログラム、装置、及び方法 |