JPH08101837A - 機械翻訳装置における翻訳規則学習方法 - Google Patents

機械翻訳装置における翻訳規則学習方法

Info

Publication number
JPH08101837A
JPH08101837A JP6259705A JP25970594A JPH08101837A JP H08101837 A JPH08101837 A JP H08101837A JP 6259705 A JP6259705 A JP 6259705A JP 25970594 A JP25970594 A JP 25970594A JP H08101837 A JPH08101837 A JP H08101837A
Authority
JP
Japan
Prior art keywords
translation
case
correspondence
translation rule
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6259705A
Other languages
English (en)
Inventor
Keisuke Nakayama
中山  圭介
Satoshi Kinoshita
聡 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6259705A priority Critical patent/JPH08101837A/ja
Priority to US08/536,756 priority patent/US5687383A/en
Publication of JPH08101837A publication Critical patent/JPH08101837A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 対訳文から両言語の文の対応関係に基づいて
翻訳規則を学習する際に、ユーザの介在により効率良く
翻訳規則を学習することを目的とする。 【構成】 対訳文間の対応付けを行ない両言語の用言と
格情報の対応を推定し、翻訳規則学習に先だってユーザ
が学習条件を設定し、対応付けを補正し、翻訳規則の候
補を生成し、その中からユーザが学習する翻訳規則を選
択してユーザ規則辞書に登録する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電子計算機を用いて自
然言語文書を翻訳する機械翻訳装置における翻訳規則学
習方法に関する。
【0002】
【従来の技術】近年、計算機による自然言語処理技術が
高まり、各種の文書処理システムが開発されている。特
に、大量の文書を他の言語の文書に自動的に翻訳する機
械翻訳システムなどが実用化されている。
【0003】自然言語文書を翻訳するためには、数万語
ないし数十万語の語彙を備える大規模な自然言語用辞書
と、言語現象を規則的に整理した文法知識等が必要であ
るが、ユーザや文書の違いによって翻訳出力をカスタマ
イズする必要のある場合も多い。このためユーザ登録辞
書やユーザ規則辞書を用意して、ユーザに翻訳出力をカ
スタマイズする機能を提供している。
【0004】従来はこのユーザ辞書を人手で構築してい
たため、ユーザに多大な労力を強いるという問題があっ
た。この問題を解決するために、人間が翻訳した大量の
翻訳文とその原文の対(対訳文書と呼ばれる)を利用し
て、そこから翻訳規則を自動的に学習する方法が近年提
案されている。これらの方法では対訳文の原言語と目的
言語をそれぞれ解析し、双方の解析結果の単語や句、格
フレームなどの対応関係を求め、求められた対応関係を
もとに翻訳を自動的に学習する。
【0005】
【発明が解決しようとする課題】しかしながら、翻訳規
則を自動的に学習する方法では、システムが求めた対応
関係が間違っていると、そこから得られた翻訳規則も間
違ったものになってしまう問題があった。またシステム
が正しく対応関係を定めていたとしても、そこから学習
できる翻訳規則が複数個ある場合、どれを学習すべきか
システムが判断できないという問題があった。
【0006】本発明の目的はこのような従来の課題を解
決することにある。すなわち、本発明はシステムが求め
た対訳文間の対応関係に誤りであったり不完全であった
場合にその対応関係をユーザやシステム自身が修正でき
るようにすることを第1の目的とする。また、システム
が定めた対応関係から複数の翻訳規則が学習できる場合
にどの翻訳規則を学習するかユーザが指定できるように
することを第2の目的とする。また学習すべき翻訳規則
の条件設定をユーザが行なうことによって、ユーザが希
望する種類の翻訳規則を学習することを第3の目的とす
る。
【0007】
【課題を解決するための手段】上記第1の目的を達成す
るため、本発明は、予め翻訳された翻訳文とその原文と
の対からなる対訳文書を予め格納しておく記憶手段と、
この記憶手段から読み出した前記対訳文書に基づいてそ
の対訳文間の単語の対応関係を推定するステップと、前
記単語の対応関係に基づいて前記対訳文書における両言
語の用言と格情報との対応を推定するステップと、推定
された両言語の用言と格情報との対応関係から翻訳規則
を抽出するステップとを順次実行して翻訳規則を学習す
る翻訳規則学習手段と、を備えた機械翻訳装置に適用さ
れる翻訳規則学習方法であり、前記翻訳規則抽出のステ
ップでは、前記対訳文書における両言語の格情報を比較
して該格情報の対応関係の誤りや不完全さを検出し、こ
の検出後にこの検出結果に応じて一方の言語の正しい格
情報が推定された場合、正しいと推定された格情報を、
翻訳規則を抽出するための格情報として用いることを特
徴とする。
【0008】また、前記翻訳規則抽出のステップにおい
て、前記対訳文書における両言語の格情報の対応関係の
誤りや不完全さを検出した内容を表示手段で表示する一
方、この表示された内容を正しいと推定された格情報に
置き換える処理を前記機械翻訳装置での所定操作でなし
得るようにすることを特徴とする。
【0009】更に、上記第2の目的を達成するため、前
記翻訳規則抽出のステップにおいて、前記対訳文書にお
ける両言語の用言と格情報の対応から用言とその格に関
する翻訳規則の候補を1つあるいは複数個生成し、この
生成後にこの生成された翻訳規則を表示手段で表示する
一方、表示された翻訳規則の中から任意の翻訳規則を前
記機械翻訳装置での所定操作でなし得るようにすること
を特徴とする。
【0010】また、前記翻訳規則抽出のステップにおい
て、翻訳規則の候補が複数個生成された場合には、既存
の翻訳規則を一部修正して得られる翻訳規則の候補を優
先的に翻訳規則として選択して学習することを特徴とす
る。
【0011】更に、上記第3の目的を達成するため、前
記翻訳規則学習手段の学習ステップの中に、翻訳規則の
学習条件を設定するステップを設け、この翻訳規則の学
習条件を設定するステップでは、前記機械翻訳装置での
所定入力操作でユーザが学習する翻訳規則についてのテ
ンプレートを指定できるようにしたことを特徴とする。
【0012】また、前記翻訳規則の学習条件を設定する
ステップでは、前記機械翻訳装置での所定入力操作でユ
ーザが学習する単語、品詞を指定できることを特徴とす
る。
【0013】
【作用】本発明の第1の目的を達成するための方法によ
れば、システムが求めた両言語間の対応関係に誤りがあ
る場合や、対応関係に不完全な部分がある場合に、対応
関係をユーザやシステムが修正、補正できるようにな
る。また第2の目的を達成するための方法によれば、必
要に応じて修正された対応関係から複数の翻訳規則が学
習できる場合に、その中から翻訳の品質の向上に効果的
な翻訳規則を選択できるようになる。また第3の目的を
達成するための方法によれば、ユーザが学習すべき翻訳
規則の条件設定を行なうことによって、ユーザが希望す
る種類の翻訳規則を学習することができるようになる。
【0014】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は翻訳規則学習システムの構成図である。図
1で入力部1はユーザがシステムに操作指定を行なうた
めのもので、マウス、キーボード等が用いられる。表示
部2はユーザにシステムの情報を提示したり、ユーザに
以後の処理を問い合わせるためのもので、CRTやCR
T上のウィンドウシステムが用いられる。記憶部3はメ
モリ、磁気ディスク等で構成され、機械翻訳システムの
辞書・文法・翻訳規則、学習を行なうための対訳文書、
学習結果の翻訳規則を格納するためのユーザ規則辞書が
入っている。そして、このような入力部1、表示部2、
記憶部3は制御部4の制御下に置かれており、制御部4
では後述するように翻訳規則を学習する処理を実行す
る。
【0015】図2は図1の表示部2に表示される画面
で、上部には各種ボタン、下部には対訳文が表示され
る。上部のボタンはユーザがボタンを押した時、制御部
に対しイベントを発生するようになっている。
【0016】図3は図1の表示部2で発生したイベント
の処理の流れを表すフローチャートである。ステップS
T1ではイベントが入力される。ステップST2ではイ
ベントが「終了」であるかどうか検査される。「終了」
の場合には終了する。そうでなかった場合にはステップ
ST3に進む。ステップST3ではイベントが「ファイ
ル読み込み」であるかどうか検査される。「ファイル読
み込み」の場合にはステップST4に進む。そうでない
場合にはステップST5に進む。ステップST4ではユ
ーザが読み込む対訳文書のファイル名を指定しステップ
ST4Aに進む。ステップST4AではステップST4
で指定された対訳文書のファイルを読み込み、ステップ
ST1に戻る。ステップST5ではイベントが「条件設
定」を表すものであるかどうかが検査される。イベント
が「条件設定」の場合にはステップST6に進む。そう
でない場合にはステップST7に進む。ステップST6
ではユーザにより学習の対象となる品詞、単語の学習条
件の設定が行なわれ、ステップST6Aに進む。ステッ
プST6Aではユーザにより学習の対象となる翻訳規則
のテンプレートの設定が行なわれ、ステップST1に戻
る。ステップST7ではイベントが「学習」を表すもの
かどうかが検査される。イベントが「学習」の場合には
ステップST8に進む。そうでなかった場合にはステッ
プST9に進む。ステップST8では翻訳規則の学習が
行なわれる。ステップST9ではその他の処理(学習の
対象となる対訳文の選択等)が行なわれステップST1
に戻る。
【0017】図3のステップ6Aでは翻訳規則のテンプ
レートとしてどのような格パターンを取るものを学習対
象とするかが指定される。例えば (1)「が」格と「を」格の両方をとるもの (2)「が」格をとるもの (3)「を」格をとるもの の中でどの格パターンをとるものを学習対象とするか等
が指定される。
【0018】図4は翻訳規則の学習の処理の流れを表す
フローチャートである。ステップST11では対訳文書
から対訳文が1文読み込まれる。ステップST12では
対訳文の原文側が解析され、原文側の依存構造が作成さ
れる。ステップST13では対訳文の訳文側が解析さ
れ、訳文側の遺贈構造が作成される。ステップST14
では原文側の依存構造と訳文側の依存構造が照合され、
格フレーム対応候補が作成される。作成された格フレー
ム対応候補は図6に示すデータ構造の格フレーム対応バ
ッファに保存される。ステップST15ではまだ翻訳規
則の抽出が行なわれていない格フレーム対応候補がある
かどうかが検査される。ない場合には終了し、親ルーチ
ンに戻る。ある場合にはステップST16に進む。ステ
ップST16では図3のステップST6で指定された品
詞、単語の条件を格フレームの用言が満たしているかど
うかが調べられ、満たしていればステップST17に進
む。条件を満たしていない場合はステップST15に戻
る。ステップST17では格フレーム対応修正ルーチン
が呼ばれ、ステップST18に進む。ステップST18
では翻訳規則抽出ルーチンが呼ばれ、格フレーム対応か
らユーザ翻訳規則が作成され、翻訳規則登録バッファに
書き込まれる。ステップST19では翻訳規則登録バッ
ファにあるユーザ翻訳規則がユーザ規則辞書に出力さ
れ、ステップST15に戻る。
【0019】図5は対訳文の日本語文「ピッチャーがボ
ールを持つ。」と英語文“Thepitcher ho
lds a ball.”をそれぞれ解析して得られる
依存構造である。これらのような文字列を解析し、上記
に示すような依存構造を求める方法については、従来様
々な手法が提案されているので詳しい説明は省略する。
また図5に示すような2つの依存構造を入力とし、対応
する語のペア(例えば日本語の「ピッチャー」と英語の
“pitcher”)を求めるにあたっては、文献「翻
訳テンプレート学習方式および翻訳テンプレート学習シ
ステム(特開平5−151260)」、「日英対訳文間
の素性構造照合による統語的曖昧性の解消(情報処理学
会論文誌、Vol.33 No.12, pp.1555)」、「二
言語対訳コーバスからの動詞の格フレーム獲得(情報処
理学会論文誌、Vol.34 No.5, pp.913)」、「対
訳文書を用いた訳語の学習(情報処理学会第48回全国
大会予稿集、3−153)」、「Lerning Tr
anslation Templetes from
Bilingual Text,(Proc of C
OLING−92, pp.672)」等に記述された手法
を用いることができる。これらの文献で述べられた手法
は、対訳辞書を用いて語の対応を推定するため、後述す
る例のように翻訳規則の抽出に必要な格情報が全て得ら
れないことがある。これらの手法により日本後側の「持
つ」が英語側の“hold”に、日本後側の「ピッチャ
ー」が英語側の“pitcher”に、日本後側の「ボ
ール」が英語側の“ball”に対応し、また2つの依
存構造が全体として対応する格フレームとなっているこ
とが得られる。図4のステップST14ではこのような
対応する格フレームを格フレーム対応候補として、図6
の格フレーム対応バッファに保存する。
【0020】図7は格フレーム対応修正ルーチンの処理
の手順を示すフローチャートである。ステップST21
では格フレーム対応補正ルーチンが呼ばれ、対訳辞書を
用いた語の対応では推定しきれなかった語の対応を求
め、格フレーム対応を修正する。ステップST22では
格フレーム対応候補バッファの内容が表示フォーマット
に変換され、表示部を用いて図10のようにユーザに提
示される。ステップST23ではユーザがイベントを入
力する。ステップST24ではイベントが「OK」であ
るかどうかが検査される。「OK」の場合はステップS
T25に進む。そうでない場合はステップST26に進
む。ステップST25では表示部の内容が格フレーム対
応バッファのフォーマットに変換され、格フレーム対応
バッファに書き込まれて終了し、親ルーチンに戻る。
【0021】例を用いて説明する。対訳文が 日本語:「この問題に質問があります。」 英語 :I have a question abo
ut it. であるとする。この場合図4のST11〜ST14で次
のような誤った格フレーム対応候補が得られたとする。
(図8に格フレーム対応バッファの内容を示す) ある=have | 問題(に)=question(obj) この場合、正しくは ある=have | 質問(が)=question(obj) | 問題(に)=problem(abuut) となるべきである。この場合の修正処理の流れを以下に
説明する。ステップST11では格フレーム対応候補ル
ーチンが呼ばれるが、格フレーム対応候補ルーチンでは
正しい格フレーム対応の候補が可能でないので、そのま
まステップST12に進む。ステップST13では格フ
レーム対応候補が表示フォーマットに変換され、表示部
に図10のように表示されてユーザの入力待ちの状態に
なる。間違った対応付けがなされているのは格1のとこ
ろであるのでユーザはマウス等を用いて格1のところに
カーソルを持っていきマウス等をクリック等する。ステ
ップST14に進むが、このイベントは「OK」ではな
いので、ステップST16に進む。ステップST16で
は格1のところがクリックされたので格1の等号の両側
がラインエディットモードに入る。ここでユーザは図1
1のように「問題(に)」を「質問(が)」に修正す
る。次にユーザは同様にマウス等を用いて格2のところ
にカーソルを持っていきマウス等をクリックする。さら
に図12に示すように格2の情報を入力する。以上で必
要な修正は終ったのでユーザは「OK」ボタンを押す。
ステップ14ではイベントが「OK」であるのでステッ
プST5に進む。ステップST15では画面の表示内容
が格フレーム対応バッファのフォーマットに変換され格
フレーム対応バッファに書き込まれる。(図9は修正さ
れた格フレーム対応バッファの内容である) 図13は図7のST21で行なう格フレーム対応補正の
処理の流れを表すフローチャートである。ステップST
31では格フレーム対応バッファの中で、片方の言語で
欠落している格情報があるかどうかが検査される。ない
場合には終了して親ルーチンに戻る。ある場合にはステ
ップST32に進む。ステップST32では日英格対応
テーブル(図14)を参照し、片方の言語で欠落してい
る格を推定する。ステップST33では辞書引きを行な
い欠落している格の格フィラーが推定され、ステップS
T31に戻る。
【0022】例を用いて説明する。対訳文が 日本語:「ピッチャーはボールを持ったまま空を見上げ
た。」 英語 :Holding the ball,he l
ooked upthe sky. であるとする。この場合図4のST11〜ST14で次
のような格フレーム対応候補が得られる。(図15に格
フレーム対応バッファの内容を示す) 持つ=hold | ボール(を) =ball(obj) | ピッチャー(が)=未対応 ステップST31で欠落している格情報があるかどうか
検査され、この場合あるので、ステップST32に進
む。ステップST32では日英格対応テーブルが参照さ
れる。日英格対応テーブルを先頭から順に参照した結果
日本語格「が」に対しては英語格“subj”が対応す
ることがわかるので、英語格“subj”が補われる。
ステップST33では日本語「ピッチャー」に対する辞
書引きが行なわれる。辞書引きの結果「ピッチャー」の
訳語は“pitcher”であることがわかるので英語
側の格フィラー“pitcher”が補われ、ステップ
ST31に戻る。ステップST31ではこれ以上欠落し
ている格情報がないので終了する。(図16は補正され
た格フレーム対応バッファの内容である) 図17は図4のST18に示す翻訳規則抽出ルーチンの
処理の手順を示すフローチャートである。ステップST
41では格フレーム対応バッファの内容を参照して、格
の全ての組合せについての翻訳規則の候補が求められ、
得られた1つあるいは複数個の翻訳規則候補が翻訳規則
候補バッファに書き込まれる。ステップST42では翻
訳規則候補バッファに格納されている全ての翻訳規則の
候補についてそれと類似の翻訳規則が標準翻訳規則辞書
あるいはユーザ規則辞書に既に存在しているかどうかが
調べられ、存在しているものについては、マークが付け
られる。ステップST43では表示部を用いて翻訳規則
候補バッファのうち、図3のステップST6Aで指定さ
れた翻訳規則のテンプレートに一致する翻訳規則がユー
ザに提示される。指定された翻訳規則のテンプレートが
ない場合は全ての翻訳規則がユーザに提示される。その
際にマークが付いているものがマークの付いていないも
のよりも上の位置に提示される。ステップST44では
ユーザがマウス等を用いて提示された翻訳規則の中から
1つ選択し、翻訳規則登録バッファに格納して、親ルー
チンに戻る。
【0023】例を用いて説明する。格フレーム対応バッ
ファに格フレーム対応 持つ=hold | ボール(を) =ball(obj) | ピッチャー(が)=pitcher(subj) が入っているとする。ステップ1では全ての格の組合せ
について翻訳規則の候補が求められ、翻訳規則候補バッ
ファに格納される。この場合 (1)持つ |ピッチャー(が) hold | pitcher(subj) |ボールを(を) → | ball(obj) (2)持つ |ピッチャー(が)→hold | pitcher(subj) (3)持つ |ボール(を) →hold | ball(obj) の3つの翻訳規則の候補が翻訳規則候補バッファに格納
される。ステップST2では(1)、(2)、(3)の
それぞれの翻訳規則候補について、それと類似の翻訳規
則が既に存在しているかどうかが調べられる。ここで規
則の類似性とは、例えば、標準翻訳規則辞書に 持つ | 物(を) → have | thing(obj) という翻訳規則が存在したとすると、翻訳規則の格パタ
ーンにより、(3)との類似性があるとされ、(3)に
マークが付けられる。
【0024】ステップST3では表示部を用いて翻訳規
則候補バッファにある翻訳規則の候補がユーザに提示さ
れる。図3のステップST61で、翻訳規則のテンプレ
ートとして、「が」格と「を」格を両方とるものと、
「を」格をとるもの、の2つが指定されていたとする。
これは翻訳規則としては、以下の2つの形式の規則を意
味する。
【0025】 動詞 | 名詞1(が) verb | noun1(subj) 名詞2(を) → | noun2(obj) 動詞 | 名詞(を) → verb | noun(obj) 従って、(1)、(2)、(3)の翻訳規則の候補の
内、翻訳規則のテンプレートに一致するものとして、
(1)、(3)が選択される。
【0026】最後にマークの付いているものを上の位置
にしてユーザに提示される。すなわちこの場合(3)
(1)の順にユーザに提示される。(図18) ステップST4ではユーザが2つの規則の中からマウス
等を用いて選択する。ここでは(3)を選択したとす
る。選択された翻訳規則は、翻訳規則登録バッファに格
納される。
【0027】なお本発明は、上記実施例に限定されるも
のではない。
【0028】まず第一に、図3のステップST6、ステ
ップST6Aで設定できる学習条件はあくまで例であ
り、同様の学習条件は適宜追加可能である。
【0029】また図14の日英格対応テーブルはあくま
で一例であり、格対応とその順序は別のものを用いても
良い。
【0030】
【発明の効果】本発明によれば、対訳文からシステムが
定めた対応関係をユーザやシステム自身が修正、補正で
きる。また対応関係から複数の翻訳規則が学習できる場
合に、翻訳の品質向上に効果的な翻訳規則を学習でき
る。またユーザが学習すべき翻訳規則の条件設定を行な
い、その条件に一致した翻訳規則だけを学習することが
可能になる。
【図面の簡単な説明】
【図1】翻訳規則学習システムの構成図である。
【図2】表示部のメインメニューである。
【図3】表示部で発生したイベントの処理の流れを示す
フローチャートである。
【図4】翻訳規則の学習の処理の流れを表すフローチャ
ートである。
【図5】対訳文の依存構造の例である。
【図6】格フレーム対応バッファの説明図である。
【図7】格フレーム対応修正ルーチンの処理の手順を表
すフローチャートである。
【図8】対訳文の依存構造の例に対する格フレーム対応
バッファの修正前の内容である。
【図9】対訳文の依存構造の例に対する格フレーム対応
バッファの修正後の内容である。
【図10】対訳文の依存構造の例に対する格フレーム対
応修正の際の修正前の表示部の表示内容である。
【図11】対訳文の依存構造の例に対する格フレーム対
応修正の際の修正中の表示部の表示内容である。
【図12】対訳文の依存構造の例に対する格フレーム対
応修正の際の修正後の表示部の表示内容である。
【図13】格フレーム対応補正の処理の流れを表すフロ
ーチャートである。
【図14】日英格対応テーブルの説明図である。
【図15】対訳文の依存構造の例に対する格フレーム対
応バッファの補正前の内容である。
【図16】対訳文の依存構造の例に対する格フレーム対
応バッファの修正後の内容である。
【図17】翻訳規則抽出ルーチンの処理の流れを表すフ
ローチャートである。
【図18】ユーザによる翻訳規則選択の際の表示部であ
る。
【符号の説明】
1 入力部 2 表示部 3 記憶部 4 制御部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 予め翻訳された翻訳文とその原文との対
    からなる対訳文書を予め格納しておく記憶手段と、 この記憶手段から読み出した前記対訳文書に基づいてそ
    の対訳文間の単語の対応関係を推定するステップと、前
    記単語の対応関係に基づいて前記対訳文書における両言
    語の用言と格情報との対応を推定するステップと、推定
    された両言語の用言と格情報との対応関係から翻訳規則
    を抽出するステップとを順次実行して翻訳規則を学習す
    る翻訳規則学習手段と、を備えた機械翻訳装置に適用さ
    れる翻訳規則学習方法であり、 前記翻訳規則抽出のステップでは、前記対訳文書におけ
    る両言語の格情報を比較して該格情報の対応関係の誤り
    や不完全さを検出し、この検出後にこの検出結果に応じ
    て一方の言語の正しい格情報が推定された場合、正しい
    と推定された格情報を、翻訳規則を抽出するための格情
    報として用いることを特徴とする機械翻訳装置における
    翻訳規則学習方法。
  2. 【請求項2】 前記翻訳規則抽出のステップにおいて、
    前記対訳文書における両言語の格情報の対応関係の誤り
    や不完全さを検出した内容を表示手段で表示する一方、
    この表示された内容を正しいと推定された格情報に置き
    換える処置を前記機械翻訳装置での所定操作でなし得る
    ようにすることを特徴とする請求項1記載の機械翻訳装
    置における翻訳規則学習方法。
JP6259705A 1994-09-30 1994-09-30 機械翻訳装置における翻訳規則学習方法 Pending JPH08101837A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6259705A JPH08101837A (ja) 1994-09-30 1994-09-30 機械翻訳装置における翻訳規則学習方法
US08/536,756 US5687383A (en) 1994-09-30 1995-09-29 Translation rule learning scheme for machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6259705A JPH08101837A (ja) 1994-09-30 1994-09-30 機械翻訳装置における翻訳規則学習方法

Publications (1)

Publication Number Publication Date
JPH08101837A true JPH08101837A (ja) 1996-04-16

Family

ID=17337794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6259705A Pending JPH08101837A (ja) 1994-09-30 1994-09-30 機械翻訳装置における翻訳規則学習方法

Country Status (2)

Country Link
US (1) US5687383A (ja)
JP (1) JPH08101837A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122982A (ja) * 2008-11-20 2010-06-03 Nec Corp 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム
US10198435B2 (en) 2015-11-17 2019-02-05 Samsung Electronics Co., Ltd. Apparatus and method for generating translation model, apparatus and method for automatic translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
CN117597711A (zh) * 2021-05-04 2024-02-23 泰雷兹数字安全法国简易股份公司 基于生物特征识别融合的识别的准确度提高

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
JP3272288B2 (ja) * 1997-12-24 2002-04-08 日本アイ・ビー・エム株式会社 機械翻訳装置および機械翻訳方法
US6173250B1 (en) 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
US6363337B1 (en) * 1999-01-19 2002-03-26 Universal Ad Ltd. Translation of data according to a template
US7016829B2 (en) * 2001-05-04 2006-03-21 Microsoft Corporation Method and apparatus for unsupervised training of natural language processing units
WO2003005166A2 (en) 2001-07-03 2003-01-16 University Of Southern California A syntax-based statistical translation model
EP1306775A1 (en) 2001-10-29 2003-05-02 BRITISH TELECOMMUNICATIONS public limited company Machine translation
US20030101044A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
AU2003269808A1 (en) 2002-03-26 2004-01-06 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
EP1349079A1 (en) * 2002-03-28 2003-10-01 BRITISH TELECOMMUNICATIONS public limited company Machine translation
EP1351158A1 (en) * 2002-03-28 2003-10-08 BRITISH TELECOMMUNICATIONS public limited company Machine translation
US7318022B2 (en) * 2003-06-12 2008-01-08 Microsoft Corporation Method and apparatus for training a translation disambiguation classifier
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) * 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US7853473B2 (en) 2004-08-31 2010-12-14 Revionics, Inc. Market-based price optimization system
DE112005002534T5 (de) 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
JP2006276915A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 翻訳処理方法、文書翻訳装置およびプログラム
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US20070043553A1 (en) * 2005-08-16 2007-02-22 Microsoft Corporation Machine translation models incorporating filtered training data
WO2007088538A2 (en) * 2006-01-31 2007-08-09 Ramot At Tel Aviv University Ltd. Method and apparatus for translating utterances
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US7865352B2 (en) * 2006-06-02 2011-01-04 Microsoft Corporation Generating grammatical elements in natural language sentences
US8209163B2 (en) * 2006-06-02 2012-06-26 Microsoft Corporation Grammatical element generation in machine translation
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US9075864B2 (en) 2006-10-10 2015-07-07 Abbyy Infopoisk Llc Method and system for semantic searching using syntactic and semantic analysis
US9588958B2 (en) 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US9098489B2 (en) 2006-10-10 2015-08-04 Abbyy Infopoisk Llc Method and system for semantic searching
US8892423B1 (en) 2006-10-10 2014-11-18 Abbyy Infopoisk Llc Method and system to automatically create content for dictionaries
US9069750B2 (en) 2006-10-10 2015-06-30 Abbyy Infopoisk Llc Method and system for semantic searching of natural language texts
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9892111B2 (en) 2006-10-10 2018-02-13 Abbyy Production Llc Method and device to estimate similarity between documents having multiple segments
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9053090B2 (en) 2006-10-10 2015-06-09 Abbyy Infopoisk Llc Translating texts between languages
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20090013268A1 (en) * 2007-07-02 2009-01-08 Universal Ad Ltd. Creation Of Visual Composition Of Product Images
KR100912501B1 (ko) * 2007-08-09 2009-08-17 한국전자통신연구원 번역 지식 구축 방법 및 장치
WO2009107456A1 (ja) * 2008-02-29 2009-09-03 シャープ株式会社 情報処理装置、方法、およびプログラム
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
JP4985689B2 (ja) * 2009-03-30 2012-07-25 ブラザー工業株式会社 印刷装置
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
KR101356417B1 (ko) * 2010-11-05 2014-01-28 고려대학교 산학협력단 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
WO2014098640A1 (en) * 2012-12-19 2014-06-26 Abbyy Infopoisk Llc Translation and dictionary selection by context
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
JP6226321B2 (ja) * 2013-10-23 2017-11-08 株式会社サン・フレア 翻訳支援システム、翻訳支援システムのサーバー、翻訳支援システムのクライアント、翻訳支援システムの制御方法、及びそのプログラム
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
CN106383818A (zh) 2015-07-30 2017-02-08 阿里巴巴集团控股有限公司 一种机器翻译方法及装置
US10769386B2 (en) * 2017-12-05 2020-09-08 Sap Se Terminology proposal engine for determining target language equivalents

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151260A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JP3326646B2 (ja) * 1994-03-04 2002-09-24 日本電信電話株式会社 機械翻訳システム用辞書・ルール学習装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
JP2010122982A (ja) * 2008-11-20 2010-06-03 Nec Corp 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US10984429B2 (en) 2010-03-09 2021-04-20 Sdl Inc. Systems and methods for translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US10402498B2 (en) 2012-05-25 2019-09-03 Sdl Inc. Method and system for automatic management of reputation of translators
US10198435B2 (en) 2015-11-17 2019-02-05 Samsung Electronics Co., Ltd. Apparatus and method for generating translation model, apparatus and method for automatic translation
CN117597711A (zh) * 2021-05-04 2024-02-23 泰雷兹数字安全法国简易股份公司 基于生物特征识别融合的识别的准确度提高

Also Published As

Publication number Publication date
US5687383A (en) 1997-11-11

Similar Documents

Publication Publication Date Title
JPH08101837A (ja) 機械翻訳装置における翻訳規則学習方法
US5652896A (en) Language conversion system and text creating system using such
Brockett et al. Correcting ESL errors using phrasal SMT techniques
US8423346B2 (en) Device and method for interactive machine translation
EP1482414B1 (en) Translating method for emphasised words
JP2002297588A (ja) 訳例辞書の自動生成方法およびプログラムおよび装置
KR100918338B1 (ko) 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트 생성 방법, 장치 및 프로그램을 저장한 기록 매체
Liu Research on the development of computer intelligent proofreading system based on the perspective of English translation application
CN114722842A (zh) 一种计算机人工智能外文翻译方法及其翻译系统
US8078451B2 (en) Interface and methods for collecting aligned editorial corrections into a database
Bhatti et al. Managing contextual shifts: Pragmatics and semantics in AI dialogue systems for Pakistani language documentation
CN113822053B (zh) 一种语法错误检测方法、装置、电子设备及存储介质
Li et al. Chinese spelling check based on neural machine translation
US20100076943A1 (en) Foreign-Language Learning Method Utilizing An Original Language to Review Corresponding Foreign Languages and Foreign-Language Learning Database System Thereof
CN110782899B (zh) 信息处理装置、存储介质及信息处理方法
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP2003006191A (ja) 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
CN115965017B (zh) 一种基于开发平台的多语言录入和解析系统及方法
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
Chen et al. Chinese Spelling Check based on Neural Machine Translation
JP3316884B2 (ja) 言語翻訳装置
JP3939151B2 (ja) 訳語選択装置および訳語選択プログラムおよび訳語選択プログラムを記憶した媒体
Brown Improving embedded machine translation with user interaction
Winiwarter JETCAT-Japanese-English Translation using Corpus-based Acquisition of Transfer rules
JP2023146547A (ja) 抽出プログラム、装置、及び方法