JP2000259631A

JP2000259631A - 機械翻訳校正装置

Info

Publication number: JP2000259631A
Application number: JP11060045A
Authority: JP
Inventors: Kazuhide Yamamoto; 和英山本
Original assignee: ATR Interpreting Telecommunications Research Laboratories
Current assignee: ATR Interpreting Telecommunications Research Laboratories
Priority date: 1999-03-08
Filing date: 1999-03-08
Publication date: 2000-09-22
Anticipated expiration: 2019-03-08
Also published as: JP3387437B2

Abstract

(57)【要約】【課題】機械翻訳された翻訳文を適切により自然な翻
訳文に校正することができる機械翻訳校正装置を提供す
る。【解決手段】校正規則生成部１０は、機械翻訳された
機械翻訳文である校正対象文と、当該校正対象文から人
手による校正により校正された校正結果文との対を対応
づけて記憶された校正データに基づいて、校正対象文
と、当該校正対象文から挿入、削除、置換のうちの少な
くとも１つの編集校正処理がなされて置き換えすべき校
正文との対からなり、かつ翻訳用校正規則として整合性
を有する校正規則を生成する。自動校正部２は、機械翻
訳された機械翻訳文である校正対象文に対して、上記生
成手段によって生成された校正規則を適用することによ
り、自動的に校正して、校正翻訳文を生成して出力す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、第１の自然言語の
入力文から機械翻訳された第２の自然言語の機械翻訳文
を自動的に校正して出力する機械翻訳校正装置に関す
る。

【０００２】

【従来の技術】自然言語処理システムに対する社会的ニ
ーズはますます増大し、研究も盛んに行なわれている。
例えば、機械翻訳装置においては、書き言葉の翻訳だけ
でなく、自動翻訳電話などの話し言葉の翻訳の技術開発
が最近、行なわれるようになっている。書き言葉の翻訳
と違って、話し言葉の翻訳を実現するには、話し言葉の
内容が粗い内容であり、文法が所定の予め記憶された文
法からはずれた文法であっても、正しく解析して、その
話し言葉を翻訳した答えを常に出力することができるよ
うな頑健な処理を提供する必要がある。

【０００３】しかしながら、従来技術の装置において
は、予め記憶された複雑な文法に基づいて、入力された
自然言語文の構造を精密に解析しており、以下のような
問題点があった。（１）所定の文法に基づいて、しばしば逸脱する話し言
葉の自然言語文を正確に解析することができず、従来の
装置は、話し言葉の解析に向いていない。（２）例えば、話し言葉をサポートするような複雑な文
法規則を書くためには熟練を要するとともに、当該文法
規則が膨大となって複雑となるので、規則間の矛盾検出
などの管理作業は極めて困難になる。（３）上記（２）のように、複雑な文法規則を作成した
場合、膨大な数の曖昧な文法規則を生成することにな
り、当該文法規則のメモリが膨大になる一方、文法規則
を照合するアルゴリズムが複雑になる。それ故、記憶装
置の記憶容量が膨大となり、これによって解析装置の規
模が大きくなるとともに、処理時間が極めて長くなる。

【０００４】この問題点を解決するために、本特許出願
人は、特開平８−４４７４０号公報において、所定の文
法からしばしば逸脱する例えば話し言葉などの自然言語
文の構造を解析することができる自然言語解析装置（以
下、第１の従来例という。）を開示している。この第１
の従来例では、「文字列からなりかつ複数の単語からな
る入力された自然言語文の構造を解析する自然言語解析
装置において、単語と言語パターンとの関係を記述した
言語パターン検索テーブルを予め記憶する第１の記憶装
置と、上記第１の記憶装置に記憶された言語パターン検
索テーブルを参照して、入力された自然言語文の各単語
から、当該自然言語文に照合可能な言語パターンを検索
する検索手段と、上記検索手段によって検索された言語
パターンと上記入力された自然言語文に含まれる表層語
句とを組み合わせ、その組み合わせたものと上記入力さ
れた自然言語文とを照合して一致した組み合わせに基づ
いて、上記入力された自然言語文に対する言語パターン
と表層語句の組み合わせよりなる構造を決定して出力す
る照合手段とを備えたこと」を特徴としている。

【０００５】また、従来技術文献１「王啓祥ほか，”格
関係からの中国語生成”，情報処理学会研究会報告，Ｎ
Ｌ８０−６，１９９０年１１月２２日」において、日本
語から中国語への機械翻訳装置（以下、第２の従来例と
いう。）を開示している。この第２の従来例では、日本
語の文を形態素／構文／意味解析して得られた格情報や
意味コードなどを持ったノードを入力とし、日本語の深
層格に中国語の文法成分を対応させ、日本語の動詞別に
中国語の文法成分の位置を決める最適な最大表層構造チ
ェーンを検索し、正しい語順で中国語の文を生成してい
る。

【０００６】

【発明が解決しようとする課題】しかしながら、第１の
従来例においては、変換部において主語などの補完を行
なっていたため、補完に必要な情報として局所的な原言
語構造しか利用できなかった。従って、翻訳言語におい
てより自然な翻訳文を出力することができないという問
題点があった。

【０００７】また、第２の従来例においては、生成規則
を手作業で作成するため、追加、削除などの管理が煩雑
となる。また、生成規則の増加に伴い、規則間の整合性
を取ることが困難となる。言いかえれば、生成規則の精
度が悪く、適切な翻訳をすることができないという問題
点があった。

【０００８】本発明の目的は以上の問題点を解決し、機
械翻訳された翻訳文を適切により自然な翻訳文に校正す
ることができる機械翻訳校正装置を提供することにあ
る。

【０００９】

【課題を解決するための手段】本発明に係る請求項１記
載の機械翻訳校正装置は、第１の自然言語の入力文から
機械翻訳された第２の自然言語の機械翻訳文を自動的に
校正して、校正翻訳文を出力する機械翻訳校正装置であ
って、上記機械翻訳された第２の自然言語の機械翻訳文
である校正対象文と、当該校正対象文から人手による校
正により校正された校正結果文との対を対応づけて校正
データとして記憶する記憶手段と、上記記憶手段に記憶
された校正データに基づいて、校正対象文と、当該校正
対象文から挿入、削除、置換のうちの少なくとも１つの
編集校正処理がなされて置き換えすべき校正文との対か
らなり、かつ翻訳用校正規則として整合性を有する校正
規則を生成する生成手段と、上記機械翻訳された第２の
自然言語の機械翻訳文である校正対象文に対して、上記
生成手段によって生成された校正規則を適用することに
より、自動的に校正して、校正翻訳文を生成して出力す
る校正手段とを備えたことを特徴とする。

【００１０】また、請求項２記載の機械翻訳校正装置
は、請求項１記載の機械翻訳校正装置において、上記生
成手段は、上記記憶手段に記憶された校正データに基づ
いて、１箇所の編集位置に対してそれぞれ校正対象文と
校正結果文の１対からなる複数の仮規則を生成し、生成
した仮規則から、校正データのうちの校正対象文と校正
結果文における文字連鎖の不変化部分を校正対象文に有
する有害な仮規則を排除し、仮規則における同一の校正
対象文に対して異なる校正結果文を有して異なる処理を
実行する仮規則を矛盾の規則として排除し、仮規則のう
ち重複する規則を排除することにより、校正規則を生成
することを特徴とする。

【００１１】さらに、請求項３記載の機械翻訳校正装置
は、請求項１又は２記載の機械翻訳校正装置において、
上記校正規則は、（１）語順の変更情報と、（２）省略
された主語を補完するための挿入情報と、（３）省略さ
れた目的語を補完するための挿入情報と、（４）省略さ
れた文要素を補完するための挿入情報と、（５）不要な
文要素を削除するための削除情報とのうちの少なくとも
１つを含むことを特徴とする。

【００１２】

【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。

【００１３】図１は、本発明に係る一実施形態である機
械翻訳装置の構成を示すブロック図である。本実施形態
の機械翻訳装置は、機械翻訳部１により公知の機械翻訳
方法により機械翻訳された翻訳文に対して人手による校
正を実行したときの校正前と校正後の対の校正データに
基づいて校正規則を自動的に生成して校正規則メモリ２
４に格納する校正規則生成部１０と、上記翻訳文に対し
て生成された校正規則を用いて自動校正して出力する自
動校正部２とを備えたことを特徴としている。ここで、
校正規則生成部１０は、校正データメモリ２１に記憶さ
れた校正データに基づいて、校正対象文と、当該校正対
象文から挿入、削除、置換のうちの少なくとも１つの編
集校正処理がなされて置き換えすべき校正文との対から
なり、かつ翻訳用校正規則として整合性を有する校正規
則を生成する。具体的には、校正規則生成部１０は、図
５に示すように、校正データメモリ２１に記憶された校
正データに基づいて、１箇所の編集位置に対してそれぞ
れ校正対象文と校正結果文の１対からなる複数の仮規則
を生成し、生成した仮規則から、校正データのうちの校
正対象文と校正結果文における文字連鎖の不変化部分を
校正対象文に有する有害な仮規則を排除し、仮規則にお
ける同一の校正対象文に対して異なる校正結果文を有し
て異なる処理を実行する仮規則を矛盾の規則として排除
し、仮規則のうち重複する規則を排除することにより、
校正規則を生成する。ここで、上記校正規則は、（１）
語順の変更情報と、（２）省略された主語を補完するた
めの挿入情報と、（３）省略された目的語を補完するた
めの挿入情報と、（４）省略された文要素を補完するた
めの挿入情報と、（５）不要な文要素を削除するための
削除情報とを含む。

【００１４】本実施形態では、機械翻訳における生成処
理において、自然と感じる文の生成、特に校正作業によ
って自然な文に変更することを目的としている。本実施
形態においては、翻訳結果に対して手作業により校正を
行ない、この両者を比較することによって校正規則を作
成し、校正規則は校正前後のＤＰマッチングをとること
により、局所的に変更するような形式で記述する。ここ
で、本実施形態では、日本語から中国語への翻訳処理の
一例について説明する。

【００１５】一般に、機械翻訳における文の語順などの
調整は、生成部において行なっている。しかしながら、
従来のシステムで行なわれているのは、英語生成におけ
る副詞的要素の位置の移動や疑問詞疑問文における疑問
詞の移動など、構文的な理由に基づくものが多く、言い
やすさ、語調をそろえるためなどの文の自然さの考慮は
あまりなされていない。以上のような動機に基づき、本
実施形態では機械翻訳の処理結果をより自然な文に書き
換えることを目的としている。この処理の実現のため
に、人手で行なった校正結果を利用し、それを規則化す
ることで自動的に校正を行う。生成される文がどのよう
な場合に自然と感じられるかは難しい問題であるため、
「自然さ」の規則を直接的に生成することは困難である
と考えられる。また、校正対象の「不自然さ」はそのシ
ステムに依存する。これに対して、与えられた文を自然
な文に校正することは比較的容易であるので、本実施形
態では、校正前後の文の比較によって校正知識を獲得す
るというアプローチを採る。このため本実施形態では、
校正前のテキストは形態素及び品詞の情報を持ち、校正
後のテキストはこれらの情報を持たない文字列と仮定す
る。

【００１６】次いで、図１の機械翻訳装置の構成及び動
作について説明する。図１において、機械翻訳部１は、
例えば従来技術文献２「古瀬蔵ほか，”経験的知識を活
用する変換主導型機械翻訳”，情報処理学会論文誌，Ｖ
ｏｌ．３５，Ｎｏ．３，平成６年３月発行」において開
示された公知の機械翻訳装置であって、翻訳前と翻訳後
の文の対を用例として予め蓄積して、当該用例を用い
て、意味的距離を計算して参照しながら、入力文に対し
て第１の自然言語の表現から第２の自然言語の表現に逐
次、変換主導型機械翻訳処理を実行し、機械翻訳後の翻
訳文を第２の自然言語の機械翻訳文メモリ３２に出力し
て格納する。人手による校正３では、第２の自然言語の
機械翻訳文メモリ３２内の機械翻訳文に対して、より自
然な翻訳文に翻訳校正して、翻訳前の校正対象文と翻訳
後の校正結果文との対である校正データを生成して校正
データメモリ２１に格納する。次いで、校正規則生成部
１０は、校正データメモリ２１内の校正データに基づい
て、校正不変化部分メモリ２２及び仮規則メモリ２３を
用いて、図５の校正規則生成処理を実行することによ
り、校正規則を生成して校正規則メモリ２４に格納す
る。さらに、自動校正部２は、第２の自然言語の機械翻
訳文メモリ３２内の機械翻訳文に対して、校正規則メモ
リ２４内の校正規則を参照して、自動的に翻訳校正を行
って、校正後の校正翻訳文を第２の自然言語の校正翻訳
文メモリ３３に出力して格納する。この翻訳校正では、
用例翻訳と同様に、校正規則を入力文に逐次適用してゆ
き、校正してゆく。

【００１７】すなわち、本実施形態の翻訳校正システム
は、図１に示すように、規則の獲得部である校正規則生
成部１０と、規則の適用部である自動校正部２とに分か
れる。規則獲得部は翻訳出力とその人手による校正結果
を組として入力し、これらから規則獲得部である校正規
則生成部１０において矛盾のない規則の集合が出力さ
れ、保存される。規則適用部である自動校正部２は、機
械翻訳などの出力結果を入力とし、予め決められた順に
校正規則を適用していく。

【００１８】観察可能な少数の現象から校正規則を作成
する際には、できるだけ校正規則を一般化してその校正
規則の適用範囲を広くしなければならない。その一方
で、現象の一般化は誤った解釈を起こす可能性も高くな
るので、副作用の問題が大きくなる。これらを両立させ
ることは観察対象が少数の場合においては特に困難とな
る。そこで、本実施形態では、悪影響を出さないことを
より重視して校正規則の作成を行う。すなわち、校正規
則を検定する際に、悪影響が出る恐れのある校正規則を
できるだけ排除する方針で取捨選択を行う。これはいわ
ば「臆病な」校正規則の作成方針である。

【００１９】さらに、校正規則は局所的な視野において
作成する。これは、構成規則の表現形態として要素列の
置換による表現、すなわち、ある要素列Ａがあればこれ
を要素列Ａ’に置換せよ、という表現が処理上便利であ
り、本実施形態の獲得対象としている文の自然さは概ね
前後の局所的な情報が関係すると予想したためである。

【００２０】規則獲得部である校正規則生成部１０で
は、校正されたテキストを校正前のものと比較すること
で構成規則を作成する。比較は文字を単位とするＤＰマ
ッチングによって行う。表１に、校正規則の獲得過程の
概要を示す。校正規則生成部１０は翻訳された校正対象
文の集合Ｇと、当該校正対象文の集合Ｇの各文の人手に
よる校正結果文の集合Ｐを入力とする。

【００２１】

【表１】 ―――――――――――――――――――――――――――――――――― ステップＳ０：Ｇ＝文生成（），Ｐ＝校正（Ｇ），Ｒ＝（），ｎ＝２； ―――――――――――――――――――――――――――――――――― ステップＳ１：Ｒ０＝仮規則生成（Ｐ，Ｇ，ｎ）； ―――――――――――――――――――――――――――――――――― ステップＳ２．１：Ｒ１＝有害規則排除（Ｐ，Ｇ，ｎ，Ｒ０）； ―――――――――――――――――――――――――――――――――― ステップＳ２．２：Ｒ２＝矛盾規則排除（Ｒ１）； ―――――――――――――――――――――――――――――――――― ステップＳ２．３：Ｒ３＝照合検定（Ｐ，Ｇ，Ｒ２）； ―――――――――――――――――――――――――――――――――― ステップＳ２．４：Ｒ４＝重複規則排除（Ｒ３）； ―――――――――――――――――――――――――――――――――― ステップＳ３：Ｒ＝規則追加（Ｒ，Ｒ４），Ｇ１＝規則適用（Ｇ，Ｒ４）； ―――――――――――――――――――――――――――――――――― ステップＳ４：ｉｆ（Ｇ１＝＝ＰｏｒＧ１＝＝Ｇ）ｔｈｅｎステップＳ５；ｅｌｓｅＧ＝Ｇ１，ｎ＋＋，ｇｏｔｏステップＳ１； ―――――――――――――――――――――――――――――――――― ステップＳ５：ｒｅｔｕｒｎＲ； ――――――――――――――――――――――――――――――――――

【００２２】表１を参照して、校正規則獲得アルゴリズ
ムの概略について説明する。ステップＳ１では、校正対
象文Ｇと校正結果文Ｐの対応する各文ごとのＤＰマッチ
ングによって仮規則集合を作成する。ＤＰマッチングは
文字を単位にして行う。ＤＰマッチング後に、連続する
要素列の書き換えによって両者の差異を吸収するように
規則を作成する。この際、規則作成時には、校正対象文
Ｇの各文が持つ単語及び品詞に対して規則作成を試み
る。このようにして作成された規則を、ここでは仮規則
と呼ぶ。

【００２３】例えば、校正対象文Ｇに属するある文ｓが
＜ａｂｃｄ＞（ここで、＜…＞は文字列であり、ａ，
ｂ，…は単語であって、ｘは文字である。）であり、こ
こで、ａ，ｂ，…の品詞はＡ，Ｂ，…とする。この文が
校正結果文ｓ’＝＜ａｂｘｃｄ＞となり、これが校正結
果文Ｐに格納されているとする。校正対象文ｓと校正結
果文ｓ’のＤＰマッチングの結果、文字ｘの挿入がある
ことがわかる。従って、校正規則生成部１０ではこの違
いを吸収するような仮規則を作成する。このとき、要素
長パラメータｎの値によって、どの程度周囲に依存した
規則を生成するかを決定する。例えば、初期設定ではｎ
が２であり、規則の左辺の要素長が２である以下の１２
の規則が生成される。このとき、右辺の要素長は差異の
種類（挿入、欠落、置換）によって左辺の要素長±１の
いずれかになる。これによって、１ヶ所の修正位置に対
して複数の仮規則が作成される。

【００２４】

【表２】 ―――――――――――――――――――――――――――――――――― ＜ａｂ＞→＜ａｂｘ＞，＜Ａｂ＞→＜Ａｂｘ＞，＜ａＢ＞→＜ａＢｘ＞，＜ＡＢ＞→＜ＡＢｘ＞，＜ｂｃ＞→＜ｂｘｃ＞，＜Ｂｃ＞→＜Ｂｘｃ＞，＜ｂＣ＞→＜ｂｘＣ＞，＜ＢＣ＞→＜ＢｘＣ＞，＜ｃｄ＞→＜ｘｃｄ＞，＜Ｃｄ＞→＜ｘＣｄ＞，＜ｃＤ＞→＜ｘｃＤ＞，＜ＣＤ＞→＜ｘＣＤ＞ ――――――――――――――――――――――――――――――――――

【００２５】同様に、規則の要素長ｎが３である校正対
象文Ｇの一文が＜ａｂｃｄｅ＞であり、そして対応する
校正結果文Ｐの一文が＜ａｂｄｅ＞である場合、以下の
１８の規則が仮生成される。

【００２６】

【表３】 ―――――――――――――――――――――――――――――――――― ＜ａｂｃ＞→＜ａｂ＞，＜ｂｃｄ＞→＜ｂｄ＞，＜ｃｄｅ＞→＜ｄｅ＞，＜Ａｂｃ＞→＜Ａｂ＞，．．． ――――――――――――――――――――――――――――――――――

【００２７】これらの処理は、校正結果文Ｐのすべての
文に対して実行され、その結果仮生成された規則集合は
Ｒ０（仮規則メモリ２３）に格納される。この時、重複
した場合でも１つとみなし頻度は記録しない。上の例に
示すように、１ヶ所の修正に対して複数の仮規則が作成
されるが、矛盾したものや最終的に重複しているものは
削除される。

【００２８】ステップＳ２では、ステップＳ１で作成さ
れた仮規則の絞りこみを行う。これは、「有害」な規則
の排除、矛盾の排除、最終的な検査、重複規則の排除と
いう、４種類の処理に分かれ、これらの処理によって徐
々に仮規則の絞り込みを行なっていく。

【００２９】ステップＳ２．１では、まずすべての文を
対象にＤＰマッチングによって不変化部分を要素列形式
で（ｎ−ｇｒａｍの形式で）抽出する。例えば、校正対
象文とその校正結果文がそれぞれ＜ａｂｃｄ＞と＜ａｂ
ｘｃｄ＞であった場合に、＜ａｂ＞と＜ｃｄ＞という２
つの文字連鎖が抽出される。これをすべての文に対して
行ない、変化させてはいけない要素列の集合を集める。
次に、これら不変化部分に対して操作を行なっている仮
規則を「有害」な仮規則とみなし、これを排除する。こ
の処理は、ステップＳ２．３でＤＰマッチングの回数を
低減させるために採用した。

【００３０】ステップＳ２．２では、仮規則のうちで矛
盾した規則を持つものを排除する。例えば、ある２つの
仮規則が

【数１】＜ｂｃ＞→＜ｂｘｃ＞と

【数２】＜ｂｃ＞→＜ｂｙｃ＞であった場合、同一の文字列から別の操作を行うことに
なり、規則適用の際にどちらを採用すべきか決めかね
る。そのため、この両規則はその条件部に問題がある
「悪い規則」であると考え、この両者を仮規則から排除
する。

【００３１】ステップＳ２．３では、最終的な規則の検
査を行う。ここでは、これまでの処理で排除されなかっ
た各仮規則をすべての訓練文に対して実行する。その結
果、ＤＰ距離が悪化した文が１文でもあれば、他の文で
ＤＰ距離が改善されていてもその文は「有害」であると
判断し、排除する。

【００３２】ステップＳ２．４においては、残された仮
規則に対して重複を調査し、これらに対してより一般的
な規則を採用する。例えば仮規則中に

【数３】＜ｂｃ＞→＜ｂｘｃ＞と

【数４】＜ＢＣ＞→＜ＢｘＣ＞（ここで、単語ｂの品詞をＢとし、単語ｃの品詞をＣと
する）の２つの規則があった場合は、後者のほうがより
一般的であり、前者の規則が適用される場合には後者も
必ず適用される。このことから後者の規則がある場合に
は前者の規則は不要であるため、このような重複規則の
チェックを行ない、該当した場合には個別的な規則を削
除する。

【００３３】ステップＳ３では、以上の処理で残された
仮規則を正式にパラメータｎにおける規則として採用
し、校正対象文の集合Ｇに対してこれら規則をすべて適
用する。この際、適用する順序はどれからでもよく、任
意である。また、競合する規則もない。全規則適用後の
校正対象文の集合をＧ１とする。

【００３４】最後に、ステップＳ４において終了条件が
チェックされる。アルゴリズムの終了条件は、ステップ
Ｓ３で校正後の文集合Ｇが最終校正結果Ｐと完全に一致
するか、又は、今回の校正規則適用によって校正対象Ｇ
が何も変化しなかった場合である。このどちらかを満た
した場合にアルゴリズムは終了し、ステップＳ５で校正
規則集合Ｒを返して終了する。そうでない場合には、校
正対象文の集合ＧをＧ１と再定義し、パラメータｎを１
だけ増加して再びステップＳ１に進む。

【００３５】次いで、自動校正部２における校正規則の
適用について説明する。一般に、実際のシステムにおい
ては、校正規則の適用の際の処理時間を考慮することが
重要である。すなわち各校正規則はできるだけ短時間で
適用されることが望ましい。また、校正規則の適用の際
には、校正規則相互の関係が明確であり、適用の際に適
用順を明確に規定できることが望ましい。本実施形態の
手法においては、各校正規則は入力とのパターンマッチ
ングによって実行されるので、比較的短時間で処理でき
る。また、校正規則は互いに競合することのなく、ｎが
同一であればすべて同時に適用できるように作成してい
るため、適用時には校正規則の選択やその適用順の選択
を行う必要がない。

【００３６】以上のように生成された校正規則は、
（１）語順の変更情報と、（２）省略された主語を補完
するための挿入情報と、（３）省略された目的語を補完
するための挿入情報と、（４）省略された文要素を補完
するための挿入情報と、（５）不要な文要素を削除する
ための削除情報とを含む。

【００３７】図２は、図１の校正データメモリ２１に格
納される校正データの一例を示す図である。図２から明
らかなように、校正データメモリ２１では、校正前の校
正対象文とその校正結果である校正結果文とが、以下の
ような形式で格納される。

【数５】（Ｘ１Ｘ２ … Ｘｎ）：”Ｙ１Ｙ２ … Ｙｎ”

【００３８】ここで、Ｘｉは単語情報を示し、単語情報
Ｘｉの表記を形態素列Ｗｉとしかつその品詞をＰｉとす
るとき、（Ｐｉ”Ｗｉ”）という形式で定義される。一
方、Ｙｉは文字を示し、”Ｙ１Ｙ２ … Ｙｎ”全体
の文字列を示す。以上のように、校正前の校正対象文
は、単語に分割され、各単語には品詞が付与されてい
る。これに対して、校正後の校正結果文は文字列として
格納されている。実際の例を以下に示す。

【００３９】

【外１】

【００４０】この例では、校正前の校正対象文の先頭の
語が品詞”

【外２】 ”でその表記の形態素列が”

【外３】 ”、次の単語は、品詞が”

【外４】 ”の”

【外５】 ”という表記、ということを示す。

【００４１】次の文字列は、校正前の表記の列”

【外６】 ”に対して人手による校正の結果、”

【外７】 ”となったことを意味している。以上の校正前後の情報
を対にしたものが蓄積の最小単位となって校正データと
して校正データメモリ２１に蓄積される。

【００４２】図３は、図１の校正不変化部分メモリ２２
に格納される校正不変化部分の一例を示す図である。図
３から明らかなように、校正不変化部は、校正規則生成
部１０における有害規則排除処理で使用され、以下の形
式を持つ。

【数６】（Ｘ１Ｘ２ … Ｘｎ）

【００４３】ここで、Ｘｉは各単語情報であり、実際に
はその単語情報Ｘｉの表記（又は形態素列）Ｗｉ又は品
詞Ｐｉのいずれかとなる。要素長ｎは校正規則獲得処理
のパラメータｎを指し、作成された仮規則の左辺要素長
に一致する。

【００４４】図４は、図１の校正規則メモリ２４に格納
される校正規則の一例を示す図である。図４から明らか
なように、校正規則は以下のように定義される。

【数７】（Ｐ１Ｐ２Ｐ３ … Ｐｍ）→（Ｑ１Ｑ
２Ｑ３ … Ｑｎ）

【００４５】ここで、Ｐｉ（ｉ＝１，２，…，ｍ）及び
Ｑｊ（ｊ＝１，２，…，ｎ）：文字列、形態素、又は品
詞である。ｍとｎの関係は、挿入規則の場合

【数８】ｍ＝ｎ−１であり、削除規則の場合、

【数９】ｍ＝ｎ＋１であり、置換規則の場合

【数１０】ｍ＝ｎである。この置換規則は、入力の要素列中において左辺
に示す要素の列（Ｐ１Ｐ２Ｐ３ … Ｐｍ）があった
場合、これを右辺の要素列（Ｑ１Ｑ２Ｑ３… Ｑ
ｎ）に置換することを意味する。実際の規則例を以下に
示す。

【００４６】

【外８】

【００４７】例えば上記の規則においては、”

【外９】 ”（教えてください）に”

【外１０】 ”（動詞）が後続した場合、”

【外１１】 ”（教える）の間接目的語である”我”（私）が補完さ
れる。ここでは”我”がない場合でも中国語として理解
は可能であるが、一般にはこれを補ったほうが自然であ
ることから、校正例として出現し、校正規則として生成
される。

【００４８】次いで、校正規則生成処理中における重複
規則排除処理について詳細に説明する。ある文の校正前
の校正対象文と、校正後の校正結果文が以下のようであ
ったとする。

【００４９】＜校正データメモリの例＞

【表４】

【００５０】仮に、このような例の場合、文字（列）”

【外１２】 ”を挿入する規則を作成する必要がある。ここで、本実
施形態では、形態素”是”に対しても仮規則を作成し、
その品詞（判定詞）に対しても重複して仮規則を生成す
る。また、「

【外１３】」と形容詞に対しても同様に処理を行う。つまり、以下
のような仮規則を作成する。

【００５１】＜仮規則の例：以下の説明のため各仮規則
に番号を付与する。＞

【表５】

【００５２】ここで、

【外１４】は文字又は文字列であり、是、

【外１５】は形態素であり、判定詞、形容詞は品詞」である。つま
り、校正規則を構成する各要素は文字列、形態素、品詞
のいずれかになる。

【００５３】次に、「有害規則排除」「矛盾規則排除」
「照合検定」の各規則のいずれかで仮規則３と仮規則４
が排除され、仮規則１と仮規則２が「重複規則排除」の
対象となる仮規則に残った場合を想定する。この場合、
例えば、処理の最初に、

【表６】という仮規則１を読み込み、この仮規則の「形態素部分
を品詞に置き換え」た仮規則、すなわちこの例では
「是」を「判定詞」に、「

【外１６】」を「形容詞」に置き換えた仮規則が存在するかどうか
を検索する。このとき、この例のように要素が形態素で
あるものが複数ある場合、該当する仮規則は組み合わせ
的に複数考えられるが、このそれぞれの組み合わせ、す
なわち、仮規則１の形態素を品詞化した仮規則として以
下を得る。

【００５４】＜仮規則１の形態素を品詞化した仮規則＞

【表７】

【００５５】以上の３種類の仮規則を考え、それぞれの
仮規則が作られているかどうかを検索する。この例では
仮規則２が残っているので、仮規則１は重複規則排除処
理によって排除される。これは、仮規則１が適用される
場面では必ず仮規則２も同時に適用される、すなわち仮
規則２は仮規則１を包含することから、仮規則１の存在
が不要なためである。

【００５６】図５は、図１の校正規則生成部１０によっ
て実行される校正規則生成処理を示すフローチャートで
ある。図５のステップＳ１１において、パラメータｎ
（仮規則の左辺の要素長である。）を２に設定し、ステ
ップＳ１２において校正データメモリ２１から校正デー
タの対を読み込む。次いで、ステップＳ１３において仮
規則生成処理（図６）を実行し、ステップＳ１４におい
て有害規則排除処理（図７）を実行し、ステップＳ１５
において矛盾規則排除処理（図９）を実行し、ステップ
Ｓ１６において照合検定処理（図１０）を実行し、ステ
ップＳ１７において重複規則排除処理（図１１）を実行
し、ステップＳ１８において校正対象文更新及び仮規則
出力処理（図１２）を実行する。そして、ステップＳ１
９において終了条件を満たすか否かが判断される。ここ
で、終了条件は、以下の２つの条件のいずれかを満たす
ときをいう。（１）生成した仮規則において、校正対象文において変
化が無い。又は（２）校正対象文が校正結果文と一致する。ステップＳ１９でＮＯであるときは、ステップＳ２０で
パラメータｎを１だけインクリメントした後、ステップ
Ｓ２１において校正データメモリ２１から別の校正デー
タの対を読み込んで、ステップＳ１３に戻る。一方、ス
テップＳ１９でＹＥＳであるときは、当該校正規則生成
処理を終了する。

【００５７】図６は、図５のサブルーチンである仮規則
生成処理（ステップＳ１３）を示すフローチャートであ
る。図６のステップＳ３１において、まず、校正対象文
と校正結果文の１対を選択して処理対象とし、ステップ
Ｓ３２において処理対象の１対の校正データに対してＤ
Ｐマッチング法を用いて文字単位でマッチングをとる。
次いで、ステップＳ３３において１対の校正データ間に
差分があるか否かが判断され、差分があるときは、ステ
ップＳ３４において各差分箇所に対して左辺の要素長が
ｎとなり、かつ差分を吸収するように仮規則を生成して
仮規則メモリ２３に出力し、ステップＳ３５に進む。一
方、ステップＳ３３でＮＯであるときはそのままステッ
プＳ３５に進む。さらに、ステップＳ３５において次の
校正データの対があるか否かが判断され、ＹＥＳのとき
はステップＳ３６において校正対象文と校正結果文の別
の１対を選択して処理対象として、ステップＳ３２に戻
る。一方、ステップＳ３５でＮＯであるときは、元のメ
インルーチンに戻る。

【００５８】図７は、図５のサブルーチンである有害規
則排除処理（ステップＳ１４）を示すフローチャートで
ある。図７のステップＳ４１において、まず、仮規則メ
モリ２３からすべての仮規則を読み込み、ステップＳ４
２において校正対象文と校正結果文の１対を選択して処
理対象とする。次いで、ステップＳ４３において要素長
がｎとなるように不変化部分を抽出して、不変化部分メ
モリ２２に出力する。なお、要素長がｎを超えるとき
は、要素長がｎとなるように分割する。次いで、ステッ
プＳ４４において次の校正データの対があるか否かが判
断され、ＹＥＳのときは、ステップＳ４５において校正
対象文と校正結果文の別の１対を選択して処理対象とし
て、ステップＳ４３に戻る。一方、ステップＳ４４でＮ
Ｏのときは、ステップＳ４６において不変化部分照合処
理（図８）を実行した後、元のメインルーチンに戻る。

【００５９】図８は、図７のサブルーチンである不変化
部分照合処理（ステップＳ４６）を示すフローチャート
である。図８のステップＳ５１において、まず、不変化
部分メモリ２２から不変化部分を１つ選択して処理対象
とし、ステップＳ５２において不変化部分を左辺に持つ
仮規則があるか否かが判断され、ＹＥＳのときに、ステ
ップＳ５３においてその仮規則を仮規則メモリ２３から
排除した後、ステップＳ５４に進む。一方、ステップＳ
５２でＮＯであるときは、そのままステップＳ５４に進
む。次いで、ステップＳ５４において次の不変化部分が
あるか否かが判断され、ＹＥＳのときは、ステップＳ５
５において不変化部分メモリ２２から別の不変化部分を
１つ選択して処理対象としてステップＳ５２に戻る。一
方、ステップＳ５４でＮＯであるときは、元のメインル
ーチンに戻る。

【００６０】図９は、図５のサブルーチンである矛盾規
則排除処理（ステップＳ１５）を示すフローチャートで
ある。図９のステップＳ６１において、まず、仮規則メ
モリ２３上で全ての仮規則を左辺の要素の文字順にソー
トし、ステップＳ６２において左辺の要素が同一の仮規
則を仮規則メモリ２３で検索する。次いで、ステップＳ
６３において該当の仮規則が１つしかないか否かが判断
され、左辺の要素が同一の仮規則が１つしかないとき
は、そのまま元のメインルーチンに戻る。一方、左辺の
要素が同一の仮規則が複数ある仮規則については、ステ
ップＳ６４においてそれらの仮規則（１つ又は複数の仮
規則）を仮規則メモリ２３からすべて排除した後、元の
メインルーチンに戻る。

【００６１】図１０は、図５のサブルーチンである照合
検定処理（ステップＳ１６）を示すフローチャートであ
る。図１０のステップＳ７１において、まず、仮規則メ
モリ２３から仮規則を１つ選択して処理対象とし、ステ
ップＳ７２においてすべての校正対象文に対してこの仮
規則を適用し、適用前後のＤＰマッチングの距離（いわ
ゆる、削除、挿入、置き換えを含む文字編集の編集距離
である。）を計算する。このステップＳ７２では、校正
データの校正対象文に対して仮規則を適用する前の校正
対象文と校正結果文との間のＤＰマッチングの距離と、
校正データの校正対象文に対して仮規則を適用したとき
の校正対象文と校正結果文との間のＤＰマッチングの距
離とを計算して比較する。次いで、ステップＳ７３にお
いてＤＰマッチングの距離が悪化した文が１文でもある
か否かが判断され、ＹＥＳのときはステップＳ７４にお
いて当該仮規則を仮規則メモリ２３から排除した後、ス
テップＳ７５に進む。一方、ステップＳ７３でＮＯであ
るときは、ステップＳ７５において次の仮規則があるか
否かが判断される。ステップＳ７５でＹＥＳのときは、
ステップＳ７６において仮規則メモリ２３から別の仮規
則を１つ選択して処理対象としてステップＳ７２に戻
る。一方、ステップＳ７５でＮＯのときは、元のメイン
ルーチンに戻る。

【００６２】図１１は、図５のサブルーチンである重複
規則排除処理（ステップＳ１７）を示すフローチャート
である。図１１のステップＳ８１において、まず、仮規
則メモリ２３から仮規則を１つ選択して処理対象とし、
ステップＳ８２において仮規則中の形態素部分を品詞に
置き換えた仮規則を仮規則メモリ２３内の残りの仮規則
中から検索する。次いで、ステップＳ８３において検索
できたか否かが判断され、検索できたときは、ステップ
Ｓ８４において形態素で記述されている仮規則を仮規則
メモリ２３から排除した後、ステップＳ８５に進む。一
方、ステップＳ８３でＮＯであるときは、そのままステ
ップＳ８５に進む。ステップＳ８５において次の仮規則
があるか否かが判断され、ＹＥＳのときは、ステップＳ
８６において仮規則メモリ２３から別の仮規則を１つ選
択して処理対象としてステップＳ８２に戻る。一方、ス
テップＳ８５でＮＯであるときは、元のメインルーチン
に戻る。

【００６３】図１２は、図５のサブルーチンである校正
対象文更新及び仮規則出力処理（ステップＳ１８）を示
すフローチャートである。図１２のステップＳ９１にお
いて、まず、仮規則メモリ２３内で左辺の要素長がｎの
仮規則を処理対象とし、ステップＳ９２において校正デ
ータメモリ２１から校正対象文を１つ選択して処理対象
とする。次いで、ステップＳ９３において処理対象のす
べての仮規則を順不同で当該校正対象文に対して適用し
て校正を行い、校正された校正データで校正データメモ
リ２１を更新する。さらに、ステップＳ９４において次
の校正対象文があるか否かが判断され、ＹＥＳのとき
は、ステップＳ９５において校正データメモリ２１から
別の校正対象文を１つ選択して処理対象としステップＳ
９２に戻る。一方、ステップＳ９４でＮＯであるとき
は、ステップＳ９６において処理対象の仮規則を校正規
則として校正規則メモリ２４に出力して格納して、元の
メインルーチンに戻る。

【００６４】以上の実施形態においては、機械翻訳部１
と、自動校正部２と、校正規則生成部１０とは、例えば
ディジタル計算機などの制御処理装置で構成され、校正
データメモリ２１と、校正不変化部分メモリ２２と、仮
規則メモリ２３と、校正規則メモリ２４と、第１の自然
言語の入力文メモリ３１と、第２の自然言語の機械翻訳
文メモリ３２と、第２の自然言語の校正翻訳文メモリ３
３とは、例えば、ハードディスクメモリなどの記憶装置
で構成される。

【００６５】

【実施例】本発明者は、本実施形態の機械翻訳装置にお
ける校正規則生成及び自動校正の有効性を確認するた
め、当該装置を計算機上に実現し、小規模な実験を行な
った。実験では、まず、学習用コーパス中から４３２文
を選択し、これらの文を、従来技術文献２の変換主導型
機械翻訳の変換知識のみで出来るだけ自然に翻訳させる
ことを試みる。次に、これらを人手によって校正を行
う。この際、校正する必要のない文も存在するが、この
ような翻訳出力も以降の校正処理の対象とする。以上の
ようにして準備した翻訳出力である校正対象文と、その
校正結果文を、校正規則生成部１０の入力として、前述
した校正規則生成処理を行う。この際に作成された仮規
則数及び各処理で排除される規則数をまとめたものを次
の表に示す。

【００６６】

【表８】規則獲得時における規則数 ―――――――――――――――――――――――――――――――――― 規則の左辺要素列長ｎ２３４５６７合計作成された仮規則数(S1) 3291 2603 1881 1131 546 179 9631 ―――――――――――――――――――――――――――――――――― 有害規則の排除数(S2.1) 621 858 593 390 95 159 2716 矛盾規則の排除数(S2.2) 1505 720 388 357 434 19 3423 照合検査での排除数(S2.3) 318 193 186 81 1 1 780 重複規則による排除数(S2.4)283 429 467 261 14 0 1454 ―――――――――――――――――――――――――――――――――― 最終獲得規則数 564 403 247 42 2 0 1258 nの仮規則数に対する採用率17.1% 15.5% 13.1% 3.7% 0.4% 0% 13.1% 全規則数に対する割合 44.8% 32.0% 19.6% 3.3% 0.2% 0% 100% ――――――――――――――――――――――――――――――――――

【００６７】今回行なった実験では、左辺が６要素の規
則が要素数として最大であり、７要素の処理において１
つも校正規則が採用されずアルゴリズムが終了した。本
実施形態のように、１つの校正箇所に対して複数の規則
を作成することを認めた場合、一般的にパラメータｎが
増加すると組み合わせが非常に多くなる。このため、パ
ラメータｎが小さいうちに多くの校正を行なわないと規
則数はパラメータｎの増加によって爆発的に増加してし
まう。しかしながら、本実施形態でのアルゴリズムで
は、比較的消極的な規則作成の方針を採ったにもかかわ
らず、多くの校正箇所が２要素や３要素の規則によって
校正されている様子が表８からわかる。以上の観点か
ら、校正規則の獲得処理は規則数の爆発を抑えることが
でき、有効に機能していると考えられる。

【００６８】機械翻訳の出力結果に対し自動校正処理を
適用し、適用前後でどれだけの文が改善されたかを次の
表にまとめた。次の表の未知欄は、変換主導型日中機械
翻訳の翻訳知識に対しても入力文は未知であるオープン
テストである。また、改善欄は校正位置が以前よりも改
善されたことを意味し、それ以外の部分の訳質を問わな
い。混合欄は改善と悪化の両者があった文及び訳質変化
に無関係の校正があった文を指す。

【００６９】

【表９】自動校正による自然さの改善 ―――――――――――――――――――――――――――――――――― 既知（％）未知（％） ―――――――――――――――――――――――――――――――――― 改善３８６８９．４％１８５４１．７％悪化００％６５１４．６％混合００％１９４．３％無変化４６１０．６％１７５３９．４％ ―――――――――――――――――――――――――――――――――― 合計４３２１００％４４４１００％ ――――――――――――――――――――――――――――――――――

【００７０】表９から明らかなように、校正知識の獲得
対象とした文に対する改善状況では、約１０％程度の文
が同一出力の文となった。これは、校正不要文と校正状
況が前文に依存しているなどに伴う無改善文に分かれる
が、前者の方が多い。また、規則作成方針通り悪化した
文がないことを確認した。未知の文に対する校正状況で
は、１５％程度が悪化したものの、４０％以上の文で改
善が観察された。また規則が全く適用されなかった文が
４０％程度あるが、この中には校正を要する文がかなり
含まれている。規則獲得に使用した文がまだ少ないた
め、悪化した文や同一出力の文の割合が多いと思われ
る。

【００７１】以上説明したように、本実施形態によれ
ば、以下の効果を有する。（１）与えられた入力文を自動的にこなれた文体やこな
れた語調などの自然な翻訳文に校正することができる。
すなわち、従来例に比較して、原言語構造に依存しない
翻訳文の生成が可能になり、より自然な自然言語を出力
することが可能になる。（２）与えられた入力文中にない場合に不自然と感じら
れる主語や目的語などの格要素及び文末助詞などの文末
表現を補うことができる。（３）与えられた入力文中で
冗長であるため不自然と感じられる主語や目的語などの
格要素及び間投詞を削除することができる。

【００７２】以上の実施形態においては、日本語から中
国語への翻訳処理の一例について説明しているが、本発
明はこれに限らず、所定の第１の自然言語の入力文を、
別の第２の自然言語の翻訳文に翻訳するための翻訳処理
に広く適用することができる。

【００７３】以上の実施形態においては、入力文をメモ
リ３１に格納しているが、キーボードなどの入力手段に
より機械翻訳部１に入力してもよい。

【００７４】

【発明の効果】以上詳述したように本発明に係る機械翻
訳校正装置によれば、第１の自然言語の入力文から機械
翻訳された第２の自然言語の機械翻訳文を自動的に校正
して、校正翻訳文を出力する機械翻訳校正装置であっ
て、上記機械翻訳された第２の自然言語の機械翻訳文で
ある校正対象文と、当該校正対象文から人手による校正
により校正された校正結果文との対を対応づけて校正デ
ータとして記憶する記憶手段と、上記記憶手段に記憶さ
れた校正データに基づいて、校正対象文と、当該校正対
象文から挿入、削除、置換のうちの少なくとも１つの編
集校正処理がなされて置き換えすべき校正文との対から
なり、かつ翻訳用校正規則として整合性を有する校正規
則を生成する生成手段と、上記機械翻訳された第２の自
然言語の機械翻訳文である校正対象文に対して、上記生
成手段によって生成された校正規則を適用することによ
り、自動的に校正して、校正翻訳文を生成して出力する
校正手段とを備える。ここで、上記生成手段は、具体的
には、上記記憶手段に記憶された校正データに基づい
て、１箇所の編集位置に対してそれぞれ校正対象文と校
正結果文の１対からなる複数の仮規則を生成し、生成し
た仮規則から、校正データのうちの校正対象文と校正結
果文における文字連鎖の不変化部分を校正対象文に有す
る有害な仮規則を排除し、仮規則における同一の校正対
象文に対して異なる校正結果文を有して異なる処理を実
行する仮規則を矛盾の規則として排除し、仮規則のうち
重複する規則を排除することにより、校正規則を生成す
る。また、上記校正規則は、（１）語順の変更情報と、
（２）省略された主語を補完するための挿入情報と、
（３）省略された目的語を補完するための挿入情報と、
（４）省略された文要素を補完するための挿入情報と、
（５）不要な文要素を削除するための削除情報とのうち
の少なくとも１つを含む。

【００７５】従って、本発明によれば、以下の効果を有
する。（１）与えられた入力文を自動的にこなれた文体やこな
れた語調などの自然な翻訳文に校正することができる。
すなわち、従来例に比較して、原言語構造に依存しない
翻訳文の生成が可能になり、より自然な自然言語を出力
することが可能になる。（２）与えられた入力文中にない場合に不自然と感じら
れる主語や目的語などの格要素及び文末助詞などの文末
表現を補うことができる。（３）与えられた入力文中で
冗長であるため不自然と感じられる主語や目的語などの
格要素及び間投詞を削除することができる。

【図面の簡単な説明】

【図１】本発明に係る一実施形態である機械翻訳装置
の構成を示すブロック図である。

【図２】図１の校正データメモリ２１に格納される校
正データの一例を示す図である。

【図３】図１の校正不変化部分メモリ２２に格納され
る校正不変化部分の一例を示す図である。

【図４】図１の校正規則メモリ２４に格納される校正
規則の一例を示す図である。

【図５】図１の校正規則生成部１０によって実行され
る校正規則生成処理を示すフローチャートである。

【図６】図５のサブルーチンである仮規則生成処理
（ステップＳ１３）を示すフローチャートである。

【図７】図５のサブルーチンである有害規則排除処理
（ステップＳ１４）を示すフローチャートである。

【図８】図７のサブルーチンである不変化部分照合処
理（ステップＳ４６）を示すフローチャートである。

【図９】図５のサブルーチンである矛盾規則排除処理
（ステップＳ１５）を示すフローチャートである。

【図１０】図５のサブルーチンである照合検定処理
（ステップＳ１６）を示すフローチャートである。

【図１１】図５のサブルーチンである重複規則排除処
理（ステップＳ１７）を示すフローチャートである。

【図１２】図５のサブルーチンである校正対象文更新
及び仮規則出力処理（ステップＳ１８）を示すフローチ
ャートである。

【符号の説明】

１…機械翻訳部、２…自動校正部、３…人手による校正、１０…校正規則生成部、２１…校正データメモリ、２２…校正不変化部分メモリ、２３…仮規則メモリ、２４…校正規則メモリ、３１…第１の自然言語の入力文メモリ、３２…第２の自然言語の機械翻訳文メモリ、３３…第２の自然言語の校正翻訳文メモリ。

【手続補正書】

【提出日】平成１２年１月２６日（２０００．１．２
６）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】０００９

【補正方法】変更

【補正内容】

【０００９】

【課題を解決するための手段】本発明に係る請求項１記
載の機械翻訳校正装置は、第１の自然言語の入力文から
機械翻訳された第２の自然言語の機械翻訳文を自動的に
校正して、校正翻訳文を出力する機械翻訳校正装置であ
って、上記機械翻訳された第２の自然言語の機械翻訳文
である校正対象文と、当該校正対象文から人手による校
正により校正された校正結果文との対を対応づけて校正
データとして記憶する記憶手段と、上記記憶手段に記憶
された校正データに基づいて、校正対象文と、当該校正
対象文から挿入、削除、置換のうちの少なくとも１つの
編集校正処理がなされて置き換えすべき校正文との対か
らなり、かつ翻訳用校正規則として整合性を有する校正
規則を生成する生成手段と、上記機械翻訳された第２の
自然言語の機械翻訳文である校正対象文に対して、上記
生成手段によって生成された校正規則を適用することに
より、自動的に校正して、校正翻訳文を生成して出力す
る校正手段とを備え、上記生成手段は、上記記憶手段に
記憶された校正データに基づいて、それぞれ校正対象文
と校正結果文の１対からなる複数の仮規則を生成し、生
成した仮規則から、翻訳用校正規則として有害であり、
矛盾し、もしくは重複する仮規則を排除することによ
り、校正規則を生成することを特徴とする。

【手続補正３】

【補正対象書類名】明細書

【補正対象項目名】００１０

【補正方法】削除

【手続補正４】

【補正対象書類名】明細書

【補正対象項目名】００１１

【補正方法】変更

【補正内容】

【００１１】さらに、請求項２記載の機械翻訳校正装置
は、請求項１記載の機械翻訳校正装置において、上記校
正規則は、（１）語順の変更情報と、（２）省略された
主語を補完するための挿入情報と、（３）省略された目
的語を補完するための挿入情報と、（４）省略された文
要素を補完するための挿入情報と、（５）不要な文要素
を削除するための削除情報とのうちの少なくとも１つを
含むことを特徴とする。

Claims

【特許請求の範囲】

【請求項１】第１の自然言語の入力文から機械翻訳さ
れた第２の自然言語の機械翻訳文を自動的に校正して、
校正翻訳文を出力する機械翻訳校正装置であって、上記機械翻訳された第２の自然言語の機械翻訳文である
校正対象文と、当該校正対象文から人手による校正によ
り校正された校正結果文との対を対応づけて校正データ
として記憶する記憶手段と、上記記憶手段に記憶された校正データに基づいて、校正
対象文と、当該校正対象文から挿入、削除、置換のうち
の少なくとも１つの編集校正処理がなされて置き換えす
べき校正文との対からなり、かつ翻訳用校正規則として
整合性を有する校正規則を生成する生成手段と、上記機械翻訳された第２の自然言語の機械翻訳文である
校正対象文に対して、上記生成手段によって生成された
校正規則を適用することにより、自動的に校正して、校
正翻訳文を生成して出力する校正手段とを備えたことを
特徴とする機械翻訳校正装置。
【請求項２】上記生成手段は、上記記憶手段に記憶さ
れた校正データに基づいて、１箇所の編集位置に対して
それぞれ校正対象文と校正結果文の１対からなる複数の
仮規則を生成し、生成した仮規則から、校正データのう
ちの校正対象文と校正結果文における文字連鎖の不変化
部分を校正対象文に有する有害な仮規則を排除し、仮規
則における同一の校正対象文に対して異なる校正結果文
を有して異なる処理を実行する仮規則を矛盾の規則とし
て排除し、仮規則のうち重複する規則を排除することに
より、校正規則を生成することを特徴とする請求項１記
載の機械翻訳校正装置。
【請求項３】上記校正規則は、（１）語順の変更情報
と、（２）省略された主語を補完するための挿入情報
と、（３）省略された目的語を補完するための挿入情報
と、（４）省略された文要素を補完するための挿入情報
と、（５）不要な文要素を削除するための削除情報との
うちの少なくとも１つを含むことを特徴とする請求項１
又は２記載の機械翻訳校正装置。