JPH1021243A

JPH1021243A - 翻訳装置および翻訳方法

Info

Publication number: JPH1021243A
Application number: JP9046140A
Authority: JP
Inventors: Franz Alexander; フランヅアレキサンダー; Keiko Horiguchi; 恵子堀口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1996-05-02
Filing date: 1997-02-28
Publication date: 1998-01-23

Abstract

(57)【要約】【課題】シソーラスの構成によらず、２つの単語間の
意味的な類似性を、的確に求めることができるようにす
る。【解決手段】入力と最も類似する用例を、シソーラス
を用いて検出する場合において、入力における単語と、
用例における単語との間の意味的な類似性を表す単語類
似度が、シソーラスにおいて、その２つの単語の共通の
概念が包含する単語の数に基づいて決定される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、翻訳装置および翻
訳方法に関する。特に、用例を用いて、第１の言語で表
現された第１言語文を、第２の言語で表現された第２言
語文に翻訳する翻訳装置および翻訳方法に関する。

【０００２】

【従来の技術】第１の言語で表現された第１言語文を、
第２の言語で表現された第２言語文に翻訳する、従来の
翻訳装置は、大きくは、例えば、規則主導型翻訳装置、
用例利用型翻訳装置、用例主導型翻訳装置などの３つに
分類することができる。

【０００３】図１３は、従来の規則主導型翻訳装置の一
例の構成を示している。入力部１は、例えばキーボード
や、音声認識装置、文字認識装置などで構成され、そこ
には、第１言語文が入力され、例えばテキストデータな
どの形に変換されて出力される。即ち、入力部１がキー
ボードで構成される場合には、第１言語文は、そのキー
ボードを操作することにより入力され、その操作に対応
したテキストデータが出力される。また、入力部１が音
声認識装置で構成される場合には、第１言語文が音声で
入力され、その音声が音声認識される。そして、その音
声認識結果に対応したテキストデータが出力される。さ
らに、入力部１が文字認識装置で構成される場合には、
例えば紙などに書かれた第１言語文が入力され（読み取
られ）、その第１言語文が文字認識される。そして、そ
の文字認識結果に対応したテキストデータが出力され
る。

【０００４】入力部１から出力される第１言語文に対応
するテキストデータは、解析部３１に供給される。解析
部３１では、入力部１からの第１言語文が、第１言語
（第１の言語）に関する知識、規則に基づいて言語処理
（解析）され、その解析結果が、変換部３２に供給され
る。変換部３２は、第１言語および第２言語（第２の言
語）に関する知識、規則に基づいて、解析部３１からの
解析結果を、所定の中間言語による中間言語文に変換
し、生成部３３に出力する。生成部３３は、第２の言語
に関する知識、規則に基づいて、変換部３２より供給さ
れた中間言語文から、それに対応する第２言語文、即
ち、第１言語文を第２言語に翻訳した翻訳文（第２言語
文）を生成し、出力部１６に供給する。

【０００５】出力部１６は、例えばディスプレイ、ある
いは音声合成装置およびスピーカなどで構成され、生成
部３３から供給される第２言語文を表示し、あるいは合
成音で出力する。

【０００６】図１４は、従来の用例利用型翻訳装置の一
例の構成を示している。なお、図中、図１３における場
合と対応する部分については、同一の符号を付してあ
り、以下では、その説明は、適宜省略する。即ち、用例
利用型翻訳装置は、照合部４１および置換部４２が新た
に設けられている他は、図１３の規則主導型翻訳装置と
同様に構成されている。

【０００７】用例利用型翻訳装置は、第１言語で表現さ
れた文単位の用例と、その用例を第２言語に翻訳した訳
文とを対応付け（以下、適宜、用例と、それに対応付け
られた訳文とを、対訳用例データという）、この対訳用
例データを、例えば変数化して記憶しており、照合部４
１では、入力部１が出力する第１言語文が、用例と照合
され、これにより、第１言語文と一致する用例が検索さ
れる。そして、第１言語文と一致する用例が存在する場
合、照合部４１は、その第１言語文を、それに一致する
用例に対応付けられた訳文に置換するように置換部４２
を制御する。これに対応して、置換部４２では、第１言
語文が、それと一致する用例の訳文に置換され、出力部
１６に供給される。

【０００８】一方、第１言語文と一致する用例が存在し
ない場合、照合部４１は、その第１言語文を解析部３１
に出力する。以下、解析部３１、変換部３２、および生
成部３３において、図１３における場合と同様の処理が
行われ、その結果得られる第２言語文が、出力部１６に
供給される。

【０００９】なお、このような用例利用型翻訳装置につ
いては、例えば特開平６−６８１３４号公報などに、そ
の詳細が開示されている。

【００１０】次に、図１５は、従来の用例主導型翻訳装
置の一例の構成を示している。なお、図中、図１３にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。

【００１１】用例主導型翻訳装置５１では、入力部１が
出力する第１言語文が、変換部５１に供給されるように
なされており、変換部５１は、入力部１より第１言語文
を受信すると、その第１言語文に最も類似する用例を、
検索部５２に検索させる。

【００１２】即ち、対訳用例記憶部５３には、文単位の
対訳用例データが記憶されており、検索部５２は、ま
ず、対訳用例記憶部５３を参照して、第１言語文と一致
する用例を検索する。そして、第１言語文と一致する用
例を検索することができた場合、検索部５２は、その用
例と対応付けられている訳文を、変換部５１に出力す
る。この場合、変換部５１は、検索部５２からの訳文
を、そのまま第２言語文として、出力部１６に供給す
る。

【００１３】一方、第１言語文と一致する用例を検索す
ることができなかった場合、検索部５２は、対訳用例記
憶部５３に記憶されている用例を順次読み出し、類似度
計算部５４に供給する。そして、検索部５２は、用例そ
れぞれと、第１言語文との、概念的（意味的な）な類似
性を表す類似度を、例えばシソーラスなどの外部知識を
用いて、類似度計算部５４に計算させる。

【００１４】即ち、シソーラス記憶部５５には、単語
を、その概念に基づいて木構造に階層化したシソーラス
が記憶されている。なお、シソーラスにおいては、木構
造のノードの部分が意味概念に相当し、いわゆる葉の部
分が単語に相当する。類似度計算部５４は、このシソー
ラスを参照し、第１言語文を構成する単語と、用例を構
成する単語との共通の概念が属する階層に基づいて、第
１言語文と用例との類似度を算出する。そして、検索部
５２は、類似度計算部５４が算出した類似度が最も高い
用例を、対訳用例記憶部５３から検索し、その用例に対
応付けられている訳文を、変換部５１に供給する。

【００１５】変換部５１は、検索部５２から訳文を受信
すると、その訳文を構成する単語のうち、第１言語文を
構成する単語と一致（対応）しないものを、その単語の
対訳に置き換え、これを、第２言語文として、出力部１
６に供給する。

【００１６】なお、このような用例主導型翻訳装置につ
いては、例えば特開平３−２７６３６７号公報などに、
その詳細が開示されている。また、第１言語文と用例と
の類似度の算出方法については、上述の特開平３−２７
６３６７号公報の他、例えば特開平４−１８８２７６号
公報や、特開平６−２７４５４６号公報、特開平６−２
７４５４８号公報などにも、その詳細が開示されてい
る。

【００１７】

【発明が解決しようとする課題】ところで、以上のよう
な従来の翻訳装置には、以下のような課題があった。

【００１８】即ち、規則主導型翻訳装置においては、第
１言語文の解析の過程で、翻訳に必要な情報が失われる
場合があり、これにより、挨拶その他の決まり文句を翻
訳した翻訳結果（第２言語文）が、逐語調になる課題が
あった。さらに、第１言語文が、例えばことわざその他
の慣用的な表現（慣用語）を含む場合には、それを正確
に翻訳するのは困難であった。また、規則主導型翻訳装
置で用いる第１言語および第２言語に関する知識、規則
を、データベースとして構築し、維持することは、容易
ではなかった。

【００１９】一方、用例利用型翻訳装置によれば、第１
言語文が、それと一致する用例に対応付けられている訳
文に翻訳されるので、挨拶その他の決まり文句や、慣用
語などが、用例として記憶されていれば、自然な表現の
第２言語文を得ることができる。しかしながら、用例利
用型翻訳装置では、第１言語文と一致する用例が記憶さ
れていない場合には、結局、規則主導型翻訳装置と同様
の処理が行われるため、上述したような問題が生じるこ
ととなり、さらに、入力されることが予想される第１言
語文を構成する文字列と完全に一致する用例をすべて記
憶しておくことは困難であった。

【００２０】そこで、用例主導型翻訳装置によれば、い
かなる第１言語文であっても、用例を用いて翻訳が行わ
れるため、規則主導型翻訳装置における場合の問題が生
じることはなく、また、第１言語文と完全に一致する用
例をすべて記憶しておく必要もない。

【００２１】しかしながら、用例主導型翻訳装置では、
第１言語文に一致する用例が存在しない場合には、それ
に最も類似する用例が検索され、その用例に対応付けら
れた訳文を構成する単語のうち、第１言語文を構成する
単語と一致しないものが、その単語の対訳に、単純に置
き換えられて、これが、翻訳結果、即ち、第２言語文と
される。従って、用例主導型翻訳装置には、言語学上の
知識、規則が一般化された形で反映されることがなく、
このため、その翻訳の質（翻訳の精度や、翻訳結果の自
然さ）は、対訳用例記憶部５３に記憶させる用例の数
（種類）を増加することのみによって向上させることが
できる（これに対し、規則主導型翻訳装置による翻訳の
質は、言語に関する知識、規則の記述の仕方によっても
向上させることができる）。そして、対訳用例記憶部５
３に記憶させる用例の数を増加することは、第１言語文
に一致または類似する用例の検索処理に時間を要するこ
ととなる。

【００２２】また、用例主導型翻訳装置における第１言
語文Ｉと用例Ｅとの類似度Ｄ（Ｉ，Ｅ）の計算は、第１
言語文Ｉを構成する単語を、ｉ₁，ｉ₂，・・・，ｉ_tと
表すとともに、用例Ｅを構成する単語を、ｅ₁，ｅ₂，・
・・，ｅ_tと表すとき（但し、ｔは、第１言語文、用例
それぞれを構成する単語数を表す）、式（１）に示すよ
うに、第１言語文Ｉを構成する単語ｉ_kと、用例Ｅの中
の対応する単語ｅ_kとの意味的な（概念的な）距離word-
distance(i_k,e_k)を求め、それに対し、単語ｅ_kの重要性
に応じた重みweight_kを付けたものの総和をとることに
より行われていた。

【００２３】

【数１】・・・（１）

【００２４】そして、このような類似度の計算方法に
は、以下のような課題があった。

【００２５】即ち、例えば、ある用例の意味内容の発話
がなされる場合においては、その用例のとおりに発話が
なされることもあるが、多くの場合、その用例における
主語となる単語などが省略されたり、また、余分な単語
が挿入されたりする。そして、上述の計算手法は、第１
言語文と用例とが、同一の単語数で構成されることを前
提とするため、両者の単語数が異なる場合には、第１言
語文に対する用例の類似性を正しく反映した類似度が得
られるかどうか不明であった。

【００２６】さらに、仮に、第１言語文と用例とが同一
の単語数で構成されていたとしても、その語順が異なっ
ている場合には、やはり、第１言語文に対する用例の類
似性を正しく反映した類似度が得られるかどうか不明で
あった。即ち、例えば、日本語のように、単語が比較的
自由な順番で並べられる言語を第１言語とする場合に
は、第１言語文として、例えば「りんごを私は食べた
い」が入力されたときに、用例として、例えば「私はみ
かんを食べたい」が記憶されていたとしても、第１言語
文の「りんご」または「私」が、用例の「私」または
「みかん」にそれぞれ対応することとなり、両者が類似
していることを認識するのが困難であった。

【００２７】また、例えば、入力部１を音声認識装置で
構成した場合においては、話者がはっきり発話しなかっ
たり、音声認識装置で認識が正しく行われず、助詞など
が欠落したテキストデータが出力されることがある。即
ち、例えば、話者が意図した第１言語文が「私は、あな
たのみかんが食べたい」というものであったとしても、
入力部１の出力が「私、あなた、みかん、食べたい」と
なることがある。このような場合において、用例とし
て、例えば「私はみかんを食べたい」が記憶されていた
ときには、入力部１の出力の「あなた」および「みか
ん」を結合した複合名詞「あなたのみかん」を、用例の
「みかん」に対応させて類似度を計算する必要がある
が、式（１）による方法では困難であった。

【００２８】そして、以上のように意味内容が用例と一
致するが、いわば表層（表面）上異なる入力に対応する
ためには、そのような表層上のバリエーションに対応し
た用例を、対訳用例記憶部５３に追加する必要があり、
この場合、上述したように、検索処理に時間を要するこ
ととなる。

【００２９】さらに、単語ｉ_kと単語ｅ_kとの距離word-d
istance(i_k,e_k)は、シソーラス記憶部５５に記憶されて
いるシソーラスにおいて、単語ｉ_kと単語ｅ_kとの共通の
概念（単語ｉ_kおよびｅ_kを包含する概念であって、最も
下位の階層に属するもの）が属する階層に基づいて決定
されるようになされていた。即ち、シソーラスは、例え
ば、最も大きい概念が属する階層を第０階層とし、以
下、小さい概念を、第１乃至第３階層に順次分類し、さ
らに、第３階層に属する概念に、対応する単語を分類す
る（割り当てる）ことで構成され、このようなシソーラ
スを参照して、単語ｉ_kと単語ｅ_kとの共通の概念が、第
０乃至第３階層のうちのいずれに属しているかが検出さ
れる（以下、適宜、第Ｃ階層におけるＣを、レベルとい
う）。そして、その概念が第０乃至第３階層に属してい
るとき、距離word-distance(i_k,e_k)は、０，１／３，２
／３、または１にそれぞれ決定されるようになされてい
た。

【００３０】この場合、シソーラスは、各単語から上位
の階層を見たときに、同一の数の階層（上述の場合は、
第０乃至第３の４階層）が存在するように構成する必要
があり、従って、全体として、いわば規則的な構造をし
ている必要があった。

【００３１】さらに、２つの単語の間の距離word-dista
nce(i_k,e_k)は、その２つの単語の共通の概念が属する階
層のレベルにより決定されるため（概念が属する階層
が、第０乃至第３の階層のうちのいずれであるかにより
決定されるため）、ある階層に属する概念を共通の概念
とする２つの単語どうしの距離と、その階層と同一階層
に属する、異なる概念を共通の概念とする２つの単語ど
うしの距離とが一致するように、シソーラスを構成する
必要があった。

【００３２】即ち、図１６は、単語の概念が第０乃至第
２の３つの階層に分類された従来のシソーラスの一例を
示している。なお、同図においては、四角形が概念を、
丸印が単語を表している。

【００３３】このようなシソーラスにおいては、例え
ば、単語ＷａとＷｂとの共通の概念Ｃ１は、単語Ｗｃと
Ｗｄとの共通の概念Ｃ２とは異なるが、この概念Ｃ１お
よびＣ２は、いずれも第１階層に属するから、従来の距
離word-distance(i_k,e_k)の計算方法によれば、単語Ｗａ
とＷｂとの距離、および単語ＷｃとＷｄとの距離は同一
とされる。このことは、線で結ばれている概念どうしの
意味的な距離が、任意の概念間で同一であることを意味
し、従って、そのようになるように、シソーラスを構成
する必要があった。

【００３４】しかしながら、シソーラスを、上述したよ
うに、規則的に、かつ概念間の距離が同一となるように
構成することは、小規模のものはともかく、ある程度の
規模のものについては、困難である。即ち、シソーラス
を規則的に構成しようとすれば、概念間の距離を一定に
することは困難であり、また、シソーラスを、概念間の
距離が一定になるように構成しようとすれば、その規則
性を維持するのが困難となる。

【００３５】従って、規則的でないシソーラスや、概念
間の距離が一定でないシソーラスを用いても、質の高い
翻訳が可能となることが要望されている。

【００３６】本発明は、このような状況に鑑みてなされ
たものであり、容易に、質の高い翻訳を行うことができ
るようにするものである。

【００３７】

【課題を解決するための手段】請求項１に記載の翻訳装
置は、第１言語文を、所定の構文上の単位である構文単
位に分割する分割手段と、分割手段より出力される第１
言語文の構文単位に類似する用例を検出する検出手段
と、検出手段により検出された用例と対応付けられてい
る訳文に基づいて、第１言語文を、構文単位で翻訳する
翻訳手段と、翻訳手段による構文単位の翻訳結果を合成
し、第２言語文を生成する生成手段とを備えることを特
徴とする。

【００３８】請求項２５に記載の翻訳方法は、第１言語
文を、所定の構文上の単位である構文単位に分割するス
テップと、第１言語文の構文単位に類似する用例を検出
するステップと、その検出された用例と対応付けられて
いる訳文に基づいて、第１言語文を、構文単位で翻訳す
るステップと、その構文単位の翻訳結果を合成し、第２
言語文を生成するステップとを備えることを特徴とす
る。

【００３９】請求項２６に記載の翻訳方法は、第１言語
文を、所定の構文上の単位である構文単位あって、大き
な構文単位から小さな構文単位に、段階的に分割しなが
ら、各段階において得られた構文単位と、用例とを照合
するステップと、その照合結果に基づいて、構文単位に
対応する用例を検出するステップと、その検出された用
例と対応付けられている訳文に基づいて、第１言語文
を、構文単位で翻訳するステップと、その構文単位の翻
訳結果を合成し、第２言語文を生成するステップとを備
えることを特徴とする。

【００４０】請求項２７に記載の翻訳装置は、単語をそ
の概念に基づいて木構造に階層化したシソーラスにおい
て、第１言語文を構成する単語と、用例を構成する単語
との共通の概念に包含される単語の数に基づいて、第１
言語文を構成する単語と、用例を構成する単語との類似
性を表す単語類似度を算出する算出手段を備えることを
特徴とする。

【００４１】請求項２８に記載の翻訳方法は、単語をそ
の概念に基づいて木構造に階層化したシソーラスにおい
て、第１言語文を構成する単語と、用例を構成する単語
との共通の概念に包含される単語の数に基づいて、第１
言語文を構成する単語と、用例を構成する単語との類似
性を表す単語類似度を算出するステップを備えることを
特徴とする。

【００４２】請求項２９に記載の翻訳装置は、用例が第
１言語文を翻訳するために用いられる事前確率と、用例
が第１言語文に変形されて用いられる変形確率とに基づ
いて、第１言語文に類似する用例を検出する検出手段
と、検出手段により検出された用例と対応付けられてい
る訳文に基づいて、第１言語文を翻訳する翻訳手段とを
備えることを特徴とする。

【００４３】請求項４０に記載の翻訳方法は、用例が第
１言語文を翻訳するために用いられる事前確率と、用例
が第１言語文に変形されて用いられる変形確率とに基づ
いて、第１言語文に類似する用例を検出するステップ
と、その検出された用例と対応付けられている訳文に基
づいて、第１言語文を翻訳するステップとを備えること
を特徴とする。

【００４４】請求項４１に記載の翻訳装置は、第１言語
文を構文解析することにより、その文法属性を抽出する
抽出手段と、第１言語文に類似する用例を、その第１言
語文および用例が有する文法属性を考慮して検出する検
出手段と、検出手段により検出された用例と対応付けら
れている訳文に基づいて、第１言語文を翻訳する翻訳手
段とを備えることを特徴とする。

【００４５】請求項４２に記載の翻訳方法は、第１言語
文を構文解析することにより、その文法属性を抽出する
ステップと、第１言語文に類似する用例を、その第１言
語文および用例が有する文法属性を考慮して検出するス
テップと、その検出された用例と対応付けられている訳
文に基づいて、第１言語文を翻訳するステップとを備え
ることを特徴とする。

【００４６】請求項１に記載の翻訳装置においては、分
割手段は、第１言語文を、所定の構文上の単位である構
文単位に分割し、検出手段は、分割手段より出力される
第１言語文の構文単位に類似する用例を検出するように
なされている。翻訳手段は、検出手段により検出された
用例と対応付けられている訳文に基づいて、第１言語文
を、構文単位で翻訳し、生成手段は、翻訳手段による構
文単位の翻訳結果を合成し、第２言語文を生成するよう
になされている。

【００４７】請求項２５に記載の翻訳方法においては、
第１言語文を、所定の構文上の単位である構文単位に分
割し、第１言語文の構文単位に類似する用例を検出する
ようになされている。そして、その検出された用例と対
応付けられている訳文に基づいて、第１言語文を、構文
単位で翻訳し、その構文単位の翻訳結果を合成し、第２
言語文を生成するようになされている。

【００４８】請求項２６に記載の翻訳方法においては、
第１言語文を、所定の構文上の単位である構文単位あっ
て、大きな構文単位から小さな構文単位に、段階的に分
割しながら、各段階において得られた構文単位と、用例
とを照合し、その照合結果に基づいて、構文単位に対応
する用例を検出するようになされている。そして、その
検出された用例と対応付けられている訳文に基づいて、
第１言語文を、構文単位で翻訳し、その構文単位の翻訳
結果を合成し、第２言語文を生成するようになされてい
る。

【００４９】請求項２７に記載の翻訳装置においては、
算出手段が、単語をその概念に基づいて木構造に階層化
したシソーラスにおいて、第１言語文を構成する単語
と、用例を構成する単語との共通の概念に包含される単
語の数に基づいて、第１言語文を構成する単語と、用例
を構成する単語との類似性を表す単語類似度を算出する
ようになされている。

【００５０】請求項２８に記載の翻訳方法においては、
単語をその概念に基づいて木構造に階層化したシソーラ
スにおいて、第１言語文を構成する単語と、用例を構成
する単語との共通の概念に包含される単語の数に基づい
て、第１言語文を構成する単語と、用例を構成する単語
との類似性を表す単語類似度を算出するようになされて
いる。

【００５１】請求項２９に記載の翻訳装置においては、
検出手段は、用例が第１言語文を翻訳するために用いら
れる事前確率と、用例が第１言語文に変形されて用いら
れる変形確率とに基づいて、第１言語文に類似する用例
を検出し、翻訳手段は、検出手段により検出された用例
と対応付けられている訳文に基づいて、第１言語文を翻
訳するようになされている。

【００５２】請求項４０に記載の翻訳方法においては、
用例が第１言語文を翻訳するために用いられる事前確率
と、用例が第１言語文に変形されて用いられる変形確率
とに基づいて、第１言語文に類似する用例を検出し、そ
の検出された用例と対応付けられている訳文に基づい
て、第１言語文を翻訳するようになされている。

【００５３】請求項４１に記載の翻訳装置においては、
抽出手段は、第１言語文を構文解析することにより、そ
の文法属性を抽出し、検出手段は、第１言語文に類似す
る用例を、その第１言語文および用例が有する文法属性
を考慮して検出するようになされている。翻訳手段は、
検出手段により検出された用例と対応付けられている訳
文に基づいて、第１言語文を翻訳するようになされてい
る。

【００５４】請求項４２に記載の翻訳方法においては、
第１言語文を構文解析することにより、その文法属性を
抽出し、第１言語文に類似する用例を、その第１言語文
および用例が有する文法属性を考慮して検出するように
なされている。そして、その検出された用例と対応付け
られている訳文に基づいて、第１言語文を翻訳するよう
になされている。

【００５５】

【発明の実施の形態】以下に、本発明の実施の形態を説
明するが、その前に、特許請求の範囲に記載の発明の各
手段と以下の実施の形態との対応関係を明らかにするた
めに、各手段の後の括弧内に、対応する実施の形態（但
し、一例）を付加して、本発明の特徴を記述すると、次
のようになる。

【００５６】即ち、請求項１に記載の翻訳装置は、第１
の言語で表現された第１言語文を、第２の言語で表現さ
れた第２言語文に翻訳する翻訳装置であって、第１の言
語で表現された用例と、その用例を第２の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段（例え
ば、図１に示す決まり文句対訳用例記憶部３、節分割パ
ターン対訳用例記憶部５、名詞句対訳用例記憶部８、動
詞句対訳用例記憶部９、およびその他対訳用例記憶部１
０など）と、第１言語文を、所定の構文上の単位である
構文単位に分割する分割手段（例えば、図１に示す節分
割処理部４および単純構文解析処理部６など）と、分割
手段より出力される第１言語文の構文単位に類似する用
例を検出する検出手段（例えば、図１に示す変換部７な
ど）と、検出手段により検出された用例と対応付けられ
ている訳文に基づいて、第１言語文を、構文単位で翻訳
する翻訳手段（例えば、図１に示す変換部７など）と、
翻訳手段による構文単位の翻訳結果を合成し、第２言語
文を生成する生成手段（例えば、図１に示す句合成処理
部１４および節合成処理部１５など）とを備えることを
特徴とする。

【００５７】請求項４に記載の翻訳装置は、分割手段
が、第１言語文を、節単位に分割する節分割手段（例え
ば、図１に示す節分割処理部４など）と、節分割手段よ
り出力される第１言語文の節単位を、句単位に分割する
句分割手段（例えば、図１に示す単純構文解析処理部６
など）とを有することを特徴とする。

【００５８】請求項５に記載の翻訳装置は、用例記憶手
段が、節単位の用例を記憶している節単位用例記憶手段
（例えば、図１に示す節分割パターン対訳用例記憶部５
など）と、句単位の用例を記憶している句単位用例記憶
手段（例えば、図１に示す名詞句対訳用例記憶部８、動
詞句対訳用例記憶部９、およびその他対訳用例記憶部１
０など）とを有することを特徴とする。

【００５９】請求項１４に記載の翻訳装置は、単語を、
その概念に基づいて木構造に階層化したシソーラスを記
憶しているシソーラス記憶手段（例えば、図１に示すシ
ソーラス記憶部１２など）と、構文単位を構成する単語
と、用例を構成する単語との類似性を表す単語類似度
を、シソーラスに基づいて算出し、単語置換確率として
出力する単語類似度算出手段（例えば、図１に示す類似
度計算部１１など）とをさらに備えることを特徴とす
る。

【００６０】請求項２０に記載の翻訳装置は、最適な変
形経路を求めるのに際し、用例を構成する単語を真に省
略することに対応する真省略経路に代えて、用例を構成
する単語を仮に省略する仮省略経路を用いるとともに、
構文単位を構成する単語を真に付加することに対応する
真付加経路に代えて、構文単位を構成する単語を仮に付
加することに対応する仮付加経路を用い、仮省略経路ま
たは仮付加経路にしたがって仮に省略または付加される
単語である仮省略単語または仮付加単語それぞれを記憶
する単語記憶手段（例えば、図１１に示すキャッシュ７
Ａなど）をさらに備えることを特徴とする。

【００６１】請求項２５に記載の翻訳方法は、第１の言
語で表現された用例と、その用例を第２の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段（例え
ば、図１に示す決まり文句対訳用例記憶部３、節分割パ
ターン対訳用例記憶部５、名詞句対訳用例記憶部８、動
詞句対訳用例記憶部９、およびその他対訳用例記憶部１
０など）を用いて、第１の言語で表現された第１言語文
を、第２の言語で表現された第２言語文に翻訳する翻訳
方法であって、第１言語文を、所定の構文上の単位であ
る構文単位に分割するステップと、第１言語文の構文単
位に類似する用例を検出するステップと、その検出され
た用例と対応付けられている訳文に基づいて、第１言語
文を、構文単位で翻訳するステップと、その構文単位の
翻訳結果を合成し、第２言語文を生成するステップとを
備えることを特徴とする。

【００６２】請求項２６に記載の翻訳方法は、第１の言
語で表現された用例と、その用例を第２の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段（例え
ば、図１に示す決まり文句対訳用例記憶部３、節分割パ
ターン対訳用例記憶部５、名詞句対訳用例記憶部８、動
詞句対訳用例記憶部９、およびその他対訳用例記憶部１
０など）を用いて、第１の言語で表現された第１言語文
を、第２の言語で表現された第２言語文に翻訳する翻訳
方法であって、第１言語文を、所定の構文上の単位であ
る構文単位あって、大きな構文単位から小さな構文単位
に、段階的に分割しながら、各段階において得られた構
文単位と、用例とを照合するステップと、その照合結果
に基づいて、構文単位に対応する用例を検出するステッ
プと、その検出された用例と対応付けられている訳文に
基づいて、第１言語文を、構文単位で翻訳するステップ
と、その構文単位の翻訳結果を合成し、第２言語文を生
成するステップとを備えることを特徴とする。

【００６３】請求項２７に記載の翻訳装置は、第１の言
語で表現された第１言語文を、第２の言語で表現された
第２言語文に翻訳する翻訳装置であって、第１の言語で
表現された用例と、その用例を第２の言語に翻訳した訳
文とを対応付けて記憶している用例記憶手段（例えば、
図１に示す名詞句対訳用例記憶部８、動詞句対訳用例記
憶部９、およびその他対訳用例記憶部１０など）と、単
語を、その概念に基づいて木構造に階層化したシソーラ
スを記憶しているシソーラス記憶手段（例えば、図１に
示すシソーラス記憶部１２など）と、第１言語文を構成
する単語と、用例を構成する単語との類似性を表す単語
類似度を、シソーラスに基づいて算出する算出手段（例
えば、図１に示す類似度計算部１１など）と、算出手段
により算出された単語類似度に基づいて、第１言語文に
類似する用例を検出する検出手段（例えば、図１に示す
変換部７など）と、検出手段により検出された用例と対
応付けられている訳文に基づいて、第１言語文を翻訳す
る翻訳手段（例えば、図１に示す変換部７など）とを備
え、算出手段が、シソーラスにおいて、第１言語文を構
成する単語と、用例を構成する単語との共通の概念に包
含される単語の数に基づいて、単語類似度を算出するこ
とを特徴とする。

【００６４】請求項２８に記載の翻訳方法は、第１の言
語で表現された用例と、その用例を第２の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段（例え
ば、図１に示す名詞句対訳用例記憶部８、動詞句対訳用
例記憶部９、およびその他対訳用例記憶部１０など）を
用いて、第１の言語で表現された第１言語文を、第２の
言語で表現された第２言語文に翻訳する翻訳方法であっ
て、単語を、その概念に基づいて木構造に階層化したシ
ソーラスに基づいて、第１言語文を構成する単語と、用
例を構成する単語との類似性を表す単語類似度を算出す
るステップと、その単語類似度に基づいて、第１言語文
に類似する用例を検出するステップと、その検出された
用例と対応付けられている訳文に基づいて、第１言語文
を翻訳するステップとを備え、単語類似度が、シソーラ
スにおいて、第１言語文を構成する単語と、用例を構成
する単語との共通の概念に包含される単語の数に基づい
て算出されることを特徴とする。

【００６５】請求項２９に記載の翻訳装置は、第１の言
語で表現された第１言語文を、第２の言語で表現された
第２言語文に翻訳する翻訳装置であって、第１の言語で
表現された用例と、その用例を第２の言語に翻訳した訳
文とを対応付けて記憶している用例記憶手段（例えば、
図１に示す名詞句対訳用例記憶部８、動詞句対訳用例記
憶部９、およびその他対訳用例記憶部１０など）と、用
例が第１言語文を翻訳するために用いられる事前確率
と、用例が第１言語文に変形されて用いられる変形確率
とに基づいて、第１言語文に類似する用例を検出する検
出手段（例えば、図１に示す変換部７など）と、検出手
段により検出された用例と対応付けられている訳文に基
づいて、第１言語文を翻訳する翻訳手段（例えば、図１
に示す変換部７など）とを備えることを特徴とする。

【００６６】請求項３７に記載の翻訳装置は、最適な変
形経路を求めるのに際し、用例を構成する単語を真に省
略することに対応する真省略経路に代えて、用例を構成
する単語を仮に省略する仮省略経路を用いるとともに、
構文単位を構成する単語を真に付加することに対応する
真付加経路に代えて、構文単位を構成する単語を仮に付
加することに対応する仮付加経路を用い、仮省略経路ま
たは仮付加経路にしたがって仮に省略または付加される
単語である仮省略単語または仮付加単語それぞれを記憶
する単語記憶手段（例えば、図１１に示すキャッシュ７
Ａなど）をさらに備えることを特徴とする。

【００６７】請求項４０に記載の翻訳方法は、第１の言
語で表現された用例と、その用例を第２の言語に翻訳し
た訳文とを対応付けて記憶している用例記憶手段（例え
ば、図１に示す名詞句対訳用例記憶部８、動詞句対訳用
例記憶部９、およびその他対訳用例記憶部１０など）を
用いて、第１の言語で表現された第１言語文を、第２の
言語で表現された第２言語文に翻訳する翻訳方法であっ
て、用例が第１言語文を翻訳するために用いられる事前
確率と、用例が第１言語文に変形されて用いられる変形
確率とに基づいて、第１言語文に類似する用例を検出す
るステップと、その検出された用例と対応付けられてい
る訳文に基づいて、第１言語文を翻訳するステップとを
備えることを特徴とする。

【００６８】請求項４１に記載の翻訳装置は、第１の言
語で表現された第１言語文を、第２の言語で表現された
第２言語文に翻訳する翻訳装置であって、第１の言語で
表現された用例と、その用例を第２の言語に翻訳した訳
文とを対応付け、用例が有する文法属性とともに記憶し
ている用例記憶手段（例えば、図１に示す名詞句対訳用
例記憶部８、動詞句対訳用例記憶部９、およびその他対
訳用例記憶部１０など）と、第１言語文を構文解析する
ことにより、その文法属性を抽出する抽出手段（例え
ば、図１に示す単純構文解析処理部６など）と、第１言
語文に類似する用例を、その第１言語文および用例が有
する文法属性を考慮して検出する検出手段（例えば、図
１に示す変換部７など）と、検出手段により検出された
用例と対応付けられている訳文に基づいて、第１言語文
を翻訳する翻訳手段（例えば、図１に示す変換部７な
ど）とを備えることを特徴とする。

【００６９】請求項４２に記載の翻訳方法は、第１の言
語で表現された用例と、その用例を第２の言語に翻訳し
た訳文とを対応付け、用例が有する文法属性とともに記
憶している用例記憶手段（例えば、図１に示す名詞句対
訳用例記憶部８、動詞句対訳用例記憶部９、およびその
他対訳用例記憶部１０など）を用いて、第１の言語で表
現された第１言語文を、第２の言語で表現された第２言
語文に翻訳する翻訳方法であって、第１言語文を構文解
析することにより、その文法属性を抽出するステップ
と、第１言語文に類似する用例を、その第１言語文およ
び用例が有する文法属性を考慮して検出するステップ
と、その検出された用例と対応付けられている訳文に基
づいて、第１言語文を翻訳するステップとを備えること
を特徴とする。

【００７０】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。

【００７１】図１は、本発明を適用した翻訳装置の一実
施の形態の構成を示している。なお、図中、図１３にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。また、
この翻訳装置は、後述するように、第１言語文を、所定
の構文上の単位である構文単位あって、大きな構文単位
から小さな構文単位に、段階的に分割しながら、各段階
において得られた構文単位を用例を用いて翻訳するよう
になされており、この意味で、段階的用例利用型翻訳装
置ということができる。さらに、ここでは、第１言語文
として、例えば日本語の文が入力され、その翻訳結果で
ある第２言語文として、例えば英語の文が出力されるも
のとする。

【００７２】入力部１は、前述したように、例えば、キ
ーボードや、音声認識装置、文字認識装置などで構成さ
れ、そこに入力される第１言語文を、テキストデータな
どの形で出力するようになされている。なお、ここで
は、入力部１は、第１言語文を、例えば形態素解析など
することで、第１言語文を構成する各単語（形態素）の
区切りや、その品詞、語根、漢字の読みなど（以下、適
宜、これらの、形態素解析により得られる情報を、形態
素情報という）を検出し、テキストデータの形の第１言
語文とともに出力するようにもなされている。

【００７３】入力部１の出力は、照合部２に供給される
ようになされている。照合部２は、決まり文句対訳用例
記憶部３に記憶されている用例と、入力部１からの第１
言語文とを照合し、決まり文句対訳用例記憶部３に記憶
されている用例の中に、第１言語文と一致するものがあ
るかどうかを判定するようになされている。そして、照
合部２は、入力部１からの第１言語文と一致する用例
が、決まり文句対訳用例記憶部３に記憶されている場
合、その用例に対応付けられている訳文を、決まり文句
対訳用例記憶部２から読み出し、出力部１６に供給する
ようになされている。従って、この場合、後段の節分割
処理部４乃至節合成処理部１５では処理は行われず、出
力部１６では、照合部２からの訳文が、第２言語文とし
て出力される。

【００７４】また、照合部２は、入力部１からの第１言
語文と一致する用例が、決まり文句対訳用例記憶部３に
記憶されていない場合、入力部１からの第１言語文およ
びその形態素情報を、節分割処理部４に出力するように
なされている。

【００７５】決まり文句対訳用例記憶部３は、第１言語
（ここでは、上述したように日本語）で表現された、例
えば、挨拶その他の、いわゆる決まり文句の用例と、そ
の用例を第２言語（ここでは、上述したように英語）に
翻訳した訳文とを対応付けた対訳用例データを記憶して
いる。従って、第１言語文が、決まり文句（決まり文句
対訳用例記憶部３に用例として記憶されている決まり文
句）である場合は、その決まり文句の用例と対応付けら
れている訳文が、照合部２から出力部１６に供給され、
第１言語文が、決まり文句でない場合は、その第１言語
文および形態素情報が、照合部２から節分割処理部４に
供給される。

【００７６】節分割処理部４は、照合部２から第１言語
文および形態素情報を受信すると、第１言語文の中に、
節分割パターン対訳用例記憶部５に記憶されている用例
のいずれかと一致する節（clause）が存在するかどうか
を判定し、存在する場合には、その節の部分で第１言語
文を区切り、これにより、第１言語文を大きな構文単位
としての節に分割するようになされている。そして、節
分割処理部４は、第１言語文の分割結果（節）のうち、
節分割パターン対訳用例記憶部５に記憶されている用例
のいずれかと一致する節を除く部分を、形態素情報とと
もに、単純構文解析処理部６に供給するようになされて
いる。さらに、節分割処理部４は、第１言語文を分割す
るのに用いた節の用例に対応付けられている訳文を、節
分割パターン対訳用例記憶部５から読み出し、第１言語
文をどのように分割したかに関する情報（以下、適宜、
節分割情報という）とともに、節合成処理部１５に供給
するようになされている。

【００７７】また、節分割処理部４は、第１言語文の中
に、節分割パターン対訳用例記憶部５に記憶されている
用例のいずれかと一致する節が存在しない場合、即ち、
第１言語文が単節で構成されている場合、第１言語文
を、そのまま、形態素情報とともに、単純構文解析処理
部６に供給するようになされている。

【００７８】節分割パターン対訳用例記憶部５は、第１
言語で表現された、節単位の用例と、その用例を第２言
語に翻訳した訳文とを対応付けた対訳用例データを記憶
している。なお、ここでは、節分割パターン対訳用例記
憶部５には、例えば、「できましたら」などの、いわば
パターン化した節の用例が記憶されている。

【００７９】単純構文解析処理部６は、節分割処理部４
からの第１言語文を構成する節に対し、同じく節分割処
理部４からの形態素情報に基づき、例えば、正規文法と
して記述されている第１言語の統語的規則（知識）を用
いて、いわば浅い構文解析を施すことで、節（節分割処
理部４から複数の節が供給される場合には、それぞれの
節）を句（phrase）単位に分割するようになされてい
る。即ち、ここでは、単純構文解析処理部６は、節分割
処理部４からの第１言語文の節を、例えば名詞句、動詞
句、およびその他の句（例えば、副詞句や、文修飾語な
ど）などに分割し、変換部７に供給するようになされて
いる。

【００８０】なお、単純構文解析処理部６は、構文解析
を行うことで、各句についての、例えば、構文的ヘッド
（syntactic head）（各句の主要語（例えば、名詞句の
重要な部分（被修飾語など）や、名詞句が１の名詞から
なる場合はその名詞など）に関する情報）や、モダリテ
ィ（modality）（例えば、可能法（potential）や、仮
定法（conditional）、願望形（desiderative）などに
関する情報）などの文法属性の抽出も行うようになされ
ている。さらに、単純構文解析処理部６は、節を構成す
る句どうしの係り受け関係その他の構文情報（以下、節
構文情報という）を検出するようにもなされている。文
法属性および節構文情報は、上述したようにして得られ
た句とともに、変換部７に供給されるようになされてい
る。

【００８１】変換部７は、単純構文解析処理部６からの
第１言語文の句に最も類似する句単位の用例を、名詞句
対訳用例記憶部８、動詞句対訳用例記憶部９、またはそ
の他対訳用例記憶部１０から検出し、その用例と対応付
けられている訳文に基づいて、句単位で翻訳を行うよう
になされている。

【００８２】即ち、変換部７は、名詞句対訳用例記憶部
８、動詞句対訳用例記憶部９、またはその他対訳用例記
憶部１０に記憶されている用例を構成する単語と、単純
構文解析処理部６からの句を構成する単語との意味的な
類似性を表す単語類似度を、類似度計算部１１に計算さ
せ、その単語類似度その他（例えば、単純構文解析処理
部６が出力する文法属性など）に基づいて、単純構文解
析処理部６からの句に最も類似する用例を検出する。な
お、変換部７では、単純構文解析処理部６からの句と一
致する用例が、名詞句対訳用例記憶部８、動詞句対訳用
例記憶部９、またはその他対訳用例記憶部１０に記憶さ
れている場合には、その用例を、単純構文解析処理部６
からの句と最も類似する用例として検出するようになさ
れている。

【００８３】さらに、変換部７は、対訳辞書１３を参照
することで、その用例に対応付けられている訳文を構成
する単語のうち、第１言語文を構成する単語と対応しな
いものを、その単語の対訳に置き換え、これにより得ら
れる句の訳文を、単純構文解析処理部６からの節構文情
報とともに、句合成処理部１４に出力するようになされ
ている。

【００８４】なお、変換部７は、以上の処理を、単純構
文解析処理部６から供給される名詞句、動詞句、その他
の句それぞれに対して行う。また、名詞句、動詞句、そ
の他の句に最も類似する句単位の用例の検出は、それぞ
れ名詞句対訳用例記憶部８、動詞句対訳用例記憶部９、
またはその他対訳用例記憶部１０のみを参照して行われ
る。

【００８５】名詞句対訳用例記憶部８、動詞句対訳用例
記憶部９、またはその他対訳用例記憶部１０は、用例
を、名詞句単位、動詞句単位、その他の句単位で、それ
ぞれ記憶している。

【００８６】類似度計算部１１は、変換部７の制御の
下、シソーラス記憶部１２に記憶されているシソーラス
に基づき、名詞句対訳用例記憶部８、動詞句対訳用例記
憶部９、またはその他対訳用例記憶部１０に記憶されて
いる用例を構成する単語と、単純構文解析処理部６が出
力する句を構成する単語との単語類似度を計算するよう
になされている。シソーラス記憶部１２は、単語を、そ
の概念に基づいて木構造に階層化したシソーラスを記憶
している。対訳辞書１３は、第１言語の単語と、それに
対応する第２言語の単語（第１言語の単語を第２言語に
訳したもの（対訳））とを対応付けて記憶している。

【００８７】句合成処理部１４は、変換部７から供給さ
れる名詞句、動詞句、およびその他の句の訳文を、同じ
く変換部７から供給される節構文情報と、第２言語の統
語的規則とに基づいて合成することにより、第１言語文
の節に対応する、第２言語の節を生成し、節合成処理部
１５に供給するようになされている。節合成処理部１５
は、節を合成し、これにより、第１言語文の翻訳結果と
しての第２言語文を生成するようになされている。

【００８８】即ち、第１言語文が複数の節で構成される
場合、節合成処理部１５に対しては、句合成処理部１４
から複数の節の翻訳結果が供給される。あるいは、ま
た、節合成処理部１５に対しては、句合成処理部１４か
らだけではなく、節分割処理部４からも、節の翻訳結果
が供給される。節合成処理部１５は、このようにして供
給される複数の節の翻訳結果を合成する（組み合わせ
る）ことで、第２言語文を生成する。節合成処理部１５
において生成された第２言語文は、出力部１６に供給さ
れて出力されるようになされている。

【００８９】なお、節分割処理部４からは、上述したよ
うに、節の翻訳結果（訳文）の他、節分割情報も供給さ
れるが、この場合は、この節分割情報に基づいて、句合
成処理部１４が出力する節の訳文と、節分割処理部４が
出力する節の訳文とが合成される。

【００９０】次に、図２を参照して、シソーラス記憶部
１２に記憶されているシソーラスについて説明する。シ
ソーラス記憶部１２には、単語が、例えば、ＥＤＲ（Ja
panElectronic Dictionary Research Institute）（日
本電子化辞書研究所）の概念辞書における場合と同様に
階層化されたシソーラスが記憶されており、図２は、そ
のシソーラスの一部を示している（出典「日本電子化辞
書研究所、ＥＤＲ電子化辞書製品版（第１．０版）、１
９９５年」）。即ち、同図は、シソーラス記憶部１２に
記憶されているシソーラスのうちの、「いく」と表現さ
れ得る単語（図中、楕円で囲んである部分）（但し、同
図においては、単語そのものではなく、その意義を示し
てある）、およびその上位概念（図中、四角で囲んであ
る部分）を表している。

【００９１】このシソーラスは、各単語から上位の階層
を見た場合に、同一の数の階層が存在するようにはなさ
れていない。即ち、例えば、図１６における場合と同様
に、最上位の概念が属する階層を、第０階層とし、以
下、その下位階層を順次、第１階層、第２階層、・・・
というとすると、「時が経過する」という意味内容（意
義）の単語Ｗ１は、第３階層の概念「時間経過」に属し
ており、「次第にする」という意味内容の単語Ｗ２は、
第７階層の概念「今までいた場所から立ち去る」に属し
ている。また、このシソーラスにおいては、例えば、
「動物や人が死ぬ」という意味内容の単語Ｗ３や、「目
的の場所に到着する」という意味内容の単語Ｗ４は、同
一階層の複数の概念に包含されるようになされている。
即ち、単語Ｗ３は、第４階層の概念「動物の生理現象」
および「生命の命が消えること」の両方に包含されてお
り、また、単語Ｗ４は、第７階層の概念「主体が終点へ
移動する」および「到着」の両方に包含されている。

【００９２】以上のように、このシソーラスは、規則的
には構成されていない。

【００９３】さらに、このシソーラスは、線で結ばれて
いる概念間の距離が同一となるようにも構成されていな
い。即ち、例えば、概念Ｃ１（「主体が終点へ移動す
る」）は、概念Ｃ２（「主体の移動」）およびＣ３
（「終点への帰着」）のいずれとも結ばれているが、概
念Ｃ１とＣ２との距離と、概念Ｃ１とＣ３との距離とは
同一とはいえない。

【００９４】図１の類似度計算部１１では、シソーラス
が、以上のように構成されるものであっても、後述する
ようにして、単語間の類似性を精度良く反映した単語類
似度が計算されるようになされている。

【００９５】次に、図３のフローチャートを参照して、
図１の翻訳装置の動作について説明する。入力部１に第
１言語文が入力されると、ステップＳ０において、入力
部１は、その第１言語文をテキストデータの形に変換す
るとともに、その第１言語文の形態素情報を生成し、照
合部２に供給する。照合部２は、ステップＳ１におい
て、決まり文句対訳用例記憶部３に記憶されている用例
と、入力部１からの第１言語文とを照合し、これによ
り、決まり文句対訳用例記憶部３に記憶されている用例
の中に、入力部１からの第１言語文と一致するものがあ
るかどうかを判定する。

【００９６】ステップＳ１において、入力部１からの第
１言語文と一致する用例が、決まり文句対訳用例記憶部
３に記憶されていると判定された場合、ステップＳ２に
進み、第１言語文が、その一致する用例に対応付けられ
ている訳文に置換され、ステップＳ１３に進む。ステッ
プＳ１３では、ステップＳ１で得られた訳文が、照合部
２から出力部１６に供給され、これにより、第１言語文
を第２言語に翻訳した第２言語文が出力され、処理を終
了する。

【００９７】一方、ステップＳ１において、入力部１か
らの第１言語文と一致する用例が、決まり文句対訳用例
記憶部３に記憶されていないと判定された場合、その第
１言語文は、形態素情報とととも、照合部２から節分割
処理部４に供給される。そして、節分割処理部４では、
ステップＳ３において、第１言語文を構成する節の中
に、節分割パターン対訳用例記憶部５に記憶されている
節単位の用例のいずれかと一致するものがあるかどうか
が判定される。

【００９８】ステップＳ３において、第１言語文を構成
する節の中に、節分割パターン対訳用例記憶部５に記憶
されている節単位の用例のいずれかと一致するものがあ
ると判定された場合、ステップＳ４に進み、節分割処理
部４は、その節の部分で第１言語文を区切り、これによ
り、第１言語文を、節単位に分割するとともに、節分割
情報を生成する。そして、節分割処理部４は、第１言語
文を構成する節のうち、節分割パターン対訳用例記憶部
５に記憶されている節単位の用例と一致するものの訳文
を、節分割パターン対訳用例記憶部５から読み出し、節
分割情報とともに、節合成処理部１５に出力する。さら
に、節分割処理部４は、第１言語文を構成する節のうち
の残ったものを、形態素情報とともに、単純構文解析処
理部６に供給し、ステップＳ５に進む。

【００９９】一方、ステップＳ３において、第１言語文
を構成する節の中に、節分割パターン対訳用例記憶部５
に記憶されている節単位の用例と一致するものがないと
判定された場合、即ち、例えば、第１言語文が単節で構
成されている場合、節分割処理部４は、第１言語文を、
形態素情報とともに、単純構文解析処理部６に出力し、
ステップＳ４をスキップして、ステップＳ５に進む。

【０１００】ステップＳ５では、単純構文解析処理部６
において、節分割処理部４からの第１言語文を構成する
節に対し、同じく節分割処理部４からの形態素情報に基
づき、第１言語の統語的規則（知識）を用いて、構文解
析処理が施され、これにより、第１言語文の節が、名詞
句や、動詞句、その他の句に分割されるとともに、各句
の文法属性、および節を構成する句どうしの係り受け関
係などの節構文情報が生成される。これらの句、文法属
性、および節構文情報は、単純構文解析処理部６から変
換部７に供給され、ステップＳ６に進む。

【０１０１】ステップＳ６では、変換部７において、単
純構文解析処理部６から供給された句と、名詞句対訳用
例記憶部８、動詞句対訳用例記憶部９、またはその他対
訳用例記憶部１０の記憶内容とが照合され、これによ
り、単純構文解析処理部６から供給された句と一致する
句単位の用例が、名詞句対訳用例記憶部８、動詞句対訳
用例記憶部９、またはその他対訳用例記憶部１０に記憶
されているかどうかが判定される。ステップＳ６におい
て、単純構文解析処理部６から供給された句と一致する
用例が、名詞句対訳用例記憶部８、動詞句対訳用例記憶
部９、またはその他対訳用例記憶部１０に記憶されてい
ると判定された場合、ステップＳ７に進み、変換部７
は、その一致する用例に対応付けられた訳文を、名詞句
対訳用例記憶部８、動詞句対訳用例記憶部９、またはそ
の他対訳用例記憶部１０から読み出し、句合成処理部１
４に出力して、ステップＳ１０に進む。

【０１０２】ここで、名詞句対訳用例記憶部８、動詞句
対訳用例記憶部９、またはその他対訳用例記憶部１０に
は、例えば、文単位の用例を入力部１に入力することに
より、単純構文解析処理部６から得られる名詞句、動詞
句、またはその他の句それぞれが記憶されている。さら
に、名詞句対訳用例記憶部８、動詞句対訳用例記憶部
９、またはその他対訳用例記憶部１０には、上述のよう
にして得られる名詞句、動詞句、またはその他の句それ
ぞれが、対応する文法属性と関係付けられて記憶されて
いる。

【０１０３】即ち、名詞句対訳用例記憶部８、動詞句対
訳用例記憶部９、およびその他対訳用例記憶部１０に
は、句単位の用例が、その文法属性という、いわば構文
解析の結果得られる抽象的なものとともに記憶されてい
る。従って、変換部７には、一般化された言語学上の知
識を与え、単純構文解析処理部６からの句（以下、適
宜、入力句という）と、名詞句対訳用例記憶部８、動詞
句対訳用例記憶部９、またはその他対訳用例記憶部１０
に記憶されている句（以下、適宜、用例句という）との
照合を、これらの句が有する文法属性（入力句および用
例句が有する文法属性）を考慮して行わせるようにする
ことができ、これにより、効率的な処理が可能となる。

【０１０４】具体的には、例えば、動詞句「予約をして
いただきたいのですが」が、単純構文解析処理部６に入
力されたときに、文法属性（slot-name value）とし
て、例えば（gerund-suffix ITADAKU）（desiderative
+）（extended-predicate +）（s-part GA）（formal
+）が得られたとする。ここで、動詞句「予約をしてい
ただきたいのですが」の最も簡潔な表現（いわば、語根
に相当する表現）は、「予約をする」であるが、文法属
性（gerund-suffix ITADAKU）は、この「予約をする」
に、「いただく」というのがサフィックス的に付加され
ていることを、文法属性（desiderative +）は、願望を
表す表現（ここでは、「たい」）が付加されていること
を、文法属性（extended-predicate +）は、述語を付加
するための表現（ここでは、「のです」）が付加されて
いることを、（s-part GA）は、終助詞「が」が付加さ
れていることを、文法属性（formal +）は、文末が丁寧
な表現となっていること（ここでは、文末として、例え
ば、「のだ」などでなはく、「のです」が用いられてい
ること）を、それぞれ意味する。

【０１０５】この場合、一般化された言語学上の知識と
して、例えば文法属性（extended-predicate +）に対応
する表現の「の」が「ん」になることがあるということ
を、単純構文解析処理部６に与えておいたとき、入力句
として、例えば、上述の動詞句の中の「の」が「ん」と
なった「予約をしていただきたいんですが」が入力され
ても、単純構文解析処理部６からは、やはり、上述の場
合と同様の文法属性（gerund-suffix ITADAKU）（desid
erative +）（extended-predicate +）（s-part GA）
（formal +）が出力される。

【０１０６】従って、動詞句「予約をしていただきたい
のですが」が、用例句として、その文法属性とともに、
動詞句対訳用例記憶部９に記憶されているとすると、変
換部７では、用例句「予約をしていただきたいのです
が」は、入力句「予約をしていただきたいんですが」と
一致すると判定される。

【０１０７】また、例えば、上述の動詞句「予約をして
いただきたいのですが」のうちの文法属性（extended-p
redicate +）と（formal +）に対応する表現を省略した
「予約をしていただきたいが」が、入力句として入力さ
れた場合には、文法属性（gerund-suffix ITADAKU）（d
esiderative +）（s-part GA）が、単純構文解析処理部
６から出力される。

【０１０８】いま、一般化された言語学上の知識とし
て、例えば、文法属性（extended-predicate +）や（fo
rmal +）に対応する表現は無視することができるという
ものを、変換部７に与えておいたとする。そして、上述
の動詞句「予約をしていただきたいのですが」が、用例
句として、その文法属性とともに、動詞句対訳用例記憶
部９に記憶されているとすると、変換部７では、用例句
「予約をしていただきたいのですが」の文法属性のうち
の（extended-predicate +）および（formal +）を無視
して照合が行われ、これにより、用例句「予約をしてい
ただきたいのですが」は、入力句「予約をしていただき
たいが」と一致すると判定される。

【０１０９】以上のように、入力句が、用例句と完全に
一致しなくても、同一の意味内容を表す用例句を得るこ
とができる。即ち、文法属性を考慮することで、変換部
７では、用例句における「のです」を無視して処理を行
うことができる。

【０１１０】さらに、その結果、表層上のバリエーショ
ンに対応した用例句を用意しておく必要がなくなり、即
ち、例えば、動詞句対訳用例記憶部９には、用例句とし
て、動詞句「予約をしていただきたいのですが」の他
に、例えば、その中の「のです」を除いた動詞句「予約
をしていただきたいが」や、「の」を除いた動詞句「予
約をしていただきたいですが」、あるいは、「の」を
「ん」に変えた動詞句「予約をしていただきたいんです
が」などを記憶させておく必要はなくなり、従って、名
詞句対訳用例記憶部８や、動詞句対訳用例記憶部９、そ
の他対訳用例記憶部１０に、用例句を、効率的に記憶さ
せておくことができる。また、名詞句対訳用例記憶部８
や、動詞句対訳用例記憶部９、その他対訳用例記憶部１
０は、用例句のデータベースということができるが、こ
のデータベースの作成、維持、改良も容易に行うことが
可能となる。

【０１１１】一方、ステップＳ６において、入力句（単
純構文解析処理部６から供給された句）と一致する用例
句が、名詞句対訳用例記憶部８、動詞句対訳用例記憶部
９、またはその他対訳用例記憶部１０に記憶されていな
いと判定された場合、ステップＳ８に進み、変換部７
は、類似度計算部１１を制御することにより、単語類似
度を計算させ、この単語類似度その他に基づいて、入力
句と、名詞句対訳用例記憶部８、動詞句対訳用例記憶部
９、またはその他対訳用例記憶部１０に記憶されている
用例句との類似性（意味的な類似性）を表す、後述する
翻訳適正率を算出する。そして、変換部７は、その翻訳
適正率が最も高い用例句を検出し、ステップＳ９に進
む。

【０１１２】ステップＳ９では、変換部７は、ステップ
Ｓ８で検出された用例句に対応付けられている訳文に基
づき、対訳辞書１３を参照しながら、入力句の訳文（以
下、適宜、入力句訳という）を生成し、単純構文解析処
理部６からの節構文情報とともに、句合成処理部１４に
出力する。

【０１１３】ここで、以上のステップＳ６乃至Ｓ９の処
理は、入力句が、名詞句、動詞句、またはその他の句で
ある場合には、名詞句対訳用例記憶部８、動詞句対訳用
例記憶部９、またはその他対訳用例記憶部１０にそれぞ
れ記憶されている用例句を対象に行われる。従って、入
力句の種類によって、処理の対象とされる用例句が制限
されるので、翻訳処理速度の向上を図ることができる。

【０１１４】句合成処理部１４は、変換部７から、ある
節を構成する入力句の訳文（入力句訳）をすべてを受信
すると、ステップＳ１０において、その入力句訳を、同
じく変換部７から供給される節構文情報に基づいて合成
することにより、第２言語の節を生成し、節合成処理部
１５に供給する。

【０１１５】その後、ステップＳ１１に進み、節合成処
理部１５は、第１言語文が複数の節から構成されている
かどうかを判定する。ステップＳ１１において、第１言
語文が複数の節から構成されていると判定された場合、
即ち、句合成処理部１４から節合成処理部１５に対し、
複数の節（第２言語の節）が供給された場合、あるい
は、節分割処理部４および句合成処理部１４の両方から
節合成処理部１５に対し、節が供給された場合、ステッ
プＳ１２に進み、節合成処理部１５は、それらの節を合
成することにより、第２言語文を生成し、出力部１６に
供給して、ステップＳ１３に進む。

【０１１６】また、ステップＳ１１において、第１言語
文が複数の節から構成されていないと判定された場合、
即ち、句合成処理部１４から節合成処理部１５に対し、
節が１つだけ供給された場合、節合成処理部１５は、そ
の節（第２言語文）を、そのまま、出力部１６に供給
し、ステップＳ１２をスキップして、ステップＳ１３に
進む。ステップＳ１３では、節合成処理部１５から供給
された第２言語文が出力され、処理を終了する。

【０１１７】以上のように、節分割処理部４および単純
構文解析処理部６において、第１言語文を、節という大
きな構文単位から、句という小さな構文単位に、段階的
に分割しながら、各段階において得られた構文単位、即
ち、節や句を対象に、用例を用いて翻訳を行うようにし
たので、第１言語文全体を対象に翻訳を行う場合に比較
して、翻訳処理速度を向上させることが可能となる。

【０１１８】なお、上述の場合、節への分割は、第１言
語文を構成する節の中に、節分割パターン対訳用例記憶
部５に記憶されている節単位の用例と一致するものが存
在する場合に、その節に基づいて行うようにしたが、節
への分割は、そのようなことと無関係に行うようにする
ことも可能である。

【０１１９】次に、第１言語文として、例えば、「でき
ましたらイチゴのアイスクリームをお願いしたいんです
が」が入力された場合の図１の翻訳装置の処理を、図４
乃至図６を参照して説明する。

【０１２０】この第１言語文「できましたらイチゴのア
イスクリームをお願いしたいんですが」からは、入力部
１において形態素解析が行われることにより、例えば、
図４（Ａ）に示すような形態素情報が抽出される。な
お、図４（Ａ）においては、参考として、第１言語文が
有する文法属性の中のモダリティ格情報も図示してあ
る。

【０１２１】第１言語文「できましたらイチゴのアイス
クリームをお願いしたいんですが」と、その形態素情報
は、入力部１から照合部２に供給される。いま、決まり
文句対訳用例記憶部３に、「できましたらイチゴのアイ
スクリームをお願いしたいんですが」が用例として記憶
されていないとすると、第１言語文「できましたらイチ
ゴのアイスクリームをお願いしたいんですが」、および
形態素情報は、照合部２から節分割処理部４に供給され
る。

【０１２２】節分割処理部４では、第１言語文「できま
したらイチゴのアイスクリームをお願いしたいんです
が」と、節分割パターン対訳用例記憶部５に記憶されて
いる節単位の用例との照合が行われる。ここで、例え
ば、いま、節分割パターン対訳用例記憶部５に、図４
（Ｂ）に示すような用例「できましたらＸ」と、その
訳文「X, if possible」とが対応付けられた対訳用例デ
ータが記憶されているとすると、第１言語文「できまし
たらイチゴのアイスクリームをお願いしたいんですが」
の中に、用例「できましたら」と一致する節が存在する
ので（この場合、「イチゴのアイスクリームをお願いし
たいんですが」は、Ｘの部分に一致するものと認識され
る）、第１言語文「できましたらイチゴのアイスクリー
ムをお願いしたいんですが」は、節分割処理部４におい
て、節「できましたら」と「イチゴのアイスクリームを
お願いしたいんですが」とに分割される。

【０１２３】そして、節分割パターン対訳用例記憶部５
に記憶されている節単位の用例と一致する節「できまし
たら」に対応付けられている訳文「X, if possible」
は、節分割処理部４から節合成処理部１５に供給され
る。また、第１言語文の残りの節「イチゴのアイスクリ
ームをお願いしたいんですが」は、節分割処理部４から
単純構文解析処理部６に供給される。

【０１２４】単純構文解析処理部６では、節「イチゴの
アイスクリームをお願いしたいんですが」が構文解析さ
れることにより、「イチゴのアイスクリームを」が１つ
の名詞句を構成し、「お願いしたいんですが」が１つの
動詞句を構成することが認識される。さらに、この場
合、動詞句「お願いしたいんですが」にかかっている名
詞句が「アイスクリームを」であることが認識される。
そして、これらの認識結果に基づいて、節「イチゴのア
イスクリームをお願いしたいんですが」が句単位に分割
される。

【０１２５】ここで、例えば文「お金をとる」における
動詞「とる」の対訳は、「take」や「get」となるが、
文「朝食をとる」における動詞「とる」の対訳は、「ha
ve」や「eat」となる。従って、動詞（動詞句）につい
ては、目的語や、主語、補語などがわからないと、その
対訳を決定することが困難な場合がある。そこで、単純
構文解析処理部６では、そのような場合には、動詞（述
部）に、必要に応じて、目的語や、主語、補語などを含
めて、１つの動詞句とするようになされている。

【０１２６】即ち、この場合、節「イチゴのアイスクリ
ームをお願いしたいんですが」は、名詞句「イチゴのア
イスクリームを」と、目的語を含んだ動詞句「アイスク
リームをお願いしたいんですが」とに分割される。

【０１２７】さらに、単純構文解析処理部６では、各句
の文法属性が生成（認識）され、各句に対して対応付け
られる。

【０１２８】即ち、名詞句「イチゴのアイスクリーム
を」については、例えば、「イチゴの」が「アイスクリ
ームを」の修飾語で、「アイスクリームを」が「イチゴ
の」の被修飾語であるという文法属性が生成される（但
し、この場合、この文法属性は、後段の処理に用いられ
ないため、以下では、特に言及しない）。

【０１２９】また、動詞句「アイスクリームをお願いし
たいんですが」については、図５（Ａ）に示すように、
「お願いしたいんですが」が語根「お願いする」の願望
形であるという文法属性（root「お願いする」＋deside
rative）と、その目的語がアイスクリーム（食べ物）で
あるという文法属性（NP1「アイスクリームを」）とが
生成される。

【０１３０】以上のようにして得られた名詞句「イチゴ
のアイスクリームを」および動詞句「アイスクリームを
お願いしたいんですが」、並びにそれらの文法属性は、
単純構文解析処理部６から変換部７に供給される。

【０１３１】変換部７では、単純構文解析処理部６から
供給された句と、名詞句対訳用例記憶部８、動詞句対訳
用例記憶部９、またはその他対訳用例記憶部１０の記憶
内容とが照合され、単純構文解析処理部６から供給され
た句と最も類似する用例句が、名詞句対訳用例記憶部
８、動詞句対訳用例記憶部９、またはその他対訳用例記
憶部１０から検出（検索）される。

【０１３２】即ち、例えば、いま、動詞句対訳用例記憶
部９に、用例「田中さんをお願いしたいんですが」が、
図５（Ｂ）に示すように、文法属性root「お願いする」
＋desiderative）、およびNP1「田中さんを」と関係付
けられ、さらに、その訳文「may I speak to NP1 ?」と
対応付けられて記憶されているとともに、用例「コーヒ
ーを１杯お願いしたいんですが」が、図５（Ｃ）に示す
ように、文法属性root「お願いする」＋desiderativ
e）、およびNP1「コーヒーを１杯」と関係付けられ、さ
らに、その訳文「may I have NP1 ?」と対応付けられて
記憶されているとした場合、目的語「アイスクリーム
を」と「田中さんを」との意味的な距離と、目的語「ア
イスクリームを」と「コーヒーを１杯」との意味的な距
離との比較から、用例「コーヒーを１杯お願いしたいん
ですが」が、動詞句「アイスクリームをお願いしたいん
ですが」に最も類似する用例として検出される。

【０１３３】そして、この用例「コーヒーを１杯お願い
したいんですが」に対応付けられている訳文「may I ha
ve NP1 ?」が、動詞句対訳用例記憶部８から読み出さ
れ、動詞句「アイスクリームをお願いしたいんですが」
の対訳として、変換部７から句合成処理部１４に供給さ
れる。

【０１３４】さらに、変換部７では、例えば図６（Ａ）
に示すように、用例「昨日の牛乳」と訳文「yesterday'
s milk」とが、用例「私の本」と訳文「my book」と
が、用例「コーヒーのアイスクリーム」と訳文「coffee
flavored ice cream」とが、それぞれ対応付けられ
て、名詞句対訳用例記憶部８に記憶されているとする
と、単純構文解析処理部６からの名詞句「イチゴのアイ
スクリームを」に最も類似する用例として、「コーヒー
のアイスクリーム」が検出され、それに対応付けられて
いる訳文「coffee flavored ice cream」が、名詞句対
訳用例記憶部８から読み出される。

【０１３５】そして、この場合、変換部７では、名詞句
「イチゴのアイスクリームを」は、用例「コーヒーのア
イスクリーム」の中の「コーヒー」が「イチゴ」となっ
たものであることが認識され、対訳辞書１３を参照する
ことにより、用例にない「イチゴ」が検索される。

【０１３６】ここで、対訳辞書１３には、図６（Ｂ）に
示すように、「イチゴ」とその対訳「strawberry」とが
対応付けられて記憶されているものとする。

【０１３７】変換部７は、対訳辞書１３から「イチゴ」
を検索すると、それに対応付けられている「strawberr
y」を読み出す。そして、名詞句対訳用例記憶部８から
読み出した訳文「coffee flavored ice cream」の中
の、「イチゴ」に対応する「コーヒー」の対訳「coffe
e」が、対訳辞書１３から読み出された「strawberry」
に置換され、これにより、名詞句「イチゴのアイスクリ
ームを」の訳文「strawberryflavored ice cream」が生
成される。この訳文「strawberry flavored ice crea
m」は、変換部７から句合成処理部１４に供給される。

【０１３８】句合成処理部１４では、名詞句「イチゴの
アイスクリームを」の訳文「strawberry flavored ice
cream」、および動詞句「アイスクリームをお願いした
いんですが」の訳文「may I have NP1 ?」が合成され、
これにより、節「イチゴのアイスクリームをお願いした
いんですが」の訳文「may I have strawberry flavored
ice cream ?」が生成されて、節合成処理部１５に供給
される。

【０１３９】節合成処理部１５は、節「イチゴのアイス
クリームをお願いしたいんですが」の訳文「may I have
strawberry flavored ice cream ?」、および節「でき
ましたら」の訳文「X, if possible」を受信すると、こ
れらを合成する。これにより、第１言語文「できました
らイチゴのアイスクリームをお願いしたいんですが」を
第２言語に訳した第２言語文「may I have strawberry
flavored ice cream,if possible ?」が生成される。

【０１４０】次に、変換部７において行われる、入力句
に最も類似する用例句の検出の方法について詳述する。
いま、入力句Ｉを構成する単語を、その先頭からｉ
ｗ₁，ｉｗ₂，・・・，ｉｗ_Nと表し、その有する文法属
性を、ｉｆ₁，ｉｆ₂，・・・，ｉｆ_Qと表す。同様に、
用例句Ｅを構成する単語を、その先頭からｅｗ₁，ｅ
ｗ₂，・・・，ｅｗ_Mと表し、その有する文法属性を、ｅ
ｆ₁，ｅｆ₂，・・・，ｅｆ_Pと表す。ここで、Ｍまたは
Ｎは、用例句Ｅまたは入力句Ｉそれぞれを構成する単語
数を表し、ＰまたはＱは、用例句Ｅまたは入力句Ｉそれ
ぞれが有する（それぞれから抽出された）文法属性の数
を表す。

【０１４１】入力句に最も類似（意味的に類似する）す
る用例句というのは、その入力句の翻訳処理に利用する
のに最も適したものである。いま、ある用例句Ｅが、入
力句Ｉの翻訳のために適している確率を、翻訳適正率と
いうとすると、この翻訳適正率は、用例句の条件付き確
率として、Ｐ（Ｅｘａｍｐｌｅ｜Ｉｎｐｕｔ）と表すこ
とができる。但し、Ｐ（）は確率を表し、Ｅｘａｍｐｌ
ｅまたはＩｎｐｕｔは、用例句の集合または入力句の集
合をそれぞれ意味する。

【０１４２】入力句に最も類似する用例句とは、この翻
訳適正率Ｐ（Ｅｘａｍｐｌｅ｜Ｉｎｐｕｔ）が最も高い
ものであり、これを、Ｅ_maxと表すとすると、この用例
句Ｅ_m _axは、式（２）により求めることができる。

【０１４３】

【数２】・・・（２）但し、式（２）の右辺は、［］内の値が最大となるＥを
求める演算を意味する。

【０１４４】ところで、翻訳適正率Ｐ（Ｅｘａｍｐｌｅ
｜Ｉｎｐｕｔ）は、ベイズ（Bayes）の法則により、式
（３）のように表すことができる。

【０１４５】 P(Example|Input)=P(Example)P(Input|Example)/P(Input) ・・・（３）

【０１４６】ここで、ある入力句Ｉに最も類似する用例
句Ｅ（Ｅ_max）を求める場合、その入力句は１つである
から、即ち、Ｉｎｐｕｔ＝Ｉであるから、式（３）の分
母Ｐ（Ｉｎｐｕｔ）は１であり、無視することができ
る。従って、式（２）および（３）から、次の式（４）
により、入力句Ｉに最も類似する用例句Ｅ_maxを求める
ことができる。

【０１４７】

【数３】・・・（４）

【０１４８】式（４）から、入力句に対する翻訳適正率
が最大の用例句を求めるためには、確率Ｐ（Ｅ）および
Ｐ（Ｉ｜Ｅ）を求める必要がある。

【０１４９】ここで、確率Ｐ（Ｅ）は、用例Ｅ（Ｅ∈Ｅ
ｘａｍｐｌｅ）が翻訳に用いられる事前確率を表す。ま
た、確率（条件付き確率）Ｐ（Ｉ｜Ｅ）は、用例句Ｅ
が、入力句Ｉのように変形されて用いられる確率（以
下、適宜、変形確率という）を表す。

【０１５０】事前確率Ｐ（Ｅ）は、任意の入力句に対し
て、用例句Ｅが用いられることの適正さに対応している
必要があり、従って、例えば、以下のような要素が反映
されるべきである。即ち、事前確率Ｐ（Ｅ）には、ま
ず、翻訳装置が適用されるドメイン（翻訳装置に入力さ
れる表現（文章）のタイプ（例えば、機械のマニュアル
に記載された文章であるとか、新聞記事であるとかな
ど）において、どのような表現が頻繁に用いられるかと
いう要素を反映させる必要がある。

【０１５１】具体的には、ドメインで頻繁に用いられる
表現に対応する用例句Ｅには、稀にしか用いられない表
現や、ドメインにあまり関係のない意味内容を持つ表現
に対応する用例句Ｅよりも高い事前確率Ｐ（Ｅ）を与え
る必要がある。

【０１５２】次に、事前確率Ｐ（Ｅ）には、その用例句
Ｅの他に、翻訳装置にどのような用例句が記憶されてい
るのかという要素（図１の翻訳装置では、用例句は、名
詞句、動詞句、またはその他の句に分けて、名詞句対訳
用例記憶部８、動詞句対訳用例記憶部９、またはその他
対訳用例記憶部１０にそれぞれ記憶されているので、入
力句が、名詞句、動詞句、またはその他の句である場合
には、名詞句対訳用例記憶部８、動詞句対訳用例記憶部
９、またはその他対訳用例記憶部１０に、それぞれどの
ような用例句が記憶されているのかという要素というこ
とになる）を反映させる必要がある。具体的には、例え
ば、非常に一般的で他に類似した用例句がほとんど存在
しない用例句Ｅに対しては、特殊な用例句や、類似する
用例句が数多く存在する用例句よりも高い事前確率Ｐ
（Ｅ）を与える必要がある。

【０１５３】以上のような要素を、適切に反映させた事
前確率Ｐ（Ｅ）は、例えば、翻訳装置が適用されるドメ
インで典型的に使われる言語表現の集合であるコーパス
データ（訓練コーパスデータ）を用いて求めることがで
きる。

【０１５４】即ち、例えば、翻訳装置に記憶されている
用例句のうち、コーパスデータを翻訳するのに最適なも
のを、人手などにより正確に選択することを、コーパス
データすべてについて行う。この場合、翻訳装置に記憶
されている用例句の数をＮ_Eと、それらの用例句が選択
された延べ回数（総数）をＴと、用例Ｅ_i（但し、ｉ＝
１，２，・・・，Ｎ_E）が選択された回数をｆｒｅｑ
（Ｅ_i）と、それぞれ表すと、各用例Ｅ_iについての事前
確率Ｐ（Ｅ_i）は、例えば、式（５）により求めること
ができる。

【０１５５】

【数４】・・・（５）

【０１５６】ここで、コーパスデータの翻訳に最も適し
ている用例句を、人手により選択するのが困難である場
合には、図１の翻訳装置にコーパスデータの翻訳を行わ
せることにより、式（５）における事前確率Ｐ（Ｅ_i）
の近似値を求めることができる。

【０１５７】即ち、図７のフローチャートに示すよう
に、まず最初に、ステップＳ２１において、事前確率Ｐ
（Ｅ_i）を、すべて、例えば１／Ｎ_Eなどに初期化し、ス
テップＳ２２に進む。ステップＳ２２では、事前確率Ｐ
（Ｅ_i）を用いて、コーパスデータすべてを、図１の翻
訳装置に翻訳させ、その際に、用例句Ｅ_iが用いられる
回数Ｆ（Ｅ_i）をカウントする。そして、ステップＳ２
３において、事前確率Ｐ（Ｅ_i）を、例えば、式Ｐ
（Ｅ_i）＝Ｆ（Ｅ_i）／Σにしたがって更新する。但し、
Σは、Ｆ（Ｅ_i）についての、ｉを１からＮ_Eに代えての
サメーションを意味する。

【０１５８】事前確率Ｐ（Ｅ_i）を、すべての用例句Ｅ_i
について更新した後は、ステップＳ２４に進み、最大の
事前確率を与える用例句Ｅ_i(max)を検出する。そして、
ステップＳ２５に進み、その用例句Ｅ_i(max)についての
事前確率Ｐ（Ｅ_i(max)）が所定の閾値より小さいかどう
かを判定し、小さくない場合には、ステップＳ２２に戻
り、ステップＳ２２乃至Ｓ２５の処理を繰り返す。ま
た、事前確率Ｐ（Ｅ_i(max)）が所定の閾値より小さい場
合、その時点における事前確率Ｐ（Ｅ_i）を、各用例句
Ｅ_iについての事前確率として出力し、処理を終了す
る。

【０１５９】次に、コーパスデータを入手することが困
難な場合には、例えば、翻訳装置に記憶されている用例
句を用い、次のようにして事前確率Ｐ（Ｅ_i）を求める
ことも可能である。

【０１６０】即ち、事前確率Ｐ（Ｅ_i）を求める用例句
Ｅ_iを構成する単語のうち、他の用例句を構成する単語
と一致するものの数をＷ_Nと、用例句Ｅ_iが有する文法属
性のうち、他の用例が有する文法属性と一致するものの
数をＦ_Nと、それぞれ表すとすると、その用例句Ｅ_iの一
般性、あるいは他の用例に対する類似性ｓｉｍ−ｓｃｏ
ｒｅ（Ｅ_i）は、例えば、（Ｗ_N＋Ｆ_N）／（用例句Ｅ_iを
構成する単語数）で見積もることができる。この場合、
事前確率Ｐ（Ｅ_i）は、例えば、式（６）にしたがって
求めることができる。

【０１６１】

【数５】・・・（６）

【０１６２】次に、変形確率Ｐ（Ｉ｜Ｅ）は、次のよう
にして求めることができる。即ち、ユーザが、用例句Ｅ
の意味内容を表現しようとする場合、ある高い確率で、
ユーザは、用例句Ｅと一語一句変わらない表現を用い、
また、それより少し低い確率で、用例句Ｅと、少しだけ
異なる表現を用い、さらに、より低い確率で、用例Ｅと
は大きく異なる表現を用いると考えることができる。

【０１６３】従って、入力句Ｉは、ユーザにおける言語
生成過程で、用例句Ｅの表現が歪められた変異型である
とみなすことができる。そこで、用例句Ｅを変形する
（歪める）ための変形オペレータとして、以下のような
ものを導入する。

【０１６４】即ち、用例句Ｅを構成する単語に対するオ
ペレータとして、単語複写オペレータｅｃｈｏ−ｗｏｒ
ｄ（ｅｗ_m，ｉｗ_n）、単語省略オペレータｄｅｌｅｔｅ
−ｗｏｒｄ（ｅｗ_m）、単語挿入オペレータａｄｄ−ｗ
ｏｒｄ（ｉｗ_n）、および単語置換オペレータａｌｔｅ
ｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）を導入する。さらに、用
例句Ｅが有する文法属性に対するオペレータとして、文
法属性複写オペレータｅｃｈｏ−ｆｅａｔｕｒｅ（ｅｆ
_p，ｉｆ_q）、文法属性省略オペレータｄｅｌｅｔｅ−ｆ
ｅａｔｕｒｅ（ｅｆ_p）、文法属性挿入オペレータａｄ
ｄ−ｆｅａｔｕｒｅ（ｉｆ_q）、および文法属性置換オ
ペレータａｌｔｅｒ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）
を導入する。

【０１６５】ここで、単語複写オペレータｅｃｈｏ−ｗ
ｏｒｄ（ｅｗ_m，ｉｗ_n）は、用例句Ｅを構成するｍ番目
（先頭からｍ番目）の単語ｅｗ_mを、そのまま、入力句
Ｉを構成するｎ番目の単語ｉｗ_nとするオペレータであ
る。単語省略オペレータｄｅｌｅｔｅ−ｗｏｒｄ（ｅｗ
_m）は、用例句Ｅを構成するｍ番目の単語ｅｗ_mを省略
（削除）するオペレータである。単語挿入オペレータａ
ｄｄ−ｗｏｒｄ（ｉｗ_n）は、入力句Ｉを構成するｎ番
目の単語ｉｗ_nを、用例句Ｅに挿入（追加）するオペレ
ータである。単語置換オペレータａｌｔｅｒ−ｗｏｒｄ
（ｅｗ_m，ｉｗ_n）は、用例句Ｅを構成するｍ番目の単語
ｅｗ_mを、入力句Ｉを構成するｎ番目の単語ｉｗ_n（但
し、ここでは、単語ｉｗ_nは、単語ｅｗ_mと意味的には近
いが異なるものであるとする）と置換するオペレータで
ある。

【０１６６】また、文法属性複写オペレータｅｃｈｏ−
ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）は、用例句Ｅが有する
ｐ番目の文法属性ｅｆ_p（文法属性の場合、それが何番
目のものであるかは、特に、処理に影響するものではな
く、従って、文法属性の順番は、ここでは、便宜的なも
のである）を、そのまま、入力句Ｉが有するｑ番目の文
法属性ｉｆ_qとするオペレータである。文法属性省略オ
ペレータｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅｆ_p）は、
用例句Ｅが有するｐ番目の文法属性ｅｆ_pを省略するオ
ペレータである。文法属性挿入オペレータａｄｄ−ｆｅ
ａｔｕｒｅ（ｉｆ_q）は、入力句Ｉが有するｑ番目の文
法属性ｉｆ_qを、用例句Ｅに挿入するオペレータであ
る。文法属性置換オペレータａｌｔｅｒ−ｆｅａｔｕｒ
ｅ（ｅｆ_p，ｉｆ_q）は、用例句Ｅが有するｐ番目の単語
ｅｆ_pを、入力句Ｉが有するｑ番目の文法属性ｉｆ_q（但
し、ここでは、文法属性ｉｆ_qは、文法属性ｅｆ_pと意味
的には近いが異なるものであるとする）と置換するオペ
レータである。

【０１６７】いま、上述の変形オペレータまとめてを、
ｄｉｓｔｏｒｔ_zと表し、用例句Ｅに対し、Ｚ個の変形
オペレータｄｉｓｔｏｒｔ₁，ｄｉｓｔｏｒｔ₂，・・
・，ｄｉｓｔｏｒｔ_Zが適用されて得られるものが、入
力句Ｉであるとすると、入力句Ｉは、式（７）に示すよ
うに、これらの変形オペレータの集合として定義するこ
とができる。

【０１６８】 I={distort₁,distort₂,・・・,distort_Z} ・・・（７）

【０１６９】なお、用例句Ｅから入力句Ｉへの変形の仕
方は、複数存在するかもしれないが、ここでは確率性が
最も高い直接的な経路にしたがった変形だけを考慮すれ
ば充分である。

【０１７０】式（７）から、変形確率Ｐ（Ｉ｜Ｅ）は、
式（８）のように表すことができる。

【０１７１】 P(I|E)=P({distort₁,distort₂,・・・,distort_Z}|E) ・・・（８）

【０１７２】ここで、式（９）に示すように、各変形オ
ペレータは独立しているとみなすことができる。

【０１７３】

【数６】・・・（９）

【０１７４】従って、式（９）から、式（８）は、式
（１０）に示すように単純化することができ、その結
果、変形確率Ｐ（Ｉ｜Ｅ）は、式（１１）に示すように
なる。

【０１７５】

【数７】・・・（１０）

【数８】・・・（１１）

【０１７６】さらに、用例句Ｅは、単語ｅｗ_m（ｍ＝
１，２，・・・，Ｍ）、および文法属性ｅｆ_p（ｐ＝
１，２，・・・，Ｐ）の集合で表すことができるから、
式（１１）は、式（１２）に示すようになる。

【０１７７】

【数９】・・・（１２）

【０１７８】式（１２）から、変形オペレータｄｉｓｔ
ｏｒｔ_kが、単語複写オペレータｅｃｈｏ−ｗｏｒｄ
（ｅｗ_m，ｉｗ_n）、単語省略オペレータｄｅｌｅｔｅ−
ｗｏｒｄ（ｅｗ_m）、単語挿入オペレータａｄｄ−ｗｏ
ｒｄ（ｉｗ_n）、単語置換オペレータａｌｔｅｒ−ｗｏ
ｒｄ（ｅｗ_m，ｉｗ_n）、文法属性複写オペレータｅｃｈ
ｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）、文法属性省略オ
ペレータｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅｆ_p）、文
法属性挿入オペレータａｄｄ−ｆｅａｔｕｒｅ（ｉ
ｆ_q）、または文法属性置換オペレータａｌｔｅｒ−ｆ
ｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）それぞれである場合の確
率Ｐ（ｄｉｓｔｏｒｔ_k｜ｅｗ₁，ｅｗ₂，・・・，ｅ
ｗ_M；ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）がわかれば、変形
確率Ｐ（Ｉ｜Ｅ）を求めることができる。

【０１７９】ここで、各変形オペレータについては、次
のような仮定をすることができ、その結果、各変形オペ
レータについての確率Ｐ（ｄｉｓｔｏｒｔ_k｜ｅｗ₁，ｅ
ｗ₂，・・・，ｅｗ_M；ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）
は簡単化することができる。

【０１８０】即ち、単語複写オペレータｅｃｈｏ−ｗｏ
ｒｄ（ｅｗ_m，ｉｗ_n）については、用例句Ｅを構成する
ｍ番目の単語ｅｗ_mが、そのまま入力句Ｉを構成する単
語ｉｗ_nとされる確率は、それらの単語ｅｗ_m，ｉｗ_nに
のみ依存すると仮定することができる。従って、確率Ｐ
（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）｜ｅｗ₁，ｅ
ｗ₂，・・・，ｅｗ_M；ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）
は、式（１３）に示すように簡単化することができる。

【０１８１】

【数１０】・・・（１３）なお、式（１３）で示される確率は、単語ｅｗ_mが、そ
のまま入力句Ｉを構成する単語として、いわば複写され
る確率を表すから、以下、適宜、単語複写確率という。

【０１８２】単語省略オペレータｄｅｌｅｔｅ−ｗｏｒ
ｄ（ｅｗ_m）については、用例句Ｅを構成するｍ番目の
単語ｅｗ_mが省略される確率は、その単語ｅｗ_mにのみ依
存すると仮定することができる。従って、確率Ｐ（ｄｅ
ｌｅｔｅ−ｗｏｒｄ（ｅｗ_m）｜ｅｗ₁，ｅｗ₂，・・
・，ｅｗ_M；ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）は、式（１
４）に示すように簡単化することができる。

【０１８３】

【数１１】・・・（１４）なお、式（１４）で示される確率は、単語ｅｗ_mが省略
される確率を表すから、以下、適宜、単語省略確率とい
う。

【０１８４】単語挿入オペレータａｄｄ−ｗｏｒｄ（ｉ
ｗ_n）については、用例句Ｅに、入力句Ｉを構成するｎ
番目の単語ｉｗ_mが挿入される確率は、その単語ｉｗ_mに
のみ依存すると仮定することができる。従って、確率Ｐ
（ａｄｄ−ｗｏｒｄ（ｉｗ_n）｜ｅｗ₁，ｅｗ₂，・・
・，ｅｗ_M；ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）は、式（１
５）に示すように簡単化することができる。

【０１８５】

【数１２】・・・（１５）なお、式（１５）で示される確率は、単語ｉｗ_nが挿入
（付加）される確率を表すから、以下、適宜、単語挿入
確率（あるいは、単語付加確率）という。

【０１８６】単語置換オペレータａｌｔｅｒ−ｗｏｒｄ
（ｅｗ_m，ｉｗ_n）については、用例句Ｅを構成するｍ番
目の単語ｅｗ_mが、入力句Ｉを構成するｎ番目の単語ｉ
ｗ_nと置換される確率は、それらの単語ｅｗ_mおよびｉｗ
_nにのみ依存すると仮定することができる。従って、確
率Ｐ（ａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）｜ｅ
ｗ₁，ｅｗ₂，・・・，ｅｗ_M；ｅｆ₁，ｅｆ₂，・・・，
ｅｆ_P）は、式（１６）に示すように簡単化することが
できる。

【０１８７】

【数１３】・・・（１６）なお、式（１６）で示される確率は、単語ｅｗ_mが単語
ｉｗ_nと置換される確率を表すから、以下、適宜、単語
置換確率という。

【０１８８】文法属性の複写、省略、挿入、または置換
を表す文法属性複写オペレータｅｃｈｏ−ｆｅａｔｕｒ
ｅ（ｅｆ_p，ｉｆ_q）、文法属性省略オペレータｄｅｌｅ
ｔｅ−ｆｅａｔｕｒｅ（ｅｆ_p）、文法属性挿入オペレ
ータａｄｄ−ｆｅａｔｕｒｅ（ｉｆ_q）、または文法属
性置換オペレータａｌｔｅｒ−ｆｅａｔｕｒｅ（ｅ
ｆ_p，ｉｆ_q）についても、単語の複写、省略、挿入、ま
たは置換を表す単語複写オペレータｅｃｈｏ−ｗｏｒｄ
（ｅｗ_m，ｉｗ_n）、単語省略オペレータｄｅｌｅｔｅ−
ｗｏｒｄ（ｅｗ_m）、単語挿入オペレータａｄｄ−ｗｏ
ｒｄ（ｉｗ_n）、または単語置換オペレータａｌｔｅｒ
−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）における単語を、文法属性
に置き換えた場合と同様の仮定をすることができる。

【０１８９】その結果、文法属性ｅｆ_pが複写される確
率（以下、適宜、文法属性複写確率という）Ｐ（ｅｃｈ
ｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）｜ｅｗ₁，ｅｗ₂，
・・・，ｅｗ_M；ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）、文法
属性ｅｆ_pが省略される確率（以下、適宜、文法属性省
略確率という）Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅ
ｆ_p）｜ｅｗ₁，ｅｗ₂，・・・，ｅｗ_M；ｅｆ₁，ｅｆ₂，
・・・，ｅｆ_P）、文法属性ｉｆ_qが挿入される確率（以
下、適宜、文法属性挿入確率という）Ｐ（ａｄｄ−ｆｅ
ａｔｕｒｅ（ｉｆ_q）｜ｅｗ₁，ｅｗ₂，・・・，ｅｗ_M；
ｅｆ₁，ｅｆ₂，・・・，ｅｆ_P）、または文法属性ｅｆ_p
が文法属性ｉｆ_qと置換される確率（以下、適宜、文法
属性置換確率という）Ｐ（ａｌｔｅｒ−ｆｅａｔｕｒｅ
（ｅｆ_p，ｉｆ_q）｜ｅｗ₁，ｅｗ₂，・・・，ｅｗ_M；ｅ
ｆ₁，ｅｆ₂，・・・，ｅｆ_P）は、それぞれ式（１７）
乃至（２０）に示すように簡単化することができる。

【０１９０】

【数１４】・・・（１７）

【数１５】・・・（１８）

【数１６】・・・（１９）

【数１７】・・・（２０）

【０１９１】以上から、単語についての変形オペレータ
（以下、適宜、単語変形オペレータという）である単語
複写オペレータｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）、
単語省略オペレータｄｅｌｅｔｅ−ｗｏｒｄ（ｅ
ｗ_m）、単語挿入オペレータａｄｄ−ｗｏｒｄ（ｉ
ｗ_n）、および単語置換オペレータａｌｔｅｒ−ｗｏｒ
ｄ（ｅｗ_m，ｉｗ_n）をまとめて、ｄｉｓｔｏｒｔ−ｗｏ
ｒｄ_x（ｅｗ_m，ｉｗ_n）と表すとともに、文法属性につ
いての変形オペレータ（以下、適宜、文法属性変形オペ
レータという）である文法属性複写オペレータｅｃｈｏ
−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）、文法属性省略オペ
レータｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅｆ_p）、文法
属性挿入オペレータａｄｄ−ｆｅａｔｕｒｅ（ｉ
ｆ_q）、および文法属性置換オペレータａｌｔｅｒ−ｆ
ｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q）をまとめて、ｄｉｓｔｏ
ｒｔ−ｆｅａｔｕｒｅ_y（ｅｆ_p，ｉｆ_q）と表すとする
と、式（１１）で表される変形確率Ｐ（Ｉ｜Ｅ）は、式
（２１）に示すように、単語変形オペレータｄｉｓｔｏ
ｒｔ−ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n）による変形確率（以
下、適宜、単語変形確率という）Ｐ（ｄｉｓｔｏｒｔ−
ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n））の積と、文法属性変形オ
ペレータｄｉｓｔｏｒｔ−ｆｅａｔｕｒｅ_y（ｅｆ_p，ｉ
ｆ_q）による変形確率（以下、適宜、文法属性変形確率
という）Ｐ（ｄｉｓｔｏｒｔ−ｆｅａｔｕｒｅ_y（ｅ
ｆ_p，ｉｆ_q））の積とで表すことができる。

【０１９２】

【数１８】・・・（２１）但し、ＸまたはＹは、適用される単語変形オペレータま
たは文法属性変形オペレータそれぞれの総数を表し、Ｘ
＋Ｙ＝Ｚ（式（１１））である。

【０１９３】次に、単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒ
ｄ（ｅｗ_m，ｉｗ_n））、単語省略確率Ｐ（ｄｅｌｅｔｅ
−ｗｏｒｄ（ｅｗ_m））、単語挿入確率Ｐ（ａｄｄ−ｗ
ｏｒｄ（ｉｗ_n））、単語置換確率Ｐ（ａｌｔｅｒ−ｗ
ｏｒｄ（ｅｗ_m，ｉｗ_n））、文法属性複写確率Ｐ（ｅｃ
ｈｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））、文法属性省
略確率Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅ
ｆ_p））、文法属性挿入確率Ｐ（ａｄｄ−ｆｅａｔｕｒ
ｅ（ｉｆ_q）｜）、または文法属性置換確率Ｐ（ａｌｔ
ｅｒ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））それぞれの算
出方法について説明する。

【０１９４】まず、単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒ
ｄ（ｅｗ_m，ｉｗ_n））、単語省略確率Ｐ（ｄｅｌｅｔｅ
−ｗｏｒｄ（ｅｗ_m））、および単語挿入確率Ｐ（ａｄ
ｄ−ｗｏｒｄ（ｉｗ_n））は、人間の言語生成行動を反
映するものであるとみなすことができる。即ち、ある種
の単語は、他の単語よりも、複写、省略、または挿入さ
れる確率が高かったり、また、低かったりする。従っ
て、翻訳装置が適用されるドメインのコーパスデータが
入手可能な場合には、単語が複写、省略、置換される確
率分布をコーパスデータから算出し、これにより、単語
複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））、
単語省略確率Ｐ（ｄｅｌｅｔｅ−ｗｏｒｄ（ｅ
ｗ_m））、または単語挿入確率Ｐ（ａｄｄ−ｗｏｒｄ
（ｉｗ_n））それぞれを求めることができる。

【０１９５】一方、コーパスデータを入手することが困
難な場合には、言語生成中における各単語の動向（単語
の取扱いの傾向（例えば、そのまま用いられ易いとか、
省略、または挿入され易いなどの傾向））に基づいて、
単語を、幾つかのグループに分類し、各グループごと
に、単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉ
ｗ_n））、単語省略確率Ｐ（ｄｅｌｅｔｅ−ｗｏｒｄ
（ｅｗ_m））、または単語挿入確率Ｐ（ａｄｄ−ｗｏｒ
ｄ（ｉｗ_n））それぞれを与えるようにすることができ
る。

【０１９６】本実施の形態では、単語を、強自立語（例
えば、動詞や名詞など）、軽自立語（例えば、形容詞
や、一部の副詞（例えば、「また」など）など）、機能
語（例えば、助詞や接続詞など）、および修飾語（例え
ば、程度を表す副詞（例えば、「とても」など）など）
（付属語も含む）の４つのグループに分類し、単語変形
オペレータが適用される単語が、いずれのグループに属
するかによって、単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ
（ｅｗ_m，ｉｗ_n））、単語省略確率Ｐ（ｄｅｌｅｔｅ−
ｗｏｒｄ（ｅｗ_m））、または単語挿入確率Ｐ（ａｄｄ
−ｗｏｒｄ（ｉｗ_n））として、式（２２）乃至（２
４）それぞれに示すような定数を与えることとする。

【０１９７】

【数１９】・・・（２２）なお、ｅｃｈｏ−ｓｔｒｏｎｇ−ｃｏｎｔｅｎｔ，ｅｃ
ｈｏ−ｌｉｇｈｔ−ｃｏｎｔｅｎｔ，ｅｃｈｏ−ｇｒａ
ｍｍａｔｉｃａｌ−ｆｕｎｃｔｉｏｎ，ｅｃｈｏ−ｍｏ
ｄｉｆｉｅｒは、それぞれ０以上１以下の所定の定数で
ある。また、単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅ
ｗ_m，ｉｗ_n））が式（２２）で与えられるのは、単語ｅ
ｗ_mとｉｗ_nとが一致している場合で、これらが一致して
いない場合には０とされる（このことは、単語複写確率
に対応する文法属性複写確率についても同様である）。

【０１９８】

【数２０】・・・（２３）なお、ｄｅｌｅｔｅ−ｓｔｒｏｎｇ−ｃｏｎｔｅｎｔ，
ｄｅｌｅｔｅ−ｌｉｇｈｔ−ｃｏｎｔｅｎｔ，ｄｅｌｅ
ｔｅ−ｇｒａｍｍａｔｉｃａｌ−ｆｕｎｃｔｉｏｎ，ｄ
ｅｌｅｔｅ−ｍｏｄｉｆｉｅｒは、それぞれ０以上１以
下の所定の定数である。

【０１９９】

【数２１】・・・（２４）なお、ａｄｄ−ｓｔｒｏｎｇ−ｃｏｎｔｅｎｔ，ａｄｄ
−ｌｉｇｈｔ−ｃｏｎｔｅｎｔ，ａｄｄ−ｇｒａｍｍａ
ｔｉｃａｌ−ｆｕｎｃｔｉｏｎ，ａｄｄ−ｍｏｄｉｆｉ
ｅｒは、それぞれ０以上１以下の所定の定数である。

【０２００】なお、本実施の形態においては、同様にし
て、文法属性変形確率、即ち、文法属性複写確率Ｐ（ｅ
ｃｈｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））、文法属性
省略確率Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅ
ｆ_p））、文法属性挿入確率Ｐ（ａｄｄ−ｆｅａｔｕｒ
ｅ（ｉｆ_q）｜）、および文法属性置換確率Ｐ（ａｌｔ
ｅｒ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））も、定数で与
えられるものとする。

【０２０１】次に、単語置換確率Ｐ（ａｌｔｅｒ−ｗｏ
ｒｄ（ｅｗ_m，ｉｗ_n））についてであるが、これは、単
語ｅｗ_mとｉｗ_nとの意味的近さに基づいて算出すること
ができる。即ち、単語ｉｗ_nが単語ｅｗ_mと同義語であれ
ば、高確率を、単語ｉｗ_nが単語ｅｗ_mと意味的に似てい
れば、それより多少低めの確率を、単語ｉｗ_nが単語ｅ
ｗ_mと意味的に無関係であれば、より低確率を、それぞ
れ単語置換確率Ｐ（ａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉ
ｗ_n））として与えるようにすれば良い。

【０２０２】単語ｅｗ_mとｉｗ_nとについての、このよう
な確率分布は、コーパスデータを用いて求めることがで
きる。即ち、文脈類似性を利用し、コーパスデータの中
の類似する文脈で、２つの単語が使われている場合は、
その２つの単語どうし類似性は高いとみなし、また、異
なる文脈の中で使われている場合には、その２つの単語
どうしの類似性は低いとみなす。そして、この類似性が
高い２つの単語については、高い単語置換確率を与える
ようにすれば良い。

【０２０３】一方、コーパスデータの入手が困難な場合
には、例えば、図２に示したようなシソーラスを用いて
単語置換確率を計算することができる。

【０２０４】ここで、シソーラスにおいては、２つの単
語間の意味的距離は、その２つの単語の共通の概念（親
ノード）の情報含有量として反映される。即ち、共通の
概念が、例えば「もの」などのように非常に一般的な概
念である場合、その概念からは、それに包含される具体
的な単語に関する情報はほとんど得ることができない
が、共通の概念が、例えば「エンジンの付いた車両」の
ようにかなり限定的な概念である場合には、その概念か
ら、そこに包含される具体的な単語に関して、多くの情
報を得ることができる。言い換えれば、ある概念（シソ
ーラスにおけるノード）の情報含有量は、その概念に包
含される単語数（number-dominated）に反比例する。

【０２０５】従って、単語置換確率Ｐ（ａｌｔｅｒ−ｗ
ｏｒｄ（ｅｗ_m，ｉｗ_n））は、２つの単語ｅｗ_mとｉｗ_n
との共通の概念の情報含有量、即ち、シソーラスにおい
て、その概念に包含される単語の数に基づいて、例え
ば、式（２５）にしたがって求めることができる。

【０２０６】

【数２２】・・・（２５）なお、上式において、Ｋは、次式で定義される。

【数２３】・・・（２６）但し、Ｃ（ｅｗ_m，ｉｗ_n）は、単語ｅｗ_mとｉｗ_nとの共
通の概念を表し、ｎｕｍｂｅｒ−ｄｏｍｉｎａｔｅｄ
（Ｃ（ｅｗ_m，ｉｗ_n））は、概念Ｃ（ｅｗ_m，ｉｗ_n）に
包含される単語（上位の概念として、概念Ｃ（ｅｗ_m，
ｉｗ_n）を有する単語）の数を表す。また、Ｖｏｃａｂ
は、シソーラスにおける単語の集合を意味する。従っ
て、式（２６）の右辺の最初または２番目のΣは、それ
ぞれ、単語ｅｗ_mまたはｉｗ_nを、シソーラス中の単語に
順次代えてのサメーションを意味する。

【０２０７】以上のような２つの単語ｅｗ_mとｉｗ_nとの
共通の概念の情報含有量に基づいて、それらの距離を求
める手法によれば、シソーラスの構造によらず、単語間
の距離（相対的な距離）を、正確に求めることができ
る。即ち、従来のように、シソーラスが、規則的に構成
されておらず、また、概念間の距離が異なっていても良
い。さらに、単語の分類の細かいシソーラスに対して
も、また、粗いシソーラスに対しても、対応することが
できる。また、一部において、細かいまたは粗い分類が
なされているシソーラスにも、対応することができる。
さらに、シソーラスは、ある特定のドメイン専用のもの
であっても、また、一般的なものであっても良い。

【０２０８】ところで、変形確率Ｐ（Ｉ｜Ｅ）は、式
（２１）に示したように、単語変形確率Ｐ（ｄｉｓｔｏ
ｒｔ−ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n））の積と、文法属性
変形確率Ｐ（ｄｉｓｔｏｒｔ−ｗｏｒｄ_y（ｅｆ_p，ｉｆ
_q））の積とで求めることができる。この単語変形確率
Ｐ（ｄｉｓｔｏｒｔ−ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n））の
積、または文法属性変形確率Ｐ（ｄｉｓｔｏｒｔ−ｗｏ
ｒｄ_y（ｅｆ_p，ｉｆ_q））の積のうち、文法属性変形確
率Ｐ（ｄｉｓｔｏｒｔ−ｗｏｒｄ_y（ｅｆ_p，ｉｆ_q））
の積は、上述したようにして得られる文法属性複写確率
Ｐ（ｅｃｈｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））、文
法属性省略確率Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅ
ｆ_p））、文法属性挿入確率Ｐ（ａｄｄ−ｆｅａｔｕｒ
ｅ（ｉｆ_q）｜）、文法属性置換確率Ｐ（ａｌｔｅｒ−
ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））の積として、比較的
単純に求めることができる。

【０２０９】即ち、文法属性については、入力句の文法
属性（以下、適宜、入力属性という）と、用例句との文
法属性（以下、適宜、用例属性という）とを比較し、入
力属性と同一の用例属性、入力属性にない用例属性、用
例属性にない入力属性、および入力属性と置換可能な用
例属性を検出する。そして、入力属性と同一の用例属
性、入力属性にない用例属性、用例属性にない入力属
性、または入力属性と置換可能な用例属性が存在する場
合には、それぞれの文法属性についての文法属性複写確
率Ｐ（ｅｃｈｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））、
文法属性省略確率Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ
（ｅｆ_p））、文法属性挿入確率Ｐ（ａｄｄ−ｆｅａｔ
ｕｒｅ（ｉｆ_q）｜）、または文法属性置換確率Ｐ（ａ
ｌｔｅｒ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））を求め
（但し、本実施の形態では、これらは、上述したよう
に、すべて定数で与えられるので、計算をする必要はな
い）、これらの積を計算することにより、文法属性変形
確率Ｐ（ｄｉｓｔｏｒｔ−ｗｏｒｄ_y（ｅｆ_p，ｉ
ｆ_q））の積を得ることができる。

【０２１０】具体的には、例えば、入力句が「予約をし
たいのですが」で、その文法属性が（desiderative +）
（extended-predicate +）（s-part GA）（formal +）
であり、用例句が「予約をしていただきたいのですが」
で、その文法属性が（gerund-suffix ITADAKU）（desid
erative +）（extended-predicate +）（s-part GA）
（formal +）であった場合には、文法属性（desiderati
ve +），（extended-predicate +），（s-part GA）、
および（formal +）が、入力属性と同一の用例属性とし
て、文法属性（gerund-suffix ITADAKU）が、入力属性
にない用例属性として検出される。

【０２１１】この場合、文法属性（desiderative +），
（extended-predicate +），（s-part GA）、または（f
ormal +）それぞれについての文法属性複写確率Ｐ（ｅ
ｃｈｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））と、文法属
性（gerund-suffix ITADAKU）についての文法属性省略
確率Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅｆ_p））と
の積を計算することで、文法属性変形確率Ｐ（ｄｉｓｔ
ｏｒｔ−ｗｏｒｄ_y（ｅｆ_p，ｉｆ_q））の積を得ること
ができる。

【０２１２】一方、単語変形確率Ｐ（ｄｉｓｔｏｒｔ−
ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n））の積を求めるにあたって
は、数ある変形経路の中から、用例句Ｅから入力句Ｉへ
の、いわば最も直接的な変形経路を見つけ出す必要があ
る。

【０２１３】即ち、例えば、用例句Ｅとして、「ここに
３時に電話する」が、訳文「call here at 3 o'clock」
と対応付けられており、この用例句Ｅが、入力句「レス
トランに電話をする」の翻訳に用いられる場合、例え
ば、次のような２つの変形経路（変形方法）が考えられ
る。

【０２１４】第１に、用例句Ｅ「ここに３時に電話す
る」について、その先頭の単語から、「ここ」を省略
し、「に」を省略し、「３時」を「レストラン」に置換
し、「に」を複写し、「電話」を複写し、「を」を挿入
し、「する」を複写すると、入力句「レストランに電話
をする」が得られる。従って、この場合、訳文「call h
ere at 3 o'clock」について、「ここに」に対応する
「here」を省略し、「３時」に対応する「3 o'clock」
を、「レストラン」に対応する「the restaurant」に置
換した訳文「call at the restaurant」が得られる。

【０２１５】第２に、用例句Ｅ「ここに３時に電話す
る」について、その先頭の単語から、「ここ」を「レス
トラン」に置換し、「に」を複写し、「３時」を省略
し、「に」を省略し、「電話」を複写し、「を」を挿入
し、「する」を複写すると、入力句「レストランに電話
をする」が得られる。従って、この場合、訳文「call h
ere at 3 o'clock」について、「ここに」に対応する
「here」を、「レストランに」に対応する「the restau
rant」に置換し、「３時に」に対応する「at 3 o'cloc
k」を省略した訳文「call the restaurant」が得られ
る。

【０２１６】この場合、第２の変形経路による訳文「ca
ll the restaurant」が正しく、従って、単語変形確率
Ｐ（ｄｉｓｔｏｒｔ−ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n））の
積を求めるにあたっては、第２の変形経路のような、い
わば最も直接的な変形経路（以下、適宜、最適経路とい
う）を見つけ出す必要がある。

【０２１７】このためには、用例句Ｅと入力句Ｉとの長
さが異なっている場合でも、即ち、用例句Ｅまたは入力
句Ｉそれぞれを構成する単語数が異なっている場合で
も、対応する単語どうしを認識し、用例句Ｅと入力句Ｉ
との最良の対応関係（アラインメント）を見つけ出して
から、用例句Ｅから入力句Ｉへの変形に適用されるべき
最も確からしい変形オペレータ（単語変形オペレータ）
の集合を見つけることが必要である。

【０２１８】いま、単語変形オペレータの集合をＤｉｓ
ｔｏｒｔ（＝｛ｄｉｓｔｏｒｔ−ｗｏｒｄ₁（ｅｗ_m，ｉ
ｗ_n），ｄｉｓｔｏｒｔ−ｗｏｒｄ₂（ｅｗ_m，ｉｗ_n），
・・・，ｄｉｓｔｏｒｔ−ｗｏｒｄ_X（ｅｗ_m，ｉ
ｗ_n）｝）と表すとすると、用例句Ｅから入力句Ｉへの
変形に適用されるべき最も確からしい単語変形オペレー
タ（以下、適宜、最適単語変形オペレータという）の集
合Ｄｉｓｔｏｒｔ_maxは、式（２７）により求めること
ができる。

【０２１９】

【数２４】・・・（２７）但し、式（２７）の右辺は、［］内の値が最大となるＤ
ｉｓｔｏｒｔを求める演算を意味する。

【０２２０】ここでは、最適単語変形オペレータの集合
を、例えば、ＤＰ（Dynamic Programming）（ダイナミ
ックプログラミング）を用いて求める。即ち、まず、確
率Ｐ（Ｄｉｓｔｏｒｔ｜Ｅ，Ｉ）から、ＤＰにおける距
離を求めるため、その負対数−ｌｏｇ（Ｐ（Ｄｉｓｔｏ
ｒｔ｜Ｅ，Ｉ））を考える。いま、Ｄ＝−ｌｏｇ（Ｐ
（Ｄｉｓｔｏｒｔ｜Ｅ，Ｉ））とおくと、単語変形オペ
レータの集合Ｄｉｓｔｏｒｔを構成する各オペレータは
独立していると仮定することで、Ｄは、式（２８）に示
すように単純化することができる。

【０２２１】

【数２５】・・・（２８）

【０２２２】そして、単語変形オペレータが、入力句Ｉ
を構成する単語のうち、それが直接影響を及ぼす単語以
外の単語とは独立していると仮定すると、式（２８）
は、式（２９）に示すように、さらに単純化することが
できる。

【０２２３】

【数２６】・・・（２９）

【０２２４】さらに、式（２９）を、個々の変形オペレ
ータについて分割することにより、式（３０）が得られ
る。

【０２２５】

【数２７】・・・（３０）

【０２２６】式（３０）における右辺の−ｌｏｇ（Ｐ
（ｄｉｓｔｏｒｔ−ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n）））
は、用例句のｍ番目の単語ｅｗ_mと、入力句のｎ番目の
単語ｉｗ_nとを対応させたときの、単語ｅｗ_mとｉｗ_nと
の間の距離であり、これは、ダイナミックプログラミン
グ方程式で用いられる個々のペナルティ（パスに対する
重み）（コスト）に直接対応しているとみることができ
る。従って、ｄｉｓｔｏｒｔ−ｗｏｒｄ_x（ｅｗ_m，ｉｗ
_n）を、単語複写オペレータｅｃｈｏ−ｗｏｒｄ（ｅ
ｗ_m，ｉｗ_n）、単語省略オペレータｄｅｌｅｔｅ−ｗｏ
ｒｄ（ｅｗ_m）、単語挿入オペレータａｄｄ−ｗｏｒｄ
（ｉｗ_n）、または単語置換オペレータａｌｔｅｒ−ｗ
ｏｒｄ（ｅｗ_m，ｉｗ_n）に書き換え、用例句のｍ番目の
単語ｅｗ_mと、入力句のｎ番目の単語ｉｗ_nとまでを対応
させたときの距離の総和（累積距離）をＧ（ｍ，ｎ）と
表すとすると、この累積距離Ｇ（ｍ，ｎ）は、式（３
１）に示す漸化式にしたがい、回帰的に求めることがで
きる。

【０２２７】

【数２８】・・・（３１）なお、初期値は、適当な値を与えるものとする。

【０２２８】式（３１）を、例えば、ｍ＝Ｍとなるまで
計算することにより、入力句Ｉと用例句Ｅとの距離（最
短距離）を求めることができ、そのとき得られたパス
（ＤＰパス）が、入力句Ｉと用例句Ｅとの間の最良の
（最適な）対応関係、即ち、最適経路を表すことにな
る。そして、その最適経路（対応関係）にしたがって、
用例句Ｅを、入力句Ｉと一致するように変形する単語変
形オペレータの集合が、最適単語変形オペレータの集合
ということになる。

【０２２９】以上のようにすることで、用例句Ｅと入力
句Ｉとの長さが異なっている場合であっても、最適単語
変形オペレータの集合を求めることができる。

【０２３０】なお、確率Ｐ（Ｄｉｓｔｏｒｔ｜Ｅ，Ｉ）
は、入力句Ｉと用例句Ｅとを照合し、両者の表現上の差
異をなくすために単語変形オペレータの集合Ｄｉｓｔｏ
ｒｔが用いられる確率を表すから、この確率により規定
される確率モデルは、確率的表現照合モデルということ
ができ、さらに、入力句Ｉと用例句Ｅとの距離は、この
確率的表現照合モデルに基づいて求められるから、確率
的表現照合モデルに基づく距離ということができる。

【０２３１】以上のようにして最適単語変形オペレータ
の集合を求めた後は、単語変形確率Ｐ（ｄｉｓｔｏｒｔ
−ｗｏｒｄ_x（ｅｗ_m，ｉｗ_n））の積を求めることがで
き、これと、文法属性変形確率Ｐ（ｄｉｓｔｏｒｔ−ｗ
ｏｒｄ_y（ｅｆ_p，ｉｆ_q））の積から、式（２１）にし
たがって、変形確率Ｐ（Ｉ｜Ｅ）を求めることができ
る。そして、この変形確率Ｐ（Ｉ｜Ｅ）と、事前確率Ｐ
（Ｅ）との積を計算することで、翻訳適正率（Ｐ（Ｉ｜
Ｅ）Ｐ（Ｅ））を求めることができ、この翻訳適正率を
最大にする用例句Ｅが、入力句Ｉに最も類似する用例句
ということになる。

【０２３２】変換部７では、以上のようにして、入力句
Ｉに最も類似する用例句Ｅが検出される。即ち、事前確
率Ｐ（Ｅ）または変形確率Ｐ（Ｉ｜Ｅ）によりそれぞれ
規定される確率モデルである事前確率モデルまたは変形
確率モデルを用いて、入力句Ｉに最も類似する用例句Ｅ
が検出される。この場合、変形確率モデルを用いること
により、既に用意されている用例句に対して、表層上の
バリエーションや、いわゆる話し言葉における格助詞や
名詞句などの省略、言い淀みなどのある用例句をむやみ
に追加しなくても、入力句を翻訳するのに最適な用例句
を検出することができ、その結果、翻訳の質を向上させ
ることができる。

【０２３３】次に、図８のフローチャートを参照して、
変換部７における、入力句Ｉに最も類似する用例句Ｅの
検出処理について、さらに説明する。なお、事前確率Ｐ
（Ｅ）は、用例句Ｅに対応付けられて、名詞句対訳用例
記憶部８、動詞句対訳用例記憶部９、およびその他対訳
用例記憶部１０に記憶されているものとする。また、定
数で与えられる単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ
（ｅｗ_m，ｉｗ_n））、単語省略確率Ｐ（ｄｅｌｅｔｅ−
ｗｏｒｄ（ｅｗ_m））、および単語挿入確率Ｐ（ａｄｄ
−ｗｏｒｄ（ｉｗ_n））、並びに文法属性複写確率Ｐ
（ｅｃｈｏ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））、文法
属性省略確率Ｐ（ｄｅｌｅｔｅ−ｆｅａｔｕｒｅ（ｅｆ
_p））、文法属性挿入確率Ｐ（ａｄｄ−ｆｅａｔｕｒｅ
（ｉｆ_q）｜）、および文法属性置換確率Ｐ（ａｌｔｅ
ｒ−ｆｅａｔｕｒｅ（ｅｆ_p，ｉｆ_q））は、変換部７が
内蔵するメモリに記憶されているものとする。さらに、
ここでは、入力句として、例えば名詞句が、変換部７に
入力されたものとし、従って、名詞句対訳用例記憶部８
に記憶されている用例句のみを対象として処理が行われ
るものとする。但し、入力句として、動詞句またはその
他の句が、変換部７に入力された場合には、処理の対象
となる用例句が、動詞句対訳用例記憶部９またはその他
対訳用例記憶部１０に記憶されているものとなるだけ
で、処理方法は、以下説明する名詞句における場合と同
様である。

【０２３４】変換部７は、入力句Ｉ（ここでは、上述し
たように名詞句とする）を受信すると、まず、ステップ
Ｓ３１において、名詞句対訳用例記憶部８から、用例句
（名詞句）Ｅを読み出す（以下、適宜、この読み出され
た用例句Ｅを、注目用例句という）。さらに、変換部７
は、ステップＳ３２において、入力句Ｉに対する注目用
例句Ｅの変形確率Ｐ（Ｉ｜Ｅ）を計算し、ステップＳ３
３に進む。ステップＳ３３では、変換部７において、注
目用例句Ｅに対応付けられている事前確率Ｐ（Ｅ）が、
名詞句対訳用例記憶部８から読み出され、それと、ステ
ップＳ３２で計算された変形確率Ｐ（Ｉ｜Ｅ）とが乗算
される。これにより、入力句Ｉに対する注目用例句Ｅの
翻訳適正率が求められる。

【０２３５】翻訳適正率が求められた後は、ステップＳ
３４に進み、名詞句対訳用例記憶部８に記憶されている
すべての用例句を対象に、翻訳適正率の計算が行われた
かどうかが、変換部７によって判定される。ステップＳ
３４において、名詞句対訳用例記憶部８に記憶されてい
るすべての用例句を対象に、翻訳適正率の計算が、まだ
行われていないと判定された場合、ステップＳ３１に戻
り、名詞句対訳用例記憶部８から、まだ翻訳適正率を計
算していない用例句Ｅが読み出され、これを、新たな注
目用例句Ｅとして、ステップＳ３２以下の処理を繰り返
す。

【０２３６】一方、ステップＳ３４において、名詞句対
訳用例記憶部８に記憶されているすべての用例句を対象
に、翻訳適正率の計算が行われたと判定された場合、ス
テップＳ３５に進み、変換部７において、入力句Ｉに対
して、最大の翻訳適正率を与える用例が検出され、処理
を終了する。

【０２３７】次に、図８のステップＳ３２の変形確率の
計算処理について、図９および図１０のフローチャート
を参照して説明する。

【０２３８】まず、図９は、変形確率のうちの文法属性
変形確率の計算処理を説明するフローチャートである。
変換部７は、まず最初に、ステップＳ４１において、入
力句Ｉと注目用例句Ｅとを比較し、文法属性複写確率、
文法属性変形確率、文法属性挿入確率、文法属性置換確
率を求める。そして、ステップＳ４２において、変換部
７は、これらを乗算することにより、文法属性変形確率
を求め、処理を終了する。

【０２３９】次に、図１０は、変形確率のうちの単語変
形確率の計算処理を説明するフローチャートである。変
換部７は、まず最初に、ステップＳ５１において、式
（３１）にしたがい、入力句Ｉと注目用例句Ｅとの間の
累積距離Ｇ（ｍ，ｎ）を求め、ステップＳ５２に進み、
ｍがＭ（注目用例句Ｅを構成する単語数）未満であるか
どうかを判定する。ステップＳ５２に進み、ｍがＭ未満
であると判定された場合、ステップＳ５１に戻り、変換
部７は、ｍを増加させ、ｎを変えながら、式（３１）を
計算する。そして、ステップＳ５２において、ｍがＭ未
満でないと判定された場合、即ち、ｍがＭに等しい場
合、累積距離Ｇ（Ｍ，ｎ）が得られたときのパス、即
ち、最適経路が検出され、ステップＳ５３に進む。

【０２４０】ステップＳ５３では、変換部７において、
得られた最適経路にしたがって、単語変形確率が計算さ
れる。即ち、単語複写確率、単語省略確率、単語挿入確
率、単語置換確率が求められ、これらを乗算すること
で、単語変形確率が求められる。なお、変換部７は、単
語置換確率については、類似度計算部１１を制御するこ
とにより、式（２５）にしたがって算出させるようにな
されている。即ち、類似度計算部１１は、シソーラス記
憶部１２に記憶されているシソーラスにおいて、入力句
Ｉを構成するある単語と、注目用例句Ｅを構成するある
単語との共通の概念に包含される単語の数を求め、その
単語数に基づいて、２つの単語間の意味的な類似性を表
す単語類似度、即ち、式（２５）を計算することにより
得られる単語置換確率を求めるようになされている。

【０２４１】次に、図１１は、本発明を適用した翻訳装
置の他の実施の形態の構成を示している。なお、図中、
図１における場合と対応する部分については、同一の符
号を付してあり、以下では、その説明は、適宜省略す
る。即ち、この翻訳装置は、変換部７がキャッシュ７Ａ
を内蔵している他は、図１における場合と基本的に同様
に構成されている。

【０２４２】キャッシュ７Ａは、後述する仮省略単語お
よび仮付加単語を一時記憶するようになされている。な
お、キャッシュ７Ａは、ＣＰＵとメインメモリとの間に
設けられるキャッシュメモリ（cache memory）のよう
に、情報を一時記憶することから、「キャッシュ」と呼
んでいるだけであり、一般的なキャッシュメモリのよう
に、高速なものである必要は、必ずしもない。

【０２４３】ここで、上述の場合においては、用例句Ｅ
を構成する単語に対する変形オペレータとして、単語複
写オペレータｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）、単
語省略オペレータｄｅｌｅｔｅ−ｗｏｒｄ（ｅｗ_m）、
単語挿入オペレータａｄｄ−ｗｏｒｄ（ｉｗ_n）、およ
び単語置換オペレータａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，
ｉｗ_n）を用いたが、この４つのオペレータでは、用例
句Ｅを構成する単語が、そのまま配置位置だけを変える
ことにより、入力句Ｉに変形される場合（例えば、用例
句Ｅが「私はみかんを食べたい」である場合に、「みか
んをわたしは食べたい」という入力句Ｉに変形すると
き）、および用例句Ｅを構成する単語が、入力句Ｉを構
成する単語と置換され、さらにその配置位置を変えるこ
とにより、入力句Ｉに変形される場合（例えば、用例句
Ｅが「私はみかんを食べたい」である場合に、「りんご
をわたしは食べたい」という入力句Ｉに変形するとき）
に対処するのが困難である。

【０２４４】また、用例句Ｅを構成する単語に、入力句
Ｉを構成する単語のうちの修飾語として使用されている
ものが付加された複合語（例えば、複合名詞など）が、
入力句Ｉに含まれている場合（例えば、用例句Ｅが「電
話を見つける」であるのに対して、入力句Ｉが「公衆電
話を見つける」である場合）や、用例句Ｅを構成する単
語を、入力句Ｉを構成する単語と置換したものに、その
入力句Ｉを構成する単語のうちの修飾語として使用され
ているものが付加された複合語が、入力句Ｉに含まれて
いる場合（例えば、用例句Ｅが「電話を見つける」であ
るのに対して、入力句Ｉが「公衆トイレを見つける」で
ある場合）、用例句Ｅを構成する単語と、入力句Ｉを構
成する複合語とを対応付ける必要があることがあるが
（上述の例では、「電話」と「公衆電話」や、「電話」
と「公衆トイレ」）、このようなことを行うのも、上述
の４つのオペレータでは困難である。

【０２４５】そこで、用例句Ｅを構成する単語ｅｗ_mを
真に省略する単語省略オペレータ（その時点で、省略を
確定してしまうオペレータ）ｄｅｌｅｔｅ−ｗｏｒｄ
（ｅｗ_m）に代えて、その単語ｅｗ_mを仮に省略するオペ
レータである仮省略オペレータを導入する。この仮省略
オペレータは、仮に省略する単語（以下、適宜、仮省略
単語という）ｅｗ_mを、キャッシュ７Ａに一時退避（記
憶）させるので、ｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ
（ｅｗ_m）と記述する。

【０２４６】また、入力句Ｉを構成する単語ｉｗ_nを、
用例句Ｅに真に挿入する単語挿入オペレータ（その時点
で、挿入を確定してしまう）ａｄｄ−ｗｏｒｄ（ｉ
ｗ_n）に代えて、その単語ｉｗ_nを仮に用例句Ｅに挿入す
るオペレータである仮挿入オペレータを導入する。この
仮挿入オペレータは、仮に挿入する単語（以下、適宜、
仮挿入単語という）ｉｗ_nを、キャッシュ７Ａに一時退
避させるので、ｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉ
ｗ_n）と記述する。

【０２４７】さらに、用例句Ｅを構成する単語ｅｗ
_mを、入力句Ｉを構成する単語のうち、単語ｅｗ_mと対応
させている単語以外の単語ｉｗ_nとして、そのまま複写
し、若しくはそのような単語ｉｗ_nと置換するオペレー
タ、即ち、用例句Ｅを構成する単語の配置位置だけを変
えたり、用例句Ｅを構成する単語を入力句Ｉを構成する
単語と置換し、その配置位置を変えるオペレータである
スクランブルオペレータｓｃｒａｍｂｌｅ（ｅｗ_m，ｉ
ｗ_n）を導入する。

【０２４８】また、入力句Ｉを構成する連続する２つの
単語ｉｗ_n-1とｉｗ_nとが、それぞれ修飾語または被修飾
語であり、これらが複合語を構成しているとするオペレ
ータである複合オペレータｃｏｍｐｏｕｎｄ（ｉ
ｗ_n-1，ｉｗ_n）を導入する。この場合、用例句Ｅを構成
する単語ｅｗ_mを、入力句Ｉを構成する単語ｉｗ_nとして
そのまま複写し、その１つ前の単語ｉｗ_n-1と複合語を
構成させるのは、単語複写オペレータｅｃｈｏ−ｗｏｒ
ｄ（ｅｗ_m，ｉｗ_n）と、複合オペレータｃｏｍｐｏｕｎ
ｄ（ｉｗ_n-1，ｉｗ_n）との組合せ（以下、適宜、複写／
複合オペレータという）で表すことができる。また、用
例句Ｅを構成する単語ｅｗ_mを、入力句Ｉを構成する単
語ｉｗ_nに置換し、その１つ前の単語ｉｗ_n-1と複合語を
構成させるのは、単語置換オペレータａｌｔｅｒ−ｗｏ
ｒｄ（ｅｗ_m，ｉｗ_n）と、複合オペレータｃｏｍｐｏｕ
ｎｄ（ｉｗ_n-1，ｉｗ_n）との組合せ（以下、適宜、置換
／複合オペレータという）で表すことができる。

【０２４９】図１１の実施の形態では、用例句Ｅを構成
する単語に対するオペレータとして、単語複写オペレー
タｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）、単語置換オペ
レータａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）、仮省略
オペレータｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅ
ｗ_m）、仮挿入オペレータｃａｃｈｅ−ａｓ−ａｄｄｅ
ｄ（ｉｗ_n）、スクランブルオペレータｓｃｒａｍｂｌ
ｅ（ｅｗ_m，ｉｗ_n）、および複合オペレータｃｏｍｐｏ
ｕｎｄ（ｉｗ_n-1，ｉｗ_n）の６つのオペレータを採用す
る。但し、この６つのオペレータのうち、複合オペレー
タｃｏｍｐｏｕｎｄ（ｉｗ_n-1，ｉｗ_n）だけは単独で用
いられず、上述のように、単語複写オペレータｅｃｈｏ
−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）または単語置換オペレータ
ａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）それぞれとの組
合せで、複写／複合オペレータまたは置換／複合オペレ
ータとして用いられる。

【０２５０】なお、新たに導入したオペレータのうち、
仮省略オペレータｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ
（ｅｗ_m）または仮挿入オペレータｃａｃｈｅ−ａｓ−
ａｄｄｅｄ（ｉｗ_n）は、それぞれ、単語省略オペレー
タｄｅｌｅｔｅ−ｗｏｒｄ（ｅｗ_m）または単語挿入オ
ペレータａｄｄ−ｗｏｒｄ（ｉｗ_n）と同様に使用する
ことができるが（但し、単語をキャッシュ７Ａに記憶さ
せることにより、その単語を仮に省略または挿入する点
で、単語の省略または挿入を確定してしまう単語省略オ
ペレータｄｅｌｅｔｅ−ｗｏｒｄ（ｅｗ_m）または単語
挿入オペレータａｄｄ−ｗｏｒｄ（ｉｗ_n）と異な
る）、スクランブルオペレータｓｃｒａｍｂｌｅ（ｅｗ
_m，ｉｗ_n）、並びに複写／複合オペレータおよび置換／
複合オペレータについては、その使用に際して以下のよ
うな制限がある。

【０２５１】即ち、用例句Ｅを構成する単語の配置位置
だけを変えたり、用例句Ｅを構成する単語を入力句Ｉを
構成する単語と置換し、その配置位置を変えて、用例句
Ｅを入力句Ｉに変形することは、その配置位置を変える
単語を省略し、その後、所定の位置に挿入するか、また
は配置位置を変える単語を所定の位置に挿入し、その
後、元の位置にある単語を省略することで実現すること
ができる。

【０２５２】従って、用例句Ｅから入力句Ｉへ変形する
場合において、単語の配置位置を変えるには、過去にお
いて、その単語が、用例句Ｅから省略または入力句Ｉに
挿入されている必要がある。このため、スクランブルオ
ペレータｓｃｒａｍｂｌｅ（ｅｗ_m，ｉｗ_n）は、過去
に、用例句Ｅを構成する単語ｅｗ_mが仮に省略された状
態になっているとき、または入力句Ｉを構成する単語ｉ
ｗ_nが仮に挿入された状態になっているとき、即ち、仮
省略単語ｅｗ_mまたは仮挿入単語ｉｗ_nがキャッシュ７Ａ
に記憶されているときのみ使用される。

【０２５３】具体的には、最適経路の算出にあたって、
用例句Ｅを構成するｍ番目の単語ｅｗ_mから、入力句Ｉ
を構成するｎ番目の単語ｉｗ_nへの変形経路が問題とな
っている場合において、ｋ＜ｍとして、キャッシュ７Ａ
に仮省略単語ｅｗ_kが記憶されているときは、スクラン
ブルオペレータｓｃｒａｍｂｌｅ（ｅｗ_k，ｉｗ_n）を使
用することができる（入力句Ｉを構成するｎ番目の単語
ｉｗ_nは、用例句Ｅを構成するｍ番目の単語ｅｗ_mを変形
したものではなく、用例句Ｅを構成するｋ番目の単語ｅ
ｗ_kを、そのまま、若しくは置換して、その配置位置を
変える変形をしたものとすることができる）。

【０２５４】また、上述の場合において、ｓ＜ｎとし
て、キャッシュ７Ａに仮挿入単語ｉｗ_sが記憶されてい
るときにも、スクランブルオペレータｓｃｒａｍｂｌｅ
（ｅｗ_m，ｉｗ_s）を使用することができる（用例句Ｅを
構成するｍ番目の単語ｅｗ_mは、入力句Ｉを構成するｎ
番目の単語ｉｗ_nに変形されたのではなく、そのまま、
若しくは置換され、その配置位置を変えて、入力句Ｉを
構成するｓ番目の単語ｉｗ_sに変形されたものとするこ
とができる）。

【０２５５】なお、スクランブルオペレータｓｃｒａｍ
ｂｌｅ（ｅｗ_k，ｉｗ_n）またはｓｃｒａｍｂｌｅ（ｅｗ
_m，ｉｗ_s）が使用された場合（最適経路の算出の過程に
おいて、これらに対応する変形経路が、最適経路を構成
する経路として選択された場合）、仮省略単語ｅｗ_kま
たは仮挿入単語ｉｗ_sは、その時点で、省略または挿入
されたものでないことが確定するので、即ち、配置位置
が変えられたものであることが確定するので、キャッシ
ュ７Ａから削除される。

【０２５６】次に、複写／複合オペレータおよび置換／
複合オペレータについては、その使用に際して以下のよ
うな制限がある。

【０２５７】即ち、用例句Ｅを構成する単語ｅｗ_mを、
入力句Ｉを構成する単語ｉｗ_nとしてそのまま複写し、
その１つ前の単語ｉｗ_n-1と複合語を構成させたり、用
例句Ｅを構成する単語ｅｗ_mを、入力句Ｉを構成する単
語ｉｗ_nに置換し、その１つ前の単語ｉｗ_n-1と複合語を
構成させるには、修飾語となる単語ｉｗ_n-1が、過去に
おいて、入力句Ｉに挿入されている必要がある。このた
め、複写／複合オペレータおよび置換／複合オペレータ
は、過去に、入力句Ｉを構成する単語ｉｗ_n-1が仮に挿
入された状態になっているとき、即ち、仮挿入単語ｉｗ
_n-1がキャッシュ７Ａに記憶されているときのみ使用さ
れる。

【０２５８】具体的には、最適経路の算出にあたって、
用例句Ｅを構成するｍ番目の単語ｅｗ_mから、入力句Ｉ
を構成するｎ番目の単語ｉｗ_nへの変形経路が問題とな
っている場合において、キャッシュ７Ａに仮挿入単語ｉ
ｗ_n-1が記憶されているとき、即ち、単語ｉｗ_nの１つ前
に、単語ｉｗ_n-1が仮挿入されているときは、複写／複
合オペレータおよび置換／複合オペレータを使用するこ
とができる。

【０２５９】なお、複写／複合オペレータまたは置換／
複合オペレータが使用された場合、仮挿入単語ｉｗ_n-1
は、その時点で、挿入されたものでないことが確定する
ので、即ち、複合語を構成することが確定するので、キ
ャッシュ７Ａから削除される。

【０２６０】次に、以上のような６つの変形オペレータ
（単語複写オペレータｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉ
ｗ_n）、単語置換オペレータａｌｔｅｒ−ｗｏｒｄ（ｅ
ｗ_m，ｉｗ_n）、仮省略オペレータｃａｃｈｅ−ａｓ−ｄ
ｅｌｅｔｅｄ（ｅｗ_m）、仮挿入オペレータｃａｃｈｅ
−ａｓ−ａｄｄｅｄ（ｉｗ_n）、スクランブルオペレー
タｓｃｒａｍｂｌｅ（ｅｗ_m，ｉｗ_n）、および複合オペ
レータｃｏｍｐｏｕｎｄ（ｉｗ_n-1，ｉｗ_n））を用い
て、単語の変形を行う場合の単語変形確率を求めるため
に、各変形オペレータについての確率（各変形オペレー
タによる変形がなされる確率）が必要となるが、これ
は、例えば、次のように定義することができる。

【０２６１】即ち、まず、単語複写オペレータｅｃｈｏ
−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）についての確率（単語複写
確率）Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））、ま
たは単語置換オペレータａｌｔｅｒ−ｗｏｒｄ（ｅ
ｗ_m，ｉｗ_n）についての確率（単語置換確率）Ｐ（ａｌ
ｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））は、例えば、上述
した場合と同様に、式（２２）または（２５）でそれぞ
れ与えられる。

【０２６２】次に、仮省略オペレータｃａｃｈｅ−ａｓ
−ｄｅｌｅｔｅｄ（ｅｗ_m）についての確率（以下、適
宜、仮省略確率という）Ｐ（ｃａｃｈｅ−ａｓ−ｄｅｌ
ｅｔｅｄ（ｅｗ_m））は、例えば、単語省略確率Ｐ（ｄ
ｅｌｅｔｅ−ｗｏｒｄ（ｅｗ_ｍ））および単語複写確率
Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_ｍ，ｉｗ_n））を用い
て、次式を満たすように与えられる。

【０２６３】 P(delete-word(ew_m))<P(cache-as-deleted(ew_m))<P(echo-word(ew_m,iw_n)) ・・・（３２）

【０２６４】なお、ここでは、仮省略確率Ｐ（ｃａｃｈ
ｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m））は、式（３２）
を満足し、かつ、例えば、類似する単語についての単語
置換確率Ｐ（ａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）よ
りは低く、類似しない単語についての単語置換確率Ｐ
（ａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）よりは高い値
とする。

【０２６５】仮挿入オペレータｃａｃｈｅ−ａｓ−ａｄ
ｄｅｄ（ｉｗ_n）についての確率（以下、適宜、仮挿入
確率という）Ｐ（ｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ
_n））は、例えば、単語挿入確率Ｐ（ａｄｄ−ｗｏｒｄ
（ｉｗ_n））および単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒ
ｄ（ｅｗ_m，ｉｗ_n））を用いて、次式を満たすように与
えられる。

【０２６６】 P(add-word(iw_n))<P(cache-as-added(iw_n))<P(echo-word(ew_m,iw_n)) ・・・（３３）

【０２６７】なお、ここでは、仮挿入確率Ｐ（ｃａｃｈ
ｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n））は、式（３３）を満
足し、かつ、例えば、類似する単語についての単語置換
確率Ｐ（ａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）よりは
低く、類似しない単語についての単語置換確率Ｐ（ａｌ
ｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）よりは高い値とす
る。

【０２６８】また、式（３２）および（３３）における
単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉ
ｗ_n））は、単語ｅｗ_mとｉｗ_nとが一致している場合に
式（２２）で与えられるものとする（単語ｅｗ_mとｉｗ_n
とが一致していない場合、上述したように、単語複写確
率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））は０とな
るので、この場合、仮省略確率Ｐ（ｃａｃｈｅ−ａｓ−
ｄｅｌｅｔｅｄ（ｅｗ_m））および仮挿入確率Ｐ（ｃａ
ｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n））の上限は、単語
複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））に
よっては制限されないものとする）。

【０２６９】スクランブルオペレータｓｃｒａｍｂｌｅ
（ｅｗ_m，ｉｗ_n）についての確率（以下、適宜、スクラ
ンブル確率という）Ｐ（ｓｃｒａｍｂｌｅ（ｅｗ_m，ｉ
ｗ_n））は、例えば、次式で与えられる。

【０２７０】 P(scramble(ew_m,iw_n))=f(P(alter-word(ew_m,iw_n)),iw_n) ew_m≠iw_nの場合 P(scramble(ew_m,iw_n))=f(P(echo-word(ew_m,iw_n)),iw_n) ew_m＝iw_nの場合・・・（３５）

【０２７１】式（３５）において、関数ｆ（）は、単語
や句などの順番が入れ替わる現象（スクランブル）の起
こり易さを求めるものであり、例えば、キャッシュ７Ａ
に記憶されている単語の性質（例えば、品詞など）や、
入力句Ｉの言語や、入力句Ｉが用いられる状況などを考
慮して設定することができる。即ち、関数ｆ（）は、例
えば、英語などよりも語順の入れ替えが自由な日本語の
入力句Ｉに対しては、英語の入力句Ｉよりも高い確率を
与えるように設定することができる。また、関数ｆ（）
は、書き言葉に比較して、倒置などの語順の入れ替えが
起こり易い話し言葉に対して、高い確率を与えるように
設定することができる。

【０２７２】なお、式（３５）では、関数ｆ（）の引数
として、ｅｗ_m≠ｉｗ_nの場合には単語置換確率Ｐ（ａｌ
ｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））を、ｅｗ_m＝ｉｗ_n
の場合には単語複写確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ
_m，ｉｗ_n））を用いているが、これは、単語ｅｗ_mとｉ
ｗ_nとが一致していない場合（ｅｗ_m≠ｉｗ_nの場合）に
は、用例句Ｅを構成する単語が置換されて語順が入れ替
えられたと考えられ、単語ｅｗ_mとｉｗ_nとが一致してい
る場合（ｅｗ_m＝ｉｗ_nの場合）には、用例句Ｅを構成す
る単語が、そのまま複写され、語順だけが入れ替えられ
たと考えられるからである。

【０２７３】また、式（３５）では、ｅｗ_m≠ｉｗ_nの場
合、およびｅｗ_m＝ｉｗ_nの場合のいずれの場合にも、関
数ｆ（）の引数として、入力句Ｉを構成する単語ｉｗ_n
を用いているが、これは、単語ｉｗ_nによって、語順の
入れ替わり易さが異なると考えられるからである。即
ち、例えば、日本語では、動詞が先頭に移動される場合
はほとんどなく、従って、単語ｉｗ_nが動詞である場合
には、関数ｆ（）は、スクランブル確率Ｐ（ｓｃｒａｍ
ｂｌｅ（ｅｗ_m，ｉｗ_n））が小さくなるような値とな
る。

【０２７４】次に、複合オペレータｃｏｍｐｏｕｎｄ
（ｉｗ_n-1，ｉｗ_n）についての確率（以下、適宜、複合
確率という）Ｐ（ｃｏｍｐｏｕｎｄ（ｉｗ_n-1，ｉ
ｗ_n））は、例えば、次式で与えられる。

【０２７５】 P(compound(iw_n-1,iw_n))＝g(iw_n-1,iw_n) ・・・（３６）

【０２７６】式（３６）において、関数ｇ（ｉｗ_n-1，
ｉｗ_n）は、連続する単語ｉｗ_n-1およびｉｗ_nが複合語
を形成する確率を表すもので、これは、例えば、次のよ
うにして計算することができる。即ち、例えば、複合語
の用例を多数記憶しておき、その中から、単語ｉ
ｗ_n-1，ｉｗ_nの並びに最も類似するものを求め、その類
似度を正規化するなどして、複合語を形成する確率とす
ることなどが可能である。

【０２７７】なお、記憶している複合語の用例との類似
度が充分大きい場合には、複合確率Ｐ（ｃｏｍｐｏｕｎ
ｄ（ｉｗ_n-1，ｉｗ_n））は、単語挿入確率Ｐ（ａｄｄ−
ｗｏｒｄ（ｉｗ_n））よりも高くなる。

【０２７８】そして、用例句Ｅを構成する単語ｅｗ
_mが、入力句Ｉを構成する単語ｉｗ_nとしてそのまま複写
され、その１つ前の単語ｉｗ_n-1と複合語を構成する確
率（以下、適宜、複写／複合確率という）は、単語複写
確率Ｐ（ｅｃｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））と、複
合確率Ｐ（ｃｏｍｐｏｕｎｄ（ｉｗ_n-1，ｉｗ_n））との
積で表され、用例句Ｅを構成する単語ｅｗ_mが、入力句
Ｉを構成する単語ｉｗ_nに置換され、その１つ前の単語
ｉｗ_n-1と複合語を構成する確率（以下、適宜、置換／
複合確率という）は、単語置換確率Ｐ（ａｌｔｅｒ−ｗ
ｏｒｄ（ｅｗ_m，ｉｗ_n））と複合確率Ｐ（ｃｏｍｐｏｕ
ｎｄ（ｉｗ_n-1，ｉｗ_n））との積で表される。

【０２７９】次に、単語複写オペレータｅｃｈｏ−ｗｏ
ｒｄ（ｅｗ_m，ｉｗ_n）、単語置換オペレータａｌｔｅｒ
−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）、仮省略オペレータｃａｃ
ｈｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m）、仮挿入オペレ
ータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n）、スクラ
ンブルオペレータｓｃｒａｍｂｌｅ（ｅｗ_m，ｉｗ_n）、
および複合オペレータｃｏｍｐｏｕｎｄ（ｉｗ_n-1，ｉ
ｗ_n）の６つの変形オペレータによれば、用例句Ｅに対
して、次のような８種類の変形を施すことができる。

【０２８０】即ち、第１に、単語複写オペレータｅｃｈ
ｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）によれば、用例句Ｅを構
成する単語ｅｗ_mを、そのまま、入力句Ｉを構成する単
語ｉｗ_nとすることができる。第２に、単語置換オペレ
ータａｌｔｅｒ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）によれば、
用例句Ｅを構成する単語ｅｗ_mを、入力句Ｉを構成する
単語ｉｗ_nに置換することができる。第３に、仮省略オ
ペレータｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m）
によれば、用例句Ｅを構成する単語ｅｗ_mを仮に省略す
ることができ、第４に、仮挿入オペレータｃａｃｈｅ−
ａｓ−ａｄｄｅｄ（ｉｗ_n）によれば、入力句Ｉを構成
する単語ｉｗ_nを仮に挿入することができる。

【０２８１】さらに、スクランブルオペレータｓｃｒａ
ｍｂｌｅ（ｅｗ_m，ｉｗ_n）によれば、次の２通りの語順
の入れ替えを行うことができる。即ち、第５に、スクラ
ンブルオペレータｓｃｒａｍｂｌｅ（ｅｗ_k，ｉｗ_n）に
よれば、キャッシュ７Ａに記憶されている仮省略単語ｅ
ｗ_kを、入力句Ｉのｎ番目の単語ｉｗ_nとして挿入して、
語順を入れ替えることができる。第６に、スクランブル
オペレータｓｃｒａｍｂｌｅ（ｅｗ_m，ｉｗ_s）によれ
ば、キャッシュ７Ａに記憶されている仮挿入単語ｉｗ_s
を、用例句Ｅのｍ番目の単語ｅｗ_mの語順が入れ替えら
れたものとすることができる。

【０２８２】そして、第７に、単語複写オペレータｅｃ
ｈｏ−ｗｏｒｄ（ｅｗ_m，ｉｗ_n）と複合オペレータｃｏ
ｍｐｏｕｎｄ（ｉｗ_n-1，ｉｗ_n）との組合せ（複写／複
合オペレータ）によれば、用例句Ｅを構成する単語ｅｗ
_mを、入力句Ｉを構成する単語ｉｗ_nとしてそのまま複写
し、その１つ前の単語ｉｗ_n-1と複合語を構成させるこ
とができ、第８に、単語置換オペレータａｌｔｅｒ−ｗ
ｏｒｄ（ｅｗ_m，ｉｗ_n）と複合オペレータｃｏｍｐｏｕ
ｎｄ（ｉｗ_n-1，ｉｗ_n）との組合せ（置換／複合オペレ
ータ）によれば、用例句Ｅを構成する単語ｅｗ_mを、入
力句Ｉを構成する単語ｉｗ_nに置換し、その１つ前の単
語ｉｗ_n-1と複合語を構成させることができる。

【０２８３】以上の８つの変形を施すことのできる変形
オペレータの最適な集合、即ち、最適経路を、ＤＰマッ
チングによって求めることを考えると、これは、例え
ば、式（３１）における場合と同様の式（３７）に示
す、８つの変形に対応するパス（経路）の重みを用いた
累積距離Ｇ（ｍ，ｎ）を計算することで求めることがで
きる。

【０２８４】

【数２９】・・・（３７）

【０２８５】図１１の実施の形態では、変換部７におい
て、キャッシュ７Ａを必要に応じて用いながら、ｍ＝Ｍ
となるまで、式（３７）を計算することにより、最適経
路が求められ、単語変形確率が算出されるようになされ
ている。

【０２８６】即ち、図１２のフローチャートに示すよう
に、変換部７では、まず最初に、ステップＳ６１におい
て、式（３７）にしたがい、注目用例句Ｅを構成する単
語ｅｗ_mと、入力句Ｉを構成する単語ｉｗ_nとを対応させ
たときの累積距離Ｇ（ｍ，ｎ）が求められる。

【０２８７】そして、ステップＳ６２に進み、変換部７
において、ステップＳ６１における累積距離Ｇ（ｍ，
ｎ）の計算にあたって、仮省略オペレータｃａｃｈｅ−
ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m）に対応する経路、即
ち、式（３７）における右辺の式のうち、上から３行目
の式が選択されたかどうかが判定され、選択されたと判
定された場合、ステップＳ６３に進む。ステップＳ６３
では、仮省略オペレータｃａｃｈｅ−ａｓ−ｄｅｌｅｔ
ｅｄ（ｅｗ_m）により仮省略された単語ｅｗ_mが、キャッ
シュ７Ａに退避（記憶）され、ステップＳ６４に進む。

【０２８８】また、ステップＳ６２において、仮省略オ
ペレータｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m）
に対応する経路が選択されていないと判定された場合、
ステップＳ６３をスキップして、ステップＳ６４に進
み、累積距離Ｇ（ｍ，ｎ）の計算にあたって、仮挿入オ
ペレータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n）に対
応する経路、即ち、式（３７）における右辺の式のう
ち、上から４行目の式が選択されたかどうかが判定され
る。ステップＳ６４において、仮挿入オペレータｃａｃ
ｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n）に対応する経路が選
択されたと判定された場合、ステップＳ６５に進み、仮
挿入オペレータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉ
ｗ_n）により仮挿入された単語ｉｗ_nが、キャッシュ７Ａ
に退避され、ステップＳ６６に進む。

【０２８９】また、ステップＳ６４において、仮挿入オ
ペレータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n）に対
応する経路が選択されていないと判定された場合、ステ
ップＳ６５をスキップして、ステップＳ６６に進み、累
積距離Ｇ（ｍ，ｎ）の計算にあたって、複写／複合オペ
レータまたは置換／複合オペレータに対応する経路、即
ち、式（３７）のおける右辺の式のうち、上から７行目
または８行目の式が選択されたかどうかが判定される。
ステップＳ６６において、複写／複合オペレータまたは
置換／複合オペレータに対応する経路が選択されたと判
定された場合、ステップＳ６７に進み、複写／複合オペ
レータまたは置換／複合オペレータにより複合語を構成
する修飾語とされた仮挿入単語ｉｗ_n-1がキャッシュ７
Ａに記憶されているので、それが削除され、ステップＳ
６８に進む。

【０２９０】また、ステップＳ６６において、複写／複
合オペレータまたは置換／複合オペレータに対応する経
路のいずれも選択されていないと判定された場合、ステ
ップＳ６７をスキップして、ステップＳ６８に進み、累
積距離Ｇ（ｍ，ｎ）の計算にあたって、スクランブルオ
ペレータｓｃｒａｍｂｌｅ（ｅｗ_k，ｉｗ_n）またはｓｃ
ｒａｍｂｌｅ（ｅｗ_m，ｉｗ_s）に対応する経路、即ち、
式（３７）のおける右辺の式のうち、上から５行目また
は６行目の式が選択されたかどうかが判定される。ステ
ップＳ６８において、スクランブルオペレータｓｃｒａ
ｍｂｌｅ（ｅｗ_k，ｉｗ_n）またはｓｃｒａｍｂｌｅ（ｅ
ｗ_m，ｉｗ_s）に対応する経路が選択されたと判定された
場合、ステップＳ６９に進み、語順の入れ替えがされた
仮省略単語ｅｗ_kまたは仮挿入単語ｉｗ_sが、キャッシュ
７Ａに記憶されているので、それが削除され、ステップ
Ｓ７０に進む。

【０２９１】一方、ステップＳ６８において、スクラン
ブルオペレータｓｃｒａｍｂｌｅ（ｅｗ_k，ｉｗ_n）また
はｓｃｒａｍｂｌｅ（ｅｗ_m，ｉｗ_s）に対応する経路の
いずれも選択されていないと判定された場合、ステップ
Ｓ６９をスキップして、ステップＳ７０に進み、ｍがＭ
（注目用例句Ｅを構成する単語数）未満であるかどうか
が判定され。ｍがＭ未満であると判定された場合、ステ
ップＳ６１に戻り、変換部７は、ｍ，ｎを増加させ、以
下、同様の処理を繰り返す。そして、ステップＳ７０に
おいて、ｍがＭ未満でないと判定された場合、即ち、ｍ
がＭに等しい場合、ステップＳ７１に進み、キャッシュ
７Ａに仮省略単語ｅｗ_mまたは仮挿入単語ｉｗ_nが記憶さ
れているかどうかが判定される。

【０２９２】ステップＳ７１において、キャッシュ７Ａ
に仮省略単語ｅｗ_mまたは仮挿入単語ｉｗ_nが記憶されて
いると判定された場合、ステップＳ７２に進み、累積距
離Ｇ（Ｍ，ｎ）が得られたときのパスのうち、キャッシ
ュ７Ａに記憶されている仮省略単語ｅｗ_mを仮省略した
仮省略オペレータｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ
（ｅｗ_m）に対応する経路、またはキャッシュ７Ａに記
憶されている仮挿入単語ｉｗ_nを仮挿入した仮挿入オペ
レータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n）に対応
する経路が、単語省略オペレータｄｅｌｅｔｅ−ｗｏｒ
ｄ（ｅｗ_m）に対応する経路、または単語挿入オペレー
タａｄｄ−ｗｏｒｄ（ｉｗ_n）に対応する経路にそれぞ
れ変換され、その結果得られるパスが、最適経路とされ
て、ステップＳ７３に進む。

【０２９３】また、ステップＳ７１において、キャッシ
ュ７Ａに仮省略単語ｅｗ_mまたは仮挿入単語ｉｗ_nのいず
れも記憶されていないと判定された場合、累積距離Ｇ
（Ｍ，ｎ）が得られたときのパスがそのまま最適経路と
され、ステップＳ７３に進み、その最適経路にしたがっ
て、単語変形確率が計算される。

【０２９４】なお、この場合、最適経路は、キャッシュ
７Ａから削除された仮省略単語ｅｗ_mまたは仮挿入単語
ｉｗ_nをそれぞれ仮省略または仮挿入した仮省略オペレ
ータｃａｃｈｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m）また
は仮挿入オペレータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉ
ｗ_n）に対応する経路を含むが、この経路は、単語変形
確率の計算にあたって無視するようにすることができ
る。

【０２９５】以上のように、仮省略オペレータｃａｃｈ
ｅ−ａｓ−ｄｅｌｅｔｅｄ（ｅｗ_m）および仮挿入オペ
レータｃａｃｈｅ−ａｓ−ａｄｄｅｄ（ｉｗ_n）とも
に、スクランブルオペレータｓｃｒａｍｂｌｅ（ｅ
ｗ_m，ｉｗ_n）を導入したので、類似する入力句Ｉと用例
句Ｅとの間の語順が異なっていても、その類似性を正し
く判定することが可能となる。

【０２９６】さらに、複合オペレータｃｏｍｐｏｕｎｄ
（ｉｗ_n-1，ｉｗ_n）も導入したので、複合語にも対処す
ることが可能となる。

【０２９７】なお、仮省略単語および仮挿入単語を一時
記憶するキャッシュ７Ａのような記憶手段を用いて確率
を計算する方法は、例えば、Roland Kuhn and Renato D
e Mori, "A Cache-based Natural Language Model for
Speech Recognition", IEEETransactions on Pattern A
nalysis and Machine Intelligence, vol.12, No.6,jun
e 1990などにおいて、音声認識のための言語モデルに適
用されている。

【０２９８】ここでは、最近用いられた単語が再び現れ
る（発話される）確率は、その単語が初めて現れる確率
よりも高いという仮説に基づく言語モデルが提案されて
おり、最近用いられた単語を記憶手段に記憶させてお
き、その記憶手段を参照して、ｉ番目の単語Ｗ_iが、所
定の単語Ｗである確率が計算されるようになされてい
る。

【０２９９】即ち、例えば、普通の３ｇ−ｇｒａｍモデ
ルでは、ｉ−１またはｉ−２番目の単語の品詞をｇ_i-1
またはｇ_i-2とそれぞれ表すときに、ｉ番目の単語Ｗ
_iが、所定の単語Ｗである確率Ｐ（Ｗ_i＝Ｗ｜ｇ_i-2，ｇ
_i-1）は、例えば、次式で計算される。

【０３００】

【数３０】・・・（３８）なお、Ｇは、音声認識の対象とする言語における品詞の
集合を意味する。

【０３０１】そして、上述の文献では、式（３８）の右
辺におけるＰ（Ｗ_i＝Ｗ｜ｇ_i＝ｇ_j）を、記憶手段に最
近現れた単語を記憶することにより、次の式（３９）に
したがって計算する方法が提案されている。

【０３０２】

【数３１】・・・（３９）なお、ｋ_M,j＋ｋ_C,j＝１で、ｋ_M,jおよびｋ_C,jは、いず
れもｊのみをインデックスとする変数である。

【０３０３】式（３９）の右辺におけるＣ_j（Ｗ，ｉ）
が、記憶手段を参照することにより計算される確率で、
単語Ｗが最近現れたかどうかで変化するようになされて
いる。

【０３０４】従って、図１１の実施の形態における手法
は、単語をキャッシュ７Ａに記憶させ、それを参照しな
がら確率を計算していく点で、単語を記憶手段に記憶さ
せて、それを参照しながら確率を計算していく上述の文
献の手法と共通するが、キャッシュ７Ａには仮省略また
は仮挿入された単語のみを記憶させる点で、最近現れた
単語を記憶手段に記憶させる上述の文献の手法とは異な
る。

【０３０５】また、複合オペレータｃｏｍｐｏｕｎｄ
（ｉｗ_n-1，ｉｗ_n）によれば、上述したような複合名詞
に対処することができる他、例えば、用例句Ｅが「犬は
かわいい」であるのに対して、入力句Ｉが「私の犬はか
わいい」である場合のように、入力句Ｉを構成する単語
「犬」に修飾語「私の」が付加された複合語「私の犬」
と、用例句Ｅを構成する単語「犬」とが対応するときな
ども対処することが可能である。但し、「私の犬」のよ
うに、「私の」が「犬」を修飾することが明かな場合
は、用例句Ｅの「犬」と入力句Ｉ「私の犬」とについ
て、置換オペレータａｌｔｅｒ−ｗｏｒｄ（「犬」，
「私の犬」）を適用し、さらに、「私の×」（ここの×
は名詞を表す）という名詞句用例を用いることにより、
正しく、かつ複合オペレータｃｏｍｐｏｕｎｄ（ｉｗ
_n-1，ｉｗ_n）を用いるときよりも効率的に処理すること
ができる。

【０３０６】即ち、複合オペレータｃｏｍｐｏｕｎｄ
（ｉｗ_n-1，ｉｗ_n）は、修飾関係が不明な、例えば「私
の犬」などの助詞「の」を伴うものでないもの（例え
ば、複合名詞）が入力部１に入力された場合や、また、
入力部１における音声認識装置で助詞を認識することが
できず、例えば、実際の入力「私の犬はかわいい」に対
して、入力部１から「私、犬はかわいい」などが出力さ
れた場合などに有効である。

【０３０７】以上、本発明を、日本語から英語への翻訳
を行う翻訳装置に適用した場合ついて説明したが、本発
明は、その他の言語間の翻訳を行う翻訳装置にも適用可
能である。

【０３０８】なお、翻訳装置には、出力部１６から出力
される翻訳結果を訂正または確認するためのボタン（以
下、適宜、それぞれを訂正ボタンまたは確認ボタンとい
う）などを設けるようにすることが可能である。そし
て、翻訳装置には、確認ボタンが操作された場合には、
翻訳結果が正しいものとして、次の処理を行わせるよう
にすることができる。また、訂正ボタンが操作された場
合には、翻訳結果が誤っているものとして、再度、翻訳
処理を行わせるようにすることができる。即ち、例え
ば、翻訳適正率が次に高い用例を検出させ、その用例に
基づいて、翻訳を行わせるようにすることなどができ
る。さらに、翻訳装置には、出力部１６から出力される
翻訳結果を訂正するための操作部などを設けるようにす
ることも可能である。この場合、操作部が操作されるこ
とにより翻訳結果が訂正されたときには、その訂正結果
に対応する用例を、名詞句対訳用例記憶部８、動詞句対
訳用例記憶部９、またはその他対訳用例記憶部１０に記
憶させるようにすることも可能である。

【０３０９】また、本実施の形態では、例えば式（５）
にしたがって、あるいは、図７で説明したようにして、
各用例Ｅ_iの事前確率Ｐ（Ｅ_i）を求めるようにしたが、
この事前確率Ｐ（Ｅ_i）は、例えば用例数Ｎ_Eの逆数１／
Ｎ_Eなど、各用例Ｅ_iについて同一の値を用いることも可
能である。

【０３１０】さらに、本実施の形態では、類似度計算部
１１において、２つの単語の共通の概念に包含される単
語の数に基づいて、単語置換確率を求めるようにした
が、単語置換確率は、従来の同様に、シソーラスにおい
て、２つの単語の共通の概念が属する階層のレベルに基
づいて求めるようにすることも可能である。即ち、シソ
ーラスの階層数をＣとするとともに、入力句Ｉの単語ｉ
ｗ_nと用例句Ｅの単語ｅｗ_mとの共通の概念が属する階層
のレベルをＬとするとき、単語置換確率Ｐ（ａｌｔｅｒ
−ｗｏｒｄ（ｅｗ_m，ｉｗ_n））は、例えば次式にしたが
って求めるようにすることも可能である。

【０３１１】

【数３２】・・・（４０）

【０３１２】また、本実施の形態では、単語省略確率な
どを、単語の品詞（単語が自立語であるかどうかや、機
能語であるかどうかなど）に基づいて決定するようにし
たが、翻訳装置が適用されるドメインによっては、品詞
以外の情報に基づいて決定するようにすることが有効な
場合もある。即ち、例えば、話し言葉などにおいては、
第１人称や第２人称などの代名詞が省略され易いこと
や、文脈上トピックとなっている単語は、会話をする者
の間で明らかであるため省略され易いことなどを考慮し
て、単語省略確率などを決定するようにすることが可能
である。

【０３１３】さらに、単語挿入確率または単語省略確率
は、式（４１）または（４２）にそれぞれ示すように、
場合分けせずに、所定の一定値とするようにすることも
可能である。

【０３１４】

【数３３】・・・（４１）

【数３４】・・・（４２）

【０３１５】また、単語省略確率などは、所定の計算式
にしたがって与えるようにすることも可能である。

【０３１６】さらに、本実施の形態では、節または句の
単位で、翻訳を行うようにしたが、その他の構文単位で
翻訳を行うようにすることも可能である。また、そのよ
うな構文単位に分割せずに翻訳を行うようにすることも
可能である。さらに、本実施の形態では、用例句を、名
詞句、動詞句、およびその他の句に分けて記憶しておく
ようにしたが、用例句の分類方法は、これに限定される
ものではない。

【０３１７】

【発明の効果】請求項１に記載の翻訳装置および請求項
２５に記載の翻訳方法によれば、第１言語文が、所定の
構文上の単位である構文単位に分割され、第１言語文の
構文単位に類似する用例が検出される。そして、その検
出された用例と対応付けられている訳文に基づいて、第
１言語文が、構文単位で翻訳され、その構文単位の翻訳
結果が合成されて、第２言語文が生成される。従って、
効率的な翻訳処理が可能となり、その結果、翻訳処理速
度を向上させることが可能となる。

【０３１８】請求項２６に記載の翻訳方法によれば、第
１言語文を、所定の構文上の単位である構文単位あっ
て、大きな構文単位から小さな構文単位に、段階的に分
割しながら、各段階において得られた構文単位と、用例
とが照合され、その照合結果に基づいて、構文単位に対
応する用例が検出される。そして、その検出された用例
と対応付けられている訳文に基づいて、第１言語文が、
構文単位で翻訳され、その構文単位の翻訳結果が合成さ
れて、第２言語文が生成される。従って、効率的な翻訳
処理が可能となり、その結果、翻訳処理速度を向上させ
ることが可能となる。

【０３１９】請求項２７に記載の翻訳装置および請求項
２８に記載の翻訳方法によれば、単語をその概念に基づ
いて木構造に階層化したシソーラスにおいて、第１言語
文を構成する単語と、用例を構成する単語との共通の概
念に包含される単語の数に基づいて、第１言語文を構成
する単語と、用例を構成する単語との類似性を表す単語
類似度が算出される。従って、シソーラスの構造によら
ず、的確な単語類似度の算出が可能となり、その結果、
翻訳精度を向上させることが可能となる。

【０３２０】請求項２９に記載の翻訳装置および請求項
４０に記載の翻訳方法によれば、用例が第１言語文を翻
訳するために用いられる事前確率と、用例が第１言語文
に変形されて用いられる変形確率とに基づいて、第１言
語文に類似する用例が検出され、その検出された用例と
対応付けられている訳文に基づいて、第１言語文が翻訳
される。従って、確率的に適切な翻訳処理を行うことが
可能となる。

【０３２１】請求項４１に記載の翻訳装置および請求項
４２に記載の翻訳方法によれば、第１言語文を構文解析
することにより、その文法属性が抽出され、第１言語文
に類似する用例が、その第１言語文および用例が有する
文法属性を考慮して検出される。そして、その検出され
た用例と対応付けられている訳文に基づいて、第１言語
文が翻訳される。従って、意味内容が同一の、表層上異
なる用例を複数記憶させておかずに済むようにすること
が可能となる。

【図面の簡単な説明】

【図１】本発明を適用した翻訳装置の一実施の形態の構
成例を示すブロック図である。

【図２】図１のシソーラス記憶部１２に記憶されている
シソーラスを示す図である。

【図３】図１の翻訳装置の動作を説明するためのフロー
チャートである。

【図４】図１の翻訳装置の動作を説明するための図であ
る。

【図５】図１の翻訳装置の動作を説明するための図であ
る。

【図６】図１の翻訳装置の動作を説明するための図であ
る。

【図７】事前確率Ｐ（Ｅ_i）を求める方法を説明するた
めのフローチャートである。

【図８】図１の変換部７の処理を説明するためのフロー
チャートである。

【図９】図８のステップＳ３２の処理の詳細を説明する
ためのフローチャートである。

【図１０】図８のステップＳ３２の処理の詳細を説明す
るためのフローチャートである。

【図１１】本発明を適用した翻訳装置の他の実施の形態
の構成例を示すブロック図である。

【図１２】図１１の変換部７の処理を説明するためのフ
ローチャートである。

【図１３】従来の翻訳装置の一例の構成を示すブロック
図である。

【図１４】従来の翻訳装置の他の一例の構成を示すブロ
ック図である。

【図１５】従来の翻訳装置の、さらに他の一例の構成を
示すブロック図である。

【図１６】従来の翻訳装置において用いられるシソーラ
スを示す図である。

【符号の説明】

１入力部，２照合部，３決まり文句対訳用例
記憶部，４節分割処理部，５節分割パターン対
訳用例記憶部，６単純構文解析処理部，７変換
部，７Ａキャッシュ，８名詞句対訳用例記憶
部，９動詞句対訳用例記憶部，１０その他対訳
用例記憶部，１１類似度計算部，１２シソーラ
ス記憶部，１３対訳辞書，１４句合成処理部，
１５節合成処理部，１６出力部

Claims

【特許請求の範囲】

【請求項１】第１の言語で表現された第１言語文を、
第２の言語で表現された第２言語文に翻訳する翻訳装置
であって、前記第１の言語で表現された用例と、その用例を前記第
２の言語に翻訳した訳文とを対応付けて記憶している用
例記憶手段と、前記第１言語文を、所定の構文上の単位である構文単位
に分割する分割手段と、前記分割手段より出力される前記第１言語文の前記構文
単位に類似する前記用例を検出する検出手段と、前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第１言語文を、前記構
文単位で翻訳する翻訳手段と、前記翻訳手段による前記構文単位の翻訳結果を合成し、
前記第２言語文を生成する生成手段とを備えることを特
徴とする翻訳装置。
【請求項２】前記用例記憶手段は、前記用例およびそ
の訳文を、前記構文単位で記憶していることを特徴とす
る請求項１に記載の翻訳装置。
【請求項３】前記分割手段は、前記第１言語文を、大
きな構文単位から小さな構文単位に、段階的に分割する
ことを特徴とする請求項１に記載の翻訳装置。
【請求項４】前記分割手段は、前記第１言語文を、節単位に分割する節分割手段と、前記節分割手段より出力される前記第１言語文の前記節
単位を、句単位に分割する句分割手段とを有することを
特徴とする請求項３に記載の翻訳装置。
【請求項５】前記用例記憶手段は、節単位の用例を記憶している節単位用例記憶手段と、句単位の用例を記憶している句単位用例記憶手段とを有
することを特徴とする請求項４に記載の翻訳装置。
【請求項６】前記句単位用例記憶手段は、前記用例
を、少なくとも名詞句と動詞句とに区分して記憶してい
ることを特徴とする請求項５に記載の翻訳装置。
【請求項７】前記分割手段は、前記第１言語文を、大
きな構文単位に分割し、その大きな構文単位に一致する
前記用例がない場合、その大きな構文単位を、より小さ
な構文単位に分割することを特徴とする請求項３に記載
の翻訳装置。
【請求項８】前記用例記憶手段は、前記用例を、その
文法属性とともに記憶していることを特徴とする請求項
１に記載の翻訳装置。
【請求項９】前記分割手段は、前記第１言語文を構文
解析することにより、前記構文単位に分割するととも
に、その文法属性を抽出し、前記検出手段は、前記構文単位および用例が有する文法
属性を考慮して、前記構文単位に類似する前記用例を検
出することを特徴とする請求項８に記載の翻訳装置。
【請求項１０】前記検出手段は、前記用例が前記構文
単位を翻訳するために用いられる事前確率と、前記用例
が前記構文単位に変形されて用いられる変形確率とに基
づいて、前記構文単位に類似する前記用例を検出するこ
とを特徴とする請求項１に記載の翻訳装置。
【請求項１１】前記変形確率は、前記用例が有する文
法属性が変形される文法属性変形確率と、前記用例を構
成する単語が変形される単語変形確率とから計算される
ことを特徴とする請求項１０に記載の翻訳装置。
【請求項１２】前記文法属性変形確率は、前記用例が有する文法属性がそのまま用いられる文法属
性複写確率と、前記用例が有する文法属性が省略される文法属性省略確
率と、前記構文単位が有する文法属性が付加される文法属性付
加確率と、前記用例が有する文法属性が、前記構文単位が有する文
法属性と置換される文法属性置換確率とから計算される
ことを特徴とする請求項１１に記載の翻訳装置。
【請求項１３】前記単語変形確率は、前記用例を構成する単語がそのまま用いられる単語複写
確率と、前記用例を構成する単語が省略される単語省略確率と、前記構文単位を構成する単語が付加される単語付加確率
と、前記用例を構成する単語が、前記構文単位を構成する単
語と置換される単語置換確率とから計算されることを特
徴とする請求項１１に記載の翻訳装置。
【請求項１４】単語を、その概念に基づいて木構造に
階層化したシソーラスを記憶しているシソーラス記憶手
段と、前記構文単位を構成する単語と、前記用例を構成する単
語との類似性を表す単語類似度を、前記シソーラスに基
づいて算出し、前記単語置換確率として出力する単語類
似度算出手段とをさらに備えることを特徴とする請求項
１３に記載の翻訳装置。
【請求項１５】前記単語類似度算出手段は、前記シソ
ーラスにおいて、前記構文単位を構成する単語と、前記
用例を構成する単語との共通の概念に包含される単語の
数に基づいて、前記単語類似度を算出することを特徴と
する請求項１４に記載の翻訳装置。
【請求項１６】前記単語変形確率は、前記用例が前記
構文単位に変形されるときの最適な変形経路にしたがっ
て計算されることを特徴とする請求項１１に記載の翻訳
装置。
【請求項１７】前記最適な変形経路は、ダイナミック
プログラミング法により求められることを特徴とする請
求項１６に記載の翻訳装置。
【請求項１８】前記単語変形確率は、前記用例を構成する単語が、そのまま若しくは前記構文
単位を構成する単語と置換され、配置位置を変えて用い
られる単語スクランブル確率と、前記用例を構成する単語に、修飾語が付加されて複合語
として用いられる単語複写／複合確率と、前記用例を構成する単語を、前記構文単位を構成する単
語と置換したものに、修飾語が付加されて複合語として
用いられる単語置換／複合確率とのうちの１以上を、さ
らに用いて計算されることを特徴とする請求項１３に記
載の翻訳装置。
【請求項１９】前記単語変形確率は、前記用例が前記
構文単位に変形されるときの最適な変形経路にしたがっ
て計算されることを特徴とする請求項１８に記載の翻訳
装置。
【請求項２０】前記最適な変形経路を求めるのに際
し、前記用例を構成する単語を真に省略することに対応
する真省略経路に代えて、前記用例を構成する単語を仮
に省略する仮省略経路を用いるとともに、前記構文単位
を構成する単語を真に付加することに対応する真付加経
路に代えて、前記構文単位を構成する単語を仮に付加す
ることに対応する仮付加経路を用い、前記仮省略経路または仮付加経路にしたがって仮に省略
または付加される単語である仮省略単語または仮付加単
語それぞれを記憶する単語記憶手段をさらに備えること
を特徴とする請求項１９に記載の翻訳装置。
【請求項２１】前記用例を構成する単語を、そのまま
若しくは前記構文単位を構成する単語と置換し、配置位
置を変えて用いることに対応するスクランブル経路は、
前記用例を構成する単語が前記仮省略単語として前記単
語記憶手段に記憶されているか、または前記構文単語を
構成する単語が前記仮付加単語として前記単語記憶手段
に記憶されているときのみ選択され、その後、前記仮省
略単語として記憶されていた前記用例を構成する単語、
または前記仮付加単語として記憶されていた前記構文単
語を構成する単語は、前記単語記憶手段から削除され、前記用例を構成する単語に、修飾語を付加して複合語と
して用いることに対応する複写／複合経路、および前記
用例を構成する単語を、前記構文単位を構成する単語と
置換したものに、修飾語を付加して複合語として用いる
ことに対応する置換／複合経路は、前記修飾語となる単
語が、前記仮付加単語として前記単語記憶手段に記憶さ
れているときのみ選択され、その後、前記仮付加単語と
して記憶されていた修飾語となる単語は、前記単語記憶
手段から削除されることを特徴とする請求項２０に記載
の翻訳装置。
【請求項２２】前記用例を前記構文単位に変形する変
形経路の終点に到達後に、前記単語記憶手段に記憶され
ている前記仮省略単語または仮付加単語を仮に省略また
は付加する仮省略経路または仮付加経路を、それぞれ真
省略経路または真付加経路にそれぞれ変換したものを、
前記最適な変形経路とすることを特徴とする請求項２１
に記載の翻訳装置。
【請求項２３】前記事前確率または変形確率は、所定
のコーパスデータに基づいて計算されることを特徴とす
る請求項１０に記載の翻訳装置。
【請求項２４】前記事前確率または変形確率は、前記
用例記憶手段に記憶されている前記用例に基づいて計算
されることを特徴とする請求項１０に記載の翻訳装置。
【請求項２５】第１の言語で表現された用例と、その
用例を第２の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第１の言語で表現さ
れた第１言語文を、前記第２の言語で表現された第２言
語文に翻訳する翻訳方法であって、前記第１言語文を、所定の構文上の単位である構文単位
に分割するステップと、前記第１言語文の前記構文単位に類似する前記用例を検
出するステップと、その検出された用例と対応付けられている前記訳文に基
づいて、前記第１言語文を、前記構文単位で翻訳するス
テップと、その構文単位の翻訳結果を合成し、前記第２言語文を生
成するステップとを備えることを特徴とする翻訳方法。
【請求項２６】第１の言語で表現された用例と、その
用例を第２の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第１の言語で表現さ
れた第１言語文を、前記第２の言語で表現された第２言
語文に翻訳する翻訳方法であって、前記第１言語文を、所定の構文上の単位である構文単位
あって、大きな構文単位から小さな構文単位に、段階的
に分割しながら、各段階において得られた構文単位と、
前記用例とを照合するステップと、その照合結果に基づいて、前記構文単位に対応する前記
用例を検出するステップと、その検出された用例と対応付けられている前記訳文に基
づいて、前記第１言語文を、前記構文単位で翻訳するス
テップと、その構文単位の翻訳結果を合成し、前記第２言語文を生
成するステップとを備えることを特徴とする翻訳方法。
【請求項２７】第１の言語で表現された第１言語文
を、第２の言語で表現された第２言語文に翻訳する翻訳
装置であって、前記第１の言語で表現された用例と、その用例を前記第
２の言語に翻訳した訳文とを対応付けて記憶している用
例記憶手段と、単語を、その概念に基づいて木構造に階層化したシソー
ラスを記憶しているシソーラス記憶手段と、前記第１言語文を構成する単語と、前記用例を構成する
単語との類似性を表す単語類似度を、前記シソーラスに
基づいて算出する算出手段と、前記算出手段により算出された前記単語類似度に基づい
て、前記第１言語文に類似する前記用例を検出する検出
手段と、前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第１言語文を翻訳する
翻訳手段とを備え、前記算出手段は、前記シソーラスにおいて、前記第１言
語文を構成する単語と、前記用例を構成する単語との共
通の概念に包含される単語の数に基づいて、前記単語類
似度を算出することを特徴とする翻訳装置。
【請求項２８】第１の言語で表現された用例と、その
用例を第２の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第１の言語で表現さ
れた第１言語文を、前記第２の言語で表現された第２言
語文に翻訳する翻訳方法であって、単語を、その概念に基づいて木構造に階層化したシソー
ラスに基づいて、前記第１言語文を構成する単語と、前
記用例を構成する単語との類似性を表す単語類似度を算
出するステップと、その単語類似度に基づいて、前記第１言語文に類似する
前記用例を検出するステップと、その検出された前記用例と対応付けられている前記訳文
に基づいて、前記第１言語文を翻訳するステップとを備
え、前記単語類似度は、前記シソーラスにおいて、前記第１
言語文を構成する単語と、前記用例を構成する単語との
共通の概念に包含される単語の数に基づいて算出される
ことを特徴とする翻訳方法。
【請求項２９】第１の言語で表現された第１言語文
を、第２の言語で表現された第２言語文に翻訳する翻訳
装置であって、前記第１の言語で表現された用例と、その用例を前記第
２の言語に翻訳した訳文とを対応付けて記憶している用
例記憶手段と、前記用例が前記第１言語文を翻訳するために用いられる
事前確率と、前記用例が前記第１言語文に変形されて用
いられる変形確率とに基づいて、前記第１言語文に類似
する前記用例を検出する検出手段と、前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第１言語文を翻訳する
翻訳手段とを備えることを特徴とする翻訳装置。
【請求項３０】前記変形確率は、前記用例が有する文
法属性が変形される文法属性変形確率と、前記用例を構
成する単語が変形される単語変形確率とから計算される
ことを特徴とする請求項２９に記載の翻訳装置。
【請求項３１】前記文法属性変形確率は、前記用例が有する文法属性がそのまま用いられる文法属
性複写確率と、前記用例が有する文法属性が省略される文法属性省略確
率と、前記第１言語文が有する文法属性が付加される文法属性
付加確率と、前記用例が有する文法属性が、前記第１言語文が有する
文法属性と置換される文法属性置換確率とから計算され
ることを特徴とする請求項３０に記載の翻訳装置。
【請求項３２】前記単語変形確率は、前記用例を構成する単語がそのまま用いられる単語複写
確率と、前記用例を構成する単語が省略される単語省略確率と、前記第１言語文を構成する単語が付加される単語付加確
率と、前記用例を構成する単語が、前記第１言語文を構成する
単語と置換される単語置換確率とから計算されることを
特徴とする請求項３０に記載の翻訳装置。
【請求項３３】前記単語変形確率は、前記用例が前記
第１言語文に変形されるときの最適な変形経路にしたが
って計算されることを特徴とする請求項２９に記載の翻
訳装置。
【請求項３４】前記最適な変形経路は、ダイナミック
プログラミング法により求められることを特徴とする請
求項３３に記載の翻訳装置。
【請求項３５】前記単語変形確率は、前記用例を構成する単語が、そのまま若しくは前記構文
単位を構成する単語と置換され、配置位置を変えて用い
られる単語スクランブル確率と、前記用例を構成する単語に、修飾語が付加されて複合語
として用いられる単語複写／複合確率と、前記用例を構成する単語を、前記構文単位を構成する単
語と置換したものに、修飾語が付加されて複合語として
用いられる単語置換／複合確率とのうちの１以上を、さ
らに用いて計算されることを特徴とする請求項３２に記
載の翻訳装置。
【請求項３６】前記単語変形確率は、前記用例が前記
構文単位に変形されるときの最適な変形経路にしたがっ
て計算されることを特徴とする請求項３５に記載の翻訳
装置。
【請求項３７】前記最適な変形経路を求めるのに際
し、前記用例を構成する単語を真に省略することに対応
する真省略経路に代えて、前記用例を構成する単語を仮
に省略する仮省略経路を用いるとともに、前記構文単位
を構成する単語を真に付加することに対応する真付加経
路に代えて、前記構文単位を構成する単語を仮に付加す
ることに対応する仮付加経路を用い、前記仮省略経路または仮付加経路にしたがって仮に省略
または付加される単語である仮省略単語または仮付加単
語それぞれを記憶する単語記憶手段をさらに備えること
を特徴とする請求項３６に記載の翻訳装置。
【請求項３８】前記用例を構成する単語を、そのまま
若しくは前記構文単位を構成する単語と置換し、配置位
置を変えて用いることに対応するスクランブル経路は、
前記用例を構成する単語が前記仮省略単語として前記単
語記憶手段に記憶されているか、または前記構文単語を
構成する単語が前記仮付加単語として前記単語記憶手段
に記憶されているときのみ選択され、その後、前記仮省
略単語として記憶されていた前記用例を構成する単語、
または前記仮付加単語として記憶されていた前記構文単
語を構成する単語は、前記単語記憶手段から削除され、前記用例を構成する単語に、修飾語を付加して複合語と
して用いることに対応する複写／複合経路、および前記
用例を構成する単語を、前記構文単位を構成する単語と
置換したものに、修飾語を付加して複合語として用いる
ことに対応する置換／複合経路は、前記修飾語となる単
語が、前記仮付加単語として前記単語記憶手段に記憶さ
れているときのみ選択され、その後、前記仮付加単語と
して記憶されていた修飾語となる単語は、前記単語記憶
手段から削除されることを特徴とする請求項３７に記載
の翻訳装置。
【請求項３９】前記用例を前記構文単位に変形する変
形経路の終点に到達後に、前記単語記憶手段に記憶され
ている前記仮省略単語または仮付加単語を仮に省略また
は付加する仮省略経路または仮付加経路を、それぞれ真
省略経路または真付加経路にそれぞれ変換したものを、
前記最適な変形経路とすることを特徴とする請求項３８
に記載の翻訳装置。
【請求項４０】第１の言語で表現された用例と、その
用例を第２の言語に翻訳した訳文とを対応付けて記憶し
ている用例記憶手段を用いて、前記第１の言語で表現さ
れた第１言語文を、前記第２の言語で表現された第２言
語文に翻訳する翻訳方法であって、前記用例が前記第１言語文を翻訳するために用いられる
事前確率と、前記用例が前記第１言語文に変形されて用
いられる変形確率とに基づいて、前記第１言語文に類似
する前記用例を検出するステップと、その検出された前記用例と対応付けられている前記訳文
に基づいて、前記第１言語文を翻訳するステップとを備
えることを特徴とする翻訳方法。
【請求項４１】第１の言語で表現された第１言語文
を、第２の言語で表現された第２言語文に翻訳する翻訳
装置であって、前記第１の言語で表現された用例と、その用例を前記第
２の言語に翻訳した訳文とを対応付け、前記用例が有す
る文法属性とともに記憶している用例記憶手段と、前記第１言語文を構文解析することにより、その文法属
性を抽出する抽出手段と、前記第１言語文に類似する前記用例を、その第１言語文
および用例が有する文法属性を考慮して検出する検出手
段と、前記検出手段により検出された前記用例と対応付けられ
ている前記訳文に基づいて、前記第１言語文を翻訳する
翻訳手段とを備えることを特徴とする翻訳装置。
【請求項４２】第１の言語で表現された用例と、その
用例を第２の言語に翻訳した訳文とを対応付け、前記用
例が有する文法属性とともに記憶している用例記憶手段
を用いて、前記第１の言語で表現された第１言語文を、
前記第２の言語で表現された第２言語文に翻訳する翻訳
方法であって、前記第１言語文を構文解析することにより、その文法属
性を抽出するステップと、前記第１言語文に類似する前記用例を、その第１言語文
および用例が有する文法属性を考慮して検出するステッ
プと、その検出された前記用例と対応付けられている前記訳文
に基づいて、前記第１言語文を翻訳するステップとを備
えることを特徴とする翻訳方法。