JPH0567144A - 前編集支援方法およびその装置 - Google Patents
前編集支援方法およびその装置Info
- Publication number
- JPH0567144A JPH0567144A JP3255839A JP25583991A JPH0567144A JP H0567144 A JPH0567144 A JP H0567144A JP 3255839 A JP3255839 A JP 3255839A JP 25583991 A JP25583991 A JP 25583991A JP H0567144 A JPH0567144 A JP H0567144A
- Authority
- JP
- Japan
- Prior art keywords
- word
- collocation
- text
- language
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 機械翻訳システムにおける構文解析の精度の
向上を図り、併せて、前編集の支援効率の向上を図るこ
とにある。 【構成】 第1の言語から第2の言語への翻訳を行う機
械翻訳システムにおいて、第1の言語のテキストを読み
込み、前記テキストを単語に分割し、複数回出現する単
語列を抽出し、前記抽出された単語列のうち、前記単語
列の出現頻度が高いまたは前記単語列中の多品詞語の個
数/割合が高い単語列を連語の候補として抽出し、前記
連語の候補のうち、ひとまとまりとして翻訳すべき連語
をユーザが選択し、前記選択した連語に翻訳援助情報と
して前編集記号を入力し、翻訳処理を行う。
向上を図り、併せて、前編集の支援効率の向上を図るこ
とにある。 【構成】 第1の言語から第2の言語への翻訳を行う機
械翻訳システムにおいて、第1の言語のテキストを読み
込み、前記テキストを単語に分割し、複数回出現する単
語列を抽出し、前記抽出された単語列のうち、前記単語
列の出現頻度が高いまたは前記単語列中の多品詞語の個
数/割合が高い単語列を連語の候補として抽出し、前記
連語の候補のうち、ひとまとまりとして翻訳すべき連語
をユーザが選択し、前記選択した連語に翻訳援助情報と
して前編集記号を入力し、翻訳処理を行う。
Description
【0001】
【産業上の利用分野】本発明は、複数文を対象とする機
械翻訳システムに係り、特に、機械翻訳システムにおけ
る前編集支援方法およびその装置に関する。
械翻訳システムに係り、特に、機械翻訳システムにおけ
る前編集支援方法およびその装置に関する。
【0002】
【従来の技術】現在の機械翻訳システムにおいては、完
全な自動翻訳を望むことは現実的ではない。そこで、翻
訳精度向上のための一手段として人手の介入を支援する
方法が提案されている。例えば、特開昭59−1405
82号公報のように、翻訳処理の援助情報を事前にある
いは翻訳処理の途中に与える方法が存在する。このよう
な方法の一つとして、文の中で一つにまとまるべき部分
を原文テキスト中で予め括弧などで囲んでおく方法は、
機械翻訳システムにおける前編集方法として一般に用い
られている。しかし、このような方法においては、援助
情報を与えるべき箇所を人間が読んで探さなければなら
ないため、工数がかかる。これを解決するために、特開
平1−35661号公報のように、援助情報を与えるべ
き箇所の候補をユーザに呈示するような前編集支援方法
も存在する。また、機械翻訳システムが主に対象とする
科学技術関係の文章においては、専門用語として複数の
単語からなる連語が頻出する。連語は、全体として一語
として扱われるべきものであり、連語を構成する単語の
訳語から連語の訳語を合成することが困難な場合があ
る。そこで、特開平1−102679号公報のように、
複数の文からなるテキストから連語を抽出する方法が存
在する。
全な自動翻訳を望むことは現実的ではない。そこで、翻
訳精度向上のための一手段として人手の介入を支援する
方法が提案されている。例えば、特開昭59−1405
82号公報のように、翻訳処理の援助情報を事前にある
いは翻訳処理の途中に与える方法が存在する。このよう
な方法の一つとして、文の中で一つにまとまるべき部分
を原文テキスト中で予め括弧などで囲んでおく方法は、
機械翻訳システムにおける前編集方法として一般に用い
られている。しかし、このような方法においては、援助
情報を与えるべき箇所を人間が読んで探さなければなら
ないため、工数がかかる。これを解決するために、特開
平1−35661号公報のように、援助情報を与えるべ
き箇所の候補をユーザに呈示するような前編集支援方法
も存在する。また、機械翻訳システムが主に対象とする
科学技術関係の文章においては、専門用語として複数の
単語からなる連語が頻出する。連語は、全体として一語
として扱われるべきものであり、連語を構成する単語の
訳語から連語の訳語を合成することが困難な場合があ
る。そこで、特開平1−102679号公報のように、
複数の文からなるテキストから連語を抽出する方法が存
在する。
【0003】
【発明が解決しようとする問題点】従来の機械翻訳にお
ける前編集支援方法においては、援助情報を与えるべき
箇所が非常に多く検出され、さらに、ユーザがそれぞれ
に個別に対処しなければならないため、作業が非常に繁
雑であるという問題点があった。また、従来、連語を抽
出する必要性の根拠として、連語を構成する単語の訳語
から適切な連語の訳語を合成することが困難である点の
みが指摘されていた。よって、従来の技術では、連語を
抽出し、これを辞書登録することによって訳語の質を向
上することを目的としている。しかし、連語を抽出し、
辞書登録することにより、適切な訳語による訳文の質の
向上に加えて、多品詞解消の失敗などを防ぐことによる
解析精度の向上も期待できる。例えば、 (例文1) Time flies like an arrow. のような例文においては、"time"を主語と考えて、"fli
es"を動詞と考えるか、それとも、"time flies"を主語
と考えて、"like"を動詞と考えるかという2通りの解釈
が存在する。これは、実際には"time"を主語と考えるの
が正しいが、人間にそれが分かるのは、"time flies"と
いう連語がおそらく存在しないことを知っているためで
あり、これは次のような例文を考えれば分かる。 (例文2) Tsetse flies like blood. この例文2においても例文1と同様の曖昧さが存在する
が、"tsetsefly"(ツェツェ蝿)という蝿が存在するこ
とを知っている人間ならば、例文1とは異なり、"tsets
e flies"を主語と考え、"like"を動詞と考えるであろ
う。しかし、これを知らない人間が読んだ場合には、ど
ちらか解釈しかねる可能性が十分考えられる。同様に、
機械翻訳においてもこのような文を解釈するために
は、"tsetse fly"をひとまとまりの連語として認識する
ことが必要である。以上、述べたように連語抽出・登録
の効果には、 1.訳語の質の向上 2.解析精度の向上 の2点がある。1.を目的とする場合には辞書登録が必
須となるが、2.を目的とする場合には、抽出した連語
に対し連語としての訳語を割り当てる必要はなく、連語
としてひとまとまりになっているという情報のみが得ら
れれば良い。実際、連語を構成する単語の訳語から連語
の訳語を合成することが可能な場合も多く、このような
場合には連語の訳語を辞書登録することは繁雑かつ不要
な作業である。さらに、抽出された連語が辞書登録する
には不適切な場合もある。実テキストから得られた連語
の候補の例を示す。 (例) excitatory and inhibitory links このような場合、"excitatory link"および"inhibitory
link"を連語として登録することは通常行われるが、
(例)のようなものは通常辞書登録されない。しかし、
(例)は並列、省略などが含まれている解析が困難な種類
の句であり、これを名詞句として、ひとまとまりだと認
識できれば、構文解析の精度の向上に役立つ。本発明の
目的は、上述の事情に鑑み、機械翻訳システムにおける
構文解析の精度の向上を図り、併せて、前編集の支援効
率の向上を図ることにある。
ける前編集支援方法においては、援助情報を与えるべき
箇所が非常に多く検出され、さらに、ユーザがそれぞれ
に個別に対処しなければならないため、作業が非常に繁
雑であるという問題点があった。また、従来、連語を抽
出する必要性の根拠として、連語を構成する単語の訳語
から適切な連語の訳語を合成することが困難である点の
みが指摘されていた。よって、従来の技術では、連語を
抽出し、これを辞書登録することによって訳語の質を向
上することを目的としている。しかし、連語を抽出し、
辞書登録することにより、適切な訳語による訳文の質の
向上に加えて、多品詞解消の失敗などを防ぐことによる
解析精度の向上も期待できる。例えば、 (例文1) Time flies like an arrow. のような例文においては、"time"を主語と考えて、"fli
es"を動詞と考えるか、それとも、"time flies"を主語
と考えて、"like"を動詞と考えるかという2通りの解釈
が存在する。これは、実際には"time"を主語と考えるの
が正しいが、人間にそれが分かるのは、"time flies"と
いう連語がおそらく存在しないことを知っているためで
あり、これは次のような例文を考えれば分かる。 (例文2) Tsetse flies like blood. この例文2においても例文1と同様の曖昧さが存在する
が、"tsetsefly"(ツェツェ蝿)という蝿が存在するこ
とを知っている人間ならば、例文1とは異なり、"tsets
e flies"を主語と考え、"like"を動詞と考えるであろ
う。しかし、これを知らない人間が読んだ場合には、ど
ちらか解釈しかねる可能性が十分考えられる。同様に、
機械翻訳においてもこのような文を解釈するために
は、"tsetse fly"をひとまとまりの連語として認識する
ことが必要である。以上、述べたように連語抽出・登録
の効果には、 1.訳語の質の向上 2.解析精度の向上 の2点がある。1.を目的とする場合には辞書登録が必
須となるが、2.を目的とする場合には、抽出した連語
に対し連語としての訳語を割り当てる必要はなく、連語
としてひとまとまりになっているという情報のみが得ら
れれば良い。実際、連語を構成する単語の訳語から連語
の訳語を合成することが可能な場合も多く、このような
場合には連語の訳語を辞書登録することは繁雑かつ不要
な作業である。さらに、抽出された連語が辞書登録する
には不適切な場合もある。実テキストから得られた連語
の候補の例を示す。 (例) excitatory and inhibitory links このような場合、"excitatory link"および"inhibitory
link"を連語として登録することは通常行われるが、
(例)のようなものは通常辞書登録されない。しかし、
(例)は並列、省略などが含まれている解析が困難な種類
の句であり、これを名詞句として、ひとまとまりだと認
識できれば、構文解析の精度の向上に役立つ。本発明の
目的は、上述の事情に鑑み、機械翻訳システムにおける
構文解析の精度の向上を図り、併せて、前編集の支援効
率の向上を図ることにある。
【0004】
【課題を解決するための手段】以上の問題を解決するた
めに、第1の言語から第2の言語への翻訳を行う機械翻
訳システムにおいて、第1の言語のテキストを読み込
み、前記テキストを単語に分割し、複数回出現する単語
列を抽出し、前記抽出された単語列のうち、前記単語列
の出現頻度が高いまたは前記単語列中の多品詞語の個数
/割合が高い単語列を連語の候補として抽出し、ユーザ
に表示し、前記連語の候補のうち、ユーザが連語として
扱って良いと指示した場合には、この指示した連語を翻
訳すべき連語としてひとまとまりとし、この連語に翻訳
援助情報として前編集記号を入力し、翻訳処理を行う。
めに、第1の言語から第2の言語への翻訳を行う機械翻
訳システムにおいて、第1の言語のテキストを読み込
み、前記テキストを単語に分割し、複数回出現する単語
列を抽出し、前記抽出された単語列のうち、前記単語列
の出現頻度が高いまたは前記単語列中の多品詞語の個数
/割合が高い単語列を連語の候補として抽出し、ユーザ
に表示し、前記連語の候補のうち、ユーザが連語として
扱って良いと指示した場合には、この指示した連語を翻
訳すべき連語としてひとまとまりとし、この連語に翻訳
援助情報として前編集記号を入力し、翻訳処理を行う。
【0005】
【作用】本発明によれば、繰返し出現する単語列を連語
の候補として抽出し、ユーザに表示し、連語として扱っ
て良いとユーザが判断した場合には、連語の候補を連語
として扱うことにより、構文解析精度が向上する。その
際、従来技術である連語を辞書登録する方法とは異な
り、連語の訳語を入力する必要がない。また、繰返し出
現する単語列を連語の候補として扱うため、ユーザがあ
る単語列を連語として指示すると、その指示は複数の箇
所に出現する同じ単語列全てに対して適用できる。その
ため、前編集の支援効率が向上する。
の候補として抽出し、ユーザに表示し、連語として扱っ
て良いとユーザが判断した場合には、連語の候補を連語
として扱うことにより、構文解析精度が向上する。その
際、従来技術である連語を辞書登録する方法とは異な
り、連語の訳語を入力する必要がない。また、繰返し出
現する単語列を連語の候補として扱うため、ユーザがあ
る単語列を連語として指示すると、その指示は複数の箇
所に出現する同じ単語列全てに対して適用できる。その
ため、前編集の支援効率が向上する。
【0006】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。第1の実施例として、本発明を機械翻訳シス
テムにおける前編集支援システムに適用した場合を詳細
に説明する。図1は、本発明のハードウェア構成図を示
す。図中、1はディスプレイ装置、2はキーボードであ
り、「モード選択キー」、「カーソルキー」、「連語選
択キー」、「親連語検索キー」、「子連語検索キー」、
「次候補キー」、「連語確定キー」(図示せず)などを
含む。3はマウス、4は入力される元の英文が格納され
る原文ファイル、5は翻訳結果である日本文が格納され
る訳文ファイル、6は辞書ファイル、7は翻訳に用いら
れる文法が格納される文法ファイル、8はメモリであ
り、後述する単語テーブル81、連語フラグテーブル8
2、連語テーブル83、親テーブル84、子テーブル8
5、表示連語テーブル86、連語状態テーブル87、ノ
ードテーブル88などを含む。9は一時的に辞書情報を
格納するために用いられるテンポラリー辞書ファイル、
10は全ての処理を行う処理装置である。
説明する。第1の実施例として、本発明を機械翻訳シス
テムにおける前編集支援システムに適用した場合を詳細
に説明する。図1は、本発明のハードウェア構成図を示
す。図中、1はディスプレイ装置、2はキーボードであ
り、「モード選択キー」、「カーソルキー」、「連語選
択キー」、「親連語検索キー」、「子連語検索キー」、
「次候補キー」、「連語確定キー」(図示せず)などを
含む。3はマウス、4は入力される元の英文が格納され
る原文ファイル、5は翻訳結果である日本文が格納され
る訳文ファイル、6は辞書ファイル、7は翻訳に用いら
れる文法が格納される文法ファイル、8はメモリであ
り、後述する単語テーブル81、連語フラグテーブル8
2、連語テーブル83、親テーブル84、子テーブル8
5、表示連語テーブル86、連語状態テーブル87、ノ
ードテーブル88などを含む。9は一時的に辞書情報を
格納するために用いられるテンポラリー辞書ファイル、
10は全ての処理を行う処理装置である。
【0007】以下、図2に示す処理フローに従って詳細
に説明する。 (ステップ11)原文ファイル4から原文テキストを読
み込む。図3に、原文テキストの例を示す。 (ステップ12)読み込んだテキスト中に出現する連語
の候補を抽出する。以下、このステップを図4に示す処
理フローを用いて詳細に説明する。
に説明する。 (ステップ11)原文ファイル4から原文テキストを読
み込む。図3に、原文テキストの例を示す。 (ステップ12)読み込んだテキスト中に出現する連語
の候補を抽出する。以下、このステップを図4に示す処
理フローを用いて詳細に説明する。
【0008】(ステップ121)テキスト中の各文を形
態素解析する。形態素解析の方法は、特開昭58−40
684号公報、特開昭59−121574号公報などに
開示された方法を用いることができるので説明は省略す
る。形態素解析結果は、単語テーブル81に格納され
る。単語テーブル81の例を図5に示す。単語テーブル
81には、テキスト中に出現した各単語について、単語
の文字列および各文中での開始文字位置および終了文字
位置が格納されている。例えば、図5の単語テーブル8
1においては、文1、単語1の欄を参照することによ
り、1番目の文の1番目の単語が、"fuzzy"であり、こ
の文字列の最初の位置が1番目の文の1文字目で、最後
の位置が5文字目であることが分かる。また、形態素解
析処理中に検索された単語の内容を辞書ファイル6から
テンポラリー辞書ファイル9に複写する。これにより、
テンポラリー辞書ファイル9には対象テキストを翻訳す
るのに必要十分な辞書情報が格納される。このテンポラ
リー辞書ファイル9を翻訳処理に用いることにより、翻
訳処理を高速化することができる。 (ステップ122)連語の候補を抽出する。以下、この
ステップを図6に示す処理フローを用いて詳細に説明す
る。
態素解析する。形態素解析の方法は、特開昭58−40
684号公報、特開昭59−121574号公報などに
開示された方法を用いることができるので説明は省略す
る。形態素解析結果は、単語テーブル81に格納され
る。単語テーブル81の例を図5に示す。単語テーブル
81には、テキスト中に出現した各単語について、単語
の文字列および各文中での開始文字位置および終了文字
位置が格納されている。例えば、図5の単語テーブル8
1においては、文1、単語1の欄を参照することによ
り、1番目の文の1番目の単語が、"fuzzy"であり、こ
の文字列の最初の位置が1番目の文の1文字目で、最後
の位置が5文字目であることが分かる。また、形態素解
析処理中に検索された単語の内容を辞書ファイル6から
テンポラリー辞書ファイル9に複写する。これにより、
テンポラリー辞書ファイル9には対象テキストを翻訳す
るのに必要十分な辞書情報が格納される。このテンポラ
リー辞書ファイル9を翻訳処理に用いることにより、翻
訳処理を高速化することができる。 (ステップ122)連語の候補を抽出する。以下、この
ステップを図6に示す処理フローを用いて詳細に説明す
る。
【0009】(ステップ12201)抽出する連語を構
成する単語数の最大値をユーザが指定する。この長さを
MXLとする。この値を大きく取れば、連語が抽出され
ずに漏れる可能性は減少するが、処理時間が長くなる。
一方、この値を小さく取れば、連語が漏れる可能性は多
くなるが、処理時間は減少するというトレードオフが存
在する。通常、4〜5程度に設定しておけば良い。 (ステップ12202)テキストから一つ文を選び、こ
れを文1とする。 (ステップ12203)文1から長さPLの単語列で連
語として抽出されていないものを単語列1として選び、
これをワークエリアに格納する。PLは、初期値が2で
あり、最大MXLまで変化する。連語として登録済みか
どうかのチェックは、連語フラグテーブル82を参照す
ることによって行う。連語フラグテーブル82の例を図
7に示す。連語フラグテーブル82の各行は、文に相当
し、各列は各文中の単語に相当する。各欄には”1”あ
るいは”0”の列が格納され、単語がi(i=2,3,
4・・・)の長さの連語の先頭の単語であることは、左
から(i−1)桁目の数字を1にすることで表現する。
例えば、文1、単語1の欄には、”100・・・”が格
納されているが、これは1番目の文の1番目の単語つま
り"fuzzy"が、長さ2の連語"fuzzy reasoning"の先頭の
単語であることを示している。 (ステップ12204)テキストから一つ文を選び、こ
れを文2とする。文2として選ばれる文は、文1以降の
文に限定する。 (ステップ12205)文2から長さPLの単語列2を
選ぶ。単語列2は、単語列1より後の単語列とする。 (ステップ12206)文1から選ばれた単語列1と文
2から選ばれた単語列2の比較を行う。もし、二つの単
語列が等しければステップ12207へ、等しくなけれ
ばステップ12208へ移る。 (ステップ12207)連語の格納処理を行う。以下、
このステップを図8に示す処理フローを用いて詳細に説
明する。
成する単語数の最大値をユーザが指定する。この長さを
MXLとする。この値を大きく取れば、連語が抽出され
ずに漏れる可能性は減少するが、処理時間が長くなる。
一方、この値を小さく取れば、連語が漏れる可能性は多
くなるが、処理時間は減少するというトレードオフが存
在する。通常、4〜5程度に設定しておけば良い。 (ステップ12202)テキストから一つ文を選び、こ
れを文1とする。 (ステップ12203)文1から長さPLの単語列で連
語として抽出されていないものを単語列1として選び、
これをワークエリアに格納する。PLは、初期値が2で
あり、最大MXLまで変化する。連語として登録済みか
どうかのチェックは、連語フラグテーブル82を参照す
ることによって行う。連語フラグテーブル82の例を図
7に示す。連語フラグテーブル82の各行は、文に相当
し、各列は各文中の単語に相当する。各欄には”1”あ
るいは”0”の列が格納され、単語がi(i=2,3,
4・・・)の長さの連語の先頭の単語であることは、左
から(i−1)桁目の数字を1にすることで表現する。
例えば、文1、単語1の欄には、”100・・・”が格
納されているが、これは1番目の文の1番目の単語つま
り"fuzzy"が、長さ2の連語"fuzzy reasoning"の先頭の
単語であることを示している。 (ステップ12204)テキストから一つ文を選び、こ
れを文2とする。文2として選ばれる文は、文1以降の
文に限定する。 (ステップ12205)文2から長さPLの単語列2を
選ぶ。単語列2は、単語列1より後の単語列とする。 (ステップ12206)文1から選ばれた単語列1と文
2から選ばれた単語列2の比較を行う。もし、二つの単
語列が等しければステップ12207へ、等しくなけれ
ばステップ12208へ移る。 (ステップ12207)連語の格納処理を行う。以下、
このステップを図8に示す処理フローを用いて詳細に説
明する。
【0010】(ステップ801)単語列の先頭の単語に
長さPLの連語であることのフラグを立てる。すなわ
ち、単語列の先頭の単語を調べ、連語フラグテーブル8
2でこの単語に相当する欄の(PL−1)桁目を1にす
る。 (ステップ802)連語テーブル83に見出しが登録さ
れているかどうか調べる。連語テーブル83の例を図9
に示す。連語テーブル83は、連語の番号、見出しを構
成する単語列、見出しを構成する単語数、連語の出現頻
度、出現位置を示している。出現位置は、連語を含む文
の文番号と連語の先頭の単語の位置の組によって示す。
登録されていればステップ803へ、登録されていなけ
ればステップ804へ移る。 (ステップ803)連語の出現頻度を1増して、新しい
出現位置、すなわち、単語列2の先頭単語の位置を登録
する。 (ステップ804)新しい見出しとして登録し、出現頻
度を2にして、2個の出現位置、すなわち、単語列1の
先頭単語の位置と単語列2の先頭単語の位置を登録す
る。
長さPLの連語であることのフラグを立てる。すなわ
ち、単語列の先頭の単語を調べ、連語フラグテーブル8
2でこの単語に相当する欄の(PL−1)桁目を1にす
る。 (ステップ802)連語テーブル83に見出しが登録さ
れているかどうか調べる。連語テーブル83の例を図9
に示す。連語テーブル83は、連語の番号、見出しを構
成する単語列、見出しを構成する単語数、連語の出現頻
度、出現位置を示している。出現位置は、連語を含む文
の文番号と連語の先頭の単語の位置の組によって示す。
登録されていればステップ803へ、登録されていなけ
ればステップ804へ移る。 (ステップ803)連語の出現頻度を1増して、新しい
出現位置、すなわち、単語列2の先頭単語の位置を登録
する。 (ステップ804)新しい見出しとして登録し、出現頻
度を2にして、2個の出現位置、すなわち、単語列1の
先頭単語の位置と単語列2の先頭単語の位置を登録す
る。
【0011】(ステップ12208)文2中の長さPL
の連語を全て処理したかどうか調べる。処理していれば
ステップ12209へ移る。処理していなければステッ
プ12205へ移り、文2から長さPLの別の単語列を
選ぶ。 (ステップ12209)文2として全ての文を処理した
かどうかを調べる。処理していればステップ12210
へ移る。処理していなければ、ステップ12204へ移
り、テキストから次の文を文2として選ぶ。 (ステップ12210)文1中の長さPLの全ての連語
を処理したかどうか調べる。処理していればステップ1
2211へ移る。処理していなければ、ステップ122
03へ移り、文1から次の長さPLの単語列を選ぶ。 (ステップ12211)文1として全ての文を処理した
かどうかを調べる。処理していればステップ12212
へ移る。処理していなければ、ステップ12202へ移
り、テキストから次の文を文1として選ぶ。 (ステップ12212)連語の候補の長さPLを更新す
る。 (ステップ12213)2以上MXL以下の全ての長さ
PLについて処理を行ったかどうか調べる。処理してい
なければ、ステップ12202へ移り、新しいPLにつ
いて処理を繰り返す。全てのPLについて処理を行って
いれば、処理を終了する。
の連語を全て処理したかどうか調べる。処理していれば
ステップ12209へ移る。処理していなければステッ
プ12205へ移り、文2から長さPLの別の単語列を
選ぶ。 (ステップ12209)文2として全ての文を処理した
かどうかを調べる。処理していればステップ12210
へ移る。処理していなければ、ステップ12204へ移
り、テキストから次の文を文2として選ぶ。 (ステップ12210)文1中の長さPLの全ての連語
を処理したかどうか調べる。処理していればステップ1
2211へ移る。処理していなければ、ステップ122
03へ移り、文1から次の長さPLの単語列を選ぶ。 (ステップ12211)文1として全ての文を処理した
かどうかを調べる。処理していればステップ12212
へ移る。処理していなければ、ステップ12202へ移
り、テキストから次の文を文1として選ぶ。 (ステップ12212)連語の候補の長さPLを更新す
る。 (ステップ12213)2以上MXL以下の全ての長さ
PLについて処理を行ったかどうか調べる。処理してい
なければ、ステップ12202へ移り、新しいPLにつ
いて処理を繰り返す。全てのPLについて処理を行って
いれば、処理を終了する。
【0012】(ステップ123)不要な連語の候補を削
除する。不要な連語の候補を除くための条件として、
(1)前置詞、接続詞などで始まる連語の候補、(2)
冠詞、前置詞、接続詞などで終わる連語の候補、(3)
be動詞やhave動詞を含む連語の候補といった条件
を設けておき、これらの条件を満たす候補を不要として
連語テーブル83から削除する。以上の処理によって、
連語の候補が抽出される。図3のテキストから抽出した
連語の候補の例を図10に示す。 (ステップ124)連語間の包含関係を構築する。連語
Aが連語Bを「包含する」あるいは「含む」とは、連語
Bを構成する単語が全て、連語B中の出現順序と同じ順
序で連語A中に出現しており、かつ連語B中に含まれな
い単語が連語A中の連語B中に現れる単語の連鎖の中に
現れないこととして定義する。例えば、"fuzzy reasoni
ng mechanism"という連語は"fuzzy reasoning"を包含す
る。また、AがBを包含するとき、AはBの親、BはA
の子であると言う。以下、包含関係を構築するステップ
を図11を用いて詳細に説明する。
除する。不要な連語の候補を除くための条件として、
(1)前置詞、接続詞などで始まる連語の候補、(2)
冠詞、前置詞、接続詞などで終わる連語の候補、(3)
be動詞やhave動詞を含む連語の候補といった条件
を設けておき、これらの条件を満たす候補を不要として
連語テーブル83から削除する。以上の処理によって、
連語の候補が抽出される。図3のテキストから抽出した
連語の候補の例を図10に示す。 (ステップ124)連語間の包含関係を構築する。連語
Aが連語Bを「包含する」あるいは「含む」とは、連語
Bを構成する単語が全て、連語B中の出現順序と同じ順
序で連語A中に出現しており、かつ連語B中に含まれな
い単語が連語A中の連語B中に現れる単語の連鎖の中に
現れないこととして定義する。例えば、"fuzzy reasoni
ng mechanism"という連語は"fuzzy reasoning"を包含す
る。また、AがBを包含するとき、AはBの親、BはA
の子であると言う。以下、包含関係を構築するステップ
を図11を用いて詳細に説明する。
【0013】(ステップ1241)連語の長さPLをス
テップ12201でユーザが入力した最大の長さMXL
に初期化する。 (ステップ1242)連語テーブル83から、長さPL
の連語を連語1として取り出す。 (ステップ1243)長さ(PL−1)の連語を連語2
として取り出す。 (ステップ1244)連語1が連語2を含むかどうか調
べる。含んでいればステップ1245へ、含んでいなけ
ればステップ1246へ移る。 (ステップ1245)包含関係を格納する。以下、この
ステップを図12を用いて説明する。
テップ12201でユーザが入力した最大の長さMXL
に初期化する。 (ステップ1242)連語テーブル83から、長さPL
の連語を連語1として取り出す。 (ステップ1243)長さ(PL−1)の連語を連語2
として取り出す。 (ステップ1244)連語1が連語2を含むかどうか調
べる。含んでいればステップ1245へ、含んでいなけ
ればステップ1246へ移る。 (ステップ1245)包含関係を格納する。以下、この
ステップを図12を用いて説明する。
【0014】(ステップ12451)親テーブル84
で、連語2に親連語が登録されているかどうか調べる。
一つでも親連語が登録されていれば、ステップ1245
2に進む。親連語が一つも登録されていなければ、ステ
ップ12453に進む。 (ステップ12452)登録済みの親連語と連語1を比
較し、連語1が未登録ならばステップ12453に進
む。 (ステップ12453)連語1を新たに連語2の親連語
として登録する。実際には、親テーブル84中で連語2
を探し、連語2に対して、親連語数を1増し、連語1の
番号を親連語欄に格納する。さらに、親連語中での子連
語の位置として、連語2の先頭の単語が、連語1の何番
目の単語かを調べ、これを親連語中の位置欄の対応する
位置に登録する。例えば、"fuzzy reasoning function"
という親連語に対して、子連語"fuzzy reasoning"の位
置は1であり、子連語"reasoning function"の位置は2
である。親テーブル84の例を図13に示す。各連語の
番号は、連語テーブル83の番号と対応している。 (ステップ12454)連語2を新たに連語1の子連語
として登録する。実際には、子テーブル85中の連語1
に対し、子連語数を1増し、連語2の番号を子連語欄に
格納する。さらに、親連語中の子連語の位置を格納す
る。子テーブル85の例を図14に示す。
で、連語2に親連語が登録されているかどうか調べる。
一つでも親連語が登録されていれば、ステップ1245
2に進む。親連語が一つも登録されていなければ、ステ
ップ12453に進む。 (ステップ12452)登録済みの親連語と連語1を比
較し、連語1が未登録ならばステップ12453に進
む。 (ステップ12453)連語1を新たに連語2の親連語
として登録する。実際には、親テーブル84中で連語2
を探し、連語2に対して、親連語数を1増し、連語1の
番号を親連語欄に格納する。さらに、親連語中での子連
語の位置として、連語2の先頭の単語が、連語1の何番
目の単語かを調べ、これを親連語中の位置欄の対応する
位置に登録する。例えば、"fuzzy reasoning function"
という親連語に対して、子連語"fuzzy reasoning"の位
置は1であり、子連語"reasoning function"の位置は2
である。親テーブル84の例を図13に示す。各連語の
番号は、連語テーブル83の番号と対応している。 (ステップ12454)連語2を新たに連語1の子連語
として登録する。実際には、子テーブル85中の連語1
に対し、子連語数を1増し、連語2の番号を子連語欄に
格納する。さらに、親連語中の子連語の位置を格納す
る。子テーブル85の例を図14に示す。
【0015】(ステップ1246)長さ(PL−1)の
連語を全て処理したかどうかを調べる。処理していれ
ば、ステップ1247へ移る。処理していなければ、ス
テップ1243へ移り、次の(PL−1)の長さの連語
を取り出す。 (ステップ1247)長さPLの連語を全て処理したか
どうか調べる。処理していれば、ステップ1248へ移
る。処理していなければ、ステップ1242へ移り、次
の長さPLの連語を取り出す。 (ステップ1248)PLを1減少させる。 (ステップ1249)PLが3以上であるかどうか調べ
る。3以上であれば、ステップ1242へ移り、新しい
PLについて処理を繰り返す。3未満になったら処理を
終了する。
連語を全て処理したかどうかを調べる。処理していれ
ば、ステップ1247へ移る。処理していなければ、ス
テップ1243へ移り、次の(PL−1)の長さの連語
を取り出す。 (ステップ1247)長さPLの連語を全て処理したか
どうか調べる。処理していれば、ステップ1248へ移
る。処理していなければ、ステップ1242へ移り、次
の長さPLの連語を取り出す。 (ステップ1248)PLを1減少させる。 (ステップ1249)PLが3以上であるかどうか調べ
る。3以上であれば、ステップ1242へ移り、新しい
PLについて処理を繰り返す。3未満になったら処理を
終了する。
【0016】(ステップ13)抽出した連語の候補のう
ち、条件を満たすものを表示すべき候補として決定す
る。表示される連語の候補が満たすべき条件としては、
以下のものを考える。(1)テキスト内の出現頻度が高
い。(2)連語の候補内の名詞/動詞の多品詞語の個数
が多い。ここで、多品詞語とは、複数の品詞となりうる
単語のことで、例えば、"fly"という英単語は、「蝿」
という意味の名詞と「飛ぶ」という意味の動詞の多品詞
語である。また、連語には親子関係が存在するため、次
のようなことが言える。例えば、"fuzzy reasoning fun
ction"という連語が存在する場合、その部分単語列であ
る"fuzzy reasoning"という連語が子連語として抽出さ
れる。このとき、"fuzzy reasoning"が"fuzzy reasonin
g function"の一部としてしか出現しないならば、"fuzz
y reasoning"を連語の候補として抽出する必要は無い。
一方、"fuzzy reasoning"のみで出現している箇所があ
る場合には、"fuzzy reasoning function"以外にも"fuz
zy reasoning"を連語の候補として抽出する必要があ
る。そこで、以下のような条件を設定する。(3)ルー
トの連語である。ここで、ルートの連語とは、親連語を
持たない連語のことである。(4)親連語が存在しない
出現位置を持つ連語である。以上の条件を満たす連語を
抽出・表示する。以下、このステップを図15を用いて
詳細に説明する。
ち、条件を満たすものを表示すべき候補として決定す
る。表示される連語の候補が満たすべき条件としては、
以下のものを考える。(1)テキスト内の出現頻度が高
い。(2)連語の候補内の名詞/動詞の多品詞語の個数
が多い。ここで、多品詞語とは、複数の品詞となりうる
単語のことで、例えば、"fly"という英単語は、「蝿」
という意味の名詞と「飛ぶ」という意味の動詞の多品詞
語である。また、連語には親子関係が存在するため、次
のようなことが言える。例えば、"fuzzy reasoning fun
ction"という連語が存在する場合、その部分単語列であ
る"fuzzy reasoning"という連語が子連語として抽出さ
れる。このとき、"fuzzy reasoning"が"fuzzy reasonin
g function"の一部としてしか出現しないならば、"fuzz
y reasoning"を連語の候補として抽出する必要は無い。
一方、"fuzzy reasoning"のみで出現している箇所があ
る場合には、"fuzzy reasoning function"以外にも"fuz
zy reasoning"を連語の候補として抽出する必要があ
る。そこで、以下のような条件を設定する。(3)ルー
トの連語である。ここで、ルートの連語とは、親連語を
持たない連語のことである。(4)親連語が存在しない
出現位置を持つ連語である。以上の条件を満たす連語を
抽出・表示する。以下、このステップを図15を用いて
詳細に説明する。
【0017】(ステップ1301)全ての連語の候補を
処理したか調べる。全て処理済みならば処理を終了す
る。処理していない連語の候補があれば、ステップ13
02に進む。 (ステップ1302)連語テーブル83から、連語の候
補を1つ読みだす。 (ステップ1303)ルートの連語であるかどうかを調
べる。ルートの連語とは、親を持たない連語である。こ
れは、親テーブル84の親連語数を参照することによっ
て判定する。ルートであればステップ1307へ進み、
ルートでなければステップ1304に進む。 (ステップ1304)連語テーブル83を参照し、出現
位置を一つ取り出す。 (ステップ1305)親テーブル84から親連語を取り
だし、連語テーブル83を参照して、ステップ1304
で取りだした連語の候補の出現位置と親連語の全ての出
現位置を比較する。ただし、出現位置は、連語が含まれ
ている文番号と連語の先頭の単語の位置の対によって表
現されているので、単純に比較することはできない。よ
って、連語の候補の親連語中の位置によって補正してか
ら比較を行う。実際には、連語の候補が出現した文と親
連語が出現した文が等しく、かつ((連語の候補の先頭
単語の位置)+1−(親連語中の位置))と親連語の先
頭単語の位置が等しければ、連語の候補のその出現位置
に親連語が存在するものとする。例えば、図9の"fuzzy
reasoning"の2番目の出現位置(2,2)は、第2文
の2番目の単語と3番目の単語が連語であることを表し
ている。ここで、親テーブル84から親連語として1番
目の連語、すなわち"fuzzy reasoning function"を取り
出す。そして、連語の候補"fuzzy reasoning"との位置
の比較を行う。親連語の位置を連語テーブル83で調べ
ると、最初の出現位置が(2,2)である。ここで、連
語の候補と親連語が出現した文が両方共第2文であり、
親連語の先頭単語の位置2と((連語の候補の先頭単語
の位置)+1−(親連語中の位置))=2+1−1=2
が等しいので、"fuzzy reasoning"の2番目の出現位置
には、親連語が存在すると言える。 (ステップ1306)全ての連語の候補の出現位置に対
し親連語が存在すれば、ステップ1301に進み、次の
連語の候補があるかどうか調べる。連語の候補が、親連
語の無い出現位置を持つ場合には、ステップ1307に
進む。 (ステップ1307)出現頻度を調べ、予め定められた
閾値よりも出現頻度が高ければステップ1309へ、低
ければステップ1308へ移る。 (ステップ1308)名詞/動詞の多品詞語の個数を調
べ、予め定められた閾値よりも高ければステップ130
9へ、低ければステップ1301へ移り、次の連語の候
補があるかどうか調べる。これにより、出現頻度が低く
ても、解析精度向上のために必要な多品詞語を多く含む
連語を抽出できる。ただし、本ステップにおいても出現
頻度の閾値を定めておき、閾値以上の連語の候補のみを
対象とするのが良い。この閾値は、ステップ1307に
おける閾値より小さくする必要がある。 (ステップ1309)表示連語テーブル86を参照し、
連語の候補の表示フラグをオンにする。そして、ステッ
プ1301に進む。図16に表示連語テーブル86の例
を示す。図16の例では、1番目の連語"fuzzy reasoni
ng function"および3番目の連語"fuzzy reasoning mec
hanism"がルートの連語であるため、フラグがオンにな
っている。また、2番目の連語"fuzzy reasoning"は、
ルートの連語ではないが、図3の第1文のように親連語
の一部としてでは無く出現する位置があるため、フラグ
がオンになっている。以上の処理によって決定された連
語の候補を表示する。連語の候補の表示モードとして
は、一覧表示およびテキスト内強調表示の2種類を用意
する。一覧表示モードは図17に示すように、表示連語
テーブル86の表示フラグがオンである全ての連語の候
補を一覧表示するものであり、テキスト内強調表示モー
ドは図18に示すように、原文テキストを表示し、さら
に原文テキスト上で連語の候補を強調して表示するもの
である。
処理したか調べる。全て処理済みならば処理を終了す
る。処理していない連語の候補があれば、ステップ13
02に進む。 (ステップ1302)連語テーブル83から、連語の候
補を1つ読みだす。 (ステップ1303)ルートの連語であるかどうかを調
べる。ルートの連語とは、親を持たない連語である。こ
れは、親テーブル84の親連語数を参照することによっ
て判定する。ルートであればステップ1307へ進み、
ルートでなければステップ1304に進む。 (ステップ1304)連語テーブル83を参照し、出現
位置を一つ取り出す。 (ステップ1305)親テーブル84から親連語を取り
だし、連語テーブル83を参照して、ステップ1304
で取りだした連語の候補の出現位置と親連語の全ての出
現位置を比較する。ただし、出現位置は、連語が含まれ
ている文番号と連語の先頭の単語の位置の対によって表
現されているので、単純に比較することはできない。よ
って、連語の候補の親連語中の位置によって補正してか
ら比較を行う。実際には、連語の候補が出現した文と親
連語が出現した文が等しく、かつ((連語の候補の先頭
単語の位置)+1−(親連語中の位置))と親連語の先
頭単語の位置が等しければ、連語の候補のその出現位置
に親連語が存在するものとする。例えば、図9の"fuzzy
reasoning"の2番目の出現位置(2,2)は、第2文
の2番目の単語と3番目の単語が連語であることを表し
ている。ここで、親テーブル84から親連語として1番
目の連語、すなわち"fuzzy reasoning function"を取り
出す。そして、連語の候補"fuzzy reasoning"との位置
の比較を行う。親連語の位置を連語テーブル83で調べ
ると、最初の出現位置が(2,2)である。ここで、連
語の候補と親連語が出現した文が両方共第2文であり、
親連語の先頭単語の位置2と((連語の候補の先頭単語
の位置)+1−(親連語中の位置))=2+1−1=2
が等しいので、"fuzzy reasoning"の2番目の出現位置
には、親連語が存在すると言える。 (ステップ1306)全ての連語の候補の出現位置に対
し親連語が存在すれば、ステップ1301に進み、次の
連語の候補があるかどうか調べる。連語の候補が、親連
語の無い出現位置を持つ場合には、ステップ1307に
進む。 (ステップ1307)出現頻度を調べ、予め定められた
閾値よりも出現頻度が高ければステップ1309へ、低
ければステップ1308へ移る。 (ステップ1308)名詞/動詞の多品詞語の個数を調
べ、予め定められた閾値よりも高ければステップ130
9へ、低ければステップ1301へ移り、次の連語の候
補があるかどうか調べる。これにより、出現頻度が低く
ても、解析精度向上のために必要な多品詞語を多く含む
連語を抽出できる。ただし、本ステップにおいても出現
頻度の閾値を定めておき、閾値以上の連語の候補のみを
対象とするのが良い。この閾値は、ステップ1307に
おける閾値より小さくする必要がある。 (ステップ1309)表示連語テーブル86を参照し、
連語の候補の表示フラグをオンにする。そして、ステッ
プ1301に進む。図16に表示連語テーブル86の例
を示す。図16の例では、1番目の連語"fuzzy reasoni
ng function"および3番目の連語"fuzzy reasoning mec
hanism"がルートの連語であるため、フラグがオンにな
っている。また、2番目の連語"fuzzy reasoning"は、
ルートの連語ではないが、図3の第1文のように親連語
の一部としてでは無く出現する位置があるため、フラグ
がオンになっている。以上の処理によって決定された連
語の候補を表示する。連語の候補の表示モードとして
は、一覧表示およびテキスト内強調表示の2種類を用意
する。一覧表示モードは図17に示すように、表示連語
テーブル86の表示フラグがオンである全ての連語の候
補を一覧表示するものであり、テキスト内強調表示モー
ドは図18に示すように、原文テキストを表示し、さら
に原文テキスト上で連語の候補を強調して表示するもの
である。
【0018】(ステップ14)表示結果を見ながら、ユ
ーザが連語として翻訳すべき連語の候補を指定する。以
下、ユーザによる選択処理の流れを、図19を用いて詳
細に説明する。
ーザが連語として翻訳すべき連語の候補を指定する。以
下、ユーザによる選択処理の流れを、図19を用いて詳
細に説明する。
【0019】(ステップ1401)ユーザは、処理の種
類を指定する。ここでは、処理の種類として、表示モー
ドの選択・変更、連語選択、辞書登録、連語確定の4種
類が用意されている。選択された処理の種類に応じて、
ステップ1402、ステップ1403、ステップ140
4、ステップ1408のいずれかへ進む。また、処理終
了が指示されたら、ステップ1409に進む。 (ステップ1402)ユーザは、表示モードを選択す
る。モード選択は、キーボード装置2における「モード
選択キー」によって行う。システムは、ユーザの指示に
従ったモードで連語の候補を表示する。ここで表示され
る連語の候補は、表示連語テーブル86のうち、表示フ
ラグがオンのものである。一覧表示においては、連語の
長さが長いものから順に表示する。また、同じ長さの連
語については、頻度の高い順に表示する。あるいは、ア
ルファベット順に表示しても良い。これらの表示順序の
指定については、ユーザによる変更が可能であるように
しておく。 (ステップ1403)ユーザが、表示されている連語の
候補のうち、ひとまとまりの連語として扱うべき連語の
候補を指定する。ここでは、指定の方法として、「カー
ソルキー」によってカーソルを指定したい連語の位置に
移動し、「連語選択キー」を押すことによって選択する
方法を用いる。どの連語が選択されているかの決定方法
は、表示モードによって異なる。一覧表示モードにおい
ては、カーソルの位置と表示データを比較することによ
ってどの連語が選択されているかを直接得られる。テキ
スト内強調表示モードにおいては、カーソルの位置と表
示データを比較して、どの単語が選択されているかを決
定したのち、さらにその単語を含む連語のうち、最も親
である連語を選択された連語として決定する。選択され
た連語は、輝度を変えるまたは色を変えるなどして強調
して表示する。また、キーボード2以外に、マウス3な
どを用いて選択することも容易にできる。以上の処理の
詳細は、パソコンやワークステーションにおけるプログ
ラムのインタフェースとして通常用いられている方法を
用いることができるので、説明を省略する。ユーザが連
語の候補を指定すると、その連語の候補は選択状態にな
る。また、一度選択状態になった連語に対して、図20
に示す連語状態テーブル87の対応する選択状態欄に1
を格納する。連語が選択状態で、「親連語検索キー」あ
るいは「子連語検索キー」が押されると、選択されてい
る連語の親あるいは子連語がそれぞれ検索される。親あ
るいは子連語の検索は、親テーブル84あるいは子テー
ブル85をそれぞれ検索し、親あるいは子連語を一つ選
択することによって行う。また、全ての親あるいは子連
語を配列に保持しておき、「次候補キー」が押された場
合には、別の親あるいは子連語を選択状態にする。一覧
表示モードにおいては、以上の情報のみで親あるいは子
連語を決定できるが、テキスト内強調表示モードにおい
ては、検索された親あるいは子連語の位置を知る必要が
あるため、さらに連語テーブル83および親テーブル8
4あるいは子テーブル85を参照して、対応する出現位
置を決定する。 (ステップ1404)辞書登録を行う。連語の候補を構
成する各単語の訳語を表示する。図21に表示例を示
す。この表示例では、"reasoning"の訳「推論」はその
まま使えるので、1を選択する。しかし、"fuzzy"につ
いては訳語が使えないので、その他の欄に「ファジー」
と入力する。もし、各単語の訳語がまったく利用できな
い場合には、連語の訳語の欄に訳語を入力する。 (ステップ1405)連語の訳語欄に訳語が入力されて
いれば、ステップ1406へ進む。入力されていなけれ
ば、ステップ1407へ進む。 (ステップ1406)各単語の訳語を合成して、連語の
訳語とする。 (ステップ1407)訳語を辞書登録する。 (ステップ1408)選択されている連語の候補を連語
として扱って良ければ、ユーザはこの連語の候補を確定
する。確定させるには、その連語の候補を選択した状態
で「連語確定キー」を押す。確定状態は、図20に示す
連語状態テーブル87の確定状態欄に1を格納すること
で管理する。 (ステップ1409)処理を終了する前に、終了処理を
行う。選択されて確定されていない連語については、ユ
ーザに指示を求める。この処理は、連語状態テーブル8
7の選択状態欄が1で確定状態欄が0の連語を連語テー
ブル83から抽出し、表示することによって行う。チェ
ック作業は、例えば次のように行われる。一覧表時モー
ドの表示例中に、"fuzzy reasoning","fuzzy reasoning
function","fuzzy reasoning mechanism"という3つの
連語が表示されている。ここで、既に述べたような方法
で"fuzzy reasoning mechanism"という連語を選択した
とする。このとき、一覧表示を見るだけでは、"fuzzy r
easoning"という連語が存在することが分かりにくい
が、「子連語検索キー」を押し、さらに次候補を検索す
ることによって、"fuzzy reasoning"が選択状態とな
り、"fuzzy reasoning"が存在することが分かる。そし
て、"fuzzy reasoning"を登録すれば、"fuzzy reasonin
g mechanism"は名詞句として処理されると考え、"fuzzy
reasoning"を確定状態にする。次に、「親連語検索キ
ー」を押し、候補を検索すると、親連語として"fuzzy r
easoning function"が見つかる。ここで、"function"
は、名詞にも動詞にも利用される多品詞語なので、"fuz
zy reasoning function"も一語として扱うことにして、
確定状態にする。また、慎重を期するには、テキスト内
強調表示モードを利用することによって、"funtion"が
動詞として使われていないことを確認してから、"fuzzy
reasoningfunction"を確定しても良い。他の例として
は、一覧表示モードの表示例において、"XXXX/1 and XX
XX/2"という連語が存在するが、このような並列の単語
列は解析誤りを生じやすいので、連語として指定するこ
とにより解析誤りを避けることができる。例えば、例文
の第2文において、 "a new function of XXXX/1 and XXXX/2" という部分があるが、これが "[[a new function of XXXX/1] and XXXX/2]" のように誤って解析されることを避けることができる。
類を指定する。ここでは、処理の種類として、表示モー
ドの選択・変更、連語選択、辞書登録、連語確定の4種
類が用意されている。選択された処理の種類に応じて、
ステップ1402、ステップ1403、ステップ140
4、ステップ1408のいずれかへ進む。また、処理終
了が指示されたら、ステップ1409に進む。 (ステップ1402)ユーザは、表示モードを選択す
る。モード選択は、キーボード装置2における「モード
選択キー」によって行う。システムは、ユーザの指示に
従ったモードで連語の候補を表示する。ここで表示され
る連語の候補は、表示連語テーブル86のうち、表示フ
ラグがオンのものである。一覧表示においては、連語の
長さが長いものから順に表示する。また、同じ長さの連
語については、頻度の高い順に表示する。あるいは、ア
ルファベット順に表示しても良い。これらの表示順序の
指定については、ユーザによる変更が可能であるように
しておく。 (ステップ1403)ユーザが、表示されている連語の
候補のうち、ひとまとまりの連語として扱うべき連語の
候補を指定する。ここでは、指定の方法として、「カー
ソルキー」によってカーソルを指定したい連語の位置に
移動し、「連語選択キー」を押すことによって選択する
方法を用いる。どの連語が選択されているかの決定方法
は、表示モードによって異なる。一覧表示モードにおい
ては、カーソルの位置と表示データを比較することによ
ってどの連語が選択されているかを直接得られる。テキ
スト内強調表示モードにおいては、カーソルの位置と表
示データを比較して、どの単語が選択されているかを決
定したのち、さらにその単語を含む連語のうち、最も親
である連語を選択された連語として決定する。選択され
た連語は、輝度を変えるまたは色を変えるなどして強調
して表示する。また、キーボード2以外に、マウス3な
どを用いて選択することも容易にできる。以上の処理の
詳細は、パソコンやワークステーションにおけるプログ
ラムのインタフェースとして通常用いられている方法を
用いることができるので、説明を省略する。ユーザが連
語の候補を指定すると、その連語の候補は選択状態にな
る。また、一度選択状態になった連語に対して、図20
に示す連語状態テーブル87の対応する選択状態欄に1
を格納する。連語が選択状態で、「親連語検索キー」あ
るいは「子連語検索キー」が押されると、選択されてい
る連語の親あるいは子連語がそれぞれ検索される。親あ
るいは子連語の検索は、親テーブル84あるいは子テー
ブル85をそれぞれ検索し、親あるいは子連語を一つ選
択することによって行う。また、全ての親あるいは子連
語を配列に保持しておき、「次候補キー」が押された場
合には、別の親あるいは子連語を選択状態にする。一覧
表示モードにおいては、以上の情報のみで親あるいは子
連語を決定できるが、テキスト内強調表示モードにおい
ては、検索された親あるいは子連語の位置を知る必要が
あるため、さらに連語テーブル83および親テーブル8
4あるいは子テーブル85を参照して、対応する出現位
置を決定する。 (ステップ1404)辞書登録を行う。連語の候補を構
成する各単語の訳語を表示する。図21に表示例を示
す。この表示例では、"reasoning"の訳「推論」はその
まま使えるので、1を選択する。しかし、"fuzzy"につ
いては訳語が使えないので、その他の欄に「ファジー」
と入力する。もし、各単語の訳語がまったく利用できな
い場合には、連語の訳語の欄に訳語を入力する。 (ステップ1405)連語の訳語欄に訳語が入力されて
いれば、ステップ1406へ進む。入力されていなけれ
ば、ステップ1407へ進む。 (ステップ1406)各単語の訳語を合成して、連語の
訳語とする。 (ステップ1407)訳語を辞書登録する。 (ステップ1408)選択されている連語の候補を連語
として扱って良ければ、ユーザはこの連語の候補を確定
する。確定させるには、その連語の候補を選択した状態
で「連語確定キー」を押す。確定状態は、図20に示す
連語状態テーブル87の確定状態欄に1を格納すること
で管理する。 (ステップ1409)処理を終了する前に、終了処理を
行う。選択されて確定されていない連語については、ユ
ーザに指示を求める。この処理は、連語状態テーブル8
7の選択状態欄が1で確定状態欄が0の連語を連語テー
ブル83から抽出し、表示することによって行う。チェ
ック作業は、例えば次のように行われる。一覧表時モー
ドの表示例中に、"fuzzy reasoning","fuzzy reasoning
function","fuzzy reasoning mechanism"という3つの
連語が表示されている。ここで、既に述べたような方法
で"fuzzy reasoning mechanism"という連語を選択した
とする。このとき、一覧表示を見るだけでは、"fuzzy r
easoning"という連語が存在することが分かりにくい
が、「子連語検索キー」を押し、さらに次候補を検索す
ることによって、"fuzzy reasoning"が選択状態とな
り、"fuzzy reasoning"が存在することが分かる。そし
て、"fuzzy reasoning"を登録すれば、"fuzzy reasonin
g mechanism"は名詞句として処理されると考え、"fuzzy
reasoning"を確定状態にする。次に、「親連語検索キ
ー」を押し、候補を検索すると、親連語として"fuzzy r
easoning function"が見つかる。ここで、"function"
は、名詞にも動詞にも利用される多品詞語なので、"fuz
zy reasoning function"も一語として扱うことにして、
確定状態にする。また、慎重を期するには、テキスト内
強調表示モードを利用することによって、"funtion"が
動詞として使われていないことを確認してから、"fuzzy
reasoningfunction"を確定しても良い。他の例として
は、一覧表示モードの表示例において、"XXXX/1 and XX
XX/2"という連語が存在するが、このような並列の単語
列は解析誤りを生じやすいので、連語として指定するこ
とにより解析誤りを避けることができる。例えば、例文
の第2文において、 "a new function of XXXX/1 and XXXX/2" という部分があるが、これが "[[a new function of XXXX/1] and XXXX/2]" のように誤って解析されることを避けることができる。
【0020】(ステップ15)ユーザが指定した連語の
候補にテキスト中で前編集記号を挿入する。ここでは、
機械翻訳システムで一般的に用いられている、前編集記
号として括弧を用いて文の一部がひとまとまりであるこ
とを指定する方法を用いる。以下、ユーザが指定した連
語に括弧を挿入する処理を図22を用いて説明する。
候補にテキスト中で前編集記号を挿入する。ここでは、
機械翻訳システムで一般的に用いられている、前編集記
号として括弧を用いて文の一部がひとまとまりであるこ
とを指定する方法を用いる。以下、ユーザが指定した連
語に括弧を挿入する処理を図22を用いて説明する。
【0021】(ステップ1501)原文テキストを作業
用テキストに複写する。 (ステップ1502)連語状態テーブル87を参照し、
確定状態欄が1である連語を連語テーブル83から選
ぶ。 (ステップ1503)連語テーブル83を参照し、連語
の最初の単語および連語の最後の単語の出現位置を得
る。 (ステップ1504)単語テーブル81を参照し、ステ
ップ1503で得た連語の最初の単語の開始文字の位置
と連語の最後の単語の終了文字の位置を得る。 (ステップ1505)作業用テキストにおいて(ステッ
プ1504で得た開始文字位置+挿入括弧数)の位置の
直前に左括弧を挿入する。また、(終了文字位置+挿入
括弧数+1)の位置の直後に右括弧を挿入する。挿入括
弧数の初期値は0である。 (ステップ1506)挿入括弧数を2増す。 (ステップ1507)連語フラグがオンである連語を全
て処理したかどうか調べる。全て処理していれば処理を
終了し、処理していなければステップ1502へ戻る。
用テキストに複写する。 (ステップ1502)連語状態テーブル87を参照し、
確定状態欄が1である連語を連語テーブル83から選
ぶ。 (ステップ1503)連語テーブル83を参照し、連語
の最初の単語および連語の最後の単語の出現位置を得
る。 (ステップ1504)単語テーブル81を参照し、ステ
ップ1503で得た連語の最初の単語の開始文字の位置
と連語の最後の単語の終了文字の位置を得る。 (ステップ1505)作業用テキストにおいて(ステッ
プ1504で得た開始文字位置+挿入括弧数)の位置の
直前に左括弧を挿入する。また、(終了文字位置+挿入
括弧数+1)の位置の直後に右括弧を挿入する。挿入括
弧数の初期値は0である。 (ステップ1506)挿入括弧数を2増す。 (ステップ1507)連語フラグがオンである連語を全
て処理したかどうか調べる。全て処理していれば処理を
終了し、処理していなければステップ1502へ戻る。
【0022】以上の処理によって、ひとまとまりの連語
として扱うべき単語列が括弧でくくられた前編集済みテ
キストが作成される。前編集済みテキストの例を図23
に示す。この前編集済みテキストを翻訳する方法は、現
在機械翻訳システムにおいて一般に用いられている方法
を用いれば良いので説明は省略する。以上説明したよう
に、本発明による前編集支援システムでは、翻訳すべき
テキストから単語列の出現頻度に基づいて連語の候補を
抽出し、抽出された連語の候補からユーザが指定したも
のをひとまとまりの連語として扱うことにより翻訳精度
が向上する。
として扱うべき単語列が括弧でくくられた前編集済みテ
キストが作成される。前編集済みテキストの例を図23
に示す。この前編集済みテキストを翻訳する方法は、現
在機械翻訳システムにおいて一般に用いられている方法
を用いれば良いので説明は省略する。以上説明したよう
に、本発明による前編集支援システムでは、翻訳すべき
テキストから単語列の出現頻度に基づいて連語の候補を
抽出し、抽出された連語の候補からユーザが指定したも
のをひとまとまりの連語として扱うことにより翻訳精度
が向上する。
【0023】本発明の第2の実施例として、本発明を英
日機械翻訳システムに適用した例を示す。以下、図24
に示す処理フローを用いて詳細に説明する。 (ステップ21)原文ファイル4から原文テキストを読
み込む。 (ステップ22)連語の候補を抽出する。本ステップ
は、第1の実施例におけるステップ12と同様の処理な
ので、詳細な説明は省略する。 (ステップ23)連語の候補から連語を選択する。本ス
テップは、第1の実施例におけるステップ13の表示す
べき連語の候補決定処理と同様なので詳細な説明は省略
する。ただし、第2の実施例においては、連語を自動的
に抽出するため、意味の無い単語列を連語として抽出す
ることを避けるために、連語の候補として抽出するため
の出現頻度の閾値は、第1の実施例において設定された
値より高い方が望ましい。 (ステップ24)一文毎に翻訳処理を行う。以下、この
ステップを図25を用いて説明する。
日機械翻訳システムに適用した例を示す。以下、図24
に示す処理フローを用いて詳細に説明する。 (ステップ21)原文ファイル4から原文テキストを読
み込む。 (ステップ22)連語の候補を抽出する。本ステップ
は、第1の実施例におけるステップ12と同様の処理な
ので、詳細な説明は省略する。 (ステップ23)連語の候補から連語を選択する。本ス
テップは、第1の実施例におけるステップ13の表示す
べき連語の候補決定処理と同様なので詳細な説明は省略
する。ただし、第2の実施例においては、連語を自動的
に抽出するため、意味の無い単語列を連語として抽出す
ることを避けるために、連語の候補として抽出するため
の出現頻度の閾値は、第1の実施例において設定された
値より高い方が望ましい。 (ステップ24)一文毎に翻訳処理を行う。以下、この
ステップを図25を用いて説明する。
【0024】(ステップ241)形態素解析処理を行
う。形態素解析処理については、特開昭58−4068
4号公報、特開昭59−121574号公報などに開示
の方法を用いることができるので、詳細な説明は省略す
る。形態素解析は連語抽出においても行われるので、処
理速度を上げるために、その結果を保持しておいて利用
することも可能であり、メモリ容量などのハードウェア
上の制約があれば、本ステップにおいてやりなおしても
良い。また、やり直す際にも、テンポラリー辞書ファイ
ル9を用いることにより翻訳処理を高速化することがで
きる。 (ステップ242)連語テーブル83から、各文に含ま
れている連語を取り出す。 (ステップ243)翻訳に用いられるノードテーブル8
8において、連語を構成する単語をまとめて一つのノー
ドにする。図26に、ノードテーブル88の例を示す。
ノードテーブル88は、文の解析結果が格納されるもの
である。図26のノードテーブル88の内容を模式的に
示すと図27のようになる。 (ステップ244)文に含まれている全ての連語を処理
したかどうか調べる。全て処理していたら終了する。処
理していなければ、ステップ242へ進む。 (ステップ245)構文解析、構文変換、生成などの翻
訳処理を行う。各処理については、特開昭58−406
84号公報、特開昭59−121574号公報などに開
示の方法を用いることができるので、詳細な説明は省略
する。 以上の実施例では、自動的に連語選択を行ったが、第1
の実施例と同様に、ユーザが連語を指定するステップを
加えることも可能である。
う。形態素解析処理については、特開昭58−4068
4号公報、特開昭59−121574号公報などに開示
の方法を用いることができるので、詳細な説明は省略す
る。形態素解析は連語抽出においても行われるので、処
理速度を上げるために、その結果を保持しておいて利用
することも可能であり、メモリ容量などのハードウェア
上の制約があれば、本ステップにおいてやりなおしても
良い。また、やり直す際にも、テンポラリー辞書ファイ
ル9を用いることにより翻訳処理を高速化することがで
きる。 (ステップ242)連語テーブル83から、各文に含ま
れている連語を取り出す。 (ステップ243)翻訳に用いられるノードテーブル8
8において、連語を構成する単語をまとめて一つのノー
ドにする。図26に、ノードテーブル88の例を示す。
ノードテーブル88は、文の解析結果が格納されるもの
である。図26のノードテーブル88の内容を模式的に
示すと図27のようになる。 (ステップ244)文に含まれている全ての連語を処理
したかどうか調べる。全て処理していたら終了する。処
理していなければ、ステップ242へ進む。 (ステップ245)構文解析、構文変換、生成などの翻
訳処理を行う。各処理については、特開昭58−406
84号公報、特開昭59−121574号公報などに開
示の方法を用いることができるので、詳細な説明は省略
する。 以上の実施例では、自動的に連語選択を行ったが、第1
の実施例と同様に、ユーザが連語を指定するステップを
加えることも可能である。
【0025】本実施例によれば、翻訳処理を行う前に、
予め連語を抽出しておき、構文解析処理の前に、連語を
一つにまとめる連語処理を行うことによって、構文解析
精度を向上させることができる。
予め連語を抽出しておき、構文解析処理の前に、連語を
一つにまとめる連語処理を行うことによって、構文解析
精度を向上させることができる。
【0026】
【発明の効果】本発明によれば、繰返し出現する単語列
を連語の候補として抽出し、ユーザに表示し、連語とし
て扱って良いとユーザが判断した場合には、連語の候補
を連語として扱うことにより、連語の訳語を登録するこ
となしに、動詞/名詞の認識誤りが減少し、解析精度が
向上する。訳語登録が不要なため、辞書登録が不必要あ
るいは不適切な連語に対して、特に有効である。また、
従来の前編集支援方法と比較すると、繰返し出現する単
語列を連語の候補として扱うため、一度の指示が複数の
箇所に対し有効なので、前編集作業が効率的に行える。
を連語の候補として抽出し、ユーザに表示し、連語とし
て扱って良いとユーザが判断した場合には、連語の候補
を連語として扱うことにより、連語の訳語を登録するこ
となしに、動詞/名詞の認識誤りが減少し、解析精度が
向上する。訳語登録が不要なため、辞書登録が不必要あ
るいは不適切な連語に対して、特に有効である。また、
従来の前編集支援方法と比較すると、繰返し出現する単
語列を連語の候補として扱うため、一度の指示が複数の
箇所に対し有効なので、前編集作業が効率的に行える。
【図1】本発明のハードウェア構成図である。
【図2】本発明の全体的な処理フローである。
【図3】処理対象となるテキストの例である。
【図4】連語の候補抽出の処理フローである。
【図5】単語テーブル81の例である。
【図6】連語の候補抽出の処理フローである。
【図7】連語フラグテーブル82の例である。
【図8】連語格納処理の処理フローである。
【図9】連語テーブル83の例である。
【図10】抽出される連語の例である。
【図11】連語間の包含関係構築の処理フローである。
【図12】親テーブル84、子テーブル85への包含関
係格納の処理フローである。
係格納の処理フローである。
【図13】親テーブル84の例である。
【図14】子テーブル85の例である。
【図15】表示すべき連語の候補決定の処理フローであ
る。
る。
【図16】表示連語テーブル86の例である。
【図17】連語の候補の一覧表示の表示例である。
【図18】テキスト内強調表示の表示例である。
【図19】ユーザによる連語選択の処理フローである。
【図20】連語状態テーブル87の例である。
【図21】ユーザによる連語の訳語登録画面の表示例で
ある。
ある。
【図22】前編集記号挿入の処理フローである。
【図23】前編集が済んだテキストの例である。
【図24】第2の実施例の全体の処理フローである。
【図25】第2の実施例における翻訳処理の処理フロー
である。
である。
【図26】翻訳処理に用いられるノードテーブル88の
例である。
例である。
【図27】ノードテーブル88の模式図の例である。
1 ディスプレイ装置 2 キーボード 3 マウス 4 入力される元の英文が格納される原文ファイル 5 翻訳結果が格納される訳文ファイル 6 辞書ファイル 7 翻訳に用いられる文法が格納される文法ファイル 8 テーブル類が保持されるメモリ 9 連語抽出に用いられた辞書情報が格納されるテンポ
ラリー辞書ファイル 10 処理装置
ラリー辞書ファイル 10 処理装置
Claims (8)
- 【請求項1】 第1の言語から第2の言語への翻訳を行
う機械翻訳システムにおいて、第1の言語のテキストを
読み込み、前記テキストを単語に分割し、複数回出現す
る単語列を抽出し、前記抽出された単語列のうち、所定
条件を満たす単語列を連語の候補として抽出し、前記連
語の候補のうち、ひとまとまりとして翻訳すべき連語を
ユーザが選択し、前記選択した連語に翻訳援助情報を入
力することを特徴とする前編集支援方法。 - 【請求項2】 請求項1の前編集支援方法において、ユ
ーザが選択した連語の候補を前記テキスト中で検索し、
翻訳援助情報として前編集記号を前記テキストに挿入す
ることを特徴とする前編集支援方法。 - 【請求項3】 請求項1の前編集支援方法において、前
記連語の候補として選ばれる単語列が満たすべき条件と
して、前記単語列の出現頻度を用いること、または、前
記単語列中の多品詞語の個数/割合を用いることを特徴
とする前編集支援方法。 - 【請求項4】 請求項1の前編集支援方法において、前
記抽出された連語の候補のうち、ユーザが指定した連語
について、連語の候補を構成する単語の訳語をユーザに
呈示し、訳語に不満な場合にはユーザが訳語を入力する
ことを特徴とする前編集支援方法。 - 【請求項5】 第1の言語から第2の言語への翻訳を行
う機械翻訳システムにおける自動前編集方法であって、
第1の言語によるテキストを読み込み、前記テキストを
単語に分割し、複数回出現する単語列を連語として抽出
し、前記抽出された連語をひとまとまりの要素として扱
い、第2の言語に翻訳することを特徴とする前編集方
法。 - 【請求項6】 第1の言語から第2の言語への翻訳を行
う機械翻訳システムにおける前編集支援装置であって、
第1の言語のテキストを読み込む手段と、前記テキスト
を単語に分割する手段と、複数回出現する単語列を抽出
する手段と、前記抽出された単語列のうち、所定条件を
満たす単語列を連語の候補として抽出する手段と、前記
連語の候補のうち、ひとまとまりとして翻訳すべき連語
をユーザが選択する手段と、前記選択した連語に翻訳援
助情報を入力する手段を有することを特徴とする前編集
支援装置。 - 【請求項7】 請求項6の前編集支援装置において、ユ
ーザが選択した連語の候補を前記テキスト中で検索する
手段と、翻訳援助情報として前編集記号を前記テキスト
に挿入する手段を有することを特徴とする前編集支援装
置。 - 【請求項8】 第1の言語から第2の言語への翻訳を行
う機械翻訳システムにおける自動前編集装置であって、
第1の言語によるテキストを読み込む手段と、前記テキ
ストを単語に分割する手段と、複数回出現する単語列を
連語として抽出する手段と、前記抽出された連語をひと
まとまりの要素として扱う手段と、第2の言語に翻訳す
る手段を有することを特徴とする前編集装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3255839A JPH0567144A (ja) | 1991-09-07 | 1991-09-07 | 前編集支援方法およびその装置 |
| US07/942,030 US5396419A (en) | 1991-09-07 | 1992-09-08 | Pre-edit support method and apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3255839A JPH0567144A (ja) | 1991-09-07 | 1991-09-07 | 前編集支援方法およびその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0567144A true JPH0567144A (ja) | 1993-03-19 |
Family
ID=17284313
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3255839A Pending JPH0567144A (ja) | 1991-09-07 | 1991-09-07 | 前編集支援方法およびその装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5396419A (ja) |
| JP (1) | JPH0567144A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100286649B1 (ko) * | 1996-06-27 | 2001-04-16 | 이구택 | 연어패턴에 기초한 어휘 변환방법 |
| KR100463376B1 (ko) * | 2002-12-10 | 2004-12-29 | 한국전자통신연구원 | 원시언어를 대상언어로 번역하기 위한 번역엔진 장치 및 그 번역방법 |
| JP2014238690A (ja) * | 2013-06-07 | 2014-12-18 | コニカミノルタ株式会社 | 操作支援プログラム及び操作支援方法並びに情報処理装置 |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
| US5748512A (en) * | 1995-02-28 | 1998-05-05 | Microsoft Corporation | Adjusting keyboard |
| JPH08329105A (ja) * | 1995-05-31 | 1996-12-13 | Canon Inc | 文書処理方法及びその装置 |
| CN1304988C (zh) * | 1996-10-16 | 2007-03-14 | 夏普公司 | 字符输入装置 |
| EP0867815A3 (en) * | 1997-03-26 | 2000-05-31 | Kabushiki Kaisha Toshiba | Translation service providing method and translation service system |
| IL121457A (en) | 1997-08-03 | 2004-06-01 | Guru Internat Inc | Computerized dictionary and thesaurus applications |
| US6629074B1 (en) | 1997-08-14 | 2003-09-30 | International Business Machines Corporation | Resource utilization indication and commit mechanism in a data processing system and method therefor |
| US6338033B1 (en) * | 1999-04-20 | 2002-01-08 | Alis Technologies, Inc. | System and method for network-based teletranslation from one natural language to another |
| US6446036B1 (en) | 1999-04-20 | 2002-09-03 | Alis Technologies, Inc. | System and method for enhancing document translatability |
| US20030065503A1 (en) * | 2001-09-28 | 2003-04-03 | Philips Electronics North America Corp. | Multi-lingual transcription system |
| JP3813911B2 (ja) * | 2002-08-22 | 2006-08-23 | 株式会社東芝 | 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム |
| JP4001283B2 (ja) * | 2003-02-12 | 2007-10-31 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 形態素解析装置および自然言語処理装置 |
| US20040243531A1 (en) * | 2003-04-28 | 2004-12-02 | Dean Michael Anthony | Methods and systems for representing, using and displaying time-varying information on the Semantic Web |
| JP2006276903A (ja) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | 文書処理装置 |
| JP2008152670A (ja) * | 2006-12-19 | 2008-07-03 | Fujitsu Ltd | 翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法 |
| US8131536B2 (en) * | 2007-01-12 | 2012-03-06 | Raytheon Bbn Technologies Corp. | Extraction-empowered machine translation |
| US7890539B2 (en) * | 2007-10-10 | 2011-02-15 | Raytheon Bbn Technologies Corp. | Semantic matching using predicate-argument structure |
| JP2019066917A (ja) * | 2017-09-28 | 2019-04-25 | 京セラドキュメントソリューションズ株式会社 | 電子機器、及び翻訳支援方法 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5840684A (ja) * | 1981-09-04 | 1983-03-09 | Hitachi Ltd | 自然言語間の自動翻訳方式 |
| JPS59121574A (ja) * | 1982-12-28 | 1984-07-13 | Fujitsu Ltd | 翻訳処理方式 |
| JPS59140582A (ja) * | 1983-01-31 | 1984-08-11 | Hitachi Ltd | 自然言語翻訳援助方式 |
| JPH0664585B2 (ja) * | 1984-12-25 | 1994-08-22 | 株式会社東芝 | 翻訳編集装置 |
| JPS61184685A (ja) * | 1985-02-12 | 1986-08-18 | Hitachi Ltd | 翻訳情報追加方法 |
| DE3616011A1 (de) * | 1985-05-14 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungsgeraet |
| JP2654001B2 (ja) * | 1986-05-08 | 1997-09-17 | 株式会社東芝 | 機械翻訳方法 |
| JPS6435661A (en) * | 1987-07-30 | 1989-02-06 | Hitachi Ltd | Pre-edition supporting system |
| JPS6466777A (en) * | 1987-09-08 | 1989-03-13 | Sharp Kk | Mechanical translation device |
| JP2590141B2 (ja) * | 1987-10-15 | 1997-03-12 | 富士通株式会社 | 連語抽出処理方法 |
-
1991
- 1991-09-07 JP JP3255839A patent/JPH0567144A/ja active Pending
-
1992
- 1992-09-08 US US07/942,030 patent/US5396419A/en not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100286649B1 (ko) * | 1996-06-27 | 2001-04-16 | 이구택 | 연어패턴에 기초한 어휘 변환방법 |
| KR100463376B1 (ko) * | 2002-12-10 | 2004-12-29 | 한국전자통신연구원 | 원시언어를 대상언어로 번역하기 위한 번역엔진 장치 및 그 번역방법 |
| JP2014238690A (ja) * | 2013-06-07 | 2014-12-18 | コニカミノルタ株式会社 | 操作支援プログラム及び操作支援方法並びに情報処理装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5396419A (en) | 1995-03-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5890103A (en) | Method and apparatus for improved tokenization of natural language text | |
| JPH0567144A (ja) | 前編集支援方法およびその装置 | |
| JP4544674B2 (ja) | 選択文字列に関連する情報を提供するシステム | |
| JP4459443B2 (ja) | 中国語テキストにおける単語分割 | |
| EP0645720B1 (en) | Dictionary creation supporting system | |
| WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
| JPH0411906B2 (ja) | ||
| JPH08292955A (ja) | 言語処理方法及びそれを適用するデータ処理装置 | |
| JPS6170660A (ja) | 機械翻訳システムにおける多義表示・選択方法 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JP2893239B2 (ja) | 翻訳支援辞書検索表示システム | |
| JPH03260764A (ja) | 翻訳用辞書登録方式 | |
| JP2730308B2 (ja) | 自然言語解析方式 | |
| JPH04367073A (ja) | 機械翻訳システムにおける文法作成支援方法 | |
| JPH1021242A (ja) | 機械翻訳装置及び機械翻訳後編集方法 | |
| JP2880600B2 (ja) | 単語列翻訳装置 | |
| JPS62282364A (ja) | 文字列検索方式 | |
| JPH11259473A (ja) | 機械翻訳装置及び機械翻訳方法 | |
| JPH05225232A (ja) | テキスト自動前編集装置 | |
| JPH0778166A (ja) | 翻訳方法及び機械翻訳装置 | |
| JPS6250961A (ja) | 翻訳処理装置 | |
| JPH0973454A (ja) | 文書作成装置及び文書作成方法 | |
| JPH0444981B2 (ja) | ||
| JPH05334347A (ja) | 翻訳装置 | |
| JPS6244872A (ja) | 機械翻訳装置 |