JPH06162070A

JPH06162070A - 機械翻訳システムの辞書作成方法

Info

Publication number: JPH06162070A
Application number: JP4335548A
Authority: JP
Inventors: Yasutsugu Morimoto; 康嗣森本; Hiroyuki Kaji; 博行梶
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1992-11-21
Filing date: 1992-11-21
Publication date: 1994-06-10
Anticipated expiration: 2018-02-04
Also published as: JP3372977B2

Abstract

(57)【要約】【目的】ユーザが必要と考えられる用語を自動的に基本
辞書・専門用語辞書に登録することができ、また各ユー
ザが重複した用語をそれぞれ登録するという無駄な工数
の発生を抑えることのできる機械翻訳システムの辞書作
成方法を提供することを目的とする。【構成】複数のユーザ辞書の見出しを参照し、複数のユ
ーザ辞書に共通して登録されている単語を検出し、検出
した単語と訳語の対に対して分野を決定し、特定の分野
のみに使われている単語と訳語は専門用語辞書に格納
し、そうでない単語は基本辞書に格納する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、機械翻訳システムに用
いる辞書の作成方法に関し、特に複数の辞書を組合せて
翻訳を行う機械翻訳システムにおける辞書作成方法に関
する。

【０００２】

【従来の技術】現在、機械翻訳システムは、実用化の時
代を迎えている。その主な理由の一つは、辞書・文法の
ような翻訳に用いる知識ベースをテキストの文種や分野
に応じてカスタマイズすることにより、翻訳精度を向上
させることができるようになったためである。例えば、
辞書のカスタマイズとしては、以下のようなことが行わ
れている。

【０００３】通常、辞書中の一つの見出し語に対し、複
数の訳語が存在するため、翻訳の際には適切な訳語を選
択する処理が必要となる。そのような処理は、翻訳精度
・処理速度の低下を招く上に、常に正しい訳語を選択す
ることは困難である。しかし、ある分野、あるユーザの
みに限定すれば、一つの見出し語の訳語を一つに限定で
きる場合がある。

【０００４】例えば、"process" という単語には、「過
程」、「経過」、「方法」、「訴訟手続き」、「突
起」、「プロセス」などの訳語があるが、情報分野のテ
キストを翻訳する場合には、「プロセス」以外の訳語が
使われることはまれである。そこで、"process" という
見出し語に対して、「プロセス」という訳語のみを登録
した辞書を作成し、情報分野のテキストを翻訳する場合
には、この辞書を用いるようにする。これにより、訳語
を選択する処理が不要となり、しかも、ほとんどの場合
正しい訳語が得られる。このように、分野・使用ユーザ
を特定し、見出し語に対する訳語を１個に絞った辞書を
作成することで翻訳精度・処理速度を向上させることが
できる。

【０００５】通常は、いわゆる基本辞書に加えて、各分
野毎に専門用語辞書が用意されており、各分野で最も可
能性の高い訳語が与えられている。また、ユーザ固有の
特殊な用語については、ユーザ辞書を各ユーザが用意し
て、自分が所望する訳語を与えることもできる。

【０００６】

【発明が解決しようとする課題】しかし、上述の従来の
技術では次のような問題点があった。

【０００７】即ち、言語は常に変化しているものであ
り、辞書のバージョンアップが常に必要である。特に、
機械翻訳が対象とする科学技術分野においては、常に新
しい技術が開発され、これに伴って新しい用語が必要と
なる。したがって、科学技術分野のテキストを翻訳する
ためには、常に新しい用語を辞書に追加していく必要が
ある。

【０００８】これに対処するために、ユーザは各々が必
要とする用語の辞書をユーザ辞書に作成する。また、シ
ステム開発者によって、基本辞書および専門用語辞書の
バージョンアップも行われる。しかし、これら二つは従
来は独立して別個に行われていた。このため、専門用語
辞書に登録される用語が本当にユーザに必要な用語であ
ることが保証されておらず、ユーザのニーズが高くない
用語が登録されている可能性がある。また、ユーザ間の
ユーザ辞書作成も独立に行われるため、既に他ユーザが
作成している用語を重複して登録するという無駄な工数
が発生する可能性がある。

【０００９】本発明は、上述の従来例における問題点に
鑑み、ユーザが必要と考えられる用語を自動的に基本辞
書・専門用語辞書に登録することができ、また各ユーザ
が重複した用語をそれぞれ登録するという無駄な工数の
発生を抑えることのできる機械翻訳システムの辞書作成
方法を提供することを目的とする。

【００１０】

【課題を解決するための手段】上記の目的を達成するた
めに、本発明は、複数のユーザが利用する基本辞書、複
数のユーザが利用する分野別の専門用語辞書、およびユ
ーザ毎に独自の用語を格納するユーザ辞書を利用する機
械翻訳システムの辞書作成方法であって、複数のユーザ
辞書の見出し語を参照して、ユーザ辞書に共通して登録
されている見出し語を検出するステップと、前記検出し
た見出し語の訳語を各ユーザ辞書から取り出し、前記見
出し語と前記訳語の対に対して、分野を特定するステッ
プと、前記見出し語と訳語の対を、前記特定された分野
の専門用語辞書に格納するステップとを備えたことを特
徴とする。

【００１１】特定された分野が一般用語の分野であると
きは、見出し語と訳語の対を基本辞書に格納し、特定さ
れた分野が専門用語の分野であるときは、見出し語と訳
語の対をその特定された分野の専門用語辞書に格納する
ようにするとよい。また、予め定められた閾値以上の数
のユーザ辞書に共通して登録されている見出し語を検出
して、基本辞書や専門用語辞書に登録するようにすると
よい。

【００１２】また、本発明は、複数のユーザが利用する
基本辞書、複数のユーザが利用する分野別の専門用語辞
書、およびユーザ毎に独自の用語を格納するユーザ辞書
を利用する機械翻訳システムの辞書作成方法であって、
翻訳の際に未知語となった用語を、登録したい見出し語
として、指定するステップと、複数のユーザ辞書の見出
し語を参照して、前記指定された見出し語が、ユーザ辞
書に共通して登録されているかどうかを調べ、ユーザ辞
書に共通に登録されている場合には、それらのユーザ辞
書から前記見出し語の訳語を取り出すステップと、前記
見出し語と前記取り出した訳語の対に対して、分野を特
定するステップと、前記見出し語と訳語の対を、前記特
定された分野の専門用語辞書に格納するステップとを備
えたことを特徴とする。

【００１３】この発明についても、特定された分野が一
般用語の分野であるときは、見出し語と訳語の対を基本
辞書に格納し、特定された分野が専門用語の分野である
ときは、見出し語と訳語の対をその特定された分野の専
門用語辞書に格納するようにするとよい。また、指定さ
れた見出し語が、所定の閾値以上の数のユーザ辞書に共
通に登録されている場合に、それらを基本辞書や専門用
語辞書に登録するようにするとよい。この場合、指定さ
れた見出し語が所定の閾値未満の数のユーザ辞書に登録
されている場合には、その見出し語の訳語をユーザ辞書
から取り出し、その見出し語を指定したユーザのユーザ
辞書に登録するようにしてもよい。

【００１４】

【作用】複数のユーザ辞書の見出しを参照し、複数のユ
ーザ辞書に共通して登録されている用語を基本辞書・専
門用語辞書に登録するようにしているので、ユーザが必
要としている用語が基本辞書・専門用語辞書に登録され
ることとなり、あるユーザが作成した用語を他のユーザ
が利用することができる。また、ある分野において特定
の訳語しか用いられない見出し語は、専門用語辞書に登
録され、分野によって訳語が特定できない見出し語につ
いては、一般用語として基本辞書に登録される。

【００１５】

【実施例】以下、図面を用いて、本発明の実施例を説明
する。ここで説明する実施例は、本発明を分散型機械翻
訳システムに適用した例である。

【００１６】図１は、本実施例の分散型機械翻訳システ
ムのシステム構成図を示す。図中、１は翻訳サーバであ
り、翻訳エンジン、文法、基本辞書、分野別の専門用語
辞書、およびユーザ毎のユーザ辞書Ｄ１を備えている。
２，３，４はそれぞれクライアントであり、各々がユー
ザ毎のユーザ辞書Ｄ２，Ｄ３，Ｄ４を備えている。

【００１７】クライアント２，３，４を使用するユーザ
は、そのクライアントが持つユーザ辞書Ｄ２，Ｄ３，Ｄ
４または翻訳サーバ１上にあるユーザ辞書Ｄ１と、翻訳
サーバ１上にある基本辞書および専門用語辞書を組合
せ、翻訳サーバ１上の翻訳エンジンと文法を用いて、翻
訳処理を行う。なお、本実施例では、基本辞書と各分野
毎の専門用語辞書を別のファイルとして記述している
が、これらを１つのファイルに格納し、ラベルなどを付
加することによって、区別するような方法を用いても構
わない。

【００１８】図１の翻訳システムでは、各ユーザが作成
したユーザ辞書に共通に含まれている用語を基本辞書・
専門用語辞書に自動的に登録できるようになっている。

【００１９】以下、図２に示す処理フローチャートにし
たがって、図１のシステムでユーザ辞書の用語を基本辞
書・専門用語辞書に登録する際の全体の処理の流れを説
明する。

【００２０】（ステップ１１）まず、サーバマシン１上
にあるユーザ辞書Ｄ１およびネットワークで接続されて
いるクライアントマシン２，３，４上にあるユーザ辞書
Ｄ２，Ｄ３，Ｄ４を参照し、専門用語辞書・基本辞書に
登録すべき用語の候補を選択する。また、選択された用
語をどの辞書に登録すべきかを決定するため、その用語
の分野を決定する。処理結果は、専門用語候補テーブル
に格納する。本ステップは、後に詳細に説明する。

【００２１】図３に、専門用語候補テーブルの例を示
す。専門用語候補テーブルは、見出し語、その見出し語
の訳語、および分野を記載する欄を備えている。

【００２２】なお、本ステップでは、ネットワークで接
続されているすべてのマシンについて処理を行っている
が、実際にはサーバ側で処理対象とするクライアントの
アドレスのリストを保持し、このリストに記載されてい
るクライアントのみを処理対象とするのが良い。

【００２３】（ステップ１２）次に、専門用語候補テー
ブル（図３）を参照し、各見出し語毎に記述されている
分野の専門用語辞書に見出し語と訳語を登録する。ただ
し、分野が「一般」となっている場合には、基本辞書に
登録する。例えば、図３の例の場合、"generation"→
「生成」は、分野が「言語」であるので言語分野の専門
用語辞書に格納する。また、"generation"→「世代」
は、分野が「一般」であるので基本辞書に格納する。

【００２４】（ステップ１３）次に、ユーザ辞書中の用
語を基本辞書・専門用語辞書に登録した旨をユーザに通
知する。この通知は、（見出し語、訳語、分野）という
リストを出力することにより行われる。ユーザは、この
リストを見て、専門辞書に新たな用語が登録されたこと
を知ることができる。また、自分がユーザ辞書に登録し
ていた用語が、専門用語辞書に登録された場合には、ユ
ーザ辞書中の用語を削除することによって、メモリの無
駄を避けることができる。

【００２５】以下、図２のステップ１１の専門用語候補
・分野選択処理を、図４に示す処理フローチャートにし
たがって詳細に説明する。

【００２６】（ステップ１１１）まず、すべてのユーザ
辞書Ｄ１〜Ｄ４を参照し、辞書管理テーブルを作成す
る。

【００２７】図５は、ユーザ辞書の例を示す。ユーザ辞
書には、見出し語、訳語、意味素性のような翻訳に必要
な情報とともに、その用語が使用された分野および分野
毎の使用頻度が格納されている。ここで、使用された分
野は、ユーザ辞書中の訳語が使用された際に、同時に使
用されていた専門用語辞書の分野を用いる。図５の例に
おいて、ユーザ辞書Ｄ１には、"generation"という見出
し語に対して、「発生」という訳語が与えられており、
この用語が生物分野の辞書と５０回、化学分野の辞書と
４０回、それぞれ一緒に使用されたことが分かる。

【００２８】図６は、辞書管理テーブルの例を示す。図
６の辞書管理テーブルは、ユーザ辞書中にあるすべての
見出し語のリストに対し、各見出し語のすべてのユーザ
における総使用頻度とユーザ辞書番号のリストからな
る。なお、ユーザ辞書Ｄ１のユーザ辞書番号は「１」、
ユーザ辞書Ｄ２のユーザ辞書番号は「２」、ユーザ辞書
Ｄ３のユーザ辞書番号は「３」、ユーザ辞書Ｄ４のユー
ザ辞書番号は「４」とする。

【００２９】図６の例では、"generation"という単語
は、すべてのユーザにおける総使用頻度が１７０回であ
り、ユーザ辞書Ｄ１、ユーザ辞書Ｄ３、およびユーザ辞
書Ｄ４に含まれている。１７０回というのは、ユーザ辞
書Ｄ１での使用頻度が５０＋４０＝９０回、ユーザ辞書
Ｄ３での使用頻度が４０回、ユーザ辞書Ｄ４での使用頻
度が２０＋２０＝４０回であるから、９０＋４０＋４０
＝１７０回と算出したものである。また、"process" と
いう単語は、総使用頻度が８０であり、ユーザ辞書Ｄ
１、ユーザ辞書Ｄ２、ユーザ辞書Ｄ３に含まれている。

【００３０】（ステップ１１２）次に、辞書管理テーブ
ル（図６）中のすべての見出し語を処理したかどうか調
べる。すべての見出し語を処理していれば、ステップ１
１を終了する。未処理の用語があれば、ステップ１１３
に進む。

【００３１】（ステップ１１３）次の見出し語（未処理
のもの）を取り出す。

【００３２】（ステップ１１４）辞書管理テーブル（図
６）を参照して、取り出した見出し語を含むユーザ辞書
の数が予め定めた閾値以上であるかどうかを調べる。閾
値以上であれば、ステップ１１５に進む。閾値未満なら
ば、基本辞書・専門用語辞書に登録する必要がないと判
断して、ステップ１１２に戻る。閾値の具体的な値は、
適宜定めればよい。例えば、全ユーザ辞書の総数の１割
程度にしてもよいし、この例ではユーザ辞書が４つであ
るから閾値を２，３程度にすればよい。

【００３３】（ステップ１１５）取り出した見出し語の
総使用頻度を所定の閾値と比較する。総使用頻度が閾値
より小さければ、基本辞書・専門用語辞書に登録する必
要がないので、ステップ１１２に戻る。閾値以上なら
ば、基本辞書・専門用語辞書に登録する価値があると判
断して、ステップ１１６に進む。閾値の具体的な値は、
適宜定めればよい。例えば、絶対的な値でもよいし、そ
れまでの翻訳で用いたすべての用語の数に適当な割合を
掛けて算出した相対的な値などでもよい。

【００３４】（ステップ１１６）次に、取り出した見出
し語の訳語毎に登録すべき専門用語辞書の分野を決定す
る。特定の分野のみで使われる訳語以外は、「一般」と
いう分野を割当てる。

【００３５】以下、ステップ１１６の分野選択処理を、
図７に示す処理フローチャートを用いて詳しく説明す
る。

【００３６】（ステップ１１６１）まず、ステップ１１
５で取り出した見出し語と関連の深い分野の候補、およ
びその分野における訳語を選択する。分野の候補と訳語
の選択は、具体的には、以下のように行う。

【００３７】まず、辞書管理テーブル（図６）を参照し
て、当該見出し語を含むユーザ辞書を調べる。次に、そ
のユーザ辞書（図５）を参照して、当該見出し語の訳語
と使用頻度を取り出す。そして、各分野毎の各訳語毎に
この使用頻度をカウントする。これを当該見出し語を含
むすべてのユーザに対して行い、予め定められた閾値以
上の頻度で使用されている分野と訳語を、当該見出し語
の分野の候補および訳語の候補とする。選択された分野
の候補と訳語は、分野テーブルに格納する。

【００３８】図８（ａ）は、分野テーブルの例を示す。
図８（ａ）の例は、"generation"という見出し語が、生
物の分野では「発生」という訳語で５０回、化学の分野
で「発生」という訳語で４０回、言語の分野で「生成」
という訳語で４０回、「世代」という訳語で２０回、情
報の分野で「世代」という訳語で２０回、ぞれぞれ使用
されたことを示している。

【００３９】（ステップ１１６２）次に、分野テーブル
（図８（ａ））中のすべての分野の候補について、未処
理の候補があるかどうか調べる。未処理の候補がなけれ
ば処理を終了する。未処理の候補があれば、ステップ１
１６３に進む。

【００４０】（ステップ１１６３）各分野の候補におい
て使用される訳語の種類の数を調べる。訳語の数が１な
らば、ステップ１１６４に進む。２以上ならばステップ
１１６５に進む。

【００４１】（ステップ１１６４）専門用語候補テーブ
ル（図３）に、当該見出し語と訳語と分野とを格納す
る。ただし、同じ見出し語と訳語について、「一般」と
いう分野で既に格納されている場合には、格納しない。
図８（ａ）の例では、化学の分野で訳語が「発生」の１
種類しかないので、見出し語"generation"、訳語「発
生」、分野「化学」を専門用語候補テーブル（図３）に
格納する。

【００４２】（ステップ１１６５）訳語の数が２以上の
ときは、本ステップからステップ１１６８の処理で、各
訳語毎に専門用語候補テーブル（図３）に登録する処理
を行う。まず、本ステップでは、分野テーブル（図８
（ａ））を参照して、訳語が出現する分野を調べ、訳語
テーブルに格納する。図８（ｂ）は、訳語テーブルの例
を示す。図８（ｂ）の例では、見出し語"generation"に
対して、「生成」という訳語が言語の分野で使用され、
「世代」という訳語が情報の分野と言語の分野で使用さ
れていることを示している。

【００４３】（ステップ１１６６）次に、ステップ１１
６５で求めた訳語テーブル（図８（ｂ））において、１
つの分野でだけ使用される訳語が１つだけであるかどう
かを調べる。具体的には、当該見出し語の訳語テーブル
において、１つの訳語が１つの分野でのみ使用されてい
ることを示すレコードが１つのみかどうかを調べる。も
し、１つだけならば、その訳語に対しフラグを立てる。
これをすべての訳語について行う。

【００４４】図８（ｂ）の訳語テーブルの例では、「生
成」という訳語が「言語」という１分野でのみ使用され
ており、かつ他の訳語で「言語」の分野のみに使用され
ているものはないから、「生成」にフラグを立てる。
「世代」は２分野で使用されているので、フラグは立て
ない。

【００４５】（ステップ１１６７）フラグが立っている
訳語を、その分野の訳語として専門用語候補テーブル
（図３）に格納する。図８（ｂ）の例では、フラグが立
っている訳語である「生成」が、専門用語候補テーブル
に格納される。

【００４６】（ステップ１１６８）フラグが立っていな
い訳語を、一般用語として専門用語候補テーブル（図
３）に格納する。図８（ｂ）の例では、フラグが立って
いない訳語である「世代」が、「一般」の用語として専
門用語候補テーブルに格納される。

【００４７】以上のようにして、複数のユーザ辞書に登
録されている用語を検出し、検出した用語と訳語の対に
対して分野を決定し、特定の分野に使用されている用語
はその分野の専門用語辞書に格納し、そうでない用語は
基本辞書に格納するようにしている。

【００４８】なお、上記実施例では、自動的に処理を行
う例を示したが、ユーザからの要求にしたがって処理を
起動することもできる。その際の処理の変更点を簡単に
説明する。まず、ユーザは、基本辞書、専門用語辞書、
および自分のユーザ辞書のいずれにもない用語、すなわ
ち未知語を見つける。そして、未知語を専門用語辞書・
基本辞書のいずれかに登録することをサーバに要求す
る。

【００４９】次に、サーバは、既に述べたように辞書管
理テーブルを作成する（ステップ１１１）。そして、ユ
ーザが登録を要求した見出し語（未知語）について、そ
の見出し語を使用しているユーザの数が閾値以上である
かどうか調べ（ステップ１１４）、さらにその見出し語
の使用頻度が閾値以上であるかどうか調べる（ステップ
１１５）。条件が満たされていれば、その未知語は他の
ユーザでも所定の頻度以上で使用されているということ
であるから、既に述べたのと同様の処理（ステップ１１
６）を行って辞書に格納する。

【００５０】条件が満たされない場合（使用頻度が閾値
以上でない場合）、他のユーザ辞書中にその見出し語が
存在しなければ、その旨を要求を出したユーザに知らせ
る。他のユーザ辞書中にその見出し語が存在するなら、
その旨をユーザに通知し、ユーザは、必要に応じてその
見出し語を含むユーザ辞書から辞書情報を複写する。辞
書情報の複写は、サーバを介しても良いし、ユーザ辞書
間で直接行っても良い。

【００５１】さらに、次のような処理を行うこともでき
る。まず、ユーザは未知語を見つける。そして、未知語
に対する辞書作成をサーバに要求する。次に、既に述べ
たように辞書管理テーブルを作成する（ステップ１１
１）。そして、ユーザが指定した見出し語を含むユーザ
辞書を辞書管理テーブルを参照して調べ、見つかったユ
ーザ辞書から自分のユーザ辞書に必要な情報を複写す
る。

【００５２】

【発明の効果】以上説明したように、本発明によれば、
複数のユーザが使用している見出し語を基本辞書・専門
用語辞書に格納するようにしているので、他のユーザが
それらの見出し語を必要とする場合に、改めてこれを作
る工数を避けることができる。また、複数のユーザ辞書
に格納されている用語を基本辞書・専門用語辞書に格納
することで、これらの辞書を記憶する記憶装置の容量の
無駄を避けることもできる。さらに、基本辞書・専門用
語辞書に格納する用語を複数のユーザ辞書に格納されて
いる用語とすることで、ユーザが必要と考えられる用語
を自動的に基本辞書・専門用語辞書に登録することがで
き、基本辞書・専門用語辞書に使用頻度の低い用語を登
録することを避けることができる。

【図面の簡単な説明】

【図１】本発明の適用対象例である機械翻訳システムの
システム構成図である。

【図２】本発明の一実施例に係る辞書作成方法の全体の
処理フローチャートである。

【図３】専門用語辞書に格納すべき用語を格納する専門
用語候補テーブルの概念図である。

【図４】専門用語の候補および分野を選択する専門用語
候補・分野選択処理の処理フローチャートである。

【図５】ユーザ辞書の概念図である。

【図６】どの見出し語がどのユーザ辞書に登録されてい
るかを管理する辞書管理テーブルの概念図である。

【図７】専門用語の各訳語毎の分野を選択する訳語毎の
分野選択処理の処理フローチャートである。

【図８】各見出し語毎に各分野毎の訳語を与える分野テ
ーブルおよび各見出し語毎に各訳語毎の分野を与える訳
語テーブルの概念図である。

【符号の説明】１…翻訳サーバ、２，３，４…クライアント。

Claims

【特許請求の範囲】

【請求項１】複数のユーザが利用する基本辞書、複数の
ユーザが利用する分野別の専門用語辞書、およびユーザ
毎に独自の用語を格納するユーザ辞書を利用する機械翻
訳システムの辞書作成方法であって、複数のユーザ辞書の見出し語を参照して、ユーザ辞書に
共通して登録されている見出し語を検出するステップ
と、前記検出した見出し語の訳語を各ユーザ辞書から取り出
し、前記見出し語と前記訳語の対に対して、分野を特定
するステップと、前記見出し語と訳語の対を、前記特定された分野の専門
用語辞書に格納するステップとを備えたことを特徴とす
る機械翻訳システムの辞書作成方法。
【請求項２】複数のユーザが利用する基本辞書、複数の
ユーザが利用する分野別の専門用語辞書、およびユーザ
毎に独自の用語を格納するユーザ辞書を利用する機械翻
訳システムの辞書作成方法であって、複数のユーザ辞書の見出し語を参照して、ユーザ辞書に
共通して登録されている見出し語を検出するステップ
と、前記検出した見出し語の訳語を各ユーザ辞書から取り出
し、前記見出し語と前記訳語の対に対して、分野を特定
するステップと、前記特定された分野が一般用語の分野であるときは、前
記見出し語と訳語の対を基本辞書に格納し、前記特定さ
れた分野が専門用語の分野であるときは、前記見出し語
と訳語の対を前記特定された分野の専門用語辞書に格納
するステップとを備えたことを特徴とする機械翻訳シス
テムの辞書作成方法。
【請求項３】前記見出し語を検出するステップは、予め
定められた閾値以上の数のユーザ辞書に共通して登録さ
れている見出し語を検出する請求項１または２に記載の
機械翻訳システムの辞書作成方法。
【請求項４】複数のユーザが利用する基本辞書、複数の
ユーザが利用する分野別の専門用語辞書、およびユーザ
毎に独自の用語を格納するユーザ辞書を利用する機械翻
訳システムの辞書作成方法であって、翻訳の際に未知語となった用語を、登録したい見出し語
として、指定するステップと、複数のユーザ辞書の見出し語を参照して、前記指定され
た見出し語が、ユーザ辞書に共通して登録されているか
どうかを調べ、ユーザ辞書に共通に登録されている場合
には、それらのユーザ辞書から前記見出し語の訳語を取
り出すステップと、前記見出し語と前記取り出した訳語の対に対して、分野
を特定するステップと、前記見出し語と訳語の対を、前記特定された分野の専門
用語辞書に格納するステップとを備えたことを特徴とす
る機械翻訳システムの辞書作成方法。
【請求項５】複数のユーザが利用する基本辞書、複数の
ユーザが利用する分野別の専門用語辞書、およびユーザ
毎に独自の用語を格納するユーザ辞書を利用する機械翻
訳システムの辞書作成方法であって、翻訳の際に未知語となった用語を、登録したい見出し語
として、指定するステップと、複数のユーザ辞書の見出し語を参照して、前記指定され
た見出し語が、ユーザ辞書に共通して登録されているか
どうかを調べ、ユーザ辞書に共通に登録されている場合
には、それらのユーザ辞書から前記見出し語の訳語を取
り出すステップと、前記見出し語と前記取り出した訳語の対に対して、分野
を特定するステップと、前記特定された分野が一般用語の分野であるときは、前
記見出し語と訳語の対を基本辞書に格納し、前記特定さ
れた分野が専門用語の分野であるときは、前記見出し語
と訳語の対を前記特定された分野の専門用語辞書に格納
するステップとを備えたことを特徴とする機械翻訳シス
テムの辞書作成方法。
【請求項６】前記訳語を取り出すステップは、前記指定
された見出し語が、所定の閾値以上の数のユーザ辞書に
共通に登録されている場合に、それらのユーザ辞書から
前記見出し語の訳語を取り出す請求項４または５に記載
の機械翻訳システムの辞書作成方法。
【請求項７】複数のユーザが利用する基本辞書、複数の
ユーザが利用する分野別の専門用語辞書、およびユーザ
毎に独自の用語を格納するユーザ辞書を利用する機械翻
訳システムの辞書作成方法であって、翻訳の際に未知語となった用語を、登録したい見出し語
として、指定するステップと、複数のユーザ辞書の見出し語を参照して、前記指定され
た見出し語が、ユーザ辞書に共通して登録されているか
どうかを調べるステップと、前記指定された見出し語が所定の閾値以上の数のユーザ
辞書に共通に登録されている場合には、それらのユーザ
辞書から前記見出し語の訳語を取り出すステップと、前記見出し語と前記取り出した訳語の対に対して、分野
を特定するステップと、前記特定された分野が一般用語の分野であるときは、前
記見出し語と訳語の対を基本辞書に格納し、前記特定さ
れた分野が専門用語の分野であるときは、前記見出し語
と訳語の対を前記特定された分野の専門用語辞書に格納
するステップと、前記指定された見出し語が所定の閾値未満の数のユーザ
辞書に登録されている場合には、前記見出し語の訳語を
ユーザ辞書から取り出し、前記見出し語を指定したユー
ザのユーザ辞書に登録するステップとを備えたことを特
徴とする機械翻訳システムの辞書作成方法。
【請求項８】複数のユーザが利用する基本辞書、複数の
ユーザが利用する分野別の専門用語辞書、およびユーザ
毎に独自の用語を格納するユーザ辞書を利用する機械翻
訳システムの辞書作成方法であって、翻訳の際に未知語となった用語を、登録したい見出し語
として、ユーザが指定するステップと、複数のユーザ辞書の見出し語を参照して、前記指定され
た見出し語の訳語をユーザ辞書から取り出し、その見出
し語を指定したユーザのユーザ辞書に登録するステップ
とを備えたことを特徴とする機械翻訳システムの辞書作
成方法。