JPH06162070A - 機械翻訳システムの辞書作成方法 - Google Patents

機械翻訳システムの辞書作成方法

Info

Publication number
JPH06162070A
JPH06162070A JP4335548A JP33554892A JPH06162070A JP H06162070 A JPH06162070 A JP H06162070A JP 4335548 A JP4335548 A JP 4335548A JP 33554892 A JP33554892 A JP 33554892A JP H06162070 A JPH06162070 A JP H06162070A
Authority
JP
Japan
Prior art keywords
dictionary
user
word
field
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4335548A
Other languages
English (en)
Other versions
JP3372977B2 (ja
Inventor
Yasutsugu Morimoto
康嗣 森本
Hiroyuki Kaji
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP33554892A priority Critical patent/JP3372977B2/ja
Publication of JPH06162070A publication Critical patent/JPH06162070A/ja
Application granted granted Critical
Publication of JP3372977B2 publication Critical patent/JP3372977B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】ユーザが必要と考えられる用語を自動的に基本
辞書・専門用語辞書に登録することができ、また各ユー
ザが重複した用語をそれぞれ登録するという無駄な工数
の発生を抑えることのできる機械翻訳システムの辞書作
成方法を提供することを目的とする。 【構成】複数のユーザ辞書の見出しを参照し、複数のユ
ーザ辞書に共通して登録されている単語を検出し、検出
した単語と訳語の対に対して分野を決定し、特定の分野
のみに使われている単語と訳語は専門用語辞書に格納
し、そうでない単語は基本辞書に格納する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システムに用
いる辞書の作成方法に関し、特に複数の辞書を組合せて
翻訳を行う機械翻訳システムにおける辞書作成方法に関
する。
【0002】
【従来の技術】現在、機械翻訳システムは、実用化の時
代を迎えている。その主な理由の一つは、辞書・文法の
ような翻訳に用いる知識ベースをテキストの文種や分野
に応じてカスタマイズすることにより、翻訳精度を向上
させることができるようになったためである。例えば、
辞書のカスタマイズとしては、以下のようなことが行わ
れている。
【0003】通常、辞書中の一つの見出し語に対し、複
数の訳語が存在するため、翻訳の際には適切な訳語を選
択する処理が必要となる。そのような処理は、翻訳精度
・処理速度の低下を招く上に、常に正しい訳語を選択す
ることは困難である。しかし、ある分野、あるユーザの
みに限定すれば、一つの見出し語の訳語を一つに限定で
きる場合がある。
【0004】例えば、"process" という単語には、「過
程」、「経過」、「方法」、「訴訟手続き」、「突
起」、「プロセス」などの訳語があるが、情報分野のテ
キストを翻訳する場合には、「プロセス」以外の訳語が
使われることはまれである。そこで、"process" という
見出し語に対して、「プロセス」という訳語のみを登録
した辞書を作成し、情報分野のテキストを翻訳する場合
には、この辞書を用いるようにする。これにより、訳語
を選択する処理が不要となり、しかも、ほとんどの場合
正しい訳語が得られる。このように、分野・使用ユーザ
を特定し、見出し語に対する訳語を1個に絞った辞書を
作成することで翻訳精度・処理速度を向上させることが
できる。
【0005】通常は、いわゆる基本辞書に加えて、各分
野毎に専門用語辞書が用意されており、各分野で最も可
能性の高い訳語が与えられている。また、ユーザ固有の
特殊な用語については、ユーザ辞書を各ユーザが用意し
て、自分が所望する訳語を与えることもできる。
【0006】
【発明が解決しようとする課題】しかし、上述の従来の
技術では次のような問題点があった。
【0007】即ち、言語は常に変化しているものであ
り、辞書のバージョンアップが常に必要である。特に、
機械翻訳が対象とする科学技術分野においては、常に新
しい技術が開発され、これに伴って新しい用語が必要と
なる。したがって、科学技術分野のテキストを翻訳する
ためには、常に新しい用語を辞書に追加していく必要が
ある。
【0008】これに対処するために、ユーザは各々が必
要とする用語の辞書をユーザ辞書に作成する。また、シ
ステム開発者によって、基本辞書および専門用語辞書の
バージョンアップも行われる。しかし、これら二つは従
来は独立して別個に行われていた。このため、専門用語
辞書に登録される用語が本当にユーザに必要な用語であ
ることが保証されておらず、ユーザのニーズが高くない
用語が登録されている可能性がある。また、ユーザ間の
ユーザ辞書作成も独立に行われるため、既に他ユーザが
作成している用語を重複して登録するという無駄な工数
が発生する可能性がある。
【0009】本発明は、上述の従来例における問題点に
鑑み、ユーザが必要と考えられる用語を自動的に基本辞
書・専門用語辞書に登録することができ、また各ユーザ
が重複した用語をそれぞれ登録するという無駄な工数の
発生を抑えることのできる機械翻訳システムの辞書作成
方法を提供することを目的とする。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明は、複数のユーザが利用する基本辞書、複
数のユーザが利用する分野別の専門用語辞書、およびユ
ーザ毎に独自の用語を格納するユーザ辞書を利用する機
械翻訳システムの辞書作成方法であって、複数のユーザ
辞書の見出し語を参照して、ユーザ辞書に共通して登録
されている見出し語を検出するステップと、前記検出し
た見出し語の訳語を各ユーザ辞書から取り出し、前記見
出し語と前記訳語の対に対して、分野を特定するステッ
プと、前記見出し語と訳語の対を、前記特定された分野
の専門用語辞書に格納するステップとを備えたことを特
徴とする。
【0011】特定された分野が一般用語の分野であると
きは、見出し語と訳語の対を基本辞書に格納し、特定さ
れた分野が専門用語の分野であるときは、見出し語と訳
語の対をその特定された分野の専門用語辞書に格納する
ようにするとよい。また、予め定められた閾値以上の数
のユーザ辞書に共通して登録されている見出し語を検出
して、基本辞書や専門用語辞書に登録するようにすると
よい。
【0012】また、本発明は、複数のユーザが利用する
基本辞書、複数のユーザが利用する分野別の専門用語辞
書、およびユーザ毎に独自の用語を格納するユーザ辞書
を利用する機械翻訳システムの辞書作成方法であって、
翻訳の際に未知語となった用語を、登録したい見出し語
として、指定するステップと、複数のユーザ辞書の見出
し語を参照して、前記指定された見出し語が、ユーザ辞
書に共通して登録されているかどうかを調べ、ユーザ辞
書に共通に登録されている場合には、それらのユーザ辞
書から前記見出し語の訳語を取り出すステップと、前記
見出し語と前記取り出した訳語の対に対して、分野を特
定するステップと、前記見出し語と訳語の対を、前記特
定された分野の専門用語辞書に格納するステップとを備
えたことを特徴とする。
【0013】この発明についても、特定された分野が一
般用語の分野であるときは、見出し語と訳語の対を基本
辞書に格納し、特定された分野が専門用語の分野である
ときは、見出し語と訳語の対をその特定された分野の専
門用語辞書に格納するようにするとよい。また、指定さ
れた見出し語が、所定の閾値以上の数のユーザ辞書に共
通に登録されている場合に、それらを基本辞書や専門用
語辞書に登録するようにするとよい。この場合、指定さ
れた見出し語が所定の閾値未満の数のユーザ辞書に登録
されている場合には、その見出し語の訳語をユーザ辞書
から取り出し、その見出し語を指定したユーザのユーザ
辞書に登録するようにしてもよい。
【0014】
【作用】複数のユーザ辞書の見出しを参照し、複数のユ
ーザ辞書に共通して登録されている用語を基本辞書・専
門用語辞書に登録するようにしているので、ユーザが必
要としている用語が基本辞書・専門用語辞書に登録され
ることとなり、あるユーザが作成した用語を他のユーザ
が利用することができる。また、ある分野において特定
の訳語しか用いられない見出し語は、専門用語辞書に登
録され、分野によって訳語が特定できない見出し語につ
いては、一般用語として基本辞書に登録される。
【0015】
【実施例】以下、図面を用いて、本発明の実施例を説明
する。ここで説明する実施例は、本発明を分散型機械翻
訳システムに適用した例である。
【0016】図1は、本実施例の分散型機械翻訳システ
ムのシステム構成図を示す。図中、1は翻訳サーバであ
り、翻訳エンジン、文法、基本辞書、分野別の専門用語
辞書、およびユーザ毎のユーザ辞書D1を備えている。
2,3,4はそれぞれクライアントであり、各々がユー
ザ毎のユーザ辞書D2,D3,D4を備えている。
【0017】クライアント2,3,4を使用するユーザ
は、そのクライアントが持つユーザ辞書D2,D3,D
4または翻訳サーバ1上にあるユーザ辞書D1と、翻訳
サーバ1上にある基本辞書および専門用語辞書を組合
せ、翻訳サーバ1上の翻訳エンジンと文法を用いて、翻
訳処理を行う。なお、本実施例では、基本辞書と各分野
毎の専門用語辞書を別のファイルとして記述している
が、これらを1つのファイルに格納し、ラベルなどを付
加することによって、区別するような方法を用いても構
わない。
【0018】図1の翻訳システムでは、各ユーザが作成
したユーザ辞書に共通に含まれている用語を基本辞書・
専門用語辞書に自動的に登録できるようになっている。
【0019】以下、図2に示す処理フローチャートにし
たがって、図1のシステムでユーザ辞書の用語を基本辞
書・専門用語辞書に登録する際の全体の処理の流れを説
明する。
【0020】(ステップ11)まず、サーバマシン1上
にあるユーザ辞書D1およびネットワークで接続されて
いるクライアントマシン2,3,4上にあるユーザ辞書
D2,D3,D4を参照し、専門用語辞書・基本辞書に
登録すべき用語の候補を選択する。また、選択された用
語をどの辞書に登録すべきかを決定するため、その用語
の分野を決定する。処理結果は、専門用語候補テーブル
に格納する。本ステップは、後に詳細に説明する。
【0021】図3に、専門用語候補テーブルの例を示
す。専門用語候補テーブルは、見出し語、その見出し語
の訳語、および分野を記載する欄を備えている。
【0022】なお、本ステップでは、ネットワークで接
続されているすべてのマシンについて処理を行っている
が、実際にはサーバ側で処理対象とするクライアントの
アドレスのリストを保持し、このリストに記載されてい
るクライアントのみを処理対象とするのが良い。
【0023】(ステップ12)次に、専門用語候補テー
ブル(図3)を参照し、各見出し語毎に記述されている
分野の専門用語辞書に見出し語と訳語を登録する。ただ
し、分野が「一般」となっている場合には、基本辞書に
登録する。例えば、図3の例の場合、"generation"→
「生成」は、分野が「言語」であるので言語分野の専門
用語辞書に格納する。また、"generation"→「世代」
は、分野が「一般」であるので基本辞書に格納する。
【0024】(ステップ13)次に、ユーザ辞書中の用
語を基本辞書・専門用語辞書に登録した旨をユーザに通
知する。この通知は、(見出し語、訳語、分野)という
リストを出力することにより行われる。ユーザは、この
リストを見て、専門辞書に新たな用語が登録されたこと
を知ることができる。また、自分がユーザ辞書に登録し
ていた用語が、専門用語辞書に登録された場合には、ユ
ーザ辞書中の用語を削除することによって、メモリの無
駄を避けることができる。
【0025】以下、図2のステップ11の専門用語候補
・分野選択処理を、図4に示す処理フローチャートにし
たがって詳細に説明する。
【0026】(ステップ111)まず、すべてのユーザ
辞書D1〜D4を参照し、辞書管理テーブルを作成す
る。
【0027】図5は、ユーザ辞書の例を示す。ユーザ辞
書には、見出し語、訳語、意味素性のような翻訳に必要
な情報とともに、その用語が使用された分野および分野
毎の使用頻度が格納されている。ここで、使用された分
野は、ユーザ辞書中の訳語が使用された際に、同時に使
用されていた専門用語辞書の分野を用いる。図5の例に
おいて、ユーザ辞書D1には、"generation"という見出
し語に対して、「発生」という訳語が与えられており、
この用語が生物分野の辞書と50回、化学分野の辞書と
40回、それぞれ一緒に使用されたことが分かる。
【0028】図6は、辞書管理テーブルの例を示す。図
6の辞書管理テーブルは、ユーザ辞書中にあるすべての
見出し語のリストに対し、各見出し語のすべてのユーザ
における総使用頻度とユーザ辞書番号のリストからな
る。なお、ユーザ辞書D1のユーザ辞書番号は「1」、
ユーザ辞書D2のユーザ辞書番号は「2」、ユーザ辞書
D3のユーザ辞書番号は「3」、ユーザ辞書D4のユー
ザ辞書番号は「4」とする。
【0029】図6の例では、"generation"という単語
は、すべてのユーザにおける総使用頻度が170回であ
り、ユーザ辞書D1、ユーザ辞書D3、およびユーザ辞
書D4に含まれている。170回というのは、ユーザ辞
書D1での使用頻度が50+40=90回、ユーザ辞書
D3での使用頻度が40回、ユーザ辞書D4での使用頻
度が20+20=40回であるから、90+40+40
=170回と算出したものである。また、"process" と
いう単語は、総使用頻度が80であり、ユーザ辞書D
1、ユーザ辞書D2、ユーザ辞書D3に含まれている。
【0030】(ステップ112)次に、辞書管理テーブ
ル(図6)中のすべての見出し語を処理したかどうか調
べる。すべての見出し語を処理していれば、ステップ1
1を終了する。未処理の用語があれば、ステップ113
に進む。
【0031】(ステップ113)次の見出し語(未処理
のもの)を取り出す。
【0032】(ステップ114)辞書管理テーブル(図
6)を参照して、取り出した見出し語を含むユーザ辞書
の数が予め定めた閾値以上であるかどうかを調べる。閾
値以上であれば、ステップ115に進む。閾値未満なら
ば、基本辞書・専門用語辞書に登録する必要がないと判
断して、ステップ112に戻る。閾値の具体的な値は、
適宜定めればよい。例えば、全ユーザ辞書の総数の1割
程度にしてもよいし、この例ではユーザ辞書が4つであ
るから閾値を2,3程度にすればよい。
【0033】(ステップ115)取り出した見出し語の
総使用頻度を所定の閾値と比較する。総使用頻度が閾値
より小さければ、基本辞書・専門用語辞書に登録する必
要がないので、ステップ112に戻る。閾値以上なら
ば、基本辞書・専門用語辞書に登録する価値があると判
断して、ステップ116に進む。閾値の具体的な値は、
適宜定めればよい。例えば、絶対的な値でもよいし、そ
れまでの翻訳で用いたすべての用語の数に適当な割合を
掛けて算出した相対的な値などでもよい。
【0034】(ステップ116)次に、取り出した見出
し語の訳語毎に登録すべき専門用語辞書の分野を決定す
る。特定の分野のみで使われる訳語以外は、「一般」と
いう分野を割当てる。
【0035】以下、ステップ116の分野選択処理を、
図7に示す処理フローチャートを用いて詳しく説明す
る。
【0036】(ステップ1161)まず、ステップ11
5で取り出した見出し語と関連の深い分野の候補、およ
びその分野における訳語を選択する。分野の候補と訳語
の選択は、具体的には、以下のように行う。
【0037】まず、辞書管理テーブル(図6)を参照し
て、当該見出し語を含むユーザ辞書を調べる。次に、そ
のユーザ辞書(図5)を参照して、当該見出し語の訳語
と使用頻度を取り出す。そして、各分野毎の各訳語毎に
この使用頻度をカウントする。これを当該見出し語を含
むすべてのユーザに対して行い、予め定められた閾値以
上の頻度で使用されている分野と訳語を、当該見出し語
の分野の候補および訳語の候補とする。選択された分野
の候補と訳語は、分野テーブルに格納する。
【0038】図8(a)は、分野テーブルの例を示す。
図8(a)の例は、"generation"という見出し語が、生
物の分野では「発生」という訳語で50回、化学の分野
で「発生」という訳語で40回、言語の分野で「生成」
という訳語で40回、「世代」という訳語で20回、情
報の分野で「世代」という訳語で20回、ぞれぞれ使用
されたことを示している。
【0039】(ステップ1162)次に、分野テーブル
(図8(a))中のすべての分野の候補について、未処
理の候補があるかどうか調べる。未処理の候補がなけれ
ば処理を終了する。未処理の候補があれば、ステップ1
163に進む。
【0040】(ステップ1163)各分野の候補におい
て使用される訳語の種類の数を調べる。訳語の数が1な
らば、ステップ1164に進む。2以上ならばステップ
1165に進む。
【0041】(ステップ1164)専門用語候補テーブ
ル(図3)に、当該見出し語と訳語と分野とを格納す
る。ただし、同じ見出し語と訳語について、「一般」と
いう分野で既に格納されている場合には、格納しない。
図8(a)の例では、化学の分野で訳語が「発生」の1
種類しかないので、見出し語"generation"、訳語「発
生」、分野「化学」を専門用語候補テーブル(図3)に
格納する。
【0042】(ステップ1165)訳語の数が2以上の
ときは、本ステップからステップ1168の処理で、各
訳語毎に専門用語候補テーブル(図3)に登録する処理
を行う。まず、本ステップでは、分野テーブル(図8
(a))を参照して、訳語が出現する分野を調べ、訳語
テーブルに格納する。図8(b)は、訳語テーブルの例
を示す。図8(b)の例では、見出し語"generation"に
対して、「生成」という訳語が言語の分野で使用され、
「世代」という訳語が情報の分野と言語の分野で使用さ
れていることを示している。
【0043】(ステップ1166)次に、ステップ11
65で求めた訳語テーブル(図8(b))において、1
つの分野でだけ使用される訳語が1つだけであるかどう
かを調べる。具体的には、当該見出し語の訳語テーブル
において、1つの訳語が1つの分野でのみ使用されてい
ることを示すレコードが1つのみかどうかを調べる。も
し、1つだけならば、その訳語に対しフラグを立てる。
これをすべての訳語について行う。
【0044】図8(b)の訳語テーブルの例では、「生
成」という訳語が「言語」という1分野でのみ使用され
ており、かつ他の訳語で「言語」の分野のみに使用され
ているものはないから、「生成」にフラグを立てる。
「世代」は2分野で使用されているので、フラグは立て
ない。
【0045】(ステップ1167)フラグが立っている
訳語を、その分野の訳語として専門用語候補テーブル
(図3)に格納する。図8(b)の例では、フラグが立
っている訳語である「生成」が、専門用語候補テーブル
に格納される。
【0046】(ステップ1168)フラグが立っていな
い訳語を、一般用語として専門用語候補テーブル(図
3)に格納する。図8(b)の例では、フラグが立って
いない訳語である「世代」が、「一般」の用語として専
門用語候補テーブルに格納される。
【0047】以上のようにして、複数のユーザ辞書に登
録されている用語を検出し、検出した用語と訳語の対に
対して分野を決定し、特定の分野に使用されている用語
はその分野の専門用語辞書に格納し、そうでない用語は
基本辞書に格納するようにしている。
【0048】なお、上記実施例では、自動的に処理を行
う例を示したが、ユーザからの要求にしたがって処理を
起動することもできる。その際の処理の変更点を簡単に
説明する。まず、ユーザは、基本辞書、専門用語辞書、
および自分のユーザ辞書のいずれにもない用語、すなわ
ち未知語を見つける。そして、未知語を専門用語辞書・
基本辞書のいずれかに登録することをサーバに要求す
る。
【0049】次に、サーバは、既に述べたように辞書管
理テーブルを作成する(ステップ111)。そして、ユ
ーザが登録を要求した見出し語(未知語)について、そ
の見出し語を使用しているユーザの数が閾値以上である
かどうか調べ(ステップ114)、さらにその見出し語
の使用頻度が閾値以上であるかどうか調べる(ステップ
115)。条件が満たされていれば、その未知語は他の
ユーザでも所定の頻度以上で使用されているということ
であるから、既に述べたのと同様の処理(ステップ11
6)を行って辞書に格納する。
【0050】条件が満たされない場合(使用頻度が閾値
以上でない場合)、他のユーザ辞書中にその見出し語が
存在しなければ、その旨を要求を出したユーザに知らせ
る。他のユーザ辞書中にその見出し語が存在するなら、
その旨をユーザに通知し、ユーザは、必要に応じてその
見出し語を含むユーザ辞書から辞書情報を複写する。辞
書情報の複写は、サーバを介しても良いし、ユーザ辞書
間で直接行っても良い。
【0051】さらに、次のような処理を行うこともでき
る。まず、ユーザは未知語を見つける。そして、未知語
に対する辞書作成をサーバに要求する。次に、既に述べ
たように辞書管理テーブルを作成する(ステップ11
1)。そして、ユーザが指定した見出し語を含むユーザ
辞書を辞書管理テーブルを参照して調べ、見つかったユ
ーザ辞書から自分のユーザ辞書に必要な情報を複写す
る。
【0052】
【発明の効果】以上説明したように、本発明によれば、
複数のユーザが使用している見出し語を基本辞書・専門
用語辞書に格納するようにしているので、他のユーザが
それらの見出し語を必要とする場合に、改めてこれを作
る工数を避けることができる。また、複数のユーザ辞書
に格納されている用語を基本辞書・専門用語辞書に格納
することで、これらの辞書を記憶する記憶装置の容量の
無駄を避けることもできる。さらに、基本辞書・専門用
語辞書に格納する用語を複数のユーザ辞書に格納されて
いる用語とすることで、ユーザが必要と考えられる用語
を自動的に基本辞書・専門用語辞書に登録することがで
き、基本辞書・専門用語辞書に使用頻度の低い用語を登
録することを避けることができる。
【図面の簡単な説明】
【図1】本発明の適用対象例である機械翻訳システムの
システム構成図である。
【図2】本発明の一実施例に係る辞書作成方法の全体の
処理フローチャートである。
【図3】専門用語辞書に格納すべき用語を格納する専門
用語候補テーブルの概念図である。
【図4】専門用語の候補および分野を選択する専門用語
候補・分野選択処理の処理フローチャートである。
【図5】ユーザ辞書の概念図である。
【図6】どの見出し語がどのユーザ辞書に登録されてい
るかを管理する辞書管理テーブルの概念図である。
【図7】専門用語の各訳語毎の分野を選択する訳語毎の
分野選択処理の処理フローチャートである。
【図8】各見出し語毎に各分野毎の訳語を与える分野テ
ーブルおよび各見出し語毎に各訳語毎の分野を与える訳
語テーブルの概念図である。
【符号の説明】 1…翻訳サーバ、2,3,4…クライアント。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】複数のユーザが利用する基本辞書、複数の
    ユーザが利用する分野別の専門用語辞書、およびユーザ
    毎に独自の用語を格納するユーザ辞書を利用する機械翻
    訳システムの辞書作成方法であって、 複数のユーザ辞書の見出し語を参照して、ユーザ辞書に
    共通して登録されている見出し語を検出するステップ
    と、 前記検出した見出し語の訳語を各ユーザ辞書から取り出
    し、前記見出し語と前記訳語の対に対して、分野を特定
    するステップと、 前記見出し語と訳語の対を、前記特定された分野の専門
    用語辞書に格納するステップとを備えたことを特徴とす
    る機械翻訳システムの辞書作成方法。
  2. 【請求項2】複数のユーザが利用する基本辞書、複数の
    ユーザが利用する分野別の専門用語辞書、およびユーザ
    毎に独自の用語を格納するユーザ辞書を利用する機械翻
    訳システムの辞書作成方法であって、 複数のユーザ辞書の見出し語を参照して、ユーザ辞書に
    共通して登録されている見出し語を検出するステップ
    と、 前記検出した見出し語の訳語を各ユーザ辞書から取り出
    し、前記見出し語と前記訳語の対に対して、分野を特定
    するステップと、 前記特定された分野が一般用語の分野であるときは、前
    記見出し語と訳語の対を基本辞書に格納し、前記特定さ
    れた分野が専門用語の分野であるときは、前記見出し語
    と訳語の対を前記特定された分野の専門用語辞書に格納
    するステップとを備えたことを特徴とする機械翻訳シス
    テムの辞書作成方法。
  3. 【請求項3】前記見出し語を検出するステップは、予め
    定められた閾値以上の数のユーザ辞書に共通して登録さ
    れている見出し語を検出する請求項1または2に記載の
    機械翻訳システムの辞書作成方法。
  4. 【請求項4】複数のユーザが利用する基本辞書、複数の
    ユーザが利用する分野別の専門用語辞書、およびユーザ
    毎に独自の用語を格納するユーザ辞書を利用する機械翻
    訳システムの辞書作成方法であって、 翻訳の際に未知語となった用語を、登録したい見出し語
    として、指定するステップと、 複数のユーザ辞書の見出し語を参照して、前記指定され
    た見出し語が、ユーザ辞書に共通して登録されているか
    どうかを調べ、ユーザ辞書に共通に登録されている場合
    には、それらのユーザ辞書から前記見出し語の訳語を取
    り出すステップと、 前記見出し語と前記取り出した訳語の対に対して、分野
    を特定するステップと、 前記見出し語と訳語の対を、前記特定された分野の専門
    用語辞書に格納するステップとを備えたことを特徴とす
    る機械翻訳システムの辞書作成方法。
  5. 【請求項5】複数のユーザが利用する基本辞書、複数の
    ユーザが利用する分野別の専門用語辞書、およびユーザ
    毎に独自の用語を格納するユーザ辞書を利用する機械翻
    訳システムの辞書作成方法であって、 翻訳の際に未知語となった用語を、登録したい見出し語
    として、指定するステップと、 複数のユーザ辞書の見出し語を参照して、前記指定され
    た見出し語が、ユーザ辞書に共通して登録されているか
    どうかを調べ、ユーザ辞書に共通に登録されている場合
    には、それらのユーザ辞書から前記見出し語の訳語を取
    り出すステップと、 前記見出し語と前記取り出した訳語の対に対して、分野
    を特定するステップと、 前記特定された分野が一般用語の分野であるときは、前
    記見出し語と訳語の対を基本辞書に格納し、前記特定さ
    れた分野が専門用語の分野であるときは、前記見出し語
    と訳語の対を前記特定された分野の専門用語辞書に格納
    するステップとを備えたことを特徴とする機械翻訳シス
    テムの辞書作成方法。
  6. 【請求項6】前記訳語を取り出すステップは、前記指定
    された見出し語が、所定の閾値以上の数のユーザ辞書に
    共通に登録されている場合に、それらのユーザ辞書から
    前記見出し語の訳語を取り出す請求項4または5に記載
    の機械翻訳システムの辞書作成方法。
  7. 【請求項7】複数のユーザが利用する基本辞書、複数の
    ユーザが利用する分野別の専門用語辞書、およびユーザ
    毎に独自の用語を格納するユーザ辞書を利用する機械翻
    訳システムの辞書作成方法であって、 翻訳の際に未知語となった用語を、登録したい見出し語
    として、指定するステップと、 複数のユーザ辞書の見出し語を参照して、前記指定され
    た見出し語が、ユーザ辞書に共通して登録されているか
    どうかを調べるステップと、 前記指定された見出し語が所定の閾値以上の数のユーザ
    辞書に共通に登録されている場合には、それらのユーザ
    辞書から前記見出し語の訳語を取り出すステップと、 前記見出し語と前記取り出した訳語の対に対して、分野
    を特定するステップと、 前記特定された分野が一般用語の分野であるときは、前
    記見出し語と訳語の対を基本辞書に格納し、前記特定さ
    れた分野が専門用語の分野であるときは、前記見出し語
    と訳語の対を前記特定された分野の専門用語辞書に格納
    するステップと、 前記指定された見出し語が所定の閾値未満の数のユーザ
    辞書に登録されている場合には、前記見出し語の訳語を
    ユーザ辞書から取り出し、前記見出し語を指定したユー
    ザのユーザ辞書に登録するステップとを備えたことを特
    徴とする機械翻訳システムの辞書作成方法。
  8. 【請求項8】複数のユーザが利用する基本辞書、複数の
    ユーザが利用する分野別の専門用語辞書、およびユーザ
    毎に独自の用語を格納するユーザ辞書を利用する機械翻
    訳システムの辞書作成方法であって、 翻訳の際に未知語となった用語を、登録したい見出し語
    として、ユーザが指定するステップと、 複数のユーザ辞書の見出し語を参照して、前記指定され
    た見出し語の訳語をユーザ辞書から取り出し、その見出
    し語を指定したユーザのユーザ辞書に登録するステップ
    とを備えたことを特徴とする機械翻訳システムの辞書作
    成方法。
JP33554892A 1992-11-21 1992-11-21 機械翻訳システム Expired - Fee Related JP3372977B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33554892A JP3372977B2 (ja) 1992-11-21 1992-11-21 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33554892A JP3372977B2 (ja) 1992-11-21 1992-11-21 機械翻訳システム

Publications (2)

Publication Number Publication Date
JPH06162070A true JPH06162070A (ja) 1994-06-10
JP3372977B2 JP3372977B2 (ja) 2003-02-04

Family

ID=18289816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33554892A Expired - Fee Related JP3372977B2 (ja) 1992-11-21 1992-11-21 機械翻訳システム

Country Status (1)

Country Link
JP (1) JP3372977B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996016374A1 (en) * 1994-11-21 1996-05-30 Omron Corporation Data base system shared by a plurality of client apparatuses, data updating method and application to character processor
JP2007206975A (ja) * 2006-02-01 2007-08-16 Toshiba Corp 言語情報変換装置及びその方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996016374A1 (en) * 1994-11-21 1996-05-30 Omron Corporation Data base system shared by a plurality of client apparatuses, data updating method and application to character processor
US5960449A (en) * 1994-11-21 1999-09-28 Omron Corporation Database system shared by multiple client apparatuses, data renewal method, and application to character processors
JP2007206975A (ja) * 2006-02-01 2007-08-16 Toshiba Corp 言語情報変換装置及びその方法

Also Published As

Publication number Publication date
JP3372977B2 (ja) 2003-02-04

Similar Documents

Publication Publication Date Title
US10169471B2 (en) Generating and executing query language statements from natural language
US4916614A (en) Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
RU2422890C2 (ru) Создание ресурса с использованием онтологий
US6850934B2 (en) Adaptive search engine query
US12112135B2 (en) Question answering information completion using machine reading comprehension-based process
JPH0310134B2 (ja)
JPH0310133B2 (ja)
WO1995010091A1 (en) Method and apparatus for data storage and retrieval
CN112434537B (zh) 翻译文本一致性校验方法、计算设备及存储介质
JP7254925B2 (ja) 改良されたデータマッチングのためのデータレコードの字訳
JP3883622B2 (ja) 有限状態トランスデューサを用いてデータベースのインデックス付けを行う方法及び装置
JP2005107597A (ja) 類似文検索装置、類似文検索方法、およびプログラム
CN119719302A (zh) 信息处理方法、装置、设备、存储介质和程序产品
JP3489216B2 (ja) ファイルシステム
JP3372977B2 (ja) 機械翻訳システム
JP3363501B2 (ja) テキスト検索装置
CN114003685B (zh) 分词位置索引构建方法及其装置、文档检索方法及其装置
JPH1115841A (ja) 情報検索装置及び情報検索プログラムを記録した媒体
US8433729B2 (en) Method and system for automatically generating a communication interface
JPH07182333A (ja) 日本語処理装置
JP2778025B2 (ja) 共起関係辞書の学習方法
Parikh et al. Adapting question answering techniques to the web
JP4217410B2 (ja) 情報検索装置及びその制御方法、並びにプログラム
JPH11195041A (ja) 文書検索装置、方法及び記録媒体
CN116226335B (zh) 关键字查询方法、装置及电子设备

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees