JPH04209068A - データベース検索方法 - Google Patents
データベース検索方法Info
- Publication number
- JPH04209068A JPH04209068A JP2400502A JP40050290A JPH04209068A JP H04209068 A JPH04209068 A JP H04209068A JP 2400502 A JP2400502 A JP 2400502A JP 40050290 A JP40050290 A JP 40050290A JP H04209068 A JPH04209068 A JP H04209068A
- Authority
- JP
- Japan
- Prior art keywords
- natural language
- translation
- keyword
- english
- japanese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
[000il
【産業上の利用分野]この発明は利用者が使用する第1
の自然言語とは異なる第2の自然言語で構築されたデー
タベースを、第1の自然言語で検索し、検索結果を第1
の自然言語で出力することを可能とするデータベース検
索方法に関するものである。 [0002] 【従来の技術】従来のこの種のデータベース検索方法と
しては、第1の自然言語のキーワードを第2の自然言語
に翻訳して、第2の自然言語で構築されたデータベース
を検索し、その検索結果の全体を一律に自動翻訳するこ
とにより第1の自然言語に翻訳して出力する方法が一般
的である。 [0003]
の自然言語とは異なる第2の自然言語で構築されたデー
タベースを、第1の自然言語で検索し、検索結果を第1
の自然言語で出力することを可能とするデータベース検
索方法に関するものである。 [0002] 【従来の技術】従来のこの種のデータベース検索方法と
しては、第1の自然言語のキーワードを第2の自然言語
に翻訳して、第2の自然言語で構築されたデータベース
を検索し、その検索結果の全体を一律に自動翻訳するこ
とにより第1の自然言語に翻訳して出力する方法が一般
的である。 [0003]
【発明が解決しようとする課題】従来の方法では、デー
タベースの検索結果全体を機械翻訳にかけるため、処理
コストがかさむという基本的な問題があった。また、検
索結果のうち文の体裁を持たない部分がうまく訳出でき
ず、人手による確認と修正が余儀なくされていた。さら
に、検索結果が第1の自然言語だけで表現されているた
め、利用者が第1の自然言語のデータベースの存在を誤
信し、多数の関連情報および詳細情報を気軽に取り奇せ
ようとして利用コストが巨額にのぼる恐れがあることも
指摘されている。 [0004]
タベースの検索結果全体を機械翻訳にかけるため、処理
コストがかさむという基本的な問題があった。また、検
索結果のうち文の体裁を持たない部分がうまく訳出でき
ず、人手による確認と修正が余儀なくされていた。さら
に、検索結果が第1の自然言語だけで表現されているた
め、利用者が第1の自然言語のデータベースの存在を誤
信し、多数の関連情報および詳細情報を気軽に取り奇せ
ようとして利用コストが巨額にのぼる恐れがあることも
指摘されている。 [0004]
【課題を解決するための手段】この発明によれば、デー
タベースの検索結果を、固定的な形式を持つ部分と、キ
ーワードリストの部分と、データの内容を記述した部分
との表現スタイルの異なる3つの部分に分け、固定的な
形式の部分をあらかじめ用意した第2の自然言語と第1
の自然言語とのパタン対応表によりパタン変換し、また
請求項2の発明では変換辞書を直接検索して一部のキー
ワードを翻訳し、更に請求項3の発明ではデータの内容
部分については、記事見出しのような断片的な表現から
なる場合はそれを文章に変換して翻訳し、これら3つの
部分の翻訳結果をあわせて検索結果として出力する。さ
らに、請求項4の発明では固定的な形式の部分を翻訳す
るためのパタン対応表に、第2の自然言語にはない表示
を第1の自然言語に補足事項を記述しておき、その補足
事項をも同時に出力して利用者の利用上の誤解を防いで
いる。 [0005]
タベースの検索結果を、固定的な形式を持つ部分と、キ
ーワードリストの部分と、データの内容を記述した部分
との表現スタイルの異なる3つの部分に分け、固定的な
形式の部分をあらかじめ用意した第2の自然言語と第1
の自然言語とのパタン対応表によりパタン変換し、また
請求項2の発明では変換辞書を直接検索して一部のキー
ワードを翻訳し、更に請求項3の発明ではデータの内容
部分については、記事見出しのような断片的な表現から
なる場合はそれを文章に変換して翻訳し、これら3つの
部分の翻訳結果をあわせて検索結果として出力する。さ
らに、請求項4の発明では固定的な形式の部分を翻訳す
るためのパタン対応表に、第2の自然言語にはない表示
を第1の自然言語に補足事項を記述しておき、その補足
事項をも同時に出力して利用者の利用上の誤解を防いで
いる。 [0005]
【作用】以上のように第2の自然言語で得られた検索結
果は表現スタイルの異なる3つの部分に分けられ、その
固定的な形式の部分はパタン変換により第1の自然言語
に変換されるため、検索結果の全体を一律に自動翻訳す
る場合より翻訳費用が低減され、しかも誤りも少ない。 [0006]
果は表現スタイルの異なる3つの部分に分けられ、その
固定的な形式の部分はパタン変換により第1の自然言語
に変換されるため、検索結果の全体を一律に自動翻訳す
る場合より翻訳費用が低減され、しかも誤りも少ない。 [0006]
【実施例】次にこの発明の詳細な説明する。以下では、
第1の自然言語を英語、第2の自然言語を日本語とする
。図1にこの発明を適用したデータベース検索システム
の基本構成を示す。英語゛home banking”
がデータベースの検索キーワードとして指定された場合
を例として、システムの動作を説明する。 [0007]まず、入出力部1により英語の”home
banking“°が検索キーワードとして指定入力
され、その指定された検索キーワードである英語の“h
ome banking”は、英日翻訳部2において“
′ホームバンキング“という日本語のキーワードに変換
(翻訳)される。この英日翻訳部2は市販されている任
意の英日翻訳システムか、英語−日本語の対訳辞書を検
索する簡単な辞書引きシステムにより実現される。 [0008]つぎに、その翻訳結果の“ホームバンキン
グ°°をキーとして日本語データベース3を検索する。 この検索により図2(a)のような検索結果が得られた
ものとする。この検索結果の内容は、データベースの特
性から図3(a)に示すパタンのようなフィールド構成
をしているものとする。つまり1行目はデータの内容で
あリ、2行目は出典情報などを示す固定的な形式の部分
であり、しかもその例では新聞色、日付、朝刊か夕刊か
、どの面か、どの段か、写真、データ索引の順で配列さ
れている、写真は記述されていない場合もある。3行目
はキーワードリストであり、4行目は分類コードを示す
固定的な形式の部分である。 [00091選別部4は、図3(a)のパタンに従って
、検索結果を固定的な形式の部分と、キーワードリスト
の部分と、データの内容の部分とに分け、その固定的な
形式の部分をパタン変換部5へ、キーワードリストの部
分をキーワード翻訳部6へ、データの内容の部分を日英
翻訳部7へそれぞれ送ることにより、英語への訳出を制
御する。 [00101パタン変換部5は入力された固定的な形式
の部分、く新聞色〉〈日付〉く朝刊/夕刊〉〈面〉く段
〉〈写真〉〈データ索引〉とく分類コード〉について、
新聞色はあらかじめ用意されたパタン対応表中の新聞色
変換表(図3(b))によって変換し、日付中の月はパ
タン対応表中の5名変換表(図3(b))によって変換
し、また図3(b)中の変換ルールに従って、例えば日
付の年9月7日の順を月7日7年の順に置きかえるなど
図3(b)の変換ルールに記述された動作の指定に従っ
て1対1に単語置き換えまたは転記を実施する。 [00111キ一ワード翻訳部6はキーワード用変換辞
書9を持たない場合は入力されたキーワードリスト部分
の各キーワード、つまり銀行、ホームバンキング、テレ
ビゲーム、NTTデータ通信を順に日英翻訳部7により
翻訳することにより英語のキーワードリストを作成する
。キーワード用変換辞書9を持つ場合は、キーワード翻
訳部6は各キーワードについてキーワード用変換辞書9
をあらかじめ検索し、これに載っているものは訳語を直
接取得し、載っていないものはそれを日英翻訳部7に送
ることによりキーワードを翻訳する。 [0012]データの内容の部分は、その表現形式が文
章になっている場合はそのまま、日英翻訳部7により日
英翻訳を実行する。データの内容の部分が新聞の記事見
出しのように断片的な表現からなる場合は文章に変換し
、その文章を日英翻訳部7で翻訳する。見出しを文章に
変換するための方法としては例えば特願平2−1171
51号および特願平2−150336号「自然言語変換
装置」などに用いられている方法を適用すればよい。 [0013]以上のようにして得た翻訳結果を、整形部
8により図2(b)に示すような翻訳結果の形に編成し
、入出力部1に転送する。このとき、例えば゛日本工業
新聞゛を°ゴhe Japan Industrial
Dai ty−Tと翻訳すると、検索結果を利用する
人はこのような英字新聞があるものと錯覚する恐れがあ
る。そこで、この誤解を防ぐように、図3(b)の変換
ルールの中の新聞色に対するパタン対応表による変換動
作の指定の後半部分に、 「末尾に“’ (in Ja
panese)”°を追加する」という補足事項“(i
n Japanese)’“をあらかじめ記述しておき
、新聞色変換の際にこの補足事項も同時に出力して、図
2(b)のように翻訳結果に追加し、”The Jap
an InduStr ial Daily”は英字新
聞でないことを明示する。このようにパタン対応表に日
本語にはない表現を英語による理解を助けるための補足
事項として記述しておき、これを同時に出力することに
より利用者の理解の助けとすることができる。 [0014]なお、特にことわらなかったが、日英翻訳
部7は市販されている任意の日英翻訳システムが使用可
能である。 [0015]
第1の自然言語を英語、第2の自然言語を日本語とする
。図1にこの発明を適用したデータベース検索システム
の基本構成を示す。英語゛home banking”
がデータベースの検索キーワードとして指定された場合
を例として、システムの動作を説明する。 [0007]まず、入出力部1により英語の”home
banking“°が検索キーワードとして指定入力
され、その指定された検索キーワードである英語の“h
ome banking”は、英日翻訳部2において“
′ホームバンキング“という日本語のキーワードに変換
(翻訳)される。この英日翻訳部2は市販されている任
意の英日翻訳システムか、英語−日本語の対訳辞書を検
索する簡単な辞書引きシステムにより実現される。 [0008]つぎに、その翻訳結果の“ホームバンキン
グ°°をキーとして日本語データベース3を検索する。 この検索により図2(a)のような検索結果が得られた
ものとする。この検索結果の内容は、データベースの特
性から図3(a)に示すパタンのようなフィールド構成
をしているものとする。つまり1行目はデータの内容で
あリ、2行目は出典情報などを示す固定的な形式の部分
であり、しかもその例では新聞色、日付、朝刊か夕刊か
、どの面か、どの段か、写真、データ索引の順で配列さ
れている、写真は記述されていない場合もある。3行目
はキーワードリストであり、4行目は分類コードを示す
固定的な形式の部分である。 [00091選別部4は、図3(a)のパタンに従って
、検索結果を固定的な形式の部分と、キーワードリスト
の部分と、データの内容の部分とに分け、その固定的な
形式の部分をパタン変換部5へ、キーワードリストの部
分をキーワード翻訳部6へ、データの内容の部分を日英
翻訳部7へそれぞれ送ることにより、英語への訳出を制
御する。 [00101パタン変換部5は入力された固定的な形式
の部分、く新聞色〉〈日付〉く朝刊/夕刊〉〈面〉く段
〉〈写真〉〈データ索引〉とく分類コード〉について、
新聞色はあらかじめ用意されたパタン対応表中の新聞色
変換表(図3(b))によって変換し、日付中の月はパ
タン対応表中の5名変換表(図3(b))によって変換
し、また図3(b)中の変換ルールに従って、例えば日
付の年9月7日の順を月7日7年の順に置きかえるなど
図3(b)の変換ルールに記述された動作の指定に従っ
て1対1に単語置き換えまたは転記を実施する。 [00111キ一ワード翻訳部6はキーワード用変換辞
書9を持たない場合は入力されたキーワードリスト部分
の各キーワード、つまり銀行、ホームバンキング、テレ
ビゲーム、NTTデータ通信を順に日英翻訳部7により
翻訳することにより英語のキーワードリストを作成する
。キーワード用変換辞書9を持つ場合は、キーワード翻
訳部6は各キーワードについてキーワード用変換辞書9
をあらかじめ検索し、これに載っているものは訳語を直
接取得し、載っていないものはそれを日英翻訳部7に送
ることによりキーワードを翻訳する。 [0012]データの内容の部分は、その表現形式が文
章になっている場合はそのまま、日英翻訳部7により日
英翻訳を実行する。データの内容の部分が新聞の記事見
出しのように断片的な表現からなる場合は文章に変換し
、その文章を日英翻訳部7で翻訳する。見出しを文章に
変換するための方法としては例えば特願平2−1171
51号および特願平2−150336号「自然言語変換
装置」などに用いられている方法を適用すればよい。 [0013]以上のようにして得た翻訳結果を、整形部
8により図2(b)に示すような翻訳結果の形に編成し
、入出力部1に転送する。このとき、例えば゛日本工業
新聞゛を°ゴhe Japan Industrial
Dai ty−Tと翻訳すると、検索結果を利用する
人はこのような英字新聞があるものと錯覚する恐れがあ
る。そこで、この誤解を防ぐように、図3(b)の変換
ルールの中の新聞色に対するパタン対応表による変換動
作の指定の後半部分に、 「末尾に“’ (in Ja
panese)”°を追加する」という補足事項“(i
n Japanese)’“をあらかじめ記述しておき
、新聞色変換の際にこの補足事項も同時に出力して、図
2(b)のように翻訳結果に追加し、”The Jap
an InduStr ial Daily”は英字新
聞でないことを明示する。このようにパタン対応表に日
本語にはない表現を英語による理解を助けるための補足
事項として記述しておき、これを同時に出力することに
より利用者の理解の助けとすることができる。 [0014]なお、特にことわらなかったが、日英翻訳
部7は市販されている任意の日英翻訳システムが使用可
能である。 [0015]
【発明の効果】以上述べたように、この発明によれば、
データベースの検索結果を、表現スタイルの異なる部分
ごとにその表現スタイルに適した手段で言語翻訳するこ
とにより、機械翻訳の処理費用を低減させることが可能
である。キーワードリスト部分の翻訳をキーワード用変
換辞書を設け、これをまず参照して変換翻訳する時は、
その分日英翻訳部7の負荷を軽減することができる。 [0016]また、文章でない表現スタイルの場合も、
文章に変換することにより、自動的に機械翻訳が可能と
なり、かつ正確に翻訳され、人手による確認、修正を必
要としない。さらに、利用者が用いる第1の自然言語に
補足事項を自動的に補うことにより、第1の自然言語で
データベースが構築されているかのような利用上の誤解
を防ぐこともできる。 [0017]
データベースの検索結果を、表現スタイルの異なる部分
ごとにその表現スタイルに適した手段で言語翻訳するこ
とにより、機械翻訳の処理費用を低減させることが可能
である。キーワードリスト部分の翻訳をキーワード用変
換辞書を設け、これをまず参照して変換翻訳する時は、
その分日英翻訳部7の負荷を軽減することができる。 [0016]また、文章でない表現スタイルの場合も、
文章に変換することにより、自動的に機械翻訳が可能と
なり、かつ正確に翻訳され、人手による確認、修正を必
要としない。さらに、利用者が用いる第1の自然言語に
補足事項を自動的に補うことにより、第1の自然言語で
データベースが構築されているかのような利用上の誤解
を防ぐこともできる。 [0017]
[0018]
【図1】この発明を適用したデータベース検索システム
の基本構成を示すブロック図である。 [0019]
の基本構成を示すブロック図である。 [0019]
【図2】データベース検索結果およびその翻訳結果の例
を示す図である。 [00201
を示す図である。 [00201
【図3]パタン変換ルールの例を示す図である。
[00211
【符号の説明]
1 人出力部、2 英日翻訳部、3 日本語デー
タベース、4 選択部、5 パタン変換部、6キ一
ワード翻訳部、7 日英翻訳部、8整形部、9キーワ
ード用変換辞書。 【図1】
タベース、4 選択部、5 パタン変換部、6キ一
ワード翻訳部、7 日英翻訳部、8整形部、9キーワ
ード用変換辞書。 【図1】
Claims (4)
- 【請求項1】第1の自然言語で指定されたキーワードを
第2の自然言語に自動的に翻訳し、その翻訳結果を用い
て、第2の自然言語で構築されたデータベースを検索し
、その検索結果を固定的な形式を持つ部分と、キーワー
ドリストの部分と、データの内容を記述した部分との3
つに分け、その固定的な形式の部分をあらかじめ用意し
た第2の自然言語と第1の自然言語とのパタン対応表に
よって第1の自然言語の表現に変換し、上記キーワード
リストおよびデータの内容を第1の自然言語へ自動翻訳
し、これら固定的な形式の第1の自然言語への変換した
ものとキーワードリスト及びデータの内容の翻訳した結
果とを併せて検索結果を得ることを特徴とするデータベ
ース検索方法。 - 【請求項2】上記キーワードリストの翻訳は、まず各キ
ーワードに対して第2の自然言語から第1の自然言語へ
の変換辞書を検索し、その変換辞書に載っている単語で
あればその訳語を直接取得し、その変換辞書になければ
キーワードを1つの文相当な表現とみなして一連の自動
翻訳の手順を通して訳語を取得することを特徴とする請
求項1記載のデータベース検索方法。 - 【請求項3】上記データの内容が文の体裁で表現されて
いる時はそのまま自動翻訳を行ない、記事見出しのよう
な断片的な表現から成る時はそれを文章に変換してから
自動翻訳を行なうことを特徴とする請求項1記載のデー
タベース検索方法。 - 【請求項4】上記固定的な形式の部分を翻訳するための
パタン対応表に、第2の自然言語にはない表現を第1の
自然言語により理解を助けるための補足事項として記述
しておき、その補足事項も同時に出力することを特徴と
する請求項1記載のデータベース検索方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2400502A JPH04209068A (ja) | 1990-12-05 | 1990-12-05 | データベース検索方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2400502A JPH04209068A (ja) | 1990-12-05 | 1990-12-05 | データベース検索方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04209068A true JPH04209068A (ja) | 1992-07-30 |
Family
ID=18510400
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2400502A Pending JPH04209068A (ja) | 1990-12-05 | 1990-12-05 | データベース検索方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04209068A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06215042A (ja) * | 1992-12-01 | 1994-08-05 | Roehm Properties Bv | 他言語cdーrom情報検索装置 |
| JPH10232883A (ja) * | 1996-10-23 | 1998-09-02 | I T I:Kk | 多言語対応文書検索システム |
-
1990
- 1990-12-05 JP JP2400502A patent/JPH04209068A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06215042A (ja) * | 1992-12-01 | 1994-08-05 | Roehm Properties Bv | 他言語cdーrom情報検索装置 |
| JPH10232883A (ja) * | 1996-10-23 | 1998-09-02 | I T I:Kk | 多言語対応文書検索システム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3666004B2 (ja) | 多言語対応文書検索システム | |
| JPS6244877A (ja) | 機械翻訳装置 | |
| JPS6140673A (ja) | 外国語作文用翻訳方法、および翻訳機 | |
| JPH02140868A (ja) | 機械翻訳システム | |
| JPS62203273A (ja) | 機械翻訳システム | |
| US5608623A (en) | Special cooccurrence processing method and apparatus | |
| JPH10312382A (ja) | 類似用例翻訳システム | |
| JPS58192173A (ja) | 機械翻訳装置 | |
| Carbonell et al. | New approaches to machine translation | |
| KR20160140527A (ko) | 다국어 전자책 시스템 및 방법 | |
| JPH04209068A (ja) | データベース検索方法 | |
| Monyela | Call us by our names: The need to establish authority control standards for non-Roman names | |
| Fassbender | Dictionary of basic indexing terminology: latest developments and future plans | |
| Pantelia | ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE | |
| JPS6310265A (ja) | 翻訳装置 | |
| Hlava et al. | Cross-language retrieval-English/Russian/French | |
| JPH04128926A (ja) | プログラムコメント翻訳方式 | |
| JPH05282361A (ja) | データベース作成支援装置及び機械翻訳装置 | |
| An | Construction and Application of Corpora in Computer-Assisted Translation of Spanish Intangible Cultural Heritage for External Promotion | |
| JP2902343B2 (ja) | 言語解析システムおよび方法 | |
| JP2958044B2 (ja) | かな漢字変換方法及び装置 | |
| JP3501240B2 (ja) | 文書作成支援装置 | |
| Bird et al. | Web-based Dictionaries for Languages of the South-west USA. | |
| JPH10105553A (ja) | 機械翻訳システム | |
| JPH06187329A (ja) | 自然言語処理装置 |