JPH04209068A - データベース検索方法 - Google Patents

データベース検索方法

Info

Publication number
JPH04209068A
JPH04209068A JP2400502A JP40050290A JPH04209068A JP H04209068 A JPH04209068 A JP H04209068A JP 2400502 A JP2400502 A JP 2400502A JP 40050290 A JP40050290 A JP 40050290A JP H04209068 A JPH04209068 A JP H04209068A
Authority
JP
Japan
Prior art keywords
natural language
translation
keyword
english
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2400502A
Other languages
English (en)
Inventor
Satoshi Shirai
白井 諭
Satoru Ikehara
池原 悟
Akio Yokoo
昭男 横尾
Yuji Ito
伊東 悠治
Shigeru Mori
茂 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2400502A priority Critical patent/JPH04209068A/ja
Publication of JPH04209068A publication Critical patent/JPH04209068A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[000il
【産業上の利用分野]この発明は利用者が使用する第1
の自然言語とは異なる第2の自然言語で構築されたデー
タベースを、第1の自然言語で検索し、検索結果を第1
の自然言語で出力することを可能とするデータベース検
索方法に関するものである。 [0002] 【従来の技術】従来のこの種のデータベース検索方法と
しては、第1の自然言語のキーワードを第2の自然言語
に翻訳して、第2の自然言語で構築されたデータベース
を検索し、その検索結果の全体を一律に自動翻訳するこ
とにより第1の自然言語に翻訳して出力する方法が一般
的である。 [0003]
【発明が解決しようとする課題】従来の方法では、デー
タベースの検索結果全体を機械翻訳にかけるため、処理
コストがかさむという基本的な問題があった。また、検
索結果のうち文の体裁を持たない部分がうまく訳出でき
ず、人手による確認と修正が余儀なくされていた。さら
に、検索結果が第1の自然言語だけで表現されているた
め、利用者が第1の自然言語のデータベースの存在を誤
信し、多数の関連情報および詳細情報を気軽に取り奇せ
ようとして利用コストが巨額にのぼる恐れがあることも
指摘されている。 [0004]
【課題を解決するための手段】この発明によれば、デー
タベースの検索結果を、固定的な形式を持つ部分と、キ
ーワードリストの部分と、データの内容を記述した部分
との表現スタイルの異なる3つの部分に分け、固定的な
形式の部分をあらかじめ用意した第2の自然言語と第1
の自然言語とのパタン対応表によりパタン変換し、また
請求項2の発明では変換辞書を直接検索して一部のキー
ワードを翻訳し、更に請求項3の発明ではデータの内容
部分については、記事見出しのような断片的な表現から
なる場合はそれを文章に変換して翻訳し、これら3つの
部分の翻訳結果をあわせて検索結果として出力する。さ
らに、請求項4の発明では固定的な形式の部分を翻訳す
るためのパタン対応表に、第2の自然言語にはない表示
を第1の自然言語に補足事項を記述しておき、その補足
事項をも同時に出力して利用者の利用上の誤解を防いで
いる。 [0005]
【作用】以上のように第2の自然言語で得られた検索結
果は表現スタイルの異なる3つの部分に分けられ、その
固定的な形式の部分はパタン変換により第1の自然言語
に変換されるため、検索結果の全体を一律に自動翻訳す
る場合より翻訳費用が低減され、しかも誤りも少ない。 [0006]
【実施例】次にこの発明の詳細な説明する。以下では、
第1の自然言語を英語、第2の自然言語を日本語とする
。図1にこの発明を適用したデータベース検索システム
の基本構成を示す。英語゛home banking”
がデータベースの検索キーワードとして指定された場合
を例として、システムの動作を説明する。 [0007]まず、入出力部1により英語の”home
 banking“°が検索キーワードとして指定入力
され、その指定された検索キーワードである英語の“h
ome banking”は、英日翻訳部2において“
′ホームバンキング“という日本語のキーワードに変換
(翻訳)される。この英日翻訳部2は市販されている任
意の英日翻訳システムか、英語−日本語の対訳辞書を検
索する簡単な辞書引きシステムにより実現される。 [0008]つぎに、その翻訳結果の“ホームバンキン
グ°°をキーとして日本語データベース3を検索する。 この検索により図2(a)のような検索結果が得られた
ものとする。この検索結果の内容は、データベースの特
性から図3(a)に示すパタンのようなフィールド構成
をしているものとする。つまり1行目はデータの内容で
あリ、2行目は出典情報などを示す固定的な形式の部分
であり、しかもその例では新聞色、日付、朝刊か夕刊か
、どの面か、どの段か、写真、データ索引の順で配列さ
れている、写真は記述されていない場合もある。3行目
はキーワードリストであり、4行目は分類コードを示す
固定的な形式の部分である。 [00091選別部4は、図3(a)のパタンに従って
、検索結果を固定的な形式の部分と、キーワードリスト
の部分と、データの内容の部分とに分け、その固定的な
形式の部分をパタン変換部5へ、キーワードリストの部
分をキーワード翻訳部6へ、データの内容の部分を日英
翻訳部7へそれぞれ送ることにより、英語への訳出を制
御する。 [00101パタン変換部5は入力された固定的な形式
の部分、く新聞色〉〈日付〉く朝刊/夕刊〉〈面〉く段
〉〈写真〉〈データ索引〉とく分類コード〉について、
新聞色はあらかじめ用意されたパタン対応表中の新聞色
変換表(図3(b))によって変換し、日付中の月はパ
タン対応表中の5名変換表(図3(b))によって変換
し、また図3(b)中の変換ルールに従って、例えば日
付の年9月7日の順を月7日7年の順に置きかえるなど
図3(b)の変換ルールに記述された動作の指定に従っ
て1対1に単語置き換えまたは転記を実施する。 [00111キ一ワード翻訳部6はキーワード用変換辞
書9を持たない場合は入力されたキーワードリスト部分
の各キーワード、つまり銀行、ホームバンキング、テレ
ビゲーム、NTTデータ通信を順に日英翻訳部7により
翻訳することにより英語のキーワードリストを作成する
。キーワード用変換辞書9を持つ場合は、キーワード翻
訳部6は各キーワードについてキーワード用変換辞書9
をあらかじめ検索し、これに載っているものは訳語を直
接取得し、載っていないものはそれを日英翻訳部7に送
ることによりキーワードを翻訳する。 [0012]データの内容の部分は、その表現形式が文
章になっている場合はそのまま、日英翻訳部7により日
英翻訳を実行する。データの内容の部分が新聞の記事見
出しのように断片的な表現からなる場合は文章に変換し
、その文章を日英翻訳部7で翻訳する。見出しを文章に
変換するための方法としては例えば特願平2−1171
51号および特願平2−150336号「自然言語変換
装置」などに用いられている方法を適用すればよい。 [0013]以上のようにして得た翻訳結果を、整形部
8により図2(b)に示すような翻訳結果の形に編成し
、入出力部1に転送する。このとき、例えば゛日本工業
新聞゛を°ゴhe Japan Industrial
 Dai ty−Tと翻訳すると、検索結果を利用する
人はこのような英字新聞があるものと錯覚する恐れがあ
る。そこで、この誤解を防ぐように、図3(b)の変換
ルールの中の新聞色に対するパタン対応表による変換動
作の指定の後半部分に、 「末尾に“’ (in Ja
panese)”°を追加する」という補足事項“(i
n Japanese)’“をあらかじめ記述しておき
、新聞色変換の際にこの補足事項も同時に出力して、図
2(b)のように翻訳結果に追加し、”The Jap
an InduStr ial Daily”は英字新
聞でないことを明示する。このようにパタン対応表に日
本語にはない表現を英語による理解を助けるための補足
事項として記述しておき、これを同時に出力することに
より利用者の理解の助けとすることができる。 [0014]なお、特にことわらなかったが、日英翻訳
部7は市販されている任意の日英翻訳システムが使用可
能である。 [0015]
【発明の効果】以上述べたように、この発明によれば、
データベースの検索結果を、表現スタイルの異なる部分
ごとにその表現スタイルに適した手段で言語翻訳するこ
とにより、機械翻訳の処理費用を低減させることが可能
である。キーワードリスト部分の翻訳をキーワード用変
換辞書を設け、これをまず参照して変換翻訳する時は、
その分日英翻訳部7の負荷を軽減することができる。 [0016]また、文章でない表現スタイルの場合も、
文章に変換することにより、自動的に機械翻訳が可能と
なり、かつ正確に翻訳され、人手による確認、修正を必
要としない。さらに、利用者が用いる第1の自然言語に
補足事項を自動的に補うことにより、第1の自然言語で
データベースが構築されているかのような利用上の誤解
を防ぐこともできる。 [0017]
【図面の簡単な説明】
[0018]
【図1】この発明を適用したデータベース検索システム
の基本構成を示すブロック図である。 [0019]
【図2】データベース検索結果およびその翻訳結果の例
を示す図である。 [00201
【図3]パタン変換ルールの例を示す図である。 [00211 【符号の説明] 1  人出力部、2  英日翻訳部、3  日本語デー
タベース、4  選択部、5  パタン変換部、6キ一
ワード翻訳部、7  日英翻訳部、8整形部、9キーワ
ード用変換辞書。 【図1】

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】第1の自然言語で指定されたキーワードを
    第2の自然言語に自動的に翻訳し、その翻訳結果を用い
    て、第2の自然言語で構築されたデータベースを検索し
    、その検索結果を固定的な形式を持つ部分と、キーワー
    ドリストの部分と、データの内容を記述した部分との3
    つに分け、その固定的な形式の部分をあらかじめ用意し
    た第2の自然言語と第1の自然言語とのパタン対応表に
    よって第1の自然言語の表現に変換し、上記キーワード
    リストおよびデータの内容を第1の自然言語へ自動翻訳
    し、これら固定的な形式の第1の自然言語への変換した
    ものとキーワードリスト及びデータの内容の翻訳した結
    果とを併せて検索結果を得ることを特徴とするデータベ
    ース検索方法。
  2. 【請求項2】上記キーワードリストの翻訳は、まず各キ
    ーワードに対して第2の自然言語から第1の自然言語へ
    の変換辞書を検索し、その変換辞書に載っている単語で
    あればその訳語を直接取得し、その変換辞書になければ
    キーワードを1つの文相当な表現とみなして一連の自動
    翻訳の手順を通して訳語を取得することを特徴とする請
    求項1記載のデータベース検索方法。
  3. 【請求項3】上記データの内容が文の体裁で表現されて
    いる時はそのまま自動翻訳を行ない、記事見出しのよう
    な断片的な表現から成る時はそれを文章に変換してから
    自動翻訳を行なうことを特徴とする請求項1記載のデー
    タベース検索方法。
  4. 【請求項4】上記固定的な形式の部分を翻訳するための
    パタン対応表に、第2の自然言語にはない表現を第1の
    自然言語により理解を助けるための補足事項として記述
    しておき、その補足事項も同時に出力することを特徴と
    する請求項1記載のデータベース検索方法。
JP2400502A 1990-12-05 1990-12-05 データベース検索方法 Pending JPH04209068A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2400502A JPH04209068A (ja) 1990-12-05 1990-12-05 データベース検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2400502A JPH04209068A (ja) 1990-12-05 1990-12-05 データベース検索方法

Publications (1)

Publication Number Publication Date
JPH04209068A true JPH04209068A (ja) 1992-07-30

Family

ID=18510400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2400502A Pending JPH04209068A (ja) 1990-12-05 1990-12-05 データベース検索方法

Country Status (1)

Country Link
JP (1) JPH04209068A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06215042A (ja) * 1992-12-01 1994-08-05 Roehm Properties Bv 他言語cdーrom情報検索装置
JPH10232883A (ja) * 1996-10-23 1998-09-02 I T I:Kk 多言語対応文書検索システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06215042A (ja) * 1992-12-01 1994-08-05 Roehm Properties Bv 他言語cdーrom情報検索装置
JPH10232883A (ja) * 1996-10-23 1998-09-02 I T I:Kk 多言語対応文書検索システム

Similar Documents

Publication Publication Date Title
JP3666004B2 (ja) 多言語対応文書検索システム
JPS6244877A (ja) 機械翻訳装置
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
JPH02140868A (ja) 機械翻訳システム
JPS62203273A (ja) 機械翻訳システム
US5608623A (en) Special cooccurrence processing method and apparatus
JPH10312382A (ja) 類似用例翻訳システム
JPS58192173A (ja) 機械翻訳装置
Carbonell et al. New approaches to machine translation
KR20160140527A (ko) 다국어 전자책 시스템 및 방법
JPH04209068A (ja) データベース検索方法
Monyela Call us by our names: The need to establish authority control standards for non-Roman names
Fassbender Dictionary of basic indexing terminology: latest developments and future plans
Pantelia ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE
JPS6310265A (ja) 翻訳装置
Hlava et al. Cross-language retrieval-English/Russian/French
JPH04128926A (ja) プログラムコメント翻訳方式
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
An Construction and Application of Corpora in Computer-Assisted Translation of Spanish Intangible Cultural Heritage for External Promotion
JP2902343B2 (ja) 言語解析システムおよび方法
JP2958044B2 (ja) かな漢字変換方法及び装置
JP3501240B2 (ja) 文書作成支援装置
Bird et al. Web-based Dictionaries for Languages of the South-west USA.
JPH10105553A (ja) 機械翻訳システム
JPH06187329A (ja) 自然言語処理装置