JPH05120342A - キーワード付与・検索方式 - Google Patents

キーワード付与・検索方式

Info

Publication number
JPH05120342A
JPH05120342A JP3308373A JP30837391A JPH05120342A JP H05120342 A JPH05120342 A JP H05120342A JP 3308373 A JP3308373 A JP 3308373A JP 30837391 A JP30837391 A JP 30837391A JP H05120342 A JPH05120342 A JP H05120342A
Authority
JP
Japan
Prior art keywords
keyword
text
database
search
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3308373A
Other languages
English (en)
Inventor
清 ▲會▼森
Kiyoshi Aimori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3308373A priority Critical patent/JPH05120342A/ja
Publication of JPH05120342A publication Critical patent/JPH05120342A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 登録対象のテキストに付与されるキーワード
の品質が一定の高さとなようにし、どのようなデータベ
ース検索者であっても熟練したデータベース検索者と同
じ検索結果を得ることができるようにする。 【構成】 インデックス変換部3は、シソーラス辞書4
を参照し、テキスト入力部2により読み込まれた入力キ
ーワードを付与キーワードに変換する。データベース登
録部5は、テキスト入力部2により読み込まれたテキス
トとそのテキストに係る付与キーワードとをデータベー
ス6に登録する。検索キーワード決定部9は、シソーラ
ス辞書4を参照し、質問式入力部8により読み込まれた
質問式7中の個々の質問語に対する検索キーワードを決
定し、当該検索キーワードに基づく検索用質問式を生成
する。データベース検索部10は、検索用質問式を満た
すテキストがあるか否かの検索をデータベース6に対し
て行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、キーワードを付与して
テキストをデータベースに登録しキーワードに基づいて
テキストをデータベースから検索するキーワード付与・
検索方式に関する。
【0002】
【従来の技術】従来、この種のキーワード付与・検索方
式では、データベース作成時,データベースへのテキス
トの登録時(データベース登録時)およびデータベース
内のテキストの検索時(データベース検索時)に、次の
ような処理が行われていた。
【0003】 データベース作成時 データベース作成者により、用語間の意味概念の関係
(上位概念,下位概念および関連概念等の関係)が明記
されたシソーラス辞書(後述する本発明におけるシソー
ラス辞書とは異なる)が作成される。
【0004】 データベース登録時 データベース登録者により、上述のシソーラス辞書中の
1以上の用語が登録対象のテキストに付与すべきキーワ
ードとして選択され、そのようなキーワードが付与され
たそのテキストがデータベースに登録される。
【0005】 データベース検索時 データベース検索者により、検索のための専用の命令
(質問語だけでなくその質問語と意味概念において一定
の関係にある用語をも用いて検索することを指示する命
令等)が駆使された質問式が入力される。また、当該キ
ーワード付与・検索方式が実現されるコンピュータシス
テムにより、データベース検索者により入力された質問
式が解釈され、上述のシソーラス辞書が参照されてその
質問式に適合する検索用のキーワードが決定され、決定
された検索用のキーワードがOR演算子で結合された検
索のための質問式が生成され、その検索のための質問式
によってデーベースが検索される。なお、上述のような
専用の命令が駆使された質問式による検索が行われるの
は、検索の精度や網羅性を高めるためである。
【0006】
【発明が解決しようとする課題】上述した従来のキーワ
ード付与・検索方式では、データベース登録時において
は、データベース登録者によりシソーラス辞書中の用語
が登録対象のテキストに付与すべきキーワードとして選
択されているので、データベース登録者の知識の程度に
よって付与されるキーワードの品質の高さが異なる(適
切でないキーワードが登録対象のテキストに付与される
おそれがある)という欠点があった。
【0007】また、データベース検索時においては、デ
ータベース検索者にとっては専用の命令を駆使して質問
式を生成する必要があり(このような専用の命令を使い
こなすためには熟練を要する)、コンピュータシステム
にとってはその質問式の解釈等の煩雑な処理を行う必要
があるので、データベース検索者の負担およびコンピュ
ータシステムの負荷が大になるという欠点があった。
【0008】本発明の目的は、上述の点に鑑み、データ
ベース登録者の知識の程度に関係なく登録対象のテキス
トに付与されるキーワードの品質を一定の高さとするこ
とができ、データベース検索者の負担およびコンピュー
タシステムの負荷を軽減することができ、どのようなデ
ータベース検索者であっても熟練したデータベース検索
者と同じ検索結果を得ることができるキーワード付与・
検索方式を提供することにある。
【0009】
【課題を解決するための手段】本発明のキーワード付与
・検索方式は、テキストとそのテキストに係る入力キー
ワードとを読み込むテキスト入力部と、シソーラス辞書
を参照して前記テキスト入力部により読み込まれた入力
キーワードを付与キーワードに変換するインデックス変
換部と、前記テキスト入力部により読み込まれたテキス
トとそのテキストに付与すべきものとして前記インデッ
クス変換部により生成された付与キーワードとをデータ
ベースに登録するデータベース登録部と、1以上の質問
語からなる質問式を読み込む質問式入力部と、前記シソ
ーラス辞書を参照して前記質問式入力部により読み込ま
れた質問式中の個々の質問語に対する検索キーワードを
決定し当該検索キーワードに基づく検索用質問式を生成
する検索キーワード決定部と、この検索キーワード決定
部で生成された検索用質問式を満たすテキストがあるか
否かの検索を前記データベースに対して行うデータベー
ス検索部とを有する。
【0010】
【作用】本発明のキーワード付与・検索方式では、テキ
スト入力部がテキストとそのテキストに係る入力キーワ
ードとを読み込み、インデックス変換部がシソーラス辞
書を参照してテキスト入力部により読み込まれた入力キ
ーワードを付与キーワードに変換し、データベース登録
部がテキスト入力部により読み込まれたテキストとその
テキストに付与すべきものとしてインデックス変換部に
より生成された付与キーワードとをデータベースに登録
し、質問式入力部が1以上の質問語からなる質問式を読
み込み、検索キーワード決定部がシソーラス辞書を参照
して質問式入力部により読み込まれた質問式中の個々の
質問語に対する検索キーワードを決定し当該検索キーワ
ードに基づく検索用質問式を生成し、データベース検索
部が検索キーワード決定部で生成された検索用質問式を
満たすテキストがあるか否かの検索をデータベースに対
して行う。
【0011】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0012】図1は、本発明のキーワード付与・検索方
式の一実施例の構成を示すブロック図である。本実施例
のキーワード付与・検索方式は、テキストデータ1(テ
キストとそのテキストに係る入力キーワードとからなる
データ)と、テキスト入力部2と、インデックス変換部
3と、シソーラス辞書4と、データベース登録部5と、
データベース6と、質問式7と、質問式入力部8と、検
索キーワード決定部9と、データベース検索部10と、
回答11とを含んで構成されている。
【0013】図2は、本実施例のキーワード付与・検索
方式におけるデータベース登録時(データベース6への
テキストの登録時)の処理を示す流れ図である。この処
理は、テキストデータ入力ステップ21と、テキストデ
ータ存在判定ステップ22と、キーワード変換ステップ
23と、キーワード存在判定ステップ24と、データベ
ース登録ステップ25とからなる。
【0014】図3は、本実施例のキーワード付与・検索
方式におけるデータベース検索時(データベース6内の
テキストの検索時)の処理を示す流れ図である。この処
理は、質問式入力ステップ31と、検索キーワード決定
ステップ32と、キーワード存在判定ステップ33と、
データベース検索ステップ34とからなる。
【0015】図4は、シソーラス辞書4の内容を示す図
である。シソーラス辞書4は、テキストデータ1中の入
力キーワードから付与キーワードへの変換や質問式7中
の質問語から検索キーワードへの変換のために参照さ
れ、同種類の意味・概念(同一概念,上位概念,下位概
念および関連概念等)を持つ用語の集合である用語群と
その用語群を統制する特定のキーワード(統制キーワー
ド)とが対になって構成されている。なお、統制キーワ
ードは、後述する付与キーワードや検索キーワードとな
りうるものである。
【0016】図5(a)〜(c)は、データベース6に
対する登録対象および検索対象となるテキストの具体例
(テキスト〜)と各テキスト〜に係る入力キー
ワードおよび付与キーワードとを示す図である。
【0017】次に、このように構成された本実施例のキ
ーワード付与・検索方式の動作について説明する。
【0018】初めに、データベース6へのテキストの登
録処理の際(データベース登録時)の動作について説明
する(図2参照)。
【0019】テキスト入力部2は、テキストデータ1を
読み込み(ステップ21)、読み込むべきテキストデー
タ1が存在するか否か(ステップ21でテキストデータ
1を読み込むことができたか否か)を判定する(ステッ
プ22)。
【0020】この判定で読み込むべきテキストデータ1
が存在する場合には、テキスト入力部2はインデックス
変換部3にそのテキストデータ1を渡す。
【0021】インデックス変換部3は、シソーラス辞書
4を参照して、テキスト入力部2から渡されたテキスト
データ1中の入力キーワードの個々を付与キーワード
(データベース6にインデックスとして格納するための
キーワード)に変換する(ステップ23)。すなわち、
入力キーワードがシソーラス辞書4内の用語群に存在す
る場合には、その入力キーワードに対応する付与キーワ
ードとしてその用語群に対応する統制キーワードを選択
する(入力キーワードが統制キーワードと同一である場
合には、その入力キーワードを付与キーワードとして選
択する)。
【0022】ステップ23の処理が終了すると、インデ
ックス変換部3は、変換対象のキーワードが存在するか
否か(付与キーワードに変換すべき入力キーワードがテ
キストデータ1中に残存しているか否か)を判定する
(ステップ24)。
【0023】この判定で変換対象のキーワードが存在す
る場合には、インデックス変換部3はテキストデータ1
中の次の入力キーワードを付与キーワードに変換するた
めにステップ23の処理に制御を戻す。
【0024】ステップ24の判定で変換対象のキーワー
ドが存在しない場合には、インデックス変換部3は変換
後のキーワード(付与キーワード)の全てとともに制御
をデータベース登録部5に渡す。
【0025】データベース登録部5は、テキスト入力部
2により読み込まれたテキストデータ1中のテキストと
そのテキストに付与するためにインデックス変換部3に
よる変換で生成された付与キーワードとの組合せをデー
タベース6に登録し(ステップ25)、テキスト入力部
2によるステップ21の処理に制御を戻す。
【0026】ステップ22の判定で読み込むべきテキス
トデータ1が存在しない場合には、処理が終了する。
【0027】続いて、データベース6内のテキストの検
索処理の際(データベース検索時)の動作について説明
する(図3参照)。
【0028】質問式入力部8は、問合せとして入力され
1以上の質問語からなる質問式7を読み込む(ステップ
31)。
【0029】検索キーワード決定部9は、シソーラス辞
書4を参照して、質問式入力部8により入力された質問
式7に記述されている個々の質問語(入力された元の質
問語)と置き換えるべき検索キーワード(データベース
6を検索するために使用されるキーワード)を決定する
(質問式7中の質問語から検索キーワードへの変換を行
う)(ステップ32)。すなわち、質問語がシソーラス
辞書4内の用語群に存在する場合には、その質問語に対
応する検索キーワードとしてその用語群に対応する統制
キーワードを選択する(質問語が統制キーワードと同一
である場合には、その質問語を検索キーワードとして選
択する)。
【0030】ステップ32の処理が終了すると、検索キ
ーワード決定部9は変換対象のキーワードが存在するか
否か(検索キーワードに変換すべき質問語が質問式7中
に残存しているか否か)を判定する(ステップ33)。
【0031】この判定で変換対象のキーワードが存在す
る場合には、検索キーワード決定部9は質問式7中の次
の質問語を検索キーワードに変換するためにステップ3
2の処理に制御を戻す。
【0032】ステップ33の判定で変換対象のキーワー
ドが存在しない場合には、検索キーワード決定部9は上
述の変換によって生成された検索キーワードがOR演算
子で結合された検索のための質問式(検索用質問式)を
生成し、その検索用質問式とともに制御をデータベース
検索部10に渡す。
【0033】データベース検索部10は、データベース
6に対して、検索キーワード決定部9で生成された検索
用質問式を満たすテキストがあるか否かを検索し、その
検索用質問式を満たすテキストを回答11として出力す
る(ステップ34)。
【0034】次に、本実施例のキーワード付与・検索方
式におけるデータベース登録時の処理の具体的な動作に
ついて説明する。ここでは、図5(a)に示すテキスト
と図5(a)に示す入力キーワードとが入力され、テ
キストと図5(a)に示す入力キーワードとがデータ
ベース6に登録される際の動作について説明する。
【0035】テキスト入力部2は、上述のテキストと
入力キーワードとからなるテキストデータ1を読み込
み、インデックス変換部3にそのテキストデータ1を渡
す。
【0036】インデックス変換部3は、シソーラス辞書
4を参照して、テキスト入力部2から渡されたテキスト
データ1中の入力キーワードの個々を付与キーワードに
変換する。
【0037】すなわち、図3に示すシソーラス辞書4中
の統制キーワードが「オブジェクト指向データベース」
である対応情報(用語群と統制キーワードとの対応を示
す対応情報)を参照して、「オブジェクト指向データベ
ース管理システム」という入力キーワードを「オブジェ
クト指向データベース」という付与キーワードに変換
し、「OODBMS」という入力キーワードを「オブジ
ェクト指向データベース」というキーワードに変換し、
「オブジェクト指向」という入力キーワードを「オブジ
ェクト指向データベース」という付与キーワードに変換
する。以上の変換の結果により、テキストの付与キー
ワードは「オブジェクト指向データベース」だけにな
る。
【0038】テキストとインデックス変換部3による
変換で生成された付与キーワードとは、データベース登
録部5に渡され、データベース登録部5によってデータ
ベース6に登録される。
【0039】次に、本実施例のキーワード付与・検索方
式におけるデータベース検索時の処理の具体的な動作に
ついて説明する。ここでは、図5(a)〜(c)に示す
テキスト〜(図5(a)〜(c)に示す付与キーワ
ードが付与されているものとする)が登録されているデ
ータベース6に対するテキストの検索が行われる際の動
作について説明する。
【0040】第1の具体例として、「OODB」という
質問式7(「OODB」という質問語のみからなる質問
式7)が入力された場合について考える。
【0041】質問式入力部8は、その質問式7を読み込
み、その質問式7を検索キーワード決定部9に渡す。
【0042】検索キーワード決定部9は、その質問式7
中の質問語とシソーラス辞書4とに基づいて、データベ
ース6を検索するために使用される検索キーワードを決
定する。すなわち、図4に示すシソーラス辞書4を参照
して、「OODB」という質問語を「オブジェクト指向
データベース」という検索キーワードに変換し(検索キ
ーワードを「オブジェクト指向データベース」に決定
し)、その検索キーワードに基づく検索用質問式(「オ
ブジェクト指向データベース」という検索用質問式)を
生成する。
【0043】データベース検索部10は、以上のように
して生成された検索用質問式によってデータベース6を
検索し(「オブジェクト指向データベース」という付与
キーワードが付与されているテキストをデータベース6
から検索し)、その検索結果として図5(a)示すテキ
ストを検出し、そのテキストを回答11として出力
する。
【0044】第2の具体例として、「自動インデグシン
グ OR キーワード自動抽出 OR automat
ed indexing」という質問式7(「自動イン
デグシング」という質問語と「キーワード自動抽出」と
いう質問語と「automated indexin
g」という質問語からなる質問式7)が入力された場合
について考える。
【0045】質問式入力部8は、その質問式7を読み込
み、その質問式7を検索キーワード決定部9に渡す。
【0046】検索キーワード決定部9は、その質問式7
中の質問語とシソーラス辞書4とに基づいて、検索キー
ワードを決定する。すなわち、図4に示すシソーラス辞
書4を参照して、「自動インデグシング」という質問語
を「自動索引」という検索キーワードに変換し、「キー
ワード自動抽出」という質問語を「自動索引」という検
索キーワードに変換し、「automated ind
exing」という質問語を「automatic i
ndexing」という検索キーワードに変換する。さ
らに、以上の検索キーワードの決定に基づき、入力され
た元の質問式7を以上の検索キーワードで組み直し、検
索用質問式(「自動索引 OR automatic
indexing」という検索用質問式)を生成する。
【0047】データベース検索部10は、以上のように
して生成された検索用質問式によってデータベース6を
検索し、その検索結果として図5(b)に示すテキスト
と図5(c)に示すテキストとを検出し、それらの
テキストおよびを回答11として出力する。
【0048】
【発明の効果】以上説明したように本発明は、データベ
ース登録時においてはシソーラス辞書を参照して入力キ
ーワードを付与キーワードに変換し(統制されたキーワ
ードを登録対象のテキストに付与し)、データベース検
索時においてはデータベース登録時に用いたシソーラス
辞書を参照して質問語に対応する検索キーワードを検出
しその検索キーワードに基づく検索用質問式を生成しそ
の検索用質問式によってデータベースを検索することに
より、データベース登録者の知識の程度の差に関係なく
付与キーワードの品質を一定の高さとすることができ、
データベース登録時およびデータベース検索時における
データベース検索者の負担およびコンピュータシステム
の負荷を軽減することができ、どのようなデータベース
検索者であっても熟練したデータベース検索者と同じ検
索結果を得ることが可能になるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】図1に示すキーワード付与・検索方式における
データベース登録時の処理を示す流れ図である。
【図3】図1に示すキーワード付与・検索方式における
データベース検索時の処理を示す流れ図である。
【図4】図1中のシソーラス辞書の内容を示す図であ
る。
【図5】図1に示すキーワード付与・検索方式の登録対
象および検索対象となるテキストならびにそのテキスト
に対する入力キーワードおよび付与キーワードの具体例
を示す図である。
【符号の説明】
1 テキストデータ 2 テキスト入力部 3 インデックス変換部 4 シソーラス辞書 5 データベース登録部 6 データベース 7 質問式 8 質問式入力部 9 検索キーワード決定部 10 データベース検索部 11 回答

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 テキストとそのテキストに係る入力キー
    ワードとを読み込むテキスト入力部と、 シソーラス辞書を参照して前記テキスト入力部により読
    み込まれた入力キーワードを付与キーワードに変換する
    インデックス変換部と、 前記テキスト入力部により読み込まれたテキストとその
    テキストに付与すべきものとして前記インデックス変換
    部により生成された付与キーワードとをデータベースに
    登録するデータベース登録部と、 1以上の質問語からなる質問式を読み込む質問式入力部
    と、 前記シソーラス辞書を参照して前記質問式入力部により
    読み込まれた質問式中の個々の質問語に対する検索キー
    ワードを決定し当該検索キーワードに基づく検索用質問
    式を生成する検索キーワード決定部と、 この検索キーワード決定部で生成された検索用質問式を
    満たすテキストがあるか否かの検索を前記データベース
    に対して行うデータベース検索部とを有することを特徴
    とするキーワード付与・検索方式。
JP3308373A 1991-10-28 1991-10-28 キーワード付与・検索方式 Pending JPH05120342A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3308373A JPH05120342A (ja) 1991-10-28 1991-10-28 キーワード付与・検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3308373A JPH05120342A (ja) 1991-10-28 1991-10-28 キーワード付与・検索方式

Publications (1)

Publication Number Publication Date
JPH05120342A true JPH05120342A (ja) 1993-05-18

Family

ID=17980288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3308373A Pending JPH05120342A (ja) 1991-10-28 1991-10-28 キーワード付与・検索方式

Country Status (1)

Country Link
JP (1) JPH05120342A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134065A (ja) * 1996-10-29 1998-05-22 Nec Corp 索引情報生成装置、索引情報生成方法および索引情報生 成用 プログラムを記憶した記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134065A (ja) * 1996-10-29 1998-05-22 Nec Corp 索引情報生成装置、索引情報生成方法および索引情報生 成用 プログラムを記憶した記憶媒体

Similar Documents

Publication Publication Date Title
US6233578B1 (en) Method and system for information retrieval
JP3666004B2 (ja) 多言語対応文書検索システム
US7260570B2 (en) Retrieving matching documents by queries in any national language
US8594994B1 (en) Cross-lingual indexing and information retrieval
JPH11203294A (ja) 情報検索システム、装置、方法及び記録媒体
US5557788A (en) Relational access system for network type data bases which uses a unique declarative statement
JP3163141B2 (ja) リレーショナルデータベース処理装置および処理方法
JPH0756932A (ja) 情報検索システム
JPH05151253A (ja) 文書検索装置
JP2001188802A (ja) 情報検索装置及び情報検索方法
JP3786233B2 (ja) 情報検索方法および情報検索システム
US20080082516A1 (en) System for and method of searching distributed data base, and information management device
JPH05324719A (ja) 文書検索システム
JPH10162008A (ja) 情報検索方法及び装置
JPH0581326A (ja) データベース検索装置
JPH05120342A (ja) キーワード付与・検索方式
JPH05266085A (ja) 動的概念辞書を用いた類似検索方法及びその装置
JP3016799B2 (ja) データベース問い合わせ処理装置
KR100434718B1 (ko) 문서 색인 시스템 및 그 방법
JPH0916624A (ja) 階層型データ検索方法
JP2001134584A (ja) 類似データの検索方法,検索装置および類似データ検索プログラム記録媒体
JP2011095802A (ja) 機械翻訳装置及びプログラム
JP2006343798A (ja) マテリアライズドビュー表作成方法、装置及びプログラム
JP2655480B2 (ja) 対象適応型自然言語インタフェース装置
JPH06180718A (ja) 検索システム