JPH0310374A - 漢字複合語キーワード検索装置 - Google Patents
漢字複合語キーワード検索装置Info
- Publication number
- JPH0310374A JPH0310374A JP1146361A JP14636189A JPH0310374A JP H0310374 A JPH0310374 A JP H0310374A JP 1146361 A JP1146361 A JP 1146361A JP 14636189 A JP14636189 A JP 14636189A JP H0310374 A JPH0310374 A JP H0310374A
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary
- word
- search
- library
- decomposing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 150000001875 compounds Chemical class 0.000 title description 13
- 238000000354 decomposition reaction Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 11
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、検索質問として入力した質問語を用語分解用
辞書を用いて単語に分解し、分解した単語をAND演算
子で結合し、その式と入力した質問語をOR演算子で結
合した検索式を自動的に生成してデータベースを検索す
る漢字複合語キーワード検索装置に関する。
辞書を用いて単語に分解し、分解した単語をAND演算
子で結合し、その式と入力した質問語をOR演算子で結
合した検索式を自動的に生成してデータベースを検索す
る漢字複合語キーワード検索装置に関する。
従来のこの種の漢字キーワード検索は、検索者が投入し
た用語をシステムが読みとり、そのままキーワードとし
てデータベースに対して検索処理を行っている。複数の
単語からなる複合語のキーワードを投入した場合でも、
複合語を構成している個々の単語には着目せずに、その
ままをキーワードとして検索している。特に複合語の場
合、単語に分解して検索式を生成するのは、検索者の作
業に頼っている。
た用語をシステムが読みとり、そのままキーワードとし
てデータベースに対して検索処理を行っている。複数の
単語からなる複合語のキーワードを投入した場合でも、
複合語を構成している個々の単語には着目せずに、その
ままをキーワードとして検索している。特に複合語の場
合、単語に分解して検索式を生成するのは、検索者の作
業に頼っている。
上述したような従来の日本語キーワード検索手段は、複
合語を構成している個々の単語がテキスト中に現われて
、しかも質問語に表現される検索要求が複合語の現われ
るテキストと同じであってもそれをヒツトせず、このた
め検索精度が落ちるという欠点がある。また、検索者が
複合語を単語に分解して個々の単語をAND演算子で結
合するにしても、その検索者が、使用するデータベース
を熟知していないと、データベースに合った検索式を作
成できないという欠点もある。
合語を構成している個々の単語がテキスト中に現われて
、しかも質問語に表現される検索要求が複合語の現われ
るテキストと同じであってもそれをヒツトせず、このた
め検索精度が落ちるという欠点がある。また、検索者が
複合語を単語に分解して個々の単語をAND演算子で結
合するにしても、その検索者が、使用するデータベース
を熟知していないと、データベースに合った検索式を作
成できないという欠点もある。
本発明の漢字複合語キーワード検索装置は、上述した従
来の問題を解決し得る漢字複合語キーワード検索装置を
提供するもので、検索質問として入力する質問語を読込
むデータ入力手段と、入力した質問語を単語に分解する
ために使用する用語分解用辞書を参照しながら質問語の
先頭文字を開始点として質問語を単語に分解する処理を
質問語の最後の文字まで繰り返す用語分解手段と、用語
分解用辞書を用いて分解した単語と質問語から検索式を
生成する検索式生成手段と、データベースのインデック
スに対して検索式生成部で作った検索式を満たすテキス
トデータがあるか否かを検索して適合した件数である回
答を出力する検索手段とを備えている。
来の問題を解決し得る漢字複合語キーワード検索装置を
提供するもので、検索質問として入力する質問語を読込
むデータ入力手段と、入力した質問語を単語に分解する
ために使用する用語分解用辞書を参照しながら質問語の
先頭文字を開始点として質問語を単語に分解する処理を
質問語の最後の文字まで繰り返す用語分解手段と、用語
分解用辞書を用いて分解した単語と質問語から検索式を
生成する検索式生成手段と、データベースのインデック
スに対して検索式生成部で作った検索式を満たすテキス
トデータがあるか否かを検索して適合した件数である回
答を出力する検索手段とを備えている。
次に、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の一実施例を示すブロック図である。第
2図は第1図の実施例において入力した質問語を単語に
分解するために参照する用語分解用辞書の内容の一例を
示す説明図である。第3図は第1図の実施例において用
語分解の手順を示す説明図である。第4図は第1図の実
施例において検索対象となるデータベースの内容の一例
を示す説明図であり、テキストデータと検索時に参照す
るインデックスとから構成されている。ここで、個々の
キーワードは各データに付与されており、個々のキーワ
ードは付与されているデータのレコード番号をもってい
る。このレコード番号テテータとインデックスが対応し
ている。第5図は第1図の実施例において分解した用語
を格納するキーワード保存テーブルの内容の一例を示す
説明図である。
2図は第1図の実施例において入力した質問語を単語に
分解するために参照する用語分解用辞書の内容の一例を
示す説明図である。第3図は第1図の実施例において用
語分解の手順を示す説明図である。第4図は第1図の実
施例において検索対象となるデータベースの内容の一例
を示す説明図であり、テキストデータと検索時に参照す
るインデックスとから構成されている。ここで、個々の
キーワードは各データに付与されており、個々のキーワ
ードは付与されているデータのレコード番号をもってい
る。このレコード番号テテータとインデックスが対応し
ている。第5図は第1図の実施例において分解した用語
を格納するキーワード保存テーブルの内容の一例を示す
説明図である。
第1図において、1は検索質問として入力される質問語
、2は質問語1を読込むデータ入力部、3は質問語を単
語に分解するために使用する用語分解用辞書4を参照し
ながら質問語1を分解する用語分解部である。用語分解
部3では、はじめに質問語1をキーワード保存テーブル
に格納し、続いて用語分解を行う。まず質問語1の先頭
文字を開始点とし、1文字目の用語が用語分解用辞書4
の中の用語と一致するか否かを調べる。一致しない場合
は、さらに1文字加えた長さまでの用語が用語分解用辞
書4の中の用語と一致するか否かを調べる。一致した場
合は、開始点から一致した長さまでの用語をキーワード
保存テーブルに格納する。そして一致した長さに1を加
えた次の文字を新たな開始点とする。上述の処理を質問
語1の最後の文字まで繰返す。ここで一致する用語がな
く、最後の文字に到達したときは、開始点からの文字を
キーワード保存テーブルに格納する。5はキワード保存
テーブルに格納した用語を用いて検索部6に渡す検索式
を生成する検索式生成部である。
、2は質問語1を読込むデータ入力部、3は質問語を単
語に分解するために使用する用語分解用辞書4を参照し
ながら質問語1を分解する用語分解部である。用語分解
部3では、はじめに質問語1をキーワード保存テーブル
に格納し、続いて用語分解を行う。まず質問語1の先頭
文字を開始点とし、1文字目の用語が用語分解用辞書4
の中の用語と一致するか否かを調べる。一致しない場合
は、さらに1文字加えた長さまでの用語が用語分解用辞
書4の中の用語と一致するか否かを調べる。一致した場
合は、開始点から一致した長さまでの用語をキーワード
保存テーブルに格納する。そして一致した長さに1を加
えた次の文字を新たな開始点とする。上述の処理を質問
語1の最後の文字まで繰返す。ここで一致する用語がな
く、最後の文字に到達したときは、開始点からの文字を
キーワード保存テーブルに格納する。5はキワード保存
テーブルに格納した用語を用いて検索部6に渡す検索式
を生成する検索式生成部である。
検索式は、分解した用語が同一データ内に出現しても検
索できるように、分解した用語をAND演算子で結合し
、その検索結果と入力した質問語1の検索結果の論理和
を回答8として出力するように、AND演算子で結合し
た式と質問語1とをOR演算子で結合し、 A OR(B AND CAND・・・・・・)
の形式をとる。ここで、Aは質問語1を、BおよびCは
それぞれキーワード保存テーブルに格納されている分解
された用語を示す。キーワード保存テーブルに質問語1
と同じ用語が格納されている場合は、質問語1がそのま
ま検索式として生成される。すなわち という検索式が生成される。6はデータベース7のイン
デックスに対して検索式生成部5で作った検索式を満た
すテキストデータがあるか否かを探=6 索し、適合した件数である回答8を出力する検索部であ
る。
索できるように、分解した用語をAND演算子で結合し
、その検索結果と入力した質問語1の検索結果の論理和
を回答8として出力するように、AND演算子で結合し
た式と質問語1とをOR演算子で結合し、 A OR(B AND CAND・・・・・・)
の形式をとる。ここで、Aは質問語1を、BおよびCは
それぞれキーワード保存テーブルに格納されている分解
された用語を示す。キーワード保存テーブルに質問語1
と同じ用語が格納されている場合は、質問語1がそのま
ま検索式として生成される。すなわち という検索式が生成される。6はデータベース7のイン
デックスに対して検索式生成部5で作った検索式を満た
すテキストデータがあるか否かを探=6 索し、適合した件数である回答8を出力する検索部であ
る。
次に一例をあげて上述の実施例の動作について説明する
。説明の都合上、質問語1に「図書館業務」を入力した
ものとする。
。説明の都合上、質問語1に「図書館業務」を入力した
ものとする。
データ入力部2は、「図書館業務」といり質問語1を読
込んで用語分解部3に渡す。用語分解部3は、はじめに
キーワード保存テーブルに質問語1 「図書館業務」を
格納する。続いて用語「図」を始めの開始点21として
用語分解用辞書4に「図」があるか否かを調べる。しか
し、これは存在しないので、次の1文字を加えて用語「
図書」で参照する。このように調べていくと、第2図に
示すように用語「図書館」 31が一致することがわか
る。用語「図書館J31をキーワード保存テーブルに格
納し、続いて「業」を次の開始点22として探索すると
、用語「業務」32が用語分解用辞書4に存在するので
、これをキーワード保存テーブルに格納する。このテー
ブルは検索式生成部5に渡され、「図書館」と「業務」
とをAND演算子て結合し、その式と「図書館」をOR
演算子で結合した 図書館業務 OR(図書館 AND 業務)という検
索式を生成する。
込んで用語分解部3に渡す。用語分解部3は、はじめに
キーワード保存テーブルに質問語1 「図書館業務」を
格納する。続いて用語「図」を始めの開始点21として
用語分解用辞書4に「図」があるか否かを調べる。しか
し、これは存在しないので、次の1文字を加えて用語「
図書」で参照する。このように調べていくと、第2図に
示すように用語「図書館」 31が一致することがわか
る。用語「図書館J31をキーワード保存テーブルに格
納し、続いて「業」を次の開始点22として探索すると
、用語「業務」32が用語分解用辞書4に存在するので
、これをキーワード保存テーブルに格納する。このテー
ブルは検索式生成部5に渡され、「図書館」と「業務」
とをAND演算子て結合し、その式と「図書館」をOR
演算子で結合した 図書館業務 OR(図書館 AND 業務)という検
索式を生成する。
検索部6では、データベース7のインデックス部に対し
「図書館業務」というキーワードを、もつデータまたは
「図書館」と「業務」という二つのキーワードをもつデ
ータを探索し、その論理和をとる。第4図に示すように
「図書館業務」というキーワードをもつデータはデータ
3に格納され、「図書館」と「業務」の2つのキーワー
ドをもつデータは、データ1およびデータ2およびデー
タ3に格納されていることがわかる。結果として回答7
には「3件」が出力される。
「図書館業務」というキーワードを、もつデータまたは
「図書館」と「業務」という二つのキーワードをもつデ
ータを探索し、その論理和をとる。第4図に示すように
「図書館業務」というキーワードをもつデータはデータ
3に格納され、「図書館」と「業務」の2つのキーワー
ドをもつデータは、データ1およびデータ2およびデー
タ3に格納されていることがわかる。結果として回答7
には「3件」が出力される。
さらに−例として「レファレンス」といつ質問語1を入
力したとする。はじめにキーワード保存テーブルに「レ
ファレンスJを格納する。続いて用語分解部5は、用語
「しjを開始点として用語分解用辞書4を参照する。こ
れにより第2図に示すように用語分解用辞書4には用語
[レファレンス」が格納されていることがわかり、これ
をキーワード保存テーブルに格納する。このテーブルは
検索式生成部5に渡されて検索式を生成する。ここで、
質問語1と同じ用語がキーワード保存テーブルに格納さ
れているため、 レファレンス という検索式が生成される。検索部6ではデータベース
に対し「レファレンス」というキーワードをもつデータ
を探索し、第2図に示すように回答7には「2件」が出
力される。
力したとする。はじめにキーワード保存テーブルに「レ
ファレンスJを格納する。続いて用語分解部5は、用語
「しjを開始点として用語分解用辞書4を参照する。こ
れにより第2図に示すように用語分解用辞書4には用語
[レファレンス」が格納されていることがわかり、これ
をキーワード保存テーブルに格納する。このテーブルは
検索式生成部5に渡されて検索式を生成する。ここで、
質問語1と同じ用語がキーワード保存テーブルに格納さ
れているため、 レファレンス という検索式が生成される。検索部6ではデータベース
に対し「レファレンス」というキーワードをもつデータ
を探索し、第2図に示すように回答7には「2件」が出
力される。
以上説明したように、本発明の漢字複合語キーワード検
索装置は、質問として入力された質問語を用語分解用辞
書を用いて単語に分解し、質問語と分解された単語とか
ら検索式を自動的に生成してデータベースを検索するこ
とにより、複合語を構成している個々の単語がテキスト
中に現われて、しかも質問語に表現される検索要求が複
合語の現われるテキストと同じであってもヒツトしない
ということや、検索者が個々の単語をAND演算子− で結合する必要がなくなるため、熟練していない検索者
でも熟練者と同じ検索結果を得ることができるという効
果がある。
索装置は、質問として入力された質問語を用語分解用辞
書を用いて単語に分解し、質問語と分解された単語とか
ら検索式を自動的に生成してデータベースを検索するこ
とにより、複合語を構成している個々の単語がテキスト
中に現われて、しかも質問語に表現される検索要求が複
合語の現われるテキストと同じであってもヒツトしない
ということや、検索者が個々の単語をAND演算子− で結合する必要がなくなるため、熟練していない検索者
でも熟練者と同じ検索結果を得ることができるという効
果がある。
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例において入力した用語を単語に分解する
ために参照する用語分解用辞書の内容を示す説明図、第
3図は第1図の実施例の用語分解の手順を示す説明図、
第4図は第1図の実施例において検索対象となるデータ
ベースの内容の一例を示す説明図、第5図は第1図の実
施例において分解された検索語を格納するキーワード保
存テーブルの内容の一例を示す説明図である。 1・・・・・・質問語、2・・・・・・データ入力部、
3・・・・・用語分解部、4・・・・・・用語分解用辞
書、5・・・・・・検索式生成部、6・・・・・・検索
部、7・・・・・・データベース、8・・・・・・回答
。
第1図の実施例において入力した用語を単語に分解する
ために参照する用語分解用辞書の内容を示す説明図、第
3図は第1図の実施例の用語分解の手順を示す説明図、
第4図は第1図の実施例において検索対象となるデータ
ベースの内容の一例を示す説明図、第5図は第1図の実
施例において分解された検索語を格納するキーワード保
存テーブルの内容の一例を示す説明図である。 1・・・・・・質問語、2・・・・・・データ入力部、
3・・・・・用語分解部、4・・・・・・用語分解用辞
書、5・・・・・・検索式生成部、6・・・・・・検索
部、7・・・・・・データベース、8・・・・・・回答
。
Claims (1)
- 検索質問として入力する質問語を読込むデータ入力部と
、入力した前記質問語を単語に分解するために使用する
用語分解用辞書を参照しながら前記質問語の先頭文字を
開始点として質問語を単語に分解する処理を質問語の最
後の文字まで繰返す用語分解部と、前記用語分解辞書を
用いて分解した単語と前記質問語から検索式を生成する
検索式生成部と、データベースのインデックスに対して
前記検索式生成部で作った検索式を満たすテキストデー
タがあるか否かを探索して適合した件数である回答を出
力する検索部とを備えることを特徴とする漢字複合語キ
ーワード検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1146361A JP2666475B2 (ja) | 1989-06-07 | 1989-06-07 | 漢字複合語キーワード検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1146361A JP2666475B2 (ja) | 1989-06-07 | 1989-06-07 | 漢字複合語キーワード検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0310374A true JPH0310374A (ja) | 1991-01-17 |
| JP2666475B2 JP2666475B2 (ja) | 1997-10-22 |
Family
ID=15405982
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1146361A Expired - Lifetime JP2666475B2 (ja) | 1989-06-07 | 1989-06-07 | 漢字複合語キーワード検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2666475B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09198395A (ja) * | 1996-01-16 | 1997-07-31 | Fuji Xerox Co Ltd | 文書検索装置 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63201824A (ja) * | 1987-02-18 | 1988-08-19 | Hitachi Ltd | 検索キ−ワ−ド選択方式 |
-
1989
- 1989-06-07 JP JP1146361A patent/JP2666475B2/ja not_active Expired - Lifetime
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63201824A (ja) * | 1987-02-18 | 1988-08-19 | Hitachi Ltd | 検索キ−ワ−ド選択方式 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09198395A (ja) * | 1996-01-16 | 1997-07-31 | Fuji Xerox Co Ltd | 文書検索装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2666475B2 (ja) | 1997-10-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6167370A (en) | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures | |
| US7444326B1 (en) | Method of performing approximate substring indexing | |
| JPH0527149B2 (ja) | ||
| JPH11110413A (ja) | データベース検索結果を生成するための方法および装置 | |
| JPH0395673A (ja) | 文章間リンク設定方法およびその装置 | |
| JP3123836B2 (ja) | テキスト型データベース装置 | |
| JPH0310374A (ja) | 漢字複合語キーワード検索装置 | |
| JPS617936A (ja) | 情報検索方式 | |
| JP3558267B2 (ja) | 文書検索装置 | |
| JPH0581326A (ja) | データベース検索装置 | |
| JP3222193B2 (ja) | 情報検索装置 | |
| JP3343941B2 (ja) | 例文検索システム | |
| JPH0944521A (ja) | インデックス作成装置および文書検索装置 | |
| JPH03148765A (ja) | 文書検索装置 | |
| JPH08249341A (ja) | 文書データベースの文書格納・検索装置 | |
| US20040249827A1 (en) | System and method of retrieving a range of rows of data from a database system | |
| JPH1125117A (ja) | 語検索装置 | |
| JPH06504858A (ja) | テキスト管理システム | |
| JPS60247756A (ja) | デ−タベ−ス装置 | |
| JPH06168271A (ja) | 項目別辞書利用データベース検索システム | |
| JPH05250413A (ja) | テキストデータ検索装置 | |
| JPH0765013A (ja) | 文書検索装置 | |
| JPH0973460A (ja) | 文書検索装置 | |
| JPH08287083A (ja) | 辞書未登録語展開方法及び装置 | |
| JPH0731684B2 (ja) | 日本語文章処理方式 |