JPH03127254A - 単語検索装置 - Google Patents
単語検索装置Info
- Publication number
- JPH03127254A JPH03127254A JP1266506A JP26650689A JPH03127254A JP H03127254 A JPH03127254 A JP H03127254A JP 1266506 A JP1266506 A JP 1266506A JP 26650689 A JP26650689 A JP 26650689A JP H03127254 A JPH03127254 A JP H03127254A
- Authority
- JP
- Japan
- Prior art keywords
- word
- heading
- storage area
- words
- english
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
この発明は、単語の綴りの誤りを検出するスペル・チエ
ッカ、単語の綴りの誤シに対して正しい単語を提示する
スペル・コレクタ等、単語辞書データベースを用いて単
語を検索するための単語検索装置に関するものである。
ッカ、単語の綴りの誤シに対して正しい単語を提示する
スペル・コレクタ等、単語辞書データベースを用いて単
語を検索するための単語検索装置に関するものである。
従来の技術
単語検索のための単語辞書データベースは、高速アクセ
スと小容量化が求められる。筐た。付加情報として品詞
、意味、アクセントや用法等をも保持した単語辞書デー
タベースが、更に望捷しい。
スと小容量化が求められる。筐た。付加情報として品詞
、意味、アクセントや用法等をも保持した単語辞書デー
タベースが、更に望捷しい。
これ1での単語辞書データベースには、単語に対する様
々なハツシュ化、単語を構成する文字の圧縮、コード化
、単語その11の格納といった方式が採用されてきた。
々なハツシュ化、単語を構成する文字の圧縮、コード化
、単語その11の格納といった方式が採用されてきた。
発明が解決しようとする課題
従来の単語辞書データベースに採用された方式では、小
容量化と高速検索及び元の単語の復元を全て満足するも
のはなく、更に付加情報を付加できなかったり付加する
ための機構が複雑であったりしていた。
容量化と高速検索及び元の単語の復元を全て満足するも
のはなく、更に付加情報を付加できなかったり付加する
ための機構が複雑であったりしていた。
課題を解決するための手段
この課題を解決するため本発明は、単語の見出し記憶領
域に各単語を構成するアルファベットを各単語毎に全て
記憶するのではなく、アルファベット順に記憶する見出
しの直前の見出しと重複するアルファベットの文字数と
、それ以外の文字とを見出し情報記憶領域に記憶し、検
索すべき単語と見出し情報記憶領域に記憶されたデータ
が示す単語とが一致する見出しを検索、する手段を備え
る。
域に各単語を構成するアルファベットを各単語毎に全て
記憶するのではなく、アルファベット順に記憶する見出
しの直前の見出しと重複するアルファベットの文字数と
、それ以外の文字とを見出し情報記憶領域に記憶し、検
索すべき単語と見出し情報記憶領域に記憶されたデータ
が示す単語とが一致する見出しを検索、する手段を備え
る。
作用
この構成によって、アルファベット順に並べた単語の各
々はその直前の単語と重複するアルファベット文字列を
含んでいるので、見出し情報記憶領域に記憶すべきデー
タ量は少ないので、この少ないデータと検索すべき単語
との一致判断も少なくなる。
々はその直前の単語と重複するアルファベット文字列を
含んでいるので、見出し情報記憶領域に記憶すべきデー
タ量は少ないので、この少ないデータと検索すべき単語
との一致判断も少なくなる。
実施例
この発明の一実施例における単語検索装置を第1図〜第
6図を用いて説明する。第1図は英単語辞書をデータベ
ース化する際の対象となる英単語列を示す。ここで、指
標文字列を“aeser”とした場合、英単語W1と指
標文字列S1との重複に着目すると、第2図のxlが得
られる。同様に、第1図W2から第2図x2が、第1図
W3から第2図x3が得られる。以下同様に、第1図か
ら第2図が得られる。
6図を用いて説明する。第1図は英単語辞書をデータベ
ース化する際の対象となる英単語列を示す。ここで、指
標文字列を“aeser”とした場合、英単語W1と指
標文字列S1との重複に着目すると、第2図のxlが得
られる。同様に、第1図W2から第2図x2が、第1図
W3から第2図x3が得られる。以下同様に、第1図か
ら第2図が得られる。
第1図での’I’11からX11全ての英単語の文字の
長さの合計は97文字、第2図でのxlからX11での
それはヘッダ長を1文字として44文字、指標文字夕1
」の長さを含めても49文字となり、約60%に圧縮さ
れたことになる。
長さの合計は97文字、第2図でのxlからX11での
それはヘッダ長を1文字として44文字、指標文字夕1
」の長さを含めても49文字となり、約60%に圧縮さ
れたことになる。
第2図を元に、英単語辞書データベースを構築した例を
第3図に示す。ここでは指標文字列−aesar ’″
は指標文字列テーブルn番目に登録されているとし、ま
た英単語辞書データベース内で当該英単語列はn番目の
ブロックに構築されているものとする。このブロック内
で示される各英単語へのヘッダ部の最初の数字は直前の
英単語との重複文字列長を示し、二番目の数字はその重
複部を除いた文字列の長さを示す。但し、最初の英単語
のヘッダ部の最初の数字は指標文字列との重複文字列長
を示す。
第3図に示す。ここでは指標文字列−aesar ’″
は指標文字列テーブルn番目に登録されているとし、ま
た英単語辞書データベース内で当該英単語列はn番目の
ブロックに構築されているものとする。このブロック内
で示される各英単語へのヘッダ部の最初の数字は直前の
英単語との重複文字列長を示し、二番目の数字はその重
複部を除いた文字列の長さを示す。但し、最初の英単語
のヘッダ部の最初の数字は指標文字列との重複文字列長
を示す。
以上のように構成された単語辞書データベースを有する
単語検索装置の構成を第4図のブロック図に示す。
単語検索装置の構成を第4図のブロック図に示す。
ここで1は、既に説明した構成の英単語辞書データベー
スである。2は英単語辞書データベースの圧縮された見
出しを展開したり、検索すべき英単語を記憶するワーク
・バッファである。4Fi。
スである。2は英単語辞書データベースの圧縮された見
出しを展開したり、検索すべき英単語を記憶するワーク
・バッファである。4Fi。
第6図の70−チャートに従った制御プログラムを記憶
した検索プログラム記憶メモリである。6は検索すべき
英単語を入力する為の複数のアルファベットキーや入力
した英単語の検索結果を出力する入出力装置である。
した検索プログラム記憶メモリである。6は検索すべき
英単語を入力する為の複数のアルファベットキーや入力
した英単語の検索結果を出力する入出力装置である。
以上のように構成された本実施例の制御手順について第
5図のフローチャートに従って説明する。
5図のフローチャートに従って説明する。
先ず、ステップs10で入出力装置6からの検索文字列
を受は付ける。そしてステップS20で。
を受は付ける。そしてステップS20で。
指標文字列テーブルを検索する。そこで得られたデータ
によってステップS30では英単語辞書データベースの
該描ブロックを得て、ステップS4゜に移行する。ここ
で該当ブロックの見出し単語を復元してワーク・バッフ
12に展開し、ステップSSOで入力された単語との一
致を判断する。
によってステップS30では英単語辞書データベースの
該描ブロックを得て、ステップS4゜に移行する。ここ
で該当ブロックの見出し単語を復元してワーク・バッフ
12に展開し、ステップSSOで入力された単語との一
致を判断する。
ここで、 °aesiccate″を検索する場合を例
にとる。
にとる。
t−t”、ハツシュ、クイック・ソート等により指標文
字列テーブルを検索し“aeaer ′を指標文字列と
する(ステップ820)。” aesar ”は指標文
字列テーブルのn番目に登録されているので、英単語辞
書データベースのn番目のブロックを検索することを決
定できる(ステップ530)。
字列テーブルを検索し“aeaer ′を指標文字列と
する(ステップ820)。” aesar ”は指標文
字列テーブルのn番目に登録されているので、英単語辞
書データベースのn番目のブロックを検索することを決
定できる(ステップ530)。
次に該当ブロック内の英単語を順次復元していき(ステ
ップ540)、該当する英単語を検索しくステップ!i
50 ) ” aesiccate ”を得ることが
できる。
ップ540)、該当する英単語を検索しくステップ!i
50 ) ” aesiccate ”を得ることが
できる。
尚1以上の説明において、単語は英単語で説明したが他
の言語でも、本発明は効果を奏する。
の言語でも、本発明は効果を奏する。
発明の効果
以上のように本発明−、アルファベット順に記憶すべき
見出しデータをその直前の見出し単語との重複文字数と
それ以外の文字列とで表現することによって60%の英
単語辞書データベースの容量の圧縮が達成できる。筐た
、見出しデータと検索単語と一致検索も、比較すべき文
字数が少ない分だけ単語の高速検索が行える。
見出しデータをその直前の見出し単語との重複文字数と
それ以外の文字列とで表現することによって60%の英
単語辞書データベースの容量の圧縮が達成できる。筐た
、見出しデータと検索単語と一致検索も、比較すべき文
字数が少ない分だけ単語の高速検索が行える。
第1図は本発明の一実施例における単語検索装置に釦い
て例として用いた英単語列金石す図、第2図は第1図に
示す英単語列を本発明にしたがってヘッダ部と本体部と
に分離した構成を示す図、第3図は本実施例の指標文字
テーブルと英単語辞書データベースとの構成図、第4図
は本実施例の単語検索装置の構成を示すブロック図、第
6図は本実施例の制御手順を示すフローチャートである
。 1・・・・・・英単語辞書データベース、2・・・・・
・ワーク・バッファ、3・・・・・・中央処理装置。
て例として用いた英単語列金石す図、第2図は第1図に
示す英単語列を本発明にしたがってヘッダ部と本体部と
に分離した構成を示す図、第3図は本実施例の指標文字
テーブルと英単語辞書データベースとの構成図、第4図
は本実施例の単語検索装置の構成を示すブロック図、第
6図は本実施例の制御手順を示すフローチャートである
。 1・・・・・・英単語辞書データベース、2・・・・・
・ワーク・バッファ、3・・・・・・中央処理装置。
Claims (1)
- アルファベットによって構成される単語に関連する単語
情報を対応する単語のアルファベット順に記憶した単語
情報記憶領域と、前記単語情報記憶領域の各単語情報の
見出しデータを記憶する領域であって、前記単語見出し
として、直前の見出しが示す単語と重複する部分の文字
数とそれ以外の文字列とを記憶した単語見出し情報記憶
領域と、検索すべき単語と前記見出し情報記憶領域に記
憶されたデータが示す単語とが一致する見出しを検索し
、該見出しに対応する単語情報を前記単語情報記憶領域
から読み出す検索手段とを有することを特徴とする単語
検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1266506A JPH03127254A (ja) | 1989-10-13 | 1989-10-13 | 単語検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1266506A JPH03127254A (ja) | 1989-10-13 | 1989-10-13 | 単語検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03127254A true JPH03127254A (ja) | 1991-05-30 |
Family
ID=17431860
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1266506A Pending JPH03127254A (ja) | 1989-10-13 | 1989-10-13 | 単語検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03127254A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0720107A1 (en) * | 1994-12-26 | 1996-07-03 | Sharp Kabushiki Kaisha | Dictionary retrieval apparatus |
| JP2008217596A (ja) * | 2007-03-06 | 2008-09-18 | Toshiba Corp | 文書検索システム及びプログラム |
-
1989
- 1989-10-13 JP JP1266506A patent/JPH03127254A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0720107A1 (en) * | 1994-12-26 | 1996-07-03 | Sharp Kabushiki Kaisha | Dictionary retrieval apparatus |
| US5761688A (en) * | 1994-12-26 | 1998-06-02 | Sharp Kabushiki Kaisha | Dictionary retrieval apparatus |
| JP2008217596A (ja) * | 2007-03-06 | 2008-09-18 | Toshiba Corp | 文書検索システム及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3152868B2 (ja) | 検索装置および辞書/テキスト検索方法 | |
| US20020169763A1 (en) | Method and system for expanding document retrieval information | |
| US6470334B1 (en) | Document retrieval apparatus | |
| JPS6033665A (ja) | キ−ワ−ド自動抽出方式 | |
| KR101694179B1 (ko) | 모음 제거 기반 인덱스 생성 방법 및 장치 | |
| JPH03127254A (ja) | 単語検索装置 | |
| JPS617936A (ja) | 情報検索方式 | |
| JPH056398A (ja) | 文書登録装置及び文書検索装置 | |
| JPH03116375A (ja) | 情報検索装置 | |
| JPH02129756A (ja) | 単語照合装置 | |
| JP2880192B2 (ja) | 文字列検索方法及び装置 | |
| JPH0140372B2 (ja) | ||
| JP3187671B2 (ja) | 電子辞書表示装置 | |
| JPH0752450B2 (ja) | 辞書デ−タ検索装置 | |
| JPH10177582A (ja) | 最長一致検索方法及び装置 | |
| JPS6057421A (ja) | 文書作成装置 | |
| JPH10149367A (ja) | テキスト蓄積検索装置 | |
| JPH08249341A (ja) | 文書データベースの文書格納・検索装置 | |
| JPH0261768A (ja) | 電子辞書装置及び電子辞書検索方法 | |
| JP3005531B1 (ja) | 辞書データ検索方法及びその装置、検索用辞書及びインデックスの作成方法 | |
| JPS59100939A (ja) | 日本語入力装置 | |
| JPS63229523A (ja) | 情報処理装置 | |
| JPS6389976A (ja) | 言語解析装置 | |
| JPS59221732A (ja) | カナ漢字変換処理装置 | |
| JP3127969B2 (ja) | 辞書記憶装置 |