JPH07287716A - 辞書検索装置 - Google Patents
辞書検索装置Info
- Publication number
- JPH07287716A JPH07287716A JP6202342A JP20234294A JPH07287716A JP H07287716 A JPH07287716 A JP H07287716A JP 6202342 A JP6202342 A JP 6202342A JP 20234294 A JP20234294 A JP 20234294A JP H07287716 A JPH07287716 A JP H07287716A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- record
- index
- compressed
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 中程度の辞書あるいは辞書に類する文書の検
索を行なうこと。 【構成】 辞書索引検索制御部10は、辞書検索制御部
9から検索キー情報をもらい、対象となる辞書の索引を
検索し、検索条件に適合する辞書のレコードの候補を探
し、候補の辞書本体15のアドレスを辞書検索制御部9
に渡す。辞書本体検索制御部11は、検索キー情報と候
補の辞書本体のアドレスをもらい、辞書本体15を検索
し、検索キー情報と最終的な照合を行なう。辞書データ
を任意の方式でレコード単位で圧縮する圧縮手段と、辞
書データを前記圧縮手段により圧縮した圧縮辞書データ
を有する。検索には、該圧縮辞書データと圧縮辞書レコ
ード位置を記録した索引を使用する。
索を行なうこと。 【構成】 辞書索引検索制御部10は、辞書検索制御部
9から検索キー情報をもらい、対象となる辞書の索引を
検索し、検索条件に適合する辞書のレコードの候補を探
し、候補の辞書本体15のアドレスを辞書検索制御部9
に渡す。辞書本体検索制御部11は、検索キー情報と候
補の辞書本体のアドレスをもらい、辞書本体15を検索
し、検索キー情報と最終的な照合を行なう。辞書データ
を任意の方式でレコード単位で圧縮する圧縮手段と、辞
書データを前記圧縮手段により圧縮した圧縮辞書データ
を有する。検索には、該圧縮辞書データと圧縮辞書レコ
ード位置を記録した索引を使用する。
Description
【0001】
【産業上の利用分野】本発明は、辞書検索装置に関し、
より詳細には、文書作成、文書校正、文章推敲を行うた
めの辞書検索装置に関する。例えば、ワープロ、パソコ
ン、パーソナルワープロなどのOA機器全般に適用され
るものである。
より詳細には、文書作成、文書校正、文章推敲を行うた
めの辞書検索装置に関する。例えば、ワープロ、パソコ
ン、パーソナルワープロなどのOA機器全般に適用され
るものである。
【0002】
【従来の技術】検索を高速化するため各種の索引を使用
することは広く行われている。また、1文字や多文字の
索引を持つことも非常に一般的である。また、検索高速
化のため、検索キーとなりそうな部分を全て持つ索引も
一般的である。さらに、検索キーの性質、検索キーの指
定内容(前方一致、後方一致、任意など)により、索引
の作り方および検索方法が異なるのが一般的である。例
えば、「電子ブック版広辞苑を読む」(ASCII ,Vol.15,
♯12 December 1991 pp.331-332)に記載されている。
また、辞書圧縮に関しては、例えば、特開昭57−15
0070号公報等に提案されている。さらに、仮名漢字
変換用の辞書の圧縮技術については、例えば、特開昭6
1−285573号公報に提案されている。
することは広く行われている。また、1文字や多文字の
索引を持つことも非常に一般的である。また、検索高速
化のため、検索キーとなりそうな部分を全て持つ索引も
一般的である。さらに、検索キーの性質、検索キーの指
定内容(前方一致、後方一致、任意など)により、索引
の作り方および検索方法が異なるのが一般的である。例
えば、「電子ブック版広辞苑を読む」(ASCII ,Vol.15,
♯12 December 1991 pp.331-332)に記載されている。
また、辞書圧縮に関しては、例えば、特開昭57−15
0070号公報等に提案されている。さらに、仮名漢字
変換用の辞書の圧縮技術については、例えば、特開昭6
1−285573号公報に提案されている。
【0003】辞書や大量の文字列データでは、必要とす
る中身の検索を高速化するため、各種の索引を使用する
ことは広く行われている。辞書に関しては、次のような
方法が一般的である。通常、辞書は何らかの見出しがあ
り、その見出しは文字コード順またはそれに近い形でソ
ートされている。例えば、日本語の国語辞典の場合、見
出しに読みと表記があり、その後に品詞名,語釈などが
記載されている。通常、見出しは辞書順(辞典により多
少異なるが)と呼ばれる読みの順に並んでいる。
る中身の検索を高速化するため、各種の索引を使用する
ことは広く行われている。辞書に関しては、次のような
方法が一般的である。通常、辞書は何らかの見出しがあ
り、その見出しは文字コード順またはそれに近い形でソ
ートされている。例えば、日本語の国語辞典の場合、見
出しに読みと表記があり、その後に品詞名,語釈などが
記載されている。通常、見出しは辞書順(辞典により多
少異なるが)と呼ばれる読みの順に並んでいる。
【0004】国語辞典では、辞書の検索で一番使われる
のは、見出しの読みによる検索である。これは、ある読
みを持つ語を調べるときに使われる。さらに、その読み
を先頭に含む場合、その読みの語とその前後や附近の語
を調べるときも使われる。一方、見出しの表記について
は、その読みに対応しているので、辞書全体としてみる
と、一定の順序に並んではいない。特に、表記の順に並
べた辞書は別として、表記のみで検索するのは難しい。
ある程度表記で引けるように索引を設けた辞書や辞書に
類するものがある。
のは、見出しの読みによる検索である。これは、ある読
みを持つ語を調べるときに使われる。さらに、その読み
を先頭に含む場合、その読みの語とその前後や附近の語
を調べるときも使われる。一方、見出しの表記について
は、その読みに対応しているので、辞書全体としてみる
と、一定の順序に並んではいない。特に、表記の順に並
べた辞書は別として、表記のみで検索するのは難しい。
ある程度表記で引けるように索引を設けた辞書や辞書に
類するものがある。
【0005】上記の辞書の説明は紙の辞書について述べ
たものだが、最近の電子化された辞書についても当ては
まる。電子化された辞書も、そのほとんどが紙の辞書の
イメージを保っている。しかし、検索については計算機
の力を借りて、より多様な引き方が簡単にできるように
なった。例えば、目的の語がはっきりしていて、その物
をキーとし、目的の語そのものを取りだす完全一致検
索,キーを頭部に含む前方一致検索,キーを尾部に持つ
後方一致検索,キーを一部にもつ任意検索,見出しだけ
でなく語釈などの記述に含まれるキーワードから関連づ
けて引ける条件検索,あいまいな記述でもそれに類似す
る語を探すあいまい検索などがある。
たものだが、最近の電子化された辞書についても当ては
まる。電子化された辞書も、そのほとんどが紙の辞書の
イメージを保っている。しかし、検索については計算機
の力を借りて、より多様な引き方が簡単にできるように
なった。例えば、目的の語がはっきりしていて、その物
をキーとし、目的の語そのものを取りだす完全一致検
索,キーを頭部に含む前方一致検索,キーを尾部に持つ
後方一致検索,キーを一部にもつ任意検索,見出しだけ
でなく語釈などの記述に含まれるキーワードから関連づ
けて引ける条件検索,あいまいな記述でもそれに類似す
る語を探すあいまい検索などがある。
【0006】例えば、読みの前方一致を実現するには、
見出しの読みの索引(1文字から最大読み文字までの多
段階の索引)を設ければよい。また、読みの後方一致検
索では、読みを逆さにした見出しを持つ索引を設けて、
検索キーも文字列を逆さにすればよい。あいまい検索の
簡単なものは、あらかじめ索引を作る際にあいまいにな
りやすい文字列から変換して登録する方法がある。条件
検索では、あらかじめキーワードと関連する語を対応づ
けを持てばよい。また、これらの機能を計算機上である
程度容易に実現できるツールとして、データベース構築
ツールが一般に提供されている。
見出しの読みの索引(1文字から最大読み文字までの多
段階の索引)を設ければよい。また、読みの後方一致検
索では、読みを逆さにした見出しを持つ索引を設けて、
検索キーも文字列を逆さにすればよい。あいまい検索の
簡単なものは、あらかじめ索引を作る際にあいまいにな
りやすい文字列から変換して登録する方法がある。条件
検索では、あらかじめキーワードと関連する語を対応づ
けを持てばよい。また、これらの機能を計算機上である
程度容易に実現できるツールとして、データベース構築
ツールが一般に提供されている。
【0007】
【発明が解決しようとする課題】前述のように、従来の
辞書検索装置において、容量の小さな辞書や文書では、
検索は比較的簡単にできる。すなわち、辞書や文書の本
文のデータを頭から総なめにしてキーの条件にあうもの
を探していけばよい。これらの検索ツールも一般の計算
機上の付帯ツールやエディタやワードプロセッサの機能
で提供されている。しかし、辞書のデータは一般に大き
く、多くの記憶容量を必要とする。また、現状では、記
憶装置を含めた計算機のスピードが辞書のデータを頭か
ら総なめにして扱うには十二分に速いとは言えず、上記
の多様な検索機能を実現するには、速く引くための大量
の索引データと、場合によっては、かなり複雑な検索機
構を使って目的を満たしている。さらに、充実した検索
機能を持つためには、ときには辞書の(もともとの内容
記述である)本来の中身よりも索引の方が大きくなるこ
ともあるという問題点があった。
辞書検索装置において、容量の小さな辞書や文書では、
検索は比較的簡単にできる。すなわち、辞書や文書の本
文のデータを頭から総なめにしてキーの条件にあうもの
を探していけばよい。これらの検索ツールも一般の計算
機上の付帯ツールやエディタやワードプロセッサの機能
で提供されている。しかし、辞書のデータは一般に大き
く、多くの記憶容量を必要とする。また、現状では、記
憶装置を含めた計算機のスピードが辞書のデータを頭か
ら総なめにして扱うには十二分に速いとは言えず、上記
の多様な検索機能を実現するには、速く引くための大量
の索引データと、場合によっては、かなり複雑な検索機
構を使って目的を満たしている。さらに、充実した検索
機能を持つためには、ときには辞書の(もともとの内容
記述である)本来の中身よりも索引の方が大きくなるこ
ともあるという問題点があった。
【0008】また、辞書のようなテキストデータの圧縮
に関しては、数々の方法が知られており、テキストデー
タ全体をそのまま圧縮する方法はかなり効率の良い方法
が知られている。しかし、本件のように検索と絡めての
圧縮が必要な場合は、圧縮データを任意の場所から解凍
する必要があり、それらの手法をそのまま単純に適用す
ることはできない。辞書の圧縮は、例えば、仮名漢字変
換用の辞書の圧縮などが知られており、高圧縮率のもの
は辞書データの内容または構造に大きく依存し一般的で
ない。
に関しては、数々の方法が知られており、テキストデー
タ全体をそのまま圧縮する方法はかなり効率の良い方法
が知られている。しかし、本件のように検索と絡めての
圧縮が必要な場合は、圧縮データを任意の場所から解凍
する必要があり、それらの手法をそのまま単純に適用す
ることはできない。辞書の圧縮は、例えば、仮名漢字変
換用の辞書の圧縮などが知られており、高圧縮率のもの
は辞書データの内容または構造に大きく依存し一般的で
ない。
【0009】本発明は、このような実情に鑑みてなされ
たもので、現状の計算機の能力を借りて中程度の辞書あ
るいは辞書に類する文書の検索を行なうこと、特に、辞
書の保守や改良場面で他の辞書データを参照する場合
に、適切な検索を行なうこと、また、辞書データの記憶
容量が一般に大きなものとなっており、従来より行われ
ている各種の圧縮技術を辞書の各レコード毎に適用し、
辞書本体を圧縮した状態で容易に検索できるようにする
こと、また、主に辞書データを対象とするが、それらを
単なるテキストデータとみなしてもよく、より広範囲の
テキストデータに対し、容量が小さく、かつ検索速度を
実用的とすること、さらに、最近の日本語文書処理シス
テムでは、必ずと言っていいほど、入力手段に何らかの
かな漢字変換システムが備えられており、これには変換
用に少なくとも読みと対応する表記の情報を含む辞書
(かな漢字変換用辞書)が付随し、該辞書は本発明で主
に扱う一般用の語釈や解説が入った辞書とはやや異なる
が、何らかの形で読みの見出しと対応する表記情報を持
っているので、その情報を辞書データの圧縮に有効利用
する辞書検索装置を提供することを目的としている。
たもので、現状の計算機の能力を借りて中程度の辞書あ
るいは辞書に類する文書の検索を行なうこと、特に、辞
書の保守や改良場面で他の辞書データを参照する場合
に、適切な検索を行なうこと、また、辞書データの記憶
容量が一般に大きなものとなっており、従来より行われ
ている各種の圧縮技術を辞書の各レコード毎に適用し、
辞書本体を圧縮した状態で容易に検索できるようにする
こと、また、主に辞書データを対象とするが、それらを
単なるテキストデータとみなしてもよく、より広範囲の
テキストデータに対し、容量が小さく、かつ検索速度を
実用的とすること、さらに、最近の日本語文書処理シス
テムでは、必ずと言っていいほど、入力手段に何らかの
かな漢字変換システムが備えられており、これには変換
用に少なくとも読みと対応する表記の情報を含む辞書
(かな漢字変換用辞書)が付随し、該辞書は本発明で主
に扱う一般用の語釈や解説が入った辞書とはやや異なる
が、何らかの形で読みの見出しと対応する表記情報を持
っているので、その情報を辞書データの圧縮に有効利用
する辞書検索装置を提供することを目的としている。
【0010】
【課題を解決するための手段】本発明は、上記目的を達
成するために、(1)読みまたは表記を有するデータあ
るいはそのほかの情報がレコード単位で収納されている
辞書の検索を行う辞書検索装置において、辞書データを
任意の方式でレコード単位で圧縮する圧縮手段と、辞書
データを前記圧縮手段により圧縮した圧縮辞書データ
と、検索キーの対象となる読みまたは表記の各文字と、
圧縮辞書上のレコード位置を関連づけた索引である1文
字索引を有し、検索キーを指定すると、該検索キー中の
文字を抽出する文字抽出手段と、該文字抽出手段により
抽出された文字を含む圧縮辞書上の圧縮レコード位置を
抽出する位置抽出手段と、該位置抽出手段により抽出さ
れた位置の圧縮辞書上の圧縮レコードを元の辞書レコー
ドに解凍し、該辞書レコードと検索キーと比較する比較
手段と、検索キーに適合するレコードを抽出表示する表
示手段とを有すること、更には、(2)前記文字索引
は、各文字別に(文字コード順に)ソートされ、圧縮辞
書上の圧縮レコード位置を登録した索引と、該索引の文
字別のブロック先頭位置を登録した索引からなること、
更には、(3)前記辞書レコードと検索キーと比較の際
に、検索キーを圧縮辞書と同様な方法で圧縮した圧縮検
索キーとし、圧縮レコードと圧縮検索キーとを比較し、
検索キーに適合するレコードを抽出表示すること、更に
は、(4)前記圧縮辞書の各圧縮レコード位置を記録し
た索引を設けること、更には、(5)前記辞書上の各レ
コードの索引作成の範囲の限定を文字位置で指定し、か
つ検索の際の圧縮レコードの解凍の範囲をその範囲に限
定すること、更には、(6)前記辞書上の各レコードの
索引作成の範囲の限定を区切り記号で指定し、かつ検索
の際の圧縮レコードの解凍の範囲をその範囲に限定する
こと、更には、(7)前記辞書レコードの読みを文書入
力用のかな漢字変換用辞書の見出しの読み位置を記憶す
ることにより圧縮すること、更には、(8)前記辞書レ
コードの表記を文書入力用のかな漢字変換用辞書の見出
し表記の位置を記憶することにより圧縮すること、更に
は、(9)前記辞書レコードの語釈あるいは解説部分を
文書入力用のかな漢字変換用辞書の表記の位置を記憶す
ることにより圧縮すること、更には、(10)前記
(7)において、前記文書入力用のかな漢字変換用辞書
の読みが短い見出しは記憶しないようにすること、更に
は、(11)前記(8)又は(9)において、前記文書
入力用のかな漢字変換用辞書の表記が短い見出しは記憶
しないようにすること、更には、(12)前記(7)〜
(11)のいずれかにおいて、前記かな漢字変換用辞書
に該当しない読みまたは表記については、かな漢字変換
用辞書のアドレス情報に対応した辞書を持つことを特徴
としたものである。
成するために、(1)読みまたは表記を有するデータあ
るいはそのほかの情報がレコード単位で収納されている
辞書の検索を行う辞書検索装置において、辞書データを
任意の方式でレコード単位で圧縮する圧縮手段と、辞書
データを前記圧縮手段により圧縮した圧縮辞書データ
と、検索キーの対象となる読みまたは表記の各文字と、
圧縮辞書上のレコード位置を関連づけた索引である1文
字索引を有し、検索キーを指定すると、該検索キー中の
文字を抽出する文字抽出手段と、該文字抽出手段により
抽出された文字を含む圧縮辞書上の圧縮レコード位置を
抽出する位置抽出手段と、該位置抽出手段により抽出さ
れた位置の圧縮辞書上の圧縮レコードを元の辞書レコー
ドに解凍し、該辞書レコードと検索キーと比較する比較
手段と、検索キーに適合するレコードを抽出表示する表
示手段とを有すること、更には、(2)前記文字索引
は、各文字別に(文字コード順に)ソートされ、圧縮辞
書上の圧縮レコード位置を登録した索引と、該索引の文
字別のブロック先頭位置を登録した索引からなること、
更には、(3)前記辞書レコードと検索キーと比較の際
に、検索キーを圧縮辞書と同様な方法で圧縮した圧縮検
索キーとし、圧縮レコードと圧縮検索キーとを比較し、
検索キーに適合するレコードを抽出表示すること、更に
は、(4)前記圧縮辞書の各圧縮レコード位置を記録し
た索引を設けること、更には、(5)前記辞書上の各レ
コードの索引作成の範囲の限定を文字位置で指定し、か
つ検索の際の圧縮レコードの解凍の範囲をその範囲に限
定すること、更には、(6)前記辞書上の各レコードの
索引作成の範囲の限定を区切り記号で指定し、かつ検索
の際の圧縮レコードの解凍の範囲をその範囲に限定する
こと、更には、(7)前記辞書レコードの読みを文書入
力用のかな漢字変換用辞書の見出しの読み位置を記憶す
ることにより圧縮すること、更には、(8)前記辞書レ
コードの表記を文書入力用のかな漢字変換用辞書の見出
し表記の位置を記憶することにより圧縮すること、更に
は、(9)前記辞書レコードの語釈あるいは解説部分を
文書入力用のかな漢字変換用辞書の表記の位置を記憶す
ることにより圧縮すること、更には、(10)前記
(7)において、前記文書入力用のかな漢字変換用辞書
の読みが短い見出しは記憶しないようにすること、更に
は、(11)前記(8)又は(9)において、前記文書
入力用のかな漢字変換用辞書の表記が短い見出しは記憶
しないようにすること、更には、(12)前記(7)〜
(11)のいずれかにおいて、前記かな漢字変換用辞書
に該当しない読みまたは表記については、かな漢字変換
用辞書のアドレス情報に対応した辞書を持つことを特徴
としたものである。
【0011】
【作用】前記構成を有する本発明の辞書検索装置は、
(1)辞書データを任意の方式でレコード単位で圧縮
し、辞書データを圧縮した圧縮辞書データを有し、検索
キーの対象となる、読みまたは表記の各文字と、圧縮辞
書上のレコード位置を関連づけた索引(1文字索引)を
有し、検索キーを指定すると、検索キー中の文字を抽出
し、その文字を含む圧縮辞書上の圧縮レコード位置を抽
出し、その位置の圧縮辞書上の圧縮レコード元の辞書レ
コードに解凍し、その検索キーと比較し、検索キーに適
合するレコードを抽出表示する。これにより、検索対象
の辞書データをレコード単位に圧縮したので、辞書本体
記憶容量を小さくでき、より小型の記憶容量で装置を実
現できる。
(1)辞書データを任意の方式でレコード単位で圧縮
し、辞書データを圧縮した圧縮辞書データを有し、検索
キーの対象となる、読みまたは表記の各文字と、圧縮辞
書上のレコード位置を関連づけた索引(1文字索引)を
有し、検索キーを指定すると、検索キー中の文字を抽出
し、その文字を含む圧縮辞書上の圧縮レコード位置を抽
出し、その位置の圧縮辞書上の圧縮レコード元の辞書レ
コードに解凍し、その検索キーと比較し、検索キーに適
合するレコードを抽出表示する。これにより、検索対象
の辞書データをレコード単位に圧縮したので、辞書本体
記憶容量を小さくでき、より小型の記憶容量で装置を実
現できる。
【0012】(2)1文字索引は、各文字別に(文字コ
ード順に)ソートされ、圧縮辞書上の圧縮レコード位置
を登録した索引(索引2)と、その索引の文字別のブロ
ック先頭位置を登録した索引(索引1)からなるので、
各文字を含む先頭位置の探索範囲を索引作成時の索引文
字位置範囲情報により、先頭位置決めの際に、不要な探
索を防止でき、検索結果の行の切りだしをより高速化で
きる。(3)辞書レコードと検索キーと比較の際、検索
キーを圧縮辞書と同様な方法で圧縮した圧縮検索キーと
し、圧縮レコードと圧縮検索キーとを比較し検索キーに
適合するレコードを抽出表示するので、一般に検索キー
より圧縮レコードのデータ長が大きく、検索キーの圧縮
は1回で済むので、圧縮レコードを解凍せずに検索キー
と照合することができ、圧縮レコードを解凍して照合す
るよりも高速に適合情報が得られる。
ード順に)ソートされ、圧縮辞書上の圧縮レコード位置
を登録した索引(索引2)と、その索引の文字別のブロ
ック先頭位置を登録した索引(索引1)からなるので、
各文字を含む先頭位置の探索範囲を索引作成時の索引文
字位置範囲情報により、先頭位置決めの際に、不要な探
索を防止でき、検索結果の行の切りだしをより高速化で
きる。(3)辞書レコードと検索キーと比較の際、検索
キーを圧縮辞書と同様な方法で圧縮した圧縮検索キーと
し、圧縮レコードと圧縮検索キーとを比較し検索キーに
適合するレコードを抽出表示するので、一般に検索キー
より圧縮レコードのデータ長が大きく、検索キーの圧縮
は1回で済むので、圧縮レコードを解凍せずに検索キー
と照合することができ、圧縮レコードを解凍して照合す
るよりも高速に適合情報が得られる。
【0013】(4)圧縮辞書の各圧縮レコード位置を記
録した索引を設けたので、検索キーに一致するデータお
よびその周辺のデータの取り出し(参照)を一括して行
なう場合、取り出し範囲が索引により、あらかじめ把握
できるので、取り出しをより高速に行うことができる。
(5),(6)辞書上の各レコードの索引作成の範囲の
限定を文字位置、或いは、区切り記号で指定し、かつ、
検索の際の圧縮レコードの解凍の範囲をその範囲に限定
でき、辞書上の索引作成の範囲の限定に対応して、圧縮
レコードの解凍の範囲を限定できるので、索引作成の限
定がある場合、圧縮レコードの限定範囲外の解凍を省略
でき、検索キーとの照合をより高速に行なうことができ
る。
録した索引を設けたので、検索キーに一致するデータお
よびその周辺のデータの取り出し(参照)を一括して行
なう場合、取り出し範囲が索引により、あらかじめ把握
できるので、取り出しをより高速に行うことができる。
(5),(6)辞書上の各レコードの索引作成の範囲の
限定を文字位置、或いは、区切り記号で指定し、かつ、
検索の際の圧縮レコードの解凍の範囲をその範囲に限定
でき、辞書上の索引作成の範囲の限定に対応して、圧縮
レコードの解凍の範囲を限定できるので、索引作成の限
定がある場合、圧縮レコードの限定範囲外の解凍を省略
でき、検索キーとの照合をより高速に行なうことができ
る。
【0014】(7)辞書レコードの読みを文書入力用の
かな漢字変換用辞書の見出しの読みの位置を記憶するこ
とにより圧縮するので、辞書の読み部分の文字列をかな
漢字変換用辞書の見出しの読み部の位置情報で置き換え
ることにより、辞書の読み部分の効果的な圧縮ができ
る。(8)辞書レコードの表記を文書入力用のかな漢字
変換用辞書の見出し表記の位置を記憶することにより圧
縮するので、辞書の表記部分の文字列をかな漢字変換用
辞書の見出しの表記部の位置情報で置き換えることによ
り、辞書の表記部分の効果的な圧縮ができる。
かな漢字変換用辞書の見出しの読みの位置を記憶するこ
とにより圧縮するので、辞書の読み部分の文字列をかな
漢字変換用辞書の見出しの読み部の位置情報で置き換え
ることにより、辞書の読み部分の効果的な圧縮ができ
る。(8)辞書レコードの表記を文書入力用のかな漢字
変換用辞書の見出し表記の位置を記憶することにより圧
縮するので、辞書の表記部分の文字列をかな漢字変換用
辞書の見出しの表記部の位置情報で置き換えることによ
り、辞書の表記部分の効果的な圧縮ができる。
【0015】(9)辞書レコードの語釈あるいは解説部
分を文書入力用のかな漢字変換用辞書の表記の位置を記
憶することにより圧縮するので、辞書の語釈あるいは解
説部分の文字列をかな漢字変換用辞書の見出しの表記部
の位置情報で置き換えることにより、辞書の語釈あるい
は解説部分の効果的な圧縮ができる。(10)文書入力
用のかな漢字変換用辞書の読みが短い見出しは記憶しな
いようにするので、かな漢字変換用辞書の見出しの読み
が短いものの位置情報は記憶しないようにしたので、よ
り圧縮効果のある文字列部分のみ位置情報が少ないデー
タ長で記憶できるため、さらに圧縮効果を高めることが
できる。
分を文書入力用のかな漢字変換用辞書の表記の位置を記
憶することにより圧縮するので、辞書の語釈あるいは解
説部分の文字列をかな漢字変換用辞書の見出しの表記部
の位置情報で置き換えることにより、辞書の語釈あるい
は解説部分の効果的な圧縮ができる。(10)文書入力
用のかな漢字変換用辞書の読みが短い見出しは記憶しな
いようにするので、かな漢字変換用辞書の見出しの読み
が短いものの位置情報は記憶しないようにしたので、よ
り圧縮効果のある文字列部分のみ位置情報が少ないデー
タ長で記憶できるため、さらに圧縮効果を高めることが
できる。
【0016】(11)文書入力用のかな漢字変換用辞書
の表記が短い見出しは記憶しないようにするので、かな
漢字変換用辞書の見出しの表記が短いものの位置情報は
記憶しないようにすることにより、より圧縮効果のある
文字列部分のみ位置情報が少ないデータ長で記憶でき、
さらに圧縮効果を高めることができる。(12)かな漢
字変換用辞書に該当しない読みまたは表記については、
かな漢字変換用辞書のアドレス情報に対応した辞書を持
つので、かな漢字変換用の辞書見出しの読みあるいは表
記に一致しない文字列を、かな漢字変換用の辞書の位置
情報(アドレス情報)に対応した形で、位置情報と読み
あるいは表記と対応づけさせた辞書を持つようにし、当
辞書のアクセスが容易かつ高速とすることができる。
の表記が短い見出しは記憶しないようにするので、かな
漢字変換用辞書の見出しの表記が短いものの位置情報は
記憶しないようにすることにより、より圧縮効果のある
文字列部分のみ位置情報が少ないデータ長で記憶でき、
さらに圧縮効果を高めることができる。(12)かな漢
字変換用辞書に該当しない読みまたは表記については、
かな漢字変換用辞書のアドレス情報に対応した辞書を持
つので、かな漢字変換用の辞書見出しの読みあるいは表
記に一致しない文字列を、かな漢字変換用の辞書の位置
情報(アドレス情報)に対応した形で、位置情報と読み
あるいは表記と対応づけさせた辞書を持つようにし、当
辞書のアクセスが容易かつ高速とすることができる。
【0017】
【実施例】実施例について、図面を参照して以下に説明
する。図1は、本発明による辞書検索装置の一実施例を
説明するための構成図で、図中、1は表示部、2は入力
部、3は外部記憶部、4は印刷部、5は制御部、6は入
力/編集制御部、7は辞書検索支援部、8は出力制御
部、9は辞書検索制御部、10は辞書索引検索制御部、
11は辞書本体検索制御部、12は出力表示制御部、1
3は設定情報管理表、14は辞書索引、15は辞書本体
である。
する。図1は、本発明による辞書検索装置の一実施例を
説明するための構成図で、図中、1は表示部、2は入力
部、3は外部記憶部、4は印刷部、5は制御部、6は入
力/編集制御部、7は辞書検索支援部、8は出力制御
部、9は辞書検索制御部、10は辞書索引検索制御部、
11は辞書本体検索制御部、12は出力表示制御部、1
3は設定情報管理表、14は辞書索引、15は辞書本体
である。
【0018】一般のOA機器であるパソコン、ワードプ
ロセッサなどと同様な構成となっている。中心に全体を
制御する制御部5があり、汎用マイクロコンピュータ、
あるいは専用LSIなどで実現されている。それに入出
力、記憶を受け持つ周辺装置のディスプレイ、キーボー
ド、フロッピー、プリンタ等がある。また、制御部5の
下にデータの入力、編集、保管、印刷を制御する部分が
あり、これらはファームウェア、専用LSIなどで実現
されている。
ロセッサなどと同様な構成となっている。中心に全体を
制御する制御部5があり、汎用マイクロコンピュータ、
あるいは専用LSIなどで実現されている。それに入出
力、記憶を受け持つ周辺装置のディスプレイ、キーボー
ド、フロッピー、プリンタ等がある。また、制御部5の
下にデータの入力、編集、保管、印刷を制御する部分が
あり、これらはファームウェア、専用LSIなどで実現
されている。
【0019】図1の例では、辞書検索支援部7のもとに
辞書検索制御部9、辞書索引検索制御部10、辞書本体
検索制御部11、出力表示制御部12で構成されてい
る。辞書検索制御部9は辞書の参照検索全体を担当す
る。また、各種辞書について参照検索に必要な設定情報
の解釈と管理を行う。辞書索引検索制御部10は辞書検
索制御部9の支持をもとに、辞書検索制御部9から検索
キー情報をもらい、対象となる辞書の1つまたは複数の
索引を検索し、検索条件に適合する辞書のレコードの候
補を探し、候補の辞書本体のアドレスを辞書検索制御部
9に渡す。
辞書検索制御部9、辞書索引検索制御部10、辞書本体
検索制御部11、出力表示制御部12で構成されてい
る。辞書検索制御部9は辞書の参照検索全体を担当す
る。また、各種辞書について参照検索に必要な設定情報
の解釈と管理を行う。辞書索引検索制御部10は辞書検
索制御部9の支持をもとに、辞書検索制御部9から検索
キー情報をもらい、対象となる辞書の1つまたは複数の
索引を検索し、検索条件に適合する辞書のレコードの候
補を探し、候補の辞書本体のアドレスを辞書検索制御部
9に渡す。
【0020】辞書本体検索制御部11は辞書検索制御部
9の指令のもとに、検索キー情報と候補の辞書本体15
のアドレスをもらい、辞書本体15を検索し、検索キー
情報と最終的な照合を行なう。出力表示制御部12は辞
書検索制御部9から辞書レコードの出力表示方法の設定
情報を受け取り、辞書出力するレコードを設定情報に合
わせて加工し、レコード出力情報として辞書検索制御部
9に送る。該辞書検索制御部9はレコード出力情報を制
御部5を介して出力制御部8に送ることで検索結果の表
示を行なう。このほか上記のキーボードからくる入力情
報や日本語入力の際の仮名漢字変換は入力/編集制御部
6のもとで、また、データの編集、保管、印刷などは入
/編集制御部6、出力制御部8のもとで行なわれる。
9の指令のもとに、検索キー情報と候補の辞書本体15
のアドレスをもらい、辞書本体15を検索し、検索キー
情報と最終的な照合を行なう。出力表示制御部12は辞
書検索制御部9から辞書レコードの出力表示方法の設定
情報を受け取り、辞書出力するレコードを設定情報に合
わせて加工し、レコード出力情報として辞書検索制御部
9に送る。該辞書検索制御部9はレコード出力情報を制
御部5を介して出力制御部8に送ることで検索結果の表
示を行なう。このほか上記のキーボードからくる入力情
報や日本語入力の際の仮名漢字変換は入力/編集制御部
6のもとで、また、データの編集、保管、印刷などは入
/編集制御部6、出力制御部8のもとで行なわれる。
【0021】図2は、本発明で検索を行う辞書の一例を
示す図である。この例では、「読み」,「表記」,「品
詞」,「語釈」が辞書の内容となっている。「通番」は
辞書レコード(行)の通し番号を表す(普通、通番は辞
書の内容には含まれていない)。このような形式のレコ
ードの概念がある辞書データを、あらかじめ、あるいは
以下に示す索引作成時に、適当な圧縮アルゴリズムでレ
コード単位に圧縮した圧縮辞書を用意する。検索には、
この圧縮辞書と以降で説明する圧縮辞書レコードの位置
を記録した索引を使用する。
示す図である。この例では、「読み」,「表記」,「品
詞」,「語釈」が辞書の内容となっている。「通番」は
辞書レコード(行)の通し番号を表す(普通、通番は辞
書の内容には含まれていない)。このような形式のレコ
ードの概念がある辞書データを、あらかじめ、あるいは
以下に示す索引作成時に、適当な圧縮アルゴリズムでレ
コード単位に圧縮した圧縮辞書を用意する。検索には、
この圧縮辞書と以降で説明する圧縮辞書レコードの位置
を記録した索引を使用する。
【0022】図3(a),(b)は、図2に示す辞書の
例から本発明の検索索引を造る過程を示したデータの一
例である。ここでは、「読み」部分の1文字索引を造る
例を示している。図2の読み部分から順次1文字づつ取
りだし、表の形でその文字を含む辞書の行位置に対応す
る圧縮辞書の行位置を記録する。これを辞書の全レコー
ドについて行う(図3(a))。次に、この表を(読み
各文字)と(圧縮辞書行位置)を対として文字のコード
順,圧縮辞書行位置順でソートする。その結果、文字と
圧縮辞書行位置を対とする1文字の索引を得る(図3
(b))。
例から本発明の検索索引を造る過程を示したデータの一
例である。ここでは、「読み」部分の1文字索引を造る
例を示している。図2の読み部分から順次1文字づつ取
りだし、表の形でその文字を含む辞書の行位置に対応す
る圧縮辞書の行位置を記録する。これを辞書の全レコー
ドについて行う(図3(a))。次に、この表を(読み
各文字)と(圧縮辞書行位置)を対として文字のコード
順,圧縮辞書行位置順でソートする。その結果、文字と
圧縮辞書行位置を対とする1文字の索引を得る(図3
(b))。
【0023】この索引は、各文字について、その文字を
含む辞書の行位置(圧縮辞書行位置)が連続して記録さ
れている。この索引を使って、任意の読み1文字を含む
圧縮辞書の行位置を知ることができる。図3(a)、
(b)では、「読み」の索引作成の例を示したが、同様に
して「表記」の索引を作成できる。この索引を用いて、
検索キーの文字を含む部分の索引範囲を参照すれば、圧
縮辞書の検索が可能である。しかし、辞書レコード数が
ある程度多い場合は、索引の量も多くなり、索引の検索
に時間がかかる。次に、図4でこの点を補う索引構成を
使う例で、実際の検索方法を説明する。
含む辞書の行位置(圧縮辞書行位置)が連続して記録さ
れている。この索引を使って、任意の読み1文字を含む
圧縮辞書の行位置を知ることができる。図3(a)、
(b)では、「読み」の索引作成の例を示したが、同様に
して「表記」の索引を作成できる。この索引を用いて、
検索キーの文字を含む部分の索引範囲を参照すれば、圧
縮辞書の検索が可能である。しかし、辞書レコード数が
ある程度多い場合は、索引の量も多くなり、索引の検索
に時間がかかる。次に、図4でこの点を補う索引構成を
使う例で、実際の検索方法を説明する。
【0024】図4(a)〜(d)は、検索例で示した本
発明の検索方法の概念を説明するための図である。例え
ば、読みの検索キー「あい」を与える(図4(a))
と、検索キー中の先頭の1文字「あ」をキーにして索引
1を検索する(図4(b))。索引1は、図4(b)で
示した索引で、各文字の開始位置(より正確には、索引
2の行番号(通番))を記録したもので、次の索引2
は、図4(b)と同じ内容の圧縮辞書行位置を記録した
表である。ただし、図4(b)の(文字)の欄は、索引
1で圧縮辞書行位置記載欄との対応が分るので、省略し
てある。索引1は、図4の索引作成時に同時に作成する
ことができる(後述図5参照)。
発明の検索方法の概念を説明するための図である。例え
ば、読みの検索キー「あい」を与える(図4(a))
と、検索キー中の先頭の1文字「あ」をキーにして索引
1を検索する(図4(b))。索引1は、図4(b)で
示した索引で、各文字の開始位置(より正確には、索引
2の行番号(通番))を記録したもので、次の索引2
は、図4(b)と同じ内容の圧縮辞書行位置を記録した
表である。ただし、図4(b)の(文字)の欄は、索引
1で圧縮辞書行位置記載欄との対応が分るので、省略し
てある。索引1は、図4の索引作成時に同時に作成する
ことができる(後述図5参照)。
【0025】索引1の検索は、図示した文字の欄の先頭
「ー」から順にキー「あ」との一致を調べる(順検索)
(図4(b)で示す矢印を参照)。この他、順検索以外
にバイナリサーチ(2分探索)の方法を用いてもよい。
その結果得た索引2の「あ」の開始位置(索引2行番
号)「002770」を得る。また、索引2の「ぃ」の開始位
置「007938」から「あ」の終了位置「007937」を得る。
「ー」から順にキー「あ」との一致を調べる(順検索)
(図4(b)で示す矢印を参照)。この他、順検索以外
にバイナリサーチ(2分探索)の方法を用いてもよい。
その結果得た索引2の「あ」の開始位置(索引2行番
号)「002770」を得る。また、索引2の「ぃ」の開始位
置「007938」から「あ」の終了位置「007937」を得る。
【0026】これから先は、索引2の「あ」の「辞書行
番号(位置)」欄に記載の全ての辞書行番号(索引2
(通番)002770〜007937)を使って、圧縮辞書本体のレ
コードを順次読み出し、解凍し、検索キー「あい」と一
致しているか照合し、その結果、適合したレコードを出
力する。以上が、図4の例に基づく本発明の検索方法の
実施例の1つである。
番号(位置)」欄に記載の全ての辞書行番号(索引2
(通番)002770〜007937)を使って、圧縮辞書本体のレ
コードを順次読み出し、解凍し、検索キー「あい」と一
致しているか照合し、その結果、適合したレコードを出
力する。以上が、図4の例に基づく本発明の検索方法の
実施例の1つである。
【0027】図5に、図3と図4で説明した索引作成の
処理の概略フローチャートを示す図である。ここでは、
辞書や索引を外部記憶装置のファイルとしておくことを
想定して説明する。以下、各ステップに従って順次説明
する。step1 :まず、辞書データをファイルからバッファに1
レコード読む。次に、読んだ辞書レコードを圧縮し、フ
ァイルに書き出す(圧縮辞書)とともに書き出し先頭位
置(圧縮辞書行位置)を記憶する。次に、同上の辞書1
レコードの読み部分に該当する全ての文字を順次取り出
し、文字コードと圧縮辞書行位置を対にしてファイルに
書き出す(索引元データ1)。step2 :索引元データ1を文字コード順、圧縮辞書行位
置順にソートする(索引元データ)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして索引1に書
き出す。
処理の概略フローチャートを示す図である。ここでは、
辞書や索引を外部記憶装置のファイルとしておくことを
想定して説明する。以下、各ステップに従って順次説明
する。step1 :まず、辞書データをファイルからバッファに1
レコード読む。次に、読んだ辞書レコードを圧縮し、フ
ァイルに書き出す(圧縮辞書)とともに書き出し先頭位
置(圧縮辞書行位置)を記憶する。次に、同上の辞書1
レコードの読み部分に該当する全ての文字を順次取り出
し、文字コードと圧縮辞書行位置を対にしてファイルに
書き出す(索引元データ1)。step2 :索引元データ1を文字コード順、圧縮辞書行位
置順にソートする(索引元データ)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして索引1に書
き出す。
【0028】図6は、図4で説明した検索の処理の概略
フローチャートを示す図である。以下、各ステップに従
って順次説明する。step1 :まず、検索キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の行開始位置を記憶する。次の行の索引
2の(行開始位置−1)を索引2の探索終了位置として
記憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、解凍し、読み部分と検索キーとを照
合し、合致するレコードを表示またはファイルに書き出
す。
フローチャートを示す図である。以下、各ステップに従
って順次説明する。step1 :まず、検索キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の行開始位置を記憶する。次の行の索引
2の(行開始位置−1)を索引2の探索終了位置として
記憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、解凍し、読み部分と検索キーとを照
合し、合致するレコードを表示またはファイルに書き出
す。
【0029】図7は、検索キーを圧縮して圧縮辞書行と
比較する検索の処理の概略フローチャートを示す図であ
る。以下、各ステップに従って順次説明する。step1 :まず、検索キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の開始位置を記憶する。次の行の索引2
の(行開始位置−1)を索引2の探索終了位置として記
憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、読み部分と辞書を圧縮した同じ方法
により圧縮した検索キーとを照合し、合致する場合、圧
縮レコードを解凍し、表示またはファイルに書き出す。 図8は、圧縮辞書行位置索引(索引3)の例を示す図で
ある。
比較する検索の処理の概略フローチャートを示す図であ
る。以下、各ステップに従って順次説明する。step1 :まず、検索キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の開始位置を記憶する。次の行の索引2
の(行開始位置−1)を索引2の探索終了位置として記
憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、読み部分と辞書を圧縮した同じ方法
により圧縮した検索キーとを照合し、合致する場合、圧
縮レコードを解凍し、表示またはファイルに書き出す。 図8は、圧縮辞書行位置索引(索引3)の例を示す図で
ある。
【0030】図9は、索引3を索引1,索引2と同時に
作成する索引作成の処理の概略フローチャートを示す図
である。以下、各ステップに従って順次説明する。step1 :まず、辞書データをファイルからバッファに1
レコード読む。次に、読んだ辞書1レコードを圧縮し、
ファイルに書き出す(圧縮辞書)とともに書き出し先頭
位置を記憶し、さらに、ファイルに書き出す(索引
3)。次に、同上の辞書1レコードの索引作成データ範
囲文字位置限定指定表の限定部分に該当する、全ての文
字を順次取り出し、文字コードと圧縮辞書行位置を対に
してファイルに書きだす(索引元データ1)。step2 :次に、索引元データ1を文字コード順、圧縮辞
書行位置順にソートする(索引元データ2)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして、索引1に
書き出す。
作成する索引作成の処理の概略フローチャートを示す図
である。以下、各ステップに従って順次説明する。step1 :まず、辞書データをファイルからバッファに1
レコード読む。次に、読んだ辞書1レコードを圧縮し、
ファイルに書き出す(圧縮辞書)とともに書き出し先頭
位置を記憶し、さらに、ファイルに書き出す(索引
3)。次に、同上の辞書1レコードの索引作成データ範
囲文字位置限定指定表の限定部分に該当する、全ての文
字を順次取り出し、文字コードと圧縮辞書行位置を対に
してファイルに書きだす(索引元データ1)。step2 :次に、索引元データ1を文字コード順、圧縮辞
書行位置順にソートする(索引元データ2)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして、索引1に
書き出す。
【0031】図10は、索引3を使った別の検索の処理
の概略フローチャートを示す図である。この例では、索
引3を使って辞書の行番号あるいはキーに該当するレコ
ード前後の位置を容易に検索しようとするもので、索引
3の検索には、索引1の説明で述べたと同様な方法が使
える。また、この索引を設けることで、辞書レコード内
に関連するレコードの情報が記載されている場合に、そ
のレコードを圧縮辞書から高速に取りだすことができ
る。以下、各ステップに従って順次説明する。
の概略フローチャートを示す図である。この例では、索
引3を使って辞書の行番号あるいはキーに該当するレコ
ード前後の位置を容易に検索しようとするもので、索引
3の検索には、索引1の説明で述べたと同様な方法が使
える。また、この索引を設けることで、辞書レコード内
に関連するレコードの情報が記載されている場合に、そ
のレコードを圧縮辞書から高速に取りだすことができ
る。以下、各ステップに従って順次説明する。
【0032】step1:まず、検索キー“あい”を解析
し、索引を検索する文字を1文字キー(あ)としてセッ
トする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の行開始位置を記憶する。次の行の索引
2の(行開始位置−1)を索引2の探索終了位置として
記憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、解凍し、読み部分と検索キーとを照
合し、合致するレコードを表示またはファイルに書き出
すとともに、合致レコードのレコード番号の表示指定、
あるいは、前後のレコードの表示指定があった場合、索
引3を検索し、圧縮辞書行位置データと合致する索引3
のレコード位置から辞書行番号を特定し、レコード番号
または前後のレコードを合わせて表示またはファイルに
書き出す。
し、索引を検索する文字を1文字キー(あ)としてセッ
トする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の行開始位置を記憶する。次の行の索引
2の(行開始位置−1)を索引2の探索終了位置として
記憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、解凍し、読み部分と検索キーとを照
合し、合致するレコードを表示またはファイルに書き出
すとともに、合致レコードのレコード番号の表示指定、
あるいは、前後のレコードの表示指定があった場合、索
引3を検索し、圧縮辞書行位置データと合致する索引3
のレコード位置から辞書行番号を特定し、レコード番号
または前後のレコードを合わせて表示またはファイルに
書き出す。
【0033】図11は、索引作成時に辞書上のキーとな
り得る部分を文字位置範囲で限定し、検索キー比較の際
に圧縮辞書行の解凍を限定する検索の処理の概略フロー
チャートを示す図である。以下、各ステップに従って順
次説明する。step1 :まず、検索キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の行開始位置を記憶する。次の行の索引
2の(行開始位置−1)を索引2の探索終了位置として
記憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、索引作成データ範囲文字位置限定指
定表の限定部分まで解凍し、解凍した文字列と検索キー
とを照合し、合致する場合、残りの部分を解凍し、レコ
ードを表示またはファイルに書き出す。 図12は、索引作成時に参照する索引作成データ範囲文
字位置限定指定表の例を示す図である。
り得る部分を文字位置範囲で限定し、検索キー比較の際
に圧縮辞書行の解凍を限定する検索の処理の概略フロー
チャートを示す図である。以下、各ステップに従って順
次説明する。step1 :まず、検索キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の、索引2の行開始位置を記憶する。次の行の索引
2の(行開始位置−1)を索引2の探索終了位置として
記憶する。step3 :記憶した索引2の行開始位置から探索終了位置
まで、索引2の圧縮辞書行位置を順次読み出し、その行
番号のレコードデータを圧縮辞書本体のファイルからバ
ッファに読み込み、索引作成データ範囲文字位置限定指
定表の限定部分まで解凍し、解凍した文字列と検索キー
とを照合し、合致する場合、残りの部分を解凍し、レコ
ードを表示またはファイルに書き出す。 図12は、索引作成時に参照する索引作成データ範囲文
字位置限定指定表の例を示す図である。
【0034】図13は、その索引作成の処理の概略フロ
ーチャートを示す図である。この例では、検索照合時に
解凍する範囲を索引作成時の文字位置範囲に限定するこ
とによって、レコード全体を解凍してから照合するより
処理の高速化をはかろうとする。以下、各ステップに従
って順次説明する。
ーチャートを示す図である。この例では、検索照合時に
解凍する範囲を索引作成時の文字位置範囲に限定するこ
とによって、レコード全体を解凍してから照合するより
処理の高速化をはかろうとする。以下、各ステップに従
って順次説明する。
【0035】step1:まず、辞書データをファイルから
バッファに1レコード読む。次に、読んだ辞書1レコー
ドを圧縮し、ファイルに書き出す(圧縮辞書)とともに
書き出し先頭位置(圧縮辞書行位置)を記憶する。次
に、同上の辞書1レコードの索引作成データ範囲文字限
定指定表の限定部分に該当する全ての文字を順次取り出
し、文字コードと圧縮辞書行位置を対にしてファイルに
書き出す(索引元データ1)。step2 :次に、索引元データ1を文字コード順、圧縮辞
書行位置順にソートする(索引元データ2)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして、索引1に
書き出す。
バッファに1レコード読む。次に、読んだ辞書1レコー
ドを圧縮し、ファイルに書き出す(圧縮辞書)とともに
書き出し先頭位置(圧縮辞書行位置)を記憶する。次
に、同上の辞書1レコードの索引作成データ範囲文字限
定指定表の限定部分に該当する全ての文字を順次取り出
し、文字コードと圧縮辞書行位置を対にしてファイルに
書き出す(索引元データ1)。step2 :次に、索引元データ1を文字コード順、圧縮辞
書行位置順にソートする(索引元データ2)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして、索引1に
書き出す。
【0036】図14は、索引作成時に辞書上のキーとな
り得る部分を区切り記号による範囲で限定し、検索キー
比較の際に圧縮辞書行の解凍を限定する検索の処理の概
略フローチャートを示す図である。以下、各ステップに
従って順次説明する。step1 :まず、索引キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の索引2の行開始位置を記憶する。次の行の索引2
の(行開始位置−1)を索引2の探索終了位置として記
憶する。step3 :次に、記憶した索引2の行開始位置から探索終
了位置まで、索引2の圧縮辞書行位置を順次読み出し、
その行番号のレコードデータを圧縮辞書本体のファイル
からバッファに読み込み、索引作成データ範囲区切り記
号限定指定表の限定部分まで解凍し、解凍した文字列と
検索キーとを照合し、合致する場合、残りの部分を解凍
し、レコードを表示またはファイルに書き出す。
り得る部分を区切り記号による範囲で限定し、検索キー
比較の際に圧縮辞書行の解凍を限定する検索の処理の概
略フローチャートを示す図である。以下、各ステップに
従って順次説明する。step1 :まず、索引キー“あい”を解析し、索引を検索
する文字を1文字キー(あ)としてセットする。step2 :次に、索引1を読み、文字欄を先頭から順次サ
ーチし、1文字キー(あ)と一致するものを探す。一致し
た行の索引2の行開始位置を記憶する。次の行の索引2
の(行開始位置−1)を索引2の探索終了位置として記
憶する。step3 :次に、記憶した索引2の行開始位置から探索終
了位置まで、索引2の圧縮辞書行位置を順次読み出し、
その行番号のレコードデータを圧縮辞書本体のファイル
からバッファに読み込み、索引作成データ範囲区切り記
号限定指定表の限定部分まで解凍し、解凍した文字列と
検索キーとを照合し、合致する場合、残りの部分を解凍
し、レコードを表示またはファイルに書き出す。
【0037】図15および図16は、索引作成時に参照
する索引作成データ範囲区切り記号限定表の例を示す図
である。すなわち、図15は、辞書中の表記部分が開始
区切りと終了区切りで囲まれている例を示す図で、図1
6は、辞書の見出しの読みが表記の開始区切りや漢字空
白で終わっている例を示す図である。
する索引作成データ範囲区切り記号限定表の例を示す図
である。すなわち、図15は、辞書中の表記部分が開始
区切りと終了区切りで囲まれている例を示す図で、図1
6は、辞書の見出しの読みが表記の開始区切りや漢字空
白で終わっている例を示す図である。
【0038】図17は、その索引作成の処理の概略フロ
ーチャートを示す図である。この例も検索照合時に解凍
する範囲を索引作成時の文字範囲に限定することによっ
て、レコード全体を解凍してから照合するより処理の高
速化をはかろうとする。以下、各ステップに従って順次
説明する。step1 :まず、辞書データをファイルからバアッファに
1レコード読む。次に、読んだ辞書1レコードを圧縮
し、ファイルに書き出す(圧縮辞書)とともに書き出し
先頭位置(圧縮辞書行位置)を記憶する。次に、同上の
辞書1レコードの索引作成データ範囲区切り記号限定指
定表の限定部分に該当する全ての文字を順次取り出し、
文字コードと圧縮辞書行位置を対にしてファイルに書き
出す(索引元データ1)。step2 :次に、索引元データ1を文字コード順、圧縮辞
書行位置順にソートする(索引元データ2)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして、索引1に
書き出す。
ーチャートを示す図である。この例も検索照合時に解凍
する範囲を索引作成時の文字範囲に限定することによっ
て、レコード全体を解凍してから照合するより処理の高
速化をはかろうとする。以下、各ステップに従って順次
説明する。step1 :まず、辞書データをファイルからバアッファに
1レコード読む。次に、読んだ辞書1レコードを圧縮
し、ファイルに書き出す(圧縮辞書)とともに書き出し
先頭位置(圧縮辞書行位置)を記憶する。次に、同上の
辞書1レコードの索引作成データ範囲区切り記号限定指
定表の限定部分に該当する全ての文字を順次取り出し、
文字コードと圧縮辞書行位置を対にしてファイルに書き
出す(索引元データ1)。step2 :次に、索引元データ1を文字コード順、圧縮辞
書行位置順にソートする(索引元データ2)。step3 :索引元データ2を順次読み出し、圧縮辞書行位
置のみを索引2に書き出すとともに、文字部のコードの
変わり目で文字と索引2の行番号を対にして、索引1に
書き出す。
【0039】以上は、辞書を例に索引の作成と検索方法
について述べたが、これを辞書以外の類似の文書や文字
列データに摘要することもできる。次に、辞書データの
圧縮方法について説明する。通常行われている方法は次
のようなものである。 (1)例えば、図2に示した辞書の例のようなデータで
全てが2byte漢字コードで記載されているデータの場合
は、1文字は16bitで記述されているのが一般的で、
かつJISコードに類するコードの場合は、2byteコード
の各バイトの最上位bitは省略でき、1文字14bitで表
現できる。また、漢字コードの範囲は限定されているの
で、その範囲を連続した範囲に写像すれば、1コードの
表現に必要なbit数はさらに減少できる。
について述べたが、これを辞書以外の類似の文書や文字
列データに摘要することもできる。次に、辞書データの
圧縮方法について説明する。通常行われている方法は次
のようなものである。 (1)例えば、図2に示した辞書の例のようなデータで
全てが2byte漢字コードで記載されているデータの場合
は、1文字は16bitで記述されているのが一般的で、
かつJISコードに類するコードの場合は、2byteコード
の各バイトの最上位bitは省略でき、1文字14bitで表
現できる。また、漢字コードの範囲は限定されているの
で、その範囲を連続した範囲に写像すれば、1コードの
表現に必要なbit数はさらに減少できる。
【0040】この方法の利点は、処理が簡単で圧縮およ
び解凍の処理が速いこと、また、圧縮したコードが1文
字に1対1に対応しているので、図7で説明した検索キ
ーを圧縮して圧縮辞書のレコードと比較するのに都合が
よい。また、図13で説明した索引作成データ範囲を文
字位置で限定した部分を解凍するのに解凍範囲があらか
じめ分かっているため、処理が簡単になる。なお、圧縮
レコードの区切りを表現する方法としては、一般に圧縮
レコードの終わりにNULLコードが使用される。
び解凍の処理が速いこと、また、圧縮したコードが1文
字に1対1に対応しているので、図7で説明した検索キ
ーを圧縮して圧縮辞書のレコードと比較するのに都合が
よい。また、図13で説明した索引作成データ範囲を文
字位置で限定した部分を解凍するのに解凍範囲があらか
じめ分かっているため、処理が簡単になる。なお、圧縮
レコードの区切りを表現する方法としては、一般に圧縮
レコードの終わりにNULLコードが使用される。
【0041】(2)さらに、圧縮率を高める方法として
は、同じ文字の連続を簡単なコードで表現する方法や、
データ中に出現するコードパターンを登録しつつ、その
高頻度パターンを短いコードで表現する方法などがあ
る。また、一般的によく使われる文字に短いコードを割
り当てる方法がある。
は、同じ文字の連続を簡単なコードで表現する方法や、
データ中に出現するコードパターンを登録しつつ、その
高頻度パターンを短いコードで表現する方法などがあ
る。また、一般的によく使われる文字に短いコードを割
り当てる方法がある。
【0042】図18は、本発明による辞書検索装置の他
の実施例を説明するための構成図で、図中、16はKK
C辞書検索制御部、17はKKC辞書本体で、その他、
図1と同じ作用をする部分は同一の符号を付してある。
図1に示す構成と異なる点は、入力/編集制御部6にか
な漢字変換用(KKC)辞書が付随している点である。
の実施例を説明するための構成図で、図中、16はKK
C辞書検索制御部、17はKKC辞書本体で、その他、
図1と同じ作用をする部分は同一の符号を付してある。
図1に示す構成と異なる点は、入力/編集制御部6にか
な漢字変換用(KKC)辞書が付随している点である。
【0043】図19(a)〜(c)は、本発明の辞書デ
ータのレコード単位の圧縮方法を説明するための図であ
る。図19(a)は、圧縮対象の辞書レコードの例、図
19(b)は、かな漢字変換用辞書の例、図19(c)
は、圧縮対象の辞書レコードの「読み」部分をかな漢字
変換用辞書の「読み」部分に対応させ、そのレコード位
置を読み情報として記憶するようにすることを説明する
対応表の例を各々示す。
ータのレコード単位の圧縮方法を説明するための図であ
る。図19(a)は、圧縮対象の辞書レコードの例、図
19(b)は、かな漢字変換用辞書の例、図19(c)
は、圧縮対象の辞書レコードの「読み」部分をかな漢字
変換用辞書の「読み」部分に対応させ、そのレコード位
置を読み情報として記憶するようにすることを説明する
対応表の例を各々示す。
【0044】図19(c)で、例えば圧縮対象辞書のレ
コード番号「20」の読み「ああ」は、かな漢字変換用
辞書のレコード番号「12」の読み「ああ」と一致する
ので、圧縮データはかな漢字変換用辞書のレコード位置
であるレコード番号「12」を記憶すればよい。また、
この例では、圧縮対象辞書のレコード番号「27」の読
み「あい」と、レコード番号「29」の読み「あい」
は、かな漢字変換用辞書のレコード番号「20」を記憶
すればよい。
コード番号「20」の読み「ああ」は、かな漢字変換用
辞書のレコード番号「12」の読み「ああ」と一致する
ので、圧縮データはかな漢字変換用辞書のレコード位置
であるレコード番号「12」を記憶すればよい。また、
この例では、圧縮対象辞書のレコード番号「27」の読
み「あい」と、レコード番号「29」の読み「あい」
は、かな漢字変換用辞書のレコード番号「20」を記憶
すればよい。
【0045】図20は、図18に示した方法による圧縮
対象辞書の読みの圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「読み」をキーにかな
漢字変換用辞書の「読み」を検索する。step3 :読みがかな漢字変換用辞書の読みと一致した初
めのレコード番号を、読みの圧縮データとして記憶す
る。step4 :圧縮対象辞書ファイルの「読み」部分を前記読
みの圧縮データと置き換えファイルに書き出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
対象辞書の読みの圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「読み」をキーにかな
漢字変換用辞書の「読み」を検索する。step3 :読みがかな漢字変換用辞書の読みと一致した初
めのレコード番号を、読みの圧縮データとして記憶す
る。step4 :圧縮対象辞書ファイルの「読み」部分を前記読
みの圧縮データと置き換えファイルに書き出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0046】図19の例では、説明を簡単にするため、
システムにあるかな漢字変換辞書が圧縮対象辞書と同じ
ようなレコード構成で示したが、通常、実際にシステム
にあるかな漢字変換用辞書は、この例のような簡単な構
造ではなく、検索の高速化あるいは辞書容量の圧縮のた
め、それ自体で読みに索引を設けたり、辞書本体の読み
や表記や品詞が圧縮されている場合がほとんどである。
この場合は、図19の「かな漢字変換用辞書読み位置」
の内容は、単にかな漢字変換用辞書のレコード番号では
なく、それに相当するかな漢字変換用辞書本体の該当す
る読み位置を記憶する。
システムにあるかな漢字変換辞書が圧縮対象辞書と同じ
ようなレコード構成で示したが、通常、実際にシステム
にあるかな漢字変換用辞書は、この例のような簡単な構
造ではなく、検索の高速化あるいは辞書容量の圧縮のた
め、それ自体で読みに索引を設けたり、辞書本体の読み
や表記や品詞が圧縮されている場合がほとんどである。
この場合は、図19の「かな漢字変換用辞書読み位置」
の内容は、単にかな漢字変換用辞書のレコード番号では
なく、それに相当するかな漢字変換用辞書本体の該当す
る読み位置を記憶する。
【0047】この場合、かな漢字変換用辞書の圧縮前の
データを元に、そのレコード位置または読み位置を記憶
するか、または圧縮済のかな漢字変換用辞書のその読み
該当位置を記憶する。圧縮済のかな漢字変換用辞書のそ
の読み位置情報は、例えば、読みの索引に読みの先頭2
文字が収納され、残りの読みが本体に収納されているよ
うな検索構造の辞書の場合、読みの先頭2文字の索引上
の位置と本体の残りの読み位置を合わせてその読み位置
情報とする。
データを元に、そのレコード位置または読み位置を記憶
するか、または圧縮済のかな漢字変換用辞書のその読み
該当位置を記憶する。圧縮済のかな漢字変換用辞書のそ
の読み位置情報は、例えば、読みの索引に読みの先頭2
文字が収納され、残りの読みが本体に収納されているよ
うな検索構造の辞書の場合、読みの先頭2文字の索引上
の位置と本体の残りの読み位置を合わせてその読み位置
情報とする。
【0048】図21は、前述の場合の圧縮対象辞書の読
みの圧縮データを作成する処理の概要フローチャートを
示す図である。以下、各ステップに従って順次説明す
る。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「読み」をキーにかな
漢字変換用辞書の「読み」を検索する。step3 :読みがかな漢字変換用辞書の読みと一致した先
頭2文字の索引上の位置と本体の残りの読みの位置を圧
縮データとして記憶する。step4 :圧縮対象辞書ファイルの「読み」部分を前記読
みの圧縮データと置き換え、ファイルに書き出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
みの圧縮データを作成する処理の概要フローチャートを
示す図である。以下、各ステップに従って順次説明す
る。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「読み」をキーにかな
漢字変換用辞書の「読み」を検索する。step3 :読みがかな漢字変換用辞書の読みと一致した先
頭2文字の索引上の位置と本体の残りの読みの位置を圧
縮データとして記憶する。step4 :圧縮対象辞書ファイルの「読み」部分を前記読
みの圧縮データと置き換え、ファイルに書き出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0049】また、圧縮対象辞書の圧縮データから読み
を復元する場合は、かな漢字変換用辞書の読み位置デー
タからかな漢字変換用の辞書をひき、そこに登録されて
いる読みデータを取得する。図22は、前述の場合の圧
縮データから読みを復元する処理の概要フローチャート
を示す図である。以下、各ステップに従って順次説明す
る。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、読み部分の解凍に入ったら、圧
縮コードをかな漢字変換用辞書の読み位置情報と解釈
し、読み位置情報に従ってかな漢字変換用辞書データか
ら読みデータを取得し、前記辞書レコードバッファにセ
ットする。次に、読み部分以外のデータは、他の解凍ア
ルゴリズムに従って前記辞書レコードバッファにセット
する。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
を復元する場合は、かな漢字変換用辞書の読み位置デー
タからかな漢字変換用の辞書をひき、そこに登録されて
いる読みデータを取得する。図22は、前述の場合の圧
縮データから読みを復元する処理の概要フローチャート
を示す図である。以下、各ステップに従って順次説明す
る。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、読み部分の解凍に入ったら、圧
縮コードをかな漢字変換用辞書の読み位置情報と解釈
し、読み位置情報に従ってかな漢字変換用辞書データか
ら読みデータを取得し、前記辞書レコードバッファにセ
ットする。次に、読み部分以外のデータは、他の解凍ア
ルゴリズムに従って前記辞書レコードバッファにセット
する。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
【0050】上記例のような読みの索引に読みの先頭2
文字が収納され、残りの読みが本体に収納されているよ
うな検索構造を持つ圧縮された辞書の場合の圧縮対象辞
書の読みの復元の場合は、記憶されたその読みの先頭2
文字の索引上の位置と本体の残りの読み位置を合成され
たその読み位置情報からそれぞれ取りだし、対応位置の
それぞれ読み文字列を取りだし、それらを合成する。
文字が収納され、残りの読みが本体に収納されているよ
うな検索構造を持つ圧縮された辞書の場合の圧縮対象辞
書の読みの復元の場合は、記憶されたその読みの先頭2
文字の索引上の位置と本体の残りの読み位置を合成され
たその読み位置情報からそれぞれ取りだし、対応位置の
それぞれ読み文字列を取りだし、それらを合成する。
【0051】図23は、前述の場合の圧縮対象辞書の圧
縮データから読みを復元する処理の概略フローチャート
を示す図である。以下、各ステップに従って順次説明す
る。 step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、読み部分の解凍に入ったら、圧
縮コードをかな漢字変換用辞書の読み位置情報と解釈
し、読み位置情報に従ってかな漢字変換用辞書データか
ら読みデータを取得し、前記辞書レコードバッファにセ
ットする。次に、読み位置情報の一部から読みの索引上
の位置を取得し、読みの先頭2文字を得る。次に、読み
位置情報の残りから本体の残りの読み位置を取得し、読
みの残りの文字を得る。次に、前記読みの先頭2文字と
残りの文字を合成し、読みデータとする。次に、読み部
分以外のデータは、他の解凍アルゴリズムに従って上記
辞書レコードバッファにセットする。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
縮データから読みを復元する処理の概略フローチャート
を示す図である。以下、各ステップに従って順次説明す
る。 step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、読み部分の解凍に入ったら、圧
縮コードをかな漢字変換用辞書の読み位置情報と解釈
し、読み位置情報に従ってかな漢字変換用辞書データか
ら読みデータを取得し、前記辞書レコードバッファにセ
ットする。次に、読み位置情報の一部から読みの索引上
の位置を取得し、読みの先頭2文字を得る。次に、読み
位置情報の残りから本体の残りの読み位置を取得し、読
みの残りの文字を得る。次に、前記読みの先頭2文字と
残りの文字を合成し、読みデータとする。次に、読み部
分以外のデータは、他の解凍アルゴリズムに従って上記
辞書レコードバッファにセットする。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
【0052】図24(a)〜(c)は、本発明の辞書デ
ータのレコード単位の圧縮方法の他の実施例を説明する
ための図で、図24(a)は、圧縮対象の辞書レコード
の例、図24(b)は、かな漢字変換用辞書の例、図2
4(c)は、圧縮対象の辞書レコードの「表記」部分
を、かな漢字変換用辞書の「表記」部分に対応させ、そ
のレコード位置を読み情報として記憶するようにするこ
とを説明する対応表の例を各々示す。
ータのレコード単位の圧縮方法の他の実施例を説明する
ための図で、図24(a)は、圧縮対象の辞書レコード
の例、図24(b)は、かな漢字変換用辞書の例、図2
4(c)は、圧縮対象の辞書レコードの「表記」部分
を、かな漢字変換用辞書の「表記」部分に対応させ、そ
のレコード位置を読み情報として記憶するようにするこ
とを説明する対応表の例を各々示す。
【0053】図24(c)で、例えば、圧縮対象辞書の
レコード番号「27」の表記「愛」は、かな漢字変換用
辞書のレコード番号「20」の表記「愛」と一致するの
で、圧縮データは、かな漢字変換用辞書のレコード位置
であるレコード番号「20」を記憶すればよい。また、
圧縮対象辞書のレコード番号「29」の表記「相」は、
かな漢字変換用辞書のレコード番号「22」を記憶すれ
ばよい。
レコード番号「27」の表記「愛」は、かな漢字変換用
辞書のレコード番号「20」の表記「愛」と一致するの
で、圧縮データは、かな漢字変換用辞書のレコード位置
であるレコード番号「20」を記憶すればよい。また、
圧縮対象辞書のレコード番号「29」の表記「相」は、
かな漢字変換用辞書のレコード番号「22」を記憶すれ
ばよい。
【0054】図25は、図24に示した方法による圧縮
対象辞書の表記の圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「表記」をキーにかな
漢字変換用辞書の「表記」を検索する。step3 :「表記」がかな漢字変換用辞書の「表記」と一
致した初めのレコード番号を表記の圧縮データとして記
憶する。step4 :圧縮対象辞書ファイルの「表記」部分を前記表
記の圧縮データを置き換え、ファイルに書き出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
対象辞書の表記の圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「表記」をキーにかな
漢字変換用辞書の「表記」を検索する。step3 :「表記」がかな漢字変換用辞書の「表記」と一
致した初めのレコード番号を表記の圧縮データとして記
憶する。step4 :圧縮対象辞書ファイルの「表記」部分を前記表
記の圧縮データを置き換え、ファイルに書き出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0055】図26は、図24に示した方法による圧縮
対象辞書の圧縮データから表記を復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、表記部分の解凍に入ったら圧縮
コードをかな漢字変換用辞書の表記位置情報と解釈し、
表記位置情報に従ってかな漢字変換用辞書データから表
記データを取得し、前記辞書レコードバッファにセット
する。次に、表記部分以外のデータは、他の解凍アルゴ
リズムに従って上記辞書レコードバッファにセットす
る。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
対象辞書の圧縮データから表記を復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、表記部分の解凍に入ったら圧縮
コードをかな漢字変換用辞書の表記位置情報と解釈し、
表記位置情報に従ってかな漢字変換用辞書データから表
記データを取得し、前記辞書レコードバッファにセット
する。次に、表記部分以外のデータは、他の解凍アルゴ
リズムに従って上記辞書レコードバッファにセットす
る。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
【0056】図27(a)〜(c)は、本発明における
辞書データのレコード単位の圧縮方法の更に他の実施例
を説明するための図で、図27(a)は、圧縮対象の辞
書レコードの例、図27(b)は、かな漢字変換用辞書
の例、図27(c)は、圧縮対象の辞書レコードの「語
釈」の一部をかな漢字変換用辞書の「表記」部分に対応
させ、そのレコード位置を読み情報として記憶するよう
にすることを説明する対応表の例を各々示す。
辞書データのレコード単位の圧縮方法の更に他の実施例
を説明するための図で、図27(a)は、圧縮対象の辞
書レコードの例、図27(b)は、かな漢字変換用辞書
の例、図27(c)は、圧縮対象の辞書レコードの「語
釈」の一部をかな漢字変換用辞書の「表記」部分に対応
させ、そのレコード位置を読み情報として記憶するよう
にすることを説明する対応表の例を各々示す。
【0057】図27(c)で、例えば、圧縮対象辞書の
レコード番号「20」の語釈の一部「驚き」は、かな漢
字変換用辞書のレコード番号「7410」の表記「驚
き」と一致するので、圧縮データは、かな漢字変換用辞
書のレコード位置であるレコード番号「7410」を記
憶すればよい。また、同語釈の一部「悲しみ」は、かな
漢字変換用辞書のレコード番号「10525」を記憶す
ればよい。
レコード番号「20」の語釈の一部「驚き」は、かな漢
字変換用辞書のレコード番号「7410」の表記「驚
き」と一致するので、圧縮データは、かな漢字変換用辞
書のレコード位置であるレコード番号「7410」を記
憶すればよい。また、同語釈の一部「悲しみ」は、かな
漢字変換用辞書のレコード番号「10525」を記憶す
ればよい。
【0058】図28は、図27に示した方法による圧縮
対象辞書の語釈部分の圧縮データを作成する処理の概略
フローチャートである。以下、各ステップに従って順次
説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「語釈」の単語部分を
キーにかな漢字変換用辞書の表記を検索する。step3 :「表記」がかな漢字変換用辞書の表記と一致し
た初めのレコード番号を語釈の単語部分の圧縮データと
して記憶する。step4 :圧縮対象辞書ファイルの「語釈」の単語部分を
前記単語部分の圧縮データと置き換え、ファイルに書き
出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
対象辞書の語釈部分の圧縮データを作成する処理の概略
フローチャートである。以下、各ステップに従って順次
説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「語釈」の単語部分を
キーにかな漢字変換用辞書の表記を検索する。step3 :「表記」がかな漢字変換用辞書の表記と一致し
た初めのレコード番号を語釈の単語部分の圧縮データと
して記憶する。step4 :圧縮対象辞書ファイルの「語釈」の単語部分を
前記単語部分の圧縮データと置き換え、ファイルに書き
出す。step5 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0059】図29は、図27に示した圧縮対象辞書の
圧縮データから語釈を復元する処理の概略フローチャー
トを示す図である。以下、各ステップに従って順次説明
する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、語釈部分の解凍に入ったら、単
語対応部分の圧縮コードをかな漢字変換用辞書の表記位
置情報と解釈し、表記位置情報に従ってかな漢字変換用
辞書データから表記データを取得し、前記辞書レコード
バッファにセットする。次に、語釈の単語対応部分以外
のデータは、他の解凍アルゴリズムに従って前記辞書レ
コードバッファにセットする。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
圧縮データから語釈を復元する処理の概略フローチャー
トを示す図である。以下、各ステップに従って順次説明
する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、語釈部分の解凍に入ったら、単
語対応部分の圧縮コードをかな漢字変換用辞書の表記位
置情報と解釈し、表記位置情報に従ってかな漢字変換用
辞書データから表記データを取得し、前記辞書レコード
バッファにセットする。次に、語釈の単語対応部分以外
のデータは、他の解凍アルゴリズムに従って前記辞書レ
コードバッファにセットする。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
【0060】図30(a)〜(c)は、本発明の辞書デ
ータのレコード単位の圧縮方法の更に他の実施例を説明
するための図で、図30(a)は、圧縮対象の辞書レコ
ードの例、図30(b)は、かな漢字変換用辞書の例、
図30(c)は、圧縮対象の辞書レコードの「読み」部
分を、かな漢字変換用辞書の「読み」部分に対応させ、
そのレコード位置を読み情報として記憶するようにする
ことを説明する対応表の例を各々示す。
ータのレコード単位の圧縮方法の更に他の実施例を説明
するための図で、図30(a)は、圧縮対象の辞書レコ
ードの例、図30(b)は、かな漢字変換用辞書の例、
図30(c)は、圧縮対象の辞書レコードの「読み」部
分を、かな漢字変換用辞書の「読み」部分に対応させ、
そのレコード位置を読み情報として記憶するようにする
ことを説明する対応表の例を各々示す。
【0061】図30(c)で、例えば圧縮対象辞書のレ
コード番号「20」の読み「ああ」は、かな漢字変換用
辞書のレコード番号「12」の読み「ああ」と一致する
ので、圧縮データはかな漢字変換用辞書のレコード位置
であるレコード番号「12」を記憶する。一方、この例
では、圧縮対象辞書のレコード番号「1」の読み「あ」
は短いので、かな漢字変換用辞書のレコード位置は記憶
しない。
コード番号「20」の読み「ああ」は、かな漢字変換用
辞書のレコード番号「12」の読み「ああ」と一致する
ので、圧縮データはかな漢字変換用辞書のレコード位置
であるレコード番号「12」を記憶する。一方、この例
では、圧縮対象辞書のレコード番号「1」の読み「あ」
は短いので、かな漢字変換用辞書のレコード位置は記憶
しない。
【0062】図31は、図30に示した方法による圧縮
対象辞書の読み圧縮データを作成する処理の概略フロー
チャートを示す図である。以下、各ステップに従って順
次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「読み」は、規定の長
さ以上かどうかを判断し、Noであれば、後述するstep
6へ行く。step3 :前記step2において、Yesであれば、読んだレ
コードの「読み」をキーにかな漢字変換用辞書の「読
み」を検索する。step4 :読みがかな漢字変換用辞書の読みと一致した初
めのレコード番号を読みの圧縮データとして記憶する。step5 :圧縮対象辞書ファイルの「読み」部分を前記読
みの圧縮データと置き換える。step6 :圧縮データレコードをファイルに書き出す。step7 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
対象辞書の読み圧縮データを作成する処理の概略フロー
チャートを示す図である。以下、各ステップに従って順
次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「読み」は、規定の長
さ以上かどうかを判断し、Noであれば、後述するstep
6へ行く。step3 :前記step2において、Yesであれば、読んだレ
コードの「読み」をキーにかな漢字変換用辞書の「読
み」を検索する。step4 :読みがかな漢字変換用辞書の読みと一致した初
めのレコード番号を読みの圧縮データとして記憶する。step5 :圧縮対象辞書ファイルの「読み」部分を前記読
みの圧縮データと置き換える。step6 :圧縮データレコードをファイルに書き出す。step7 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0063】図32は、図30に示した方法による圧縮
対象辞書の圧縮データから読みを復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、読み部分の解凍に入り、その圧
縮コードが規定値以上の長さの読みのデータと解釈でき
るときは、その圧縮コードをかな漢字変換用辞書の読み
位置情報と解釈し、読み位置情報に従ってかな漢字変換
用辞書データから読みデータを取得し、前記辞書レコー
ドバッファにセットする。次に、読み部分以外のデータ
あるいは読み部分でも規定値未満の長さの読みデータと
解釈できる場合は、他の解凍アルゴリズムに従って前記
辞書レコードバッファにセットする。step3 :解凍した辞書のレコードを表示するか、または
次の処理に渡す。
対象辞書の圧縮データから読みを復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、読み部分の解凍に入り、その圧
縮コードが規定値以上の長さの読みのデータと解釈でき
るときは、その圧縮コードをかな漢字変換用辞書の読み
位置情報と解釈し、読み位置情報に従ってかな漢字変換
用辞書データから読みデータを取得し、前記辞書レコー
ドバッファにセットする。次に、読み部分以外のデータ
あるいは読み部分でも規定値未満の長さの読みデータと
解釈できる場合は、他の解凍アルゴリズムに従って前記
辞書レコードバッファにセットする。step3 :解凍した辞書のレコードを表示するか、または
次の処理に渡す。
【0064】図33(a)〜(c)は、本発明の辞書デ
ータのレコード単位の圧縮方法の更に他の実施例を説明
するための図で、図33(a)は、圧縮対象の辞書レコ
ードの例、図33(b)は、かな漢字変換用辞書の例、
図33(c)は、圧縮対象の辞書レコードの「表記」部
分を、かな漢字変換用辞書の「表記」部分に対応させ、
そのレコード位置を読み情報として記憶するようにする
ことを説明する対応表の例を各々示す。
ータのレコード単位の圧縮方法の更に他の実施例を説明
するための図で、図33(a)は、圧縮対象の辞書レコ
ードの例、図33(b)は、かな漢字変換用辞書の例、
図33(c)は、圧縮対象の辞書レコードの「表記」部
分を、かな漢字変換用辞書の「表記」部分に対応させ、
そのレコード位置を読み情報として記憶するようにする
ことを説明する対応表の例を各々示す。
【0065】図33(c)で、例えば、圧縮対象辞書の
レコード番号「197」の表記「愛情」は、かな漢字変
換用辞書のレコード番号「103」の表記「愛情」と一
致するので、圧縮データはかな漢字変換用辞書のレコー
ド位置であるレコード番号「103」を記憶する。一
方、この例では、圧縮対象辞書のレコード番号「27」
の表記「愛」は短いので、かな漢字変換用辞書のレコー
ド位置は記憶しない。
レコード番号「197」の表記「愛情」は、かな漢字変
換用辞書のレコード番号「103」の表記「愛情」と一
致するので、圧縮データはかな漢字変換用辞書のレコー
ド位置であるレコード番号「103」を記憶する。一
方、この例では、圧縮対象辞書のレコード番号「27」
の表記「愛」は短いので、かな漢字変換用辞書のレコー
ド位置は記憶しない。
【0066】図34は、図33に示した方法による圧縮
対象辞書の表記の圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「表記」は規定の長さ
以上かどうかを判断し、Noであれば、後述するstep6
へ行く。step3 :前記step2において、Yesであれば、読んだレ
コードの「表記」をキーにかな漢字変換用辞書の「表
記」を検索する。step4 :表記がかな漢字変換用辞書の表記と一致した初
めのレコード番号を表記の圧縮データとして記憶する。step5 :圧縮対象辞書ファイルの「表記」部分を前記表
記の圧縮データと置き換える。step6 :圧縮データレコードをファイルに書き出す。step7 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
対象辞書の表記の圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「表記」は規定の長さ
以上かどうかを判断し、Noであれば、後述するstep6
へ行く。step3 :前記step2において、Yesであれば、読んだレ
コードの「表記」をキーにかな漢字変換用辞書の「表
記」を検索する。step4 :表記がかな漢字変換用辞書の表記と一致した初
めのレコード番号を表記の圧縮データとして記憶する。step5 :圧縮対象辞書ファイルの「表記」部分を前記表
記の圧縮データと置き換える。step6 :圧縮データレコードをファイルに書き出す。step7 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0067】図35は、図33に示した方法による圧縮
対象辞書の圧縮データから表記を復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、表記部分の解凍に入り、その圧
縮コードが規定値以上の長さの表記のデータと解釈でき
るときは、その圧縮コードをかな漢字変換用辞書の表記
位置情報と解釈し、表記位置情報に従ってかな漢字変換
用辞書データから表記データを取得し、前記辞書レコー
ドバッファにセットする。次に、表記部分以外のデータ
あるいは表記部分でも規定値未満の長さの表記データと
解釈できる場合は、他の解凍アルゴリズムに従って前記
辞書レコードバッファにセットするstep3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
対象辞書の圧縮データから表記を復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、表記部分の解凍に入り、その圧
縮コードが規定値以上の長さの表記のデータと解釈でき
るときは、その圧縮コードをかな漢字変換用辞書の表記
位置情報と解釈し、表記位置情報に従ってかな漢字変換
用辞書データから表記データを取得し、前記辞書レコー
ドバッファにセットする。次に、表記部分以外のデータ
あるいは表記部分でも規定値未満の長さの表記データと
解釈できる場合は、他の解凍アルゴリズムに従って前記
辞書レコードバッファにセットするstep3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
【0068】図36(a)〜(c)は、本発明の辞書デ
ータのレコード単位の圧縮方法の更に他の実施例を説明
するための図で、図36(a)は、圧縮対象の辞書レコ
ードの例、図36(b)は、かな漢字変換用辞書の例、
図36(c)は、補助辞書の例、図36(c)は、圧縮
対象の辞書レコードの「表記」部分をかな漢字変換用辞
書の「表記」部分に対応させ、そのレコード位置を表記
情報として記憶するようにすることを説明する対応表の
例を各々示す。
ータのレコード単位の圧縮方法の更に他の実施例を説明
するための図で、図36(a)は、圧縮対象の辞書レコ
ードの例、図36(b)は、かな漢字変換用辞書の例、
図36(c)は、補助辞書の例、図36(c)は、圧縮
対象の辞書レコードの「表記」部分をかな漢字変換用辞
書の「表記」部分に対応させ、そのレコード位置を表記
情報として記憶するようにすることを説明する対応表の
例を各々示す。
【0069】図36(c)で、例えば、圧縮対象辞書の
レコード番号「1」の表記「亜」は、かな漢字変換用辞
書のレコード番号「1」の表記「亜」と一致するので、
圧縮データはかな漢字変換用辞書のレコード位置である
レコード番号「1」を記憶する。一方、圧縮対象辞書の
レコード番号「5」の表記「痾」はかな漢字変換用辞書
には登録されていないので、かな漢字変換用辞書のレコ
ード位置は記憶できない。この場合、システムに備わっ
ている補助辞書あるいは補助辞書に類するもの(単漢字
辞書,特殊語辞書など)あるいは圧縮対象辞書の内容に
対応して、新たに作成した補助辞書を使用し、その表記
位置を記憶する。表記「痾」は補助辞書のレコード番号
「523645」(かな漢字変換用辞書の最終レコード
の後に通番とした補助辞書のレコード番号)を記憶す
る。例えば、かな漢字変換用辞書のレコード番号は、
「1〜50000」で、補助辞書のレコード番号は「50001」
から始まると仮定する。
レコード番号「1」の表記「亜」は、かな漢字変換用辞
書のレコード番号「1」の表記「亜」と一致するので、
圧縮データはかな漢字変換用辞書のレコード位置である
レコード番号「1」を記憶する。一方、圧縮対象辞書の
レコード番号「5」の表記「痾」はかな漢字変換用辞書
には登録されていないので、かな漢字変換用辞書のレコ
ード位置は記憶できない。この場合、システムに備わっ
ている補助辞書あるいは補助辞書に類するもの(単漢字
辞書,特殊語辞書など)あるいは圧縮対象辞書の内容に
対応して、新たに作成した補助辞書を使用し、その表記
位置を記憶する。表記「痾」は補助辞書のレコード番号
「523645」(かな漢字変換用辞書の最終レコード
の後に通番とした補助辞書のレコード番号)を記憶す
る。例えば、かな漢字変換用辞書のレコード番号は、
「1〜50000」で、補助辞書のレコード番号は「50001」
から始まると仮定する。
【0070】図37は、図36に示した方法による圧縮
対象辞書の表記の圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「表記」をキーにかな
漢字変換用辞書の「表記」を検索する。step3 :表記がかな漢字変換用辞書の表記と一致したか
どうかを判断する。step4 :前記step3でYesであれば、表記がかな漢字変
換用辞書の表記と一致した初めのレコード番号を表記の
圧縮データとして記憶する。step5 :前記step3でNoであれば、「表記」をキーに補
助辞書の「表記」を検索し、一致したレコード番号を表
記の圧縮データとして記憶する。step6 :圧縮対象辞書ファイルの「表記」部分を前記表
記の圧縮データと置き換える。step7 :圧縮データレコードをファイルに書き出す。step8 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
対象辞書の表記の圧縮データを作成する処理の概略フロ
ーチャートを示す図である。以下、各ステップに従って
順次説明する。step1 :まず、圧縮対象辞書ファイルからバッファに1
レコード読む。step2 :次に、読んだレコードの「表記」をキーにかな
漢字変換用辞書の「表記」を検索する。step3 :表記がかな漢字変換用辞書の表記と一致したか
どうかを判断する。step4 :前記step3でYesであれば、表記がかな漢字変
換用辞書の表記と一致した初めのレコード番号を表記の
圧縮データとして記憶する。step5 :前記step3でNoであれば、「表記」をキーに補
助辞書の「表記」を検索し、一致したレコード番号を表
記の圧縮データとして記憶する。step6 :圧縮対象辞書ファイルの「表記」部分を前記表
記の圧縮データと置き換える。step7 :圧縮データレコードをファイルに書き出す。step8 :以上の操作を圧縮対象辞書の全レコードについ
て繰り返す。
【0071】図38は、図36に示した方法による圧縮
対象辞書の圧縮データから表記を復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、表記部分の解凍に入り、その圧
縮コードにより、かな漢字変換用辞書の表記位置情報ま
たは補助辞書の位置情報と解釈し、表示位置情報に従っ
てかな漢字変換用辞書データまたは補助辞書から表記デ
ータを取得し、前記辞書レコードバッファにセットす
る。次に、表記部分以外のデータは、他の解凍アルゴリ
ズムに従って前記辞書レコードバッファにセットする。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
対象辞書の圧縮データから表記を復元する処理の概略フ
ローチャートを示す図である。以下、各ステップに従っ
て順次説明する。step1 :まず、検索して取得した辞書の圧縮レコードを
バッファにセットする。step2 :次に、圧縮レコード収納バッファを走査し、先
頭から順次解凍、解凍データを辞書レコードバッファに
順次セットする。次に、表記部分の解凍に入り、その圧
縮コードにより、かな漢字変換用辞書の表記位置情報ま
たは補助辞書の位置情報と解釈し、表示位置情報に従っ
てかな漢字変換用辞書データまたは補助辞書から表記デ
ータを取得し、前記辞書レコードバッファにセットす
る。次に、表記部分以外のデータは、他の解凍アルゴリ
ズムに従って前記辞書レコードバッファにセットする。step3 :解凍した辞書レコードを表示するか、または次
の処理に渡す。
【0072】図28において、「語釈」を単語部分に分
解するには、字種による簡単な形態素分解など、任意の
形態素解析により行う。また、単語が用言の場合の送り
仮名のゆれなど、かな漢字変換用辞書の検索の際の照合
方法については、ここでは特に限定せず、従来行われて
いる形態素解析の手法によればよい。簡単な方法では、
かな漢字変換用辞書の用言の照合処理と同様な手法をと
るか、あるいは語釈の文字列を全て体言とみなして照合
し、かな漢字変換用辞書の表記と一致しないものは、か
な漢字変換用辞書を使った圧縮データとしない方法でも
よい。
解するには、字種による簡単な形態素分解など、任意の
形態素解析により行う。また、単語が用言の場合の送り
仮名のゆれなど、かな漢字変換用辞書の検索の際の照合
方法については、ここでは特に限定せず、従来行われて
いる形態素解析の手法によればよい。簡単な方法では、
かな漢字変換用辞書の用言の照合処理と同様な手法をと
るか、あるいは語釈の文字列を全て体言とみなして照合
し、かな漢字変換用辞書の表記と一致しないものは、か
な漢字変換用辞書を使った圧縮データとしない方法でも
よい。
【0073】図20,図21,図25,図26,図3
1,図34において、かな漢字変換用辞書と照合しなか
った文字列は、圧縮しないかまたは先に述べた別の圧縮
方法により圧縮する。その際、必要があれば、圧縮デー
タと非圧縮データ間、かな漢字変換位置情報を使った圧
縮データとその他の圧縮方法による圧縮データ間には、
識別するための区切り記号(または符号)を設けるが、
それぞれのコード領域が重ならないようにする。また、
以上の概要フローにおいて、辞書レコードの各読み部,
表記部,語釈などはレコード内の位置や区切り記号など
を用いて認識可能なものとする。
1,図34において、かな漢字変換用辞書と照合しなか
った文字列は、圧縮しないかまたは先に述べた別の圧縮
方法により圧縮する。その際、必要があれば、圧縮デー
タと非圧縮データ間、かな漢字変換位置情報を使った圧
縮データとその他の圧縮方法による圧縮データ間には、
識別するための区切り記号(または符号)を設けるが、
それぞれのコード領域が重ならないようにする。また、
以上の概要フローにおいて、辞書レコードの各読み部,
表記部,語釈などはレコード内の位置や区切り記号など
を用いて認識可能なものとする。
【0074】図21,図22において、「読み」が索引
と本体に分れて存在する場合の例の処理フローを示した
が、「表記」についても同様である。また、かな漢字変
換用辞書の読みあるいは表記が圧縮されている場合は、
その圧縮データの位置を記憶し、実際の読みあるいは表
記を得る場合は、かな漢字変換用辞書の位置情報にある
圧縮データをかな漢字変換用辞書の圧縮アルゴリズムに
従って解凍したデータを読みまたは表記情報とする。
と本体に分れて存在する場合の例の処理フローを示した
が、「表記」についても同様である。また、かな漢字変
換用辞書の読みあるいは表記が圧縮されている場合は、
その圧縮データの位置を記憶し、実際の読みあるいは表
記を得る場合は、かな漢字変換用辞書の位置情報にある
圧縮データをかな漢字変換用辞書の圧縮アルゴリズムに
従って解凍したデータを読みまたは表記情報とする。
【0075】さらに、かな漢字変換用辞書が高度に圧縮
されている場合には、圧縮対象辞書の圧縮データを作る
際に、かな漢字変換用辞書の元辞書と実際の圧縮された
かな漢字変換用辞書と合わせて参照する方法や、同元辞
書を参照せずに表記の位置データを得るには表記の読み
を一旦求め、読みでかな漢字変換用辞書を引き表記対応
表記を求め、対象とする表記と照合して一致した表記の
位置を圧縮データの位置として記憶するなどの方法を取
る。これらの処理フローについては、個々のかな漢字変
換用辞書の圧縮検索アルゴリズムに依存するので省略す
る。
されている場合には、圧縮対象辞書の圧縮データを作る
際に、かな漢字変換用辞書の元辞書と実際の圧縮された
かな漢字変換用辞書と合わせて参照する方法や、同元辞
書を参照せずに表記の位置データを得るには表記の読み
を一旦求め、読みでかな漢字変換用辞書を引き表記対応
表記を求め、対象とする表記と照合して一致した表記の
位置を圧縮データの位置として記憶するなどの方法を取
る。これらの処理フローについては、個々のかな漢字変
換用辞書の圧縮検索アルゴリズムに依存するので省略す
る。
【0076】
【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。 (1)請求項1〜4に対応する効果:比較的簡便な方法
で中程度の辞書あるいは辞書に類する文書の検索を頭か
ら総なめして検索する方法に較べ、非常に高速で行うこ
とができる。また、任意文字列の検索を高速に行う検索
装置としては、従来のものに較べかなり簡便で索引の量
が非常に少なくて済む。 (2)請求項1に対応する効果:検索対象の辞書データ
をレコード単位に圧縮したので、辞書本体記憶容量を小
さくでき、より小型の記憶容量で装置を実現できる。 (3)請求項2に対応する効果:各文字を含む行先頭位
置の探索範囲を索引作成時の索引文字位置範囲情報によ
り、行先頭位置決めの際に、不要な探索を防止でき、検
索結果の行の切りだしをより高速化できる。 (4)請求項3に対応する効果:一般に検索キーより圧
縮レコードのデータ長が大きく、検索キーの圧縮は1回
で済むので、圧縮レコードを解凍せずに検索キーと照合
することができ、圧縮レコードを解凍して照合するより
も高速に適合情報が得られる。 (5)請求項4に対応する効果:圧縮辞書の各圧縮レコ
ード位置を記録した索引を設けたので、検索キーに一致
するデータおよびその周辺のデータの取りだし(参照)
を一括して行う場合、取りだし範囲が索引によりあらか
じめ把握できるので、取りだしをより高速に行うことが
できる。 (6)請求項5,6に対応する効果:辞書上の索引作成
の範囲の限定に対応して、圧縮レコードの解凍の範囲を
限定できるので、索引作成の限定がある場合、圧縮レコ
ードの限定範囲外の解凍を省略でき、検索キーとの照合
をより高速に行うことができる。 (7)請求項7〜12に対応する効果:比較的簡便な方
法で中程度の辞書あるいは辞書に類する文書の検索を頭
から総なめして検索する方法に比べ、非常に高速で行う
ことができる。また、任意文字列の検索を高速に行う検
索装置としては、従来のものに比べ、かなり簡便で索引
の量が非常に少なくて済む。また、検索対象の辞書デー
タをレコード単位に圧縮したので、辞書本体記憶容量を
小さくでき、より小型の記憶容量で装置を実現できる。
特に、文書処理システムに必ずと言っていいほど備えら
れているかな漢字変換用の辞書を効果的に利用し、辞書
のレコード情報をレコード単位に圧縮したので、圧縮効
果が高く、かつレコード情報取り出し時の解凍時間が原
理的に高速に行え、非常に有効である。 (8)請求項7,10に対応する効果:辞書の読み部分
の文字列をかな漢字変換用辞書の見出しの読み部の位置
情報で置き換えたので、辞書の読み部分の効果的な圧縮
ができる。 (9)請求項8,11に対応する効果:辞書の表記部分
の文字列をかな漢字変換用辞書の見出しの表記部の位置
情報で置き換えたので、辞書の表記部分の効果的な圧縮
ができる。 (10)請求項9に対応する効果:辞書の語釈あるいは
解説部分の文字列をかな漢字変換用辞書の見出しの表記
部の位置情報で置き換えたので、辞書の語釈あるいは解
説部分の効果的な圧縮ができる。 (11)請求項10に対応する効果:かな漢字変換用辞
書の見出しの読みが短いものの位置情報は記憶しないよ
うにしたので、より圧縮効果のある文字列部分のみ位置
情報が少ないデータ長で記憶できるため、さらに圧縮効
果が高い。 (12)請求項11に対応する効果:かな漢字変換用辞
書の見出しの表記が短いものの位置情報は記憶しないよ
うにしたので、より圧縮効果のある文字列部分のみ位置
情報が少ないデータ長で記憶できるため、更に圧縮効果
が高い。 (13)請求項12に対応する効果:かな漢字変換用の
辞書見出しの読みあるいは表記に一致しない文字列を、
かな漢字変換用の辞書の位置情報(アドレス情報)に対
応した形で、位置情報と読みあるいは表記と対応づけさ
せた辞書を持つようにしたので、当辞書のアクセスが容
易かつ高速となる。
によると、以下のような効果がある。 (1)請求項1〜4に対応する効果:比較的簡便な方法
で中程度の辞書あるいは辞書に類する文書の検索を頭か
ら総なめして検索する方法に較べ、非常に高速で行うこ
とができる。また、任意文字列の検索を高速に行う検索
装置としては、従来のものに較べかなり簡便で索引の量
が非常に少なくて済む。 (2)請求項1に対応する効果:検索対象の辞書データ
をレコード単位に圧縮したので、辞書本体記憶容量を小
さくでき、より小型の記憶容量で装置を実現できる。 (3)請求項2に対応する効果:各文字を含む行先頭位
置の探索範囲を索引作成時の索引文字位置範囲情報によ
り、行先頭位置決めの際に、不要な探索を防止でき、検
索結果の行の切りだしをより高速化できる。 (4)請求項3に対応する効果:一般に検索キーより圧
縮レコードのデータ長が大きく、検索キーの圧縮は1回
で済むので、圧縮レコードを解凍せずに検索キーと照合
することができ、圧縮レコードを解凍して照合するより
も高速に適合情報が得られる。 (5)請求項4に対応する効果:圧縮辞書の各圧縮レコ
ード位置を記録した索引を設けたので、検索キーに一致
するデータおよびその周辺のデータの取りだし(参照)
を一括して行う場合、取りだし範囲が索引によりあらか
じめ把握できるので、取りだしをより高速に行うことが
できる。 (6)請求項5,6に対応する効果:辞書上の索引作成
の範囲の限定に対応して、圧縮レコードの解凍の範囲を
限定できるので、索引作成の限定がある場合、圧縮レコ
ードの限定範囲外の解凍を省略でき、検索キーとの照合
をより高速に行うことができる。 (7)請求項7〜12に対応する効果:比較的簡便な方
法で中程度の辞書あるいは辞書に類する文書の検索を頭
から総なめして検索する方法に比べ、非常に高速で行う
ことができる。また、任意文字列の検索を高速に行う検
索装置としては、従来のものに比べ、かなり簡便で索引
の量が非常に少なくて済む。また、検索対象の辞書デー
タをレコード単位に圧縮したので、辞書本体記憶容量を
小さくでき、より小型の記憶容量で装置を実現できる。
特に、文書処理システムに必ずと言っていいほど備えら
れているかな漢字変換用の辞書を効果的に利用し、辞書
のレコード情報をレコード単位に圧縮したので、圧縮効
果が高く、かつレコード情報取り出し時の解凍時間が原
理的に高速に行え、非常に有効である。 (8)請求項7,10に対応する効果:辞書の読み部分
の文字列をかな漢字変換用辞書の見出しの読み部の位置
情報で置き換えたので、辞書の読み部分の効果的な圧縮
ができる。 (9)請求項8,11に対応する効果:辞書の表記部分
の文字列をかな漢字変換用辞書の見出しの表記部の位置
情報で置き換えたので、辞書の表記部分の効果的な圧縮
ができる。 (10)請求項9に対応する効果:辞書の語釈あるいは
解説部分の文字列をかな漢字変換用辞書の見出しの表記
部の位置情報で置き換えたので、辞書の語釈あるいは解
説部分の効果的な圧縮ができる。 (11)請求項10に対応する効果:かな漢字変換用辞
書の見出しの読みが短いものの位置情報は記憶しないよ
うにしたので、より圧縮効果のある文字列部分のみ位置
情報が少ないデータ長で記憶できるため、さらに圧縮効
果が高い。 (12)請求項11に対応する効果:かな漢字変換用辞
書の見出しの表記が短いものの位置情報は記憶しないよ
うにしたので、より圧縮効果のある文字列部分のみ位置
情報が少ないデータ長で記憶できるため、更に圧縮効果
が高い。 (13)請求項12に対応する効果:かな漢字変換用の
辞書見出しの読みあるいは表記に一致しない文字列を、
かな漢字変換用の辞書の位置情報(アドレス情報)に対
応した形で、位置情報と読みあるいは表記と対応づけさ
せた辞書を持つようにしたので、当辞書のアクセスが容
易かつ高速となる。
【図1】 本発明による辞書検索装置の一実施例を説明
するための構成図である。
するための構成図である。
【図2】 本発明における辞書の例を示す図である。
【図3】 本発明における索引作成の例を示す図であ
る。
る。
【図4】 本発明における検索方法の概念図を示す図で
ある。
ある。
【図5】 本発明における索引作成した処理の概略フロ
ー(その1)を示す図である。
ー(その1)を示す図である。
【図6】 本発明における検索の処理の概略フロー(そ
の1)を示す図である。
の1)を示す図である。
【図7】 本発明における検索の処理の概略フロー(そ
の2)を示す図である。
の2)を示す図である。
【図8】 本発明における圧縮辞書行位置索引を示す図
である。
である。
【図9】 本発明における索引作成の処理の概略フロー
(その2)を示す図である。
(その2)を示す図である。
【図10】 本発明における検索の処理の概略フロー
(その3)を示す図である。
(その3)を示す図である。
【図11】 本発明における検索の処理の概略フロー
(その4)を示す図である。
(その4)を示す図である。
【図12】 本発明における索引作成データ範囲文字位
置限定指定表の例を示す図である。
置限定指定表の例を示す図である。
【図13】 本発明における索引作成の処理の概略フロ
ー(その3)を示す図である。
ー(その3)を示す図である。
【図14】 本発明における検索の処理の概略フロー
(その5)を示す図である。
(その5)を示す図である。
【図15】 本発明における索引作成データ範囲区切り
記号限定指定表の例(その1)を示す図である。
記号限定指定表の例(その1)を示す図である。
【図16】 本発明における索引作成データ範囲区切り
記号限定指定表の例(その2)を示す図である
記号限定指定表の例(その2)を示す図である
【図17】 本発明における索引作成の処理の概略フロ
ー(その4)を示す図である。
ー(その4)を示す図である。
【図18】 本発明による辞書検索装置の他の実施例を
説明するための構成図である。
説明するための構成図である。
【図19】 本発明における辞書データのレコード単位
の圧縮方法の一実施例を説明するための図である。
の圧縮方法の一実施例を説明するための図である。
【図20】 本発明における圧縮対象辞書の読みの圧縮
データを作成する処理の概略フロー(その1)を示す図
である。
データを作成する処理の概略フロー(その1)を示す図
である。
【図21】 本発明における圧縮対象辞書の読みの圧縮
データを作成する処理の概略フロー(その2)を示す図
である。
データを作成する処理の概略フロー(その2)を示す図
である。
【図22】 本発明における圧縮対象辞書の圧縮データ
から読みを復元する処理の概略フロー(その1)を示す
図である。
から読みを復元する処理の概略フロー(その1)を示す
図である。
【図23】 本発明における圧縮対象辞書の圧縮データ
から読みを復元する処理の概略フロー(その2)を示す
図である。
から読みを復元する処理の概略フロー(その2)を示す
図である。
【図24】 本発明における辞書データのレコード単位
の圧縮方法の他の実施例を説明するための図である。
の圧縮方法の他の実施例を説明するための図である。
【図25】 本発明における圧縮対象辞書の表記の圧縮
データを作成する処理の概略フローを示す図である。
データを作成する処理の概略フローを示す図である。
【図26】 本発明における圧縮対象辞書の圧縮データ
から表記を復元する処理の概略フロー(その1)を示す
図である。
から表記を復元する処理の概略フロー(その1)を示す
図である。
【図27】 本発明における辞書データのレコード単位
の圧縮方法の更に他の実施例を説明するための図であ
る。
の圧縮方法の更に他の実施例を説明するための図であ
る。
【図28】 本発明における圧縮対象辞書の語釈部分の
圧縮データを作成する処理の概略フローを示す図であ
る。
圧縮データを作成する処理の概略フローを示す図であ
る。
【図29】 本発明における圧縮対象辞書の圧縮データ
から語釈を復元する処理の概略フローを示す図である。
から語釈を復元する処理の概略フローを示す図である。
【図30】 本発明における辞書データのレコード単位
の圧縮方法の更に他の実施例を説明するための図であ
る。
の圧縮方法の更に他の実施例を説明するための図であ
る。
【図31】 本発明における圧縮対象辞書の読みの圧縮
データを作成する処理の概略フロー(その3)を示す図
である。
データを作成する処理の概略フロー(その3)を示す図
である。
【図32】 本発明における圧縮対象辞書の圧縮データ
から読みを復元する処理の概略フロー(その3)を示す
図である。
から読みを復元する処理の概略フロー(その3)を示す
図である。
【図33】 本発明における辞書データのレコード単位
の圧縮方法の更に他の実施例を説明するための図であ
る。
の圧縮方法の更に他の実施例を説明するための図であ
る。
【図34】 本発明における圧縮対象辞書の表記の圧縮
データを作成する処理の概略フロー(その2)を示す図
である。
データを作成する処理の概略フロー(その2)を示す図
である。
【図35】 本発明における圧縮対象辞書の圧縮データ
から表記を復元する処理の概略フロー(その2)を示す
図である。
から表記を復元する処理の概略フロー(その2)を示す
図である。
【図36】 本発明における辞書データのレコード単位
の圧縮方法の更に他の実施例を説明するための図であ
る。
の圧縮方法の更に他の実施例を説明するための図であ
る。
【図37】 本発明における圧縮対象辞書の表記の圧縮
データを作成する処理の概略フロー(その3)を示す図
である。
データを作成する処理の概略フロー(その3)を示す図
である。
【図38】 本発明における圧縮対象辞書の圧縮データ
から表記を復元する処理の概略フロー(その3)を示す
図である。
から表記を復元する処理の概略フロー(その3)を示す
図である。
1…表示部、2…入力部、3…外部記憶部、4…印刷
部、5…制御部、6…入力/編集制御部、7…辞書検索
支援部、8…出力制御部、9…辞書検索制御部、10…
辞書索引検索制御部、11…辞書本体検索制御部、12
…出力表示制御部、13…設定情報管理表、14…辞書
索引、15…辞書本体、16…KKC辞書検索制御部、
17…KKC辞書本体。
部、5…制御部、6…入力/編集制御部、7…辞書検索
支援部、8…出力制御部、9…辞書検索制御部、10…
辞書索引検索制御部、11…辞書本体検索制御部、12
…出力表示制御部、13…設定情報管理表、14…辞書
索引、15…辞書本体、16…KKC辞書検索制御部、
17…KKC辞書本体。
Claims (12)
- 【請求項1】 読みまたは表記を有するデータあるいは
そのほかの情報がレコード単位で収納されている辞書の
検索を行う辞書検索装置において、辞書データを任意の
方式でレコード単位で圧縮する圧縮手段と、辞書データ
を前記圧縮手段により圧縮した圧縮辞書データと、検索
キーの対象となる読みまたは表記の各文字と、圧縮辞書
上のレコード位置を関連づけた索引である1文字索引を
有し、検索キーを指定すると、該検索キー中の文字を抽
出する文字抽出手段と、該文字抽出手段により抽出され
た文字を含む圧縮辞書上の圧縮レコード位置を抽出する
位置抽出手段と、該位置抽出手段により抽出された位置
の圧縮辞書上の圧縮レコードを元の辞書レコードに解凍
し、該辞書レコードと検索キーと比較する比較手段と、
検索キーに適合するレコードを抽出表示する表示手段と
を有することを特徴とする辞書検索装置。 - 【請求項2】 前記文字索引は、各文字別にソートさ
れ、圧縮辞書上の圧縮レコード位置を登録した索引と、
該索引の文字別のブロック先頭位置を登録した索引から
なることを特徴とする請求項1記載の辞書検索装置。 - 【請求項3】 前記辞書レコードと検索キーと比較の際
に、検索キーを圧縮辞書と同様な方法で圧縮した圧縮検
索キーとし、圧縮レコードと圧縮検索キーとを比較し、
検索キーに適合するレコードを抽出表示することを特徴
とする請求項1記載の辞書検索装置。 - 【請求項4】 前記圧縮辞書の各圧縮レコード位置を記
録した索引を設けることを特徴とする請求項1記載の辞
書検索装置。 - 【請求項5】 前記辞書上の各レコードの索引作成の範
囲の限定を文字位置で指定し、かつ検索の際の圧縮レコ
ードの解凍の範囲をその範囲に限定することを特徴とす
る請求項1記載の辞書検索装置。 - 【請求項6】 前記辞書上の各レコードの索引作成の範
囲の限定を区切り記号で指定し、かつ検索の際の圧縮レ
コードの解凍の範囲をその範囲に限定することを特徴と
する請求項1記載の辞書検索装置。 - 【請求項7】 前記辞書レコードの読みを文書入力用の
かな漢字変換用辞書の見出しの読み位置を記憶すること
により圧縮することを特徴とする請求項1記載の辞書検
索装置。 - 【請求項8】 前記辞書レコードの表記を文書入力用の
かな漢字変換用辞書の見出し表記の位置を記憶すること
により圧縮することを特徴とする請求項1記載の辞書検
索装置。 - 【請求項9】 前記辞書レコードの語釈あるいは解説部
分を文書入力用のかな漢字変換用辞書の表記の位置を記
憶することにより圧縮することを特徴とする請求項1記
載の辞書検索装置。 - 【請求項10】 前記文書入力用のかな漢字変換用辞書
の読みが短い見出しは記憶しないようにすることを特徴
とする請求項7記載の辞書検索装置。 - 【請求項11】 前記文書入力用のかな漢字変換用辞書
の表記が短い見出しは記憶しないようにすることを特徴
とする請求項8又は9記載の辞書検索装置。 - 【請求項12】 前記かな漢字変換用辞書に該当しない
読みまたは表記については、かな漢字変換用辞書のアド
レス情報に対応した辞書を持つことを特徴とする請求項
7〜11のいずれか1項に記載の辞書検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6202342A JPH07287716A (ja) | 1994-02-22 | 1994-08-26 | 辞書検索装置 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2413394 | 1994-02-22 | ||
| JP6-24133 | 1994-08-10 | ||
| JP6202342A JPH07287716A (ja) | 1994-02-22 | 1994-08-26 | 辞書検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07287716A true JPH07287716A (ja) | 1995-10-31 |
Family
ID=26361619
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6202342A Pending JPH07287716A (ja) | 1994-02-22 | 1994-08-26 | 辞書検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07287716A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10319990A (ja) * | 1997-05-20 | 1998-12-04 | Denso Corp | 単語辞書データの圧縮方法、単語辞書データの展開方法、音声認識装置、音声認識機能付きナビゲーションシステム及び記録媒体 |
| JP2010508606A (ja) * | 2006-11-01 | 2010-03-18 | アビニシオ テクノロジー エルエルシー | 個別にアクセス可能なデータユニットの格納管理 |
| US8489553B2 (en) | 2006-11-01 | 2013-07-16 | Ab Initio Technology Llc | Managing storage of individually accessible data units |
| EP3118755A1 (en) | 2015-07-13 | 2017-01-18 | Fujitsu Limited | Searching program, searching method, and searching device |
| EP3119003A2 (en) | 2015-07-13 | 2017-01-18 | Fujitsu Limited | Encoding computer program, encoding method, encoding apparatus, decoding computer program, decoding method, and decoding apparatus |
| US9811570B2 (en) | 2011-07-08 | 2017-11-07 | Ab Initio Technology Llc | Managing storage of data for range-based searching |
| CN112527949A (zh) * | 2020-12-15 | 2021-03-19 | 建信金融科技有限责任公司 | 数据存储与检索方法、装置、计算机设备及存储介质 |
-
1994
- 1994-08-26 JP JP6202342A patent/JPH07287716A/ja active Pending
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10319990A (ja) * | 1997-05-20 | 1998-12-04 | Denso Corp | 単語辞書データの圧縮方法、単語辞書データの展開方法、音声認識装置、音声認識機能付きナビゲーションシステム及び記録媒体 |
| JP2010508606A (ja) * | 2006-11-01 | 2010-03-18 | アビニシオ テクノロジー エルエルシー | 個別にアクセス可能なデータユニットの格納管理 |
| US8489553B2 (en) | 2006-11-01 | 2013-07-16 | Ab Initio Technology Llc | Managing storage of individually accessible data units |
| US8639674B2 (en) | 2006-11-01 | 2014-01-28 | Ab Initio Technology Llc | Managing storage of individually accessible data units |
| US8949189B2 (en) | 2006-11-01 | 2015-02-03 | Ab Initio Technology Llc | Managing storage of individually accessible data units |
| US9811570B2 (en) | 2011-07-08 | 2017-11-07 | Ab Initio Technology Llc | Managing storage of data for range-based searching |
| EP3118755A1 (en) | 2015-07-13 | 2017-01-18 | Fujitsu Limited | Searching program, searching method, and searching device |
| EP3119003A2 (en) | 2015-07-13 | 2017-01-18 | Fujitsu Limited | Encoding computer program, encoding method, encoding apparatus, decoding computer program, decoding method, and decoding apparatus |
| US20170017707A1 (en) | 2015-07-13 | 2017-01-19 | Fujitsu Limited | Non-transitory computer-readable recording medium, searching method, and searching device |
| US9779071B2 (en) | 2015-07-13 | 2017-10-03 | Fujitsu Limited | Non-transitory computer-readable recording medium, encoding method, encoding apparatus, decoding method, and decoding apparatus |
| US10664491B2 (en) | 2015-07-13 | 2020-05-26 | Fujitsu Limited | Non-transitory computer-readable recording medium, searching method, and searching device |
| CN112527949A (zh) * | 2020-12-15 | 2021-03-19 | 建信金融科技有限责任公司 | 数据存储与检索方法、装置、计算机设备及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5992737A (en) | Information search method and apparatus, and medium for storing information searching program | |
| JPS6244878A (ja) | 文書フアイリングシステム | |
| US20040225497A1 (en) | Compressed yet quickly searchable digital textual data format | |
| US5560037A (en) | Compact hyphenation point data | |
| JP3689954B2 (ja) | 異種コード文字列転記装置および電子辞書 | |
| JPH07287716A (ja) | 辞書検索装置 | |
| JPH05324730A (ja) | 文書情報検索装置 | |
| JP2848729B2 (ja) | 翻訳方法および翻訳装置 | |
| JP3780556B2 (ja) | 自然言語事例検索装置及び自然言語事例検索方法 | |
| JPH07182354A (ja) | 電子文書の作成方法 | |
| JPH06223107A (ja) | 辞書検索装置 | |
| JP2560656B2 (ja) | 文書ファイリングシステム | |
| CN101331483A (zh) | 用于操纵数据文件的方法和设备 | |
| JPH01214963A (ja) | 辞書引き装置 | |
| JPS6175952A (ja) | 文書入力処理方式 | |
| JPH0954781A (ja) | 文書検索システム | |
| JPH06266765A (ja) | 文章検索装置 | |
| JPH0816617A (ja) | 文書検索方法及び装置 | |
| JP2967995B2 (ja) | 文書処理装置および文書処理方法 | |
| JP2001202388A (ja) | フルテキストサーチ方法および装置 | |
| JPS61156465A (ja) | 文書作成方式 | |
| JPH01260531A (ja) | 文書検索装置 | |
| JPH04253262A (ja) | フリガナ付加方式 | |
| JPS60256853A (ja) | データ検索装置および方法 | |
| JPH09153038A (ja) | 文書作成装置 |