JPH0523458B2 - - Google Patents
Info
- Publication number
- JPH0523458B2 JPH0523458B2 JP61015342A JP1534286A JPH0523458B2 JP H0523458 B2 JPH0523458 B2 JP H0523458B2 JP 61015342 A JP61015342 A JP 61015342A JP 1534286 A JP1534286 A JP 1534286A JP H0523458 B2 JPH0523458 B2 JP H0523458B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- user
- area
- words
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】
<産業上の利用分野>
本発明は電子辞書に関し、特にその中のユーザ
辞書の改良に関する。
辞書の改良に関する。
<従来の技術>
単語情報を取り扱う計算機システム、ワードプ
ロセツサあるいは電子タイプライタ等において
は、入力した単語の綴りに誤りがないかどうかを
チエツクするために電子辞書を備えている。この
電子辞書は、メイン辞書とユーザ辞書からなり、
メイン辞書はシステムがあらかじめ供給した単語
情報を保持し、ユーザ辞書はユーザが登録した単
語情報を保持する。
ロセツサあるいは電子タイプライタ等において
は、入力した単語の綴りに誤りがないかどうかを
チエツクするために電子辞書を備えている。この
電子辞書は、メイン辞書とユーザ辞書からなり、
メイン辞書はシステムがあらかじめ供給した単語
情報を保持し、ユーザ辞書はユーザが登録した単
語情報を保持する。
通常のスペルチエツクは、第6図に示すよう
に、メイン辞書に当該単語情報と同じ情報が有る
かどうか検索し、同じ情報が無ければユーザ辞書
に同じ単語情報が有るかどうか検索し、メイン辞
書またはユーザ辞書に同じ単語情報が有るときは
綴りは正しく無いときは綴りは誤りであることを
判断する。
に、メイン辞書に当該単語情報と同じ情報が有る
かどうか検索し、同じ情報が無ければユーザ辞書
に同じ単語情報が有るかどうか検索し、メイン辞
書またはユーザ辞書に同じ単語情報が有るときは
綴りは正しく無いときは綴りは誤りであることを
判断する。
<発明が解決しようとする問題点>
上述のスペルチエツクにおいて、メイン辞書の
データ構造が良くて処理が速くても、ユーザ辞書
の処理に時間がかかつては、全体として処理は遅
くなる。ユーザ辞書は、メイン辞書と違つてシス
テムが供給するものではなく、ユーザが自由に単
語を登録できるようにしているので、それなりの
対応性を持たなくてはならない。すなわち、メイ
ン辞書と同じように高速処理が実現でき、なお且
つユーザ辞書に登録されている単語情報を自由に
リスト出力できることが必要である。ユーザ辞書
の領域は限られているので、データ領域が満了に
なつた場合、どの単語情報を削除するかはリスト
がないと判別できない。
データ構造が良くて処理が速くても、ユーザ辞書
の処理に時間がかかつては、全体として処理は遅
くなる。ユーザ辞書は、メイン辞書と違つてシス
テムが供給するものではなく、ユーザが自由に単
語を登録できるようにしているので、それなりの
対応性を持たなくてはならない。すなわち、メイ
ン辞書と同じように高速処理が実現でき、なお且
つユーザ辞書に登録されている単語情報を自由に
リスト出力できることが必要である。ユーザ辞書
の領域は限られているので、データ領域が満了に
なつた場合、どの単語情報を削除するかはリスト
がないと判別できない。
第7図はHash法のみを用いたユーザ辞書の構
造を示す。Hash法では、ユーザが登録する単語
情報を数値データとHashすなわちデータブロツ
ク長を一定にするための無意味情報とを組み合わ
せて登録する。このユーザ辞書では、インデツク
スはHashにより平均的にデータが割り振られて
データを検索する速度は速いが、データ部が満了
になつた場合や、現在登録されている単語を確認
したい場合に、元の単語を再生し直すのは困難で
ある。また、ユーザ辞書に登録する単語が偶然に
もHash値が同じ場合の対処が問題である。同じ
Hash値などの兼用するとすれば、今度削除する
ときにどちらを削除するのか残すのかがわからな
い。
造を示す。Hash法では、ユーザが登録する単語
情報を数値データとHashすなわちデータブロツ
ク長を一定にするための無意味情報とを組み合わ
せて登録する。このユーザ辞書では、インデツク
スはHashにより平均的にデータが割り振られて
データを検索する速度は速いが、データ部が満了
になつた場合や、現在登録されている単語を確認
したい場合に、元の単語を再生し直すのは困難で
ある。また、ユーザ辞書に登録する単語が偶然に
もHash値が同じ場合の対処が問題である。同じ
Hash値などの兼用するとすれば、今度削除する
ときにどちらを削除するのか残すのかがわからな
い。
第8図はHash値を使用せずに文字列を使用し
た例である。このように単に文字列だけを並べた
場合、単語の長さごとに文字を比較するわけであ
るが、ユーザ領域にどのような単語が登録されて
いるかはわかる反面、スペルチエツクの場合に単
語の比較になるのでどうしても処理が遅くなる。
これをカバーするために、ユーザ領域にある単語
を頻度順や最新に使用した順番に並べる方法がと
られることもあるが、実際に誤綴りの単語が入力
された場合、やはりユーザ領域の最後まで検索す
るので時間がかかつてしまう。また、第9図に示
すようにHashを用いないインデツクス例えば単
語の頭文字や単語の長さからインデツクスを構成
したとしても、Hashを用いたインデツクスのよ
うに平均的にデータが割り振られない(cやsで
始まる8文字単語は多いが、zやxで始まる8文
字単語はほとんど皆無であるので)から、単語に
よつてはHash法を用いた場合より検索に時間が
かかる。
た例である。このように単に文字列だけを並べた
場合、単語の長さごとに文字を比較するわけであ
るが、ユーザ領域にどのような単語が登録されて
いるかはわかる反面、スペルチエツクの場合に単
語の比較になるのでどうしても処理が遅くなる。
これをカバーするために、ユーザ領域にある単語
を頻度順や最新に使用した順番に並べる方法がと
られることもあるが、実際に誤綴りの単語が入力
された場合、やはりユーザ領域の最後まで検索す
るので時間がかかつてしまう。また、第9図に示
すようにHashを用いないインデツクス例えば単
語の頭文字や単語の長さからインデツクスを構成
したとしても、Hashを用いたインデツクスのよ
うに平均的にデータが割り振られない(cやsで
始まる8文字単語は多いが、zやxで始まる8文
字単語はほとんど皆無であるので)から、単語に
よつてはHash法を用いた場合より検索に時間が
かかる。
<問題点を解決する為の手段>
本発明による電子辞書は、システムがあらかじ
め供給した単語情報を保持するメイン辞書と、ユ
ーザが登録した単語情報を保持するユーザ辞書と
を備え、オペレータが入力した単語の綴りのチエ
ツクを、上記両辞書を参照することにより行う機
能を備えた電子辞書であつて、上記ユーザ辞書は
オペレータが登録した単語をハツシユ法を用いた
数値データで記憶する第1のエリアと、その単語
を文字データで記憶する第2のエリアとにより構
成されるとともに、上記第1のエリアはスペルチ
エツクの参照用とし、かつ、上記第2のエリアは
オペレータの確認用としたことによつて特徴付け
られている。ことを特徴とする。
め供給した単語情報を保持するメイン辞書と、ユ
ーザが登録した単語情報を保持するユーザ辞書と
を備え、オペレータが入力した単語の綴りのチエ
ツクを、上記両辞書を参照することにより行う機
能を備えた電子辞書であつて、上記ユーザ辞書は
オペレータが登録した単語をハツシユ法を用いた
数値データで記憶する第1のエリアと、その単語
を文字データで記憶する第2のエリアとにより構
成されるとともに、上記第1のエリアはスペルチ
エツクの参照用とし、かつ、上記第2のエリアは
オペレータの確認用としたことによつて特徴付け
られている。ことを特徴とする。
<実施例>
第1図は本実施例のユーザ辞書の構造を示す。
このユーザ辞書1は、インデツクス部2、ユーザ
が登録した単語をHash法を用いた数値データで
記憶するエリアからなるデータ部3、並びに、上
記単語を文字データで記憶するエリアからなるデ
ータ部4により構成される。
このユーザ辞書1は、インデツクス部2、ユーザ
が登録した単語をHash法を用いた数値データで
記憶するエリアからなるデータ部3、並びに、上
記単語を文字データで記憶するエリアからなるデ
ータ部4により構成される。
第2図はこのユーザ辞書1を用いた計算機シス
テムの構成を示す。入力装置5は、文字や単語の
情報を記憶装置6に入力するための装置であり、
例えば鍵盤装置、タブレツト装置、OCR、磁気
テープ装置等からなる。記憶装置6は、入力装置
5から入力された文字や単語の情報を保存する領
域であり、例えばコアメモリ、ICメモリ、磁気
デイスク等からなる。出力装置7は、記憶装置6
において保存・編集された結果の情報を出力する
装置であり、例えばプリンタ、デイスプレイ装
置、磁気テープ装置、磁気デイスク装置等からな
る。スペルチエツク辞書装置8は、記憶装置6に
格納されている文字や単語の綴り情報の問い合わ
せに対して適宜有効な情報を供給するための辞書
領域であり、メイン辞書(図示せず)及び上述の
ユーザ辞書1から構成される。このスペルチエツ
ク辞書装置8は、例えばコアメモリ、ICメモリ、
ROM、磁気デイスク等からなる。制御装置9
は、以上の構成要素間の信号及びデータのやりと
りを制御するコンピユータからなる。
テムの構成を示す。入力装置5は、文字や単語の
情報を記憶装置6に入力するための装置であり、
例えば鍵盤装置、タブレツト装置、OCR、磁気
テープ装置等からなる。記憶装置6は、入力装置
5から入力された文字や単語の情報を保存する領
域であり、例えばコアメモリ、ICメモリ、磁気
デイスク等からなる。出力装置7は、記憶装置6
において保存・編集された結果の情報を出力する
装置であり、例えばプリンタ、デイスプレイ装
置、磁気テープ装置、磁気デイスク装置等からな
る。スペルチエツク辞書装置8は、記憶装置6に
格納されている文字や単語の綴り情報の問い合わ
せに対して適宜有効な情報を供給するための辞書
領域であり、メイン辞書(図示せず)及び上述の
ユーザ辞書1から構成される。このスペルチエツ
ク辞書装置8は、例えばコアメモリ、ICメモリ、
ROM、磁気デイスク等からなる。制御装置9
は、以上の構成要素間の信号及びデータのやりと
りを制御するコンピユータからなる。
以下、作用について説明する。
スペルチエツクを行なう場合は、Hash法によ
り当該単語のHash値を算出し、インデツクス部
2より当該データを高速で検索する。
り当該単語のHash値を算出し、インデツクス部
2より当該データを高速で検索する。
ユーザ辞書1の単語情報の登録、削除、リスト
出力には、データ部4を主に使用する。
出力には、データ部4を主に使用する。
ユーザ辞書1に単語を登録する場合は、第3図
に示すように、まずメイン辞書に同じ単語情報が
有るかうどうか検索し(ステツプ#11)、無けれ
ばユーザ辞書1のデータ部4に同じ単語情報が有
るかどうか検索する(ステツプ#12)。メイン辞
書またはデータ部4に同じ単語情報が有るとき
は、エラーになる。同じ単語情報が無いときは、
当該単語情報についてHash値を作成し(ステツ
プ#13)、作成したHash値と同じHash値がデー
タ部3に有るかどうか検索する(ステツプ#14)。
同じHash値が有るときは、2重フラグをONす
る(ステツプ#15)。Hash値は27ビツトで表わさ
れ、その前半の5ビツトでインデツクスを構成し
ているため、データ部分は22ビツトで表現され
る。しかし、実際は、ユーザ辞書1のデータ部3
は3バイトで格納されるので、2ビツトの余裕が
ある。そこで、2ビツトのうちの1ビツトがON
になつていれば、それは2重にHash値が使用さ
れていることを表わすものとする。以上の処理の
後、インデツクスのカウントアツプ、Hash値の
セツト並びにデータ部4に文字データの追加を行
ない、単語情報の登録を完了する(ステツプ
#16)。
に示すように、まずメイン辞書に同じ単語情報が
有るかうどうか検索し(ステツプ#11)、無けれ
ばユーザ辞書1のデータ部4に同じ単語情報が有
るかどうか検索する(ステツプ#12)。メイン辞
書またはデータ部4に同じ単語情報が有るとき
は、エラーになる。同じ単語情報が無いときは、
当該単語情報についてHash値を作成し(ステツ
プ#13)、作成したHash値と同じHash値がデー
タ部3に有るかどうか検索する(ステツプ#14)。
同じHash値が有るときは、2重フラグをONす
る(ステツプ#15)。Hash値は27ビツトで表わさ
れ、その前半の5ビツトでインデツクスを構成し
ているため、データ部分は22ビツトで表現され
る。しかし、実際は、ユーザ辞書1のデータ部3
は3バイトで格納されるので、2ビツトの余裕が
ある。そこで、2ビツトのうちの1ビツトがON
になつていれば、それは2重にHash値が使用さ
れていることを表わすものとする。以上の処理の
後、インデツクスのカウントアツプ、Hash値の
セツト並びにデータ部4に文字データの追加を行
ない、単語情報の登録を完了する(ステツプ
#16)。
ユーザ辞書1から単語を削除する場合は、第4
図に示すように、まずユーザ辞書1に当該単語の
文字データが有るかどうか検索し(ステツプ
#21)、文字データが有るときはデータ部4から
この文字データを削除する(ステツプ#22)。次
に、当該単語についてHash値を作成(ステツプ
#23)、データ部3の同じHash値に2重フラグが
ONしているかどうか検索する(ステツプ#24)。
2重フラグがONしていなければ、このHash値
を削除し(ステツプ#25)、インデツクスをカウ
ントダウンする(ステツプ#29)。一方、2重フ
ラグがONしていると、ユーザ辞書1の全ての単
語についてHash法によりHash値を算出して同じ
Hash値がまだ複数個有るかどうか検察し(ステ
ツプ#26、#27)、複数個有るときはそのままイ
ンデツクスをカウントダウンし(ステツプ#29)、
1個だけなら2重フラグをOFFにして(ステツ
プ#28)、インデツクスをカウントダウンする
(ステツプ#29)。
図に示すように、まずユーザ辞書1に当該単語の
文字データが有るかどうか検索し(ステツプ
#21)、文字データが有るときはデータ部4から
この文字データを削除する(ステツプ#22)。次
に、当該単語についてHash値を作成(ステツプ
#23)、データ部3の同じHash値に2重フラグが
ONしているかどうか検索する(ステツプ#24)。
2重フラグがONしていなければ、このHash値
を削除し(ステツプ#25)、インデツクスをカウ
ントダウンする(ステツプ#29)。一方、2重フ
ラグがONしていると、ユーザ辞書1の全ての単
語についてHash法によりHash値を算出して同じ
Hash値がまだ複数個有るかどうか検察し(ステ
ツプ#26、#27)、複数個有るときはそのままイ
ンデツクスをカウントダウンし(ステツプ#29)、
1個だけなら2重フラグをOFFにして(ステツ
プ#28)、インデツクスをカウントダウンする
(ステツプ#29)。
ユーザ辞書1に登録してある単語情報をリスト
出力する場合は、第5図に示すように、ユーザ辞
書1のデータ部4に当該文字データが有るかどう
か検索し(ステツプ#31)、文字データが有ると
きはこの文字データを出力装置7へ送る(ステツ
プ#32)。データ部4は、頭文字がアルフアベツ
ト順に単語情報を保持するので、リストを見易く
出力できる。
出力する場合は、第5図に示すように、ユーザ辞
書1のデータ部4に当該文字データが有るかどう
か検索し(ステツプ#31)、文字データが有ると
きはこの文字データを出力装置7へ送る(ステツ
プ#32)。データ部4は、頭文字がアルフアベツ
ト順に単語情報を保持するので、リストを見易く
出力できる。
<発明の効果>
以上説明したように本発明においては、ユーザ
辞書を登録した単語をハツシユ法を用いた数値デ
ータで記憶する第1のエリアと、その単語を文字
データで記憶する第2のエリアとにより構成し、
その第1のエリアはスペルチエツクの参照用と
し、また第2のエリアはオペレータの確認用に用
いるよう構成したから、ユーザ辞書に対してスペ
ルチエツクのときはHash値を利用して高速処理
が可能になるとともに、登録、削除、リスト出力
等の高速を必要としない処理のときは文字データ
を利用することにより対応でき、電子辞書の機能
を高めることができる。
辞書を登録した単語をハツシユ法を用いた数値デ
ータで記憶する第1のエリアと、その単語を文字
データで記憶する第2のエリアとにより構成し、
その第1のエリアはスペルチエツクの参照用と
し、また第2のエリアはオペレータの確認用に用
いるよう構成したから、ユーザ辞書に対してスペ
ルチエツクのときはHash値を利用して高速処理
が可能になるとともに、登録、削除、リスト出力
等の高速を必要としない処理のときは文字データ
を利用することにより対応でき、電子辞書の機能
を高めることができる。
第1図は本発明実施例のユーザ辞書の構造を示
す図、第2図は本発明を適用した計算機システム
の構成を示すブロツク図、第3図、第4図並びに
第5図は本発明実施例の処理手順を示すフローチ
ヤート、第6図はスペルチエツクの処理手順を示
すフローチヤート、第7図、第8図並びに第9図
は従来例のユーザ辞書の構造を示す図である。 1……ユーザ辞書、2……インデツクス、3,
4……データ部。
す図、第2図は本発明を適用した計算機システム
の構成を示すブロツク図、第3図、第4図並びに
第5図は本発明実施例の処理手順を示すフローチ
ヤート、第6図はスペルチエツクの処理手順を示
すフローチヤート、第7図、第8図並びに第9図
は従来例のユーザ辞書の構造を示す図である。 1……ユーザ辞書、2……インデツクス、3,
4……データ部。
Claims (1)
- 1 システムがあらかじめ供給した単語情報を保
持するメイン辞書と、ユーザが登録した単語情報
を保持するユーザ辞書とを備え、オペレータが入
力した単語の綴りのチエツクを、上記両辞書を参
照することにより行う機能を備えた電子辞書であ
つて、上記ユーザ辞書はオペレータが登録した単
語をハツシユ法を用いた数値データで記憶する第
1のエリアと、その単語を文字データで記憶する
第2のエリアとにより構成されるとともに、上記
第1のエリアはスペルチエツクの参照用とし、か
つ上記第2のエリアはオペレータの確認用とした
ことを特徴とする電子辞書。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61015342A JPS62173568A (ja) | 1986-01-27 | 1986-01-27 | 電子辞書 |
| US07/646,358 US5297038A (en) | 1985-09-27 | 1991-01-25 | Electronic dictionary and method of codifying words therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61015342A JPS62173568A (ja) | 1986-01-27 | 1986-01-27 | 電子辞書 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62173568A JPS62173568A (ja) | 1987-07-30 |
| JPH0523458B2 true JPH0523458B2 (ja) | 1993-04-02 |
Family
ID=11886116
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61015342A Granted JPS62173568A (ja) | 1985-09-27 | 1986-01-27 | 電子辞書 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62173568A (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS55954A (en) * | 1978-06-20 | 1980-01-07 | Nippon Telegr & Teleph Corp <Ntt> | Data retrieval system |
-
1986
- 1986-01-27 JP JP61015342A patent/JPS62173568A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS62173568A (ja) | 1987-07-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS619753A (ja) | 文書処理装置における頻発熟語の自動登録方法 | |
| GB2259596A (en) | Compressed language dictionary | |
| JPH07114568A (ja) | データ検索装置 | |
| JPS6359660A (ja) | 情報処理装置 | |
| US5682543A (en) | Dictionary editing apparatus | |
| JPH0523458B2 (ja) | ||
| EP0539965B1 (en) | An electronic dictionary including a pointer file and a word information correction file | |
| JP2000331023A (ja) | 情報検索装置及び情報検索処理プログラムを記憶した記憶媒体 | |
| JPH05250416A (ja) | データベースの登録・検索装置 | |
| JP3187671B2 (ja) | 電子辞書表示装置 | |
| JP2634926B2 (ja) | かな漢字変換装置 | |
| JPS61265633A (ja) | 発音記号による辞書検索処理方式 | |
| JPH0310369A (ja) | 辞書作成支援装置 | |
| JPH0731315Y2 (ja) | 電子機器 | |
| JPH09204433A (ja) | キーワード設定装置 | |
| JP3305343B2 (ja) | 辞書編集装置 | |
| JPH0567146A (ja) | データ編集装置 | |
| JPS6198475A (ja) | 日本語文章入力装置 | |
| JPH0623973B2 (ja) | 文字処理装置の頻度変更方式 | |
| JPS63229563A (ja) | 索引作成方式 | |
| JPH0330048A (ja) | 文字入力装置 | |
| JPS6210762A (ja) | 仮名漢字変換方式 | |
| JPS60166070A (ja) | 情報入力方式 | |
| JPH0371370A (ja) | 英単語検索装置 | |
| JPS6162137A (ja) | 単語検索装置 |