JPH0646423B2 - 単語辞書照合装置 - Google Patents
単語辞書照合装置Info
- Publication number
- JPH0646423B2 JPH0646423B2 JP61235610A JP23561086A JPH0646423B2 JP H0646423 B2 JPH0646423 B2 JP H0646423B2 JP 61235610 A JP61235610 A JP 61235610A JP 23561086 A JP23561086 A JP 23561086A JP H0646423 B2 JPH0646423 B2 JP H0646423B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- read
- dictionary
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、入力された読取文字列を単語辞書内の登録内
容と照合して該読取文字列を認識する単語辞書照合装置
に関する。
容と照合して該読取文字列を認識する単語辞書照合装置
に関する。
第3図はこの種の単語照合装置の従来例を示すブロック
図である。
図である。
入力レジスタ31は文字読取機(不図示)から読取られた
文字列を入力して記憶し、さらに語長テーブルポインタ
32へ転送する。語長テーブルポインタ32は読取文字列を
その中に含まれる単語列の語長(文字数)ごとに分類
し、さらにこれを単語辞書に適合するコードに変換す
る。単語辞書読取部33は該コードを入力してこのコード
を用いて単語辞書34に読出し指令を出し、単語辞書34か
ら該コードに対応する文字列を読出すとともに、入力レ
ジスタ31内に記憶されている読取文字列と揃えて単語照
合部35へ出力する。単語照合部35は単語辞書読出部33か
ら入力された両文字列が一致するかどうかを照合する。
文字列を入力して記憶し、さらに語長テーブルポインタ
32へ転送する。語長テーブルポインタ32は読取文字列を
その中に含まれる単語列の語長(文字数)ごとに分類
し、さらにこれを単語辞書に適合するコードに変換す
る。単語辞書読取部33は該コードを入力してこのコード
を用いて単語辞書34に読出し指令を出し、単語辞書34か
ら該コードに対応する文字列を読出すとともに、入力レ
ジスタ31内に記憶されている読取文字列と揃えて単語照
合部35へ出力する。単語照合部35は単語辞書読出部33か
ら入力された両文字列が一致するかどうかを照合する。
このようにして、単語照合部35は両文字列が一致したと
き、そのコードをもって当該読取文字列のコードとして
出力する。
き、そのコードをもって当該読取文字列のコードとして
出力する。
上述した従来の単語照合装置では、単語を構成する文字
数が多くなればなるほど1文字当りのビット数が増大す
るので、単語辞書の容量と照合時間が増大するという欠
点がある。
数が多くなればなるほど1文字当りのビット数が増大す
るので、単語辞書の容量と照合時間が増大するという欠
点がある。
本発明の単語辞書照合装置は、読出文字中に予め定めら
れた出現頻度の低い文字を含まないときは、前記読取文
字列の一致を確認したとき該読取文字またはこれを代表
するコードを出力し、読取文字中に予め定められた出現
頻度の低い文字を含むときは、該文字を予め定められた
単一コードに変換した文字列として同様に辞書を検索
し、該文字列の一致を確認したとき辞書内の該文字列に
格納されているポインタ情報を出力する第1の照合手段
と、第1の照合手段から入力された前記ポインタ情報
と、前記文字読取機から入力された読取文字列中の該ポ
インタ情報に示された出現頻度を低い文字とから、予め
出現頻度の低い文字を含む文字列を格納している第2の
辞書を検索照合して、読取文字列の一致を確認したとき
該読取文字またはこれを代表するコードを出力する第2
の照合手段を有している。
れた出現頻度の低い文字を含まないときは、前記読取文
字列の一致を確認したとき該読取文字またはこれを代表
するコードを出力し、読取文字中に予め定められた出現
頻度の低い文字を含むときは、該文字を予め定められた
単一コードに変換した文字列として同様に辞書を検索
し、該文字列の一致を確認したとき辞書内の該文字列に
格納されているポインタ情報を出力する第1の照合手段
と、第1の照合手段から入力された前記ポインタ情報
と、前記文字読取機から入力された読取文字列中の該ポ
インタ情報に示された出現頻度を低い文字とから、予め
出現頻度の低い文字を含む文字列を格納している第2の
辞書を検索照合して、読取文字列の一致を確認したとき
該読取文字またはこれを代表するコードを出力する第2
の照合手段を有している。
このようにして、出現頻度の高い文字のみで構成された
読取文字列は出現頻度の高い文字のみで構成された容量
の小さい辞書で検索照合するので、従来例のような容量
の大きい辞書について検索照合する場合に比べて処理時
間が小さく、読取文字列に出現頻度の低い文字を含む場
合に2回照合したとしても総合的に処理時間を節約でき
る。
読取文字列は出現頻度の高い文字のみで構成された容量
の小さい辞書で検索照合するので、従来例のような容量
の大きい辞書について検索照合する場合に比べて処理時
間が小さく、読取文字列に出現頻度の低い文字を含む場
合に2回照合したとしても総合的に処理時間を節約でき
る。
本発明の実施例について図面を参照して説明する。
第1図は本発明の単語辞書照合装置の一実施例の構成を
示すブロック図、第2図は本実施例で照合される住所例
を示す図である。
示すブロック図、第2図は本実施例で照合される住所例
を示す図である。
本実施例は郵便物の宛名住所を予め作成された住所辞書
と照合して確認するもので、文字読取機3は入力された
文字列のうち対象とする住所部分を読取って、第1の読
取文字列としてレジスタ4に出力する。レジスタ4は入
力された第1の読取文字列を第1の照合手段1と第2の
照合手段2へそれぞれ出力する。第1の照合手段1は索
引テーブルポインタ11と辞書読出部12と辞書部13と照合
部14とから構成され、出現頻度の高い文字のみよりなる
文字列(住所)を照合出力し、もし文字列中に出現頻度
の低い文字が含まれているときは、その照合を第2の照
合手段に行なわせる。索引テーブルポインタ11は、レジ
スタ4から入力された第1の読取文字列の文字中に、予
め定められている出現頻度の低い文字があれば該文字を
予め定められた単一コードで置換し、なければそのまゝ
で、いずれの場合も第2の読取文字列として出力する。
辞書読出部12は第2の読出文字列を入力してそのうちに
含まれる単語を連鎖して若干個の単語列を形成し、それ
ぞれの語長(全文字数)により分類する。辞書部13は予
め、多数の住所名の文字列を格納しており、辞書読出部
12から入力された前記単語列に対応する文字列を第3の
読取文字列として出力し、辞書読出部12は前記第2の読
取文字列とともにこの第3の読取文字列を照合部14に出
力する。照合部14は第2の読取文字列と第3の読取文字
列とを照合して、両者が一致して、かつ読取文字列中に
単一コードを含まぬときはこれをそのまゝ、またはこれ
を代表するコードを出力する。もし、一致した読取文字
列中に単一コードが含まれているときは、単一コードを
含む文字列に対応して辞書部13に格納されているポイン
タ情報が照合部14から第2の照合手段2に出力される。
第2照合手段2は索引テーブルポインタ21と辞書読出部
22と辞書部23と照合部24とから構成されて、出現頻度の
低い文字を含む文字列(住所)を照合対象とする。索引
テーブルポインタ21はレジスタ4から第1の読取文字列
を、また、第1の照合手段1から前記ポインタ情報をそ
れぞれ入力して、ポインタ値により指定された単語中の
単一コードに該当する箇所の文字(出現頻度の低い文
字)を予め定められたコードに変換して第4の読取文字
列とし、第1および第4の読取文字列を辞書読出部22に
出力する。辞書部23は予め出現頻度の低い文字に対応す
る住所名の文字列を格納しており、辞書読出部22から第
4の読取文字列を入力したとき、対応する文字列を第5
の読取文字列として辞書読出部22へ返す。辞書読出部22
はこの第5の読取文字列と第1の読取文字列とを照合部
24へ出力する。照合部24は入力された両読取文字列を照
合して、両者が一致すれば照合された読取文字列または
これを代表するコードを出力する。区分機5は第1の照
合手段または第2の照合手段からの出力を受けて、宛先
住所による郵便物の仕分けを行う。
と照合して確認するもので、文字読取機3は入力された
文字列のうち対象とする住所部分を読取って、第1の読
取文字列としてレジスタ4に出力する。レジスタ4は入
力された第1の読取文字列を第1の照合手段1と第2の
照合手段2へそれぞれ出力する。第1の照合手段1は索
引テーブルポインタ11と辞書読出部12と辞書部13と照合
部14とから構成され、出現頻度の高い文字のみよりなる
文字列(住所)を照合出力し、もし文字列中に出現頻度
の低い文字が含まれているときは、その照合を第2の照
合手段に行なわせる。索引テーブルポインタ11は、レジ
スタ4から入力された第1の読取文字列の文字中に、予
め定められている出現頻度の低い文字があれば該文字を
予め定められた単一コードで置換し、なければそのまゝ
で、いずれの場合も第2の読取文字列として出力する。
辞書読出部12は第2の読出文字列を入力してそのうちに
含まれる単語を連鎖して若干個の単語列を形成し、それ
ぞれの語長(全文字数)により分類する。辞書部13は予
め、多数の住所名の文字列を格納しており、辞書読出部
12から入力された前記単語列に対応する文字列を第3の
読取文字列として出力し、辞書読出部12は前記第2の読
取文字列とともにこの第3の読取文字列を照合部14に出
力する。照合部14は第2の読取文字列と第3の読取文字
列とを照合して、両者が一致して、かつ読取文字列中に
単一コードを含まぬときはこれをそのまゝ、またはこれ
を代表するコードを出力する。もし、一致した読取文字
列中に単一コードが含まれているときは、単一コードを
含む文字列に対応して辞書部13に格納されているポイン
タ情報が照合部14から第2の照合手段2に出力される。
第2照合手段2は索引テーブルポインタ21と辞書読出部
22と辞書部23と照合部24とから構成されて、出現頻度の
低い文字を含む文字列(住所)を照合対象とする。索引
テーブルポインタ21はレジスタ4から第1の読取文字列
を、また、第1の照合手段1から前記ポインタ情報をそ
れぞれ入力して、ポインタ値により指定された単語中の
単一コードに該当する箇所の文字(出現頻度の低い文
字)を予め定められたコードに変換して第4の読取文字
列とし、第1および第4の読取文字列を辞書読出部22に
出力する。辞書部23は予め出現頻度の低い文字に対応す
る住所名の文字列を格納しており、辞書読出部22から第
4の読取文字列を入力したとき、対応する文字列を第5
の読取文字列として辞書読出部22へ返す。辞書読出部22
はこの第5の読取文字列と第1の読取文字列とを照合部
24へ出力する。照合部24は入力された両読取文字列を照
合して、両者が一致すれば照合された読取文字列または
これを代表するコードを出力する。区分機5は第1の照
合手段または第2の照合手段からの出力を受けて、宛先
住所による郵便物の仕分けを行う。
次に、本実施例の動作を第2図に示す宛先住所例の場合
について説明する。
について説明する。
いま、出現頻度の低い文字として数字が指定されている
ものとし、単一コードとして*が定められているとする
と、住所名「Ang Mo KioIndustrial Park 5」が文字読
取機3からレジスタ4を介して索引テーブルポインタ11
へ入力されて「Ang Mo Kio Industrial Park *」に変
換され、第2の読取文字列として辞書読出部12へ出力さ
れる。辞書読出部12ではこの第2の読取文字列の各単語
を連鎖することにより例えば次のような単語列を生成す
る。
ものとし、単一コードとして*が定められているとする
と、住所名「Ang Mo KioIndustrial Park 5」が文字読
取機3からレジスタ4を介して索引テーブルポインタ11
へ入力されて「Ang Mo Kio Industrial Park *」に変
換され、第2の読取文字列として辞書読出部12へ出力さ
れる。辞書読出部12ではこの第2の読取文字列の各単語
を連鎖することにより例えば次のような単語列を生成す
る。
Park * Mo Kio Industrial Park * Kio Industrial Park など。
これらの単語列はその語長(文字数)にしたがって逐次
辞書部13へ入力される。辞書部13では、予め語長にした
がって第2の読取文字列に対応する住所名の文字列が格
納されているので、検索された第3の文字列は辞書読出
部12を介して照合部14で第2の読取文字列と一致するか
どうか照合される。通常は1個なし数個の単語列による
検索で足り、いまの場合「Ang Mo Kio Industrial Park
*」が検索されて両文字列が一致することが検出され
る。もしこの文字列中に単一コード*が含まれていなけ
れば直ちに照合結果として出力されるが、いまの場合は
含まれているので、辞書部13内のこの部分に格納されて
いるポインタ情報が第2の照合手段へ出力される。
辞書部13へ入力される。辞書部13では、予め語長にした
がって第2の読取文字列に対応する住所名の文字列が格
納されているので、検索された第3の文字列は辞書読出
部12を介して照合部14で第2の読取文字列と一致するか
どうか照合される。通常は1個なし数個の単語列による
検索で足り、いまの場合「Ang Mo Kio Industrial Park
*」が検索されて両文字列が一致することが検出され
る。もしこの文字列中に単一コード*が含まれていなけ
れば直ちに照合結果として出力されるが、いまの場合は
含まれているので、辞書部13内のこの部分に格納されて
いるポインタ情報が第2の照合手段へ出力される。
一方、第2の照合手段2では、索引テーブルポインタ21
が、前記ポインタ情報と第1の読取文字列を入力して、
第1の読取文字列中のポインタ情報に該当する箇所、す
なわち、いまの場合「5」を予め定められたコードに変
換し、第4の読取文字列として第1の読取文字列ととも
に辞書読出部22へ出力する。第2の照合手段2の辞書部
23にはこの出現頻度の低い文字に対応する住所名が予め
格納されているので、第4の読取文字「5」により第1
の照合手段1における場合と同様の手順で第5の読取文
字列が検索され、照合部24で第1の読取文字列と一致す
るかどうか照合される。いまの場合「Ang Mo Kio Indus
trial Park 5」が照合の結果として出力される。
が、前記ポインタ情報と第1の読取文字列を入力して、
第1の読取文字列中のポインタ情報に該当する箇所、す
なわち、いまの場合「5」を予め定められたコードに変
換し、第4の読取文字列として第1の読取文字列ととも
に辞書読出部22へ出力する。第2の照合手段2の辞書部
23にはこの出現頻度の低い文字に対応する住所名が予め
格納されているので、第4の読取文字「5」により第1
の照合手段1における場合と同様の手順で第5の読取文
字列が検索され、照合部24で第1の読取文字列と一致す
るかどうか照合される。いまの場合「Ang Mo Kio Indus
trial Park 5」が照合の結果として出力される。
このようにして、出現頻度の高い文字のみで構成された
住所名は出現頻度の高い文字のみで構成された容量の小
さい辞書部13で検索できるので、従来のように容量の大
きい辞書部を用いる場合に比べて処理時間が少なくてす
み、出現頻度が低い文字を含む場合に2回照合したとし
ても、総合的には処理時間を節約することができる。
住所名は出現頻度の高い文字のみで構成された容量の小
さい辞書部13で検索できるので、従来のように容量の大
きい辞書部を用いる場合に比べて処理時間が少なくてす
み、出現頻度が低い文字を含む場合に2回照合したとし
ても、総合的には処理時間を節約することができる。
以上説明したように本発明は、入力される読取文字列の
文字について、予め出現頻度の高い文字と出現頻度の低
い文字とに分類しておき、出現頻度の低い文字を含まな
い文字列を照合出力する第1の照合手段と、該文字を含
む文字列を照合対象とする第2の照合手段とを設けて、
出現頻度の低い文字の有無にしたがい文字列を別々に照
合処理することにより、通常は出現頻度の高い文字の辞
書の照合のみで読取文字列の照合が終了し、辞書容量お
よび照合時間を小さくするという効果がある。
文字について、予め出現頻度の高い文字と出現頻度の低
い文字とに分類しておき、出現頻度の低い文字を含まな
い文字列を照合出力する第1の照合手段と、該文字を含
む文字列を照合対象とする第2の照合手段とを設けて、
出現頻度の低い文字の有無にしたがい文字列を別々に照
合処理することにより、通常は出現頻度の高い文字の辞
書の照合のみで読取文字列の照合が終了し、辞書容量お
よび照合時間を小さくするという効果がある。
第1図は本発明の単語辞書照合装置の一実施例の構成を
示すブロック図、第2図は本実施例に入力される住所例
を示す図、第3図は単語辞書照合装置の従来例の構成を
示すブロック図である。 1……第1の照合手段、2……第2の照合手段、 3……文字読取機、4……レジスタ、 5……区分機、 11,21……索引テーブルポインタ、 12,22……辞書読出部、 13,23……辞書部、 14,24……照合部。
示すブロック図、第2図は本実施例に入力される住所例
を示す図、第3図は単語辞書照合装置の従来例の構成を
示すブロック図である。 1……第1の照合手段、2……第2の照合手段、 3……文字読取機、4……レジスタ、 5……区分機、 11,21……索引テーブルポインタ、 12,22……辞書読出部、 13,23……辞書部、 14,24……照合部。
Claims (1)
- 【請求項1】文字読取機で読取った読取文字列の中に含
まれる単語列を用いて、該文字列に対応する文字列を予
め記憶している単語辞書を検索し照合することにより、
該読取文字列が辞書内に格納されている文字列と一致す
るかどうかを確認する単語辞書照合装置において、 読取文字中に予め定められた出現頻度の低い文字を含ま
ないときは、前記読取文字列の一致を確認したとき該読
取文字またはこれを代表するコードを出力し、読取文字
中に予め定められた出現頻度の低い文字を含むときは、
該文字を予め定められた単一コードに変換した文字列と
して同様に辞書を検索し、該文字列の一致を確認したと
き辞書内の該文字列に格納されているポインタ情報を出
力する第1の照合手段と、 第1の照合手段から入力された前記ポインタ情報と、前
記文字読取機から入力された読取文字列中の該ポインタ
情報に示された出現頻度の低い文字とから、予め出現頻
度の低い文字を含む文字列を格納している第2の辞書を
検索照合して、読取文字列の一致を確認したとき該読取
文字またはこれを代表するコードを出力する第2の照合
手段を有することを特徴とする単語辞書照合装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61235610A JPH0646423B2 (ja) | 1986-10-02 | 1986-10-02 | 単語辞書照合装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61235610A JPH0646423B2 (ja) | 1986-10-02 | 1986-10-02 | 単語辞書照合装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6389991A JPS6389991A (ja) | 1988-04-20 |
| JPH0646423B2 true JPH0646423B2 (ja) | 1994-06-15 |
Family
ID=16988558
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61235610A Expired - Lifetime JPH0646423B2 (ja) | 1986-10-02 | 1986-10-02 | 単語辞書照合装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0646423B2 (ja) |
-
1986
- 1986-10-02 JP JP61235610A patent/JPH0646423B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6389991A (ja) | 1988-04-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS61267885A (ja) | 単語辞書照合装置 | |
| JP3812818B2 (ja) | データベース生成装置、データベース生成方法及びデータベース生成処理プログラム | |
| JPS60105039A (ja) | 文字列照合方式 | |
| JPH0646423B2 (ja) | 単語辞書照合装置 | |
| JP2588261B2 (ja) | Ocrによる住所データベース検索装置 | |
| JP2535629B2 (ja) | 検索システムの入力文字列正規化方式 | |
| JP2671311B2 (ja) | 住所読取装置 | |
| JP2874199B2 (ja) | 単語辞書照合装置 | |
| JP2655087B2 (ja) | 文字認識後処理方式 | |
| JPH0441388B2 (ja) | ||
| JP2530659B2 (ja) | 光学文字読取システム | |
| JPH0746362B2 (ja) | 文字列照合方法 | |
| JP3210842B2 (ja) | 情報処理装置 | |
| JP2839515B2 (ja) | 文字読取システム | |
| JPH069053B2 (ja) | 住所辞書照合装置 | |
| JP2560959B2 (ja) | 文字認識後処理方式 | |
| JP2917310B2 (ja) | 単語照合における単語辞書検索方式 | |
| JPH05242303A (ja) | 宛名読取装置 | |
| JPH0528132A (ja) | 単語辞書照合装置 | |
| JPH06301822A (ja) | 文字認識後処理方式 | |
| JPS6355683A (ja) | 住所読取装置 | |
| JPS58146927A (ja) | 関連語情報を有する単語辞書作成方式 | |
| JPH01112364A (ja) | データ処理装置 | |
| JPH04250589A (ja) | 単語照合装置及び単語照合方法 | |
| JPS63131288A (ja) | 単語照合装置 |