JPH02308384A - 住所認識装置 - Google Patents

住所認識装置

Info

Publication number
JPH02308384A
JPH02308384A JP1130709A JP13070989A JPH02308384A JP H02308384 A JPH02308384 A JP H02308384A JP 1130709 A JP1130709 A JP 1130709A JP 13070989 A JP13070989 A JP 13070989A JP H02308384 A JPH02308384 A JP H02308384A
Authority
JP
Japan
Prior art keywords
word
address
recognition
character
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1130709A
Other languages
English (en)
Inventor
Masaaki Shizuno
静野 正明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1130709A priority Critical patent/JPH02308384A/ja
Publication of JPH02308384A publication Critical patent/JPH02308384A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、例えば配達物に示されている宛先である住
所を読取って認識を行う住所認識装置に関する。
(従来の技術) 従来、住所認識装置にあっては、区分情報としての配達
物上の住所を構成する文字列を、例えば光学式文字読取
装置で読取って、この読取った文字列から単語辞書を参
照して単語を認識し、さらに、この認識された単語を組
み合わせて構成される住所を住所辞書を参照することに
より認識し、この認識された住所に基づいて配達物の区
分を行うようになっている。
このような住所認識装置では、住所を認識するにあたり
、住所の上位階層の単語から下位階層の単語へと順番に
住所辞書を検索し、認識処理を行っていた。例えば、下
記のような 「東京都足立区千住曙町」 という住所を認識する場合、「東京都」=「足立区」−
「千住」→「曙町」の順番で住所辞書の検索を行い、住
所辞書中に一致するものを見出だすことにより住所認識
を行っていた。しかしながら、この方法では、単語認識
によって得られた単語候補のすべてを住所辞書と照合す
る必要があり、最後まで読めないことが判っていても途
中まで照合を行うので処理時間か長くなるという欠点が
ある。
(発明が解決しようとする課題) 上記したように、住所の上位階層から順次照合して単語
認識を行うものは単語候補のすべてを住所辞書と照合す
る必要があり、最後まで読めないことが判っていても途
中まで照合を行うので処理時間が長くなるという欠点を
除去するもので、処理時間を短くし、高速に住所認識を
行うことのできる住所認識装置を提供することを目的と
する。
[発明の構成] (課題を解決するための手段) この発明の住所認識装置は、文字情報を検出して辞書中
の情報と照合して住所を認識する住所認識装置において
、住所を構成する文字列を読取る文字読取手段と、この
文字読取手段により読取られた文字列に対して文字認識
を行って文字候補を出力する文字認識手段と、認識処理
に使用する単語のうち住所認識を開始すべき単語をキー
ワードとして記憶している単語辞書と、前記文字認識手
段から出力された文字候補と前記単語辞書との照合によ
り単語認識を行って単語候補を出力する単語認識手段と
、この単語認識手段から出力された単語候補のうち前記
キーワードとして記憶されている単語を検索し、この検
索された単語を開始点として前記単語候補を順次照合す
ることにより住所認識を行う住所認識手段とを具備する
ことを特徴とする。
(作用) この発明は、予め単語辞書に用意する単語のうち住所認
識の開始点となるべき単語、つまり区分されるべき住所
の最下位階層の単語をキーワードとして登録しておき、
単語認識手段により認識された単語候補のうちキーワー
ドとして登録されている単語を検索し、この検索された
単語を照合の開始点として上記単語候補を上位階層の方
へ順次照合し、照合できた一連の単語を住所として認識
するようにしたものである。これにより照合すべき数が
減少し、高速に住所認識ができるものとなっている。
(実施例) 以下、この発明の一実施例について図面を参照して説明
する。
第1図は、住所認識装置を概略的に示すものである。す
なわち、11は走査部(光電変換部)で、図示しない搬
送路に沿って図示矢印a方向に搬送される配達物Pに対
向するように設けられている。
この走査部11は、配達物P上を光学的に走査して光電
変換することによりパターン信号を得るものであり、例
えば配達物Pを照明する光源、及びその反射光を受けて
電気信号に変換する自己走査形のCCDイメージセンサ
等によって構成されている。この走査部11が出力する
読取信号は住所領域検出部12及び文字認識部13内の
二値化回路20に供給されるようになっている。
住所領域検出部12は、配達物Pに記載されている各種
情報の中から、領域の形や位置等により、住所情報が記
載されている領域を検出する周知のものである。この住
所領域検出部12で住所領域として検出される、例えば
領域の座標値が文字認識部13内の選択回路21に出力
されるようになっている。
文字認識部13は、走査部11からの読取信号を二値化
する二値化回路20、住所領域検出部12から供給され
る座標値により特定される領域内の二値化信号、つまり
走査部11からの読取信号のうち住所領域の読取信号の
みを選択して出力する選択回路21、この選択回路21
から供給される住所領域に対応する住所情報の文字を1
文字ずつ検出切出しする文字検出切出回路22、この文
字検出切出回路22から供給される検出切出された文字
情報を正規化し、サンプリングする正規化回路23、及
び正規化回路23から供給される文字情報を、例えば文
字辞書25内の各文字に対する基準パターンとのマツチ
ング法などによって認識し、複数の文字候補を出力する
認識回路24によって構成されている。この文字認識部
13の認識回路24からの出力は単語認識部14に供給
される。
単語認識部14は、上記文字認識部13から供給される
文字候補に対して単語辞書15から読出される単語によ
り単語を認識し、認識できた複数の単語候補を出力する
ものである。また、単語辞書15に記憶される単語のう
ち、住所認識処理上必ず認識できなければならない単語
、つまり認識結果により区分情報として使用される最下
位階層の単語には、予め当該単語をキーワードとするべ
き旨の識別情報が付されている。この単語辞書15は例
えばROM等で構成される周知のものである。この単語
認識部14からの出力、つまり複数の単語候補は住所認
識部16に供給される。
住所認識部16は、上記単語認識部14から供給される
単語候補に対し所定の処理を施して住所を認識し、その
認識された住所に対する区分指定データ、つまり住所認
識装置の後段に設けられている区分部の区分ポケット(
図示しない)を示すデータを出力するものである。
次に、上記構成において第2図ないし第4図を参照しな
がら動作を説明する。
例えば今、第1図に示す配達物Pが図示矢印a方向に搬
送され、走査部11に到達すると、この走査部11は、
その配達物P上を光学的に走査して光電変換し、そのパ
ターン信号が住所領域検出部12に供給される。すると
、住所領域検出部12は、上記配達物Pに記載されてい
る各情報の中から住所情報が記載されている住所領域を
検出する。
また、上記走査部11の出力は文字認識部13内の二値
化回路20に供給され、二値化された後、選択回路21
に出力される。
これにより、選択回路21は、上記住所領域検出部12
から供給される座標情報に対応する上記二値化回路20
からの出力、つまり住所領域の読取信号のみを選択的に
文字検出切出回路22に出力する。この文字検出切出回
路22は供給された住所領域に対応する住所情報の文字
を1文字ずつ検出切出し、正規化回路23に出力する。
正規化回路23では検出切出された文字情報を正規化し
、サンプリングして二値化された文字列として認識回路
24に出力する。この実施例では、第2図(a)に示す
ように、8文字の列が入力される場合の例について説明
する。
認識回路24は供給された文字情報を、例えば文字辞書
25内の文字に対する基準パターンとのマツチング法な
どによって文字認識し、単語認識部14に出力する。こ
の際、自由手書き漢字などでは認識結果を唯一に決定す
ることは困難であるので、1つの入力文字に対して複数
の答候補となる文字候補を出力する。図示例では4つの
文字候補が出力されるようになっている。
単語認識部14は、上記文字認識部13から供給される
文字候補に対して単語辞書15から読出される単語によ
り単語を認識し、その単語列を住所認識部16に出力す
る。すなわち、入力文字列の一部を取り出し、その中の
各文字候補を組み合わせて単語辞書と照合することによ
り単語候補を得る。例えば、2〜4文字目の部分の各文
字列についてそれぞれ、第4、第3、第4の答候補を組
み合わせると「関谷町」となり、単語辞書に含まれる単
語と一致し、第2図(b)に示すように、「関谷町」と
いう単語候補が得られる。第2図(b)中、「*」が付
されている単語はキーワードである。このキーワードは
、住所認識処理を行うについて必ず認識できなければな
らない単語であり、例えば住所により区分する場合の最
下位階層の単語がキーワードとして選択されている。
第3図は、第2図(b)に示す単語候補のメモリ上のイ
メージである。図において、「左単語(LW)Jとは、
住所候補となる「単語名(NM)Jの左にある単語を示
す。例えば、住所「東京都足立区足立」 のときは、「定立」の左は「定立区」であることを表し
ている。なお、左単語がないとき、つまり、上記例でい
えば「東京都」のように最上位階層の単語である場合は
、左単語としてrENDJが記憶されるようになってい
る。
また、「左端位置(L)」、「右端位置(R)」は、入
力された文字列の中での単語候補位置を示すものである
。例えば、入力された文字列が「定立区千住宮元町」 であれば、「宮元町jの左端は「6」、右端は「8」で
表される。
次に、このような単語候補が単語認識部14から得られ
ると、住所認識部16は第4図のフローチャートに示す
ような住所認識処理を開始する。
先ず、単語候補の中からキーワードとなっている単語を
検索し、それを含む住所候補を選択する。
つまり、図示しないカウンタにセットされる変数nを「
1」に初期化しくステップS 1 ) 、n番目の単語
候補のキーワードフラグ(K)欄を参照して、当該単語
がキーワードであるか否か判断する(ステップS2)。
そして、キーワードでないことが判断されるとステップ
Sllへ分岐し、変数nをインクリメントして単語候補
として得られた単語の最後まで調べたか否か、つまり、
図示例でいえば変数nが「9」になったか否かを判断す
る(ステップ512)。そして、最後の単語まで調べて
いないことが判断されるとステップS2へ戻り、キーワ
ードとして定義された単語候補が出現するまでステップ
S2、S11、S12を繰り返し実行する。
この繰り返し実行の過程において、ステップS2でキー
ワードとなっている単語候補が見つかった旨を判断する
と、照合できた単語の長さ、つまり住所候補の長さを記
憶するレジスタLNG(図示しない)を「0」にクリア
し、その時の変数nを図示しないレジスタに変数mとし
てセットする(ステップS3)。図示例では、最初に見
つかるキーワードとなっている単語候補は4番目の単語
候補「関谷町」である。したがって、その時の変数nで
ある「4」が変数mとしてセットされる。
次いで、m番目の単語候補の左単語LWをL W m 
、左端位置りをLm、右端位置RをRmとする(ステッ
プS4)。すなわち、4番目の単語候補である「関谷町
」の左単語LWとして「定立区」、左端位置りとして「
2」、右端位置Rとして「4」を得る。
次いで、住所候補の単語の長さを求める。つまり、レジ
スタLNGにrRm−Lm+IJを計算した値「4〜2
+1−3Jを加算する(ステップS5)。そして、当該
単語候補の左単語がrENDJであるか否か、つまり、
その単語候補が最上位階層の単語であるか否かを調べる
(ステップS6)。そして、「END」でないことが判
断されると、単語名N 、Mが左単語L W m 。
つまり「定立区」であり、かつ右端位置Rが「Lm−1
」、つまりr2−1−IJとなる単語を単語候補中から
捜す(ステップS7)。そして、ステップS8にて該当
するものがあることが判断されると、その単語候補の番
号を新しい変数mとする(ステップS9)。一方、該当
するものがないことが判断されると、住所候補として変
数n及び照合できた住所候補の長さLNGを図示しない
メモリに残す(ステップ510)。図示例では、該当す
るものがないので変数nである「4」及びL−NGを「
3」としてメモリに残す。すなわち、以上の処理にて「
関谷町」のみ住所候補として照合できたことになる。
次に、変数nをインクリメントしくステップ511)、
上記したと同様に、次のキーワードとして定義された単
語候補が出現するまでステップS2、Sll、512を
繰り返し実行する。そして、この繰り返し実行の過程に
おいてステップS2でキーワードとなっている単語候補
が見つかると、レジスタLNGを「0」にクリアし、そ
の時の変数nを図示しないレジスタに変数mとして格納
する(ステップS3)。図示例では2番目に見つかるキ
ーワードとなっている単語候補は6番目の単語候補「前
片」である。したがって、その時の変数nである「6」
が変数mとしてセットされる。以降の処理は、上記キー
ワード「関谷町」の場合と同じであるので説明を省略す
るが、この場合は、「前片」のみが住所候補として照合
できる。
次に、変数nをインクリメントしくステップ511)、
上記したと同様に、次のキーワードとして定義された単
語候補が出現するまでステップS2、Sll、S12を
繰り返し実行する。
そして、この繰り返し実行の過程において、ステップS
2でキーワードとなっている単語候補が見つかると、レ
ジスタLNGを「0」にクリアし、その時の変数nを図
示しないレジスタに変数mとしてセットする(ステップ
S3)。図示例では3番目に見つかるキーワードとなっ
ている単語候補は8番目の単語候補「宮元町」である。
したがって、その時の変数nである「8」が変数mとし
てセットされる。次いで、m番目の単語候補の左単語L
WをL W m 、左端位置りをLm、右端位置RをR
mとする(ステップS4)。すなわち、8番目の単語候
補である「宮元町」の左単語LWとして「千住」、左端
位置りとして「6」、右端位置Rとして「8」を得る。
次いで、住所候補の長さを求める。つまり、レジスタL
NGにrRm−Lm+IJを計算した値r8−6+1−
3Jを加算する(ステップS5)。
そして、当該単語候補の左単語がrENDJであるか否
か、つまり、その単語候補が最上位階層の単語であるか
否かを調べ(ステップS6)、rENDJでないことが
判断されると、単語名NMが左単語L W m 、つま
り「千住Jであり、かつ右端位置RがrLm−IJ、つ
まりr6−1−5」となる単語を単語候補中から捜す(
ステップS7)。そして、ステップS8にて該当するも
のがあることが判断されると、その単語候補の番号を新
しい変数mとする(ステップS9)。この場合、5番目
の単語候補に該当するものあるのでステップS9へ進み
、一致した単語候補の番号、つまり「5」を新しい変数
mとし、再度ステップS4へ戻る。そして、2巡目の処
理では、5番目の単語候補である「千住」の左単語LW
として「定立区」、左端位置りとして「4」、右端位置
Rとして「5」を得る。
次いで、住所候補の長さを求める。つまり、レジスタL
NGに「Rm−Lm+IJを計算した値r5−4+1−
2Jを加算する(ステップS5)。
これによりレジスタLNGの内容は「5」となる。
そして、当該単語候補の左単語がrENDJであるか否
か、つまり、その単語候補が最上位階層の単語であるか
否かを調べ(ステップS6)、rENDJでないことが
判断されると、単語名NMが左単語L W m、つまり
「定立区」であり、かつ右端位置Rが「Lm−IJ 、
つまりr4−1−3jとなる単語を単語候補中から捜す
(ステップS7)。この場合、2番目の単語候補に該当
するものがあるので、ステップS9へ進み、一致した単
語候補の番号、つまり「2」を新しい変数mとし、再度
ステップS4へ戻る。そして、3巡目の処理では、2番
目の単語候補である「定立区」の左単語LWとして「東
京都」、左端位置りとして「1」、右端位置Rとして「
3」を得る。
次いで、住所候補の長さを求める。つまり、レジスタL
NGにrRm−Lm+lJを計算した値r3−1+1−
34を加算する(ステップS5)。
これによりレジスタLNGの内容は「8」となる。
そして、当該単語候補の左単語がrENDJであるか否
か、つまり、その単語候補が最上位階層の単語であるか
否かを調べ(ステップS6)、rENDJでないことが
判断されると、単語名NMが左単語L W m 、つま
り「東京都」であり、かつ右端位置Rが「Lm−IJ 
、つまりrl−1−OJとなる単語を単語候補中から捜
す(ステップS7)。この場合、該当するものがないの
で、ステップS10へ分岐し、住所候補として変数nが
「8」及びLNGが「8」という値を残す。すなわち、
「定立区千住宮本町」が照合できたことになる。
さらに、「元町」をキーワードとして処理を行った場合
は、上記と同様に、「元町」だけを照合できることにな
る。そして、ステップS12で終了である旨が判断され
一連の住所認識処理を終了する。
このようにして認識された住所候補としては、第2図(
c)に示すように、複数のものが得られる。この場合は
、例えばレジスタLNGの内容を参照することにより、
照合できた文字数(丸印で囲ったもの)の一番多いもの
を認識結果として出力する。すなわち、図示例では「定
立区千住宮元町」が認識結果となる。そして、認識され
た住所に対応する区分指定データ、つまり後段の区分部
における区分ポケットを示すデータを、後段の区分部に
出力する。これにより各住所に対応した区分ポケットに
配達物Pが区分されることになる。
上記したように、予め単語辞1t15に用意する単語の
うち住所認忠の開始点となるべき単語、つまり区分され
るべき住所の最下位階層の単語をキーワードとして登録
しておき、単語認識部14により認識された単語候補の
うちキーワードとじて登録されている単語を検索し、こ
の検索されたキーワードとしての単語を照合開始単語と
して上記単語候補を上位階層の方へ順次照合し、照合で
きた一連の単語を住所として認識するようにしたので、
従来方式では9つの単語候補すべてについて照合する必
要があるが、本実施例によれば半分以下の4つの照合で
済み、照合する単語候補の数が減少するので高速に住所
認識ができるものとなっている。また、最下位階層の単
語から順次照合処理を行うようにしたので、最後まで読
めないことが分かっている照合を実施することがなく、
効率良く照合処理ができるものとなっている。
[発明の効果] 以上詳述したように、この発明によれば、処理時間を短
くし、高速に住所認識を行うことのできる住所認識装置
を提供できる。
【図面の簡単な説明】
図面はこの発明の一実施例を示すもので、第1図は全体
の構成を概略的に示す図、第2図は住所候補を得るまで
の処理を説明するための図、第3図は単語候補のメモリ
イメージを示す説明図、第4図は動作を説明するための
フローチャートである。 P・・・配達物、11・・・走査部(文字読取手段)、
12・・・住所領域検出部、13・・・文字認識部(文
字認識手段)、14・・・単語認識部(単語認識手段)
、15・・・単語辞書、16・・・住所認識部(住所認
識手段)。

Claims (1)

  1. 【特許請求の範囲】 文字情報を検出して辞書中の情報と照合して住所を認識
    する住所認識装置において、 住所を構成する文字列を読取る文字読取手段と、この文
    学読取手段により読取られた文字列に対して文字認識を
    行って文字候補を出力する文字認識手段と、 認識処理に使用する単語のうち住所認識を開始すべき単
    語をキーワードとして記憶している単語辞書と、 前記文字認識手段から出力された文字候補と前記単語辞
    書との照合により単語認識を行って単語候補を出力する
    単語認識手段と、 この単語認識手段から出力された単語候補のうち前記キ
    ーワードとして記憶されている単語を検索し、この検索
    された単語を開始点として前記単語候補を順次照合する
    ことにより住所認識を行う住所認識手段と を具備したことを特徴とする住所認識装置。
JP1130709A 1989-05-24 1989-05-24 住所認識装置 Pending JPH02308384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1130709A JPH02308384A (ja) 1989-05-24 1989-05-24 住所認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1130709A JPH02308384A (ja) 1989-05-24 1989-05-24 住所認識装置

Publications (1)

Publication Number Publication Date
JPH02308384A true JPH02308384A (ja) 1990-12-21

Family

ID=15040746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1130709A Pending JPH02308384A (ja) 1989-05-24 1989-05-24 住所認識装置

Country Status (1)

Country Link
JP (1) JPH02308384A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0841630A3 (en) * 1996-05-21 1999-09-01 Hitachi, Ltd. Apparatus for recognizing input character strings by inference

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0841630A3 (en) * 1996-05-21 1999-09-01 Hitachi, Ltd. Apparatus for recognizing input character strings by inference
US6751605B2 (en) 1996-05-21 2004-06-15 Hitachi, Ltd. Apparatus for recognizing input character strings by inference

Similar Documents

Publication Publication Date Title
EP1362322B1 (en) Holistic-analytical recognition of handwritten text
CN110851590A (zh) 一种通过敏感词检测与非法内容识别进行文本分类的方法
JPS6120038B2 (ja)
JPH02308384A (ja) 住所認識装置
JP2588261B2 (ja) Ocrによる住所データベース検索装置
JP2671311B2 (ja) 住所読取装置
JP2801602B2 (ja) 単語認識装置
JPH0441388B2 (ja)
JP2801638B2 (ja) 住所認識装置
JPH0256086A (ja) 文字認識の後処理方法
JPH0766423B2 (ja) 文字認識装置
JPH02310686A (ja) 住所認識装置
JPH0259513B2 (ja)
JPS63303481A (ja) 住所読取装置
JPS63268082A (ja) パタ−ン認識装置
JPH08227427A (ja) 文字認識装置
JPH0646423B2 (ja) 単語辞書照合装置
JP2839515B2 (ja) 文字読取システム
JPH01304087A (ja) 住所認識装置
JPS61148585A (ja) 文字認識装置
JPH0746373B2 (ja) 単語認識装置
JPH05324899A (ja) 郵便物記載住所認識装置
JPH0474756B2 (ja)
JPS6275785A (ja) 文字認識装置
JPS5953986A (ja) 文字認識装置