JP3673034B2 - 郵便物の宛名領域検出装置 - Google Patents
郵便物の宛名領域検出装置 Download PDFInfo
- Publication number
- JP3673034B2 JP3673034B2 JP25993796A JP25993796A JP3673034B2 JP 3673034 B2 JP3673034 B2 JP 3673034B2 JP 25993796 A JP25993796 A JP 25993796A JP 25993796 A JP25993796 A JP 25993796A JP 3673034 B2 JP3673034 B2 JP 3673034B2
- Authority
- JP
- Japan
- Prior art keywords
- address
- line
- area
- lines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Sorting Of Articles (AREA)
Description
【発明の属する技術分野】
この発明は郵便物の処理装置、特に郵便物の宛名を読み取ってその配達先に従って区分する際に用いられる郵便物の宛名領域検出装置に関する。
【0002】
【従来の技術】
郵便物の処理分野においては、連日大量に送られてくる郵便物を限られた時間内に処理して行かねばならない。そこで郵便業務の機械化が進められ、郵便局員の負担の軽減がはかられている。その一例が、光学的文字読取装置を用いて、郵便物上の郵便番号を読み取り、その読取結果によって郵便物を複数の配達郵便局ごとに区分する差立区分機、あるいは、更に郵便物上の宛名を読み取りその読取結果によって郵便物を複数の送達区域ごとに区分する配達区分機である。
【0003】
配達区分機では、郵便物上に書かれた宛名を読みとる際、従来は画像処理によって宛名が書かれていると推定される領域を1つ確定させ、その領域に対して行検出、文字検出、文字識別、町名識別をパイプライン処理することにより宛名を自動認識している。
【0004】
しかし、現行の郵便物の宛名に関しては、その宛名記載位置、記載方法などの書式にほとんど制約が設けられていないため様々な書式の郵便物が存在し、しかも郵便物上には広告等の宛名以外の文字情報、絵および写真も存在し、それらの画像情報が混在する中から宛名情報を正しく抽出することは非常に困難である。したがって、今後もますます郵便物の量が増加していくことを考えると、従来手法よりも高性能の宛名読み取り手法を開発することが求められている。
【0005】
【発明が解決しようとする課題】
従来の技術では宛名領域を確定してからその領域に含まれる情報を読み取るように構成されているために、誤った領域を宛名領域として決定した場合、当該郵便物は配達区分機からリジェクトされるので、再投入するしかなく、最初に投入された配達区分機における以降の処理で宛名を正しく認識することは不可能である。しかも確定された1つの領域内に書かれている文字を全て認識してからこの領域が宛名領域であるか否かを決定するため、1領域当たりの処理時間が長くなる。
【0006】
一般に宛名領域検出の成功率を上げるには一度リジェクトされた郵便物について他の領域の検出動作を続行できるようにすればよいが、郵便1通あたりの処理時間が制限されているため、従来の方法で複数の領域を検出することは時間が多く掛り、実現が困難であった。
【0007】
そこで、この発明は、郵便物表面の画像から宛名領域を簡単、正確に検出し、郵便物処理を高速で行うことを可能とする郵便物の宛名領域検出装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
この発明の郵便物の宛名検出装置は、郵便物表面より光電変換して画像信号を得る画像入力手段と、この画像入力手段により得られた前記画像信号を格納する画像メモリと、この画像メモリの前記画像信号を2値画像判定した黒画素連結領域とこの黒画素連結領域に外接する外接矩形情報を抽出する黒画素連結領域抽出部と、この黒画素連結領域抽出部により抽出された前記外接矩形情報から行候補の矩形情報を抽出する行候補検出部と、この行候補検出部により抽出された矩形情報から宛名領域候補を検出する宛名領域候補検出部と、前記宛名領域候補に含まれる文字情報から宛名領域を確定する宛名領域確定手段と、を具備することを特徴としている。
【0009】
上記の構成により、最初に文字行を検出し、それを統合して複数の宛名領域候補を検出し、各領域候補から宛名書きだし部であると推定される文字行を検出し、その文字行に対して文字検出、文字識別、町名識別を行なって宛名書きだし部であるか否か調べることにより、その文字行を含む領域が宛名記載領域であるか否かを高速に判定することができる。文字認識の結果、その文字行が宛名情報を含んでいなければその行を含む領域には宛名情報が書かれていないと判断し、次の領域候補について同様の処理を行う。ここで、この発明では各領域につき一行から数行分の文字認識を行うだけでよいため、1領域あたりの処理時間が短くてすむため、複数領域の候補について確認をとることが可能となる。
【0010】
【発明の実施の形態】
以下、この発明の第1の実施の形態について図面を参照して説明する。
図1はこの発明の第1の実施の形態に係わる光学的文字読取装置の構成を示すブロック図であり、図2は図1の宛名領域検出部の内部構成を示すブロック図である。
【0011】
図1において、郵便物Mの画像が光学的文字読取装置1の光電変換回路2により電気信号に変換され、2値化処理部3により白画素と黒画素を示す2値信号に変換される。2値化処理部3から得られた2値信号は黒画素連結領域抽出部4の画像メモリに一時格納され、この画像メモリ上で黒画素連結領域が抽出される。一般に郵便物の宛名記載は黒字で行われ、かつ宛名文字は1行または複数行に亘って記載される。したがって、郵便物の画像中から黒画素連結領域を検出すると、この検出された黒画素連結領域には宛名文字列を構成する文字もしくは文字の一部分が含まれている可能性が高い。検出された黒画素連結領域からは、その領域に外接する矩形情報が求められる。
【0012】
黒画素連結領域抽出部4により抽出された黒画素連結領域に外接する矩形情報は、宛名領域の検出のために宛名領域検出部5に送られる。宛名領域検出部5により検出された領域に含まれる宛名文字の読取りは、宛名文字行から個々の文字の検出を次の文字検出切り出し回路6にて行い、この切り出された文字一つ一つについて行う。
【0013】
ここで、宛名領域検出部5の内部の構成を図2を参照して説明する。図2において、黒画素連結領域抽出部4により抽出された黒画素連結領域に外接する矩形情報は、宛名領域の検出のために宛名領域検出部5の行候補検出部5aに送られてチェックされる。この宛名領域検出部5には、基準宛名領域データベース5Rが関連して設けられ、後述する行候補検出部5a、宛名領域候補検出部5b、行、領域評価部5c,および宛名筆頭部候補検出部5d夫々において予め用意されている基準となる情報を参照して、あるいは基準情報との比較に基づく類似度の大小により夫々の段階に於ける候補の検出が行われる。
【0014】
まず行候補検出部5aでは、黒画素連結領域抽出部4により抽出された各々の外接矩形情報に含まれる矩形領域の形状、郵便物上の位置などを表す情報が基準宛名領域データベース5Rに格納されている対応する基準情報と比較され、この比較結果をもとに複数の外接矩形領域を統合して行候補領域を切り出して、その行候補の矩形情報を抽出するようになっている。
【0015】
検出された行候補情報は次に宛名領域候補検出部5bにより処理され、基準宛名領域データベース5Rに格納されている対応する基準情報と比較され、この比較結果をもとに一つもしくは複数箇所の宛名領域候補が検出される。
【0016】
検出された宛名候補領域に対しては、検出された宛名候補領域に行がいくつ含まれているか、あるいは行数が所定数nよりも多いか少ないか、検出された行の平均幅が所定の寸法より大きいか、小さいか、あるいは検出された行の幅の分布がどのようになっているか、検出された宛名候補領域に含まれている行の位置の分布がどのようなものかなどが行、領域の評価部5cにより評価される。この行、領域の評価部5cによる評価の方法の詳細は後で説明する。
【0017】
行、領域の評価部5cにより宛名領域であると評価する際には、宛名領域候補検出部5bにより検出された宛名領域候補の一つ一つについて同様に基準宛名領域データベース5Rに格納されている対応する基準情報と比較され、その中に含まれる行の数、サイズ、および行位置の分布から宛名の記載書式を判定し、この判定された書式に応じて次の宛名筆頭部行候補検出部5dにおいて、宛名筆頭行の候補を検出する。
【0018】
検出された宛名候補領域が複数の場合は、この複数の宛名候補領域の夫々についてその中の筆頭部候補を宛名筆頭部行候補検出部5dにより検出し、所定の記憶エリアに格納しておく。
【0019】
このようにして宛名領域検出部5により検出された宛名筆頭行部候補の一つ、例えば最も筆頭部として可能性の高い行を一つ選択し、この行について次の文字検出切り出し回路6で個々の文字を切り出し、順次認識回路7に送り、文字辞書8を用いて文字認識を行う。宛名筆頭行部の文字全てについて文字認識が行われ、認識された文字は次の知識処理回路9に送られ、知識辞書10を用いて市区町村名の宛名識別が行われる。識別された市区町村名が予め知識辞書10に格納された実在の宛名と一致すれば、処理された宛名筆頭行部候補が含まれる宛名領域中の全ての行についても同様に識別し、読み取られた宛名情報は読取り結果処理回路11に送られ、所定の配達区分処理が行われる。
【0020】
図1の光電変換回路2で読取られた郵便物Mの画像が、例えば図3の(a)に示したように縦方向の中央部に横書きでL1,L2の2行にわたって記載された宛名部分を持つ場合を例に取って図1、図2に示した光学的文字読取装置1の動作を説明する。処理対象となる郵便物Mの画像には更に広告文字行L3,L4ならびに切手L5の画像が含まれているものとする。なお、以下の説明では通常の書状で切手や郵便番号枠が上にきて長手方向の辺が縦になるような書状の置き方を縦置き、切手や郵便番号枠が右手にきて短手方向の辺が縦になるような書状の置き方を横置きと呼ぶことにする。また縦行とは書状長手方向に長い行のことを指し、横行とは書状短手方向に長い行のことを指すものとする。
【0021】
光電変換回路2で読取られた郵便物Mの画像データからは、2値化処理部3により微分・2値化処理を施したのち、黒画素連結領域抽出部4にて図3の(b)に示したような行L1,L2,L3,L4に対応する連結黒画素領域に外接する矩形情報を求める。この矩形情報はそれぞれの文字に対応しており、この情報は宛名領域検出部5内の行候補検出部5aにおいて横方向に隣接する外接矩形情報を統合することによって、図3(c)に示したような行L1,L2,L3,L4を検出する。
【0022】
これらの検出された行L1,L2,L3,L4の情報は宛名領域候補検出部5bにおいてさらに隣接する行を統合して、図3(d)に示したように行L1,L2に対応する第1の宛名領域候補A1ならびに第2の宛名領域候補A2を検出する。各領域A1,A2内の夫々の行L1〜L4は、行サイズ・相対位置を図3(e)において基準宛名領域データベース5Rに格納されているあらかじめ用意された評価基準にかけられ、夫々の領域A1,A2内において類似度あるいは評価値の高いものが宛名書きだし行候補、即ち宛名筆頭行部として選択される。領域A1,A2内において筆頭行候補として選択された行は図3(f)に示したようにハッチングで示される。
【0023】
宛名書きだし行候補は複数箇所選択され、評価値の高いものから順に図3(g)に示したフィードバック処理にかけられる。フイードバック処理では、まず、図3(h)において宛名書きだし行候補の中から行L1を選択し、図3(i)においてその行L1の各々の文字検出を行い、図3(j)において個々の文字識別を行い、識別された文字列に対して図3(k)において市町村名識別、たとえば町名識別処理を行う。次に図3(l)においてその識別結果が宛名情報として読めるか調べる。もし知識辞書10を参照した結果、識別された文字列が意味をなしていなければ、別の領域A2の筆頭行、例えばL3を選択して同様の処理を繰り返す。もし図3(l)において意味をなしていれば、その行L1の前または後の行、ここでは後の行L2を認識処理にかけ,宛名情報を完成させる。
【0024】
次に、図2の行、領域の評価部5cにおいて宛名がどのような書式で記載されているか判断する処理について説明する。これは、最初に郵便物に宛名が記載される主な書式をいくつか情報として持っておき、与えられた書状がどの書式で書かれている可能性が高いか判断する処理を行う。図4は、宛名の記載される書式の分類方式の一例である。図4に挙げているのは、宛名行の方向および記載位置に注目して縦置き横書き(a)、縦置き横書き(b)、横置き横書きの正方向(c)および逆方向(d)の4通りに宛名の書式を分類した例である。この例以外の宛名行方向・位置の場合を宛名記載書式に追加登録してもよい。また、宛名の方向・記載位置の他に宛名行サイズも考慮してさらに宛名記載書式を細かく分類して定義してもよい。
【0025】
宛名の記載書式を判断する手法の一例として、書状画像から行を切り出した後縦置きした時の画像上部から横書き行が見つかった場合は縦置き横書き方向に宛名が書かれていると判断する方法が考えられる。またこの場合、書状上部に書かれている横行ほど宛名行書きだし候補の検出処理にかける優先順位を高くする処理を行うことが考えられる。
【0026】
以下、図2の行、領域評価部5cにおける行、領域の評価の具体例を図5乃至図11を参照して詳細に説明する。
図5の例では、図5(a)に示したように縦置きの書状に2行の縦書で宛名が記載された郵便物の場合であり、図5(b)はこの郵便物の画像から宛名記載領域を判定し、宛名が手書きで表示された場合の宛名行を検出する処理を示すフローチャートを示す。図2の宛名領域候補検出部5bで検出された領域に含まれた行を切り出した後、図5(b)の最初のステップST1において検出された行数がn行以下、例えば4行以下であるか否かを判定し、n行以下でなければ宛名領域ではないものとしてステップST2の別の判定処理にうつる。
【0027】
ここではn行以下であるから、宛名が手書きであり、手書きフラグをステップST3でセットし、ステップST4で手書きの宛名用に用意した筆頭宛名行検出処理を行う。この筆頭宛名行検出処理は図2の宛名筆頭部候補行検出部5dにおいて行われる。
【0028】
上記の宛名行が4行以下か否かという判定条件は、別の条件と組み合わせて使用してもよい。一例として宛名が書状長手方向であるという条件と組み合わせた場合を図6に示す。図6(a)に示した書状画像から行を切り出した後、ステップST11で検出された行のうち書状長手方向の行数がn行以下であるか否かを判定し、n行以上であれば別の判定処理(ST12)にうつる。n行以下であれば宛名が書状長手方向に手書きで書かれていると判断(ST13)し、宛名行が手書きの縦行である場合用に用意した宛名行検出処理を行う(ST14)。例えば、書状から検出された縦行数が4行以下であれば宛名が手書きであると判断する。なお、行方向の条件を書状長手方向とする代わりに書状短手方向としても良い。
【0029】
宛名の記載領域を判断する手法の別の例を図7に示す。図7(a)に示す書状画像から行を切り出した後、書状から検出された行の平均幅を図7(b)のステップST21にて計算し、行平均幅がWミリメートル以上であるか否かを判定(ST22)し、Wミリメートル以上でなければ別の判定処理(ST23)にうつる。
【0030】
Wミリメートル以上であれば宛名が手書きであると判断(ST24)し、手書きの宛名用に用意した筆頭宛名行検出処理を行う(ST25)。例えば、書状から検出された行の平均幅が20mm以上であれば宛名が手書きであると判断する。なお行平均幅のしきい値は、ミリメートル単位の代わりに画素数単位で与えても良い。また上の例では平均幅を求めるために書状画像から検出した全ての行を使用しているが、書状画像の特定領域に書かれた行のみを用いて平均幅を算出しても良い。
【0031】
上記の判定条件は、別の条件と組み合わせて使用してもよい。一例として宛名行が書状長手方向であるという条件と組み合わせた場合を図8に示す。図8(a)に示した書状画像から行を切り出した後、図8(b)のステップST31にて書状から検出された行のうち縦行の平均幅を計算し、行平均幅がWミリメートル以上であるか否かを判定(ST32)し、Wミリメートル以上でなければ別の判定処理(ST33)にうつる。Wミリメートル以上であれば宛名が書状長手方向に手書きで書かれていると判断(ST34)し、宛名行が手書きの縦行である場合用に用意した筆頭宛名行検出処理を行う(ST35)。例えば、書状から検出された縦行の平均幅が20mm以上であれば宛名が手書きであると判断する。なお行平均幅のしきい値は、ミリメートル単位の代わりに画素数単位で与えても良い。また、行方向の条件を書状長手方向とする代わりに書状短手方向としても良い。さらに、上の例では平均幅を求めるために書状画像から検出した全ての行を使用しているが、書状画像の特定領域に書かれた行のみを用いて平均幅を算出しても良い。
【0032】
画像から検出した行の平均幅を用いて宛名の記載形式を推定するためには、行の平均幅が宛名行幅に近い値である必要がある。画像から検出した行の幅サイズにばらつきがある場合の筆頭宛名行検出手法の例を図9に示す。図9(a)に示す書状画像から行を切り出した後、図9(b)に矩形で囲んで示すように宛名行の可能性の高い行を選択し、選択した行の平均幅によって宛名の記載書式を判定する。
【0033】
まず書状から検出された行の幅サイズの分布を調べておき(ST41)、行の平均幅を計算(ST42)する。次に検出した行のうち、平均幅の1/mよりは幅が広くかつn倍以下の幅である行を選択(ST43)し、選択した行の平均幅を計算して、宛名書式判定用の基準幅とする(ST44)。基準幅がWミリメートル以上であるか否かを判定(ST45)し、Wミリメートル以上でなければ別の判定処理(ST46)にうつる。
【0034】
Wミリメートル以上であれば宛名が手書きであると判断(ST47)し、手書きの宛名用に用意した筆頭宛名行検出処理を行う(ST48)。例えば、m=2,n=1.5,基準幅が20mm以上であれば宛名が手書きであると判断する。なお行平均幅のしきい値は、ミリメートル単位の代わりに画素数単位で与えても良い。また上の例では基準幅を求めるために書状画像から検出した全ての行を使用しているが、書状画像の特定領域に書かれた行のみを用いて基準幅を算出しても良い。
【0035】
上記の判定条件は、別の条件と組み合わせて使用してもよい。一例として宛名が書状長手方向であるという条件と組み合わせた場合を図10に示す。図10(a)に示す書状画像から行を切り出した後、図10(b)に示したように宛名行の可能性の高い縦行を選択し、図10(c)の各々のステップにおいて選択した行の平均幅によって宛名の記載書式を判定する。
【0036】
まず書状から検出された縦行の幅サイズの分布を調べておき(ST51)、縦行の平均幅を計算(ST52)する。次に検出した縦行のうち、平均幅の1/mよりは幅が広くかつn倍以下の幅である行を選択(ST53)し、選択した縦行の平均幅を計算して、宛名書式判定用の基準幅とする(ST54)。基準幅がWミリメートル以上であるか否かを判定(ST55)し、Wミリメートル以上でなければ別の判定処理(ST56)にうつる。Wミリメートル以上であれば宛名が書状長手方向に手書きで書かれていると判断(ST57)し、宛名行が手書きの縦行である場合用に用意した筆頭宛名行検出処理を行う(ST58)。例えば、m=2,n=1.5,基準幅が20mm以上であれば宛名が手書きであると判断する。なお行平均幅のしきい値は、ミリメートル単位の代わりに画素数単位で与えても良いし、行方向の条件を書状長手方向とする代わりに書状短手方向としても良い。また上の例では基準幅を求めるために書状画像から検出した全ての行を使用しているが、書状画像の特定領域に書かれた行のみを用いて基準幅を算出しても良い。
【0037】
宛名の記載書式を判断する手法の別の例を図11に示す。図11(a)のステップST61において、書状から検出された行の記載位置の分布を調べ、検出した行のうち、ステップST62において書状を縦置きした時の右半分の領域に行領域全部または行領域の一部がかかっている行がどれだけあるか調ベる。行総数のうちn%以上でなければ図12(a)の別の判定処理(ステップST71)にうつる。
【0038】
n%以上であれば宛名が図11(b)または図11(d)に示したように書状右半分に縦置き縦書き方向または横置き横書き方向に書かれていると判断する(ST63)。例えば図11(b)または図11(d)に示した書状では、いずれの書状もその右半分に全行数の70%以上の行が書かれており、書状右半分に縦置き縦書き、または横置き横書きに書かれていると判断する。
【0039】
反対に、図12(b)に示したように書状の左半分に全行数の70%以上の行が書かれている場合、図12(a)のステップST71いおいて検出した行のうち書状を縦置きした時の左半分の領域に行領域全部または行領域の一部がかかっている行がどれだけあるか調ベ、行総数のうちn%(例えばn=70)以上でなければ別の判定処理(ST72)にうつる。
【0040】
70%以上であれば宛名が書状左半分に書状下から上方向に横置き横書きで書かれていると判断する(ST73)。例えば図12(b)の書状が与えられて、書状左半分に全行数の70%以上の行が書かれていた場合、図12(c)のように書状左半分に書状下から上方向に横置き横書きに書かれていると判断する。
【0041】
ここで、郵便物画像から宛名記載領域を検出する処理の具体例について図13を参照してさらに説明する。図13(a)に示した書状画像から同図(b)の行情報を検出する。次に、宛名の記載書式ごとに宛名行を検出するデフォルトの領域および宛名行方向を定義しておき、宛名行と方向が同じで行デフォルト領域に行領域がかかる行を選択して宛名行候補とする。例えば宛名が縦置き横書きで書かれていると仮定した時は図13(c)の斜線領域にかかっている横行を選択し、横置き横書きまたは縦置き縦書きで書かれていると仮定した時は図13(d)または(e)の斜線領域にかかっている縦行を選択する。図13(a)の書状の場合は、図13(f),(g)に示したように、縦置き横書きと正方向の横置き横書きの宛名領域候補および宛名行候補が検出されるが、図13(e)に示したように斜線部が逆方向の右端に偏った場合には図13(h)において横置き横書きの宛名行候補は検出されない。
【0042】
以上のように検知された各記載書式ごとに、選択された行の中から宛名行を見つける処理を行う。以下、郵便物画像から宛名行を検出し読みとる処理について説明する。図14は郵便物画像から宛名の書きだしの行をまず検出し、そのあと宛名の続きの行を順次文字認識にかける処理の一例である。
【0043】
図14のステップST181において郵便物画像を入力し、この入力された郵便物画像からステップST182において行情報を検出し、ステップST183にて検出した各行の記載位置および行サイズの分布を調べ分析する。
【0044】
分析の結果最も可能性の高い宛名の記載書式を判定(ST184)し、その宛名記載書式に対応する宛名行検出処理を行い1行または複数の宛名の書きだしすなわち筆頭行候補を選択する(ST185)。選択された宛名書きだし行候補は優先順位の高い順に文字検出および文字認識処理にかけられ、例えば町名の一部として読めるかどうか判断される(ST186)。
【0045】
宛名書きだし行候補の中に町名として読める行が存在すればその行の郵便物画像上での位置の近くから続きの行を見つけ、宛名行として順次文字検出および文字認識処理にかけていく(ST187)。町名として読める宛名書きだし行候補がなかった場合は2番目に可能性の高い宛名記載書式を選択(ST188)し、その宛名記載書式に対応する宛名行検出処理を行い1行または複数の宛名の書きだし行候補を選択する(ST189)。以下、町名の一部として読める宛名書きだし行候補が見つかる(ST190)まで可能性の高い宛名記載書式を順次選択(ST191)し、その宛名記載書式に対応する宛名行検出処理を行って1行または複数の宛名の書きだし行候補を選択(ST192)し、選択された宛名書きだし行候補は優先順位の高い順にn番目まで文字検出および文字認識処理にかけて、町名として読めるかどうか判断する(ST193)処理を繰り返す。
【0046】
第n番目の宛名記載処理まで処理して宛名書きだし行が見つからなかった場合は処理を打ち切りリジェクトする。ここで可能性があまり低い場合はエラーとなることが多いので、nの値は例えば3などの固定値であってもよい。また、最初に選択した宛名記載書式によってnの値を変えても良い。一例として、縦置き横書きと最初に判定した場合は最初の候補で宛名が読めることが多いのでn=1とし、それ以外の場合はn=4とする処理が考えられる。
【0047】
次に郵便物画像に書かれた行の位置やサイズの分布を調べて宛名の記載書式を判定する際、記載書式を1つに絞りきれない場合の処理の一例を図15に示す。ここではほとんどの処理が図14の場合と同じなので対応する処理は同じ番号を付してある。図15において、郵便物画像(181)から行情報を検出(ST182)し、検出した各行の記載位置および行サイズの分布を調べ分析(ST183)して可能性の高い宛名記載書式をいくつか選択する(ST184A)。
【0048】
可能性の高い宛名記載書式がn通りあった場合、まずn個の中で最も可能性の高い宛名記載書式を1つ選択(ST184B)し、その書式に対応する宛名行検出処理を行って宛名行候補を検出する(ST185)。検出した宛名行候補に順次文字検出処理および文字認識処理をほどこし、その行が宛名の一部として読めるか調ベる(ST186)。宛名として読めた場合はその行の続きの行を順次宛名読み取り処理にかけていく(ST187)。
【0049】
読める行が見つからなかった場合は、第1の宛名記載書式に類似した宛名記載書式を優先的に選択し(ST188A)、その宛名記載書式に対応する宛名行検出処理を行って宛名行候補を検出(ST189)し、検出した候補の中から宛名の一部として読める行を探し(ST190)、宛名行が見つからなければ別の宛名記載書式で同様の処理を繰り返す(ST190),(ST191),(ST192),(ST193)。n番目の宛名記載書式でも宛名行が見つからなかった場合はリジェクトする。
【0050】
次に郵便物画像に書かれた行の位置やサイズの分布を調べて宛名の記載書式を判定する際、記載書式を1つに絞りきれない場合の処理の別の例を図16に示す。これは、たとえば図16(a)および図16(b)に示すように、宛名が書状右半分に書かれている2つの書状において、行の書かれた位置およびサイズが非常に類似していて、宛名の書式が縦置き縦書きなのか横置き横書きなのかは文字認識処理を行うまで判断することが困難であるような場合である。このような場合、一方の宛名記載書式で書かれた書状が他方の宛名記載書式で書かれた書状よりも郵便局に多く届く時には、一番多く届く宛名記載書式に対応する宛名行検出処理を行い、見つからなかった場合に2番目に多く届く宛名記載書式に対応する宛名行検出処理処理を行うのが有効である。以下の説明は宛名が書状右半分に縦置き縦書き方向に書かれている場合の宛名行検出処理を先に行う場合である。
【0051】
図16(c)の最初のステップST201において宛名が書状右半分に書かれていると判断された書状から、ST202において宛名行の探索対象とする行を選択する。次に(a)のように、宛名が書状右半分に縦置き縦書き方向に書かれている場合の宛名行検出処理(ST203)を行い、宛名探索対象となる行の中から宛名行候補を選択する。
【0052】
宛名行候補を順次文字検出および文字認識処理にかけ、宛名の一部として読める行が存在するか調べる(ST204)。宛名行が見つかった場合は、その行の付近の行を順次宛名読みとり処理にかける(ST205)。宛名行が見つからなかった場合は、図16(b)に例示したように宛名が書状右半分に横置き縦書き正方向に書かれている場合の宛名行検出処理(ST206)を行い、宛名探索対象となる行の中から宛名行候補を選択する。宛名行候補を順次文字検出および文字認識処理にかけ、宛名の一部として読める行が存在するか調べる(ST207)。宛名行が見つかった場合は、その行の付近の行を順次宛名読みとり処理にかける(ST208)。
【0053】
これでも宛名行が見つからなかった場合はその他の宛名記載書式を選択した場合の宛名行検出処理を行う(ST209)。
この例では宛名が書状右半分に書かれている書状の場合について述べたが、他の制約条件と組み合わぜて使用しても良い。例えば(ST201)の部分を「宛名が手書きで書状右半分に書かれていると判断された書状」としても良い。
【0054】
次に、郵便物画像から宛名行を検出し読みとる処理のさらに別の例について説明する。図17は郵便物画像からハイフン「−」を含む行を検出しその行の付近に書かれた行を宛名行候補とする処理の一例である。これは、たとえば図4(a)に示した郵便物画像の最上行の郵便番号記載枠列210の中間に含まれているハイフン「−」211に基づき宛名に含まれる行情報,および番地表示行212中のハイフン213を検出するものである。
【0055】
図17の最初のステップST211において図4(a)に示したような郵便物の画像が取り込まれ、その最上部に横方向の文字行210をステップST212により検出する。
【0056】
次にステップST213において行数カウンタiに0をセットし、ステップST214にてiが検出した全行数よりも小さければ、すなわち1行以上の横行があれば、ステップST215において例えば行210中にハイフン「−」211が存在するか否かを調べる。このハイフン211の存在は、行210の2値化画像の射影情報を用いたり、行210内の黒画素外接矩形の形状を調べることによって判定する。行210中にハイフンが存在していなければステップST216にてiの値を1つ増やしてST214の処理に戻る。
【0057】
ハイフン211が見つかった場合はステップST217で行210のフラグをセットして(ST214)の処理に戻る。iの値が行数と等しくなった時点(この場合はi=3)で処理を終了する。同様に3行目の行212にもハイフン213が検出される。全ての行を評価し終ったあと、ST218にて書状上でフラグがセットされた2行(210、212)で挟まれた1行(214)または複数行から構成される行セットを検出する。
【0058】
ついで、行セット数カウン夕jに0をセット(ST219)し、jが検出した全行セット数よりも小さければ(ST220),フラグがセットされた2行(210,212)を郵便番号行および街区情報を含む行とし、2行に挟まれた行セットjに属する行(214)を順次文字検出および文字認識処理にかけて(ST221)宛名として読めるか調べる(ST222)。なおフラグがセットされた2行のどちらが郵便番号行か判定出来た場合は行セットjの中でその行に近い側の行から順に宛名読み取り処理にかける。2行のどちらが郵便番号行か判定出来なかった場合は、一方の行が郵便番号行であった場合の処理を両方の行について行う。行セットjが宛名読み取り処理にかけた結果宛名として読めた場合は、読み取り結果を出力する。宛名として読めなかった場合はjの値を1つ増やして(ST223)、(ST220)の処理に戻る。
jの値が全行セット数と等しくなって宛名が見つかっていない場合は別の宛名検出処理に移るか、リジェクト処理を行う。
【0059】
【発明の効果】
以上詳述したようにこの発明によれば、宛名領域候補を迅速に検出でき、また各領域候補のごく一部分に対して文字認識を行なうことによって宛名領域か否かの確認が速やかにできるので、1領域あたりの宛名領域か否かの判定処理が高速に実行でき、したがって、郵便物画像から複数の宛名領域候補をとり、個々について順次宛名領域か否かの確認が可能となり、宛名読み取り性能を向上させることが可能となる。また、各宛名領域候補において、領域内の行に読みとり順序を設定しているため、宛名書きだし行として選択した行がそうでなかった場合も次の候補をすぐ選択できる。上記の効果により、宛名書きだし行以降の住所情報を読みとる際、認識すべき行を選択することが容易である。書状上の行のサイズ、分布、記載位置を評価して宛名の記載書式を推定するため、宛名行の検出が容易になる。更に宛名の記載書式ごとに宛名行を検索する領域を用意し、その領域から宛名行検出を行うため一書式あたりの宛名行検出処理時間が短い。複数の宛名記載書式を書状に適用するため、最初に推定した宛名記載書式が正しくなくても、2番目以降に適用した宛名記載書式に正解があれば宛名情報を読みとることが出来る。
【図面の簡単な説明】
【図1】この発明の一実施の形態に係る郵便物の宛名領域検出装置の回路構成を示すブロック図。
【図2】図1の一部の回路の内部を詳細に示すブロック図。
【図3】この発明の一実施の形態に係る郵便物の宛名領域検出の処理の流れを示すフローチャート。
【図4】種々の宛名記載書式の例を示す図。
【図5】宛名記載書式の判定処理の一例を示す図。
【図6】宛名記載書式の判定処理の他の例を示す図。
【図7】宛名記載書式の判定処理の他の例を示す図。
【図8】宛名記載書式の判定処理のさらに他の例を示す図。
【図9】宛名記載書式の判定処理のさらに他の例を示す図。
【図10】宛名記載書式の判定処理のさらに他の例を示す図。
【図11】宛名記載書式の判定処理のさらに他の例を示す図。
【図12】宛名記載書式の判定処理のさらに他の例を示す図。
【図13】宛名記載領域検出の種々の例を示す図。
【図14】この発明の一実施の形態に係る郵便物の宛名行検出の処理の流れを示すフローチャート。
【図15】この発明の他の実施の形態に係る郵便物の宛名行検出の処理の流れを示すフローチャート。
【図16】この発明の更に他の実施の形態に係る郵便物の宛名行検出の処理の流れを示すフローチャート。
【図17】この発明の更に他の実施の形態に係る郵便物の宛名行検出の処理の流れを示すフローチャート。
【符号の説明】
1…光学的文字読取り装置
2…光電変換回路
3…2値化処理部
4…黒画素連結領域抽出部
5…宛名領域検出部
5a…行候補検出部
5b…宛名領域候補検出部
5c…行、領域の評価部
5d…宛名筆頭部行候補検出部
5R…基準宛名領域データベース
6…文字検出切り出し部
7…認識回路
8…文字辞書
9…知識処理回路
10…知識辞書
11…読取り結果処理回路
M…郵便物
Claims (7)
- 郵便物表面より光電変換して画像信号を得る画像入力手段と、
この画像入力手段により得られた前記画像信号を格納する画像メモリと、
この画像メモリの前記画像信号を2値画像判定した黒画素連結領域とこの黒画素連結領域に外接する外接矩形情報を抽出する黒画素連結領域抽出部と、
この黒画素連結領域抽出部により抽出された前記外接矩形情報から行候補の矩形情報を抽出する行候補検出部と、
この行候補検出部により抽出された矩形情報から宛名領域候補を検出する宛名領域候補検出部と、
前記宛名領域候補に含まれる文字情報から宛名領域を確定する宛名領域確定手段と、
を具備することを特徴とする郵便物の宛名領域検出装置。 - 前記行候補検出部は、
郵便物表面の宛名領域に含まれる行画像の種々の特徴パターンを類型化して記憶する手段と、
前記検出された行画像の特徴と記憶された行画像の種々の特徴パターンとの類似度を検出する手段と、
この検出された類似度の高い順に宛名領域候補を決定する手段と、
を具備することを特徴とする請求項1に記載の郵便物の宛名領域検出装置。 - 前記宛名領域確定手段は、前記検出された複数文字を含む文字行を表す行画像の記載位置および郵便物の長辺または短辺に対する宛名文字の方向を検出する領域情報検出手段を含むことを特徴とする請求項1に記載の郵便物の宛名領域検出装置。
- 前記領域情報検出手段は、予め複数の郵便物について前記文字行の数、サイズ、分布状態、位置についての統計データを蓄積したデータベースと、前記検出された文字行の数、サイズ、分布状態、位置のうちの少なくとも一つを示すデータと前記データベースとの対応関係から宛名記載位置および宛名文字の方向について少なくとも2個の候補を出力する手段とを有することを特徴とする請求項3に記載の郵便物の宛名領域検出装置。
- 郵便物表面の2値画像情報を得る手段と、
この2値画像情報から郵便物中の文字行情報を検出する手段と、
郵便物表面画像中の文字行情報に応じて宛名記載位置および方向を検出する手段と、
前記郵便物表面画像から検出された行数があらかじめ用意したしきい値より少ない場合は宛名が手書きでなされていると判断する手段と、
この判断手段の結果により手書き宛名文字の認識処理を実行する手段と、
検出された宛名が縦置き郵便物の右側か左側に集中して記載されていることを検知する手段と、
縦置き郵便物の右側に集中して記載されている場合は宛名が縦書きであるものとして認識処理し、左側に行が集中している場合に横置き横書きとして認識処理する手段と、
を具備することを特徴とする郵便物の宛名領域検出装置。 - 前記検知手段は、検出された行のうち所定の割合の行が縦置き郵便物の右側か左側に集中して記載されていることを検知する手段を含むことを特徴とする請求項5による郵便物の宛名領域検出装置。
- 郵便物表面の2値画像情報を得る手段と、
この2値画像情報から郵便物中の文字行情報を検出する手段と、
郵便物表面画像中の文字行情報の分布状態に応じて宛名記載位置および方向を検出する手段と、
前記検出した各行についてハイフンが含まれているか調べる手段と、
この手段によりハイフンを含む行が2行ある場合に、それぞれを郵便番号行および街区行と判断する手段と、
前記ハイフンを含む2行にはさまれた1行または複数行を宛名行と判断する手段と、を具備することを特徴とする郵便物の宛名領域検出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25993796A JP3673034B2 (ja) | 1996-09-30 | 1996-09-30 | 郵便物の宛名領域検出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25993796A JP3673034B2 (ja) | 1996-09-30 | 1996-09-30 | 郵便物の宛名領域検出装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH1099788A JPH1099788A (ja) | 1998-04-21 |
| JP3673034B2 true JP3673034B2 (ja) | 2005-07-20 |
Family
ID=17341004
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP25993796A Expired - Fee Related JP3673034B2 (ja) | 1996-09-30 | 1996-09-30 | 郵便物の宛名領域検出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3673034B2 (ja) |
-
1996
- 1996-09-30 JP JP25993796A patent/JP3673034B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH1099788A (ja) | 1998-04-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100324847B1 (ko) | 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 | |
| JPH11226513A (ja) | 郵便物宛先読取装置及び郵便物区分装置 | |
| KR100536509B1 (ko) | 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치 | |
| JP3485020B2 (ja) | 文字認識方法及び装置ならびに記憶媒体 | |
| US20060291692A1 (en) | Information processing apparatus having learning function for character dictionary | |
| JP2000285190A (ja) | 帳票識別方法および帳票識別装置および記憶媒体 | |
| JPH06501801A (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
| CN114937269B (zh) | 一种基于英文和汉字联合的船舶号牌识别方法及系统 | |
| JPH0739820A (ja) | 街区認識装置および宛名読取区分機 | |
| JP3673034B2 (ja) | 郵便物の宛名領域検出装置 | |
| JP4855698B2 (ja) | 宛先認識装置 | |
| JPH06124366A (ja) | 住所読取装置 | |
| JP3162552B2 (ja) | 郵便物あて名認識装置及びあて名認識方法 | |
| JP3673616B2 (ja) | 商品券識別方法及び装置 | |
| CA2473278C (en) | Sorting apparatus and address information determination method | |
| JP5178851B2 (ja) | 宛先認識装置 | |
| JPH07271899A (ja) | 文字認識装置 | |
| JP3160347B2 (ja) | 郵便物の宛名読取装置 | |
| JP2571236B2 (ja) | 文字切出し識別判定方法 | |
| JPH11179289A (ja) | 郵便物区分装置 | |
| JPH10432A (ja) | 郵便物の住所読取方法及び郵便物の住所読取装置 | |
| JP4659947B2 (ja) | 読取装置、読取方法、区分装置、及び区分方法 | |
| JPH08164365A (ja) | 宛名読取装置 | |
| JPH11226516A (ja) | カスタマバーコード印字郵便物上の宛名読み取り装置 | |
| JPS63303481A (ja) | 住所読取装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040720 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040831 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041101 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050208 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050325 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050419 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050421 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080428 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090428 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110428 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130428 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |