JPH05324899A - 郵便物記載住所認識装置 - Google Patents
郵便物記載住所認識装置Info
- Publication number
- JPH05324899A JPH05324899A JP4131226A JP13122692A JPH05324899A JP H05324899 A JPH05324899 A JP H05324899A JP 4131226 A JP4131226 A JP 4131226A JP 13122692 A JP13122692 A JP 13122692A JP H05324899 A JPH05324899 A JP H05324899A
- Authority
- JP
- Japan
- Prior art keywords
- address
- word
- character
- recognizing
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
Landscapes
- Sorting Of Articles (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】郵便物表面に記載されているあて名を文字認識
処理により読み取った結果にもとづいて個個の郵便物を
区分する郵便物あて名自動読取区分機の住所認識処理に
おいて,住所情報の階層性に着目し,各階層の単語デー
タを個別に用意し,文字列途中までの認識結果によって
次の階層レベルの照合単語を限定変化させ単語検索時間
を短縮し,かつ誤認識を削減する。 【構成】住所認識部6の認識処理において使用する住所
単語辞書記憶部9の住所単語辞書のデータ構造に,アド
レスポインタによる階層性を持たせる。住所単語辞書は
アドレスレジスタと単語記憶部とから構成されている。
これにより,非現実的な組み合わせの単語照合検索処理
が不要になり,検索時間の短縮と類似町名に対する誤認
識の削減とが確保できる。
処理により読み取った結果にもとづいて個個の郵便物を
区分する郵便物あて名自動読取区分機の住所認識処理に
おいて,住所情報の階層性に着目し,各階層の単語デー
タを個別に用意し,文字列途中までの認識結果によって
次の階層レベルの照合単語を限定変化させ単語検索時間
を短縮し,かつ誤認識を削減する。 【構成】住所認識部6の認識処理において使用する住所
単語辞書記憶部9の住所単語辞書のデータ構造に,アド
レスポインタによる階層性を持たせる。住所単語辞書は
アドレスレジスタと単語記憶部とから構成されている。
これにより,非現実的な組み合わせの単語照合検索処理
が不要になり,検索時間の短縮と類似町名に対する誤認
識の削減とが確保できる。
Description
【0001】
【産業上の利用分野】本発明は郵便物記載住所認識装置
に関し,特に郵便物あて名自動読取区分処理において,
認識対象の住所モデルに階層的データ構造を持たせて最
終認識結果を算出する階層的住所認識を行なう郵便物記
載住所認識装置に関する。
に関し,特に郵便物あて名自動読取区分処理において,
認識対象の住所モデルに階層的データ構造を持たせて最
終認識結果を算出する階層的住所認識を行なう郵便物記
載住所認識装置に関する。
【0002】
【従来の技術】従来の郵便物記載住所認識装置は,入力
した文字パターンと辞書パターンとを比較照合するパタ
ーン照合処理を採用し,それぞれの文字パターンに対し
て出力した第一候補の文字カテゴリー群の中から,あら
かじめ登録されている住所単語と最も合致しているもの
を,それぞれの住所レベルで検索判定していた。
した文字パターンと辞書パターンとを比較照合するパタ
ーン照合処理を採用し,それぞれの文字パターンに対し
て出力した第一候補の文字カテゴリー群の中から,あら
かじめ登録されている住所単語と最も合致しているもの
を,それぞれの住所レベルで検索判定していた。
【0003】ここでいう住所レベルとは,住所の構成要
素を都道府県名・市区名・町村名・字名(あざめい)・
丁目・番地・号・号棟として設定した場合のそれぞれの
構成要素の階層性を正の整数で表現したものである。
素を都道府県名・市区名・町村名・字名(あざめい)・
丁目・番地・号・号棟として設定した場合のそれぞれの
構成要素の階層性を正の整数で表現したものである。
【0004】したがって,ある字名は特定の町名の下に
しか存在しない場合でも,実際の住所認識処理として
は,町名検索後に認識用単語辞書に登録されているすべ
ての字名と総当り的な単語照合を行い,最も合致する字
名を字名の最終判定結果としていた。
しか存在しない場合でも,実際の住所認識処理として
は,町名検索後に認識用単語辞書に登録されているすべ
ての字名と総当り的な単語照合を行い,最も合致する字
名を字名の最終判定結果としていた。
【0005】
【発明が解決しようとする課題】この従来の郵便物住所
認識装置では,町名検索後の字名検索のように,住所の
データ構造が階層性を持つ場合に,字名テーブルに登録
されているすへての字名との照合を行ない,最もよく合
致する字名を字名の最終判定結果とするため,現実には
存在しない町名と字名の組み合わせについても検索を行
なうこととなり,検索時間が必要以上にかかり,また類
似字名を持つ場合には誤判定の主要な原因となるという
問題点があった。
認識装置では,町名検索後の字名検索のように,住所の
データ構造が階層性を持つ場合に,字名テーブルに登録
されているすへての字名との照合を行ない,最もよく合
致する字名を字名の最終判定結果とするため,現実には
存在しない町名と字名の組み合わせについても検索を行
なうこととなり,検索時間が必要以上にかかり,また類
似字名を持つ場合には誤判定の主要な原因となるという
問題点があった。
【0006】本発明の目的は上述した問題点を解決し,
住所情報の階層性に着目し,各階層の単語データを個別
に用意して,文字列途中までの認識結果にもとづいて次
の階層レベルの照合単語を効率的に変化設定させるよう
に住所パターンの接続関係を流動的に扱うことにより,
検索時間と誤判定とを著しく圧縮しうる郵便物記載住所
認識装置を提供することにある。
住所情報の階層性に着目し,各階層の単語データを個別
に用意して,文字列途中までの認識結果にもとづいて次
の階層レベルの照合単語を効率的に変化設定させるよう
に住所パターンの接続関係を流動的に扱うことにより,
検索時間と誤判定とを著しく圧縮しうる郵便物記載住所
認識装置を提供することにある。
【0007】
【課題を解決するための手段】本発明の装置は,郵便物
の表面に記載されている住所情報としてのあて名を住所
単語との照合によって読み取った結果にもとづいて,個
個の郵便物を区分する郵便物あて名自動読取区分処理に
おける前記住所情報を認識する郵便物記載住所認識装置
であって,前記住所情報の階層性に着目し,前記住所情
報を構成する各階層の単語データを個別に用意し,文字
列の途中までの認識結果に対応して次の階層レベルでの
照合に必要とする照合単語を限定して変化設定する構成
を有する。
の表面に記載されている住所情報としてのあて名を住所
単語との照合によって読み取った結果にもとづいて,個
個の郵便物を区分する郵便物あて名自動読取区分処理に
おける前記住所情報を認識する郵便物記載住所認識装置
であって,前記住所情報の階層性に着目し,前記住所情
報を構成する各階層の単語データを個別に用意し,文字
列の途中までの認識結果に対応して次の階層レベルでの
照合に必要とする照合単語を限定して変化設定する構成
を有する。
【0008】
【実施例】次に,本発明について図面を参照して説明す
る。図1は,本発明の一実施例のブロック図であり,郵
便物を光走査した画像データを入力する画像入力部1
と,郵便物表面を撮像した画像からあて名が記載されて
いる画像領域を検出するあて名領域検知部2と,検出さ
れたあて名領域から一文字分の画像情報を検出する文字
切出し部3と,切り出された部分画像を文字認識に適当
な大きさと濃度の文字パターンに正規化する文字正規化
部4と,正規化された文字パターンと,あらかじめ登録
した辞書パターンを比較照合して個個の文字パターンに
対するカテゴリー付けを行なうパターン照合部5と,パ
ターン照合部5が判定した文字カテゴリー判定結果群の
中からあらかじめ装置に登録されている住所を検索判定
する住所認識部6と,住所認識の最終判定を行なう最終
判定部7と,パターン照合における標準とする辞書パタ
ーンを記憶する辞書パターン記憶部8と,住所認識に必
要な住所単語を記憶する住所単語記憶部9とを備えた構
成を有する。
る。図1は,本発明の一実施例のブロック図であり,郵
便物を光走査した画像データを入力する画像入力部1
と,郵便物表面を撮像した画像からあて名が記載されて
いる画像領域を検出するあて名領域検知部2と,検出さ
れたあて名領域から一文字分の画像情報を検出する文字
切出し部3と,切り出された部分画像を文字認識に適当
な大きさと濃度の文字パターンに正規化する文字正規化
部4と,正規化された文字パターンと,あらかじめ登録
した辞書パターンを比較照合して個個の文字パターンに
対するカテゴリー付けを行なうパターン照合部5と,パ
ターン照合部5が判定した文字カテゴリー判定結果群の
中からあらかじめ装置に登録されている住所を検索判定
する住所認識部6と,住所認識の最終判定を行なう最終
判定部7と,パターン照合における標準とする辞書パタ
ーンを記憶する辞書パターン記憶部8と,住所認識に必
要な住所単語を記憶する住所単語記憶部9とを備えた構
成を有する。
【0009】次に,本実施例の動作の説明に先立ち,本
発明の基本的特徴について説明する。
発明の基本的特徴について説明する。
【0010】本発明では,認識対象とする住所のデータ
構造を流動的に考え,住所パターンの接続関係を流動的
に扱える典型住所概念を住所モデルと呼び,この住所モ
デルのデータ構造に階層性を付与している。
構造を流動的に考え,住所パターンの接続関係を流動的
に扱える典型住所概念を住所モデルと呼び,この住所モ
デルのデータ構造に階層性を付与している。
【0011】具体的な住所モデルは,図2の(a)およ
び(b)に示すように,左から右に,レベル1からレベ
ル10に対応させて示す都道府県名,市区町村名,字
名,丁目5,丁目仕切記号,番地,番地仕切記号等を含
む典型住所モデルであり,すべての住所はこの型に当て
はめられるので,認識対象とする郵便物の記載住所や,
処理郵便局の局情による処理プログラムの固有化が回避
でき,統一した迅速処理が確保できるものとしている。
び(b)に示すように,左から右に,レベル1からレベ
ル10に対応させて示す都道府県名,市区町村名,字
名,丁目5,丁目仕切記号,番地,番地仕切記号等を含
む典型住所モデルであり,すべての住所はこの型に当て
はめられるので,認識対象とする郵便物の記載住所や,
処理郵便局の局情による処理プログラムの固有化が回避
でき,統一した迅速処理が確保できるものとしている。
【0012】次に,本実施例の動作について説明する。
【0013】画像入力部1から出力された郵便物表面の
全体画像から,あて名領域検知部2が住所領域の位置と
大きさとを検出する。
全体画像から,あて名領域検知部2が住所領域の位置と
大きさとを検出する。
【0014】文字切出し部3は,あて名領域検知部2が
検知した住所領域の画像情報について行のライン化を行
ない,一行の画像情報からさらに一文字を切り出す文字
切出しを行なう。
検知した住所領域の画像情報について行のライン化を行
ない,一行の画像情報からさらに一文字を切り出す文字
切出しを行なう。
【0015】切り出された一文字分の画像情報は,文字
正規化部4によりその大きさと濃度レベルを正規化され
た後,パターン照合部5で辞書パターン記憶部8に記憶
されている文字パターン群と比較照合され,個個の文字
ブロック画像に対するカテゴリー付けが行なわれる。
正規化部4によりその大きさと濃度レベルを正規化され
た後,パターン照合部5で辞書パターン記憶部8に記憶
されている文字パターン群と比較照合され,個個の文字
ブロック画像に対するカテゴリー付けが行なわれる。
【0016】住所認識部6は,住所単語記憶部9の記憶
する住所単語を利用し住所認識を行なう。
する住所単語を利用し住所認識を行なう。
【0017】住所単語記憶部9の記憶する住所単語は,
図3に示す如く,階層的住所単語辞書としてのデータ構
造を有し,町名テーブルと字名テーブルとはアドレスポ
インタを介して検索される。
図3に示す如く,階層的住所単語辞書としてのデータ構
造を有し,町名テーブルと字名テーブルとはアドレスポ
インタを介して検索される。
【0018】住所認識部6は,パターン照合部5が出力
した個個の文字の認識結果を受け,次の(1)〜(8)
の処理により住所を認識する。 (1)住所レベル3の町名を検索し,候補町名を見つけ
る。 (2)候補町名が上がった場合には,そのうち最も読取
りレベルが高い町名について以下の処理を行う。候補が
ない場合は,処理を中断し判定不能の結果を出す。 (3)町名の直前に住所レベル2の市区町村名があるか
検索する。存在すれば,町名の読取りレベルをさらに上
げる。 (4)レベル2の単語が検索できた時は,さらにその直
前にレベル1の単語があるかを検索し,あればその単語
情報を最終判定部7に転送する。 (5)(2)で選択された町名単語について,その町名
に対応した字名テーブル先頭アドレスを知るため,住所
単語記憶部9に町名とともに記憶されているアドレスポ
インタ値を読み出す。 (6)住所認識部6は,アドレスポインタで指定された
テーブルデータ,すなわち字名データをロードし,文字
認識結果バッファと照合する。照合が取れない場合はア
ドレスレジスタをインクリメントして次の字名データを
ロードし照合する。 (7)その結果,最も類似度が高い字名を最終判定部7
に転送する。 (8)それぞれの住所レベルにおいて,単語判定時には
次の住所レベルがいくつであるかを調査し,各住所レベ
ル別の単語テーブル先頭アドレスを図3のようにポイン
トすることにより,階層的照合を行なう。
した個個の文字の認識結果を受け,次の(1)〜(8)
の処理により住所を認識する。 (1)住所レベル3の町名を検索し,候補町名を見つけ
る。 (2)候補町名が上がった場合には,そのうち最も読取
りレベルが高い町名について以下の処理を行う。候補が
ない場合は,処理を中断し判定不能の結果を出す。 (3)町名の直前に住所レベル2の市区町村名があるか
検索する。存在すれば,町名の読取りレベルをさらに上
げる。 (4)レベル2の単語が検索できた時は,さらにその直
前にレベル1の単語があるかを検索し,あればその単語
情報を最終判定部7に転送する。 (5)(2)で選択された町名単語について,その町名
に対応した字名テーブル先頭アドレスを知るため,住所
単語記憶部9に町名とともに記憶されているアドレスポ
インタ値を読み出す。 (6)住所認識部6は,アドレスポインタで指定された
テーブルデータ,すなわち字名データをロードし,文字
認識結果バッファと照合する。照合が取れない場合はア
ドレスレジスタをインクリメントして次の字名データを
ロードし照合する。 (7)その結果,最も類似度が高い字名を最終判定部7
に転送する。 (8)それぞれの住所レベルにおいて,単語判定時には
次の住所レベルがいくつであるかを調査し,各住所レベ
ル別の単語テーブル先頭アドレスを図3のようにポイン
トすることにより,階層的照合を行なう。
【0019】ここでいう読取りレベルとは,住所構成各
部の読取り可否にしたがって,読み取れていれば+2
点,読み取れていなければ0点の加算をしたものであ
る。たとえば住所が,区名部,町名部,丁目部,番地部
から構成されている場合には,読み取りレベルの最低点
は0点,最大点は8点となる。
部の読取り可否にしたがって,読み取れていれば+2
点,読み取れていなければ0点の加算をしたものであ
る。たとえば住所が,区名部,町名部,丁目部,番地部
から構成されている場合には,読み取りレベルの最低点
は0点,最大点は8点となる。
【0020】また,この読取りレベルの読取り信頼度R
adは,町名・丁目・番地の単語類似度およびその付加情
報にもとづいて,次のように計算される。 Rad=ΣRi (i=1,2,3) ここで,R1は町名読取り信頼度,R2は丁目読取り信
頼度,R3は番地読取り信頼度であり,これらは次式で
算出される。
adは,町名・丁目・番地の単語類似度およびその付加情
報にもとづいて,次のように計算される。 Rad=ΣRi (i=1,2,3) ここで,R1は町名読取り信頼度,R2は丁目読取り信
頼度,R3は番地読取り信頼度であり,これらは次式で
算出される。
【0021】 R1=2*(文字認識結果と町名単語の一致文字数) −1*(文字認識結果と町名単語の不一致文字数) R2=2*(文字認識結果と丁目文字の一致文字数) −1*(文字認識結果と丁目文字の不一致文字数) R3=2*(文字認識結果と番地文字の一致文字数) −1*(文字認識結果と番地文字の不一致文字数) このようにして,町名検索後の字名検索のように住所の
データ構造が階層性を持つ場合に,字名テーブルに登録
されているすべての字名と総当り的照合を行なうことな
く,最も合致する字名を階層的に検索できる。
データ構造が階層性を持つ場合に,字名テーブルに登録
されているすべての字名と総当り的照合を行なうことな
く,最も合致する字名を階層的に検索できる。
【0022】すなわち,本発明では,認識対象とする住
所のデータ構造を変動的に考え,住所パターンの接続関
係を流動的に扱える典型住所概念を住所モデルとし,こ
の住所モデルのデータ構造に階層性を持たせている。具
体的には,住所モデルとは,図2に示すように,都道府
県名・市区町村名・字名・丁目・丁目仕切記号・番地・
番地仕切記号等から構成される典型住所モデルであり,
すべての住所はこの型に当てはめられるため,認識対象
となる郵便物の記載住所や,処理する郵便局の局情によ
る処理プログラムの固有化が避けられる。
所のデータ構造を変動的に考え,住所パターンの接続関
係を流動的に扱える典型住所概念を住所モデルとし,こ
の住所モデルのデータ構造に階層性を持たせている。具
体的には,住所モデルとは,図2に示すように,都道府
県名・市区町村名・字名・丁目・丁目仕切記号・番地・
番地仕切記号等から構成される典型住所モデルであり,
すべての住所はこの型に当てはめられるため,認識対象
となる郵便物の記載住所や,処理する郵便局の局情によ
る処理プログラムの固有化が避けられる。
【0023】これにより,不要な単語検索処理がなくな
るため,最終判定結果を得るまでの処理時間を著しく抑
圧でき,また異なる町名に関して類似字名を持つ場合に
は,町名別の字名検索を行うため誤判定を避けることが
できる。
るため,最終判定結果を得るまでの処理時間を著しく抑
圧でき,また異なる町名に関して類似字名を持つ場合に
は,町名別の字名検索を行うため誤判定を避けることが
できる。
【0024】
【発明の効果】以上説明したように本発明は,郵便物に
記載される住宅情報の階層性に着目し,各階層の単語デ
ータを個別に用意して,認識すべき文字列の途中までの
認識結果によって次の階層レベルの照合単語を限定変化
さることにより,住所情報の検索時間を大幅に短縮し,
誤認識を著しく削減できる効果がある。
記載される住宅情報の階層性に着目し,各階層の単語デ
ータを個別に用意して,認識すべき文字列の途中までの
認識結果によって次の階層レベルの照合単語を限定変化
さることにより,住所情報の検索時間を大幅に短縮し,
誤認識を著しく削減できる効果がある。
【図1】本発明の一実施例のブロック図である。
【図2】図1の実施例における住所レベルの具体例を示
す図である。
す図である。
【図3】図1の実施例における階層的住所単語辞書のデ
ータ構造を示す図である。
ータ構造を示す図である。
1 画像入力部 2 あて名領域検知部 3 文字切出し部 4 文字正規化部 5 パターン照合部 6 住所認識部 7 最終判定部 8 辞書パターン記憶部 9 住所単語記憶部
Claims (1)
- 【請求項1】 郵便物の表面に記載されている住所情報
としてのあて名を住所単語との照合によって読み取った
結果にもとづいて,個個の郵便物を区分する郵便物あて
名自動読取区分処理における前記住所情報を認識する郵
便物記載住所認識装置であって,前記住所情報の階層性
に着目し,前記住所情報を構成する各階層の単語データ
を個別に用意し,文字列の途中までの認識結果に対応し
て次の階層レベルでの照合に必要とする照合単語を限定
して変化設定することを特徴とする郵便物記載住所認識
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4131226A JPH05324899A (ja) | 1992-05-25 | 1992-05-25 | 郵便物記載住所認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4131226A JPH05324899A (ja) | 1992-05-25 | 1992-05-25 | 郵便物記載住所認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05324899A true JPH05324899A (ja) | 1993-12-10 |
Family
ID=15052980
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4131226A Pending JPH05324899A (ja) | 1992-05-25 | 1992-05-25 | 郵便物記載住所認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05324899A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19547812A1 (de) * | 1994-12-20 | 1996-07-04 | Nec Corp | Lesegerät für Schriftzeichenketten |
| JP2009163689A (ja) * | 2008-01-10 | 2009-07-23 | Nec Corp | 住所認識方法及び装置、並びに郵便あて名区分機 |
-
1992
- 1992-05-25 JP JP4131226A patent/JPH05324899A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19547812A1 (de) * | 1994-12-20 | 1996-07-04 | Nec Corp | Lesegerät für Schriftzeichenketten |
| DE19547812C2 (de) * | 1994-12-20 | 1999-08-05 | Nec Corp | Lesegerät für Schriftzeichenketten |
| US6014460A (en) * | 1994-12-20 | 2000-01-11 | Nec Corporation | Character strings reading device |
| JP2009163689A (ja) * | 2008-01-10 | 2009-07-23 | Nec Corp | 住所認識方法及び装置、並びに郵便あて名区分機 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100324847B1 (ko) | 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 | |
| US5933531A (en) | Verification and correction method and system for optical character recognition | |
| JPH0739820A (ja) | 街区認識装置および宛名読取区分機 | |
| JPH05324899A (ja) | 郵便物記載住所認識装置 | |
| JPH07271899A (ja) | 文字認識装置 | |
| JP2991594B2 (ja) | 郵便物の宛名読取装置 | |
| JP3243000B2 (ja) | 郵便物処理装置および郵便物処理方法 | |
| JPH0957199A (ja) | 宛名読取装置及び郵便物区分装置 | |
| JPH05242303A (ja) | 宛名読取装置 | |
| JP3088036B2 (ja) | 宛名読取区分機 | |
| JPH02148174A (ja) | Ocrによる住所データベース検索装置 | |
| JPH0975859A (ja) | 郵便番号認識方法、郵便番号認識装置および区分機 | |
| JPH11312219A (ja) | 宛名読取り装置および郵便物等区分機および文字列認識方法 | |
| JP2000011096A (ja) | 文字認識処理装置及び方法並びに記憶媒体 | |
| JP2001232303A (ja) | 宛名認識装置およびそれを用いた郵便区分機 | |
| JP2001025713A (ja) | 郵便区分システム | |
| JPH1185909A (ja) | 住所認識方法 | |
| JPH09190507A (ja) | 住所読取装置 | |
| JPH0739816A (ja) | 宛名読取装置 | |
| JPS63303481A (ja) | 住所読取装置 | |
| JP2002126655A (ja) | 区分装置及び区分方法 | |
| JPH0947726A (ja) | 住所読取装置、郵便物区分機及び住所読取方法 | |
| JPH10432A (ja) | 郵便物の住所読取方法及び郵便物の住所読取装置 | |
| JPH1196307A (ja) | 単語認識装置 | |
| JPH0793467A (ja) | 住所読取システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19991026 |