JPH05250515A - テンプレートを使用してバーコード文字を光学的に認識する方法および装置 - Google Patents

テンプレートを使用してバーコード文字を光学的に認識する方法および装置

Info

Publication number
JPH05250515A
JPH05250515A JP4267871A JP26787192A JPH05250515A JP H05250515 A JPH05250515 A JP H05250515A JP 4267871 A JP4267871 A JP 4267871A JP 26787192 A JP26787192 A JP 26787192A JP H05250515 A JPH05250515 A JP H05250515A
Authority
JP
Japan
Prior art keywords
character
template
characters
pattern
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4267871A
Other languages
English (en)
Inventor
Dennis W Golem
ダブリュー.ゴーレム デニス
Meera Kulkarni
クルカーニ メアラ
Raymond L Higgins
エル.ヒギンズ レイモンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR International Inc
Original Assignee
NCR International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR International Inc filed Critical NCR International Inc
Publication of JPH05250515A publication Critical patent/JPH05250515A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 小切手等の文書上のバーコード文字の光学的
走査と認識を行う方法とシステムを提供する。 【構成】 本システム21は光学的スキャナ13、マイ
クロプロセッサ23、ROM25とデータ並びに複数の
予定文字同定2進パターン(テンプレート)を格納する
格納プログラム付RAM27を含む。スキャナは文書1
9を走査し、複数のグレイスケールピクセル値を発生。
マイクロプロセッサ23は格納されたピクセル値を処理
し各文字20の位置を特定し、その文字をテンプレート
に比較照合。プロセッサは照合の失敗、文字の拒絶時
に、文字の座標を使用して当該文字をセグメント化した
文字のピクセル値を2進データに変換し、これを圧縮
し、テンプレートと照合し、当該2進データに符合する
テンプレートを複数テンプレートから選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書の走査および英数字
一般の認識に関し、特にテンプレートを使用してCMC
7型のバーコード化された文字(以下、バーコード文字
という)を光学的に走査し認識することに関する。
【0002】
【従来の技術】CMC7文字セットはフランスのカンパ
ニエ・ド・マシネ・ブル社により開発された文字組み
で、主としてヨーロッパの多くの国で経済取引上広く使
用されている。一般的にこれらの文字は銀行為替、小切
手その他の経理文書上に磁気スキャナで走査できるMI
CR(磁気インク文字記録)形式で記録されている。各
文字は、予定の高さ、幅、および不透明度の異なるバー
とバー間の間隙(例えば7本のバーとバー間の6個の間
隙であって、4個の間隙が短い(狭い)幅を有し、2個
の間隙が長い(広い)幅)を有する。しかしながら、バ
ーコードの印刷品質が劣っていたり、当該文字パターン
がぺんによるなぞり書きその他のノイズにより崩れてい
るときは光学的文字認識はしばしば適切な文字認識がで
きない。
【0003】
【発明が解決しようとする課題】そこで本発明は、文字
パターンの印刷が低品質のとき、あるいは文字パターン
のバー間隔に不規則その他の文字崩れの問題があると
き、それらバーコード文字が良好に認識できるシステム
を与えることを課題とする。
【0004】
【課題を解決するための手段】本発明は、文字形状(テ
ンプレートパターン)情報を使用してバーコード文字を
認識する光学的文字認識のためのシステムおよび方法を
与える。このシステムは、印刷が低品質であるとき、あ
るいは文字の一部が不明瞭であったり、その他外部的原
因で崩れている場合でも、良好にバーコード文字を認識
できる。
【0005】第一の局面で、本発明の光学文字認識シス
テムは、(a)文字と異なる不透明度を有する文書上に
おいて不透明度の異なるバーおよび間隙からなる予定パ
ターンを有するバーコード文字を光学的に走査(入力お
よび格納)すると共に、該不透明度に対応するグレイス
ケールピクセル値を、明ピクセルと暗ピクセルを表す複
数のグレイスケールピクセル値として発生するCCDス
キャナと、(b)前記グレイスケールピクセル値と、プ
ログラムと、文字を表す複数の予定テンプレート2進パ
ターンにしてその一つが該文字を表すようにされたテン
プレート2進パターンとを格納するメモリと、(c)前
記スキャナおよびメモリに結合され前記プログラムの制
御の下にオペレーションを行うプロセッサにして、該グ
レイスケール値から該文字を表す値のマトリックスを選
択することにより該文書上の該文字の位置を特定し、該
マトリックス値を2進データに変換し、該2進データを
圧縮し、さらに該圧縮済み該2進データに符合すること
により該文字を同定する働きをするパターンを該複数の
予定テンプレート2進パターンの中から選択するプロセ
ッサを含む。
【0006】このCCDスキャナは制御論理回路を含
み、プロセッサはマイクロプロセッサを含み、メモリは
立ち上げルーチン付きROM(読み取り専用メモリ)
と、プログラム、ピクセル値および2進パターンを有す
るRAM(ランダムアクセスメモリ)とを含む。
【0007】第二の局面で、本発明の方法は、予定長の
高さ、幅、および不透明度の異なる予定のバーと間隙を
有する文書上のバーコード文字にして複数の予定テンプ
レート2進パターンの一つにより表される前記バーコー
ド文字を光学的に同定する方法にして、(a)光学的に
文書を走査し、該不透明度に対応するグレイスケールピ
クセル値を、明ピクセルおよび暗ピクセルを表す複数の
グレイスケールピクセル値として発生するステップと、
(b)該グレイスケールピクセル値から文字を表す値の
マトリックスを選択することにより該文書上の文字の位
置を特定するステップと、(c)該マトリックス値を2
進データに変換するステップと、(d)該2進データを
圧縮するステップと、(e)該圧縮済み該2進データに
符合することにより文字を同定する働きをするパターン
を該複数の予定テンプレート2進パターンの中から選択
するステップとを含むバーコード文字同定方法を与え
る。文書上の文字は例えばCMC7フォーマットで記録
されている。カメラ(CCDスキャナ)は文書を鉛直方
向に、底部右隅から出発して底部から頂部へ走査する。
文書は文書の左頂部隅に走査が到達し走査が終了したこ
とを示すまで、文書は右へ連続的に移動される(その場
合、鉛直方向の各走査幅は一ピクセルの直径に相当す
る)。
【0008】ある文字(すなわちある文字を表すグレー
スケールピクセル値)の位置を特定するにあたり、本シ
ステムは当該文字に対して選択したピクセル値の上に窓
(ウインドウ)を配置する(以下これを、文字のフレー
ム化と言う)。このフレーム化はこのウィンドウ内の選
択ピクセル値の和が最大となるように行う。ウインドウ
の配置に当たり、本システムは文字データの少なくとも
三列を使用して文字縁および文字間間隙を同定する。次
に本システムは選択したピクセル値から、しきいレベル
を計算し、選択したピクセル値をそのしきいレベルを基
準とする2進データに変換する。次にこの2進データは
より小さなマトリックス(配列)に圧縮され、その文字
と最も良く一致するパターンが発見される迄、予定のテ
ンプレート2進パターンの各々と論理比較される。各テ
ンプレート(2進パターン)は三ビットコンフィギュレ
ーション(レベル)を有する。その第一ビットコンフィ
ギュレーションは文字の実際のビットパターンを表し、
第二ビットコンフィギュレーションは実際のビットパタ
ーンのビットの有意性(significance)を表し、第三ビ
ットコンフィギュレーションは実際のビットパターンの
ビットの重み値を表す。この変換された2進データが各
予定ビットパターンの各三ビットコンフィギュレーショ
ンに論理的に匹敵する程度が、「ミスマッチワード」と
して表現され、このミスマッチワードからミスマッチ計
数が計算される。次にこのミスマッチ計数が少なくとも
一つの予定しきい値と比較され、当該しきい値より小さ
い(すなわちしきい値未満の)最小ミスマッチ計数が当
該文字を表すものとして選択される。
【0009】
【実施例】以下に本発明のシステムを説明する。本シス
テムは印刷が低品質であるかあるいは文字の一部(バ
ー、間隙)が外部的原因で崩れているときに良好なバー
コード文字認識を与える。
【0010】文字間のバー間隔に関する情報は従来バー
コード文字を認識するのに使用されている。文字形状お
よびテンプレートパターン情報は従来バーコード化され
ていない文字の認識に使用されている。本発明のシステ
ムはテンプレートパターン情報をバーコード文字の認識
に拡張使用するものである(以下、この方法をテンプレ
ートマッチング方法という)。テンプレートマッチング
方法の一適用例(ルーチン)を挙げれば、バーコード認
識方法を使用して行うCMC7バーコード文書の読み取
りがある。この方法は、印刷品質が低いため、または外
部的ノイズのためにバーコード文字の認識に失敗したと
き、その文字の分類を助けるため、本テンプレートマッ
チング方法が呼び出される。テンプレートマッチング方
法が当該文字の分類を完了した後、バーコード認識方法
が続行され、文書の残りが処理される。その後、必要に
応じてテンプレートマッチング方法が呼び出される。
【0011】図1は本発明のシステム11を示す。この
システムは文書19を走査するための光学的読取り機ま
たはスキャナ13と、スキャナ13から受信したデータ
を処理するコンピューターシステム21とを含む。この
スキャナはCCD(電荷結合デバイス)15および制御
器17を具えたカメラでよい。文書19は銀行為替とか
上に英数字20を印刷された小切手等である。コンピュ
ーターシステム21はマイクロプロセッサ23と、ブー
トプログラムを備えたROM(読み取り専用メモリ)2
5と、走査デバイスおよびマイクロプロセッサからのデ
ータを格納し、また予め定義されたテンプレートパター
ン(すなわち選択された文字を表す2進データのパター
ン)を格納するためのプログラム付きRAM(随時アク
セス可能メモリ)27を含む。
【0012】走査オペレーションは文書19の右底部隅
33から始まり、頂部左隅35で終わる。スキャナ13
は文書19の底部から頂部に向けて鉛直方向に、最初は
図の矢印37で示すように最右の走査線39から走査
し、次いで再び底部から頂部へ次の最右の走査線41に
沿って走査を行い、以下同様にして文書の頂部左隅に達
するまで走査する。走査線は平行に配列されている。文
書19は矢印43で示すように左から右へ連続的に移動
される。スキャナは連続的走査線に沿って走査を行う。
各走査線の幅はピクセルの直径(約0.0127cmす
なわち0.005インチ)に相当する。このようにして
連続する文字が文書から読み取られる(すなわち入力さ
れ、格納される)。
【0013】図2に示すような幅21ピクセル、高さ2
8ピクセルの文字の場合、本システムは、文字をあたか
もそれが幅23ピクセル、高さ30ピクセルの領域内に
あるかのように、すなわち文字の頂部、底部および両側
に1ピクセルの白縁があるかのように、取り扱う。文書
上に記録された文字のイメージは磁気的なものでも非磁
気的なものであってもよい。
【0014】図2に示すように各文字20は7個の平行
な鉛直バー(データバー)45と4個の短間隙47とバ
ー間の二つの長間隙49とで一意的に定義される。走査
方向37(図1)は平行なバーの方向に一致する。各バ
ーは0.010ないし0.019cmの幅で、各短間隙
は0.011ないし0.019cmの幅、各長間隙は
0.031ないし0.039cmの幅でよい。
【0015】文字の走査および処理(セグメント化およ
び認識)は、各文字を構成する鉛直バーと間隙を含む当
該文字形状とで記述される。各バーの高さは変化する
が、バーおよび間隙の幅は予定の範囲内に保持(印刷)
される。一文字についてのバーの幅および間隙は同じ文
字組の他の文字のバーおよび間隙の幅と同一である。
【0016】文字のいろいろのバーおよび間隙を表すた
め、文字が走査されるときにスキャナにより発生される
ピクセル値は、例えば28行(すなわち文字の高さを表
す28ピクセル)および21列(すなわち文字幅に相当
する21ピクセル)を有するデータ配列(マトリック
ス)としてメモリ27(図1)中に格納される。連続す
る文字間の空間および文字の上方と下方の空間(すなわ
ち文書の地が現われている空間)を表すピクセルを除外
すると、文字(例えば文字「9」)のバーおよび間隙は
図3に示す配列で表すことができる。各暗ピクセル51
は鉛直バー45の一部を表し、範囲0-255の不透明
インデックスすなわちグレイスケール値を有する。各明
ピクセル53は間隙47、49または文字間空間55の
部分を表し、範囲0-255の不透明/グレイスケール
値を有する。暗ピクセルは一般に大きなグレイスケール
値(255に近い値)を有し、また明ピクセルは一般に
より小さな値(0に近い値)を有する。
【0017】上述したようにこれらのグレイスケールデ
ータ値は文書を走査するスキャナにより発生される。発
生されたデータは次いでシステムで処理するため、メモ
リ27(図1)内に格納される。バーコード文字データ
の処理において本システムで採用する方法は、「バーコ
ード文字の処理」という以下の見出しつけた下記の項で
説明する。しかし読者にとって本処理方法をより良く理
解できるようにするため、バーコード化されていない文
字データ(以下、非バーコード文字データという)の処
理を初めに説明する。
【0018】非バーコード文字データの処理 このシステムは格納されたプログラムの制御の下に、格
納されたデータ値を調べ、最初の文字の位置特定に進
み、次いで最初のフィールドの後続文字に進み、次いで
後続フィールドの他の文字に進む。文字の位置特定が終
わると、システムは当該文字をフレーム化または区画化
(delimit)する(すなわち他の文字から当該文字を分
離またはセグメント化(segment)する)。最右のスキ
ャナ走査線39(図1、2)に沿って底部から頂部への
走査から開始し、次いで次の最右走査線41に沿って底
部から頂部へ走査し、以下同様に文書を走査して得た格
納グレイスケールデータ値から、システムは以下に述べ
るように各文字の位置を特定しフレーム化(セグメント
化)する。これは、最初に格納されたデータを捜索し、
走査線に沿う明ピクセルから暗ピクセルへの遷移を表す
グレイスケール値の上昇を探知することにより行う。も
しも例えば40(この40というこの特定の値はフォン
トに依存する)より大きい上昇が、走査方向37に隣接
するピクセルの二つのグレイスケールデータ値の間に発
見されると、暗ピクセルが発見されたと考えられる。こ
の暗ピクセルに近接する(文書の)領域は、文字が発見
される確率が高い領域であると見做される。暗ピクセル
が発見されると、システムはこの文字領域を検査し(す
なわち暗ピクセル値に近い格納済みデータを検査し)、
この暗ピクセルが文字の一部であるか否かを決定する。
システムは文書上の文字を効果的にフレーム化するに足
りる大きさのセグメント化ウィンドウを確立することに
より文字の存在を検査する。暗ピクセルの位置はウィン
ドウの中心に相当する。左縁および右縁(列)55、5
7および頂部縁および底部縁(行)59、61を有する
セグメント化ウィンドウ53が図4(a)に示されてい
る。左縁および右縁の境界をなしているのは(左+1)
列63および(右−1)列65で、頂部縁および底部縁
の境界をなしているのは(最上+1)行67、および
(底部−1)行69である。
【0019】図4(a)、5を参照して以下に説明する
ように、文字はウィンドウ内のすべてのグレイスケール
ピクセル値の和が最大となったときにフレーム化され、
かつウィンドウの中心に配置されたと考えられる。ウィ
ンドウが移動されるときに和(Sw)が増大するか否か
を決定するため、左右の列55、57各々の中のピクセ
ル値とそれらの各境界列63、65の中のピクセル値と
の和が計算される。同様に、頂部列59および底部列6
1各々の中のピクセル値と境界列67、69各々の中の
ピクセル値との和が計算される。例えばもしも列63内
の和が列57内の和よりも大きいことが発見され、かつ
列63を含め列57を排除するようにウィンドウ53を
一ピクセルだけ左へ移動するとウィンドウ内の和(S
w)が増大するようであれば、ウィンドウは左へ移動さ
れる。同様に、もしも行67を含め、行61を排除する
ようにウィンドウを一ピクセルだけ上に移動すればウィ
ンドウ内の和(Sw)が増大するなら、ウィンドウは上
に移動される。このようにウィンドウに隣接する(すな
わち境界をなす)行、列のピクセル値の和(累積的カウ
ント)は、ウィンドウの縁にある行および列のピクセル
値の和に相対的な値であり、この値からウィンドウ内の
ピクセル値の和(Sw)を増大させるようにウィンドウ
を移動させる方向が決定できる。図5に示すように、下
記のカウントにより、左への移動に伴ってウィンドウカ
ウントが100だけ増大され、上への移動に伴って17
0増大される。 「右−1」列のカウント = 0 「右」列のカウント = 0 「左」列のカウント = 100 「左+1」列のカウント = 100 「底部−1」行のカウント = 0 「底部」行のカウント = 0 「頂部」行のカウント = 170 「頂部+1」行のカウント = 170 したがってウィンドウは左および上へ移動される。この
ようにしてウィンドウはSwの増大する方向に移動さ
れ、このオペレーションはウィンドウを四つの任意の方
向(左、右、上、下)に移動してももはやSwを増大さ
せなくなるまで反復される。このときウィンドウは文字
をフレーム化した(区画化またはセグメント化した)と
考えられ、当該文字はウィンドウの中心に配置されてい
ると考えられる。このようにしてこのウィンドウにより
文字を最もよく表すピクセル値のマトリックスが選択さ
れる(フレーム化される)。
【0020】フレーム化された文字を表す情報(暗ピク
セルグレイスケール値)が十分にウィンドウ内にあるか
否かを決定する検査として、予定の確認しきい値(例え
ばしきいグレイスケール値100)を超えるウィンドウ
内ピクセルの全数を計算する。もしもこの全数が例えば
60(E13Bフォントのようなフォントの場合)以上
であると、ウィンドウ内に文字が見つかったことが確認
される。そうでないときはウィンドウ内にフレーム化さ
れた対象物はノイズと解釈され、システムは新しい文字
を発見する手続きに進む。
【0021】フレーム化の後、セグメント化(フレーム
化)された文字は同定に備えて縮尺変更(scale)され
る。認識プロセスでは16ビットワードが使用される
(すなわち、テンプレートの幅が16ピクセルであ
る)。多くの文字が16ピクセルより幅が広い(たとえ
ばE13B文字は19ピクセルである)ので、それらは
フレーム化した後に16ビットに変換される。これは予
定の列、例えばE13Bフォントの場合、列4、9、お
よび14を除去することにより達成される。(OCRA
およびOCRBフォントは、200ピクセル/インチの
とき、幅が16ピクセルであり、列の除去は必要でな
い。)
【0022】前節までの説明は処理の準備として文字が
どのように文書上の位置特定を受けるか、すなわち後の
処理のためどのように文書上の位置を特定され効率よく
フレーム化(セグメント化)されるかを説明するもので
ある。以下の説明は、フレーム化された文字が当該文字
の同定(分類/認識)のために2進型式に変換され、次
いでテンプレート(これは予定の2進パターンである)
と比較される一つの方法の説明である。
【0023】この変換オペレーションではフレーム化さ
れた各行の文字について格納されたグレイスケールピク
セル値が2進型式に変換される。最初に、フレーム化さ
れた文字の暗ピクセルの算術平均として基準しきい値が
(前述したように)計算される。次いでこの基準しきい
値に相対的に、グレイスケールピクセル値が2進形に変
換される。例えばもしも計算された基準しきい値が10
0であると、グレイスケール値80、120、130、
90、85、70、110、135は図6の8ビットワ
ード71に示すビットパターン01100011を有す
る2進データに変換することができる。これは以下に示
す2進等価スケールを用いて行われる。 グレイスケールピクセル値 2進型式等価値 ≧100 1(黒) <100 0(白)
【0024】この2進データはフレーム化された文字の
一行または薄片(slice)を表す。次にこの2進データ
および当該文字を表す他の行の変換済み2進データが複
数のテンプレートと比較される。各テンプレートは一文
字に対応する。各テンプレートは2進データの予定パタ
ーンを表し、三つの異なるレイヤー(ビットコンフィギ
ュレーション)を含む。図6に示すこれら三つの8ビッ
トワード73、75、77は三つの各レイヤーにおける
8ビット行を表す。第一レイヤー(これはビットパター
ンレイヤーで、パターンワード73に対応する)は文字
の実際の黒/白(0/1)パターンを表す。第二レイヤ
ー(これはビット有意レイヤー(bit-significance lay
er)で、ビット有意ワード75に相当する)は有意の文
字のビット位置および有意でない文字の位置を同定す
る。1-ビットは、文字のビットパターンが文字の大き
さおよび形状に拘わらず不変に留まると予想される有意
ビット位置を同定する。0-ビットは、文字の大きさま
たは形状が異なるときビットパターンが同一とは限らな
い非有意ビット位置を同定する。第三レイヤー(これは
ビット重みレイヤーで、主にワード77に対応する)は
類似の(実質的に類似の)文字を識別するときにいずれ
のビットが重要であるか、またそれゆえにいずれのビッ
トが他のビットより大きな重みを有するかを同定する。
この第三レイヤーでは1-ビットは重みのあるビットに
指定され、0-ビットは重みなしのビットに指定され
る。例えば文字「O」と「U」に対するテンプレートの
第三レイヤーの頂部行における1-ビットは、これら二
つの文字を識別するのに有用である。また文字「Q」と
「O」に対するテンプレートの第三レイヤーの底部行内
の1-ビットは、「Q」と「O」とを識別するのに有用
である。
【0025】図6に示すように文字同定のため、2進デ
ータ71にいろいろの論理オペレーションがマイクロプ
ロセッサ23(図1)により行われる。(これら論理オ
ペレーションは実際には16ビットオペレーションとし
て行われる。しかし、簡単のため8ビットオペレーショ
ンを図示する)。第一に、2進データはビットパターン
レイヤーの対応ワード73との間で排他的OR演算さ
れ、2進データ71と正しい予定パターン73との間の
ミスマッチパターン74を発生する。次いでこのミスマ
ッチパターン74はビット有意レイヤーのワード75と
論理的AND演算され、ミスマッチワード76が発生さ
れる。ミスマッチワード76は、文字の大きさおよび形
状に独立なミスマッチ(不一致)の程度を表す。このミ
スマッチワード76は次いで重みを付けられる。すなわ
ちビット重みレイヤー内の対応するワード77と論理的
AND演算され、重み付きミスマッチインジケーター7
8を発生させる。(もしも重み付きワード77が全く1
-ビットを含まないならば、(その結果は0なので処理
時間を節約するため)重み付けまたはAND演算はなさ
れないで、システムは2進データの次行の処理に進
む)。
【0026】重み付けオペレーションに続いて、2進デ
ータ行71に対してミスマッチカウント(MCR)が計
算される。この計算はマイクロプロセッサ23(図1)
により次式 MCR = MCW + (WOC × WF) (1) で求められる。ここにMCW はミスマッチワードに
対するミスマッチカウント(すなわちミスマッチワード
76内の1の数)、WOC はミスマッチインジケータ
ーすなわち重み出力カウント(すなわちミスマッチイン
ジケーターワード78内の1の数)、WF はE13B
型文字に対する予定の重み因子(例えば整数2)を表
す。このようにして、図6のミスマッチワード76、7
8に示すミスマッチビットパターンの場合、MCW
2、WOC=1、WF=2であることが了解できよう。
それゆえ、2進データ行71について計算したミスマッ
チカウント(MCR)は上式(1)から4(すなわち2
+(1×2))となる。
【0027】一行についてミスマッチカウントを計算し
た後、システムは上記の方法で文字の残りの行すべてに
ついてのミスマッチカウントの計算に進む。次に文字の
すべての行に対するミスマッチカウントが加算されてテ
ンプレートミスマッチカウント(すなわちフレーム化さ
れた文字に適用したテンプレートに対するミスマッチカ
ウント)を発生する。同様の方法で処理対象のフォント
の文字テンプレートについても、フレーム化した文字に
相対的なミスマッチカウントがテンプレート毎に発生さ
れる。いろいろのテンプレートが処理されるに従い、二
つの最低テンプレートミスマッチカウントとそれらに関
連したテンプレート番号とがメモリ内に格納される。文
字を同定する前提条件は:もしもこの最低カウントがし
きい値(E13Bフォントでは拒絶しきい値40)未満
であり、次に低いカウントよりも予定量(E13Bフォ
ントではしきい値差5)だけ小さければ、システムはこ
の文字を同定する。
【0028】前述したテンプレートの認識(以下、テン
プレート認識という)は図7に示すように全部で9箇所
で行うことができる。これはイメージ内のノイズ等の因
子により完全にはフレーム化されない文字を同定するた
めに行われる。図7に示す例では、テンプレートおよび
(2進データの)入力パターンの大きさは23行(高
さ)×16列(幅)である。テンプレートの三つのレイ
ヤー(パターンレイヤー、ビット有意レイヤーおよび重
み付けレイヤー)はすべて同一方向に同一量移動(shif
t)される。後述する移動位置の説明において「テンプ
レート行」とはビットパターン行、ビット有意行、およ
びビット重み付け行を指す。
【0029】中央位置87ではテンプレート96は入力
パターン98の真上に配置されている。 行2ないし2
2のみがこの比較に使用される。従って、テンプレート
行1はパターン行1と比較され、テンプレート行2はパ
ターン行2と比較され、・・・以下同様である。中央水
平位置81、87、93ではすべての列(1ないし1
6)が使用される。上方中央位置81では、テンプレー
トの行1ないし22が入力パターンの行2ないし23と
比較される。これはテンプレートパターンを鉛直方向上
に一行だけ移動することと同一である。この場合、テン
プレート行1は入力パターン行2と比較され、テンプレ
ート行2は入力パターン行3と比較される、等々であ
る。この状況(水平方向の中央位置)ではテンプレート
と入力パターンのすべての列が比較される。同様にし
て、下端中央位置93ではテンプレートは下方に一行だ
け移動されており、従ってテンプレート行2ないし23
が入力パターン行1ないし22と比較照合される。
【0030】水平移動した諸位置は入力パターン98上
でテンプレート96を左または右へ移動することに対応
する。中央左位置85ではテンプレート列1ないし15
および入力パターン列2ないし16が使用される。(こ
れは鉛直方向に中央位置なので行2ないし22が入力パ
ターンおよびテンプレートの両方に使用される。)従っ
てテンプレートワードビット1はパターンワードビット
2と比較され、テンプレートワードビット3はパターン
ワードビット4と比較され、以下同様に比較される。例
えばもしもテンプレートパターンレイヤーワードが 0011111100001111 であり、入力文字パターンワードが 0010111100011110 であると、テンプレートが左へ1ビット(列)移動され
る。 0011111100001111 排他的OR演算した結果は 0101000100000000 となろう。左への移動演算が行われると、最右のビット
(最下位ビット、LSB)は0であることに注意された
い。従ってビット有意ワードのLSBもまた0である
(なぜならば三つのレイヤーすべてが同一方向に同一量
移動されるからである)。それゆえ、ミスマッチワード
76のLSBは(ビット有意ワードとのAND演算の
後)常に0となる。同様に、右への移動は最左ビット
(最高位ビット、MSB)を0にし、従ってミスマッチ
ワード76のMSBは(AND演算の後)常に0とな
る。
【0031】右向き水平移動(位置89)は左向き移動
と同様で、方向が反対なだけである。従ってテンプレー
トワードのビット2は入力パターンワードのビット1と
整列する(比較される)。
【0032】隅位置(位置95、91、83、79)は
一行分の鉛直移動と一列分の水平移動との組み合わせを
表す。例として、左上位置79ではテンプレート行1は
左へ一ビット位置だけ移動され、パターンワード2と比
較され、テンプレート行2は左へ一ビット移動されてパ
ターンワード3と比較される、等々である。
【0033】この方法を使用して文字を認識するために
は、一テンプレートあたり9回のパス数(推移数)に文
字セット中のテンプレート数を乗じた数のパス数が必要
である。例えば49文字を持つ英数字セットは全部で4
41(9×49)個の比較照合を必要とする。これは時
間を消耗する。文字同定もっと速く促進するには入力パ
ターンに対して当初は各テンプレートの中央位置のみを
比較する。いろいろのテンプレートを処理するにともな
い、最低の二つのミスマッチカウントおよびそれらに対
応するテンプレート番号をRAM27内に格納する。こ
の最初のパスが終ってから、ただ二つのテンプレートの
残りの8個の位置を処理し、入力されたパターンに対し
て最良の(すなわち最低の)全ミスマッチを発見する。
従って通常、たった65個(1×49+2×8)の比較
が必要である(すなわち必要な441個の比較のうちの
約15%である)。
【0034】文字の受理または拒否を行うための前提条
件を以下に述べる。
【0035】前記最低テンプレートミスマッチカウント
は、当該テンプレートが表す文字に対する予定の拒否し
きい値と比較される。もしもこの文字についてのテンプ
レートミスマッチカウントがこのしきい値未満であり、
かつ二つの最低テンプレートについてのテンプレートミ
スマッチの差(最低ミスマッチを、次に最低のミスマッ
チから減じた値)が予定の量(例えば10)より大きい
と、最低のテンプレートミスマッチを持つテンプレート
がフレーム化された文字を同定する。ミスマッチカウン
トが近すぎるか否かを検査する理由は非常に似かよった
文字(例えばQとO)を区別するためである。もしもミ
スマッチが近いと、文字は誤った同定を犯す危険を避る
ために拒否される。もしも上記の拒否しきい値未満のテ
ンプレートミスマッチがないか、または二つのテンプレ
ートミスマッチカウント近すぎると、下に述べる後処理
オペレーション(post precessing operation)が行わ
れる。もしも後処理オペレーションの後、フレーム化さ
れた文字が依然として拒否されるなら、文字のイメージ
が強化され、2進型式に変換される(これについては後
述する)。次に上記の認識プロセスが再び行われる。も
しも文字が同定される(上記前提条件を満足する)と、
システムは次の文字について上記処理(位置特定および
フレーム化)を行う。
【0036】中央位置のみを検査すると、前記二つの最
近接文字以外の文字であって中央位置外の位置にある文
字が近接カウントを有する正しい選択文字である、とい
う可能性を見逃すかも知れない。後処理はそのような状
況を修復することができる。もしも選択された二つの最
低カウントの文字が共にそれらの各文字についての予定
拒否しきい値を超えており、あるいは文字間距離(最低
ミスマッチと第二最低ミスマッチとの差)が小さすぎる
ときは、一層良好な照合結果を得るため多数の他のテン
プレートが他の8位置において検査される。いずれのテ
ンプレートを処理するかの選択は、例えばテンプレート
どうしの最近接文字の類似性に基づいて決定される。例
えば最近接する二つの選択文字(最低の二つのミスマッ
チカウントを有するもの)が文字DとOであるとき、こ
れらは両方ともそれらの拒否しきい値以上のミスマッチ
カウントを有する。後処理オペレーションではDおよび
Oに類似する予定の組の文字が次に処理される。これに
は文字0(ゼロ)、Q、C及びUが含まれることがあり
うる。このオペレーションの後で最近接の二つの文字の
ミスマッチカウントが検査され(最低のミスマッチカウ
ントが最初に検査される)、それらが拒否条件および文
字間距離条件に合うか否かが観察される。もしも少なく
とも一文字が条件に合うと、その文字が結果として返さ
れ、イメージ中の次の文字の処理(位置特定およびフレ
ーム化)が進められる。
【0037】もしも上記文字のいずれも拒否条件に適合
しないか、あるいは文字間距離が小さすぎると、フレー
ム化された文字は拒否される。この場合、(後述の通
り)そのイメージが強化される、その文字は再度2進化
され、第二回目の上記認識プロセスが反復される。もし
もその文字が認識されると、その文字が返される。そう
でないときは結果として拒否文字コードが返され、文書
上の次の文字の処理(位置定めおよびフレーム化)が続
けられる。
【0038】上記の拒否しきい値に加えて後述する出口
しきい値(exit threshold)(例えば値10)も文字同
定プロセスに使用することができる。処理速度を高める
ため、後続テンプレートミスマッチカウントが出口しき
い値に比較され、出口しきい値未満となるテンプレート
ミスマッチカウントを持つ最初のテンプレートが当該文
字を同定する。この場合、残りのテンプレートは処理さ
れない(これによって処理速度が高まる)。
【0039】さらに文字同定プロセスの速度を高めるた
め、テンプレートの各行が処理されているときにもしも
現在のテンプレート(すなわち現在処理中のテンプレー
ト)のミスマッチカウントがそれまでに得られた下から
二番目の最低カウントよりも大きいことが発見される
と、進行中の処理は中止される。なぜならばこの現在の
のテンプレートはもはや最低ミスマッチカウントを持つ
二つのうちの一つでありえないからである。認識速度を
さらに高めるため、テンプレートはそれらが最も起生す
る確率の高い順序(例えば英数字フォントでは子音を従
えた母音の前に数字が来る)に予め順序づけておくこと
もできる。もしもミスマッチカウントが出口しきい値よ
り低いなら、(上述したように)残りのテンプレートは
調べる必要がない。このように、最も頻繁に起こる文字
が最初に調べられるべきである。またより高速の文字同
定を促進するためには、テンプレートにより中央位置の
み検査し、その後でもしも最低テンプレートミスマッチ
カウントが出口しきい値を超えれば、出口しきい値に最
近接する二つのテンプレート各々について残りの8位置
を処理するようにでき、最低のテンプレートミスマッチ
カウントを持つテンプレートをもって当該文字を表すも
のとすることができる。さらに同定を速くするため、残
りの8位置(図7)は次の順序 79、81、83、8
9、91、93、95で処理することができる。これは
文字が最も配置されている可能性の高い順序である。
【0040】システムはフレーム化した文字を同定した
後、前にフレーム化した文字の左へ、選択したピクセル
数(例えば3)だけセグメント化ウィンドウを移動する
ことにより、次の文字の処理に進む(すなわち当該フレ
ーム化した文字に近接する文書上の領域を表す次のグル
ープの格納済みピクセル値グループを処理する。)次に
この近接領域における文字がフレーム化(セグメント
化)され、上述したように同定される。エンド-オブ-フ
ィールドが検出されるまで(すなわちもはや文字がな
く、エンド-オブ-フィールド文字があるまで)、残りの
文字(すなわち残りの格納済みピクセルデータ)がすべ
てこのように処理される。
【0041】もしも文字同定プロセスにおいて文字が拒
否されると、同定を容易にするため、そのイメージが強
化される。このイメージの強化は例えば一定のストロー
ク幅をもつ文字(すなわち文字の各鉛直ストローク幅ま
たは水平ストローク幅が一定数の暗ピクセル数を有する
文字)のイメージを発生することにより行うことができ
る。これは以下に述べるようにして達成できる。第一
に、文字を表すグレイスケールピクセル値(例えば6-
ビット、8-ビット、または16-ビット値)はもっと小
さな範囲の値に変換される。(この変換は高速処理のた
め例えば3-ビットグレイスケールピクセル値に変換す
るものである。) 次いで当該文字イメージの個別ピク
セル値が検査され、ストロークのピクセル値のうち最も
暗い二つまたは三つの値のみが黒に変えられ、他は白に
変えられる。このことにより、例えば米国特許第4,6
25,330号に説明されているような一定ストローク
幅の2進イメージが発生する。
【0042】文字同定を改善する一助として、各文字の
縁を以下のように処理することができる。上述したよう
に、文字同定プロセスで使用した各テンプレートは選択
された文字セット(例えばE13B文字セット)の一文
字に対応し、図2および図4に示すように、各文字は幅
14ピクセル、高さ21ピクセルである。文字の左およ
び右に余分の一列を付加し、文字の頂部および底部に余
分の一行を付加する。これによって文字の大きさは16
×23となる。各テンプレートは各文字に対応して幅1
6ピクセル、高さ23ピクセルである。各テンプレート
は14列文字の両側(右側および左側)に余分の列を有
し、また21行文字の頂部および底部に余分の一行を有
する。各余分の行は16個の白ピクセルを含み、各余分
の列は、23個の白ピクセルを含む。これら余分の行お
よび列はある種の文字の縁部分の同定を一層よくするた
めの白ピクセル境界で、14×21文字領域を囲む役割
をする。これについて以下に述べる。例えばもしも文字
「E」が12×21「F」テンプレートと比較照合さ
れ、このテンプレートが上方に一ピクセル位置だけ移動
されると、「E」の底部におけるピクセル値は失われ
る。なぜならばこの底部はテンプレートミスマッチカウ
ントの発生に使用できなくなるからである。これはEを
Fと誤って同定する結果を来たしうる。なぜならばミス
マッチカウントが低いからである。16×23テンプレ
ートでは、Eの底部は失われないので、Fテンプレート
の底部の白行に比較されるミスマッチカウントに実質的
に寄与することにより、EをFと誤同定することを回避
できよう。同様の説明は16×23テンプレートの右お
よび左列に関しても成り立ち、これらの列は「B」と
「3」のような文字間の誤同定を低減する働きをする。
【0043】図8に示すように、各16×23テンプレ
ートはRAM27の69個の16ビットワードによって
表すことができる(一インチ当たり200ピクセルの走
査に相応する)。69ワードのうち、23ワードは第一
レイヤービットパターンワードを表し、23ワードは第
二レイヤービット有意ワードを表し、23ワードが第三
レイヤービット重みワードを表す。23ワードの組の各
々が文字の高さに対応し、各16ビットワードが文字の
幅に対応する。(簡単のため、図6では論理的オペレー
ションを表すのに16ビットではなく8ビットを使用し
た。)
【0044】以下に掲げるのは本システムが上記論理的
オペレーションその他の処理オペレーションを行うこと
ができるための格納プログラムの疑似コードリストであ
る。 疑似コード PROCEDURE: MAIN 文書イメージからコードラインを認識する。 while (NOT END OF DOCUMENT) { if (FIND FIRST CHARACTER finds a character) then RECOGNIZE FIELD else END OF DOCUMENT } PROCEDURE: FIND FIRST CHARACTER do { SCAN IMAGE FOR WHITE TO BLACK TRANSITION } until (FOUND CHARACTER or END OF DOCUMENT) PROCEDURE: RECOGNIZE FIELD do { RECOGNIZE CHARACTER move to next position } while (FOUND CHARACTER) PROCEDURE: RECOGNIZE CHARACTER BINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER if REJECTED then { ENHANCED BINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER }
【0045】バーコード文字データの処理 非バーコード文字の認識に関する上記のテンプレートマ
ッチングオペレーションは、いくつかの修正(下記)を
施すことにより、バーコード文字データに適用可能であ
る。
【0046】前述したように文書上のバーコード文字を
走査し、グレイスケールピクセル値を発生させ、メモリ
27に格納した後で、格納済みのピクセル値が文字毎に
他の文字のピクセル値からセグメント化される。文字は
セグメント化され、文字の底部右縁を表すX-Y座標を
発生する。次にこの座標は処理を受けるため、セグメン
ト化ルーチンからバーコード文字認識ルーチンへ送信さ
れる(渡される)。もしもこのバーコード認識ルーチン
が当該バーコード文字を適切に認識することに失敗する
と、次にこのX-Y座標文字データを処理するための、
テンプレートマッチング文字認識ルーチン(template m
atching character recognition routine)が呼び出さ
れる。(この代わりとしてX-Y座標データを直接にテ
ンプレートマッチング文字認識ルーチンに渡し、バーコ
ード認識ルーチンを素通りしてもよい。) テンプレー
トマッチングルーチンが呼び出されると、当該文字の底
部右隅位置のX-Y座標がこのルーチンに渡される。
(X座標は文字の水平座標すなわち列座標を表し、Y座
標は鉛直座標すなわち行座標を表す。) 次にテンプレ
ートマッチングルーチンは以下に述べるようにこのX-
Y座標を使ってバーコードセグメンテーションウインド
ウ(bar-code segmentation window)を設定する。この
セグメンテーションウインドウは水平位置(座標)に関
して CMC7文字幅±1文字幅、鉛直位置(座標)に
関して文字高±1/2文字高の範囲内に文字位置を特定
するように拘束される。(これに失敗すると、バーコー
ドセグメントルーチンにより決定されたX-Y座標位置
は、分類化に使用される。) 分類化に先立ち、以下に
説明するように文字の境界が検査される。(これはテン
プレートマッチングルーチンを呼び出す前に行われ
る。)
【0047】CMC7文字の検査は、当該文字を囲んで
いる1ピクセル幅の境界の中のピクセル値の平均値を決
定することにより、当該文字が明確な境界を有するか否
かを決定するために行われる。もしもこの平均グレイス
ケールピクセル値が以下に定義するしきい値(thr)
を超えると、それは文字が著しく崩れていることを示
し、テンプレートマッチングは行われない。そうでない
ときはテンプレートマッチングルーチンが呼び出され、 thr=0.9*((黒+白)/2) で定義されるしきい値を使ってテンプレートマッチング
が行われる。ここに「黒」および「白」は当該文字を予
備走査(prescanning)することにより決定される。
「黒」は当該文字の鉛直バー上の最高レベルピクセルで
あり、「白」は鉛直バー間に位置する最低レベルピクセ
ルである。バーコード文字データは、バーコード文字の
縁を決定するために当該文字の内側および外側の二つの
連続列が検査されることを除けば、(上述した)非バー
コード文字データの場合と実質上同様にセグメント化
(フレーム化)される。バーコード文字の性質のため、
(非バーコード文字について行われるように)ウインド
ウの内側および外側の単一列を使用するとその単一列が
バー間の白い間隙に落ちる可能性があり、そうなると当
該文字のセグメントメンテーション(segmentation、セ
グメント化)を誤まる。そのような過誤セグメンテーシ
ョンを回避するため、図4(b)に示すようにウインド
ウ153の左の三列172内のピクセルの和(和17
2)がウインドウ内の右の三列171内のピクセル和
(和171)と比較される。もしも和172>和171
であると、ウインドウを左へ移動することにより正味の
利得が現われる。もしもウインドウの右の三列173内
のピクセル和がウインドウ内の左の三列170内のピク
セル和を超えると、ウインドウを右へ移動することによ
り正味の利得が現われる。上記いずれの状況も真である
場合は以下の計算が行われる。 もしも (和172−和171)>(和173−和17
2) なら、ウインドウは左へ移動される。 もしも (和172−和171)<(和173−和17
2) なら、ウインドウは右へ移動される。 このようにしてグレイスケールピクセル値の和(Sx)
は最大値をとるに至る。バーは鉛直方向に向いているの
で、文字の上方および下方の単一行和はウインドウの鉛
直方向の移動を決定するのに適切であり、これは非バー
コード文字の場合と同じである。文字データがメモリ2
7に適切にセグメント化されているとき(すなわち文字
がウインドウ153内で適切にフレーム化されてている
とき)は、グレイスケールピクセル値すべての和は最大
値(Sw)をとる。
【0048】セグメント化された各文字は走査データ値
からなるアレイ(配列)(幅21ピクセル、高さ28ピ
クセル)として表される。鉛直走査線37(図1)に沿
うデータはグレイスケールピクセル値の波形を表す。ウ
インドウ内のイメージを2進化するための適切なしきい
値を発見するため、イメージを検査して最も黒い(25
5に最も近い)ピクセルと最も白い(0に最も近い)ピ
クセルとが見い出される。次に以下の方程式に基づいて
2進化しきい値が設定される。 しきい値=最も黒いピクセル−(最も黒いピクセル−最
も白いピクセル)*2/3 例えばもしも最も白いピクセルが値60を有し、最も黒
いピクセルが値200を有するなら、しきい値は しきい値=200−(200−60)*/3=107 のレベルに設定されることになろう。このしきい値レベ
ルはしきい値を超えるセグメント化済み文字データのす
べてのグレイスケールピクセル値を「1」(黒を表す)
に設定し、しきい値未満のグレイスケール値をすべて
「0」(白を表す)に設定することにより、セグメント
化済み文字データを2進化するのに使用される。これに
よって当該セグメント化された当該文字を表す2進
(0,1)ピクセル値からなる21列(21ピクセル
幅)×28行(28ピクセル高)アレイを生ずる。
【0049】「非バーコード文字データの処理」と見出
しを付けた項に上述したテンプレートマッチングルーチ
ン手順を使用して文字の認識を行う準備として、テンプ
レートの大きさに相当するように上記2進アレイの大き
さが低下される(圧縮される)。例えばアレイの底部行
から開始して、ピクセル行を隔行に削除または省略する
(アクセスを跳ばす)ことにより、アレイは14行×2
1列のピクセルアレイに低減(圧縮)できる。さらに圧
縮したアレイを反時計方向に90度回転することにより
(すなわちアレイが回転されたかのごとくにアレイのデ
ータ値にアクセスすることにより)、アレイは21×1
4アレイと見ることができ、実際、各文字の境界を形成
する白ピクセル(文字の両側それぞれと上側および下側
に一ピクセル)が含まれるときは、23×16アレイと
見ることができる。このアレイの圧縮および回転により
バーコード情報(バーと間隙の比)を著しく損なうこと
なくアレイの大きさおよび方向をテンプレートの大きさ
および方向に相当するようにすることができる。
【0050】次に、メモリ27内に格納された、予定バ
ーコード文字パターンを表す相当サイズ(23×16)
のテンプレートを上述したように使用して当該文字の2
進パターンをテンプレートパターンに符号させ、当該文
字を認識する。図9(a)には欠陥あるバーコード情報
を持つ文字(文字「4」)の例が示してある。それに対
応する、(欠陥を表すノイズを含む)2進パターンが図
9(b)に示されている。文字「4」の認識に使用され
る符合するテンプレートのビットパターンの例が図9
(c)に示されている。もしもテンプレートマッチング
ルーチンが文字の認識に失敗すると、当該文字の2進化
に使用したしきい値が しきい値=最も黒いピクセル−(最も黒いピクセル−最
も白いピクセル)*1/2 に低下される。前述の例と同様に、もしも最も白いピク
セルが値60を持ち、最も黒いピクセルが値200を持
つことが発見されたとすると、しきい値は 200−(200−60)*1/2=130 のレベルにされる。当該文字情報がCMC7文字のバー
よりも黒でない(すなわち低いピクセル値を有する)と
きはこのしきい値レベルを使用することによりCMC7
文字を不明瞭化する情報(例えばスタンプ、汚れ、ぺん
書きマーク等)を「脱落させる」効果を有する。
【0051】
【効果】本テンプレートマッチングシステムは文字全体
の形状またはパターンを検査するので、バーに欠損があ
る場合、余分なバー(署名によるぺン書きマーク等)を
含む場合、あるいは文字パターンのバー間隔に不規則そ
の他の文字崩れの問題がある場合でも文字認識ができ
る。上述したように、本発明のテンプレートマッチング
システムをバー/間隙比分析システムと関連させて(ま
たはその代わりに)使用するとき、読み取り速度(認識
すべき全文字数に対する認識された文字数の比率)が著
しく改善される。
【図面の簡単な説明】
【図1】本発明のシステムのブロック線図である。
【図2】図1のシステムにより読み取り可能(走査可能
かつ同定可能)なバーコード文字の外観を例示する図で
ある。
【図3】いろいろの不透明さ(グレイスケール値)をも
つピクセルからなるマトリックスを有する、走査した文
字の図解である。
【図4】バーコード化されていない文字のフレーム化に
使用されるウィンドウ(a)およびバーコード化されて
いる文字のフレーム化に使用されるウィンドウ(b)の
図である。
【図5】バーコード化されていない文字のフレーム化に
使用した図4(a)のウィンドウの図である。
【図6】走査およびフレーム化した文字を表す2進デー
タにいろいろの論理オペレーションを行った結果を示す
ブロック線図である。
【図7】フレーム化した文字のイメージのいろいろの部
分を表すマトリックスのブロック線図である。
【図8】本システムがバーコード化されていない文字を
表すのに使用するテンプレートおよび関連の2進値の図
解および表である。
【図9】印刷品質の低いバーコード文字、対応の2進パ
ターン、およびバーコード文字を表すのに図1のシステ
ムが使用した対応のテンプレートを例示する図である。
【符号の説明】
20 英数字 33 文書の右
底部隅 35 文書の頂部左隅 37 走査方向 39 最右の走査線 41 走査線 43 文書の移動方向 45 鉛直バー
(データバー) 47 短い間隙 49 長い間隙 51 暗ピクセル 53 明ピクセ
ル 55 文字間空間
───────────────────────────────────────────────────── フロントページの続き (72)発明者 メアラ クルカーニ カナダ エヌ2ティー 1ピー3、オンタ リオ、ウォータールー、リージェンシー クレッセント 463 (72)発明者 レイモンド エル.ヒギンズ カナダ エヌ2エヌ 2エム1、オンタリ オ、キッチナー、イエロー バーチ ドラ イブ 25

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】光学的文字認識システムであって文書上の
    不透明度の異なるバーおよび間隙からなる予定パターン
    を有するバーコード文字を光学的に走査すると共に、該
    不透明度に対応するグレイスケール値を、明ピクセルお
    よび暗ピクセルのパターンを表す複数のグレイスケール
    値として、発生する手段と、 該文字を表す予定の2進パターンを含む複数の予定2進
    パターンを含む予定テンプレートと該グレイスケール値
    とを格納するためのプログラムを具えたメモリ手段と、 該走査手段および該メモリ手段に結合され、該プログラ
    ムの制御の下にオペレーションを行う処理手段にして、
    該グレイスケール値から該文字を表す値のマトリックス
    を選択することにより該文書上の該文字の位置を特定
    し、該マトリックス値を2進データに変換し、該2進デ
    ータを圧縮し、さらに該圧縮済み該2進データに符合す
    ることにより該文字を同定する働きをするパターンを該
    複数の予定テンプレート2進パターンの中から選択す
    る、前記処理手段とを含む光学文字認識システム。
  2. 【請求項2】予定長の高さ、幅および不透明度の異なる
    予定のバーと間隙を有する文書上のバーコード文字にし
    て複数の予定テンプレート2進パターンの一つにより表
    される前記バーコード文字を、光学的に同定する方法に
    して、 光学的に文書を走査して該不透明度に対応するグレイス
    ケール値を、明ピクセルおよび暗ピクセルを表す複数の
    グレイスケール値として、発生するステップと、 該グレイスケール値から文字を表す値のマトリックスを
    選択することにより該文書上の文字の位置を特定するス
    テップと、 該マトリックス値を2進データに変換するステップと、 該2進データを圧縮するステップと、 該圧縮済み該2進データに符合することにより該文字を
    同定する働きをするパターンを該複数の予定テンプレー
    ト2進パターンの中から選択するステップとを含むバー
    コード文字同定方法。
JP4267871A 1991-09-18 1992-09-11 テンプレートを使用してバーコード文字を光学的に認識する方法および装置 Pending JPH05250515A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/761,661 US5367578A (en) 1991-09-18 1991-09-18 System and method for optical recognition of bar-coded characters using template matching
US761661 1991-09-18

Publications (1)

Publication Number Publication Date
JPH05250515A true JPH05250515A (ja) 1993-09-28

Family

ID=25062898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4267871A Pending JPH05250515A (ja) 1991-09-18 1992-09-11 テンプレートを使用してバーコード文字を光学的に認識する方法および装置

Country Status (2)

Country Link
US (1) US5367578A (ja)
JP (1) JPH05250515A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502094A (ja) * 2012-11-30 2016-01-21 ケーエルエー−テンカー コーポレイション 相対的なクリティカルディメンションの測定のための方法および装置

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859923A (en) * 1992-12-29 1999-01-12 Cognex Corporation Mark quality inspection apparatus and method
US6543691B1 (en) * 1995-01-03 2003-04-08 Jerome H. Lemelson Method and apparatus for encoding and decoding bar codes with primary and secondary information and method of using such bar codes
US6032861A (en) * 1995-01-03 2000-03-07 Lemelson; Jerome H. Method and apparatus for encoding and decoding bar codes with primary and secondary information and method of using such bar codes
US6535210B1 (en) 1995-06-07 2003-03-18 Geovector Corp. Vision system computer modeling apparatus including interaction with real scenes with respect to perspective and spatial relationship as measured in real-time
US5764798A (en) * 1996-03-18 1998-06-09 Intermec Corporation Prioritized searching methods for finding a coded symbol in a digitized image
US5698833A (en) * 1996-04-15 1997-12-16 United Parcel Service Of America, Inc. Omnidirectional barcode locator
US6366696B1 (en) * 1996-12-20 2002-04-02 Ncr Corporation Visual bar code recognition method
DE19734031A1 (de) * 1997-08-06 1999-02-11 Sick Ag Verfahren und Vorrichtung zum Lesen eines aus einer vorgegebenen Anzahl von Codeelementen bestehenden Strichcodes
US6173213B1 (en) 1998-05-11 2001-01-09 Ellison Machinery Company Motorized inbound laser orientation and wheel recognition station
US6252607B1 (en) * 1998-07-27 2001-06-26 Attachmate Corporation Method and system for character spacing in graphics terminal emulation
US6678414B1 (en) * 2000-02-17 2004-01-13 Xerox Corporation Loose-gray-scale template matching
US6522292B1 (en) 2000-02-23 2003-02-18 Geovector Corp. Information systems having position measuring capacity
US6757431B2 (en) * 2000-12-19 2004-06-29 Xerox Corporation Resolution conversion for anti-aliased images using loose gray scale template matching
US7031875B2 (en) * 2001-01-24 2006-04-18 Geo Vector Corporation Pointing systems for addressing objects
US20020181779A1 (en) * 2001-06-04 2002-12-05 Hansen Von L. Character and style recognition of scanned text
US20030059099A1 (en) * 2001-09-27 2003-03-27 Longford Equipment International Limited Optical character recognition system
US6655592B2 (en) * 2001-10-10 2003-12-02 Hewlett-Packard Development Company, L.P. Graphically demodulating graphical bar codes without foreknowledge of the original unmodulated base image
US7051937B2 (en) 2002-03-22 2006-05-30 Lockheed Martin Corporation System and method for fast binarization of bar codes in the presence of noise
US20040219961A1 (en) * 2003-04-08 2004-11-04 Ellenby Thomas William Computer games having variable execution dependence with respect to spatial properties of a mobile unit.
JP4713107B2 (ja) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 景観中文字列認識方式および装置
DE102004059388B4 (de) * 2004-12-09 2006-11-30 British American Tobacco (Germany) Gmbh Zerfaserung von Tabakmaterial
US20060190812A1 (en) * 2005-02-22 2006-08-24 Geovector Corporation Imaging systems including hyperlink associations
JP4743065B2 (ja) * 2006-09-27 2011-08-10 ブラザー工業株式会社 画像認識装置、複写装置及び画像認識方法
DE102006059659B4 (de) * 2006-12-18 2009-12-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US8172152B2 (en) * 2009-03-20 2012-05-08 Delphax Technologies, Inc. Method for inkjet printing of E13B magnetic ink character recognition characters and substrate having such characters printed thereon
US9098764B2 (en) * 2009-07-20 2015-08-04 The Regents Of The University Of California Image-based barcode reader
US8079524B2 (en) * 2009-11-30 2011-12-20 Symbol Technologies, Inc. Imaging-based scanner including border searching for image acquisition
KR101102896B1 (ko) * 2011-03-04 2012-01-09 (주)올라웍스 복수의 사용자가 동시에 콜렉션을 수행할 수 있도록 지원하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체
EP3005235A1 (en) * 2013-05-24 2016-04-13 Life Technologies Corporation Methods and systems for detection of a consumable in a system
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion
US10679101B2 (en) * 2017-10-25 2020-06-09 Hand Held Products, Inc. Optical character recognition systems and methods

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3688955A (en) * 1969-11-24 1972-09-05 Automatisme Cie Gle Character-reading apparatus incorporating electronic scanning circuitry
US3629833A (en) * 1969-11-24 1971-12-21 Frederick M Demer Character recognition system employing a plurality of character compression transforms
GB1547119A (en) * 1977-12-09 1979-06-06 Ibm Image rotation apparatus
US4408342A (en) * 1981-04-16 1983-10-04 Ncr Corporation Method for recognizing a machine encoded character
US4468809A (en) * 1981-12-23 1984-08-28 Ncr Corporation Multiple font OCR reader
JPS59790A (ja) * 1982-06-28 1984-01-05 Fuji Electric Co Ltd パタ−ン識別装置
US4903316A (en) * 1986-05-16 1990-02-20 Fuji Electric Co., Ltd. Binarizing apparatus
US4822986A (en) * 1987-04-17 1989-04-18 Recognition Equipment Incorporated Method of detecting and reading postal bar codes
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
DE3720489A1 (de) * 1987-06-20 1988-12-29 Sood Ralf A Verfahren zum lesen von text- und druckvorlagen
KR910007752B1 (ko) * 1988-01-18 1991-09-30 가부시키가이샤 도시바 문자인식시스템
US4873426A (en) * 1988-08-03 1989-10-10 Image Business Systems Corporation Technique for reading bar codes
US5052044A (en) * 1990-02-02 1991-09-24 Eastman Kodak Company Correlated masking process for deskewing, filtering and recognition of vertically segmented characters
US5077805A (en) * 1990-05-07 1991-12-31 Eastman Kodak Company Hybrid feature-based and template matching optical character recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502094A (ja) * 2012-11-30 2016-01-21 ケーエルエー−テンカー コーポレイション 相対的なクリティカルディメンションの測定のための方法および装置

Also Published As

Publication number Publication date
US5367578A (en) 1994-11-22

Similar Documents

Publication Publication Date Title
JPH05250515A (ja) テンプレートを使用してバーコード文字を光学的に認識する方法および装置
EP0492979B1 (en) Optical character recognition apparatus and method
US5557689A (en) Optical word recognition by examination of word shape
US5640466A (en) Method of deriving wordshapes for subsequent comparison
EP0543593B1 (en) Method for determining boundaries of words in text
US6366696B1 (en) Visual bar code recognition method
CN112507782B (zh) 文本图像的识别方法及装置
EP1086439B1 (en) Techniques for reading postal codes
US5410611A (en) Method for identifying word bounding boxes in text
US7590275B2 (en) Method and system for recognizing a candidate character in a captured image
EP0543590B1 (en) Method for comparing word shapes
US9158986B2 (en) Character segmentation device and character segmentation method
US20080310721A1 (en) Method And Apparatus For Recognizing Characters In A Document Image
Yuan et al. Text extraction from gray scale document images using edge information
Palacios et al. A system for processing handwritten bank checks automatically
Chahi et al. Block wise local binary count for off-line text-independent writer identification
JPH0587871B2 (ja)
Sawaki et al. Text-line extraction and character recognition of document headlines with graphical designs using complementary similarity measure
Lehal et al. Feature extraction and classification for OCR of Gurmukhi script
US5563958A (en) System and method for optical character recognition bar-coded characters
US5272766A (en) OCR system for recognizing user-specified custom fonts in addition to standard fonts using three-layer templates
Mostafa An adaptive algorithm for the automatic segmentation of printed Arabic text
EP0495607B1 (en) A method and apparatus for representing an unrecognised character in optical character recognition means for subsequent recognition
CN114694162B (zh) 基于图像处理的发票图像识别方法及系统
JPH02116987A (ja) 文字認識装置