JPH05250515A

JPH05250515A - テンプレートを使用してバーコード文字を光学的に認識する方法および装置

Info

Publication number: JPH05250515A
Application number: JP4267871A
Authority: JP
Inventors: Dennis W Golem; ダブリュー．ゴーレムデニス; Meera Kulkarni; クルカーニメアラ; Raymond L Higgins; エル．ヒギンズレイモンド
Original assignee: NCR International Inc
Current assignee: NCR International Inc
Priority date: 1991-09-18
Filing date: 1992-09-11
Publication date: 1993-09-28
Also published as: US5367578A

Abstract

(57)【要約】（修正有）【目的】小切手等の文書上のバーコード文字の光学的
走査と認識を行う方法とシステムを提供する。【構成】本システム２１は光学的スキャナ１３、マイ
クロプロセッサ２３、ＲＯＭ２５とデータ並びに複数の
予定文字同定２進パターン（テンプレート）を格納する
格納プログラム付ＲＡＭ２７を含む。スキャナは文書１
９を走査し、複数のグレイスケールピクセル値を発生。
マイクロプロセッサ２３は格納されたピクセル値を処理
し各文字２０の位置を特定し、その文字をテンプレート
に比較照合。プロセッサは照合の失敗、文字の拒絶時
に、文字の座標を使用して当該文字をセグメント化した
文字のピクセル値を２進データに変換し、これを圧縮
し、テンプレートと照合し、当該２進データに符合する
テンプレートを複数テンプレートから選択する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文書の走査および英数字
一般の認識に関し、特にテンプレートを使用してＣＭＣ
７型のバーコード化された文字（以下、バーコード文字
という）を光学的に走査し認識することに関する。

【０００２】

【従来の技術】ＣＭＣ７文字セットはフランスのカンパ
ニエ・ド・マシネ・ブル社により開発された文字組み
で、主としてヨーロッパの多くの国で経済取引上広く使
用されている。一般的にこれらの文字は銀行為替、小切
手その他の経理文書上に磁気スキャナで走査できるＭＩ
ＣＲ（磁気インク文字記録）形式で記録されている。各
文字は、予定の高さ、幅、および不透明度の異なるバー
とバー間の間隙（例えば７本のバーとバー間の６個の間
隙であって、４個の間隙が短い（狭い）幅を有し、２個
の間隙が長い（広い）幅）を有する。しかしながら、バ
ーコードの印刷品質が劣っていたり、当該文字パターン
がぺんによるなぞり書きその他のノイズにより崩れてい
るときは光学的文字認識はしばしば適切な文字認識がで
きない。

【０００３】

【発明が解決しようとする課題】そこで本発明は、文字
パターンの印刷が低品質のとき、あるいは文字パターン
のバー間隔に不規則その他の文字崩れの問題があると
き、それらバーコード文字が良好に認識できるシステム
を与えることを課題とする。

【０００４】

【課題を解決するための手段】本発明は、文字形状（テ
ンプレートパターン）情報を使用してバーコード文字を
認識する光学的文字認識のためのシステムおよび方法を
与える。このシステムは、印刷が低品質であるとき、あ
るいは文字の一部が不明瞭であったり、その他外部的原
因で崩れている場合でも、良好にバーコード文字を認識
できる。

【０００５】第一の局面で、本発明の光学文字認識シス
テムは、（ａ）文字と異なる不透明度を有する文書上に
おいて不透明度の異なるバーおよび間隙からなる予定パ
ターンを有するバーコード文字を光学的に走査（入力お
よび格納）すると共に、該不透明度に対応するグレイス
ケールピクセル値を、明ピクセルと暗ピクセルを表す複
数のグレイスケールピクセル値として発生するＣＣＤス
キャナと、（ｂ）前記グレイスケールピクセル値と、プ
ログラムと、文字を表す複数の予定テンプレート２進パ
ターンにしてその一つが該文字を表すようにされたテン
プレート２進パターンとを格納するメモリと、（ｃ）前
記スキャナおよびメモリに結合され前記プログラムの制
御の下にオペレーションを行うプロセッサにして、該グ
レイスケール値から該文字を表す値のマトリックスを選
択することにより該文書上の該文字の位置を特定し、該
マトリックス値を２進データに変換し、該２進データを
圧縮し、さらに該圧縮済み該２進データに符合すること
により該文字を同定する働きをするパターンを該複数の
予定テンプレート２進パターンの中から選択するプロセ
ッサを含む。

【０００６】このＣＣＤスキャナは制御論理回路を含
み、プロセッサはマイクロプロセッサを含み、メモリは
立ち上げルーチン付きＲＯＭ（読み取り専用メモリ）
と、プログラム、ピクセル値および２進パターンを有す
るＲＡＭ（ランダムアクセスメモリ）とを含む。

【０００７】第二の局面で、本発明の方法は、予定長の
高さ、幅、および不透明度の異なる予定のバーと間隙を
有する文書上のバーコード文字にして複数の予定テンプ
レート２進パターンの一つにより表される前記バーコー
ド文字を光学的に同定する方法にして、（ａ）光学的に
文書を走査し、該不透明度に対応するグレイスケールピ
クセル値を、明ピクセルおよび暗ピクセルを表す複数の
グレイスケールピクセル値として発生するステップと、
（ｂ）該グレイスケールピクセル値から文字を表す値の
マトリックスを選択することにより該文書上の文字の位
置を特定するステップと、（ｃ）該マトリックス値を２
進データに変換するステップと、（ｄ）該２進データを
圧縮するステップと、（ｅ）該圧縮済み該２進データに
符合することにより文字を同定する働きをするパターン
を該複数の予定テンプレート２進パターンの中から選択
するステップとを含むバーコード文字同定方法を与え
る。文書上の文字は例えばＣＭＣ７フォーマットで記録
されている。カメラ（ＣＣＤスキャナ）は文書を鉛直方
向に、底部右隅から出発して底部から頂部へ走査する。
文書は文書の左頂部隅に走査が到達し走査が終了したこ
とを示すまで、文書は右へ連続的に移動される（その場
合、鉛直方向の各走査幅は一ピクセルの直径に相当す
る）。

【０００８】ある文字（すなわちある文字を表すグレー
スケールピクセル値）の位置を特定するにあたり、本シ
ステムは当該文字に対して選択したピクセル値の上に窓
（ウインドウ）を配置する（以下これを、文字のフレー
ム化と言う）。このフレーム化はこのウィンドウ内の選
択ピクセル値の和が最大となるように行う。ウインドウ
の配置に当たり、本システムは文字データの少なくとも
三列を使用して文字縁および文字間間隙を同定する。次
に本システムは選択したピクセル値から、しきいレベル
を計算し、選択したピクセル値をそのしきいレベルを基
準とする２進データに変換する。次にこの２進データは
より小さなマトリックス（配列）に圧縮され、その文字
と最も良く一致するパターンが発見される迄、予定のテ
ンプレート２進パターンの各々と論理比較される。各テ
ンプレート（２進パターン）は三ビットコンフィギュレ
ーション（レベル）を有する。その第一ビットコンフィ
ギュレーションは文字の実際のビットパターンを表し、
第二ビットコンフィギュレーションは実際のビットパタ
ーンのビットの有意性（significance）を表し、第三ビ
ットコンフィギュレーションは実際のビットパターンの
ビットの重み値を表す。この変換された２進データが各
予定ビットパターンの各三ビットコンフィギュレーショ
ンに論理的に匹敵する程度が、「ミスマッチワード」と
して表現され、このミスマッチワードからミスマッチ計
数が計算される。次にこのミスマッチ計数が少なくとも
一つの予定しきい値と比較され、当該しきい値より小さ
い（すなわちしきい値未満の）最小ミスマッチ計数が当
該文字を表すものとして選択される。

【０００９】

【実施例】以下に本発明のシステムを説明する。本シス
テムは印刷が低品質であるかあるいは文字の一部（バ
ー、間隙）が外部的原因で崩れているときに良好なバー
コード文字認識を与える。

【００１０】文字間のバー間隔に関する情報は従来バー
コード文字を認識するのに使用されている。文字形状お
よびテンプレートパターン情報は従来バーコード化され
ていない文字の認識に使用されている。本発明のシステ
ムはテンプレートパターン情報をバーコード文字の認識
に拡張使用するものである（以下、この方法をテンプレ
ートマッチング方法という）。テンプレートマッチング
方法の一適用例（ルーチン）を挙げれば、バーコード認
識方法を使用して行うＣＭＣ７バーコード文書の読み取
りがある。この方法は、印刷品質が低いため、または外
部的ノイズのためにバーコード文字の認識に失敗したと
き、その文字の分類を助けるため、本テンプレートマッ
チング方法が呼び出される。テンプレートマッチング方
法が当該文字の分類を完了した後、バーコード認識方法
が続行され、文書の残りが処理される。その後、必要に
応じてテンプレートマッチング方法が呼び出される。

【００１１】図１は本発明のシステム１１を示す。この
システムは文書１９を走査するための光学的読取り機ま
たはスキャナ１３と、スキャナ１３から受信したデータ
を処理するコンピューターシステム２１とを含む。この
スキャナはＣＣＤ（電荷結合デバイス）１５および制御
器１７を具えたカメラでよい。文書１９は銀行為替とか
上に英数字２０を印刷された小切手等である。コンピュ
ーターシステム２１はマイクロプロセッサ２３と、ブー
トプログラムを備えたＲＯＭ（読み取り専用メモリ）２
５と、走査デバイスおよびマイクロプロセッサからのデ
ータを格納し、また予め定義されたテンプレートパター
ン（すなわち選択された文字を表す２進データのパター
ン）を格納するためのプログラム付きＲＡＭ（随時アク
セス可能メモリ）２７を含む。

【００１２】走査オペレーションは文書１９の右底部隅
３３から始まり、頂部左隅３５で終わる。スキャナ１３
は文書１９の底部から頂部に向けて鉛直方向に、最初は
図の矢印３７で示すように最右の走査線３９から走査
し、次いで再び底部から頂部へ次の最右の走査線４１に
沿って走査を行い、以下同様にして文書の頂部左隅に達
するまで走査する。走査線は平行に配列されている。文
書１９は矢印４３で示すように左から右へ連続的に移動
される。スキャナは連続的走査線に沿って走査を行う。
各走査線の幅はピクセルの直径（約０.０１２７ｃｍす
なわち０.００５インチ）に相当する。このようにして
連続する文字が文書から読み取られる（すなわち入力さ
れ、格納される）。

【００１３】図２に示すような幅２１ピクセル、高さ２
８ピクセルの文字の場合、本システムは、文字をあたか
もそれが幅２３ピクセル、高さ３０ピクセルの領域内に
あるかのように、すなわち文字の頂部、底部および両側
に１ピクセルの白縁があるかのように、取り扱う。文書
上に記録された文字のイメージは磁気的なものでも非磁
気的なものであってもよい。

【００１４】図２に示すように各文字２０は７個の平行
な鉛直バー（データバー）４５と４個の短間隙４７とバ
ー間の二つの長間隙４９とで一意的に定義される。走査
方向３７（図１）は平行なバーの方向に一致する。各バ
ーは０．０１０ないし０．０１９ｃｍの幅で、各短間隙
は０．０１１ないし０．０１９ｃｍの幅、各長間隙は
０．０３１ないし０．０３９ｃｍの幅でよい。

【００１５】文字の走査および処理（セグメント化およ
び認識）は、各文字を構成する鉛直バーと間隙を含む当
該文字形状とで記述される。各バーの高さは変化する
が、バーおよび間隙の幅は予定の範囲内に保持（印刷）
される。一文字についてのバーの幅および間隙は同じ文
字組の他の文字のバーおよび間隙の幅と同一である。

【００１６】文字のいろいろのバーおよび間隙を表すた
め、文字が走査されるときにスキャナにより発生される
ピクセル値は、例えば２８行（すなわち文字の高さを表
す２８ピクセル）および２１列（すなわち文字幅に相当
する２１ピクセル）を有するデータ配列（マトリック
ス）としてメモリ２７（図１）中に格納される。連続す
る文字間の空間および文字の上方と下方の空間（すなわ
ち文書の地が現われている空間）を表すピクセルを除外
すると、文字（例えば文字「９」）のバーおよび間隙は
図３に示す配列で表すことができる。各暗ピクセル５１
は鉛直バー４５の一部を表し、範囲０-２５５の不透明
インデックスすなわちグレイスケール値を有する。各明
ピクセル５３は間隙４７、４９または文字間空間５５の
部分を表し、範囲０-２５５の不透明／グレイスケール
値を有する。暗ピクセルは一般に大きなグレイスケール
値（２５５に近い値）を有し、また明ピクセルは一般に
より小さな値（０に近い値）を有する。

【００１７】上述したようにこれらのグレイスケールデ
ータ値は文書を走査するスキャナにより発生される。発
生されたデータは次いでシステムで処理するため、メモ
リ２７（図１）内に格納される。バーコード文字データ
の処理において本システムで採用する方法は、「バーコ
ード文字の処理」という以下の見出しつけた下記の項で
説明する。しかし読者にとって本処理方法をより良く理
解できるようにするため、バーコード化されていない文
字データ（以下、非バーコード文字データという）の処
理を初めに説明する。

【００１８】非バーコード文字データの処理このシステムは格納されたプログラムの制御の下に、格
納されたデータ値を調べ、最初の文字の位置特定に進
み、次いで最初のフィールドの後続文字に進み、次いで
後続フィールドの他の文字に進む。文字の位置特定が終
わると、システムは当該文字をフレーム化または区画化
（delimit）する（すなわち他の文字から当該文字を分
離またはセグメント化（segment）する）。最右のスキ
ャナ走査線３９（図１、２）に沿って底部から頂部への
走査から開始し、次いで次の最右走査線４１に沿って底
部から頂部へ走査し、以下同様に文書を走査して得た格
納グレイスケールデータ値から、システムは以下に述べ
るように各文字の位置を特定しフレーム化（セグメント
化）する。これは、最初に格納されたデータを捜索し、
走査線に沿う明ピクセルから暗ピクセルへの遷移を表す
グレイスケール値の上昇を探知することにより行う。も
しも例えば４０（この４０というこの特定の値はフォン
トに依存する）より大きい上昇が、走査方向３７に隣接
するピクセルの二つのグレイスケールデータ値の間に発
見されると、暗ピクセルが発見されたと考えられる。こ
の暗ピクセルに近接する（文書の）領域は、文字が発見
される確率が高い領域であると見做される。暗ピクセル
が発見されると、システムはこの文字領域を検査し（す
なわち暗ピクセル値に近い格納済みデータを検査し）、
この暗ピクセルが文字の一部であるか否かを決定する。
システムは文書上の文字を効果的にフレーム化するに足
りる大きさのセグメント化ウィンドウを確立することに
より文字の存在を検査する。暗ピクセルの位置はウィン
ドウの中心に相当する。左縁および右縁（列）５５、５
７および頂部縁および底部縁（行）５９、６１を有する
セグメント化ウィンドウ５３が図４（ａ）に示されてい
る。左縁および右縁の境界をなしているのは（左＋１）
列６３および（右−１）列６５で、頂部縁および底部縁
の境界をなしているのは（最上＋１）行６７、および
（底部−１）行６９である。

【００１９】図４（ａ）、５を参照して以下に説明する
ように、文字はウィンドウ内のすべてのグレイスケール
ピクセル値の和が最大となったときにフレーム化され、
かつウィンドウの中心に配置されたと考えられる。ウィ
ンドウが移動されるときに和（Ｓｗ）が増大するか否か
を決定するため、左右の列５５、５７各々の中のピクセ
ル値とそれらの各境界列６３、６５の中のピクセル値と
の和が計算される。同様に、頂部列５９および底部列６
１各々の中のピクセル値と境界列６７、６９各々の中の
ピクセル値との和が計算される。例えばもしも列６３内
の和が列５７内の和よりも大きいことが発見され、かつ
列６３を含め列５７を排除するようにウィンドウ５３を
一ピクセルだけ左へ移動するとウィンドウ内の和（Ｓ
ｗ）が増大するようであれば、ウィンドウは左へ移動さ
れる。同様に、もしも行６７を含め、行６１を排除する
ようにウィンドウを一ピクセルだけ上に移動すればウィ
ンドウ内の和（Ｓｗ）が増大するなら、ウィンドウは上
に移動される。このようにウィンドウに隣接する（すな
わち境界をなす）行、列のピクセル値の和（累積的カウ
ント）は、ウィンドウの縁にある行および列のピクセル
値の和に相対的な値であり、この値からウィンドウ内の
ピクセル値の和（Ｓｗ）を増大させるようにウィンドウ
を移動させる方向が決定できる。図５に示すように、下
記のカウントにより、左への移動に伴ってウィンドウカ
ウントが１００だけ増大され、上への移動に伴って１７
０増大される。「右−１」列のカウント＝０「右」列のカウント＝０「左」列のカウント＝１００「左＋１」列のカウント＝１００「底部−１」行のカウント＝０「底部」行のカウント＝０「頂部」行のカウント＝１７０「頂部＋１」行のカウント＝１７０したがってウィンドウは左および上へ移動される。この
ようにしてウィンドウはＳｗの増大する方向に移動さ
れ、このオペレーションはウィンドウを四つの任意の方
向（左、右、上、下）に移動してももはやＳｗを増大さ
せなくなるまで反復される。このときウィンドウは文字
をフレーム化した（区画化またはセグメント化した）と
考えられ、当該文字はウィンドウの中心に配置されてい
ると考えられる。このようにしてこのウィンドウにより
文字を最もよく表すピクセル値のマトリックスが選択さ
れる（フレーム化される）。

【００２０】フレーム化された文字を表す情報（暗ピク
セルグレイスケール値）が十分にウィンドウ内にあるか
否かを決定する検査として、予定の確認しきい値（例え
ばしきいグレイスケール値１００）を超えるウィンドウ
内ピクセルの全数を計算する。もしもこの全数が例えば
６０（Ｅ１３Ｂフォントのようなフォントの場合）以上
であると、ウィンドウ内に文字が見つかったことが確認
される。そうでないときはウィンドウ内にフレーム化さ
れた対象物はノイズと解釈され、システムは新しい文字
を発見する手続きに進む。

【００２１】フレーム化の後、セグメント化（フレーム
化）された文字は同定に備えて縮尺変更（scale）され
る。認識プロセスでは１６ビットワードが使用される
（すなわち、テンプレートの幅が１６ピクセルであ
る）。多くの文字が１６ピクセルより幅が広い（たとえ
ばＥ１３Ｂ文字は１９ピクセルである）ので、それらは
フレーム化した後に１６ビットに変換される。これは予
定の列、例えばＥ１３Ｂフォントの場合、列４、９、お
よび１４を除去することにより達成される。（ＯＣＲＡ
およびＯＣＲＢフォントは、２００ピクセル／インチの
とき、幅が１６ピクセルであり、列の除去は必要でな
い。）

【００２２】前節までの説明は処理の準備として文字が
どのように文書上の位置特定を受けるか、すなわち後の
処理のためどのように文書上の位置を特定され効率よく
フレーム化（セグメント化）されるかを説明するもので
ある。以下の説明は、フレーム化された文字が当該文字
の同定（分類／認識）のために２進型式に変換され、次
いでテンプレート（これは予定の２進パターンである）
と比較される一つの方法の説明である。

【００２３】この変換オペレーションではフレーム化さ
れた各行の文字について格納されたグレイスケールピク
セル値が２進型式に変換される。最初に、フレーム化さ
れた文字の暗ピクセルの算術平均として基準しきい値が
（前述したように）計算される。次いでこの基準しきい
値に相対的に、グレイスケールピクセル値が２進形に変
換される。例えばもしも計算された基準しきい値が１０
０であると、グレイスケール値８０、１２０、１３０、
９０、８５、７０、１１０、１３５は図６の８ビットワ
ード７１に示すビットパターン０１１０００１１を有す
る２進データに変換することができる。これは以下に示
す２進等価スケールを用いて行われる。グレイスケールピクセル値２進型式等価値 ≧１００１（黒）＜１０００（白）

【００２４】この２進データはフレーム化された文字の
一行または薄片（slice）を表す。次にこの２進データ
および当該文字を表す他の行の変換済み２進データが複
数のテンプレートと比較される。各テンプレートは一文
字に対応する。各テンプレートは２進データの予定パタ
ーンを表し、三つの異なるレイヤー（ビットコンフィギ
ュレーション）を含む。図６に示すこれら三つの８ビッ
トワード７３、７５、７７は三つの各レイヤーにおける
８ビット行を表す。第一レイヤー（これはビットパター
ンレイヤーで、パターンワード７３に対応する）は文字
の実際の黒／白（０／１）パターンを表す。第二レイヤ
ー（これはビット有意レイヤー（bit-significance lay
er）で、ビット有意ワード７５に相当する）は有意の文
字のビット位置および有意でない文字の位置を同定す
る。１-ビットは、文字のビットパターンが文字の大き
さおよび形状に拘わらず不変に留まると予想される有意
ビット位置を同定する。０-ビットは、文字の大きさま
たは形状が異なるときビットパターンが同一とは限らな
い非有意ビット位置を同定する。第三レイヤー（これは
ビット重みレイヤーで、主にワード７７に対応する）は
類似の（実質的に類似の）文字を識別するときにいずれ
のビットが重要であるか、またそれゆえにいずれのビッ
トが他のビットより大きな重みを有するかを同定する。
この第三レイヤーでは１-ビットは重みのあるビットに
指定され、０-ビットは重みなしのビットに指定され
る。例えば文字「Ｏ」と「Ｕ」に対するテンプレートの
第三レイヤーの頂部行における１-ビットは、これら二
つの文字を識別するのに有用である。また文字「Ｑ」と
「Ｏ」に対するテンプレートの第三レイヤーの底部行内
の１-ビットは、「Ｑ」と「Ｏ」とを識別するのに有用
である。

【００２５】図６に示すように文字同定のため、２進デ
ータ７１にいろいろの論理オペレーションがマイクロプ
ロセッサ２３（図１）により行われる。（これら論理オ
ペレーションは実際には１６ビットオペレーションとし
て行われる。しかし、簡単のため８ビットオペレーショ
ンを図示する）。第一に、２進データはビットパターン
レイヤーの対応ワード７３との間で排他的ＯＲ演算さ
れ、２進データ７１と正しい予定パターン７３との間の
ミスマッチパターン７４を発生する。次いでこのミスマ
ッチパターン７４はビット有意レイヤーのワード７５と
論理的ＡＮＤ演算され、ミスマッチワード７６が発生さ
れる。ミスマッチワード７６は、文字の大きさおよび形
状に独立なミスマッチ（不一致）の程度を表す。このミ
スマッチワード７６は次いで重みを付けられる。すなわ
ちビット重みレイヤー内の対応するワード７７と論理的
ＡＮＤ演算され、重み付きミスマッチインジケーター７
８を発生させる。（もしも重み付きワード７７が全く１
-ビットを含まないならば、（その結果は０なので処理
時間を節約するため）重み付けまたはＡＮＤ演算はなさ
れないで、システムは２進データの次行の処理に進
む）。

【００２６】重み付けオペレーションに続いて、２進デ
ータ行７１に対してミスマッチカウント（ＭＣ_R）が計
算される。この計算はマイクロプロセッサ２３（図１）
により次式ＭＣ_R ＝ＭＣ_W ＋（ＷＯＣ × ＷＦ）（１）で求められる。ここにＭＣ_W はミスマッチワードに
対するミスマッチカウント（すなわちミスマッチワード
７６内の１の数）、ＷＯＣはミスマッチインジケータ
ーすなわち重み出力カウント（すなわちミスマッチイン
ジケーターワード７８内の１の数）、ＷＦはＥ１３Ｂ
型文字に対する予定の重み因子（例えば整数２）を表
す。このようにして、図６のミスマッチワード７６、７
８に示すミスマッチビットパターンの場合、ＭＣ_W＝
２、ＷＯＣ＝１、ＷＦ＝２であることが了解できよう。
それゆえ、２進データ行７１について計算したミスマッ
チカウント（ＭＣ_R）は上式（１）から４（すなわち２
＋（１×２））となる。

【００２７】一行についてミスマッチカウントを計算し
た後、システムは上記の方法で文字の残りの行すべてに
ついてのミスマッチカウントの計算に進む。次に文字の
すべての行に対するミスマッチカウントが加算されてテ
ンプレートミスマッチカウント（すなわちフレーム化さ
れた文字に適用したテンプレートに対するミスマッチカ
ウント）を発生する。同様の方法で処理対象のフォント
の文字テンプレートについても、フレーム化した文字に
相対的なミスマッチカウントがテンプレート毎に発生さ
れる。いろいろのテンプレートが処理されるに従い、二
つの最低テンプレートミスマッチカウントとそれらに関
連したテンプレート番号とがメモリ内に格納される。文
字を同定する前提条件は：もしもこの最低カウントがし
きい値（Ｅ１３Ｂフォントでは拒絶しきい値４０）未満
であり、次に低いカウントよりも予定量（Ｅ１３Ｂフォ
ントではしきい値差５）だけ小さければ、システムはこ
の文字を同定する。

【００２８】前述したテンプレートの認識（以下、テン
プレート認識という）は図７に示すように全部で９箇所
で行うことができる。これはイメージ内のノイズ等の因
子により完全にはフレーム化されない文字を同定するた
めに行われる。図７に示す例では、テンプレートおよび
（２進データの）入力パターンの大きさは２３行（高
さ）×１６列（幅）である。テンプレートの三つのレイ
ヤー（パターンレイヤー、ビット有意レイヤーおよび重
み付けレイヤー）はすべて同一方向に同一量移動（shif
t）される。後述する移動位置の説明において「テンプ
レート行」とはビットパターン行、ビット有意行、およ
びビット重み付け行を指す。

【００２９】中央位置８７ではテンプレート９６は入力
パターン９８の真上に配置されている。行２ないし２
２のみがこの比較に使用される。従って、テンプレート
行１はパターン行１と比較され、テンプレート行２はパ
ターン行２と比較され、・・・以下同様である。中央水
平位置８１、８７、９３ではすべての列（１ないし１
６）が使用される。上方中央位置８１では、テンプレー
トの行１ないし２２が入力パターンの行２ないし２３と
比較される。これはテンプレートパターンを鉛直方向上
に一行だけ移動することと同一である。この場合、テン
プレート行１は入力パターン行２と比較され、テンプレ
ート行２は入力パターン行３と比較される、等々であ
る。この状況（水平方向の中央位置）ではテンプレート
と入力パターンのすべての列が比較される。同様にし
て、下端中央位置９３ではテンプレートは下方に一行だ
け移動されており、従ってテンプレート行２ないし２３
が入力パターン行１ないし２２と比較照合される。

【００３０】水平移動した諸位置は入力パターン９８上
でテンプレート９６を左または右へ移動することに対応
する。中央左位置８５ではテンプレート列１ないし１５
および入力パターン列２ないし１６が使用される。（こ
れは鉛直方向に中央位置なので行２ないし２２が入力パ
ターンおよびテンプレートの両方に使用される。）従っ
てテンプレートワードビット１はパターンワードビット
２と比較され、テンプレートワードビット３はパターン
ワードビット４と比較され、以下同様に比較される。例
えばもしもテンプレートパターンレイヤーワードが００１１１１１１００００１１１１であり、入力文字パターンワードが００１０１１１１０００１１１１０であると、テンプレートが左へ１ビット（列）移動され
る。００１１１１１１００００１１１１排他的ＯＲ演算した結果は０１０１０００１００００００００となろう。左への移動演算が行われると、最右のビット
（最下位ビット、ＬＳＢ）は０であることに注意された
い。従ってビット有意ワードのＬＳＢもまた０である
（なぜならば三つのレイヤーすべてが同一方向に同一量
移動されるからである）。それゆえ、ミスマッチワード
７６のＬＳＢは（ビット有意ワードとのＡＮＤ演算の
後）常に０となる。同様に、右への移動は最左ビット
（最高位ビット、ＭＳＢ）を０にし、従ってミスマッチ
ワード７６のＭＳＢは（ＡＮＤ演算の後）常に０とな
る。

【００３１】右向き水平移動（位置８９）は左向き移動
と同様で、方向が反対なだけである。従ってテンプレー
トワードのビット２は入力パターンワードのビット１と
整列する（比較される）。

【００３２】隅位置（位置９５、９１、８３、７９）は
一行分の鉛直移動と一列分の水平移動との組み合わせを
表す。例として、左上位置７９ではテンプレート行１は
左へ一ビット位置だけ移動され、パターンワード２と比
較され、テンプレート行２は左へ一ビット移動されてパ
ターンワード３と比較される、等々である。

【００３３】この方法を使用して文字を認識するために
は、一テンプレートあたり９回のパス数（推移数）に文
字セット中のテンプレート数を乗じた数のパス数が必要
である。例えば４９文字を持つ英数字セットは全部で４
４１（９×４９）個の比較照合を必要とする。これは時
間を消耗する。文字同定もっと速く促進するには入力パ
ターンに対して当初は各テンプレートの中央位置のみを
比較する。いろいろのテンプレートを処理するにともな
い、最低の二つのミスマッチカウントおよびそれらに対
応するテンプレート番号をＲＡＭ２７内に格納する。こ
の最初のパスが終ってから、ただ二つのテンプレートの
残りの８個の位置を処理し、入力されたパターンに対し
て最良の（すなわち最低の）全ミスマッチを発見する。
従って通常、たった６５個（１×４９＋２×８）の比較
が必要である（すなわち必要な４４１個の比較のうちの
約１５％である）。

【００３４】文字の受理または拒否を行うための前提条
件を以下に述べる。

【００３５】前記最低テンプレートミスマッチカウント
は、当該テンプレートが表す文字に対する予定の拒否し
きい値と比較される。もしもこの文字についてのテンプ
レートミスマッチカウントがこのしきい値未満であり、
かつ二つの最低テンプレートについてのテンプレートミ
スマッチの差（最低ミスマッチを、次に最低のミスマッ
チから減じた値）が予定の量（例えば１０）より大きい
と、最低のテンプレートミスマッチを持つテンプレート
がフレーム化された文字を同定する。ミスマッチカウン
トが近すぎるか否かを検査する理由は非常に似かよった
文字（例えばＱとＯ）を区別するためである。もしもミ
スマッチが近いと、文字は誤った同定を犯す危険を避る
ために拒否される。もしも上記の拒否しきい値未満のテ
ンプレートミスマッチがないか、または二つのテンプレ
ートミスマッチカウント近すぎると、下に述べる後処理
オペレーション（post precessing operation）が行わ
れる。もしも後処理オペレーションの後、フレーム化さ
れた文字が依然として拒否されるなら、文字のイメージ
が強化され、２進型式に変換される（これについては後
述する）。次に上記の認識プロセスが再び行われる。も
しも文字が同定される（上記前提条件を満足する）と、
システムは次の文字について上記処理（位置特定および
フレーム化）を行う。

【００３６】中央位置のみを検査すると、前記二つの最
近接文字以外の文字であって中央位置外の位置にある文
字が近接カウントを有する正しい選択文字である、とい
う可能性を見逃すかも知れない。後処理はそのような状
況を修復することができる。もしも選択された二つの最
低カウントの文字が共にそれらの各文字についての予定
拒否しきい値を超えており、あるいは文字間距離（最低
ミスマッチと第二最低ミスマッチとの差）が小さすぎる
ときは、一層良好な照合結果を得るため多数の他のテン
プレートが他の８位置において検査される。いずれのテ
ンプレートを処理するかの選択は、例えばテンプレート
どうしの最近接文字の類似性に基づいて決定される。例
えば最近接する二つの選択文字（最低の二つのミスマッ
チカウントを有するもの）が文字ＤとＯであるとき、こ
れらは両方ともそれらの拒否しきい値以上のミスマッチ
カウントを有する。後処理オペレーションではＤおよび
Ｏに類似する予定の組の文字が次に処理される。これに
は文字０（ゼロ）、Ｑ、Ｃ及びＵが含まれることがあり
うる。このオペレーションの後で最近接の二つの文字の
ミスマッチカウントが検査され（最低のミスマッチカウ
ントが最初に検査される）、それらが拒否条件および文
字間距離条件に合うか否かが観察される。もしも少なく
とも一文字が条件に合うと、その文字が結果として返さ
れ、イメージ中の次の文字の処理（位置特定およびフレ
ーム化）が進められる。

【００３７】もしも上記文字のいずれも拒否条件に適合
しないか、あるいは文字間距離が小さすぎると、フレー
ム化された文字は拒否される。この場合、（後述の通
り）そのイメージが強化される、その文字は再度２進化
され、第二回目の上記認識プロセスが反復される。もし
もその文字が認識されると、その文字が返される。そう
でないときは結果として拒否文字コードが返され、文書
上の次の文字の処理（位置定めおよびフレーム化）が続
けられる。

【００３８】上記の拒否しきい値に加えて後述する出口
しきい値（exit threshold）（例えば値１０）も文字同
定プロセスに使用することができる。処理速度を高める
ため、後続テンプレートミスマッチカウントが出口しき
い値に比較され、出口しきい値未満となるテンプレート
ミスマッチカウントを持つ最初のテンプレートが当該文
字を同定する。この場合、残りのテンプレートは処理さ
れない（これによって処理速度が高まる）。

【００３９】さらに文字同定プロセスの速度を高めるた
め、テンプレートの各行が処理されているときにもしも
現在のテンプレート（すなわち現在処理中のテンプレー
ト）のミスマッチカウントがそれまでに得られた下から
二番目の最低カウントよりも大きいことが発見される
と、進行中の処理は中止される。なぜならばこの現在の
のテンプレートはもはや最低ミスマッチカウントを持つ
二つのうちの一つでありえないからである。認識速度を
さらに高めるため、テンプレートはそれらが最も起生す
る確率の高い順序（例えば英数字フォントでは子音を従
えた母音の前に数字が来る）に予め順序づけておくこと
もできる。もしもミスマッチカウントが出口しきい値よ
り低いなら、（上述したように）残りのテンプレートは
調べる必要がない。このように、最も頻繁に起こる文字
が最初に調べられるべきである。またより高速の文字同
定を促進するためには、テンプレートにより中央位置の
み検査し、その後でもしも最低テンプレートミスマッチ
カウントが出口しきい値を超えれば、出口しきい値に最
近接する二つのテンプレート各々について残りの８位置
を処理するようにでき、最低のテンプレートミスマッチ
カウントを持つテンプレートをもって当該文字を表すも
のとすることができる。さらに同定を速くするため、残
りの８位置（図７）は次の順序７９、８１、８３、８
９、９１、９３、９５で処理することができる。これは
文字が最も配置されている可能性の高い順序である。

【００４０】システムはフレーム化した文字を同定した
後、前にフレーム化した文字の左へ、選択したピクセル
数（例えば３）だけセグメント化ウィンドウを移動する
ことにより、次の文字の処理に進む（すなわち当該フレ
ーム化した文字に近接する文書上の領域を表す次のグル
ープの格納済みピクセル値グループを処理する。）次に
この近接領域における文字がフレーム化（セグメント
化）され、上述したように同定される。エンド-オブ-フ
ィールドが検出されるまで（すなわちもはや文字がな
く、エンド-オブ-フィールド文字があるまで）、残りの
文字（すなわち残りの格納済みピクセルデータ）がすべ
てこのように処理される。

【００４１】もしも文字同定プロセスにおいて文字が拒
否されると、同定を容易にするため、そのイメージが強
化される。このイメージの強化は例えば一定のストロー
ク幅をもつ文字（すなわち文字の各鉛直ストローク幅ま
たは水平ストローク幅が一定数の暗ピクセル数を有する
文字）のイメージを発生することにより行うことができ
る。これは以下に述べるようにして達成できる。第一
に、文字を表すグレイスケールピクセル値（例えば６-
ビット、８-ビット、または１６-ビット値）はもっと小
さな範囲の値に変換される。（この変換は高速処理のた
め例えば３-ビットグレイスケールピクセル値に変換す
るものである。）次いで当該文字イメージの個別ピク
セル値が検査され、ストロークのピクセル値のうち最も
暗い二つまたは三つの値のみが黒に変えられ、他は白に
変えられる。このことにより、例えば米国特許第４,６
２５,３３０号に説明されているような一定ストローク
幅の２進イメージが発生する。

【００４２】文字同定を改善する一助として、各文字の
縁を以下のように処理することができる。上述したよう
に、文字同定プロセスで使用した各テンプレートは選択
された文字セット（例えばＥ１３Ｂ文字セット）の一文
字に対応し、図２および図４に示すように、各文字は幅
１４ピクセル、高さ２１ピクセルである。文字の左およ
び右に余分の一列を付加し、文字の頂部および底部に余
分の一行を付加する。これによって文字の大きさは１６
×２３となる。各テンプレートは各文字に対応して幅１
６ピクセル、高さ２３ピクセルである。各テンプレート
は１４列文字の両側（右側および左側）に余分の列を有
し、また２１行文字の頂部および底部に余分の一行を有
する。各余分の行は１６個の白ピクセルを含み、各余分
の列は、２３個の白ピクセルを含む。これら余分の行お
よび列はある種の文字の縁部分の同定を一層よくするた
めの白ピクセル境界で、１４×２１文字領域を囲む役割
をする。これについて以下に述べる。例えばもしも文字
「Ｅ」が１２×２１「Ｆ」テンプレートと比較照合さ
れ、このテンプレートが上方に一ピクセル位置だけ移動
されると、「Ｅ」の底部におけるピクセル値は失われ
る。なぜならばこの底部はテンプレートミスマッチカウ
ントの発生に使用できなくなるからである。これはＥを
Ｆと誤って同定する結果を来たしうる。なぜならばミス
マッチカウントが低いからである。１６×２３テンプレ
ートでは、Ｅの底部は失われないので、Ｆテンプレート
の底部の白行に比較されるミスマッチカウントに実質的
に寄与することにより、ＥをＦと誤同定することを回避
できよう。同様の説明は１６×２３テンプレートの右お
よび左列に関しても成り立ち、これらの列は「Ｂ」と
「３」のような文字間の誤同定を低減する働きをする。

【００４３】図８に示すように、各１６×２３テンプレ
ートはＲＡＭ２７の６９個の１６ビットワードによって
表すことができる（一インチ当たり２００ピクセルの走
査に相応する）。６９ワードのうち、２３ワードは第一
レイヤービットパターンワードを表し、２３ワードは第
二レイヤービット有意ワードを表し、２３ワードが第三
レイヤービット重みワードを表す。２３ワードの組の各
々が文字の高さに対応し、各１６ビットワードが文字の
幅に対応する。（簡単のため、図６では論理的オペレー
ションを表すのに１６ビットではなく８ビットを使用し
た。）

【００４４】以下に掲げるのは本システムが上記論理的
オペレーションその他の処理オペレーションを行うこと
ができるための格納プログラムの疑似コードリストであ
る。疑似コード PROCEDURE: MAIN 文書イメージからコードラインを認識する。 while (NOT END OF DOCUMENT) { if (FIND FIRST CHARACTER finds a character) then RECOGNIZE FIELD else END OF DOCUMENT } PROCEDURE: FIND FIRST CHARACTER do { SCAN IMAGE FOR WHITE TO BLACK TRANSITION } until (FOUND CHARACTER or END OF DOCUMENT) PROCEDURE: RECOGNIZE FIELD do { RECOGNIZE CHARACTER move to next position } while (FOUND CHARACTER) PROCEDURE: RECOGNIZE CHARACTER BINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER if REJECTED then { ENHANCED BINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER }

【００４５】バーコード文字データの処理非バーコード文字の認識に関する上記のテンプレートマ
ッチングオペレーションは、いくつかの修正（下記）を
施すことにより、バーコード文字データに適用可能であ
る。

【００４６】前述したように文書上のバーコード文字を
走査し、グレイスケールピクセル値を発生させ、メモリ
２７に格納した後で、格納済みのピクセル値が文字毎に
他の文字のピクセル値からセグメント化される。文字は
セグメント化され、文字の底部右縁を表すＸ-Ｙ座標を
発生する。次にこの座標は処理を受けるため、セグメン
ト化ルーチンからバーコード文字認識ルーチンへ送信さ
れる（渡される）。もしもこのバーコード認識ルーチン
が当該バーコード文字を適切に認識することに失敗する
と、次にこのＸ-Ｙ座標文字データを処理するための、
テンプレートマッチング文字認識ルーチン（template m
atching character recognition routine）が呼び出さ
れる。（この代わりとしてＸ-Ｙ座標データを直接にテ
ンプレートマッチング文字認識ルーチンに渡し、バーコ
ード認識ルーチンを素通りしてもよい。）テンプレー
トマッチングルーチンが呼び出されると、当該文字の底
部右隅位置のＸ-Ｙ座標がこのルーチンに渡される。
（Ｘ座標は文字の水平座標すなわち列座標を表し、Ｙ座
標は鉛直座標すなわち行座標を表す。）次にテンプレ
ートマッチングルーチンは以下に述べるようにこのＸ-
Ｙ座標を使ってバーコードセグメンテーションウインド
ウ（bar-code segmentation window）を設定する。この
セグメンテーションウインドウは水平位置（座標）に関
してＣＭＣ７文字幅±１文字幅、鉛直位置（座標）に
関して文字高±１／２文字高の範囲内に文字位置を特定
するように拘束される。（これに失敗すると、バーコー
ドセグメントルーチンにより決定されたＸ-Ｙ座標位置
は、分類化に使用される。）分類化に先立ち、以下に
説明するように文字の境界が検査される。（これはテン
プレートマッチングルーチンを呼び出す前に行われ
る。）

【００４７】ＣＭＣ７文字の検査は、当該文字を囲んで
いる１ピクセル幅の境界の中のピクセル値の平均値を決
定することにより、当該文字が明確な境界を有するか否
かを決定するために行われる。もしもこの平均グレイス
ケールピクセル値が以下に定義するしきい値（ｔｈｒ）
を超えると、それは文字が著しく崩れていることを示
し、テンプレートマッチングは行われない。そうでない
ときはテンプレートマッチングルーチンが呼び出され、ｔｈｒ＝０．９＊（（黒＋白）／２）で定義されるしきい値を使ってテンプレートマッチング
が行われる。ここに「黒」および「白」は当該文字を予
備走査（prescanning）することにより決定される。
「黒」は当該文字の鉛直バー上の最高レベルピクセルで
あり、「白」は鉛直バー間に位置する最低レベルピクセ
ルである。バーコード文字データは、バーコード文字の
縁を決定するために当該文字の内側および外側の二つの
連続列が検査されることを除けば、（上述した）非バー
コード文字データの場合と実質上同様にセグメント化
（フレーム化）される。バーコード文字の性質のため、
（非バーコード文字について行われるように）ウインド
ウの内側および外側の単一列を使用するとその単一列が
バー間の白い間隙に落ちる可能性があり、そうなると当
該文字のセグメントメンテーション（segmentation、セ
グメント化)を誤まる。そのような過誤セグメンテーシ
ョンを回避するため、図４（ｂ）に示すようにウインド
ウ１５３の左の三列１７２内のピクセルの和（和１７
２）がウインドウ内の右の三列１７１内のピクセル和
（和１７１）と比較される。もしも和１７２＞和１７１
であると、ウインドウを左へ移動することにより正味の
利得が現われる。もしもウインドウの右の三列１７３内
のピクセル和がウインドウ内の左の三列１７０内のピク
セル和を超えると、ウインドウを右へ移動することによ
り正味の利得が現われる。上記いずれの状況も真である
場合は以下の計算が行われる。もしも（和１７２−和１７１）＞（和１７３−和１７
２）なら、ウインドウは左へ移動される。もしも（和１７２−和１７１）＜（和１７３−和１７
２）なら、ウインドウは右へ移動される。このようにしてグレイスケールピクセル値の和（Ｓｘ）
は最大値をとるに至る。バーは鉛直方向に向いているの
で、文字の上方および下方の単一行和はウインドウの鉛
直方向の移動を決定するのに適切であり、これは非バー
コード文字の場合と同じである。文字データがメモリ２
７に適切にセグメント化されているとき（すなわち文字
がウインドウ１５３内で適切にフレーム化されてている
とき）は、グレイスケールピクセル値すべての和は最大
値（Ｓｗ）をとる。

【００４８】セグメント化された各文字は走査データ値
からなるアレイ（配列）（幅２１ピクセル、高さ２８ピ
クセル）として表される。鉛直走査線３７（図１）に沿
うデータはグレイスケールピクセル値の波形を表す。ウ
インドウ内のイメージを２進化するための適切なしきい
値を発見するため、イメージを検査して最も黒い（２５
５に最も近い）ピクセルと最も白い（０に最も近い）ピ
クセルとが見い出される。次に以下の方程式に基づいて
２進化しきい値が設定される。しきい値＝最も黒いピクセル−（最も黒いピクセル−最
も白いピクセル）＊２／３例えばもしも最も白いピクセルが値６０を有し、最も黒
いピクセルが値２００を有するなら、しきい値はしきい値＝２００−（２００−６０）＊／３＝１０７のレベルに設定されることになろう。このしきい値レベ
ルはしきい値を超えるセグメント化済み文字データのす
べてのグレイスケールピクセル値を「１」（黒を表す）
に設定し、しきい値未満のグレイスケール値をすべて
「０」（白を表す）に設定することにより、セグメント
化済み文字データを２進化するのに使用される。これに
よって当該セグメント化された当該文字を表す２進
（０,１）ピクセル値からなる２１列（２１ピクセル
幅）×２８行（２８ピクセル高）アレイを生ずる。

【００４９】「非バーコード文字データの処理」と見出
しを付けた項に上述したテンプレートマッチングルーチ
ン手順を使用して文字の認識を行う準備として、テンプ
レートの大きさに相当するように上記２進アレイの大き
さが低下される（圧縮される）。例えばアレイの底部行
から開始して、ピクセル行を隔行に削除または省略する
（アクセスを跳ばす）ことにより、アレイは１４行×２
１列のピクセルアレイに低減（圧縮）できる。さらに圧
縮したアレイを反時計方向に９０度回転することにより
（すなわちアレイが回転されたかのごとくにアレイのデ
ータ値にアクセスすることにより）、アレイは２１×１
４アレイと見ることができ、実際、各文字の境界を形成
する白ピクセル（文字の両側それぞれと上側および下側
に一ピクセル）が含まれるときは、２３×１６アレイと
見ることができる。このアレイの圧縮および回転により
バーコード情報（バーと間隙の比）を著しく損なうこと
なくアレイの大きさおよび方向をテンプレートの大きさ
および方向に相当するようにすることができる。

【００５０】次に、メモリ２７内に格納された、予定バ
ーコード文字パターンを表す相当サイズ（２３×１６）
のテンプレートを上述したように使用して当該文字の２
進パターンをテンプレートパターンに符号させ、当該文
字を認識する。図９（ａ）には欠陥あるバーコード情報
を持つ文字（文字「４」）の例が示してある。それに対
応する、（欠陥を表すノイズを含む）２進パターンが図
９（ｂ）に示されている。文字「４」の認識に使用され
る符合するテンプレートのビットパターンの例が図９
（ｃ）に示されている。もしもテンプレートマッチング
ルーチンが文字の認識に失敗すると、当該文字の２進化
に使用したしきい値がしきい値＝最も黒いピクセル−（最も黒いピクセル−最
も白いピクセル）＊１／２に低下される。前述の例と同様に、もしも最も白いピク
セルが値６０を持ち、最も黒いピクセルが値２００を持
つことが発見されたとすると、しきい値は２００−（２００−６０）＊１／２＝１３０のレベルにされる。当該文字情報がＣＭＣ７文字のバー
よりも黒でない（すなわち低いピクセル値を有する）と
きはこのしきい値レベルを使用することによりＣＭＣ７
文字を不明瞭化する情報（例えばスタンプ、汚れ、ぺん
書きマーク等）を「脱落させる」効果を有する。

【００５１】

【効果】本テンプレートマッチングシステムは文字全体
の形状またはパターンを検査するので、バーに欠損があ
る場合、余分なバー（署名によるぺン書きマーク等）を
含む場合、あるいは文字パターンのバー間隔に不規則そ
の他の文字崩れの問題がある場合でも文字認識ができ
る。上述したように、本発明のテンプレートマッチング
システムをバー／間隙比分析システムと関連させて（ま
たはその代わりに）使用するとき、読み取り速度（認識
すべき全文字数に対する認識された文字数の比率）が著
しく改善される。

【図面の簡単な説明】

【図１】本発明のシステムのブロック線図である。

【図２】図１のシステムにより読み取り可能（走査可能
かつ同定可能）なバーコード文字の外観を例示する図で
ある。

【図３】いろいろの不透明さ（グレイスケール値）をも
つピクセルからなるマトリックスを有する、走査した文
字の図解である。

【図４】バーコード化されていない文字のフレーム化に
使用されるウィンドウ（ａ）およびバーコード化されて
いる文字のフレーム化に使用されるウィンドウ（ｂ）の
図である。

【図５】バーコード化されていない文字のフレーム化に
使用した図４（ａ）のウィンドウの図である。

【図６】走査およびフレーム化した文字を表す２進デー
タにいろいろの論理オペレーションを行った結果を示す
ブロック線図である。

【図７】フレーム化した文字のイメージのいろいろの部
分を表すマトリックスのブロック線図である。

【図８】本システムがバーコード化されていない文字を
表すのに使用するテンプレートおよび関連の２進値の図
解および表である。

【図９】印刷品質の低いバーコード文字、対応の２進パ
ターン、およびバーコード文字を表すのに図１のシステ
ムが使用した対応のテンプレートを例示する図である。

【符号の説明】

２０英数字３３文書の右
底部隅３５文書の頂部左隅３７走査方向３９最右の走査線４１走査線４３文書の移動方向４５鉛直バー
（データバー）４７短い間隙４９長い間隙５１暗ピクセル５３明ピクセ
ル５５文字間空間

───────────────────────────────────────────────────── フロントページの続き (72)発明者メアラクルカーニカナダエヌ２ティー１ピー３、オンタリオ、ウォータールー、リージェンシークレッセント 463 (72)発明者レイモンドエル．ヒギンズカナダエヌ２エヌ２エム１、オンタリオ、キッチナー、イエローバーチドライブ 25

Claims

【特許請求の範囲】

【請求項１】光学的文字認識システムであって文書上の
不透明度の異なるバーおよび間隙からなる予定パターン
を有するバーコード文字を光学的に走査すると共に、該
不透明度に対応するグレイスケール値を、明ピクセルお
よび暗ピクセルのパターンを表す複数のグレイスケール
値として、発生する手段と、該文字を表す予定の２進パターンを含む複数の予定２進
パターンを含む予定テンプレートと該グレイスケール値
とを格納するためのプログラムを具えたメモリ手段と、該走査手段および該メモリ手段に結合され、該プログラ
ムの制御の下にオペレーションを行う処理手段にして、
該グレイスケール値から該文字を表す値のマトリックス
を選択することにより該文書上の該文字の位置を特定
し、該マトリックス値を２進データに変換し、該２進デ
ータを圧縮し、さらに該圧縮済み該２進データに符合す
ることにより該文字を同定する働きをするパターンを該
複数の予定テンプレート２進パターンの中から選択す
る、前記処理手段とを含む光学文字認識システム。
【請求項２】予定長の高さ、幅および不透明度の異なる
予定のバーと間隙を有する文書上のバーコード文字にし
て複数の予定テンプレート２進パターンの一つにより表
される前記バーコード文字を、光学的に同定する方法に
して、光学的に文書を走査して該不透明度に対応するグレイス
ケール値を、明ピクセルおよび暗ピクセルを表す複数の
グレイスケール値として、発生するステップと、該グレイスケール値から文字を表す値のマトリックスを
選択することにより該文書上の文字の位置を特定するス
テップと、該マトリックス値を２進データに変換するステップと、該２進データを圧縮するステップと、該圧縮済み該２進データに符合することにより該文字を
同定する働きをするパターンを該複数の予定テンプレー
ト２進パターンの中から選択するステップとを含むバー
コード文字同定方法。