JPS59123085A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS59123085A
JPS59123085A JP58171439A JP17143983A JPS59123085A JP S59123085 A JPS59123085 A JP S59123085A JP 58171439 A JP58171439 A JP 58171439A JP 17143983 A JP17143983 A JP 17143983A JP S59123085 A JPS59123085 A JP S59123085A
Authority
JP
Japan
Prior art keywords
character
characters
transition
white
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58171439A
Other languages
English (en)
Inventor
グレゴリ−・マ−チン・ベツドナ−
ジヨン・チヤ−ルズ・ハ−マン
マンスリ・セルヴアプライ・イエンガ−・ナラシマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS59123085A publication Critical patent/JPS59123085A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 文字認識の分野では手書き文字を識別するための有効で
費用のかからない方法をもたらすことが望ましい。この
ような方法が見つかれば、中央演算処理場所で必要とさ
れる情報がまず遠隔位置で手書きで生成される状況の下
では非常に有用となるはずである。遠隔位置の手書き原
稿を自動的に読み取ることによって手書きの情報を中央
位置で書き直す必要をなくすことができれば、中央演算
処理システムとの直接対話が実現可能になる。本発明者
等は、大した費用をかけずに、かかるプロセスに使用で
きる方法を発見した。
〔従来技術〕
現在利用できる文字認識システムは、標準化ないし正規
化された字形の分析を試みるものである。
これらのシステムでは、原稿上の文字を走査して、一連
の2進ビット行として記録する。多くの場合、自然に書
かれた文字の占める面積は、認識を得るために必要な面
積よりも広い。余剰データ・ビットを記録し分析するこ
とは時間と費用がかかる恐れがある。これらの難点を避
けるため文字の認識が得られる範囲で文字の形をできる
だけ小さく再形成するのが通常である。普通このことは
、文字の「正規化」と呼ばれている。従来技術では、こ
の正規化プロセス中に文字を元の大きさの約172に縮
小するのが普通である。かかる文字サイズの縮小が意味
をもち有用となるには、それを効率のよい信頼できる認
識プロセスと組み合せることが不可欠である。
互いに区別できる文字の特徴を識別しようとする試みは
数多く行われてきたが、従来の手法は必ず非常に複雑で
費用のかかる認識技術を必要とするものであった。
1979年5月15日発行のカワの米国特許第4155
072号には、非常に歪んだ文字を認識できる文字認識
装置が記載されている。しかし、カワの装置が効果を発
輝するには、文字の形を変えねばならない。カワの特許
では、文字を1行ずつ走査し、拡大率に応じて文字の水
平寸法を正規化する平均化アルゴリズムにもとづいて、
各行を修正ないし正規化する。こうすることによって、
歪んだ文字が歪んでいない形に似たものになり、カワの
認識論理と容易に調和÷きるものになる。
文字を正規化した後、カワは、各走査行中で文字の始め
と終りを測定し、始めと終りの中の部分を等しい6つの
間隔に分割する。次に、この等しい6つの間隔を、分類
コードに変換しなけれ2ばならない。始めと終りの位置
の値および分類コードを、標準文字を表すコード表と対
比することによって、文字の読みを識別することができ
る。カワの手順には、多数の欠点がある。第一に、認識
される文字を、文字が僅かしか歪んでいないようにする
精巧な文字正規化ルーチンにかける必要があり従って単
に文字を縮小して位置調整するだけの正規化装置には使
用できない。また、−行の始めと終りの位置の間の部分
を適正に分離するための実体的ゲーティング・タイミン
グ回路構成が必要である。
走査された情報の操作は、各行を順次扱うかあるいは他
の行と並行して扱うかに応じて時間または費用がかかる
〔発明の特徴〕
本発明者等は手書き文字の規格化された字形を分析し、
これらの文字を相互に区別する特性を識別するための新
規な方法を発見した。
本発明者等は、文字の論力的オーバーレーを共通りラス
の範囲内で最大にし、異なるクラスの文字の間の論理的
分離を向上させる多数の簡単な測定特性を発見した。[
文字のオーバーレー」という場合、手書きされた実際の
文字がどれだけ歪んでいても、特定の文字クラスについ
ては同一である文字の特性を指すことにする。明らかに
その文字クラスについては無条件に不変であり、他の文
字クラスには決して現れない文字の特徴を見つけること
ができれば、その特定の特徴を識別するだけでその文字
に対する完全なオーバーレーを得ることができる。
本発明は、カワの欠点を除くもので、又カワの技法とは
逆に最終認識プロセスから独立している。
本発明者等は認識すべき文字の正規化された形の複数回
走査から、複数の遷移測定値を引き出す、文字を認識す
る方法を開発した。
手書き文字をまず行列中の複数個のビットとして表し、
正規化された形に変換する。正規化プロセスは1本発明
の構成部分ではないので、ここでは説明しない。
文字が正規化された後、文字認識プロセスの次のステッ
プは、文字表示から遷移測定値を引き出すことである。
本発明者等は1文字を識別する際に、他の種類の測定値
も使用でき、文字の明確な識別を得るためにそれらが必
要となることも多いが、4種の遷移測定値が特に価値が
あることを発見した。本発明者等が特に有用であること
を発見した4種の基本的遷移測定値とは、前端白色部、
前端黒色部、遷移部、後端白色部の測定値である。
前端白色部側定値とはある文字の走査線の始めから走査
線中の黒色部の最初の瞬間までの間隔の測定値である。
前端黒色部側定値とは、走査線中の黒色部前端の始めか
ら走査線中の白色表現の次の瞬間までの間隔の測定値で
ある。
遷移測定値とは走査線中での黒色から白色への変更回数
の測定値である。これは、走査線がぶつかった黒線の数
を示す。
後端白色部側定値とは走査線中の最後の黒色表現から走
査線の終りまでの間隔の測定値である。
本プロセスにより、高さ16走査線、幅13ビットの正
規化文字を認識することが可能である。
各走査線に対する遷移測定値が、コードに従って16ビ
ツトの遷移測定値バク1−ル中に記録される。
良好な具体例では、遷移測定ベクトルの最初の3ビツト
が走査線の前端黒色部の走行長さないし間隔を示し、次
の5ビツトが前端白色部走行長さを示し次の4ビットが
後端白色部走行長さないし間隔を示し、最後の4ビツト
がその行の黒色から白色への遷移の回数と性質を示す。
最後のグループ中の最初のピッ1〜は検出された黒色−
白色−黒色遷移の2つの黒色部分の間に白色ビットが複
数個あるかどうかを示すことができ、後の3ビツトは実
際に黒色−白色遷移の回数を示す。
〔実施例〕
本発明の良好な一実施例では、遷移測定値ベクトルは、
次のようにコード化されている。
Kノ五  条件       指    ボ1   オ
ン  前端黒色部走行長さくLBRL)=32   オ
ン  LBRL=4 3   オン  LBRL>4 4   オン  前端白色部走行長さくLWRL)=2
5   オン  LWRL=3 6   オン  LWRL=4ないし57   オン 
 LWRL=6 8   オン  LWRL>6 9   オン  後端白色部走行長さくTWRL)=3
10    オン  TWRL=4ないし511   
 オン  TWRL=6 12    オン  TWRL>6 13   オン  黒色−白色−黒色遷移に対する複数
白色ビット(MWB) 14    オン  黒色−白色一図遷移15    
オン  黒色−白色−黒色遷移16    オン  黒
色−白色一黒色一白色一黒色遷移この良好な具体例では
、−回のテーブル索引で遷移a1す定値ベクトルが得ら
れ、レジスター/バッファーに記憶される。このテーブ
ルは概念的には、それぞれ異なるビットの走査線組合せ
の一つを表す、211個のアドレスからなっている。統
合走査線の右側IOビットにもとづく210個のアドレ
スをもつテーブルを使用することにより、テーブルのサ
イズは大幅に減少する。走査線の最初の3ピツ1〜から
の情報を収容するため、テーブルから得られる値を修正
して、走査線全体を表す最終的遷移n1す定値ベクトル
をもたらす。文字「8」を表現するためのテーブル索引
手続きは、次のように表すことができる。
(以下余白) ビデオ・ビットのパターン   ゛   ′ベクトルW
WlillNWWBBBBWW11      010
00010100001001i1WWwBBBWWB
BWIil       1000010000001
010WWWBBWIIWWWBBW       0
000100000001010WWnBBWWWBB
WW       0000010000001010
wwwwwBswBBtyn       ooooo
iootooooot。
1i1WWWWlIIIBBWliln       
1000001001000100WWWW11111
WBB11nlil       000000010
1000100WIN1111IBBBWBBIW  
     10000100100000101III
IBBB’1illilllBBWWW       
 1001000010001010WBBWWIBB
WWWIN       0000100001001
010BBBIIWWBBWWIIWW       
 1000000001001010[3BWWlil
BBnWWIdW       0000000000
10101011BBWIIBBWWIIWIIII 
       00001000001010101+
I[311111i18BWWWWWW       
00001000001..01010WBBBBBB
WWWWWW        00101000001
00100WWBBBI3WWIdltlllWW  
      0101000000010100この文
字について得られた遷移測定値ベクトルを次に詳しく説
明するようにして1次の認識決定プロセスで利用するこ
とができる。
拘束されない文字パターンのストロークの幅、形、大き
さおよび向きの歪みを扱う場合に、遷移測定値の考え方
を用いれば認識論理に著しい不変性が付与される。
前端および後端白色部走行長さは、一般にパターンの外
部輪廓を定義する。組込みORにより、パターン、形、
大きさにある程度の変動が許され、従って同じクラスの
パターンのオーバーレーがより望ましいものとなる。
黒化部走行長さは、ストロークの太さおよび長さ特性に
関する情報を与え、白色部走行長さを補足するのに必要
な次元深さを与える。連関する黒色部ゲーティングは、
スI−ロークの動揺を補償するが必要な垂直ストローク
と水平ストロークの分離は保持する、ストローク・オー
バーレー効果をもたらす。
l)遷移の黒色部ゲーティングは、傾斜パターン、誤登
録パターン、歪んだパターンを補償する能力をもたらす
。遷移自体は固有の論理和効果をもたらし、同じクラス
のパターンを他のクラスから分離しながらオーバーレー
できるようにする。遷移は、パターンの大きさを効果的
に正規化しながら。
より激しい形の歪みを補償する。
実際に手書き文字を認識しようと試みる場合には、明ら
かに認識プロセスを実現するために利用できる全ての手
段を使用するのが、慎重なやり方である。本発明者等は
、認識プロセスのための方法をうまく組み合せることに
より明確な文字認識が非常に容易に得られることを発見
した。文字の明確な識別を受けるには遷移測定値ベクト
ルを正規化文字入力の解釈と組み合せて使用することに
よって文字を識別することが必要の場合が普通である。
その他の状況の下では1文字の識別を得るために、記録
された正規化イメージの他の特殊な特性を探し出すこと
が望ましいことがある。認識システムを1本発明者等が
開発したユニークな遷移測定値ベクトル体系を含めて、
これまでに開発された全ての識別技術を最大限に利用で
きるように設計するのが、本発明者等の意図である。
本発明者等が有用であることを発見したもう一つの識別
手段は、形状弁別機能の使用である。この機能は、実際
の文字パターンとそれに対応する形のより詳しい位相評
価を分析することによってより芝しい文字分離を分解す
るために特別に設計されている。この機能は文字クラス
の弁別をよくするため、遷移測定値定義域に重ねて設計
されている。
文字情報を正規化し、遷移測定値をとり、所定機能を決
定した後に、実際の文字識別プロセスが開始する。この
識別プロセスの良好な具体例では、文字識別性を得るた
めに論理ツリーと(9孔)検査機を使用する。論理ツリ
ーは、それぞれ識別すべき文字が特定の特徴ないし属性
をもってt)る力1を識別するように設計されている、
一連の論理モジュールからなっている。これらの一連の
論理モジュールを論理的に組み合せることにより5文字
が特定の識別性をもっているかどうかを確証することが
できる。これが実現されると、文字情報をその文字に対
する緊密に設計されたプール式と対比する事によって、
識別性を確認する。確認が得られる場合、文字は識別さ
れ認識される。確認が得られない場合、その文字が別の
表現を持ち得るかどうかを決定するために、次の処理を
行う。
この認識プロセスを図面に則してもつと詳しく説明する
第1図は、文字認識システムの全体を概念的に示したも
のである。手書き文字の情報をデジタル化原稿ビデオ信
号1に変換し、通信アダプター2を介して、データ処理
装置3に送る。デジタル化ビデオ信号にビデオ前処理4
を加えて、各文字に対する情報を他の文字から分離する
。この前処理   −により情報が充分に位置調整され
て、文字情報を含まない区域は、処理されず、良好なオ
ーノベーレー特性が維持される。          
   〜前処理の完了後、文字情報を正規化する(5)
正規化によって各文字イメージの標準基本サイズが得ら
れ、その結果、信頼できるやり方でうまく比較を行うこ
とができるようになる。
文字が正規化された後、指定された遷移測定6を行う。
これらの測定から文字イメージ中の遷移の性質、頻度、
発生に関する情報が与えられる。
各行で特定の色が横切る間隔の遷移測定値も得られる。
正規化文字は、文字の形状弁別機能7を展開するのにも
使用される。例えば文字が数字「8」の特性である「左
の切込み」をもつことをシステムは認識できる。
文字の正規化の後に遷移測定値および形状弁別特徴の情
報を収集し、後で詳しく説明するように、論理ツリー検
査機8中の論理ツリーを用いて文字を識別する。論理ツ
リーによる識別の後輪理ツリー及び検査機8中の精密に
設計されたプール論理検査機中で文字識別を検査する。
第2A図ないし2E図は若干の遷移測定値の例を示した
もので、同じ文字の2つの表現が非常に異なった形をし
ている場合でも特定の文字に対する測定値が相対的に一
様であることを立証するのに役立つ。
第2A図は、数字「8」の3つの行の黒色(B)白色(
II)遷移測定を示したものである。1行目は文字rB
WBJが示すように2つの黒色(B)部の間に1つの白
色(υ)部があることを示している。2行目では、文字
rBJが示すように一つの黒色遷移しか検出されない。
3行目は再び2−っの黒色部の間に1つの白色部がある
ことを示すrBWBJ遷移を示している。すぐにわかる
ように文字「8」の2つのパターンは、非常に異なって
いるが、双方の与える遷移情報は、基本的に同じである
。この情報は、相対的に不変なので、文字の識別に非常
に有用である。
第2B図は、別の文字について遷移測定値が類似する2
つの行を示したものであり、やはり文字の形が変っても
遷移測定値によって決定される文字の特徴は余り変らな
いことを示している。
第2C図は前端白色部走行長さの測定がどう行われるか
を示したものである。正規化された文字を位置調整して
、その文字の少くとも若干部分が測定エツジに触れるよ
うにする。各走査行毎番二選択された行における位置調
整された文字のエツジと最初に呪われる黒色部の間の列
位置の数をカウントする。本発明者等は、測定の絶対値
自身よりも有用な、特定の測定値範囲を定義した。前述
した特定の良好な具体例では得られる測定値は、前端白
色部走行長さが2ビツト、3ビツト、4〜5ビツト 6
ビツト、または7ビツト以上である。
この測定値の指示がその行に対する遷移測定値ベクl−
ルの4番目〜8番目のビット位置に記憶される。
第2D図は、後端白色部走行長さくTWRL)の測定を
示したものである。前述の特定の具体例における’]:
’WR’Lに対する測定値は3ビツト、4〜5ピッ1−
16ビツ1−1および7ビツト以上である。これらの測
定値指示は、遷移測定値ベクトルの9番目〜12番目の
ビット位置に記憶される。
第2E図は、前端黒色部走行長さくLBRL、)の測定
を示したものである。これらの測定器よ、黒色部が最初
に現われる列から、白色部をもつ次の列まで行う。この
場合も、重要なの番よ、測定イ直の絶対長さではなくて
、相対長さである。前述の特定の具体例では、3ビツト
、4ビツト、および5ビツト以上のLBRL測定値が、
遷移測定)直ベクトルの最初の3ビツトに記憶される。
遷移測定値ビットの最後の4つのビット位置番よ、ある
行の色遷移の回数および特定の複数白色ビットを示すの
に使用する。
以上をまとめると、正規化文字の5の13ビツトの各行
は、6で16ビツトの遷移測定イ直ベク(−ルをもたら
す。
次に遷移測定値ベクトルの第2の良好な具体仔1につい
て説明する。
(以下余白) ビット    ピッ1〜がオンの場合の説明1    
  前端黒色部走行長さ=31〜2=4 1〜3〉4 4      前端白色部走行長さ=24〜5=3 4〜6    、           =4154〜
7=6 4〜8〉6 9      後端白色部走行長さ=39〜10   
           =4159〜■1=6 9〜12〉6 13      2つの黒色部の間に白色ビットが複数
ある事を示す(ビット15がオンの場合のみ)14  
   1つの白色−黒色遷移を示す15       
黒色−白色−黒色遷移を示す16       黒色−
白色一黒色一白色〜黒色遷移を示すこの第2の具体例で
は、特定の条件を表現する全てのビットがそれよりも高
い条件が検出された場合に、オンのままでオフに切換わ
らない。例えば前端黒色部走行長さが4ビツトの場合、
先の具体例では、ビット1がオフに変るはずであるが、
この場合は、ビットlと2は、共にオンのままとなる。
各正規化文字は、高さが16行なので、各文字は、6の
16ビツト遷移測定値ベクトル16個で表されるはずで
ある。各文字に対する遷移測定値ベクトルは6の32バ
イトのバッファーに記憶され、認識プロセス中保存され
る。
先にも指摘したように、5の正規化文字と6の遷移測定
値だけでは、情報が不充分で手書き文字を明確に識別で
きないことが多い。従って、文字に関する追加的情報を
収集する。この追加的情報の一部は、正規化文字自体か
ら直接得られるが、その他の情報は、遷移測定値から得
られる。
第3八図ないし30図は、正規化文字にもどって形状弁
別特徴が文字識別のプロセスに有用となる例を示したも
のである。この形状弁別配置では、文字パターンが12
の固定区域に分別される。特定区域を選択して、分離す
べき文字のグループないしクラスを識別することにより
、制限区域からのピッ1−を戦略的に選択して、各グル
ープを望み通り分離できる特徴をもたらす特徴選択を計
画することができる。第3A図ないし30図に示した8
字左切込みの例は、この特徴選択プロセスの見本である
。区域4.5−7.8のビット・パターンを比較すると
、その文字が文字「8」の8字切込み特性を持っている
か、それとも第3C図に示した文字「0」の場合のよう
に、この特性を持っていないかが容易に示される。同様
にして、特定の文字または文字グループの他の重要な特
徴を識別し、認識プロセスで利用することができる。
5で正規化文字、6で遷移測定値ベクトル、7で文字の
特徴が得られると、認識プロセスが開始される。この認
識プロセスはまず論理ツリーを用いて論理的選択を実施
し、文字の識別性に関して、選択が行われると、精密に
設計されたプール式を用いて、その識別性を検査するこ
とからなっている。この選択・検査プロセスによって文
字は明確に認識される。確認が得られない場合には、別
の論理プロセスを選択して、ツリー論理プロセスを繰返
すことができる。このプロセスは、望む限り何度でも繰
返すことができる。
後述する特定の例では5の正規化文字ビデオ信号、7の
形状弁別特徴情報、6の遷移測定値ベクトルがツリー論
理装置8で利用できる。ツリー論理装置8は、特定の特
性をもつ選択された文字グループをその特性をもたない
他の文字グループから分離できるように設計された一連
の論理的弁別装置、回路などからなっている。どの論理
回路ま ′たは装置を選択するかは文字情報の事前の論
理的検査の結果によって決定される。
この例はツリー論理プロセスを非常に簡略化して示した
ものである。実際の設計では、論理ツリーは、子息上の
判断ブロックからなることもある。
必要な判断ブロックの数は認識すべき文字ビットの大き
さおよび文字ビット内の各文字の誤いによつてほぼ決ま
る。実際に本発明者等は、ここに記載した遷移測定値ベ
クトルを使用すれば、はとんどの場合に、文字ビット中
の類似文字のオーバーレーが増大して、正規化ビデオ信
号のみを使用して認識情報をもたらす場合や、さらには
前記のカワの米国特許第4155079号などのように
何らかの形で、測定を行う場合よりも、認識を得るのに
必要な論理ツリーの大きさが著しく小さくなることを発
見した。
第4図に簡略化して示した例では、まずノード11で遷
移測定値ベクトルの特定の特性について検査する。その
特性が見つかれば、論理は、ツリーの左側へ進むか、見
つからない場合は、もう一方の方向に論理が進む。実際
には、論理ツリーは各文字グループ間の最もはっきりし
た分離をもたらすテストを最初に実施するように設計さ
れている。従ってほとんどの場合には、その文字につい
て行う最初のまたは、ごく初めの方のテストで遷移測定
値ベクトルを使用することになる。同図に於て、N:正
規化ビデオ信号、M:遷移測定値、F:形状弁別特徴を
、夫々表わす。
第4図からすぐにわかるように、最終的な文字識別を得
るために、その文字について一連のテストを実施する。
この例が示すように、これらのテストには、ノード15
や16などのように、実際の正規化ビデオ信号を見るこ
とを含むものもあり、ノード12.13.14などのよ
うに、形状弁別特徴を使用するものや、遷移測定値を使
うものもある。
第5図は、文字「6」を文字「8」と区別するための論
理ツリーの例を示したものであり、その文字について得
られた測定値ベクトルを用いてノード14で文字の上半
部をテストすることによって、区別がなされる。同図に
於て、 ■:4行目で遷移=1 ■)ニア行目で後端白色部=6 ■二6行目で遷移=1 ■=3行目で前端白色部=6 ■:5行目で後端白色部≧7 ■=6行目で前端黒色部≧5 ■=3行目で前端白色部≧7 を夫々表わす。このプロセスでは、7行目の後端白色部
走行長さなど、その文字のある特徴が、文字「8Jを文
字[6」から分離するのに重要なので、検査される。7
行目の後端白一色部などのテス1〜は文字「0」を文字
「8」と区別する際に有用な情報を与えないので、これ
らの文字の分離を得るために使用されることはない。第
5図からすぐにわかるよう−に、例えば、その文字が唯
一つの形でしかあり得ないと論理が満足するまで前回の
論理ゲーティング・オペレーションの結果にもとづいて
、一連の論理ゲーティング・オペレーションが実施され
る。この例では、論理が求める特微力へ存在するとの在
論を下し、第5図に示したように「オン」に出力を与え
た場合、その文字は、「8」の頂部の特徴ではなく、「
6」の幹部の特徴をもつとみなされる。「オフ」出力が
得られた場合、その文字は、「8」の頂部の特徴をもつ
とみなされる。この時点で、論理が文字を識別したこと
になる。
もちろん我々が開始した精巧な認識プロセスを用いた場
合でも、なお若干のあいまし)さが残ることがあり得る
ので当該技術で周知のように文字の識別性を検査しなけ
ればならない。はっきりしているが誤まった認識をもた
らすという問題を避けるため、緊密設計されたプール論
理を用し\て、文字識別を検査する。これに通した論理
ツリー・検査機の一例がIBMのTDB 1981年1
月号3663〜4頁所載の「2−レベル文字認識」(゛
Two−Level Character Recog
nition”)と題する論文に記載されている。
以上の説明からすぐにわかるように、認識すべき各文字
について遷移測定値ベクトルを得ると、既知のものより
もずっと認識プロセスが改良される。遷移測定値ベクト
ルによって、手書き文字を認識するための認識システム
に伴いがちな歪みのない文字に関する情報を得るための
機構が実現される。先行技術では、文字の識別に文字の
正規化ビデオ形が使用されることが多かった。その結果
、文字の正規化形は、認識プロセスで実現される理想形
と厳密に一致しないため、しばしば文字が識別されず、
あるいは、誤まって識別されることが起こった。遷移測
定値ベクトルは、手書きの文字がどれほど歪んでいよう
とも、同じ文字に対して、はとんど常に類似の測定値を
与えるので、この問題は、本発明によって完全に克服さ
れる。その上遷移測定値ベクトルは、文字の正規化ビデ
オ表現に存在する分離特徴を破壊することはない。測定
すべき特性をうまく選択することにより、類似している
が同じではない文字間の分離が遷移測定値バク1−ル中
で保持される。すなわち本発明者等は、認識プロセスに
遷移測定値ベタ1〜ルを使用することによって、文字識
別プロセスが著しく簡略になることを発見した。
【図面の簡単な説明】
第1図は、文字認識システムを概念的に表した図、第2
A図ないし2E図は遷移測定値の例を示す図、第3八図
ないし30図は形状弁別特徴の例を示す図、第4図は、
文字を区別するためのツリー論理の一部を示す図、第5
図は、文字の形状弁別特徴を区別するためのツリー論理
の一部を示す図である。 1・・・・デジタル化原稿ビデオ信号、2・・・・通信
アダプター、3・・・・データ処理装置、4・・・・ビ
デオ前処理、5・・・・正規化、6・・・・遷移測定、
7・・・・形状弁別機能、8・・・・ツリー・検査機。 出願人 インターナショナル・ビジネス・マシーンズ・
コーポレーション

Claims (2)

    【特許請求の範囲】
  1. (1)認識すべき文字から各々その特性に対する可能な
    1組の測定値のうちの1つによって表される予定の走査
    線遷移特性に関する複数の測定値を引き出すこと、及び
    該文字に対する選択された1つの該測定値を該文字が識
    別できるように論理的に組み合せることからなる文字を
    認識する方法。
  2. (2)論理的に組み合せる該ステップは該測定値の列を
    作成すること、および線列の各部分を順次検査すること
    からなり、該各部分は認識すべき該文字の特定の遷移特
    性を表し、該部分の該順次検査の結果から該文字を識別
    する特許請求の範囲第(1)項記載の方法。
JP58171439A 1982-12-27 1983-09-19 文字認識方法 Pending JPS59123085A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US45301782A 1982-12-27 1982-12-27
US453017 1982-12-27

Publications (1)

Publication Number Publication Date
JPS59123085A true JPS59123085A (ja) 1984-07-16

Family

ID=23798896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58171439A Pending JPS59123085A (ja) 1982-12-27 1983-09-19 文字認識方法

Country Status (3)

Country Link
EP (1) EP0114996A3 (ja)
JP (1) JPS59123085A (ja)
CA (1) CA1199407A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2797335B1 (fr) * 1999-08-05 2001-10-26 Roland Tomasi Procede, support d'enregistrement et systeme informatique pour la reconnaissance de formes numerisees

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3260995A (en) * 1963-01-16 1966-07-12 Textron Electronics Inc Character reading system employing sequential sensing of matrix input
US4048615A (en) * 1976-06-04 1977-09-13 Recognition Equipment Incorporated Automated character recognition system
DE3005206C2 (de) * 1980-02-12 1983-01-05 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Verfahren zur automatischen Zeichenerkennung

Also Published As

Publication number Publication date
EP0114996A2 (en) 1984-08-08
CA1199407A (en) 1986-01-14
EP0114996A3 (en) 1986-10-29

Similar Documents

Publication Publication Date Title
US4817171A (en) Pattern recognition system
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
JP2553608B2 (ja) 光学文字読取装置
US5267332A (en) Image recognition system
US5734750A (en) Character recognition method and apparatus
EP0385009A1 (en) Apparatus and method for use in image processing
US4034343A (en) Optical character recognition system
EP0516576A2 (en) Method of discriminating between text and graphics
WO1992006449A1 (en) Character recognition methods and apparatus for locating and extracting predetermined data from a document
Kavianifar et al. Preprocessing and structural feature extraction for a multi-fonts Arabic/Persian OCR
Brown Character recognition by feature point extraction
US5119441A (en) Optical character recognition apparatus and method using masks operation
JPS59123085A (ja) 文字認識方法
EP3477547B1 (en) Optical character recognition systems and methods
Lakshmi et al. OCR of printed Telugu text with high recognition accuracies
US5721790A (en) Methods and apparatus for separating integer and fractional portions of a financial amount
JPS6316795B2 (ja)
Lee et al. Combining macro and micro features for writer identification
AU8853291A (en) Character recognition methods including separating and extracting particular portions from extracted data
EP0519737A2 (en) Image recognition system
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JP2578768B2 (ja) 画像処理方法
JP2578767B2 (ja) 画像処理方法
EP0201909A2 (en) Procedure for automatic reading of images and device for carrying out this same procedure
Sarkar et al. Classifying foreground pixels in document images