JPS60159987A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS60159987A
JPS60159987A JP59016467A JP1646784A JPS60159987A JP S60159987 A JPS60159987 A JP S60159987A JP 59016467 A JP59016467 A JP 59016467A JP 1646784 A JP1646784 A JP 1646784A JP S60159987 A JPS60159987 A JP S60159987A
Authority
JP
Japan
Prior art keywords
character
branch point
quadrilateral
data
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59016467A
Other languages
English (en)
Inventor
Minoru Nagao
永尾 実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Tateisi Electronics Co
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tateisi Electronics Co, Omron Tateisi Electronics Co filed Critical Tateisi Electronics Co
Priority to JP59016467A priority Critical patent/JPS60159987A/ja
Publication of JPS60159987A publication Critical patent/JPS60159987A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は、未知文字を光学的に読み取り、これを白黒2
値化して文字パターンをめた後、文字パターンより未知
文字の特徴を抽出し、この特徴を辞書に予め格納しであ
る標準パターンと照合して、未知文字を特定する文字認
識装置に関する。
〈発明の背景〉 従来の文字認識装置では、辞書照合処理に際し、未知文
字の特徴を用いてその候補文字を段階的に絞り込んでゆ
き、そして最後に詳細な辞書照合動作を実行している。
例えば文字特徴のうち、交点およびループの有無に着目
すると、第1図に示す如く、数字「1」〜「9」はその
態様に応じて4個のグループに分類される。従ってもし
未知文字が、゛′交点有り″パループ無し″の特徴を有
する場合、その未知文字は第3番目のグループに含まれ
る候補文字r4Jr5J r7Jのいずれかであると判
断される。これと同様の処理を、例えばループの数、端
点の数、分岐点の有無等の他の文字特徴を用いて実施す
れば、候補文字をより一層絞り込むことができる。とこ
ろがこの種絞込み操作において、文字特徴として、交点
、分岐点、ループ、凹み等を用いただけでは、例えば第
2図に示す英文字「P」と数字「9」との間の区別、更
には第3図に示す数字「5」と数字「2」との間の区別
が不可能であり、これがためこれら文字の認識にはより
複雑な処理方法を採択する等の必要があった。
〈発明の目的〉 本発明は、特定の文字特徴に着目し、文字パターンにお
けるその特徴部分の存在位置を判定することによって、
上記不都合を解消した文字認識装置を提供することを目
的とする。
〈発明の構成および効果〉 上記目的を達成するため、本発明では、未知文字の2値
化データに基づき文字パターンが外接する四辺形を抽出
し、この四辺形の領域を、例えば第4,5図に示す縦方
向或いは第6,7図に示す横方向に夫々3分割して、例
えば文字分岐点のような特徴部分がいずれの分割領域に
存在位置するかを判定するよう構成した。
本発明によれば、第4図の英文字rPJの場合は、文字
の分岐点T、 、 T2は左端の領域XAに存在し、一
方第5図の数字「9」の場合は、文字の分岐点T1. 
T2. T3が右端の領域XCに存在して、左端の領域
XAには全く存在せず、従ってこの両者は明確に区別し
得る。また第6図の数字「5」の場合は、分岐点TI、
T2は上端の領域YAに存在し、一方第7図の数字「2
」の場合は、分岐点Tl、T2が下端の領域Ycに存在
して、上端の領域YAには存在せず、従ってこの両者は
明確に区別し得る。かくして本発明は、従来不可能であ
った特定文字間の区別を可能とし、文字認識精度の向上
に貢献する等、発明目的を達成した顕著な効果を奏する
〈実施例の説明〉 第8図は本発明にかかる装置の回路構成例を示し、図中
の画像メモリ1には、白黒2値された文字パターンが格
納される。また外接四辺形抽出回路2は、画像メモリ1
上において文字パターンが外接する四辺形を抽出し、更
に分岐点位置抽出回路3は文字の特徴をなす分岐点の存
在位置を抽出する。これら抽出データは、RAM(Ra
ndom Access Metnory ) 4に格
納され、CPU(Central Processin
g Unit ) 5は、プログラムメモリ6のプログ
ラムを解読し、RAM4や画像メモリ1に対するデータ
の読出し若しくは書込みを実行すると共に、前記各抽出
回路2,4の動作を制御する。
第9図はCPU5の制御動作を示す。令弟10図に示す
画像メモリ1のXY座標上に英文字「P」の文字パター
ン7が格納された場合を想定すると、まずCPU5は、
第9図のステップ10において、文字パターン7が外接
する四辺形8を抽出する。この四辺形8を規定するデー
タは、文字パターン7におけるX座標の最大、最小値X
M 、 Xmと、Y座標の最大、最小値YM 、 Ym
とによって与えられ、これら座標データ(図示例の場合
、Xm = 2、XM=9、Ym = 2、YM=10
)は第11図に示すRAM4の所定領域に順次格納され
る。
つぎにCPU5は、ステップ11において、文字パター
ン7より分岐点T1.T2が存在位置する座標(X、Y
)を抽出し、その座標データ(図示例の場合、Tlが(
4,5)、T2が(4、6)である)は第12図に示す
RAM4の所定領域に格納される。尚第12図中、テー
ブルストッパーは分岐点情報の完了を示すコードである
ついでCPU5は、ステップ12において、前記の四辺
形7を縦横各3分割し、つぎのステップ13において、
前記分岐点T1.T2が分割されたいずれの領域に存在
位置するかを判定する。
第13図は、前記ステップ12.13の内容を一層詳細
に示したものである。同図中、ステップ20〜25は前
記四辺形7を縦方向に3分割するラインの位置データX
l、 X2を、またステップ26〜31は横方向に3分
割するラインの位置データY、、、Y2を夫々算出する
過程を示す。図示例の方法は、四辺形7の横辺および縦
辺を3で割って、分割定数Dx、Dyおよびその余りを
め(ステップ20.26)、夫々の余りが、0.1.2
のいずれであるかを判定した後(ステップ21〜22お
よびステップ27〜28)、余りの値に応じて前記位置
データXl。
X2およびYl、Y2を算出している(ステップ23〜
25およびステップ29〜31)。そしてこれら位装置
データ(図示例の場合、X1=5.X2=7、Yl−5
,Y2−8)は、第14図に示すRAM4の所定領域に
格納され、これにより四辺形8はデータ上、第15.1
6図に示す縦横各3個の領域XA〜xc 、 YA、%
、 Ycに分割される。
つぎにcpu5は、ステップ32〜37において、分岐
点T1.T2が縦分割された領域XA −Xcのいずれ
に位置するか、またステップ38〜43において、横分
割された領域YA、Ycのいずれに位置するかを判定す
る。この判定は、分岐点Tl、T2のX座標と前記位置
データXl、X2との大小比較(ステップ32.33)
および、分岐点T1.T2のY座標と位置データY、 
、 Y2との大小比較(ステップ38 、39 )によ
って実行され、各ステップの判定結果に基ついて第17
図に示すRAM4の所定領域に分岐点T1.T2の存在
位置を表わすデータがセットされる(ステップ34〜3
6および、ステップ40〜41)。前記分岐点Tl、T
2の各座標は、第12図に示すRAM領域から読み出さ
れるが、読み出したデータがテーブルストッパであると
き、ステップ37、ステップ43の判定が6YES”と
なり、各判定処理は完了する。かくて第17図において
、領域XA 、 YA 、 YBに対応するRAM領域
にはデータ「1」がセットされ、これにより分岐点はこ
れら分割領域に存在位置することが理解される。
第18図は、数字「9」の文字パターンを示し、上記と
同様の方法によって、第19図に示す分岐点の存在位置
データを得ることができる。
この第19図におけるデータ配置と前記第17図におけ
るデータ配置とを比較すると、両者は明らかに一致して
おらず、従って例えば領域XAに対応するデータ内容を
参照することによって、英文字r P Jと数字「9」
との区別が可能である。
【図面の簡単な説明】
第1図は候補文字の分類例を示す説明図、第2図および
第3図は従来装置において分類不能な文字パターン例を
示す説明図、第4図〜第7図は本発明にかかる方式を説
明するための文字パターンを示す説明図、第8図は本発
明の装置例を示す回路ブロック図、第9図はCPUの制
御動作を示すフローチャート、第10図は画像メモリ上
の文字パターンを示す説明図、第11図および第12図
はRAMへのデータ格納状態を示す説明図、第13図は
CPUの制御動作を示すフローチャート、第14図はR
AMへのデータ格納状態を示す説明図、第15図および
第16図は四辺形の分割領域を示す説明図、第17図は
判定結果を示すRAMのデータ内容を表わした説明図、
第18図は画像メモリ上の文字パターンを示す説明図、
第19図は判定結果を示すRAMのデータ内容を表わし
た説明図である。 2・・・・・・外接四辺形抽出回路 3・・・・・・分岐点位置抽出回路 5・・・・・・CPU 特許出願人 立石電機株式会社 17+l 図 −3+2. 升3 ワ テ 4 図 分 j 図 ”)r6 回 分q 固 ”AQ グ テ10 面 分12図 分/4−Lη テ/6 図

Claims (1)

  1. 【特許請求の範囲】 ■ 未知文字を読み取り白黒2値化して文字パターンを
    めた後、未知文字の特徴を抽出して標準パターンと照合
    する文字認識装置において、前記2値化データに基づき
    文字パターンが外接する四辺形を抽出する手段と、抽出
    された四辺形の領域を複数分割する手段と、特定の文字
    特徴につき各分割領域における存在有無を判定する手段
    とを具備して成る文字認識装置。 ■ 前記四辺形は、縦横各方向に3分割される特許請求
    の範囲第1項記載の文字認識装置。 ■ 前記特定の文字特徴は、文字の分岐点である特許請
    求の範囲第1項記載の文字認識装置。
JP59016467A 1984-01-30 1984-01-30 文字認識装置 Pending JPS60159987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59016467A JPS60159987A (ja) 1984-01-30 1984-01-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59016467A JPS60159987A (ja) 1984-01-30 1984-01-30 文字認識装置

Publications (1)

Publication Number Publication Date
JPS60159987A true JPS60159987A (ja) 1985-08-21

Family

ID=11917058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59016467A Pending JPS60159987A (ja) 1984-01-30 1984-01-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPS60159987A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62281090A (ja) * 1986-05-30 1987-12-05 Canon Inc パタ−ン情報認識方法
JP2002245407A (ja) * 2001-02-16 2002-08-30 Nippon Digital Kenkyusho:Kk 認識候補文字棄却判定方法、文字認識装置及び認識候補文字棄却判定プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62281090A (ja) * 1986-05-30 1987-12-05 Canon Inc パタ−ン情報認識方法
JP2002245407A (ja) * 2001-02-16 2002-08-30 Nippon Digital Kenkyusho:Kk 認識候補文字棄却判定方法、文字認識装置及び認識候補文字棄却判定プログラム

Similar Documents

Publication Publication Date Title
JP3155577B2 (ja) 文字認識方法及び装置
CN110503682B (zh) 矩形控件识别方法、装置、终端及存储介质
US6035062A (en) Character recognition method and apparatus
US5233672A (en) Character reader and recognizer with a specialized editing function
JPS60159987A (ja) 文字認識装置
JPH07129713A (ja) 文字認識装置
JPS62111369A (ja) シンボル認識方法
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JPH0573725A (ja) 手書き文字・図形認識装置
JPS62281082A (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JP3411949B2 (ja) 筆順及び続け字登録方法
JP2972443B2 (ja) 文字認識装置
JPS6321949B2 (ja)
JPS60168283A (ja) 文字認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP3045086B2 (ja) 光学式文字読取方法および装置
JPH0434652A (ja) 図面入力装置
JPH04260980A (ja) 図形認識装置
JPH02254581A (ja) 情報認識装置
JPS63223987A (ja) 文字検索方法
JPH0578067B2 (ja)
JPH0458383A (ja) マルチフォント文字認識装置
JPS6057110B2 (ja) 光学的文字認識方法及びその装置
JPH08147406A (ja) 文字認識装置