JPH0452510B2 - - Google Patents

Info

Publication number
JPH0452510B2
JPH0452510B2 JP58211374A JP21137483A JPH0452510B2 JP H0452510 B2 JPH0452510 B2 JP H0452510B2 JP 58211374 A JP58211374 A JP 58211374A JP 21137483 A JP21137483 A JP 21137483A JP H0452510 B2 JPH0452510 B2 JP H0452510B2
Authority
JP
Japan
Prior art keywords
character
circuit
line segment
characters
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58211374A
Other languages
English (en)
Other versions
JPS60103492A (ja
Inventor
Koji Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP58211374A priority Critical patent/JPS60103492A/ja
Priority to KR1019840006937A priority patent/KR890002473B1/ko
Priority to EP84113410A priority patent/EP0144006B1/en
Priority to DE8484113410T priority patent/DE3478769D1/de
Priority to CA000467388A priority patent/CA1214561A/en
Priority to AU35212/84A priority patent/AU571021B2/en
Publication of JPS60103492A publication Critical patent/JPS60103492A/ja
Priority to US07/142,353 priority patent/US4783835A/en
Publication of JPH0452510B2 publication Critical patent/JPH0452510B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18162Extraction of features or characteristics of the image related to a structural representation of the pattern
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔1〕 発明の技術分野 本発明は用紙に記載された文字、記号等を光学
的に読取る際に有用な文字認識方式に関する。本
発明の方式は手持ち式のOCR、すなわち二次元
に配列された複数の光電変換素子からなるイメー
ジセンサを有するスキヤナを手で持ち、紙面上に
記された文字等の上を移動させながら読取る場合
に特に著しい効果が期待できる。
〔2〕 従来技術 OCRによる文字等の認識方式としては、例え
ば特開昭54−16133号公報記載の方式が開示され
ており、以下その内容を第1図を用いて説明す
る。スキヤナ1を手2で持ち、用紙3上を移動さ
せることによつて文字、記号等を読取るものであ
りスキヤナ1にはランプ4とレンズ5と二次元に
配列された複数の光電変換素子からなるイメージ
センサ6と制御及び二値化のための回路7を内蔵
している。
ランプ4で用紙3を照射し、その反射系をレン
ズ5を介してイメージセンサ6へ結像させる。イ
メージセンサ6の出力制御及び二値化回路7に
て、用紙領域と文字領域の二値に区分する。垂直
切出し回路9および水平切出し回路10はそれぞ
れ垂直方向および水平方向の文字エリアを決定す
る。例えば制御及び二値化回路7から第2図に示
すような二値化した画像が得られたとすると、垂
直方向の文字エリアはLj行からLj+N−1行まで
および水平方向の文字エリアはB1からBi列まで
と決定される。11は行特徴抽出回路であり文字
エリア内の各行ごとの特徴を抽出する。例えば各
行ごとに横線分か、左側の縦線分あるいは2本の
縦線分などに区分して、それぞれに対応する行特
徴コードCiを出力する。さらに詳細に説明すれ
ば、行特徴抽出回路11は、文字エリア内の各行
の黒画素の分布を検出し、そのパターンに応じ
て、特定の行特徴コードをそれぞれ与える。例え
ば第6図aのような「2」という文字であれば、
第6図bのように各行に区切つて、各行の黒画素
のパターンを調べる。文字エリアの第1行及び第
2行には、黒画素が全長さにわたつて分布してい
るので、これには第7図のテーブルに従つて、
C6というコードを与える。第3行から第5行に
は、黒画素が右端部にのみ分布しているので、こ
れには第7図のテーブルに従つて、C3というコ
ードを与える。以下、同様の手順に従つて最下行
までそれぞれコードを与える。なお、上の説明で
は文字エリア内の1行ごとに文字線分の特徴を抽
出する例を示したが、文字エリア内の複数行ごと
に文字線分の特徴を抽出するようにしてもよい。
すなわち、第6図cのように2行ごとに区切つ
て、各区切つた行の黒画素のパターンを調べても
よい。また、文字エリア内を縦の列ごとに区切つ
て、パターンを与えてもよい。部分特徴抽出回路
12は各行ごとに行特徴抽出回路11から送られ
る行特徴Ciを相隣接する複数行まとめて、さらに
再区分して、それらを代表する特徴信号Diを出
力する。これにより、データの圧縮を行なつてい
る。さらに識別処理回路13は、Diの出現順序
から文字を識別している。
〔3〕 従来技術の問題点 上記の従来のOCRにおける文字認識方式では
行特徴抽出回路11で特徴ごとに区分する区分の
種類がそれ程多くないので、多くの文字を識別す
ることができない。数字だけあるいは数字と若干
の英字や記号などの限定した文字を対象とする場
合には識別可能であるが、数字と全英字を識別す
るとなると、たとえば数字「8」と英字「B」の
識別や英字「K」と英字「X」などの識別ができ
ない欠点があつた。このため従来の手持ち式
OCRでは、数字と10種程度の英字を識別してい
るにすぎない。
また、行ごとに抽出する特徴の区分の種類を増
やすことも可能であるが、識別処理回路13の読
出専用記憶装置(ROM)が非常に多くなり装置
が高価となる欠点がある。
〔4〕 発明の目的 本発明の目的は上記従来技術の問題点を解消し
簡単な機能を付加することによつて、多くの文字
記号等をOCRにより識別することのできる改良
された文字認識方式を提供することにある。
〔5〕 発明の内容 本発明の内容を第3図、第4図及び第5図を用
いて説明する。
第3図において1〜13の符号を付した部分は
従来技術と同じであつて点線枠で区画された部分
が本発明の構成上の特徴である。21は左端検出
回路であり、制御および二値化回路7から送られ
る信号から各行ごとに文字線分の存在、つまり
“黒”の左端のセルの列番号を検出し、信号Piを
出力する。例えば第2図のLj行では、“黒”の左
端がB2列であるので信号Piとして“P2”を出力
する。なお左端検出回路21には垂直切出し回路
9および水平切出し回路10からの文字エリアの
信号も入力され、文字エリア内の“黒”の左端を
検出する。
左側形状識別回路23は左端検出回路21から
送られる各行ごとの“黒”の左端のセル番号の信
号Piから文字の左側の形状を識別する。左側形状
識別回路23は読出専用記憶装置(以下ROMと
称する)を用いることにより容易に実現できる。
左側形状識別回路23におけるデータフローを第
4図に示す。
第4図は一部を示したものである。円内のS0、
S1……は変化する状態を示し、矢印の近傍のP2、
P3……は“黒”の左端のセル番号に対応する信
号Piを示している。
例えばS0から始まり“黒”の左端セル番号が
2であればPiとして、P2の信号が入力され、S0
からS1の状態に変化することを表わしている。
例えば第2図に示すようなパターンからPiの信号
がP2、P2、P8、P8、P8、P8、P2……P2と入力
されたとすれば、第4図からS0、S1、S2、S3、
S4、S5と変化し、S5で終る。S5は“〓”の形状
と対応しているので、左側形状として“〓”を得
る。
第5図は、左側形状識別回路23を、ROM3
0とレジスタ31から構成した実施例であり、入
力信号Piと、レジスタ31の出力信号をROMの
アドレスとして読出し、その内容をレジスタ31
へセツトする。たとえば、まずレジスタ31をク
リアし、PiとしてP2が入力されると、このアド
レスで示すROM30の内容は“S1”を示してお
りこれをレジスタ31へセツトする。これを繰返
すものである。右側の形状も同様にして識別され
る。すなわち22は右側検出回路であり、各行ご
とに文字線分すなわち“黒”の右端のセル番号を
検出し、信号Qiを出力する。第2図の例ではLj
行ではBi−1列であり、これに対応する信号を
出力する。24は右側形状識別回路24は左側形
状識別回路23と同様にして右側の形状を識別す
る。25は文字形状識別回路であり、左側形状識
別回路23および右側形状識別回路24から送ら
れるそれぞれの形状に対応する信号から、左右の
形状を合成した文字形状を識別するものである。
26は合成回路であり、識別処理回路13の出
力信号と、文字形状識別回路25からの出力信号
とから、文字の識別結果を出力するものである。
例えば、数字「8」と英字「B」の識別では、識
別処理回路13から出力される信号は同じである
が、文字形状識別回路25からの出力信号は異な
る。数字「8」の左側の形状は「ε」、右側の形
状は「3」で文字形状は「8」となる。一方、英
字「B」の左側の形状は「1」、右側の形状は
「3」で文字形状は「B」となる。これにより合
成回路26により数字“8”と英字“B”の識別
あるいは英字「K」と「X」の識別などが可能と
なる。文字形状識別回路25および合成回路26
は左側形状識別回路23と同様にROMとレジス
タの構成で容易に実現できる。説明では一行ごと
に左、右、端検出を行なつたが複数行ごとに検出
してもよい。又、行ごとでなく列ごとに上下の文
字端を検出しても良いし、行ごと列ごとの両方を
検出してもよい。
〔6〕 効 果 本発明は、各行ごとに文字線分の特徴を描出し
該文字線分の特徴の出現順序により、文字の特徴
を描出するとともに、各行ごとに文字線分の左端
および右端を検出し、文字線分の左端および右端
の出現順序から文字の輪郭形状を描出し、文字の
特徴ならびに文字輪郭形状から文字を識別するの
で、構造の簡単なOCRによつて多くの種類の文
字を識別することができる。
【図面の簡単な説明】
第1図は従来のOCRの文字認識機構を示す図
である。第2図はOCRのイメージセンサの視野
の中の文字パターンを示す図である。第3図は本
発明の文字認識方式を実現するための機構を示す
図である。第4図は左側形状識別回路におけるデ
ータフローを示す図である。第5図は本発明の左
側形状識別回路の構成を示す図である。第6図a
〜cは行特徴抽出の説明図である。第7図は文字
線分の特徴コードの一覧を示す図である。 1…スキヤナ、2…手、3…用紙、4…ラン
プ、5…レンズ、6…イメージセンサ、7…制御
及び二値化回路、9…垂直切出し回路、10…水
平切出し回路、11…行特徴抽出回路、12…部
分特徴抽出回路、13…識別処理回路、21…左
端検出回路、22…右側検出回路、23…左側形
状識別回路、24…右側形状識別回路、25…文
字形状識別回路、26…合成回路、30…読出専
用記憶装置(ROM)、31…レジスタ。

Claims (1)

    【特許請求の範囲】
  1. 1 面状に配列した複数の光電変換素子からなる
    イメージセンサを有するスキヤナにより文字、記
    号等を走査し、文字、記号等を認識する文字認識
    方式において、文字線分が存在する光電変換素子
    の数から垂直および水平方向の文字エリアを検出
    し、前記文字エリア内の1或は複数の行又は列ご
    とに文字線分の特徴を抽出し、その出現順序によ
    り文字特徴を抽出するとともに、前記文字エリア
    内の1或は複数の行或いは列の少なくともいずれ
    か一方ごとに文字線分の端部を検出し、前記文字
    特徴と、文字エリアを構成する全ての行又は全て
    の列にわたつて前記端部を連ねた文字輪郭の形状
    とから走査された文字、記号等を認識することを
    特徴とする文字認識方式。
JP58211374A 1983-11-09 1983-11-09 文字認識方式 Granted JPS60103492A (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP58211374A JPS60103492A (ja) 1983-11-09 1983-11-09 文字認識方式
KR1019840006937A KR890002473B1 (ko) 1983-11-09 1984-11-06 문자인식방식
EP84113410A EP0144006B1 (en) 1983-11-09 1984-11-07 An improved method of character recognitionand apparatus therefor
DE8484113410T DE3478769D1 (en) 1983-11-09 1984-11-07 An improved method of character recognitionand apparatus therefor
CA000467388A CA1214561A (en) 1983-11-09 1984-11-08 Method and apparatus of character recognition
AU35212/84A AU571021B2 (en) 1983-11-09 1984-11-08 Recognition of character features by vertical/horizontal segmentation of image fields
US07/142,353 US4783835A (en) 1983-11-09 1987-12-28 Method of character recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58211374A JPS60103492A (ja) 1983-11-09 1983-11-09 文字認識方式

Publications (2)

Publication Number Publication Date
JPS60103492A JPS60103492A (ja) 1985-06-07
JPH0452510B2 true JPH0452510B2 (ja) 1992-08-24

Family

ID=16604900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58211374A Granted JPS60103492A (ja) 1983-11-09 1983-11-09 文字認識方式

Country Status (7)

Country Link
US (1) US4783835A (ja)
EP (1) EP0144006B1 (ja)
JP (1) JPS60103492A (ja)
KR (1) KR890002473B1 (ja)
AU (1) AU571021B2 (ja)
CA (1) CA1214561A (ja)
DE (1) DE3478769D1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5058182A (en) * 1988-05-02 1991-10-15 The Research Foundation Of State Univ. Of New York Method and apparatus for handwritten character recognition
US4874404A (en) * 1989-03-01 1989-10-17 Boswell Jerald O Vacuum cleaner
JPH03214378A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
JPH043279A (ja) * 1990-04-20 1992-01-08 Canon Inc 画像読み取り装置
JPH0749927A (ja) * 1993-08-09 1995-02-21 Nireco Corp パターン認識方法
US5795784A (en) 1996-09-19 1998-08-18 Abbott Laboratories Method of performing a process for determining an item of interest in a sample
US5856194A (en) 1996-09-19 1999-01-05 Abbott Laboratories Method for determination of item of interest in a sample
JP4208491B2 (ja) * 2002-06-11 2009-01-14 キヤノン株式会社 撮像装置及び指紋認識装置
US20040208376A1 (en) * 2003-04-18 2004-10-21 Winbond Electronics Corp. Pattern recognition device and method
CN101763505B (zh) * 2009-12-29 2011-12-07 重庆大学 基于投影对称性的车牌字符特征提取及分类方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3303463A (en) * 1963-03-04 1967-02-07 Ibm Error detection and correction apparatus for character readers
US3585592A (en) * 1968-02-29 1971-06-15 Nippon Electric Co Character recognition system with character edge detection capability
JPS5242028A (en) * 1975-09-29 1977-04-01 Fujitsu Ltd Letter recognition system
US4193056A (en) * 1977-05-23 1980-03-11 Sharp Kabushiki Kaisha OCR for reading a constraint free hand-written character or the like
JPS5811663B2 (ja) * 1977-05-24 1983-03-04 シャープ株式会社 文字図形認識方式
GB2002159B (en) * 1977-07-07 1982-01-13 Sumitomo Electric Industries Character reading system
JPS596418B2 (ja) * 1977-07-07 1984-02-10 住友電気工業株式会社 文字読取方式
US4180799A (en) * 1978-04-21 1979-12-25 Caere Corporation Apparatus and method for recognizing characters
AU533978B2 (en) * 1979-11-16 1983-12-22 Tokyo Electric Co. Ltd. Character reader
US4355301A (en) * 1980-05-27 1982-10-19 Sumitomo Electric Industries, Ltd. Optical character reading system

Also Published As

Publication number Publication date
AU3521284A (en) 1985-05-16
EP0144006A3 (en) 1987-01-14
JPS60103492A (ja) 1985-06-07
EP0144006A2 (en) 1985-06-12
US4783835A (en) 1988-11-08
EP0144006B1 (en) 1989-06-21
KR890002473B1 (ko) 1989-07-10
AU571021B2 (en) 1988-03-31
KR850003608A (ko) 1985-06-20
CA1214561A (en) 1986-11-25
DE3478769D1 (en) 1989-07-27

Similar Documents

Publication Publication Date Title
EP0063454B1 (en) Method for recognizing machine encoded characters
JPS63261486A (ja) 書体識別装置
JPH0452510B2 (ja)
US4797940A (en) Optical character reader
KR890003689B1 (ko) 광학적 판독장치
JP2000251010A (ja) 帳票読み取り方法
JPS6097484A (ja) 文字認識方式
EP0201909A2 (en) Procedure for automatic reading of images and device for carrying out this same procedure
JP2906608B2 (ja) 光学的文字読取装置
JPS61221982A (ja) 画像パタ−ン周囲長算出装置
JPH0731716B2 (ja) 光学的文字読取装置
JPS5878270A (ja) 光学的文字読取り装置
JPS6278686A (ja) 光学的文字読取装置
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JPH0469785A (ja) 光学的情報読取装置
JPH0715702B2 (ja) 文字パターン切り出し装置
JPS596418B2 (ja) 文字読取方式
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
JPS5822779B2 (ja) 文字パタ−ンの分類方式
JPH0576674B2 (ja)
JPS6160186A (ja) 光学的読取装置
JPS5953984A (ja) 文字認識装置
JPS6410875B2 (ja)
JPS63217490A (ja) 光学文字読取装置
JPH05108887A (ja) パターン切出しおよび認識方法とそのシステム