JPS58109980A - 文字読取り装置 - Google Patents

文字読取り装置

Info

Publication number
JPS58109980A
JPS58109980A JP56208306A JP20830681A JPS58109980A JP S58109980 A JPS58109980 A JP S58109980A JP 56208306 A JP56208306 A JP 56208306A JP 20830681 A JP20830681 A JP 20830681A JP S58109980 A JPS58109980 A JP S58109980A
Authority
JP
Japan
Prior art keywords
character
center
circumscribed
information
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56208306A
Other languages
English (en)
Other versions
JPS6120036B2 (ja
Inventor
Kunio Sakai
坂井 邦夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56208306A priority Critical patent/JPS58109980A/ja
Publication of JPS58109980A publication Critical patent/JPS58109980A/ja
Publication of JPS6120036B2 publication Critical patent/JPS6120036B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は漢字を含む多数の文字を読取シ対象として、安
定に且つ効率良く大分類識別の特徴を抽出することので
きる実用性の高い文字読攻)装置に関する。
発明の技術的背景 入力文字ノ々ターンの特徴を抽出し、辞書に予め発鈴さ
れている辞書ノリーンの特徴との照合を行い、その照合
結果に従りて上記入力文字パターンを読取シ認識するこ
とが行われている。
ところがこの文字認識において漢字を含む多数の文字を
読取シ対象とする場合、上記特徴の照合処理が非常に膨
大な量となシ、処理効率が着しく悪くなる。そこで従来
では、上記認識処理に先立ってII識対象文字を複数O
概略的な特徴によりて大分類し、これによって識別段階
での照合文字数を低減して処理効率の向上、処理速度の
高速化を図ることが行われている。この際、上記大分類
に用いる特徴と候補文字識別に用いる特徴とに同じもの
を用いることが必要であるが、この特徴は手書文字等に
起因する文字パターンの変形や種々の雑音に対して十分
安定であることが必要である。
しかして、従来、このような文字ノ々ターンの大分類に
用いられる特徴としては、文字線の複雑さに着目したも
のや、文字周辺部の形状に着目したもの、更には文字全
体の粗い形状に着目したもの等がある。尚、これらにつ
いては、例えば下記の文献に詳しく紹介されている。
坂井、渡辺 1印刷漢字認識の現状” 情報処理、 Vol、22  No、 4 PP、27
4〜279(昭和56年4月) 第1図はその一例を示すもので、原文字t!ターンの周
囲の形状に着目し、その周辺部上下左右に矩形状に設け
た走・査領域U t”D e L e R内に存在する
文字線を検出し、その量を「0」。
rlJ、r2Jなる3段階のレベルに量子化してこれを
特徴データとするものである。また第2図(a)に示す
ものは、原文字ノ臂ターンに接する外接辺”eaml、
rに着目し、これらの外接辺u、d、l、rに接する文
字背景部の面積を求め、これを多次元の特徴ベクトルと
して利用するものである。前者(第1図)は文字線部に
着目するのに対し、後者(第2図(a))は背景部面積
に着目する点を異にしているが、いずれも文字/#ター
ンの周囲における面積的数量を特徴としていると云える
背景技術′の問題点 とζろが、上記特徴抽出は、活字文字等のようにその/
母ターンが規格されている場合には非常に有効であるが
、手書文字のように文字としての特徴を有しながらも大
きく変形しているような場合には極めて不安定である。
しかも、例え活字文字であっても、第2図(b)に示す
ように文字ノ臂ターンの欠けやかすれが存在する場合、
その特徴抽出は甚だ不安定なものとなる。換言すれば文
字ノ4ターンの変形や種々の雑音に対して常に安定に特
徴抽出を行い得ないと云う問題を有している。
発明の目的 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、手書きされた漢字を含む多数の
文字を読取シ対象として、入力された原文字ノやターン
の大分類識別に必要な特徴を安定に且つ効率良く抽出す
ることのできる実用性の高い文字読取シ装置を提供する
ことKある。
発明の概要 本発明は文字の大盆類識別に必要な分類情報(%徴)が
文字パターンの周囲部に多く存在することに着目し、上
記文字・ぐターンの周囲部において、よシ広域での特徴
間を抽出し、絶対的な位置情報に代えて相対的位置情報
を用い、且つ特徴間の位置関係を新たな特徴として用い
ることを可能としたものであυ、入力された原文¥9タ
ーンの外接辺から文字ツクターン中心に向う背景部の重
心位置を各外接辺にそれぞれ対応して求め、これらの重
心位置の外接枠に対する相対位置か轟字Iり一ンの平均
的窪み量を求めてこれを大分類識別の特徴として抽出す
るようにした文字読取シ装置にある。
発明の効果 従りて本発明によれば、入力された文字1?ターンに接
する外接辺によりて囲まれる上記文字ノ9ターンの各外
接辺に対応した背景部の重々位置情報と云う新規な概念
を゛導入し、しかもこれらの重心位置の外接枠に対する
相対的な位置情報t*徴とするので、文字パターンの変
形や種種の雑音に対して十分安定にその特徴情報を得る
ことが可能となる。故に、欠けやかすれ等を生じた活字
文字であっても、あるいは手書きされた文字でありても
、その大分類識別に必要な特徴を安定に且つ効率良く得
ることができるので、文字認識処理の著しい向上を図シ
得る。また漢字等の複雑な文字パターンであって、且つ
手書文字を封蓋とする場合であっても上記背景部の重心
位置とその相対的な位置関係から、原文字パターンの特
徴を強く反映した情報を簡易に得ることができる等、文
字認識処理において実用性の高い顕著な効果を奏し得る
発明の実施例 以下、図面を参照して本発明の一実施例につき説明する
第3図は本装置における入力文字パターンの特徴抽出処
理について示すものであシ、ここでは手書き入力された
「上」なる文字ノ母ターンが示される。特徴抽出処理け
、先ず与えられた文字パターンについて、これを囲む外
接枠を検出することから行われる。この外接枠は、文字
t!ターンの′最左端に接する在外接辺り、同じく最右
端に接する右外接辺R1そして文字/々ターンの最上端
に接する上昇接辺Uと最下端に接する下外接辺りをそれ
ぞれ検出することによりて求められる。尚、上記各外接
辺U、D、L、Rは文字パターンを走査検出し、文字線
の位置座標を相互に比較することにより容易に達せられ
る。
箕を基準位置(基準線)として、各外接辺U。
D、L、Rから文字・ダターン中心に向う方向にそれぞ
れ走査し、文字線に到達する迄の走査線長を求める。但
し、上記走査の最大炎を例えば長さ!(可変)として文
字・々ターンの大きさに応じて規定するようにすること
が信号処理上好ましい。そして、これらの走査線長の総
和で示される各外接辺U’、 D 、 L 、 Hにそ
れぞれ対応した文字/ぐターンの背景部の面積Sを求め
る。
例えば外接辺Uにおける背景部の面積Sは、第3図に示
すように最大炎!に規定され九走査線にて外接辺Uを基
準位置として文字14’ターンの中心に向う方向に走査
し、その総和を求める。
但し、走査線が文字線に到達したとき、その走査は終了
し、また文字線に到達しなかったときには前記長さlに
達したときにその走査を終了とする。そして、このよう
にして求められた面積Sで示される領域の各点を(x、
y)として、領域SO重心位置G(X、Y)を次のよう
にして求める。
このようにして求められる外接辺Uに接する背景部の重
心位置G(X、Y)は文字ノ譬ターンの文字線に対する
部分的な欠は等に対して安定化された広域に亘うて文字
、p4ターンの特徴を反映した情報となる。しかして、
同様な処理によシ、他の外接辺り、L、Hにそれぞれ接
する背景部についてもその重心位置を求める。
その後、これらの重心位置の情報から、文字・fターン
の外接枠O大きさ、つまシ縦幅および″ 横幅について
正規化した前記領域Sの重心GO文字枠に対する相対位
置PUを Y Ptr = (−e  ) V として求める。但し、上式中H,Vは文字パターン外接
枠の横幅および縦幅を示している。この正規化処理を、
各外接辺tJ、D、L、Rに接する背景部の重心位置G
について七れぞれ行う。
これによつて、入力された文字ツクターンomg部の特
徴を示す情報が、正規化重心位置(Pw*PDePt−
tPm)として求められる。この情報は、文字パターン
の外接辺U、D、L、Rから見た外形部の平均的窪み量
に相幽したものであり、従って文字Iぐターンを大分類
識別する上で文字ノ臂ターンが有する特徴を十分反映し
た亀のとなりている。従うて、このようにして求められ
丸文字/譬ターンの周囲部の特徴(PU * PD @
 PLtP稟)を用いることによシ、上記文字・リーン
を効果的に、且つ安定確実に大分類識別することが可能
となる、。
例えは第4図(&) 、 (b)にそれぞれ示されるよ
うに大きさが異なシ、しかも手書きされた文字r区」、
「工」が入力された場合、上述し九処理によシその文字
パターン周囲部の特徴を求めれば (Pl。、・pl、  、 pl、  、 pl、  
)(P2Tj * p2D# p2. t p2. )
として示される。従りて、これらの特徴情報を第4図(
e) K示すように重ね合せて対比してみれば明らかな
ように、その平均的窪み量に顕著な差があることが判る
。特に同じ外接辺に対応5する特徴を対比してみれば、
例えば正規化重心位置間の距離についてみれば、特徴の
差異が距離の大きさとして文字パターンの特徴の違いを
大きく反映していることが判る。従って、両者の類似性
について、距離(P’ty t P2tr ) * (
”D*P2n) + (P’L IP’L) # (P
’l IF5嵐)についてそれぞれ求めれば総合的に判
定することができ、ここに大分類識別を容易に可能とす
る。しかも算術的な処理によって上記判定を効果的に行
うことができる。
第5図はこのような処理を施して文字パターンの大分類
識別の為の特徴を抽出する本発明の一実施例装置を示す
概略構成図である。
読取シ対象である文字バタ、−ンlは、例えばテレピゾ
ヨンカメラ等からなる走査光電変換装置2によシ光電変
換され、文字面を走査して入力される。この光電変換装
置2を介して入力された文字パターン1の像信号は2値
量子化装置3に入力され、例えば背景濃度を基準として
定められた弁別レベルにて弁別されて2値量子化される
。そして、量子化されてなる文字パターン信号は、走査
位置に対応する2値画素信号として17レームメモリ等
のノ々ターン記憶装置4に記憶される。この記憶装置4
に記憶格納された文字/9タ一ン画素信号が所定方向に
走査して読出され、前述した4!徴抽出処理に供される
即ち、外接枠検出装置5は、上記記憶装置4に格納され
丸文字パターンの文字線の位置座標をサーチし、その最
左端座標XL%その最右端座標X、を求め、在外接辺L
 tL = xLとして、ま九右外接辺RをR=Xlと
して求め°ている。同時に文字パターンの文字IIIの
最上端座標YT1と最下端座標YDを求め、上昇接辺U
と下外接辺りを求めている。そして、外接枠検出装置5
は、これらの外接辺り、R,U、Dの情報を走査回路6
L * ’my(’U+gDK制御情報としてそれぞれ
与えている。しかして、各走査回路f; x、 + 6
 B + 6 g6Dでは、与えられた外接辺の情報か
ら走査開始の基準線を定め、前記記憶装置4に格納され
た文字・やメーンの信号を上記基準線から文字・母ター
ンの中心に向う方向に、(左→右)、(右→左)、(上
→下)、(下→上)へと順次走査し、各外接辺に対応し
た(接した)走査線長の総和を求めている。つt、b各
外接辺をそれぞれ基準とした背景部領域Bを求めている
。このようにして求められた領域S′の情報を得る重心
計算部7L+71e 1ua7Dは、前述したようにそ
の重心位置Q (X’、 Y )をそれぞれ求め、これ
を正規化して相対的な位置情報である正規化重心位置p
、 # psi e PEI * PDをそれぞれ求め
ていもこれらの情報が統括され、入力文字パターンの周
囲部の特徴情報(PL * Pa * pu、pD)と
して特徴比較装置8に与えられる。
特徴辞書9には、予め各文字に対する上記したような特
徴情報が登録されておシ、特徴比較装置8はこれらの1
.辞書特徴と前記求められた入力文字ノ臂ターンの特徴
との類似性(類似度)を順次計算している。そして、そ
の類似度が、所定の許容値0以上のとき、これを得た特
徴辞書のカテプリーを大分@識別結果として出力してい
る。
このように、本発明に係る特徴抽出と、これに基づく大
分類識別を行う実施例装置は非常に簡単に実現できる。
そして、このようにして得られ九人分類識別結果と、入
力文字/々ターンの像信号とを次段の文字認識部に与え
れば、その文字認識を簡易に且つ効率良く行うことが可
能となる。しかも上述したように手書文字等の文字ノ4
メーンの変形や種々の雑音に対して安定なので、me処
理の効率を著しく向上せしめ得る。
従って、漢字を含む多くの文字を認識対象とする実用性
の高い文字読取シ認識システムを構築できる勢の絶大な
る効果を奏する。
尚、本発明は上記し九実施例にのみ限定されるものでは
ない0例えば、実施例では領域Sの重心位置を特徴情報
として求めたが、類似効果を得るものとして領域SO中
心を H,V H,V として求め、これを特徴情報としてもよい。このように
すれば、データ処理と装置構成の簡略化を図ることがで
きる。また文字線の’+?微情報等も併せて大分類識別
を行うようにしてもよい。
要するに本発明はその要旨を逸脱しない範囲で種々変形
して実施することができる。
【図面の簡単な説明】
第1図および第2図(a) 、 (bンは従来の文字/
4’ターンの特徴抽出の概念を説明する為の図、第3図
は本発明に係る文字/4ターンの特徴抽出の概念を説明
する為の図、第4図(、)〜(、)は本発明による文字
・臂ターンの特徴によって示される文字パターンの差異
を説明する為の図、第5図は本発明の一実施例装置の要
部概略構成図である。 1・・・文字パターン、2・・・走査光電変換装置、3
・・・2値量子化装置、4・・・パターン記憶装置、6
・・・外接枠検出装置、’L * 68 z 61J 
* 6D”’走査回路、1l−vr**7TJ+rD・
・・重心計算部、8・・・特徴比較装置、9・・・特徴
辞書。 出願人代理人  弁理士 鈴 江 武 彦第1図 第2図 第4図 第5図 1、事件の表示 特星帖ぢ6−ユ08ヨ06う 2、eB日偽ン6簿本 i〜札取υ装置 3、補正をする者 事件との関係 乍1許出4鏝入 (BO7)微振を魂°電気株式盆傳1 4、代理人 (5,補正の対象 ロロ 印 豊 7、J奄正店肉巷 叩陶書、:4−+ミ曖矛1竹口智よd′牙2118に丞
さ収コ紙1下訃−蓮9對i1屹 i乞

Claims (1)

    【特許請求の範囲】
  1. (1)原文字・臂ターンを光電変換して入力する手段と
    、この入力された原文字パターンを2値量子化して記憶
    する手段と、この記憶された原文字・臂ターンの上下左
    右4方向の外接辺からなる外接枠を検出する手段と、上
    記各外接辺から原文字中心に向う方向の文字背景部の重
    心位置を検出、する手段と、これらの各外接辺に対応し
    た文字背景部重心位置の前記外接枠に対する相対位置か
    ら前記原文字14タ一ン周囲の平均的窪み量を検出する
    手段と、この検出された平均的窪み量から前記原文字ノ
    4ターンの大分類識別を行う手段とを具備したことを%
    微とする文字読取り装置。 、(2)文字背景部の重心位置を検出する手段は、各外
    接辺から原文字ノ4ターンの中心に向う方向に走査して
    、外接辺から文字線に到るまでの走査距離をそれぞれ求
    めて行われるものである特許請求の範囲第1項記載の文
    字読取り装置。
JP56208306A 1981-12-23 1981-12-23 文字読取り装置 Granted JPS58109980A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56208306A JPS58109980A (ja) 1981-12-23 1981-12-23 文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56208306A JPS58109980A (ja) 1981-12-23 1981-12-23 文字読取り装置

Publications (2)

Publication Number Publication Date
JPS58109980A true JPS58109980A (ja) 1983-06-30
JPS6120036B2 JPS6120036B2 (ja) 1986-05-20

Family

ID=16554063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56208306A Granted JPS58109980A (ja) 1981-12-23 1981-12-23 文字読取り装置

Country Status (1)

Country Link
JP (1) JPS58109980A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6314292A (ja) * 1986-07-04 1988-01-21 Nec Corp 活字文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6314292A (ja) * 1986-07-04 1988-01-21 Nec Corp 活字文字認識装置

Also Published As

Publication number Publication date
JPS6120036B2 (ja) 1986-05-20

Similar Documents

Publication Publication Date Title
US9158986B2 (en) Character segmentation device and character segmentation method
Konidaris et al. Keyword-guided word spotting in historical printed documents using synthetic data and user feedback
US20070230784A1 (en) Character string recognition method and device
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
US6687421B1 (en) Skew detection of text in a noisy digitized image
JPH0896059A (ja) バーコード読取装置
Yadav et al. Text extraction in document images: highlight on using corner points
Okun et al. Document skew estimation without angle range restriction
JPH02306386A (ja) 文字認識装置
Shafait et al. The effect of border noise on the performance of projection-based page segmentation methods
Srivastva et al. A survey on techniques of separation of machine printed text and handwritten text
Lu et al. Chinese word searching in imaged documents
Van Beusekom et al. Combined orientation and skew detection using geometric text-line modeling
Kapoor et al. Skew angle detectionof a cursive handwritten Devanagari script character image.
JPS58109980A (ja) 文字読取り装置
Zemouri et al. Machine printed handwritten text discrimination using Radon transform and SVM classifier
JPH031712B2 (ja)
Das et al. Recognition and integration of dimension sets in vectorized engineering drawings
Premachandra et al. Parallel scanning based speed-up method for detection of elliptical obstacles in high-resolution image
JPH0324709B2 (ja)
Bouressace et al. A convolutional neural network for Arabic document analysis
JPH06139338A (ja) 指紋紋様分類装置
JP3090928B2 (ja) 文字認識装置
JP2580976B2 (ja) 文字切出し装置
Humied Segmentation accuracy for offline Arabic handwritten recognition based on bounding box algorithm