JPH0421235B2 - - Google Patents

Info

Publication number
JPH0421235B2
JPH0421235B2 JP58083429A JP8342983A JPH0421235B2 JP H0421235 B2 JPH0421235 B2 JP H0421235B2 JP 58083429 A JP58083429 A JP 58083429A JP 8342983 A JP8342983 A JP 8342983A JP H0421235 B2 JPH0421235 B2 JP H0421235B2
Authority
JP
Japan
Prior art keywords
character
feature
code
shape
pattern area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58083429A
Other languages
English (en)
Other versions
JPS59208680A (ja
Inventor
Shigeru Akamatsu
Takahiko Kawatani
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58083429A priority Critical patent/JPS59208680A/ja
Publication of JPS59208680A publication Critical patent/JPS59208680A/ja
Publication of JPH0421235B2 publication Critical patent/JPH0421235B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (1) 発明の属する分野の説明 本発明は、文字識別処理方式、特に手書き漢字
などのように複雑かつ多字種の識別対象を含む識
別処理において、文字のパタン領域上の任意のメ
ツシユ点あるいは特に選択された一部分のメツシ
ユ点から複数方向に文字を走査し、横切つた文字
の背景部分あるいは文字ストロークの特徴を、各
方向ごとに計数あるいは集積することにより得ら
れる特徴と標準特徴とをパタン領域上の出現位置
に対応づけることによつて、該入力文字を識別す
る文字識別処理方式に関するものである。
(2) 従来の技術の説明 従来、この種の方式に代表的なものの1つとし
て、ストローク密度分布法(特開昭56−44975号
公報)が知られている。本方式の基本部分である
特長抽出処理の原理を第1図に示して説明する。
パタン領域の任意のメツシユ点、たとえば第1
図Aにおける点11から、上下左右各方向にパタ
ン領域を文字枠まで走査する。そして各方向別に
走査途上で横切つた文字線の本数を第1図B図示
の如く点11に対応して設けられた4個をレジス
タに格納する。このように格納された状態を説明
するために、第1図Bにおいて、記号12で表わ
している。この走査をパタン領域上の全メツシユ
点について行なうことにより、次の(1)式のような
4次元の特徴ベクトルSがパタン上のすべてのメ
ツシユ点に求められる。
S=(n1,n2,n3,n4) (1) ここでn1,n2,n3,n4は走査線が横切る文字線
の本数を表わす。そして識別は、パタン領域上で
抽出された位置に前記特徴を配列し、その特徴配
列を出象的なパタンのみなしてマツチングを行な
う。このような上記従来方式では、雑音や文字の
変形に強く、パタンの複雑さをかなり忠実に表現
する特徴が得られるので、パタンの複雑さが広い
範囲にわたつて分布している漢字などを対象とす
る分類法として適する反面、該特徴はパタンを構
成する文字ストロークの本数の分布だけを表現
し、その形状などをほとんど表現しえない為、該
特徴の分類能力にはおのずと限界があるという欠
点があつた。この欠点を克服する方法の1つとし
ては、文字ストロークの傾きを求め、その傾きに
応じて文字ストロークの本数を数えて特徴ベクト
ルを得ることが発展形態として考えられる。たと
えば、任意のメツシユ点がら上方向に走査した時
に交わる水平方向、右上り方向、左上り方向の文
字ストローク数をn11,n12,n13としてそれれ別個
に計数し、該計数値を該メツシユ点において求ま
る特徴のうち上方向への走査に対応する成分とす
る方法、などがこれに相当する。この場合、単に
文字ストロークの本数だけではなく、その傾きを
含めた分布を表わす特徴ベクトルが得られ、従来
法に比べて識別が容易となる場合も予想される。
しかしながら、手書き文字とくに手書き漢字で
は、パタンを構成する文字ストロークの方向は、
筆記者のクセや筆記条件などの要因によつて必ず
しも同一字種のパタンの中でも安定には得られな
い。たとえば第2図A,Bはどちらも「圧」とい
う字のパタンの実施例を示したものであるが、第
2図Aの点13の上方向特徴成分はn11=2,n12
=n13=0となる一方、第2図Bの点14の上方
向特徴成分はn11=0,n12=2,n13=0となる。
このように、本方式では、文字ストロークの傾き
を特徴に反映させたことのために、かえつて同一
字種のパタンから得られる特徴の変動が大きくな
つてしまい、該特徴の分類能力にマイナスとなつ
てしまう欠点があつた。
(3) 発明の目的 本発明は、これらの欠点を解決するためになさ
れたもので、パタン領域上の任意のメツシユ点に
複数方向から伝播されたストロークの傾き情報の
間の相対的関係にもとづいて背景白部の形状を分
類してコード化した形状コードをパタン領域上の
位置に対応して得るとともに、パタン領域上の任
意あるいは特に選択された一部のメツシユ点を通
つて各走査方向ごとに存在する背景白部の形状の
該分類結果に応じて得られる図形的特徴を計数し
た特徴ベクトルを得ることを目的としており、以
下図面について詳細に説明する。
(4) 発明の構成および作用の説明 第3図は、本発明の実施例であつて、20は走
査部、30はパタンメモリ部、31はパタンメモ
リ、40は特徴抽出部、41は文字ストローク傾
斜抽出部、42は傾斜コード伝播処理部、43は
特徴生成点検出部、44は特徴生成点計数部、4
5は形状コード抽出部、46は特徴ベクトル抽出
部、47は特徴ベクトル格納部、48は形状コー
ド計数部、49は形状特徴格納部、50は識別
部、51は特徴ベクトルを用いた識別部、52は
形状特徴を用いた識別部、53は総合判定部、6
0は制御部である。
これを動作するには、制御部60の指令によ
り、走査部20がドキユメント紙面を走査し、用
紙上の1文字を含む領域の2値信号(黒および
白)がパタンメモリ31の所定のアドレスに順次
格納される。パタンメモリ31上では、パタン領
域内の任意の1メツシユに対して予め定められた
ワード数からなるメモリアドレスが割りあてられ
ている。パタン領域内の2値信号がパタンメモリ
31に格納され終ると、制御部60の指令を受
け、特徴抽出部40は予め定められた手順に従つ
てパタンメモリ31の内容を読み出しながら処理
を行ない、パタン領域上の任意あるいは特に選択
されたメツシユ点から複数方向に文字を走査した
時、各方向について求まる図形的特徴の計数値か
ら得られる特徴ベクトルを特徴ベクトル格納部4
7に、また、パタン領域を予め定められた大きさ
に分割した各部分領域について、背景白部の形状
を表現した形状コードの出現分布を表わす形状特
徴を形状特徴格納部49に抽出する。
特徴抽出部40による動作が終了すると、識別
部50では、複数の識別部51,52が特徴ベク
トル格納部47に形成された特徴ベクトルを用い
た識別と、計上特徴格納部49に形成された形状
特徴を用いた識別とをそれぞれ実行し、これらに
より総合判定部53は該入力文字か何であつたか
を決定し、出力端子70に出力する。
識別部50において実現される特徴ベクトルお
よび形状特徴を用いた識別法ならびに該複数識別
系の組み合わせによる総合判定法については、本
発明において特に新規性を主張するものではな
く、その具体例も既に公知<例えば特開昭57−
141781号公報>であると考えられるので、詳細な
説明は省略する。以下に特徴抽出部40における
具体的動作について、順を追つて説明する。
まず、文字ストローク傾斜抽出部41は、パタ
ンメモリ31の内容を読み出しながら、パタン領
域上の文字ストローク上に位置する任意の黒メツ
シユ点に対して、該メツシユ点近傍での該文字ス
トロークの傾斜角度をコード化した傾斜コードを
求め、パタンメモリ上の対応するアドレスに格納
する。文字ストロークの傾斜角度を求める方法と
しては、文字輪郭線上を追跡しながら連続する輪
郭点のなす角度を平滑化する方法、文字パタンを
細線化した後文字線を追跡して交点・屈曲点など
の幾何学的特徴点を折れ線近似する方法、などが
知られており、本発明においては上記任意の公知
技術を用いることができるので、詳細な説明は省
略する。なお、傾斜コードとしては、文字ストロ
ークの傾きを測定した角度値と考えてもよいが、
もちろんこれに限定されるわけでなく、該角度値
を一定の規則に従つて量子化した任意のコードを
想定することができる。
パタン領域上の任意の黒メツシユ点について傾
斜コードが求められると、傾斜コード伝播処理部
42が動作し、パタン領域上を予め定められた方
向に走査しながら黒メツシユ点上の該傾斜コード
を隣接する黒メツシユ点および白メツシユ点に
次々と伝播させて、対応するパタンメモリ31上
のアドレスに格納する。傾斜コード伝播処理部4
2の動作の実施例の1つとして、第4図に、パタ
ンメモリ31上の任意の黒メツシユ点および白メ
ツシユ点に伝播されて格納される傾斜コードの内
訳を図的表現によつて示す。
図中101は白メツシユ点102に対応して格
納される傾斜コードを表わす図的表現であり、
CU,CD,CL,CRは、白メツシユ点102よりそ
れぞれ上・下・左・右の各方向に最初に存在する
黒メツシユ点又は文字の外接枠上の点、103,
104,105,106の傾斜コードを表わす予
め定められたビツト長のデータに対応している。
なお、本例の103,106のような文字外接枠
上の点には、予め該方向に文字線が存在しないこ
とを意味して定義された傾斜コードを求めておく
ものとする。また、107は黒メツシユ点108
に対応した図的表現であり、CU,CD,CL,CR
同様に108よりそれぞれ上・下・左・右の各方
向に最初に存在する黒メツシユ点又は文字の外接
枠上の点109,110,111,112の傾斜
コードに、また、CSは該黒メツシユ点108自身
の傾斜コードに対応している。
傾斜コード伝播処理部42によりパタン領域上
のすべてのメツシユ点について傾斜コードの伝
播・格納が終了した段階で、あるいは、パタン領
域上の走査の過程で後記条件判定が可能となる予
め設定された段階に至つた特、傾斜コード伝播処
理部42の動作と平行して、特徴生成点検出部4
3は、パタンメモリ31に格納された文字パタン
において予め定められた図形的条件を満足する任
意のメツシユ点に対して、該メツシユ点に対応す
るアドレスに格納されている複数方向の文字スト
ロークから伝播された傾斜オードの間の相対的関
係に予め設定されている条件が満足される特、該
条件に対応する特徴生成点を該メツシユ点上に検
出する。
第5図に特徴生成点検出の一実施例を示す。パ
タン領域の走査方向を201とする時、該走査線
上で白メツシユ点から変化する任意の黒メツシユ
点202について、パタンメモリ上の対応するア
ドレスに格納されている各方向の傾斜コードの図
的表現を203とする。ここで傾斜コードCSで与
えられる該黒メツシユ点202における文字スト
ローク204の傾きをθ1とし、他方傾斜コードCL
で与えられる文字ストローク205が存在する場
合に限つて、対応する黒メツシユ点206におけ
る傾きをθ2とするとき、θ1,θ2によつて与えられ
る2つの文字ストローク204,205の間のな
す角度に応じて、以下に示す3種類の特徴生成点
F1,F2,F3を定義する。
すなわち、 θ1−θ2≧αの時F1 |θ1−θ2|<αの時F2 θ2−θ1≧αの時F3 (2) を検出するものとする。
3種の特徴生成点をこのように定義することに
よつて、特徴生成点F1は第6図aに示すように
文字ストロークの対が下方向に角度α以上に開い
た位置関係にある時、特徴生成点F2は第6図b
に示すように文字ストロークの対がほぼ平行な位
置関係にある時、特徴生成点F3は第6図cに示
すように文字ストロークの対が上方向に角度α以
上に開いた位置関係にある時、それぞれ検出され
ることになる。
第7図に、特徴生成点検出のもう1つの実施例
を示す。パタンメモリ上の走査線を301とす
る。このとき、該走査線上にあつて走査方向30
2およびそれと直交する方向303について文字
ストロークからの距離が予め定められた一定値L
メツシユ以内である任意の白メツシユ点304に
おいて、対応するアドレスに格納された各方向の
傾斜コードの図的表現305とする。このうち前
記の2方向、302,303に対応する傾斜コー
ドCD,CRによつてそれぞれ与えられる黒メツシ
ユ点306,307上における文字ストロークの
傾きθ3,θ4が、つぎの条件 90−β<|θ3−θ4|<90+β (3) を満足する場合に走査線上で該メツシユ点の数を
計数していき、該走査点301が白メツシユ点か
ら黒メツシユ306に移る時点で該メツシユ点計
数値が予め定められた閾値を越えた場合に特徴生
成点を検出するものと定める。該特徴生成点は、
パタン領域上の文字ストロークによつて形成され
る〓型とコーナー領域において検出されることに
なる。走査方向およびそれと直交する方向のとり
方に応じて、第8図に示す各種のコーナー領域4
01,402,403,404の存在を特徴生成
点検出の条件とすることができる。
パタンメモリ31上を複数方向に順次走査を行
ないながら、特徴生成点検出部43の前記動作と
同期して特徴生成点計数部44が動作し、パタン
領域上の任意のあるいは特に選択された一部分の
メツシユ点について、該メツシユ点を通る走査線
が横切る特徴生成点の数を該特徴生成点の種別と
該走査線の方向別に計数し、該計数値を該メツシ
ユ点に応答するパタンメモリ上のアドレスに格納
する。
上記特徴生成点の計数処理が終了すると、特徴
ベクトル抽出部46はパタン領域上の前記各メツ
シユ点に対応して求めた該計数値を組み合せて合
成し、識別に用いる特徴ベクトルを抽出して、そ
の結果を特徴ベクトル格納部47に格納する。
第9図に、パタン領域上に選ばれたメツシユ点
における特徴生成点の計数値から識別に用いる特
徴ベクトルを抽出する方法の一実施例を示す。パ
タン領域500上の斜線で示す各部分領域50
1,502,…の内部の任意のメツシユ点につい
て、先に述べたような処理によつて各走査方向お
よび各特徴生成点の種別に対応して特徴生成点の
計数値を求めた後、各部分領域別に内部のメツシ
ユ点についての計数値の対応する成分の総和を求
め、特徴ベクトルの成分とする。
たとえば、本図実施例に示す各部分領域50
1,502,…について一様に、第6図に示した
図形的特徴に対応する3種の特徴生成点を上・
下・左・右の4つの走査方向それぞれについて計
数するものとすれば、特徴ベクトル抽出部46に
よつて288次元の識別用特徴ベクトルが求めら
れる。
一方、形状コード抽出部45は、前記傾斜コー
ド伝播処理部42によつてパタン領域上の任意の
メツシユ点に複数走査方向から伝播・格納された
文字ストロークの傾斜コードを、予め定められた
規則に従つて組み合せることにより、パタン領域
上の背景白部の形状をコード化した形状コードを
抽出し、該メツシユ点に対応するパタンメモリ上
のアドレスに格納する。この種の形状コード抽出
法としては、任意の白メツシユ点の上・下・左・
右各方向の文字ストロークの傾斜をそれぞれ独立
に表わす傾斜コードを直接合成して形状コードを
得る方法が特開昭56−110188号公報に見られる。
これに対して本発明においては、複数走査方向に
対応する傾斜コードの相対関係にもとづいて形状
コードを抽出する点に特色があり、その為の形状
コード抽出部45の構成実施例を第10図に示
す。
任意の白メツシユ点において、図的表現107
に示す傾斜コードを入力とする。図中601,6
02は記憶部であり、それぞれ端子603,60
4より与えられる傾斜コードCU,CDに対して該
白メツシユ点の上下に位置する文字ストロークの
相対的関係を表わすコードを端子605に、また
端子606,607より与えられる傾斜コード
CL,CRに対して該白メツシユ点の左右に位置す
る文字ストロークの相対的関係を表わすコードを
端子608に出力する。該端子605,608に
得られるコードを合成部609により合成し、形
状コードを端子610に得る。
パタンメモリ上の任意のメツシユ点に対応する
アドレスに形状コードが格納された後、形状コー
ド計数部48は、パタン領域をあらかじめ定めら
れた大きさに分割した部分領域ごとに形状コード
の出現メツシユ数を計数して、該計数値を形状特
徴格納部49の該形状コードに対応するアドレス
に格納し、形状特徴を得る。
(5) 効果の説明 以上説明した様に本発明によれば、複数の文字
ストロークについてそれぞれ求まる傾き情報の間
の相対的な関係にもとづいて文字パタンの図形的
特徴を表現し、文字パタンの複雑さの分布を表わ
す特徴ベクトルならびに背景白部形状の出現分布
を表わす形状特徴の抽出にそれぞれ該図形的特徴
を反映させているので、手書き漢字の認識におい
て筆記者のクセや筆記条件などに対しても比較的
安定であり、かつ従来法と比べて識別能力の高い
特徴が得られるという利点がある。
【図面の簡単な説明】
第1図は従来の代表的な手書き漢字識別処理方
式であるストローク密度分布法の特徴抽出原理を
示す図、第2図はパタン中の文字ストロークの方
向変動にともなつて文字ストロークの傾きを表わ
す特徴に表われるばらつきの例を示す図、第3図
は本発明の一実施例の構成を示すブロツク図、第
4図は傾斜コード伝播処理部の動作の実施例を示
す図、第5図は特徴生成点検出の一実施例を示す
図、第6図は特徴生成点に対応する図形的特徴の
一例を示す図、第7図は特徴生成点検出の他の実
施例を示す図、第8図は前記別種の特徴生成点に
対応する図形的特徴の一例を示す図、第9図は特
徴ベクトル抽出部による処理の一実施例を説明す
る図、第10図は形状コード抽出部の機能構成の
一実施例を示すブロツク図である。 図中、10は読取り文字パタン入力端子、20
は走査部、30はパタンメモリ部、31はパタン
メモリ、40は特徴抽出部、41は文字ストロー
ク傾斜抽出部、42は傾斜コード伝播処理部、4
3は特徴生成点検出部、44は特徴生成点計数
部、45は形状コード抽出部、46は特徴ベクト
ル抽出部、47は特徴ベクトル格納部、48は形
状コード計数部、49は形状特徴格納部、50は
識別部、51は特徴ベクトルによる識別部、52
は形状特徴による識別部、53は総合判定部、7
0は識別結果出力端子。

Claims (1)

  1. 【特許請求の範囲】 1 文字パタン領域上の背景部分あるいは文字ス
    トロークの図形的特徴を抽出して、該特徴を用い
    て入力文字に対する候補カテゴリを選ぶ文字識別
    処理方式において、任意の文字ストローク上に位
    置する黒メツシユにおいて該文字ストロークの傾
    き情報を求める手段と、複数の文字ストロークに
    ついて求まる傾き情報の間の相対的関係をあらか
    じめ定められた条件が満足されるかを判定し、文
    字パタン上の図形的特徴を検出する手段とからな
    り、該検出された図形的特徴を用いて識別するこ
    とを特徴とする文字識別処理方式。 2 パタン領域上の定められた方向の走査によつ
    て文字ストローク上に求められた傾き情報をパタ
    ン領域内の背景白部の白メツシユに伝播させる手
    段と、各走査方向から伝播された複数ストローク
    の傾き情報の相対的関係から、あらかじめ定めら
    れた規則に従つて、背景白部の形状をコード化し
    て形状コードを抽出し、該形状コードをパタン領
    域上の位置に対応して格納する手段とを設け、該
    形状コードを用いて識別を行うことを特徴とする
    特許請求の範囲第1項記載の文字識別処理方式。
JP58083429A 1983-05-12 1983-05-12 文字識別処理方式 Granted JPS59208680A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58083429A JPS59208680A (ja) 1983-05-12 1983-05-12 文字識別処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58083429A JPS59208680A (ja) 1983-05-12 1983-05-12 文字識別処理方式

Publications (2)

Publication Number Publication Date
JPS59208680A JPS59208680A (ja) 1984-11-27
JPH0421235B2 true JPH0421235B2 (ja) 1992-04-09

Family

ID=13802191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58083429A Granted JPS59208680A (ja) 1983-05-12 1983-05-12 文字識別処理方式

Country Status (1)

Country Link
JP (1) JPS59208680A (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS594070B2 (ja) * 1979-12-29 1984-01-27 富士通株式会社 文字特徴抽出方式
JPS5773481A (en) * 1980-10-24 1982-05-08 Nec Corp Optical character recognition device

Also Published As

Publication number Publication date
JPS59208680A (ja) 1984-11-27

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US7164795B2 (en) Apparatus for extracting ruled line from multiple-valued image
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
US5896464A (en) Ruled line elimination apparatus and method
JP3411472B2 (ja) パターン抽出装置
JP2001283153A (ja) カラー画像から文字列パターンを抽出する装置および方法
JPH0418351B2 (ja)
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JPH0421235B2 (ja)
JP2868134B2 (ja) 画像処理方法及び装置
JPH03126181A (ja) 文書画像の領域分割方法
JPH06195511A (ja) 2値化しきい値決定装置
JP3710164B2 (ja) 画像処理装置及び方法
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH06139338A (ja) 指紋紋様分類装置
JP3084833B2 (ja) 特徴抽出装置
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JP3104355B2 (ja) 特徴抽出装置
JP2715930B2 (ja) 線分検出方法
JP3127413B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JPH09114925A (ja) 光学式文字読取装置