JPS6284389A - 文字分類方式 - Google Patents

文字分類方式

Info

Publication number
JPS6284389A
JPS6284389A JP60110287A JP11028785A JPS6284389A JP S6284389 A JPS6284389 A JP S6284389A JP 60110287 A JP60110287 A JP 60110287A JP 11028785 A JP11028785 A JP 11028785A JP S6284389 A JPS6284389 A JP S6284389A
Authority
JP
Japan
Prior art keywords
character
point
area
directions
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60110287A
Other languages
English (en)
Other versions
JPH0576664B2 (ja
Inventor
Atsushi Tsukumo
津雲 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP60110287A priority Critical patent/JPS6284389A/ja
Publication of JPS6284389A publication Critical patent/JPS6284389A/ja
Publication of JPH0576664B2 publication Critical patent/JPH0576664B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は印刷文字認識、特に、漢字、平仮名、片仮名、
英字、数字等の印刷邦文文字の認識における分類方式に
関する。
(従来技術とその問題点) 従来印刷漢字認識では、シングルフォントの場合には、
字種の多さ、字形の複雑さ、類似文字対の多さ等の問題
があり、マルチフォントになるとさらに字体の変化が問
題とされて来た。一般に漢字認識の対象字種は少なくと
も常用漢字約2000字からJIS第−水準約3000
字であり、場合によってはそれ以上の字種の読み取りの
要望もある。そこで字種の多さに対ぐる対策として、比
較的簡単な処理によって100字種程度に候補を絞る大
分類が、おおくの場合に採用されている。このようにし
て選択された候補字種に対して、字形の複雑さを考慮し
た認識方式を適用し、その結果認識出力が一字種に絞れ
ずに、類似文字対が残ったときには詳細識別処理が行な
われる。このような処理の例では、大分類として複雑指
数、四辺コード法の組み合わせ、認識処理として複合類
似度法、詳細識別処理として混合類似度法が、約200
0字のシングルフォント印刷漢字認識に適用されたこと
が知られている。(日経エレクトロニクス1977.1
0.31号pp。
102−128森健−1坂井邦夫、”2000字種を1
00字/秒で読む印刷漢字OCRの開発パ)シかしこの
ような大分類処理では認識対象をマルチフォントにした
ときの分類性能に問題があり、正しい候補字種を後続す
る認識処理に送るために候補字種を多くすると、認識処
理の重荷が増大し、認識性能および処理速度を維持する
ことが難しくなるという問題が生じる。
この例とは別に常用漢字等の約2000字種のマルチフ
ォント印刷漢字を対象とし、分類処理をより高性能にし
て、形状の類似した文字のある候補だけを詳細識別で処
理し、殆どの文字は分類過程で認識処理してしまう例も
報告されている。(電子通信学会論文誌VolJ67−
D、No、8.目黒真−1梅田三千で二値化されたmX
n二次元配列で表わされる文字パタンの外接矩形の水平
方向の辺をM分割、垂直方向をN分割し、この外接矩形
を、MXNの矩形部分領域に分割し、各部分領域での黒
点数を計数し、MXN次元ベクトルを作り、ベクトル空
間での分類を行なうもので、実験的には、8×8の部分
領域に分割を行なって64次元ベクトルで分類をすると
きが最も分類性能がよい。もう一つの特@量は、同じく
二値化された文字パタンの外接矩形の水平方向の辺をM
分割、垂直方向の辺をN分割し、左側の垂直方向の辺か
らは水平方向右向きに走査し、黒点に初めて到達するま
での白点数と2度目に到達するまでの白点数を計数する
。この2種類の白点数をN個の区間でそれぞれ合計する
と、2XN個の要素が得られる。同様の処理を、右側の
垂直方向の辺からは水平方向左向きに走査して行ない、
上側の水平方向の辺からは垂直方向下向きに走査して行
ない、下側水平方向の辺からは垂直方向上向きに走査し
て行ない、それぞれの辺に対して、2XN個、2XM個
、2XM個の要素が得られる。
い。
前者の特徴ベクトルは文字パタンの文字部の大局的な分
布を示しており、後者の特徴ベクトルは文字パタンの周
辺の形状を反映しており、共に絶対位置に文字パタンの
構造を大局的に反映させた異なった特徴となっている。
しかしこれらの特徴はいずれも大局的な性質を捉えてい
るものなので、認識対象をJIS第−水準約3000字
のように拡大し、複雑な構造をした字形の文字が極端に
多くなリ、かつ類似文字対の組み合わせが増加すると、
後続する識別処理に負担が大きくかかり、分類性能の維
持か困難になるという問題点がある。
一方、文字パタンの相対位置の情報を反映させた特徴ベ
クトルによる分類方式もある。
従来、この種の代表的な方式として下記の方式が知られ
ている。すなわち、まず、4辺が認識すべき文字を囲む
ような矩形領域を作り、この領域を縦方向にm個、横方
向にn個に分割し、mXn個の微小領域の集合とする。
この各々の微小領域を前記文字を含む領域内の点と定義
する。このような点は文字を表わす線を含まない背景点
と文字を表わす線を含む文字点との2種類に分けられる
。今、二゛うして定義されたある1つの背景点Pをとり
、その点から左右の水平方向および上下の垂直方向に走
査線を出し、それらの走査線が前記文字の線と、それぞ
れ左方に0回、右方にd回、上方にa回、および下方に
b回交差したとする。これを背景点Pに付随する1つの
特性を表わす量と考え、すべての背景点には、あるそれ
ぞれのc、d、aおよびbの値をもつ特性が付随するこ
とになる。
今、仮に文字の線と交差する回数を表わす前記C5d、
a及びbの値が2又は2以上の場合には、それを2と制
限することにすると許される値は0,1および2の3種
類とする。従って、各点の特性として許される種類の数
は34=81であり、81種類の各特性について背景点
を集計し、81次元のベクトルを生成し、このベクトル
を用いて線形識別関数によって文字認識を行なう。
これはグラックスマン(Glucksman)の方法[
エイチ、エイ、グラックスマン:クラシフィケーション
オプミックスドフォントアルファベチックスパイキャラ
クタリスチ゛ツクスロシ、ダイジェストオブファストア
イイーイーイーコンピュータコンファレンス、138ペ
ージ、1967年参照(H,A、Glucksman 
:C1assification  of  Mixe
d  font  Alphabetics  byC
haracteristic Loci、Digest
 of First IEEE ComputerCo
nference、P、138.1967)]として知
られているがこれを漢字を含む邦文文字の認識に適用し
ようとすると、次のような問題が生じる。
まず、第1に水平あるいは垂直の走査線が文字と交差回
路を2回を上限としているが、漢字のようにストローク
数が多い文字に対しては少なすぎる。
第2に単に文字部との交差回数を計数するだけでは、文
字の傾きに対して上記ベクトルの要素の値が不安定にな
る。
第3に交差回数の上限を漢字の複数さに合わせ7程度ま
でとった場合には、上記のようなベクトルを作ると、8
4=4096次元という膨大な次元数をもつ空間のベク
トルを処理をする必要が生じ、処理が非常に困難になる
上記のような欠点を除去するために交差回数の上限を増
加し、交差回数の計数値を文字の傾きに対して安定に決
定し、さらに処理量を実現可能な量に軽減する文字認識
方式は、既に特開昭58−70383号公報(特願昭5
6−169153号明細書文字認識方式)として示され
ている。この認識方式は、相対位置情報だけを扱いなが
ら効果的な分類を行なっているが、印刷文字の分類に用
途を限定すると印刷文字特有の絶対位置情報を導入する
ことにより、さらに効果的な分類が期待できる。
このような一つの試みとしては既に特公昭58−165
03号公報(文字識別処理方式)がある。ここではmX
nの文字パタンを横方向にM分割、縦方向にN分割して
MXNの局所領域を定める。この局所領域は、横方向に
p個、縦方向にq個から成っており、m =MXp、n
 =NXqという関係がある。前記各局所領域において
、前記局所領域内の各点に割りつけられた上下左右方向
ごとの交差数の合計を求め、上方向の交差数の合計をA
、下方向の交差数の合計をB、左方向の交差数の合計を
C7右方向の交差数の合計をDとしたとき、この(A、
B、C,D)て示される4次元ベクトルを前記局所領域
を代表する特徴ベクトルとしている。前記各局所領域に
ついて、代表する4次元特徴ベクトルを求め、すべての
特徴ベクトル或いは選択された特徴ベクトルを用いてベ
クトル演算で分類を行なっている。この方法は確かに位
置情報が反映されてはいるが、各局所領域内で上下左右
方向ごとの交差数の合計を求め、4次元ベクトルにして
いることにより、局所領域が比較的小さいときには、前
記グラックスマンの方法、或いは前記特開昭58−70
383号公報の方法の特徴とを小さくすることになる。
すなわち前記p、qの値を小さくすることになる。しか
し、前記m、n、M、N、p。
qの関係から、前言己p、qの値を小さくすると、前記
M、Nの値は大きくなり、局所領域の数MXNが大きく
なる。前記各局所領域は4次元ベクトルで代表されてい
るので、すべての局所領域を用いて文字パタンを代表す
ると4XMXN次元のベクトルとなり、前記局所領域の
数MXNが増大することは前記文字パタンを代表するベ
クトルの次元が増大することを意味し、これは分類のた
めのベクトル演算での処理の増大を招くことになる。例
えば文字パタンが64X64のパタンであるとき、すな
わちm=n=64であるとき、局所領域の大きさを4×
4、すなわちp=q=4とすると、前記m、n、M、N
、p、qの関係がらM==N=16となり、局所領域の
数は256個、すなわちMXN=256となる。従って
すべての局所領域を用いて前記文字パタンを表わすと4
XMXN=1024次元という膨大な次元数のベクトル
となる。また前記次元数を減らすために局所領域を選択
することにしても、仮に8分の1の32個を選択しM=
N=8となり、文字パタンを代表するベクトルの次元数
は256次元(=4次元X8X8)と低くなるが、既に
述べた通り8×8の領域をわずか4次元ベクトルと、前
記入力特徴ベクトルと同じ形式の64次元ベクトルで記
述されて各字種ごとに用意されているひ標準ベクトルを
格納する標準ベクトル記憶部と、前記入力特徴ベクトル
と前言己各字種ごとの標準ベクトルとを照合し、ベクト
ル計算によって前記入力特徴ベクトルと前記各字種ごと
の標準ベクトルとの相違度を求める相違度演算部と、前
記相違度によって各字種の順位付けを行ない、詳細識別
のための候補字種を定める分類処理部とを有し、絶対位
置情報と文字パタンの構造情報とを反映した特Ritに
よって文字認識のための大分類を行なうことを特徴とす
る文字分類方式を実現することができる。
(発明の作用原理) 以下図面を用いて本発明の原理について詳細に説明する
。第6図は本発明の詳細な説明するための図である。第
6図(a)において、A、B、C,Dは、二値化された
文字パタンの外接矩形上のそれぞれの辺を2等分する点
であり、E、F、G、Hはそれぞれ前記外接記背景部の
各点から上方向及び左方向の2方向へ走査を行ない、右
上の小領域では前記背景部の各点から上方向及び右方向
の2方向へ走査を行ない、左下の小領域では前記背景部
の各点がら下方向及び左方向の2方向へ走査を行ない、
右下の小領域では前記背景部の各点から下方向及び右方
向の2方向へ走査を行ない、前記上方向及び下方向の走
査では水平方向と斜方向のストロークと交差した回数を
計数し、前記左方向及び右方向の走査では垂直方向と斜
方向のストロークと交差した回数を計数し、交差回数が
0.1.2回のときにはそのままの交差回数を、前記交
差回数が3回以上のときは交差回数を3とし、前記それ
ぞれの4筒所の小領域の背景部の各点に、2方向の交差
回数の組み合わせて16種類の特徴コードを割りつける
特徴パタン生成部と、前記4箇所の小領域に於いて、そ
れぞれ16種類の特徴コードの出現頻度を計数して16
個の要素を求め、この結果全領域で求まる64個の要素
を前記外接矩形の面積で正規化して得られる64次元ベ
クトルを入力特徴ベクトルとする特徴ベクトル抽出部で
代表するということで分類能力に問題が生じる。
(発明の目的) 本発明の目的は字種の増加に伴ない、複雑な構造をした
文字が極端に多くなり、かつ類似文字の組合わせが増加
しても充分に印刷文字の分類性能を維持するために、相
対位置情報と絶対位置情報とを反映する安定した特徴を
、64次元ベクトルという非常に低い次元のベクトルで
実現することにより、処理量の増大をも防止することの
できる文字分類方式を提供するものである。
(発明の構成) 本発明によれば、文字部と背景部とが、二値から成る量
子化信号に変換されて成る文字パタン上で、背景部の各
点より複数方向に走査し、交差するストローク数を計数
し、特徴付けを行なうことによって得られる特徴を用い
る文字分類方式に於いて、前記文字パタンの外接矩形領
域を、水平方向及び垂直方向にそれぞれ二等分して4種
の小領域を定め、前記小領域のうち、左上の小領域では
前左上部分領域、右上部分領域、左下部分領域、右下部
分領域に属する文字の背景部の点である。この背景部の
点から、従来技術の上、下、左、右へと4つの方向に走
査するのと異りその点の属する部分領域によって指定さ
れる2つの方向のみに走査が行なわれる。すなわち、前
記左上部分領域の背景部のすべての点からは、上向き及
び左向きに走査を行ない、前記右上部分領域の背景部の
すべての点からは上向き及び右向きに走査を行ない、前
記左下部分領域の背景部のすべての点からは下向き及び
左向きに走査を行ない、前記右下部分領域の背景部のす
べての点からは下向き及び右向きに走査を行ない、走査
方向と、交差した文字パタンの輪郭部の接線方向とが、
定められた閾値以上の角度で交差していれば、交差回数
を計数することにより、各背景部の点を特徴づける。第
6図(b)は前記背景点E、F、G、Hの特徴表現を示
しており、前記背景点Eは上に2回、左に1回交差し、
前記背景点Fは上に1同右に0回交差し、前記背景点G
は下に2回、左に1回交差し、前記背景点Hは下に1回
、右に2回交差している。第6図(c)、(d)は、走
査線が文字ストロークと交差したときに、前記文字前記
パタンの輪郭部の接線の方向を考慮して交差回数を計数
することの効果を表わす図である。第6図(C)におい
ては第6回(a)と同じ文字パタンか傾いて入力された
ことを示しており、A’ 、B’ 、C’ 、D’ は
外接矩形の各辺を二等分する点、E’ 、F’ 、G’
 、H’ はそれぞれ背景部の点である。前記背景点E
′から左向きに走査したとき文字部と1回交差するが走
査方向と輪郭部の接線方向のなす角度が小さいので計数
しない。同じく前記背景点E′から上向きに走査したと
き文字部と2回交差するが、1回は走査方向と輪郭部の
接線方向のなす角度が小さいので、特徴づけるときの交
差回数は1とする。前記他の背景点Fl 、G’。
H′ についても同様であり、前記各背景点Et 、F
r。
G’ 、H’ の′vf徴づけられた結果を第6図(d
)に示す。
この例で示すように交差回数を計数するときに文字パタ
ンの輪郭の接線方向と走査方向のなす角度を考慮するこ
とにより、文字パタンの傾きを吸収する効果が得られる
。印刷文字認識に置いては、文字パタンか傾いて入力さ
れることは頻繁に起こるので、文字パタンの傾きが吸収
できるか否かは、認識能力に大きく影響する。
交差回数には、最大3の上限を設定する。すなわち走査
して4回以上の交差をしても交差回数を3回とする。こ
れは交差回数をコード化するときに2ビツトを割当てれ
ばよいことを意味する。その理由は文字パタンを前記4
箇所の部分領域に分割したときに、4回以上の交差が起
こりうる場合は非常に稀であるので、交差回数に上限を
設けて特徴づけを行なっても、分類のための特徴として
はその性能を劣化させるものではないからである。この
ように前記各部分領域において、各背景点は、垂直、水
平の2方向の交差回数で特徴づけられ、1方向の特徴に
2ビツトが必要なので、2方向のvf薇には4ビツトが
必要となり、2方向で特徴づけられる各背景点は4ビツ
トが割当てられることになる。
従って前記各部分領域において、前記各背景点に16種
類の特徴のいずれかが割当てられることになり、前記そ
れぞれの16種類の特徴を属する4つの部骨領域で特徴
づけすると、前記文字パタンの全領域の背景点に64種
の特徴のいずれかが割当てられる。ここで交差回数を2
回以下に限定すると、1方向の交差回数が0.1.2の
3通りであるので2方向で特徴づけられる背景点に割当
てられる特徴は9(=3×3)種類となり、前記全領域
の背景点には36(=9×4)種の特徴のいずれかが割
当てられる。これは交差回数を最大3回とした場合に比
べ、特徴の数は半分以下にもなっていないが、分類対象
を形状の複雑な漢字としたときには、あまりに粗い特徴
である。従って本方式のように4箇所の部分領域を設定
する場合には、分類能力、処理量を考えて、交差数を最
大3回と定めるのが最もよい効果が得られる。
さて、前記処理を次のように定式化する。前記部分領域
を示すコードをiとし、左上の前記部分領域を示すとき
i=0、右上の前期部分領域を示すときi=1、左下の
前記部分領域を示すときi=2、右下の前記部分領域を
示すときi=3とする。次に前記各部分領域における2
方向の交差回数を示すコードをj。
kとする。例えば、i=0のとき、jは上方向の交差回
数でkは左方向の交差回数、i=1のとき、jは上方向
の交差回数でkは右方向の交差回数、i=2のとき、j
は下方向の交差回数、kは左方向の交差回数、i=3の
とき、jは下方向の交差回数、kは右方向の交差回数を
示すことにする。前記コードij、kを用いて前記各背
景点に割当てられる特徴をfijkと表わすと、前記第
6図(a)の前記背景点Eに割当てられる特徴はf02
1、前記背景点Fに割当てられる特徴はfllo、前記
背景点Gに割当てられる特徴はf221、前記背景点H
に割当てられる特徴はf312となる。これまでの説明
で前記コードij、には0,1,2.3の4種類の値を
とるので、特徴fijkは64種類である。
一つの文字パタンの各背景点に前記特徴付けを行なった
とき、前記特徴fijkの割当てられた背景点の数をF
ijkとし、前記特徴点数Fijkを外接矩形の面積で
正規化した値をFijkとする。前記正規化された値F
ijkを要素とする64次元ベクトルを、前記文字パタ
ンの特徴ベクトルとする。分類処理は次のように行なう
。前記64次元の特徴ベクトルを字種ごとに用意し、こ
れを標準ベクトルF(s)zとする。は字種を表わすコ
ードである。入力文字パタンから得られる前記64次元
の特徴ベクトルを入力ベクトルFとすると、前記入力ベ
クトルFと前記各々の標準ベクトルF(II)己のベク
トル演算で定義される相違度をD([F、F(S−)と
し、前記相違度の値が小さい順に順位付けを行ない、分
類処理を行なう。この場合の相違度は、ユークリッド距
離、シティブロック距離等のベクトル距離等を採用して
、通常の文字認識で行なわれている処理を実行すればよ
い。
(実施例) 第1図は本発明の構成を示すブロック図である。
1は特徴パタン生成部であり、二値化された文字パタン
を信号90として入力し、前記4種の部分領域の前記各
背景点に前記特徴づけを行ない、前記文字パタンの外接
矩形情報を信号91、前記部分領域ごとの特徴づけされ
た特徴パタンを信号92として出力する。2は特徴ベク
トル抽出部で、前記特徴パタン信号92を入力して前記
特徴fijkごとに割当てられた前記文字パタンの背景
部の点の数を計数し、前記出現頻度Fijkを求め、同
時に前記外接矩形情報信号91を入力して外接矩形の面
積を計算し、前記出現頻度Fijkを前記外接矩形の面
積で正規化して、前記正規化された値Fijkを求め、
前記64次元入力特徴ベクトルFとして信号93を出力
する。3は相違度演算部で、前記入力特徴ベクトルを信
号93、前記標準特徴ベクトルを信号95として入力し
、あらかじめ定められたベクトル演算により、前記入力
特徴ベクトルFと前記標準特徴ベクトル(F(51,と
の相違度D(F、F(Sk)を計算し、相違度信号94
として出力する。4は分類部で、前記相違度信号94を
入力し、順位付等の処理を行ない、分類結果を信号96
として出力する。5は標準特徴ベクトル記憶部で、字種
ごとに前記64次元の標準特徴ベクトルを格納し、前記
相違度演算部3から前記信号95として、前記標準′F
i−徴ベクトルが読み出される。図中、相違度演算部3
、分類部4、標準ベクトル記憶部5は通常の文字認識方
式等で用いられるものであり、前記相違度演算部3は、
加算器、乗算器、比較器、レジスター等で容易に実現で
き、前記分類部4も同様に、比較器、レジスター等で容
易に実現でき、前記標準特徴ベクトル記憶部5は、通常
の記憶素子で容易に実現できる。
第2図(a)は、前記特徴パタン生成部1の構成の一実
施例を示す図である。
11は二値パタン記憶部で、前記二値化された文字パタ
ンを信号90として入力し、格納するもので通常の記憶
素子で容易に実現できるものである。
12は特徴処理領域抽出部で、信号911として前記二
値パタン記憶部11から前記二値化された文字パタンを
読み込み、前記文字パタンの外接矩形を求め、前記外接
矩形の頂点の座標値を信号91として出力する。前記特
徴処理は前記外接矩形の内側で行なわれる。本外接矩形
を求める処理は、文字認識に限らず一般のイメージ処理
で行なわれるものであり、前記特徴処理領域抽出部12
は容易に実現できる。13は輪郭方向コード生成部で、
前記信号911として前記二値化された文字パタンを読
み込み、同時に前記特徴処理領域抽出部12から前記信
号91として前記外接矩形の頂点の座標値を読み込み、
前記外接矩形の内側の各画素に対して、文字パタンの背
景部の点か、輪郭部の点か、内部の点かを検出し、前記
輪郭部の点の場合には、前記輪郭点における仮の傾斜コ
ードを検出し、前記背景部の点の場合には、前言己外接
矩形の座標値から求められる前記4分割部分領域の各座
標を参照し、前記左上部分領域かを識別するコードを定
めて、前記画素の情報とし、前記画素の情報を信号91
31として出力し、次に前記画素の情報の書き込まれた
特徴パタンの画素および隣接する画素を同時に信号91
32として前記文字部の輪郭点においては前記画素と前
記隣接する画素の仮の傾斜コードから、前記輪郭点にお
ける方向コードを決定し、信号9133として出力す−
る。14は特徴パタン記憶部で、各画素は前記背景点、
前記輪郭点、前記内部点等のパタン上の点の識別子、前
記輪郭点に対しては前記仮の傾斜コード、前記方向コー
ド前記背景点に対しては前記部分領域識別子、前記特徴
づけのための交差数等の属性があり、前記パタン上の点
の識別子、前記輪郭点に対する仮の傾斜コードおよび前
記部分領域識別子は前記信号9131として書き込まれ
、前記輪郭点に対する仮の傾斜コードは、前記信号91
32として読み出され、前記方向コードは前記信号91
33として書き込まれ、前記画素全体は信号9141と
して読み出され、信号9142として書き込まれ、すべ
ての特徴づけ処理が行なわれた後には、前記画素全体が
それぞれ信号92として読み出されるものである。15
は交差回数計数部で、前記特徴処理領域抽出部12から
信号91として前記外接矩形の座標値を読み込み、前記
4分割部分領域の座標を求め、前記特徴パタン記憶部1
4がら前記部分領域に応じた走査手順に従って前記特徴
パタンの画素を信号9141として順序読み込み、前記
文字パタンの輪郭点に割当てられた方向コードに応じて
前記背景部の点に前記交差数を信号9142として前記
特徴パタン記憶部14に書き込むものである。
第2図(b)は前記輪郭方向コード生成部13の構成の
一実施例を示すためのブロック図である。130は部分
領域決定部であり、前記信号91として前記外接矩形の
頂点の座標値を読み込み、水平方向並び垂直方向の辺を
それぞれ2等分する点の座標を求め、前記4分割部分領
域を決定し、前記4分割部分領域を定める4個の矩形の
頂点の座標をそれぞれ信号9134として出力するもの
で、容易に実現できる。
131は局所画素処理部で、前記信号911として二値
化された文字パタンの各参照画素と前記参照画素に隣接
する8画素の計9画素を読み込み、前記参照画素が文字
パタンの輪郭点の場合には前記9画素によって前記仮の
傾斜コードを決定し、前記輪郭点を示すコードと、前記
仮の傾斜コードを前記信号9131として前記特徴パタ
ン記憶部14の対応する画素に書き込み、前記参照画素
が文字パタンの内部点の場合には前記内部点を示すコー
ドを前記信号9131として前記特徴パタン記憶部14
の前記対応する画素に書き込み、前記参照画素が前記文
字パタンの外接矩形内の背景点の場合には、前記背景点
を示すコードと、前記背景点が属する前記4分割部分領
域を示すコードとを、前記信号9131として前記特徴
パタン記憶部14の前記対応する画素に書き込むもので
ある。132は輪郭方向決定部であり、前記部分領域決
定部130から信号9134として入力される前記4分
割部分領域の頂点の座標から処理を行なう領域を定め、
前記局所画素処理部131によって定められた前記特徴
パタン記憶部14の画素を信号9132として読み込み
、前記仮の傾斜コードから前記方向コードを決定し信号
9133として前記特徴パタン記憶部の対応する画素に
書き込むものである。第3図(a)は前記参照画素と前
記隣接する8画素の位置関係を示しており、Xが参照画
素、a、 b、 c、 d。
e、f9g、hが隣接する8画素を示している。第3図
(b)は前a己仮の傾斜コードを示す図であり、3桁の
2進数、すなわち3ビツトで表現される。第3図(C)
は前記参照画素が文字パタン上の輪郭点である場合に前
記仮の傾斜コード0,1.・・・、7を割当てる規則を
示す図であるが、図中前記傾斜コードの欄が十になって
いる部分は文字パタンの内部となっているので前記傾斜
コードが割当てられない点、 となっているのは、前記
輪郭点とは見なさずに内部点と同一のコードを割当て、
前記方向コードを割当てる処理の対象外とされる点にな
ることを示す。
第3図(C)の適用の仕方を以下に示す。
前記参照画素Xの値が0、すなわち背景点の場合には、
前記方向コードを割り当てる処理の対象外である。前記
参照画素Xの値が1で、第3図(a)のa、 b、 c
d、e、f5g、hが0.0.0.0.1.1.1.1
の場合には、第3図(c)のa、 b、 c、 dがo
、 o、 o、 oとなっている行と、e、f9g、h
が1、1.1.1となっている列の交差する欄に注目す
ると、3′となっているので、仮の傾斜コードを3とす
る。同様に前記参照画素Xの値が1で、第3図(a)の
a。
b、c、d、e、12g、hが0.1.1.0.1.0
.1.1の場合には、第3図(C)のa、 b、 c、
 dが0.1.1.0となっている行と、e、 f。
g、hが1.0.1.1となっている列の交差する欄に
注目すると、0′となっているので、仮の傾斜コードを
Oとする。このように、参照画素に隣接する8画素の値
から、第3図(e)の規則を適用する。前記局所画素処
理部131は、以上説明したように仮の傾斜コードを割
当てる処理等前記特徴パタン記憶部14の各画素に書き
込みを行なうので、通常の論理回路、順序回路等で容易
に実現できる。
第3図(d)は前記方向コードを示す図であり、4桁の
2進数、すなわち4ビツトで表現される。第3図(e)
〜(1)前記第3図(b)に示す仮の傾斜コードXlX
2X3から前記第3図方向コードYIY2Y3Y4を生
成する規則を示す図で、例えば前記仮の傾斜コードXl
X2X3が000のときには、前記隣接する画素のうち
前記第3図(a)のす9gに対応する画素の前記仮の傾
斜コードを調べ、それぞtlLlll、 111のとき
には方向コードを1110とし、前記す2gに対応する
画素の前記仮の傾斜コードがそれぞれ111.000の
ときには方向コードを1111と決定する規則を示し、
前記第3図(Oの前記画素すとgの9通り以外の組合わ
せのときには方向コードを000とする。
同様に前記仮の傾斜コードXlX2X3が001のとき
には、前記隣接する画素のうち前記第3図(a)の画素
す。
gの組合せまたは、09gの組合せを調べ前記仮の傾斜
コードXlX2X3が010のときには、前記隣接する
画素のc、fの組合せを調べ、前記XlX2X3かつ0
11のときには前記隣接画素のc、dの組合せまたはe
、fの組合せを調べ、前記XlX2X3が100のとき
には前記隣接画素e、dの組合せを調べ、前記XlX2
X3が101のときには前記隣接画素e、aの組合せま
たはd、h(7)組合せを調べ、前記XlX2X3が1
10のときには前記隣接画素り、aの組合せを調べ、前
記XlX2X3が111のときには前記隣接画素す、h
の組合せまたはg、aの組合せを調べ、第3図(e)〜
(1)に示す方向コード決定規則に該当する隣接画素の
組合せがあるときには、前記方向コード決定規則から前
記方向コードYIY2Y3Y4を決定し、前記該当する
組合せがないときにはYIY2Y3Y4:XlX2X3
0 トして前記方向コードYIY2Y3Y4を決定する
。これらの処理は通常の論理回路、順序回路により容易
に実現することができるものであり、従って前記輪郭方
向決定部132は容易に実現することができる。
第4図は前記特徴パタン記憶部14の画素の構成の一実
施例を示すための図である。
1画素あたり8ビツトの情報を有し、図中ビット0は文
字パタンの輪郭を示すビットであり、前記ビット0が1
″のときは輪郭部の画素、前記ビット0が′θ″のとき
は輪郭部でない画素である。前記輪郭部の画素の場合は
、ビット1.2.3の3ビツトが前記仮の傾斜コードX
lX2X3に対応し、ビット4.5.6.7の4ビツト
が前記方向コードYIY2Y3Y4に対応する。
前記輪郭部でない画素の場合は、ビット1は文字部の点
か背景部の点かの識別子で、ビットが′1″の場合には
前記文字内部の点、ビット1が0″の場合には前記背景
部の点としている。前記文字内部の点ではビット2.3
.4.5.6ビツトはDon’t Careである。
前記背景部の点の場合、ビット2,3の2亜ツトは前記
4分割部分領域の識別子、ビット4,5の2ビツトとビ
ット6.7の2ビツトはそれぞれ2方向への交差回数の
計数情報である。前記特徴パタン記憶部14は以上のよ
うなビットごとに属性を持つもので通常の記憶素子を用
いればよい。
第5図(a)、 (b)は前記交差回数計数部15で、
前記各4分割部分領域における交差回数計数のための特
徴づけられた画素を効果的に走査方向を示す図である。
前記交差回数を計数する処理としては、第6図(a)。
(C)に示すようにすべての背景点を出発点として、そ
れぞれ2方向に走査する方法もある。しかし、前記方法
は背景点の画素の特徴づけをわかりやすく説明すること
には向いているが、実際に行なう処理としては、同じ向
きに何度も走査を行なうことになるので効率的ではない
。しかし第5図(a)、(b)のように走査を行なうと
、効率的にすべての背景点の特徴づけが行なえる。
前記4分割部分領域の左上及び左下の部分領域では水平
方向右むきの走査を行ない、右上及び右下の部分領域で
は水平方向左向きの走査を行ない、左上及び右上の部分
領域では垂直方向下向きの走査を行ない、左下及び右下
の部分領域では垂直方向上向きの走査を行ない、0に初
期化された交差数値を背景点の画素に逐次書き込み、文
字パタンの輪郭部と交差し、前記ストロークとの交差条
件を満足した場合には前記交差数値に1を加えたものを
新たに交差数値とし、次に出現する背景部の画素に前記
新たな交差数値を書き込むという処理を繰り返す。上記
の処理順序に従って、左上及び右下の部分領域で右向き
の走査をすべての行で1回行なうと、前記部分領域内の
すべての背景点から左向きに走査したときの交差回数と
同じ値求まる。右向き、下向き、上向きの走査のときも
同様であり、第5図(a)、(b)ように走査を行なう
と、走査回数を重複することなく、すべての背景点の特
徴づけが効率的に行なえる。
以上の処理は、記憶部との間の読み出し、書き込み処理
、比較、加算といった処理から成り立っており、通常の
論理回路、順序回路等で容易に実現できる。
(発明の効果) 以上のよう本発明によれば、文字パタンの外接短形で定
まる領域を4分割した部分領域ごとに特徴を求めること
により、絶対位置情報を反映させることができ、前記部
分領域ごとに走査方向を定めて特徴抽出を行なっている
ので、安定した相対位置情報を反映するベクトルを16
次元という低次元で実現することができたので、文字パ
タン全体を比較的低次元の64次元ベクトルで表わすこ
とができ、この64次元ベクトルで、漢字のような複雑
な溝道を持ち、類似字形のおおい多字種の印刷文字を充
分な性能で分類できる文字分類方式を提供することがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図で、第2図
(a)は特徴パタン生成部の構成の一実施例を示すブロ
ック図で、第2図(b)は輪郭方向コード生成部の構成
の一実施例を示すブロック図である。第3図(d)〜(
1)は輪郭方向コード生成部の原理を説明する図で、第
3図(d)は隣接画素を示すための図、第3図(b)は
仮の傾斜方向を示す図、第3図(C)は仮の傾斜方向を
定める規則を示す図、第3図(d)は方向コードを示す
図、第3図(e)〜(1)は仮の傾斜コードから方向コ
ードを定める規則を示す図である。 第4図は特徴パタン記憶14の画素の構成の一実施例を
示す図、第5図は交差回数を計数するときの各部分領域
ごとの走査方向を示す図である。第6図は本発明の原理
を示すための図である。 図において、1は特徴パタン生成部、2は特徴ベクトル
抽出部、3は相違度演算部、4は分類処理、5は標準特
徴ベクトル記憶部、11は二値パタン記憶部、12は特
徴処理領域抽出部、13は輪郭方向コード生成部、14
は特徴パタン記憶部、15は交差回数計数部、130は
部分領域決定部、131は局所画素処理部、132は輪
郭方向決定部である。

Claims (1)

    【特許請求の範囲】
  1. 文字部と背景部とが、二値から成る量子化信号に変換さ
    れて成る文字パタン上で、背景部の各点より複数方向に
    走査し、交差するストローク数を計数し、特徴付けを行
    なうことによって得られる特徴を用いる文字分類方式に
    おいて、前記文字パタンの外接矩形領域を、水平方向及
    び垂直方向にそれぞれ二等分して4種の小領域を定め、
    前記小領域のうち、左上の小領域では前記背景部の各点
    から上方向及び左方向の2方向へ走査を行ない、右上の
    小領域では前記背景部の各点から上方向及び右方向の2
    方向へ走査を行ない、左下の小領域では前記背景部の各
    点から下方向及び左方向の2方向へ走査を行ない、右下
    の小領域では前記背景部の各点から下方向及び右方向の
    2方向へ走査を行ない、前記上方向及び下方向の走査で
    は水平方向と斜方向のストロークと交差した回数を計数
    し、前記左方向及び右方向の走査では垂直方向と斜方向
    のストロークと交差した回数を計数し、交差回数が0、
    1、2回のときにはそのままの交差回数を、前記交差回
    数が3回以上のときは交差回数を3とし、前記それぞれ
    の4箇所の小領域の背景部の各点に、2方向の交差回数
    の組み合わせて16種類の特徴コードを割りつける特徴
    パタン生成部と、前記4箇所の小領域に於いて、それぞ
    れ16種類の特徴コードの出現頻度を計数して16個の
    要素を求め、この結果全領域で求まる64個の要素を前
    記外接矩形の面積で正規化して得られる64次元ベクト
    ルを入力特徴ベクトルとする特徴ベクトル抽出部と、前
    記入力特徴ベクトルと同じ形式の64次元ベクトルで記
    述されて各字種ごとに用意されている標準特徴ベクトル
    を格納する標準特徴ベクトル記憶部と、前記入力特徴ベ
    クトルと前記各字種ごとの標準特徴ベクトルとを照合し
    、ベクトル計算によって前記入力特徴ベクトルと前記各
    字種ごとの標準特徴ベクトルとの相違度を求める相違度
    演算部と、前記相違度によって各字種の順位付けを行な
    い、詳細識別のための候補字種を定める分類処理部とを
    有し、絶対位置情報と文字パタンの構造情報とを反映し
    た特徴量によって文字認識のための大分類を行なうこと
    を特徴とする文字分類方式。
JP60110287A 1985-05-24 1985-05-24 文字分類方式 Granted JPS6284389A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60110287A JPS6284389A (ja) 1985-05-24 1985-05-24 文字分類方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60110287A JPS6284389A (ja) 1985-05-24 1985-05-24 文字分類方式

Publications (2)

Publication Number Publication Date
JPS6284389A true JPS6284389A (ja) 1987-04-17
JPH0576664B2 JPH0576664B2 (ja) 1993-10-25

Family

ID=14531870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60110287A Granted JPS6284389A (ja) 1985-05-24 1985-05-24 文字分類方式

Country Status (1)

Country Link
JP (1) JPS6284389A (ja)

Also Published As

Publication number Publication date
JPH0576664B2 (ja) 1993-10-25

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
US4903312A (en) Character recognition with variable subdivisions of a character region
US4817187A (en) Apparatus and method for vectorization of incoming scanned image data
US4641355A (en) Pattern recognition apparatus
JPS6284389A (ja) 文字分類方式
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP2001506383A (ja) ピクセルマトリクス上で文字認識を実行する方法
JP4211941B2 (ja) パターン抽出装置
JP2789622B2 (ja) 文字/図形領域判定装置
JP3104355B2 (ja) 特徴抽出装置
JP3196291B2 (ja) 文字認識方法および装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH03268181A (ja) 文書読み取り装置
JPH11120291A (ja) パタン認識システム
JPH03126188A (ja) 文字認識装置
JPH06348891A (ja) 図形混在文書画像の構造解析方法
JP2507949B2 (ja) 文字/図形領域判定装置
JPH04280393A (ja) 文字図形認識装置
Shimotsuji et al. A High Speed Raster-to-Vector Conversion Using Special Hardware for Contour Tracking.
JP2853167B2 (ja) パターン認識用辞書作成装置
JPS5855551B2 (ja) 識別特徴抽出装置
Ozaki Logical Tagging of Document Images by White Space Pattern Matching
JPS61188679A (ja) ストローク近似直線抽出による文字認識装置及び方法
JPH0252313B2 (ja)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term