JPS6284389A

JPS6284389A - 文字分類方式

Info

Publication number: JPS6284389A
Application number: JP60110287A
Authority: JP
Inventors: Atsushi Tsukumo; 津雲　淳
Original assignee: Agency of Industrial Science and Technology
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 1985-05-24
Filing date: 1985-05-24
Publication date: 1987-04-17
Also published as: JPH0576664B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は印刷文字認識、特に、漢字、平仮名、片仮名、
英字、数字等の印刷邦文文字の認識における分類方式に
関する。

（従来技術とその問題点）従来印刷漢字認識では、シングルフォントの場合には、
字種の多さ、字形の複雑さ、類似文字対の多さ等の問題
があり、マルチフォントになるとさらに字体の変化が問
題とされて来た。一般に漢字認識の対象字種は少なくと
も常用漢字約２０００字からＪＩＳ第−水準約３０００
字であり、場合によってはそれ以上の字種の読み取りの
要望もある。そこで字種の多さに対ぐる対策として、比
較的簡単な処理によって１００字種程度に候補を絞る大
分類が、おおくの場合に採用されている。このようにし
て選択された候補字種に対して、字形の複雑さを考慮し
た認識方式を適用し、その結果認識出力が一字種に絞れ
ずに、類似文字対が残ったときには詳細識別処理が行な
われる。このような処理の例では、大分類として複雑指
数、四辺コード法の組み合わせ、認識処理として複合類
似度法、詳細識別処理として混合類似度法が、約２００
０字のシングルフォント印刷漢字認識に適用されたこと
が知られている。（日経エレクトロニクス１９７７．１
０．３１号ｐｐ。

１０２−１２８森健−１坂井邦夫、”２０００字種を１
００字／秒で読む印刷漢字ＯＣＲの開発パ）シかしこの
ような大分類処理では認識対象をマルチフォントにした
ときの分類性能に問題があり、正しい候補字種を後続す
る認識処理に送るために候補字種を多くすると、認識処
理の重荷が増大し、認識性能および処理速度を維持する
ことが難しくなるという問題が生じる。

この例とは別に常用漢字等の約２０００字種のマルチフ
ォント印刷漢字を対象とし、分類処理をより高性能にし
て、形状の類似した文字のある候補だけを詳細識別で処
理し、殆どの文字は分類過程で認識処理してしまう例も
報告されている。（電子通信学会論文誌ＶｏｌＪ６７−
Ｄ、Ｎｏ、８．目黒真−１梅田三千で二値化されたｍＸ
ｎ二次元配列で表わされる文字パタンの外接矩形の水平
方向の辺をＭ分割、垂直方向をＮ分割し、この外接矩形
を、ＭＸＮの矩形部分領域に分割し、各部分領域での黒
点数を計数し、ＭＸＮ次元ベクトルを作り、ベクトル空
間での分類を行なうもので、実験的には、８×８の部分
領域に分割を行なって６４次元ベクトルで分類をすると
きが最も分類性能がよい。もう一つの特＠量は、同じく
二値化された文字パタンの外接矩形の水平方向の辺をＭ
分割、垂直方向の辺をＮ分割し、左側の垂直方向の辺か
らは水平方向右向きに走査し、黒点に初めて到達するま
での白点数と２度目に到達するまでの白点数を計数する
。この２種類の白点数をＮ個の区間でそれぞれ合計する
と、２ＸＮ個の要素が得られる。同様の処理を、右側の
垂直方向の辺からは水平方向左向きに走査して行ない、
上側の水平方向の辺からは垂直方向下向きに走査して行
ない、下側水平方向の辺からは垂直方向上向きに走査し
て行ない、それぞれの辺に対して、２ＸＮ個、２ＸＭ個
、２ＸＭ個の要素が得られる。

い。

前者の特徴ベクトルは文字パタンの文字部の大局的な分
布を示しており、後者の特徴ベクトルは文字パタンの周
辺の形状を反映しており、共に絶対位置に文字パタンの
構造を大局的に反映させた異なった特徴となっている。

しかしこれらの特徴はいずれも大局的な性質を捉えてい
るものなので、認識対象をＪＩＳ第−水準約３０００字
のように拡大し、複雑な構造をした字形の文字が極端に
多くなリ、かつ類似文字対の組み合わせが増加すると、
後続する識別処理に負担が大きくかかり、分類性能の維
持か困難になるという問題点がある。

一方、文字パタンの相対位置の情報を反映させた特徴ベ
クトルによる分類方式もある。

従来、この種の代表的な方式として下記の方式が知られ
ている。すなわち、まず、４辺が認識すべき文字を囲む
ような矩形領域を作り、この領域を縦方向にｍ個、横方
向にｎ個に分割し、ｍＸｎ個の微小領域の集合とする。

この各々の微小領域を前記文字を含む領域内の点と定義
する。このような点は文字を表わす線を含まない背景点
と文字を表わす線を含む文字点との２種類に分けられる
。今、二゛うして定義されたある１つの背景点Ｐをとり
、その点から左右の水平方向および上下の垂直方向に走
査線を出し、それらの走査線が前記文字の線と、それぞ
れ左方に０回、右方にｄ回、上方にａ回、および下方に
ｂ回交差したとする。これを背景点Ｐに付随する１つの
特性を表わす量と考え、すべての背景点には、あるそれ
ぞれのｃ、ｄ、ａおよびｂの値をもつ特性が付随するこ
とになる。

今、仮に文字の線と交差する回数を表わす前記Ｃ５ｄ、
ａ及びｂの値が２又は２以上の場合には、それを２と制
限することにすると許される値は０，１および２の３種
類とする。従って、各点の特性として許される種類の数
は３４＝８１であり、８１種類の各特性について背景点
を集計し、８１次元のベクトルを生成し、このベクトル
を用いて線形識別関数によって文字認識を行なう。

これはグラックスマン（Ｇｌｕｃｋｓｍａｎ）の方法［
エイチ、エイ、グラックスマン：クラシフィケーション
オプミックスドフォントアルファベチックスパイキャラ
クタリスチ゛ツクスロシ、ダイジェストオブファストア
イイーイーイーコンピュータコンファレンス、１３８ペ
ージ、１９６７年参照（Ｈ，Ａ、Ｇｌｕｃｋｓｍａｎ　
：Ｃ１ａｓｓｉｆｉｃａｔｉｏｎ　　ｏｆ　　Ｍｉｘｅ
ｄ　　ｆｏｎｔ　　Ａｌｐｈａｂｅｔｉｃｓ　　ｂｙＣ
ｈａｒａｃｔｅｒｉｓｔｉｃ　Ｌｏｃｉ、Ｄｉｇｅｓｔ
　ｏｆ　Ｆｉｒｓｔ　ＩＥＥＥ　ＣｏｍｐｕｔｅｒＣｏ
ｎｆｅｒｅｎｃｅ、Ｐ、１３８．１９６７）］として知
られているがこれを漢字を含む邦文文字の認識に適用し
ようとすると、次のような問題が生じる。

まず、第１に水平あるいは垂直の走査線が文字と交差回
路を２回を上限としているが、漢字のようにストローク
数が多い文字に対しては少なすぎる。

第２に単に文字部との交差回数を計数するだけでは、文
字の傾きに対して上記ベクトルの要素の値が不安定にな
る。

第３に交差回数の上限を漢字の複数さに合わせ７程度ま
でとった場合には、上記のようなベクトルを作ると、８
４＝４０９６次元という膨大な次元数をもつ空間のベク
トルを処理をする必要が生じ、処理が非常に困難になる
。

上記のような欠点を除去するために交差回数の上限を増
加し、交差回数の計数値を文字の傾きに対して安定に決
定し、さらに処理量を実現可能な量に軽減する文字認識
方式は、既に特開昭５８−７０３８３号公報（特願昭５
６−１６９１５３号明細書文字認識方式）として示され
ている。この認識方式は、相対位置情報だけを扱いなが
ら効果的な分類を行なっているが、印刷文字の分類に用
途を限定すると印刷文字特有の絶対位置情報を導入する
ことにより、さらに効果的な分類が期待できる。

このような一つの試みとしては既に特公昭５８−１６５
０３号公報（文字識別処理方式）がある。ここではｍＸ
ｎの文字パタンを横方向にＭ分割、縦方向にＮ分割して
ＭＸＮの局所領域を定める。この局所領域は、横方向に
ｐ個、縦方向にｑ個から成っており、ｍ　＝ＭＸｐ、ｎ
　＝ＮＸｑという関係がある。前記各局所領域において
、前記局所領域内の各点に割りつけられた上下左右方向
ごとの交差数の合計を求め、上方向の交差数の合計をＡ
、下方向の交差数の合計をＢ、左方向の交差数の合計を
Ｃ７右方向の交差数の合計をＤとしたとき、この（Ａ、
Ｂ、Ｃ，Ｄ）て示される４次元ベクトルを前記局所領域
を代表する特徴ベクトルとしている。前記各局所領域に
ついて、代表する４次元特徴ベクトルを求め、すべての
特徴ベクトル或いは選択された特徴ベクトルを用いてベ
クトル演算で分類を行なっている。この方法は確かに位
置情報が反映されてはいるが、各局所領域内で上下左右
方向ごとの交差数の合計を求め、４次元ベクトルにして
いることにより、局所領域が比較的小さいときには、前
記グラックスマンの方法、或いは前記特開昭５８−７０
３８３号公報の方法の特徴とを小さくすることになる。

すなわち前記ｐ、ｑの値を小さくすることになる。しか
し、前記ｍ、ｎ、Ｍ、Ｎ、ｐ。

ｑの関係から、前言己ｐ、ｑの値を小さくすると、前記
Ｍ、Ｎの値は大きくなり、局所領域の数ＭＸＮが大きく
なる。前記各局所領域は４次元ベクトルで代表されてい
るので、すべての局所領域を用いて文字パタンを代表す
ると４ＸＭＸＮ次元のベクトルとなり、前記局所領域の
数ＭＸＮが増大することは前記文字パタンを代表するベ
クトルの次元が増大することを意味し、これは分類のた
めのベクトル演算での処理の増大を招くことになる。例
えば文字パタンが６４Ｘ６４のパタンであるとき、すな
わちｍ＝ｎ＝６４であるとき、局所領域の大きさを４×
４、すなわちｐ＝ｑ＝４とすると、前記ｍ、ｎ、Ｍ、Ｎ
、ｐ、ｑの関係がらＭ＝＝Ｎ＝１６となり、局所領域の
数は２５６個、すなわちＭＸＮ＝２５６となる。従って
すべての局所領域を用いて前記文字パタンを表わすと４
ＸＭＸＮ＝１０２４次元という膨大な次元数のベクトル
となる。また前記次元数を減らすために局所領域を選択
することにしても、仮に８分の１の３２個を選択しＭ＝
Ｎ＝８となり、文字パタンを代表するベクトルの次元数
は２５６次元（＝４次元Ｘ８Ｘ８）と低くなるが、既に
述べた通り８×８の領域をわずか４次元ベクトルと、前
記入力特徴ベクトルと同じ形式の６４次元ベクトルで記
述されて各字種ごとに用意されているひ標準ベクトルを
格納する標準ベクトル記憶部と、前記入力特徴ベクトル
と前言己各字種ごとの標準ベクトルとを照合し、ベクト
ル計算によって前記入力特徴ベクトルと前記各字種ごと
の標準ベクトルとの相違度を求める相違度演算部と、前
記相違度によって各字種の順位付けを行ない、詳細識別
のための候補字種を定める分類処理部とを有し、絶対位
置情報と文字パタンの構造情報とを反映した特Ｒｉｔに
よって文字認識のための大分類を行なうことを特徴とす
る文字分類方式を実現することができる。

（発明の作用原理）以下図面を用いて本発明の原理について詳細に説明する
。第６図は本発明の詳細な説明するための図である。第
６図（ａ）において、Ａ、Ｂ、Ｃ，Ｄは、二値化された
文字パタンの外接矩形上のそれぞれの辺を２等分する点
であり、Ｅ、Ｆ、Ｇ、Ｈはそれぞれ前記外接記背景部の
各点から上方向及び左方向の２方向へ走査を行ない、右
上の小領域では前記背景部の各点から上方向及び右方向
の２方向へ走査を行ない、左下の小領域では前記背景部
の各点がら下方向及び左方向の２方向へ走査を行ない、
右下の小領域では前記背景部の各点から下方向及び右方
向の２方向へ走査を行ない、前記上方向及び下方向の走
査では水平方向と斜方向のストロークと交差した回数を
計数し、前記左方向及び右方向の走査では垂直方向と斜
方向のストロークと交差した回数を計数し、交差回数が
０．１．２回のときにはそのままの交差回数を、前記交
差回数が３回以上のときは交差回数を３とし、前記それ
ぞれの４筒所の小領域の背景部の各点に、２方向の交差
回数の組み合わせて１６種類の特徴コードを割りつける
特徴パタン生成部と、前記４箇所の小領域に於いて、そ
れぞれ１６種類の特徴コードの出現頻度を計数して１６
個の要素を求め、この結果全領域で求まる６４個の要素
を前記外接矩形の面積で正規化して得られる６４次元ベ
クトルを入力特徴ベクトルとする特徴ベクトル抽出部で
代表するということで分類能力に問題が生じる。

（発明の目的）本発明の目的は字種の増加に伴ない、複雑な構造をした
文字が極端に多くなり、かつ類似文字の組合わせが増加
しても充分に印刷文字の分類性能を維持するために、相
対位置情報と絶対位置情報とを反映する安定した特徴を
、６４次元ベクトルという非常に低い次元のベクトルで
実現することにより、処理量の増大をも防止することの
できる文字分類方式を提供するものである。

（発明の構成）本発明によれば、文字部と背景部とが、二値から成る量
子化信号に変換されて成る文字パタン上で、背景部の各
点より複数方向に走査し、交差するストローク数を計数
し、特徴付けを行なうことによって得られる特徴を用い
る文字分類方式に於いて、前記文字パタンの外接矩形領
域を、水平方向及び垂直方向にそれぞれ二等分して４種
の小領域を定め、前記小領域のうち、左上の小領域では
前左上部分領域、右上部分領域、左下部分領域、右下部
分領域に属する文字の背景部の点である。この背景部の
点から、従来技術の上、下、左、右へと４つの方向に走
査するのと異りその点の属する部分領域によって指定さ
れる２つの方向のみに走査が行なわれる。すなわち、前
記左上部分領域の背景部のすべての点からは、上向き及
び左向きに走査を行ない、前記右上部分領域の背景部の
すべての点からは上向き及び右向きに走査を行ない、前
記左下部分領域の背景部のすべての点からは下向き及び
左向きに走査を行ない、前記右下部分領域の背景部のす
べての点からは下向き及び右向きに走査を行ない、走査
方向と、交差した文字パタンの輪郭部の接線方向とが、
定められた閾値以上の角度で交差していれば、交差回数
を計数することにより、各背景部の点を特徴づける。第
６図（ｂ）は前記背景点Ｅ、Ｆ、Ｇ、Ｈの特徴表現を示
しており、前記背景点Ｅは上に２回、左に１回交差し、
前記背景点Ｆは上に１同右に０回交差し、前記背景点Ｇ
は下に２回、左に１回交差し、前記背景点Ｈは下に１回
、右に２回交差している。第６図（ｃ）、（ｄ）は、走
査線が文字ストロークと交差したときに、前記文字前記
パタンの輪郭部の接線の方向を考慮して交差回数を計数
することの効果を表わす図である。第６図（Ｃ）におい
ては第６回（ａ）と同じ文字パタンか傾いて入力された
ことを示しており、Ａ’　、Ｂ’　、Ｃ’　、Ｄ’　は
外接矩形の各辺を二等分する点、Ｅ’　、Ｆ’　、Ｇ’
　、Ｈ’　はそれぞれ背景部の点である。前記背景点Ｅ
′から左向きに走査したとき文字部と１回交差するが走
査方向と輪郭部の接線方向のなす角度が小さいので計数
しない。同じく前記背景点Ｅ′から上向きに走査したと
き文字部と２回交差するが、１回は走査方向と輪郭部の
接線方向のなす角度が小さいので、特徴づけるときの交
差回数は１とする。前記他の背景点Ｆｌ　、Ｇ’。

Ｈ′　についても同様であり、前記各背景点Ｅｔ　、Ｆ
ｒ。

Ｇ’　、Ｈ’　の′ｖｆ徴づけられた結果を第６図（ｄ
）に示す。

この例で示すように交差回数を計数するときに文字パタ
ンの輪郭の接線方向と走査方向のなす角度を考慮するこ
とにより、文字パタンの傾きを吸収する効果が得られる
。印刷文字認識に置いては、文字パタンか傾いて入力さ
れることは頻繁に起こるので、文字パタンの傾きが吸収
できるか否かは、認識能力に大きく影響する。

交差回数には、最大３の上限を設定する。すなわち走査
して４回以上の交差をしても交差回数を３回とする。こ
れは交差回数をコード化するときに２ビツトを割当てれ
ばよいことを意味する。その理由は文字パタンを前記４
箇所の部分領域に分割したときに、４回以上の交差が起
こりうる場合は非常に稀であるので、交差回数に上限を
設けて特徴づけを行なっても、分類のための特徴として
はその性能を劣化させるものではないからである。この
ように前記各部分領域において、各背景点は、垂直、水
平の２方向の交差回数で特徴づけられ、１方向の特徴に
２ビツトが必要なので、２方向のｖｆ薇には４ビツトが
必要となり、２方向で特徴づけられる各背景点は４ビツ
トが割当てられることになる。

従って前記各部分領域において、前記各背景点に１６種
類の特徴のいずれかが割当てられることになり、前記そ
れぞれの１６種類の特徴を属する４つの部骨領域で特徴
づけすると、前記文字パタンの全領域の背景点に６４種
の特徴のいずれかが割当てられる。ここで交差回数を２
回以下に限定すると、１方向の交差回数が０．１．２の
３通りであるので２方向で特徴づけられる背景点に割当
てられる特徴は９（＝３×３）種類となり、前記全領域
の背景点には３６（＝９×４）種の特徴のいずれかが割
当てられる。これは交差回数を最大３回とした場合に比
べ、特徴の数は半分以下にもなっていないが、分類対象
を形状の複雑な漢字としたときには、あまりに粗い特徴
である。従って本方式のように４箇所の部分領域を設定
する場合には、分類能力、処理量を考えて、交差数を最
大３回と定めるのが最もよい効果が得られる。

さて、前記処理を次のように定式化する。前記部分領域
を示すコードをｉとし、左上の前記部分領域を示すとき
ｉ＝０、右上の前期部分領域を示すときｉ＝１、左下の
前記部分領域を示すときｉ＝２、右下の前記部分領域を
示すときｉ＝３とする。次に前記各部分領域における２
方向の交差回数を示すコードをｊ。

ｋとする。例えば、ｉ＝０のとき、ｊは上方向の交差回
数でｋは左方向の交差回数、ｉ＝１のとき、ｊは上方向
の交差回数でｋは右方向の交差回数、ｉ＝２のとき、ｊ
は下方向の交差回数、ｋは左方向の交差回数、ｉ＝３の
とき、ｊは下方向の交差回数、ｋは右方向の交差回数を
示すことにする。前記コードｉｊ、ｋを用いて前記各背
景点に割当てられる特徴をｆｉｊｋと表わすと、前記第
６図（ａ）の前記背景点Ｅに割当てられる特徴はｆ０２
１、前記背景点Ｆに割当てられる特徴はｆｌｌｏ、前記
背景点Ｇに割当てられる特徴はｆ２２１、前記背景点Ｈ
に割当てられる特徴はｆ３１２となる。これまでの説明
で前記コードｉｊ、には０，１，２．３の４種類の値を
とるので、特徴ｆｉｊｋは６４種類である。

一つの文字パタンの各背景点に前記特徴付けを行なった
とき、前記特徴ｆｉｊｋの割当てられた背景点の数をＦ
ｉｊｋとし、前記特徴点数Ｆｉｊｋを外接矩形の面積で
正規化した値をＦｉｊｋとする。前記正規化された値Ｆ
ｉｊｋを要素とする６４次元ベクトルを、前記文字パタ
ンの特徴ベクトルとする。分類処理は次のように行なう
。前記６４次元の特徴ベクトルを字種ごとに用意し、こ
れを標準ベクトルＦ（ｓ）ｚとする。は字種を表わすコ
ードである。入力文字パタンから得られる前記６４次元
の特徴ベクトルを入力ベクトルＦとすると、前記入力ベ
クトルＦと前記各々の標準ベクトルＦ（ＩＩ）己のベク
トル演算で定義される相違度をＤ（［Ｆ、Ｆ（Ｓ−）と
し、前記相違度の値が小さい順に順位付けを行ない、分
類処理を行なう。この場合の相違度は、ユークリッド距
離、シティブロック距離等のベクトル距離等を採用して
、通常の文字認識で行なわれている処理を実行すればよ
い。

（実施例）第１図は本発明の構成を示すブロック図である。

１は特徴パタン生成部であり、二値化された文字パタン
を信号９０として入力し、前記４種の部分領域の前記各
背景点に前記特徴づけを行ない、前記文字パタンの外接
矩形情報を信号９１、前記部分領域ごとの特徴づけされ
た特徴パタンを信号９２として出力する。２は特徴ベク
トル抽出部で、前記特徴パタン信号９２を入力して前記
特徴ｆｉｊｋごとに割当てられた前記文字パタンの背景
部の点の数を計数し、前記出現頻度Ｆｉｊｋを求め、同
時に前記外接矩形情報信号９１を入力して外接矩形の面
積を計算し、前記出現頻度Ｆｉｊｋを前記外接矩形の面
積で正規化して、前記正規化された値Ｆｉｊｋを求め、
前記６４次元入力特徴ベクトルＦとして信号９３を出力
する。３は相違度演算部で、前記入力特徴ベクトルを信
号９３、前記標準特徴ベクトルを信号９５として入力し
、あらかじめ定められたベクトル演算により、前記入力
特徴ベクトルＦと前記標準特徴ベクトル（Ｆ（５１，と
の相違度Ｄ（Ｆ、Ｆ（Ｓｋ）を計算し、相違度信号９４
として出力する。４は分類部で、前記相違度信号９４を
入力し、順位付等の処理を行ない、分類結果を信号９６
として出力する。５は標準特徴ベクトル記憶部で、字種
ごとに前記６４次元の標準特徴ベクトルを格納し、前記
相違度演算部３から前記信号９５として、前記標準′Ｆ
ｉ−徴ベクトルが読み出される。図中、相違度演算部３
、分類部４、標準ベクトル記憶部５は通常の文字認識方
式等で用いられるものであり、前記相違度演算部３は、
加算器、乗算器、比較器、レジスター等で容易に実現で
き、前記分類部４も同様に、比較器、レジスター等で容
易に実現でき、前記標準特徴ベクトル記憶部５は、通常
の記憶素子で容易に実現できる。

第２図（ａ）は、前記特徴パタン生成部１の構成の一実
施例を示す図である。

１１は二値パタン記憶部で、前記二値化された文字パタ
ンを信号９０として入力し、格納するもので通常の記憶
素子で容易に実現できるものである。

１２は特徴処理領域抽出部で、信号９１１として前記二
値パタン記憶部１１から前記二値化された文字パタンを
読み込み、前記文字パタンの外接矩形を求め、前記外接
矩形の頂点の座標値を信号９１として出力する。前記特
徴処理は前記外接矩形の内側で行なわれる。本外接矩形
を求める処理は、文字認識に限らず一般のイメージ処理
で行なわれるものであり、前記特徴処理領域抽出部１２
は容易に実現できる。１３は輪郭方向コード生成部で、
前記信号９１１として前記二値化された文字パタンを読
み込み、同時に前記特徴処理領域抽出部１２から前記信
号９１として前記外接矩形の頂点の座標値を読み込み、
前記外接矩形の内側の各画素に対して、文字パタンの背
景部の点か、輪郭部の点か、内部の点かを検出し、前記
輪郭部の点の場合には、前記輪郭点における仮の傾斜コ
ードを検出し、前記背景部の点の場合には、前言己外接
矩形の座標値から求められる前記４分割部分領域の各座
標を参照し、前記左上部分領域かを識別するコードを定
めて、前記画素の情報とし、前記画素の情報を信号９１
３１として出力し、次に前記画素の情報の書き込まれた
特徴パタンの画素および隣接する画素を同時に信号９１
３２として前記文字部の輪郭点においては前記画素と前
記隣接する画素の仮の傾斜コードから、前記輪郭点にお
ける方向コードを決定し、信号９１３３として出力す−
る。１４は特徴パタン記憶部で、各画素は前記背景点、
前記輪郭点、前記内部点等のパタン上の点の識別子、前
記輪郭点に対しては前記仮の傾斜コード、前記方向コー
ド前記背景点に対しては前記部分領域識別子、前記特徴
づけのための交差数等の属性があり、前記パタン上の点
の識別子、前記輪郭点に対する仮の傾斜コードおよび前
記部分領域識別子は前記信号９１３１として書き込まれ
、前記輪郭点に対する仮の傾斜コードは、前記信号９１
３２として読み出され、前記方向コードは前記信号９１
３３として書き込まれ、前記画素全体は信号９１４１と
して読み出され、信号９１４２として書き込まれ、すべ
ての特徴づけ処理が行なわれた後には、前記画素全体が
それぞれ信号９２として読み出されるものである。１５
は交差回数計数部で、前記特徴処理領域抽出部１２から
信号９１として前記外接矩形の座標値を読み込み、前記
４分割部分領域の座標を求め、前記特徴パタン記憶部１
４がら前記部分領域に応じた走査手順に従って前記特徴
パタンの画素を信号９１４１として順序読み込み、前記
文字パタンの輪郭点に割当てられた方向コードに応じて
前記背景部の点に前記交差数を信号９１４２として前記
特徴パタン記憶部１４に書き込むものである。

第２図（ｂ）は前記輪郭方向コード生成部１３の構成の
一実施例を示すためのブロック図である。１３０は部分
領域決定部であり、前記信号９１として前記外接矩形の
頂点の座標値を読み込み、水平方向並び垂直方向の辺を
それぞれ２等分する点の座標を求め、前記４分割部分領
域を決定し、前記４分割部分領域を定める４個の矩形の
頂点の座標をそれぞれ信号９１３４として出力するもの
で、容易に実現できる。

１３１は局所画素処理部で、前記信号９１１として二値
化された文字パタンの各参照画素と前記参照画素に隣接
する８画素の計９画素を読み込み、前記参照画素が文字
パタンの輪郭点の場合には前記９画素によって前記仮の
傾斜コードを決定し、前記輪郭点を示すコードと、前記
仮の傾斜コードを前記信号９１３１として前記特徴パタ
ン記憶部１４の対応する画素に書き込み、前記参照画素
が文字パタンの内部点の場合には前記内部点を示すコー
ドを前記信号９１３１として前記特徴パタン記憶部１４
の前記対応する画素に書き込み、前記参照画素が前記文
字パタンの外接矩形内の背景点の場合には、前記背景点
を示すコードと、前記背景点が属する前記４分割部分領
域を示すコードとを、前記信号９１３１として前記特徴
パタン記憶部１４の前記対応する画素に書き込むもので
ある。１３２は輪郭方向決定部であり、前記部分領域決
定部１３０から信号９１３４として入力される前記４分
割部分領域の頂点の座標から処理を行なう領域を定め、
前記局所画素処理部１３１によって定められた前記特徴
パタン記憶部１４の画素を信号９１３２として読み込み
、前記仮の傾斜コードから前記方向コードを決定し信号
９１３３として前記特徴パタン記憶部の対応する画素に
書き込むものである。第３図（ａ）は前記参照画素と前
記隣接する８画素の位置関係を示しており、Ｘが参照画
素、ａ、　ｂ、　ｃ、　ｄ。

ｅ、ｆ９ｇ、ｈが隣接する８画素を示している。第３図
（ｂ）は前ａ己仮の傾斜コードを示す図であり、３桁の
２進数、すなわち３ビツトで表現される。第３図（Ｃ）
は前記参照画素が文字パタン上の輪郭点である場合に前
記仮の傾斜コード０，１．・・・、７を割当てる規則を
示す図であるが、図中前記傾斜コードの欄が十になって
いる部分は文字パタンの内部となっているので前記傾斜
コードが割当てられない点、　となっているのは、前記
輪郭点とは見なさずに内部点と同一のコードを割当て、
前記方向コードを割当てる処理の対象外とされる点にな
ることを示す。

第３図（Ｃ）の適用の仕方を以下に示す。

前記参照画素Ｘの値が０、すなわち背景点の場合には、
前記方向コードを割り当てる処理の対象外である。前記
参照画素Ｘの値が１で、第３図（ａ）のａ、　ｂ、　ｃ
。

ｄ、ｅ、ｆ５ｇ、ｈが０．０．０．０．１．１．１．１
の場合には、第３図（ｃ）のａ、　ｂ、　ｃ、　ｄがｏ
、　ｏ、　ｏ、　ｏとなっている行と、ｅ、ｆ９ｇ、ｈ
が１、１．１．１となっている列の交差する欄に注目す
ると、３′となっているので、仮の傾斜コードを３とす
る。同様に前記参照画素Ｘの値が１で、第３図（ａ）の
ａ。

ｂ、ｃ、ｄ、ｅ、１２ｇ、ｈが０．１．１．０．１．０
．１．１の場合には、第３図（Ｃ）のａ、　ｂ、　ｃ、
　ｄが０．１．１．０となっている行と、ｅ、　ｆ。

ｇ、ｈが１．０．１．１となっている列の交差する欄に
注目すると、０′となっているので、仮の傾斜コードを
Ｏとする。このように、参照画素に隣接する８画素の値
から、第３図（ｅ）の規則を適用する。前記局所画素処
理部１３１は、以上説明したように仮の傾斜コードを割
当てる処理等前記特徴パタン記憶部１４の各画素に書き
込みを行なうので、通常の論理回路、順序回路等で容易
に実現できる。

第３図（ｄ）は前記方向コードを示す図であり、４桁の
２進数、すなわち４ビツトで表現される。第３図（ｅ）
〜（１）前記第３図（ｂ）に示す仮の傾斜コードＸｌＸ
２Ｘ３から前記第３図方向コードＹＩＹ２Ｙ３Ｙ４を生
成する規則を示す図で、例えば前記仮の傾斜コードＸｌ
Ｘ２Ｘ３が０００のときには、前記隣接する画素のうち
前記第３図（ａ）のす９ｇに対応する画素の前記仮の傾
斜コードを調べ、それぞｔｌＬｌｌｌ、　１１１のとき
には方向コードを１１１０とし、前記す２ｇに対応する
画素の前記仮の傾斜コードがそれぞれ１１１．０００の
ときには方向コードを１１１１と決定する規則を示し、
前記第３図（Ｏの前記画素すとｇの９通り以外の組合わ
せのときには方向コードを０００とする。

同様に前記仮の傾斜コードＸｌＸ２Ｘ３が００１のとき
には、前記隣接する画素のうち前記第３図（ａ）の画素
す。

ｇの組合せまたは、０９ｇの組合せを調べ前記仮の傾斜
コードＸｌＸ２Ｘ３が０１０のときには、前記隣接する
画素のｃ、ｆの組合せを調べ、前記ＸｌＸ２Ｘ３かつ０
１１のときには前記隣接画素のｃ、ｄの組合せまたはｅ
、ｆの組合せを調べ、前記ＸｌＸ２Ｘ３が１００のとき
には前記隣接画素ｅ、ｄの組合せを調べ、前記ＸｌＸ２
Ｘ３が１０１のときには前記隣接画素ｅ、ａの組合せま
たはｄ、ｈ（７）組合せを調べ、前記ＸｌＸ２Ｘ３が１
１０のときには前記隣接画素り、ａの組合せを調べ、前
記ＸｌＸ２Ｘ３が１１１のときには前記隣接画素す、ｈ
の組合せまたはｇ、ａの組合せを調べ、第３図（ｅ）〜
（１）に示す方向コード決定規則に該当する隣接画素の
組合せがあるときには、前記方向コード決定規則から前
記方向コードＹＩＹ２Ｙ３Ｙ４を決定し、前記該当する
組合せがないときにはＹＩＹ２Ｙ３Ｙ４：ＸｌＸ２Ｘ３
０　トして前記方向コードＹＩＹ２Ｙ３Ｙ４を決定する
。これらの処理は通常の論理回路、順序回路により容易
に実現することができるものであり、従って前記輪郭方
向決定部１３２は容易に実現することができる。

第４図は前記特徴パタン記憶部１４の画素の構成の一実
施例を示すための図である。

１画素あたり８ビツトの情報を有し、図中ビット０は文
字パタンの輪郭を示すビットであり、前記ビット０が１
″のときは輪郭部の画素、前記ビット０が′θ″のとき
は輪郭部でない画素である。前記輪郭部の画素の場合は
、ビット１．２．３の３ビツトが前記仮の傾斜コードＸ
ｌＸ２Ｘ３に対応し、ビット４．５．６．７の４ビツト
が前記方向コードＹＩＹ２Ｙ３Ｙ４に対応する。

前記輪郭部でない画素の場合は、ビット１は文字部の点
か背景部の点かの識別子で、ビットが′１″の場合には
前記文字内部の点、ビット１が０″の場合には前記背景
部の点としている。前記文字内部の点ではビット２．３
．４．５．６ビツトはＤｏｎ’ｔ　Ｃａｒｅである。

前記背景部の点の場合、ビット２，３の２亜ツトは前記
４分割部分領域の識別子、ビット４，５の２ビツトとビ
ット６．７の２ビツトはそれぞれ２方向への交差回数の
計数情報である。前記特徴パタン記憶部１４は以上のよ
うなビットごとに属性を持つもので通常の記憶素子を用
いればよい。

第５図（ａ）、　（ｂ）は前記交差回数計数部１５で、
前記各４分割部分領域における交差回数計数のための特
徴づけられた画素を効果的に走査方向を示す図である。

前記交差回数を計数する処理としては、第６図（ａ）。

（Ｃ）に示すようにすべての背景点を出発点として、そ
れぞれ２方向に走査する方法もある。しかし、前記方法
は背景点の画素の特徴づけをわかりやすく説明すること
には向いているが、実際に行なう処理としては、同じ向
きに何度も走査を行なうことになるので効率的ではない
。しかし第５図（ａ）、（ｂ）のように走査を行なうと
、効率的にすべての背景点の特徴づけが行なえる。

前記４分割部分領域の左上及び左下の部分領域では水平
方向右むきの走査を行ない、右上及び右下の部分領域で
は水平方向左向きの走査を行ない、左上及び右上の部分
領域では垂直方向下向きの走査を行ない、左下及び右下
の部分領域では垂直方向上向きの走査を行ない、０に初
期化された交差数値を背景点の画素に逐次書き込み、文
字パタンの輪郭部と交差し、前記ストロークとの交差条
件を満足した場合には前記交差数値に１を加えたものを
新たに交差数値とし、次に出現する背景部の画素に前記
新たな交差数値を書き込むという処理を繰り返す。上記
の処理順序に従って、左上及び右下の部分領域で右向き
の走査をすべての行で１回行なうと、前記部分領域内の
すべての背景点から左向きに走査したときの交差回数と
同じ値求まる。右向き、下向き、上向きの走査のときも
同様であり、第５図（ａ）、（ｂ）ように走査を行なう
と、走査回数を重複することなく、すべての背景点の特
徴づけが効率的に行なえる。

以上の処理は、記憶部との間の読み出し、書き込み処理
、比較、加算といった処理から成り立っており、通常の
論理回路、順序回路等で容易に実現できる。

（発明の効果）以上のよう本発明によれば、文字パタンの外接短形で定
まる領域を４分割した部分領域ごとに特徴を求めること
により、絶対位置情報を反映させることができ、前記部
分領域ごとに走査方向を定めて特徴抽出を行なっている
ので、安定した相対位置情報を反映するベクトルを１６
次元という低次元で実現することができたので、文字パ
タン全体を比較的低次元の６４次元ベクトルで表わすこ
とができ、この６４次元ベクトルで、漢字のような複雑
な溝道を持ち、類似字形のおおい多字種の印刷文字を充
分な性能で分類できる文字分類方式を提供することがで
きる。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図で、第２図
（ａ）は特徴パタン生成部の構成の一実施例を示すブロ
ック図で、第２図（ｂ）は輪郭方向コード生成部の構成
の一実施例を示すブロック図である。第３図（ｄ）〜（
１）は輪郭方向コード生成部の原理を説明する図で、第
３図（ｄ）は隣接画素を示すための図、第３図（ｂ）は
仮の傾斜方向を示す図、第３図（Ｃ）は仮の傾斜方向を
定める規則を示す図、第３図（ｄ）は方向コードを示す
図、第３図（ｅ）〜（１）は仮の傾斜コードから方向コ
ードを定める規則を示す図である。第４図は特徴パタン記憶１４の画素の構成の一実施例を
示す図、第５図は交差回数を計数するときの各部分領域
ごとの走査方向を示す図である。第６図は本発明の原理
を示すための図である。図において、１は特徴パタン生成部、２は特徴ベクトル
抽出部、３は相違度演算部、４は分類処理、５は標準特
徴ベクトル記憶部、１１は二値パタン記憶部、１２は特
徴処理領域抽出部、１３は輪郭方向コード生成部、１４
は特徴パタン記憶部、１５は交差回数計数部、１３０は
部分領域決定部、１３１は局所画素処理部、１３２は輪
郭方向決定部である。

Claims

【特許請求の範囲】

文字部と背景部とが、二値から成る量子化信号に変換さ
れて成る文字パタン上で、背景部の各点より複数方向に
走査し、交差するストローク数を計数し、特徴付けを行
なうことによって得られる特徴を用いる文字分類方式に
おいて、前記文字パタンの外接矩形領域を、水平方向及
び垂直方向にそれぞれ二等分して４種の小領域を定め、
前記小領域のうち、左上の小領域では前記背景部の各点
から上方向及び左方向の２方向へ走査を行ない、右上の
小領域では前記背景部の各点から上方向及び右方向の２
方向へ走査を行ない、左下の小領域では前記背景部の各
点から下方向及び左方向の２方向へ走査を行ない、右下
の小領域では前記背景部の各点から下方向及び右方向の
２方向へ走査を行ない、前記上方向及び下方向の走査で
は水平方向と斜方向のストロークと交差した回数を計数
し、前記左方向及び右方向の走査では垂直方向と斜方向
のストロークと交差した回数を計数し、交差回数が０、
１、２回のときにはそのままの交差回数を、前記交差回
数が３回以上のときは交差回数を３とし、前記それぞれ
の４箇所の小領域の背景部の各点に、２方向の交差回数
の組み合わせて１６種類の特徴コードを割りつける特徴
パタン生成部と、前記４箇所の小領域に於いて、それぞ
れ１６種類の特徴コードの出現頻度を計数して１６個の
要素を求め、この結果全領域で求まる６４個の要素を前
記外接矩形の面積で正規化して得られる６４次元ベクト
ルを入力特徴ベクトルとする特徴ベクトル抽出部と、前
記入力特徴ベクトルと同じ形式の６４次元ベクトルで記
述されて各字種ごとに用意されている標準特徴ベクトル
を格納する標準特徴ベクトル記憶部と、前記入力特徴ベ
クトルと前記各字種ごとの標準特徴ベクトルとを照合し
、ベクトル計算によって前記入力特徴ベクトルと前記各
字種ごとの標準特徴ベクトルとの相違度を求める相違度
演算部と、前記相違度によって各字種の順位付けを行な
い、詳細識別のための候補字種を定める分類処理部とを
有し、絶対位置情報と文字パタンの構造情報とを反映し
た特徴量によって文字認識のための大分類を行なうこと
を特徴とする文字分類方式。