JPS603077A

JPS603077A - 傾斜抽出方式

Info

Publication number: JPS603077A
Application number: JP58110209A
Authority: JP
Inventors: Yoshiyuki Yamashita; 山下　義征; Koichi Higuchi; 浩一樋口
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1983-06-21
Filing date: 1983-06-21
Publication date: 1985-01-09
Also published as: JPH0420227B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（技術分野）本発明に、高速で安定な傾ｊ」抽出方式に関するもので
ある。

（背景技術）従来、文字認識装置においては、第１図の例の様々手書
文字の死者の違いによる文字線の傾斜、又印字文字の印
字の傾斜に起因する文字線の傾余１宿に起因する抽出し
た特徴のばらつきを吸収するために、辞層マスクの複数
化の手段によシ前記特徴のほらつきを吸収していた。し
かしなから、この手段は識別を行なう際の抽出したη句
、徴と界層との照合の時間が辞層マスクの数に比例して
増大し、装置の処理速度の低下を招いていた。この欠点
を除去する為に、各方向の文字線傾斜を抽出して使用す
る辞書マスクを選択することにより処理速度を向上させ
る方法があるが、従来の傾斜抽出方式Ｃ１各方向につい
て、当該方向の各ストロークの傾斜の単純平均により算
出しているので、傾斜の傾向が不安定な短かいストロー
クの影響により、抽出する＃ｉ斜が不安定とｆＪ：Ｉ）
ひいては認識性能の低下を招いてい／こ。

（発明の目的）本発明は、このような欠点全除去する為に、文字パター
ンより抽出したストローク成分の傾斜の、各ストローク
成分の長さを重みとする加重平均を算出することにより
、安定な文字線の傾斜を算出することを特徴とし、その
目的は高速で安定な傾斜抽出方式を提供することにある
。

（発明の構成及び作用）第２図は、本発明の文字認識装置における一実施例の構
成図を示す。同図において、文字の光信号は光信号人力
１よシ光電変換部２において２値の量子化されたディジ
タル電気信号に変換され、パターンレジスタ３に格納さ
れる。それと同時に線幅計算部４において人カパターン
の線幅（Ｗ）か言１算される。サブパターン抽出部５は
、パター７レジスタ３について垂直スキャンを全面に行
なって黒点（文字線部全黒点とする）の連続する長さと
、線幅計算部４において計算された線幅との関係よシ、
垂直サブパタ〜７（ＶＳＰ）−ｉ抽出する。

同様に、水平スキャンにより水平サブパター７（１−１
Ｓ　Ｐ　）　２、右斜め４５°スキヤンにより右斜めサ
ブパター７（ＲＳ　Ｐ　）−ｑ、左斜め４５°スキヤ／
により左斜めザブパターン（ＬＳＰ）４抽出する。第３
図は原パターンと各ザブパターンの例で、（ａ）は原パ
ターン、（１））は垂直ザブパターン（ｖｓｐ）、（Ｃ
）は水平サブパターン（ＩＩＳＰ）、（ｄ）　ｆｉ右斜
めザブパターン（１もＳＰ）、（ｃ）ｑｘ左斜めサブパ
ター７（ＬＳＰ）　である。

ストローク抽出部６は各サブパターンレジスタにおける
水平又は垂直スキャンを全面に行ない、白点から黒点、
黒点から白点への変化点を検出し、１列（又は行）前の
スキャノにおけ為変化点個数と変化点座標と現列（又は
行）の変化点個数と変化点座標の関係よりストロークを
抽出し、抽出した各ザブパター７レジスタ内のストロー
クの両端点のパターンレジスタ３で定義される２次元座
標系における座標（パターンレジスタの左下を原点とす
る）を傾胴］１旧Ｂ部７へ送出する。傾斜抽出部７はス
トローり抽出都６において抽出した各サブパター７レジ
スタ内のストロークの両端点座標を参照し、各ザブパタ
ーンごとに平均傾斜を言１算する。即ち、水平サブパタ
ーンより抽出したストロークの両端点座標ｆ　（ＨＸＳ
ｎ、　、　ＨＹＳ　ｒｌ）　、　（１−ＩＸＥｎ。

ＨＹＥｎ）、但しｎ−１１−−＋　Ｐ　、　Ｐｔａ、ス
トローク数として（１）式によ逆傾斜ＱＨを計算する（
但し１−ＩＸＥｐ　’）　ｆ（ＸＳ　ｐ　）。

（１）式中のｆ−ＩＬ　Ｇ　ｐは当該ストロークの長さ
を表わし、（２）式の近似式によりめる。

１−（ＬＧｐ　＝ＭＡＸ　（１ｌ−ＩＸＥｐ　−ＨＸ５
　ｐ　１．１１−１．ＹＥｐ　−１−ＩＹＳ　ｐ　Ｉ）
（２）式は２点間の距離を、２点間の水平及び垂直座標
差の内で、小さい方の１／２と他の一方との和とする近
似式である。同様にｖＶｌθＲ、０ｔ、　ｆｆ１（３）
〜（５）式ニヨり計算ｔ−ル。但シ、ＶＹＥｑ　）　Ｖ
ＹＳ　ｑ　。

ＲＸＥ　ｔ　）　ＲＸＳ　ｔ　、　ＬＸＥ　ｋ　）　Ｌ
Ｘ８　ｋとする。

ΣＶＬＧｑ ■ なお、上記式中Ｑ、Ｌ、１ぐはそれぞれ垂直サブパター
ン、右斜めザブパターン、左斜めサブ／くターンよシ抽
出したストローク数である。またストローク数がＯのと
きは傾斜もΩとする。ま７ｊストロ−クツ長すＶＬＧｑ
　、　ｉもＬＧｔ　、　ＬＬＧｋｔｒＬ（２）式と同様
な計算により算出迂る。。

傾斜抽出部７は、上記式（１）〜（５）よシ計算した各
ザブパター７の傾斜を辞書選択部８へ送出する。、文字
枠検出部９はパターンレジスタ３内の文字パターンに外
接する文字枠を検出し、その結果を文字枠分割決定部１
０−＼送る。

文字枠分割決定部１０は、検出され／こ文字枠内をＭＸ
Ｎ（７）領域（Ｍ、ＮｔｒＪ、整数、本実施例では■＼
４−Ｎ−５）に分割するためのＸｊｌ！ｌｌ＋、　’Ｙ
輔上の分割点座標を決定する。ここでＸ軸は文字枠の水
平方向奮、Ｙ軸は垂直方向をそれぞれ示す。

特徴マトリクス抽出部１１は、文字枠分割決定部１０に
より決定された分割点座標によシＶＳＰ、ｆｌｓＰ。

ＪもＳＰ　、　ＬＳＩ）の各サブパターンレジスタ上の
文字枠領域を１＼＋Ｉ　ｘ　Ｎの領域に分割し、各領域
の黒点数１３１］を計数し、線幅計算部４で言１ｙｌｌ
＋−シた線幅Ｗを用いて次式（６）により文字線長を示
す！１！ｉ徴全割算し、ｆｖｌｘＮｘ４次元の特徴マド
ＩＪクスを作成する。

Ｌｉ　ｊ　＝　Ｂｉ　ｊ　／Ｗ　（６）その後、Ｖ　Ｓ
　Ｐ特徴マトリクスは文字枠のＹ軸方向の長さΔＹで、
Ｈ８Ｐ特徴マトリクスＢＸ軸方向の長さΔＸで、ＩＬＳ
Ｐ及びＬＳＰ特徴マトリクスは（Δχ＋ΔＹ）／２　で
それぞれ正規化を行ない最終的にＭｘＮｘ　４次元の特
徴マトリクスを作成する。

辞１′選択部８は傾斜抽出部７より出力され／也傾斜θ
Ｈ、θ■、θＲ＋θエニーｋ参照して、入力文字パター
ンに適し／ζ辞書を選択するための選択信号を辞朋°メ
モリ部１３に送出する。辞１：メモリ部１３には、あら
かじめ／［Ｍ′徴ごとに分類して作成した辞書マスクが
舵機ごとに数種類用意しである。本実施例にｇ号いてυ
二辞皆メモリ部にはＶＳＰη寺徴マ青黴クス、１−Ｉ　
ＳＰ時徴マトリクス、１もＳ　Ｐ　％徴マトリクス、Ｉ
、ＳＰ特徴マトリクスについてそれぞれ３種類の傾斜に
対応する辞−１マスクを用意した。各ｑ青黴マトリクス
のイ頃余Ｉはそ）Ｌぞれ θｎ＜−０，２５、−０，２５＜θＨ＜０．２５　、０
．２５　＜θＨの３種類θｖ＜　０．２５．−０．２５
＜θｖ＜０．２５　、０．２５　＜θ■　の３種類θＲ
＜　０．７　、　０．７　＜θＲ・て１４　・】４　く
θＩ？　の３　ｆｆ１ｆ類θＬ＜−１，，４、−１，４
，＜θＬ＜−０，，７、−０，７≦θＩ７　の３種類に
対応している。辞書選択部８は、傾斜抽出部から得た傾
斜θＨ４θ■、θＲ７θＬに対応した各特徴マトリクス
ごとの辞書を選択するための信号を出力する。辞書メモ
リ部１３は上記選択信号で指定された、各特徴ごとの辞
書を識別部］２に参照させる１、識別部１２ば、各特徴
ごとに指定された辞書マスク（ｆｊ　）と前記抽出され
た特徴マトリクス（ｆｌ）との間に式（７）で定義され
る距離（１］を適ｊ１］シ、Ｄが最小の値となるような
辞１マスクのカテゴリ名全文字名出力１４へ出力するも
のである。

Ｄ刊Ｘ（ｆｉ丁百−分　・（７）この様に、本実施例においては入力文字の各方向の文字
線の傾斜を、ストロークの長さを・重みとして、抽出し
た各サブパターン内のストロークのイ頃斜全加重平均す
ることにより抽出しているので、文字パター７内の各方
向彷の文字線の傾斜角度が短いストロークの傾斜の不安
定性の影響を除去して安定に抽出できる利点がある。

換言すれば、筆記者の違いによる文字線の傾斜傾向全抽
出する方法としてはその処理が簡単であり、又、゛大分
類法で使用するザブバタ〜７を使用すれば大分類法との
整合性の点も問題がない。

（発明の効果）不発ヴ」は文字パター／内の各方向の文字線の傾余Ｉを
、抽出し／こサブパターン内の各ストロークのイｌ’Ｊ
１斜をス１用コークの長さを重みとする加重平均するこ
とにより抽出しているので、短かいストロークの傾余１
の不安定性の影響をうけることなく傾斜の抽出が安定と
なる利点があり、高速で認識精度の良い文字認識装置に
利用することができる。

【図面の簡単な説明】

第１図ｒよ手書文字例、第２図は本発明の文字認識装Ｍ
、における一実施例を示す構成図、第３図は原バター／
と各ザブパター７の例を示す図である。 ■、光情号人力、２．光電変換、３　バタールジ７’ｌ
、４：線幅語算部、５．ザブパター７抽出都、６：スト
ローク抽出部、７　傾斜抽出部、８：辞書選択部、９：
文字枠検出部、１００文字枠分割決定部、１１：特徴マ
トリクス抽出部、１２：識別部、１３：辞書メモリ、Ｊ
４：文字名出力。

Claims

【特許請求の範囲】

文字認識装置の辞書マスクを選択するために、文字図形
パターンを予め定めた複数方向ごとに走督して検出し／
こ文字線の断…ｊの中からその断面長が前記文字図形パ
ターン内の線幅より十分に長い断面全抽出することによ
シ作成する各サブバター７カ・らストローク成分を抽出
する傾斜抽出方式Ｑておいて、該抽出したサブパターン
ごとのストローク成分のイ頃斜をそれぞれのストローク
成分の長さ７、（Ｒ’Ｈ１みとじて力ロ重平均したもの
を、当該サブノ９ターンの傾斜として抽出することを特
徴とする傾ネ゛１抽出方式。