JPS603077A - 傾斜抽出方式 - Google Patents
傾斜抽出方式Info
- Publication number
- JPS603077A JPS603077A JP58110209A JP11020983A JPS603077A JP S603077 A JPS603077 A JP S603077A JP 58110209 A JP58110209 A JP 58110209A JP 11020983 A JP11020983 A JP 11020983A JP S603077 A JPS603077 A JP S603077A
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- character
- pattern
- extracted
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 24
- 239000000284 extract Substances 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 description 11
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000002233 Penicillium roqueforti Nutrition 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(技術分野)
本発明に、高速で安定な傾j」抽出方式に関するもので
ある。
ある。
(背景技術)
従来、文字認識装置においては、第1図の例の様々手書
文字の死者の違いによる文字線の傾斜、又印字文字の印
字の傾斜に起因する文字線の傾余1宿に起因する抽出し
た特徴のばらつきを吸収するために、辞層マスクの複数
化の手段によシ前記特徴のほらつきを吸収していた。し
かしなから、この手段は識別を行なう際の抽出したη句
、徴と界層との照合の時間が辞層マスクの数に比例して
増大し、装置の処理速度の低下を招いていた。この欠点
を除去する為に、各方向の文字線傾斜を抽出して使用す
る辞書マスクを選択することにより処理速度を向上させ
る方法があるが、従来の傾斜抽出方式C1各方向につい
て、当該方向の各ストロークの傾斜の単純平均により算
出しているので、傾斜の傾向が不安定な短かいストロー
クの影響により、抽出する#i斜が不安定とfJ:I)
ひいては認識性能の低下を招いてい/こ。
文字の死者の違いによる文字線の傾斜、又印字文字の印
字の傾斜に起因する文字線の傾余1宿に起因する抽出し
た特徴のばらつきを吸収するために、辞層マスクの複数
化の手段によシ前記特徴のほらつきを吸収していた。し
かしなから、この手段は識別を行なう際の抽出したη句
、徴と界層との照合の時間が辞層マスクの数に比例して
増大し、装置の処理速度の低下を招いていた。この欠点
を除去する為に、各方向の文字線傾斜を抽出して使用す
る辞書マスクを選択することにより処理速度を向上させ
る方法があるが、従来の傾斜抽出方式C1各方向につい
て、当該方向の各ストロークの傾斜の単純平均により算
出しているので、傾斜の傾向が不安定な短かいストロー
クの影響により、抽出する#i斜が不安定とfJ:I)
ひいては認識性能の低下を招いてい/こ。
(発明の目的)
本発明は、このような欠点全除去する為に、文字パター
ンより抽出したストローク成分の傾斜の、各ストローク
成分の長さを重みとする加重平均を算出することにより
、安定な文字線の傾斜を算出することを特徴とし、その
目的は高速で安定な傾斜抽出方式を提供することにある
。
ンより抽出したストローク成分の傾斜の、各ストローク
成分の長さを重みとする加重平均を算出することにより
、安定な文字線の傾斜を算出することを特徴とし、その
目的は高速で安定な傾斜抽出方式を提供することにある
。
(発明の構成及び作用)
第2図は、本発明の文字認識装置における一実施例の構
成図を示す。同図において、文字の光信号は光信号人力
1よシ光電変換部2において2値の量子化されたディジ
タル電気信号に変換され、パターンレジスタ3に格納さ
れる。それと同時に線幅計算部4において人カパターン
の線幅(W)か言1算される。サブパターン抽出部5は
、パター7レジスタ3について垂直スキャンを全面に行
なって黒点(文字線部全黒点とする)の連続する長さと
、線幅計算部4において計算された線幅との関係よシ、
垂直サブパタ〜7(VSP)−i抽出する。
成図を示す。同図において、文字の光信号は光信号人力
1よシ光電変換部2において2値の量子化されたディジ
タル電気信号に変換され、パターンレジスタ3に格納さ
れる。それと同時に線幅計算部4において人カパターン
の線幅(W)か言1算される。サブパターン抽出部5は
、パター7レジスタ3について垂直スキャンを全面に行
なって黒点(文字線部全黒点とする)の連続する長さと
、線幅計算部4において計算された線幅との関係よシ、
垂直サブパタ〜7(VSP)−i抽出する。
同様に、水平スキャンにより水平サブパター7(1−1
S P ) 2、右斜め45°スキヤンにより右斜めサ
ブパター7(RS P )−q、左斜め45°スキヤ/
により左斜めザブパターン(LSP)4抽出する。第3
図は原パターンと各ザブパターンの例で、(a)は原パ
ターン、(1))は垂直ザブパターン(vsp)、(C
)は水平サブパターン(IISP)、(d) fi右斜
めザブパターン(1もSP)、(c)qx左斜めサブパ
ター7(LSP) である。
S P ) 2、右斜め45°スキヤンにより右斜めサ
ブパター7(RS P )−q、左斜め45°スキヤ/
により左斜めザブパターン(LSP)4抽出する。第3
図は原パターンと各ザブパターンの例で、(a)は原パ
ターン、(1))は垂直ザブパターン(vsp)、(C
)は水平サブパターン(IISP)、(d) fi右斜
めザブパターン(1もSP)、(c)qx左斜めサブパ
ター7(LSP) である。
ストローク抽出部6は各サブパターンレジスタにおける
水平又は垂直スキャンを全面に行ない、白点から黒点、
黒点から白点への変化点を検出し、1列(又は行)前の
スキャノにおけ為変化点個数と変化点座標と現列(又は
行)の変化点個数と変化点座標の関係よりストロークを
抽出し、抽出した各ザブパター7レジスタ内のストロー
クの両端点のパターンレジスタ3で定義される2次元座
標系における座標(パターンレジスタの左下を原点とす
る)を傾胴]1旧B部7へ送出する。傾斜抽出部7はス
トローり抽出都6において抽出した各サブパター7レジ
スタ内のストロークの両端点座標を参照し、各ザブパタ
ーンごとに平均傾斜を言1算する。即ち、水平サブパタ
ーンより抽出したストロークの両端点座標f (HXS
n、 、 HYS rl) 、 (1−IXEn。
水平又は垂直スキャンを全面に行ない、白点から黒点、
黒点から白点への変化点を検出し、1列(又は行)前の
スキャノにおけ為変化点個数と変化点座標と現列(又は
行)の変化点個数と変化点座標の関係よりストロークを
抽出し、抽出した各ザブパター7レジスタ内のストロー
クの両端点のパターンレジスタ3で定義される2次元座
標系における座標(パターンレジスタの左下を原点とす
る)を傾胴]1旧B部7へ送出する。傾斜抽出部7はス
トローり抽出都6において抽出した各サブパター7レジ
スタ内のストロークの両端点座標を参照し、各ザブパタ
ーンごとに平均傾斜を言1算する。即ち、水平サブパタ
ーンより抽出したストロークの両端点座標f (HXS
n、 、 HYS rl) 、 (1−IXEn。
HYEn)、但しn−11−−+ P 、 Pta、ス
トローク数として(1)式によ逆傾斜QHを計算する(
但し1−IXEp ’) f(XS p )。
トローク数として(1)式によ逆傾斜QHを計算する(
但し1−IXEp ’) f(XS p )。
(1)式中のf−IL G pは当該ストロークの長さ
を表わし、(2)式の近似式によりめる。
を表わし、(2)式の近似式によりめる。
1−(LGp =MAX (1l−IXEp −HX5
p 1.11−1.YEp −1−IYS p I)
(2)式は2点間の距離を、2点間の水平及び垂直座標
差の内で、小さい方の1/2と他の一方との和とする近
似式である。同様にvVlθR、0t、 ff1(3)
〜(5)式ニヨり計算t−ル。但シ、VYEq ) V
YS q 。
p 1.11−1.YEp −1−IYS p I)
(2)式は2点間の距離を、2点間の水平及び垂直座標
差の内で、小さい方の1/2と他の一方との和とする近
似式である。同様にvVlθR、0t、 ff1(3)
〜(5)式ニヨり計算t−ル。但シ、VYEq ) V
YS q 。
RXE t ) RXS t 、 LXE k ) L
X8 kとする。
X8 kとする。
ΣVLGq
■
なお、上記式中Q、L、1ぐはそれぞれ垂直サブパター
ン、右斜めザブパターン、左斜めサブ/くターンよシ抽
出したストローク数である。またストローク数がOのと
きは傾斜もΩとする。ま7jストロ−クツ長すVLGq
、 iもLGt 、 LLGktrL(2)式と同様
な計算により算出迂る。。
ン、右斜めザブパターン、左斜めサブ/くターンよシ抽
出したストローク数である。またストローク数がOのと
きは傾斜もΩとする。ま7jストロ−クツ長すVLGq
、 iもLGt 、 LLGktrL(2)式と同様
な計算により算出迂る。。
傾斜抽出部7は、上記式(1)〜(5)よシ計算した各
ザブパター7の傾斜を辞書選択部8へ送出する。、文字
枠検出部9はパターンレジスタ3内の文字パターンに外
接する文字枠を検出し、その結果を文字枠分割決定部1
0−\送る。
ザブパター7の傾斜を辞書選択部8へ送出する。、文字
枠検出部9はパターンレジスタ3内の文字パターンに外
接する文字枠を検出し、その結果を文字枠分割決定部1
0−\送る。
文字枠分割決定部10は、検出され/こ文字枠内をMX
N(7)領域(M、NtrJ、整数、本実施例では■\
4−N−5)に分割するためのXjl!ll+、 ’Y
輔上の分割点座標を決定する。ここでX軸は文字枠の水
平方向奮、Y軸は垂直方向をそれぞれ示す。
N(7)領域(M、NtrJ、整数、本実施例では■\
4−N−5)に分割するためのXjl!ll+、 ’Y
輔上の分割点座標を決定する。ここでX軸は文字枠の水
平方向奮、Y軸は垂直方向をそれぞれ示す。
特徴マトリクス抽出部11は、文字枠分割決定部10に
より決定された分割点座標によシVSP、flsP。
より決定された分割点座標によシVSP、flsP。
JもSP 、 LSI)の各サブパターンレジスタ上の
文字枠領域を1\+I x Nの領域に分割し、各領域
の黒点数131]を計数し、線幅計算部4で言1yll
+−シた線幅Wを用いて次式(6)により文字線長を示
す!1!i徴全割算し、fvlxNx4次元の特徴マド
IJクスを作成する。
文字枠領域を1\+I x Nの領域に分割し、各領域
の黒点数131]を計数し、線幅計算部4で言1yll
+−シた線幅Wを用いて次式(6)により文字線長を示
す!1!i徴全割算し、fvlxNx4次元の特徴マド
IJクスを作成する。
Li j = Bi j /W (6)その後、V S
P特徴マトリクスは文字枠のY軸方向の長さΔYで、
H8P特徴マトリクスBX軸方向の長さΔXで、ILS
P及びLSP特徴マトリクスは(Δχ+ΔY)/2 で
それぞれ正規化を行ない最終的にMxNx 4次元の特
徴マトリクスを作成する。
P特徴マトリクスは文字枠のY軸方向の長さΔYで、
H8P特徴マトリクスBX軸方向の長さΔXで、ILS
P及びLSP特徴マトリクスは(Δχ+ΔY)/2 で
それぞれ正規化を行ない最終的にMxNx 4次元の特
徴マトリクスを作成する。
辞1′選択部8は傾斜抽出部7より出力され/也傾斜θ
H、θ■、θR+θエニーk参照して、入力文字パター
ンに適し/ζ辞書を選択するための選択信号を辞朋°メ
モリ部13に送出する。辞1:メモリ部13には、あら
かじめ/[M′徴ごとに分類して作成した辞書マスクが
舵機ごとに数種類用意しである。本実施例にg号いてυ
二辞皆メモリ部にはVSPη寺徴マ青黴クス、1−I
SP時徴マトリクス、1もS P %徴マトリクス、I
、SP特徴マトリクスについてそれぞれ3種類の傾斜に
対応する辞−1マスクを用意した。各q青黴マトリクス
のイ頃余Iはそ)Lぞれ θn<−0,25、−0,25<θH<0.25 、0
.25 <θHの3種類θv< 0.25.−0.25
<θv<0.25 、0.25 <θ■ の3種類θR
< 0.7 、 0.7 <θR・て14 ・】4 く
θI? の3 ff1f類θL<−1,,4、−1,4
,<θL<−0,,7、−0,7≦θI7 の3種類に
対応している。辞書選択部8は、傾斜抽出部から得た傾
斜θH4θ■、θR7θLに対応した各特徴マトリクス
ごとの辞書を選択するための信号を出力する。辞書メモ
リ部13は上記選択信号で指定された、各特徴ごとの辞
書を識別部]2に参照させる1、識別部12ば、各特徴
ごとに指定された辞書マスク(fj )と前記抽出され
た特徴マトリクス(fl)との間に式(7)で定義され
る距離(1]を適j1]シ、Dが最小の値となるような
辞1マスクのカテゴリ名全文字名出力14へ出力するも
のである。
H、θ■、θR+θエニーk参照して、入力文字パター
ンに適し/ζ辞書を選択するための選択信号を辞朋°メ
モリ部13に送出する。辞1:メモリ部13には、あら
かじめ/[M′徴ごとに分類して作成した辞書マスクが
舵機ごとに数種類用意しである。本実施例にg号いてυ
二辞皆メモリ部にはVSPη寺徴マ青黴クス、1−I
SP時徴マトリクス、1もS P %徴マトリクス、I
、SP特徴マトリクスについてそれぞれ3種類の傾斜に
対応する辞−1マスクを用意した。各q青黴マトリクス
のイ頃余Iはそ)Lぞれ θn<−0,25、−0,25<θH<0.25 、0
.25 <θHの3種類θv< 0.25.−0.25
<θv<0.25 、0.25 <θ■ の3種類θR
< 0.7 、 0.7 <θR・て14 ・】4 く
θI? の3 ff1f類θL<−1,,4、−1,4
,<θL<−0,,7、−0,7≦θI7 の3種類に
対応している。辞書選択部8は、傾斜抽出部から得た傾
斜θH4θ■、θR7θLに対応した各特徴マトリクス
ごとの辞書を選択するための信号を出力する。辞書メモ
リ部13は上記選択信号で指定された、各特徴ごとの辞
書を識別部]2に参照させる1、識別部12ば、各特徴
ごとに指定された辞書マスク(fj )と前記抽出され
た特徴マトリクス(fl)との間に式(7)で定義され
る距離(1]を適j1]シ、Dが最小の値となるような
辞1マスクのカテゴリ名全文字名出力14へ出力するも
のである。
D刊X(fi丁百−分 ・(7)
この様に、本実施例においては入力文字の各方向の文字
線の傾斜を、ストロークの長さを・重みとして、抽出し
た各サブパターン内のストロークのイ頃斜全加重平均す
ることにより抽出しているので、文字パター7内の各方
向彷の文字線の傾斜角度が短いストロークの傾斜の不安
定性の影響を除去して安定に抽出できる利点がある。
線の傾斜を、ストロークの長さを・重みとして、抽出し
た各サブパターン内のストロークのイ頃斜全加重平均す
ることにより抽出しているので、文字パター7内の各方
向彷の文字線の傾斜角度が短いストロークの傾斜の不安
定性の影響を除去して安定に抽出できる利点がある。
換言すれば、筆記者の違いによる文字線の傾斜傾向全抽
出する方法としてはその処理が簡単であり、又、゛大分
類法で使用するザブバタ〜7を使用すれば大分類法との
整合性の点も問題がない。
出する方法としてはその処理が簡単であり、又、゛大分
類法で使用するザブバタ〜7を使用すれば大分類法との
整合性の点も問題がない。
(発明の効果)
不発ヴ」は文字パター/内の各方向の文字線の傾余Iを
、抽出し/こサブパターン内の各ストロークのイl’J
1斜をス1用コークの長さを重みとする加重平均するこ
とにより抽出しているので、短かいストロークの傾余1
の不安定性の影響をうけることなく傾斜の抽出が安定と
なる利点があり、高速で認識精度の良い文字認識装置に
利用することができる。
、抽出し/こサブパターン内の各ストロークのイl’J
1斜をス1用コークの長さを重みとする加重平均するこ
とにより抽出しているので、短かいストロークの傾余1
の不安定性の影響をうけることなく傾斜の抽出が安定と
なる利点があり、高速で認識精度の良い文字認識装置に
利用することができる。
第1図rよ手書文字例、第2図は本発明の文字認識装M
、における一実施例を示す構成図、第3図は原バター/
と各ザブパター7の例を示す図である。 ■、光情号人力、2.光電変換、3 バタールジ7’l
、4:線幅語算部、5.ザブパター7抽出都、6:スト
ローク抽出部、7 傾斜抽出部、8:辞書選択部、9:
文字枠検出部、100文字枠分割決定部、11:特徴マ
トリクス抽出部、12:識別部、13:辞書メモリ、J
4:文字名出力。
、における一実施例を示す構成図、第3図は原バター/
と各ザブパター7の例を示す図である。 ■、光情号人力、2.光電変換、3 バタールジ7’l
、4:線幅語算部、5.ザブパター7抽出都、6:スト
ローク抽出部、7 傾斜抽出部、8:辞書選択部、9:
文字枠検出部、100文字枠分割決定部、11:特徴マ
トリクス抽出部、12:識別部、13:辞書メモリ、J
4:文字名出力。
Claims (1)
- 文字認識装置の辞書マスクを選択するために、文字図形
パターンを予め定めた複数方向ごとに走督して検出し/
こ文字線の断…jの中からその断面長が前記文字図形パ
ターン内の線幅より十分に長い断面全抽出することによ
シ作成する各サブバター7カ・らストローク成分を抽出
する傾斜抽出方式Qておいて、該抽出したサブパターン
ごとのストローク成分のイ頃斜をそれぞれのストローク
成分の長さ7、(R’H1みとじて力ロ重平均したもの
を、当該サブノ9ターンの傾斜として抽出することを特
徴とする傾ネ゛1抽出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58110209A JPS603077A (ja) | 1983-06-21 | 1983-06-21 | 傾斜抽出方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58110209A JPS603077A (ja) | 1983-06-21 | 1983-06-21 | 傾斜抽出方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS603077A true JPS603077A (ja) | 1985-01-09 |
| JPH0420227B2 JPH0420227B2 (ja) | 1992-04-02 |
Family
ID=14529818
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58110209A Granted JPS603077A (ja) | 1983-06-21 | 1983-06-21 | 傾斜抽出方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS603077A (ja) |
-
1983
- 1983-06-21 JP JP58110209A patent/JPS603077A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0420227B2 (ja) | 1992-04-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH01292486A (ja) | 文字認識装置及び方法 | |
| CN109241975B (zh) | 一种基于字符中心点定位的车牌字符分割方法 | |
| JPS603077A (ja) | 傾斜抽出方式 | |
| CN108460384B (zh) | 一种脱机手写体文本的字符切分方法 | |
| KR102838473B1 (ko) | 이미지 요소 분석을 이용한 조립 인영 식별 방법 | |
| JPS6214277A (ja) | 画像処理方式 | |
| JPH0410087A (ja) | 基本ライン抽出方法 | |
| JPH04352295A (ja) | 文字列方向判別装置 | |
| JP2788506B2 (ja) | 文字認識装置 | |
| CN106909897A (zh) | 一种文本图像倒置快速检测方法 | |
| JPH02273884A (ja) | 文書画像の歪検出補正方法 | |
| JPH0545992B2 (ja) | ||
| JP2520174B2 (ja) | 文字自動抽出装置 | |
| JP3936039B2 (ja) | 網がけ領域抽出装置 | |
| Fadeel | An efficient segmentation algorithm for arabic handwritten characters recognition system | |
| JPS5894065A (ja) | 文字認識装置 | |
| JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
| JP3411795B2 (ja) | 文字認識装置 | |
| JPH05298487A (ja) | 英文字認識装置 | |
| JPH05108882A (ja) | 文字認識装置 | |
| JPS6019285A (ja) | ストロ−ク抽出方法 | |
| JP2888885B2 (ja) | 文字切出し装置 | |
| JPH10162104A (ja) | 文字認識装置 | |
| JPH0580711B2 (ja) | ||
| JP2832035B2 (ja) | 文字認識装置 |