JPS603077A - Inclination extraction system - Google Patents
Inclination extraction systemInfo
- Publication number
- JPS603077A JPS603077A JP58110209A JP11020983A JPS603077A JP S603077 A JPS603077 A JP S603077A JP 58110209 A JP58110209 A JP 58110209A JP 11020983 A JP11020983 A JP 11020983A JP S603077 A JPS603077 A JP S603077A
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- character
- pattern
- extracted
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 24
- 239000000284 extract Substances 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 description 11
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000002233 Penicillium roqueforti Nutrition 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
(技術分野)
本発明に、高速で安定な傾j」抽出方式に関するもので
ある。DETAILED DESCRIPTION OF THE INVENTION (Technical Field) The present invention relates to a fast and stable slope j'' extraction method.
(背景技術)
従来、文字認識装置においては、第1図の例の様々手書
文字の死者の違いによる文字線の傾斜、又印字文字の印
字の傾斜に起因する文字線の傾余1宿に起因する抽出し
た特徴のばらつきを吸収するために、辞層マスクの複数
化の手段によシ前記特徴のほらつきを吸収していた。し
かしなから、この手段は識別を行なう際の抽出したη句
、徴と界層との照合の時間が辞層マスクの数に比例して
増大し、装置の処理速度の低下を招いていた。この欠点
を除去する為に、各方向の文字線傾斜を抽出して使用す
る辞書マスクを選択することにより処理速度を向上させ
る方法があるが、従来の傾斜抽出方式C1各方向につい
て、当該方向の各ストロークの傾斜の単純平均により算
出しているので、傾斜の傾向が不安定な短かいストロー
クの影響により、抽出する#i斜が不安定とfJ:I)
ひいては認識性能の低下を招いてい/こ。(Background Art) Conventionally, in a character recognition device, the inclination of the character line due to the difference in the number of characters of various handwritten characters as shown in the example of Fig. 1, and the inclination of the character line due to the inclination of the printed character are In order to absorb the resulting variations in the extracted features, the variations in the features have been absorbed by means of multiple layer masks. However, with this method, the time required to compare the extracted η phrases and signs with the boundary layer during identification increases in proportion to the number of layer masks, resulting in a reduction in the processing speed of the device. In order to eliminate this drawback, there is a method to improve the processing speed by extracting the character line slope in each direction and selecting a dictionary mask to use.However, in the conventional slope extraction method C1, for each direction, Since it is calculated by a simple average of the slope of each stroke, the #i slope to be extracted is unstable due to the influence of short strokes with unstable slope trends fJ:I)
This in turn leads to a decline in recognition performance.
(発明の目的)
本発明は、このような欠点全除去する為に、文字パター
ンより抽出したストローク成分の傾斜の、各ストローク
成分の長さを重みとする加重平均を算出することにより
、安定な文字線の傾斜を算出することを特徴とし、その
目的は高速で安定な傾斜抽出方式を提供することにある
。(Objective of the Invention) In order to eliminate all such defects, the present invention calculates a weighted average of the slopes of stroke components extracted from character patterns, using the length of each stroke component as a weight. It is characterized by calculating the slope of character lines, and its purpose is to provide a fast and stable slope extraction method.
(発明の構成及び作用)
第2図は、本発明の文字認識装置における一実施例の構
成図を示す。同図において、文字の光信号は光信号人力
1よシ光電変換部2において2値の量子化されたディジ
タル電気信号に変換され、パターンレジスタ3に格納さ
れる。それと同時に線幅計算部4において人カパターン
の線幅(W)か言1算される。サブパターン抽出部5は
、パター7レジスタ3について垂直スキャンを全面に行
なって黒点(文字線部全黒点とする)の連続する長さと
、線幅計算部4において計算された線幅との関係よシ、
垂直サブパタ〜7(VSP)−i抽出する。(Structure and operation of the invention) FIG. 2 shows a block diagram of an embodiment of the character recognition device of the invention. In the figure, an optical signal of a character is converted into a binary quantized digital electrical signal by an optical signal input 1 and a photoelectric conversion section 2, and is stored in a pattern register 3. At the same time, the line width (W) of the human pattern is calculated in the line width calculating section 4. The sub-pattern extractor 5 vertically scans the entire surface of the putter 7 register 3 and calculates the relationship between the continuous length of black dots (all black dots in the character line area) and the line width calculated by the line width calculator 4. C,
Extract vertical subpattern ~7 (VSP)-i.
同様に、水平スキャンにより水平サブパター7(1−1
S P ) 2、右斜め45°スキヤンにより右斜めサ
ブパター7(RS P )−q、左斜め45°スキヤ/
により左斜めザブパターン(LSP)4抽出する。第3
図は原パターンと各ザブパターンの例で、(a)は原パ
ターン、(1))は垂直ザブパターン(vsp)、(C
)は水平サブパターン(IISP)、(d) fi右斜
めザブパターン(1もSP)、(c)qx左斜めサブパ
ター7(LSP) である。Similarly, by horizontal scanning, horizontal sub pattern 7 (1-1
S P ) 2, right diagonal 45° scan right diagonal sub putter 7 (RS P )-q, left diagonal 45° ski/
4 left diagonal sub patterns (LSP) are extracted. Third
The figure shows examples of the original pattern and each sub pattern, where (a) is the original pattern, (1)) is the vertical sub pattern (vsp), and (C
) is a horizontal sub-pattern (IISP), (d) fi right diagonal sub pattern (1 is also SP), and (c) qx left diagonal sub pattern 7 (LSP).
ストローク抽出部6は各サブパターンレジスタにおける
水平又は垂直スキャンを全面に行ない、白点から黒点、
黒点から白点への変化点を検出し、1列(又は行)前の
スキャノにおけ為変化点個数と変化点座標と現列(又は
行)の変化点個数と変化点座標の関係よりストロークを
抽出し、抽出した各ザブパター7レジスタ内のストロー
クの両端点のパターンレジスタ3で定義される2次元座
標系における座標(パターンレジスタの左下を原点とす
る)を傾胴]1旧B部7へ送出する。傾斜抽出部7はス
トローり抽出都6において抽出した各サブパター7レジ
スタ内のストロークの両端点座標を参照し、各ザブパタ
ーンごとに平均傾斜を言1算する。即ち、水平サブパタ
ーンより抽出したストロークの両端点座標f (HXS
n、 、 HYS rl) 、 (1−IXEn。The stroke extraction unit 6 performs horizontal or vertical scanning over the entire surface of each sub-pattern register, and extracts from the white point to the black point,
Detect the change point from a black point to a white point, and calculate the stroke based on the relationship between the number of change points and the coordinates of the change point in the previous column (or row), and the number of change points and the coordinates of the change point in the current column (or row). Extract the coordinates (with the lower left of the pattern register as the origin) in the two-dimensional coordinate system defined in the pattern register 3 of both end points of the stroke in each of the extracted Zabu putter 7 registers] 1 to the old B part 7 Send. The slope extraction section 7 refers to the coordinates of both end points of the stroke in each sub-pattern 7 register extracted in the stroke extraction capital 6, and calculates the average slope for each subpattern. That is, the coordinates f (HXS
n, , HYS rl), (1-IXEn.
HYEn)、但しn−11−−+ P 、 Pta、ス
トローク数として(1)式によ逆傾斜QHを計算する(
但し1−IXEp ’) f(XS p )。HYEn), where n-11--+ P, Pta, and the number of strokes, calculate the reverse slope QH using equation (1) (
However, 1-IXEp') f(XS p ).
(1)式中のf−IL G pは当該ストロークの長さ
を表わし、(2)式の近似式によりめる。f-IL G p in equation (1) represents the length of the stroke, which is determined by the approximate equation of equation (2).
1−(LGp =MAX (1l−IXEp −HX5
p 1.11−1.YEp −1−IYS p I)
(2)式は2点間の距離を、2点間の水平及び垂直座標
差の内で、小さい方の1/2と他の一方との和とする近
似式である。同様にvVlθR、0t、 ff1(3)
〜(5)式ニヨり計算t−ル。但シ、VYEq ) V
YS q 。1-(LGp = MAX (1l-IXEp -HX5
p 1.11-1. YEp-1-IYS p I)
Equation (2) is an approximate expression in which the distance between two points is the sum of 1/2 of the smaller one of the horizontal and vertical coordinate differences between the two points and the other one. Similarly, vVlθR, 0t, ff1(3)
~ (5) Equation 2 calculation table. However, VYEq) V
YSq.
RXE t ) RXS t 、 LXE k ) L
X8 kとする。RXE t) RXS t, LXE k) L
Let it be X8k.
ΣVLGq
■
なお、上記式中Q、L、1ぐはそれぞれ垂直サブパター
ン、右斜めザブパターン、左斜めサブ/くターンよシ抽
出したストローク数である。またストローク数がOのと
きは傾斜もΩとする。ま7jストロ−クツ長すVLGq
、 iもLGt 、 LLGktrL(2)式と同様
な計算により算出迂る。。ΣVLGq ■ Note that in the above formula, Q, L, and 1st are the number of strokes extracted from the vertical sub pattern, right diagonal sub pattern, and left diagonal sub/turn, respectively. Furthermore, when the number of strokes is O, the slope is also assumed to be Ω. Ma7j Strokes Long VLGq
, i are also calculated using the same calculation as LGt, LLGktrL (2). .
傾斜抽出部7は、上記式(1)〜(5)よシ計算した各
ザブパター7の傾斜を辞書選択部8へ送出する。、文字
枠検出部9はパターンレジスタ3内の文字パターンに外
接する文字枠を検出し、その結果を文字枠分割決定部1
0−\送る。The slope extraction section 7 sends the slope of each sub putter 7 calculated according to the above equations (1) to (5) to the dictionary selection section 8. , the character frame detection unit 9 detects a character frame circumscribing the character pattern in the pattern register 3, and sends the result to the character frame division determination unit 1.
0-\Send.
文字枠分割決定部10は、検出され/こ文字枠内をMX
N(7)領域(M、NtrJ、整数、本実施例では■\
4−N−5)に分割するためのXjl!ll+、 ’Y
輔上の分割点座標を決定する。ここでX軸は文字枠の水
平方向奮、Y軸は垂直方向をそれぞれ示す。The character frame division determining unit 10 converts the inside of the detected character frame into MX.
N(7) area (M, NtrJ, integer, in this example ■\
4-N-5) Xjl! ll+, 'Y
Determine the coordinates of the division points on the bridge. Here, the X axis indicates the horizontal direction of the character frame, and the Y axis indicates the vertical direction.
特徴マトリクス抽出部11は、文字枠分割決定部10に
より決定された分割点座標によシVSP、flsP。The feature matrix extraction unit 11 extracts VSP and flsP based on the division point coordinates determined by the character frame division determination unit 10.
JもSP 、 LSI)の各サブパターンレジスタ上の
文字枠領域を1\+I x Nの領域に分割し、各領域
の黒点数131]を計数し、線幅計算部4で言1yll
+−シた線幅Wを用いて次式(6)により文字線長を示
す!1!i徴全割算し、fvlxNx4次元の特徴マド
IJクスを作成する。Divide the character frame area on each sub-pattern register (J, SP, LSI) into 1\+I x N areas, count the number of black dots in each area (131), and use the line width calculation unit 4 to calculate the number of black points (131).
Express the character line length using the following equation (6) using the line width W obtained by +-. 1! Divide all i characteristics to create a fvlxNx4-dimensional feature matrix.
Li j = Bi j /W (6)その後、V S
P特徴マトリクスは文字枠のY軸方向の長さΔYで、
H8P特徴マトリクスBX軸方向の長さΔXで、ILS
P及びLSP特徴マトリクスは(Δχ+ΔY)/2 で
それぞれ正規化を行ない最終的にMxNx 4次元の特
徴マトリクスを作成する。Li j = Bi j /W (6) Then, V S
The P feature matrix is the length ΔY of the character frame in the Y-axis direction,
H8P feature matrix BX axis direction length ΔX, ILS
The P and LSP feature matrices are each normalized by (Δχ+ΔY)/2 to finally create an M×N× four-dimensional feature matrix.
辞1′選択部8は傾斜抽出部7より出力され/也傾斜θ
H、θ■、θR+θエニーk参照して、入力文字パター
ンに適し/ζ辞書を選択するための選択信号を辞朋°メ
モリ部13に送出する。辞1:メモリ部13には、あら
かじめ/[M′徴ごとに分類して作成した辞書マスクが
舵機ごとに数種類用意しである。本実施例にg号いてυ
二辞皆メモリ部にはVSPη寺徴マ青黴クス、1−I
SP時徴マトリクス、1もS P %徴マトリクス、I
、SP特徴マトリクスについてそれぞれ3種類の傾斜に
対応する辞−1マスクを用意した。各q青黴マトリクス
のイ頃余Iはそ)Lぞれ
θn<−0,25、−0,25<θH<0.25 、0
.25 <θHの3種類θv< 0.25.−0.25
<θv<0.25 、0.25 <θ■ の3種類θR
< 0.7 、 0.7 <θR・て14 ・】4 く
θI? の3 ff1f類θL<−1,,4、−1,4
,<θL<−0,,7、−0,7≦θI7 の3種類に
対応している。辞書選択部8は、傾斜抽出部から得た傾
斜θH4θ■、θR7θLに対応した各特徴マトリクス
ごとの辞書を選択するための信号を出力する。辞書メモ
リ部13は上記選択信号で指定された、各特徴ごとの辞
書を識別部]2に参照させる1、識別部12ば、各特徴
ごとに指定された辞書マスク(fj )と前記抽出され
た特徴マトリクス(fl)との間に式(7)で定義され
る距離(1]を適j1]シ、Dが最小の値となるような
辞1マスクのカテゴリ名全文字名出力14へ出力するも
のである。The slope 1' selection unit 8 is output from the slope extraction unit 7 and the slope θ is output from the slope extraction unit 7.
With reference to H, θ■, θR+θany k, a selection signal for selecting the /ζ dictionary suitable for the input character pattern is sent to the dictionary memory section 13. Dictionary 1: In the memory unit 13, several types of dictionary masks are prepared for each rudder machine, which are classified and created in advance for each /[M' characteristic. In this example, g is υ
In the memory section of the two words, there are VSP η temples, Aokikusu, 1-I.
SP chronological matrix, 1 is also SP % characteristic matrix, I
, 1 masks corresponding to three types of slopes were prepared for each of the SP feature matrices. I and I of each q blue mold matrix are respectively) θn<-0,25, -0,25<θH<0.25, 0
.. 25 <3 types of θH θv< 0.25. -0.25
Three types of θR: <θv<0.25, 0.25 <θ■
< 0.7, 0.7 <θR・te14 ・】4 kuθI? 3 ff1f class θL<-1,,4,-1,4
, <θL<-0,,7, -0,7≦θI7. The dictionary selection unit 8 outputs a signal for selecting a dictionary for each feature matrix corresponding to the slopes θH4θ■ and θR7θL obtained from the slope extraction unit. The dictionary memory unit 13 causes the identification unit 2 to refer to the dictionary for each feature specified by the selection signal. The distance (1) defined by equation (7) is applied between the feature matrix (fl) and the category name of the word 1 mask such that D is the minimum value is output to the full character name output 14. It is something.
D刊X(fi丁百−分 ・(7)
この様に、本実施例においては入力文字の各方向の文字
線の傾斜を、ストロークの長さを・重みとして、抽出し
た各サブパターン内のストロークのイ頃斜全加重平均す
ることにより抽出しているので、文字パター7内の各方
向彷の文字線の傾斜角度が短いストロークの傾斜の不安
定性の影響を除去して安定に抽出できる利点がある。D issue Since it is extracted by weighted averaging of all the strokes, the advantage is that it can remove the influence of the instability of the slope of strokes where the slope angle of the character line in each direction in the character pattern 7 is short and extract it stably. There is.
換言すれば、筆記者の違いによる文字線の傾斜傾向全抽
出する方法としてはその処理が簡単であり、又、゛大分
類法で使用するザブバタ〜7を使用すれば大分類法との
整合性の点も問題がない。In other words, the process is simple as a method for extracting all the slope trends of character lines due to differences in scribes, and if Zabbata-7 used in the major classification method is used, it is consistent with the major classification method. There is no problem with this point either.
(発明の効果)
不発ヴ」は文字パター/内の各方向の文字線の傾余Iを
、抽出し/こサブパターン内の各ストロークのイl’J
1斜をス1用コークの長さを重みとする加重平均するこ
とにより抽出しているので、短かいストロークの傾余1
の不安定性の影響をうけることなく傾斜の抽出が安定と
なる利点があり、高速で認識精度の良い文字認識装置に
利用することができる。(Effect of the invention) ``Dufu'' extracts the slope I of the character line in each direction in the character pattern / and calculates the slope I of each stroke in this subpattern.
1 slope is extracted by weighted averaging using the length of the stroke cork as a weight, so the slope remainder 1 of a short stroke is
This method has the advantage that slope extraction is stable without being affected by instability, and can be used in character recognition devices with high speed and high recognition accuracy.
第1図rよ手書文字例、第2図は本発明の文字認識装M
、における一実施例を示す構成図、第3図は原バター/
と各ザブパター7の例を示す図である。
■、光情号人力、2.光電変換、3 バタールジ7’l
、4:線幅語算部、5.ザブパター7抽出都、6:スト
ローク抽出部、7 傾斜抽出部、8:辞書選択部、9:
文字枠検出部、100文字枠分割決定部、11:特徴マ
トリクス抽出部、12:識別部、13:辞書メモリ、J
4:文字名出力。Figure 1 is an example of handwritten characters, Figure 2 is an example of character recognition system M of the present invention.
, a configuration diagram showing an example of the raw butter/
and FIG. 7 is a diagram showing an example of each sub putter 7. ■, Kojogo Jinriki, 2. Photoelectric conversion, 3 Batarji 7'l
, 4: Line width word calculation section, 5. Zabu putter 7 extraction capital, 6: stroke extraction section, 7 slope extraction section, 8: dictionary selection section, 9:
Character frame detection unit, 100 character frame division determination unit, 11: Feature matrix extraction unit, 12: Identification unit, 13: Dictionary memory, J
4: Character name output.
Claims (1)
パターンを予め定めた複数方向ごとに走督して検出し/
こ文字線の断…jの中からその断面長が前記文字図形パ
ターン内の線幅より十分に長い断面全抽出することによ
シ作成する各サブバター7カ・らストローク成分を抽出
する傾斜抽出方式Qておいて、該抽出したサブパターン
ごとのストローク成分のイ頃斜をそれぞれのストローク
成分の長さ7、(R’H1みとじて力ロ重平均したもの
を、当該サブノ9ターンの傾斜として抽出することを特
徴とする傾ネ゛1抽出方式。In order to select a dictionary mask for a character recognition device, character/figure patterns are scanned and detected in multiple predetermined directions.
This is a slope extraction method that extracts stroke components from each of the 7 sub-butters created by extracting all cross-sections whose cross-sectional length is sufficiently longer than the line width in the character figure pattern from among the character line breaks...j. Q, and the weighted average of the stroke component of each extracted sub-pattern with the length of each stroke component, 7, (R'H1), is taken as the slope of the 9th turn of the sub-pattern. The trend 1 extraction method is characterized by extraction.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58110209A JPS603077A (en) | 1983-06-21 | 1983-06-21 | Inclination extraction system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58110209A JPS603077A (en) | 1983-06-21 | 1983-06-21 | Inclination extraction system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS603077A true JPS603077A (en) | 1985-01-09 |
| JPH0420227B2 JPH0420227B2 (en) | 1992-04-02 |
Family
ID=14529818
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58110209A Granted JPS603077A (en) | 1983-06-21 | 1983-06-21 | Inclination extraction system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS603077A (en) |
-
1983
- 1983-06-21 JP JP58110209A patent/JPS603077A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0420227B2 (en) | 1992-04-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH01292486A (en) | Device for recognizing character | |
| CN109241975B (en) | A license plate character segmentation method based on character center point location | |
| JPS603077A (en) | Inclination extraction system | |
| CN108460384B (en) | A character segmentation method for offline handwritten text | |
| KR102838473B1 (en) | A recognizing method of assembled stamp using image feature analysis | |
| JPS6214277A (en) | Image processing method | |
| JPH0410087A (en) | Base line extracting method | |
| JPH04352295A (en) | System and device for identifing character string direction | |
| JP2788506B2 (en) | Character recognition device | |
| CN106909897A (en) | A kind of text image is inverted method for quick | |
| JPH02273884A (en) | Detecting and correcting method for distortion of document image | |
| JPH0545992B2 (en) | ||
| JP2520174B2 (en) | Automatic character extraction device | |
| JP3936039B2 (en) | Screened area extraction device | |
| Fadeel | An efficient segmentation algorithm for arabic handwritten characters recognition system | |
| JPS5894065A (en) | Character recognizing device | |
| JP2918363B2 (en) | Character classification method and character recognition device | |
| JP3411795B2 (en) | Character recognition device | |
| JPH05298487A (en) | Alphabet recognizing device | |
| JPH05108882A (en) | Character recognition device | |
| JPH0371380A (en) | Character recognizing device | |
| JPS6019285A (en) | Stroke extracting method | |
| JPH10162104A (en) | Character recognition device | |
| JPH0580711B2 (en) | ||
| JP2832035B2 (en) | Character recognition device |