JPS6330665B2 - - Google Patents

Info

Publication number
JPS6330665B2
JPS6330665B2 JP55187607A JP18760780A JPS6330665B2 JP S6330665 B2 JPS6330665 B2 JP S6330665B2 JP 55187607 A JP55187607 A JP 55187607A JP 18760780 A JP18760780 A JP 18760780A JP S6330665 B2 JPS6330665 B2 JP S6330665B2
Authority
JP
Japan
Prior art keywords
character
buffer
line
area
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55187607A
Other languages
Japanese (ja)
Other versions
JPS57111783A (en
Inventor
Akira Inoe
Masumi Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP55187607A priority Critical patent/JPS57111783A/en
Priority to EP82900151A priority patent/EP0067236B1/en
Priority to DE8282900151T priority patent/DE3177075D1/en
Priority to PCT/JP1981/000424 priority patent/WO1982002268A1/en
Publication of JPS57111783A publication Critical patent/JPS57111783A/en
Publication of JPS6330665B2 publication Critical patent/JPS6330665B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は文字分離方式に関し、特に複数の文字
が一定の形状のマスクによつても個々の文字に分
離できないように図面等に書入されている場合で
も、これらの各文字を個々の文字に分離すること
ができるようにした文字分離方式に関する。
[Detailed Description of the Invention] The present invention relates to a character separation method, and in particular, even when a plurality of characters are written on a drawing etc. in such a way that they cannot be separated into individual characters even with a mask of a certain shape, these characters can be separated. This invention relates to a character separation method that allows each character to be separated into individual characters.

例えば自由に手書きされた手書き文字を認識す
る場合、まずその第一段階として文字を一字一字
分離して抽出し、それからこの抽出した文字を識
別している。このように文字を分離して抽出する
場合、第1図イに示す如きマスクMを使用し、こ
れを同ロの如く文字列上に走査して、個々の文字
を抽出していた。この場合、第1図ロに示すよう
に、複数の文字が互に離れてしかもある大きさの
文字で記載されているような場合、これをマスク
Mのような一定の形状(例えば矩形)のマスクに
より各文字毎に分離することができるので、これ
らをそれぞれ互に分離して抽出することが可能で
ある。
For example, when recognizing freely handwritten characters, the first step is to separate and extract each character, and then identify the extracted characters. When separating and extracting characters in this way, a mask M as shown in FIG. In this case, as shown in FIG. Since each character can be separated using a mask, it is possible to separate and extract these characters from each other.

しかしながら第1図ハに示すように、複数の文
字が互に接近して記載されている場合、もはや第
1図イに示す如きマスクを走査する方法ではこれ
らの文字を正確に分離することが不可能であり、
したがつてこのような場合には文字を正確に認識
することが困難である。
However, when multiple characters are written close to each other as shown in Figure 1C, it is no longer possible to accurately separate these characters using the method of scanning a mask as shown in Figure 1B. It is possible and
Therefore, in such cases, it is difficult to accurately recognize characters.

したがつて本発明の目的は、このように複数の
文字が近接して記載されている場合でも各文字を
正確に分離することができる文字分離方式を提供
することを目的とするものである。そしてそのた
め本発明における文字分離方式では、入力手段か
ら入力された文字の画像情報を保持する情報保持
手段と、上記画像情報を第1の方向に走査してそ
の白黒変化点を求め、該変化点の間の領域である
第1領域を検出する第1特徴抽出手段と、上記画
像情報を、前記第1の方向と略直交する第2の方
向に走査してその白黒変化点を求め、該変化点間
の領域である第2領域を検出する第2特徴抽出手
段と、上記第1領域と第2領域との重畳しない領
域を前記第1の方向に走査したときの中間点を検
出する検出手段と、前記得られた中間点から前記
第2の方向に第1の線を引くとともに該第1の線
が文字情報に一致したときこれに応じて前記第1
の方向に第2の線を引く引線手段とを備え、前記
得られた第1と第2の線を個々の文字情報の存在
する領域を分離する分離線とすることを特徴とす
る。
Therefore, an object of the present invention is to provide a character separation method that can accurately separate each character even when a plurality of characters are written close to each other. Therefore, the character separation method according to the present invention includes an information holding means that holds image information of characters inputted from an input means, and an information holding means for holding image information of characters inputted from an input means, and scanning the image information in a first direction to obtain black and white change points. a first feature extracting means for detecting a first region that is a region between the two; a second feature extraction means for detecting a second region that is an area between points; and a detection means for detecting an intermediate point when scanning an area where the first area and the second area do not overlap in the first direction. Then, a first line is drawn in the second direction from the obtained intermediate point, and when the first line matches the character information, the first line is drawn in the second direction.
and a drawing line means for drawing a second line in the direction of , and the obtained first and second lines are used as separation lines that separate areas where individual character information exists.

以下本発明を具体的に説明するに先立ち、本発
明の原理を第2図〜9図にもとづき説明する。
Before explaining the present invention in detail below, the principle of the present invention will be explained based on FIGS. 2 to 9.

(a) まず手書き文字の記入された原稿あるいは図
面を読むことにより得られた画像データm0
記入されたメモリm1,m2を用意する。そして
メモリm1を第2図イに示すように、x方向に
走査する。このとき文字が画かれている黒点を
「1」とし、文字の画かれていない白紙領域を
「0」として画像データm0を得る。このとき、
第2図ロに示すように変化点すなわち「0」→
「1」および「1」→「0」に変化する点を求
める。例えば第2図ロに示すように、ラインl
上を走査するとき、x1では「0」→「1」に変
化し、x2では「1」→「0」に変化し、x3では
「0」→「1」に変化し、x4では「1」→「0」
に変化するので、これらのx1〜x4はいずれも変
化点である。この場合変化点P1(「1」→
「0」)およびP2(「0」→「1」)の対を検出
し、メモリm2上のこの変化点P1〜P2間の領域
をすべて「1」とする。
(a) First, memories m 1 and m 2 containing image data m 0 obtained by reading a manuscript or drawing containing handwritten characters are prepared. Then, the memory m1 is scanned in the x direction as shown in FIG. 2A. At this time, image data m0 is obtained by setting the black dot where the characters are drawn as "1" and the blank area where no characters are drawn as "0". At this time,
As shown in Figure 2 (b), the change point is "0" →
Find "1" and the point where "1" changes to "0". For example, as shown in Figure 2 (b), the line l
When scanning above, x 1 changes from "0" to "1", x 2 changes from "1" to "0", x 3 changes from "0" to "1", x 4 Then "1" → "0"
Therefore, all of these x 1 to x 4 are changing points. In this case, the change point P 1 (“1” →
0) and P 2 (“0”→“1”), and all areas between the change points P 1 and P 2 on the memory m 2 are set to “1”.

(b) 次にメモリm1上の画像データm0を、、第2
図イに示すようにy方向に走査して、同様に変
化点Q1(「1」→「0」ただしy方向)および
Q2(「0」→「1」)の対を検出し、これによ
り、該Q1〜Q2間のメモリm2上の領域を、 もし「0」ならば「1」に、 もし「1」ならび「0」に 反転させる。これにより第3図に示す如く、二
重線領域が「0」となり、1線領域が「1」と
なり、メモリm2には第4図に示すデータが記
入されることになる。このとき文字の部分は
「1」が連続しているので、そのまま残る。
(b) Next, the image data m 0 on the memory m 1 is transferred to the second
As shown in Figure A, scan in the y direction and similarly change the change point Q 1 (“1” → “0” in the y direction) and
The pair Q 2 (“0” → “1”) is detected, and the area on the memory m 2 between Q 1 and Q 2 is changed to “1” if “0” and “1” if “1”. ” and invert it to “0”. As a result, as shown in FIG. 3, the double line area becomes "0", the single line area becomes "1", and the data shown in FIG. 4 is written in the memory m2 . At this time, since "1" is consecutive in the character part, it remains as is.

(c) 今度は、この第4図に示す状態のデータが記
入されているメモリm2をx方向に走査し、斜
線領域内での変化点R1(「0」→「1」)、R2
(「1」→「0」)の対を検出する。これはその
斜線前の領域が「0」が連続しているかどうか
と、「1」が文字幅よりも多く連続しているこ
と等により識別して検出できる。
(c) Next, scan the memory m 2 in which the data in the state shown in FIG . 2
Detect the pair (“1” → “0”). This can be detected by checking whether the area before the diagonal line has consecutive "0"s and whether there are "1"s consecutively more than the character width.

(d) いま、第5図に示すように上記R1の座標を
(x1、y1)とし、R2の座標を(x2、y2)とした
とき、その中央部の中心点M(xm、ym)を求
める。このときxm=(x1+x2)/2、ym=y1
(y2)である。このようにして第6図に示すよ
うにM1〜M4を求めることができる。そしてこ
れらの中心点M1〜M4を始点としてy方向に直
線を引き、これが文字情報点(「1」が連続し
て存在する)に接触したとき、その点から左右
両側に再び文字情報点接触するまで横線を引
く。この場合M4からは横線が引けないことは、
図より明らかである。
(d) Now, as shown in Figure 5, when the coordinates of R 1 are (x 1 , y 1 ) and the coordinates of R 2 are (x 2 , y 2 ), the center point M Find (xm, ym). In this case, xm = (x 1 + x 2 )/2, ym = y 1
(y 2 ). In this way, M 1 to M 4 can be determined as shown in FIG. Then, a straight line is drawn in the y direction starting from these center points M 1 to M 4 , and when it touches a character information point (“1” exists continuously), character information points are drawn again on both the left and right sides from that point. Draw horizontal lines until they touch. In this case, the fact that a horizontal line cannot be drawn from M 4 is
It is clear from the figure.

(e) 次に第7図に示す如く、メモリm2を下より
x方向に走査する。そして第8図に示す如く、、
上記(d)と同様に中心点S1〜S4を求めてこれより
y方向に直線を引き、これが文字情報点に接触
したとき同様に横線を引く。この場合S1および
S4からは横線が引けない。
(e) Next, as shown in FIG. 7, the memory m 2 is scanned from below in the x direction. And as shown in Figure 8,
Similarly to (d) above, find the center points S 1 to S 4 and draw a straight line from these in the y direction, and when this comes into contact with a character information point, draw a horizontal line in the same way. In this case S 1 and
You cannot draw a horizontal line from S 4 .

(f) このとき、第8図に示すように、中心点M1
からの垂直線が2本の水平線p2,l1と交るよう
なときは、水平線p2とl1の中間に水平線lmを引
く。そして水平線がx方向でオーバラツプする
ときは、そのオーバラツプ領域で垂線v1,v2
v3を引く。
(f) At this time, as shown in Figure 8, the center point M 1
If a vertical line from 2 intersects two horizontal lines p 2 and l 1 , draw a horizontal line lm between horizontal lines p 2 and l 1 . When the horizontal lines overlap in the x direction, the perpendicular lines v 1 , v 2 ,
v subtract 3 .

(g) このように線を引くことにより、第9図に示
す如く、文字A、B、…………Eを中心点M1
M2,M3,S2,S3、水平線lm,p2,l2,p3,l3
垂線v1,v2,v3………等により単一文字として
区別することが可能になる。
(g) By drawing lines in this way, as shown in Figure 9, we can move the letters A, B, ......E to the center point M 1 ,
M 2 , M 3 , S 2 , S 3 , horizontal line lm, p 2 , l 2 , p 3 , l 3 ,
Perpendicular lines v 1 , v 2 , v 3 , etc. make it possible to distinguish them as a single character.

次に本発明の一実施例を第10図にもとづき説
明する。
Next, one embodiment of the present invention will be described based on FIG. 10.

図中、1は入力部、2は出力メモリ、3は第1
画像メモリ、4はバツフア、5は第1特徴抽出
部、6は第1アドレス・テーブル、7は第1アド
レス発生部、8は制御部、9は第2アドレス発生
部、10はバツフア、11は第2特徴抽出部、1
2は第2アドレス・テーブル、13は第2画像メ
モリ、14はエクスクルシーブ・オア回路、15
は第3アドレス発生部、16,17はバツフア、
18は第3特徴抽出部、19は第3アドレス・テ
ーブル、20は境界線抽出部、21は境界線テー
ブル、22は第4アドレス発生部、23,24は
バツフア、25は第4特徴抽出部である。
In the figure, 1 is the input section, 2 is the output memory, and 3 is the first
Image memory, 4 is a buffer, 5 is a first feature extraction section, 6 is a first address table, 7 is a first address generation section, 8 is a control section, 9 is a second address generation section, 10 is a buffer, 11 is a Second feature extraction unit, 1
2 is a second address table, 13 is a second image memory, 14 is an exclusive OR circuit, 15
is the third address generation part, 16 and 17 are buffers,
18 is a third feature extractor, 19 is a third address table, 20 is a boundary line extractor, 21 is a boundary line table, 22 is a fourth address generator, 23 and 24 are buffers, and 25 is a fourth feature extractor. It is.

入力部1は、手書き原稿等を例えば光電変換部
で変換する電気信号発生部である。出力メモリ2
は、手書き原稿等から入力された情報を、第9図
に示す如く区分けして得られる単独文字情報が出
力されるためにセツトされるメモリである。
The input unit 1 is an electrical signal generation unit that converts a handwritten manuscript or the like using, for example, a photoelectric conversion unit. Output memory 2
is a memory set for outputting single character information obtained by dividing information input from a handwritten manuscript or the like as shown in FIG.

第1画像メモリ3は、入力部1から入力された
画像データが保持されるメモリである。バツフア
4は、上記第1画像メモリ3に保持された画像デ
ータが送出保持されるものであつて、上記(a)の如
き処理を行なうための作業用のバツフア・メモリ
である。
The first image memory 3 is a memory in which image data input from the input section 1 is held. The buffer 4 is a working buffer memory for transmitting and holding the image data held in the first image memory 3, and is used to perform the processing as described in (a) above.

第1特徴抽出部5は、バツフア4に保持された
画像データから、上記(a)の如く、変化点P1およ
びP2の対を求め、そのP1〜P2の領域を「1」と
して読出すものであり、第1アドレス・テーブル
6には上記変化点P1〜P2の間の「1」の領域の
アドレスが保持されるテーブルである。
The first feature extraction unit 5 obtains a pair of change points P 1 and P 2 from the image data held in the buffer 4, as shown in (a) above, and sets the region of P 1 to P 2 as “1”. The first address table 6 is a table in which the addresses of the areas of "1" between the change points P1 and P2 are held.

第1アドレス発生部7は、バツフア4に保持さ
れた画像データを、上記(a)に示す如く、x方向に
走査するためのアドレスを発生するものである。
The first address generating section 7 generates an address for scanning the image data held in the buffer 4 in the x direction as shown in (a) above.

制御部8は、第1画像メモリ3に入力された画
像データを上記(a)〜(g)の手順にしたがつて処理
し、個々の文字領域を作成するための各種制御を
行なうものであつて、例えばバツフア4を走査す
るための第1アドレス発生部7を制御したり、第
1特徴抽出部5を制御するものである。
The control unit 8 processes the image data input to the first image memory 3 according to the steps (a) to (g) above, and performs various controls for creating individual character areas. For example, it controls the first address generation section 7 for scanning the buffer 4 or the first feature extraction section 5.

第2アドレス発生部9は、バツフア10に保持
された画像データを上記(b)に示すようにy方向に
走査するためのアドレスを発生するものである。
またバツフア10は上記第1画像メモリ3に保持
された画像データが送出され、これが保持される
メモリであつて、上記(b)の如き処理を行なうため
の作業用のバツフア・メモリである。
The second address generating section 9 generates an address for scanning the image data held in the buffer 10 in the y direction as shown in (b) above.
The buffer 10 is a memory to which the image data held in the first image memory 3 is sent and held, and is a working buffer memory for performing the processing as in (b) above.

第2特徴抽出部11はバツフア10に保持され
た画像データから、上記(b)の如く変化点Q1,Q2
の対を検出し、そのQ1,Q2の領域を「1」とし
て読出すものであり、第2アドレス・テーブル1
2には上記変化点Q1〜Q2間の「1」の領域のア
ドレスが保持されるテーブルである。
The second feature extraction unit 11 extracts the change points Q 1 and Q 2 from the image data held in the buffer 10 as shown in (b) above.
, and reads out the Q 1 and Q 2 areas as "1".
2 is a table in which addresses of areas of "1" between the change points Q 1 and Q 2 are held.

第2画像メモリ13は、上記(a)、(b)の結果得ら
れた第4図に示す画像データがセツトされるメモ
リである。
The second image memory 13 is a memory in which the image data shown in FIG. 4 obtained as a result of the above (a) and (b) is set.

第3アドレス発生部15はバツフア16および
17を文字の上方より順次x方向に走査するため
のアドレスを発生するものである。バツフア16
は、第2画像メモリ13にセツトされている第4
図に示す如き画像データがセツトされるバツフ
ア・メモリであり、またバツフア17は第1画像
メモリ3にセツトされている画像データがセツト
されるバツフア・メモリである。そしてこれらの
バツフア16,17は、上記(c)および(d)に示す処
理を行なつて第6図に示す如き中心点M1〜M4
よびそれから発生される垂直線、水平線等を得る
ために、文字の上方方向より順次x方向に走査さ
れる。
The third address generating section 15 generates an address for sequentially scanning the buffers 16 and 17 in the x direction from above the character. Batsuhua 16
is the fourth image set in the second image memory 13.
This is a buffer memory into which image data as shown in the figure is set, and the buffer 17 is a buffer memory into which the image data set in the first image memory 3 is set. These buffers 16 and 17 undergo the processing shown in (c) and (d) above to obtain center points M 1 to M 4 and vertical lines, horizontal lines, etc. generated therefrom as shown in FIG. Then, the character is sequentially scanned in the x direction starting from the top.

第3特徴抽出部18は、バツフア16,17に
セツトされた画像データにもとづき上記(c)および
(d)の処理を行なうものである。すなわち、第4図
に示す画像データのセツトされているバツフア1
6および第1画像メモリ3から伝達された画像デ
ータのセツトされているバツフア17は、第3ア
ドレス発生部15から発生されたアドレス情報に
もとづき、その文字の上方よりx方向に順次走査
され、それらの出力データを順次第3特徴抽出部
18に伝達する。そしてバツフア16から出力さ
れたデータにより第4図斜線領域内の上記変曲点
R1,R2を検出する。そしてその中心点を求める
これをM2とする。このようにバツフア16をx
方向に順次走査することにより上記(c)に記載した
ような手法で、中心点M1,M3,M4を得る。こ
のときバツフア17からは文字情報が伝達される
ので、上記(c)に説明した例とは異なり、これによ
り文字位置を識別するものである。このようにし
て中心点M1〜M4を得たのちに、第3特徴抽出部
18は、その引線回路18−0にてこれらの中心
点M1〜M4よりy方向に直線を下方に引く。そし
てこれが文字に接触したとき(勿論この文字位置
はバツフア17から伝達される文字情報より得
る)、今度はその接触点より左右のx方向に直線
を引く。これらの各直線は文字と接触するまで引
く。したがつて中心点M4はy方向の垂直線のみ
が引かれることになる。
The third feature extraction unit 18 extracts the above (c) and
This process performs the process (d). That is, the buffer 1 in which the image data shown in FIG.
6 and the buffer 17 in which the image data transmitted from the first image memory 3 is set are sequentially scanned in the x direction from above the character based on the address information generated from the third address generation section 15. The output data of is sequentially transmitted to the three feature extraction sections 18. Then, based on the data output from the buffer 16, the above-mentioned inflection point within the shaded area in Fig.
Detect R 1 and R 2 . Then find the center point and let it be M 2 . In this way, convert the buffer 16 to x
Center points M 1 , M 3 , and M 4 are obtained by scanning sequentially in the direction as described in (c) above. At this time, character information is transmitted from the buffer 17, so unlike the example described in (c) above, character positions are identified using this information. After obtaining the center points M 1 to M 4 in this way, the third feature extraction unit 18 uses its drawing line circuit 18-0 to draw a straight line downward in the y direction from these center points M 1 to M 4 . Pull. When this contacts a character (of course, the character position is obtained from the character information transmitted from the buffer 17), a straight line is drawn from the contact point in the left and right x directions. Draw each of these lines until they touch the letters. Therefore, only a vertical line in the y direction is drawn at the center point M4 .

第3アドレス・テーブル19は、上記(c)、(d)、
(e)により得た中心点M1〜M4、S1〜S4および各直
線の文字と接触する座標および各直線の交点座標
等が記入されるテーブルである。
The third address table 19 includes the above (c), (d),
This is a table in which the center points M 1 to M 4 and S 1 to S 4 obtained in (e), the coordinates of each straight line in contact with the characters, the coordinates of the intersection of each straight line, etc. are entered.

境界線抽出部20は、上記第3アドレス・テー
ブル19から伝達されたデータにもとづき、上記
(f)および(g)の処理を行ない、第9図に示す如き各
文字間の境界を作成するものである。そして、境
界線テーブル21は上記境界線抽出部20により
作成された各文字間の境界位置のデータが記入さ
れるテーブルである。
Based on the data transmitted from the third address table 19, the boundary line extraction unit 20 extracts the
By performing the processing in (f) and (g), boundaries between characters as shown in FIG. 9 are created. The boundary line table 21 is a table in which data of the boundary positions between each character created by the boundary line extraction section 20 is entered.

第4アドレス発生部22はバツフア22および
23を、上記(e)において説明した如く、文字の下
方より順次x方向に走査するためのアドレスを発
生するものである。バツフア23は、第2画像メ
モリ13にセツトされている第4図に示す如き画
像データがセツトされるバツフア・メモリであ
り、またバツフア24は第1画像メモリ3にセツ
トされている画像データがセツトされるバツフ
ア・メモリである。そしてこれらのバツフア2
3,24は、上記(e)に示す処理が行なわれて第8
図に示す如き中心点S1〜S4およびそれから発生さ
れる垂直線、水平線等を得るために、文字の下方
位置より順次x方向に走査される。
The fourth address generating section 22 generates addresses for sequentially scanning the buffers 22 and 23 in the x direction starting from the bottom of the character, as explained in (e) above. The buffer 23 is a buffer memory into which the image data as shown in FIG. 4 set in the second image memory 13 is set, and the buffer 24 is into which the image data set in the first image memory 3 is set. buffer memory. And these batshua 2
3 and 24 are the 8th after the process shown in (e) above is performed.
In order to obtain the center points S 1 to S 4 and the vertical lines, horizontal lines, etc. generated therefrom as shown in the figure, the characters are sequentially scanned in the x direction from the lower position of the character.

第4特徴抽出部25は、バツフア23,24に
セツトされた画像データにもとづき上記(e)の処理
を行なうものである。すなわち第4図に示す画像
データのセツトされているバツフア23および第
1画像メモリ3から伝達された画像データのセツ
トされているバツフア24は、第4アドレス発生
部22から発生されたアドレス情報にもとづき、
その文字の下方よりx方向に順次走査され、その
出力データを順次第4特徴抽出部18に伝達す
る。この第4特徴抽出部18はバツフア23から
伝達されたデータにより、上記中心点S1〜S4
得、その引線回路25−0によりこれらの中心点
S1〜S4からy方向に直線を上方に引く。そしてこ
れが文字に接触したとき(勿論この文字位置はバ
ツフア24から伝達される文字情報より得る)、
今度はその接触点より左右のx方向に直線を引
く。これらの各直線は文字と接触するまで引くの
で、結局、第8図に図示の如く、中心点S1とS4
対するy方向の直線からはx方向の直線は得られ
ず、中心点S2については直線p2が、中心点S3につ
いては直線p3がそれぞれ引かれることになる。
The fourth feature extractor 25 performs the process (e) above based on the image data set in the buffers 23 and 24. That is, the buffer 23 in which the image data shown in FIG. ,
The character is sequentially scanned in the x direction from below, and the output data is sequentially transmitted to the four feature extraction sections 18. This fourth feature extraction unit 18 obtains the center points S 1 to S 4 based on the data transmitted from the buffer 23, and uses the drawing line circuit 25-0 to extract these center points.
Draw a straight line upward in the y direction from S 1 to S 4 . When this comes into contact with a character (of course, this character position is obtained from the character information transmitted from the buffer 24),
Next, draw a straight line in the x direction to the left and right from the contact point. Each of these straight lines is drawn until it touches the characters, so as shown in FIG . A straight line p 2 is drawn for the center point S 3 , and a straight line p 3 is drawn for the center point S 3 .

以下第10図の動作について簡単に説明する。 The operation shown in FIG. 10 will be briefly explained below.

(1) まず手書き原稿等の画像情報が入力部1で電
気信号に変換されて「1」、「0」の画像データ
となり、第1画像メモリ3にセツトされる。そ
してこの画像データはバツフア4およびバツフ
ア10に送出されこれらにもセツトされる。
(1) First, image information such as a handwritten manuscript is converted into an electrical signal by the input section 1 to become image data of "1" and "0", and is set in the first image memory 3. This image data is then sent to the buffers 4 and 10 and set there as well.

(2) このようにバツフア4およびバツフア10に
画像データがセツトされた後、制御部8は第1
アドレス発生部7に対してはバツフア10をx
方向に走査するように、またバツフア10に対
してはy方向に走査するようにアドレスを発生
すべく制御する。これにより第1特徴抽出部5
は上記(a)に示した変化点対P1,P2を検出して
この変化点対P1〜P2の領域を「1」となし、
この「1」としたアドレス領域を第1アドレ
ス・テーブル6にセツトする。一方第2特徴抽
出部11は上記(b)に示した変化点Q1,Q2の対
を検出してこの変化点対P1〜P2の領域を「1」
となし、この「1」としたアドレス領域を第2
アドレス・テーブル12にセツトする。
(2) After the image data is set in the buffers 4 and 10 in this way, the control section 8
For the address generation section 7, add a buffer of 10 x
The buffer 10 is controlled to generate an address so as to scan in the y-direction. As a result, the first feature extraction unit 5
detects the pair of changing points P 1 and P 2 shown in (a) above and sets the area of this pair of changing points P 1 to P 2 as “1”,
This address area set to "1" is set in the first address table 6. On the other hand, the second feature extraction unit 11 detects the pair of changing points Q 1 and Q 2 shown in (b) above, and sets the area of this pair of changing points P 1 to P 2 to “1”.
and set this address area as "1" to the second address area.
Set in address table 12.

(3) このようにして変化点P1〜P2およびQ1〜Q2
の間の領域を「1」にした後、エクスクルシー
ブ・オア回路14で、第1アドレス・テーブル
6および第2アドレス・テーブル12の「1」
の領域のエクスクルシーブ・オアをとり、これ
により第4図に示す如き画像データが得られ、
これが第2画像メモリ13にセツトされる。
(3) In this way, the change points P 1 ~ P 2 and Q 1 ~ Q 2
After setting the area between them to "1", the exclusive OR circuit 14 sets "1" in the first address table 6 and the second address table 12.
Taking the exclusive OR of the area, image data as shown in Fig. 4 is obtained.
This is set in the second image memory 13.

(4) このようにして得られた第4図に示す画像デ
ータは、第2画像メモリ13からバツフア16
および23に転送され、またバツフア17およ
びバツフア24には第1画像メモリ3にセツト
されているオリジナルの画像データが転送され
る。
(4) The image data shown in FIG. 4 obtained in this way is transferred from the second image memory 13 to the buffer 16.
and 23, and the original image data set in the first image memory 3 is transferred to the buffers 17 and 24.

(5) それから制御部8は第3アドレス発生部15
に対し、バツフア16および17を文字の上方
よりx方向に順次走査するという通常の走査を
行なうためのアドレスを発生させる。これによ
り出力されたデータにもとづき、第3特徴抽出
部18は、上記(c)に示した如く変化点R1,R2
の対を検出し、第6図に示す如く、中心点M1
〜M4を求め、これよりy方向に垂直線を引き、
これが文字に接触したとき、その点よりx方向
に水平に直線を引く。そしてこの水平の直線も
文字に接触するところまで引く。このとき文字
情報はバツフア17より得ることができる。
(5) Then, the control unit 8 controls the third address generation unit 15
On the other hand, an address is generated for normal scanning in which the buffers 16 and 17 are sequentially scanned from above the character in the x direction. Based on the data thus output, the third feature extraction unit 18 extracts the change points R 1 and R 2 as shown in (c) above.
As shown in Fig. 6, the center point M 1
Find ~M 4 and draw a vertical line in the y direction from this,
When this touches a character, draw a straight line horizontally in the x direction from that point. Then draw this horizontal line until it touches the letters. At this time, character information can be obtained from the buffer 17.

(6) 同時に制御部8は第4アドレス発生部22に
対し、バツフア23および24を、第7図に示
すように、文字の下方よりx方向に順次走査す
るという下からの走査を行なうためのアドレス
を発生させる。これにより出力されたデータに
もとづき、第4特徴抽出部25は、同様の変化
点を求めこれにより第8図に示す如き中心点S1
〜S4を得る。そしてこれらの中心点S1〜S4から
y方向に直線を上方に引く。そしてこれが文字
と接触したとき今度はその接触点より左右のx
方向に直線を引く。この水平の直線も文字に接
触するところまで引く。そしてこのときの文字
情報はバツフア24より得ることができる。
(6) At the same time, the control unit 8 instructs the fourth address generation unit 22 to scan the buffers 23 and 24 from below in order to sequentially scan in the x direction from below the character, as shown in FIG. Generate an address. Based on the data outputted from this, the fourth feature extracting section 25 finds a similar change point and thereby obtains the center point S 1 as shown in FIG.
~Get S4 . Then, straight lines are drawn upward in the y direction from these center points S 1 to S 4 . And when this comes into contact with the character, this time the x to the left and right of that contact point
Draw a straight line in the direction. Draw this horizontal straight line until it touches the letters. The character information at this time can be obtained from the buffer 24.

(7) このようにして、第8図に示すように、中心
点M1〜M4、S1〜S4よびびそれらよりy方向に
引かれた直線、およびx方向に引かれた直線l1
〜l3,p2,p3等のデータが第3アドレス・テー
ブル19に送出される。
( 7 ) In this way , as shown in FIG. 1
Data such as ~l 3 , p 2 , p 3 etc. are sent to the third address table 19.

(8) 境界線抽出部20は、この第3アドレス・テ
ーブル19から送出されたデータにもとづき、
中心点M1からのy方向の直線のように、水平
方向の直線p2,l1と交叉するものについてはそ
れらの中央に水平方向の直線lmを引き、また
直線l2,p2;l2,p3およびl3,p3のように互にx
方向にオーバラツプしている領域のあるものに
ついてはその領域のところで垂直に線v1,v2
v3を引く。そしてこのようにして第9図に示す
如く、文字A〜Eを個々の文字領域に区分けす
る。
(8) Based on the data sent from this third address table 19, the boundary line extraction unit 20
For lines that intersect the horizontal lines p 2 and l 1 , such as the line in the y direction from the center point M 1 , a horizontal line lm is drawn in the center of them, and the lines l 2 , p 2 ; 2 , p 3 and l 3 , p 3 mutually x
For areas with overlapping directions, vertical lines v 1 , v 2 ,
v subtract 3 . In this manner, the characters A to E are divided into individual character areas as shown in FIG.

(9) 上記の如く区分けされた座標情報は境界線テ
ーブル21にセツトされ、これにもとづき第1
画像メモリにセツトされた画像データが1文字
分ずつ抽出されて出力メモリ2に送出され、こ
れより例えば文字認識装置等に送出され、その
文字の識別が行なわれることになる。
(9) The coordinate information divided as above is set in the boundary line table 21, and based on this, the first
The image data set in the image memory is extracted one character at a time and sent to the output memory 2, from which it is sent to, for example, a character recognition device, where the characters are identified.

以上説明の如く、本発明によれば、複数の文字
が接近して書込された場合でも、これを単独に区
分けすることが可能になる。したがつて原稿用紙
の所定の枠内に記載されていない手書き文字でも
これを単独に分離することが可能になる。それ
故、このような手書き文字でも文字を1文字ずつ
分離して抽出できるので、例えば手書き文字に対
する文字認識等を行なう場合に大きな効果を発揮
することができる。
As described above, according to the present invention, even when a plurality of characters are written close to each other, it is possible to separate them into individual characters. Therefore, even handwritten characters that are not written within a predetermined frame on the manuscript paper can be separated individually. Therefore, since even such handwritten characters can be separated and extracted character by character, great effects can be exerted when, for example, character recognition of handwritten characters is performed.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は文字読取用のマスクおよび、該マスク
により文字分離が可能な場合および不可能な場合
の説明図、第2図は走査状態説明図、第3図〜第
9図は本発明の動作状態説明図、第10図は本発
明の一実施例構成図である。 図中、1は入力部、2は出力メモリ、3は第1
画像メモリ、4はバツフア、5は第1特徴抽出
部、6は第1アドレス・テーブル、7は第1アド
レス発生部、8は制御部、9は第2アドレス発生
部、10はバツフア、11は第2特徴抽出部、1
2は第2アドレス・テーブル、13は第2画像メ
モリ、14はエクスクルシーブ・オア回路、15
は第3アドレス発生部、16,17はバツフア、
18は第3特徴抽出部、19は第3アドレス・テ
ーブル、20は境界線抽出部、21は境界線テー
ブル、22は第4アドレス発生部、23,24は
バツフア、25は第4特徴抽出部をそれぞれ示
す。
Fig. 1 is an explanatory diagram of a mask for character reading and cases in which character separation is possible and not possible using the mask, Fig. 2 is an explanatory diagram of the scanning state, and Figs. 3 to 9 are diagrams illustrating the operation of the present invention. The state explanatory diagram, FIG. 10, is a configuration diagram of an embodiment of the present invention. In the figure, 1 is the input section, 2 is the output memory, and 3 is the first
Image memory, 4 is a buffer, 5 is a first feature extraction section, 6 is a first address table, 7 is a first address generation section, 8 is a control section, 9 is a second address generation section, 10 is a buffer, 11 is a Second feature extraction unit, 1
2 is a second address table, 13 is a second image memory, 14 is an exclusive OR circuit, 15
is the third address generation part, 16 and 17 are buffers,
18 is a third feature extractor, 19 is a third address table, 20 is a boundary line extractor, 21 is a boundary line table, 22 is a fourth address generator, 23 and 24 are buffers, and 25 is a fourth feature extractor. are shown respectively.

Claims (1)

【特許請求の範囲】[Claims] 1 入力手段から入力された文字の画像情報を保
持する情報保持手段と、上記画像情報を第1の方
向に走査してその白黒変化点を求め、該変化点の
間の領域である第1領域を検出する第1特徴抽出
手段と、上記画像情報を、前記第1の方向と略直
交する第2の方向に走査してその白黒変化点を求
め、該変化点間の領域である第2領域を検出する
第2特徴抽出手段と、上記第1領域と第2領域と
の重畳しない領域を前記第1の方向に走査したと
きの中間点を検出する検出手段と、前記得られた
中間点から前記第2の方向に第1の線を引くとと
もに該第1の線が文字情報に一致したときこれに
応じて前記第1の方向に第2の線を引く引線手段
とを備え、前記得られた第1と第2の線を個々の
文字情報の存在する領域を分離する分離線とする
ことを特徴とする文字分離方式。
1. Information holding means for holding image information of characters inputted from an input means, and a first area that scans the image information in a first direction to obtain points of black and white change, and is an area between the points of change. a first feature extraction means for detecting a black and white change point by scanning the image information in a second direction substantially orthogonal to the first direction, and a second feature extracting means for detecting a black and white change point of the image information; a second feature extraction means for detecting, a detection means for detecting an intermediate point when scanning an area where the first area and the second area do not overlap in the first direction, and a second feature extracting means for detecting an intermediate point from the obtained intermediate point. drawing means for drawing a first line in the second direction and drawing a second line in the first direction when the first line matches character information; A character separation method characterized in that the first and second lines are used as separation lines that separate areas where individual character information exists.
JP55187607A 1980-12-29 1980-12-29 Character separation and pickup system Granted JPS57111783A (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP55187607A JPS57111783A (en) 1980-12-29 1980-12-29 Character separation and pickup system
EP82900151A EP0067236B1 (en) 1980-12-29 1981-12-28 Character and figure isolating and extracting system
DE8282900151T DE3177075D1 (en) 1980-12-29 1981-12-28 Character and figure isolating and extracting system
PCT/JP1981/000424 WO1982002268A1 (en) 1980-12-29 1981-12-28 Character and figure isolating and extracting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55187607A JPS57111783A (en) 1980-12-29 1980-12-29 Character separation and pickup system

Publications (2)

Publication Number Publication Date
JPS57111783A JPS57111783A (en) 1982-07-12
JPS6330665B2 true JPS6330665B2 (en) 1988-06-20

Family

ID=16209064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55187607A Granted JPS57111783A (en) 1980-12-29 1980-12-29 Character separation and pickup system

Country Status (1)

Country Link
JP (1) JPS57111783A (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system

Also Published As

Publication number Publication date
JPS57111783A (en) 1982-07-12

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH02306386A (en) Character recognizing device
JPH0418351B2 (en)
JPS6330665B2 (en)
JPS6330666B2 (en)
JP2000113106A (en) Document image processor
JPS6327752B2 (en)
JPS61150081A (en) Character recognizing device
JP2626011B2 (en) Drawing reading processing method
JP2722549B2 (en) Optical character reader
JP2800205B2 (en) Image processing device
JP2762476B2 (en) Copy-writing device
JPH04167193A (en) Character recognizing method
JPH07109612B2 (en) Image processing method
JP3903540B2 (en) Image extraction method and apparatus, recording medium on which image extraction program is recorded, information input / output / selection method and apparatus, and recording medium on which information input / output / selection processing program is recorded
JPS62123581A (en) Document picture input device
JPH0271379A (en) Picture processor
JPS61196382A (en) Character segmenting system
JPH04156694A (en) Character recognition system
JPS59194269A (en) On-line character recognition system
JPH0119189B2 (en)
JPH05114047A (en) Device for segmenting character
JPS6253869B2 (en)
JPH08185475A (en) Image recognition device
JPH056245A (en) Image processing method and apparatus