JPH04364593A - Handwritten character segmenting system - Google Patents
Handwritten character segmenting systemInfo
- Publication number
- JPH04364593A JPH04364593A JP3139382A JP13938291A JPH04364593A JP H04364593 A JPH04364593 A JP H04364593A JP 3139382 A JP3139382 A JP 3139382A JP 13938291 A JP13938291 A JP 13938291A JP H04364593 A JPH04364593 A JP H04364593A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- frame
- entry frame
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
Description
【0001】0001
【産業上の利用分野】本発明は手書き文字切り出し方式
に関し、特にマークシートの画像信号から記入された文
各1文字分のパタンを切り出すための手書き文字切り出
し方式に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a handwritten character cutting method, and more particularly to a handwritten character cutting method for cutting out a pattern for each character of a written sentence from an image signal of a mark sheet.
【0002】0002
【従来の技術】マークシートを読み取りその画像信号か
ら記入された文字を認識する手書き文字認識装置では、
マークシートの画像から記入された1文字毎のパタンを
抽出す切り出し処理が必要となる。文字認識の正読率を
上げるためには、切り出されてたパタン内に記入された
1文字の全体像が確実に含まれることが要求され、また
処理時間を短くするには切り出されたパタン内の画素数
を最小にすることが要求される。[Prior Art] A handwritten character recognition device that reads a mark sheet and recognizes written characters from its image signal.
A cutting process is required to extract the pattern of each written character from the image of the mark sheet. In order to increase the correct reading rate of character recognition, it is necessary to ensure that the entire image of a single character written in the cut out pattern is included, and to shorten the processing time, It is required to minimize the number of pixels.
【0003】このため、従来からのこの種の文字認識装
置の入力として使われるマークシートには、文字の記入
位置を特定する工夫がされている。[0003] For this reason, mark sheets used as input for conventional character recognition devices of this type have been devised to specify the positions where characters are written.
【0004】図3に示すように、マークシート34上に
文字の記入位置を指定する長方形の文字記入枠31を印
刷して、文字の大きさと記入位置を制限し、さらに文字
記入枠31の座標を算出する基準となる位置情報マーク
32,33をマークシート34の周辺部に印刷すること
が一般に行われている。As shown in FIG. 3, a rectangular character writing frame 31 for specifying the writing position of characters is printed on a mark sheet 34, the size and writing position of the characters are limited, and the coordinates of the character writing frame 31 are also specified. It is common practice to print position information marks 32 and 33, which serve as a reference for calculation, on the periphery of the mark sheet 34.
【0005】従来の手書き文字り出し方式では、切り出
したパタンをそのまま文字記入枠31をドロップアウト
カラーで印刷して光学読み取り部でその枠の画像のみを
消去したり、文字記入枠31を切り出し寸法に対して大
きめに印刷したり、工夫したりしている。[0005] In the conventional handwritten character extraction method, the character entry frame 31 is printed in a dropout color based on the cut out pattern, and only the image of that frame is erased using the optical reading section, or the character entry frame 31 is cut out and the size is adjusted. They print it larger and make other improvements.
【0006】[0006]
【発明が解決しようとする課題】しかしながら、このよ
うな従来の手書き切り出し方式では、ドロップアウトカ
ラー印刷のマークシートをコピーしたものは記入用マー
クシートとして使えず、光学読み取り電気変換部をファ
クシミリ端末等に置き換えた場合に、ドロップアウトカ
ラーに対する感度のばらつきによりノイズが入り易く、
また文字記入枠を大きめに印刷すると実際に記入された
文字のサイズと位置の特定が難しくなり、結果的に正読
率を低下させるという問題がある。[Problems to be Solved by the Invention] However, in such a conventional handwritten cutout method, a copy of a mark sheet printed in dropout color cannot be used as a mark sheet for filling in, and the optical reading/electrical converter is replaced with a facsimile terminal, etc. noise is likely to occur due to variations in sensitivity to dropout colors,
Furthermore, if the character entry frame is printed in a larger size, it becomes difficult to specify the size and position of the actually written characters, resulting in a problem of lowering the correct reading rate.
【0007】[0007]
【課題を解決するための手段】本発明の手書き文字切り
出し方式は、文字の記入位置を指定する長方形の文字記
入枠と前記文字記入枠の座標を算出する基準となる位置
情報マークとを印刷したマークシートを光学的に走査し
て電気信号に変換する光学読み取り部と、得られた電気
信号を量子化して画像信号を得る量子化部と、画像信号
を入力して画像情報を蓄積する画像メモリ部と、画像信
号から前記マークシートに記入された手書き文字パタン
を1文字分ずつ切り出し文字切り出し処理部とを有する
手書き文字認識装置の文字切り出し方式において、第1
回目の切り出し処理にて前記文字記入枠の位置を前記位
置情報マークから算出して該文字記入枠の画像を含んだ
長方形のパタン領域を得、第2回目の切り出し処理にて
前記パタン領域の4辺から内側へ順次画素の状態を調べ
て前記文字記入枠の4辺の位置を特定し、該文字記入枠
の画像と枠内部の文字画像領域とを分離して、該文字画
像領域のパタンを得ることを特徴とする。[Means for Solving the Problems] The handwritten character extraction method of the present invention includes printing a rectangular character entry frame that specifies the character entry position and a position information mark that serves as a reference for calculating the coordinates of the character entry frame. An optical reading section that optically scans the mark sheet and converts it into an electrical signal, a quantization section that quantizes the obtained electrical signal to obtain an image signal, and an image memory section that inputs the image signal and stores image information. and a character extraction processing unit that extracts the handwritten character pattern written on the mark sheet from the image signal one character at a time.
In the second cutting process, the position of the character entry frame is calculated from the position information mark to obtain a rectangular pattern area that includes the image of the character entry frame, and in the second cutting process, the position of the character entry frame is calculated from the position information mark. The positions of the four sides of the character entry frame are identified by sequentially examining the state of the pixels from the side to the inside, the image of the character entry frame and the character image area inside the frame are separated, and the pattern of the character image area is determined. It is characterized by obtaining.
【0008】[0008]
【実施例】次に、本発明について図面を参照して説明す
る。DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be explained with reference to the drawings.
【0009】図1は本発明の一実施例のブロック構成図
を示し、図2は本実施例の処理の様子を説明する正面図
である。FIG. 1 shows a block diagram of an embodiment of the present invention, and FIG. 2 is a front view illustrating the processing of this embodiment.
【0010】本実施例でも従来方式と同様に、図3に示
すような文字記入枠31と位置情報マーク32,33と
を印刷したマークシート34を入力するが、文字認識枠
の印刷は、従来のようなドロップアウトカラー印刷は行
わない。このマークシート34を光学読み取り部11に
おいて光学的に走査して、明度レベルを表わす電気信号
に変換し、量子化部12において画素単位に明度レベル
を量子して、画像情報をディジタルデータに変換する。
このディジタルデータ変換された画像情報を、次の切り
出し処理のために、画像メモリ13に蓄積する。マーク
シート認識処理部14では、マークシート全体の画像か
ら横位置情報マーク32と縦位置情報マーク33を抽出
して、文字切入枠位置の座標を計算して、切り出し処理
部15に各1文字ずつの切り出し座標と大きさ情報とを
与える。In this embodiment, as in the conventional method, a mark sheet 34 on which a character entry frame 31 and position information marks 32, 33 as shown in FIG. Dropout color printing is not performed. This mark sheet 34 is optically scanned by the optical reading section 11 and converted into an electrical signal representing the brightness level, and the brightness level is quantized for each pixel in the quantization section 12 to convert the image information into digital data. The image information converted into digital data is stored in the image memory 13 for the next cutting process. The mark sheet recognition processing section 14 extracts the horizontal position information mark 32 and the vertical position information mark 33 from the image of the entire mark sheet, calculates the coordinates of the character cutting frame position, and sends the cutout processing section 15 to cut out one character each. Give coordinates and size information.
【0011】このとき常に図2で示すように、切り出し
枠21内に文字記入枠31の画像が完全に促えられてい
るように、上下左右にマージンを持たせて大きめの切り
出しを行ない、切り出したパタンは、次の切り出し処理
のために、小容量を画像メモリ部16に格納されたパタ
ンについて、上端から下端向きに1ラインずつの画素の
状態を調べ、黒画素が一定値を最初に越えたラインの縦
座標Y1を得る。意向加担から上向き、左端から右向き
、右端から左むきに同様の処理を行い、縦座標Y2、横
座標X2を得る。これらの座標は、文字記入枠の画像2
2の外縁の位置を表わしている。At this time, as shown in FIG. 2, a larger cutout is made with margins on the top, bottom, left and right sides so that the image of the character entry frame 31 is completely displayed within the cutout frame 21. For the next cutting process, the pattern is stored in a small capacity in the image memory unit 16, and the state of the pixels is checked line by line from the top to the bottom, and the black pixel is the first one that exceeds a certain value. Obtain the ordinate Y1 of the line. Similar processing is performed upward from the intention, from the left end to the right, and from the right end to the left to obtain the ordinate Y2 and the abscissa X2. These coordinates are shown in image 2 of the character entry frame.
It represents the position of the outer edge of 2.
【0012】次に文字記入枠認識処理部17は、文字記
入枠の線幅も一定とみなして、文字記入枠の画像22と
記入文字の画像23の境界で切り出すように切り出し枠
24を決定する。文字記入枠の線幅にマージンを加えた
値をmとすると、切り出し枠24の座標は、Y1+m、
Y2−m、X1+m、X2−mとして求められる。[0012] Next, the character entry frame recognition processing unit 17 determines a cutting frame 24 to be cut out at the boundary between the character entry frame image 22 and the input character image 23, assuming that the line width of the character entry frame is also constant. . If the value of the line width of the character entry frame plus the margin is m, the coordinates of the cutting frame 24 are Y1+m,
It is determined as Y2-m, X1+m, and X2-m.
【0013】こうして求めた各座標を切り出し処理部1
8に与えて切り出し枠24内のパタンを文字認識処理部
19の入力として与える。このような切り出しにより、
文字記入枠31を正確に促えることができ、正確な文字
切り出しが可能となる。[0013] Each coordinate obtained in this way is cut out and processed by the processing unit 1.
8 and the pattern within the cutout frame 24 is given as an input to the character recognition processing section 19. By cutting out like this,
The character entry frame 31 can be accurately drawn, and characters can be accurately cut out.
【0014】[0014]
【発明の効果】以上説明したように本発明は、切り出し
処理を2段階とし、位置情報マークを基準とする切り出
しに加えて、文字記入枠の位置を検出する手段を設ける
ことにより、文字画像領域をより正確に切り出すことが
可能となり、正読率を向上させる効果がある。また使用
するマークシートは、特殊なインクによるドロップアウ
トカラー印刷を行わずに済む。As explained above, the present invention performs the cutting process in two stages, and in addition to the cutting based on the position information mark, it also provides a means for detecting the position of the character entry frame, thereby improving the character image area. can be extracted more accurately, which has the effect of improving the correct reading rate. Additionally, the mark sheets used do not require dropout color printing using special ink.
【図1】本発明の実施例のブロック図。FIG. 1 is a block diagram of an embodiment of the invention.
【図2】本発明の実施例の処理の様子を説明する正面図
。FIG. 2 is a front view illustrating the process of the embodiment of the present invention.
【図3】従来方式および本発明で使用するマークシート
の一例を示す正面図。FIG. 3 is a front view showing an example of a mark sheet used in the conventional method and the present invention.
11 光学読み取り部り部 12 量子化部 13 画像メモリ部 14 マークシート認識処理部 15 切り出し処理部 16 画像メモリ部 17 文字記入枠認識処理部 18 切り出し処理部 19 文字認識処理部 21 切り出し枠 22 文字記入枠の画像 23 記入文字の画像 24 切り出し枠 31 文字技乳枠 32,33 位置情報マーク 34 マークシート 11 Optical reading section 12 Quantization section 13 Image memory section 14 Mark sheet recognition processing section 15 Cutting processing section 16 Image memory section 17 Character entry frame recognition processing unit 18 Cutting processing section 19 Character recognition processing section 21 Cutting frame 22 Image of text entry frame 23 Image of written characters 24 Cutting frame 31 Character technique breast frame 32, 33 Location information mark 34 Mark sheet
Claims (1)
字記入枠と前記文字記入枠の座標を算出する基準となる
位置情報マークとを印刷したマークシートを光学的に走
査して電気信号に変換する光学読み取り部と、得られた
電気信号を量子化して画像信号を得る量子化部と、画像
信号を入力して画像情報を蓄積する画像メモリ部と、画
像信号から前記マークシートに記入された手書き文字パ
タンを1文字分ずつ切り出し文字切り出し処理部とを有
する手書き文字認識装置の文字切り出し方式において、
第1回目の切り出し処理にて前記文字記入枠の位置を前
記位置情報マークから算出して該文字記入枠の画像を含
んだ長方形のパタン領域を得、第2回目の切り出し処理
にて前記パタン領域の4辺から内側へ順次画素の状態を
調べて前記文字記入枠の4辺の位置を特定し、該文字記
入枠の画像と枠内部の文字画像領域とを分離して、該文
字画像領域のパタンを得ることを特徴とする手書き文字
切り出し方式。[Claim 1] A mark sheet on which a rectangular character entry frame specifying a character entry position and a position information mark serving as a reference for calculating the coordinates of the character entry frame are printed is optically scanned and converted into an electrical signal. an optical reading section, a quantization section that quantizes the obtained electrical signal to obtain an image signal, an image memory section that inputs the image signal and stores image information, and a handwritten character written on the mark sheet from the image signal. In a character extraction method of a handwritten character recognition device having a character extraction processing unit that extracts a pattern one character at a time,
In the first cutting process, the position of the character entry frame is calculated from the position information mark to obtain a rectangular pattern area that includes the image of the character entry frame, and in the second cutting process, the pattern area is obtained. The positions of the four sides of the character entry frame are identified by sequentially examining the state of the pixels from the four sides inward, and the image of the character entry frame and the character image area inside the frame are separated, and the image of the character image area is separated from the character image area inside the frame. A handwritten character extraction method characterized by obtaining patterns.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3139382A JPH04364593A (en) | 1991-06-12 | 1991-06-12 | Handwritten character segmenting system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3139382A JPH04364593A (en) | 1991-06-12 | 1991-06-12 | Handwritten character segmenting system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04364593A true JPH04364593A (en) | 1992-12-16 |
Family
ID=15244016
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3139382A Pending JPH04364593A (en) | 1991-06-12 | 1991-06-12 | Handwritten character segmenting system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04364593A (en) |
-
1991
- 1991-06-12 JP JP3139382A patent/JPH04364593A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5418865A (en) | Mark sensing on a form | |
| US5101448A (en) | Method and apparatus for processing a document by utilizing an image | |
| US7170647B2 (en) | Document processing apparatus and method | |
| US5696841A (en) | Image processing method and apparatus for extracting vertically and horizontally written text | |
| JP2000200321A (en) | Method for detecting and reading a two-dimensional bar code | |
| CN102722729A (en) | Method of detection document alteration by comparing characters using shape features of characters | |
| CN112308063B (en) | Character recognition device, translation pen, image translation method, and image translation device | |
| JPS63158678A (en) | Inter-word space detecting method | |
| US20040179733A1 (en) | Image reading apparatus | |
| CN100530219C (en) | Image processing apparatus | |
| JP2845370B2 (en) | Character recognition method | |
| JPH04364593A (en) | Handwritten character segmenting system | |
| JP5517028B2 (en) | Image processing device | |
| JPH0916713A (en) | Image area division method | |
| JP7532124B2 (en) | Information processing device, information processing method, and program | |
| JPH06111060A (en) | Optical character reader | |
| US6142374A (en) | Optical character reader | |
| JP2909132B2 (en) | Optical character reader | |
| JPH06111057A (en) | Optical character reader | |
| KR20080041056A (en) | Image forming apparatus and image forming method | |
| JP2931041B2 (en) | Character recognition method in table | |
| JPH0661112B2 (en) | Pattern recognition method | |
| JPH0660220A (en) | Area extracting method for document image | |
| JPH08212296A (en) | Optical character reader | |
| CN119540065A (en) | Method, device, equipment and storage medium for processing text in images |