JPH03246779A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH03246779A
JPH03246779A JP2044818A JP4481890A JPH03246779A JP H03246779 A JPH03246779 A JP H03246779A JP 2044818 A JP2044818 A JP 2044818A JP 4481890 A JP4481890 A JP 4481890A JP H03246779 A JPH03246779 A JP H03246779A
Authority
JP
Japan
Prior art keywords
pattern
character
sub
line width
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2044818A
Other languages
Japanese (ja)
Inventor
Hirohisa Goto
後藤 裕久
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2044818A priority Critical patent/JPH03246779A/en
Publication of JPH03246779A publication Critical patent/JPH03246779A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To perform character recognition at high speed and with superior operability by dividing a prescribed area into arbitrary plural areas, and performing the feature extraction of a character pattern based on a result in which the character direction of each divided area is decided from an extracted sub pattern. CONSTITUTION:The prescribed area including the character string of a document, etc., is divided into the arbitrary plural areas with an area segmenting means 4, and a vertical sub pattern and a horizontal sub pattern area extracted from each divided area with a sub pattern extraction means 10, and the features of the vertical sub pattern and the horizontal sub pattern are extracted with a character direction decision means 20. The character direction of the character string in the prescribed area is decided based on the feature, and the feature extraction of a character pattern is performed based on a decided result. In such a way, it is possible to recognize the characters of the character strings on various kinds of documents, etc., at high speed and with superior operability.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、印刷文書等を光学的に読取る光学式文字読取
り装置(Optical Character Rea
der、以下OCRという)等における高速かつ小型で
、操作性の良い文字認識装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention is an optical character reading device that optically reads printed documents, etc.
The present invention relates to a high-speed, small-sized, and easy-to-operate character recognition device such as OCR (hereinafter referred to as OCR).

(従来の技術) 従来、このような分野の技術としては、特開昭62−1
66479号公報に記載されるものがあった。
(Prior art) Conventionally, as a technology in this field, Japanese Patent Application Laid-Open No. 62-1
There was one described in Publication No. 66479.

近年、日本語情報処理システムの普及により、日本語印
刷文書を計算機に入力する要求が急速に高まり、入力の
高速化及び省力化のために、印刷漢字OCRの必要性が
急速に高まってきている。
In recent years, with the spread of Japanese information processing systems, the demand for inputting Japanese printed documents into computers has rapidly increased, and the need for printed kanji OCR has rapidly increased to speed up input and save labor. .

この印刷漢字OCRでは、文字認識装置が設けられ、そ
の文字認識装置によって印刷文書中の漢字等を読取り、
その読取った漢字等の文字パタンを認識することが必要
となる。
This printed kanji OCR is equipped with a character recognition device that reads kanji, etc. in a printed document, and
It is necessary to recognize the character patterns of the read kanji and other characters.

ところで、印刷文書には、横書きの文書と、新聞や文庫
本等の縦書きの文書とがある。
By the way, printed documents include horizontally written documents and vertically written documents such as newspapers and paperback books.

例えば、印刷文書の一例として名刺を挙げると、第2図
(a)〜(d)に示すように、横書きの名刺(第2図(
a))と縦書きの名刺(第2図(b))とがある。第2
図(C)は、横書き名刺(第2図(a))のパタンであ
り、また第2図(d)は、縦書き名刺(第2図(b))
のパタン例であって第2図(C)のパタンを反時計方向
に90°回転させたパタンになっている。
For example, if we take a business card as an example of a printed document, as shown in Figures 2 (a) to (d), horizontal business cards (Figure 2 (
a)) and a vertical business card (Fig. 2(b)). Second
Figure (C) is a pattern for a horizontally written business card (Figure 2 (a)), and Figure 2 (d) is a pattern for a vertically written business card (Figure 2 (b)).
This is an example of a pattern obtained by rotating the pattern in FIG. 2(C) by 90° counterclockwise.

従来の印刷漢字OCRにおける文字認識装置では、画像
読取手段により読取った入力パタンを画像記憶手段に記
憶し、その画像記憶手段に記憶された入力パタンから文
字切出手段によって1文字ずつ文字パタンを切出す。そ
して、その切出された文字パタンの特徴を特徴抽出手段
によって抽出し、その抽出された特徴と、照合辞書マス
クを格納した辞書記憶手段の内容とを、照合手段によっ
て照合し、入力パタンの文字認識を行うようになってい
る。
In a conventional character recognition device for printed kanji OCR, an input pattern read by an image reading means is stored in an image storage means, and a character pattern is cut out one character at a time by a character cutting means from the input pattern stored in the image storage means. put out. Then, the features of the cut out character pattern are extracted by the feature extracting means, and the extracted features are compared with the contents of the dictionary storage means storing the matching dictionary mask by the matching means, and the characters of the input pattern are Recognition is now possible.

このような文字認識装置では、第2図のように帳票の形
状が同じで文字方向が横書きと縦書きがある場合や、横
書き行と縦書き行が混在した文書を認識する場合には、
オペレータが帳票を見ながら、帳票毎や文字列毎に、横
書きか縦書きかをキーボード等で指定しなければ、正し
く文字認識を行うことができなかった。
With such a character recognition device, when recognizing a form with the same shape and horizontal and vertical text directions as shown in Figure 2, or a document with a mixture of horizontal and vertical lines,
Correct character recognition could not be performed unless the operator, while looking at the form, designated horizontal or vertical writing for each form or character string using a keyboard or the like.

そこで、このような問題を解決するため、前記文献の技
術では、0°、90°、180°、270°回転した4
種類の辞書を予め辞書記憶手段に記憶させておく。そし
て、入力パタンを前記4種類の辞書で認識し、それぞれ
の辞書で認識して得られた認識結果から、最も類似度の
高い結果が出力された辞書の方向を文字方向と判定し、
その判定結果に基づき文字の認識を行うようになってい
た。
Therefore, in order to solve such a problem, the technique of the above-mentioned document uses four
A dictionary of types is stored in a dictionary storage means in advance. Then, the input pattern is recognized with the four types of dictionaries, and from the recognition results obtained by each dictionary, the direction of the dictionary that outputs the result with the highest degree of similarity is determined to be the character direction,
Characters were recognized based on the determination results.

(発明が解決しようとする課題) しかしながら、上記構成の装置では、次のような課題が
あった。
(Problems to be Solved by the Invention) However, the apparatus with the above configuration has the following problems.

前記文献の技術では、文字方向を判定してその判定結果
に基づき文字の認識を行うようになっているが、1つの
文字パタンに対し、0°、90゜180°、270°回
転に対応する4種類の識別を行うことが必要となるため
、文字認識処理に時間がかかる。しかも、0°、90°
、180゜270°といった4種類の辞書を用意しなけ
ればならないため、それらを記憶する辞書記憶手段のメ
モリ容量が大きくなってしまい、装置の大型化を招くと
いう問題があった。さらに、前記文献の技術では、縦書
きや横書きの名刺を自動的に認識することはできても、
名刺以外の印刷文書等については認識することができず
、そのため装置としての汎用性が低く、技術的に十分満
足のゆくものではなかった。
In the technique of the above-mentioned document, the character direction is determined and character recognition is performed based on the determination result. Since it is necessary to perform four types of identification, character recognition processing takes time. Moreover, 0°, 90°
Since four types of dictionaries such as , 180° and 270° must be prepared, the memory capacity of the dictionary storage means for storing them becomes large, resulting in the problem of an increase in the size of the device. Furthermore, although the technology in the above document can automatically recognize business cards written vertically or horizontally,
It was not possible to recognize printed documents other than business cards, and therefore the device had low versatility and was not technically satisfactory.

本発明は前記従来技術が持っていた課題として、名刺以
外の印刷文書等についてはオペレータが文字方向の横書
きかまたは紺書きかを判別して指定しなければならず、
オペレータの操作が煩雑になって処理時間がかかるとい
う点と、装置が大型化する等といった点について解決し
た文字認識装置を提供するものである。
The present invention solves a problem that the prior art had, and for printed documents other than business cards, the operator must distinguish and specify whether the character direction is horizontal or dark blue.
The object of the present invention is to provide a character recognition device that solves problems such as complicated operator operations and long processing times, and an increase in the size of the device.

(課題を解決するための手段) 前記課題を解決するために、第1の発明は、帳票上等の
文字列を含む所定の領域内から1文字ずつ文字パタンを
切出す文字切出手段と、前記文字切出手段で切出された
文字パタンの特徴を抽出する特徴抽出手段と、横書き用
等の所定の照合辞書マスクを格納した辞書記憶手段と、
前記特徴抽出手段で抽出された特徴を前記辞書記憶手段
の内容と照合して前記文字パタンの識別を行う識別手段
とを、備えた文字認識装置において、前記所定の領域を
任意の数の領域に分割して複数の分割領域を生成する領
域切出手段と、前記各分割領域の垂直サブパタン及び水
平サブパタンを任意の領域数だけ抽出するサブパタン抽
出手段と、文字方向判定手段と、変換手段とを、設けた
ものである。
(Means for Solving the Problem) In order to solve the above problem, a first invention provides a character cutting means for cutting out a character pattern one character at a time from within a predetermined area containing a character string on a form, etc.; a feature extracting means for extracting features of the character pattern cut out by the character cutting means; a dictionary storage means storing a predetermined collation dictionary mask for horizontal writing, etc.;
In the character recognition device, the predetermined region is divided into an arbitrary number of regions, the character recognition device comprising: an identification device that identifies the character pattern by comparing the features extracted by the feature extraction device with the contents of the dictionary storage device. A region cutting means for dividing into a plurality of divided regions, a sub-pattern extraction means for extracting vertical sub-patterns and horizontal sub-patterns of each divided region by an arbitrary number of regions, a character direction determining means, and a converting means, It was established.

ここで、文字方向判定手段は、前記サブパタン抽出手段
で抽出された垂直サブパタン及び水平サブパタンの特徴
を抽出し、その特徴に基づき、前記所定の領域内に含ま
れる文字列の文字の方向を判定して文字方向判定結果を
出力する機能を有している。また、変換手段は、前記文
字方向判定結果に基づき、特徴変換またはパタン変換を
行って前記特徴抽出手段で文字パタンの特徴抽出を行な
わせる機能を有している。
Here, the character direction determining means extracts the features of the vertical sub-pattern and the horizontal sub-pattern extracted by the sub-pattern extracting means, and determines the direction of the characters of the character string included in the predetermined area based on the features. It has a function to output the character direction determination result. Further, the converting means has a function of performing feature conversion or pattern conversion based on the result of the character direction determination, thereby causing the feature extracting means to extract the characteristics of the character pattern.

第2〜第4の発明では、前記文字方向判定手段を次のよ
うに構成している。即ち、第2の発明の文字方向判定手
段では、前記複数の分割領域がら垂直サブパタン及び水
平サブパタンか抽出される毎に、該垂直サブパタンの線
幅と水平サブパタンの線幅を算出し、その垂直サブパタ
ンの線幅和と水平サブパタンの線幅和とを求め、その両
線幅和の比と予め定めた線幅比基準値とを比較して文字
方向を判定する機能を有している。
In the second to fourth inventions, the character direction determining means is configured as follows. That is, in the character direction determining means of the second invention, each time a vertical sub-pattern and a horizontal sub-pattern are extracted from the plurality of divided areas, the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern are calculated, and the line width of the vertical sub-pattern is calculated. It has a function of determining the character direction by determining the sum of the line widths of the horizontal sub-pattern and the sum of the line widths of the horizontal sub-patterns, and comparing the ratio of both sums of line widths with a predetermined line width ratio reference value.

第3の発明の文字方向判定手段では、垂直サブパタンの
線幅と水平サブパタンの線幅とを算出し、その両線幅の
比を前記各分割領域毎に求め、その線幅比と予め定めた
線幅比基準値とを比較した分割領域毎の比較結果に基づ
き、文字方向を判定する機能を有している。
In the character direction determination means of the third invention, the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern are calculated, the ratio of both line widths is determined for each divided area, and the line width ratio and the predetermined line width are determined. It has a function of determining the character direction based on the comparison result for each divided area with the line width ratio reference value.

第4の発明の文字方向判定手段では、垂直サブパタンの
線幅と水平サブパタンの線幅を算出し、その両線幅の比
を前記各分割領域毎に求め、その線幅比の平均と予め定
めた線幅比基準値とを比較して文字方向を判定する機能
を有している。
In the character direction determination means of the fourth invention, the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern are calculated, the ratio of both line widths is determined for each divided area, and the average of the line width ratio is determined in advance. It has a function to determine the character direction by comparing it with the line width ratio reference value.

第5の発明では、第1〜第4の発明において、前記の所
定の領域を行とすることを特徴としている。
A fifth invention is characterized in that in the first to fourth inventions, the predetermined area is a row.

(作用) 第1〜第5の発明によれば、以上のように文字認識装置
を構成したので、帳票イメージ等が入力されると、領域
切出平段は、文字列を含む所定の領域(例えば、行)を
任意の数の領域に分割して複数の分割領域を生成し、そ
の生成結果をサブパタン抽出手段に与える。サブパタン
抽出手段は、複数の分割領域をそれぞれ走査して垂直サ
ブパタン及び水平サブパタンを任意の領域数だけ抽出し
、その抽出結果を文字方向判定手段に与える。文字方向
判定手段は、サブパタン抽出手段で抽出された垂直サブ
パタン及び水平サブパタンの特徴(例えば、垂直サブパ
タン及び水平サブパタンの線幅等)を抽出し、その特徴
に基づき、演算等によって前記所定の領域内に含まれる
文字列の文字方向(例えば、縦方向及び横方向)を判定
し、その文字方向判定結果を変換手段へ出力する。
(Operation) According to the first to fifth aspects of the invention, the character recognition device is configured as described above, so that when a form image or the like is input, the area cut-out flat step selects a predetermined area ( For example, a plurality of divided regions are generated by dividing a row) into an arbitrary number of regions, and the generation results are provided to the sub-pattern extraction means. The sub-pattern extracting means scans each of the plurality of divided regions to extract vertical sub-patterns and horizontal sub-patterns in an arbitrary number of regions, and provides the extraction results to the character direction determining means. The character direction determining means extracts the features of the vertical sub-pattern and horizontal sub-pattern extracted by the sub-pattern extracting means (for example, the line widths of the vertical sub-pattern and horizontal sub-pattern), and based on the features, performs calculation etc. to The character direction (for example, vertical direction and horizontal direction) of the character string included in is determined, and the character direction determination result is output to the conversion means.

変換手段は、文字方向判定結果に基づき、特徴抽出手段
における文字パタンの特徴の変換あるいは文字パタンの
パタン変換を行ってその特徴抽出手段で、文字パタンの
的確な特徴抽出を行なわせるように働く。すると、識別
手段では、特徴抽出手段の出力に基づき、辞書記憶手段
内の照合辞書マスクを参照して文字パタンの識別を行う
。これにより、名刺を含めた種々の帳票等における文字
列の文字を高速で、かつ操作性が良く、小さなメモリ容
量で的確に認識可能となる。従って、前記課題を解決で
きるのである。
The converting means converts the characteristics of the character pattern in the feature extracting means or converts the pattern of the character pattern based on the result of the character direction determination, thereby allowing the feature extracting means to accurately extract the characteristics of the character pattern. Then, the identification means identifies the character pattern based on the output of the feature extraction means with reference to the collation dictionary mask in the dictionary storage means. This makes it possible to accurately recognize characters in character strings on various forms, including business cards, at high speed, with good operability, and with a small memory capacity. Therefore, the above problem can be solved.

(実施例) 第1図は、本発明の一実施例を示す文字認識装置の機能
ブロック図である。
(Embodiment) FIG. 1 is a functional block diagram of a character recognition device showing an embodiment of the present invention.

この機能ブロック図を説明する前に、先ず本実施例の原
理を説明する。
Before explaining this functional block diagram, the principle of this embodiment will be explained first.

印刷文書に使用される活字の大部分を占める、例えば明
朝体について、その線幅に着目し、後述するサブパタン
抽出方法を用いて得た水平サブパタンの線幅と垂直サブ
パタンの線幅との比について測定を行った結果を第1表
に示す。
Focusing on the line width of Mincho fonts, which account for most of the type used in printed documents, we calculated the ratio of the line width of horizontal sub-patterns to the line width of vertical sub-patterns, which was obtained using the sub-pattern extraction method described later. The results of the measurements are shown in Table 1.

第1表 水平サブパタン及び垂直サブパタンの 線幅比測定結果 第3図(a)〜(f>は、明朝体「亜」の垂直サブパタ
ンと水平サブパタンを示す図である。第1表の測定では
、第3図(a)に示す明朝体の「亜」の文字について、
活字の大きさ8.12、及び16ポイントを対象に、分
解能37.5μmのイメージスキャンにより得られた2
値パタンについて水平サブパタン及び垂直サブパタンを
抽出し、水平サブパタン線幅及び垂直サブパタン線幅を
それぞれ求めた。
Table 1 Line width ratio measurement results of horizontal sub-patterns and vertical sub-patterns Figures 3(a) to (f) are diagrams showing the vertical sub-patterns and horizontal sub-patterns of the Mincho font "A". , Regarding the character "A" in the Mincho font shown in Figure 3 (a),
2 obtained by image scanning with a resolution of 37.5 μm for type size 8.12 and 16 points.
A horizontal sub-pattern and a vertical sub-pattern were extracted from the value pattern, and the horizontal sub-pattern line width and vertical sub-pattern line width were determined, respectively.

水平サブパタン及び垂直サブパタンの抽出方法は、後述
する(1)式を用いて入力パタンの線幅を求め、該入力
パタンを水平及び垂直方向に走査して検出した文字線の
断面の中から、その断面共が該入力パタンの線幅よりも
十分に長い断面を抽出して行う。
The method for extracting horizontal sub-patterns and vertical sub-patterns is to obtain the line width of the input pattern using equation (1), which will be described later, and then scan the input pattern in the horizontal and vertical directions to extract the line width from the cross-sections of the character lines detected. This is performed by extracting a cross section whose cross section is sufficiently longer than the line width of the input pattern.

第3図(a)に示す明朝体の横書きの「亜」の垂直サブ
パタン例が第3図(b)に、及び水平サブパタン例が第
3図(C)にそれぞれ示されている。また、第3図(a
>、(b)、(c)に対応する縦書きのパタン例が第3
図(d)、(e)。
An example of the vertical sub-pattern of the horizontally written "A" in the Mincho font shown in FIG. 3(a) is shown in FIG. 3(b), and an example of the horizontal sub-pattern is shown in FIG. 3(C). Also, Figure 3 (a
The vertical writing pattern examples corresponding to >, (b), and (c) are shown in the third example.
Figures (d) and (e).

(f)にそれぞれ示されている。すなわち、第3図(d
)は、縦書きの明朝体の「亜」であり、第3図(a)の
文字パタンを反時計方向に90°回転させた状態となっ
ている。従って、第3図(d)の垂直サブパタンを示す
第3図(e)と水平サブパタンを示す第3図(f>とは
、それぞれ第3図(C)、(b)のパタンを反時計方向
に90°回転させたものと同一のパタンとなる。
(f) respectively. That is, Fig. 3 (d
) is a vertically written Mincho font "A", which is obtained by rotating the character pattern of FIG. 3(a) by 90 degrees counterclockwise. Therefore, FIG. 3(e) showing the vertical sub-pattern of FIG. 3(d) and FIG. 3(f> showing the horizontal sub-pattern) are the patterns of FIG. The pattern is the same as the one rotated 90 degrees.

第1表から明らかなように、明朝体は、水平サブパタン
線幅と垂直サブパタン線幅の大きさが大きく異なる。従
って、横書き文字の線幅比(=垂直サブパタン線幅/水
平サブパタン線幅)の大きさは、2゜8以上となってい
る。同様に、縦書き文字の線幅比(=垂直サブパタン線
幅/水平サブパタン線幅)は、0.36以下となってい
る。
As is clear from Table 1, the horizontal sub-pattern line width and the vertical sub-pattern line width of the Mincho font differ greatly. Therefore, the line width ratio (=vertical sub-pattern line width/horizontal sub-pattern line width) of horizontally written characters is 2.8 or more. Similarly, the line width ratio (=vertical sub-pattern line width/horizontal sub-pattern line width) of vertically written characters is 0.36 or less.

以上のことから理解できるように、入力パタンの線幅比
(=垂直サブパタン線幅/水平サブパタン線幅)の大き
さにより、入力パタンが横書きか、縦書きかを判断する
ことが可能となる。
As can be understood from the above, it is possible to determine whether the input pattern is written horizontally or vertically depending on the line width ratio (=vertical sub-pattern line width/horizontal sub-pattern line width) of the input pattern.

次に、以上のような原理に基づき構成された第1図の文
字認識装置の構成を説明する。
Next, the configuration of the character recognition device shown in FIG. 1, which is configured based on the above principle, will be explained.

この文字認識装置は、帳票上の文字を光信号Sinの形
で入力して光電変換により電気信号に変換する画像読取
手段1を有し、その画像読取手段1の出力側には、ラン
ダム・アクセス・メモリ(RAM)等で構成された画像
記憶手段2が接続されている。画像記憶手段2は、例え
ば1帳票分のイメージを格納するもので、その出力側に
は、行位置検出手段3及び領域切出手段4が接続されて
いる。行位置検出手段3は、画像記憶手段2の帳票イメ
ージより、その画像記憶手段2における行の位置座標を
出力する機能を有している。領域切出手段4は、行位置
検出手段3の出力に基づき、画像記憶手段2の帳票イメ
ージの行を、文字を含む複数の領域に分割する機能を有
し、その出力側には、サブパタン抽出手段10が接続さ
れている。
This character recognition device has an image reading means 1 that inputs characters on a form in the form of an optical signal Sin and converts it into an electrical signal by photoelectric conversion.The output side of the image reading means 1 has a random access - Image storage means 2 composed of memory (RAM) etc. is connected. The image storage means 2 stores, for example, an image for one form, and a line position detection means 3 and an area cutting means 4 are connected to its output side. The line position detection means 3 has a function of outputting the position coordinates of a line in the image storage means 2 from the form image in the image storage means 2. The area cutting means 4 has a function of dividing the line of the form image in the image storage means 2 into a plurality of areas including characters based on the output of the line position detecting means 3, and has a sub-pattern extraction function on the output side. Means 10 are connected.

サブパタン抽出手段10は、領域切出手段4で切出され
た複数の分割領域の垂直サブパタン及び水平サブパタン
を複数の領域数だけ抽出する機能を有している。このサ
ブパタン抽出手段10は、領域切出手段4から出力され
た1領域分のデータを格納するバッファ等からなる領域
記憶手段11と、領域切出手段4から出力された領域に
ついて領域線幅Waを計算する領域線幅計算手段12と
、領域記憶手段11の領域内を垂直に走査して領域の垂
直サブパタンを抽出する垂直サブパタン抽出手段13と
、領域記憶手段11の領域内を水平に走査して領域の水
平サブパタンを抽出する水平サブパタン抽出手段14と
で、構成されている。この垂直サブパタン抽出手段13
及び水平サブパタン抽出手段14の出力側には、文字方
向判定手段20が接続されている。
The sub-pattern extracting means 10 has a function of extracting the vertical sub-patterns and horizontal sub-patterns of the plurality of divided regions cut out by the region cutting means 4 by the number of the plural regions. This sub-pattern extraction means 10 includes an area storage means 11 consisting of a buffer or the like for storing data for one area outputted from the area extraction means 4, and an area line width Wa for the area outputted from the area extraction means 4. A region line width calculating means 12 for calculating, a vertical sub-pattern extracting means 13 for vertically scanning the inside of the region storage means 11 to extract a vertical sub-pattern of the region, and a vertical sub-pattern extraction means 13 for horizontally scanning the inside of the region storage means 11 for extracting vertical sub-patterns of the region. The horizontal sub-pattern extracting means 14 extracts a horizontal sub-pattern of a region. This vertical sub-pattern extraction means 13
A character direction determining means 20 is connected to the output side of the horizontal sub-pattern extracting means 14.

文字方向判定手段20は、垂直サブパタン及び水平サブ
パタンの特徴、例えば線幅を抽出し、その線幅に基づき
、文字方向が縦書きが横書きかを判定し、その文字方向
判定結果を出力するものであり、判定手段21と、バッ
ファ等からなる記憶手段22とで構成されている。
The character direction determining means 20 extracts features of the vertical sub-pattern and horizontal sub-pattern, such as line width, determines whether the character direction is vertical or horizontal based on the line width, and outputs the character direction determination result. It is composed of a determining means 21 and a storage means 22 consisting of a buffer or the like.

また、行位置検出手段3の出力側には文字切出手段30
が接続されている。文字切出手段30は、行位置検出手
段3から出力された各行の行位置座標を入力し、1文字
ずつを切出した文字パタンを出力する機能を有し、その
出力側には、特徴抽出手段40が接続されている。
Further, on the output side of the line position detection means 3, a character cutting means 30 is provided.
is connected. The character cutting means 30 has a function of inputting the line position coordinates of each line outputted from the line position detecting means 3 and outputting a character pattern by cutting out each character, and has a feature extraction means on the output side. 40 are connected.

特徴抽出手段40は、文字切出手段30で切出された文
字パタンに基づき、特徴マトリクスを生成するものであ
り、パタン記憶手段41、線幅計算手段42、サブパタ
ン抽出手段43、文字枠検出手段44、文字枠分割決定
手段45、特徴マトリクス抽出手段46、及び特徴変換
手段47より構成されている。
The feature extraction means 40 generates a feature matrix based on the character pattern cut out by the character cutout means 30, and includes a pattern storage means 41, a line width calculation means 42, a subpattern extraction means 43, and a character frame detection means. 44, character frame division determining means 45, feature matrix extracting means 46, and feature converting means 47.

パタン記憶手段41は、文字切出手段30で切出された
文字パタンを格納し、その格納結果をサブパタン抽出手
段43及び文字枠検出手段44へ与えるものであり、レ
ジスタ等で構成されている。
The pattern storage means 41 stores the character patterns cut out by the character cutout means 30, and provides the storage results to the sub-pattern extraction means 43 and the character frame detection means 44, and is composed of registers and the like.

線幅計算手段42は、文字切出手段30で切出された文
字パタンの線幅Wを計算し、その計算結果をサブパタン
抽出手段43及び特徴マトリクス抽出手段46へ与える
機能を有している。
The line width calculating means 42 has a function of calculating the line width W of the character pattern cut out by the character cutting means 30 and providing the calculation result to the sub pattern extraction means 43 and the feature matrix extraction means 46.

サブパタン抽出手段43は、パタン記憶手段41につい
て複数の方向く例えば、垂直方向、水平方向、右斜め方
向、左斜め方向)に走査して垂直サブパタンVSP、水
平サブパタンH3P、右斜めサブパタンR3P、及び左
斜めサブパタンLSPを抽出し、その抽出結果を特徴マ
トリクス抽出手段46へ出力する機能を有している。文
字枠検出手段44は、パタン記憶手段41内の文字パタ
ンに外接する文字枠を検出し、それを文字枠分割決定手
段45へ出力する機能を有している。文字枠分割決定手
段45は、検出された文字枠の内部領域を複数の領域に
分割するためのX軸(文字枠の水平方向)、Y軸(文字
枠の垂直方向)上の分割点座標を決定し、その決定結果
を特徴マトリクス抽出手段46へ出力するものである。
The sub-pattern extraction means 43 scans the pattern storage means 41 in a plurality of directions (for example, vertical direction, horizontal direction, right diagonal direction, left diagonal direction) and extracts vertical sub-patterns VSP, horizontal sub-patterns H3P, right-diagonal sub-patterns R3P, and left diagonal sub-patterns. It has a function of extracting the diagonal sub-pattern LSP and outputting the extraction result to the feature matrix extraction means 46. The character frame detection means 44 has a function of detecting a character frame circumscribing the character pattern in the pattern storage means 41 and outputting it to the character frame division determining means 45. The character frame division determining means 45 determines the coordinates of dividing points on the X axis (horizontal direction of the character frame) and the Y axis (vertical direction of the character frame) for dividing the internal region of the detected character frame into a plurality of regions. The determination result is output to the feature matrix extraction means 46.

特徴マトリクス抽出手段46は、パタン記憶手段41内
の文字パタンの特徴を抽出して特徴マトリクスを生成し
、それを特徴変換手段47へ与える機能を有している。
The feature matrix extraction means 46 has a function of extracting the features of the character patterns in the pattern storage means 41 to generate a feature matrix, and providing it to the feature conversion means 47.

特徴変換手段47は、判定手段21から出力された文字
方向判定結果に基づき、特徴マトリクス抽出手段46か
らの特徴マトリクスを所定角度回転する機能を有してい
る。この特徴変換手段47の出力側には、識別手段51
が接続され、その識別手段51に辞書記憶手段50が接
続されている。
The feature converting means 47 has a function of rotating the feature matrix from the feature matrix extracting means 46 by a predetermined angle based on the character direction determination result output from the determining means 21. On the output side of this feature conversion means 47, identification means 51
is connected to the identification means 51, and a dictionary storage means 50 is connected to the identification means 51.

辞書記憶手段50は、例えば横書き用の照合辞書マスク
を格納するもので、リード・オンリ・メモリ(ROM>
等で構成されている。識別手段51は、特徴抽出手段4
7からの特徴マトリクスを照合辞書マスクで照合し、そ
の照合した文字パタンの文字名5outを出力する機能
を有している。
The dictionary storage means 50 stores, for example, a collation dictionary mask for horizontal writing, and is a read-only memory (ROM).
It is made up of etc. The identification means 51 is the feature extraction means 4
It has a function of collating the feature matrix from 7 with a collation dictionary mask and outputting the character name 5out of the collated character pattern.

次に、以上のように構成される文字認識装置の動作を、
第4図及び第5図(a)〜(e)を参照しつつ説明する
。なお、第4図は名刺のイメージを示す図、第5図(a
〉〜(e)は2値パタンと各サブパタンとを説明するた
めの図である。
Next, we will explain the operation of the character recognition device configured as above.
This will be explained with reference to FIG. 4 and FIGS. 5(a) to 5(e). In addition, Figure 4 is a diagram showing the image of a business card, Figure 5 (a
> to (e) are diagrams for explaining a binary pattern and each sub-pattern.

第1図において、帳票上の文字に対応した光信号Sin
が画像読取手段1に入力されると、画像読取手段1は、
光信号Sinを電気信号に変換して画像記憶手段2へ出
力する。画像記憶手段2は、画像読取手段1からの電気
信号を入力し、1帳票分のイメージを格納する。行位置
検出手段3は、画像記憶手段2に格納された帳票イメー
ジを走査して水平方向と垂直方向の周辺分布を作成し、
行の切出しを行い、画像記憶手段2における行の位置座
標を出力する。
In FIG. 1, the optical signal Sin corresponding to the characters on the form
is input to the image reading means 1, the image reading means 1
The optical signal Sin is converted into an electrical signal and output to the image storage means 2. The image storage means 2 receives an electrical signal from the image reading means 1 and stores an image for one form. The line position detection means 3 scans the form image stored in the image storage means 2 to create horizontal and vertical peripheral distributions,
The line is cut out, and the position coordinates of the line in the image storage means 2 are output.

即ち、第4図のような名刺のイメージが画像記憶手段2
に格納されている場合、行位置検出手段3ではそのイメ
ージに対して水平走査を行い、周辺分布h (y)を作
成し、1行目の開始位fiYs1と終了位置Yel、2
行目の開始位置Ys2と終了位置Ye2.3行目の開始
位置Ys3と終了位置Ye3を順次得る。次に、行位置
検出手段3は、画像記憶手段2のイメージに対して行毎
に垂直走査を行い、例えば2行目について開始位置XS
と終了位置Xeを得る。このようにして行位置検出手段
3は、画像記憶手段2のイメージに対して行位置を検出
し、その検出結果を領域切出手段4及び文字切出手段3
0へ出力する。
That is, the image of the business card as shown in FIG. 4 is stored in the image storage means 2.
If the image is stored in
The start position Ys2 and end position Ye2 of the row, and the start position Ys3 and end position Ye3 of the third row are sequentially obtained. Next, the line position detecting means 3 vertically scans the image in the image storage means 2 line by line, and for example, for the second line, the starting position XS
and the end position Xe is obtained. In this way, the line position detecting means 3 detects the line position with respect to the image in the image storage means 2, and transfers the detection result to the area cutting means 4 and the character cutting means 3.
Output to 0.

領域切出手段4は、行位置検出手段3から出力された画
像記憶手段2内の行の位置を検出し、その行を、文字を
含む複数の領域に分割する。第4図を例にとると、「吉
」 「田」 「正」の1文字ずつを含む3つの領域ml
、m2.m3に分割する。
The area cutting means 4 detects the position of the line in the image storage means 2 output from the line position detecting means 3, and divides the line into a plurality of areas including characters. Taking Figure 4 as an example, there are three areas ml containing one character each of ``Kichi'', ``Den'', and ``Sei''.
, m2. Divide into m3.

即ち、この領域切出手段4では、第4図に示すように、
垂直走査による各文字の中心Xml、Xm2、Xm3の
中点Xdl、Xd2を分割点とし、それぞれml、m2
.m3の3つの領域(分割領域)に分割する。そして、
領域切出手段4は、1領域のデータを、サブパタン抽出
手段10内の領域記憶手段11及び領域線幅計算手段1
2へ出力する。
That is, in this area cutting means 4, as shown in FIG.
The midpoints Xdl and Xd2 of the centers Xml, Xm2, and Xm3 of each character by vertical scanning are used as dividing points, and ml and m2 are respectively
.. Divide into three regions (divided regions) of m3. and,
The region cutting means 4 stores the data of one region in the region storage means 11 in the subpattern extraction means 10 and the region line width calculation means 1.
Output to 2.

領域記憶手段11は、領域切出手段4から出力された1
領域分のデータを格納し、その格納結果を垂直サブパタ
ン抽出手段13及び水平サブパタン抽出手段14へ出力
する。領域線幅計算手段12は、領域切出手段4から出
力された領域について領域線幅Waを計算し、その線幅
Waを垂直サブパタン抽出手段13及び水平サブパタン
抽出手段14へ出力する。
The area storage means 11 stores 1 output from the area extraction means 4.
Data for the area is stored, and the storage results are output to the vertical sub-pattern extraction means 13 and the horizontal sub-pattern extraction means 14. The area line width calculating means 12 calculates the area line width Wa for the area output from the area cutting means 4, and outputs the line width Wa to the vertical sub-pattern extracting means 13 and the horizontal sub-pattern extracting means 14.

この領域線幅計算手段12は、例えば公知の画像処理用
フィルタ回路と同様にシフトレジスタ構成となっており
、次式に示すような公知の近似式を用いて線幅Wを計算
する。
The area line width calculation means 12 has a shift register configuration similar to, for example, a known image processing filter circuit, and calculates the line width W using a known approximate expression as shown in the following equation.

W=1/ (1−(Q/A))     ・・・・・・
(1)この(1)式において、Qは(2X2>の窓(W
indow:方形領域)の全ての点が黒点となる点(こ
れを4黒点という〉の個数、Aは全黒点の個数である。
W=1/ (1-(Q/A)) ・・・・・・
(1) In this equation (1), Q is a window (W
The number of points (this is called 4 black points) in which all points in a rectangular area are black points, and A is the number of all black points.

領域線幅計算手段12では、これら4黒点の個数Q及び
全黒点の個数Aを計数し、その計数結果から(1)式に
従って線幅Wを演算により求める。
The area line width calculation means 12 counts the number Q of these four black dots and the number A of all black dots, and calculates the line width W from the counting results according to equation (1).

垂直サブパタン抽出手段13は、領域記憶手段11の領
域内を垂直に走査し、黒点の連続する長さと、領域線幅
計算部平段12で計算された線幅Waとの関係により、
領域の垂直サブパタンを抽出し、その抽出結果を文字方
向判定手段20内の判定手段21へ出力する。また、水
平サブパタン抽出手段14は、領域記憶手段11の領域
内を水平に走査し、黒点の連続する長さと、領域線幅計
算手段12で計算された線幅Waとの関係により、領域
の水平サブパタンを抽出し、その抽出結果を判定手段2
1へ出力する。
The vertical sub-pattern extraction means 13 vertically scans the area in the area storage means 11, and calculates the following based on the relationship between the length of continuous black dots and the line width Wa calculated by the area line width calculation unit 12.
The vertical sub-pattern of the area is extracted, and the extraction result is output to the determining means 21 in the character direction determining means 20. Further, the horizontal sub-pattern extraction means 14 horizontally scans the area in the area storage means 11, and determines the horizontal pattern of the area based on the relationship between the length of continuous black dots and the line width Wa calculated by the area line width calculation means 12. The sub-pattern is extracted and the extraction result is determined by the judgment means 2.
Output to 1.

文字方向判定手段20における判定手段21は、垂直サ
ブパタン抽出手段13に格納されている領域の垂直サブ
パタンについて、領域線幅計算手段12と同様に全黒点
数と4黒点数を求め、(1)式を用いて垂直サブパタン
の線幅Wvを求める。
The determining means 21 in the character direction determining means 20 calculates the total number of black dots and the number of four black dots for the vertical sub-pattern of the area stored in the vertical sub-pattern extraction means 13 in the same way as the area line width calculating means 12, and calculates the number of total black dots and the number of four black dots using the equation (1). The line width Wv of the vertical sub-pattern is determined using .

また、水平サブパタン抽出手段14に格納されている領
域の水平サブパタンについても、同様にして線幅whを
求める。このようにして求めた垂直サブパタンの線幅W
v及び水平サブパタンの線幅whは、記憶手段22に格
納される。これらの線幅計算処理と記憶手段22への格
納処理とは、領域切出手段4が切出すべき全ての領域(
例えば、第4図の3つの分割領域ml、m2.m3)に
ついて行われる。
Furthermore, the line width wh is determined in the same manner for the horizontal sub-patterns in the area stored in the horizontal sub-pattern extracting means 14. The line width W of the vertical sub-pattern obtained in this way
v and the line width wh of the horizontal sub-pattern are stored in the storage means 22. These line width calculation processes and storage processes in the storage means 22 are performed to calculate all the areas (
For example, the three divided areas ml, m2. m3).

判定手段21では、領域切出手段4が切出すべき全ての
領域(例えば、ml、m2.m3)を切出した後に、記
憶手段22に格納された前記切出すべき全ての領域の垂
直サブパタンの線幅Wvと水平サブパタンの線幅whを
読出し、垂直サブパタンの線幅Wvと水平サブパタンの
線幅whのそれぞれの総和を求める。さらに、この判定
手段21では、垂直サブパタンの線幅の総和ΣWvと水
平サブパタンの線幅の総和Σwhとの比ΣWv/Σwh
を求め、その比を予め定めた線幅比基準値wthと比較
し、次の(2)式、(3)式を満足するか否かの判定を
行う。
In the determination means 21, after the region cutting means 4 cuts out all the regions to be cut out (for example, ml, m2.m3), the vertical subpattern lines of all the regions to be cut out are stored in the storage means 22. The width Wv and the line width wh of the horizontal sub-pattern are read, and the sum of the line width Wv of the vertical sub-pattern and the line width wh of the horizontal sub-pattern is determined. Furthermore, this determining means 21 determines that the ratio ΣWv/Σwh of the total line width ΣWv of the vertical sub-patterns and the total sum Σwh of the line widths of the horizontal sub-patterns
is determined, and the ratio is compared with a predetermined line width ratio reference value wth to determine whether the following equations (2) and (3) are satisfied.

ΣWv/Σwh≧wth     ・・・・・・(2)
ΣWv/Σwh<wth    ・曲直3)(本実施例
では、例えばWth=1> 判定手段21では、(2)式を満足すれば、文字方向を
横書きと判定して横書きの文字方向判定結果を、(3)
式を満足すれば、文字方向を縦書きと判定して縦書きの
文字方向判定結果を、それぞれ特徴変換手段47へ出力
する。
ΣWv/Σwh≧wth ・・・・・・(2)
ΣWv/Σwh<wth・curved straight 3) (in this embodiment, for example, Wth=1>) If the equation (2) is satisfied, the determining means 21 determines that the character direction is horizontal writing, and uses the horizontal writing character direction determination result as (3)
If the formula is satisfied, the character direction is determined to be vertical writing, and the vertical writing character direction determination results are output to the feature conversion means 47, respectively.

以上のように、画像記憶手段2内の帳票イメージ上の文
字の方向が判定した後、次に説明するように、帳票イメ
ージ上の各文字に対して認識処理が行われる。
As described above, after the direction of the characters on the form image in the image storage means 2 has been determined, recognition processing is performed on each character on the form image, as described below.

先ず、文字切出手段30では、行位置検出手段3から出
力された各行の行位置座標を入力すると、その行位置検
出手段3で得た画像記憶手段2内における行位置の行に
ついて、垂直に走査を行って周辺分布を作成し、その周
辺分布に基づき、1文字ずつ切出した文字パタンを、特
徴抽出手段40内のパタン記憶手段41及び線幅計算手
段42に与える。パタン記憶手段41は、文字切出手段
30で切出された文字パタンを格納する。線幅計算手段
42は、文字切出手段30から出力された文字パタンに
ついて、領域線幅計算手段12と同様にして、全黒点数
と4黒点数を求め、前記(1)式を用いて文字パタンの
線幅Wを計算し、その計算結果をサブパタン抽出手段4
3及び特徴マトリクス抽出手段46に与える。
First, when inputting the line position coordinates of each line outputted from the line position detecting means 3, the character cutting means 30 vertically cuts out the line at the line position in the image storage means 2 obtained by the line position detecting means 3. A peripheral distribution is created by scanning, and character patterns cut out one character at a time based on the peripheral distribution are provided to a pattern storage means 41 and a line width calculation means 42 in the feature extraction means 40. The pattern storage means 41 stores character patterns cut out by the character cutting means 30. The line width calculation means 42 calculates the number of total black dots and the number of four black dots for the character pattern output from the character cutting means 30 in the same manner as the area line width calculation means 12, and calculates the number of black dots and four black dots for the character pattern output from the character cutting means 30, and calculates the number of black dots and the number of four black dots for the character pattern outputted from the character cutting means 30, and calculates the number of black dots and the number of four black dots for the character pattern output from the character cutting means 30, The line width W of the pattern is calculated and the calculation result is sent to the sub-pattern extraction means 4.
3 and the feature matrix extraction means 46.

サブパタン抽出手段43は、パタン記憶手段41に格納
された文字パタンに対して垂直走査を全面に行い、黒点
の連続する長さと、線幅計算手段42で計算された線幅
Wとの関係により、垂直サブパタンVSPを抽出する。
The sub-pattern extraction means 43 performs vertical scanning over the entire surface of the character pattern stored in the pattern storage means 41, and based on the relationship between the length of continuous black dots and the line width W calculated by the line width calculation means 42, Extract the vertical sub-pattern VSP.

同様にして、サブパタン抽出手段43は、水平走査によ
り水平サブパタンH3Pを、右斜め45°走査により右
斜めサブパタンR8Pを、左斜め45°走査により左斜
めサブパタンLSPを、それぞれ抽出する。
Similarly, the sub-pattern extracting means 43 extracts the horizontal sub-pattern H3P by horizontal scanning, the right-diagonal sub-pattern R8P by scanning diagonally 45 degrees to the right, and the left diagonal sub-pattern LSP by scanning diagonally 45 degrees left.

このようにして抽出されたサブパタンの例が第5図(a
)〜(e)に示されている。第5図(a)は外接する文
字枠F内の2値パタンからなる原パタンであり、このよ
うな原パタンから得られた垂直サブパタンか第5図(b
)に、水平サブパタンか第5図(C)に、右斜めサブパ
タンか第5図(d)に、左斜めサブパタンか第5図(e
)に、それぞれ示されている。
An example of sub-patterns extracted in this way is shown in Figure 5 (a
) to (e). Figure 5(a) is an original pattern consisting of a binary pattern within the circumscribed character frame F, and the vertical subpattern obtained from such an original pattern is
), the horizontal sub-pattern is shown in Figure 5 (C), the right diagonal sub-pattern is shown in Figure 5 (d), and the left diagonal sub-pattern is shown in Figure 5 (e).
) are shown respectively.

パタン記憶手段41の出力側に接続された文字枠検出手
段44では、パタン記憶手段41内の文字パタンに外接
する文字枠Fを検出し、その検出結果を文字枠分割決定
手段45へ出力する。文字枠分割決定手段45は、検出
された文字枠Fの内部領域をMXNの領域(但し、M、
Nは整数、本実施例では例えばM=N=5とする〉に分
割するための、X軸およびY軸上の分割点座標を決定す
る。ここで、X軸は文字枠Fの水平方向を、Y軸は文字
枠Fの垂直方向をそれぞれ示す。
A character frame detection means 44 connected to the output side of the pattern storage means 41 detects a character frame F circumscribing the character pattern in the pattern storage means 41, and outputs the detection result to the character frame division determination means 45. The character frame division determining means 45 divides the internal area of the detected character frame F into an area of MXN (however, M,
N is an integer; in this embodiment, for example, M=N=5. The coordinates of the dividing points on the X-axis and Y-axis are determined. Here, the X axis indicates the horizontal direction of the character frame F, and the Y axis indicates the vertical direction of the character frame F, respectively.

次に、特徴マトリクス抽出手段46は、文字枠分割決定
手段45によって決定された分割点座標に基づき、垂直
、水平、右斜め及び左斜めの各サブパタン(VSP、H
3P、H3P及びLSP)におけるパタン記憶手段41
上の文字枠領域を、MXNの領域に分割し、得られた各
分割領域内の黒点数Bijを計数する。この黒点Bij
と、線幅計算手段42で求めた線幅Wとを用い、次の式
(4)によって文字線長Lijを示す特徴を計算し、M
XNX4次元の特徴マトリクスを作成する。
Next, the feature matrix extraction means 46 extracts vertical, horizontal, right diagonal, and left diagonal sub-patterns (VSP, H
3P, H3P and LSP) pattern storage means 41
The upper character frame area is divided into MXN areas, and the number of black dots Bij in each of the resulting divided areas is counted. This sunspot Bij
and the line width W obtained by the line width calculation means 42, calculate the feature indicating the character line length Lij by the following equation (4), and calculate M
Create an XNX four-dimensional feature matrix.

Lij=Bij/W     ・・・・・・(4)さら
に、この特徴マトリクス抽出手段46では、垂直サブパ
タン■SPの特徴マトリクスに対しては文字枠FのY軸
方向の長さΔYで、水平サブパタンH3Pの特徴マトリ
クスに対してはX軸方向の長さΔXで、右斜めサブパタ
ンR3P及び左斜めサブパタンLSPの特徴マトリクス
に対しては(Δχ+ΔY)/2で、それぞれ正規化を行
い、文字の大きさによる変動を吸収した]VIXNX4
次元の特徴マトリクスを作成する。
Lij=Bij/W (4) Furthermore, this feature matrix extraction means 46 extracts the horizontal subpattern by the length ΔY of the character frame F in the Y axis direction for the feature matrix of the vertical subpattern ■SP. The feature matrix of H3P is normalized by the length ΔX in the X-axis direction, and the feature matrix of right diagonal sub-pattern R3P and left diagonal sub-pattern LSP is normalized by (Δχ + ΔY)/2, and the character size is ]VIXNX4
Create a dimensional feature matrix.

特徴変換手段47は、判定手段21から出力された文字
方向判定結果に基づき、特徴マトリクス抽出手段46で
抽出された特徴マトリクスを変換する。即ち、文字方向
判定結果が横書きである場合、特徴マトリクス抽出手段
46で抽出された特徴マトリクスをそのまま識別手段5
1へ出力する。
The feature converter 47 converts the feature matrix extracted by the feature matrix extractor 46 based on the character direction determination result output from the determiner 21. That is, when the character direction determination result is horizontal writing, the feature matrix extracted by the feature matrix extracting means 46 is directly used by the identifying means 5.
Output to 1.

また、文字方向判定結果が縦書きである場合、特徴マト
リクス抽出手段46で抽出した特徴マトリクスを90°
時計方向に回転し、水平特徴マトリクスを垂直特徴マト
リクスへ、垂直特徴マトリクスを水平特徴マトリクスへ
、左斜め特徴マトリクスを右斜め特徴マトリクスへ、右
斜め特徴マトリクスを左斜め特徴マトリクスへ、それぞ
れ変換して識別手段51に出力する。
Further, when the character direction determination result is vertical writing, the feature matrix extracted by the feature matrix extraction means 46 is
Rotate clockwise and convert the horizontal feature matrix to vertical feature matrix, the vertical feature matrix to horizontal feature matrix, the left diagonal feature matrix to right diagonal feature matrix, and the right diagonal feature matrix to left diagonal feature matrix. It is output to the identification means 51.

その後、識別手段51では、辞書記憶手段50に格納さ
れた照合辞書マスクを用い、各特徴毎に指定された照合
辞書マスクfjと、抽出された特徴マトリクスfiとの
間に、次の式(5)で定義される距離りを適用し、この
距離りが最小の値となるような辞書マスクのカテゴリ名
を文字名S。
Thereafter, the identification means 51 uses the collation dictionary mask stored in the dictionary storage means 50 to create the following equation (5) between the collation dictionary mask fj specified for each feature and the extracted feature matrix fi. ) is applied, and the category name of the dictionary mask for which this distance is the minimum value is the character name S.

utの形で出力する。Output in ut format.

これにより、帳票上の文字の的確な認識が行える。This allows accurate recognition of characters on the form.

以上のように、本実施例では次のような利点を有してい
る。
As described above, this embodiment has the following advantages.

(i)本実施例では、領域切出手段4により、帳票上の
文字列を含む所定の領域を任意の複数の領域に分割し、
各分割領域からサブパタン抽出手段10で垂直サブパタ
ン及び水平サブパタンを抽出し、文字方向判定手段20
により、垂直サブパタン及び水平サブパタンの特徴、例
えば線幅を抽出し、その特徴に基づき所定の領域内の文
字列の文字の方向を自動的に判定し5、その文字方向判
定結果に基づき、文字パタンの特徴を抽出するようにし
た。そのため、名刺を含む種々の帳票について、オペレ
ータが張票単位や、帳票上の文字列毎に文字方向を指定
するという煩雑な作業が省略でき、それによって名刺を
含む種々の帳票上等の文字を、操作性良く、高精度かつ
高速に認識することができる。
(i) In this embodiment, the area cutting means 4 divides a predetermined area including a character string on a form into a plurality of arbitrary areas,
A subpattern extracting means 10 extracts a vertical subpattern and a horizontal subpattern from each divided area, and a character direction determining means 20 extracts a vertical subpattern and a horizontal subpattern.
extracts features of vertical sub-patterns and horizontal sub-patterns, such as line width, automatically determines the character direction of a character string within a predetermined area based on the characteristics5, and then determines the character pattern based on the character direction determination result. Extracts the features of Therefore, for various forms including business cards, the operator can omit the complicated work of specifying the character direction for each form or for each character string on a form. , it is easy to operate, and can be recognized with high precision and high speed.

(ii)  本実施例では、領域切出手段4により、所
定の領域を任意の複数の領域に分割し、各分割領域につ
いてサブパタン抽出手段10で垂直サブパタン及び水平
サブパタンを抽出し、文字方向判定手段20で文字方向
を判定し、その判定結果に基づき特徴抽出手段40で文
字パタンの特徴を抽出している。そのため、文字方向の
判定に必要なメモリ(領域記憶手段11及び記憶手段2
2等〉は、所定の領域全体を記憶する必要がなく、分割
領域の大きさのメモリ容量で十分である。さらに、文字
方向判定手段20の文字方向判定結果に基づき、特徴抽
出手段40で文字パタンの特徴抽出を行っているので、
辞書記憶手段50に格納する所定角度回転した照合辞書
マスクの数を、従来のものに比べて少なくでき、それに
よって辞書記憶手段50のメモリ容量の小型化が図れる
。このように、従来のものに比べてメモリ容量を小さく
できるので、装置全体の小型化が可能となる。
(ii) In this embodiment, the region cutting means 4 divides a predetermined region into a plurality of arbitrary regions, the sub-pattern extracting means 10 extracts a vertical sub-pattern and a horizontal sub-pattern for each divided region, and the character direction determining means At step 20, the character direction is determined, and based on the determination result, feature extraction means 40 extracts the characteristics of the character pattern. Therefore, the memory (area storage means 11 and storage means 2
2 etc., it is not necessary to store the entire predetermined area, and the memory capacity of the divided area is sufficient. Furthermore, since the feature extraction means 40 extracts the characteristics of the character pattern based on the character direction determination result of the character direction determination means 20,
The number of collation dictionary masks that are rotated by a predetermined angle and stored in the dictionary storage means 50 can be reduced compared to the conventional one, thereby making it possible to reduce the memory capacity of the dictionary storage means 50. In this way, the memory capacity can be made smaller than that of the conventional device, so the entire device can be made smaller.

(iii )  文字方向判定手段20は、垂直サブパ
タンの線幅Wvと水平サブパタンの線幅whとの比を求
め、その比と予め設定された線幅比基準値Wthとを比
較し、その比較結果に基づき行内の文字列の文字の方向
を判定するようにしているので、構成が簡単で、精度の
良い文字方向の判定結果が得られる。
(iii) The character direction determining means 20 calculates the ratio between the line width Wv of the vertical sub-pattern and the line width wh of the horizontal sub-pattern, compares the ratio with a preset line width ratio reference value Wth, and determines the comparison result. Since the direction of the characters in the character string within a line is determined based on this, the configuration is simple and highly accurate character direction determination results can be obtained.

なお、本発明は、図示の実施例に限定されず、種々の変
形が可能である。その変形例としては、例えば次のよう
なものがある。
Note that the present invention is not limited to the illustrated embodiment, and various modifications are possible. Examples of such modifications include the following.

(i)  上記実施例では、切出すべき各領域の垂直サ
ブパタンの線幅Wvと水平サブパタンの線幅whとを、
各領域毎に記憶手段22に格納し、領域切出手段4が切
出すべき全ての領域を切出した後に、文字方向を判定す
るようにしているが、他の方法によって文字方向を判定
するようにしても良い。
(i) In the above embodiment, the line width Wv of the vertical sub-pattern and the line width wh of the horizontal sub-pattern of each region to be cut out are
Although each region is stored in the storage means 22 and the character direction is determined after the region cutting means 4 has cut out all the regions to be cut out, it is also possible to judge the character direction by another method. It's okay.

例えば、各領域毎に垂直サブパタンの線幅Wvと水平サ
ブパタンの線幅whとを求めた後に、垂直サブパタンの
線幅Wvと水平サブパタンの線幅whの比を求め、その
線幅比を記憶手段22に各領域毎に格納する。そして、
領域切出手段4によって切出すべき領域を全て切出した
後に、判定手段21により、記憶手段22に格納された
領域毎の線幅比について、それぞれの線幅比と予め定め
た線幅比基準値とをそれぞれ比較し、縦書きと判定され
た領域数Atと横書きと判定された領域数Ayとを求め
、次の(6)式及び(7)式の判定を行う。
For example, after determining the line width Wv of the vertical sub-pattern and the line width wh of the horizontal sub-pattern for each area, the ratio of the line width Wv of the vertical sub-pattern to the line width wh of the horizontal sub-pattern is determined, and the line width ratio is stored in the storage device. 22 for each area. and,
After all the regions to be cut out are cut out by the region cutting means 4, the determining means 21 determines each line width ratio and a predetermined line width ratio reference value with respect to the line width ratio for each region stored in the storage means 22. The number of areas At determined to be vertical writing and the number Ay of areas determined to be horizontal writing are determined, and the following equations (6) and (7) are determined.

At≦Ay      ・・・・・ペロ)At>Ay 
      ・・・・・・(7)判定手段21では、 (6)式を満足するならば、 横書きの文字方向判定結果を、(7)式を満足するなら
ば、縦方向の文字判定結果を、それぞれ出力し、それを
特徴変換手段47へ与えるようにしてもよい。
At≦Ay ... Pero) At>Ay
(7) The determining means 21 determines the horizontal character direction determination result if the formula (6) is satisfied, and the vertical character determination result if the formula (7) is satisfied. It is also possible to output each of them and provide them to the feature conversion means 47.

また、判定手段21では、記憶手段22に格納された領
域毎の線幅比の平均Wavを求め、その平均Wavと予
め定めた線幅比基準値wthとを比較し、その比較結果
に基づき文字方向を判定するようにしても良い。
Further, the determining means 21 calculates the average Wav of the line width ratio for each area stored in the storage means 22, compares the average Wav with a predetermined line width ratio reference value wth, and based on the comparison result, the character The direction may also be determined.

文字方向判定手段をこのような構成にしても、上記実施
例とほぼ同様の利点が得られる。
Even if the character direction determining means is configured in this manner, substantially the same advantages as in the above embodiment can be obtained.

(ii)  上記実施例では、文字方向判定手段20に
よる文字方向の判定結果に基づき、特徴変換手段47で
特徴マトリクスを変換した後、文字の識別を行うように
しているが、例えばパタン変換手段を文字切出手段30
の出力側に設け、そのパタン変換手段により、文字方向
判定手段20の文字方向判定結果に基づき、文字切出手
段30から切出された文字パタンを所定方向に回転し、
その回転した文字パタンに基づき、文字パタンの特徴抽
出を行うようにしても良い。このような構成にしても、
上記実施例とほぼ同様の作用、効果が得られる。
(ii) In the above embodiment, characters are identified after the feature matrix is converted by the feature converter 47 based on the determination result of the character direction by the character direction determiner 20. For example, the character is identified by the pattern converter. Character cutting means 30
is provided on the output side of the character cutting means 30, and the pattern converting means rotates the character pattern cut out from the character cutting means 30 in a predetermined direction based on the character direction determination result of the character direction determining means 20,
The characteristics of the character pattern may be extracted based on the rotated character pattern. Even with this configuration,
Almost the same actions and effects as in the above embodiment can be obtained.

(iii )  上記実施例では、サブパタン抽出手段
43でサブパタンを求め、このサブパタンから、特徴マ
トリクス抽出手段46で特徴マトリクスを求めることに
より、文字の特徴抽出を行っているが、これ以外の構成
により、特徴を抽出することも可能である。例えば、パ
タン記憶手段41内を水平及び垂直方向にそれぞれ走査
し、走査線が文字手段を横切る回数を被認識文字の特徴
とするような構成にしても良い。このように構成した場
合、特徴変換手段47は、被認識文字が縦書きの場合、
水平走査により得られた特徴を被認識文字の垂直方向の
特徴として識別手段51へ出力し、垂直方向により得ら
れた特徴を被認識文字の水平方向の特徴として識別手段
51へ出力するような構成に変更することが必要である
(iii) In the above embodiment, character features are extracted by finding a sub-pattern in the sub-pattern extracting means 43 and finding a feature matrix from this sub-pattern in the feature matrix extracting means 46, but with other configurations, It is also possible to extract features. For example, the pattern storage means 41 may be scanned in the horizontal and vertical directions, and the number of times a scanning line crosses the character means may be used as a feature of the character to be recognized. When configured in this way, the feature conversion means 47 converts the characters into vertically written characters.
Features obtained by horizontal scanning are output to the identification means 51 as vertical features of the character to be recognized, and features obtained in the vertical direction are output to the identification means 51 as horizontal features of the character to be recognized. It is necessary to change to

(iv)  上記実施例の行位置検出手段3、領域切出
手段4、サブパタン抽出手段10、文字方向判定年段2
0、文字切出手段30、特徴抽出手段40、及び識別手
段51等は、個別回路で構成する以外に、計算機Gこよ
るプログラム制御等により実行するようにしても良い。
(iv) Line position detection means 3, area extraction means 4, sub-pattern extraction means 10, and character direction determination stage 2 of the above embodiment
0, the character extraction means 30, the feature extraction means 40, the identification means 51, etc. may be executed by program control by the computer G, etc., instead of being configured by individual circuits.

(発明の効果) 以上詳細に説明したように、第1の発明によれば、領域
切出手段により、帳票上等の文字列を含む所定の領域を
任意の複数の領域に分割し、各分割領域からサブパタン
抽出手段によって垂直サブパタン及び水平サブパタンを
抽出し、文字方向判定手段によって垂直サブパタン及び
水平サブパタンの特徴を抽出し、その特徴に基づき所定
の領域内の文字列の文字方向を判定し、その判定結果に
基づき文字パタンの特徴抽出を行なわせるようにしたの
で、名刺はもとより、それ以外の帳票等の文字について
も、文字方向の判定が行え、その判定結果に基づき的確
な文字認識が可能となる。そのため、オペレータが帳票
単位や、帳票上の文字列毎に文字方向を指定するという
煩雑な作業を省略でき、高速かつ操作性の良い文字認識
が行える。
(Effects of the Invention) As described above in detail, according to the first invention, the area cutting means divides a predetermined area including a character string on a form into a plurality of arbitrary areas, and each A sub-pattern extraction means extracts a vertical sub-pattern and a horizontal sub-pattern from the region, a character direction determination means extracts the characteristics of the vertical sub-pattern and horizontal sub-pattern, determines the character direction of a character string within a predetermined region based on the characteristics, and Since character pattern features are extracted based on the determination results, the character direction can be determined not only for business cards but also for characters on other documents, etc., and accurate character recognition is possible based on the determination results. Become. Therefore, the operator can omit the complicated work of specifying the character direction for each form or for each character string on a form, and character recognition can be performed at high speed and with good operability.

しかも、領域切出手段により、所定の領域を任意の複数
の領域に分割し、各分割領域についてサブパタン抽出手
段でサブパタンを抽出し、その抽出したサブパタンによ
り文字方向判定手段で文字方向を判定し、その判定結果
に基づき文字パタンの特徴抽出を行わせているので、文
字方向の判定に必要なメモリ容量は、所定の領域全体で
ある必要がなく、分割領域の大きさのメモリ容量があれ
ば十分である。その上、文字方向判定結果に基づき文字
パタンの特徴抽出を行っているので、辞書記憶手段に格
納するデータ数を少なくでき、それによって辞書記憶手
段のメモリ容量を小さくできる。このように記憶容量を
小さくすることができるので、装置全体を小型にするこ
とが可能となる。
Moreover, the region cutting means divides a predetermined region into a plurality of arbitrary regions, the subpattern extraction means extracts a subpattern for each divided region, and the character direction determination means determines the character direction based on the extracted subpattern, Since character pattern features are extracted based on the determination results, the memory capacity required for character direction determination does not need to be the entire predetermined area, and is sufficient as long as the memory capacity is the size of the divided area. It is. Furthermore, since character pattern features are extracted based on the character direction determination results, the number of data stored in the dictionary storage means can be reduced, thereby reducing the memory capacity of the dictionary storage means. Since the storage capacity can be reduced in this way, it is possible to downsize the entire device.

第2〜第4の発明によれば、文字方向判定手段により、
垂直サブパタンの線幅と水平サブパタンの線幅とに基づ
き文字方向を判定するようにしているので、構成が簡単
で、精度の良い文字方向の判定が行える。
According to the second to fourth inventions, the character direction determining means
Since the character direction is determined based on the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern, the configuration is simple and the character direction can be determined with high accuracy.

第5の発明では、所定の領域を行としているので、横書
き、あるいは縦書きで書かれた文字を的確に認識できる
In the fifth invention, since the predetermined area is defined as a line, characters written horizontally or vertically can be accurately recognized.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の実施例を示す文字認識装置の機能ブロ
ック図、第2図(a)〜(d)は印刷文書の例を示す図
、第3図(a)〜(f)は明朝体の垂直サブパタンと水
平サブパタンの例を示す図、第4図は名刺のイメージの
例を示す図、第5図(a)〜(e)は2値パタンと各サ
ブパタンとを説明するための図である。 1・・・・・・画像読取手段、2・・・・・・画像記憶
手段、3・・・・・・行位置検出手段、4・・・・・・
領域切出手段、10・・・・・・サブパタン抽出手段、
12・・・・・・領域線幅計算手段、13・・・・・・
垂直サブパタン抽出手段、14・・・1.・水平サブパ
タン抽出手段、20・・・・・・文字方向判定手段、2
1・・・・・・判定手段、22・・・・・・記憶手段、
30・・・・・・文字切出手段、40・・・・・・特徴
槽lJ后段、46・・・・・・特徴マトリクス抽出手段
、47・・・・・・特徴変換手段、50・・・・・・辞
書記憶手段、51・・・・・・識別手段。 印刷文書の例 第2図 (α) (b) (c) [ぎ明朝クリ?穴タン (d7) 縦書き明WwM”lTKグン (e) 剥を書さ明I#*千寸1大タシ (f) 明朝体の垂直サブノマグンと水平サブツマタンのイ列第
3図 名利のイメージ 第4図
FIG. 1 is a functional block diagram of a character recognition device showing an embodiment of the present invention, FIGS. 2(a) to (d) are diagrams showing examples of printed documents, and FIGS. 3(a) to (f) are clear Figure 4 is a diagram showing an example of the vertical sub-pattern and horizontal sub-pattern of the morning typeface, Figure 4 is a diagram showing an example of a business card image, and Figures 5 (a) to (e) are diagrams for explaining the binary pattern and each sub-pattern. It is a diagram. 1... Image reading means, 2... Image storage means, 3... Line position detection means, 4...
Region cutting means, 10... sub-pattern extraction means,
12... Area line width calculation means, 13...
Vertical sub-pattern extraction means, 14...1.・Horizontal sub-pattern extraction means, 20...Character direction determination means, 2
1... Determination means, 22... Storage means,
30...Character extraction means, 40...Feature tank lJ rear stage, 46...Feature matrix extraction means, 47...Feature conversion means, 50. ...Dictionary storage means, 51...Identification means. Example of printed document Figure 2 (α) (b) (c) Hole tongue (d7) Vertical writing Akira WwM"lTK Gun (e) Peeling writing Akira I# * 1,000 sun 1 large tashi (f) Mincho typeface vertical subnomagun and horizontal subtsumatan A row 3 image of name and interest No. Figure 4

Claims (1)

【特許請求の範囲】 1、文字列を含む所定の領域内から1文字ずつ文字パタ
ンを切出す文字切出手段と、前記文字切出手段で切出さ
れた文字パタンの特徴を抽出する特徴抽出手段と、所定
の照合辞書マスクを格納した辞書記憶手段と、前記特徴
抽出手段で抽出された特徴を前記辞書記憶手段の内容と
照合して前記文字パタンの識別を行う識別手段とを、備
えた文字認識装置において、 前記所定の領域を任意の数の領域に分割して複数の分割
領域を生成する領域切出手段と、 前記各分割領域の垂直サブパタン及び水平サブパタンを
任意の領域数だけ抽出するサブパタン抽出手段と、 前記サブパタン抽出手段で抽出された垂直サブパタン及
び水平サブパタンの特徴を抽出し、その特徴に基づき、
前記所定の領域内に含まれる文字列の文字の方向を判定
して文字方向判定結果を出力する文字方向判定手段と、 前記文字方向判定結果に基づき特徴変換またはパタン変
換を行って前記特徴抽出手段で文字パタンの特徴抽出を
行なわせる変換手段とを、 設けたことを特徴とする文字認識装置。 2、請求項1記載の文字認識装置において、前記文字方
向判定手段は、 前記複数の分割領域から垂直サブパタン及び水平サブパ
タンが抽出される毎に、該垂直サブパタンの線幅と水平
サブパタンの線幅を算出し、その垂直サブパタンの線幅
和と水平サブパタンの線幅和とを求め、その両線幅和の
比と予め定めた線幅比基準値とを比較して文字方向を判
定する機能を有することを特徴とする文字認識装置。 3、請求項1記載の文字認識装置において、前記文字方
向判定手段は、 前記複数の分割領域から垂直サブパタン及び水平サブパ
タンが抽出される毎に、該垂直サブパタンの線幅と水平
サブパタンの線幅とを算出し、その両線幅の比を前記各
分割領域毎に求め、その線幅比と予め定めた線幅比基準
値とを比較した分割領域毎の比較結果に基づき文字方向
を判定する機能を有することを特徴とする文字認識装置
。 4、請求項1記載の文字認識装置において、前記文字方
向判定手段は、 前記複数の分割領域から垂直サブパタン及び水平サブパ
タンが抽出される毎に、該垂直サブパターンの線幅と水
平サブパタンの線幅を算出し、その両線幅の比を前記各
分割領域毎に求め、その線幅比の平均と予め定めた線幅
比基準値とを比較して文字方向を判定する機能を有する
ことを特徴とする文字認識装置。 5、請求項1、2、3又は4記載の文字認識装置におい
て、 前記所定の領域を行とすることを特徴とする文字認識装
置。
[Claims] 1. Character extraction means for cutting out a character pattern one character at a time from within a predetermined region containing a character string, and feature extraction for extracting features of the character pattern cut out by the character extraction means. means, dictionary storage means storing a predetermined collation dictionary mask, and identification means for comparing the features extracted by the feature extraction means with the contents of the dictionary storage means to identify the character pattern. In the character recognition device, an area cutting means for dividing the predetermined area into an arbitrary number of areas to generate a plurality of divided areas, and extracting vertical sub-patterns and horizontal sub-patterns of each of the divided areas for an arbitrary number of areas. a sub-pattern extracting means, extracting features of the vertical sub-pattern and horizontal sub-pattern extracted by the sub-pattern extracting means, and based on the features,
character direction determining means for determining the direction of characters in a character string included in the predetermined area and outputting a character direction determination result; and feature extraction means for performing feature conversion or pattern conversion based on the character direction determination result. A character recognition device comprising: a conversion means for extracting features of a character pattern. 2. In the character recognition device according to claim 1, each time a vertical sub-pattern and a horizontal sub-pattern are extracted from the plurality of divided regions, the character direction determining means determines the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern. It has a function to determine the character direction by calculating the sum of the line widths of the vertical sub-pattern and the sum of the line widths of the horizontal sub-patterns, and comparing the ratio of both sums of line widths with a predetermined line width ratio reference value. A character recognition device characterized by: 3. In the character recognition device according to claim 1, each time a vertical sub-pattern and a horizontal sub-pattern are extracted from the plurality of divided regions, the character direction determining means determines the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern. The function calculates the ratio of both line widths for each divided area, and determines the character direction based on the comparison result for each divided area by comparing the line width ratio with a predetermined line width ratio reference value. A character recognition device comprising: 4. In the character recognition device according to claim 1, each time a vertical sub-pattern and a horizontal sub-pattern are extracted from the plurality of divided regions, the character direction determining means determines the line width of the vertical sub-pattern and the line width of the horizontal sub-pattern. , calculate the ratio of both line widths for each divided area, and compare the average of the line width ratios with a predetermined line width ratio reference value to determine the character direction. character recognition device. 5. The character recognition device according to claim 1, 2, 3 or 4, wherein the predetermined area is a line.
JP2044818A 1990-02-26 1990-02-26 Character recognizing device Pending JPH03246779A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2044818A JPH03246779A (en) 1990-02-26 1990-02-26 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2044818A JPH03246779A (en) 1990-02-26 1990-02-26 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH03246779A true JPH03246779A (en) 1991-11-05

Family

ID=12702024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2044818A Pending JPH03246779A (en) 1990-02-26 1990-02-26 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH03246779A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116647A (en) * 2017-01-20 2018-07-26 リード テクノロジーズ,インコーポレイティド Apparatus, method and computer readable storage medium for determining rotation angle of text

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116647A (en) * 2017-01-20 2018-07-26 リード テクノロジーズ,インコーポレイティド Apparatus, method and computer readable storage medium for determining rotation angle of text

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US4933979A (en) Data reading apparatus for reading data from form sheet
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
JPH0420226B2 (en)
US20010055423A1 (en) Image processing device and program product
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
JPH03246779A (en) Character recognizing device
JPH0516632B2 (en)
JP3276555B2 (en) Format recognition device and character reader
JPS6214277A (en) Image processing method
JP2000076378A (en) Character recognizing method
JP3276554B2 (en) Format recognition device and character reader
JP3083609B2 (en) Information processing apparatus and character recognition apparatus using the same
JP2902097B2 (en) Information processing device and character recognition device
JP2827288B2 (en) Character recognition device
JP2616995B2 (en) Character recognition device
JP2995818B2 (en) Character extraction method
JPS63269267A (en) Character recognition method
JP3090928B2 (en) Character recognition device
JPH03244094A (en) Character recognition device
JP2755299B2 (en) Image processing method
JP3428504B2 (en) Character recognition device
JP2747136B2 (en) Character recognition device
JP3195405B2 (en) Character recognition device
JPH04241074A (en) Automatic document clean copying device