JPH0578068B2 - - Google Patents
Info
- Publication number
- JPH0578068B2 JPH0578068B2 JP60077633A JP7763385A JPH0578068B2 JP H0578068 B2 JPH0578068 B2 JP H0578068B2 JP 60077633 A JP60077633 A JP 60077633A JP 7763385 A JP7763385 A JP 7763385A JP H0578068 B2 JPH0578068 B2 JP H0578068B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- image
- histogram
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、新聞・雑誌等の活字および手書き文
字を認識し、たとえばJISコード等の情報量に変
換する文字認識装置に関するものである。DETAILED DESCRIPTION OF THE INVENTION Field of Industrial Application The present invention relates to a character recognition device that recognizes printed characters and handwritten characters from newspapers, magazines, etc., and converts them into an amount of information such as a JIS code.
従来の技術
従来の文字認識装置では、縦書き・横書きおよ
び行間隔・文字間隔等の書式が明確な文書、つま
り読み取る文字の用紙上の絶対的な位置があらか
じめ判明している文書を対象に文字認識を行つて
きた。このことは、文字認識装置が対象とする文
書に制限を与えており、この問題を解決するため
に、入力画像の2次元フーリエ変換を用いて行間
を検出して縦書き・横書き等の行方向を抽出し、
書式が未知の文書に対しても、文章の意味が理解
できるように認識候補文字の順序を決定する方法
がとられていた。(例えば、長谷・星野“印刷文
字列の周期的特徴”信学論(D),J65−D,2,
PP.298〜299)
発明が解決しようとする問題点
しかしながら、入力画像の2次元フーリエ変換
により入力文書の行方向を検出する従来の技術で
は、2次元フーリエ変換という多大な計算量を必
要とする方法を用いているために処理に時間がか
かる。Conventional technology Conventional character recognition devices target documents with clear formats such as vertical writing, horizontal writing, line spacing, character spacing, etc., in other words, documents where the absolute position of the characters to be read on the paper is known in advance. I've been recognizing it. This places restrictions on the documents that can be targeted by character recognition devices, and to solve this problem, two-dimensional Fourier transform of the input image is used to detect the line spacing and the line direction, such as vertical or horizontal writing, is detected. extract,
Even for documents with unknown formats, methods have been used to determine the order of recognition candidate characters so that the meaning of the text can be understood. (For example, Hase and Hoshino, “Periodic characteristics of printed character strings,” IEICE (D), J65-D, 2,
PP.298-299) Problems to be Solved by the Invention However, the conventional technique of detecting the line direction of an input document by two-dimensional Fourier transform of the input image requires a large amount of calculation due to two-dimensional Fourier transform. The process takes time because of the method used.
本発明はかかる点に鑑みてなされたものであ
り、簡易な方法で入力画像の行方向を検出し、書
式が未知の文書に対しても、文章の意味が理解で
きるように認識候補文字を編集することができる
文字認識装置を提供することを目的としている。 The present invention has been made in view of these points, and uses a simple method to detect the line direction of an input image, and edits recognition candidate characters so that the meaning of the text can be understood even for documents with unknown formats. The purpose of the present invention is to provide a character recognition device that can perform the following functions.
問題点を解決するための手段
本発明は前記問題点を解決するため、入力画像
を縦方向・横方向に走査して文字部を形成する画
素のヒストグラムを求め、ヒストグラムから求め
た縦方向・横方向それぞれの文字間隔長の平均値
を比較することにより、簡易に文書の行方向を抽
出し、認識候補文字を編集するものである。Means for Solving the Problems In order to solve the above-mentioned problems, the present invention scans an input image in the vertical and horizontal directions to obtain a histogram of pixels forming a character part, and By comparing the average value of the character interval length in each direction, the line direction of the document can be easily extracted and recognition candidate characters can be edited.
作 用
本発明は前記した技術的手段により、書式が未
知の文書に対して、高速に行方向を抽出して認識
候補文字を文章の意味が理解できるように編集す
ることが可能となる。Effects The present invention makes it possible to extract the line direction of a document whose format is unknown at high speed and edit recognition candidate characters so that the meaning of the sentence can be understood by using the above-mentioned technical means.
実施例
以下、本発明の実施例について図面を参照しな
がら説明する。Embodiments Hereinafter, embodiments of the present invention will be described with reference to the drawings.
第1図は、本発明による文字認識装置の一実施
例の構成図である。1は画像入力部であり、認識
対象文字を含む画像を走査し2値信号で画像を入
力し画像メモリ2に格納する。3は行方向判定部
であり、画像メモリ2を走査して入力画像の縦書
き・横書き判定を行い、同時に行アドレスを検出
する。4は文字切り出し部であり、行方向判定部
3で検出した行方向及び行アドレスを用いて画像
メモリ2を行単位で走査し、行単位の画像の射影
を用いて1字ずつ認識対象文字画像を切り出し、
各文字の入力画像上の文字アドレスを検出する。
5は認識部であり、文字切り出し部4で切り出し
た認識対象文字のストローク等の特徴量を求め、
あらかじめ辞書6に登録されている文字の特徴量
と照合し、最も似た文字を認識候補文字とする。
7は編集部であり、行方向判定部3で求めた行方
向と行アドレス及び文字切り出し部4で求めた文
字アドレスを用いて、認識部5で抽出した認識候
補文字を文章の意味が理解できる順序に編集し、
文章メモリ8に文字コードで格納する。 FIG. 1 is a block diagram of an embodiment of a character recognition device according to the present invention. Reference numeral 1 denotes an image input unit which scans an image including characters to be recognized, inputs the image as a binary signal, and stores it in the image memory 2. Reference numeral 3 denotes a line direction determination unit which scans the image memory 2 to determine whether the input image is written vertically or horizontally, and at the same time detects the line address. Reference numeral 4 denotes a character cutting unit, which scans the image memory 2 line by line using the line direction and line address detected by the line direction determination unit 3, and extracts a character image to be recognized character by character using projection of the image in line units. Cut out,
Detect the character address on the input image for each character.
5 is a recognition unit, which calculates feature quantities such as strokes of characters to be recognized cut out by the character cutout unit 4;
The characters are compared with the feature amounts of the characters registered in advance in the dictionary 6, and the most similar character is selected as the recognition candidate character.
Reference numeral 7 denotes an editing section, which uses the line direction and line address obtained by the line direction determination section 3 and the character address obtained from the character extraction section 4 to understand the meaning of the sentence from the recognition candidate characters extracted by the recognition section 5. Edit in order,
It is stored in the text memory 8 as a character code.
以上のように構成された文字認識装置の動作に
ついて、第2図に示す入力画像Pを例に説明す
る。 The operation of the character recognition device configured as described above will be explained using the input image P shown in FIG. 2 as an example.
画像入力部1から入力された画像Pは文字部
1、白部0の2値データで画像メモリ2に蓄えら
れる。まず行方向判定部3で画像メモリ2に蓄え
られている入力画像Pを走査して、入力画像全体
における文字部を形成する画素の縦方向ヒストグ
ラムHvと横方向ヒストグラムHhを求めると第2
図に示す様になる。文字部と文字間部を分けるた
めに、ヒストグラムHvとHhそれぞれに対してヒ
ストグラムの値が0画素以下である文字間部分と
0画素より多い画素数の文字部分に分け、各部分
の先頭アドレスを求める。第2図中のys1,ys2…
…ysi……及びxs1,xs2……xsi……は文字部分の先
頭アドレスであり、ye1,ye2……yei及びxe1,xe2
……xei……は文字間部分の先頭アドレスである。
このアドレスから縦方向の文字間隔長(ysi+1−
yei)の平均値(si+1−ei)と横方向の文字間隔
長(xsi+1−xei)の平均値(si+1−ei)とを比較
すると縦方向の値が横方向の値に対して大とな
り、入力画像Pの行方向は横書きであることがわ
かる。さらに入力画像Pの行方向が横書きと決定
したことから、ヒストグラムHvの文字部分及び
文字間部分の先頭アドレスys1,ye1……ysi,yei…
…は入力画像Pの行アドレスになる。 The image P input from the image input section 1 is stored in the image memory 2 as binary data of 1 for text and 0 for white. First, the line direction determining unit 3 scans the input image P stored in the image memory 2 to obtain a vertical histogram H v and a horizontal histogram H h of pixels forming a character portion in the entire input image.
The result will be as shown in the figure. In order to separate the character part and the inter-character part, the histograms H v and H h are divided into the inter-character part where the histogram value is less than or equal to 0 pixels, and the character part with the number of pixels greater than 0 pixel, and the beginning of each part is Ask for address. y s1 , y s2 ... in Figure 2
...y si ... and x s1 , x s2 ...x si ... are the start addresses of the character parts, y e1 , y e2 ... y ei and x e1 , x e2
...x ei ... is the start address of the intercharacter portion.
From this address, the vertical character spacing length (y si+1 −
Comparing the average value ( si+1 − ei ) of y ei ) with the average value (si +1 − ei ) of the horizontal character spacing length (x si+1 −x ei ) , it is found that the vertical value is the same as the horizontal value. It is found that the line direction of the input image P is horizontal writing. Furthermore, since the line direction of the input image P has been determined to be horizontal writing, the start addresses of the character portion and the inter-character portion of the histogram H v are y s1 , y e1 ... y si , y ei ...
... becomes the row address of the input image P.
次に文字切り出し部4では、行アドレスを用い
て画像メモリ2から第3図に示す行画像Lを抽出
する。抽出した行画像Lを射影してヒストグラム
H1を求めると第3図に示す様になる。ヒストグ
ラムH1から1字1字の横方向のアドレス(zs1,
ze1)……(zsi,zei)……を求め、認識対象文字
画像を1字ずつ切り出し、さらに、行アドレスと
組合せて文字アドレスを決定する。 Next, the character cutting section 4 extracts the line image L shown in FIG. 3 from the image memory 2 using the line address. Project the extracted row image L to create a histogram
When H 1 is determined, it becomes as shown in Figure 3. Histogram H 1 to 1 character horizontal address (z s1 ,
z e1 )...(z si , z ei )... are obtained, the character image to be recognized is cut out character by character, and the character address is determined by combining with the line address.
認識部5には切り出された認識対象文字の矩形
Rが順次入力される。第4図aに切り出された認
識対象文字『松』を示す。切り出した『松』の各
画素について、第4図bの矢印が示す方向に着目
画素を含んでM個以上(Mはあらかじめ設定)連
つているか否かを調べ方向コードを設定する。方
向コード毎に各画素の連結性を調べてストローク
を抽出し、ストロークの数・位置・長さ等の特微
量を抽出する。第4図aに認識対象文字『松』の
ストローク抽出結果を示す。抽出した特微量を辞
書6に登録されている文字の特微量と照合し、最
も似た文字「松」を認識候補文字とする。 The rectangles R of the cut out characters to be recognized are sequentially input to the recognition unit 5. FIG. 4a shows the character "pine" cut out to be recognized. For each pixel of the cut out "pine tree", it is checked whether or not there are M or more (M is preset) consecutive pixels including the pixel of interest in the direction indicated by the arrow in FIG. 4b, and a direction code is set. Strokes are extracted by examining the connectivity of each pixel for each direction code, and feature quantities such as the number, position, and length of strokes are extracted. Figure 4a shows the stroke extraction results for the recognition target character ``pine''. The extracted feature amount is compared with the feature amount of characters registered in the dictionary 6, and the most similar character "pine" is selected as a recognition candidate character.
認識部5から順次抽出される入力画像Pから切
り出された認識対象文字の認識候補文字は、入力
画像Pが横書きであること及びそれぞれの文字ア
ドレスから、編集部7で「松」「下」「電」「器」
……と横方向に左上から右下へ文字をならべて、
文章の意味が理解できるように編集され文章メモ
リ8に文字コードで蓄えられる。 The recognition candidate characters of the recognition target characters cut out from the input image P sequentially extracted from the recognition unit 5 are selected by the editing unit 7 as “pine”, “shita”, “”, based on the fact that the input image P is written horizontally and the respective character addresses. electricity” “vessel”
...and line up the letters horizontally from top left to bottom right,
The text is edited so that its meaning can be understood and stored in the text memory 8 as a character code.
以上のように構成された文字認識装置では、簡
易な方法で求めた行方向及び行アドレスを用い
て、認識対象文字の切り出し、さらに認識候補文
字の編集を行うことにより、文章の意味が理解で
きる文字列を作成することができる。さらに、文
章メモリを文書処理装置等に接続することによ
り、新たな文書編集が可能となる。 With the character recognition device configured as described above, the meaning of a sentence can be understood by cutting out characters to be recognized and editing candidate characters for recognition using the line direction and line address obtained using a simple method. You can create strings. Furthermore, by connecting the text memory to a document processing device or the like, new document editing becomes possible.
尚、行方向判定を行う際のヒストグラムを、本
実施例では入力画像全体について求めたが、行の
傾き等に対処するために、入力画像をブロツクに
分割してブロツク毎のヒストグラムを求めること
により、行方向を決定することができる。 In this example, the histogram used to determine the row direction was obtained for the entire input image, but in order to deal with the inclination of the rows, the input image was divided into blocks and a histogram was obtained for each block. , the row direction can be determined.
発明の効果
本発明によれば、入力画像を縦方向・横方向に
走査して文字部を形成する画素のヒストグラムを
求め、ヒストグラムから求めた縦方向・横方向の
文字間隔長の平均値を比較するという簡易な方法
で高速に入力画像の行方向を抽出することによ
り、書式が未知の文書に対して文書の意味が理解
できるように認識候補文字を編集することが可能
となる。Effects of the Invention According to the present invention, an input image is scanned in the vertical and horizontal directions to obtain a histogram of pixels forming a character portion, and the average values of the character spacing lengths in the vertical and horizontal directions obtained from the histogram are compared. By quickly extracting the line direction of an input image using a simple method, it becomes possible to edit recognition candidate characters in a document whose format is unknown so that the meaning of the document can be understood.
第1図は本発明における一実施例による文字認
識装置の構成図、第2図は入力画像及び入力画像
の行方向と行アドレスの判定方法の説明図、第3
図は入力画像内の認識対象文字切り出し方法の説
明図、第4図は文字認識方法の説明図である。
1……画像入力部、2……画像メモリ、3……
行方向判定部、4……文字切り出し部、5……認
識部、6……辞書、7……編集部、8……文章メ
モリ。
FIG. 1 is a block diagram of a character recognition device according to an embodiment of the present invention, FIG. 2 is an explanatory diagram of an input image and a method for determining the line direction and line address of the input image, and FIG.
The figure is an explanatory diagram of a method for cutting out characters to be recognized from an input image, and FIG. 4 is an explanatory diagram of a character recognition method. 1... Image input section, 2... Image memory, 3...
Line direction determination section, 4...Character cutting section, 5...Recognition section, 6...Dictionary, 7...Editing section, 8...Text memory.
Claims (1)
部と、前記画像入力部で入力された画像を縦方
向・横方向に走査して文字部を形成する画素のヒ
ストグラムを求め、このヒストグラムの値がN画
素以下である文字間隔の連続する走査線の数で定
義される文字間隔長の平均値を縦方向と横方向で
比較することにより縦書き・横書きを判定する行
方向判定部と、入力画像から認識対象文字を切り
出す文字切り出し部と、前記認識対象文字を辞書
と照合することにより認識候補文字を抽出する認
識部と、前記認識候補文字を編集する編集部を有
することを特徴とする文字認識装置。1. An image input section that inputs an image containing characters to be recognized, and an image input section that scans the image input in the vertical and horizontal directions to obtain a histogram of pixels forming a character section, and calculates the value of this histogram. A line direction determination unit that determines vertical writing or horizontal writing by comparing the average value of character spacing length defined by the number of consecutive scanning lines with a character spacing of N pixels or less in the vertical direction and horizontal direction, and an input image. A character recognition system comprising: a character extraction unit that extracts a recognition target character from a text; a recognition unit that extracts a recognition candidate character by comparing the recognition target character with a dictionary; and an editing unit that edits the recognition candidate character. Device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60077633A JPS61235990A (en) | 1985-04-12 | 1985-04-12 | Character recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60077633A JPS61235990A (en) | 1985-04-12 | 1985-04-12 | Character recognition device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61235990A JPS61235990A (en) | 1986-10-21 |
| JPH0578068B2 true JPH0578068B2 (en) | 1993-10-28 |
Family
ID=13639301
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60077633A Granted JPS61235990A (en) | 1985-04-12 | 1985-04-12 | Character recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61235990A (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0541299B1 (en) * | 1991-11-04 | 2000-03-01 | Canon Kabushiki Kaisha | Apparatus and method for optical character recognition |
-
1985
- 1985-04-12 JP JP60077633A patent/JPS61235990A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61235990A (en) | 1986-10-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| JP2713622B2 (en) | Tabular document reader | |
| JPH01253077A (en) | Detection of string | |
| Amin et al. | Page segmentation and classification utilizing bottom-up approach | |
| JPH0797390B2 (en) | Character recognition device | |
| JPH0578068B2 (en) | ||
| JP2890306B2 (en) | Table space separation apparatus and table space separation method | |
| Ng et al. | Segmentation of music primitives | |
| JPH07230525A (en) | Ruled line recognition method and table processing method | |
| JP2537973B2 (en) | Character recognition device | |
| JPH0548510B2 (en) | ||
| Chandran et al. | Structure recognition and information extraction from tabular documents | |
| JPH0564396B2 (en) | ||
| JPS6227887A (en) | Character type separation method | |
| JPH07160810A (en) | Character recognition device | |
| JPS5831028B2 (en) | character recognition device | |
| JPH04167193A (en) | Character recognizing method | |
| JPH08171609A (en) | High-speed character string extraction device | |
| JPH11110485A (en) | Character reading device and character reading method | |
| Said | Automatic processing of documents and bank cheques | |
| JPH0576674B2 (en) | ||
| Babić | Cursive word raw segmentation based on scanning skew slots | |
| JPH01265378A (en) | European character recognizing system | |
| JPS58222384A (en) | Font identification method | |
| JP2001060249A (en) | Character string collation system for document identification |