JPS61262984A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS61262984A
JPS61262984A JP60106404A JP10640485A JPS61262984A JP S61262984 A JPS61262984 A JP S61262984A JP 60106404 A JP60106404 A JP 60106404A JP 10640485 A JP10640485 A JP 10640485A JP S61262984 A JPS61262984 A JP S61262984A
Authority
JP
Japan
Prior art keywords
character
character string
recognition
pixels
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60106404A
Other languages
English (en)
Other versions
JPH0664628B2 (ja
Inventor
Mariko Takenouchi
磨理子 竹之内
Masahiro Shimizu
正博 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60106404A priority Critical patent/JPH0664628B2/ja
Publication of JPS61262984A publication Critical patent/JPS61262984A/ja
Publication of JPH0664628B2 publication Critical patent/JPH0664628B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野    ゛ 本発明は新聞、雑誌等の活字および手書き文字を認識し
、たとえばJISコード等の情報量に変換する文字認識
装置に関するものである。
従来の技術 従来の文字認識装置では、文字列の傾き、文字列間隔、
文字間隔等の書式が明確な文書を対象に文字認識を行っ
てきた。このことは、文字認識装置が対象とする文書に
制限を与えており、この問題を解決する゛ために、入力
画像から文字列の傾き(回転角θ)を検出し傾き補正を
行うことにより書式が未知の文書に対しても安定した文
字切り出しを行う方法がとられていた。(例えば、長谷
・星野“印刷文字列の周期的特徴″信学論(D)。
J 65− D 、 2 、 Dll、  298〜2
99、秋山・増田″書弐指定情報によらない紙面構成要
素抽出法″信学論(’D) 、 J66−D、 1 、
’pp111〜118電気通信学会発行) 発明が解決しようとする問題点 しかしながら、入力画像の文字列の傾きを検出し傾き補
正を行うことにより文字切り出しをイキう従来の技術で
は、傾き補正に多大な計算量を必要とし処理に時間がか
かる。
本発明はかかる点に鑑みてなされたものであり、書式が
未知の文書に対しても、簡易な方法で入力画像の文字列
を検出し、入力画像の傾き補正を行うことなく高速に文
字を切り出すことができる文字認識装置を提供すること
を目的としている。
問題点を解決づ゛るための手段 本発明の文字認識装置は、認識対象文字を含む画像を入
力する画像入力部と、前記画像入力部で入力された画像
を、縦書き文書の場合は縦、横書き文書の場合は横であ
る文字列方向にM画素単位のブロックに区切り、各ブロ
ックを文字列方向に走査して文字部を形成する画素のヒ
ス1−グラムを求め、ヒストグラムの値がN画素以上で
ある文字列部の開始位置と終了位置を検出し、各ブロッ
ク間の文字列部の連結状態を調べて文字列を抽出する文
字列抽出部と、文字列から認識対象文字を切り出す文字
切り出し部と、認識対象文字を辞書ど照合して認識候補
文字を抽出する認識部とを設りたことを特徴とする。
作用 このように構成しlcため、入力画像を文字列の方向に
ブロックに区切り、各ブロックを文字部11方向に走査
して文字部を形成覆る画素のヒス1〜グラムを求め、ヒ
スミルグラムから求めた各ブロック毎の文字列部の連結
状態を調べることにより、容易に文字列を抽出して認識
対象文字を切り出し、認識候補文字を抽出することがで
き、書式が未知の文書に対して、傾き補正を行うことな
く高速に文字列を抽出して認識対象文字を切り出し認識
できる。
実施例 以下、本発明の一実施例を第1図〜第7図に基づいて説
明する。
第1図は本発明の文字認識装置を示す。1は画像入力部
で、認識対象文字を含む画像を走査して2値信号で画像
を入力し画像メモリ2に格納する。
3は文字列方向設定部で、入力画像の縦書き・横書きを
オペレータが設定する。4は文字列抽出部で、文字列方
向設定部3で設定した文字列方向を−4= 用いて画像メモリ2を走査して文字列を抽出】−る。
5は文字切り出し部で、文字列方向設定部3で設定した
文字列方向を用いて文字列抽出部4で抽出した文字列か
ら認識対象文字を切り出す。6は認識部で、文字切り出
し部5で切り出した認識対象文字の特徴量を求め、あら
かじめ辞書7に登録されている文字の特徴間と照合し、
その内の最も似た文字を認識候補文字として表示部8に
表示する。
このように構成された文字認識装置の構成を、、第2図
に示す入力画像Pを例に挙げて詳細に説明する。
画像入力部1から入力された画111Pは文字部を11
i、11、白部をO″の2値データで画像メモリ2に蓄
えられる。文字列抽出部4では画像メモリ2を走査して
文字列を抽出する。入力画像Pを文字列方向設定部3で
設定された文字列方向の横方向にm画素ずつのブロック
に分けると、B1・B2・B3の3ブロツクとなる。ブ
ロックB1を文字列方向である横方向に走査して、文字
部を形成する画素のヒストグラムHbを求めると第3図
に示す様になる。ヒストグラムHbから、1画素以上の
値をもつ文字列部の開始アドレスS1・B2・・・Si
・・・及び文字列部の終了アドレスe1・B2・・・e
t・・・を求める。同様にしてブロックB2・B3につ
いても、文字部を形成覆る画素のヒス1〜グラムを求め
文字列部の開始アドレス及び終了アドレスを求めると第
4図に示す様になる。図中のNOoは文字列部の出用順
序を表わす。これらの文字列部、の開始75ドレス及び
終了アドレスから、ブロック毎に求めた文字列部の連結
状態を調べる。
下記第1式と第2式が成立すれば、隣合うブロックの文
字列が連結状態であることを示す。
B(i−1)、k  ≧F31el   ”’■B(+
−1)ek  ≦B15l・・・■ここで81はブロッ
ク、sk、srは文字列開始アドレス、ek、elは文
字列終了アドレスを示す。全ての1 ・k−/について
第1式と第2式の条件を調ベブロック間の文字列の連結
状態を求めると第5図に示す様になり、図中のLl・L
2・・・l−i・・・の文字列番号で表わされる文字列
が抽出される。文字切り出し部5にkJ抽出された文字
列が順次入力される。第6図に抽出された第1番目の文
字列1−1を示で。文字列1−1は、文字列抽出部4で
求めた文字列開始アドレスB1,1・B2.2・B3.
3及び文字列終了アドレスB 1.、− B 2e2・
B3e、、で囲まれている。抽出した文字列11を用影
してヒストグラム1−11を求めると第6図に示す様に
なる。
ヒス1グラムト(lから1字1字の横方向のアドレス<
 C,、Ce1>・−(Csi 、 Cei )・・・
を求め、認識対象文字を1字ずつ切り出社。認識部6に
は切り出された認識対象文字の矩形Rが順次入力される
。第7図(a)に切り出された認識対象文字「松」を示
す。切り出しt= r松、1の各画素について、第7図
(1))の矢印が示す方向に着目画素を含んでq個以1
=(Qはあらかじめ設定)連っているか否かを調べ方向
コードを設定する。方向コード毎に各画素の連結性を調
べてストロークを抽出し、ス[・ローフの数・位置・長
さ等の特徴間を抽出する。第7図(a)に「松」のスロ
ーク抽出結果を示す。抽出した特徴量を辞書7にあらか
じめ登録されている文字の特徴間と照合し、最も似た文
字「松」を認識候補文字として表示部8に表示する。
発明の詳細 な説明のように本発明の文字認識装置は、画像入力部と
文字列抽出部と文字切り出し部および認識部を設け、入
力画像を文字列の方向にM画素単位のブロックに区切り
、各ブ1,1ツクを文字列方向に走査して文字部を形成
する画素のヒス1〜グラムを求め、ヒストグラムから求
めた文字列部の開始アドレスと終了アドレスを用いて、
各ブロックの文字列部の連結状態を調べ高速に入力画像
の文字列を抽出するよう構成したため、書式が未知の文
書に対して、入力画像の角痘補正等の多大な4専処理を
行うことなく認識対象文字を切り出し認識することがで
きるものである。
【図面の簡単な説明】
第1図は本発明の文字認識装置の一実施例の構成図、第
2図は入力画像及び入力画像のブロック分割説明図、第
3図はブロックにおける文字列部抽出の説明図、第4図
は各ブロックの文字TJIJ部の開始アドレスと終了ア
ドレスの抽出結果の説明図、図は文字認識の説明図であ
る。 1・・・画像入力部、2・・・画也メモリ、3・・・文
字列方向設定部、4・・・文字列抽出部、5・・・文字
切り出し部、6・・・認識部、7・・・辞書、8・・・
表示部代理人   森  本  義  弘 −〇− 第1図 第2図 京a業  グ画素  ヅ画、。 第4図 第4図 第7図 51ie1 ■

Claims (1)

    【特許請求の範囲】
  1. 1、認識対象文字を含む画像を入力する画像入力部と、
    前記画像入力部で入力された画像を、縦書き文書の場合
    は、縦、横書き文書の場合は横である文字列方向にM画
    素単位のブロックに区切り、各ブロックを文字列方向に
    走査して文字部を形成する画素のヒストグラムを求め、
    ヒストグラムの値がN画素以上である文字列部の開始位
    置と終了位置を検出し、各ブロック間の文字列部の連結
    状態を調べて文字列を抽出する文字列抽出部と、文字列
    から認識対象文字を切り出す文字切り出し部と、認識対
    象文字を辞書と照合して認識候補文字を抽出する認識部
    とを設けた文字認識装置。
JP60106404A 1985-05-17 1985-05-17 文字認識装置 Expired - Lifetime JPH0664628B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60106404A JPH0664628B2 (ja) 1985-05-17 1985-05-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60106404A JPH0664628B2 (ja) 1985-05-17 1985-05-17 文字認識装置

Publications (2)

Publication Number Publication Date
JPS61262984A true JPS61262984A (ja) 1986-11-20
JPH0664628B2 JPH0664628B2 (ja) 1994-08-22

Family

ID=14432742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60106404A Expired - Lifetime JPH0664628B2 (ja) 1985-05-17 1985-05-17 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0664628B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63198449A (ja) * 1987-02-12 1988-08-17 Nec Corp 情報処理装置における通信処理のメモリ管理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63198449A (ja) * 1987-02-12 1988-08-17 Nec Corp 情報処理装置における通信処理のメモリ管理方式

Also Published As

Publication number Publication date
JPH0664628B2 (ja) 1994-08-22

Similar Documents

Publication Publication Date Title
US5212739A (en) Noise tolerant optical character recognition system
US11164027B2 (en) Deep learning based license plate identification method, device, equipment, and storage medium
US6640010B2 (en) Word-to-word selection on images
US4562594A (en) Method and apparatus for segmenting character images
US5033104A (en) Method for detecting character strings
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
EP0602180A1 (en) LOCATION OF CHARACTERS FOR IDENTIFICATION OF CHARACTERS.
US5854860A (en) Image filing apparatus having a character recognition function
JPS61262984A (ja) 文字認識装置
JP3303246B2 (ja) 画像処理装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2537973B2 (ja) 文字認識装置
JPH0797390B2 (ja) 文字認識装置
JPH0728935A (ja) 文書画像処理装置
JPS6337487A (ja) 文字認識装置
JPH0916713A (ja) 画像領域分割方法
JPS62219087A (ja) 文字認識装置
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH11306282A (ja) 文字列領域抽出方法及び装置
JPS6343788B2 (ja)
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
JPS6210784A (ja) 文字認識装置
JPH0573718A (ja) 領域属性識別方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term