JPH0222427B2 - - Google Patents

Info

Publication number
JPH0222427B2
JPH0222427B2 JP56043038A JP4303881A JPH0222427B2 JP H0222427 B2 JPH0222427 B2 JP H0222427B2 JP 56043038 A JP56043038 A JP 56043038A JP 4303881 A JP4303881 A JP 4303881A JP H0222427 B2 JPH0222427 B2 JP H0222427B2
Authority
JP
Japan
Prior art keywords
character
line
control device
scanning
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56043038A
Other languages
English (en)
Other versions
JPS57157380A (en
Inventor
Akira Sakurai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP56043038A priority Critical patent/JPS57157380A/ja
Publication of JPS57157380A publication Critical patent/JPS57157380A/ja
Publication of JPH0222427B2 publication Critical patent/JPH0222427B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 この発明は画像種類の識別装置に係り、特に活
字と手書文字の識別を実行するための装置に関す
る。
従来、活字か手書きかの文字種類を識別するこ
とは行なわれていなかつた。しかし、この様な文
字種類の識別を行えば、文字認識やデータ圧縮を
行う際に便利であり、より効果的な文字認識やデ
ータ圧縮が可能である。
この発明は、この様な事情に基づいて成された
ものであり、活字と手書文字の判別が可能な画像
種類の識別装置を提供することを目的とする。
この目的を達成するため、この発明によれば被
読取り物上を走査して得られた文字画像から文字
行に相当する領域を抽出する手段と、抽出された
領域に含まれる個々の文字領域を検出し、この文
字領域のうち、高さが所定の範囲内にあるものの
みを選択して抽出する手段と、選択抽出された文
字領域についての高さの平均μHと標準偏差σnを
基に文字種類を判定する手段とを有するようにす
る。
判定手段は、例えば、σH/μHの大小から文字
種類の判定を行う。
以下、添付図面を参照しつつこの発明の実施例
を説明する。
一般に、文字画像の特性を調べてみると、手書
文字と活字文字とでは高さのばらつきが手書文字
の方が大きいことが分かつた。この発明は、この
ことを利用するものであり、以下の様な段階を追
つて文字種類の判別を行う。
(1) 文字行の抽出 2値画像において主走査方向に文字行があると
仮定する。ここで、一走査線における黒画素数の
和がk画素以上(例えば、k=2〜4)のとき、
この走査線は文字行内に存在していると判断す
る。
次に、この様な黒画素の条件を満たす走査線数
Rが11R12(例えば、11=10、12=60)であ
るとき、この一連の走査線を文字行と判断し抽出
する(第1図a)。
(2) 文字領域の抽出 次に、(1)で抽出した文字行に対応する走査線に
おいて、この走査線方向とは略直角な方向におけ
る黒画素が一定数以上連続する部分を文字領域と
して判断抽出する(第2図b)。
このとき、第1図cに示す様に、文字行の高さ
H1と共に各文字領域の高さH1,H2,……を算出
する。ここで、1/2H1>Hi(i=1、2、3、… …、n)であるような文字領域は切捨てる。例え
ば、第1図cにおいては、H2<1/2H1であり切 捨てられてしまう。
(3) 文字種類の判定 (2)で算出した各文字領域の高さH1,H2,……
を基に、高さの平均μH及び高さの標準偏差σHを
次の様に求める。
次に、D=σH/μHと閾値THとを比較し、 DTHのときは手書文字、 D<THのときは活字文字 と判定する。例えば、TH=0.1とする。
更に、文字行の幅W1について、aを定数(例
えば3)として、 W1<aH1 なる関係がある文字行について成立つとき、前の
行のμ′H,σ′Hをもつて次の様な判断を行うこと
もできる。
すなわち、当該行の高さH1について、 μ′H−σ′H′<H1<μ′H+σ′H のとき、この行は前の行と同じ種類の文字行であ
ると判定する。
第2図はこの発明に係る実施例を示すものであ
る。
同図によれば、シフトレジスタ20、カウンタ
21、アドレス制御装置22、出力制御装置2
3、文字列抽出装置24、文字領域抽出装置2
5、演算装置26、及び判定装置27を具えてい
る。
シフトレジスタ20は文字行を抽出するための
ものであり、複数のシフトレジスタを縦続接続し
たものであり、例えば一台のシフトレジスタは一
走査線分の画像情報を蓄積する。
カウンタ21は各走査線毎に黒画素を計数する
ものであり、その走査線の黒画素の数が一定値k
を越えたことをアドレス制御装置22に記憶させ
る。
アドレス制御装置33は、黒画素の数が一定値
kを越えた走査線に対応するアドレスを記憶する
と共に、後の処理に係る文字領域に対応するアド
レスも記憶する。この記憶されたアドレスはそれ
ぞれ信号Sa,Sbとして出力制御装置23及び文
字領域抽出装置24を駆動する。また、後段の処
理のために必要なアドレス信号Scを所定のタイ
ミングで送出する。
出力制御装置23は、以上の様なアドレス制御
装置22の出力信号Saで駆動され、必要な条件
を満たした連続する走査線に対応したシフトレジ
スタの内容を取出すようにする。この出力制御装
置23の出力S1が文字行に対応する。
文字列抽出装置24は、前記第2項の操作を行
い文字領域を抽出するものであり、出力制御装置
23を介して、出した文字行に対応する情報S1
一度蓄積し、これを副走査方向に走査して黒画素
列を順次出す。この黒画素領域に対応するアドレ
スSbをアドレス制御装置22に記憶させる。
文字領域抽出装置25は、文字列抽出装置24
によつて順次抽出出力された黒画素列が一定数以
上連続するか否かを判断し、連続した場合に当該
判断サイクルに係る黒画素列が文字領域に属する
と判断し、その黒画素列のうち最大のものをその
文字領域の高さHiとして出力する。
他方、この文字領域抽出装置25は、出力制御
装置23から抽出走査線の数に対応する信号Sd
を入力され、1/2H1>Hiの条件にあてはまる高さ Hiがあればそれを出力しないこととする。また、
後段の必要に応じてHiをそのまま転送する。
演算装置26は各Hiをアドレス信号として
σH/μHを演算するものであり、例えばレジスタ
とROMをもつて構成する。
判定装置27は、演算装置26の出力D=
σH/μHを与め定めた閾値Thと比較し、D5Th
であれば手書文字“1”、D<Thであれば活字文
字“0”を示す信号S0を送出する。また、必要に
応じて文字行の高さH1、幅W1を利用した前述の
処理を行うこともできる。
次に、以上の実施例の動作を説明する。
スキヤナ(図示せず)によつて読取られ2値化
された画像信号Svが直列的に順次シフトレジス
タ20に送込まれる。例えば、第1番目の走査線
に対応する画像信号がシフトレジスタ20に送込
まれるが、このときカウンタ21は黒画素の数に
応じてカウントアツプし、カウント値が例えばk
=5を越えるとこの1番目の行は文字行になる可
能性があるとして、この走査線のアドレスをアド
レス制御装置22に記憶させる。
こうして、i番目(例えば10番目)までの走査
線の画像情報をシフトレジスタ20に蓄積した段
階で、アドレス制御装置22の記憶内容を走査
し、文字行となる可能性があるとして記憶させた
走査線が一定数連続していれば、この走査線のア
ドレスSaと出力制御装置23に与える。以下、
順次一走査線毎にこの判断を繰返し、必要な画像
についての文字行を抽出する。
抽出された走査線毎に、この走査線とは略直角
な方向(副走査線方向)の黒画素列を文字列抽出
装置24で抽出し、文字領域抽出装置25におい
てこの黒画素列が連続する度合を計数して文字領
域を判断すると共に、各領域の高さHiを算出す
る。演算装置26において各Hiを基に抽出した
文字領域についての判別式Dの値を演算し、これ
を判定装置27の閾値と比較して、文字種類の判
別信号S0を送出する。このとき、判別した信号S0
に対応するアドレスをアドレス制御装置22が信
号Scとして出力する。
この発明は、以上の様に構成することにより、
活字文字と手書文字の判別が可能な画像種類の識
別装置を提供することができる。
【図面の簡単な説明】
第1図はこの発明の各段階を説明するための
図、第2図はこの発明の実施例の系統図である。 20…シフトレジスタ、21…カウンタ、22
…アドレス制御装置、23…出力制御装置、24
…文字列抽出装置、25…文字領域抽出装置、2
6…演算装置、27…判定装置。

Claims (1)

  1. 【特許請求の範囲】 1 被読取り物上を走査して得られた文字画像か
    ら文字行に相当する領域を抽出する手段と、 前記抽出された領域に含まれる個々の文字領域を
    検出し、この文字領域のうち、高さが所定の範囲
    内にあるもののみを選択して抽出する手段と、前
    記選択抽出された文字領域についての高さの平均
    μHと標準偏差σnを基に文字種類を判定する手段
    とを有する画像種類の識別装置。 2 特許請求の範囲第1項記載の装置において、
    前記判定手段はσH/μHの大小から判定を行う画
    像種類の識別装置。
JP56043038A 1981-03-24 1981-03-24 Discriminating device of kind of picture Granted JPS57157380A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56043038A JPS57157380A (en) 1981-03-24 1981-03-24 Discriminating device of kind of picture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56043038A JPS57157380A (en) 1981-03-24 1981-03-24 Discriminating device of kind of picture

Publications (2)

Publication Number Publication Date
JPS57157380A JPS57157380A (en) 1982-09-28
JPH0222427B2 true JPH0222427B2 (ja) 1990-05-18

Family

ID=12652737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56043038A Granted JPS57157380A (en) 1981-03-24 1981-03-24 Discriminating device of kind of picture

Country Status (1)

Country Link
JP (1) JPS57157380A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6278690A (ja) * 1985-10-02 1987-04-10 Fujitsu Ltd 文字認識装置
JPH0721817B2 (ja) * 1986-03-26 1995-03-08 株式会社日立製作所 文書画像処理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5434706B2 (ja) * 1971-09-13 1979-10-29
JPS5222436A (en) * 1975-08-13 1977-02-19 Sharp Corp Character reader

Also Published As

Publication number Publication date
JPS57157380A (en) 1982-09-28

Similar Documents

Publication Publication Date Title
EP0113410B1 (en) Image processors
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US7054485B2 (en) Image processing method, apparatus and system
GB2190778A (en) Character recognition with variable subdivision of a character region
US6754391B2 (en) Systems and methods for rendering image-based data
CN1118484A (zh) 带缺陷检测的文件图像处理器
JPS63158678A (ja) 単語間スペ−ス検出方法
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
JP2644041B2 (ja) 文字認識装置
JPH0222427B2 (ja)
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP3378108B2 (ja) 二値イメージ出力装置
JPH0357507B2 (ja)
JPS6343788B2 (ja)
JP2590463B2 (ja) ナンバ−プレ−ト自動認識装置
JP2716291B2 (ja) 用紙情報入力装置
JPS6331825B2 (ja)
JP2002015283A (ja) 分離文字列統合方法および装置
JP2743378B2 (ja) 文字認識方法
JP2571236B2 (ja) 文字切出し識別判定方法
JP2626084B2 (ja) 文字認識装置
JP2721415B2 (ja) 文字画像抽出方法
JPH07115542A (ja) 画像処理装置
JP2875330B2 (ja) 文字認識方法