JPH0782524B2 - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH0782524B2
JPH0782524B2 JP58055980A JP5598083A JPH0782524B2 JP H0782524 B2 JPH0782524 B2 JP H0782524B2 JP 58055980 A JP58055980 A JP 58055980A JP 5598083 A JP5598083 A JP 5598083A JP H0782524 B2 JPH0782524 B2 JP H0782524B2
Authority
JP
Japan
Prior art keywords
character
pattern
cutout
recognition
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58055980A
Other languages
English (en)
Other versions
JPS59180783A (ja
Inventor
広海 難波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58055980A priority Critical patent/JPH0782524B2/ja
Publication of JPS59180783A publication Critical patent/JPS59180783A/ja
Publication of JPH0782524B2 publication Critical patent/JPH0782524B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、特に連続した文字列の読取処理を行なう光学
的文字読取装置に関する。
〔発明の技術的背景とその問題点〕
一般に、光学的文字読取装置では、用紙上に記録された
文字列に対して、1文字毎の検出切出処理が行なわれ
る。そして、切出された文字が、文字認識部で認識され
ることになる。したがつて、文字の検出切出処理は、文
字読取性能に大きな影響を与えることになり、極めて重
要である。
ところで、検出切出処理において、第1図(a)に示す
ような隣接した文字列が、セリフ(serif)および印字
ずれ等の理由により接続している場合、確実な検出切出
は極めて困難である。このような場合、従来では以下の
ような検出切出方法が行なわれている。即ち、まず第1
図(a)に示すように、連続した文字ブロツクの左端X1
から文字ピツチPだけ離れた位置(X1+P)の近傍に幅
W1の境界検出領域を設定する。この境界検出領域内を、
同図(b)に示すように縦方向に走査し、各走査線1〜
6中の黒ビツト数を計数する。この黒ビツトの計数直列
(ヒストグラム)から文字の境界を求める。この境界の
決定方法は、例えば黒ビツト数の最小値の位置または黒
ビツト数の変化量最大の位置等から選択してなされる。
例えば、同図(b)に示す各走査線1〜6中の黒ビツト
数が、それぞれ15,14,13,14,6,4ビツトであれば、第5
本目の走査線5の位置X2が境界となる。そして、このよ
うに決定された境界位置X2に基づいて、検出切出処理が
行なわれる。さらに、次の文字については、位置X2を起
点として、上記と同様な操作が行なわれ、境界位置X3が
求められる。
しかしながら、上記のような従来の方式では、例えば第
1図(a)に示すように左端の文字幅(文字Iの幅)が
ピツチPよりも狭い場合、本来の正常な境界位置Bより
も右方向の位置が境界位置X2となり、次の文字を分断し
て認識する不都合がある。また、文字幅がピツチPより
広い場合(印字が濃くて太くなつた場合など)第1図
(c)に示すようにその文字自身を分断して認識するこ
とになる。即ち、従来方式では、1文字単位に文字境界
の検出判定を行なうため、異種フオントの混在、印字濃
度による文字幅の変動および印字の位置ずれなどが存在
すると、切出位置を誤まつて検出することが多い。一
度、切出位置の検出をミスすると、後続する文字の検出
切出も誤まる可能性が高いなど、文字列全体の読取が不
安定になる欠点があつた。さらに、プロポーシヤル(pr
oportional)文字、即ち文字ピツチが一定でなく文字幅
に応じて詰めて印字される文字の読取は不可能であつ
た。
〔発明の目的〕
本発明は上記の事情に鑑みてなされたもので、その目的
は、連続した文字列およびプロポーシヤル文字等の場合
でも、確実な検出切出処理を実現して安定な文字読取を
行なうことができる光学的文字読取装置を提供すること
にある。
〔発明の概要] 本発明では、文字の検出切出手段において、少なくとも
連続した2文字分以上の文字パターンを格納するパター
ンメモリが設けられる。このパターンメモリ内の文字パ
ターンに対する垂直射影ヒストグラムが求められる。こ
の垂直直射影ヒストグラムに基づいて、文字の検出切出
候補位置が検出される。この検出切出候補位置から、連
続する少なくとも2文字分について検出切出位置が、選
択される。そして、選択された検出切出位置でパターン
メモリ内の文字パターンを切出して、その1文字分の文
字認識が行なわれる。この文字認識結果が判定手段によ
り文字の特徴を有しているか否かを判定され、その判定
結果で検出切出位置の妥当性が判定される。
〔発明の実施例〕
以下図面を参照して本発明の一実施例について説明す
る。第2図は本発明に係る光学的文字読取装置の部分的
構成を示すブロツク図である。図中、1は走査器で、用
紙上の文字情報を走査し光電変換した文字パターンを出
力する。パターンメモリ2は、走査器1からの文字パタ
ーンを例えば1行分格納する。XおよびYアドレスカウ
ンタ3,4は、パターンメモリ2のXおよびY座標を指定
する。5は黒ビツトカウンタ(Bカウンタ)で、パター
ンメモリ2内を走査して得られる信号の中で文字パター
ンを構成する黒ビツト数を計数する。6は1文字パター
ンメモリで、パターンメモリ2から1文字分切出された
文字パターンを格納する。認識部7は、1文字パターン
メモリ6内の文字パターンを読出して文字認識を行なつ
て、その認識結果をマイクロプロセツサ8に出力する。
マイクロプロセツサ8は、Bカウンタ5からの計数結果
に基づいてパターンメモリ2内の文字パターンに対する
検出切出位置を決定する機能を有し、さらに認識部7か
ら認識結果に基づいて検出切出の妥当性を判定する機能
を有する。
このような構成において、その動作を第3図および第4
図を参照して説明する。まず、走査器1により用紙上の
1行分の文字パターン(または2文字分以上からなる1
フイールド分でもよい)が走査されて、パターンメモリ
2内に格納される。次に、パターンメモリ2内を走査し
て、1文字分が検出切出される。この場合、マイクロプ
ロセツサ8は、パターンメモリ2内の文字パターンの垂
直射影ヒストグラムを作成して、この垂直射影ヒストグ
ラムに基づいて検出切出を行なう。この垂直射影ヒスト
グラムは、文字パターンに対して上から下へ投影した射
影で、Yアドレスカウンタ4をインクリメントしつつB
カウンタ5で黒ビツト数をカウントした際の計数結果に
より作成される。マイクロプロセツサ8は、各文字間が
十分分離していると判定した場合、パターンメモリ2内
の文字パターンに対して上下方向位置を検出した後(X
アドレスカウンタ3を操作する)、検出切出した文字パ
ターンを1文字パターンメモリ6へ転送して文字認識を
行なうように制御する。
一方、各文字間が第3図に示すように、分離していない
場合、まず基準点X1から文字ピツチPおよび2P離れた両
者の位置の近傍に幅W2の境界出領域を設定する。この境
界検出領域内に対して、Yアドレスカウンタ4の動作に
よりパターンメモリ2内を縦方向に走査する。この走査
による各走査線中の黒ビツト数が、Bカウンタ5で計数
される。但し、上記のような垂直射影ヒストグラムが作
成されていれば、そのデータを使用してもよい。マイク
ロプロセツサ8は、黒ビツト数の計数値列(ヒストグラ
ム)に基づいて、文字の検出切出候補点を検出する。こ
の場合、候補点は、例えば黒ビツト数の極小点、増加量
最大の点および減少量最大の点などであり、この実施例
では第3図に示すようにX21,X22,X31,X32の4点であ
る。
次に、マイクロプロセツサ8は、検出切出候補点列X21,
X22,X31,X32の中から、2文字分(2文字しか接続して
いない場合は1文字分)の検出切出候補点を選択する。
この場合、まず候補点としてX1+PおよびX1+2Pの両者
のそれぞれに最も近い点を選択する。そして、選択され
た検出切出候補点でパターンメモリ2ら文字パターンを
切出して、その文字認識を行なう。この認識結果によ
り、2文字とも認識できた場合には、正しく検出切出し
されたものと判定し、その2文字分の処理を終了し次の
文字の処理に移る。また、少なくとも一方の文字が認識
できなかつた場合(リジエクト)には、検出切出候補点
の選択を再度行なう。この場合、リジエクトされた方の
文字の切出位置が、変化するような候補点を優先して選
択する。その後、上記のように再度、文字パターンを切
出して、その文字認識を行なう。そして、検出切出候補
点の全ての組合せ(但し、文字幅が許容範囲外になる組
合せを除く)に対して、認識できなかつた場合には、各
認識結果のうち最良の結果(例えばパターンマツチング
法の場合、類似度の和が最大のもの等)をその認識結果
とする(第4図の判定結果)。
具体的には、第3図において仮にX1+PおよびX1+2Pの
両者に最も近い点でX22,X32を候補点として選択したと
する。そして、上記のような一連の動作の結果、第1文
字は「l」と認識され、第2文字(本来はm)はリジエ
クトになつたとする。そこで、第2文字の右方向の検出
切出候補点をX31にして、再度文字認識を行なう。この
認識結果で、第1文字は「l」と認識され、第2文字は
リジエクトになつたとする。第2文字の右方向の検出切
出候補点は他にないので、今度は左方向の検出切出候補
点をX21とする。この場合、第2文字の右方向の候補点
としてX32があるが、(X32−X21)は文字幅の許容範囲
外となるため選択されない。したがつて、第2文字の右
方向の候補点には、X31が選択されることになる。そし
て、文字認識の結果として、第1文字が「l」、第2文
字が「m」と認識され、この認識結果が最終結果とな
る。このような具体例を以下のような表で示す。
ここで、上記表において、認識結果の数字は類似度値を
示し、類似度値が80未満の場合はリジエクトとして処理
する。したがつて、検出切出候補点X21,X31の場合、第
1文字は「l」と認識され、第2文字は「m」と認識さ
れることになる。
このようにして、連続した文字列に対する文字認識を行
なうことができる。この場合、本発明においては、上記
のように少なくとも2文字以上の文字境界領域の検出を
行ない、各文字の認識結果に応じて最適の検出切出候補
点を選択する。したがつて、異種フオントの混在、文字
幅の変動および印字の位置ずれ等がある場合でも、各文
字の検出切出しを確実に行なうことができる。また、プ
ロポーシヤル文字の場合でも、確実な検出切出処理を行
なうことができる。但しこの場合には、検出切出候補点
の検出領域および文字幅の許容範囲が広がるので、多少
処理時間が増大することになる。
〔発明の効果〕
以上詳述したように本発明によれば、連続した文字列に
おいて異種フオントの混在、印字濃度による文字幅の変
動と印字の位置ずれ等がある場合またはプロポーシヤル
文字の場合でも、1文字毎の検出切出処理を確実に行な
うことができる。したがつて、結果的に安定で正確な文
字読取を行なうことができるものである。
【図面の簡単な説明】
第1図は従来の光学的文字読取装置において検出切出処
理方法を説明するための文字パターンの一例を示す図、
第2図は本発明の一実施例に係る光学的文字読取装置の
部分的構成を示すブロツク図、第3図は第2図の装置に
おいて検出切出処理方法を説明するための文字パターン
の一例を示す図、第4図は第2図の動作を説明するため
のフローチヤートである。 1……走査器、2……パターンメモリ、3……Xアドレ
スカウンタ、4……Yアドレスカウンタ、5……黒ビツ
ト数カウンタ、7……認識部、8……マイクロプロセツ
サ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】用紙上に記録された文字情報を光電変換す
    る光電変換手段と、 この光電変換手段により得られた文字パターンであっ
    て、少なくとも2文字分の文字パターンを格納するパタ
    ーンメモリと、 このパターンメモリに格納された少なくとも2文字分以
    上の文字パターン列において、前記文字パターン列の垂
    直射影ヒストグラムと文字ピッチ情報に基づいて、前記
    文字パターン列から1文字単位の文字パターンを切出す
    ための検出切出候補位置を所定の範囲内で決定する候補
    位置決定手段と、 この候補位置決定手段により決定された前記検出切出候
    補位置から検出切出位置を選択する選択手段と、 この選択手段により選択された前記検出切出位置により
    前記パターンメモリに格納された前記文字パターン列か
    ら1文字単位の文字パターンを切出して、文字認識処理
    を行なう文字認識手段と、 この文字認識手段から得られた前記文字パターン列に対
    応する少なくとも2文字分の各認識結果に基づいて、前
    記各認識結果の全てが正常である場合に選択した前記検
    出切出位置を妥当であると判定し、前記各認識結果の中
    で認識不可の文字パターンがある場合には前記選択手段
    による検出切出位置を変更し、この変更した検出切出位
    置に基づいて前記文字認識手段による文字認識処理を再
    実行させる制御手段とを具備したことを特徴とする光学
    的文字読取装置。
JP58055980A 1983-03-31 1983-03-31 光学的文字読取装置 Expired - Lifetime JPH0782524B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58055980A JPH0782524B2 (ja) 1983-03-31 1983-03-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58055980A JPH0782524B2 (ja) 1983-03-31 1983-03-31 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS59180783A JPS59180783A (ja) 1984-10-13
JPH0782524B2 true JPH0782524B2 (ja) 1995-09-06

Family

ID=13014219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58055980A Expired - Lifetime JPH0782524B2 (ja) 1983-03-31 1983-03-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH0782524B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2505402B2 (ja) * 1984-10-31 1996-06-12 キヤノン株式会社 画像処理装置
JP2505401B2 (ja) * 1984-10-31 1996-06-12 キヤノン株式会社 画像処理装置
JP3965983B2 (ja) 2001-11-30 2007-08-29 松下電工株式会社 画像処理方法およびその装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52119032A (en) * 1976-03-31 1977-10-06 Fujitsu Ltd Pattern recognition unit
JPS58214969A (ja) * 1982-06-09 1983-12-14 Nec Corp 文字読取装置

Also Published As

Publication number Publication date
JPS59180783A (ja) 1984-10-13

Similar Documents

Publication Publication Date Title
US4481665A (en) Character segmentation method
EP0125877B1 (en) Information input apparatus
US4430563A (en) Data processing form
EP0164012A1 (en) Apparatus and method for reading a two-dimensional bar code
EP0308673A2 (en) Image inclination detecting method and apparatus
US4512032A (en) Optical character recognition apparatus
JPH0782524B2 (ja) 光学的文字読取装置
JPH09237312A (ja) 光学的文字読取装置
JP2578768B2 (ja) 画像処理方法
JPH05210759A (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS6027436B2 (ja) 文字認識修正方式
JPH0632074B2 (ja) 正規化方法
JPH0433074B2 (ja)
JP2578767B2 (ja) 画像処理方法
JPH0557632B2 (ja)
JPH039506B2 (ja)
JPS6139172A (ja) 文字検出切出方式
JPS6041396B2 (ja) 宛名検出装置
JPS62281095A (ja) パタ−ン情報認識方法
JPH0776979B2 (ja) 画像処理方法
JPS6142310B2 (ja)
JPH0778820B2 (ja) 画像処理方法
JPH04139593A (ja) 郵便番号認識装置
JPS62281094A (ja) パタ−ン情報認識方法