JPH0225553B2 - - Google Patents

Info

Publication number
JPH0225553B2
JPH0225553B2 JP56099262A JP9926281A JPH0225553B2 JP H0225553 B2 JPH0225553 B2 JP H0225553B2 JP 56099262 A JP56099262 A JP 56099262A JP 9926281 A JP9926281 A JP 9926281A JP H0225553 B2 JPH0225553 B2 JP H0225553B2
Authority
JP
Japan
Prior art keywords
character
black
area
image information
scan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56099262A
Other languages
English (en)
Other versions
JPS581274A (ja
Inventor
Manabu Takakura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56099262A priority Critical patent/JPS581274A/ja
Publication of JPS581274A publication Critical patent/JPS581274A/ja
Publication of JPH0225553B2 publication Critical patent/JPH0225553B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
本発明は文字認識装置において一字宛認識対象
の文字に外接する四辺形の文字枠を求める文字切
り出し方式に係り、特に手書き文字に対して、所
定文字枠を越えて隣接文字枠に侵入した文字を判
別認識する文字切り出し方式に係る。 情報処理システムの入力方法に光学文字読取装
置(以後OCRと略記する)が利用されているが
初期の特殊活字を用いたタイプライタ又はライン
プリンタ印字文字を認識する装置から、手書き文
字を認識出来る装置に発展している。 しかし、手書き文字においては、単に字形及び
寸法に個人差がある丈でなく、所定の記入枠を越
えて両隣りの記入枠に侵入する文字があるため、
文字切り出しに際して困難を生じている。 以下にその問題点を述べるに先立ち、理解に便
ならしめるため、従来の文字切り出し方式につい
て図面を参照しながら簡単に説明する。 第1図に文字認識装置の構成説明図を示す。 同図において帳票1上に記載された文字2はレ
ンズ系3を介してセンサ4に入射され、光電変換
された後、前処理回路5において所要の処理をさ
れて量子化され画像メモリ6に記憶され、文字識
認処理をプロセツサ7において行う。この文字認
識処理に当つて最初に行う処理が文字切り出し処
理である。 第2図に画像メモリ(第1図6)のメモリ構成
を示す。本例は1バイト(8ビツト)を1画素分
をメモリ8として、64Kバイトのメモリを用いた
場合の各メモリの構成をそれぞれの領域に16進数
表示のアドレスを付して示している。 即ち本図の例においては左上隅の1画素メモリ
8は0000番地であり、それより右に移ると下2桁
が順次変化して、右上隅では00FFとなり、又縦
に変化すると上2桁が変化して左上隅の1画素メ
モリ8より順次変化して左下隅はFF00となる。
最後のアドレスは右下隅でFFFFになる。 次に第3図に帳票1上の文字2と、それらの文
字が画像メモリ上で切出される際の切出し基点ア
ドレス9−1乃至9−4及び切出し高さと画像取
込高さで決る文字枠10の関係を示す。 同図において、文字認識装置によつて定まる画
像取込み高さと画像取込み幅(図の左右方向で特
に図示せず)及び文字枠10に対して、文字2が
本図の場合数字で534と並んでいる。今数字5
について考えると、その字を切出すためには、切
出し基点9−1と9−2をそれぞれ左切出し基点
及び右切出し基点とする。 同図において記載数字3及び4を順次切出す場
合は左及び右切出し基点は順次9−2と9−3又
は9−3と9−4の如く左方に捜索する。 第4図に画像メモリ上にビデオ情報として記憶
された数字5を例にして切出し方法を説明する。 同図において文字幅3バイト(8ビツト/バイ
ト)、切出し高さ40ビツトの画像メモリ領域を1
文字枠10としてその枠内において各縦スキヤン
毎にセグメントをなしているビデオ情報について
切出しを行う場合について述べる。 (但し実際には文字幅は5〜6バイトとしてい
る。) 同図において、まず数字5に対する左切出し基
点アドレス9−1から縦方向に捜索(以後縦スキ
ヤンと称す)を行い、最初の縦スキヤンが白スキ
ヤンであつたならば順次右側に黒スキヤンがあら
われるまで捜索してゆく。 今もし数字5が書かれなかつたならば、右切り
出し基点アドレス9−2まですべて白スキヤンと
なり、この場合はその文字枠10は空白(ブラン
ク)として処理される。 同図においては数字5がキチンとその文字枠1
0の中に納まつて書かれているので、左切出し基
点アドレス9−1より縦スキヤンを上述の如く右
方に捜索してゆくとすぐに最初の黒スキヤンが表
われる。 その場合最初の黒スキヤンの位置11を左切出
し位置(アドレス)とする。 又本図と違つて、左切り出し基点アドレス9−
1上の開始スキヤンが黒スキヤンになつた場合
は、その開始縦スキヤン位置を起点として、左右
に同数(通常十数ビツト)の範囲に対し左右交互
に縦スキヤン捜索を行う。 この捜索で最初に左側縦スキヤンに白スキヤン
を生じた場合、その右隣縦スキヤンを左切出し位
置とし、右側縦スキヤンに白スキヤンを生じた場
合は右側へ黒スキヤンを発見するまで走行してゆ
き黒スキヤン発見位置を左切出し位置とする。 上述の白スキヤンが左側文字枠内に生じた場合
は、当該文字枠記載文字が左側文字枠に侵入して
おり、又白スキヤンが当該文字枠内に生じた場合
は左側文字枠記載文字が当該文字枠に侵入してお
り、いずれも両方の文字間に重なりを生じていな
い場合である。 もし全捜索範囲内に白スキヤンが発見出来ない
場合は強制的に左文字枠基点位置である左切り出
し基点アドレス位置9−1を左切り出し位置とし
て文字切り出しを行つている。 これは当該文字枠10の記載文字とその左隣り
の文字枠10記載文字が相互に相手文字枠内に深
く侵入し合つて重なりを生じた場合あるいは文字
がつながつた場合である。 このように、順次右側、上側、下側と同様な手
順によつて切出し捜索を行つて文字の切出し位置
を決定して、文字切り出し処理を完了し、次のパ
ターン認識処理に移る。 上に述べた相隣る文字枠10の記載文字が相互
に相手文字枠内に深く侵入し合つた場合に強制的
に左又は右文字枠基点位置より左又は右切り出し
を行う場合について説明する。 第5図に文字2としてこの場合数字の5と3が
帳票1上で相互に相手文字枠10の中に侵入し合
つて書かれているいわゆるはみ出し文字の場合を
示す。即ち数字5は上部の横線が右隣りの数字3
の文字枠10にはみ出し部12となつて侵入し、
又数字3の下後は左隣りの数字5の文字枠10に
はみ出し部12となつて侵入している。 同図の数字5の右切出し基点アドレス(数字3
の左切出し基点アドレスと同じ)9−2を中心と
して画像メモリ上のビデオに変換された状況を第
6図に示す。 第6図において、数字5の右切出し基点アドレ
ス9−2から切出し捜索として右捜索13と左捜
索14を図示の都合上それぞれ交互に10回行つた
とする。(実際は前述の如く通常十数回づつ行な
われる)。同図においては数字5の上部横線はは
み出し部12となつて左捜索14の領域よりはみ
出している上に、数字3も左文字枠10にはみ出
し部12が侵入しているため、いずれにしても10
回の右捜索では縦スキヤンに白スキヤンは発生し
ない。右捜索13の領域についても同様である。 従つて、第6図の場合数字5が書かれている文
字枠10に対しての右切り出し位置15は右切り
出し基点アドレス9−2と同じとなり、数字5の
書かれた文字枠10に侵入している数字3のはみ
出し部12が附随される。 しかるに、上述の如き強制切り出しを行うと、
切出した文字を判別認識する場合には、しばしば
誤認識を生ずる可能性があるので、強制切出しの
ときはリジエクトを答として出力し本例の場合
5,3ともにリジエクトされ、OCRの運用効率
を低下させる。 本発明は、以上述べたはみ出し文字を識別して
誤認識を防止し、又リジエクト回数を減少して運
用効率を改善する文字切り出し方式を提案せんと
するもので、その目的は画像メモリに蓄えられる
複数の文字を含む画像情報に対して、予め与えら
れた文字位置情報が定める文字枠間境界の近傍を
文字を横断するように走査し、該走査の結果、黒
画素含む黒走査群と他の黒走査群の間に黒画素を
含まない白走査が存在する場合に当該白走査の検
出された走査位置を文字間の境界とみなして上記
画像情報から一文字ずつの情報を含んだ矩形領域
の画像情報を抽出する文字切出し方式において、
前記文字枠間境界を中心とし一定の大きさを有す
る矩形領域を設定すると共に、該矩形領域内の各
走査線上の隣接走査線上との黒領域の連続性を検
査し該矩形領域の始端側につながる黒領域と終端
側につながる黒領域とに分別する黒領域連続性検
査手段と、前記矩形領域から処理対象の文字側と
反対側の黒領域につながる黒領域を除去し該除去
した黒領域画像を予め定めてある保持場所に保持
しておく除去/保持手段と、処理対象の文字枠内
画像情報に前記反対側の黒領域につながる黒領域
を除去した矩形領域の画像情報を接続した増加画
像情報を作成する増加画像情報作成手段を備え、
前記文字枠間境界近傍の全ての走査において白走
査が検出されなかつたとき、前記黒領域連続性検
査手段による検査を行い、その結果黒領域の分離
が出来ない場合は、前記文字枠境界をもつて切り
出し、分離が出来る場合は、前記増加画像情報作
成手段の作成した画像情報から切り出し、前記除
去/保持手段の保持した黒領域画像は次の処理対
象文字画像に接続して用いるよう構成したことを
特徴とする文字切り出し方式により達成できる。 すなわち、今前述の第5図における数字5,3
のはみ出し状態を例にして説明すれば、数字5の
右切り出し位置を十数ビツト右側まで捜索して行
くが数字5と3が相互にはみ出しているため白ス
キヤンは生じない。しかし、数字5と数字3は相
互に分離しているため、当該切出し領域即ち数字
5の領域から連続しているセグメントである数字
5のはみ出し部と、当該切出し領域からは連続し
ておらず、隣接切出し領域即ち数字3の領域から
連続している数字3のはみ出し部とを不連続と判
別して、数字3のはみ出し部を数字5の切出し領
域より除去してやれば、数字5は正しく認識出来
て、その帳票をリジエクトせずに済む。又次に数
字3を切出す場合には前に除去した数字3のはみ
出し部を戻してやつて切出しを行う。 以下図面を参照して本発明の一実施例について
説明する。 第7図は第6図に示した数字5と3のはみ出し
状態で数字5の文字枠10を切出し処理対象とし
てその右切出し位置を求める場合の、ビデオ16
のセグメント図にエツジアドレスを付したエツジ
パターンである。 エツジパターンとは第7図を例にとると、下方
より上方に縦スキヤンを行つている場合白から黒
に変化すれば変つた黒のビツトのアドレスを一方
のエツジ(この場合黒エツジと称す)とし、又黒
から白に変化すれば、変つた白のビツトのアドレ
スを他方のエツジ(この場合白エツジと称す)の
アドレスとして、それらのアドレスを表示した図
で、本図は数字5の文字枠10の右切出し基点ア
ドレス9−2を中心として描いてある。 同図においてa1a2は1対の黒エツジと白エツジ
のアドレスであつて、図に示されたa〜tのアル
フアベツトのサフイツクスが奇数であれば黒エツ
ジであり、偶数であれば白エツジである。 又同一縦スキヤンにおいて複数の文字領域が存
在する場合は例えば同図の一番左端の縦スキヤン
即ちaスキヤンにおいて、a1−a2とa3−a4の如
く、それぞれの文字領域(この場合2組)が示さ
れる。 同図のe及びsの2つの縦スキヤンでは文字領
域は4組で本例において最も多い部分である。 第7図のエツジパターンから左右の文字枠10
に所属する文字(この場合5と3)のうち数字5
について、その右側のはみ出し部に対する分離切
出し処理の詳細を第8図のフローチヤートを中心
に第9図乃至第14図により説明する。 第8図において、はみ出し部に対する右切出し
処理を開始すると、まず文字枠右位置から左右に
それぞれ所定ビツト数(通常+数ビツト)の捜索
領域を設け、右側より左側に縦スキヤン走査を行
う。もし白スキヤンがあれば、その白スキヤンの
次に最初の黒スキヤンが見つかつた位置を右切出
し位置とする。 もし捜索領域全体について白スキヤンが存在し
ない場合は、その捜索領域内のビデオが分離して
いるかどうかを下記に述べるエツジテーブルを用
いた連続エツジ検出方法により判別して、もし分
離していない場合は従来通り強制的に文字枠右位
置を右切出し位置とし、もし分離していれば、右
側文字のビデオを特に設けた記憶領域に格納し
(本発明ではこれをセーブ(SAVE)と称してい
るので今後この処理をSAVEと記す)、左側文字
のみを切出し領域に残す。 次に上述のSAVE動作が発生したことを記憶し
ておくためにプログラムスイツチを設けて、
SAVEするSW=1としておく。 因に上述の白スキヤンが存在した場合と、強制
切り出しの場合はいずれもこのSAVEするSWは
0としてから特徴抽出の処理に入る。 上述の説明に戻つて、プログラムスイツチを操
作した後、当該切出し文字について、その右側を
再切出しして、はみ出し部を含めた文字全体を切
出す。 次に特徴抽出処理を行つた後、SAVEするSW
=1かどうかを調べて、1ならば右側文字の
SAVEされたビデオを切出し作業を行つているビ
デオメモリ領域に戻して、次の文字の切出し作業
を開始する。 先に一寸ふれたビデオ情報の隣接縦スキヤン毎
のセグメント間の連続又は分離の判別について以
下に述べる。 第7図に示したエツジパターンから第9図に示
す上下エツジテーブル17を作成する。 又上下エツジテーブル最終アドレステーブル1
8には、各縦スキヤンに対する最終ポインタap
〜tpが格納されている。 第9図に示した上下エツジテーブル17から、
連続したエツジを検出する方法を、隣接セグメン
ト間の位置関係により連続、不連続を規定する第
11図の連続判別図と以下に述べる連続判別式と
を対比し、更に第7図のエツジパターンも参照し
て説明する。 今第m−1スキヤンにおいて得られたセグメン
ト中連続判別を行うものの下エツジアドレスを
j、上エツジアドレスをkとし、又第mスキヤン
において得られ現セグメント中の上記j,Kに対
して連続判別を行うものの下エツジアドレスを
h、上エツジアドレスをiとする。 連続判別式は上記の8種類となり、それに対応
した連続判別図の番号を右方に記す。 但し、常にh<i,j<kの関係が成立する。
【表】
【表】 (1)の条件は左方のセグメントが上方にあり、右
方のセグメントが下方にあつて、その間が不連続
な場合であり、その逆が(8)の条件である。 連続条件(2)乃至(7)は左右のセグメントの大きさ
と接続状態とから10種類が存在する。 今これらの判別式を二三第7図と第9図にあて
はめて説明する。 まず第7図のa1a2とb1b2とをくらべると、(3)が
成立して第11図3−4の形の連続である。 次にa1a2とb3b4をくらべると、(8)が成立して第
11図8の状態の不連続である。 次にa3a4とb1b2は(1)で不連続、a3a4とb3b4は(4)
が成立して、第11図4−2の状態の連続であ
る。 このように順次相隣るセグメントのエツジアド
レスを比較してゆくと、d1d2とe1e2が不連続、及
びd1d2とe1e2が不連続である事が判り、以後左の
領域より連続なるa1a2とa3a4にそれぞれ連続なる
エツジ系列と左の領域とは不連続なe1e2,q3q4
びs5s6にそれぞれ連続なるエツジ系列はとは不連
続なることが判別出来る。 その結果を連続エツジ登録テーブル21に記憶
せしめると第10図の如くなり、その領域はテー
ブル最終アドレステーブル18の各スキヤンに対
応する最終ポインタap〜tpにより監視している。 第9図から第10図に転送されなかつたエツジ
アドレスは、先に述べたSAVE処理により別に格
納されて、次の本例における数字3を切出す際再
び取出して用いられるが、その処理は後に第13
図の回路ブロツク図の説明の際に説明する。 次に第7図のe3e4−f3f4−e5e6の部分を見ると
f3f4のセグメントに対してe3e4に連続なるエツジ
系列e5e6に連続なるエツジ系列が連続となつてい
る。 同じ状況はe5e6−d3d4−e7e8においても生じて
いる。 この形状を“曲がり”と称し、判別条件図を第
12図に示し、判別式を以下に述べる。 記号h,i,j,kは第11と同様とし、kより
上方の下、上エツジをそれぞれn,oとし又iよ
り上方の下、上エツジをそれぞれl,mとする。
又判別式の番号は前出に引続いて付ける。 まず左曲りの場合については、 (9) h<k<n<iなるときであり第12図の9
−1乃至9−5に示す関係位置の場合である。 次に右曲りの場合については、左曲りと対称に
なるので、 (10) j<i<l<kなるときであり、第12図の
10−1乃至10−5に示す関係位置の場合で
ある。 この“曲り”判別により第10図の連続エツジ
は全部連続している事が判別される。 上下方向についての曲りの判別も同様に行なわ
れるので説明は省略する。 以上右切出しについて説明したが、左側、上
部、下部の各はみ出し部に対しても同様な処理手
順と操作により分離切出しが行なわれる。 分離処理の回路動作を第13図に示す本発明の
一実施例の回路ブロツク図により説明する。 同図において、多少前述の説明と重複するが初
めよりの回路動作から説明すると、まず切出し回
路スタート信号が従来装置より発せられて切出
し回路22が起動し、同時にビデオストレツジ2
9よりビデオデータ〓〓を入力して切出し動作を開
始する。 今迄の説明の続きとして右切出しの場合につい
て説明すると、切出し回路22において前述の如
く第7図の右切出し基点アドレス9−2より左方
に縦スキヤンを開始する。 本例においては、前記の如く文字の5と3がは
み出し状態にあるため、最初の縦スキヤンから黒
スキヤンである。この場合は、シーケンスに従つ
て右切出し基点アドレス9−2の左右各十数ビツ
トの捜索領域に対して基点アドレス9−2を開始
点として左右交互に走査し、白スキヤンの有無を
テストする。但し先にも述べた如く本説明図では
左右おのおの10ビツト宛の範囲としている。 この範囲を捜索しても白スキヤンを発見出来な
かつたとき切出回路22から信号としてエツジ
テーブル作成回路23に入力される。 エツジテーブル作成回路23は切出し回路22
よりエツジテーブル作成領域を示す切出し領域デ
ータを信号として受信して、エツジテーブル記
憶回路24にライト信号〓〓を発信してエツジテー
ブルデータとして上下エツジアドレスを記憶さ
せる。 前に述べた如く切出し回路22は捜索領域に対
して、今の右切出しの場合であれば右方と左方の
2回走査を行つてその結果をエツジテーブル作成
回路23において照合し、一致していればエツジ
テーブル作成回路エンド信号を連続セグメント
判定回路25に送信して起動せしめ、もし不一致
の場合は切出し不良ステータス信号を切出し回
路22と異常処理シーケンス回路に送る。 上記信号を受けた切出し回路22はSAVE
SW=0信号をアンドゲート32に発信し、特
徴抽出回路30の特徴抽回路エンド信号と共に
認識回路31に起動信号を送つてその文字処理を
終了させる。 上記信号を受信した連続セグメント判定回路
25はエツジテーブル記憶回路、24にリード信
号〓〓を送つて、エツジテーブルデータを受信
し、先に述べた連続判別式(1)乃至8と曲り判別式
(9),(10)を用いて連続セグメントのエツジアドレス
を連続セグメント記憶回路26の連続エツジ登録
テーブルに、又曲りセグメントのアドレスの曲り
レジスタに、曲りの個数を曲りカウンタにライト
信号により連続セグメントデータとして記憶
させる。 もし捜索領域の全域において左領域より連続な
るセグメントと右領域より連続なるセグメントが
分離出来ないときは分離失敗ステータス信号を
切出し回路22及び異常処理シーケンス回路上送
信して、前述の切出し不良ステータス信号の時
と同様の処理を行う。 分離セグメントが存在する場合はSAVEデータ
は次の連続セグメントとビデオデータ比較回路2
7において分離記憶させる。 連続セグメント判定回路25の処理が完了する
と、連続セグメント判定回路エンド信号が連続
セグメントとビデオデータ比較回路27に送られ
て、その回路動作が起動し、連続セグメント記憶
回路26にリード信号を送つて連続セグメント
データを受信し、ビデオパターンに再生し、同
時にリード/ライト信号をビデオストレツジ2
9に送つて切出し回路22より送れたアドレスデ
ータ〓〓によりビデオデータをとり出し、その両
ビデオパターンを比較する。 両方のビデオパターンが一致すれば、ビデオデ
ータ中の残りのビデオパターンを不連続セグメ
ントとして、ライト信号〓〓を不連続セグメント記
憶回路28に送つて不連続セグメントデータを
記憶させ、一方ビデオストレツジ29にはビデオ
ストレツジ消去データを送つて不連続セグメン
トの部分を除去する。 この不連続部分を除去する動作をまとめて、
SAVEと称することは先に述べたが、このSAVE
を行つた場合SAVESW=1の信号を発信して
切出し回路22及びアンドゲート34に送る。 以上述べた動作が終了した時点で切出し回路2
2より切出し回路エンド信号が発信され、特徴
抽出回路30が切出し回路22より左右、上下の
切出しアドレスデータ〓〓と切出し回路スタート信
号を受けて起動する。 特徴抽出回路30の動作が完了すると、特徴抽
出回路エンド信号をアンドゲート32,33,
34に送る。 まずアンドゲート34は上述の信号と
SAVESW=1の信号を受けて不連続セグメン
ト記憶回路28に先に記憶した不連続セグメント
のビデオデータをビデオストレツジ29に転送す
る命令である不連続セグメントのビデオストレツ
ジへのロードスタート信号を送る。 この信号を受けた不連続セグメント記憶回路
28は不連続セグメントデータをビデオストレ
ツジ29に転送して、SAVEデータを次の文字切
出し対象文字のビデオパターンに付加する。 信号を受けたアンドゲート33は、不連続セ
グメント記憶回路28より不連続セグメントのビ
デオストレツジへのロードエンド信号を受け
て、オアゲート35を介し認識回路31に起動信
号を送り、特徴抽出回路30より特徴データ〓〓を
受信する。 信号を受けたアンドゲート32は切出し回路
22よりSAVESW=0の信号が発信されてい
るときオアゲート35を介して認識回路31を起
動させる。 以上述べた如く、本発明によれば従来分離不能
であつた相互はみ出し文字を分離して認識可能と
なしたので、OCRの読取り動作におけるリジエ
クトを減少し、又文字認識の成功率も向上出来る
ので、OCRの運転効率の向上と信頼性の向上に
対して効果多大である。
【図面の簡単な説明】
第1図は文字認識装置の構成説明図であり、第
2図は画像メモリ構成図、第3図は帳票上の画像
とフオーマツト情報位置関係図、第4図は画像メ
モリ上ビデオと切出し情報図、第5図ははみ出し
文字の帳票上位置関係図、第6図は同じくビデオ
図、第7図は本発明の一実施例のセグメント図、
第8図は同じく右切出しフローチヤート、第9図
は同じく上下エツジテーブル、第10図は同じく
連続エツジ登録テーブル、第11図は同じく連続
判別条件図、第12図は同じく曲りエツジ判別条
件図、第13図は同じく回路ブロツク図である。 図中、1は帳票であり、2は文字、3はレンズ
系、4はセンサ、5は前処理回路、6は画像メモ
リ、7はプロセツサ、8は1画素メモリ、9−1
乃至9−4は切出し基点アドレス、10は文字
枠、11は左切出し位置、12ははみ出し部、1
3は左捜索、14は右捜索、15は右切出し位
置、16はビデオ、17は上下エツジテーブル、
18はテーブル最終アドレステーブル、19及び
20は最終ポインタ、21は連続エツジ登録テー
ブル、22は切出し回路、23はエツジテーブル
作成回路、24はエツジテーブル記憶回路、25
は連続セグメント判定回路、26は連続セグメン
ト記憶回路、27は連続セグメントとビデオデー
タ比較回路、28は不連続セグメント記憶回路、
29はビデオストレツジ、30は特徴抽出回路、
31は認識回路、32乃至34はアンドゲート、
35はオアゲート、は切出し回路スタート信
号、はSAVESW=1信号、はエツジ情報信
号、はSAVESW=0信号、は切出し回路エ
ンド信号、は切出し不良ステータス信号、は
エツジテーブルデータ、はエツジテーブル作成
回路エンド信号、はエツジテーブルデータ、
及び〓〓はリード信号、は分離失敗ステータス信
号、及びは連続セグメントデータ、は連続
セグメント判定回路エンド信号、及び〓〓はビデ
オデータ、はリード/ライト信号、はビデオ
ストレツジ消去データ、及びは不連続セグメ
ントデータ、は不連続セグメントのビデオスト
レツジへのロードスタート信号、は不連続セグ
メントのビデオストレツジへのロードエンド信
号、は特徴抽出回路エンド信号、〓〓,,〓〓は
ライト信号、〓〓及び〓〓はアドレスデータ、〓〓は特
徴データである。

Claims (1)

  1. 【特許請求の範囲】 1 画像メモリに蓄えられる複数の文字を含む画
    像情報に対して、予め与えられた文字位置情報に
    よつて決定される文字枠間境界の近傍を文字を横
    断するように走査し、該走査の結果、黒画素含む
    黒走査群と他の黒走査群の間に黒画素を含まない
    白走査が存在する場合に当該白走査の検出された
    走査位置を文字間の境界とみなして上記画像情報
    から一文字ずつの情報を含んだ矩形領域の画像情
    報を抽出する文字切出し方式において、 前記文字枠間境界を中心とし一定の大きさを有
    する矩形領域を設定すると共に、 該矩形領域内の各走査線上の隣接走査線上との
    黒領域の連続性を検査し該矩形領域の始端側につ
    ながる黒領域と終端側につながる黒領域とに分別
    する黒領域連続性検査手段1と、 前記矩形領域から処理対象の文字側と反対側の
    黒領域につながる黒領域を除去し該除去した黒領
    域画像を予め定めてある保持場所に保持しておく
    除去/保持手段2と、 処理対象の文字枠内画像情報に前記反対側の黒
    領域につながる黒領域を除去した矩形領域の画像
    情報を接続した増加画像情報を作成する増加画像
    情報作成手段3を備え、 前記文字枠間境界近傍の全ての走査において白
    走査が検出されなかつたとき、前記黒領域連続性
    検査手段1による検査を行い、その結果黒領域の
    分離が出来ない場合は、前記文字枠境界をもつて
    切り出し、分離が出来る場合は、前記増加画像情
    報作成手段3の作成した画像情報から切り出し、
    前記除去/保持手段2の保持した黒領域画像は次
    の処理対象文字画像に接続して用いるよう構成し
    たことを特徴とする文字切出し方式。
JP56099262A 1981-06-26 1981-06-26 文字切出し方式 Granted JPS581274A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56099262A JPS581274A (ja) 1981-06-26 1981-06-26 文字切出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56099262A JPS581274A (ja) 1981-06-26 1981-06-26 文字切出し方式

Publications (2)

Publication Number Publication Date
JPS581274A JPS581274A (ja) 1983-01-06
JPH0225553B2 true JPH0225553B2 (ja) 1990-06-04

Family

ID=14242788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56099262A Granted JPS581274A (ja) 1981-06-26 1981-06-26 文字切出し方式

Country Status (1)

Country Link
JP (1) JPS581274A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170178A (ja) * 1984-09-13 1986-04-10 Noiberuku Kk 吐出ポンプ
JP2570415B2 (ja) * 1988-04-28 1997-01-08 セイコーエプソン株式会社 文字切り出し方法
JP2565150B2 (ja) * 1988-04-28 1996-12-18 セイコーエプソン株式会社 文字切り出し方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5617574A (en) * 1979-07-23 1981-02-19 Nec Corp Noise picture eliminating device

Also Published As

Publication number Publication date
JPS581274A (ja) 1983-01-06

Similar Documents

Publication Publication Date Title
JPH0546591B2 (ja)
CA2091997C (en) Character recognition methods including locating and extracting predetermined and apparatus data from a document
JPH0225553B2 (ja)
JP2005250786A (ja) 画像認識方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH03142691A (ja) 表形式文書認識方式
US20030002062A1 (en) Image processing apparatus, method and program, and storage medium
JPH07168911A (ja) 文書認識装置
JPH07160810A (ja) 文字認識装置
JPH08171609A (ja) 文字列高速抽出装置
JPH0217575A (ja) 図面自動認識方式
JP3027232B2 (ja) 文字認識装置
JP2882056B2 (ja) 特定パターンの識別方法
JPH05298487A (ja) 英文字認識装置
JPH07104940B2 (ja) 図形認識装置
JP4248700B2 (ja) 罫線識別方法、罫線識別装置および記録媒体
JPH1049602A (ja) 帳票認識方法
JPS609887Y2 (ja) 文字読取装置における前処理回路
JP2000113107A (ja) 文字認識装置及び方法
JPH08241376A (ja) 文字認識装置および文字認識方法
JPH05159100A (ja) 表認識装置
JPS603676B2 (ja) 交差点抽出方式
JPH05274473A (ja) 光学的文字読取装置
JPH10228538A (ja) 画像の端点抽出方法
JPH03164885A (ja) 光学式文字読取装置