JPH0223905B2 - - Google Patents

Info

Publication number
JPH0223905B2
JPH0223905B2 JP56074015A JP7401581A JPH0223905B2 JP H0223905 B2 JPH0223905 B2 JP H0223905B2 JP 56074015 A JP56074015 A JP 56074015A JP 7401581 A JP7401581 A JP 7401581A JP H0223905 B2 JPH0223905 B2 JP H0223905B2
Authority
JP
Japan
Prior art keywords
character
circuit
cutting
extraction
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56074015A
Other languages
English (en)
Other versions
JPS57189274A (en
Inventor
Teruo Akyama
Isao Masuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP56074015A priority Critical patent/JPS57189274A/ja
Publication of JPS57189274A publication Critical patent/JPS57189274A/ja
Publication of JPH0223905B2 publication Critical patent/JPH0223905B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は、紙面上の文字を直接機械で読みとる
OCR装置において、文字のピツチが与えられず、
かつ分離文字や、場合によつて前後の文字とは全
くピツチの異なる記号を含んでいる文字列から
個々の文字、或いは記号を効率的に切出すことの
出来る文字切出し装置に関するものである。
従来のOCR装置では、複数個の文字を含む文
字列から予め与えられている文字ピツチをもとに
個々の文字を切出していた。従つてOCRは、基
本的には固定ピツチで規則正しく並んだ文字しか
切出すことが出来ず、文字の間隔が変化したり、
前後の文字とピツチの異なる記号等を含んだ文字
列に対しては正確な文字切出しが出来ないという
欠点を持つていた。また1つの文字列に含まれて
いる文字のピツチが固定であつても、文字ピツチ
の異なる文字列を同一紙面上に含んでいる文書に
対しては対応が困難であつた。
本発明は、これらの欠点を解決するために分離
文字、非分離文字等が混在する文字列に対して、
文字のピツチが正確にわかつていない場合や、或
いは全くわからない場合でも、また文字の間隔が
変化している場合や、ピツチが前後の文字とは全
く異なる記号等が文字列中に含まれている場合で
も効率的且つ正確な文字切出しを行なうことを目
的としている。
以下に、本発明を図面に従つて詳細に説明す
る。
第1図は本発明のブロツク図であつて、1は2
次元画面を画素に分解し各画素の濃度に応じて入
力される電気信号を2値化する2値化回路、1a
は2値化された各画素値を送る信号線、2は2値
化された2次元画面から文字列の領域を抽出する
文字列領域抽出回路、2aは抽出された文字列領
域の画像データを転送する信号線、3は文字列の
画像データを記憶しておく文字列画像データ記憶
装置、4は文字列画像データ記憶装置3の内容
と、切出しの途中結果と最終結果を格納する切出
し結果記憶装置5との内容を用いて文字の切出し
を行なう文字切出し回路、5bは切出した最終結
果を出力する信号線である。また文字切出し回路
4は初期パラメータ設定用の入力信号線をもつ。
3a,4a,5aは、文字列画像データ記憶装置
3と、文字切出し回路4及び切出し結果記憶装置
間の信号線群であり、詳細については後に説明す
る。
2値化回路1は、原画像を光電変換装置等によ
り走査し、その濃度に応じて出力される電気信号
を適当なしきい値を用いて0、又は1の2値の画
像データとするもので、公知の技術で実現可能な
ものである。
文字列領域抽出回路2は、上記2値の画像デー
タから画像に含まれる文字列の部分の画像データ
を抽出するもので、たとえば特願昭55−126845号
の出願に示す2次元文字領域抽出装置によつて実
現可能である。
文字列画像データ記憶装置3は、文字列領域抽
出回路2から転送されてくる文字列の画像データ
を格納するための装置である。
文字切出し回路4は、文字列領域抽出回路2に
よつて得られた文字列の画像データから個々の文
字を切出すための回路であつて第2図に示すよう
に複数個の回路から構成されている。以下、文字
切出し回路4を構成する個々の回路について、切
出し結果記憶装置5の持つ機能とともに説明す
る。
文字ピツチ推定回路6は、文字列画像データ記
憶装置3から信号線3a1によつて送られてくる
データ格納完了信号を受けて、文字列画像データ
記憶装置3に格納されている文字列画像データを
信号線3a2を用いて入力し、文字列の形状から
文字ピツチを推定し、該推定値を信号線6aを用
いて文字切出しパラメータ記憶装置7に格納する
回路である。
第3図は、文字ピツチの推定方法を説明するた
めの図である。図でaは文字列領域抽出回路2に
より抽出された文字列の一例で、たんざく状に切
出され、またbは文字列画像データ記憶装置内に
格納された文字列画像データの領域の巾を示して
いる。通常、文字は正方形に近い矩形で囲むこと
が出来るので、文字のピツチcは、bの値をもと
に、たとえば次に示す式で推定することが可能で
ある。
b×ρ1≦c≦b×ρ2;ρ1>0.ρ2>0.ρ1≦ρ2 文字が正方形に収まる場合にはρ1=ρ2=1とな
り、一般的にはρ1,ρ2は1に近い値を取る。入力
データによつておおよそのピツチがわかつている
場合には初期パラメータとして推定文字ピツチを
文字切出しパラメータ記憶装置7に格納してもよ
い。
文字切出しパラメータ記憶装置7は、文字切出
しに必要なパラメータを格納しておく装置で文字
の推定ピツチに関するパラメータ、切出し候補線
を求める場合の最大反転画素数に関するパラメー
タ、及び候補線探索領域に関するパラメータ等を
必要に応じて初期化し、記憶しておくためのもの
である。
文字切出し候補線抽出回路8は、信号線3a3
から入力される文字列画像データに基づいて文字
切出し線の候補位置を検出する回路である。第4
図は、縦書きの場合の文字切出し候補線の抽出方
法を説明するための図であるが、文字が横書きの
場合でも同様の処理が可能ある。
第4図A,B,C,Dにおいて、dL19dL4,eR1
〜eR4はそれぞれ文字列の左端と右端とを示す。
斜線の部分は、文字列画像データ上の黒画素の部
分を示している。文字切出し候補線抽出回路8は
まず第4図Aのf1の様に文字列の左端から右端に
かけて白画素が直線的に連結している部分を探
し、そこを文字切出しのための候補位置とする。
さらに第4図Bの様に、図形同士は接詳してい
ないにもかかわらず文字列の左端から右端にかけ
ての直線的に連続した白画素がない場合には、文
字列の左端と右端とを結ぶ直線以外のパスを求め
ることによる文字切出し候補線抽出を行なう。こ
こではパスの探索範囲を、文字切出しパラメータ
記憶装置7から信号線7aを経て入力されるパラ
メータにより決定する。第4図のBはその様子を
示したものであつて、f2は求めらた切出し候補線
である。この場合、パスの探索巾gは文字切出し
パラメータ記憶装置7から読み出される。第4図
Cの場合、文字列の左端と右端を連結するパスf3
が存在するが、探索巾gの範囲を越えているので
文字切出し候補線として登録されない。
さらに切出し候補線抽出回路8は、必要に応じ
て一定個数以下の黒画素を白画素に反転すること
により第4図Aのf1に類する切出し候補線抽出を
行なう。第4図Dは、画素hを反転することによ
つて切出し候補線f4が引かれる状態を示してい
る。この場合の反転画素数は1であるが、最大反
転画素数Mは、文字切出しパラメータ記憶装置内
のパラメータによつて決定される。最大反転画素
数はたとえば文字列の巾bを用いて以下の様に決
めることが出来る。
M=int(b×ρ3); ・ρ3≧0 この式でintは整数化を意味し、ρ3はパラメー
タである。以上の結果をもとに文字切出し候補線
抽出回路8は信号線8aを用いて切出し結果記憶
装置5の中の切出し候補位置フラグを立てる。
第5図は、切出し結果記憶装置5のフラグの状
態を説明する図である。切出し結果記憶装置5の
内部には切出し候補位置フラグ、切出し済みフラ
グ、切出し開始位置フラグの3種類のフラグがセ
ツト出来る様になつている。第5図のiは、文字
列画像データ記憶装置3の中に格納された文字列
画像データの一例である。第5図iに示される画
像データの場合、最大反転画素数を0とすると、
文字切出し候補線抽出回路8は切出し結果記憶装
置内の切出し候補位置フラグj1〜j7をセツトする。
なお信号線5a1は、後に述べる文字切出しの繰
り返し処理において、切出し結果記憶装置内の情
報を読み取り、文字列の中の未切出し部分を抽出
するために用いられるものである。
非分離文字切出し回路9は、文字列の中に含ま
れる非分離文字を切出す回路である。第3図の様
に縦書きの場合には、上下方向の分離のない文
字、例えば「東」「都」などを切出す。1つの
「文字」を構成する図形が文字切出し候補線によ
つて2個以上の領域に分割される可能性のない文
字をここでは非分離文字と呼ぶことにする。従つ
て横書きの場合で文字切出し候補線が縦方向に引
かれる場合には「都」は分離文字として扱かわれ
る。
非分離文字切出し回路9は、切出し結果記憶装
置5の中の切出し候補位置フラグを信号線5a2
を用いて読み出し、フラグ間の距離が文字切出し
パラメータ記憶装置7から信号線7bを用いて読
み出されて決定される推定文字ピツチの付近にあ
るものを抽出し、切出し候補線に挾まれる非分離
の図形を1つの「文字」とし、信号線9aを用い
て切出し結果記憶装置5の中の切出し済みフラグ
と切出し開始フラグとを立てる。
第5図においては、まずk1,k4,k6の部分が1
つの文字として切出され、それに対応する切出し
済みフラグl1,l2,l3が立てられる。次に切出し
済みフラグの先端に対応する場所に切出し位置フ
ラグm1,m2,m3が立てられる。
分離文字切出し回路10は、信号線5a3を経
て読み出される切出し済みフラグを用いて、既に
切出されている非分離文字の平均ピツチを計算
し、切出しされている部分(切出し済みフラグが
立てられている部分)に連続する未切出し部分
(切出し済みフラグが立てられていない部分)に
おいて、切出し済み文字の平均ピツチ付近に引か
れた切出し候補線を抽出し、もしあればそこまで
の部分を1つの文字として切出し信号線10aを
用いて切出し結果憶装置内に各種のフラグをセツ
トとする。
第5図の場合、既に切出されている部分k1,k4
に連続する部分n1,n2を探し、これまでに切出さ
れた非分離文字の平均ピツチすなわち(k1+k4
k6)/3の値付近にある切出し候補位置フラグj4
を抽出し、切出し候補線間θに含まれる図形をつ
の文字として切出し、信号線10aを用いて切出
し結果装置内の切出し済みフラグl4と切出し開始
位置フラグm4を立てる。この時θの値のとる範
囲は、k1+k2+k6/3×ρ4≦θ≦k1+k4+k6/3×ρ5
に よつて決定される。パラメータρ4,ρ5は文字切出
しパラメー記憶装置7から信号線7eを用いて読
み込まれる。
誤り切出し検出修正回路11は、信号線5a4
を用いて読出した切出し結果記憶装置5の内容
と、信号線3a4を用いて読み出した文字列画像
データとを照らし合わせ、誤つて切出している部
分を検出し、信号線11aを用いて切出し結果記
憶装置内の各フラグのセツト、リセツトを行うこ
とによつて切出し結果に修正を加える回路であ
る。
第6図は誤り修正の一手法を示す図で、この場
合、「京」の下の部分の図形が1つの「文字」と
して切出されており、切出し済みフラグRと切出
し開始位置フラグSが立てられている。すなわち
図形「亠」と「〓」が切り離されており、この様
な場合には以下に示す処理を行なうことによつて
その誤りを修正する。まず切出し領域に挾まれる
部分が一定の値ρ6以下であるp1にし、そこに含ま
れる図形Qから上下の切出し領域までの距離p2
p3を計測する。p2が一定の値ρ7より小さい場合に
は図形Qを上の領域に、又、p3が一定の値ρ7より
も小さい場合にには下の領域に統合する。
第6図の場合にはp3がρ7よりも小さく図形Qが
下の領域と統合され、切出し済みフラグRと切出
し開始位置フラグSがR′及びS′にセツトしなおさ
れる様子が示されている。この回路で用いられる
ρ7は信号線7dを経由して入力される値をもとに
して決定される。またp2,p3が一定の条件を満足
しない場合には上下の領域の切出し済みフラグ、
切出し開始位置フラグをクリアすることによつて
リジエクト処理を行なう。
つぶれ文字強制切出し回路12は、画像データ
上において2つ以上の文字図形がつぶれ等によつ
て連結し、1つの図形となつている部分を抽出
し、信号線5a5を経由して入力される各フラグ
の内容をもとに既に切出された文字の平均ピツチ
を算出し、その値を用いて強制的な文字切出しを
行ない、その結果を信号線12を用いて切出し結
果記憶装置5に書き込む回路である。
第5図のk5は2つ以上の文字が連結しているた
めに文字の切出しが出来ない場合の例を示してあ
る。ここでは、 k5×ρ3≦N=k1+θ+k4+k6/4≦k5×ρ9 N=2、3…ρ8>0、ρ9>0、ρ8<ρ9 を満足するNを求め、切出し結果記憶装置内の切
出し済みフラグl5と切出し開始位置フラグm5
m6を立てる。ここではρ8,ρ9は、ほぼ1に近い
値となるρ8,ρ9,Nの値の上限などは、信号線7
を用いて文字切出しパラメータ記憶装置7から
入力される値をもとに決定される。
処理終了判定回路13は、文字切出しパラメー
タ記憶装置7から信号線7fを用いてパラメータ
を読み込み、処理を打ち切るか、パラメータの値
を変更したのちこれまでの一連の切出し処理をく
り返して行なうかを判定する回路である。処理を
終了する場合には、切出し結果を切出し結果記憶
装置5から第1図に示される信号線5bを用いて
出力する。文字の切出しの位置及びその範囲は、
切出し済みフラグ、切出し開始位置フラグによつ
て容易に決定出来る。処理を繰り返して行なう場
合には信号線13cを用いて文字切出しパラメー
タ変更回路へパラメータを転送する。
文字切出しパラメータ変更回路14は変更した
パラメータを信号線14aを用いて文字切出しパ
ラメータ記憶装置7に転送した後、繰り返し処理
を行なうための制御信号を信号線14bを用いて
文字切出し候補線抽出回路8へ出力する。なお2
回目以後の処理は、切出し結果記憶装置内の切出
し済みフラグが立つていない部分、すなわち未切
出し部分のみが対象となる。
なお第2図で6b,8b,9b,10b,11
b,12b,13bは各回路へ制御信号を送るた
めの信号線である。さらにこの手法によれば、切
出し済み領域部分に挾まれる領域に含まれる図形
を一つの文字、或いは記号として判定することに
より、前後の文字とはピツチの異なる記号が文字
列に含まれている場合でも有効な切出しが可能で
ある。
以上説明した様に、本装置では文字列の形状か
ら推定したピツチを利用して確実に切出せる複数
個の文字をまず切出しておき、切出せなかつた部
分に対しては誤り切出しの検出修正を行ないなが
ら既に切出された文字の平均ピツチを利用して切
出すという一連の処理をパラメータを変更しなが
ら反復することによつて、文字のピツチが与えら
れていない文字列、また文字そのものの大きさは
等しくても文字が一定のピツチに従つて並んでい
ない文字列、前後の文字と全くピツチの異なる記
号を含んでいる文字列等に対しても、効果的かつ
正確な文字の切出しが出来る。従つて本装置は、
例えば新聞の様に文字列によつて含まれている文
字の数が必ずしも一定でなく、文字ピツチの異な
る文字列を同一紙面上に含むものに対しても効果
的な文字の切出しが可能である。
【図面の簡単な説明】
第1図は本発明の一実施例のブロツク図であつ
て、1は2値化回路、2は文字列領域抽出回路、
3は文字列画像データ記憶装置、4は文字切出し
回路、5は切出し結果記憶装置である。第2図は
第1図の文字切出し回路を構成する個々の回路の
1構成例であつて、6は文字ピツチ推定回路、7
は文字切出しパラメータ記憶装置、8は文字切出
し候補線抽出回路、9は非分離文字切出し回路、
10は分離文字切出し回路、11は誤り切出し検
出修正回路、12はつぶれ文字強制切出し回路、
13は処理終了判定回路、14は文字切出しパラ
メータ変更回路である。第3図は文字列領域抽出
回路2によつて抽出された文字列データの一例、
第4図は文字切出し候補線抽出の方法を示す図、
第5図は切出し結果記憶装置のフラグの状態を示
す一例を示す図、第6図は誤り切出しの検出修正
の方法を示す図である。なお第1図における信号
線3a,4a,5aはそれぞれ第2図の3a1,
3a2,3a3,3a4,8a,9a,10a,
11a,12a,13a,5a1,5a2,5a
3,5a4,5a5に対応する。

Claims (1)

    【特許請求の範囲】
  1. 1 2次元画面に含まれる文字列部分の2値画像
    データを入力し、該文字列に含まれる個々の文字
    を切出す文字切出し装置において、文字列の2値
    画像を記憶しておく文字列画像データ記憶装置
    と、文字列を構成する各文字がほぼ一定の大きさ
    の方形内に納まることを利用して文字ピツチを推
    定する文字ピツチ推定回路と、文字の推定ピツ
    チ、或いは文字切出し位置の推定等に用いる各種
    パラメータを記憶する文字切出しパラメータ記憶
    装置と、文字列画像データに格納されている文字
    列の画像データに対して文字切出しパラメータ記
    憶装置内に設定された値を用いて探索領域を決定
    した上で前記探索領域内に於いて、一定の個数以
    下の黒画素を白画素に反転し、白画素が連結する
    部分を抽出することによつて文字切出し候補線を
    抽出する文字切出し候補線抽出回路と、前記文字
    切出し候補線抽出回路によつて抽出された候補線
    の間隔が文字ピツチ推定回路によつて推定された
    文字ピツチの付近にある候補線対を探し、前記候
    補線対の中に含まれる非分離の図形を1つの文字
    として切出す非分離文字切出し回路と、前記非分
    離文字切出し回路によつて切出されなかつた部分
    に対して既に抽出されている文字の平均ピツチを
    用いて分離文字切出しを行なう分離文字切出し回
    路と、既に切出された文字に隣接する未切出し部
    分に含まれる図形の位置大きさ等から該切出し文
    字が正しく切出されているか否かを検証し、切出
    し位置が誤りであると判定された場合には、その
    誤りを修正する誤り切出し検出修正回路と、複数
    個の文字がつぶれて連結している場合の強制切出
    しを既に切出されている文字の平均ピツチをもと
    に行なうつぶれ文字強制切出し回路と、文字切出
    し過程の状態及び最終結果を格納する切出し結果
    記憶装置とを具備することを特徴とする文字切出
    し装置。
JP56074015A 1981-05-15 1981-05-15 Character cutout device Granted JPS57189274A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56074015A JPS57189274A (en) 1981-05-15 1981-05-15 Character cutout device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56074015A JPS57189274A (en) 1981-05-15 1981-05-15 Character cutout device

Publications (2)

Publication Number Publication Date
JPS57189274A JPS57189274A (en) 1982-11-20
JPH0223905B2 true JPH0223905B2 (ja) 1990-05-25

Family

ID=13534845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56074015A Granted JPS57189274A (en) 1981-05-15 1981-05-15 Character cutout device

Country Status (1)

Country Link
JP (1) JPS57189274A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59205679A (ja) * 1983-05-06 1984-11-21 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPS60146376A (ja) * 1984-01-11 1985-08-02 Nec Corp 文字切出し装置

Also Published As

Publication number Publication date
JPS57189274A (en) 1982-11-20

Similar Documents

Publication Publication Date Title
US20020085243A1 (en) Document processing apparatus and method
JPH05225378A (ja) 文書画像の領域分割システム
JPH0418351B2 (ja)
JPH0223905B2 (ja)
JPH0410087A (ja) 基本ライン抽出方法
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPS6325391B2 (ja)
JP2872768B2 (ja) 文字切出し装置
JPS61117670A (ja) 文字切り出し処理方式
JPH0548510B2 (ja)
JP3122476B2 (ja) 自動文書清書装置
JPH0750496B2 (ja) 画信号処理装置
JPS6239459B2 (ja)
JP2789622B2 (ja) 文字/図形領域判定装置
JPH0467674B2 (ja)
JP2000040122A (ja) 文字切り出し方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH07111738B2 (ja) 文書中の領域境界抽出方式
JP3275475B2 (ja) 文字配列が既知の対象文字列の認識装置
JPS59205679A (ja) 文字切出し装置
JP4129320B2 (ja) 画像処理装置及び記録媒体
JP3381803B2 (ja) 傾き角検出装置
JP2539026B2 (ja) 文字切り出し装置
JP2963807B2 (ja) 郵便番号枠検出装置