JPS58106665A - 文字行切出し方法 - Google Patents

文字行切出し方法

Info

Publication number
JPS58106665A
JPS58106665A JP56204636A JP20463681A JPS58106665A JP S58106665 A JPS58106665 A JP S58106665A JP 56204636 A JP56204636 A JP 56204636A JP 20463681 A JP20463681 A JP 20463681A JP S58106665 A JPS58106665 A JP S58106665A
Authority
JP
Japan
Prior art keywords
projection
block
character
line
projections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56204636A
Other languages
English (en)
Inventor
Mamoru Maeda
護 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP56204636A priority Critical patent/JPS58106665A/ja
Publication of JPS58106665A publication Critical patent/JPS58106665A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、文書画像上の文字行を切り出す方法に関する
光学的文字認識装置などにおい・では、読み取った文書
画像から個々の文字ノ(・ターンを抽出するに先立ち、
文字行の切り出しを行なう必要がある。
この文字行の切出しは、通常、文書画像の文字行方向(
横書き文書ならば水平方向、縦書き文書ならば垂直方向
)の1射影をとることによって行なっている。しかし、
文字行に傾きがあったり、文書原稿のスキューが大きい
と、傾きの分だけ射影が拡がり、文字行の切出しが不正
確になる。傾きゃスキューがさらに大きくなると、隣接
する文字行の射影同士が重なってしまい、切出しが不可
能となる。
このような問題を解決するために、例えば横書き文書画
像の左端部と右端部とについて、それぞれ水平方向の射
影を求め、各射影の中心を起点として斜め方向に走査し
て黒画素を計数し、黒画素数が最大となる走査方向を文
字行の方向として検出することにより、文字行を切り出
す方法も提案され′Cいる。しかしこの方法は、斜め方
向の走萱が必要である等、アルゴリズムおよび装置構成
が複雑になる傾向がある。さらに、傾きが大きく、黒画
素数の多い長い文字行に挾まれた短い文字行は、切出し
を失敗する恐れもある。
したかつ・C本発明の目的は、傾きの大きい文字行を従
来よりも確実に切り出すことのできる、新規な文字行切
出し方法を提供することである。
本発明のもう1つの目的は、切出しのアルゴリズムが簡
単で、かつ大きな記憶域を必要とせず、装置化が容易な
文字行切出し方法を提供することにある。
しかして本発明の文字切出し方法は、文書画像を文字行
方向に3つ以上のブロックに分割し、該文書画像を走査
し゛C個々のブロック毎に文字行方向(横書き文書なら
水平方向、縦書き文書なら垂IP−/J IHJ J 
v)2u釉也小αノ、Lり未) i: シ’C求メタ各
ブロックの射影間の連結を調べることにより、該文書画
像上の個々の文字行を切り出すことを特徴とするもので
ある。
以下、一実施例によっ°C本発明を具体的に説明する。
第1図は、本発明(二よる文字行切出しを実行する装置
の一例を示すブロック図である。
50は文書の1ページまたは複数ページ分の画像データ
が蓄積されている画像メモリである。101は文字行切
出し用の記憶域として用いられるバッファメモリ装置で
あり、最も傾斜した1文字行分に相当する走査ライン数
(N)の画像データを蓄積できる容量を有する。
102は画像を含む走査ラインを検出する画像検出回路
であり、本例ではノイズの影響を避けるために黒画素が
2画素以上連続する走査ラインを画像ラインとして検出
する。103はバッファメモリ装置101ノ読み書き(
f(、/W )をiむ1]御す6 R/W制御回路であ
る。104は射影検出回路、105は射紗り恥鮎r胴へ
−(又手付を識別する連結判定回路である。
つぎに、第2図に概念的に示すような横書き文書画像を
例にして、文字行の切出し動作を説明する。
几/W制御回路103は画像メモリ装置5oに対し、文
書の上端より画像データの転送を要求する。画像メモリ
装置50より読み出された画像データは、R/W制御回
路103の制御下でバッファメモリ装置101に順次書
き込まれるが、同時に画像検出回路102にも入力され
る。
画像検出回路102が最初の画像ラインを検出して信号
を出力すると、几/W制御回路103はその走査ライン
を先頭ラインt1(第2図)とし、それからN本口の最
終ラインtN(第2図)の画像データがバッファメモリ
装置1o1に読み込まれた時点で、画像メモリ装置間に
対して画像データの転送停止を要求する。これにより、
バッファメモリ装置101に走査ラインt1〜tNのN
912分の画像データが蓄積される。なお、先頭ライン
t1より前の走査ラインの画像データは捨゛Cられる。
このようにしてバッファメモリ装置101が満杯になる
と、そこに蓄積された画像データを走査して文字行切出
し操作を開始する。
すなわち、R/W制御回路103のアドレス制御にした
がって、バッファメモリ装置101内の画像データが先
頭ラインt1から順番に読み出される。
この際、読出し中の走査ライン番号(先頭ラインt1か
らの相対的なライン番号)と、ブロック番号が几/W制
御回路103より射影検出回路104へ送出される。
ここでブロック番号について説明する。
本発明では文字切出しの際に、文書画像を文字行方向に
3つ以上のブロックに分割して扱う。本例では第2図に
点線で示すように、文書画像をN〜Gの7ブロツクに分
割している。これら各ブロックN〜Gの識別゛番号が上
記のブロック番号である。
さ′C1射影検出回路104はバッファメモ1.I’4
f101から読み出される各走査ラインにつぃ°C1各
ブロック毎に揖i#車が所安数しjト在左すス孔胛べて
、ブロック毎に文字行方向(主走査方向)の射影を検出
する。このようにして各ブロックにつぃC求められた射
影を、第2図に縦矢線a1.b1゜・・・・・・11で
概念的に示す。なお、ブロックB、C。
Eのように文字行が2行存在するブロックでは、同一ブ
ロックに2つの射影が検出されることは当然である。射
影検出回路104はフリック別に検出した各射影の上端
と下端の走査ライン番号を検出し保持する。
上記の射影検出が終了すると、連結判定回路105が射
影相互の連結を調べて文字行を切り出す。まず、各ブロ
ックの射影とその隣妙のブロックの射影との重なりを調
べ、重なり合う射影を連結する。
この操作を全′Cの射影につい°C行なう。
第2図の例では、隣接するブロックF、Gの射影f1+
’lの範囲に共通の走査ラインを含むから、射影f1+
’lは連結する。ブロックE、Fの射影e1+hの範囲
に共通の走査ラインを含むから相互に連結され、したが
つ・C射影e1+ r1+ 91が連結される。ブロッ
クDの射影d1とブロックEの射影e1とは重ならない
から連結されない。
このようにし゛C1第2図の例では射影a1.b1゜C
1、−射影eII fII21、射影b2I021dl
、C2がそれぞれ一群として連結される。
つぎに、先頭ラインt1を含む射影を含む連結された射
影群と他の射影群(または孤立した射影)との連結を調
べる。もし、先頭ラインを含む射影群に全ブロックの射
影が含まれ”でいれば、その射影群の範囲に文字行があ
ると判定駿、左右端の射影の中心を通る直線を基準とし
て、一定幅の帯状領域を文字行として切り出し、その領
域を示す情報を出力する。
先頭ラインt1を含む射影群に全ブロックの射影が含ま
れていなければ、その射影群のうちの左右端の射影の中
心を結ぶ直線の延長線と交叉する他の射影(群)を捜す
。それが存在すれば、その射影(群)と先頭ラインt1
を含む射影群とを連結し、その中で左右端の射影の中心
を通る直線を基準とし、一定幅の帯状領域を文字行とし
て切り出す。連結すべき他の射影(群)がなければ、先
頭ラインt1を含む射影群の中の左右端の射影の中心を
通る直線を基準とし、一定幅の帯状領域を文字行としC
切り出す。
第2図の例では、文字列(00・・・・・・00,11
1・・・・・・111)を含む文字行が切り出されるこ
とになる。
以上のようにして1つの文字行の切出しを終了すると、
几/W制御回路103は文字行とし°C切り出された領
域につい゛Cバッファメモリ装置101内の画像データ
を消去(クリア)する。ついで几/W制御回路103は
、消去しない範囲で最も高い位置にある射影の上端の走
査ラインを改めて先頭ラインt1′とする。第2図の例
では射影e2の上端の走査ラインを新し、い先頭ライン
t1′とする。そし°CR,/W制御回路103は画像
メモリ装置間に対して、前回転送した最後の走査ライン
の次の走査ラインから画像データの転送を要求する。・
ノくラフアメモリ装置101に先頭ラインt1′から走
査ラインN本分の画像データが蓄積すると、R/W制御
回路103は画像メモリ装[50に対して画像データの
転送停止を要求する。その後、前述したと同様の文字行
切出し操作が開始される。
以上の動作の繰り返しにより、文書画像上の全′Cの文
字行が切り出される。
なお、以上の説明では、文字行として切り出された領域
の画像データ(〕(ツラフアメモリ置101内)をクリ
アしたが、これを行なう代りに、その領域内の射影をそ
の後の文字切出し時の連結対象から除外するような処理
を行なってもよUN Qまた、射影検出と連結判定とを
並行して実行することも可能である。
本発明は以上に詳述した如くであるから、傾きの大きな
文字行−や、長い文字行の間に挾まれた短い文字行も確
実に切出し可能であり、また切出しアルゴリズムも簡単
で大容敞の記憶域も不要であるため切出し装置も安価に
実現できる等、極めて大きな効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
文字切出し過程を説明するためのIシ]である。 関・・・画像メモリ装置、101・・・文字切出し用の
ノζッファメモリ装置、102・・・画像検出回路、1
03・・・R/W (読み書き)制御回路、104・・
・射影検出回路、105・・・連結判定回路。 代理人 弁理士 鈴 木   誠

Claims (1)

    【特許請求の範囲】
  1. ■、 文書画像を文字行方向に3つ以上のブロックに分
    割し、該文書画像を走査することにより、個々のブロッ
    ク毎に文字行方向の射影を求め、求めた各ブロックの射
    影相互間の連結を調べることにより該文書画像上の個々
    の文字行を切り出すことを特徴とする文字行切出し方法
JP56204636A 1981-12-18 1981-12-18 文字行切出し方法 Pending JPS58106665A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56204636A JPS58106665A (ja) 1981-12-18 1981-12-18 文字行切出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56204636A JPS58106665A (ja) 1981-12-18 1981-12-18 文字行切出し方法

Publications (1)

Publication Number Publication Date
JPS58106665A true JPS58106665A (ja) 1983-06-25

Family

ID=16493752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56204636A Pending JPS58106665A (ja) 1981-12-18 1981-12-18 文字行切出し方法

Country Status (1)

Country Link
JP (1) JPS58106665A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254382A (ja) * 1984-05-31 1985-12-16 Toshiba Corp 文字行検出方式
EP0513678A3 (ja) * 1991-05-13 1994-01-26 Eastman Kodak Co
JP2007272348A (ja) * 2006-03-30 2007-10-18 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
JP2011108025A (ja) * 2009-11-18 2011-06-02 Kobe Steel Ltd 文字認識方法及び文字認識装置
US8787676B2 (en) 2010-08-03 2014-07-22 Fuji Xerox, Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254382A (ja) * 1984-05-31 1985-12-16 Toshiba Corp 文字行検出方式
EP0513678A3 (ja) * 1991-05-13 1994-01-26 Eastman Kodak Co
JP2007272348A (ja) * 2006-03-30 2007-10-18 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
JP2011108025A (ja) * 2009-11-18 2011-06-02 Kobe Steel Ltd 文字認識方法及び文字認識装置
US8787676B2 (en) 2010-08-03 2014-07-22 Fuji Xerox, Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method

Similar Documents

Publication Publication Date Title
JPS58106665A (ja) 文字行切出し方法
JP3285686B2 (ja) 領域分割方法
JP3089396B2 (ja) マーク読み取り装置および方法
JPS5949671A (ja) 光学的文字読取装置
JP2902694B2 (ja) 光学式文字読取装置
JPS61196381A (ja) 文字切出し方式
JPS6343788B2 (ja)
JPS6136874A (ja) 光学文字読取装置における訂正文字処理方法
JP2008210327A (ja) 文字画像出力システム及び文字画像出力方法
JPH07282191A (ja) 表処理方法
JPH0564396B2 (ja)
JPS6017566A (ja) 画像記憶検索装置
JP3190794B2 (ja) 文字切り出し装置
JPH02128292A (ja) 光学文字読取装置
JP2722550B2 (ja) 光学文字読取装置
JPS58170165A (ja) マ−ク読取方式
JPH0127468B2 (ja)
JPH04276888A (ja) 文字読取装置
JPS596419B2 (ja) 文字切出し方式
JPH0225553B2 (ja)
JP3867237B2 (ja) 文字認識方法および装置および文字認識プログラムを記録した記録媒体
JPH05324902A (ja) 画像入力方法
JPH08202876A (ja) 画像処理装置
JPH0573717A (ja) 光学的文字読取装置
JPS61217882A (ja) 光学的文字認識装置