JPS5932077A - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JPS5932077A
JPS5932077A JP57142364A JP14236482A JPS5932077A JP S5932077 A JPS5932077 A JP S5932077A JP 57142364 A JP57142364 A JP 57142364A JP 14236482 A JP14236482 A JP 14236482A JP S5932077 A JPS5932077 A JP S5932077A
Authority
JP
Japan
Prior art keywords
change position
black
character
scanning line
cut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57142364A
Other languages
English (en)
Inventor
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP57142364A priority Critical patent/JPS5932077A/ja
Publication of JPS5932077A publication Critical patent/JPS5932077A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、帳票等から読み取られた文字等の読取パター
ンを文字ごとに切り出す文字切出し装置に関する。
〔従来技術〕
従来の文字切出し装置においては第1図に示すような切
出し方法が用いられている。
■ 各走査ラインごとに黒画素の有無を検出し、黒画素
が連続している部分全1文字として切シ出す方法。
■ 各走査ラインごとに黒画素数をカウントし射影濃度
分布を求め、その分布に基づき文字を切り出す方法。
■ 文字ピッチが一定の文字においては、その文字ピッ
チを用いて文字を切り出す方法。
しかしながら第2図に示すように、連結文字のように文
字間がなくなっている場合は上記の、■の方法では切り
出せず、文字ピッチが可変な場合は、上記■の方法では
所望の文字切出しができないという問題があった。
〔目的〕
本発明は上記事情を考慮してなされたもので、文字ピッ
チが変化するような文字で、文字間がな゛ぐなっている
場合でも所望の文字切出しができる文字切出し装置を提
供することを目的とする。
〔実施例〕
本発明の一実施例を第3図に示す。帳票等に書かれた文
字等は読取部(図示せず)によって読み取られ、その読
取パターンは行切出し部lで1行分の行切出しがおこな
われる。行切出しさ冗た読取パターンは文字切出し装置
2の画像メモリ11に格納された1文字ごとに分離する
切出しがおこなわれる。黒画素カウンタ12は読取パタ
ーンの縦方向の各走査ラインごとの黒画素数をカウント
するものである。また黒ランカウンタ■3は各走査ライ
ンごとの連続する黒画素の集まり(これを「黒ラン」と
いう)の数をカウントするものである。これら黒画素カ
ウンタ12と黒ランカウンタ13とはひとつのカウンタ
によ多構成してもよい。黒画素カウンタ12tこよシカ
ラントされた各走査ラインごとの黒I!il素数を用い
て、射影ブロック検出部14では「射影ブロック」が検
出され、急激変化位置検出部15では「急激変化位置」
が検出される。また領域変化位置検出部16では黒ラン
カウンタ13でカウントされた各走査ラインごとの黒ラ
ン数を用いて「領域変化位置」が検出される。「射影ブ
ロック」、「急激変化位置」、「領域変化位置」につい
ては後述する。これら各検出部14 、15 、16の
検出結果を用いて、切出し判定部では切出し位置の決定
がおこなわれ(詳細については後述する)、切出し部1
8でその決定した切出し位置で切り出される。切り出さ
れた文字ごとの読取パターンは、文字メモリ3に格納さ
れ文字認識等の処理がおこなわれる。
次に本実施例の動作分力4図、第5図を用いて更に詳し
く述べる。
(1)黒画素カウンタ12で各走査ラインごとの黒画素
数をカウントする。
(2)黒ランカウンタ13で各走査ラインごとの黒ラン
数をカウントする。
(3)  (1)でカウントした黒画素数正こより、黒
画素数がゼロでない連続する走査ラインの範囲すなわち
「射影ブロック」を射影ブロック検出部■4にて検出す
る。
(4)  (1)でカウントした黒画素数が、文字線巾
の2倍程度(本実施例では「7」)以上変化する位置を
「急激変化位置」として、急激変化位置検出部15にて
検出する。
(5)  (7)でカウントした黒ラン数が変化する位
置を「領域変化位置」として、領域変化位置検出部16
にて検出する。
(6)領域変化位置が射影ブロック内にない場合はその
射影ブロックを1文字として切シ出す。
(7)  (3)によシ求めた射影ブロックが所定故(
本実施例ではr18J)より小さいときはそのまま1文
字として切シ出す。
(8)  (6)、(7)の条件を満足しないときは射
影ブロックの左右1/4を除いた「処理範囲」で以下の
処理をおこなう。
(i)(2)でカウントした黒ラン数が1である領域に
おいて、 げン急激変化位置があるときはその位置で領域を分割し
、(1)でカウントした黒画素数が小さい方の領域にお
いて、黒画素数が線幅程度(本実施例では「3」)以下
の位置があれば切出し位置候補とする。第4図のAが切
出し位置候補となる。
(ロ)急激変化位置がないときは、黒ラン数が1である
すべての領域において、黒画素数が線幅程度(本実施例
では「3」)以下の位置があれば切出し位置候補とする
(ii)(2)でカウントとした黒ラン数が2である領
域において、 この領域の両端が急激変化位置であυ、両側の画素数が
大きいときで、この領域内に画素数が線幅の2倍程度(
本実施例では「5」)以下の位置があれば切り出し位置
候補とする。第5図のB、Cが切出し位置候補となる。
(fit)処理範囲の中央Oから5以上離れた切出し位
置候補は棄却する。
(i■) 2ケ所以上の切出し位置候補があるときは処
理範囲の中央Oに近い位置を切出し位置とする。第5図
では切出し位置候補B、Cのうち中央Oに近いCが切出
し位置となる。
(9)(7)において1文字として切り出す読取パター
ンのうちとなりあう2つの読取パターンの間隔がn以下
で2つの読取パターンをあわせた幅がm以下のときは1
文字として切り出す。本実施例ではn=51m=18と
した。
以上のような処理の結果第4図に示す読取パターンでは
位置Aで、第5図に示す言つて取パターンでは位置Cで
文字切出しがおこなわれ、なぐなった英小文字のr L
、8 J p r t rjも正しく切り出すことがで
きる。
なお、各判定条件における数値は切出し対象文字、セン
サの解像度、等により経験的に定められるものであシ、
上述した数値に限定されるものではない。
〔効果〕
以上の通り本発明によれば、文字ピッチが変化するよう
な文字で文字間がなく・なっている場合でも、所望の文
字切出しをおこなうことができる。
特に文字ピッチが可変な印字文字に対しては有効であり
、OCR,文書編集装置等に利用することができる。
【図面の簡単な説明】
第1図は従来の文字切出し装置の文字切出し方法を示す
パターン図、 第2図(a) e (b) 、 (C) 、 (d)は
それぞれ従来の文字切出し方法では切出し困難な読取ノ
くターンを示すノシターン図、 第3図は本発明の一実施例による文字切出し装置のブロ
ック図、 第4図、第5図はそれぞれ同装置の文字切出し動作金示
す説明図でおる。 1・・・行切出し部、2・・・文字切出し装置、3・・
・文字メモリ、11・・・画像メモリ、12・・・黒画
素カウンタ、13・・・黒ランカウンタ、14・・・射
影ブロック検出部、15・・・急激変化位置検出部、1
6・・・領域変化位置検出部、17・・・切出し判定部
、18・・・切出し部。 出願人代理人  猪 股    清 第2図 (a)     (b)      (c)     
 (d)第3図 /2 第4図 (1)黒画素数24 +52020t94211128
878891+ 13112(2)黒うン数12322
221223333333221(3)射影ブ叱ソつ□ (4) 急;秀父変イヒJ[TυHtJf      
       I(5)  9頁カ!し変イロil装置
 NJ     Ill        Ji(8) 
(i )切出し1Ω置葭補        A第5図 (1)黒画素数134162021206664481
616157677754(2)黒ラン数111111
12222231112221111(3)射影ブ引ツ
ク□

Claims (1)

  1. 【特許請求の範囲】 帳檗等から読み取られた文字等の読取パターンを文字等
    ごとに切り出す文字切出し装置において、前記読取パタ
    ーンにおける各走査ラインごとの黒画素数および黒ラン
    数をカウントするカウンタと、 このカウンタによりカウントされた各走査ラインごとの
    黒画素数の有無により射影ブロックを検出する射影ブロ
    ック検出部と、 前記カウンタによりカウントされた各走査ラインごとの
    黒画素数が所定数以上変化する走査ラインの急激変化位
    置を検出する急激変化位置検出部と、 前記カウンタによりカウントされた各走査ラインごとの
    黒ラン数が変化する走査ラインの領域変化位置を検出す
    る領域変化位置検出部と、前記射影ブロック検出部で検
    出された射影ブロックと、前記急激位置検出部で検出さ
    れた急激変化位置と、前記領域変化位置検出部で検出さ
    れた領域変化位置とに基づいて予め足められた判定条件
    によシ切出し位置を決定する切出し判定部と金備え、 前記切出し判定部により決定された切出し位置により前
    記読取パターンの切出しをおこなうことを特徴とする文
    字切出し装置。
JP57142364A 1982-08-17 1982-08-17 文字切出し装置 Pending JPS5932077A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57142364A JPS5932077A (ja) 1982-08-17 1982-08-17 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57142364A JPS5932077A (ja) 1982-08-17 1982-08-17 文字切出し装置

Publications (1)

Publication Number Publication Date
JPS5932077A true JPS5932077A (ja) 1984-02-21

Family

ID=15313661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57142364A Pending JPS5932077A (ja) 1982-08-17 1982-08-17 文字切出し装置

Country Status (1)

Country Link
JP (1) JPS5932077A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163684A (ja) * 1986-12-26 1988-07-07 Toshiba Corp 文字パタ−ン切出し装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163684A (ja) * 1986-12-26 1988-07-07 Toshiba Corp 文字パタ−ン切出し装置

Similar Documents

Publication Publication Date Title
US20050238252A1 (en) System and method of determining image skew using connected components
EP2545495A2 (en) Paragraph recognition in an optical character recognition (ocr) process
US4527283A (en) Character information separating apparatus for printed character reading systems
JPS6077279A (ja) 文字イメ−ジ切出し方法
EP0248262B1 (en) Apparatus and method for detecting character components on a printed document
JPH08202815A (ja) 書類の上下方向検知方法及び装置
EP0062665A1 (en) Segmentation system and method for optical character scanning
JPH0430070B2 (ja)
JPS5932077A (ja) 文字切出し装置
JPH0410087A (ja) 基本ライン抽出方法
JPS6325391B2 (ja)
JPH0373916B2 (ja)
JP2728086B2 (ja) 文字切り出し方法
JPH0564396B2 (ja)
JP3142950B2 (ja) 線分認識方式
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPS6254380A (ja) 文字認識装置
JP3196603B2 (ja) バーコード認識方法及びシステム
JP2508195B2 (ja) 文字行抽出装置
JPH04343192A (ja) 文字認識装置の文字切り出し方法
JP2682456B2 (ja) 光学文字読取装置
JP3381803B2 (ja) 傾き角検出装置
JP2730996B2 (ja) 日本語文書の接触文字の切出し方法
JPH09106438A (ja) 等幅フォントにおける幅の検出方法および装置
JPH0459670B2 (ja)