JPS6255778A - 文章読取装置 - Google Patents

文章読取装置

Info

Publication number
JPS6255778A
JPS6255778A JP60196201A JP19620185A JPS6255778A JP S6255778 A JPS6255778 A JP S6255778A JP 60196201 A JP60196201 A JP 60196201A JP 19620185 A JP19620185 A JP 19620185A JP S6255778 A JPS6255778 A JP S6255778A
Authority
JP
Japan
Prior art keywords
partial image
text
pattern
partial
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60196201A
Other languages
English (en)
Inventor
Yoji Maeda
前田 陽二
Hajime Nanbu
南部 元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP60196201A priority Critical patent/JPS6255778A/ja
Publication of JPS6255778A publication Critical patent/JPS6255778A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、図9表などが混在する文書から文字領域を
切り出して読み取る文書読取装置に関するものである。
〔従来の技術〕
第2図は従来の文書読取装置の構成を示す図である。
図中、1は文書を光学的に走査し、光電変換して得たパ
ターンを記憶するパターン観測記憶手段、2はパターン
などを表示する表示画面、3は情報を入力するキーボー
ド、4は文字ブロックと呼ばれる文字だけからなる文書
の部分画像から文字を切り出して認識する文字切り出し
認識手段、5は文章読取装置全体の処理の流れを制御す
る制御手段である。
第3図は、表示画面2に表示した文書パターン例を示す
図であって、図中、6は文書パターン、7は表ブロック
、8は図ブロック、9は文字ブロック、10は文字ブロ
ック9の最上左端位置、1)は文字ブロック9の最下右
端位置である。
次に動作について説明する。
パターン観測記憶手段lに記憶した文書パターン6を制
御手段5を通じて表示画面2に表示する。
この文書パターン6をオペレータが観測して、文字ブロ
ックの位置情報である最上左端位置10と最下右端位置
1)の指定をキーボード3より入力する。
制御手段5では、上記位置情報に基づいて、上記パター
ン観測記憶手段lに記憶しである文書パターン6から文
字ブロックを切り出して文字切出し認識手段4に送り、
文字の切り出しと文字の認識を行なう。
〔発明が解決しようとする問題点〕
しかして、従来の文書読取装置は以上のように構成され
ているので、全ての文書読取についてオペレータが文字
ブロックを認識し、その認識して得た文字ブロックの位
置情報をキーボード3に入力するといった複雑な手順が
必要であった。
この発明は上記のような問題点を解消するためになされ
たもので、オペレータの負担を軽減できる文書読取装置
を得ることを目的とする。
〔問題点、を解決するための手段〕
このため第1の発明にかかる文字読取装置は、文章パタ
ーンに含まれるそれぞれの部分画像を検出する部分画像
検出手段と、この部分画像検出手段によって検出した部
分画像が文字部分か否かの属性を判定する部分画像属性
判定手段と、この部分画像属性判定手段の判定結果にも
とづき文字部分の切り出しを行なう文字部分切出し認識
手段とを備えたことを特徴とするものである。
また第2の発明にかかる文字読取装置は、文章パターン
に含まれるそれぞれの部分画像を検出する部分画像検出
手段と、この部分画像検出手段によって検出した部分画
像が文字部分か否かの属性を判定する部分画像属性判定
手段と、この部分画像属性判定手段の判定結果にもとづ
き文字部分の切り出しを行なう文字部分切出し認識手段
と上記部分画像属性判定手段が上記属性を判定すること
ができないとき判定不能である文章パターンを画面上に
指示する指示手段と、この指示手段で指定された文章パ
ターンの部分画像が文字部分か否かの指定を行なって上
記文字部分切出し認識手段にその指定を入力するキーボ
ード等の操作入力手段とを備えたことを特徴とするもの
である。
〔作用〕
この第1の発明にかかる文字読取装置において、部分画
像検出手段は、表示画面上に表示された文章パターンに
含まれる部分画像を検出し、部分画像属性判定手段は上
記検出された部分画像の属性を判定する。
ここで部分画像の属性が文字部分であると判定された場
合には文字切出し認識手段はこの判定に基づいて文字部
分の切り出しを行なう。これで、文字部分であるか否か
の判定をオペレータが行なう必要がなくなる。
ここにおいて部分画像属性判定手段が部分画像の属性を
判定することができないとき、第2の発明にかかる文字
読取装置の指示手段は判定不能の部分画像を表示画面上
に表示する等して判定不能の部分画像を指示する。この
指示にもとづいてオペレータは部分画像属性判定手段で
は判定できない判定不能の部分画像の判定を行なって、
この判定にもとづく情報を操作入力手段としてのキーボ
ードから入力する。これにより判定不能の部分画像の属
性が文字部分であるとの情報がキーボードから入力され
れば、このキーボードの入力を文字部分切出し認識手段
が認識して文字の切り出しを行なう。
〔実施例〕
以下図面に基づいて本発明の詳細な説明する。
なお、従来の技術と同一または相当する構成については
同一番号を付してその説明を省略する。
第1図は本発明の一構成を示す全体の構成図である。
第1図において、12は文書中において横方向及び縦方
向に白画素が連続する数を計数し、その長さが闇値以上
ならば、文書の領域を連続する白画素の位置で順次分割
することにより複数の部分画像を検出する部分画像検出
手段、13は部分画像検出手段12で検出した部分画像
の黒画素の連続性を調べることにより、文字ブロック、
あるいは表ブロックなど部分画像の属性を判定する部分
画像属性判定手段である。14は部分画像属性判定手段
が部分画像の属性を判定することができないとき、判定
不能である部分画像を表示画面2に表示する指示手段で
ある。
上記構成において、部分画像検出手段12ではパターン
観測記憶手段1に記憶された文書パター6から、3個の
部分画像7〜9を検出する。部分画像属性判定手段13
においては、各部分画像の黒画素の連続性を調べ、部分
画像8は黒画素の連続性により図ブロックであり、部分
画像7は黒画素が直線的に連続しているものと、分離し
て存在しているものがあることから表領域であることが
判る。部分画像9は、主に黒画素が分離して存在するが
、一部直線的に連続している部分があることから、文字
ブロックか表ブロックか判断できない。そこで指示手段
は制御手段5からの判定不能の制御情報に基づいて判定
不能となった部分画像9のパターンを表示画面2に表示
し、オペレータの指示を待つ。オペレータは文字ブロッ
クであれば′1′その他の部分画像であれば“0゛を操
作入力手段としてのキーボード3より入力し、文字ブロ
ックであるとの情報“l゛がキーボード3に入力された
場合、制御手段5は部分画像のパターンを文字切出し認
識手段4に送り、切り出しと認識の処理を行なう。但し
、上記部分画像が文字部分であると判定されたときは、
この判定結果にもとづき文字部分切出し認識手段により
文字の切出しが行なわれる。従って、オペレータは何等
文字部分か否かの判定作業を行なわなくてよい。
なお、上記実施例では、部分画像検出手段における部分
画像検出方法を、横方向及び縦方向に白画素が連続する
数を計数した情報を用いて行なう方法について説明した
が、この発明はこれに限らず、黒画素の連続性を用いる
方法など、この技術分野で行、なわれている他の方法を
用いてもよい。
また、部分画像属性判定手段も、黒画素の連続性に基づ
いた情報を用いて、部分画像の属性判定を行なったが、
この発明は、他の情報を用いて属性判定を行なっても、
その効果は変わらない。
また、判定のつかない部分画像を指示するため当該画像
を画面の所定部位に表示する場合について説明したが他
の指示方法でもよい。例えばあらかじめ全て表示し、判
定のつかない部分画像のみを枠で囲むようにして指示し
てもよい。
〔発明の効果〕
以上発明したように第1の発明にかかる文章読取装置は
、上記文章パターンに含まれるそれぞれの部分画像を検
出する部分画像検出手段と、この部分画像検出手段によ
って検出した部分画像が文字部分か否かの属性を判定す
る部分画像属性判定手段と、この部分画像属性判定手段
の判定結果にもとづき文字部分の切り出しを行なう文字
部分切出し認識手段とを備えたので、属性の判定が可能
な部分画像についてはオペレータがあえて文字ブロック
の属性と位置の情報を人力する必要がなくなる。
また第2の発明にかかる文章読取装置は、上記第1の発
明に加えて、部分画像属性判定手段が上記属性を判定す
ることができないとき判定不能である文章パターンを画
面上に指示する指示手段と、この指示手段で指定された
文章パターンの部分画像が文字部分か否かの指定を行な
って上記文字部分切出し認識手段にその指定を入力する
キーボード等の操作入力手段とを備えたので、属性の判
定が不可能な部分画像については、オペレータがその属
性についての情報を入力すれば、文字ブロックの位置情
報を入力しなくても文字ブロックを自動的に切り出すこ
とができる。
【図面の簡単な説明】
第1図はこの発明の構成を示す図、第2図は従来例の構
成を示す図、第3図は文書パターンを示す図である。 図中、1はパターン観測記憶手段、2は表示画面、3は
キーボード、4は文字切出し認識手段、5は制御手段、
12は部分画像検出手段、13は部分画像属性判定手段
である。 なお、図中、同一符号は同一、又は相当部分を示す。 代理人  大  岩  増  雄(ほか2名)第1図 第3図 手続補正書岨匍 昭和61年61)゛ 日 1、事件の表示   特願昭60−196201号2、
発明の名称 文書読取装置 3、補正をする者 事件との関係 特許出願人 住 所    東京都千代田区丸の内二丁目2番3号名
 称  (601)三菱電機株式会社代表者志岐守哉 4゜代理人 5、補正の対象 発明の名称、特許請求の範囲、発明の詳細な説明の欄。 6、補正の内容 +1、発明の名称「文章読取装置」とあるのを「文書読
取装置」と補正する。 (2、特許請求の範囲を別紙のとおり補正する。 (3)明細書第3頁第9行目、第4頁第19行目、第5
頁第6行目、第14行目、第16行目、第6頁第2行目
乃至第3行目、第1O頁第3行目、第4行目、第14行
目、第17行目、第18行目「文章」とあるのを「文書
」と補正する。゛(4)同書第4頁第18行目、第5頁
第6行目、第6頁第1行目、第13行目「文字」とある
のを「文書」と補正する。 (5)同書第5頁第12行目「行なう文字部分切」とあ
るのを「行い、かつ文字を切り出して認識する文字部分
切」と補正する。 (6)同書第9頁第5行目「何等」とあるのを「常に」
と補正する。         以上2、特許請求の範
囲 (1)文lを光学的に走査して得られたnパターンを表
示画面上に表示し、この表示された叉1パターンの中か
ら文字部分のみ切り出すことにより、文字部分の切り出
しと認識を行なう文1読取装置において、上記文1パタ
ーンに含まれるそれぞれの部分画像を検出する部分画像
検出手段と、この部分画像検出手段によって検出した部
分画像が文字部分か否かの属性を判定する部分画像属性
判定手段と、この部分画像属性判定手段の判定結果にも
とづき文字部分の切り出しを丘公工が2文ヱ土切刃mて
Wo−る 宜h \ 出し認識手段とを備えたことを特
徴とする文1読取装置。 (2)文1を光学的に走査して得られた文1パターンを
表示画面上に表示し、この表示された文1パターンの中
から文字部分のみ切り出すことにより、文字部分の切り
出しと認識を行なうjLREJlt取装置において、上
記nパターンに含まれるそれぞれの部分画像を検出する
部分画像検出手段と、この部分画像検出手段によって検
出した部分画像が文字部分か否かの属性を判定する部分
画像属性判定手段と、この部分画像属性判定手段の判定
結果にもとづき文字部分の切り出しを行至工jとム幻に
奢してi゛  る ″″αノ 出し認識手段と、上記部
分画像属性判定手段が上記属性を判定することができな
いとき判定不能であるnパターンを画面上に指示する指
示手段と、この指示手段で指定されたnパターンの部分
画像が文字部分か否かの1旨定を行なって上記文字部分
切出し認識手段にその指定を入力するキーボード等の操
作入力手段とを備えたことを特徴とする文1読取装置。

Claims (2)

    【特許請求の範囲】
  1. (1)文章を光学的に走査して得られた文章パターンを
    表示画面上に表示し、この表示された文章パターンの中
    から文字部分のみ切り出すことにより、文字部分の切り
    出しと認識を行なう文章読取装置において、上記文章パ
    ターンに含まれるそれぞれの部分画像を検出する部分画
    像検出手段と、この部分画像検出手段によって検出した
    部分画像が文字部分か否かの属性を判定する部分画像属
    性判定手段と、この部分画像属性判定手段の判定結果に
    もとづき文字部分の切り出しを行なう文字部分切出し認
    識手段とを備えたことを特徴とする文章読取装置。
  2. (2)文章を光学的に走査して得られた文章パターンを
    表示画面上に表示し、この表示された文章パターンの中
    から文字部分のみ切り出すことにより、文字部分の切り
    出しと認識を行なう文章読取装置において、上記文章パ
    ターンに含まれるそれぞれの部分画像を検出する部分画
    像検出手段と、この部分画像検出手段によって検出した
    部分画像が文字部分か否かの属性を判定する部分画像属
    性判定手段と、この部分画像属性判定手段の判定結果に
    もとづき文字部分の切り出しを行なう文字部分切出し認
    識手段と、上記部分画像属性判定手段が上記属性を判定
    することができないとき判定不能である文章パターンを
    画面上に指示する指示手段と、この指示手段で指定され
    た文章パターンの部分画像が文字部分か否かの指定を行
    なって上記文字部分切出し認識手段にその指定を入力す
    るキーボード等の操作入力手段とを備えたことを特徴と
    する文章読取装置。
JP60196201A 1985-09-05 1985-09-05 文章読取装置 Pending JPS6255778A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60196201A JPS6255778A (ja) 1985-09-05 1985-09-05 文章読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60196201A JPS6255778A (ja) 1985-09-05 1985-09-05 文章読取装置

Publications (1)

Publication Number Publication Date
JPS6255778A true JPS6255778A (ja) 1987-03-11

Family

ID=16353875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60196201A Pending JPS6255778A (ja) 1985-09-05 1985-09-05 文章読取装置

Country Status (1)

Country Link
JP (1) JPS6255778A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668300A (ja) * 1991-12-18 1994-03-11 Internatl Business Mach Corp <Ibm> 文書画像のレイアウトモデルを作成する方法及び装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57211674A (en) * 1981-06-23 1982-12-25 Ricoh Co Ltd Frame recognizing method
JPS5871583A (ja) * 1981-10-23 1983-04-28 株式会社日立製作所 発熱体装置
JPS58169682A (ja) * 1982-03-31 1983-10-06 Toshiba Corp 文字画像処理装置
JPS59788A (ja) * 1982-06-28 1984-01-05 Nippon Telegr & Teleph Corp <Ntt> 文字領域と図形領域とを区別する図形処理方式
JPS60126777A (ja) * 1983-12-14 1985-07-06 Hitachi Ltd 文字切り出し方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57211674A (en) * 1981-06-23 1982-12-25 Ricoh Co Ltd Frame recognizing method
JPS5871583A (ja) * 1981-10-23 1983-04-28 株式会社日立製作所 発熱体装置
JPS58169682A (ja) * 1982-03-31 1983-10-06 Toshiba Corp 文字画像処理装置
JPS59788A (ja) * 1982-06-28 1984-01-05 Nippon Telegr & Teleph Corp <Ntt> 文字領域と図形領域とを区別する図形処理方式
JPS60126777A (ja) * 1983-12-14 1985-07-06 Hitachi Ltd 文字切り出し方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668300A (ja) * 1991-12-18 1994-03-11 Internatl Business Mach Corp <Ibm> 文書画像のレイアウトモデルを作成する方法及び装置

Similar Documents

Publication Publication Date Title
JP3756719B2 (ja) 文書修飾装置及び画像処理装置
JPH09120460A (ja) 書類から記事を抽出する装置および方法
JP3814320B2 (ja) 画像処理方法及び装置
US6157738A (en) System for extracting attached text
JP2001101164A (ja) 文書画像処理装置及び文書画像処理方法
JPS6255778A (ja) 文章読取装置
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPS61253587A (ja) 光学文字読取装置
JPS6337487A (ja) 文字認識装置
JPH0388086A (ja) 文書読取装置
US6748123B1 (en) Displaying multi-line fields for key-in
JPS61175875A (ja) 文書読取り装置
JPH045779A (ja) 文字認識装置
JPH05342325A (ja) 文書処理装置およびその装置のためのフォーム登録装置
JP2579356B2 (ja) 文書読取装置
JPH117493A (ja) 文字認識処理装置
JPH0927007A (ja) 文字認識装置及び方法
EP1018694A2 (en) System and method for automatic graph parsing
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JPH0927008A (ja) 文字認識装置及び方法
JPS61198376A (ja) 光学的文字読取装置
JPH05303661A (ja) イメージデータ部分取得表示装置
JPH0512486A (ja) 画像処理装置
JPH03103996A (ja) 光学的文字読取装置