JPS638988A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS638988A
JPS638988A JP61153232A JP15323286A JPS638988A JP S638988 A JPS638988 A JP S638988A JP 61153232 A JP61153232 A JP 61153232A JP 15323286 A JP15323286 A JP 15323286A JP S638988 A JPS638988 A JP S638988A
Authority
JP
Japan
Prior art keywords
character
character line
image
slip
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61153232A
Other languages
English (en)
Inventor
Katsumi Yaguchi
矢口 克己
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61153232A priority Critical patent/JPS638988A/ja
Publication of JPS638988A publication Critical patent/JPS638988A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、特に書籍、雑誌及び新聞等の紙面から文字を
読取る際に好適する文字読取装置に関する。
(従来の技術) 従来から、各種事務処理分野において光学的文字読取装
置が広く用いられているが、近年、ジャーナリズムの分
野にも普及しつつある。
この分野では、読取らせたい対象が書籍、雑誌および新
聞等の紙面のように文字や写真等が多様にレイアウトさ
れている帳票である場合が多く、従来の文字読取装置で
は対応できない場合が多い。
一般的な文字読取装置では帳票の読取りを行なう場合、
たとえば第3図(A>に示したように、文字行が存在す
る位置をフォーマット情報として、予め指定しておく必
要がある。
この場合、文字行の位置は、帳票の端部から11の位置
、L2の位置、・・・というような絶対的な位置情報で
示す場合が多い。
近年、帳票上の文字行を自動釣に検出し、連続して読取
りを実行することができる文字読取装置が開発されてい
るが、この文字読取装置により、第3図(B)に示した
ような文字行を持つ帳票(端部からLlおよびLlの位
置に文字行が存在する)と、第3図(C)に示したよう
な文字行を持つ帳票(端部からLlおよびL3の位置に
文字行を持つ)との読取りを行なった場合、両帳票の各
文字行に同じ文章が書かれていると、読取結果が全く同
じになる。
すなわち従来の自動文字行検出型の文字読取装置では、
文字自体の読取り結果のみが得られ、そのフォーマット
に関する情報は得られない。このため、後に特定の文字
行が帳票上のいかなる位置に存在していたのかを知るこ
とは不可能であった。
しかしながら書籍、雑誌および新聞等の読取りを行なう
場合には、再版等の事情で後にフォーマット情報が必要
になる可能性が高いため、従来の文字読取装置を用いる
と、紙面上のフォーマットに関する情報を他の手段で別
個に検出および記録しなければならないという問題があ
った。
(発明が解決しようとする問題点) 本発明は上述したような事情により成されたもので、文
字の認識は勿論、読取った帳票のフォーマットをも自動
的に検出することができ、書籍、雑誌および新聞等の読
取りを行なう際に特に有効となる文字読取装置の提供を
目的としている。
[発明の構成] (問題点を解決するための手段) 本発明の文字読取装置は、帳票のイメージを格納するイ
メージ格納手段と、前記イメージから濃度値ヒストグラ
ムを得て各文字行の存在を検出する文字行検出手段と、
前記濃度値ヒストグラムから前記帳票上における各文字
行位置を検出する文字行位置検出手段と、検出した文字
行の各文字を認識する文字認識手段とを備え、各文字の
認識結果と文字行位置を示す情報とを共に出力するよう
に構成されている。
(作 用) 本発明の文字読取装置は、濃度値ヒストグラムから各文
字行の存在を検出して各文字の認識を行なうのみならず
、帳票上における各文字行の位置を検出して出力するの
で、磁気ディスク装置等に認識結果とともに位置情報を
記録しておけば、後に帳票のフォーマットを容易に知る
ことができる。
(実施例) 以下、本発明の実施例の詳細を図面に基づい説明する。
第1図は本発明の一実施例装置の構成を示すブロック図
である。
同図において1は読取るべき帳票を光学的に走査してイ
メージ信号を出力する光電変換部、2は1ペ一ジ分のイ
メージを暫定的に格納するページバッファ、3はページ
バッファ2をX方向およびY方向に走査して、X方向お
よびY方向の濃度値ヒストグラムを求め、各文字行およ
び各文字の存在を検出し、切出しを行なう検出切出し部
、4は前記濃度値ヒストグラムから各文字行の存在位置
を、たとえば帳票の端部から何センチという概念で検出
する文字行検出部、6は各部の制御を司る制御部、7は
ホストシステムとのデータの入出力を司るインターフェ
イス部である。
そして第2図は前記検出切出し部3および文字行検出部
4の機能を示す図である。
検出切出し部3は、ページバッファ2に格納されたイメ
ージSをX方向およびY方向に走査して、X方向よびY
方向の1走査ラインごとの黒ドツト数の累計を求め、濃
度値ヒストグラムHを得る。
なお第2図においてY方向の濃度値ヒストグラムは省略
されている。そしてこの濃度値ヒストグラムHから文字
行の存在を検出する。このとき文字行検出部4は、前記
濃度値ヒストグラムHにおいて文字行が存在すると判断
された箇所(ピーク位置)の、原点(Olo)からの距
離をカウントし、各文字行が帳票の端部からどの位の距
離に位置しているかを検出する。
すなわち本実施例装置では、光電変換部1から帳票のイ
メージが入力され、1ペ一ジ分の文字イメージがページ
バッファに入力されると、検出切出し部3が1ペ一ジ分
の文字イメージの濃度値ヒストグラムを求め、文字行の
存在を検出し、文字行検出部4が各文字行の帳票の端部
からの距離(絶対的な距離)を検出する。そして文字認
識部5が文字イメージの認識処理を実行する。この認識
処理が修了したら、インターフェイス部7を介して認識
結果および各文字行の位置情報がホストシステムに出力
され、磁気ディスク装置等に順次記憶される。
なお本実施例において、一旦記録された各文字行の位置
を示す情報は、ホストシステム側の指定により、たとえ
ばインチ、センチまたはミリメートル単位等、目的に即
した形に変換して出力するようにする。
かくして本実施例の文字読取装置は、各文字の認識結果
とともに各文字行の存在位置を示すデータを出力するの
で、特に書籍、雑誌および新聞等、多様なレイアウトの
ものが存在する紙面を読取らせる場合に特に有効であり
、たとえば再版用のデータベース等を比較的容易に構築
することができる。
なお上述した実施例装置では、文字行の存在位置を帳票
の端部からの距離、すなわち絶対位置として検出してい
るが、各文字行の間の距離、すなわち相対位置として検
出することも考えられる。
また上述した実施例装置では、帳票のイメージがページ
バッファ2に格納されるようにしているが、文字行の位
置をカウントする手段を設けておけば帳票のイメージは
ラインバッファに格納されるようにしてもよい。
[発明の効果] 以上説明したように本発明の文字読取装置は、各文字の
認識結果のみならず、各文字行の存在位置を示す情報も
出力するので、特に書籍、雑誌および新聞の紙面等、多
様なレイアウトのものが存在する読取り等を行なう場合
、後に各紙面のフォーマット情報を容易に知ることがで
き、極めて有効である。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図は同実施例装置にあける検出切出し部および文
字行検出部の機能を示す図、第3図(A)〜(C)は、
従来の文字読取装置の読取り対象としての帳票における
文字行のレイアウトについて説明する図である。 1・・・・・・・・・光電変換部 2・・・・・・・・・ページバッファ 3・・・・・・・・・検出切出し部 4・・・・・・・・・文字行検出部 5・・・・・・・・・文字認識部 6・・・・・・・・・制御部 7・・・・・・・・・インターフェイス部出願人   
   株式会社 東芝 代理人 弁理士  須 山 佐 − 第1図

Claims (2)

    【特許請求の範囲】
  1. (1)帳票のイメージを格納するイメージ格納手段と、
    前記イメージから濃度値ヒストグラムを得て各文字行の
    存在を検出する文字行検出手段と、前記濃度値ヒストグ
    ラムから前記帳票上における各文字行位置を検出する文
    字行位置検出手段と、検出した文字行の各文字を認識す
    る文字認識手段とを備え、各文字の認識結果と文字行位
    置を示す情報とを共に出力するように構成されているこ
    とを特徴とする文字読取装置。
  2. (2)文字行位置検出手段が、帳票上における各文字行
    の絶対的な位置を検出するように構成されている特許請
    求の範囲第1項記載の文字読取装置。
JP61153232A 1986-06-30 1986-06-30 文字読取装置 Pending JPS638988A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61153232A JPS638988A (ja) 1986-06-30 1986-06-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61153232A JPS638988A (ja) 1986-06-30 1986-06-30 文字読取装置

Publications (1)

Publication Number Publication Date
JPS638988A true JPS638988A (ja) 1988-01-14

Family

ID=15557941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61153232A Pending JPS638988A (ja) 1986-06-30 1986-06-30 文字読取装置

Country Status (1)

Country Link
JP (1) JPS638988A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09506668A (ja) * 1994-05-24 1997-06-30 アライドシグナル・インコーポレーテッド フェニル置換トリス−官能性ケトキシムシラン類を用いる室温硬化性シリコン組成物

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054082A (ja) * 1983-09-05 1985-03-28 Mitsubishi Electric Corp 光学文字読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054082A (ja) * 1983-09-05 1985-03-28 Mitsubishi Electric Corp 光学文字読取装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09506668A (ja) * 1994-05-24 1997-06-30 アライドシグナル・インコーポレーテッド フェニル置換トリス−官能性ケトキシムシラン類を用いる室温硬化性シリコン組成物

Similar Documents

Publication Publication Date Title
JPH0750483B2 (ja) 文書画像追加情報の蓄積方法
US5854860A (en) Image filing apparatus having a character recognition function
JPS638988A (ja) 文字読取装置
JPS5845743B2 (ja) 情報処理システム
JPH0149998B2 (ja)
JPH0652236A (ja) 電子ファイリング装置
JPS6046471B2 (ja) 文字読取装置
JP2666931B2 (ja) 光学的文字読取装置
JP2590099B2 (ja) 文字読取方式
JP2823350B2 (ja) マルチメディア入力装置
JPS5949671A (ja) 光学的文字読取装置
JP2619915B2 (ja) 情報処理方法および装置
JPS58123169A (ja) 文字行切出し方式
JPS58109973A (ja) 印字文字エコ−チエツク機能付印字装置
JPH04192090A (ja) 光学文字読取装置
JPH04309B2 (ja)
JPH0557632B2 (ja)
JPH02128292A (ja) 光学文字読取装置
JPS5860381A (ja) スキユ−検出方式
JPH0426153B2 (ja)
JPS63167991A (ja) 文字認識装置
JPH0420506B2 (ja)
JPH01199285A (ja) 光学的文字読取装置
JPS6275885A (ja) 文字読取装置
JPH03164885A (ja) 光学式文字読取装置