JPH01270183A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01270183A
JPH01270183A JP63099445A JP9944588A JPH01270183A JP H01270183 A JPH01270183 A JP H01270183A JP 63099445 A JP63099445 A JP 63099445A JP 9944588 A JP9944588 A JP 9944588A JP H01270183 A JPH01270183 A JP H01270183A
Authority
JP
Japan
Prior art keywords
character
image
format
recognition device
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63099445A
Other languages
English (en)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP63099445A priority Critical patent/JPH01270183A/ja
Publication of JPH01270183A publication Critical patent/JPH01270183A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文字画像から文字領域を捜し出し、コード
番号に変換する文字認識装置に関する。
〔従来の技術〕
近年、文字認識装置の急激なる進歩により、さまざまな
文書画像から文字を認識し、自動的に文書ファイル等の
作成ができるようになってきており、文書画像が活字で
あっても、手書き文字であっても文字を正確に認識でき
る様になっている。
文書画像には、例えば日本語のように縦書きの文書もあ
れば、英語のように横画きの文書もある。
これらの文書を認識するにあたっては、前もって使用者
が、文書の情報を与えるが、認識対象文書の書式が限定
されているがのどちらであった。
〔発明が解決しようとする課題〕
しかしながら、このように使用者が使用の都度文書画像
の書式情報を文字認識装置に与えたり、また認識書式が
限定されていたのでは、実際に認識装置に使用するにあ
たり、非常に操作性が悪い。
そこで本発明は、このような課題を解決するもので、そ
の目的とするところは、書式不明の文書画像から書式を
自動的に判断し文書を認識する文字認識装置を提供する
ことにある。
〔課題を解決するための手段〕
本発明は、(1)光学的画像入力手段により、紙面等に
書かれた文字画像を読み取り、紙面上に書かれた文字を
認識し、コード番号に置きIQえる文字認識装置におい
て、書式判断手段を有することを特徴とする6 また該書式判断手段は、入力画像の水平方向及び垂直方
向の周辺分布をとり入力画像の書式を判断することを特
徴とする。
また文字画1象の複数の周辺分布の空白部分の有無及び
大きさを判断の手段に用いることを特徴とする。
〔実 施 例〕
以下本発明について実施例に基づいて詳細に説明する。
本発明の文字認識装置は、第1図のブロック図に示す櫟
に、CP tJ 1 、画像入力装置2、J2識文字表
示装置3、ROM4、RAM5により構成されている。
また本発明の文字認識装置の動作は第2図のブロック図
に示す様に、画像入力手段6、入力された画像が、縦書
きか横書きかを判断する書式判断手段7、画1象中から
文字列を抽出する文字列抽出手段8、文字列から文字を
抽出する文字抽出手段9、抽出された文字を認識する文
字認識手段10、該認識文字を表示する認識結果表示手
段11とからなっている。
以下、入力画像から書式と判断する一連の動作を第4図
に示すフローチャートに基づいて詳細に説明する。
画像入力手段6においては、画像入力装置2によって、
文字画像12・13がRA M 5に読み込まれる。該
RAM5に読み込まれたデータは、日本語等の縦書き文
書12なのか、英語等の横書き文書13なのか分かつて
いない、このまま、文字列抽出手段8において文字列の
抽出を行うのは不可能である0本発明はここで、書式判
断手段7(18)を設けである。該書式判断手段7 (
18)においては、入力された文字画像12・13の水
平方向の周辺分布14・15及び垂直方向の周辺分布1
6・17の計算を行う、もしも入力された文字画像か第
3図(b)に示す12であった場合、水平方向の周辺分
布14及び垂直方向の周辺分布16は第3図(C)及び
第3図(a)に示す様になる。ここで、垂直方向の周辺
分布16をみる。
もしも、入力された文字画像が樅書き文書であれば、必
ず垂直方向の周辺分布16に空白部分(行間に相当する
)が存在するはずであり、該空白部分が無ければ、横書
き文書と見なすことができる。
周辺分布16には、行間かもしれない空白部分が存在し
ている。従って、入力された文字画像12は、樅書き文
書である可能性がある。しかし、これだけでは、入力さ
れた文字画@12がf7書き文書とみなすことは不可能
である。次に、水平方向の周辺分布14をみる。もしも
、水平方向の周辺分布14に空白部分が存在しなければ
、入力された文字画像は縦書き文書であると判断でき、
また、周辺分布14に空白部分が存在すれば、入力され
た文字画像が横書き文書である可能性があると判断でき
る。第3図(b)においては、垂直方向の周辺分布16
、水平方向の周辺分布14の両方とも空白部分が存在し
ている。従って、両方の可能性がある。そこで、該空白
部分の大きさを比べる。
一般的な文書においては、水平方向及び垂直方向の両方
の周辺分布に空白部分が存在する場合、行方向の空白部
分の方が他の方向の空白部分よりも大きいという性質を
もっている。第3図(b)の周辺分布14・16の空白
部分の大きさを比べると、垂直方向の周辺分布の空白部
分の方が垂直方向の周辺分布の空白部分よりも大きい、
従って、入力された文字画像12は、樅書き文書である
と判断できる。
また、入力された画像が、第3図(e)に示ず13であ
った場合も同様な方法にて書式を判断すれば良い。幸い
、第3図(d)に示す入力された画像13の垂直方向の
周辺分布17には空白部分が無い。もしも、縦書き文書
であれば必ず空白部分が存在するはずであるから、該入
力された文字画像13は横書き文書であると判断できる
以上の様に、入力画像の水平方向と垂直方向の周辺分布
を計ユし、空白部分に着目して判断するので、簡単にか
つ確実に入力画像め書式を判断することが可能となる。
また、入力された文字画像から自動的に書式を判断する
ので、画像入力時における書式指定の手間か省け、操作
性が向上する。
また本発明は、文字画像の書式が、水平方向と垂直方向
の場合について述べたが、該方法は、水平方向と垂直方
向に限ったものではなく、平行に書かれた文字ならば斜
め方向の文字でも良く、あらゆる方向(180度の範囲
において)の周辺分布を求めれば、書式を判断すること
が可能である。
〔発明の効果〕
以上述べた様に本発明によれは、文字認識装置において
、入力された文字画像が、横書き文書なのか、樅書き文
書なのかの書式判断をする書式判断手段を有しているの
で、画像入力前後に書式を指定する必要のない、また、
書式判断の手段として、水平方向、垂直方向の周辺分布
をとり、空白部分に着目して判断するので、簡単にかつ
確実に入力画像の書式を判断することが可能となる。
【図面の簡単な説明】
第1図に本発明の文字認識装置のブロック図。 第2図に本発明の認識手段のブロック図。 第3図(a)(b)(c)(d)(e)(f)に本発明
の書式判断手段を示し7た図。 第4図に本発明の書式判断のフローチャートを示す。 1・・・・・CPU 2・・・・・画像入力装置 3・・・・・認識結果表示装置 4・・・・・ROM 5・・・・・RA M 6・・・・・画像入力手段 7・・・・・書式判断手段 8・・・・・文字列抽出手段 9・・・・・文字抽出手段 10・・・・・文字認識手段 11・・・・・認識文字表示手段 12.13・・文字画像 ■・1.15・・水平方向周辺分布 16.17・・垂直方向周辺分布 18・・・・・書式判断手段 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 上 柳 雅 誉(他1名)第3図(I
l) 第3図(j)

Claims (2)

    【特許請求の範囲】
  1. (1)光学的画像入力手段により、紙面等に書かれた文
    字画像を読み取り、紙面上に書かれた文字を認識し、コ
    ード番号に置き換える文字認識装置において、書式判断
    手段を有することを特徴とする文字認識装置。
  2. (2)文字画像の複数の周辺分布の空白部分の有無及び
    大きさを判断の手段に用いることを特徴とする請求項1
    記載の文字認識装置。
JP63099445A 1988-04-22 1988-04-22 文字認識装置 Pending JPH01270183A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63099445A JPH01270183A (ja) 1988-04-22 1988-04-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63099445A JPH01270183A (ja) 1988-04-22 1988-04-22 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01270183A true JPH01270183A (ja) 1989-10-27

Family

ID=14247572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63099445A Pending JPH01270183A (ja) 1988-04-22 1988-04-22 文字認識装置

Country Status (1)

Country Link
JP (1) JPH01270183A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03204791A (ja) * 1990-01-05 1991-09-06 Nippon Steel Corp 打刻印の検出方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03204791A (ja) * 1990-01-05 1991-09-06 Nippon Steel Corp 打刻印の検出方法及び装置

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
US5854860A (en) Image filing apparatus having a character recognition function
JPH0430070B2 (ja)
JPH01270183A (ja) 文字認識装置
JP2008108114A (ja) 文書処理装置および文書処理方法
JP3197441B2 (ja) 文字認識装置
JPS6254380A (ja) 文字認識装置
JP3006294B2 (ja) 光学的文字読取装置
JP3086277B2 (ja) 文書画像処理装置
JPH04324577A (ja) 折れ線グラフ認識装置
ANTONACOPOULOS Automatic reading of Braille documents
KR100234028B1 (ko) 문자인식 시스템의 문자영역 구분방법
JPH02230484A (ja) 文字認識装置
JPH11242716A (ja) 画像処理方法および記録媒体
JP2917396B2 (ja) 文字認識方式
JP2823350B2 (ja) マルチメディア入力装置
JP2002189984A (ja) 文書読取装置
JPH02128292A (ja) 光学文字読取装置
JPH01284991A (ja) 文字認識方法
JPH1049602A (ja) 帳票認識方法
JPH04109381A (ja) 文字読取装置
JPH01180687A (ja) マークシートおよびマークシート文字認識方法
JPH0443476A (ja) 文字認識装置
JPH03142694A (ja) 文書読取装置
JPH0365781A (ja) パターン正規化方式