JPH03244094A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03244094A
JPH03244094A JP2042046A JP4204690A JPH03244094A JP H03244094 A JPH03244094 A JP H03244094A JP 2042046 A JP2042046 A JP 2042046A JP 4204690 A JP4204690 A JP 4204690A JP H03244094 A JPH03244094 A JP H03244094A
Authority
JP
Japan
Prior art keywords
pattern
character
sub
input pattern
character direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2042046A
Other languages
English (en)
Inventor
Hirohisa Goto
後藤 裕久
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2042046A priority Critical patent/JPH03244094A/ja
Publication of JPH03244094A publication Critical patent/JPH03244094A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〉 本発明は、印刷文書等を光学的に読取る光学式文字読取
り装置(Optical Character Rea
der、以下OCRという)等における高速かつ小型で
、操作性の良い文字認識装置に関するものである。
(従来の技術) 従来、このような分野の技術としては特開昭62−16
6479号公報に記載されるものがあった。
近年、日本語情報処理システムの普及により、日本語印
刷文書を計算機に入力する要求が急速に高まり、入力の
高速化及び省力化のために、印刷漢字OCRの必要性が
急速に高まってきている。
この印刷漢字OCRでは、文字認識装置が設けられ、そ
の文字認識装置によって印刷文書中の漢字等を読取り、
その読取った漢字等の文字パタンを識別することが必要
となる。
ところで、印刷文書には、横書きの文書と、新聞や文庫
本等の縦書きの文書とがある。
例えば、印刷文書の一例として名刺を挙げると、第2図
(a−1>、  (a−2)〜(di、)(d−2>に
示すように、横書きの名刺(第2図(a−1>、(b−
王)〉と、縦書きの名刺(第2図(c−1)、  (d
−1>)とがある。さらに、名刺の置き方により、帳票
の形は同じでも、]−80°回転している場合がある。
例えば、第2図(a−1>を1−80°回転した状態が
第2図(b↑)であり、第2図(c−1,>を1−80
°回転した状態が第2図(d−1)である。また、第2
図(a−1,)、 (b−1>、 (c−1>、 (d
l)の各パタン例が、第2図(a−2>、12)、(c
−2>、(d−2)にそれぞれ示されている。ここで、
第2図(a−2>を基準にすると、同図(b−2)は1
−80°、同図(c−2>は270°、同図(d−2)
は90°、それぞれ時計方向に回転させたパタンになっ
ている。
従来の印刷漢字0CRJこおける文字認識装置では、光
電変換手段により読取った入力パタンをパタン記憶手段
に記憶し、特徴抽出手段により、パタン記憶手段に記憶
された入力パタンからその入力パタンの特徴を抽出する
。そして、識別手段により、特徴抽出手段で抽出された
特徴と、辞書記憶手段に記憶された辞書とを照合して入
力パタンの識別を行うようになっている。
このような文字認識装置では、第2図に示すように、印
刷文書には縦書きと横書きがあり、しかも帳票が180
°回転してセットされるおそれがあるような文書を認識
する場合、オペレータが帳票を見ながら、文字毎や帳票
毎にキーボード等で文字方向を指定しなければ、正しく
文字認識を行うことができなかっノ2゜ そこで、このような問題を解決するため、前記文献の技
術では、06.90°、180°、270°回転した4
種類の辞書を予め辞書記憶手段に記憶させておく。そし
て、入力パタンを前記4種類の辞書で認識し、それぞれ
の辞書で認識して得られた認識結果から、最も類似度の
高い結果が出力された辞書の方向を文字方向と判定し、
その判定結果に基づき文字の認識を行うようになってい
た。
(発明が解決しようとする課題) しかしながら、上記構成の装置では、次のような課題が
あった。
(a〉 1つの文字パタンに対し、0°、90″180
°、270°回転に対応する4回の識別を行うことが必
要となるため、文字認識処理に時間がかかるという問題
があった。
(b)  06.90°、180’ 、270’ とい
った4種類の辞書を用意しなければならないため、それ
らを記憶する辞書記憶手段のメモリ容量が非常に大きく
なってしまい、装置の大型化を招くという問題があった
(c)  前記文献の技術では、文字方向を判定してそ
の判定結果に基づき文字の認識を行うため、オペレータ
が文字方向を文字毎や、帳票毎に指定する必要かなくな
り、それによって操作の煩雑化や処理時間がかかるとい
う問題を解決できる。しかし、前記文献の技術では、縦
書きや横書きの名刺を自動的に認識することはできても
、名刺以外の印刷文書等については認識することができ
ず、そのため装置としての汎用性が低く、技術的に十分
満足のゆくものではなかった。
本発明は前記従来技術が持っていた課題として、認識処
理に時間がかかる、装置が大型化する、汎用性がない等
といった点について解決した文字認識装置を提供するも
のである。
(課題を解決するための手段) 本発明は前記課題を解決するために、読取られた入力パ
タンを記憶するパタン記憶手段と、前記パタン記憶手段
に記憶された入力パタンからその入力パタンの特徴を抽
出する特徴抽出手段と、辞書を記憶する辞書記憶手段と
、前記特徴抽出手段で抽出された特徴と前記辞書とを照
合して前記入力パタンの識別を行う識別手段とを、備え
た文字認識装置において、前記パタン記憶手段に記憶さ
れた入カバクンを複数の方向に走査して垂直サブパタン
及び水平サブパタンを抽出するサブパタン抽出手段と、
文字方向判定手段と、変換手段と、回転方向判定手段と
を設けたものである。
ここで、文字方向判定手段は、前記サブパタン抽出手段
で抽出された垂直サブパタン及び水平ザブパタンの各線
幅を計算し、その両線幅の比と予め定めた線幅比基準値
とを比較して文字方向(例えば、横書き、縦書き〉を判
定する機能を有している。変換手段は、前記文字方向判
定手段の出力に基づいて特徴変換またはパタン変換を行
うことにより、前記パタン記憶手段に記憶された入力パ
タンから異なる2方向の特徴の抽出を行ってその抽出結
果を前記識別手段で識別させる機能を有している。また
、回転方向判定手段は、前記識別手段の出力に基づき、
前記文字方向判定手段の出力が所定角度(例えば、O′
もしくは180°)回転しているか否かを判定して前記
文字パタンの回転方向を判定する機能を有している。
(作用〉 本発明によれば、以上のように文字認識装置を構成した
ので、帳票上の文字等が光電変換手段等で読取られると
、その読取られた入力パタンかパタン記憶手段に記憶さ
れる。すると、サブパタン抽出手段は、パタン記憶手段
に記憶された入力パタンを複数方向(例えば、水平及び
垂直方向等)に走査し、垂直サブパタン及び水平サブパ
タンを抽出してその抽出結果を文字方向判定手段に与え
る。文字方向判定手段では、抽出された垂直ザブパタン
及び水平サブパタンの各線幅を計算し、その垂直サブパ
タンの線幅と水平ザブパタンの線幅との比を求め、その
比と予め設定された線幅比基準値とを比較し、入力パタ
ンの文字方向(例えば、横書き、縦書き)を判定し、そ
の文字方向判定結果を変換手段及び回転方向判定手段に
与える。
変換手段は、文字方向判定結果に基づき、特徴抽出手段
で抽出される文字パタンの特徴71ヘリクスあるいは入
力パタン等を、所定角度回転することにより、パタン記
憶手段に記憶された入力パタンから異なる2方向の特徴
の抽出(例えば、横書きの場合は、回転させないパタン
の特徴抽出と↓80°回転したパタン用の特徴抽出、縦
書きの場合は、90°回転したパタン用の特徴抽出と2
70°回転したパタン用の特徴抽出)を行い、その抽出
結果を識別手段で識別させるように働く。回転方向判定
手段は、識別手段の識別結果に基づき、文字方向判定手
段から出力される横書きか縦書きかの文字方向判定結果
が、所定角度(例えば、0°もしくは380’)回転し
ているか否かを判定して入力パタンの回転方向を判定す
る。
このように、文字方向判定手段と回転方向判定手段とで
、それぞれ文字方向を判定するため、1つの文字パタン
に対する識別回数が少なくなって、認識処理を短時間で
行えると共に、照合用の辞書の数も少なくて済み、それ
によって辞書記憶手段の容量の削減により、装置の小型
化が図れる。さらに、この装置は、名刺以外の印刷文書
等に対しても、処理可能であるため、汎用性の向上が図
れる。従って、前記課題を解決できるのである。
(実施例) 第1図は、本発明の一実施例を示す文字認識装置の機能
ブロック図である。
この機能ブロック図を説明する前に、先ず本実施例の原
理を説明する。
印刷文書に使用される活字の大部分を占める、例えば明
朝体について、その線幅に着目し、後述するサブパタン
抽出方法を用いて得た水平サブパタンの線幅と垂直サブ
パタンの線幅との比について測定を行った結果を第1表
に示す。
0 第11表 水平サブパタン及び垂直サブパタンの 線幅比測定結果 第3図(a)〜(f>は、明朝体「亜」の垂直サブパタ
ンと水平サブパタンを示す図である。第1表の測定では
、第3図(a>に示す明朝体の「亜」の文字について、
活字の大きさ8.12、及び]6ポインI・を対象に、
分解能37.5μmのイメージスキャンにより得られf
s2値パタンについて水平サブパタン及び垂直サブパタ
ンを抽出し、水平サブパタン線幅及び垂直サブパタン線
幅をそれぞれ求めた。
水平サブパタン及び垂直ザブパタンの抽出方法は、後述
する(コ−)式を用いて入力パタンの線幅を求め、該入
力パタンを水平及び垂直方向に走査して検出した文字線
の断面の中から、その断面長が該入力パタンの線幅より
も十分に長い断面を抽出して行う。
第3図(a)に示す明朝体の横書きの「亜」の垂直サブ
パタン例が第3図(b)に、及び水平サブパタン例が第
3図(C)にそれぞれ示されている。また、第3図(a
>、(b)、(c)に対応する縦書きのパタン例が第3
図(d)、(e)(f)にそれぞれ示されている。すな
わち、第3図(d)は、縦書きの明朝体の「亜」であり
、第3図(a)の文字パタンを反時計方向に90°回転
させた状態となっている。従って、第3図(d)圭1− 2 の垂直サブパタンを示す第3図(e)と水平サブパタン
を示す第3図(f>とは、それぞれ第3図(c)、(b
)のパタンを反時計方向に90°回転させたものと同一
のパタンとなる。
第工表から明らかなように、明朝体は、水平サブパタン
線幅と垂直サブパタン線幅の大きさが大きく異なる。従
って、横書き文字の線幅比(−垂直サブパタン線幅/水
平サブパタン線幅〉の大きさは、2.8以上となってい
る。同様に、縦書き文字の線幅比(−垂直サブパタン線
幅/水平ザブパタン線幅〉は、0.36以下となってい
る。
以上のことから理解できるように、入力パタンの線幅比
(−垂直サブパタン線幅/水平サブパタン線幅)の大き
さにより、入力パタンか横書きが、縦書きかを判断する
ことが可能となる。
次に、以上のような原理に基づき構成された第1図の文
字認識装置の構成を説明する。
この文字認識装置は、入力帳票上の文字や図形等を光電
変換により電気信号に変換して文字図形パタンを出力す
る光電変換手段上を有し、その光電変換手段lの出力側
には、ランダム・アクセスメモリ(RAM)等で構成さ
れるパタン記憶手段2と、線幅計算手段3とが接続され
ている。パタン記憶手段2は、光電変換手段上から出力
される文字図形パタンの例えば1パタン分を記憶するも
ので、その出力側には特徴抽出手段10が接続されてい
る。線幅計算手段3は、光電変換手段1から出力された
文字図形パタンを受けると入力パタンの線幅Wを計算す
る回路であり、その出力側には特徴抽出手段lOが接続
されている。
特徴抽出手段10は、パタン記憶手段2から出力された
大カパタンの特徴を抽出して2種類の特徴マトリクスを
出力するもので、文字枠検出手段↓1、文字枠分割決定
手段12、サブパ゛タン抽出手段13、特徴マトリクス
抽出手段14及び特徴変換手段15より構成されている
。文字枠検出手段1工は、パタン記憶手段2内の文字パ
タンに外接する文字枠を検出し、その検出結果を文字枠
分割決定手段12へ出力する機能を有している。文字枠
分割決定手段12は、検出された文字枠の向上3 4 部領域をMXNの領域(但し、M、Nは整数であり、本
実施例では、例えばM=N=5とする)に分割するため
のX軸(文字枠の水平方向)、Y軸(文字枠の垂直方向
)上の分割点座標を決定し、その決定結果を特徴マトリ
クス抽出手段14へ出力する機能を有している。
サブパタン抽出手段13は、パタン記憶手段2Gこ記憶
された入力パタンを複数の方向に走査(例えば、垂直走
査、水平走査、右斜め45°走査、及び左斜め45°走
査)して、垂直サブパタンVSP、水平サブパタンH3
P、右斜めサブパタンR3P、及び左斜めサブパタンL
SPをそれぞれ抽出し、その抽出結果を特徴マトリクス
抽出手段14へ出力する機能を有している。特徴マトリ
クス抽出手段14は、文字枠分割決定手段12から出力
される分割点座標に基づき、ザブパタン抽出手段↑3の
出力から特徴マトリクスを抽出し、その抽出結果を特徴
変換手段1−5に与える機能を有している。特徴変換手
段15は、入力された特徴マトリクスを所定方向に回転
して2種類の特徴マトリクスを出力する機能を有してい
る。
サブパタン抽出手段の出力側には、文字方向判定手段2
0が接続され、その文字方向判定手段20の出力側が、
特徴変換手段1−5及び回転方向判定手段23に接続さ
れている。さらに、辞書記憶手段2丁が設けられ、その
辞書記憶手段21と特徴変換手段1−5が識別手段22
に接続され、その識別手段22が回転方向判定手段23
に接続されている。
文字方向判定手段20は、サブパタン抽出手段13の出
力から入力パタンの文字方向を判定して文字方向判定結
果を特徴変換手段15及び回転方向判定手段23へ出力
する機能を有している。辞書記憶手段21−は、例えば
横書き用の照合辞書マスクを記憶するもので、リード・
オンリ・メモリ(ROM)等で構成されている。識別手
段22は、辞書記憶手段2]−の内容を参照し、特徴変
換手段15から出力される2種類の1寺徴71〜リクス
に対する辞書マスクのカテゴリ名と距離(類似度)を回
転方向判定手段23へ出力する機能を有してい5 1.6 る。回転方向判定手段23は、識別手段22の出力を記
憶するバッファ等の記憶手段を有し、識別手段22の出
力りこ基づき、文字方向判定手段20から出力された文
字方向判定結果が所定角度(例えば、○°もしくは工8
0°〉回転しているか否かを判定して入力パタンの回転
方向を判定し、文字名及び文字方向をそれぞれ出力する
機能を有している。
次に、以上のように構成される文字認識装置の動作を、
第4図(a)〜(e)を参照しつつ説明する。なお、第
4図(a)〜(e>は、2値パタンと各サブパタンとを
説明するための図である。
第上図において、帳票上の文字、図形に対応した光信号
が光電変換手段■に入力されると、光電変換手段上は、
入力された光信号を電気信号に変換して文字図形パタン
をパタン記憶手段2及び線幅計算手段3へ出力する。パ
タン記憶手段2は、光電変換手段1から出力された文字
図形パタンの例えば↑パタン分を記憶する。
線幅計算手段3は、光電変換手段↓から出力された文字
図形パタンを入力すると、その入力パタンの線幅Wを計
算し、その計算結果をサブパタン抽出手段13及び特徴
マトリクス抽出手段14へ出力する。
この線幅計算手段3は、例えば公知の画像処理用フィル
タ回路と同様にシフトレジスタ構成となっており、次式
に示すような公知の近似式を用いて線幅Wを計算する。
W−1/(1−(Q/A)+    ・・・・・・(1
)この〈1〉式において、Qは(2x2)の窓(Wln
dOw;方形領域〉の全ての点が黒点となる点くこれを
4黒点という〉の個数、Aは全黒点の個数である。線幅
計算手段3では、これら4黒点の個数Q及び全黒点の個
数Aを計数し、その計数結果から(1〉式に従って線幅
Wを演算(こより求める。
次に、特徴抽出手段10において、文字枠検出手段11
により、パタン記憶手段2内の文字パタ 7 )8 ンに外接する文字枠が検出される。文字枠分割決定手段
1−2では、検出された文字枠の内部領域をMXN (
例えば、M=N=5>の領域に分割するためのX軸、Y
軸上の分割点座標を決定し、その決定結果を特徴マトリ
クス抽出手段14へ出力する。
一方、サブパタン抽出手段13では、パタン記憶手段2
に記憶された入力パタンに対し、垂直走査を全面に行っ
て黒点(文字線部を黒点とする)の連続する長さと、線
幅計算手段3により計算された線幅Wとの関係により、
垂直サブパタンVSPを抽出する。同様に、サブパタン
抽出手段13では、水平走査によって水平サブパタンH
S Pを、右斜め45°走査によって右斜めサブパタン
R3Pを、左斜め45°走査によって左斜めサブパタン
LSPを、それぞれ抽出する。
このようにして抽出されたサブパタンの例が第4図(a
)〜(e)に示されている。第4図(a)は外接する文
字枠F内の2値パタンからなる原パタンであり、このよ
うな原パタンから得られた垂直ヅフ゛パタンか第4図(
b)に、水平サブパタンが第4図(C)に、右斜めサブ
パタンが第4図(d)に、左斜めサブパタンか第4図(
e)に、それぞれ示されている。このようなサブパタン
は、特徴マトリクス抽出手段14及び文字方向判定手段
20へ与えられる。
特徴マトリクス抽出手段14は、文字枠分割決定手段1
2によって決定された分割点座標に基づき、垂直、水平
、右斜め及び左斜めの各サブパタン(VSP、H8P、
R3P及びLSP)におけるパタン記憶手段2上の文字
枠領域を、MXNの領域に分割し、得られた各分割領域
内の黒点数Bjjを計数する。この黒点数Bijと、線
幅計算手段3で求めた線幅Wとを用い、次の式(2)に
よって文字線長Lijを示す特徴を計算し、M×NX4
次元の特徴マトリクスを作成する。
Lij=Bij/W      ・・・・・・(2)さ
らに、この特徴マトリクス抽出手段14では、1つ 0 垂直サブパタンVSPの特徴マトリクスに対しては文字
枠FのY軸方向の長さΔYで、水平サブパタンH3Pの
特徴マトリクスに対してはX軸方向の長さ△Xで、右斜
めサブパタンR3P及び左斜めサブパタンLSPの特徴
マトリクスに対しては(△X+△Y)/2で、それぞれ
正規化を行い、文字の大きさによる変動を吸収したMX
NX4次元の特徴マトリクスを作成する。
文字方向判定手段20は、線幅計算手段3と同様に、サ
ブパタン抽出手段]−3に格納されている垂直サブパタ
ンを走査し、垂直サブパタンの4黒点数Qvと全黒点数
Avを求め、(1−〉式を用いて垂直サブパタンの線幅
Wvを求める。さらに、サブパタン抽出手段13に格納
されている水平サブパタンを走査し、その水平サブパタ
ンの4黒点数Qhと全黒点数Ahを求め、(1)式を用
いて水平サブパタンの線幅Whを求める。そして、垂直
サブパタン及び水平サブパタンの線幅比Wv/whを計
算し、その線幅比Wv/Whと、予め設定された線幅比
基準値wthとを比較し、次の(3〉式、(4〉式を満
足するか否かの判定を行W v /W h  ≧wth
     ・・・・・・(3)Wv/Wh  <Wt 
h     ・=−(4)(本実施例では、例えばWt
 h= 1 >即ち、文字方向判定手段20では、(3
)式を満足すれば、文字方向を横書きと判定して横書き
の文字方向判定結果を、(4)式を満足ずれは、文字方
向を縦書きと判定して縦書きの文字方向判定結果を、特
徴変換手段↑5及び回転方向判定手段23へ出力する。
特徴変換手段圭5は、文字方向判定手段20から出力さ
れた文字方向判定結果が横書きの場合、特徴マトリクス
抽出手段14から入力した各特徴マトリクス(f IH
1]−1−1MXN>と、各特徴マトリクスを180°
回転した特徴マトリクス(f21.i−111−1lと
を、識別手段22へ出力する。また、文字方向判定手段
20から出力された文字方向判定結果が縦書きの場合、
特徴変換手段15では、先ず、特徴マトリクス抽出手段
J4から出力された特徴マトリクスについて、垂直特徴
マトリクスと水平特徴マトリクスを入れ換えると共に、
右斜め特徴マトリクスと左斜め特徴マトリクスを入れ換
える。次に、入れ換え後の各特徴マトリクスを時計方向
に90°回転させた特徴マトリクス(f 1;、1−1
9MXN >と、270°回転させた特徴マトリクス(
f 2 H、]−:l−MXN)とを、識別手段22へ
出力する。
識別手段22は、特徴変換手段15から出力された2種
類の特徴マトリクスの内、先ず、工種類の特徴マトリク
スf11と、辞書記憶手段214こ記憶された照合辞書
マスクg・どの間に、次の(5〉式で定義される距離(
類似度〉Dlllを適用し、この距離Dmが最小の値と
なる辞書マスクのカテゴリ名C1と距離D1を、回転方
向判定手段23へ出力する。
同様に、識別手段22では、もう工種類の特徴マトリク
スf21と、辞書記憶手段2]−に記憶された照合辞書
マスクg・どの距離を求め、(5)式で求めた距離Dl
llが最小となる辞書マスクのカテゴリ名C2と距離D
2を、回転方向判定手段23へ出力する。
回転方向判定手段23は、バッファ等の記憶手段を有し
ており、識別手段22から出力された2種類のカテゴリ
名C1,C2と距離Di 、C2を格納し、距離の比較
を行い、距離の小さい方のカテゴリ名を文字名として出
力すると共(、こ、そのカテゴリ名を得た特徴マトリク
スの回転方向を文字方向として出力する。
即ち、カテゴリ名C2は、カテゴリ名C1に対して18
0°回転した特徴マトリクスから得た結3 果である。回転方向判定手段23では、このカテゴリ名
C1かC2かを判定した後、文字方向判定手段20から
出力された横書きか、縦書きかの文字方向判定結果に基
づき、文字が0°、90°、↓80°、270°のどの
方向になっているかを判定し、その判定結果を前記の文
字名と共に文字方向として出力する。これらの出力は、
例えば′CRT等の表示部で表示されたり、プリンタ等
で印字される。
以上のように、本実施例では次のような利点を有してい
る。
本実施例では、サブパタン抽出手段13により、入力パ
タンに対する垂直サブパタンと水平ザブパタンを抽出し
、その抽出結果に基づき、文字方向判定手段20により
、入力パタンか縦書きか、横書きかの文字方向を判定す
る。この文字方向判定結果に基づき、特徴変換手段15
では、入力パタンから異なる2つの特徴抽出を行い、そ
の抽出した2種類の特徴マトリクスを識別手段22へ与
える。識別手段22では、抽出された2種類の特徴4 マトリクスを照合辞書マスクと照合して識別処理を行う
。回転方向判定手段23では、識別手段22からの識別
結果Gこ基づき、文字方向判定手段20から出力される
文字方向判定結果に対して0゜及び↑80°回転してい
るか否かを判定し、入力パタンの文字方向を判定する。
これにより、高速かつ小型で、操作性の良い文字認識装
置が実現できる、 すなわち、本実施例では、文字方向判定手段20により
、入力パタンに対する垂直サブパタンの線幅Wvと水平
サブパタンの線幅Whとの比に基づいて縦書きか、横書
きかの文字方向を判定する。
これにより、0°、90°、180°、270゜の4方
向のうち、互いに180°異なる2方向に限定される。
さらに、特徴変換手段]5により、異なる2つの特徴抽
出を行い、その抽出された特徴を識別手段22て識別し
た後、回転方向判定手段2B4こより、前記2方向に限
定された識別結果を比較して互いに180°異なる2方
向から、上方向に文字方向を決定している。そのため、
従来5 6 のように、0°、90°、工80°、270°の4方向
の照合辞書マスクを用意する必要がなく、しかも識別手
段22による文字認識を、従来の4回に比べ2回しか行
わないので、処理時間が少なくて済み、高速かつ小型の
文字認識装置を実現できる。
また、本実施例では、従来のような名刺以外の帳票に対
する認識処理も可能となるので、オペレータが文字毎や
、帳票毎に、文字方向を指定する必要がなく、汎用性が
あり、操作性の良い文字認識装置を実現できる。
なお、本発明は、図示の実施例に限定されず、種々の変
形が可能である。その変形例としては、例えば次のよう
なものがある。
(i) 上記実施例では、サブパタン抽出手段1−3に
より、入力パタンからサブパタンを抽出し、そのサブパ
タンから特徴マトリクス抽出手段14及び特徴変換手段
15によって抽出した特徴マトリクスを変換し、回転方
向判定手段23に対する回転方向判定用の特徴を生成し
ているが、他の方法で特徴を抽出するようにしても良い
。例えば、パタン記憶手段2の出力側にパタン変換手段
を設け、そのパタン変換手段の出力側を文字枠検出手段
1−1及びサブパタン抽出手段上3に接続し、文字方向
判定手段20から出力される文字方向判定結果に基づき
、該パタン変換手段によって入力パタンを所定角度回転
した後、その回転結果をサブパタン抽出手段13に与え
ることにより、特徴抽出を行うようにしても、上記実施
例とほぼ同様の利点が得られる。
(ii)  Jz記記構内線幅計算手段3、特徴抽出手
段10、文字方向判定手段20、識別手段22、及び回
転方向判定手段23等は、個別回路で構成する以外に、
計算機によるプログラム制御等tこより実行するように
しても良い。
(発明の効果〉 以上詳細に説明したように、本発明によれば、サブパタ
ン抽出手段により、入力パタンの垂直ザブパタンと水平
サブパタンを抽出し、その抽出結果に基づき、文字方向
判定手段によって人カバタフ ンが、例えば縦書きか、横書きかの文字方向を判定する
ようにしたので、例えば文字方向が0°、90°、18
0°、270°の4方向のうち、互いに180°異なる
2方向の文字方向が的確に判定できる。
そして、変換手段により、入力パタンから異なる2つの
特徴抽出を行い、その抽出した特徴を識別手段で識別し
て得られたそれぞれの結果に基づき、回転方向判定手段
により、文字方向判定手段から出力される文字方向判定
結果に対してその回転角度を判定して入力パタンの文字
方向を判定するようにしたので、識別手段によって抽出
された異なる2つの特徴が、該回転方向判定手段によっ
て2方向から1方向の文字方向が決定される。
そのため、従来のように、例えば0″、90。
180°、270°の4方向の照合用の辞書を用意する
必要がなく、辞書記憶手段の記憶容量を小さくでき、そ
れによって認識装置の小型化が図れる。しかも、識別手
段による照合は、従来の4回に比べ、2回しか行わない
ので、処理時間が少なくて済み、処理速度の高速化が可
能となる。さらに、従来のような名刺以外の帳票等に対
しても、文字方向の判定と、その判定結果に基づく的確
な文字の認識が行えるため、名刺以外の帳票等に対して
、オペレータが文字毎や、帳票毎に、文字方向を指定す
る必要がなく、操作性が良く、汎用性のある文字認識装
置を実現できる。
【図面の簡単な説明】
第1図は本発明の実施例を示す文字認識装置の機能ブロ
ック図、第2図(a−↓>、(a−2)〜(d.−1>
、(d−2>は印刷文書の例を示す図、第3図(a)・
〜(f>は明朝体の垂直サブパタンと水平サブパタンを
示す図、第4図(a)〜(e)は2値パタンと各サブパ
タンを説明するための図である。 l・・・・・・光電変換手段、2・・・・・・パタン記
憶手段、3・・・・・・線幅計算手段、10・・・・・
・特徴抽出手段、11−・・・・・・・文字枠検出手段
、12・・・・・・文字枠分割決定手段、13・・・・
・・サブパタン抽出手段、14・・・・・・特徴マトリ
クス抽出手段、15・・・・・・特徴変換手段、2つ 0 20 ・文字方向判定手段、 1− ・辞書記憶子 段、 2 ・識別手段、 3 回転方向判定子 段。

Claims (1)

  1. 【特許請求の範囲】 読取られた入力パタンを記憶するパタン記憶手段と、前
    記パタン記憶手段に記憶された入力パタンからその入力
    パタンの特徴を抽出する特徴抽出手段と、辞書を記憶す
    る辞書記憶手段と、前記特徴抽出手段で抽出された特徴
    と前記辞書とを照合して前記入力パタンの識別を行う識
    別手段とを、備えた文字認識装置において、 前記パタン記憶手段に記憶された入力パタンを複数の方
    向に走査して垂直サブパタン及び水平サブパタンを抽出
    するサブパタン抽出手段と、前記サブパタン抽出手段で
    抽出された垂直サブパタン及び水平サブパタンの各線幅
    を計算し、その両線幅の比と予め定めた線幅比基準値と
    を比較して文字方向を判定する文字方向判定手段と、前
    記文字方向判定手段の出力に基づいて特徴変換またはパ
    タン変換を行うことにより、前記パタン記憶手段に記憶
    された入力パタンから異なる2方向の特徴の抽出を行っ
    てその抽出結果を前記識別手段で識別させる変換手段と
    、 前記識別手段の出力に基づき、前記文字方向判定手段の
    出力が所定角度回転しているか否かを判定して前記入力
    パタンの回転方向を判定する回転方向判定手段とを、 設けたことを特徴とする文字認識装置。
JP2042046A 1990-02-22 1990-02-22 文字認識装置 Pending JPH03244094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2042046A JPH03244094A (ja) 1990-02-22 1990-02-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2042046A JPH03244094A (ja) 1990-02-22 1990-02-22 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03244094A true JPH03244094A (ja) 1991-10-30

Family

ID=12625180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2042046A Pending JPH03244094A (ja) 1990-02-22 1990-02-22 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03244094A (ja)

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US5748809A (en) Active area identification on a machine readable form using form landmarks
JPH05242292A (ja) 分離方法
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
US5835634A (en) Bitmap comparison apparatus and method using an outline mask and differently weighted bits
JPS5991582A (ja) 文字読取装置
JPH03244094A (ja) 文字認識装置
Agarwal et al. Bank check analysis and recognition by computers
JPH03246779A (ja) 文字認識装置
JP3384634B2 (ja) 文字種識別方法
JPS6227887A (ja) 文字種分離方式
JP3197441B2 (ja) 文字認識装置
JPH03273372A (ja) 文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JPS63269267A (ja) 文字認識方法
JP3428504B2 (ja) 文字認識装置
JP2747136B2 (ja) 文字認識装置
JP3197464B2 (ja) 文字認識方法および文字認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2616995B2 (ja) 文字認識装置
JPS62164182A (ja) 文字図形パタ−ン認識方式
JPH05174179A (ja) 文書画像処理装置
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法