JPH01312683A - 文字読取方式 - Google Patents

文字読取方式

Info

Publication number
JPH01312683A
JPH01312683A JP63145228A JP14522888A JPH01312683A JP H01312683 A JPH01312683 A JP H01312683A JP 63145228 A JP63145228 A JP 63145228A JP 14522888 A JP14522888 A JP 14522888A JP H01312683 A JPH01312683 A JP H01312683A
Authority
JP
Japan
Prior art keywords
character pattern
similarity
partial
pattern
input character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63145228A
Other languages
English (en)
Inventor
Kozo Tomono
伴野 浩三
Keiji Kobayashi
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63145228A priority Critical patent/JPH01312683A/ja
Publication of JPH01312683A publication Critical patent/JPH01312683A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は文字読取方式に関するものであり、詳しくは
低品質の印字などを読み取る光学文字読取装置における
文字読取方式に関するものである。
〔従来の技術〕
第8図は例えば特公昭53−46062号公報に示され
た従来の文字読取方式を採用した光学文字読取装置の構
成を示すブロック図である。
図において、1は文字が書かれた帳票、2は帳票1上の
文字を走査して入力文字パターンを読み取る走査手段、
3は上記入力文字パターンを記憶するパターンメモリ、
4は上記入力文字パターンと下記基準文字パターンとを
重ね合せて類似度を計算し帳票1上の文字を認識する認
識手段、5は読取対象文字に対する標準字形の文字パタ
ーン(以下基準文字パターンと呼ぶ)を記憶した認識辞
書である。
次に動作について説明する。帳票1に印刷された文字を
走査手段2で光学的に走査し、光電変換することにより
、入力文字パターンをパターンメモリ3に記憶する。認
識手段4は、パターンメモリ3に記憶された入力文字パ
ターンと認識辞書5に記憶された基準文字パターンとを
重ね合せ、両者の整合の度合(類似度)を計算し、頚イ
以度が最大で、しかも所定の認識方式によって定められ
た条件を満足するものを認識結果として出力する。
この場合の類似度は、例えば入力文字パターンと基準文
字パターンとについて白をr−IJ、黒を「1」で表す
2値行列π−(Pij) 、回=(Qij)としたとき
、(式1)に示すSで表されるものである。
ここで、分子は2つの行列の要素一致数、分母■は行列
の全要素数である。なおπ9頁はベクトル、P、  Q
はスカラーを表す。
〔発明が解決しようとする課題〕
従来の文字読取方式は以上のように構成されているので
、入力文字パターンの一部が欠けたり、ノイズのために
そのパターンの形状が太き(なった場合や、プリンタの
印字精度、帳票の伸縮、光学系の精度が所定の条件を満
たさない場合などに、その文字の基準パターンとの重ね
合せが正しい位置で行えないため、類似度が低下し、読
取精度が低くなるという問題点があった。また、従来の
文字読取方式は、特にプリンタ等で印字される場合、印
字ヘッドの傾きが少しでも正常な角度からずれると、文
字の上端、下端あるいは左端、右端がかすれた状態にな
るため、読取精度が著しく低下するという問題点があっ
た。
この発明は上記のような問題点を解消するためになされ
たもので、人力文字パターンの一部が欠けたり、ノイズ
のためにそのパターンの形状が大きくなった場合でも、
精度良(文字を読取ることができる文字読取方式を得る
ことを目的とする。
〔課題を解決するための手段〕
この発明に係る文字読取方式においては、入力文字パタ
ーンと基準文字パターンとを複数個にそれぞれ分割した
部分パターン相互間の部分類似度を格納する部分類似度
テーブル6を有し、認識手段4は、入力文字パターンと
基準文字パターンとの部分パターン相互間の最通な部分
類似度を部分類似度テーブル6により計算するとともに
、部分パターン相互間の対応付けのうち部分1ff(I
u度の和が最大となる組み合せを選択して人力文字パタ
ーンと基準文字パターンとの類似度を求め帳票1上の文
字を認識し、文字を読み取ることを特徴とするものであ
る。
〔作用〕
認識手段4は、部分類似度テーブル6により入力文字パ
ターンと基準文字パターンとの部分パターン相互間の最
通な部分類似度を計算する。そして認識手段4は、その
部分類似度の和が最大となる組み合せを選択し、この組
み合せにより入力文字パターンと基準文字パターンとの
類似度を求める。したがって、入力文字パターンと基準
文字パターンとの重ね合せの位置のずれがあっても、そ
の位置ずれが極小になる。
〔発明の実施例〕
第1図はこの発明の一実施例に係る文字読取方式を採用
した光学文字読取装置の構成を示すブロック図である。
第1図において、第8図に示す構成要素に対応するもの
には同一の符号を付し、その説明を省略する。第1図の
部分類似度テーブル6は、入力文字パターンと基準文字
パターンとを複数個にそれぞれ分割した部分パターン相
互間の部分類似度を格納するものである。
第2図は例えば英文字「H」の入力文字パターンを示し
、第3図は英文字rHJの基準文字パターンを示す。第
4図は上記部分類似度テーブル6における入力文字パタ
ーンと基準文字パターンの関係を示し、第5図は例えば
認識手段4に備えられる類似度計算用テーブル7におけ
る入力文字パターンと基準文字パターンとの関係を示す
。第6図は部分類似度テーブル6の一例を示し、第7図
は類似度計算用テーブル7の一例を示す。第6図の部分
類似度テーブル6および第7図の類似度計算用テーブル
7は第2図の入力文字パターンと第3図の基準文字パタ
ーンとを用いた場合を示す。
次に動作について説明する。パターンメモリ3に入力文
字パターンが記憶されるまでの動作は従来装置と同一で
あるので説明を省略する。次に認識手段4はパターンメ
モリ3内の入力文字パターンと認識辞書5内の基準パタ
ーンとをそれぞれ複数個に分割する。ここでは両パター
ンのサイズをMXN画素とし、N個の列パターンに分割
する。
認識手段4はここで、入力文字パターンの第i列の列パ
ターン(P I!+  P zt、・・・・・・P、t
)と基準文(p、t・qk=)を1=1−N、j=1〜
Nのすべての組合せについて計算し、これを列パターン
間の部分類似度f (i、j)として第4図に示す部分
類似度テーブル6に登録する。実用上は、処理時間短縮
のため、実際に必要な組合せについてのみ計算すればよ
く、1i−jl<Cを満足する組合せに限定することが
できる。ここでCは印字条件によって決まる整合の際の
最大ずれ量である。
計算が不要な組合せについては負の大きな値を入れてお
く。
次に認識手段4は部分類似度テーブル6を用いて、入力
文字パターンと基準文字パターンとの間で列パターンの
対応づけを行い、両パターン間の類似度Sを求める。例
えば入力文字パターンの列番号x(11,x(21,・
・・・・・x (N)を基準文字パターンの列番号y(
11,y(2)、  )’ (N)に対応づける場合、
類似度Sは で定義する。
認識手段4は(式2)で定義されるSを、可能な対応づ
けについてすべて求め、その最大値を入力文字パターン
と当該基準文字パターンとの類似度S′とする。
類似度S′を求めるには、DPの手法を用いる。
具体的には、(式3)〜(弐6)及び第5図の類似度計
算用テーブル7により順次g (i、j)を計算してい
き、最終的に求まるg (N、N)から(式7)を用い
て求める。
g (1,j)=f  (1,3)(j=1〜N)・・
・・・・(式3) %式%) ・・・・・・(式4) g (i、j)=MAX (g (i−1,j−1)+
f  (i、j)、g (i−1,j)。
g(i、j−1)・・・・・・(式5)(ただし、1i
−jl≦Cかつi、j>2)g (i、  j) =f
  (i、  j)   ・・・・・・(弐6)(ただ
し、1i−jl>Cかつt、Jン2)XN (式5)の右辺において、第1項は入力文字パターンの
第i列と基準文字パターンの第j列を対応づける場合に
用いられる項である。また、第2項は入力文字パターン
の第i列を無視し、基準文字パターンのいずれの列にも
対応づけない場合に用いられる項である。また、第3項
は基準文字パターンの第j列を無視し、入力文字パター
ンのいずれの列にも対応づけない場合に用いられる項で
ある。具体的には、第2項は入力文字パターンがノイズ
等の影響でパターンの形状が大きくなった場合に選択さ
れ、第3項は入力文字パターンの一部が欠けた場合に選
択される。認識手段4は上記計算を読取対象文字のすべ
ての基準パターンについて行い、類似度S′が最大でし
かも所定の条件を満足するものを帳票1上の文字の認識
結果として出力する。
このように認識手段4は、入力文字パターンと基準文字
パターンとの部分パターン相互間の最通な部分類似度を
部分類似度テーブル6により計算し、部分パターン相互
間の対応付けのうち部分類似度の和が最大となる組み合
せを選択して入力文字パターンと基準文字パターンとの
類似度を求め帳票1上の文字を認識する。
次に第2図の入力文字パターンと第3図の基準文字パタ
ーンとを例として、具体的に類似度S′の求め方を説明
する。ここで文字パターンの画素数はMXN=9x6−
54である。
第6図がこのときの部分類似度テーブル6である。ここ
では印字条件で決まる定数Cの値を1とし、1i−jl
≦1の要素のみを計算している。
なお、1i−jl>lの要素には負の大きな値(ここで
は−1000)が入っている。第7図が類似度計算用テ
ーブル7である。この類似度計算用テーブル7における
g (1,1)、g (1,2)。
g (2,1)には(弐3)、 (式4)により、部分
類似度テーブル6のf  (1,1)、  f  (1
,2) 。
f  (2,1)の値がそのまま登録される。次に類似
度計算用テーブル7のg (2,2)は(式5)%式%
) 9,7)=9となる。これは、入力文字パターンの第2
列を無視する場合に相当する。また、g (2,3)は
同様にしてMAX <g (1,2)+9.  g  
(1,3)、g  (2,2))=MAX(18,−1
000,9)=18となる。これは入力文字パターンの
第2列と基準文字パターンの第3列を対応づける場合に
相当する。
以下、同様にして類似度計算用テーブル7のg (i、
j)を次々に計算していくと、最終的には第7図の丸印
で示すg (1,2)、  g (2,3)。
g (3,4)g (4,5)g (5,5)、g (
6゜6)を通るパスで求まる値g (6,6)=45を
文字パターンの全画素数54で割った値45154=0
.83が類似度S′となる。
これは入力文字パターンの第1.2.3,4゜6列を基
準文字パターンの第2.3,4,5.6列に対応づけた
場合に相当しており、第6図の丸印で示したf  (i
、j)を採用して類(用度S′を求めたことになる。
なお、上記実施例では人力文字パターンと基準文字パタ
ーンとをN個の列に分割して整合を行ったが、これに限
らずM個の行に分割して整合を行ってもよい、また、N
個の列に分割して整合を行い、列パターン間の最通な対
応づけを求めた後、対応のついた列パターンのみを用い
て入力文字パターン及び基準文字パターンを再構成し、
再構成した両パターンをM個の行に分割して整合を行っ
てもよい。上記のうち、どの方法を採用するかは、プリ
ンタの印字方式や帳票の伸縮方向等、印字ずれの原因を
考慮して決めれば良い。また、基準文字パターンの画素
の値をrlJ、r−IJの2値行列で表す例について説
明したが、この他にdon’tcareの画素の値とし
てrOJを用いた3値行列で表すなど、認識方式に応じ
て整合の方法を変えてもよい。
〔発明の効果〕
以上のように本発明によれば、入力文字パターンと基準
文字パターンとをそれぞれ複数個に分割し、分割された
部分パターン間の部分類似度の値により部分パターン間
の最通な対応付けを求めて類似度を計算するようにした
ので、入力文字パターンと基準文字パターンとの重ね合
せの位置のずれが極小となり、これにより入力文字パタ
ーンの一部が欠けたり、ノイズのためにそのパターンの
形状が大きくなった場合でも、精度良く文字を読み取る
ことができ、したがって読み取り性能が高い文字読取装
置を提供できるという効果が得られる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る文字読取方式を採用
した光学文字読取装置の構成を示すプロ7り図、第2図
はこの実施例における入力文字パターン図、第3図はこ
の実施例における基準文字パターン図、第4図はこの実
施例における部分類似度テーブル図、第5図はこの実施
例における類似度計算用テーブル、第6図は第4図の部
分類似度テーブルの一例図、第7図は第5図の類似度計
算用テーブルの一例図、第8図は従来の文字読取方式を
採用した光学文字読取装置の構成を示すブロック図であ
る。 1・・・・・・帳票、2・・・・・・走査手段、3・・
・・・・パターンメモリ、4・・・・・・認識手段、5
・・・・・・認識辞書、6・・・・・・部分類似度テー
ブル。 代理人  大君 増a(ばか2名)

Claims (1)

    【特許請求の範囲】
  1. 帳票上の文字を走査して入力文字パターンを読み取る走
    査手段と、上記入力文字パターンを記憶するパターンメ
    モリと、読取対象文字の字形に対する基準文字パターン
    を記憶した認識辞書と、上記入力文字パターンと上記基
    準文字パターンとを重ね合せて類似度を計算し上記帳票
    上の文字を認識する認識手段とを備え、文字を読み取る
    文字読取装置において、上記入力文字パターンと上記基
    準文字パターンとを複数個にそれぞれ分割した部分パタ
    ーン相互間の部分類似度を格納する部分類似度テーブル
    を設け、上記認識手段は、上記入力文字パターンと上記
    基準文字パターンとの部分パターン相互間の最通な部分
    類似度を上記部分類似度テーブルにより計算するととも
    に、上記部分パターン相互間の対応付けのうち部分類似
    度の和が最大となる組み合せを選択して上記入力文字パ
    ターンと上記基準文字パターンとの類似度を求め上記帳
    票上の文字を認識し、文字を読み取ることを特徴とする
    文字読取方式。
JP63145228A 1988-06-13 1988-06-13 文字読取方式 Pending JPH01312683A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63145228A JPH01312683A (ja) 1988-06-13 1988-06-13 文字読取方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63145228A JPH01312683A (ja) 1988-06-13 1988-06-13 文字読取方式

Publications (1)

Publication Number Publication Date
JPH01312683A true JPH01312683A (ja) 1989-12-18

Family

ID=15380306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63145228A Pending JPH01312683A (ja) 1988-06-13 1988-06-13 文字読取方式

Country Status (1)

Country Link
JP (1) JPH01312683A (ja)

Similar Documents

Publication Publication Date Title
US5228095A (en) Apparatus for recognizing printed characters
JPH01312683A (ja) 文字読取方式
JPH10162102A (ja) 文字認識装置
JPS6214277A (ja) 画像処理方式
JP2858560B2 (ja) 文書読み取り装置
JP2595657Y2 (ja) 通帳読取装置
JPS59116885A (ja) 文字認識方式
JP2708604B2 (ja) 文字認識方法
JP2784004B2 (ja) 文字認識装置
JPS6095689A (ja) 光学的文字読取装置
JP2973892B2 (ja) 文字認識方式
JPH0351982A (ja) 文字列認識方式
JP2784502B2 (ja) デジタルデータ記録紙の二次元データ記録読取方法およびその記録読取装置。
JP2976990B2 (ja) 文字認識装置
JP2619915B2 (ja) 情報処理方法および装置
JP2614319B2 (ja) 画素数変換方式
JP2917396B2 (ja) 文字認識方式
JPS5831028B2 (ja) 文字認識装置
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH01282691A (ja) 文字認識方式
JPS6045885A (ja) 文字認識方法
JPS5914078A (ja) 帳票読取装置
JPH1083433A (ja) 光学式文字読取装置の文字辞書作成方法
JPH0488488A (ja) 光学文字読取装置
JPH08194772A (ja) 光学的文字読取り装置