JPH0792818B2 - パターン切出しおよび認識方法とそのシステム - Google Patents

パターン切出しおよび認識方法とそのシステム

Info

Publication number
JPH0792818B2
JPH0792818B2 JP4095186A JP9518692A JPH0792818B2 JP H0792818 B2 JPH0792818 B2 JP H0792818B2 JP 4095186 A JP4095186 A JP 4095186A JP 9518692 A JP9518692 A JP 9518692A JP H0792818 B2 JPH0792818 B2 JP H0792818B2
Authority
JP
Japan
Prior art keywords
pattern
character
recognition
patterns
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4095186A
Other languages
English (en)
Other versions
JPH05108887A (ja
Inventor
浩道 藤沢
康明 中野
仁 小松
彰三 門田
清道 栗野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4095186A priority Critical patent/JPH0792818B2/ja
Publication of JPH05108887A publication Critical patent/JPH05108887A/ja
Publication of JPH0792818B2 publication Critical patent/JPH0792818B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は光学文字読取り装置(以
下、「OCR」という)におけるパターン切出しおよび認
識方法とそのシステムに関し、特に自然な筆記条件で書
かれた帳票上等のパターンを切出し、それを認識するに
好適なパターン切出しおよび認識方法とそのシステムに
関する。
【0002】
【従来の技術】従来、上記OCRに読込ませる文字は、
図1(a)に示す如く、文字毎に設定された文字枠11内
に正しく筆記する必要があった。その場合、多少の枠か
らのはみ出しは許容されるが、その程度は、図1(b)に
示す如く、上下方向については1.0〜1.5mm程度、左
右方向については隣の枠に入らない程度であった。とこ
ろで、OCRを更に普及させるためには、上述の如く、
OCR独特な文字枠内に文字,数字等を筆記させること
なく、図2(a)または(b)に示す如く、文字枠にあまり
こだわらず、通常、我々が筆記しているような、自然な
筆記条件を可能にすることが必要である。図1と図2を
比較すれば明らかな如く、従来の文字枠は、寸法が大き
いとともに、文字枠間ギャップ5が0.5〜1.0mmであ
るのに対して、条件の緩和された文字枠は、図2中の1
2,13に示される如く、寸法が小さくなるとともに、
文字枠間ギャップ6,7が0mmとなっている。
【0003】
【発明が解決しようとする課題】この結果として、文字
の、枠12,13からのはみ出しが大きくなり、また、
文字相互が縦方向にオーバラップしたり、あるいは、文
字相互が接触し易くなるという問題が生ずることにな
る。更に、文字パターン成分が分離しているような場
合、例えば、図2(a)または(b)における数字「5」等で
は、その成分の大部分が隣の枠に入ることがあり、文字
読取り上、困難な問題を惹き起こしている。このような
場合、従来の技術では、文字を正しく切出したり、正し
く読取ることができなかった。本発明は上記事情に鑑み
てなされたもので、その目的とするところは、従来の技
術における上述の如き問題を解消し、文字枠から大きく
はみ出したり、隣接文字と接触しているような、自然な
筆記条件で書かれた文字について、特に、入力された1
単位映像パターンが1カテゴリを表わすパターンの一部
分であると判断された場合に、複数の部分パターンを組
み合せて1文字とし、該組み合せた文字について文字認
識を行うことが可能なパターン切出しおよび認識方法と
そのシステムを提供することにある。
【0004】
【課題を解決するための手段】本発明の上述の目的は、
1文字単位の文字枠を有しない帳票を入力して、電気的
信号に変換された前記帳票上の2次元映像パターンから
単位映像パターンごとに分離して切出すステップと、前
記切出された単位映像パターンを1つの単位映像パター
ンまたは複数の単位映像パターンの組み合せである認識
対象映像パターンに区分して、該認識対象映像パターン
のそれぞれをパターン辞書内の各パターンと比較して、
前記単位映像パターンに該当する文字パターンを認識す
るステップと、前記認識対象映像パターンについて得ら
れた認識結果を、隣接する認識対象映像パターンの認識
結果を参照して、予め定められた書換え規則に従って書
換えるステップとを有し、前記帳票上の2次元映像パタ
ーン中に含まれる文字列パターンを総合的に判断する
とを特徴とするパターン切出しおよび認識方法とそのシ
ステムによって達成される。
【0005】
【作用】本発明に係るパターン切出しおよび認識方法
そのシステムにおいては、文字読取り装置におけるパタ
ーン切出し処理において、切出されたパターン(これを
単位映像パターン と呼ぶ)を1つ以上組み合せた、実
際に認識対象となる映像パターン(これを 認識対象映像
パターン と呼ぶ)が、完全なパターンでなく、一つの文
字の一部分(部分パターン)であると判断された場合に、
その認識結果を、隣接する認識対象映像パターンの認識
結果を参照して、予め定められた書換え規則に従って書
換えることにより、総合的に判断するようにしたことに
より、自然な筆記条件で書かれた文字についての文字認
識の精度を向上させることが可能となるという効果が得
られるものである。
【0006】
【実施例】以下、本発明の原理について若干の説明を行
った後、実施例を図面に基づいて詳細に説明する。本発
明の原理は、次の2点にある。すなわち、 (1)パターンの切出しにおいて、曖昧性が生じた場合に
は、切出し部は、無理に判断をすることなく、複数の仮
説を立てて、各々の仮説による部分パターンを含む単位
パターンを認識部に送る。 (2)認識部では、上述の単位パターンの識別を行い、総
合的な判断から切出しの妥当性のチェックを行い、曖昧
性を解消する。 以下、これについて、より具体的に説明する。図3は、
隣接文字パターンの種々の状態を示す図である。図3
(a)では、パターン31と32とが、縦方向にオーバラ
ップしている。この場合には、連続した黒領域をパター
ン成分として切出すことができる。連続した黒領域をパ
ターン成分として抽出する方法は、従来から良く知られ
ており、枠内に正しく文字が書かれている場合は勿論の
こと、単純にオーバラップしている場合でも、黒領域に
沿って枠外にはみ出している部分まで抽出できるので、
単位パターンを、正しく切出すことができる。なお、こ
れについては、例えば、A.Rosenfeld et.al.,“Sequ
ential Operations in Digital PictureProcessin
g”(J.ACM,vol.14,No.4,Oct.,1966,pp.471-494)
の記載を参考にすることができる。
【0007】次に、図3(b)では、パターンが部分33
と34に分離していて、分離した成分34の大部分が隣
接の枠に入っている。パターン34が枠21に属するの
か、枠22に属するのか不明な場合は、双方を「あり得
るケース」として多重の仮説を作る。そして、双方のケ
ースを別個に認識部に送って、その認識結果から、どち
らの仮説が正しかったかを決定する。図3(c)は、分離
文字パターンが接触しているケース、図3(d)は、分離
パターン相互で接触しているケースである。図3(c)の
場合は、分離パターンが数字「5」のみであるのに対し
て、図3(d)の場合は、数字「5」と「7」の両方が分離パ
ターンであり、それらが接触している。図3(e)は、完
全なパターン相互が接触したケースである。つまり、分
離していないパターンであるが、隣接パターンが接触し
ている場合である。図3(b)〜(e)のケースに対する認
識方法を、以下、図4〜図7に基づいて説明する。図4
は、切出し部が複数の仮説を立てた場合の動作説明図で
あり、図3(b)に示した如き、分離したパターン成分3
4が、隣接枠に入っている場合の認識方法を説明してい
る。
【0008】図4において、51,53は切出し部が出
力した2つの仮説、また、200は認識部、100はパ
ターン辞書、101〜104は該パターン辞書100内
の部分辞書を示している。認識部200は上述の2つの
仮説51,53を入力して文字認識を行い、それぞれに
対する認識結果52,54を出力する。すなわち、第1
の仮説51に対する認識結果は(SP.5)と(RJ.6)で
ある。ここで、(SP.5)は、「5のサブパターン」を意
味しており、部分辞書101を参照して認識されたも
の、また、(RJ.6)は、「リジェクト(不読)であるが、
候補は6である」を意味している。更に、第2の仮説5
3に対する認識結果は、(AC.5)と(AC.6)であり、
いずれも、数字「5」あるいは「6」として受容したことを
意味している。従って、第2の仮説が妥当であり、認識
結果は、数字「5」,「6」となる。なお、上述のパターン
辞書100に設けられる部分辞書101〜103は、本
発明において新たに設けられたものであり、従来は、正
常なパターンの辞書104のみが設けられていたもので
ある。
【0009】上述の部分辞書101は、部分パターン格
納している辞書であり、部分辞書102は、部分パター
ンと他の文字とが接触したパターンを格納している辞
書、部分辞書103は、接触文字パターンを格納してい
る辞書である。次に、図3(c)に示した如き、分離パタ
ーン成分が隣接文字に接触している場合の認識方法を、
図5に基づいて説明する。この場合、図5に示す如く、
切出し結果は55のようになり、認識結果56は(SP.
5)と(SC.5,6)となる。ここで、(SC.5,6)は
数字「5」の部分パターンと数字6が接触したものである
ことを意味しており、前述の部分辞書102を参照して
認識されたものである。この結果から、読取り文字は、
数字の「5」と「6」であることが判断できる。次に、図3
(d)に示した如き、分離パターン成分相互で接触してい
る場合の認識方法を、図6に基づいて説明する。この場
合には、図6(a)に示す如く、2つの仮説57,59が
立ち、認識結果58,60が得られる。また、この場合
には、図6(b)に示す如く、特にサブパターン61、す
なわち、図3(d)の38を単独で認識して、その結果と
して認識結果62の(SS.5,7)が得られる。
【0010】上述の仮説57は、サブパターン38が右
側に付加されたものと仮定した場合であり、仮説59
は、サブパターン38が左側に付加されたものと仮定し
た場合である。また、認識結果58の(SP.5)と(R
J.?)は、「5のサブパターン」と「リジェクト(全く不
明)」であり、同様に、認識結果60の(RJ.?)と(S
P.7)は、「リジェクト(全く不明)」と「7のサブパター
ン」である。また、認識結果62の(SS.5,7)は「数
字5のサブパターンと数字7のサブパターンの接触した
パターン」であることを 意味している。これらは、部分
パターンと他の文字とが接触したパターンの部分辞書1
02を参照して得られるものである。これらの結果を総
合することにより、答は数字「5」と「7」であると判断さ
れることになる。次に、図3(e)に示した如き、完全な
パターン相互が接触している場合の認識方法を、図7に
基づいて説明する。この場合には、図7に示す如く、無
理に分割せずに、全体を認識部に送り、部分辞書103
を参照して同じものを探し、認識する。ここでは、その
結果として(CC.5,6)が得られているが、これは 数
字「5」と「6」が接触したものであることを意味してい
る。
【0011】以上、説明した如く、本発明においては、
認識結果を総合して最終的な答を出すことが特徴であ
る。なお、実際には、例えば、以下の如き規則に従って
処理することにより、実現される。図3(a)〜(e)に対
して行った処理を整理すると、以下のようになる。 (a) (AC.5)(AC.6) → (AC.5)(AC.6) (b) (SP.5)(RJ.6) (AC.5)(AC.6) → (AC.5)(AC.6) (c) (SP.5)(SC.5,6) → (AC.5)(AC.6) (d) (SP.5)(RJ.?) (RJ.?)(SP.7) (SS.5,7) → (AC.5)(AC.7) (e) (CC.5,6) → (AC.5)(AC.6) 上の各式の左辺の仮説毎の認識結果コードは、右辺の如
き認識結果コードに書換えがなされる。これらを一般化
したものを、書換え規則(Rewriting Rules)と呼ぶこ
とにする。
【0012】本実施例に示す切出し方法では、書換え規
則が以下のようになる。
【外1】 規則R1は、7頁に示した(a)と(b)に対応するもの
で、a,bをアクセプト(認識)していない場所があって
も、他に1つでもアクセプトした場所があれば、認識で
きたことにするというものである。
【0013】規則R2は、同(c)に対応するもので、a
のサブパターンが認識される一方、aのサブパターンと
bのパターンとの接触が認識された場合には、aとbが
認識できたことにするというものである。規則R3は、
同(d)に対応するもので、aのサブパターンが認識さ
れ、アクセプト以外の例えばリジェクトで任意の値の候
補が与えられる一方、bのサブパターンが認識され、ア
クセプト以外の任意の値の候補が与えれた場合には、分
離されているサブパターンのみを認識してみることを指
示するものである。また、規則R4も、同(d)に対応す
るものであり、規則R3によって処理されたサブパター
ンのみの認識結果を含めて、総合的に認識する場合を示
している。すなわち、aのサブパターンと認識できない
パターン,bのサブパターンと認識できないパターンお
よびaのサブパターンとbのサブパターンとの接触した
パターンの3つが認識された場合には、総合的認識によ
り、aアクセプト,bアクセプトとなるというものであ
る。規則R5は、同(e)に対応するもので、aとbの接
触したパターンは、aアクセプト,bアクセプトとなる
というものである。
【0014】図8に、本発明の一実施例である文字読取
り装置のブロック図を示す。本実施例に示す文字読取り
装置は、パターン観測部800,パターン切出し部90
0,帳票フォーマット辞書950,パターン認識部20
0,パターン辞書100,認識結果最終判定部400お
よび認識結果書換え規則辞書300から構成されてい
る。以下、本装置の動作を説明する。読取りの対象であ
る帳票75には、図2に示した如き、自然な筆記条件で
文字が記入されている。帳票75がパターン観測部80
0に入力され、光電変換および前処理(2値化,帳票ス
キュー補正)を受けると、2次元映像パターンが電気的
信号としてパターン切出し部900に送出される。パタ
ーン切出し部900では、帳票フォーマット辞書950
からの枠位置パラメータを参照して、1枚の帳票の映像
から1文字に該当すると判断されるパターンを1組ずつ
切出して、パターン認識部200に送出する。パターン
認識部200では、入力された1文字分のパターンと、
図4にその内容を例示したパターン辞書100に記憶さ
れている各パターンとを比較照合し、認識結果を認識結
果最終判定部400に送出する。
【0015】なお、パターン認識部200での処理に
は、前述の如く、サブパターンや接触した2文字分のパ
ターンをも含んでいることは言うまでもない。また、本
実施例においては、パターン認識部200からの認識結
果の出力は、入力されたパターン毎に認識結果を記号化
して、認識結果最終判定部400に送出する。認識結果
最終判定部400は、受取った認識結果に対して、前述
の認識結果書換え辞書300中の各書換え規則を、適用
できる書換え規則がなくなるまで順次適用して、書換え
処理を行う。すなわち、前述の書換え規則R1〜R5の
条件の中から、上述の記号化された認識結果がこれに合
致するものを選択・適用し、その結果を採用する。上述
のパターン切出し部900以降の処理を、以下、更に詳
細に説明する。図9に、上述の切出し処理および認識処
理のフローチャートと、これに対応するデータの内容を
例示する。ステップ 701では、帳票1枚分の映像パター
ン711から、1行分の映像パターン712を切出す。
ステップ 702では、黒地パターンの連続性を利用して、
黒地毎のぱターン成分を抽出し、横方向に関して順序付
けを行った後、成分リスト713を作成する。
【0016】更に、各成分の属性を計算し、成分属性リ
スト714を作成する。なお、ここで、成分の属性と
は、各成分の上下端,左右端の座標,輪郭総長等であ
る。次に、ステップ 703では、上で作成した成分属性リ
スト714と、帳票フォーマット辞書950の情報か
ら、文字間の境界の仮説を立て、文字リスト715を作
成する。この文字リスト715は、各文字パターンが、
どの成分から構成されているかを示すもので、図9で
は、第1の仮説では順序1,2,3でそれぞれ1つの文
字、4と5を合せて1つの文字と仮定し、第2の仮説で
は、順序1と2を合せて1つの文字、3だけで1つの文
字、4と5を合せて1つの文字と仮定する例を示してい
る。以上は、パターン切出し部900の処理である。ス
テップ 704は、パターン認識部200の処理である。ス
テップ 704では、上述の成分リスト713,成分属性リ
スト714および文字リスト715を入力して、文字リ
スト715に示される成分を集めてパターン整合を行
い、その結果を結果リスト716に書込む。
【0017】整合結果を表わす結果コードは、前述の
(SP.a),(SC.a,b),(SS.a,b),(CC.a,
b),(AC.a),(RJ.a)等の記号形式をとる。これら
の意味は、前述の通り、それぞれ、「カテゴリaのサブ
パターン」,「カテゴリaのサブパターンとカテゴリbの
接触したもの」,「カテゴリaとカテゴリbのサブパター
ンが 相互に接触したもの」,「カテゴリaとカテゴリbが
相互に接触したもの」,「カテゴリaのパターン」,「候補は
aであるがリジェクト」である。ステップ 705は、認識
結果最終判定部400の処理である。ここでは、上述の
結果リスト716に対して、書換え規則辞書300内の
すべての規則を参照し、適用できる規則がなくなるまで
順次適用し、最終的に得られた結果に応じた処理を行
う。また、ステップ 706では、帳票75上のすべての行
についての処理が終了したか否かを判断し、終了してい
なければステップ 701に戻って、終了するまで上述の処
理を繰り返し行う。
【0018】上記実施例によれば、前記認識部で、例え
ば、入力された1単位映像パターンが1カテゴリを表わ
すパターンの一部分であると判断した場合には、複数の
部分パターンを組み合せて1文字とし、該組み合せた文
字について文字認識を行うことが可能になり、文字読取
り装置における、自然な筆記条件で書かれた文字の読取
り精度が向上するという効果が得られる。なお、上記実
施例は本発明の一例を示すものであり、本発明はこれに
限定されるべきものではないことは言うまでもないこと
である。
【0019】
【発明の効果】以上、詳細に述べた如く、本発明によれ
ば、文字枠から大きくはみ出したり、隣接文字と接触し
ているような、自然な筆記条件で書かれた文字につき、
特に、入力された1単位映像パターンが1カテゴリを表
わすパターンの一部分であると判断された場合に、複数
の部分パターンを組み合せて1文字とし、該組み合せた
文字について文字認識を行うことが可能なパターン切出
しおよび認識方法とそのシステムを実現できるという顕
著な効果を奏するものである。
【0020】
【図面の簡単な説明】
【図1】従来のOCR用帳票の文字枠と筆記文字の例を
示す図である。
【図2】筆記条件を緩和した場合の、従来のOCR用帳
票の文字枠と筆記文字の例を示す図である。
【図3】隣接文字パターンの種々の状態を例示する図で
ある。
【図4】本発明の原理を説明する図(その1)である。
【図5】本発明の原理を説明する図(その2)である。
【図6】本発明の原理を説明する図(その3)である。
【図7】本発明の原理を説明する図(その4)である。
【図8】本発明の一実施例である文字読取り装置のブロ
ック図である。
【図9】実施例に係る文字読取り装置における、切出し
処理および認識処理のフローチャートとこれに対応する
データの内容を例示する図である。
【符号の説明】
75:読取り対象である帳票、100:パターン辞書、
101〜103:部分辞書、104:正常パターン辞
書、200:パターン認識部、300:認識結果書換え
規則辞書、400:認識結果最終判定部、800:パタ
ーン観測部、900:パターン切出し部、950:帳票
フォーマット辞書。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 門田 彰三 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 栗野 清道 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (56)参考文献 特開 昭59−91582(JP,A) 特開 昭58−165179(JP,A)

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 1文字単位の文字枠を有しない帳票を入
    力して、電気的信号に変換された前記帳票上の2次元映
    像パターンから単位映像パターンごとに分離して切出す
    ステップと、前記切出された単位映像パターンを1つの
    単位映像パターンまたは複数の単位映像パターンの組み
    合せである認識対象映像パターンに区分して、該認識対
    象映像パターンのそれぞれをパターン辞書内の各パター
    ンと比較して、前記単位映像パターンに該当する文字パ
    ターンを認識するステップと、前記認識対象映像パター
    ンについて得られた認識結果を、隣接する認識対象映像
    パターンの認識結果を参照して、予め定められた書換え
    規則に従って書換えるステップとを有し、前記帳票上の
    2次元映像パターン中に含まれる文字列パターンを総合
    的に判断することを特徴とするパターン切出しおよび認
    識方法。
  2. 【請求項2】 前記認識結果は、前記認識対象映像パタ
    ーンに該当すると認識された文字パターンを表わす文字
    パターン(カテゴリ)名と、前記認識対象映像パターンが
    文字パターンの完全なパターンであるか、または、文字
    パターンの部分パターンであるかを示す情報とを含むも
    のであることを特徴とする請求項1記載のパターン切出
    しおよび認識方法。
  3. 【請求項3】 前記ステップに加えて、前記書換え規則
    に従って書換えられた認識対象映像パターンが、なお、
    文字パターンの部分パターンであると判断される場合に
    は、当該認識対象映像パターンを含む複数の単位映像パ
    ターンの組み合せについて、再度、パターン辞書内の各
    パターンとの比較を行い、前記複数の単位映像パターン
    の組み合せに該当する文字パターンについての認識を行
    うステップを有することを特徴とする請求項1または2
    記載のパターン切出しおよび認識方法。
  4. 【請求項4】 前記切出された単位映像パターンを1つ
    の単位映像パターンまたは複数の単位映像パターンの組
    み合せである認識対象映像パターンに区分する際に、そ
    の区切りに曖昧性がある場合には、前記単位映像パター
    ン間の境界に複数の仮説を作成し、該複数の仮説のそれ
    ぞれに対応した区分を行って得られた認識対象映像パタ
    ーンについて認識処理を行い、最終的に、前記複数の仮
    説のうちから単一の仮説を選択することを特徴とする請
    求項1から3のいずれかに記載のパ ターン切出しおよび
    認識方法。
  5. 【請求項5】 前記帳票上の2次元映像パターンから単
    位映像パターンごとに分離して切出すステップにおい
    て、前記帳票上の2次元映像パターンから1文字行分の
    2次元映像パターンを一括して切出し、前記単位映像パ
    ターンとして、前記切出された1文字行分の2次元映像
    パターンから連続した黒画素領域を抽出することを特徴
    とする請求項1から4のいずれかに記載のパターン切出
    しおよび認識方法。
  6. 【請求項6】 前記パターン辞書は、1つの文字パター
    ンを構成する完全パターンとともに、前記文字パターン
    の一部分を構成する部分パターンおよび前記文字パター
    ンと他の文字パターンとが接触した接触パターンを記憶
    することを特徴とする請求項1から5のいずれかに記載
    のパターン切出しおよび認識方法。
  7. 【請求項7】 1文字単位の文字枠を有しない帳票を入
    力し、電気的信号に変換された2次元映像パターンから
    単位映像パターンを得る入力手段と、該入力手段により
    得た前記帳票上の2次元映像パターンから、1つの単位
    映像パターンまたは複数の単位映像パターンの組み合せ
    である認識対象映像パターンを切出すパターン切出し手
    段と、該パターン切出し手段により切出された認識対象
    映像パターンのそれぞれをパターン辞書内の各パターン
    と比較して、前記単位映像パターンに該当する文字パタ
    ーンを認識するパターン認識手段と、該パターン認識手
    段により前記認識対象映像パターンのそれぞれについて
    得られた認識結果を、隣接する単位映像パターンの認識
    結果を参照して、予め定められた書換え規則に従って書
    換えることにより、前記帳票上の2次元映像パターン中
    に含まれる文字列パターンを総合的に判断する総合判定
    手段とを有することを特徴とするパターン切出しおよび
    認識システム。
  8. 【請求項8】 前記パターン認識手段は、前記認識対象
    映像パターンに該当すると認識された文字パターンを表
    わす文字パターン(カテゴリ)名と、前記認識対象映像パ
    ターンが文字パターンの完全なパターンであるか、また
    は、文字パターンの部分パターンであるかを示す情報と
    を出力することを特徴とする請求項7記載のパターン切
    出しおよび認識システム。
  9. 【請求項9】 前記総合判定手段は、前記書換え規則に
    従って書換えられた認識対象映像パターンの認識結果
    が、なお、文字パターンの部分パターンであると判断さ
    れる場合には、当該認識対象映像パターンを含む複数の
    単位映像パターンの組み合せについて、再度、パターン
    辞書内の各パターンとの比較を行い、前記複数の単位映
    像パターンの組み合せに該当する文字パターンについて
    の認識を行うことを特徴とする請求項7または8記載の
    パターン切出しおよび認識システム。
  10. 【請求項10】 前記パターン切出し手段は、前記認識
    対象映像パターンの切出しにおいて、1つの文字パター
    ンを構成する認識対象映像パターンの区切りに曖昧性が
    ある場合には、前記単位映像パターン間の境界に複数の
    仮説を作成し、前記パターン認識手段は、前記複数の仮
    説のそれぞれに対応する前記認識対象映像パターンにつ
    いて認識処理を行い、前記総合判定手段は、前記複数の
    仮説のうちから最終的に単一の仮説を選択することを特
    徴とする請求項7から9のいずれかに記載のパターン切
    出しおよび認識システム。
  11. 【請求項11】 前記パターン辞書は、1つの文字パタ
    ーンを構成する完全パターンとともに、文字パターンの
    一部分を構成する部分パターンおよび1つの文字パター
    ンと他の文字パターンの接触した接触パターンを記憶す
    ることを特徴とする請求項7から10のいずれかに記載
    のパターン切出しおよび認識システム。
JP4095186A 1992-04-15 1992-04-15 パターン切出しおよび認識方法とそのシステム Expired - Lifetime JPH0792818B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4095186A JPH0792818B2 (ja) 1992-04-15 1992-04-15 パターン切出しおよび認識方法とそのシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4095186A JPH0792818B2 (ja) 1992-04-15 1992-04-15 パターン切出しおよび認識方法とそのシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP57208300A Division JPS5998283A (ja) 1982-11-27 1982-11-27 パターン切出しおよび認識方法、ならびにそのシステム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP6192419A Division JPH0792819B2 (ja) 1994-08-16 1994-08-16 パターン切出しおよび認識方法とそのシステム

Publications (2)

Publication Number Publication Date
JPH05108887A JPH05108887A (ja) 1993-04-30
JPH0792818B2 true JPH0792818B2 (ja) 1995-10-09

Family

ID=14130726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4095186A Expired - Lifetime JPH0792818B2 (ja) 1992-04-15 1992-04-15 パターン切出しおよび認識方法とそのシステム

Country Status (1)

Country Link
JP (1) JPH0792818B2 (ja)

Also Published As

Publication number Publication date
JPH05108887A (ja) 1993-04-30

Similar Documents

Publication Publication Date Title
JPH055146B2 (ja)
US6006240A (en) Cell identification in table analysis
EP0063454B1 (en) Method for recognizing machine encoded characters
JPH0467234B2 (ja)
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
JPH0792818B2 (ja) パターン切出しおよび認識方法とそのシステム
Hanmandlu et al. Segmentation of handwritten Hindi text: A structural approach
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2917427B2 (ja) 図面読取装置
JPH0792819B2 (ja) パターン切出しおよび認識方法とそのシステム
JP2675303B2 (ja) 文字認識方法
JP2550012B2 (ja) パタ−ン切り出し及び認識方法
JPH0581474A (ja) 文字列抽出方法および文字領域検出方法
JPH0728935A (ja) 文書画像処理装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPS61220081A (ja) パタ−ン切り出し及び認識方式
JPH0785221A (ja) 図面自動認識装置の文字とシンボルの分離・認識方法
JP2000207491A (ja) 文字列読取方法及び装置
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
Hashemi et al. The effects of image enhancement in OCR systems: a prototype
JPH02166583A (ja) 文字認識装置
JP3377719B2 (ja) 文字認識装置及びコンピュータ読み取り可能な記録媒体
JP3030814B2 (ja) ノイズ成分除去方法及びノイズ成分除去プログラムを記録した記録媒体