JPH04109381A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH04109381A
JPH04109381A JP2228661A JP22866190A JPH04109381A JP H04109381 A JPH04109381 A JP H04109381A JP 2228661 A JP2228661 A JP 2228661A JP 22866190 A JP22866190 A JP 22866190A JP H04109381 A JPH04109381 A JP H04109381A
Authority
JP
Japan
Prior art keywords
character
recognition
cutting
pattern
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2228661A
Other languages
English (en)
Other versions
JP2925270B2 (ja
Inventor
Kenji Mishima
三縞 健司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2228661A priority Critical patent/JP2925270B2/ja
Publication of JPH04109381A publication Critical patent/JPH04109381A/ja
Application granted granted Critical
Publication of JP2925270B2 publication Critical patent/JP2925270B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は、用紙に記録された文字等の読取りを行なう文
字読取装置に関する。
(従来の技術) 一般に、用紙に記録された文字等の読取りを行なう文字
読取装置は、用紙に予め印刷された文字等の記入位置を
示す記入枠内のイメージパターンを切出し認、識処理を
行なっている。例えば、スキャナ装置によって検出され
た用紙全体のイメージから、各文字等のイメージパター
ンの文字切出し位置を決定し、1文字分毎にイメージパ
ターン切出すものである。こうして切出されたイメージ
パターンは、標準パターンとのマツチングが行なわれ(
認識処理)、認識結果が決定される。
さらに、近年では、認識処理の結果について、前後の文
字を含めた例えば単語単位で知識処理を行なうことによ
って、より認識率を向上させる方法かとられている。
ところで、予め用紙に文字証人位置を位置を示す記入枠
を印刷するのは、確実に1文字毎の文字パターンの切出
しを行なうことかできるようにするためである。しかし
なから、保険、銀行業務等こおいて文字読取装置を用い
る場合、用紙に対する文字等の記入は、一般の人によっ
て行なわれる場合か多い。このため、記入枠内に正確に
記入されずに、例えば記入枠をはみ出して周囲の文字等
(他にもノイズ等の場合もある)と接触や近接した状態
で記入される場合かある。このような場合、文字切出し
位置が一意に決定できず、認謡処理によって正しい認識
結果が得られないものとして切出しリジェクト(読取り
拒否)となっている。さらに、切出しリジェクトの場合
、認識処理に後続して実行される知識処理も機能しない
ようになっている。
(発明が解決しようとする課題) このように、認識しようとしている文字の文字パターン
が、周囲の文字、ノイズ等と接触、または近接している
ために、文字切出し位置を一意に決定できない場合には
、切出しリジェクトとなっていた。さらに、知識処理か
機能しないために、認識率の低下を招いてしまうという
問題があった。
本発明は前記のような点に鑑みてなされたもので、文字
パターンか周囲の文字等と接触、近接している場合であ
っても、正確な文字読取結果を得ることか可能な文字読
取装置を提供することを目的とする。
[発明の構成] (課題を解決するだめの手段) 本発明は、用紙に記録された文字等の読取りを、前記用
紙から検出したイメージパターンをもとに行なう文字読
取装置において、イメージパターンから複数の切出し位
置候補に基づいて文字パターンの切出しを行なう文字切
出し手段と、前記文字切出し手段によって切出された各
文字パターンについて文字認識処理を行なう文字読取処
理手段と、前記切出し位置候補に対応する複数の前記文
字認識処理の結果について所定順に認識順位を編集する
編集手段とを備えており、編集手段によって編集された
認識順位に基づいて知識処理を行なうように構成するも
のである。
(作用) このような構成によれば、複数の切圧し位置候補に基づ
いて文字パターンの切出しか行われ、文字認識処理か実
行される。従って、隣接する文字か接触等しているため
に誤認識され易い場合であっても、複数の認識結果か得
られ、所定順に認識順位が編集されて知識処理に供され
る。この結果、正確な文字読取結果が得られ認識率が向
上する。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる文字読取装置の構成を示すブロ
ック図である。第1図において、10はスキャナ部であ
り、読取り処理の対象とする用紙について光学的走査を
行なうことによって用紙全体のイメージ検出を行なうも
のである。12はイメージ格納部てあり、スキャナ部1
0において検出された用紙全体のイメージを格納するた
めのものである。14は文字切出し部であり、イメージ
格納部12に格納された全体のイメージから、1文字毎
の文字パターンの切出しを行なうものである。
文字切出し部14は、文字記入枠の位置の他に、後述す
る文字認識部16による認識結果に応じて文字切出し位
置(切出し位置候補)を変更して、繰り返して文字パタ
ーン切出しを行なうことができる。
16は文字認識部であり、文字切出し部14において切
出された文字パターンについて、予め設定された標準パ
ターンとのマツチングを行なうことによって、認識結果
を決定するものである。18は編集部であり、文字切出
し部14における文字パターンの切出しか良好でない場
合(文字パターンが接触等している場合)に、繰り返し
て行なわれる認識処理の結果を、所定の順番に編集する
ものである。
20は知識処理部であり、編集部18によって編集され
た認識結果について順番に知識処理を施し、読取結果を
出力するものである。
次に、同実施例の動作について説明する。
ます、スキャナ部IOは、文字読取処理の対象とする用
紙について光学的走査を行ない、用紙全体のイメージの
検出を行なう。スキャナ部10によって検出された用紙
全体のイメージは、イメージ格納部12に格納される。
イメージ格納部12に1枚分のイメージか格納されると
、文字切出し部14は、このイメージから文字記入性の
切出しを行ない、さらに各行について1文字毎に文字パ
ターンの切出しを行なう。
以下、第2図に示すフローチャートを参照しながら説明
する。
文字切出し部14は、文字記入性の切出しを行なうと、
次に文字パターンの切出しを行なう。ここで、第3図に
示す゛イメージパターンを例にして説明する。まず、文
字切出し部14は、第3図中Aて示す予め設定されてい
る文字記入枠の位置において第1回の文字パターンの切
出しを行なう(ステップSl)。なお、図中Bて示す文
字記入枠は、通常用紙にドロップアウトカラーによって
印刷されるので、イメージ格納部12には枠イメージは
格納されない。第3図では、枠位置を示すものとする。
切出された文字パターンは、文学誌1部16に転送され
る。この場合、第4図(a)(b)にかすような、2つ
の文字パターンか切出される。文字認識部16は、文字
切出し部14から転送された文字パターンについて認識
処理を実行する(ステップS2)。この結果、第1文字
、第2の文字のそれぞれに、第5図に示すような認識結
果か得られたものとする。すなわち、第1文字の第1位
「川−:、第2位「ル」、第2文字の第1位「越」、第
2位「超」である。同実施例では、マツチングによって
得られる類似度値の順に第2位までの候補を決定するも
のとする。文字認識処理によって得られた候補は、編集
部18に転送される。なお、第1回の文字切出しによっ
て得られた認識結果を、認識結果〕とする。
ここで、文字切出し部14は、文字切°出しの対象とす
るイメージについて、第3図に示すような縦射影(y方
向)をとり、この射影から文字記入枠の位置(図中Aの
位置)の前後で文字パターンか接続しているか否かを判
別する(ステ・ノブS3)。
この結果、文字パターンか接続していないと判別された
場合には、この旨か編集部18に通知され、第5図に示
す認識結果1か知識処理部20に転送される。
一方、ステップS3において、文字パターンが接続して
いると判別された際には、文字切出し部14は、文字枠
(図中A)に最も近い縦射影のゼロ点で第2回の文字切
出しを行なう(ステップS5)  ここでは、第3図中
Cで示す位置において文字切出しが行なわれる。この場
合、第6図(a)(b)に示すような、2つの文字パタ
ーンが切り出され、文字認識部16に転送される。文字
認識部16は、文字切出し部14から転送された文字パ
ターンについて認識処理を実行する(ステップS6)。
この結果、第1文字、第2の文字のそれぞれに、第7図
に示すような認識結果が得られたものとする。すなわち
、第1文字の第1位「ハ」、第2位「す」、第2文字の
第1位「殿」、第2位「越」である。文字認識処理によ
って得られた候補は、編集部18に転送される。なお、
第2回の文字切出しによって得られた認識結果を、認識
結果2とする。
次に、編集部18は、文字認識部16から転送された認
識結果1,2について編集処理を行なう(ステップS7
)。ここでは、単純に上位から順、すなわち認識結果1
の第1位候補、認識結果2の第1位候補、認識結果1の
第2位候補、認識結果2の第2候補の順に編集するもの
とする。この結果、第8図に示すような編集結果を得る
ことかできる。
編集部18は、この編集結果を知識処理部20に転送す
る。
知識処理部20ては、編集部18から転送された第4位
までの候補の組み合わせによって得られる単語と、予め
設定された知識ベースに基づいて知識処理を行ない、文
字読取り結果を決定する(ステップS8)。
このようにして、複数箇所(前記実施例では2か所)で
文字切出しを行ない、それぞれにおいて得られる文字パ
ターンについて文字認識処理を行ない、その結果をもと
にして知識処理か実行される。二のため、認識対象とす
る文字か周囲の文字に接触している場合であっても、文
字認識処理、さらに知識処理か実行されることにより、
正確な文字読取結果を得ることが可能となる。
なお、前記実施例における文字切出し部14は、特徴量
として縦射影に基づき、X軸に垂直な直線によって文字
パターンを切出すものとしたか、例えばラベリング法に
よって行なうこともてきる。
なお、ラベリング法は、連続するイメージ(黒ドツト)
のそれぞれに対してラベルを付し、ラベルを付された適
当なイメージの集合によって文字パターンを分類して切
出すものである。これによれば、例えば第°9図に示す
ように、隣接する文字が互いに文字記入枠をはみ出して
いるような場合であっても、図中破線で示すような曲線
によって文字パターンを切出すので、確実に文字パター
ンを分離することかできる。なお、この際に、文字記入
枠に最も近い曲線によって文字切出しを行なうようにす
ることもできる。
また、前記実施例における文字切出し位置候補は、文字
記入枠位置と文字枠に最も近い縦射影の上口点位置の2
か所としているが、その候補数は限定されず、3か所以
上としても良い。文字の両側に複数の切出し候補(例え
ば縦射影の上口点位置)かある場合には、それらの組み
合わせて文字パターンの切出しを行なうこともてきる。
また、編集部18における編集規則は、単純に上位から
順としているが、認識処理の結果得られる類似度値をも
とにして行なっても良い。
さらに、編集部)8から知識処理部20に転送される文
字認識候補数は、所定個数以下に制限しても良い。
[発明の効果コ 以上のように本発明によれば、複数の文字切出し位置候
補に基づいて文字切出しを行ない、それぞれにおいて得
られる文字パターンについて文字認識処理を行ない、そ
の結果をもとにして知識処理か実行される。このため、
認識対象とする文字か周囲の文字に接触し誤認識され易
い場合であっても、正確な文字読取結果を得ることが可
能となるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例の処理手順
を示すフローチャート、第3図は処理対象とするイメー
ジパターンの一例を示す図、第4図は第1回の文字切出
しによって得られた文字パターンの例を示す図、第5図
は第4図に示す文字パターンについて認識処理を行なっ
た結果得られた認識結果の一例を示す図、第6図は第2
回の文字切出しによって得られた文字パターンの例を示
す図、第7図は第6図に示す文字)イメージについて認
゛工処理を行なった結果得られた認識結果の一例を示す
図、第8図は編集処理の結果の一例を示す図、第9図は
文字パターン切出しの他の方法を説明するための図であ
る。 10・・・スキャナ部、12・・・イメージ格納部、1
4・・文字切出し部、16・・・文字認識部、18・・
・編集部、20・・・知識処理部。 出願人代理人 弁理士 鈴汀武彦 第2 図 (a) (b) 第6図 第8図 第4図 第7図 第9図 A 第3 図 第 図

Claims (1)

  1. 【特許請求の範囲】 用紙に記録された文字等の読取りを、前記用紙から検出
    したイメージパターンをもとに行なう文字読取装置にお
    いて、 前記イメージパターンから複数の切出し位置候補に基づ
    いて、文字パターンの切出しを行なう文字切出し手段と
    、 前記文字切出し手段によって切出された各文字パターン
    について、文字認識処理を行なう文字認識処理手段と、 前記切出し位置候補に対応する複数の前記文字認識処理
    の結果について、所定順に認識順位を編集する編集手段
    と、 を具備し、 前記編集手段によって編集された認識順位に基づいて知
    識処理を行なうこととを特徴とする文字読取装置。
JP2228661A 1990-08-30 1990-08-30 文字読取装置 Expired - Lifetime JP2925270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2228661A JP2925270B2 (ja) 1990-08-30 1990-08-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2228661A JP2925270B2 (ja) 1990-08-30 1990-08-30 文字読取装置

Publications (2)

Publication Number Publication Date
JPH04109381A true JPH04109381A (ja) 1992-04-10
JP2925270B2 JP2925270B2 (ja) 1999-07-28

Family

ID=16879833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2228661A Expired - Lifetime JP2925270B2 (ja) 1990-08-30 1990-08-30 文字読取装置

Country Status (1)

Country Link
JP (1) JP2925270B2 (ja)

Also Published As

Publication number Publication date
JP2925270B2 (ja) 1999-07-28

Similar Documents

Publication Publication Date Title
JP2925270B2 (ja) 文字読取装置
JPS6316795B2 (ja)
JP2877380B2 (ja) 光学的文字読取装置
JPH0728935A (ja) 文書画像処理装置
JP2909132B2 (ja) 光学的文字読取装置
JPS5972577A (ja) 図面読取装置
JPH0373916B2 (ja)
JP2570571B2 (ja) 光学文字読取装置
JP2539026B2 (ja) 文字切り出し装置
JPS62290984A (ja) パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
JPH0319589B2 (ja)
JP2784004B2 (ja) 文字認識装置
JP3334369B2 (ja) 選択項目認識装置
JPH0498586A (ja) 画像生成装置
JPS60179887A (ja) 文字読取装置
JPS61289479A (ja) 繋がり文字を読取る文字認識装置
JPH06301814A (ja) 文字読取装置
JPH05189599A (ja) 光学文字読取装置
JPH0443476A (ja) 文字認識装置
JPH08227440A (ja) 文書画像処理装置
JPH06251192A (ja) 光学的文字読み取り装置
JPH01270183A (ja) 文字認識装置
JPS62231389A (ja) 文字認識装置
JPS5914078A (ja) 帳票読取装置
JPH0652351A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090507

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090507

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100507

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100507

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110507

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110507

Year of fee payment: 12