JPS59112367A - 文字読取方式 - Google Patents

文字読取方式

Info

Publication number
JPS59112367A
JPS59112367A JP57222489A JP22248982A JPS59112367A JP S59112367 A JPS59112367 A JP S59112367A JP 57222489 A JP57222489 A JP 57222489A JP 22248982 A JP22248982 A JP 22248982A JP S59112367 A JPS59112367 A JP S59112367A
Authority
JP
Japan
Prior art keywords
character
turn
chisel
pattern
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57222489A
Other languages
English (en)
Other versions
JPH0210472B2 (ja
Inventor
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57222489A priority Critical patent/JPS59112367A/ja
Publication of JPS59112367A publication Critical patent/JPS59112367A/ja
Publication of JPH0210472B2 publication Critical patent/JPH0210472B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 定で々い文書の文字を精度よくかつ高速に読取ることの
できる文字読取方式に関するものである。
従来の文字読取装置では第1図に示すように走査・光電
変換した帳票上の文字・ξターンを信号入力端子1を介
してノミターンメモリ2に一旦格納し、該・ξターンメ
モリ2上の文字行に対し文字切出し部3により文字列の
先頭から予め定められた一定間隔で一文字ずつ切出し、
その文字ノミターンを識別部4へ転送してそれが何とい
う文字であるかを判定し,更にその識別結果を出力端子
5より出力するようになしていた。このため帳票」二の
文字ピッチが一定でないとまったく読取れないとーう欠
点があった。
また上記文字読取装置の文字切出しg++ :i K補
助識別部6を設け、幅の狭いパターンのみを該補助識別
部6にて一文字であるがあるいは文字の一部であるかを
判定し、一文字のパターンと判定された場合には該幅の
狭いパターンを一文字とみなして文字切出しを行ない、
また文字の一部と判定されれば次のノミターンに加えて
文字切出しを行なうようにして文字ピッチが一定で々−
帳票より文字を読取れるようにしたものは既に提案され
て層だ。
しかしながら上記装置では幅の狭いノミターンが他の文
字パターンと同様なパターンを成す(例えば横書きの帳
票において漢字「化」のようにその偏「イ」がカタカナ
の「イ」と同じ字形を成すような)場合や、文字に切れ
が生じて一文字が多くの,2ターンに分かれたり、連続
l2て書かれた2以−Lの文字が一文字として判定され
る場合等において十分な切出し精度を得ることが困難で
あった。捷だ補助識別部6が動作する場合は、その判定
結果が出されるまで文字切出[、部3の動作が停止する
ため読取速度が遅くなるという欠点があった。また、こ
の読取速度の低下は補助識別部6で対処しなければ々ら
ないノミターンが増える程、顕著になる欠点があった。
本発明は上記従来の欠点を除去するため、帳票上の文字
行におりで予め定められた一定区間内に複数のノミター
ンが存在する場合は該ノクターンを順次組合せて文字切
出しを行ない、それらをすべて文字識別し、その結果か
ら、より文字らしいものを選択するように々したもので
、その目的とするところは文字ピッチの一定でない帳票
等の文書の文字を精度よくかつ高速に読取ることのでき
る文字読取方式を提供することにある。以下図面につい
て詳細に説明する。
第3図乃至第8図は本発明の一実施例を示すもので、図
中、11は入力端子、12はノミターンメモl1、13
は文字切出し部、14は識別部、15は文字決定部、1
6は出力端子である。
これを動作するには、捷ず帳票上の文字を光電変換装置
(図示せず)によりパターンデータに変換l,、これを
入力端子11を介1,て・Qターンメモリ12に一旦蓄
える。文字切出1−7部13は該ノミターンメモリ12
より第4図に示すような一行分の文字を含む行パターン
20を切出1−、これを行方向(図中、矢印X方向)に
走査していき列方向(図中、矢印Y方向)に・ぐターン
の存在する部分を黒(2准将号では「1」)、存在しな
い部分を白(2准将号では「0」)で表示したデータ(
以下、これを点列データと称す。)30を取り出す。更
に該文字切出し部12は点列データ30に基づいて後述
する処理を実行し行ノぐターン20より個別ノミターン
21を切出し、個々の個別パターン21とその切出しに
関する情報とを一対の個別データとして識別部】4に順
次送出する。識別部14は上記個別データのうち個別ノ
ミターン21のみを順次文字識別し、その識別結果(例
えば文字コー¥)と上記切出しに関する情報とを一対の
データとして文字決定部15に順次送出する。文字決定
部15は該データに後述する処理を施こし正l〜い文字
の識別結果のみを出力端子I6よりllliQ次出力す
る。
文字切出し部】3における個別パターン21の切出しは
、点列データ30の先頭を開始点(以下、基準位置と称
す。)と17で予め設定された一定区間α内に存在する
黒の部分の集合(以下、これを点列の塊りと称す。)の
個数を調べ、−個の場合はその区間を一文字の個別ツク
ターンとみなし7、複数個存在する場合は連続する点列
の塊りを順次−個−Cつ増して組合わせた複数個のツク
ターンをそれぞれ一文字の個別ツクターンとみなすとと
もに該複数個の点列の塊りのうち先頭の塊りを除いた位
置を次の一定区間αの基準位置とする如くなっている。
次に第5図に示すフローチャートに従って詳細に説明す
るが、図中DNOは一定区間α内の点列の塊り数Nを検
出するだめの動作が何回繰返し生じたかを表わす動作番
号、またPNOは点列の塊りの組合わせによる個別ツク
ターン(以下、これを組合わせ)ξターンと称す。)を
作成する際のツクターンの順番を示すツクターン番号で
あり、該動作番号DNOと・ξターン番号PNOは切出
i−に関する情報を構成する。
捷ず点列データ30の先頭すなわち文字切出しの開始位
置から一定区間α内に存在する点列の塊りの数Nを計数
し1、N=Gのときはその区間がスペースであればDN
O=1 、 PNO=]を付与してスペースツクターン
を識別部14へ送出し、区間が全て点列の塊りであれば
次の点列の塊りの終了の位置を検出L7、その区間を接
触文字とみな[、て強制分離を行ない、それぞれの個別
)ξターンにDNO=1. 、 PNO=1を付与して
識別部14へ送出する。またN=]のときはその区間が
一文字の個別ツクターンであるとみなしてその個別パタ
ーンVCT)NO−2、PNO=1を付与して識別部J
4へ送出する。
更にN)]のときは黒列の塊りの出現順序を変えること
なく先頭から現われる点列の塊りを順次組合わせ、N個
の絹合せツクターンを作成し動作番号DNOと1からN
−iでのパターン番号PNOを付与して識別部14へ送
出する9例えばN=3のとき、点列の塊りをa、l)、
Cとすると、最初の処理ではDNO=1でPNO=1の
、oターン「a」、DNO=1でPNO=2のツクター
ンrabJ、DNO=1  でP N O= 3のノぐ
ターンrabcJの3個の切出しに関する情報付きの組
合わせ・ぐターンを識別部】4へ送出する。次に先頭の
点列の塊り「a」を除きDNO=2として処理を繰返し
、DNO=2でPNO=1のパターン「l)」、DNO
=2でPNO=2のツクターン「l)c」を識別部14
へ送出し、史に先頭の点列の塊り[1]」を除き1)N
O−2として処理を繰返し、DNO=3でPNO=1の
AターンrcJを識別部14へ送出する如くなって因る
文字決定部15では切出しに関する情報より一定区間α
内のツクターンが一文字の個別ツクターンとみなされて
いる場合にはその識別結果をその一!ま出力し、複数個
のパターンとみなされている場合にはその複数個の組合
わせパターンの各々の識別結果の中からりジェツトを除
いて該組合わせパターンの内で坪4ノξターン幅が最も
長いものを正しい識別結果として出力するとともに該区
間内の点列の塊りをその一々ターン内に含む後続の識別
結果を排除する如くなって因る。
第6図は文字決定部15での処理の詳細を示すフローチ
ャートで、切出L7/eターンに関する情報す々わち動
作番号]) N Oとパターン番号PNOから読取結果
として出力するための対象区間の組合わせツクターンで
あるか否かを判定して識別結果をバッファに格納し格納
したバッファの中から雇員の糾合わせパターンで識別で
きたものを読取結果として出力する。
次にm lr図の行ノ々ターン20を例にとって文字切
出しと文字決定の過程を説明する。行、oターン20の
うちのツクターン「べ」、「りJ 、 r l−Jにつ
いてはその点列データ30中の一定区間α内における点
列の塊り数が一個であるから、それぞれ−文字毎の個別
ツクターン21として切出され、その識別結果がその捷
ま出力端子】6に送出される。次のツクターン「ル」を
含む一定区間α(ここでは対象区間■と称す6  )K
は点列の塊りが2個存午するため、文字切出し部13i
d該2個のパターンを順次組合わせた個別ノミターン「
ノ」及び「ル」とその切出しに関する情報を識別部14
に送出するとともに、該対象区間■における点列の塊り
のうぢの先頭の塊シ「ノ」を除いた位置を次の対象区間
■の基準位置として設定する。ここでは該対象区間■に
おいても2個の点列の塊りが検出され上記同様に組合わ
せパターンとその切出しに関する情報が送出され、見、
下対象区間■、■においても同様となる。識別部14で
は対象区間■のパターン「ノ」に対して「ノ」や「1」
などの文字を識別結果として出力し、パターン「ル」に
対して「ル」の文字を出力する。文字決定部15ではパ
ターン幅が最も太きくて識別結果の確度が高いもの、対
象区間■では「ル」を読取結果として出力し、同時にパ
ターン「し」を含む対象区間■の識別結果を排除し、対
象区間■の識別結果から次の文字決定を行なう。該対象
区間■の識別結果からは「化」の文字が読取結果として
出力され、次の区間■は排除される。以下のパターン「
を」。
「進」等については上記同様に一文字として吊゛lコ取
られる。第7図は上記説明した第4図の行パターンの切
出し、識別、文字決定処理の実行のようすを示したもの
で、また第8図はその処理の流れを示したものである。
このように上記実施例によれば、一定区間σ内の点列の
塊り数に基づいて一文字のパターンか、そうでないかを
区別するようになしたため、−文字として切出す区間と
複数の組合わせパターンを構成すべき区間とを確実に区
別することができ、1だ複数個の点列の塊りが一定区間
α内に存在した場合は先頭の塊りを除いた位置を次の区
間の基準位置となしたため、考え得る全ての組合わせパ
ターンを取出すことができ、読取精度を上げることがで
きる。まだ文字切出し部では点列の塊9数に従って機械
的に・ξターンを切出すのみでよいから従来例の如く補
助識別部の識別結果を待つ必要がなく、この処理全体を
パイプライン構成とすることもでき、処理の高速化がは
かれる。
以上説明したように本発明によれば、帳宗上の文章を走
査光電変換し得られた文字行のノミターンから一文字ず
つ切出して文字認識を行なう文字読取方式において、文
字行上の予め定められた一定区間内に存在する点列の塊
りの個数を調べ、−個の場合はその区間を一文字のパタ
ーンとみなして切出し、被数個の場合は該点列の塊りを
順次適宜に組合わせた複数の組合わせパターンをそれぞ
れ一文字のパターンとみなして切出し、該切出しだパタ
ーンとその切出しに関する情報を出力する切出し工程と
、該切出しだ・ξターンの識別結果とその切出しに関す
る情報とより一文字のパターンとみなされている場合は
その識別結果をそのまま出力し、被数個の・ξターンと
みガされている場合はその複数の組合わせノミターンの
各々の識別結果の中から最もパターン幅の長い組合わせ
パターンに対応する識別結果を出力する文字決定工程と
をSするため、分離文字や切れが生じた文字を含み文字
ピッチが一定でない文書からの文字切出しを複雑々識別
や判定を必要とすることなく、一義的に行なうことがで
き処理の高速化がはかれるとともに、文字の一部が他の
文字と同様な場合であっても正しく読取ることができ、
また複数個の点列の塊りが一定区間内に存在する場合に
連続する点列の塊りを順次−個ずつ増して組合わせたノ
ミターンをそれぞれ一文字のパターンとみなして切出す
とともに該複数個の点列の塊りのうち先頭の塊りを除い
た位置を次の一定区間の基準位置となしたものでは考え
得る全ての組合わせパターンを取出すことができ読取精
度を上げることができ、従って読取対象を拡大できる等
の利点がある。
【図面の簡単な説明】
図面は本発明の説明に供するもので、第1図は従来の文
字読取装置を示すブロック図、第2図は従来の他の文字
読取装置を示すブロック図、第3図は本発明方式を適用
した文字読取装置の一実施例を示すブロック図、第4図
ハ行パターン及びその点列データの一例を示す説明図、
第5図は文字切出部13のフローチャート、第6図は文
字決定部15のフローチャート、第7図は第4図の行パ
ターンに対する切出し、識別、文字決定処理の実行のよ
うすを示す説明図、第8図は第7図の処理の流れを示す
説明図である。 11・・・入力端子、12・・・パターンメモリ、13
・・・文字切出し部、14・・・識別部、15・・・文
字決定部、16・・・出力端子 特許出願人  日本電信電話公社 代理人 弁理士  吉 1)精 孝 第1図 第2図 第3図 第4図 379− 第5図 −J−統r山王書(自発) 昭和59年 3月 7日 特許庁長官 若 杉 和 夫 殿 1事件の表示 昭和57年特許願第222489号 2発明の名称 文字読取方式 3補正をする者 事件との関係 特許出願人 住 所 東京都千代田区内幸町1丁目1番6号名 称 
(422)日本電信電話公社 代表者   真藤  恒 4代理人 〒105 電(03150B−9866自 
 発 6?1n正の対象 1図 面」 7補1■の内賽 別紙のとおり 7補正の内容 (1)図中、第5図を別紙のとおり補正する。

Claims (2)

    【特許請求の範囲】
  1. (1)帳票上の文章を走査光電変換し得られた文字行の
    、oターンから一文字ずつ切出して文字認識を行なう文
    字読取方式において、文字行上の予め定められた一定区
    間内に存在する点列の塊りの個数を調べ、−個の場合は
    その区間を一文字のパターンとみなして切出し、複数個
    の場合は該点列の塊りを順次適宜に組合わせた複数の組
    合わせノミターンをそれぞれ一文字のノミターンとみな
    して切出し、該切出したノミターンとその切出しに関す
    る情報を出力する切出し工程と、該切出したノミターン
    の識別結果とその切出しに関する情報とより一文字のノ
    ミターンとみなされている場合はその識別結果をそのま
    ま出力し、複数個のパターンとみなされている場合はそ
    の複数の組合わせパターンの各々の識別結果の中から最
    もパターン幅の長い組合わせノミターンに対応する識別
    結果を出力する文字決定工程とを廟することを特徴とす
    る文字読取方式。
  2. (2)帳票上の文章を走査光電変換し得られ、た文字行
    の、oターンから一文字ずつ切出して文字認識を行なう
    文字読取方式において、文字行上の予め定められた一定
    区間内に存在する点列の塊りの個数を調べ、−個の場合
    はその区間を一文字のノミターンとみなして切出し、複
    数個の場合は連続する点列の塊りを順次−個ずつ増して
    組合わせたノミターンをそれぞれ一文字のノミターンと
    みなして切出すとともに該複数個の点列の塊りのうち先
    頭の塊りを除いた位置を次の一定区間の基準位置とし、
    該切出しだ、oターンとその切出しに関する情報を出力
    する切出し工程と、該切出しだノミターンの識別結果と
    その切出しに関する情報とより一文字のノミターンとみ
    なされている場合はその識別結果をそのま捷出力し、複
    数個のノミターンとみなされている場合はその複数の組
    合わせノミターンの各々の識別結果の中から最もパター
    ン幅の長い組合わせノミターンに対応する識別結果を出
    力する文字決定工程とを消寸5ことを特徴とする文字読
    取方式。
JP57222489A 1982-12-18 1982-12-18 文字読取方式 Granted JPS59112367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57222489A JPS59112367A (ja) 1982-12-18 1982-12-18 文字読取方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57222489A JPS59112367A (ja) 1982-12-18 1982-12-18 文字読取方式

Publications (2)

Publication Number Publication Date
JPS59112367A true JPS59112367A (ja) 1984-06-28
JPH0210472B2 JPH0210472B2 (ja) 1990-03-08

Family

ID=16783225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57222489A Granted JPS59112367A (ja) 1982-12-18 1982-12-18 文字読取方式

Country Status (1)

Country Link
JP (1) JPS59112367A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6195481A (ja) * 1984-10-17 1986-05-14 Hitachi Ltd パタ−ン切り出し及び認識方法
JPS63223890A (ja) * 1987-03-12 1988-09-19 Toshiba Corp 図面読取装置
JPH01303586A (ja) * 1988-05-31 1989-12-07 Ricoh Co Ltd 文字切り出し方法
JP2013047887A (ja) * 2011-08-29 2013-03-07 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6195481A (ja) * 1984-10-17 1986-05-14 Hitachi Ltd パタ−ン切り出し及び認識方法
JPS63223890A (ja) * 1987-03-12 1988-09-19 Toshiba Corp 図面読取装置
JPH01303586A (ja) * 1988-05-31 1989-12-07 Ricoh Co Ltd 文字切り出し方法
JP2013047887A (ja) * 2011-08-29 2013-03-07 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
JPH0210472B2 (ja) 1990-03-08

Similar Documents

Publication Publication Date Title
GB2208735A (en) Character recognition system
US4850026A (en) Chinese multifont recognition system based on accumulable stroke features
JPS5827551B2 (ja) オンライン手書き文字認識方式
JPH076206A (ja) 自動文字分類装置
US5708731A (en) Pattern matching method with pixel vectors
JPS60153574A (ja) 文字読取方法
JPS59112367A (ja) 文字読取方式
US4887301A (en) Proportional spaced text recognition apparatus and method
JPS60153575A (ja) 文字読取方法
JPS59158482A (ja) 文字認識装置
JPS62121589A (ja) 文字切出し方法
JPS6139175A (ja) 光学的文字読取装置
JPS6343788B2 (ja)
JPH02230484A (ja) 文字認識装置
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
JPH0259504B2 (ja)
JPH06162263A (ja) 文字認識装置及び方法
JPH0969139A (ja) 光学式文字読取方法とその装置
JPH10154207A (ja) 文字切出し方法および文字切出し装置
JPH0378892A (ja) 表形式文書の認識装置
JP2000029982A (ja) 文字認識装置及び文字認識結果の出力方法
JPH0934992A (ja) オンライン手書き文字列切り出し装置
KR19990052967A (ko) 윈도우 및 프로젝션 정보를 이용한 한글 인식방법
JPH08243506A (ja) 住所読取り装置及び方法
JPH0392989A (ja) 文字認識装置