JPS5831028B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS5831028B2
JPS5831028B2 JP54045144A JP4514479A JPS5831028B2 JP S5831028 B2 JPS5831028 B2 JP S5831028B2 JP 54045144 A JP54045144 A JP 54045144A JP 4514479 A JP4514479 A JP 4514479A JP S5831028 B2 JPS5831028 B2 JP S5831028B2
Authority
JP
Japan
Prior art keywords
character
memory
midpoint
recognized
video signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54045144A
Other languages
English (en)
Other versions
JPS55138179A (en
Inventor
憲雄 金光
篤 霜山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP54045144A priority Critical patent/JPS5831028B2/ja
Publication of JPS55138179A publication Critical patent/JPS55138179A/ja
Publication of JPS5831028B2 publication Critical patent/JPS5831028B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、認識対象文字について複数の候補文字が存在
する場合、認識対象文字の前後の文字を参照して、複数
の候補文字の中の1個を選択するようにした文字認識装
置に関するものである。
現在のOCR装置は、各文字を前後の関連を見ず、1文
字ずつ認識して出力している。
このため、まわりに大きな文字が書かれているにも拘わ
らず、小さいゴミ出力に対しても認識結果を出力してし
まったり、片仮名フィールドに書かれた半濁点「。
」を片仮名「口」と認識するようなことが生じていた。
この外、濁点r=Jと片仮名「ハ」の区別をつげ難(、
また、白丸「。
」と黒丸「・」の区別をつげ難い場合が生ずるという欠
点も有している。
認識対象文字の文字種決定を確実に行うため、従来技術
においては、読取り行のセンターラインを絶対位置情報
として用い、センターラインより上側にあるか下側にあ
るかという情報を参照して、各文字単独で読取りを行っ
ていた。
このような従来技術は次のような欠点を有している。
(イ)読取りセンターラインの決定方式が、センターマ
ークを読み取れない場合、仮想のセンターラインを設定
しなければならなかった。
すなわち、紙が停止する位置をセンターラインの仮想位
置に合うように、紙を移動停止せねばならなかった。
これには自と停止誤差が生じ、その誤差が大きかった。
(0)各行の左側および右側にセンターマークを設けた
読取シートを用い、対応するセンターマークを読取り、
両センターマークを結ぶ直線を読取り行のセンターライ
ンとする読取りセンターラインの決定方式が知られてい
る。
この方式は、左右両側の2個のセンターマークを読取り
、スキューを補正した後に文字の読取りを行わなければ
ならず、その分だけ時間が余分に必要であり、読取シー
トのデザインにも問題が生じた。
←→ 読取り文字を文字枠の下側に書くユーザにとって
は、濁点「N」、白丸「。
」、黒丸「・」、アポストローフr=j、ダッシュr−
Jなどが文字枠の中心に来ても不自然でないため、文字
枠の中心付近に書く場合が生じてしまい、読取り不能と
なった。
本発明は、上記の欠点を除去するものであって、前後の
文字と認識対象文字との関係を参照して認識対象文子の
文字種を常に正しく決定するようにした文字認識装置を
提供することを目的としている。
そしてそのため、本発明の文字認識装置は、イメージ・
センサと、該イメージ・センサからのアナログ映像信号
を量子化する量子化手段と、量子化映像信号を格納する
映像メモリとを備え、上記映像メモリから量子化映像信
号を読出し、該量子化映像信号によって文字認識を行う
文字認識装置において、認識対象文字に外接する四辺形
に対応するメモリ領域内の量子化映像信号を上記映像メ
モリから切出す切出し手段と、該切出し手段によって切
出された認識対象文字について1個又は複数個の候補文
字を定める認識手段と、上記四辺形の上端の基準位置に
対する位置を抽出する上端抽出手段と、上記四辺形の下
端の基準位置に対する位置を抽出する下端抽出手段と、
上記四辺形の中点の基準位置に対する位置を抽出する中
点抽出手段と、同一読取り行における各認識対象文字毎
に候補文字、下端位置、中点位置および上端位置を関連
付けて格納するメモリと、該メモリに格納されている中
点位置に基づいて現在の認識対象文字の中点位置と前の
認識対象文字の中点位置の差分を算出する文字相互間特
徴抽出手段と、上記メモリからデータを読出し上記文字
相互間特徴抽出手段によって算出された差分を参照して
認識対象文字の文子様を決定する答編集手段とを設けた
ことを特徴とするものである。
以下、本発明を図面を参照しつつ説明する。
第1図は本発明の1実施例のブロック図、第2図および
第3図は文字の切出しを説明する図、第4図はメモリ1
3の内容を説明する図である。
第1図において、1は帳票、2はレンズ、3はセンサ、
4は増幅器、5はA/D変換器、6は前処理回路、7は
映像メモリ、8は切出し回路、9は認識回路、10は上
端抽出回路、11は中点抽出回路、12は下端抽出回路
、13はメモリ、14は文字相互間特徴抽出回路、15
は答編集回路をそれぞれ示している。
イメージ・センサ3は、帳票1上の文字を横方向にスキ
ャンニングするものである。
A/D変換器5は、イメージ・センサ3によって光電変
換されたアナログ映像信号をディジタル信号に変換する
前処理回路6は、映像信号を文字部と背景部の白黒2値
信号に変換するものである。
切出し回路8は、文字に外接する四辺形を作るものであ
る。
第2図および第3図は文字の切出しを説明するものであ
る。
文字を下から上へ向う走査線で右から左へ走査する場合
、最初に黒が検出される走査線のX座標値X2および最
後に黒が検出される走査線のX座標値X、を求め、次に
左から右へ向う水平走線で上から下へ走査し、最初に黒
が検出される走査線のY座標値y1 および最後に黒が
検出される走査線のY座標値y2 を求める。
なお、XI。x2.yl、y2は文字を囲む文字枠を基
準とするものである。
文字の外接四辺形は点(x2 t y2 )、(X2+
y1)、(Xl、y2)および(xl、yl)で規定さ
れる。
認識回路9は、切出された文字について1個又は複数個
の候補文字を抽出するものである。
上端抽出回路10は、文字の上端位置、すなわちyl
(第3図参照)を抽出するものである。
中点抽出回路11は、文字の上端と下端の中点位置、す
なわち(y1+y2)/2を抽出するものである。
下端抽出回路12は、文字の下端位置、すなわちy2
を抽出するものである。
文字相互間特徴抽出回路14は、現在の認識対象文字の
中点位置と前の認識対象文字の中点位置との差分を求め
るものである。
次に、本発明の実施例を具体例で説明する。
いま、帳票1上に「ケロンパ」なる文字が記入され、メ
モリ13に第4図に示す如き情報が格納されたと仮定す
る。
第2番目の記入文字に(すなわち認識対象文子)につい
ては、中点位置が第1番目の記入文字の中点位置より上
側に存在しないので、答編集回路15は片仮名「口」を
選択する。
第5番目の記入文字については、中点位置が第4番目の
記入文字の中点位置より上側に存在し、文字高さも小さ
いので、答編集回路15は半濁点「。
」を選択する。
半濁点「。」を選択する場合、前の記入文字がノ・行の
文字であることを条件として付加するとを認識精度は一
層向上する。
候補文字としてげ」と「ハ」が選択された場合において
も、同様にして認識対象文字が濁点「1」であるか、或
は片仮名「・・」であるかを判定することが出来る。
この場合においても前の文字がカ行、す行、り行、・・
行であることを条件とすれば、認識精度は一層向上する
又、現在の認識対象文字に対する候補文字として黒丸「
・」と白丸「。
」が選択された状態の下では、現在の認識対象文字につ
いて次の如き判定が行われる。
1、前の認識対象文字が・・行の文字であると判定され
た場合について、現在の認識対象文字が前の認識対象文
字より上側にあるとき、白丸「。
」と判定する。
2、現在の認識対象文字の前に文字が存在しない場合に
ついて。
2−1.現在の認識対象文字の大きさが所定値より小さ
いとき、文字存在せずど判定する。
2−2.現在の認識文字の大きさが所定値より大きく且
つ後の認識対象文字より上側であるとき、判読不能と判
定する。
2−3.現在の認識対象文字の大きさが所定直より大き
く且つ下側にあるとき、黒丸「・」と判定する。
3、現在の認識対象文字の前の認識対象文字が・・行以
外の文字であると判定された場合について。
3−1.現在の認識対象文字の大きさが所定値より小さ
いとき、文字存在せずど判定する。
3−2.現在の認識対象文字の大きさが所定(直より大
きく、且つ前の認識対象文字より上側にあるとき、判読
不能と判定する。
3−3.現在の認識対象文字の大きさが所定値より大き
く、且つ下側にあるときは、黒丸「・」と判定する。
以上の説明から明らかなように、本発明によれば、現在
の認識対象文字の文字種決定を、現在の認識対象文字と
前後の認識対象文字との物理的相対関係を参照して行っ
ているので、文字認識の精度を著しく向上させることが
出来る。
【図面の簡単な説明】
第1図は本発明の1実施例のフロック図、第2図および
第3図は文字の切出しを説明する図、第4図はメモリ1
3の内容を説明する図である。 1・・・・・・帳票、2・・・・・・レンズ、3・・・
・・・センサ、4・・・・・・増幅器、5・・・・・・
A/D変換器、6・・・・・・前処理回路、7・・・・
・・映像メモリ、8・・・・・・切出し回路、9・・・
・・・認識回路、10・・・・・・上端抽出回路、11
・・・・・・中点抽出回路、12・・・・・・下端抽出
回路、13・・・・・・メモリ、14・・・・・・文字
相互間特徴抽出回路、15・・・・・・答編集回路。

Claims (1)

    【特許請求の範囲】
  1. 1 イメージ・センサと、該イメージ・センサからのア
    ナログ映像信号を量子化する量子化手段と、量子化映像
    信号を格納する映像メモリとを備え、上記映像メモリか
    ら量子化映像信号を読出し、該量子化映像信号によって
    文字認識を行う文字認識装置において、認識対象文字に
    外接する四辺形に対応するメモリ領域内の量子化映像信
    号を上記映像メモリから切出す切出し手段と、該切出し
    手段によって切出された認識対象文字について1個又は
    複数個の候補文字を定める認識手段と、上記四辺形の上
    端の基準位置に対する位置を抽出する上端抽出手段と、
    上記四辺形の下端の基準位置に対する位置を抽出する下
    端抽出手段と、上記四辺形の中点の基準位置に対する位
    置を抽出する中点抽出手段と、同一読取り行における各
    認識対象文字毎に候補文字、下端位置、中点位置および
    上端位置を関連付けて格納するメモリと、該メモリに格
    納されている中点位置に基づいて現在の認識対象文字の
    中点位置と前の認識対象文字の中点位置の差分な算出す
    る文字相互間特徴抽出手段と、上記メモリからデータを
    読出し上記文字相互間特徴抽出手段によって算出された
    差分を参照して認識対象文字の文字種を決定する答編集
    手段とを設けたことを特徴とする文字認識装置。
JP54045144A 1979-04-13 1979-04-13 文字認識装置 Expired JPS5831028B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP54045144A JPS5831028B2 (ja) 1979-04-13 1979-04-13 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP54045144A JPS5831028B2 (ja) 1979-04-13 1979-04-13 文字認識装置

Publications (2)

Publication Number Publication Date
JPS55138179A JPS55138179A (en) 1980-10-28
JPS5831028B2 true JPS5831028B2 (ja) 1983-07-02

Family

ID=12711076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54045144A Expired JPS5831028B2 (ja) 1979-04-13 1979-04-13 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5831028B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2521915B2 (ja) * 1986-07-04 1996-08-07 日本電気株式会社 活字文字認識装置
EP0457534B1 (en) * 1990-05-14 2001-10-31 Canon Kabushiki Kaisha Image processing method and apparatus

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5582382A (en) * 1978-12-18 1980-06-21 Matsushita Electric Ind Co Ltd Recognition system for hand-written symbol and kana (japanese syllabary) character

Also Published As

Publication number Publication date
JPS55138179A (en) 1980-10-28

Similar Documents

Publication Publication Date Title
JP3727971B2 (ja) 文書処理装置、及び文書処理方法
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US5799115A (en) Image filing apparatus and method
JPH05500129A (ja) 光学式文字認識のための行ごとのセグメント化及びしきい値設定
JPS5831028B2 (ja) 文字認識装置
ANTONACOPOULOS Automatic reading of Braille documents
JPH0660220A (ja) 文書画像の領域抽出方法
JP3334369B2 (ja) 選択項目認識装置
JPS6160184A (ja) 光学的文字読取装置
JP3027232B2 (ja) 文字認識装置
JPH0578068B2 (ja)
JPS6039276A (ja) 光学文字読み取り装置
JPH04167193A (ja) 文字認識方法
JPH1097588A (ja) 罫線認識方法、表処理方法および記録媒体
JPH0443476A (ja) 文字認識装置
JPH03230288A (ja) 情報処理装置
JPH01265378A (ja) 欧文文字認識方式
JPS6327751B2 (ja)
JPH0550785B2 (ja)
JPS588024B2 (ja) ルビ付文字の検出切出装置
JPS61289479A (ja) 繋がり文字を読取る文字認識装置
JPH03282791A (ja) 文字認識方法
JPS5860381A (ja) スキユ−検出方式
JPS5827276A (ja) 光学的文字読取装置
JPS6134683A (ja) 光学文字読取装置