JPH051512B2 - - Google Patents

Info

Publication number
JPH051512B2
JPH051512B2 JP59163643A JP16364384A JPH051512B2 JP H051512 B2 JPH051512 B2 JP H051512B2 JP 59163643 A JP59163643 A JP 59163643A JP 16364384 A JP16364384 A JP 16364384A JP H051512 B2 JPH051512 B2 JP H051512B2
Authority
JP
Japan
Prior art keywords
recognition
character
pattern
matching
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP59163643A
Other languages
English (en)
Other versions
JPS6142083A (ja
Inventor
Manabu Takakura
Kazuhito Fukuoka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP16364384A priority Critical patent/JPS6142083A/ja
Publication of JPS6142083A publication Critical patent/JPS6142083A/ja
Publication of JPH051512B2 publication Critical patent/JPH051512B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、帳票等に記された漢字を含む手書き
文字を読み取つて認識する文字認識装置(以下
OCRという)に係り、特に誤認識を減少させる
ことができる文字認識装置に関するものである。
近来、OCRの進歩は目覚ましく、英数字、か
ら文字を対象とする活字印刷、及び手書き文字の
読み取りが可能なOCRが、帳票処理業務等に広
く実用に供されているが、更に漢字を含む日本語
文字の認識技術の開発も盛んで種々の方法が試み
られている。
特に漢字を含む手書き文字の認識においては誤
認識を減少させる方法が望まれている。
〔従来の技術〕
第3図は漢字を含む手書き文字を対象とする日
本語文字のOCRのブロツク図を示す。
図において、帳票1は、フイールド毎に顧客の
住所、氏名、または品名等が記された伝票であ
る。
読取部2は、帳票1上に照射された光の反射光
をレンズ系21を経てイメージセンサ22によつ
て走査して1フレームの文字を読み取り、イメー
ジデータとして2値化回路3へ送る機能を有す
る。
主制御部4は、各部を制御して文字読取り、認
識処理プログラムを遂行する機能を有する。
画像メモリ5は、2値化されたイメージデー
タ、即ち、読み取られた文字の画像データを記憶
するものである。
1文字切出回路6は、フオーマツト情報メモリ
9から送られるフオーマツト情報に基いて、画像
メモリ5に記憶された1フレームの文字より1文
字を切り出して認識回路10へ送る機能を有す
る。
特徴抽出回路7は、認識回路10から送られる
文字の特徴、即ち、文字の画数、曲線係数等を抽
出して認識回路10へ送る機能を有する。
辞書メモリ8は、認識の基準となる文字の特徴
が記憶されており、認識回路10の要求により、
順次認識回路10へ送出する機能を有する。
フオーマツト情報メモリ9は、帳票1上の文字
記入位置を示す情報が格納されており、読み取ら
れた文字の記入位置を画像メモリ5、1文字切出
回路6、及び認識回路10へ送る機能を有する。
認識回路10は、1文字切出回路6より送られ
た文字に対する特徴を特徴抽出回路7より受け取
り、辞書メモリ8から順次送られる文字の特徴と
を照合して一致度を求め、一致度の高いものから
順に文字コードを候補列として送出する機能を有
する。
このような構成及び機能を有するので、文字認
識の方法を説明すると、まず帳票1上の文字が読
み取られて2値化された画像データは画像メモリ
5に格納される。
次に画像データは1文字切出回路6に送られ、
フオーマツト情報メモリ9から送られた文字位置
情報に基いて、1文字の切出しを行つて認識回路
10へ送る。
認識回路10は入力した文字データを特徴抽出
回路7へ送り、その文字データの特徴を抽出させ
て受け取る。そこで辞書メモリ8より文字の特徴
を順次読み出して文字データの特徴と照合して、
一致度の高い文字を認識の答として候補文字にす
る。
この候補文字が複数個あれば候補列として順次
文字コードを出力する。
このようにして画像メモリ5に格納されている
画像データは順次文字認識が行われる。
〔発明が解決しようとする問題点〕
上記従来方法によると、漢字を含む手書き文字
は、漢字の画数、平仮名の曲線係数等によつて認
識されるが、手書きのくせ等によつて類似文字に
対する誤認識が多いというという問題点がある。
〔問題点を解決するための手段〕
本発明は、媒体上に記された文字に光を照射
し、照射した光の反射光より得られた文字の画像
データを認識する文字認識装置であつて、画像デ
ータの文字の特徴に基いて認識する第1の認識手
段と、画像データの文字パターンに基いて認識
し、認識された文字パターンを記憶し、以後の認
識時に該文字パターンを出力させる記入者パター
ン記憶手段を有する第2の認識手段とを備え、第
1の認識手段による認識の結果、認識の一致度が
所望値より低い時は、該当する画像データを第2
の認識手段によつて認識すると共に、認識された
文字パターンを記入者パターン記憶手段に更新記
憶する文字認識装置であり、かくすることにより
上記問題点を解決することができる。
〔作用〕
本発明によれば、画像データの特徴に基いて認
識するだけの従来方法に代えて、従来方法と同様
な第1の認識手段と、第1の認識手段によつて認
識した結果、一致度が低い時に、更に画像データ
を記入者パターンメモリに記憶された記入者パタ
ーンと照合して認識するか、或いは画像データを
所定の大きさに正規化して、この正規化された文
字パターンと標準パターンメモリに記憶された標
準パターンとを照合して認識する等の第2の認識
手段とによつて認識することにより、類似文字に
対する誤認識を減少させることができる。
また記入者パターンメモリを認識の都度更新す
るので、認識処理効率を高めることができる。
〔実施例〕
以下、本発明の一実施例を第1図及び第2図を
参照して説明する。第1図は本発明による実施例
を示すブロツク図、第2図は第1図のフローチヤ
ートである。全図を通じて同一符号は同一対象物
を示す。
第1図において、主制御部4aは、従来例で説
明した主制御部4と同様の機能、即ち、読み取ら
れた文字の画像データの特徴に基いて認識処理を
遂行する第1の認識手段を制御する機能を有する
と共に、画像データの文字パターンに基いて認識
処理を遂行する第2の認識手段を制御する機能を
有する。
判定回路11は、画像データより抽出された特
徴を辞書メモリ8の文字の特徴と照合して認識し
た結果、所定の一致度に達しているか否かを判定
し、一致度が低い時は認識回路10aに通知す
る。この場合には画像データのパターンによつて
照合する第2の認識手段に移行する。
正規化回路12は、画像メモリ5より送られる
文字パターンをn×m(例えば48×48ドツト)に
正規化する機能を有する。
正規化文字パターンメモリ13は、正規化回路
14で正規化された文字パターンを記憶する記憶
手段である。
記入者パターンメモリ14は、既に認識の対象
となつた一致度の高い文字パターン、即ち、記入
者パターンを認識の都度更新して記憶する記憶手
段である。
標準パターンメモリ15は、文字の標準パター
ンを記憶する記憶手段である。
変形パターン生成回路16は、正規化された文
字パターンの一致度の低い部分を検出して、その
部分のパターンを上下、または左右方向に移動さ
せて、一致度を高めるための変形パターンを生成
する機能を有する。
例えば第3図に示すように、標準文字パターン
“3”に対する正規化した文字パターンの一致度
を演算して一致度が低い部分、即ち、図中ハツチ
ングで示す部分aを検出し、この部分aをまず下
方へ所定寸法(例えば文字パターンの高さの1/8)
だけ移動して変形させ、標準文字パターン“3”
との一致度を演算して、一致度が高ければ変形さ
せたパターンを変形パターンメモリ17へ送り、
一致度が低ければ部分aを左方へ移動して変形さ
せ、標準文字パターン“3”との一致度が高けれ
ば、変形させたパターンを変形パターンメモリ1
7へ送る。それでも一致度が低ければ部分aを右
方へ、次いで上方へと移動して変形させて同様に
標準文字パターン“3”との一致度が高ければ、
変形させたパターンを変形パターンメモリ17へ
送る。もしそれでも標準文字パターン“3”との
一致度が低ければリジエクト文字とする。
変形パターンメモリ17は、変形パターン生成
回路18で生成された変形パターンを記憶する記
憶手段である。
マツチング回路18は、送り込まれる文字パタ
ーンと記入者パターン、正規化された文字パター
ンと標準パターン、変形文字パターンと標準パタ
ーンを夫々照合してマツチングをとる機能を有す
る。
一致度判定回路19は、マツチング回路18で
のマツチングの結果によつて一致度を判定し、認
識回路10aに通知する機能を有する。
このような構成及び機能を有するので、認識処
理の方法を第2図のフローチヤートによつて説明
する。
まず帳票1上の文字が読み取られて、従来例
と同様に抽出回路7によつて画像データの特徴
が抽出されて認識回路10aで辞書メモリ8か
ら送られた文字の特徴と照合されて一致度が求
められる。
一致度は判定回路11において所定値(例え
ば70%)に達しているか否かを判定して認識回
路10aに通知する。
そこで認識回路10aは一致度が所定値に達
している文字は認識の答、即ち、候補文字とし
て送出される。
もし一致度が低い場合には、画像データの文
字パターンによつて認識する方法に移行し、ま
ず認識回路10aは1文字切出回路6から送ら
れた切出文字のパターンをマツチング回路18
へ送り、また記入者パターンメモリ14に指令
して記入者パターンをマツチング回路18に送
らせて照合する。
照合結果は一致度判定回路19に送られて一
致度が所定値に達しているか否かを判定して認
識回路10aに通知する。
認識回路10aはこの判定結果により、一致
度が所定値に達している時は、と同様の処置
を取ると共に、切出文字のパターンは記入者パ
ターンメモリ14に送られて、照合された記入
者パターンと置き換えて更新記憶される。
一致度が低い時は、切出文字の文字パターン
を正規化回路12へ送つて正規化し、正規化文
字パターンを正規化文字パターンメモリ13に
記憶する。
次に正規化文字パターンと標準パターンをマ
ツチング回路18に送つて照合する。
照合の結果、と同様に一致度が判定され
る。
判定により、一致度が所定値に達している時
は、と同様の処置を取ると共に、候補文字と
して認識された正規化パターンは記入者パター
ンメモリ14に送られ、該当する文字の記入者
パターンが更新される。
一致度が低い時は、まず正規化文字パターン
を変形パターン生成回路16に送つて一致度の
低い部分、例えば第3図で説明した文字パター
ンの部分aを上下、または左右に移動させ、そ
の文字の変形パターンを変形パターンメモリ1
7に記憶する。
そこで変形パターンと標準パターンをマツチ
ング回路18に送つて照合する。
照合の結果、と同様に一致度が判定され
る。
一致度が所定値に達している時は、と同様
の処置を取ると共に、候補文字として認識され
た変形パターンは記入者パターンメモリ14に
送られ、該当する文字の記入者パターンが更新
される。
一致度が低い時は答としてリジエクト文字
(例えば“?”)を出力する。
このようにして読み取られた画像データの文字
の特徴に基いて認識処理を行い、一致度が低い時
には文字パターンに基く認識処理に移行し、しか
も、より精度の高いパターン照合を段階的に行う
ことより誤認識を防止することができ、また認識
の一致度が高い文字パターンを記入者パターンメ
モリ14に更新記憶するので、未学習の手書文字
や類似文字でも早い段階で高い一致度を得ること
ができ認識処理の効率を高めることができる。
〔発明の効果〕
以上説明したように本発明によれば、未学習の
手書文字や類似文字の誤認識を減少させることが
でき、また認識処理の効率を高めることができる
という効果がある。
【図面の簡単な説明】
第1図は本発明による実施例を示すブロツク
図、第2図は第1図のフローチヤート、第3図は
実施例の説明図、第4図は従来方法を示すブロツ
ク図である。 図において、4,4aは主制御部、5は画像メ
モリ、6は1文字切出回路、7は特徴抽出回路、
8は辞書メモリ、9はフオーマツト情報メモリ、
10,10aは認識回路、11は判定回路、12
は正規化回路、13は正規化文字パターン、14
は記入者パターンメモリ、15は標準パターンメ
モリ、16は変形パターン生成回路、17は変形
パターンメモリ、18はマツチング回路、19は
一致度判定回路を示す。

Claims (1)

  1. 【特許請求の範囲】 1 媒体上に記された文字に光を照射し、該照射
    した光の反射光より得られた該文字の画像データ
    を認識する文字認識装置であつて、 前記画像データの文字の特徴に基いて認識する
    第1の認識手段と、 該画像データの文字パターンに基いて認識し、
    認識された文字パターンを記憶し、以後の認識時
    に該文字パターンを出力させる記入者パターン記
    憶手段を有する第2の認識手段とを備え、 前記第1の認識手段による認識の結果、認識の
    一致度が所望値より低い時は、該当する画像デー
    タを前記第2の認識手段によつて認識すると共
    に、該認識された文字パターンを該記入者パター
    ン記憶手段に更新記憶することを特徴とする文字
    認識装置。 2 前記第2の認識手段は、前記画像データの大
    きさを正規化する正規化手段と、 文字の標準パターンが記憶された標準パターン
    記憶手段とを備えることを特徴とする特許請求の
    範囲第1項に記載の文字認識装置。 3 前記第2の認識手段は、前記正規化された画
    像データの一致度が低い部分を所定方向に移動さ
    せる変形パターン生成手段を備えることを特徴と
    する特許請求の範囲第2項に記載の文字認識装
    置。
JP16364384A 1984-08-03 1984-08-03 文字認識装置 Granted JPS6142083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16364384A JPS6142083A (ja) 1984-08-03 1984-08-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16364384A JPS6142083A (ja) 1984-08-03 1984-08-03 文字認識装置

Publications (2)

Publication Number Publication Date
JPS6142083A JPS6142083A (ja) 1986-02-28
JPH051512B2 true JPH051512B2 (ja) 1993-01-08

Family

ID=15777841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16364384A Granted JPS6142083A (ja) 1984-08-03 1984-08-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6142083A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005290656A (ja) * 2004-03-10 2005-10-20 Kyoto Kiito Kk 糸芭蕉の繊維抽出法ならびに糸芭蕉糸および織物

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19820353C2 (de) 1998-05-07 2001-06-13 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
CN101256631B (zh) * 2007-02-26 2011-06-01 富士通株式会社 一种字符识别的方法、装置
JP7225548B2 (ja) * 2018-03-22 2023-02-21 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS511100A (en) * 1974-06-22 1976-01-07 Kyodo Printing Co Ltd Pasuhoototoniokeru kaoshashinhyojisho
JPS5856909B2 (ja) * 1980-12-20 1983-12-17 株式会社東芝 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005290656A (ja) * 2004-03-10 2005-10-20 Kyoto Kiito Kk 糸芭蕉の繊維抽出法ならびに糸芭蕉糸および織物

Also Published As

Publication number Publication date
JPS6142083A (ja) 1986-02-28

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
WO1991017521A1 (en) A hybrid feature-based and template matching optical character recognition system
US5621818A (en) Document recognition apparatus
JP2000155803A (ja) 文字読取方法および光学式文字読取装置
JPH051512B2 (ja)
JP2751865B2 (ja) 文字列認識装置
JP3812719B2 (ja) 文書検索装置
JPS6146573A (ja) 文字認識装置
JPH0728935A (ja) 文書画像処理装置
JPS60138689A (ja) 文字認識方法
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP3006823B2 (ja) 文字および単語の認識方式
JP2963474B2 (ja) 類似文字識別方法
JP2851865B2 (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPS6143383A (ja) 文字認識装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JPH0340186A (ja) 文字認識装置
JPH09138838A (ja) 文字認識方法およびその装置
JPH01191992A (ja) 文字認識装置
JPH0272497A (ja) 光学的文字読取装置
JPH0514953B2 (ja)
JPH07117995B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees