JPH0496190A - 光学的手書き漢字認識の後処理装置及び方法 - Google Patents
光学的手書き漢字認識の後処理装置及び方法Info
- Publication number
- JPH0496190A JPH0496190A JP2210786A JP21078690A JPH0496190A JP H0496190 A JPH0496190 A JP H0496190A JP 2210786 A JP2210786 A JP 2210786A JP 21078690 A JP21078690 A JP 21078690A JP H0496190 A JPH0496190 A JP H0496190A
- Authority
- JP
- Japan
- Prior art keywords
- furigana
- kanji
- recognition
- handwritten
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔目次〕
概要
産業上の利用分野
従来の技術(第6図)
発明が解決しようとする課題
課題を解決するための手段(第1,2図)作用(第1,
2図) 実施例(第3.4.5図) 発明の効果 〔概要〕 漢字とそのフリガナとを対応付けるフリガナ付単語辞書
を検索し、手書き漢字列及びフリガナ列の光学的認識の
補完を行う光学的手書き漢字認識の後処理装置及び方法
に関し、 漢字認識精度を上げて業務処理の一層の効率化を実現し
信頼性のある光学的手書き漢字認識の後処理装置及び方
法を提供することを目的とし、手書き漢字列及び対応す
る手書きフリガナ列を光学的に取込み、各文字列を形成
する文字毎に、各々複数の文字候補を一定のレベル順に
挙げ、当該各レベル毎に、認識すべき各文字列に対応さ
せて並べた複数の文字列候補を認識結果として出力し、
フリガナ付単語辞書に対し、前記認識結果である各文字
列候補毎について検索を行い、当該認識結果である各文
字列候補がフリガナ付単語辞書に存在するか否かを判断
し、存在する場合には、当該文字列候補をフリガナ付漢
字として出力し、存在しない場合には、認識された各漢
字について、一字毎に読み方付漢字辞書から読み方を抽
出し、当該読み方に該当する文字列候補を作成して再度
フリガナ付単語辞書の検索を行う構成である。
2図) 実施例(第3.4.5図) 発明の効果 〔概要〕 漢字とそのフリガナとを対応付けるフリガナ付単語辞書
を検索し、手書き漢字列及びフリガナ列の光学的認識の
補完を行う光学的手書き漢字認識の後処理装置及び方法
に関し、 漢字認識精度を上げて業務処理の一層の効率化を実現し
信頼性のある光学的手書き漢字認識の後処理装置及び方
法を提供することを目的とし、手書き漢字列及び対応す
る手書きフリガナ列を光学的に取込み、各文字列を形成
する文字毎に、各々複数の文字候補を一定のレベル順に
挙げ、当該各レベル毎に、認識すべき各文字列に対応さ
せて並べた複数の文字列候補を認識結果として出力し、
フリガナ付単語辞書に対し、前記認識結果である各文字
列候補毎について検索を行い、当該認識結果である各文
字列候補がフリガナ付単語辞書に存在するか否かを判断
し、存在する場合には、当該文字列候補をフリガナ付漢
字として出力し、存在しない場合には、認識された各漢
字について、一字毎に読み方付漢字辞書から読み方を抽
出し、当該読み方に該当する文字列候補を作成して再度
フリガナ付単語辞書の検索を行う構成である。
本発明は帳票による業務処理等の高速化を実現するため
に導入されるOCR装置における光学的手書き漢字認識
の後処理装置及び方法に係り、特に、漢字と当該漢字に
付されるべきフリガナとを対応付けて格納するフリガナ
付単語辞書を検索して、手書き漢字列及び対応する手書
きフリガナ列の光学的認識の補完を行う光学的手書き漢
字認識の後処理装置及び方法に関する。
に導入されるOCR装置における光学的手書き漢字認識
の後処理装置及び方法に係り、特に、漢字と当該漢字に
付されるべきフリガナとを対応付けて格納するフリガナ
付単語辞書を検索して、手書き漢字列及び対応する手書
きフリガナ列の光学的認識の補完を行う光学的手書き漢
字認識の後処理装置及び方法に関する。
これによって、OCR装置の漢字の認識精度を挙げ、こ
れによって帳票の記入値を正確に読み取ることか可能と
なり、業務処理の一層の効率化が実現されることになる
。
れによって帳票の記入値を正確に読み取ることか可能と
なり、業務処理の一層の効率化が実現されることになる
。
従来、各メーカで行っている光学的手書き漢字認識の後
処理(特に住所、氏名)はフリガナ付単語辞書により実
施しているところが多い。
処理(特に住所、氏名)はフリガナ付単語辞書により実
施しているところが多い。
このような光学的手書き漢字認識の後処理装置として第
6図に示すものがあった。
6図に示すものがあった。
本装置は同図に示すように、漢字列と当該漢字列に付さ
れるべきフリガナ列とを対応付けて格納するフリガナ付
単語辞書部63と、手書き漢字列及び対応する手書きフ
リガナ列を光学的に取り込み、各文字列を形成する文字
毎に最も類似の程度の高い文字候補を求め、認識すべき
前記各文字列に対応させて最も類似の程度の高いレベル
について並べた文字列候補を認識結果として出方する手
書きフリガナ付漢字の光学的初期認識部61と、ヲリガ
ナ付単語辞書部63に対し、前記認識結果である各文字
列候補毎について検索を行うフリガす付単語認識補完部
62と、を有するものである。
れるべきフリガナ列とを対応付けて格納するフリガナ付
単語辞書部63と、手書き漢字列及び対応する手書きフ
リガナ列を光学的に取り込み、各文字列を形成する文字
毎に最も類似の程度の高い文字候補を求め、認識すべき
前記各文字列に対応させて最も類似の程度の高いレベル
について並べた文字列候補を認識結果として出方する手
書きフリガナ付漢字の光学的初期認識部61と、ヲリガ
ナ付単語辞書部63に対し、前記認識結果である各文字
列候補毎について検索を行うフリガす付単語認識補完部
62と、を有するものである。
ところで、フリガナ付単語辞書による後処理のメリット
は、フリガナが確実に認識されていて、しかも辞書に登
録されていれは、漢字側の認識率が多少低くとも、10
0%認識することができるところにある。しかし、日本
の姓名単語及び住所単語は10万語以上あり、実状は使
用頻度の高いもののみを辞書登録して使う場合が多い。
は、フリガナが確実に認識されていて、しかも辞書に登
録されていれは、漢字側の認識率が多少低くとも、10
0%認識することができるところにある。しかし、日本
の姓名単語及び住所単語は10万語以上あり、実状は使
用頻度の高いもののみを辞書登録して使う場合が多い。
また、フリガナの認識率は漢字よりも高いとはいえ、1
00%ではない。したがって、フリガナ付単語辞書によ
る認識補完の辞書に登録されていなかったり、フリガナ
の誤認識によって後処理の効果が出ない場合があるとい
う問題点を有していた。
00%ではない。したがって、フリガナ付単語辞書によ
る認識補完の辞書に登録されていなかったり、フリガナ
の誤認識によって後処理の効果が出ない場合があるとい
う問題点を有していた。
このような場合が生ずるのはフリガナ付単語辞書による
光学的手書き漢字認識結果の補完処理の中で、手書きフ
リガナが辞書の中に登録されていなかったり、本来、登
録されているにも拘らず、手書きフリガナが一部、誤認
識されていたために未登録と判断されたような場合であ
る。
光学的手書き漢字認識結果の補完処理の中で、手書きフ
リガナが辞書の中に登録されていなかったり、本来、登
録されているにも拘らず、手書きフリガナが一部、誤認
識されていたために未登録と判断されたような場合であ
る。
そこで、本発明は漢字の認識精度を上げることにより帳
票上の記入値等を正確に読み取って、業務処理の一層の
効率化を実現することができる信頼性のある光学的手書
き漢字認識の後処理装置及び方法を提供することを目的
としてなされたものである。
票上の記入値等を正確に読み取って、業務処理の一層の
効率化を実現することができる信頼性のある光学的手書
き漢字認識の後処理装置及び方法を提供することを目的
としてなされたものである。
以上の技術的課題を解決するため、第一の発明は第1図
に示すように、漢字と当該漢字に付されるべきフリガナ
とを対応付けて格納するフリガナ付単語辞書部3を有し
、当該フリガナ付単語辞書部3を検索して、手書き漢字
列の光学的認識の補完を行う光学的手書き漢字認識の後
処理装置において、手書き漢字列及び対応する手書きフ
リガナ列を光学的に取り込み、各文字列を形成する文字
毎に、各々複数の文字候補を類似の程度に応じたレベル
順に挙げ、当該各レベル毎に、認識すべき前記各文字列
に対応させて並べた複数の文字列候補を認識結果として
出力する手書きフリガナ付漢字の光学的初期認識部lと
、フリガナ付単語辞書部3に対し、前記認識結果である
各文字列候補について検索を行うフリガナ付単語認識補
完部2と、漢字一字毎に漢字と当該漢字の読み方とを対
応付けて格納する読み方付漢字辞書部5と、フリガナ付
単語認識補完部2により前記認識結果がフリガナ付単語
辞書部3に存在しないと判断された場合には、認識され
た各漢字について読み方付漢字辞書部5から対応する漢
字の読み方を抽出し、当該読み方に該当する文字列候補
を作成して前記フリガナ付単語認識補完部2に送出する
フリガナ補完部4と、を有するものである。
に示すように、漢字と当該漢字に付されるべきフリガナ
とを対応付けて格納するフリガナ付単語辞書部3を有し
、当該フリガナ付単語辞書部3を検索して、手書き漢字
列の光学的認識の補完を行う光学的手書き漢字認識の後
処理装置において、手書き漢字列及び対応する手書きフ
リガナ列を光学的に取り込み、各文字列を形成する文字
毎に、各々複数の文字候補を類似の程度に応じたレベル
順に挙げ、当該各レベル毎に、認識すべき前記各文字列
に対応させて並べた複数の文字列候補を認識結果として
出力する手書きフリガナ付漢字の光学的初期認識部lと
、フリガナ付単語辞書部3に対し、前記認識結果である
各文字列候補について検索を行うフリガナ付単語認識補
完部2と、漢字一字毎に漢字と当該漢字の読み方とを対
応付けて格納する読み方付漢字辞書部5と、フリガナ付
単語認識補完部2により前記認識結果がフリガナ付単語
辞書部3に存在しないと判断された場合には、認識され
た各漢字について読み方付漢字辞書部5から対応する漢
字の読み方を抽出し、当該読み方に該当する文字列候補
を作成して前記フリガナ付単語認識補完部2に送出する
フリガナ補完部4と、を有するものである。
一方、第二の発明は第2図に示すように、漢字と当該漢
字に付されるべきフリガナとを対応付けるフリガナ付単
語辞書を検索して、手書き漢字列の光学的認識の補完を
行う光学的手書き漢字認識の後処理方法において、手書
き漢字列及び対応する手書きフリガナ列を光学的に認識
し、各文字列を形成する文字毎に、各々複数の文字候補
を類似の程度に応じたレベル順に挙げ、当該各レベル毎
に、認識すべき前記各文字列に対応させて各レベル毎に
並べた複数の文字列候補を認識結果として出力し(S1
)、フリガナ付単語辞書に対し、前記認識結果である各
文字列候補毎について検索を行い(S2)、、当該認識
結果である各文字列候補がフリガナ付単語辞書に存在す
るか否かの判断を行い(S3)、存在すると判断された
場合には、当該文字列候補をフリガナ付漢字として出方
しくS5)、存在しないと判断された場合には、認識さ
れた各漢字について、一字毎に読み方付漢字辞書からそ
の読み方を抽出し、当該読み方に該当する文字列候補を
作成して(S4)、再度フリガナ付単語辞書の検索を行
う(S2)ものである。
字に付されるべきフリガナとを対応付けるフリガナ付単
語辞書を検索して、手書き漢字列の光学的認識の補完を
行う光学的手書き漢字認識の後処理方法において、手書
き漢字列及び対応する手書きフリガナ列を光学的に認識
し、各文字列を形成する文字毎に、各々複数の文字候補
を類似の程度に応じたレベル順に挙げ、当該各レベル毎
に、認識すべき前記各文字列に対応させて各レベル毎に
並べた複数の文字列候補を認識結果として出力し(S1
)、フリガナ付単語辞書に対し、前記認識結果である各
文字列候補毎について検索を行い(S2)、、当該認識
結果である各文字列候補がフリガナ付単語辞書に存在す
るか否かの判断を行い(S3)、存在すると判断された
場合には、当該文字列候補をフリガナ付漢字として出方
しくS5)、存在しないと判断された場合には、認識さ
れた各漢字について、一字毎に読み方付漢字辞書からそ
の読み方を抽出し、当該読み方に該当する文字列候補を
作成して(S4)、再度フリガナ付単語辞書の検索を行
う(S2)ものである。
続いて、本発明(第−及び第二の発明)についての動作
を説明する。
を説明する。
第1図及び第2図に示すように、ステッフSlで前記手
書きフリガナ付漢字を前記手書きフリガナ付漢字の光学
的初期認識部1により光学的に取り込み、各文字を形成
する文字毎に、各々複数の文字候補を類似の程度に応じ
たレベル順に独立に挙げ、認識すべき前記各文字列に対
応させて各レベル毎に並べた複数の文字列候補を認識結
果として出力する。
書きフリガナ付漢字を前記手書きフリガナ付漢字の光学
的初期認識部1により光学的に取り込み、各文字を形成
する文字毎に、各々複数の文字候補を類似の程度に応じ
たレベル順に独立に挙げ、認識すべき前記各文字列に対
応させて各レベル毎に並べた複数の文字列候補を認識結
果として出力する。
ステップS2で、例えば、前記フリガナ付単語認識補完
部2はフリガナ付単語辞書部3に対し、前記認識結果で
ある各文字列候補毎について検索を行う。
部2はフリガナ付単語辞書部3に対し、前記認識結果で
ある各文字列候補毎について検索を行う。
ステップS3で、当該フリガナ付単語認識補完部2は前
記認識結果である文字列候補が存在するか否かの判断を
行う。
記認識結果である文字列候補が存在するか否かの判断を
行う。
当該認識結果であるいずれかの文字列候補が存在する場
合にはステップS5に進み、当該文字列候補を該当する
手書きのフリガナ付漢字として出力することになる。
合にはステップS5に進み、当該文字列候補を該当する
手書きのフリガナ付漢字として出力することになる。
一方、ステップS3で当該認識結果である文字列候補の
いずれも存在しない場合には、ステップS4に進み、例
えば、前記フリガナ補完部4は認識された各漢字につい
て、前記読み方付漢字辞書部5から漢字一字毎に当該漢
字の読み方を抽出し、当該読み方に基づき前記初期認識
結果の文字候補内に当該読み方が存在するか否かを判断
し、存在する場合には、当該読み方(フリガナ)を正し
いものととして前記初期認識結果を修正して再度前記フ
リガナ付き漢字認識補完部2により前記フリガナ付単語
辞書部3に対し、ステップS2で検索を行わしめること
になる。
いずれも存在しない場合には、ステップS4に進み、例
えば、前記フリガナ補完部4は認識された各漢字につい
て、前記読み方付漢字辞書部5から漢字一字毎に当該漢
字の読み方を抽出し、当該読み方に基づき前記初期認識
結果の文字候補内に当該読み方が存在するか否かを判断
し、存在する場合には、当該読み方(フリガナ)を正し
いものととして前記初期認識結果を修正して再度前記フ
リガナ付き漢字認識補完部2により前記フリガナ付単語
辞書部3に対し、ステップS2で検索を行わしめること
になる。
ステップS3で前記フリガナ付単語辞書部3にいずれか
の文字列候補が存在すると判断された場合には、ステッ
プS5に進み、該当する文字列候補が認識された手書き
フリガナ付漢字として出力されることになる。
の文字列候補が存在すると判断された場合には、ステッ
プS5に進み、該当する文字列候補が認識された手書き
フリガナ付漢字として出力されることになる。
続いて、本発明の実施例に係る光学的手書き漢字認識の
後処理装置及び方法について説明する。
後処理装置及び方法について説明する。
第3図に本実施例に係る機器構成ブロック図を示す。
同図ニ示すように、CPU20と、0CR(Optic
al Character Reader ;光学的文
字読取り装置)30と、漢字と当該漢字に付されるべき
フリガナとを対応付けて格納するフリガナ付単語辞書部
13と、主記憶装置40と、出力部50と、漢字一字毎
に漢字と当該漢字の読み方とを対応付けて格納する読み
方付漢字辞書部15と、初期認識を行うため漢字及びフ
リガナの標準パターンを格納する漢字・フリガナ辞書部
60とを有するものである。
al Character Reader ;光学的文
字読取り装置)30と、漢字と当該漢字に付されるべき
フリガナとを対応付けて格納するフリガナ付単語辞書部
13と、主記憶装置40と、出力部50と、漢字一字毎
に漢字と当該漢字の読み方とを対応付けて格納する読み
方付漢字辞書部15と、初期認識を行うため漢字及びフ
リガナの標準パターンを格納する漢字・フリガナ辞書部
60とを有するものである。
また、第4図には、本実施例に係る光学的手書き漢字認
識の後処理装置を機能的に示したものであり、本装置は
フリガナ付単語辞書部13と、手書き漢字列及び対応す
る手書きフリガナ列を光学的に取り込み、各文字列を形
成する文字毎に、各々複数の文字候補を類似の程度に応
じたレベル順に独立に挙げ、認識すべき前記各文字列に
対応させて各レベル毎に並べた複数の文字列候補を認識
結果として出力する手書きフリガナ付漢字の光学的初期
認識部11と、前記フリガナ付単語辞書部13に対し、
前記認識結果である各文字列候補毎について検索を行う
フリガナ付単語認識補完部12と、読み方付き漢字辞書
部15と、フリガナ付単語認識補完部12により前記認
識結果がフリガナ付き漢字辞書部13に存在しないと判
断された場合には、認識された各漢字について読み方付
漢字辞書部15から対応する漢字の読み方を抽出し、当
該読み方に該当する文字列候補を作成して前記フリガナ
付単語認識補完部12に送出するフリガナ補完部14と
、を有するものである。
識の後処理装置を機能的に示したものであり、本装置は
フリガナ付単語辞書部13と、手書き漢字列及び対応す
る手書きフリガナ列を光学的に取り込み、各文字列を形
成する文字毎に、各々複数の文字候補を類似の程度に応
じたレベル順に独立に挙げ、認識すべき前記各文字列に
対応させて各レベル毎に並べた複数の文字列候補を認識
結果として出力する手書きフリガナ付漢字の光学的初期
認識部11と、前記フリガナ付単語辞書部13に対し、
前記認識結果である各文字列候補毎について検索を行う
フリガナ付単語認識補完部12と、読み方付き漢字辞書
部15と、フリガナ付単語認識補完部12により前記認
識結果がフリガナ付き漢字辞書部13に存在しないと判
断された場合には、認識された各漢字について読み方付
漢字辞書部15から対応する漢字の読み方を抽出し、当
該読み方に該当する文字列候補を作成して前記フリガナ
付単語認識補完部12に送出するフリガナ補完部14と
、を有するものである。
ここで、フリガナ付単語認識補完部12及びフリガナ補
完部14は認識補完後処理部10に相当するものであり
、前記CPU20、当該処理プログラムを格納した前記
主記憶装置40、及び前記出力部50に相当するもので
ある。
完部14は認識補完後処理部10に相当するものであり
、前記CPU20、当該処理プログラムを格納した前記
主記憶装置40、及び前記出力部50に相当するもので
ある。
また、前記0CR30、CPU20、前記漢字・フリガ
ナ辞書部60、及び初期認識のプログラムを格納した前
記主記憶装置40は前記光学的初期認識部11に相当す
るものである。
ナ辞書部60、及び初期認識のプログラムを格納した前
記主記憶装置40は前記光学的初期認識部11に相当す
るものである。
さらに、当該手書きフリガナ付漢字の光学的初期認識部
11は第4図に示すように手書き漢字光学的認識部11
a及び手書きフリガナの光学的認識部11bからなるも
のである。
11は第4図に示すように手書き漢字光学的認識部11
a及び手書きフリガナの光学的認識部11bからなるも
のである。
続いて、本実施例に係る光学的手書き漢字認識の後処理
装置及び方法の動作を説明する。
装置及び方法の動作を説明する。
前記手書きフリガナ付漢字の光学的初期認識部11の前
記手書き漢字の光学的認識部11aにより認識された手
書き漢字列及び手書きフリガナの光学的認識部11bに
より認識された手書きフリガナ列の初期認識結果が前記
認識補完後処理部10の前記フリガナ付単語認識補完部
12に入力する。
記手書き漢字の光学的認識部11aにより認識された手
書き漢字列及び手書きフリガナの光学的認識部11bに
より認識された手書きフリガナ列の初期認識結果が前記
認識補完後処理部10の前記フリガナ付単語認識補完部
12に入力する。
ここで、前記手書きフリガナ付漢字の光学的初期認識部
11による初期認識は、例えば、光学的に取り込まれた
手書きされた文字像を電気信号に変換し、雑音を含む文
字信号から文字信号のみを切り出し、文字の位置、大き
さ、傾き、線巾の正規化、特徴抽出を行って、得たパタ
ーンと予め前記漢字・フリガナ辞書部60に格納してお
いた標準パターンとの類似の程度を計算し、類似性の高
い標準パターンを初期認識結果として出力する。
11による初期認識は、例えば、光学的に取り込まれた
手書きされた文字像を電気信号に変換し、雑音を含む文
字信号から文字信号のみを切り出し、文字の位置、大き
さ、傾き、線巾の正規化、特徴抽出を行って、得たパタ
ーンと予め前記漢字・フリガナ辞書部60に格納してお
いた標準パターンとの類似の程度を計算し、類似性の高
い標準パターンを初期認識結果として出力する。
第5図には例として、手書きされた「束材(アズマムラ
)」について、当該光学的初期認識部11により初期認
識された結果の文字列候補を示す。
)」について、当該光学的初期認識部11により初期認
識された結果の文字列候補を示す。
同図に示すように、手書きされた「東」について初期認
識された結果、類似の程度の最も高いレベルの候補1は
「東」であり、次に類似性の高いレベルの候補2は「束
」であり、次は候補3の「策」であり、・・・、候補n
は「西」である。また、手書きされた「村」について初
期認識された結果、類似性の最も高い候補1は「材」で
あり、次が候補2の「村」であり、次は候補3の「林」
であり、・・・候補nは「森」である。
識された結果、類似の程度の最も高いレベルの候補1は
「東」であり、次に類似性の高いレベルの候補2は「束
」であり、次は候補3の「策」であり、・・・、候補n
は「西」である。また、手書きされた「村」について初
期認識された結果、類似性の最も高い候補1は「材」で
あり、次が候補2の「村」であり、次は候補3の「林」
であり、・・・候補nは「森」である。
同様にして、手書きされた「ア」については候補1は「
ア」てあり、候補2は「す」であり、候補3は「テ」で
あり、・・・、候補nは「フ」である。以下同様にして
番手書きされた「ズ」、「マ」、「ム」、「ヲ」につい
て各々n個ずつの候補が挙げられている。
ア」てあり、候補2は「す」であり、候補3は「テ」で
あり、・・・、候補nは「フ」である。以下同様にして
番手書きされた「ズ」、「マ」、「ム」、「ヲ」につい
て各々n個ずつの候補が挙げられている。
フリガナ付単語認識補完部12は前記フリカナ付単語辞
書部13を検索し、各文字列候補毎、第5図に示す場合
には、最も類似性の高いレベルの文字列候補1ては「束
材、アズマムヲ」、候補2では「束材、ナスコハヨ」、
・・・等について、当該フリカナ付単語辞書部13に当
該各文字列候補の組合せが存在するか否かが判断される
ことになる。
書部13を検索し、各文字列候補毎、第5図に示す場合
には、最も類似性の高いレベルの文字列候補1ては「束
材、アズマムヲ」、候補2では「束材、ナスコハヨ」、
・・・等について、当該フリカナ付単語辞書部13に当
該各文字列候補の組合せが存在するか否かが判断される
ことになる。
第5図に示した同レベル毎に並べた各文字列候補につい
ては、いずれも当該フリカナ付単語辞書部13には存在
しないと判断されることになる。
ては、いずれも当該フリカナ付単語辞書部13には存在
しないと判断されることになる。
一方、当該フリカナ付単語辞書部13に当該漢字列のフ
リガナ列が存在し、かつ1個だけであって、しかもフリ
ガナの初期認識結果と一致する場合には、前記フリガナ
付単語認識補完部12により当該フリガナを認識結果と
して出力することになる。
リガナ列が存在し、かつ1個だけであって、しかもフリ
ガナの初期認識結果と一致する場合には、前記フリガナ
付単語認識補完部12により当該フリガナを認識結果と
して出力することになる。
第5図に示したように、前記フリガナ付単語認識補完部
12により各文字列候補が前記フリカナ付単語辞書部1
3に存在しないと判断された場合には、その旨が前記フ
リガナ補完部14に通知される。
12により各文字列候補が前記フリカナ付単語辞書部1
3に存在しないと判断された場合には、その旨が前記フ
リガナ補完部14に通知される。
すると、当該フリガナ補完部14は初期認識された各漢
字列候補を形成する各漢字について、その読み方を検索
し、読み方付漢字辞書部15から初期認識されたフリガ
ナ組合せの中に該当するものがあるか否かの判断を行う
ことになる。
字列候補を形成する各漢字について、その読み方を検索
し、読み方付漢字辞書部15から初期認識されたフリガ
ナ組合せの中に該当するものがあるか否かの判断を行う
ことになる。
その場合、前記フリガナ組合せの中に該当するものがな
かった場合には、補完終了を前記フリガナ付単語認識補
完部12に報告を行う(成果なし)。
かった場合には、補完終了を前記フリガナ付単語認識補
完部12に報告を行う(成果なし)。
また、初期認識されたフリガナの組み合わせの中に該当
するものが1個存在すれば、それを、複数個存在すると
判断された場合には、各候補レベルに重み付は算出を行
って可能性の高いものを採用するようにする。
するものが1個存在すれば、それを、複数個存在すると
判断された場合には、各候補レベルに重み付は算出を行
って可能性の高いものを採用するようにする。
こうして、採用した結果を前記フリガナ付単語認識補完
部12に対し、フリガナ補完結果としてフィードバック
することになる。
部12に対し、フリガナ補完結果としてフィードバック
することになる。
ここで、読み方付漢字辞書により検索された例として、
第5図に初期認識された結果を示すと、候補1の「材」
について、「ザイ」はフリガナ組合せの中に該当なく、
候補2の「村」について、「リン」はフリガナ組合せの
中に該当なく、「ムラ」はフリガナ組合せの中に該当あ
り、所定の可能性値の算出を行うことになる。
第5図に初期認識された結果を示すと、候補1の「材」
について、「ザイ」はフリガナ組合せの中に該当なく、
候補2の「村」について、「リン」はフリガナ組合せの
中に該当なく、「ムラ」はフリガナ組合せの中に該当あ
り、所定の可能性値の算出を行うことになる。
さらに、候補3の「林」について、「リン」はフリガナ
組合せの中に該当なく、「ハヤシ」はフリガナ組合せの
中に該当ない。このようにして候補nの「森」について
までフリガナ組合せの中に該当するものがあるか否かの
判断がなされることになる。
組合せの中に該当なく、「ハヤシ」はフリガナ組合せの
中に該当ない。このようにして候補nの「森」について
までフリガナ組合せの中に該当するものがあるか否かの
判断がなされることになる。
こうして、第5図に示した例では判定の結果は「ムラ」
ではなく「ムラ」ということになる。
ではなく「ムラ」ということになる。
こうして、得られたフリガナ列候補「アズマ」「ムラ」
と、初期認識された漢字候補について、前記漢字認識補
完部12により再度、前記フリガナ付単語辞書部13に
対して検索が行われ、当該辞書部13に存在すれは、最
終的な認識結果として、当該漢字列及びフリガナ列が前
記出力部50から出力されることになる。
と、初期認識された漢字候補について、前記漢字認識補
完部12により再度、前記フリガナ付単語辞書部13に
対して検索が行われ、当該辞書部13に存在すれは、最
終的な認識結果として、当該漢字列及びフリガナ列が前
記出力部50から出力されることになる。
以上説明したように、本実施例によれば、OCR装置に
よる光学的読取りによる漢字認識の精度が向上し、従来
の認識精度の低さに起因する入力データの修正にかかわ
る操作者の負荷の軽減が可能となる。
よる光学的読取りによる漢字認識の精度が向上し、従来
の認識精度の低さに起因する入力データの修正にかかわ
る操作者の負荷の軽減が可能となる。
以上説明したように、本発明はフリガナ付単語認識補完
部と、フリガナ付単語辞書部により前記初期認識結果が
フリガナ付単語辞書部に存在しないと判断された場合に
は、認識された各漢字について読み方付漢字辞書部から
対応する漢字の読み方を抽出し、当該読み方に基づき、
当該読み方に該当する文字列候補を作成するフリガナ補
完部を設けている。
部と、フリガナ付単語辞書部により前記初期認識結果が
フリガナ付単語辞書部に存在しないと判断された場合に
は、認識された各漢字について読み方付漢字辞書部から
対応する漢字の読み方を抽出し、当該読み方に基づき、
当該読み方に該当する文字列候補を作成するフリガナ補
完部を設けている。
従って、光学的読取りによる漢字認識の精度が向上し、
従来のように精度の低さに起因する入力データの修正を
行う必要のあった操作者の負担の軽減を図ることができ
て、信頼性があり、かつ効率の良い光学的手書き漢字認
識の後処理装置及び方法を提供することができることに
なる。
従来のように精度の低さに起因する入力データの修正を
行う必要のあった操作者の負担の軽減を図ることができ
て、信頼性があり、かつ効率の良い光学的手書き漢字認
識の後処理装置及び方法を提供することができることに
なる。
【図面の簡単な説明】
第1図は第一の発明の原理ブロック図、第2図は第二の
発明に係る原理流れ図、第3図は実施例に係る機器構成
ブロック図、第4図は実施例に係るブロック図、第5図
は実施例に係る処理例を示す図、及び、第6図は従来例
に係るブロック図である。 1.11・・・手書きフリガナ付漢字の光学的初期認識
部 2.12・・・フリガナ付単語認識補完部3.13・・
・フリガナ付単語辞書部 4.14・・・フリガナ補完部 5.15・・・読み刃付漢字−辞書部
発明に係る原理流れ図、第3図は実施例に係る機器構成
ブロック図、第4図は実施例に係るブロック図、第5図
は実施例に係る処理例を示す図、及び、第6図は従来例
に係るブロック図である。 1.11・・・手書きフリガナ付漢字の光学的初期認識
部 2.12・・・フリガナ付単語認識補完部3.13・・
・フリガナ付単語辞書部 4.14・・・フリガナ補完部 5.15・・・読み刃付漢字−辞書部
Claims (2)
- (1)漢字と当該漢字に付されるべきフリガナとを対応
付けて格納するフリガナ付単語辞書部(3)を有し、当
該フリガナ付単語辞書部(3)を検索して、手書き漢字
列の光学的認識の補完を行う光学的手書き漢字認識の後
処理装置において、手書き漢字列及び対応する手書きフ
リガナ列を光学的に取り込み、各文字列を形成する文字
毎に、各々複数の文字候補を類似の程度に応じたレベル
順に挙げ、当該各レベル毎に、認識すべき前記各文字列
に対応させて並べた複数の文字列候補を認識結果として
出力する手書きフリガナ付漢字の光学的初期認識部(1
)と、 フリガナ付単語辞書部(3)に対し、前記認識結果であ
る各文字列候補について検索を行うフリガナ付単語認識
補完部(2)と、 漢字一字毎に漢字と当該漢字の読み方とを対応付けて格
納する読み方付漢字辞書部(5)と、フリガナ付単語認
識補完部(2)により前記認識結果がフリガナ付単語辞
書部(3)に存在しないと判断された場合には、認識さ
れた各漢字について読み方付漢字辞書部(5)から対応
する漢字の読み方を抽出し、当該読み方に該当する文字
列候補を作成して前記フリガナ付単語認識補完部(2)
に送出するフリガナ補完部(4)と、を有することを特
徴とする光学的手書き漢字認識の後処理装置。 - (2)漢字と当該漢字に付されるべきフリガナとを対応
付けるフリガナ付単語辞書を検索して、手書き漢字列の
光学的認識の補完を行う光学的手書き漢字認識の後処理
方法において、 手書き漢字列及び対応する手書きフリガナ列を光学的に
認識し、各文字列を形成する文字毎に、各々複数の文字
候補を類似の程度に応じたレベル順に挙げ、当該各レベ
ル毎に、認識すべき前記各文字列に対応させて並べた複
数の文字列候補を認識結果として出力し(S1)、 フリガナ付単語辞書に対し、前記認識結果である各文字
列候補毎について検索を行い(S2)、当該認識結果で
ある各文字列候補がフリガナ付単語辞書に存在するか否
かの判断を行い (S3)、 存在すると判断された場合には、当該文字列候補をフリ
ガナ付漢字として出力し(S5)、存在しないと判断さ
れた場合には、認識された各漢字について、一字毎に読
み方付漢字辞書からその読み方を抽出し、当該読み方に
該当する文字列候補を作成して(S4)、再度フリガナ
付単語漢字辞書の検索を行う(S2)ことを特徴とする
光学的手書き漢字認識の後処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2210786A JPH0496190A (ja) | 1990-08-09 | 1990-08-09 | 光学的手書き漢字認識の後処理装置及び方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2210786A JPH0496190A (ja) | 1990-08-09 | 1990-08-09 | 光学的手書き漢字認識の後処理装置及び方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0496190A true JPH0496190A (ja) | 1992-03-27 |
Family
ID=16595110
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2210786A Pending JPH0496190A (ja) | 1990-08-09 | 1990-08-09 | 光学的手書き漢字認識の後処理装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0496190A (ja) |
-
1990
- 1990-08-09 JP JP2210786A patent/JPH0496190A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6671684B1 (en) | Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document | |
| US7970213B1 (en) | Method and system for improving the recognition of text in an image | |
| US6834121B2 (en) | Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof | |
| CN116092083B (zh) | 一种基于知识库的ocr纠错方法、装置及存储介质 | |
| US6535652B2 (en) | Image retrieval apparatus and method, and computer-readable memory therefor | |
| US10438097B2 (en) | Recognition device, recognition method, and computer program product | |
| CN119337866A (zh) | 一种ocr病历文本的纠错方法 | |
| JPH0496190A (ja) | 光学的手書き漢字認識の後処理装置及び方法 | |
| JP3792759B2 (ja) | 文字認識方法とその装置 | |
| JP3071745B2 (ja) | 文字認識結果の後処理方法 | |
| JP2001147990A (ja) | 画像データ処理装置及び方法並びにこれに利用される記憶媒体 | |
| JPH07271920A (ja) | 文字認識装置 | |
| JP2746345B2 (ja) | 文字認識の後処理方法 | |
| JP2003115028A (ja) | 帳票識別辞書自動生成方法及び帳票処理システム | |
| JP2918380B2 (ja) | 文字認識結果の後処理方法 | |
| JPH1069494A (ja) | 画像検索方法とその装置 | |
| JP4633271B2 (ja) | 辞書学習方法及び辞書学習プログラム | |
| JPS60138689A (ja) | 文字認識方法 | |
| JPH0355874B2 (ja) | ||
| JP3595081B2 (ja) | 文字認識方法 | |
| JPH0436885A (ja) | 光学式文字読取装置 | |
| JPH01191992A (ja) | 文字認識装置 | |
| JPH0546806A (ja) | 文字認識方法 | |
| JPH0540854A (ja) | 文字認識結果の後処理方法 | |
| US20180012111A1 (en) | Recognition device, recognition method, and computer program product |