JP2000315247A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP2000315247A JP2000315247A JP11126053A JP12605399A JP2000315247A JP 2000315247 A JP2000315247 A JP 2000315247A JP 11126053 A JP11126053 A JP 11126053A JP 12605399 A JP12605399 A JP 12605399A JP 2000315247 A JP2000315247 A JP 2000315247A
- Authority
- JP
- Japan
- Prior art keywords
- character
- dictionary
- standard pattern
- area
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
つ高速で文字認識することが可能な文字認識装置を提供
することを目的とする。 【解決手段】 入力された文字画像10の文字幅を推定
し、その文字幅に相当する長さの文字領域を切り出す文
字領域切出部11、切り出された文字領域内の文字パタ
ーンの特徴を抽出する特徴抽出部12、一文字標準パタ
ーン辞書14_1と複数文字標準パターン辞書14_2
との双方からなる標準パターン辞書14、特徴抽出部1
2で抽出された文字パターンの特徴を、一文字標準パタ
ーン辞書14_1および複数文字標準パターン辞書14
_2に記述された一文字および文字列それぞれの特徴と
照合して文字領域内の文字パターンが表す文字あるいは
文字列の候補を抽出する辞書照合部15とを備えた。
Description
像を文字として認識する文字認識装置に関する。
認識する文字認識装置の分野において、例えばOCR
(光学式文字読取装置)やイメージスキャナとOCRソ
フトとを組み合わせた文字認識装置などが広い業務分野
で用いられている。従来のOCR用帳票では、一文字ず
つの文字記入枠が印刷された帳票が用いられ、漢字を用
いるシステムでは文字記入枠の大きさも漢字が記入しや
すいよう大きな文字記入枠が採用されている。このよう
にすることによりOCRにとっては記入された文字を正
確に認識しやすくなり、また記入者に対して隣の文字と
接触しないように記入することを促す効果がある。
従って、一般に使用される通常の帳票のような小さな帳
票を用い文字枠にとらわれずに記入された文字列、すな
わち、通常の伝票などに不規則な文字間隔、不規則な記
入方法で記入された隣接する文字どうしが接触し合うよ
うな低品質の手書きの文字列についても実用になる認識
精度で認識することが可能な文字認識装置が求められて
いる。
−Bあるいはマルチフォントなどのように複数の特定の
文字フォントだけを用いて注意深く印刷されたOCR帳
票が使用されているが、印刷された文字列についても、
不特定のプリンタにより多様な文字ピッチで印刷され
た、多様な変形のある文字列、例えば、文字ピッチが狭
いプリンタやプロポーショナルピッチで印刷された文字
列、あるいは半角文字と全角文字が混在する文字列など
から実用になる認識精度で文字列を切り出すことのでき
る文字認識装置が要望されている。
おける文字切出し方式、特にフリーピッチの文字列、す
なわち文字枠が設定されていないフィールドからの文字
切出し方式では、孤立した黒画素の連結領域について文
字列の高さ情報を求め、その高さ情報から文字のピッチ
情報を求め、その値により隣り合う文字を統合しあるい
は分離して認識対象とすべき一文字を切り出す方式が採
用されている。あるいは1行、1フィールドの文字列を
行方向、フィールド方向に垂直な方向へ投影しておき、
文字列の高さ情報から文字のピッチ情報を求め、その値
により投影ヒストグラムから文字位置を切り出していく
方式を採用したものもある。その切出しが一通りに決ま
らない場合には複数通りの切出し位置を求めることも行
われている。
られた書式に従って記入された文字を収集し、これらの
文字から認識方式に依存する文字パターンの特徴を抽出
し統計的な手法などにより標準パターンが作成される。
また、標準パターンは、収集された文字から平均パター
ンとして作成されることもある。手書き文字の場合に
は、記入者により大きな字形変形が生じるため各字種に
ついて複数の標準パターンが作成される。通常一つの標
準パターンをテンプレートとよび、複数の標準パターン
を集めた辞書を複数テンプレート辞書と呼ぶ。辞書照合
方法としては、入力帳票から切り出された一文字からそ
の文字パターンの特徴を抽出し、この特徴と標準パター
ン辞書のテンプレートの特徴との間で類似度計算あるい
は距離計算を行い、最大の類似度を持つカテゴリあるい
は最小の距離を持つテンプレートのカテゴリを認識結果
として求める方法が採用されている。侯補文字列として
は、距離の小さい順に例えば8位までを侯補文字列とし
ている。
列が求められる。複数通りの侯補がある場合はパターン
どうしの類似度評価値により、あるいは知識処理などの
言語処理により最良の切出し候補を決定する方法が採用
されている。
のようにフリーピッチで記入された文字列、あるいは不
特定のプリンタで印刷された文字列を認識する場合に、
隣接する文字どうしが接触することが多く、また、印刷
文字列の場合は半角文字と全角文字が混在することがあ
り、隣り合う文字どうしが接触することが多いため、一
文字ずつ検出して認識する方法では、どの範囲までが一
文字かを判断するのが困難であり、実用に耐える認識精
度を実現することは難しい。ひらがな、カタカナ、およ
び漢字では偏(へん)と旁(つくり)のように、もとも
と分離した文字領域からなる文字もあり、これらの文字
領域が正しく認識できなければ何文字記入してあるのか
さえ判断できない場合もある。
列から個々の文字のピッチを推定する方法として次のよ
うな種々の方法が提案されている。
方向に投影して行を構成する文字の平均高さを求める。
次に、文字列の黒画素を行方向に垂直な方向に投影して
黒画素の行方向の頻度をヒストグラムとして表しそのヒ
ストグラムから頻度が0の位置、すなわち文字列が途切
れている位置、あるいはヒストグラムの極小点、すなわ
ち接触文字または重なり文字を切り離すべき切断候補位
置を求める。この切断候補位置に基づき、先に求めた文
字列の平均高さから全角文字、半角文字の列として妥当
と見られる位置を文字切出し位置とする。
方向に垂直な方向に投影して黒画素の行方向の頻度をヒ
ストグラムとして表しそのヒストグラムから頻度が0の
位置、あるいはヒストグラムの極小点を求め、文字切出
し位置と推定される位置をその文字列に対して複数通り
求める。複数通りの文字切出位置のうちのいずれが尤も
らしい文字切出位置であるかの判定は、文字列の類似度
評価値と認識結果からの判断にゆだねる。
素の連結領域を求め、連結領域の並びについて小さな領
域どうしは統合し、大きな領域は複数に分離して一文字
の領域を決めて文字切出しを行なう。その際の小さい領
域、大きい領域の判断は文字列の高さを基準にして行
う。
次のような問題がある。すなわち、第1の方法において
は、1行の文字列が全て全角文字で構成されている場合
には、全角文字は文字幅と文字高さが全て等しいと考え
られるので平均文字高さから文字幅を正確に推定するこ
とができ、従って、一文字ずつ正確に切り出すことがで
きるが、半角文字と全角文字が混在している場合、例え
ば全角の仮名交じり漢字文字列に半角の英数字あるいは
カタカナが混入している場合には、文字位置が半角分だ
けずれたり、半角2文字が一文字分に認識されることが
あり、正しい文字切出位置が求められないことがある。
して複数通りの切出し結果が得られるため1行の認識処
理に複数行分の処理時間がかかり、接触文字が多数ある
場合などは非常に多くの切出し結果が出てくるため認識
処理速度が著しく低下するという問題がある。
分の分離に関して認識精度上多くの問題があり、正確に
文字認識を行うことは困難である。
難しい文字画像からでも正確にかつ高速で文字認識する
ことが可能な文字認識装置を提供することを目的とす
る。
発明の文字認識装置は、入力された文字画像から文字幅
を推定してその文字画像から文字幅に相当する長さの文
字領域を切り出す文字領域切出部と、上記文字領域切出
部により切り出された文字領域内の文字パターンの特徴
を抽出する特徴抽出部と、標準的な文字一文字それぞれ
の特徴が記述された一文字標準パターン辞書と標準的な
文字が所定数配列されてなる文字列それぞれの特徴が記
述された複数文字標準パターン辞書との双方からなる標
準パターン辞書と、上記特徴抽出部で抽出された、文字
領域内の文字パターンの特徴を、上記標準パターン辞書
を構成する上記一文字標準パターン辞書および上記複数
文字標準パターン辞書に記述された一文字および文字列
それぞれの特徴と照合してその文字領域内の文字パター
ンが表す文字あるいは文字列の候補を抽出する辞書照合
部とを備えたことを特徴とする。
書照合部により、上記文字領域内の文字パターンの特徴
を上記複数文字標準パターン辞書に記述された文字列の
特徴と照合した結果文字列の候補が抽出された場合に、
上記特徴抽出部に、文字列の候補が抽出された文字領域
がさらにその文字列を構成する文字数と同数に分割され
てなる各分割領域それぞれの文字パターンの特徴を抽出
させ、上記辞書照合部に、上記分割領域それぞれの文字
パターンの特徴を、上記一文字標準パターン辞書に記述
された一文字それぞれの特徴と照合させて上記分割領域
の配列に対応した文字列の候補を抽出させ、その文字列
の候補が、上記複数文字標準パターン辞書を用いて抽出
された文字列の候補と一致するか否かを検証する検証部
を備えたものであることが好ましい。
像から上記文字幅に相当する長さの文字領域を、該文字
幅を上記所定数と同数に分割したときの一分割分の長さ
ずつずらしながら切り出すものであることも好ましい。
出部により切り出された文字領域それぞれについて文字
あるいは文字列の候補を抽出するとともに抽出された文
字あるいは文字列の候補を総合して文字配列の候補を抽
出するものであることも好ましい態様である。
な文字認識不能領域が残った場合に、上記文字認識不能
領域の文字パターンの特徴を上記一文字標準パターン辞
書に記述された一文字それぞれの特徴と照合して文字候
補を抽出するものであることも好ましい態様の一つであ
る。
説明する。
るコンピュータの外観図(a)および内部構成図(b)
である。
に、このコンピュータ60は、CPU61、メモリ6
2、表示装置63、プリンタ64、CD−ROMドライ
ブ65、磁気ディスク66、マウス67、キーボード6
8、およびイメージスキャナ69などがシステムバス7
0によって接続されて構成されおり、このコンピュータ
60に本発明の文字認識装置が形成されている。
ータ60に文字画像が入力されて文字認識が行われる。
施形態における機能ブロック図である。
文字認識装置100は、入力された文字画像10から文
字幅を推定して文字画像10から文字幅に相当する長さ
の文字領域を切り出す文字領域切出部11、文字領域切
出部11により切り出された文字領域内の文字パターン
の特徴を抽出する特徴抽出部12、標準的な文字一文字
それぞれの特徴が記述された一文字標準パターン辞書1
4_1と標準的な文字が所定数配列されてなる文字列そ
れぞれの特徴が記述された複数文字標準パターン辞書1
4_2との双方からなる標準パターン辞書14、特徴抽
出部12で抽出された、文字領域内の文字パターンの特
徴を、標準パターン辞書14を構成する一文字標準パタ
ーン辞書14_1および複数文字標準パターン辞書14
_2に記述された一文字および文字列それぞれの特徴と
照合してその文字領域内の文字パターンが表す文字ある
いは文字列の候補を抽出する辞書照合部13、および抽
出された文字あるいは文字列の候補を格納し外部に出力
する候補文字出力部15を備えている。
100の動作について説明する。
などから取り込まれた文字画像10がこの文字認識装置
100に入力されると、文字領域切出部11により文字
の平均高さが求められ、それに基づいて文字幅が推定さ
れる。文字の平均高さは、文字列の黒画素を行方向に投
影することによって求められ、日本語の全角文字の幅と
高さはほぼ等しく記入されることが多いという前提に基
づき文字の平均高さから文字ピッチ、すなわち文字幅を
推定することができる。この文字幅により全角文字を検
出することができる。
から文字の平均高さの半分の文字幅で半角文字一文字を
検出することができる。
字については、文字領域の幅が上記の文字幅の2文字分
の幅である場合は、文字領域を2分の1に強制的に分割
することにより2文字として検出することができる。ま
た、3文字分の幅がある場合は文字領域を3分の1に強
制的に分割すればよい。
文字領域が文字画像10の左端から順次切り出される。
文字幅の推定および文字領域の切出しは、文字画像10
の左端からだけではなく、必要に応じて文字画像10の
途中から行えるように構成してもよい。
内の文字パターンの特徴を抽出する。文字パターンの特
徴は、例えば、一文字分の矩形の領域を縦8列横8行の
8×8=64領域に分割し、垂直方向と水平方向に走査
して黒画素の個数を計数して得られる投影分布関数によ
り表わすことができる。このような方法で抽出された文
字領域内の文字パターンの特徴は、辞書照合部13にお
いて、一文字標準パターン辞書14_1および複数文字
標準パターン辞書14_2に記述された一文字および文
字列それぞれの特徴と照合され相互間の距離を求めて距
離の小さい順に例えば10個の候補が求められる。
照)は、正常な一文字の文字領域から統計的に作成され
た一文字標準パターン辞書14_1と、標準的な文字が
所定数、例えば2つ配列されてなる文字列それぞれの特
徴が記述された複数文字標準パターン辞書14_2との
2つの部分から構成されている。
ーン辞書14として一文字標準パターン辞書14_1お
よび複数文字標準パターン辞書14_2の2種類の辞書
を備えているのは、全角文字列の中に半角数字が並んで
いる場合に、文字領域切出部11は、半角2文字を一文
字として検出するので、この半角2文字を一つのパター
ンとして辞書照合を行うようにするためである。
とそのカテゴリ、すなわちその標準パターンを作成した
文字カテゴリを表す文字コードが記述されている。一文
字標準パターン辞書の場合は、例えば「0」というよう
に1つの文字コードが記述されており、複数文字標準パ
ターン辞書の場合は、例えば「00」というように2つ
の文字コードの並びが記述されている。
辞書を用いた照合により得られた結果は、正常な一文字
として検出できた文字領域であると判断されるのでその
まま1つの文字コードを候補として出力する。辞書照合
部13での複数文字標準パターン辞書を用いた照合によ
り得られた結果は、複数文字コードの並びを候補として
出力する。
から出力された文字コードを整理して最終候補文字列を
作成し、一文字の候補は1つの文字コードのまま、複数
文字の候補は複数の文字コードの並びとして外部に出力
される。
00では、文字行全体ではなく局所的な文字列部分に着
目し一文字標準パターン辞書と複数文字標準パターン辞
書との双方からなる標準パターン辞書を用いて照合を行
うことにより、半角文字が含まれていたり文字どうしが
接触していたりしている低品質な文字列からでも、文字
を正確に切り出すことができるので、文字認識の精度は
高くなり、しかも多くの切出し候補を抽出する必要がな
くなるから認識処理時間も短縮される。
形態について説明する。
施形態を示す概略構成図である。
文字認識装置200は、図2に示した第1の実施形態の
文字認識装置100と同様の文字領域切出部11、特徴
抽出部12、一文字標準パターン辞書14_1と複数文
字標準パターン辞書14_2との双方からなる標準パタ
ーン辞書14、辞書照合部13、および候補文字出力部
15を備えたほかに、検証部16が追加されている。
り、文字領域内の文字パターンの特徴を複数文字標準パ
ターン辞書14_2に記述された文字列の特徴と照合し
た結果文字列の候補が抽出された場合に、特徴抽出部1
2に、上記文字列の候補が抽出された文字領域がさらに
その文字列を構成する文字数と同数に分割されてなる各
分割領域それぞれの文字パターンの特徴を抽出させ、辞
書照合部13に、分割領域それぞれの文字パターンの特
徴を、一文字標準パターン辞書14_1に記述された一
文字それぞれの特徴と照合させて分割領域の配列に対応
した文字列の候補を抽出させ、その文字列の候補が、複
数文字標準パターン辞書14_2を用いて抽出された文
字列の候補と一致するか否かを検証するものである。
設けられる検証部の動作を説明する流れ図であり、図5
は、第2の実施形態における検証の機能の説明図であ
る。
ターンの認識結果であるか否かが判定され(ステップS
1)、判定の結果が複数文字パターンの認識結果である
場合、すなわち、辞書照合部13が、文字領域内の文字
パターンの特徴を複数文字標準パターン辞書14_2に
記述された文字列の特徴と照合した結果、文字列の候補
が抽出された場合に再びその文字領域の切り出しを行う
(ステップS2)。すなわち、特徴抽出部12に、上記
文字列の候補が抽出された文字領域がさらにその文字列
を構成する文字数と同数に分割されてなる各分割領域そ
れぞれの文字パターンの特徴を抽出させる。
ると、辞書照合部13(図3参照)による照合の結果、
複数文字、例えば、「0」の2文字が一つのパターン2
0として認識された場合、文字領域切出部11によりそ
の文字領域の切り出しが行われ、パターン20の垂直方
向の黒画素投影ヒストグラムの極小値を示す位置で分割
が行われる。この例では2文字なのでパターン20_1
とパターン20_2とに2分割される。半角文字が2文
字並んでいる場合には2等分される。
われる(ステップS3)。すなわち、辞書照合部13
は、分割されたそれぞれの文字パターン20_1,20
_2の特徴を、一文字標準パターン辞書14_1に記述
された一文字それぞれの特徴と照合させて分割領域の配
列に対応した文字列の候補を抽出する。
プS4)。すなわち、検証部16は、一文字標準パター
ン辞書14_1を用いて抽出した文字列の候補が、複数
文字標準パターン辞書14_2を用いて抽出した文字列
の候補と一致するか否かを検証する。
5)、一文字標準パターン辞書14_1を用いて抽出し
た文字列の候補が、複数文字標準パターン辞書14_2
を用いて抽出した文字列の候補と一致する場合は、分割
された文字は妥当であると判断し、これらのパターン2
0_1,20_2の文字コード21,22(図5参照)
を候補文字出力部15に出力する。ステップS5におけ
る判定の結果、両者が一致しない場合は分割は不適切で
あるとして分割結果を候補から除外する(ステップS
6)。
れるので、図5に示したような2つの文字どうしが接触
した場合の文字画像からでも正確な文字認識を行うこと
ができる。
形態について説明する。
施形態における文字切り出し方式の説明図である。
2または図3に示した第1または第2の実施形態の文字
認識装置と類似の構成を有しており、文字領域切出部の
機能のみが第1および第2の実施形態の文字認識装置と
相違している。すなわち、第3の実施形態の文字認識装
置の文字領域切出部では、入力された文字画像から文字
幅に相当する長さの文字領域を、文字幅を2つに分割し
たときの一分割分の長さずつずらしながら切り出すよう
構成されている。
10個の全角文字列に相当する文字画像30から文字領
域を切り出す場合について説明する。
と垂直方向に、すなわち、横書き文字列と推定される文
字画像30の場合は、上下方向に投影してヒストグラム
を作成し、そのヒストグラムの極小となる位置を求め、
高さHから判断して文字画像の先頭からHおよびH/2
に相当する距離に現れる極小値の位置の間隔からWおよ
びW/2を推定する。そしてこの文字幅WでピッチをW
/2ずつずらしながら文字領域を切り出していく。
が一文字として切り出され、特徴抽出、辞書照合が行わ
れ、候補が求められる。この文字領域「12」の場合は
複数文字標準パターン辞書14_2(図3参照)の中の
「12」の標準パターンに最も距離が近いので、第2の
実施形態におけると同様な方法で再び文字切出、特徴抽
出、辞書照合、および検証が行われ、文字領域「12」
が2つの文字領域に分割され、「1」および「2」とい
う2文字の候補が得られる。次に、W/2だけずらした
a2の文字領域「23」が一文字として切り出され、文
字領域alの場合と同様な認識処理が行なわれ、「2」
および「3」という2文字の候補が得られる。同様にし
て、文字領域a3,a4,・・・が認識処理され、
「3」および「4」という2文字の候補、「4」および
「5」という2文字の候補、・・・が得られる。
出された文字領域それぞれについて文字あるいは文字列
の候補を抽出するとともに抽出された文字あるいは文字
列の候補を総合して文字配列の候補を抽出し候補文字出
力部に出力する。
角文字と半角文字とが混在している文字画像であっても
正確な文字認識を行うことができる。
すような接触文字の場合にも正確な文字認識を行うこと
ができる。
出し方式による他の処理例を示す図である。
1つの「1」と、互いに接触した7つの「0」とが含ま
れている。この文字画像40の場合にも、図6における
と同様に、先ずalの文字領域「10」が一文字として
切り出され、特徴抽出、辞書照合が行われ、候補が求め
られる。この文字領域「10」の場合は複数文字標準パ
ターン辞書14_2(図3参照)の中の「10」の標準
パターンに最も距離が近いので、第2の実施形態におけ
ると同様の方法により「1」および「0」という2文字
の候補が得られる。次に、W/2だけずらしたa2の文
字領域「00」が一文字として切り出され、「0」およ
び「0」という2文字の候補が得られる。同様にして、
a3,a4,・・・の領域が処理される。
出された文字領域それぞれについて文字あるいは文字列
の候補を抽出するとともに抽出された文字あるいは文字
列の候補を総合して文字配列の候補を抽出し候補文字出
力部に出力する。
合う文字どうしが接触した文字画像であっても正確な文
字認識を行うことができる。
形態について説明する。
2または図3に示した文字認識装置100,200とほ
ぼ同様の構成を有しているが、この実施形態の辞書照合
部は、文字認識不能領域が残った場合に、その文字パタ
ーンの特徴を一文字標準パターン辞書14_1に記述さ
れた一文字それぞれの特徴と照合して文字候補を抽出す
るよう構成されている。
施形態における文字切り出し方式の説明図である。
文字の並びの中に半角に相当する文字幅で濁点あるいは
空白が混入した文字画像50の場合は、図8(b)に示
すように、先ず、第2および第3の実施形態におけると
同様の方法により平均高さHから文字幅Wを推定し、文
字画像50の左端から文字幅Wで文字領域al「カ」を
切り出してカタカナの「カ」が認識される。次に、W/
2だけ切出位置をずらして文字幅Wで文字領域a2を切
り出して認識処理をおこなう。しかしこの文字領域a2
は辞書とマッチングしないので文字候補は得られない。
以下同様にして、a3、a4、a5、a6、の各文字領
域の切り出し、認識処理が続けられる。
域a3、および文字領域a6はそれぞれカタカナ文字
「カ」、カタカナ文字「カ」、およびカタカナ文字
「ク」として認識されるが、文字領域a2、文字領域a
4、および文字領域a5は辞書照合の結果、リジェクト
される。このように切出位置をW/2ずつずらした結果
得られた文字候補は本実施形態の辞書照合部により総合
され、文字配列の候補として抽出される。図8の例で
は、文字領域a1から得られた文字「カ」と文字領域a
3から得られた文字「カ」とが総合された文字配列「カ
カ」が得られるが、文字領域a3から得られた文字
「カ」と文字領域a6から得られた文字「ク」との間に
文字認識不能な文字認識不能領域a7が残ってしまう。
認識不能領域a7は半角文字に相当する文字領域である
ことから、この文字認識不能領域a7の文字パターンの
特徴を一文字標準パターン辞書14_1(図2,2参
照)に記述された一文字それぞれの特徴と照合して文字
候補を抽出しなおすことにより文字認識不能領域a7を
半角濁点として認識する。こうして、図8(b)に示す
文字列から図8(c)に示すような認識結果が得られ
る。
不能領域の処理の流れ図である。
認識結果を求め(ステップS11)、文字領域al〜a
nの中に認識不能領域があるか否かが判定され(ステッ
プS12)、認識不能領域がある場合は、認識不能領域
を一文字とみなして一文字標準パターン辞書14_1を
用いて辞書参照を行い文字候補を求める。
では、半角一文字が全角の文字の間に混入していてもそ
れを正確に認識することができる。また、図8(a)に
示すように半角の空白が全角の文字の間に混入している
場合についても上記の半角濁点の場合と同様に正確に認
識することができる。
装置によれば、標準的な文字一文字それぞれの特徴が記
述された一文字標準パターン辞書と標準的な文字が所定
数配列されてなる文字列それぞれの特徴が記述された複
数文字標準パターン辞書との双方からなる標準パターン
辞書を用いて文字認識を行うので、通常の伝票に記入す
るような不規則な間隔、記入の仕方で記入された文字列
でも、全角文字、半角文字の混在した印刷文字列でも高
精度に文字を切り出して認識することが可能であり、文
字認識の難しい文字画像からでも正確にかつ高速で文字
認識することが可能な文字認識装置を実現することがで
きる。
タの外観図(a)および内部構成図(b)である。
る機能ブロック図である。
概略構成図である。
証部の動作を説明する流れ図である。
る。
る文字切り出し方式の説明図である。
る他の処理例を示す図である。
る処理例を示す図である。
理の流れ図である。
Claims (5)
- 【請求項1】 入力された文字画像から文字幅を推定し
て該文字画像から該文字幅に相当する長さの文字領域を
切り出す文字領域切出部と、 前記文字領域切出部により切り出された文字領域内の文
字パターンの特徴を抽出する特徴抽出部と、 標準的な文字一文字それぞれの特徴が記述された一文字
標準パターン辞書と標準的な文字が所定数配列されてな
る文字列それぞれの特徴が記述された複数文字標準パタ
ーン辞書との双方からなる標準パターン辞書と、 前記特徴抽出部で抽出された、文字領域内の文字パター
ンの特徴を、前記標準パターン辞書を構成する前記一文
字標準パターン辞書および前記複数文字標準パターン辞
書に記述された一文字および文字列それぞれの特徴と照
合して該文字領域内の文字パターンが表す文字あるいは
文字列の候補を抽出する辞書照合部とを備えたことを特
徴とする文字認識装置。 - 【請求項2】 前記辞書照合部により、前記文字領域内
の文字パターンの特徴を前記複数文字標準パターン辞書
に記述された文字列の特徴と照合した結果文字列の候補
が抽出された場合に、前記特徴抽出部に、文字列の候補
が抽出された文字領域がさらに該文字列を構成する文字
数と同数に分割されてなる各分割領域それぞれの文字パ
ターンの特徴を抽出させ、前記辞書照合部に、前記分割
領域それぞれの文字パターンの特徴を、前記一文字標準
パターン辞書に記述された一文字それぞれの特徴と照合
させて前記分割領域の配列に対応した文字列の候補を抽
出させ、該文字列の候補が、前記複数文字標準パターン
辞書を用いて抽出された文字列の候補と一致するか否か
を検証する検証部を備えたことを特徴とする請求項1記
載の文字認識装置。 - 【請求項3】 前記文字領域切出部が、前記文字画像か
ら前記文字幅に相当する長さの文字領域を、該文字幅を
前記所定数と同数に分割したときの一分割分の長さずつ
ずらしながら切り出すものであることを特徴とする請求
項1又は2記載の文字認識装置。 - 【請求項4】 前記辞書照合部が、前記文字領域切出部
により切り出された文字領域それぞれについて文字ある
いは文字列の候補を抽出するとともに抽出された文字あ
るいは文字列の候補を総合して文字配列の候補を抽出す
るものであることを特徴とする請求項3記載の文字認識
装置。 - 【請求項5】 前記辞書照合部が、文字認識不能な文字
認識不能領域が残った場合に、前記文字認識不能領域の
文字パターンの特徴を前記一文字標準パターン辞書に記
述された一文字それぞれの特徴と照合して文字候補を抽
出するものであることを特徴とする請求項4記載の文字
認識装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12605399A JP4280355B2 (ja) | 1999-05-06 | 1999-05-06 | 文字認識装置 |
| KR1019990047465A KR100582039B1 (ko) | 1999-05-06 | 1999-10-29 | 문자 인식 장치 |
| CNB99123281XA CN1181446C (zh) | 1999-05-06 | 1999-11-01 | 文字识别装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12605399A JP4280355B2 (ja) | 1999-05-06 | 1999-05-06 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000315247A true JP2000315247A (ja) | 2000-11-14 |
| JP4280355B2 JP4280355B2 (ja) | 2009-06-17 |
Family
ID=14925485
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP12605399A Expired - Fee Related JP4280355B2 (ja) | 1999-05-06 | 1999-05-06 | 文字認識装置 |
Country Status (3)
| Country | Link |
|---|---|
| JP (1) | JP4280355B2 (ja) |
| KR (1) | KR100582039B1 (ja) |
| CN (1) | CN1181446C (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005301664A (ja) * | 2004-04-12 | 2005-10-27 | Fuji Xerox Co Ltd | 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム |
| JP2005352653A (ja) * | 2004-06-09 | 2005-12-22 | Omron Corp | 文字認識装置 |
| JP2008084105A (ja) * | 2006-09-28 | 2008-04-10 | Oki Electric Ind Co Ltd | 文字切出方法及び文字認識装置 |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004056266A (ja) * | 2002-07-17 | 2004-02-19 | Ricoh Co Ltd | 像域分離装置、画像処理装置、画像形成装置、プログラム及び記憶媒体 |
| KR100598115B1 (ko) * | 2004-08-31 | 2006-07-10 | 삼성전자주식회사 | 고속 문자인식방법 및 장치 |
| CN101226596B (zh) * | 2007-01-15 | 2012-02-01 | 夏普株式会社 | 文档图像处理装置以及文档图像处理方法 |
| CN101354704B (zh) * | 2007-07-23 | 2011-01-12 | 夏普株式会社 | 字形特征字典制作装置及具备该装置的文档图像处理装置 |
| CN101354703B (zh) * | 2007-07-23 | 2010-11-17 | 夏普株式会社 | 文档图像处理装置和文档图像处理方法 |
| CN101493896B (zh) * | 2008-01-24 | 2013-02-06 | 夏普株式会社 | 文档图像处理装置及文档图像处理方法 |
| CN101763505B (zh) * | 2009-12-29 | 2011-12-07 | 重庆大学 | 基于投影对称性的车牌字符特征提取及分类方法 |
| CN102867178B (zh) * | 2011-07-05 | 2015-06-10 | 富士通株式会社 | 汉字识别方法和装置 |
| CN105869140A (zh) * | 2015-11-24 | 2016-08-17 | 乐视致新电子科技(天津)有限公司 | 图像处理方法和装置 |
| CN107016392A (zh) * | 2016-01-27 | 2017-08-04 | 四川效率源信息安全技术股份有限公司 | 一种去除图片中文字边框的方法 |
| CN107071179A (zh) * | 2017-04-25 | 2017-08-18 | 北京小米移动软件有限公司 | 日程管理方法及装置 |
| JP6729486B2 (ja) * | 2017-05-15 | 2020-07-22 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、情報処理プログラム及び情報処理方法 |
| KR102570961B1 (ko) * | 2020-10-21 | 2023-08-25 | 엄혜용 | 온라인 게임 내에서 문자를 인식하는 텍스트 마이닝 장치 |
| CN114219931B (zh) * | 2021-12-17 | 2025-08-19 | 金科览智科技(北京)有限公司 | 一种印章文字的识别方法以及系统 |
| KR20230164347A (ko) * | 2022-05-25 | 2023-12-04 | (주)그리드원 | Ocr 대상 문자열에 대한 문자열 보정 방법 및 상기 문자열 보정 방법을 수행하는 컴퓨팅 장치 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07152877A (ja) * | 1993-12-01 | 1995-06-16 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
| JP2988304B2 (ja) * | 1995-02-23 | 1999-12-13 | 松下電器産業株式会社 | 文字列管理装置 |
| JP2751865B2 (ja) * | 1995-04-17 | 1998-05-18 | 日本電気株式会社 | 文字列認識装置 |
| JPH09245120A (ja) * | 1996-03-11 | 1997-09-19 | Hitachi Ltd | 文字切出し方法 |
| TW421764B (en) * | 1996-05-21 | 2001-02-11 | Hitachi Ltd | Input character string estimation and identification apparatus |
| JPH09326012A (ja) * | 1996-06-05 | 1997-12-16 | Oki Electric Ind Co Ltd | 文字認識装置および文字認識方法 |
| JP3452774B2 (ja) * | 1997-10-16 | 2003-09-29 | 富士通株式会社 | 文字認識方法 |
-
1999
- 1999-05-06 JP JP12605399A patent/JP4280355B2/ja not_active Expired - Fee Related
- 1999-10-29 KR KR1019990047465A patent/KR100582039B1/ko not_active Expired - Fee Related
- 1999-11-01 CN CNB99123281XA patent/CN1181446C/zh not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005301664A (ja) * | 2004-04-12 | 2005-10-27 | Fuji Xerox Co Ltd | 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム |
| JP2005352653A (ja) * | 2004-06-09 | 2005-12-22 | Omron Corp | 文字認識装置 |
| JP2008084105A (ja) * | 2006-09-28 | 2008-04-10 | Oki Electric Ind Co Ltd | 文字切出方法及び文字認識装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4280355B2 (ja) | 2009-06-17 |
| KR100582039B1 (ko) | 2006-05-23 |
| KR20000075420A (ko) | 2000-12-15 |
| CN1273401A (zh) | 2000-11-15 |
| CN1181446C (zh) | 2004-12-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Spitz | Determination of the script and language content of document images | |
| KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
| US6341176B1 (en) | Method and apparatus for character recognition | |
| EP1016033B1 (en) | Automatic language identification system for multilingual optical character recognition | |
| KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
| JP4280355B2 (ja) | 文字認識装置 | |
| EP1703444A2 (en) | Detecting an orientation of characters in a document image | |
| US7454063B1 (en) | Method of optical character recognition using feature recognition and baseline estimation | |
| JP2001283152A (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| US11551461B2 (en) | Text classification | |
| JPH1011531A (ja) | 帳票読取装置 | |
| Okamoto et al. | Performance evaluation of a robust method for mathematical expression recognition | |
| JP2730665B2 (ja) | 文字認識装置および方法 | |
| JPH04195692A (ja) | 文書読取装置 | |
| Baird | Global-to-local layout analysis | |
| Chaudhuri et al. | Extraction of type style-based meta-information from imaged documents | |
| Kumar et al. | Line based robust script identification for indianlanguages | |
| JP4194020B2 (ja) | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 | |
| JP2917427B2 (ja) | 図面読取装置 | |
| JPH07319880A (ja) | キーワード抽出・検索装置 | |
| JP3428504B2 (ja) | 文字認識装置 | |
| JP2906758B2 (ja) | 文字読取装置 | |
| JP2697790B2 (ja) | 文字タイプ決定方法 | |
| JP2008084105A (ja) | 文字切出方法及び文字認識装置 | |
| JP2866920B2 (ja) | 標準パターン作成方法及び装置並びに文字認識装置及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060323 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081209 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090205 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090310 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090316 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140319 Year of fee payment: 5 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |