JPH01292487A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH01292487A JPH01292487A JP63122271A JP12227188A JPH01292487A JP H01292487 A JPH01292487 A JP H01292487A JP 63122271 A JP63122271 A JP 63122271A JP 12227188 A JP12227188 A JP 12227188A JP H01292487 A JPH01292487 A JP H01292487A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- smoothing
- black
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
以下の順序で本発明を説明する。
A産業上の利用分野
B発明の概要
C従来の技術
り発明が解決しようとする問題点(第2図)E問題点を
解決するための手段(第1図、第3図、第6図及び第8
図) 2作用(第1図及び第8図) G実施例 (G1)文字認識装置の実施例(第1図〜第10図)(
G2)他の実施例 H発明の効果 A産業上の利用分野 本発明は文字認識装置に関し、特に印刷文字を認識する
場合に通用して好適なものである。
解決するための手段(第1図、第3図、第6図及び第8
図) 2作用(第1図及び第8図) G実施例 (G1)文字認識装置の実施例(第1図〜第10図)(
G2)他の実施例 H発明の効果 A産業上の利用分野 本発明は文字認識装置に関し、特に印刷文字を認識する
場合に通用して好適なものである。
B発明の概要
本発明は、文字認識装置において、イメージ文字情報か
ら抽出された文字パターンをスムージング処理するよう
にしたことにより、文字認識速度を一段と向上させるこ
とができる。
ら抽出された文字パターンをスムージング処理するよう
にしたことにより、文字認識速度を一段と向上させるこ
とができる。
C従来の技術
従来、大量の印刷文書を電子化してファイリングしたり
、データベース化して多様な用途に対応できるような情
報網を構築することが提案されており、印刷文書の電子
化手段も人手による入力操作が必要な文字情報入力装置
に代えて、人手による入力操作が不必要な文字認識装置
を用いることが考えられている。
、データベース化して多様な用途に対応できるような情
報網を構築することが提案されており、印刷文書の電子
化手段も人手による入力操作が必要な文字情報入力装置
に代えて、人手による入力操作が不必要な文字認識装置
を用いることが考えられている。
因は印刷文字認識装置は一般に、印刷文書上の印刷文字
を光学的に読み取って2次元的なイメージ情報として電
子化し、当該イメージ情報から印刷された文字を取り出
して対応する文字コードを出力するようになされている
。
を光学的に読み取って2次元的なイメージ情報として電
子化し、当該イメージ情報から印刷された文字を取り出
して対応する文字コードを出力するようになされている
。
このようにしてイメージ情報を文字コードにコード化す
ることにより、電子計算機を用いて単語を検索したり、
意味を理解したりするような解読処理を自動的に実行す
るような文書処理システムを実現できる。
ることにより、電子計算機を用いて単語を検索したり、
意味を理解したりするような解読処理を自動的に実行す
るような文書処理システムを実現できる。
かくするにつき、例えばイメージ情報から取り出したデ
ータを必要に応じて圧縮して解読処理に供することがで
きることにより、文書の処理速度を必要に応じて向上さ
せることができると考えられる。
ータを必要に応じて圧縮して解読処理に供することがで
きることにより、文書の処理速度を必要に応じて向上さ
せることができると考えられる。
D発明が解決しようとする問題点
ところが現在用いられている印刷漢字認識装置は、実際
上識別率として97〜99%程度に高い識別能力をもっ
ているが、識別速度としてはlO〜30文字/秒程度の
機能をもつに過ぎず、大量の印刷文書を電子化するため
の入力手段としては未だ不十分である。
上識別率として97〜99%程度に高い識別能力をもっ
ているが、識別速度としてはlO〜30文字/秒程度の
機能をもつに過ぎず、大量の印刷文書を電子化するため
の入力手段としては未だ不十分である。
識別速度を向上させる方法として従来、イメージ情報か
ら切り出された入力情報の特徴(例えば4辺のペリフェ
ラル特徴)に基づいて特@量を検出して大分類辞書から
候補文字を選出するような大分類処理を実行し、当該候
補文字についてパターンマツチングに基づく細分類処理
を実行することによって最も類億した文字を決定するよ
うな文字認識方法が提案されている(特開昭62−18
6390号公報)。
ら切り出された入力情報の特徴(例えば4辺のペリフェ
ラル特徴)に基づいて特@量を検出して大分類辞書から
候補文字を選出するような大分類処理を実行し、当該候
補文字についてパターンマツチングに基づく細分類処理
を実行することによって最も類億した文字を決定するよ
うな文字認識方法が提案されている(特開昭62−18
6390号公報)。
このように大分類処理と細分類処理とを階層的に実行す
る文字認識方法は、特に形状、位置等に特殊な特徴がな
い文字(すなわち通常文字)を識別する際には識別能力
を一段と高めることができる利点があることが確認され
ている。
る文字認識方法は、特に形状、位置等に特殊な特徴がな
い文字(すなわち通常文字)を識別する際には識別能力
を一段と高めることができる利点があることが確認され
ている。
ところが実際上印刷文書から2次元的なイメージ情報を
得る手段として一般にイメージスキャナが用いられてい
るが、光学的光情報を電気的な2値情報に変換する際に
、印刷文字の周縁部分において細かい凹凸が生ずること
を避は得ない問題がある。
得る手段として一般にイメージスキャナが用いられてい
るが、光学的光情報を電気的な2値情報に変換する際に
、印刷文字の周縁部分において細かい凹凸が生ずること
を避は得ない問題がある。
例えば第2図に示すように、 「娃」の文字をイメー
ジスキャナによって読み取ることにより得られるイメー
ジ情報から形成した文字パターンPTIIOJIにおい
て、僅かに右上がりに傾斜する文字部の上側辺又は上側
辺の境界部分に1ドラトル数ドツト分の「白」ドツトを
挟んで1ドラトル数ドツト分の「黒」ドツトを配列した
ような凹凸パターン部分DBKOが生ずることが観察さ
れる。
ジスキャナによって読み取ることにより得られるイメー
ジ情報から形成した文字パターンPTIIOJIにおい
て、僅かに右上がりに傾斜する文字部の上側辺又は上側
辺の境界部分に1ドラトル数ドツト分の「白」ドツトを
挟んで1ドラトル数ドツト分の「黒」ドツトを配列した
ような凹凸パターン部分DBKOが生ずることが観察さ
れる。
この凹凸パターン部分DEKOは識別対象となる標準印
刷文字から得たイメージ情報について発生しているもの
で、イメージスキャナに光電変換素子として設けられて
いるイメージセンサの配列によって決まるような凹凸形
状を呈し、微視的に見たとき当該文字「娃」の文字パタ
ーンPTや。Jlの特徴を表しているということができ
る。
刷文字から得たイメージ情報について発生しているもの
で、イメージスキャナに光電変換素子として設けられて
いるイメージセンサの配列によって決まるような凹凸形
状を呈し、微視的に見たとき当該文字「娃」の文字パタ
ーンPTや。Jlの特徴を表しているということができ
る。
ところが文字パターンPT、。、1の周辺から見た凹凸
形状を特徴として把握するようなペリフェラル特徴抽出
手法によって文字の認識をしようとする場合、文字部の
周縁部に生ずる凹凸パターン部分DBKOをペリフェラ
ル特徴の一要素としてその特徴量を抽出すると、文字の
特徴が不必要に複雑になるおそれがある0文字の特徴が
複雑になると、大分類処理が複雑になり、その結果文字
の誤認識を生ずる確率が高くなるために文字認識速度を
劣化させる原因になるおそれがある。
形状を特徴として把握するようなペリフェラル特徴抽出
手法によって文字の認識をしようとする場合、文字部の
周縁部に生ずる凹凸パターン部分DBKOをペリフェラ
ル特徴の一要素としてその特徴量を抽出すると、文字の
特徴が不必要に複雑になるおそれがある0文字の特徴が
複雑になると、大分類処理が複雑になり、その結果文字
の誤認識を生ずる確率が高くなるために文字認識速度を
劣化させる原因になるおそれがある。
本発明は以上の点を考慮してなされたもので、イメージ
スキャナによって発生されたイメージ文字情報に含まれ
ている凹凸パターン部分の形状を文字パターンの主要な
特徴を損なわせることなく簡略化することにより、文字
認識速度を劣化させる原因を未然に防止し得るようにし
た文字認識装置を提案しようとするものである。
スキャナによって発生されたイメージ文字情報に含まれ
ている凹凸パターン部分の形状を文字パターンの主要な
特徴を損なわせることなく簡略化することにより、文字
認識速度を劣化させる原因を未然に防止し得るようにし
た文字認識装置を提案しようとするものである。
E問題点を解決するための手段
かかる問題点を解決するため本発明においては、文字列
信号S4から切り出した2値データでなる文字パターン
入力データD A T A t Hのうち、注目画素P
E、、□及びその隣接画素PENFI〜PENr*でな
る比較パターンPTcoやをスムージング標準パターン
PTmtyと比較し、一致したとき注目画素PE0IJ
のデータを反転させることによりスムージング処理パタ
ーンF’Tsszを得、当該スムージング処理パターン
PTsに2でなる文字パターン出力データD A T
Aoutに基づいて文字識別処理を実行するようにする
。
信号S4から切り出した2値データでなる文字パターン
入力データD A T A t Hのうち、注目画素P
E、、□及びその隣接画素PENFI〜PENr*でな
る比較パターンPTcoやをスムージング標準パターン
PTmtyと比較し、一致したとき注目画素PE0IJ
のデータを反転させることによりスムージング処理パタ
ーンF’Tsszを得、当該スムージング処理パターン
PTsに2でなる文字パターン出力データD A T
Aoutに基づいて文字識別処理を実行するようにする
。
F作用
注目画素PE0IJ及びその隣接画素PENFI〜PE
NFIでなる比較パターンPTcoxがスムージング標
準パターンPTmtrと一致したとき注目画素PE0I
Jのデータを反転させるようなスムージング処理をする
ことにより、注目画素PE0IJが黒字文字部から突出
した黒字部分であったり、黒字文字部に白地画素が混在
していたり、黒字文字部に孤立した白地画素が混在した
り、白地背景部に孤立した黒字画素が混在したりするよ
うな場合に、これを必要に応じて除去したり埋め込むこ
とができることにより、文字パターンの周辺の凹凸形状
を一段と単純化し得る。
NFIでなる比較パターンPTcoxがスムージング標
準パターンPTmtrと一致したとき注目画素PE0I
Jのデータを反転させるようなスムージング処理をする
ことにより、注目画素PE0IJが黒字文字部から突出
した黒字部分であったり、黒字文字部に白地画素が混在
していたり、黒字文字部に孤立した白地画素が混在した
り、白地背景部に孤立した黒字画素が混在したりするよ
うな場合に、これを必要に応じて除去したり埋め込むこ
とができることにより、文字パターンの周辺の凹凸形状
を一段と単純化し得る。
かくして文字識別部における識別精度を高めることがで
きることにより、この分会体として文字識別速度を一段
と向上させることができる。
きることにより、この分会体として文字識別速度を一段
と向上させることができる。
G実施例
以下図面について、本発明の一実施例を詳述する。
(Gl)文字認識装置の実施例
第3図において、1は全体として文字認識装置を示し、
原稿読取部2において得られたイメージ読取信号S1を
雑音除去手段4−に与える。
原稿読取部2において得られたイメージ読取信号S1を
雑音除去手段4−に与える。
雑音除去手段4は、イメージ読取信号St内に含まれて
いるいわゆる孤立点についての雑音を除去することによ
り、誤って当該孤立点を文字の一部であると認識するお
それを回避するように動作する。
いるいわゆる孤立点についての雑音を除去することによ
り、誤って当該孤立点を文字の一部であると認識するお
それを回避するように動作する。
雑音除去手段4の雑音除去出力S2は文字切出部5の回
転補正手段6に与えられ、文書の回転誤差を補正した後
その補正出力S3を文字列抽出手段7に供給する。
転補正手段6に与えられ、文書の回転誤差を補正した後
その補正出力S3を文字列抽出手段7に供給する。
文字列抽出手段7は、印刷文書のうち、文字領域を他の
領域(例えば写真、図面等の領域)から区分けして文字
領域に含まれるイメージ文字データだけを抽出すると共
に、当該文字領域に含まれる文字列が横書であることを
確認した後文字列の抽出をする。
領域(例えば写真、図面等の領域)から区分けして文字
領域に含まれるイメージ文字データだけを抽出すると共
に、当該文字領域に含まれる文字列が横書であることを
確認した後文字列の抽出をする。
この文字列の抽出は、第4図に示すように、文字領域A
Rの各ドツトの位置を、列方向(水平方向)に取ったX
軸及び行方向(垂直方向)に取ったy軸でなるxy座標
で表すようにし、文字領域ARを構成する文字列ARI
、AR2・・・・・・に含まれる論理「1」レベルのド
ツト(黒い文字部のドツトを表す)の和の値をy軸上に
投影して(これをy投影と呼ぶ)、y投影信号S、を得
る。
Rの各ドツトの位置を、列方向(水平方向)に取ったX
軸及び行方向(垂直方向)に取ったy軸でなるxy座標
で表すようにし、文字領域ARを構成する文字列ARI
、AR2・・・・・・に含まれる論理「1」レベルのド
ツト(黒い文字部のドツトを表す)の和の値をy軸上に
投影して(これをy投影と呼ぶ)、y投影信号S、を得
る。
ここで、 文字列ARI、AR2・・・・・・の間の行
間位置には黒い文字部がないことがらy投影信号Syの
信号レベルが「0」レベルになるのに対して、文字列A
RI、AR2・・・・・・に対応するy軸上の位置では
、文字列に含まれている各文字をX軸と平行なうイン上
のトータルドツト数に対応する信号レベルになる。そこ
でy投影信号Syを所定のスレショルドレベルと比較し
、当8亥スレショルドレベル以上の区間の間論理「1」
レベルに立ち上がる文字列切出データCLを得ることが
できる。
間位置には黒い文字部がないことがらy投影信号Syの
信号レベルが「0」レベルになるのに対して、文字列A
RI、AR2・・・・・・に対応するy軸上の位置では
、文字列に含まれている各文字をX軸と平行なうイン上
のトータルドツト数に対応する信号レベルになる。そこ
でy投影信号Syを所定のスレショルドレベルと比較し
、当8亥スレショルドレベル以上の区間の間論理「1」
レベルに立ち上がる文字列切出データCLを得ることが
できる。
文字列抽出手段7はこの文字列切出データCLを用いて
回転補正手段6から与えられる補正出力S3のうち、当
該文字列切出データCLが論理「1」になっている期間
の信号部分を、各行の文字列ARI、AR2・・・・・
・の文字列信号S4として文字切出手段8に供給する。
回転補正手段6から与えられる補正出力S3のうち、当
該文字列切出データCLが論理「1」になっている期間
の信号部分を、各行の文字列ARI、AR2・・・・・
・の文字列信号S4として文字切出手段8に供給する。
このようにして文字列切出データCLが論理「1」レベ
ルに立ち上がる区間は当該文字列ARI、AR2・・・
・・・の行の最大高さHL(=HL1、HL2・・・・
・・)を表すことになり、各行に含まれる文字の高さ方
向(すなわちy軸方向)の位置は、当該行の最大高さH
L (−HLI、HL2・・・・・・)の範囲に生ずる
ことになる。
ルに立ち上がる区間は当該文字列ARI、AR2・・・
・・・の行の最大高さHL(=HL1、HL2・・・・
・・)を表すことになり、各行に含まれる文字の高さ方
向(すなわちy軸方向)の位置は、当該行の最大高さH
L (−HLI、HL2・・・・・・)の範囲に生ずる
ことになる。
文字切出手段8は各行の文字列API、AR2・・・・
・・に含まれている各文字及び文字の構成文字部分(分
離文字の場合)が存在する位置及び範囲をX方向及びy
方向について検出することにより、第5図に示すように
、各文字及び構成文字部分に外接するように取り囲む高
さh及び幅Wの外接枠WAKUによって囲まれる矩形領
域CHRとして切り出すような処理を実行する。なお、
Pは全角文字の平均文字ピッチ、dは矩形間隔を示す。
・・に含まれている各文字及び文字の構成文字部分(分
離文字の場合)が存在する位置及び範囲をX方向及びy
方向について検出することにより、第5図に示すように
、各文字及び構成文字部分に外接するように取り囲む高
さh及び幅Wの外接枠WAKUによって囲まれる矩形領
域CHRとして切り出すような処理を実行する。なお、
Pは全角文字の平均文字ピッチ、dは矩形間隔を示す。
かくして外接枠WAKUによって囲まれた矩形領域CH
Rの内部に、第2図について上述したように、文字パタ
ーンMOJIのうち黒い文字部のドツトを論理「1」レ
ベルで表し、かつ白い背景部のドツトを論理「0」レベ
ルで表してなる時間直列的な2植体号構成の文字パター
ン入力データDATA、、を形成する。
Rの内部に、第2図について上述したように、文字パタ
ーンMOJIのうち黒い文字部のドツトを論理「1」レ
ベルで表し、かつ白い背景部のドツトを論理「0」レベ
ルで表してなる時間直列的な2植体号構成の文字パター
ン入力データDATA、、を形成する。
文字切出手段8は文字パターン入力データDAT A
I Nを第6図のスムージング回路15によってスムー
ジング処理することにより、第7図に示すような文字パ
ターン出力データD A T A ouyを得てこれを
入力文字情報S5として文字識別部9に送出する。
I Nを第6図のスムージング回路15によってスムー
ジング処理することにより、第7図に示すような文字パ
ターン出力データD A T A ouyを得てこれを
入力文字情報S5として文字識別部9に送出する。
スムージング回路15は、文字パターン入力データDA
TAIN(第2図)を構成する各ドツトの画素について
、第8図に示すように、当該画素を注目画素PE0IJ
とし、かつその周囲を取り囲む8個の隣接画素PE、4
□〜PENFIIで構成される比較入カバターンPTC
O)Iを、第1図(A) 〜(F)に示すスムージング
標準パターンPT□、と比較して、一致したとき次式 %式% のように、 比較パターンp’rcoやの注目画素PE
0IJのデータrPEomJJに対して論理rlJを排
他的論理和演算することにより、スムージング処理パタ
ーンPTs、4zの注目画素のデータを反転させるよう
なスムージング処理を実行するようになされている。
TAIN(第2図)を構成する各ドツトの画素について
、第8図に示すように、当該画素を注目画素PE0IJ
とし、かつその周囲を取り囲む8個の隣接画素PE、4
□〜PENFIIで構成される比較入カバターンPTC
O)Iを、第1図(A) 〜(F)に示すスムージング
標準パターンPT□、と比較して、一致したとき次式 %式% のように、 比較パターンp’rcoやの注目画素PE
0IJのデータrPEomJJに対して論理rlJを排
他的論理和演算することにより、スムージング処理パタ
ーンPTs、4zの注目画素のデータを反転させるよう
なスムージング処理を実行するようになされている。
第1図(A)の場合のスムージング標準パターンP T
++wv (= P T*Er++〜PTIEF14
)は文字パターン入力データD A T A IN (
第2図)の凹凸パターン部分DEKOのうち、注目画素
PE0IJの部分が1画素分だけ黒い文字部から外方に
突出したような比較入カバターンPTcosが到来した
場合に適用するもので、このときスムージング回路15
は当該突出した画素を取り去るようなスムージング処理
をすることによりスムージング処理パターンP Tsn
z (−P Tstz+”)を得る。
++wv (= P T*Er++〜PTIEF14
)は文字パターン入力データD A T A IN (
第2図)の凹凸パターン部分DEKOのうち、注目画素
PE0IJの部分が1画素分だけ黒い文字部から外方に
突出したような比較入カバターンPTcosが到来した
場合に適用するもので、このときスムージング回路15
は当該突出した画素を取り去るようなスムージング処理
をすることによりスムージング処理パターンP Tsn
z (−P Tstz+”)を得る。
また第1図(B)のスムージング標準パターンPT*t
v (−PTatrz+〜P Txtrz* )は、
白い背景部が注目画素PE0IJの部分において1画素
分だけ黒い文字部分の中に食い込むような比較入カバタ
ーンPTC。イが到来した場合に適用するもので、この
場合スムージング回路15は当該食い込んだ白い画素を
黒い画素で埋め込むようなスムージング処理をした後ス
ムージング処理パターンPT*Mz (=PTsw。
v (−PTatrz+〜P Txtrz* )は、
白い背景部が注目画素PE0IJの部分において1画素
分だけ黒い文字部分の中に食い込むような比較入カバタ
ーンPTC。イが到来した場合に適用するもので、この
場合スムージング回路15は当該食い込んだ白い画素を
黒い画素で埋め込むようなスムージング処理をした後ス
ムージング処理パターンPT*Mz (=PTsw。
)を得る。
また第1図(C)のスムージング標準パターンPTtt
tv (=PTmtrs+ 〜PT□。4)は、同様
に黒い文字部に1画素分だけ白い背景画素が食い込んだ
ような比較入カバターンPTco14が到来した場合に
適用するもので、このときスムージング回路15は当該
食い込んだ白い画素部分を黒い画素で埋め込んだと同様
のスムージング処理を実行した後スムージング処理パタ
ーンPTsxz (=PT3□、)を得る。
tv (=PTmtrs+ 〜PT□。4)は、同様
に黒い文字部に1画素分だけ白い背景画素が食い込んだ
ような比較入カバターンPTco14が到来した場合に
適用するもので、このときスムージング回路15は当該
食い込んだ白い画素部分を黒い画素で埋め込んだと同様
のスムージング処理を実行した後スムージング処理パタ
ーンPTsxz (=PT3□、)を得る。
また第1図(D)のスムージング標準パターンPT*t
y (=PT□F4)は、黒い文字部の中に孤立する
ように白い画素が1画素分だけ混在したような比較入カ
バターンPTcoxが到来した場合に適用するもので、
このときスムージング回路15は当該白い画素に黒い画
素を埋め込むようなスム−ジング処理をした後スムージ
ング処理パターンPT□z(”PTs。4)を得る。
y (=PT□F4)は、黒い文字部の中に孤立する
ように白い画素が1画素分だけ混在したような比較入カ
バターンPTcoxが到来した場合に適用するもので、
このときスムージング回路15は当該白い画素に黒い画
素を埋め込むようなスム−ジング処理をした後スムージ
ング処理パターンPT□z(”PTs。4)を得る。
第1図(E)のスムージング標準バタ〜ンPT*wv
(”PTmz□)は、白い背景部分に孤立して黒い画
素が1画素分だけ混在するような比較パターンPTCO
Mが到来した場合に適用するもので、このときスムージ
ング回路15は当該孤立した黒い画素を消し去るような
スムージング処理をした後スムージング処理パターンP
Tsnz (−PTsxzs)を得る。
(”PTmz□)は、白い背景部分に孤立して黒い画
素が1画素分だけ混在するような比較パターンPTCO
Mが到来した場合に適用するもので、このときスムージ
ング回路15は当該孤立した黒い画素を消し去るような
スムージング処理をした後スムージング処理パターンP
Tsnz (−PTsxzs)を得る。
第1図(F)のスムージング標準パターンPT*tr
(−PT□F&)は、例えば交差する線部分のように
、十字状線部の中心画素に白い画素が1画素分だけ混在
したような比較入カバターンPT Cogが到来した場
合に適用するもので、このときスムージング回路15は
当該白い画素を黒い画素で埋め込むようなスムージング
処理をした後スムージング処理パターンPT、。(”
P T s□、)を得る。
(−PT□F&)は、例えば交差する線部分のように
、十字状線部の中心画素に白い画素が1画素分だけ混在
したような比較入カバターンPT Cogが到来した場
合に適用するもので、このときスムージング回路15は
当該白い画素を黒い画素で埋め込むようなスムージング
処理をした後スムージング処理パターンPT、。(”
P T s□、)を得る。
スムージング回路15(第6図)は時間直列データでな
る文字パターン入力データD A T A r yを順
次、1ビツト遅延用シフト回路DLII、DL12.1
ライン遅延用シフト回路DL21.1ビツト遅延用シフ
ト回路DL22、DL23、lライン遅延用シフト回路
DL31.1ビツト遅延用シフト回路DL32、DL;
33を通るように1ビツトずつシフトさせて行くように
なされ、 かくして1ビツト遅延用シフト回路DLI
L DLI2、DL22、DL23、DL32、DL3
3の入力端及び出力端から、 順次比較式カバターンP
TCONを構成する画素P Eur* 、 P EMF
? 、 PENF& −、P ENrs s P Eo
mJSP ENF4、P ENF3 、P ENrz
、P E□、のデータを引き出してROM (read
only memory)変換回路構成のスムージン
グ処理回路SMZに供給するようになされている。
る文字パターン入力データD A T A r yを順
次、1ビツト遅延用シフト回路DLII、DL12.1
ライン遅延用シフト回路DL21.1ビツト遅延用シフ
ト回路DL22、DL23、lライン遅延用シフト回路
DL31.1ビツト遅延用シフト回路DL32、DL;
33を通るように1ビツトずつシフトさせて行くように
なされ、 かくして1ビツト遅延用シフト回路DLI
L DLI2、DL22、DL23、DL32、DL3
3の入力端及び出力端から、 順次比較式カバターンP
TCONを構成する画素P Eur* 、 P EMF
? 、 PENF& −、P ENrs s P Eo
mJSP ENF4、P ENF3 、P ENrz
、P E□、のデータを引き出してROM (read
only memory)変換回路構成のスムージン
グ処理回路SMZに供給するようになされている。
スムージング処理回路SMZは、 第1図(A)〜(F
)について上述したスムージング標準パターンPTmt
rをスムージング処理パターンPT□2に変換するよう
な変換テーブルを有し、これにより文字パターン入力デ
ータD A T A I Nのデータが1ビツトずつシ
フト回路をシフトするごとに、比較入カバターンPT、
。、をスムージング標準パターンPT□7と比較し、一
致するパターンが到来したときこれをスムージング処理
パターンPTsxzに変換して文字パターン出力データ
DA T A outとして送出する。
)について上述したスムージング標準パターンPTmt
rをスムージング処理パターンPT□2に変換するよう
な変換テーブルを有し、これにより文字パターン入力デ
ータD A T A I Nのデータが1ビツトずつシ
フト回路をシフトするごとに、比較入カバターンPT、
。、をスムージング標準パターンPT□7と比較し、一
致するパターンが到来したときこれをスムージング処理
パターンPTsxzに変換して文字パターン出力データ
DA T A outとして送出する。
この実施例の場合文字識別部9は、ペリフェラル特徴に
基づく大分類処理によって候補文字を識別した後、当該
候補文字についてパターンマツチングに基づく細分類処
理を実行するような階層的な識別処理を実行するように
なされている。
基づく大分類処理によって候補文字を識別した後、当該
候補文字についてパターンマツチングに基づく細分類処
理を実行するような階層的な識別処理を実行するように
なされている。
ここでペリフェラル特徴に基づいて文字認識する手法と
しては、特開昭62−186390号公報に開示のもの
を適用し得る。
しては、特開昭62−186390号公報に開示のもの
を適用し得る。
因に文字識別部9は第9図及び第10図に示すように、
4辺形の外接枠WAKUで囲まれた入力文字MOJI
について、その左及び右側辺(これをA辺及びB辺と呼
ぶ)WAKUA及びWAKUl側から見た第1及び第2
のペリフェラル特徴と、上側辺及び上側辺(これを0辺
及び0辺と呼ぶ)WAKUc及びWAKUゎから見た第
3及び第4のペリフェラル特徴に基づいて、白地に対し
て黒い文字部が作る文字構造をコード化してなる特徴量
DcNIIを形成し、この特徴量DC□に基づいて類似
する候補文字を大分類辞書から選出する。
4辺形の外接枠WAKUで囲まれた入力文字MOJI
について、その左及び右側辺(これをA辺及びB辺と呼
ぶ)WAKUA及びWAKUl側から見た第1及び第2
のペリフェラル特徴と、上側辺及び上側辺(これを0辺
及び0辺と呼ぶ)WAKUc及びWAKUゎから見た第
3及び第4のペリフェラル特徴に基づいて、白地に対し
て黒い文字部が作る文字構造をコード化してなる特徴量
DcNIIを形成し、この特徴量DC□に基づいて類似
する候補文字を大分類辞書から選出する。
A辺におけるペリフェラル特徴は、 人力文字MOJI
のうち、 左側辺W A K U aに沿う例えば3ド
ツト目のラインの黒字文字部を、矢印ARAで示す方向
から見たとき、ドツトラインLAより左側にある黒字文
字部の長さdsI 、d s2、ds、をコード化して
特徴量D cMtを形成する。
のうち、 左側辺W A K U aに沿う例えば3ド
ツト目のラインの黒字文字部を、矢印ARAで示す方向
から見たとき、ドツトラインLAより左側にある黒字文
字部の長さdsI 、d s2、ds、をコード化して
特徴量D cMtを形成する。
第1O図の場合、左側文字部MOJIaの左上方の隅部
の走査開始部分(これをスタートコーナと呼ぶ)の長さ
C3がかなり長いことにより、当該左上方の隅部にはド
ツトがないことを表すことができる。
の走査開始部分(これをスタートコーナと呼ぶ)の長さ
C3がかなり長いことにより、当該左上方の隅部にはド
ツトがないことを表すことができる。
これに対して走査終了端にある左下方の隅部(これをエ
ンドコーナと呼ぶ)の長さCeは短いので、当該エンド
コーナにドツトがあることを表すことができる。
ンドコーナと呼ぶ)の長さCeは短いので、当該エンド
コーナにドツトがあることを表すことができる。
かくしてスタートコーナ及びエンドコーナの長さCs及
びCeが所定のスレショルド長さより短いときスタート
コーナ及びエンドコーナに黒字文字部があることを表す
論理「1」のデータを特徴量DCMIの第0及び第1番
目のビットB、及びB、のデータとする。
びCeが所定のスレショルド長さより短いときスタート
コーナ及びエンドコーナに黒字文字部があることを表す
論理「1」のデータを特徴量DCMIの第0及び第1番
目のビットB、及びB、のデータとする。
これに対して、スタートコーナ及びエンドコーナ間に゛
ある黒字文字部の長さds、、da!・・・・・・ds
nが所定のスレショルド長さより短いとき論理「0」の
データを設定しくこのことは当該黒字文字部が短点であ
ることを表す)、これに対して大きいとき論理rlJの
データを設定する(このことは当該黒字文字部が長点で
あることを表す)。
ある黒字文字部の長さds、、da!・・・・・・ds
nが所定のスレショルド長さより短いとき論理「0」の
データを設定しくこのことは当該黒字文字部が短点であ
ることを表す)、これに対して大きいとき論理rlJの
データを設定する(このことは当該黒字文字部が長点で
あることを表す)。
この長さda、 Sds、・・・・・・に対応するデー
タを第2、第3・・・・・・番目のビットのデータBz
sB、・・・・・・とすることによって、 黒字文字部
の長さの配列の仕方(従って短点及び長点の配列の仕方
)、すなわち当該文字MOJIの特徴を可変長コードの
特徴量Dcmとして表すことができる。
タを第2、第3・・・・・・番目のビットのデータBz
sB、・・・・・・とすることによって、 黒字文字部
の長さの配列の仕方(従って短点及び長点の配列の仕方
)、すなわち当該文字MOJIの特徴を可変長コードの
特徴量Dcmとして表すことができる。
このようにして文字識別部9はA辺、B辺、0辺、D辺
についての特徴量DC□でなる特徴量数値データを標準
文字について予め求めて標準文字コードとして大分類辞
書に格納しておき、入力文字情報S5が到来したとき当
該入力文字情報S5がもっている特徴量D CHIと同
じ特徴量Dellを有する標準文字コードを候補文字情
報として細分類処理回路に引き渡すようになされている
。
についての特徴量DC□でなる特徴量数値データを標準
文字について予め求めて標準文字コードとして大分類辞
書に格納しておき、入力文字情報S5が到来したとき当
該入力文字情報S5がもっている特徴量D CHIと同
じ特徴量Dellを有する標準文字コードを候補文字情
報として細分類処理回路に引き渡すようになされている
。
細分類処理回路は当該候補文字情報についての文字パタ
ーンを細分類辞書から読み出して入力文字情報S5の文
字パターンとパターンマツチングをとることにより、最
も確からしい文字を識別し、当該識別結果を認識文字情
報S6として送出する。
ーンを細分類辞書から読み出して入力文字情報S5の文
字パターンとパターンマツチングをとることにより、最
も確からしい文字を識別し、当該識別結果を認識文字情
報S6として送出する。
以上の構成によれば、文字切出手段8のスムージング回
路15においてスムージング処理を実行するようにした
ことにより、文字列信号S4から切り出された文字パタ
ーンPTイ。Jl (第2図)に凹凸パターン部分DE
KOが生じていたとしても、これをスムージング処理で
きることにより第7図に示すように黒字文字部の周辺に
凹凸パターンをもたない文字パターン出力データD A
T A outに変換してから入力文字情報S5とし
て文字識別部に引き渡すことができる。
路15においてスムージング処理を実行するようにした
ことにより、文字列信号S4から切り出された文字パタ
ーンPTイ。Jl (第2図)に凹凸パターン部分DE
KOが生じていたとしても、これをスムージング処理で
きることにより第7図に示すように黒字文字部の周辺に
凹凸パターンをもたない文字パターン出力データD A
T A outに変換してから入力文字情報S5とし
て文字識別部に引き渡すことができる。
第2図及び第7図を比較してみれば明らかなように、
スムージング処理された後の文字パターン出力データD
A T A oatが表す文字パターンPT14゜J
IKはその周辺から見た凹凸形状がスムージング処理前
の文字パターン入力データD A T A I Mの文
字パターンPT工。、Iの場合の凹凸形状と比較して格
段的に単純化されている。
スムージング処理された後の文字パターン出力データD
A T A oatが表す文字パターンPT14゜J
IKはその周辺から見た凹凸形状がスムージング処理前
の文字パターン入力データD A T A I Mの文
字パターンPT工。、Iの場合の凹凸形状と比較して格
段的に単純化されている。
しかも、このようにして単純化された文字パターンPT
MOJIXの周辺の凹凸形状は、入力文字MOJIがも
っている主要な形状的特徴それ自体を大幅に変更するお
それはないので、文字識別部9においてペリフェラル特
微量D eNRを抽出する際に、当該特徴量り、□のデ
ータを不必要に複雑にするおそれを有効に回避し得、こ
の分天分類処理効率を高めることができることにより、
全体として文字Ill速度を向上させることができる。
MOJIXの周辺の凹凸形状は、入力文字MOJIがも
っている主要な形状的特徴それ自体を大幅に変更するお
それはないので、文字識別部9においてペリフェラル特
微量D eNRを抽出する際に、当該特徴量り、□のデ
ータを不必要に複雑にするおそれを有効に回避し得、こ
の分天分類処理効率を高めることができることにより、
全体として文字Ill速度を向上させることができる。
因にペリフェラル特徴についての特徴量D ellのデ
ータが複雑になれば、入力文字MOJrの微細な特徴的
な変化でも特徴量D ellに取り込むことになるので
、文字識別部9においてペリフェラル特徴の抽出結果に
実用上不必要な変動が生ずるおそれがあるが、上述の実
施例によればかがる変動要因を有効に除去し得る。
ータが複雑になれば、入力文字MOJrの微細な特徴的
な変化でも特徴量D ellに取り込むことになるので
、文字識別部9においてペリフェラル特徴の抽出結果に
実用上不必要な変動が生ずるおそれがあるが、上述の実
施例によればかがる変動要因を有効に除去し得る。
(G2)他の実施例
(1) 上述の実施例においては、文字識別部9にお
いてペリフェラル特徴に基づいて識別処理をする場合に
ついて述べたが、文字識別手法として他の識別方法を実
行する場合にも広く本発明を適用し得る。
いてペリフェラル特徴に基づいて識別処理をする場合に
ついて述べたが、文字識別手法として他の識別方法を実
行する場合にも広く本発明を適用し得る。
(2) 上述の実施例においては、スムージング処理
を文字切出手段8において実行することにより、回転補
正手段6、文字列抽出手段7における処理を実行した後
にスムージング処理するようにした場合について述べた
が、これに加えて又はこれに代えて雑音除去手段4にお
いてスムージング処理を実行するようにしても上述の場
合と同様の効果を得ることができる。
を文字切出手段8において実行することにより、回転補
正手段6、文字列抽出手段7における処理を実行した後
にスムージング処理するようにした場合について述べた
が、これに加えて又はこれに代えて雑音除去手段4にお
いてスムージング処理を実行するようにしても上述の場
合と同様の効果を得ることができる。
(3)上述の実施例においては、注目画素PBOIJに
対してこれを取り囲む8つの隣接画素PE、□〜PEu
rsの全てを用いてスムージング処理をするようにした
が、当該8つの隣接画素のうちの一部を省略するように
しても良い。
対してこれを取り囲む8つの隣接画素PE、□〜PEu
rsの全てを用いてスムージング処理をするようにした
が、当該8つの隣接画素のうちの一部を省略するように
しても良い。
H発明の効果
上述のように本発明によれば、イメージ文字情報の文字
パターンの周縁部分に生ずる凹凸パターン部分をスムー
ジング処理することにより、文字パターンの外形形状を
単純化し得ることにより、−段と効率良く文字識別処理
を実行し得るような文字認識装置を容易に実現し得る。
パターンの周縁部分に生ずる凹凸パターン部分をスムー
ジング処理することにより、文字パターンの外形形状を
単純化し得ることにより、−段と効率良く文字識別処理
を実行し得るような文字認識装置を容易に実現し得る。
第1図は本発明による文字認識装置において実行される
スムージング処理に用いられるスムージングパターンを
示す路線図、第2図は文字パターン入力データの文字パ
ターンを示すパターン図、第3図は本発明による文字認
識装置の全体構成を示すブロック図、第4図は文字列の
切出動作の説明に供する路線図、第5図は矩形領域の抽
出動作の説明に供する路線図、第6図はスムージング回
路の構成を示すブロック図、第7図はスムージング処理
された文字パターン出方データの文字パターンを示すパ
ターン図、第8図はスムージング処理すべき比較入カバ
ターンを示す路線図、第9図及び第1O図はべりフェラ
ル特徴の抽出原理を示す路線図である。 1・・・・・・文字認識装置、2・・・・・・原稿読取
部、3・・・・・・文字認識処理部、4・・・・・・雑
音除去手段、5・・・・・・文字切出部、6・・・・・
・回転補正手段、7・・・・・・文字列抽出手段、8・
・・・・・文字切出手段、9・・・・・・文字識別部、
15・・・・・・スムージング回路、DLII〜DL3
3・・・・・・シフト回路、SMZ・・・・・・スムー
ジング処理回路。
スムージング処理に用いられるスムージングパターンを
示す路線図、第2図は文字パターン入力データの文字パ
ターンを示すパターン図、第3図は本発明による文字認
識装置の全体構成を示すブロック図、第4図は文字列の
切出動作の説明に供する路線図、第5図は矩形領域の抽
出動作の説明に供する路線図、第6図はスムージング回
路の構成を示すブロック図、第7図はスムージング処理
された文字パターン出方データの文字パターンを示すパ
ターン図、第8図はスムージング処理すべき比較入カバ
ターンを示す路線図、第9図及び第1O図はべりフェラ
ル特徴の抽出原理を示す路線図である。 1・・・・・・文字認識装置、2・・・・・・原稿読取
部、3・・・・・・文字認識処理部、4・・・・・・雑
音除去手段、5・・・・・・文字切出部、6・・・・・
・回転補正手段、7・・・・・・文字列抽出手段、8・
・・・・・文字切出手段、9・・・・・・文字識別部、
15・・・・・・スムージング回路、DLII〜DL3
3・・・・・・シフト回路、SMZ・・・・・・スムー
ジング処理回路。
Claims (1)
- 【特許請求の範囲】 文字列信号から切り出した2値データでなる文字パター
ン入力データのうち注目画素及びその隣接画素でなる比
較パターンをスムージング標準パターンと比較し、一致
したとき上記注目画素のデータを反転させることにより
スムージング処理パターンを得、当該スムージング処理
パターンでなる文字パターン出力データに基づいて文字
識別処理を実行する ことを特徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63122271A JPH01292487A (ja) | 1988-05-19 | 1988-05-19 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63122271A JPH01292487A (ja) | 1988-05-19 | 1988-05-19 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01292487A true JPH01292487A (ja) | 1989-11-24 |
Family
ID=14831831
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63122271A Pending JPH01292487A (ja) | 1988-05-19 | 1988-05-19 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01292487A (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS4843542A (ja) * | 1971-09-30 | 1973-06-23 | ||
| JPS57207979A (en) * | 1981-06-17 | 1982-12-20 | Ricoh Co Ltd | Processing method of smoothing of binary character picture |
| JPS6249482A (ja) * | 1985-08-28 | 1987-03-04 | Hitachi Seiko Ltd | 画像前処理装置 |
-
1988
- 1988-05-19 JP JP63122271A patent/JPH01292487A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS4843542A (ja) * | 1971-09-30 | 1973-06-23 | ||
| JPS57207979A (en) * | 1981-06-17 | 1982-12-20 | Ricoh Co Ltd | Processing method of smoothing of binary character picture |
| JPS6249482A (ja) * | 1985-08-28 | 1987-03-04 | Hitachi Seiko Ltd | 画像前処理装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7170647B2 (en) | Document processing apparatus and method | |
| JP2766053B2 (ja) | 画像データ処理方法 | |
| CA1306296C (en) | Image processing apparatus | |
| US5228097A (en) | Method for registering image data | |
| JPH01292487A (ja) | 文字認識装置 | |
| Aparna et al. | A complete OCR system development of Tamil magazine documents | |
| JP2000113111A (ja) | イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体 | |
| JP3177138B2 (ja) | 図面閉領域の抽出方法 | |
| JPH1117959A (ja) | 2値画像のランレングス符号化方法およびランレングス符号化プログラムを記録した記録媒体 | |
| JP2894111B2 (ja) | 光学式活字文字認識装置における認識結果の総合判定方式 | |
| JPS61147379A (ja) | 光学式文字読取装置 | |
| JP3199033B2 (ja) | 光学式文字読取方法、及び光学式文字読取装置 | |
| JPH0433074B2 (ja) | ||
| JP4439054B2 (ja) | 文字認識装置及び文字枠線の検出方法 | |
| JP2964980B2 (ja) | 光学的文字認識における直線成分検出方法及び装置 | |
| JP2679098B2 (ja) | 輪郭検出画像の符号化処理装置 | |
| JPS60210069A (ja) | 文書情報符号化方法 | |
| JPS61125687A (ja) | パタ−ン抽出方式 | |
| JP3747602B2 (ja) | 画像処理方法および画像処理装置 | |
| JPH0773273A (ja) | パターン切出しおよび認識方法とそのシステム | |
| JP2771045B2 (ja) | 文書画像の領域分割方法 | |
| JP2721415B2 (ja) | 文字画像抽出方法 | |
| JPH07107689B2 (ja) | 画像信号処理装置 | |
| JPH02166583A (ja) | 文字認識装置 | |
| JPS60110091A (ja) | 文字認識方式 |