JPS6262393B2 - - Google Patents
Info
- Publication number
- JPS6262393B2 JPS6262393B2 JP56037888A JP3788881A JPS6262393B2 JP S6262393 B2 JPS6262393 B2 JP S6262393B2 JP 56037888 A JP56037888 A JP 56037888A JP 3788881 A JP3788881 A JP 3788881A JP S6262393 B2 JPS6262393 B2 JP S6262393B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- feature matrix
- sub
- original pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
本発明は高速で正確な文字認識方法に関するも
のである。従来、文字図形認識装置においては文
字図形パターンによりストロークを抽出し、それ
ら抽出されたストロークの位置、長さ、ストロー
ク間の相互関係等の幾何学的な特徴を用いて認識
する方法が多く採用されている。ストロークの抽
出方法として、次の2つの方法が知られている。
のである。従来、文字図形認識装置においては文
字図形パターンによりストロークを抽出し、それ
ら抽出されたストロークの位置、長さ、ストロー
ク間の相互関係等の幾何学的な特徴を用いて認識
する方法が多く採用されている。ストロークの抽
出方法として、次の2つの方法が知られている。
文字図形の輪郭を追跡することにより検出さ
れた輪郭点系列について曲率を計算し、その曲
率の大きな値の点を分割点として輪郭系列を分
割し、分割された系列を組合わせることにより
ストロークを抽出する。
れた輪郭点系列について曲率を計算し、その曲
率の大きな値の点を分割点として輪郭系列を分
割し、分割された系列を組合わせることにより
ストロークを抽出する。
文字図形パターンに細線化処理を行なつて骨
格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出し
てストロークを抽出する。しかし、の方法は
文字図形パターンが大きくなり、また文字図形
パターンが複雑化すると、その処理量が増大
し、処理速度の低下を招くこと、の方法は文
字図形パターンを細線化する必要があり、また
その細線化によるパターンの歪、ヒゲの発生等
の問題があり、その後の処理を複雑なものとす
ること、 等の欠点を有していた。これらの欠点を除去す
る方法として、文字図形パターンの線巾Wを検出
し、このパターンを所望の方向に走査し、パター
ンの当該走査方向における記入点の長さlと、前
記線巾Wとの間でl≧NW(Nは定数)を満足す
る記入点を取り出すことにより、走査方向のスト
ローク成分を表わすサブパターンを抽出し、さら
に文字枠内を(N×M)の領域(N,Mは定数)
に分割して各領域の文字線量を計算して特徴マト
リクスAを作成し、内蔵辞書と照合して識別する
方法が提案されている。
格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出し
てストロークを抽出する。しかし、の方法は
文字図形パターンが大きくなり、また文字図形
パターンが複雑化すると、その処理量が増大
し、処理速度の低下を招くこと、の方法は文
字図形パターンを細線化する必要があり、また
その細線化によるパターンの歪、ヒゲの発生等
の問題があり、その後の処理を複雑なものとす
ること、 等の欠点を有していた。これらの欠点を除去す
る方法として、文字図形パターンの線巾Wを検出
し、このパターンを所望の方向に走査し、パター
ンの当該走査方向における記入点の長さlと、前
記線巾Wとの間でl≧NW(Nは定数)を満足す
る記入点を取り出すことにより、走査方向のスト
ローク成分を表わすサブパターンを抽出し、さら
に文字枠内を(N×M)の領域(N,Mは定数)
に分割して各領域の文字線量を計算して特徴マト
リクスAを作成し、内蔵辞書と照合して識別する
方法が提案されている。
またこの方法においてストロークの欠如を防ぐ
ために、原パターンの各方向ストロークを抽出す
る際に、さらに原パターンの黒ビツトのうち、前
記各サブパターンに属さない黒ビツトをもつて未
定義サブパターンを抽出しこれを含めた特徴マト
リクスBを作成し、前記の識別において類似文字
が得られた場合にはこのマトリクスを用いて識別
を行う方法が提案されている。しかし、類似文字
候補同志の特徴マトリクスAは同一と見なせるか
ら、類似文字候補の中からさらに目標文字を抽出
する際には、未定義サブパターン特徴マトリクス
Cだけを用いた識別を行なえばよく、特徴マトリ
クスAと特徴マトリクスCを合成した特徴マトリ
クスBを用いて識別を行なうことは、いたずらに
装置の構成を複雑にし、ひいては識別に要する時
間の増大をもたらすこととなる。
ために、原パターンの各方向ストロークを抽出す
る際に、さらに原パターンの黒ビツトのうち、前
記各サブパターンに属さない黒ビツトをもつて未
定義サブパターンを抽出しこれを含めた特徴マト
リクスBを作成し、前記の識別において類似文字
が得られた場合にはこのマトリクスを用いて識別
を行う方法が提案されている。しかし、類似文字
候補同志の特徴マトリクスAは同一と見なせるか
ら、類似文字候補の中からさらに目標文字を抽出
する際には、未定義サブパターン特徴マトリクス
Cだけを用いた識別を行なえばよく、特徴マトリ
クスAと特徴マトリクスCを合成した特徴マトリ
クスBを用いて識別を行なうことは、いたずらに
装置の構成を複雑にし、ひいては識別に要する時
間の増大をもたらすこととなる。
第1図は本発明の文字認識装置における実施例
を示したものである。本装置の動作を説明する
と、光信号入力1は光電変換部2において2値の
量子化された電気信号に変換されパターンレジス
タ3に格納される。それと同時に線巾計算部4に
おいて入力パターンの線巾が計算される。垂直サ
ブパターン抽出部5はパターンレジスタ3につい
て垂直スキヤンを全面行なつて、黒ビツトの連続
の長さと線巾計算部4において計算された線巾と
の関係より垂直サブパターン(VSP)を抽出す
る。同様に水平サブパターン抽出部6は水平スキ
ヤンにより水平サブパターン(HSP)を、右斜め
サブパターン抽出部7は右斜め(45゜)スキヤン
により右斜めサブパターン(RSP)を、左斜めサ
ブパターン抽出部8は左斜め(45゜)スキヤンに
より、左斜めサブパターン(LSP)を抽出する。
を示したものである。本装置の動作を説明する
と、光信号入力1は光電変換部2において2値の
量子化された電気信号に変換されパターンレジス
タ3に格納される。それと同時に線巾計算部4に
おいて入力パターンの線巾が計算される。垂直サ
ブパターン抽出部5はパターンレジスタ3につい
て垂直スキヤンを全面行なつて、黒ビツトの連続
の長さと線巾計算部4において計算された線巾と
の関係より垂直サブパターン(VSP)を抽出す
る。同様に水平サブパターン抽出部6は水平スキ
ヤンにより水平サブパターン(HSP)を、右斜め
サブパターン抽出部7は右斜め(45゜)スキヤン
により右斜めサブパターン(RSP)を、左斜めサ
ブパターン抽出部8は左斜め(45゜)スキヤンに
より、左斜めサブパターン(LSP)を抽出する。
未定義サブパターン抽出部9は、パターンレジ
スタ3に格納される黒ビツトのうち、前述のすべ
てのサブパターンに属さない黒ビツトをもつて、
未定義サブパターン(USP)を抽出する。
スタ3に格納される黒ビツトのうち、前述のすべ
てのサブパターンに属さない黒ビツトをもつて、
未定義サブパターン(USP)を抽出する。
このUSPは、HSP,VSP,RSP,LSPと原パタ
ーンPとの間に下記の論理式(1)を適用することに
より抽出する。
ーンPとの間に下記の論理式(1)を適用することに
より抽出する。
USP=P〓〓〓〓 …(1)
文字枠検出部10はパターンレジスタ3内の文
字パターンに外接する文字枠を検出しその結果を
文字枠分割決定部11へ送る。文字枠分割決定部
11は、文字枠検出部10より検出された文字枠
内を(N×M)の領域(N,Mは定数、本実施例
ではN=M=5)に分割する為のX軸、Y軸(文
字枠の水平方向をX軸、垂直方向をY軸とする)
上の分割点座標を決定する。
字パターンに外接する文字枠を検出しその結果を
文字枠分割決定部11へ送る。文字枠分割決定部
11は、文字枠検出部10より検出された文字枠
内を(N×M)の領域(N,Mは定数、本実施例
ではN=M=5)に分割する為のX軸、Y軸(文
字枠の水平方向をX軸、垂直方向をY軸とする)
上の分割点座標を決定する。
特徴マトリクス抽出部12は、文字枠分割決定
部11により決定された分割点座標によりVSP,
HSP,RSP,LSPの各サブパターンレジスタ上の
文字枠領域を(N×M)の領域に分割し、各領域
の黒ビツト数(Bij)を計数し、線巾Wを使用し
て、下記式(2)により文字線長(Lij)を示す特徴
を計算して、(N×M)×4次元の特徴マトリクス
を作成する。
部11により決定された分割点座標によりVSP,
HSP,RSP,LSPの各サブパターンレジスタ上の
文字枠領域を(N×M)の領域に分割し、各領域
の黒ビツト数(Bij)を計数し、線巾Wを使用し
て、下記式(2)により文字線長(Lij)を示す特徴
を計算して、(N×M)×4次元の特徴マトリクス
を作成する。
Lij=Bij/W …(2)
その後VSP特徴マトリクスは文字枠のy方向の
長さΔYで、HSP特徴マトリクスはx方向の長さ
ΔXで、RSPとLSPの特徴マトリクスは√(
X)2+(ΔY)2で正規化を行ない、最終的に
(N×M)×4次元の文字の大きさで正規化した特
徴マトリクスを作成する。
長さΔYで、HSP特徴マトリクスはx方向の長さ
ΔXで、RSPとLSPの特徴マトリクスは√(
X)2+(ΔY)2で正規化を行ない、最終的に
(N×M)×4次元の文字の大きさで正規化した特
徴マトリクスを作成する。
USP特徴マトリクス抽出部13は、USPについ
て特徴マトリクス抽出部12と同様の動作によ
り、(N×M)×1次元の特徴マトリクスを作成す
る。USP特徴マトリクスは、本実施例では√(
X)2+(ΔY)2で正規化する。第1識別部1
4は標準文字マスク(fn)と、特徴マトリクス
抽出部12において抽出された特徴マトリクス
(fi)との間に周知の下式(3)の距離(D)を用いて、
Dが最小のものから順序付けを行ない、候補文字
名及び距離(D)を出力する。
て特徴マトリクス抽出部12と同様の動作によ
り、(N×M)×1次元の特徴マトリクスを作成す
る。USP特徴マトリクスは、本実施例では√(
X)2+(ΔY)2で正規化する。第1識別部1
4は標準文字マスク(fn)と、特徴マトリクス
抽出部12において抽出された特徴マトリクス
(fi)との間に周知の下式(3)の距離(D)を用いて、
Dが最小のものから順序付けを行ない、候補文字
名及び距離(D)を出力する。
D=√(n−i)2 …(3)
第2識別部15は第1識別部14より得られた
第1位候補の標準文字マスクとの距離(D1)と、
第i位候補(i=2,3,4,…)の標準マスク
との距離(Di)が、本実施例では次に示す式(4)
を満足する場合には、当該候補と第1位候補は類
似文字候補とみなし、類似文字候補が存在しない
場合には、第1位候補の文字名を文字名出力16
に出力する。
第1位候補の標準文字マスクとの距離(D1)と、
第i位候補(i=2,3,4,…)の標準マスク
との距離(Di)が、本実施例では次に示す式(4)
を満足する場合には、当該候補と第1位候補は類
似文字候補とみなし、類似文字候補が存在しない
場合には、第1位候補の文字名を文字名出力16
に出力する。
|D1−Di/D1|<C(Cは定数) …(4)
類似文字候補が存在する場合には、未定義サブ
パターン特徴マトリクス抽出部13より得られた
未定義サブパターン特徴マトリクスCと、前記類
似文字候補の標準文字マスクとの間に前記式(3)の
で定義した距離(D)を適用して、Dが最小の値とな
る標準文字マスクのカテゴリ名を文字名出力16
に出力する。第2図は原パターンと抽出されたサ
ブパターンの例を示したものである。Aは原パタ
ーン、BがVSP、CがHSP、DがRSP、Eが
LSP、FがUSPをそれぞれ示す。
パターン特徴マトリクス抽出部13より得られた
未定義サブパターン特徴マトリクスCと、前記類
似文字候補の標準文字マスクとの間に前記式(3)の
で定義した距離(D)を適用して、Dが最小の値とな
る標準文字マスクのカテゴリ名を文字名出力16
に出力する。第2図は原パターンと抽出されたサ
ブパターンの例を示したものである。Aは原パタ
ーン、BがVSP、CがHSP、DがRSP、Eが
LSP、FがUSPをそれぞれ示す。
以上、実施例に基づいて説明したように、本発
明によれば、特徴マトリクスと内蔵辞書との照合
の際、2種以上の類似文字候補が得られた場合
に、未定義サブパターンにより作成した特徴マト
リクスのみを用いて識別を行なうので、ストロー
クの欠如による誤読がなく、かつ構成が簡単で、
高速な文字認識を行うことが出来る利点がある。
明によれば、特徴マトリクスと内蔵辞書との照合
の際、2種以上の類似文字候補が得られた場合
に、未定義サブパターンにより作成した特徴マト
リクスのみを用いて識別を行なうので、ストロー
クの欠如による誤読がなく、かつ構成が簡単で、
高速な文字認識を行うことが出来る利点がある。
第1図は本発明の実施例に於ける構成図、第2
図はサブパターン抽出例をそれぞれ示したもので
ある。 1……光信号入力、2……光電変換部、3……
パターンレジスタ、5〜9……サブパターン抽出
部、10……文字枠検出部、11……文字枠分割
決定部、12……特徴マトリクス抽出部、13…
…未定義サブパターン特徴マトリクス抽出部、1
4……第1識別部、15……第2識別部、16…
…文字名出力。
図はサブパターン抽出例をそれぞれ示したもので
ある。 1……光信号入力、2……光電変換部、3……
パターンレジスタ、5〜9……サブパターン抽出
部、10……文字枠検出部、11……文字枠分割
決定部、12……特徴マトリクス抽出部、13…
…未定義サブパターン特徴マトリクス抽出部、1
4……第1識別部、15……第2識別部、16…
…文字名出力。
Claims (1)
- 1 文字図形を光電変換し、量子化して得られた
デイジタル信号を原パターンとしてパターンレジ
スタに格納し、前記原パターンより各方向のスト
ローク成分をあらわすサブパターンを抽出してサ
ブパターンレジスタに格納し、前記原パターンの
文字枠内領域を前記サブパターンレジスタについ
て(N×M)個の領域(N,Mは定数)に分割
し、各領域内の文字線長をあらわす特徴量を文字
の大きさで正規化して第1の特徴マトリクスを作
成し、この第1の特徴マトリクスをあらかじめ貯
蔵された辞書と照合して文字図形を識別する文字
認識方法において、前記第1の特徴マトリクスと
前記辞書との照合の際2種以上の類似文字が候補
として得られた場合に、前記原パターンより抽出
した前記サブパターンのいずれにも属さない未定
義サブパターンのみにより作成した第2の特徴マ
トリクスを作成し、この第2の特徴マトリクスを
用いて前記類似文字を前記辞書と照合して文字を
識別することを特徴とする文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56037888A JPS57153385A (en) | 1981-03-18 | 1981-03-18 | Character recognizing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56037888A JPS57153385A (en) | 1981-03-18 | 1981-03-18 | Character recognizing method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57153385A JPS57153385A (en) | 1982-09-21 |
| JPS6262393B2 true JPS6262393B2 (ja) | 1987-12-25 |
Family
ID=12510072
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56037888A Granted JPS57153385A (en) | 1981-03-18 | 1981-03-18 | Character recognizing method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57153385A (ja) |
-
1981
- 1981-03-18 JP JP56037888A patent/JPS57153385A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57153385A (en) | 1982-09-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Das et al. | A fast algorithm for skew detection of document images using morphology | |
| JPS6262393B2 (ja) | ||
| JPS6318787B2 (ja) | ||
| JPH08255223A (ja) | 文字認識装置における類似文字判別方法 | |
| JPS6262392B2 (ja) | ||
| JPH0545991B2 (ja) | ||
| JPS5894067A (ja) | 文字認識方法 | |
| JPS5837780A (ja) | 文字認識方式 | |
| JPS62154079A (ja) | 文字認識方式 | |
| JPS6038755B2 (ja) | 特徴抽出方式 | |
| JP2576491B2 (ja) | 特徴抽出方式 | |
| KR100317653B1 (ko) | 대용량인쇄체문자인식을위한특징추출방법 | |
| JPH0545992B2 (ja) | ||
| JPS622382A (ja) | 画像処理方法 | |
| JPS62125485A (ja) | 文字認識方式 | |
| KR940001225B1 (ko) | 패턴 인식방법 | |
| JP2576494B2 (ja) | 特徴抽出方式 | |
| JPH0632080B2 (ja) | 文字認識方式 | |
| JP3127413B2 (ja) | 文字認識装置 | |
| JPS6222186A (ja) | 図面読取り装置 | |
| JPH0632081B2 (ja) | 文字認識方式 | |
| JPS634231B2 (ja) | ||
| JPH0545993B2 (ja) | ||
| JPS62164182A (ja) | 文字図形パタ−ン認識方式 | |
| JPH0545990B2 (ja) |