JPS5894064A - 手書文字認識装置 - Google Patents
手書文字認識装置Info
- Publication number
- JPS5894064A JPS5894064A JP56190498A JP19049881A JPS5894064A JP S5894064 A JPS5894064 A JP S5894064A JP 56190498 A JP56190498 A JP 56190498A JP 19049881 A JP19049881 A JP 19049881A JP S5894064 A JPS5894064 A JP S5894064A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- writer
- character
- pattern
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は高速で精度の良い手書文字認識装置に関するも
のである。
のである。
従来の手書文字認識装置においては、筆者の違いによる
文字線の傾斜等のばらつきによる特徴のばらつきを吸収
するため辞書マスクの複数化により前記特徴のばらつき
を吸収していた。しかしながらこの装置は識別を行なう
際の抽出した特徴と辞書との照合の時間が辞書マスクの
数に比例して増大し、装置の処理速度の低下を招く欠点
があった。
文字線の傾斜等のばらつきによる特徴のばらつきを吸収
するため辞書マスクの複数化により前記特徴のばらつき
を吸収していた。しかしながらこの装置は識別を行なう
際の抽出した特徴と辞書との照合の時間が辞書マスクの
数に比例して増大し、装置の処理速度の低下を招く欠点
があった。
本発明は、このような従来の欠点を除去するため、あら
かじめ筆者の文字サンプルを読取ることによシ該筆者専
用の辞書を作成しておき、該辞書を使用して前記筆者の
手書文字を認識するようにしたもので、その目的とする
ところは高速で安定な手書文字認識装置を提供すること
にある。
かじめ筆者の文字サンプルを読取ることによシ該筆者専
用の辞書を作成しておき、該辞書を使用して前記筆者の
手書文字を認識するようにしたもので、その目的とする
ところは高速で安定な手書文字認識装置を提供すること
にある。
第1図は本発明手書文字認識装置における一実施例を示
す構成図で、図において1は光電変換部、2はパターン
レジスタ、3は線幅計算部、4は文字枠検出部、5は文
字枠分割決定部、6はサプノやターン抽出部、7は特徴
マトリクス抽出部、8は識別部、9は制御部、10はメ
モリ部、1ノは文字名出力、12はストローク抽出部、
13は平均角度計算部、14はキーデート部を示す。
す構成図で、図において1は光電変換部、2はパターン
レジスタ、3は線幅計算部、4は文字枠検出部、5は文
字枠分割決定部、6はサプノやターン抽出部、7は特徴
マトリクス抽出部、8は識別部、9は制御部、10はメ
モリ部、1ノは文字名出力、12はストローク抽出部、
13は平均角度計算部、14はキーデート部を示す。
次に、その動作を説明する。先ず(1)、筆者専用辞書
作成、次に(2)、認識動作の順に行なう。
作成、次に(2)、認識動作の順に行なう。
(1)の筆者専用の辞書作成は以下の手順で行なう。
オペレータはキーボード部J4の筆者登録制御キー及び
筆者登録番号キーを押下する。キーyl? −ド部14
は前記キーの押下を検出し、登録制御信号及び登録番号
信号を制御9へ送出する。次に、オペレータは筆者の文
字サンプルが書いである帳票を読取機構にセットする。
筆者登録番号キーを押下する。キーyl? −ド部14
は前記キーの押下を検出し、登録制御信号及び登録番号
信号を制御9へ送出する。次に、オペレータは筆者の文
字サンプルが書いである帳票を読取機構にセットする。
本実施例においては文字サンプルを漢字の「木」とした
。そして、読ル機構にセットされた帳票上の文字は、光
電変換部1において2値の量子化されたディジタル電気
信号に変換され、パターンレジスタ2に格納される。そ
れと同時に、線幅計算部3において入カバターンの線幅
が計算される。サブパターン抽出部6は、パターンレジ
スタについて垂直スキャンを全同行なって、黒ビットの
連続の長さと計算部3において計算された線幅との関係
よシ垂直サブパターン(vsp)を抽出する。同様に、
水平スキャンによシ水平すブ/eターン(H4F)を、
右斜め45°スキヤンにより右斜めサブパターン(H8
F)を、左斜め45°スキヤンにより左斜めサブパター
ン(LSP)を抽出する。第2図は原パターンと各サプ
ノやターンの例で(、)は原・母ターン、(b)は垂直
サブパターン(vsp)、(C)は水平サブAl−:/
(H4F) 、(d)は右斜めサブ/、oターン(H
8F) 、(e)ハ左斜メサブノjターン(LSP)で
ある。ストローク抽出2部12は各サブパターンレジス
タに対し水平又は垂直スキャンを全同行ない、白点から
黒点(文字線部を黒点とする)黒点から白点への変化点
を検出し、1列(又は行)前のスキャンにおける変化点
個数と変化点座標と現列(又は行)の変化点個数と変化
点座標の関係よりストロークを抽出し、抽出した各サブ
パターンレジスタ内のストロークの両端点のパターンレ
ジスタで定義される2次元座標系における座標(パター
ンレジスタの左下を原点とする。)を平均角度計算部1
3へ送出する。平均角度計算部13はストローク抽出部
12において抽出した各サブパターンレジスタ内のスト
ロークの両端点座標を参照し、各サブパターン毎に平均
角度を計算する。先ず水平サブパターンより抽出したス
トロークの両端点座標を(HXSn、 HYSn)、(
HXEn、HYEn)但し n = 1、・・・N、N
はストローク数とすると(1)式により平均角度θ□を
計算する。(但し)(XEn>HXSn)へ 同様に09.θR1θ、を(2)〜(4)式により計算
する。
。そして、読ル機構にセットされた帳票上の文字は、光
電変換部1において2値の量子化されたディジタル電気
信号に変換され、パターンレジスタ2に格納される。そ
れと同時に、線幅計算部3において入カバターンの線幅
が計算される。サブパターン抽出部6は、パターンレジ
スタについて垂直スキャンを全同行なって、黒ビットの
連続の長さと計算部3において計算された線幅との関係
よシ垂直サブパターン(vsp)を抽出する。同様に、
水平スキャンによシ水平すブ/eターン(H4F)を、
右斜め45°スキヤンにより右斜めサブパターン(H8
F)を、左斜め45°スキヤンにより左斜めサブパター
ン(LSP)を抽出する。第2図は原パターンと各サプ
ノやターンの例で(、)は原・母ターン、(b)は垂直
サブパターン(vsp)、(C)は水平サブAl−:/
(H4F) 、(d)は右斜めサブ/、oターン(H
8F) 、(e)ハ左斜メサブノjターン(LSP)で
ある。ストローク抽出2部12は各サブパターンレジス
タに対し水平又は垂直スキャンを全同行ない、白点から
黒点(文字線部を黒点とする)黒点から白点への変化点
を検出し、1列(又は行)前のスキャンにおける変化点
個数と変化点座標と現列(又は行)の変化点個数と変化
点座標の関係よりストロークを抽出し、抽出した各サブ
パターンレジスタ内のストロークの両端点のパターンレ
ジスタで定義される2次元座標系における座標(パター
ンレジスタの左下を原点とする。)を平均角度計算部1
3へ送出する。平均角度計算部13はストローク抽出部
12において抽出した各サブパターンレジスタ内のスト
ロークの両端点座標を参照し、各サブパターン毎に平均
角度を計算する。先ず水平サブパターンより抽出したス
トロークの両端点座標を(HXSn、 HYSn)、(
HXEn、HYEn)但し n = 1、・・・N、N
はストローク数とすると(1)式により平均角度θ□を
計算する。(但し)(XEn>HXSn)へ 同様に09.θR1θ、を(2)〜(4)式により計算
する。
(但しVYEm) VYSm、 RXEI ) RXS
I 、LXEk)LXSk)但し、上記式中M、L、に
はそれぞれ垂直サブパターン、右斜めサブ・々ターン、
左斜めサブ/ぐターンより抽出したストローク数である
。平均角度計算部13は上記式によシ計算した各サブパ
ターンの平均角度を制御部9へ送出する。制御部9は平
均角度計算部J3より送出された各サブパターン毎の平
均角度と、キーゲート部14より送出された前述の登録
制御信号と登録番号信号を参照して筆者専用辞書を作成
する。
I 、LXEk)LXSk)但し、上記式中M、L、に
はそれぞれ垂直サブパターン、右斜めサブ・々ターン、
左斜めサブ/ぐターンより抽出したストローク数である
。平均角度計算部13は上記式によシ計算した各サブパ
ターンの平均角度を制御部9へ送出する。制御部9は平
均角度計算部J3より送出された各サブパターン毎の平
均角度と、キーゲート部14より送出された前述の登録
制御信号と登録番号信号を参照して筆者専用辞書を作成
する。
本実施例において、筆者専用辞書を作成する時の元にな
る辞書(以後元辞書と称する)は水平特徴マトリクスマ
スク、垂直特徴マトリクスマスク、右斜め特徴マトリク
スマスク、左斜め特徴マトリクスマスクについてそれぞ
れ3種類の平均角度に対応するマスクを用意した。但し
水平特徴マトリクスは水平サブパターンより、垂直特徴
、マトリクスは垂直サブ・やターンより、右斜め特徴マ
トリクスは右斜めサブパターンより左斜め特徴マトリク
スは左斜めサブパターンより抽出する特徴マトリクスで
あシ、その抽出方法は後述する。
る辞書(以後元辞書と称する)は水平特徴マトリクスマ
スク、垂直特徴マトリクスマスク、右斜め特徴マトリク
スマスク、左斜め特徴マトリクスマスクについてそれぞ
れ3種類の平均角度に対応するマスクを用意した。但し
水平特徴マトリクスは水平サブパターンより、垂直特徴
、マトリクスは垂直サブ・やターンより、右斜め特徴マ
トリクスは右斜めサブパターンより左斜め特徴マトリク
スは左斜めサブパターンより抽出する特徴マトリクスで
あシ、その抽出方法は後述する。
各特徴マトリクスマスクの3種類とは平均角度がそれぞ
れ θ□く−o25.−o25<θ□<0.25 、
0.25<θ□の3種類θvく−0,25、−0,25
<θ、(0,25、0,25<、θ9の3種類θ、<
0.7 、 o7<θ、< 1.4 、 1.
4 <08の3種類θ、<−1,4、−t4<θt、<
(17,0,7<、θ1の3種類に対応するマー・り
を用意した。
れ θ□く−o25.−o25<θ□<0.25 、
0.25<θ□の3種類θvく−0,25、−0,25
<θ、(0,25、0,25<、θ9の3種類θ、<
0.7 、 o7<θ、< 1.4 、 1.
4 <08の3種類θ、<−1,4、−t4<θt、<
(17,0,7<、θ1の3種類に対応するマー・り
を用意した。
制御部9は元辞書をメモリ部ioより読出し平均角度計
算部13において計算された当該筆記者についてのθ□
、θ7.θ8.θ1を参照して各特徴マ) IJクスマ
スクのそれぞれについて前記元辞書のθH1θ9.θ8
.θ1 の分類を参照して対応するマスクを元辞書より
抜き出し1組の辞書として構成し、キーが一ド部14よ
シ送出された登録番号に対応するメモリ部ノ0内の所定
の番地に格納する。
算部13において計算された当該筆記者についてのθ□
、θ7.θ8.θ1を参照して各特徴マ) IJクスマ
スクのそれぞれについて前記元辞書のθH1θ9.θ8
.θ1 の分類を参照して対応するマスクを元辞書より
抜き出し1組の辞書として構成し、キーが一ド部14よ
シ送出された登録番号に対応するメモリ部ノ0内の所定
の番地に格納する。
次に(2)の認識動作は以下の動作により行なう。
オイレータはキーゲート部14の読堆対諮の帳票ノ筆者
登録番号キーと読を制御キーを押下し、読取対象帳票を
読取機構にセットする。キーボード部14は前記キーの
押下を検出し、読取制御キー押下信号と登録番号信号と
登録番号信号を受けとると、メモリ部10より前記登録
番号に対応する所定の番地より辞書を読出し、識別部8
へ該辞書を送出した後に、識別部8よシカテゴリ名が出
力されるのを待つ。
登録番号キーと読を制御キーを押下し、読取対象帳票を
読取機構にセットする。キーボード部14は前記キーの
押下を検出し、読取制御キー押下信号と登録番号信号と
登録番号信号を受けとると、メモリ部10より前記登録
番号に対応する所定の番地より辞書を読出し、識別部8
へ該辞書を送出した後に、識別部8よシカテゴリ名が出
力されるのを待つ。
読取機構にセットされた帳票上の文字は光電変換部1に
おいて2値の量子化されたディジタル電気信号に変換さ
れ、パターンレジスタ2に格納される。それと同時に、
線幅計算部3において入カバターンの線幅が計算される
。サブノRターン抽出部6Vi、A’ターンレジスクに
ついて垂直スキャンを全血行なって、黒ビットの連峰の
長さと計算・部3において計算された線幅との関係よシ
垂直サブパターン(vsp)を抽出する。同様に、水平
スキャンによシ水平サブパターン(LSP)を、右斜め
45゜スキャンにより右斜めサブパターン(LSP)
ヲ、左斜め45°スキヤンにより左斜めサブパターン(
LSP)を抽出する。
おいて2値の量子化されたディジタル電気信号に変換さ
れ、パターンレジスタ2に格納される。それと同時に、
線幅計算部3において入カバターンの線幅が計算される
。サブノRターン抽出部6Vi、A’ターンレジスクに
ついて垂直スキャンを全血行なって、黒ビットの連峰の
長さと計算・部3において計算された線幅との関係よシ
垂直サブパターン(vsp)を抽出する。同様に、水平
スキャンによシ水平サブパターン(LSP)を、右斜め
45゜スキャンにより右斜めサブパターン(LSP)
ヲ、左斜め45°スキヤンにより左斜めサブパターン(
LSP)を抽出する。
文字枠検出部4はパターンレジスタ2内の文字パターン
に外接する文字枠を検出し、その結果を文字枠分割決定
部5へ送る。文字枠分割決定部5は検出された文字枠内
をMxNの領域(M、Nは整数、本実施例ではM=N=
5)に分割するためのX軸、Y軸上の分割点座標を決定
する。ここでX軸は文字枠の水平方向を、Y軸は垂直方
向をそれぞれ示す。
に外接する文字枠を検出し、その結果を文字枠分割決定
部5へ送る。文字枠分割決定部5は検出された文字枠内
をMxNの領域(M、Nは整数、本実施例ではM=N=
5)に分割するためのX軸、Y軸上の分割点座標を決定
する。ここでX軸は文字枠の水平方向を、Y軸は垂直方
向をそれぞれ示す。
特徴マトリクス抽出部7は、文字枠分割決定部5によシ
決定された分割点座標によfi VSP、LSP。
決定された分割点座標によfi VSP、LSP。
LSP 、 LSPの各サブノfターンレジスタ上の文
字枠領域をMxNの領域に分割し、各領域の黒ビット数
Bijを計数し、線幅Wを使用して式(5)により文字
線長を示す特徴を計算し、MxNx4次元の特徴マトリ
クスを作成する。
字枠領域をMxNの領域に分割し、各領域の黒ビット数
Bijを計数し、線幅Wを使用して式(5)により文字
線長を示す特徴を計算し、MxNx4次元の特徴マトリ
クスを作成する。
Lij= JJ/w (5)その後
、VSP特徴マ) IJクスは文字枠のY軸方向の長さ
ΔYで、H8P特徴マトリクスはX軸方向の長さΔXで
、LSP及びLSP %徴マトリクスは(Δχ+ΔY)
/2でそれぞれ正規化を行ない最終的にM X N X
4次元の特徴マ) IJクスを作成する。識別部8は
辞書マスク(f、)と前記抽出された特徴マトリクスC
f1)との間に式(6)で定義される距離(D)を適用
し、Dが最小の値となるような辞書マスクのカテゴリ名
を制御部9へ送出する。制御部9は送られてきたカテゴ
リ名を文字名出力ノノに出力するようにしたものである
。
、VSP特徴マ) IJクスは文字枠のY軸方向の長さ
ΔYで、H8P特徴マトリクスはX軸方向の長さΔXで
、LSP及びLSP %徴マトリクスは(Δχ+ΔY)
/2でそれぞれ正規化を行ない最終的にM X N X
4次元の特徴マ) IJクスを作成する。識別部8は
辞書マスク(f、)と前記抽出された特徴マトリクスC
f1)との間に式(6)で定義される距離(D)を適用
し、Dが最小の値となるような辞書マスクのカテゴリ名
を制御部9へ送出する。制御部9は送られてきたカテゴ
リ名を文字名出力ノノに出力するようにしたものである
。
D−〆ΣCf、 −fつ2(6)
このように筆記者の文字サンプルを読取ることにより当
該筆者の文字線の傾斜の傾向を抽出して、当該筆者専用
の辞書を、あらかじめ用意した複数の辞・書マスクの中
から選択することにより作成し該辞書を使用して前記筆
記者の文字を認識しているので当該筆記者の文字を認識
するために不必要な辞書マスクが除かれており、高速な
処理を行なうことができる。又筆記者毎の専用辞書を作
成して登録することができるので各筆記者毎に最適な辞
書を使用して認識することができる。。
該筆者の文字線の傾斜の傾向を抽出して、当該筆者専用
の辞書を、あらかじめ用意した複数の辞・書マスクの中
から選択することにより作成し該辞書を使用して前記筆
記者の文字を認識しているので当該筆記者の文字を認識
するために不必要な辞書マスクが除かれており、高速な
処理を行なうことができる。又筆記者毎の専用辞書を作
成して登録することができるので各筆記者毎に最適な辞
書を使用して認識することができる。。
以上詳細に説明したように、本発明は筆記者専用の辞書
を作成し、該辞書を使用して文字を認識しているので、
高速で精度の良い認識を行なうことができ、高速で精度
の良い手書文字認識装置に利用して大きな効果がある。
を作成し、該辞書を使用して文字を認識しているので、
高速で精度の良い認識を行なうことができ、高速で精度
の良い手書文字認識装置に利用して大きな効果がある。
第1図は本発明手書文字認識装置の一実施例を示す構成
図、第2図は原パターンと各サブパターンの例を示す図
である。 l・・・光電変換部、2・・・パターンレジスタ、3・
・・線幅計算部、4・・・文字枠検出部、5・・・文字
枠分割決定部、6・・・サブパターン抽出部、−7・・
・特徴マトリクス抽出部、8・・・識別部、9・・・制
御部、1o・・・メモリ部、11・・・文字名出力、1
2・・・ストローク抽出部、13・・・平均角度計算部
、14・・・キーが−ド部。
図、第2図は原パターンと各サブパターンの例を示す図
である。 l・・・光電変換部、2・・・パターンレジスタ、3・
・・線幅計算部、4・・・文字枠検出部、5・・・文字
枠分割決定部、6・・・サブパターン抽出部、−7・・
・特徴マトリクス抽出部、8・・・識別部、9・・・制
御部、1o・・・メモリ部、11・・・文字名出力、1
2・・・ストローク抽出部、13・・・平均角度計算部
、14・・・キーが−ド部。
Claims (1)
- あらかじめ特徴毎に分類して作成した辞書マスクを、特
徴毎に数種類用意しておき、筆者の文字サンプルを光電
変換し、量子化して得られたディジタル信号を原パター
ンとしてパターンレジスタに格納し、前記原パターンよ
り各方向のストローク成分を抽出して、各方向の文字線
の傾斜を抽出し該筆者についての特徴毎の分類を決定し
、当該筆者専用の辞書を前記あらかじめ用意した特徴毎
の複数の辞書マスクの中からそれぞれ特徴毎に選択し、
構成して登録しておき、該辞書を使用して文字の認識を
行なうことを特徴とする手書文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56190498A JPS5894064A (ja) | 1981-11-30 | 1981-11-30 | 手書文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56190498A JPS5894064A (ja) | 1981-11-30 | 1981-11-30 | 手書文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5894064A true JPS5894064A (ja) | 1983-06-04 |
Family
ID=16259087
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56190498A Pending JPS5894064A (ja) | 1981-11-30 | 1981-11-30 | 手書文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5894064A (ja) |
-
1981
- 1981-11-30 JP JP56190498A patent/JPS5894064A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS5894064A (ja) | 手書文字認識装置 | |
| JP3936039B2 (ja) | 網がけ領域抽出装置 | |
| JPS62125485A (ja) | 文字認識方式 | |
| JPH0545992B2 (ja) | ||
| JPS5894066A (ja) | 文字認識装置 | |
| JP2827288B2 (ja) | 文字認識装置 | |
| JPS62154079A (ja) | 文字認識方式 | |
| JPS62164182A (ja) | 文字図形パタ−ン認識方式 | |
| JPS5837780A (ja) | 文字認識方式 | |
| JP2715930B2 (ja) | 線分検出方法 | |
| JP3276554B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
| JPH0266681A (ja) | 図面処理装置 | |
| JPH0776980B2 (ja) | 文字認識方法 | |
| JPS5894065A (ja) | 文字認識装置 | |
| JPS5894067A (ja) | 文字認識方法 | |
| JP2616995B2 (ja) | 文字認識装置 | |
| JPH0545991B2 (ja) | ||
| JPH10162104A (ja) | 文字認識装置 | |
| JPH0580711B2 (ja) | ||
| JPH0420227B2 (ja) | ||
| JPH04139593A (ja) | 郵便番号認識装置 | |
| JPS6262393B2 (ja) | ||
| JPS6318787B2 (ja) | ||
| JPS6019287A (ja) | 文字認識方法 | |
| JPH01152586A (ja) | 文字図形認識方法 |