JPS5870383A - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JPS5870383A JPS5870383A JP56169153A JP16915381A JPS5870383A JP S5870383 A JPS5870383 A JP S5870383A JP 56169153 A JP56169153 A JP 56169153A JP 16915381 A JP16915381 A JP 16915381A JP S5870383 A JPS5870383 A JP S5870383A
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature
- evaluation value
- character pattern
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は文字118識方式、特(iこ印刷或いは常用手
書き漢字の認識方式に関する。
書き漢字の認識方式に関する。
従来、手鴫き英数カナ特別記号等の文字認識方式には、
文字部に注目してストロークの情報を抽出し、入力文字
の構造を解析する方法と、文字部ではなく背景部に注目
して、背景部の各点、或いは定めら冗た点を特徴付けて
認識する方法の2種類の代表的な手法が用いられていた
。前者は入力文字の細部の一1w報までとらえることに
1つて認識性能を向上させよ・うとするものであり、後
者は大域的な特徴を比較的安定に抽出しようとするもの
である。
文字部に注目してストロークの情報を抽出し、入力文字
の構造を解析する方法と、文字部ではなく背景部に注目
して、背景部の各点、或いは定めら冗た点を特徴付けて
認識する方法の2種類の代表的な手法が用いられていた
。前者は入力文字の細部の一1w報までとらえることに
1つて認識性能を向上させよ・うとするものであり、後
者は大域的な特徴を比較的安定に抽出しようとするもの
である。
これら両方式は、それぞれ既に製品化が行なわれ、実用
化に耐え得ることが立証されているが、認識対象を漢字
、平仮名等の一般の日本狛の文章に用いられる文字に拡
張すると、(1)その字形の膜雑さ、(2字種の多さ、
(3)類似文字組の多さ等という問題点が生じ、従来の
方式では認識することができないのが現状である。
化に耐え得ることが立証されているが、認識対象を漢字
、平仮名等の一般の日本狛の文章に用いられる文字に拡
張すると、(1)その字形の膜雑さ、(2字種の多さ、
(3)類似文字組の多さ等という問題点が生じ、従来の
方式では認識することができないのが現状である。
本発明は後者の手法に−し、手書き及び印刷漢字に平仮
名等を認識する方式に関するものである。
名等を認識する方式に関するものである。
従来、この種の代表的な方式として下記の方式が知られ
ている。すなわち、まず、4辺が認識すべき文字を囲む
よう々矩形領域を作り、この領域を縦方向にm個、横方
向にn個に分割し、n〕Xn個の微小領域の集合とする
。この各々の微小領域を前記文字を含む領域内の点と定
義する。このような点は文字を表わす線を含まない背景
点ど文字を表わす線を含む文字点との2種類に分けられ
る。
ている。すなわち、まず、4辺が認識すべき文字を囲む
よう々矩形領域を作り、この領域を縦方向にm個、横方
向にn個に分割し、n〕Xn個の微小領域の集合とする
。この各々の微小領域を前記文字を含む領域内の点と定
義する。このような点は文字を表わす線を含まない背景
点ど文字を表わす線を含む文字点との2種類に分けられ
る。
今、こうして定義されたある1つの背景点Pをとり、そ
の点から左右の水平方向および−J、下の垂直方向に走
査線を出し、それらの走査線が前記文字の線と、それぞ
れ左方に0回、右方にd回、上方に3回、および下方に
b@交差したとする。
の点から左右の水平方向および−J、下の垂直方向に走
査線を出し、それらの走査線が前記文字の線と、それぞ
れ左方に0回、右方にd回、上方に3回、および下方に
b@交差したとする。
これを背景点Pに付随する1つの特性を表わす量と考え
、第1図のように表示する。こうすると、すべての背景
点には、あるそれぞれのc、 d、 aおよびbの値を
もつ特性が付随することになる。
、第1図のように表示する。こうすると、すべての背景
点には、あるそれぞれのc、 d、 aおよびbの値を
もつ特性が付随することになる。
今、仮に文字の線と交差する回数を表わす前記c、’
d、 a及びbの饋が2又は2以上の場合には、それを
2と制限することにすると許される値(ば0.1および
2の3種類となる。従って、各点の特性として許される
蛾類の斂L・よ3−81であり、81種類の各特性につ
いて背景点をヒ集計し、81次元のベクトルを生成し、
このベクトルを用い−Cm形識別関数によって文字認識
を行なう。
d、 a及びbの饋が2又は2以上の場合には、それを
2と制限することにすると許される値(ば0.1および
2の3種類となる。従って、各点の特性として許される
蛾類の斂L・よ3−81であり、81種類の各特性につ
いて背景点をヒ集計し、81次元のベクトルを生成し、
このベクトルを用い−Cm形識別関数によって文字認識
を行なう。
こ
これはグラックス;e ン(G1*cksrnan)の
方法(Hl、A+Glucks+nan:Glassi
fication of Mixedfont Alp
babetics by Cbaracteristi
c Loci。
方法(Hl、A+Glucks+nan:Glassi
fication of Mixedfont Alp
babetics by Cbaracteristi
c Loci。
Digest of First I’hiEh Co
mputer Conferen−ce、 P、138
.1967J照)として知られているがこれを漢字を富
む邦文文字の、認識に適用しようとすると、次のような
間Aが生じる。
mputer Conferen−ce、 P、138
.1967J照)として知られているがこれを漢字を富
む邦文文字の、認識に適用しようとすると、次のような
間Aが生じる。
まず、第1に水平あるいは垂直の走査線が文字と交差回
数を2回を上限としているが、漢字のようにストローク
数が多い文字に対しては少なすぎる。
数を2回を上限としているが、漢字のようにストローク
数が多い文字に対しては少なすぎる。
では、文字の傾きに対して上記ベクトルの要素の値が不
安定になる。
安定になる。
第3に交差回数の上限を漢字の複雑さに合わせ7程度ま
でとった場合には、−h記のよう々ベクトルを作ると、
8−4096次元という膨大な次元数をもつ空間のベク
トルを処理をする必要が生じ、処理が非常に困難になる
。
でとった場合には、−h記のよう々ベクトルを作ると、
8−4096次元という膨大な次元数をもつ空間のベク
トルを処理をする必要が生じ、処理が非常に困難になる
。
江
」二!δような欠点を除去するために交差回数の上限を
増加し、交差回数の計数値を文字の傾きに対して安定に
決定し、さらに処理量を実現可能な量に軽減する文字認
識方式は既に特願昭55−1−49792号明細書に「
光学式文字認識装置」として提案されているが、前記方
式では、漢字の分力1用の情報は文字バタンの用量にあ
るといら点と、処理量を軽減するために1主に文字バタ
ンの周囲の情報に着目しているので、字種によっては分
類が困難であるという欠点を有していた。
増加し、交差回数の計数値を文字の傾きに対して安定に
決定し、さらに処理量を実現可能な量に軽減する文字認
識方式は既に特願昭55−1−49792号明細書に「
光学式文字認識装置」として提案されているが、前記方
式では、漢字の分力1用の情報は文字バタンの用量にあ
るといら点と、処理量を軽減するために1主に文字バタ
ンの周囲の情報に着目しているので、字種によっては分
類が困難であるという欠点を有していた。
能を高め、かつ、前記方式とほぼ変わらない処理量で実
現できる文字ゑ〕織方式を提供することになる。IJ、
下、本ゲ・明について、図面を用いて詳細に説明する。
現できる文字ゑ〕織方式を提供することになる。IJ、
下、本ゲ・明について、図面を用いて詳細に説明する。
第2図(+)(IJ)(lit)は、本発明の原理を説
明するだめの図であり、二値バタン上の文字の背景を表
わす点から水平あるいは垂直方向の走査線が文字ストロ
ークど決められた範囲内の角度で交差したときには、交
差回数として計数とし、そうでない場合には文字部と交
わっても交差回数としては計数しないために、回内(1
)のQ点では、a−4,b−1cm3.d−1とガって
いるが、P点では左方の水平走査線と交差するストロー
クの角度が小さいので、c−0,他は−a −1,b
−4,d −1とガっている。ζ、れを第1図に対応さ
せて示すと、第2図(If)(lit)の如くなる。
明するだめの図であり、二値バタン上の文字の背景を表
わす点から水平あるいは垂直方向の走査線が文字ストロ
ークど決められた範囲内の角度で交差したときには、交
差回数として計数とし、そうでない場合には文字部と交
わっても交差回数としては計数しないために、回内(1
)のQ点では、a−4,b−1cm3.d−1とガって
いるが、P点では左方の水平走査線と交差するストロー
クの角度が小さいので、c−0,他は−a −1,b
−4,d −1とガっている。ζ、れを第1図に対応さ
せて示すと、第2図(If)(lit)の如くなる。
一般に手書き漢字では、筆記者によって文字の傾きの程
度に差が出るものであるが、上記のように走査線とスト
ロークのなす角度で交差の有無の計数を決定しているの
で、ストロークの傾きに対しても安定な背景点の特性を
決定することができる。
度に差が出るものであるが、上記のように走査線とスト
ロークのなす角度で交差の有無の計数を決定しているの
で、ストロークの傾きに対しても安定な背景点の特性を
決定することができる。
さて、上記のように背景点の特性を求める場合に交差回
数の上限を、例えば、7程度にしておけば充分であるが
、その場合光にも述べたように8−4096通りの特性
がある。しかし、−h述したように背景点の特性が安定
しただめに、各文字に対して実際に出現する特性は、4
096通りに比べ理によって得ることができる。例えば
、字形の複雑さによって差はあるが、4096次元のう
ち0でない要素は、最大128個から256個でhD、
これだけで要素数が40分の−から20分の一位に減っ
たことになる。また、2個のベクトルX (−(Xo、
X+・・・・・・・・・l x4@5 ) )とY
(−(Yo、)’t−・・・・・・・・・+Y+oos
))の演算で、例えば、 を行なうことを考えると、iを要素、XI、 Yl等を
要素の値と呼ぶことにすれば、要素と要素の値の複数個
の組で、ベクトルX及びYが表現されているときにX及
びYのいずれにも存在する要素をjs、1t*・・・・
・・・・・jAeJとし、Xだけに存在する要素をに、
に、・・・・・・・・−、kBttKとし、Yだけ存在
する要素を1!、、l!、?・−・−1(2*Lとする
と、Jnk−d、knL−lLハJ−gl(f6は空集
合を表わす)であ−るから、となり、本方式では右辺の
ように非常に少ない演算で、2個のベクトルの演算を行
なうことができ置として実現することが可能になる。
数の上限を、例えば、7程度にしておけば充分であるが
、その場合光にも述べたように8−4096通りの特性
がある。しかし、−h述したように背景点の特性が安定
しただめに、各文字に対して実際に出現する特性は、4
096通りに比べ理によって得ることができる。例えば
、字形の複雑さによって差はあるが、4096次元のう
ち0でない要素は、最大128個から256個でhD、
これだけで要素数が40分の−から20分の一位に減っ
たことになる。また、2個のベクトルX (−(Xo、
X+・・・・・・・・・l x4@5 ) )とY
(−(Yo、)’t−・・・・・・・・・+Y+oos
))の演算で、例えば、 を行なうことを考えると、iを要素、XI、 Yl等を
要素の値と呼ぶことにすれば、要素と要素の値の複数個
の組で、ベクトルX及びYが表現されているときにX及
びYのいずれにも存在する要素をjs、1t*・・・・
・・・・・jAeJとし、Xだけに存在する要素をに、
に、・・・・・・・・−、kBttKとし、Yだけ存在
する要素を1!、、l!、?・−・−1(2*Lとする
と、Jnk−d、knL−lLハJ−gl(f6は空集
合を表わす)であ−るから、となり、本方式では右辺の
ように非常に少ない演算で、2個のベクトルの演算を行
なうことができ置として実現することが可能になる。
第3図は、本発明の一実施例の構成を示すブロック図で
ある。10は量子化信号に変換された文字バタン信号で
あり、特徴コード化部1は、文字バタン信号10を入力
信号とし、背景部の各点から複数方向へ走査を行ない、
文字ストロークと定められた範囲の角度で交差したとき
に、交差数を計数し、各背景点の特性をコード化するも
ので、詳細は後述する。
ある。10は量子化信号に変換された文字バタン信号で
あり、特徴コード化部1は、文字バタン信号10を入力
信号とし、背景部の各点から複数方向へ走査を行ない、
文字ストロークと定められた範囲の角度で交差したとき
に、交差数を計数し、各背景点の特性をコード化するも
ので、詳細は後述する。
2は特徴選択部で、特徴コード化部1でコード化された
各背景点の特性を信号20として読み出し、各コードの
出現頻度情報を抽出し、出現頻度の多い順に、対応する
コードと出現頻度の組を信号30として出力するが、そ
の時の組数は出現頻度の総和が、ある閾値を越えるまで
の可変とするか、或いは組数を、あらかじめ定めて固定
とする方法があるが、いずれの方法も本発明においては
受けつけることができる。
各背景点の特性を信号20として読み出し、各コードの
出現頻度情報を抽出し、出現頻度の多い順に、対応する
コードと出現頻度の組を信号30として出力するが、そ
の時の組数は出現頻度の総和が、ある閾値を越えるまで
の可変とするか、或いは組数を、あらかじめ定めて固定
とする方法があるが、いずれの方法も本発明においては
受けつけることができる。
3は評価値演算部で、特徴選択部2から送られてくる入
力文字バタンの出現フード及び頻度の情報信号30と標
準文字記憶部5から情報信号30と同じ形式で送られて
くる標準文字バタンの出現コード及び頻度の情報信号5
0とを入力信号とし、入力文字バタンと各標準文字バタ
ンとの類似性の評価値を抽出し2、信号40として送り
出すものである。
力文字バタンの出現フード及び頻度の情報信号30と標
準文字記憶部5から情報信号30と同じ形式で送られて
くる標準文字バタンの出現コード及び頻度の情報信号5
0とを入力信号とし、入力文字バタンと各標準文字バタ
ンとの類似性の評価値を抽出し2、信号40として送り
出すものである。
評価の方式としては、2個のベクトルXとYの類似度8
(X、 N) 離d(入Y) (ただし、rux、x>−Jム=習x−xハ 等でもよ
いが、計算量と装置構成の簡単さから、本発明の詳細な
説明に用いだL(X、Y)が望ましい。
(X、 N) 離d(入Y) (ただし、rux、x>−Jム=習x−xハ 等でもよ
いが、計算量と装置構成の簡単さから、本発明の詳細な
説明に用いだL(X、Y)が望ましい。
4は識別部で、入力文字バタンと各標準文字バタンの類
似性の評価値ふら最終的な6g識結果を信号41として
出力するもので、一つの実施例としては、各評価値を順
位づけして、最も類似性の高い評価値に対応する標準文
字バタンの字種を単純に出力する方式がある。土だ、別
の実施例としては順位づけをした後に、第1位の評価値
と第2位以下の評価値とを比較し、ある程度の差があれ
ば第1位の字種だけを出力し、そうでない場合には複数
の字種を候補文字として出力する方式がある。
似性の評価値ふら最終的な6g識結果を信号41として
出力するもので、一つの実施例としては、各評価値を順
位づけして、最も類似性の高い評価値に対応する標準文
字バタンの字種を単純に出力する方式がある。土だ、別
の実施例としては順位づけをした後に、第1位の評価値
と第2位以下の評価値とを比較し、ある程度の差があれ
ば第1位の字種だけを出力し、そうでない場合には複数
の字種を候補文字として出力する方式がある。
また、別の実施例としては、第2の実施例において、第
1位の評価値と第2位の評価値の間に大きな差があって
も、評価値自体が類似性の低い値をとる場合には、読取
不能として誤読を防ぐ方式等がある。
1位の評価値と第2位の評価値の間に大きな差があって
も、評価値自体が類似性の低い値をとる場合には、読取
不能として誤読を防ぐ方式等がある。
5は標準文字記憶部で、各被読取文字種ごとに前記特性
コード及びその頻度とを記憶し信号線5゜へ出力するも
のである。
コード及びその頻度とを記憶し信号線5゜へ出力するも
のである。
第4図は、特徴コード化部1の実施例の構成を示すブロ
ック図である。11は文字バタン信号】0を一時記憶す
るバタン記憶部であり、12は文字バタンの文字部と背
景部の境界となっている輪郭部に方向コードを割り当て
る輪郭方向コード化部であり、入力バタン記憶部11よ
り、各点及び周囲の点を信号102として順次読み込み
、方向コードの割当てを決定し、信号103として順次
送り出す。
ック図である。11は文字バタン信号】0を一時記憶す
るバタン記憶部であり、12は文字バタンの文字部と背
景部の境界となっている輪郭部に方向コードを割り当て
る輪郭方向コード化部であり、入力バタン記憶部11よ
り、各点及び周囲の点を信号102として順次読み込み
、方向コードの割当てを決定し、信号103として順次
送り出す。
13は輪郭方向コード化バタン記憶部で信号103を順
次読込み、輪郭部に方向コードの割り当てられた輪郭方
向コード化バタンを記憶する。14は交差点数部で、第
5図(+)、 (11)、 (Illχ側に示した4通
、りの走査法によって入力バタン記憶部11と輪郭方向
コード化バタン記憶部13より信号104と信号105
として文字バタンの情報を、順次読み込み、1行の走査
の間に、初めは内部にあるカウンターを0に初期化して
おき、走査中に定められた方向コードと出会うごとにカ
ウンターを1ずつ壜し、また信号i 04を読み込んだ
ときに背景部を表わす点であった場合には、その時のカ
ウンタの値を信号10Gとして送り出す。
次読込み、輪郭部に方向コードの割り当てられた輪郭方
向コード化バタンを記憶する。14は交差点数部で、第
5図(+)、 (11)、 (Illχ側に示した4通
、りの走査法によって入力バタン記憶部11と輪郭方向
コード化バタン記憶部13より信号104と信号105
として文字バタンの情報を、順次読み込み、1行の走査
の間に、初めは内部にあるカウンターを0に初期化して
おき、走査中に定められた方向コードと出会うごとにカ
ウンターを1ずつ壜し、また信号i 04を読み込んだ
ときに背景部を表わす点であった場合には、その時のカ
ウンタの値を信号10Gとして送り出す。
15は特徴コード化バタン記憶部で、バタン記憶部11
と輪郭方向コード化バタン記憶部13に対応して特徴コ
ードを記憶するものであるが、その一実施例として41
1の記憶部を用意し、第5図に示した4通りの走査に対
応する記憶部の入力バタン記憶部1]上の画素に対応す
る番地に交差点数計数部14の出力信号106の値を甫
き込む方法があり、特徴コードを信号20として参照す
るときには、前記4層の記憶部の対応する4個の値を取
9出すことになる。
と輪郭方向コード化バタン記憶部13に対応して特徴コ
ードを記憶するものであるが、その一実施例として41
1の記憶部を用意し、第5図に示した4通りの走査に対
応する記憶部の入力バタン記憶部1]上の画素に対応す
る番地に交差点数計数部14の出力信号106の値を甫
き込む方法があり、特徴コードを信号20として参照す
るときには、前記4層の記憶部の対応する4個の値を取
9出すことになる。
第6図(11,(貼Oil Ov)、 (凧(Vへυ1
かは輪郭部に方向コードを割当てるーレリを示す図であ
る。この図では文字バタン上の任意の1点と、その点に
瞬接する8個の点によって方向コードを割り当てる例で
あり、第6図(1)、 (If)、 (iiD、 Ov
)、 (vlおよび(VDを満たすと六には方向コード
0.1.1.2.3.3が割り当てられ、これらを18
0度回転した場合にも、同じ方向コード0、1.1.2
.3.3が割り当てられ、これらを90度および270
度回板回転場合には、方向コード4.5.5.6゜7.
7が割り当てられることを示し、また、走査線と文字ス
トロークが定められた範囲の角度で交差するときに交差
数を計数するとは、例えば、第5図の(11、(11)
の走査を行ガう場合には、第6図(vl)に示すように
方向コード0,12,6.7と交差したり合にのみ計数
し、また、第5図の(iiL (iv)の走査を行なう
場合には、方向フード2.3.−1.5.6と交差した
場合にのみ計数することによって実現できる。
かは輪郭部に方向コードを割当てるーレリを示す図であ
る。この図では文字バタン上の任意の1点と、その点に
瞬接する8個の点によって方向コードを割り当てる例で
あり、第6図(1)、 (If)、 (iiD、 Ov
)、 (vlおよび(VDを満たすと六には方向コード
0.1.1.2.3.3が割り当てられ、これらを18
0度回転した場合にも、同じ方向コード0、1.1.2
.3.3が割り当てられ、これらを90度および270
度回板回転場合には、方向コード4.5.5.6゜7.
7が割り当てられることを示し、また、走査線と文字ス
トロークが定められた範囲の角度で交差するときに交差
数を計数するとは、例えば、第5図の(11、(11)
の走査を行ガう場合には、第6図(vl)に示すように
方向コード0,12,6.7と交差したり合にのみ計数
し、また、第5図の(iiL (iv)の走査を行なう
場合には、方向フード2.3.−1.5.6と交差した
場合にのみ計数することによって実現できる。
第7図(1〜(Ill、 (Ill)は、評価値演算部
3におす1”る処理内容を直観的に示すだめの図で′f
!1シ、N−(1)は「田」の手書き入力バタンと、そ
の選択された特徴コード及びその特徴コードの頻度情報
の一例を示す図であり、(II)は辞書1内の「田」の
標準lくタンとその選択された特徴コード及びその特徴
コードの頻度情報の−fllを示す図であり、(lit
)は辞書内の「甲」の標準バタンとその選択された特徴
コード及びその特徴コードの頻度情報の一例を示す図で
あり、コードと頻度は、例えば、同図(1)の手書き入
力バタンは、上に1回、下に2回、左に1回、右に2回
交差する背景点が、820+上に1回、下に2回、左に
2回、右に1回交差する背景点が800上に2回、下に
1回、左に1回、右に2回交差する背景点カフ60.−
ヒに2回、′FK1回、左に2回右に1回交差する背景
点が、770あるということを意味している。
3におす1”る処理内容を直観的に示すだめの図で′f
!1シ、N−(1)は「田」の手書き入力バタンと、そ
の選択された特徴コード及びその特徴コードの頻度情報
の一例を示す図であり、(II)は辞書1内の「田」の
標準lくタンとその選択された特徴コード及びその特徴
コードの頻度情報の−fllを示す図であり、(lit
)は辞書内の「甲」の標準バタンとその選択された特徴
コード及びその特徴コードの頻度情報の一例を示す図で
あり、コードと頻度は、例えば、同図(1)の手書き入
力バタンは、上に1回、下に2回、左に1回、右に2回
交差する背景点が、820+上に1回、下に2回、左に
2回、右に1回交差する背景点が800上に2回、下に
1回、左に1回、右に2回交差する背景点カフ60.−
ヒに2回、′FK1回、左に2回右に1回交差する背景
点が、770あるということを意味している。
評価値ど17て■、(X、’Y)を用のるとすると、手
書き入力バタンr 111 Jと、・禦皐バタン「1口
」との評価値は、 +820−8001+l goo−soo l利760
−8001+177()−8001−90人カバタン「
田」と標準バタン「甲」との評価値はとなり、手書き入
力バタン「日」は、標準バタン「甲」よりも、標準バ)
ン「田」に近いという結果が得られることに7する。
書き入力バタンr 111 Jと、・禦皐バタン「1口
」との評価値は、 +820−8001+l goo−soo l利760
−8001+177()−8001−90人カバタン「
田」と標準バタン「甲」との評価値はとなり、手書き入
力バタン「日」は、標準バタン「甲」よりも、標準バ)
ン「田」に近いという結果が得られることに7する。
以上説明したように、本発明によれば複数方向の走査に
おいて文字の傾きに対しても安定したストロークとの交
差点数を特徴として抽出することができまた、理論的に
は膨大な演算処理を実現可能な範囲内の処理量で済ませ
ることのできる文字認識処理が実現できる。
おいて文字の傾きに対しても安定したストロークとの交
差点数を特徴として抽出することができまた、理論的に
は膨大な演算処理を実現可能な範囲内の処理量で済ませ
ることのできる文字認識処理が実現できる。
第1図は文字バタンの背景部の各点の特性を表示する図
の一例であり、第2図は本発明の詳細な説明するだめの
図である。 第3図は本発明の一実施例の構成を示すブロック図、第
4図tま特徴コード化部1の実施例の構成を示すブロッ
ク図、第5肖は交差数計数のだめの複数の走査方向の一
例を示す図、第6図は輪郭部に方向コードを割り当てる
一例を示す図、第7図は評価値演算部3における処理内
容を直観的に示すための園である。 1λにおいて、1・・・・・・・・・特徴コード化部、
2・・・・・・・・・特徴選択部、3・・・・・・・・
・評価値演算部、4・・・・・・・・・識別部5・・・
・・・・・・標準文字記憶部、11・・・・−・・・・
バタン記憶部、12・・・・・・・・・輪郭方向コード
化部、13・・・・・・・・輪郭方向コード化バタン記
憶部、14・・・・・・・・・交差点数計数部15・・
・・・・・・・特徴コード化バタン記憶部を、それぞれ
示塁3図 毛 呼 15図 (i) (i)(iiD もら図 (り (i+”) (:ii) (
iV)0 / /
、Z(Vli ) Civン (V> <Vt> 3 3 発’7j (i) (1′1°i) 乙 (jl)
の一例であり、第2図は本発明の詳細な説明するだめの
図である。 第3図は本発明の一実施例の構成を示すブロック図、第
4図tま特徴コード化部1の実施例の構成を示すブロッ
ク図、第5肖は交差数計数のだめの複数の走査方向の一
例を示す図、第6図は輪郭部に方向コードを割り当てる
一例を示す図、第7図は評価値演算部3における処理内
容を直観的に示すための園である。 1λにおいて、1・・・・・・・・・特徴コード化部、
2・・・・・・・・・特徴選択部、3・・・・・・・・
・評価値演算部、4・・・・・・・・・識別部5・・・
・・・・・・標準文字記憶部、11・・・・−・・・・
バタン記憶部、12・・・・・・・・・輪郭方向コード
化部、13・・・・・・・・輪郭方向コード化バタン記
憶部、14・・・・・・・・・交差点数計数部15・・
・・・・・・・特徴コード化バタン記憶部を、それぞれ
示塁3図 毛 呼 15図 (i) (i)(iiD もら図 (り (i+”) (:ii) (
iV)0 / /
、Z(Vli ) Civン (V> <Vt> 3 3 発’7j (i) (1′1°i) 乙 (jl)
Claims (1)
- 文字部と背景部とが、二値から成る量子化信号に変換さ
れて成る文字バタン上で、背景部の各点より接散方向に
文字を走査し、前記各走査方向に対し、定められた範囲
の角度で交差するストローク数を計数して、特徴づける
特徴コード化部とコード化された特徴から複数個の特徴
と、その頻度情報を抽出する特徴選択部と、前記特徴選
択部より得られる選択された特徴コードと、その頻度情
報と同形式の被読取字種の標準文字情報を格納している
標準文字記憶部と、前記特徴選択部より得られる入力用
情報を読込み、前記標準文字記憶部に格納されてい力各
被読取字種の標準文字情報との評価値演算を行ない、そ
の各評価値を送り出す評価値演算部と各被読取字種に対
応する評価値から最適な認識結果を出力する識別部を有
することを特徴とする文字認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56169153A JPS5870383A (ja) | 1981-10-22 | 1981-10-22 | 文字認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56169153A JPS5870383A (ja) | 1981-10-22 | 1981-10-22 | 文字認識方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5870383A true JPS5870383A (ja) | 1983-04-26 |
| JPH0250514B2 JPH0250514B2 (ja) | 1990-11-02 |
Family
ID=15881260
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56169153A Granted JPS5870383A (ja) | 1981-10-22 | 1981-10-22 | 文字認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5870383A (ja) |
-
1981
- 1981-10-22 JP JP56169153A patent/JPS5870383A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0250514B2 (ja) | 1990-11-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0355748B1 (en) | A pattern recognition apparatus and method for doing the same | |
| Mohamed et al. | Generalized hidden markov models. ii. application to handwritten word recognition | |
| US6081620A (en) | System and method for pattern recognition | |
| EP0385009A1 (en) | Apparatus and method for use in image processing | |
| Lehal et al. | Feature extraction and classification for OCR of Gurmukhi script | |
| JPH0944602A (ja) | 近傍点検出方法及びパターン認識装置 | |
| Heutte et al. | Combining structural and statistical features for the recognition of handwritten characters | |
| JPS5870383A (ja) | 文字認識方式 | |
| US5596657A (en) | Method of sorting out candidate characters in character recognition system | |
| US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
| Tou et al. | Automatic recognition of handwritten characters via feature extraction and multi-level decision | |
| KR19980025571A (ko) | 규칙적인 잡음을 이용한 한글 인식 시스템 | |
| KR200331200Y1 (ko) | 프렉탈 차원을 이용한 문자인식장치 | |
| KR100332752B1 (ko) | 문자인식방법 | |
| JP3374793B2 (ja) | 高速認識検索システム及びそれに用いる認識検索高速化方法並びにその制御プログラムを記録した記録媒体 | |
| JPH03126188A (ja) | 文字認識装置 | |
| KR102007791B1 (ko) | 단계별 윤곽선 특성 분석을 이용한 숫자 인식 방법 및 장치 | |
| JPH06162266A (ja) | オンライン手書き文字認識の方法及びその装置 | |
| JP2851865B2 (ja) | 文字認識装置 | |
| JP2639314B2 (ja) | 文字認識方式 | |
| Cao et al. | Online structure based Chinese character pre-classification | |
| Lucas et al. | Fast convolutional OCR with the scanning n-tuple grid | |
| JPS58207183A (ja) | 文字識別方式 | |
| JPS5875279A (ja) | 文字分類方式 | |
| JPH0567239A (ja) | 活字文字認識装置 |