JPH0799534B2 - 文字図形認識方式 - Google Patents
文字図形認識方式Info
- Publication number
- JPH0799534B2 JPH0799534B2 JP62061241A JP6124187A JPH0799534B2 JP H0799534 B2 JPH0799534 B2 JP H0799534B2 JP 62061241 A JP62061241 A JP 62061241A JP 6124187 A JP6124187 A JP 6124187A JP H0799534 B2 JPH0799534 B2 JP H0799534B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- series
- pattern
- divided
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は媒体上の文字図形を認識する文字図形認識方式
に関するものである。
に関するものである。
(従来の技術) 従来、文字図形認識装置では、文字図形パターンよりス
トロークを抽出し、それら抽出されたストロークの位
置、長さ、ストローク間の相互関係等を用いて認識する
方式が多く採用されている。その手法は(1)文字図形
の輪郭を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分割点と
して輪郭系列を分割し、分割された系列を組合わせるこ
とによりストロークを抽出するか、(2)文字図形パタ
ーンに細線化処理を行なつて骨格化し、その骨格パター
ンの連結性及び骨格パターンを追跡し急激な角度の変化
点等を検出してストロークを抽出し、前記(1)(2)
より抽出されたストロークについて幾何学的な特徴等を
抽出して識別を行なつていた。
トロークを抽出し、それら抽出されたストロークの位
置、長さ、ストローク間の相互関係等を用いて認識する
方式が多く採用されている。その手法は(1)文字図形
の輪郭を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分割点と
して輪郭系列を分割し、分割された系列を組合わせるこ
とによりストロークを抽出するか、(2)文字図形パタ
ーンに細線化処理を行なつて骨格化し、その骨格パター
ンの連結性及び骨格パターンを追跡し急激な角度の変化
点等を検出してストロークを抽出し、前記(1)(2)
より抽出されたストロークについて幾何学的な特徴等を
抽出して識別を行なつていた。
(発明が解決しようとする問題点) しかしながら、前記従来の文字図形認識方式では、次の
ような問題点がある。
ような問題点がある。
(1)の方式では文字図形パターンが大きくなり、又文
字図形パターンが複雑化すると、その処理量が増大し処
理速度の低下を招いていた。(2)の方式では文字図形
パターンを細線化する必要があり、又その細線化による
パターンのひずみ、ヒゲ等の問題があり、その後の処理
を複雑なものとしていた。
字図形パターンが複雑化すると、その処理量が増大し処
理速度の低下を招いていた。(2)の方式では文字図形
パターンを細線化する必要があり、又その細線化による
パターンのひずみ、ヒゲ等の問題があり、その後の処理
を複雑なものとしていた。
本発明は以上述べた問題点を解決し、簡単な処理で高速
に文字図形を認識することが可能な文字図形認識方式を
提供することを目的とする。
に文字図形を認識することが可能な文字図形認識方式を
提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、媒体上の文字図
形を読取って量子化,2値化して、例えば文字線部を黒ビ
ット、背景部を白ビットと表わして得られるパターンを
記憶する記憶手段を備え、前記パターンに基づいて文字
図形を認識する文字図形認識方式において、(a)前記
パターンを走査して文字図形の外接枠を検出する第1の
検出手段、(b)前記パターンを走査して所定の2つの
軸に(例えば2次元座標における水平方向、垂直方向。
以下これらをX軸、Y軸という。)投影した各軸方向の
黒ビツト数分布を作成する作成手段、(c)前記2つの
軸方向の前記外接枠内の範囲で各黒ビツト数分布の重心
座標を決定し、決定した各重心座標で外接枠内の範囲を
分割した各分割範囲に対し各黒ビツト数分布の重心座標
を決定する過程を繰り返して各軸方向の重心座標系列を
検出する第2の検出手段、(d)前記重心座標系列に基
づいて各軸方向の分割座標系列を決定する決定手段、
(e)前記分割座標系列で分割される前記外接枠の各領
域の長さを対応する軸方向の外接枠の長さで正規化した
各軸方向の分割領域長系列を計算する計算手段、及び
(f)前記分割領域長系列と予め計算された標準パター
ンの分割領域長系列とを照合して前記パターンの文字図
形を認識する認識手段を具備するものである。
形を読取って量子化,2値化して、例えば文字線部を黒ビ
ット、背景部を白ビットと表わして得られるパターンを
記憶する記憶手段を備え、前記パターンに基づいて文字
図形を認識する文字図形認識方式において、(a)前記
パターンを走査して文字図形の外接枠を検出する第1の
検出手段、(b)前記パターンを走査して所定の2つの
軸に(例えば2次元座標における水平方向、垂直方向。
以下これらをX軸、Y軸という。)投影した各軸方向の
黒ビツト数分布を作成する作成手段、(c)前記2つの
軸方向の前記外接枠内の範囲で各黒ビツト数分布の重心
座標を決定し、決定した各重心座標で外接枠内の範囲を
分割した各分割範囲に対し各黒ビツト数分布の重心座標
を決定する過程を繰り返して各軸方向の重心座標系列を
検出する第2の検出手段、(d)前記重心座標系列に基
づいて各軸方向の分割座標系列を決定する決定手段、
(e)前記分割座標系列で分割される前記外接枠の各領
域の長さを対応する軸方向の外接枠の長さで正規化した
各軸方向の分割領域長系列を計算する計算手段、及び
(f)前記分割領域長系列と予め計算された標準パター
ンの分割領域長系列とを照合して前記パターンの文字図
形を認識する認識手段を具備するものである。
(作用) 本発明によれば、以上のように文字認識方式を構成した
ので、技術的手段は次のように作用する。記憶手段に格
納されたパターンを走査することによつて、第1の検出
手段では文字図形の外接枠(文字枠)が検出され、作成
手段では各軸方向(例えばX軸,Y軸方向)の黒ビツト数
分布が作成される。このようにして得られた外接枠及び
各黒ビツト数分布に基づいて、第2の検出手段で各軸方
向の重心座標系列が検出される。検出された重心座標系
列に基づいて、決定手段により各軸方向の分割座標系列
が決定される。例えば、文字図形の複雑度に応じて各軸
方向の分割数が定められ、重心座標系列にほぼ均等に対
応した各軸方向の分割座標系列が決定される。決定され
た分割座標系列で分割される前記外接枠の各領域の長さ
を対応する軸方向の外接枠の長さで正規化した各軸方向
の分割領域長の系列(分割領域長系列)が計算手段によ
り計算される。この正規化した分割領域長系列と予め同
様にして計算された標準パターンの分割領域長系列とが
認識手段により照合され、該当する標準パターンのカテ
ゴリ名を文字図形名として出力される。このように本発
明では、文字図形のパターンを走査して文字図形の特徴
情報として分割領域長系列を算出し、この特徴情報で文
字図形を認識しているので、簡単な処理で高速な文字認
識が可能となる。
ので、技術的手段は次のように作用する。記憶手段に格
納されたパターンを走査することによつて、第1の検出
手段では文字図形の外接枠(文字枠)が検出され、作成
手段では各軸方向(例えばX軸,Y軸方向)の黒ビツト数
分布が作成される。このようにして得られた外接枠及び
各黒ビツト数分布に基づいて、第2の検出手段で各軸方
向の重心座標系列が検出される。検出された重心座標系
列に基づいて、決定手段により各軸方向の分割座標系列
が決定される。例えば、文字図形の複雑度に応じて各軸
方向の分割数が定められ、重心座標系列にほぼ均等に対
応した各軸方向の分割座標系列が決定される。決定され
た分割座標系列で分割される前記外接枠の各領域の長さ
を対応する軸方向の外接枠の長さで正規化した各軸方向
の分割領域長の系列(分割領域長系列)が計算手段によ
り計算される。この正規化した分割領域長系列と予め同
様にして計算された標準パターンの分割領域長系列とが
認識手段により照合され、該当する標準パターンのカテ
ゴリ名を文字図形名として出力される。このように本発
明では、文字図形のパターンを走査して文字図形の特徴
情報として分割領域長系列を算出し、この特徴情報で文
字図形を認識しているので、簡単な処理で高速な文字認
識が可能となる。
(実施例) 以下、第1図乃至第4図を参照して本発明の実施例を説
明する。
明する。
第1図は本発明の文字図形認識方式の一実施例を示す機
能ブロツク図である。
能ブロツク図である。
1は文字、図形、記号等(以下、文字という)が記載さ
れた帳票等の媒体からの光入力である。この光入力1は
光電変換部2に入力される。光電変換部2は1つの文字
予定領域を128×128の画素へ分解し、各画素を2値のデ
イジタル信号(以下これを入力文字パターンと呼ぶ)へ
変換するものであり、平均的大きさの1文字は60×60ビ
ツト程度の入力文字パターンで表現される。パターンレ
ジスタ3は文字予定領域における各画素のX,Y座標を再
現できる形式で入力文字パターンを記憶するものであ
り、文字予定領域に対応して128×128ビツトの容量を有
するものである。
れた帳票等の媒体からの光入力である。この光入力1は
光電変換部2に入力される。光電変換部2は1つの文字
予定領域を128×128の画素へ分解し、各画素を2値のデ
イジタル信号(以下これを入力文字パターンと呼ぶ)へ
変換するものであり、平均的大きさの1文字は60×60ビ
ツト程度の入力文字パターンで表現される。パターンレ
ジスタ3は文字予定領域における各画素のX,Y座標を再
現できる形式で入力文字パターンを記憶するものであ
り、文字予定領域に対応して128×128ビツトの容量を有
するものである。
文字枠検出部4は、例えば文字の外接枠(文字枠)をそ
のパターンレジスタにおける左端座標Xl、右端座標Xr、
上端座標Yt、下端座標Ybで表現して検出する。
のパターンレジスタにおける左端座標Xl、右端座標Xr、
上端座標Yt、下端座標Ybで表現して検出する。
文字投影作成部5はパターンレジスタ3の入力文字パタ
ーンを所定の軸、例えばX軸,Y軸(夫夫パターンレジス
タ3の2次元座標における水平方向,垂直方向)へ投影
して黒ビツト数の分布を求め、黒ビツト数分布SX
(x),SY(y)を作成する。
ーンを所定の軸、例えばX軸,Y軸(夫夫パターンレジス
タ3の2次元座標における水平方向,垂直方向)へ投影
して黒ビツト数の分布を求め、黒ビツト数分布SX
(x),SY(y)を作成する。
但し、x,yはパターンレジスタ3における夫夫0〜127な
る2次元座標であり、Yt,Ybは文字枠のY軸方向の上端
座標、下端座標、Xl,XrはX軸方向の左端座標、右端座
標であり、P(x,y)は黒ビツト又は白ビツトを意味
し、黒ビツト(有意色)の場合P(x,y)=1、白ビツ
ト(背景色)の場合P(x,y)=0をとる。
る2次元座標であり、Yt,Ybは文字枠のY軸方向の上端
座標、下端座標、Xl,XrはX軸方向の左端座標、右端座
標であり、P(x,y)は黒ビツト又は白ビツトを意味
し、黒ビツト(有意色)の場合P(x,y)=1、白ビツ
ト(背景色)の場合P(x,y)=0をとる。
第2図(a)に入力文字パターン例として漢字「天」と
「夫」のパターンの場合を示し、第2図(b),(c)
に第2図(a)の各パターンに対する黒ビツト数分布SX
(x),SY(y)を示す。
「夫」のパターンの場合を示し、第2図(b),(c)
に第2図(a)の各パターンに対する黒ビツト数分布SX
(x),SY(y)を示す。
重心検出部6は、文字枠のX,Y各軸方向の全範囲Xl〜Xr,
Yt〜Yb及び前の過程で検出した重心座標でその範囲Xl〜
Yr,Yt〜Ybを分割した各範囲を対象として、入力文字パ
ターンの夫々の黒ビツト数分布SX(x),SY(y)の重
心座標系列X(Mp),Y(Mq)を求めるものであり、各範
囲の1次モーメントの和をその範囲の黒ビツト和で除算
することによつて求めるものである。但し、Mp,Mqは座
標値の大きさの順に付した重心座標番号であり、Mp=1
〜MX(MXはX軸方向の重心の個数であつて奇数)Mq=1
〜MY(MYはY軸方向の重心の個数)である。X軸方向の
重心座標の個数MXとしては、15個程度の比較的多い数
(分割数に比べて)を採用することが望ましいが、説明
の簡略化のために7個の重心座標X(Mp)を検出する場
合について述べる。
Yt〜Yb及び前の過程で検出した重心座標でその範囲Xl〜
Yr,Yt〜Ybを分割した各範囲を対象として、入力文字パ
ターンの夫々の黒ビツト数分布SX(x),SY(y)の重
心座標系列X(Mp),Y(Mq)を求めるものであり、各範
囲の1次モーメントの和をその範囲の黒ビツト和で除算
することによつて求めるものである。但し、Mp,Mqは座
標値の大きさの順に付した重心座標番号であり、Mp=1
〜MX(MXはX軸方向の重心の個数であつて奇数)Mq=1
〜MY(MYはY軸方向の重心の個数)である。X軸方向の
重心座標の個数MXとしては、15個程度の比較的多い数
(分割数に比べて)を採用することが望ましいが、説明
の簡略化のために7個の重心座標X(Mp)を検出する場
合について述べる。
まず、文字枠のX軸方向の範囲Xl〜Xrを対象として、次
式に示すように入力文字パターンの黒ビツト数分布SX
(x)の1次モーメント和をその範囲の黒ビツト和で除
算することによつて、中央の重心座標番号M4の重心座標
X(4)を求め 次いで、その重心座標X(4)で分割された夫夫の範
囲、Xl〜X(4),X(X4)〜Xrを対象として2つの重心
座標X(2),X(6)を求める。
式に示すように入力文字パターンの黒ビツト数分布SX
(x)の1次モーメント和をその範囲の黒ビツト和で除
算することによつて、中央の重心座標番号M4の重心座標
X(4)を求め 次いで、その重心座標X(4)で分割された夫夫の範
囲、Xl〜X(4),X(X4)〜Xrを対象として2つの重心
座標X(2),X(6)を求める。
次いで、これまで検出された重心座標X(2),X
(4),X(6)で分割された範囲Xl〜X(2),X(2)
〜X(4),X(4)〜X(6),X(6)〜Xrを対象とし
て4個の重心座標X(1),X(3),X(5),X(7)を
求める。
(4),X(6)で分割された範囲Xl〜X(2),X(2)
〜X(4),X(4)〜X(6),X(6)〜Xrを対象とし
て4個の重心座標X(1),X(3),X(5),X(7)を
求める。
Y軸方向の重心座標Y(Mq)の検出も検出する重心座標
個数MYを7個とした場合、まず、文字枠の範囲Yt〜Ybを
対象として入力文字パターンの黒ビツト分布SY(y)の
重心座標Y(4)を検出し、次いで文字枠を重心座標で
2分した範囲Yt〜Y(4),Y(4)〜Ybそれぞれを対象
として黒ビツト分布SY(y)重心座標Y(2),Y(4)
を検出し、更にこれまでに検出された重心座標Y
(2),Y(4),Y(6)でY軸方向の文字枠を分割した
夫々の範囲Yt〜Y(2),Y(2)〜Y(4),Y(4)〜
Y(6),Y(6)〜Ybを対象として黒ビツト分布SY
(y)の重心座標を検出することによつて、計7個の重
心座標Y(1)〜Y(7)を検出する。
個数MYを7個とした場合、まず、文字枠の範囲Yt〜Ybを
対象として入力文字パターンの黒ビツト分布SY(y)の
重心座標Y(4)を検出し、次いで文字枠を重心座標で
2分した範囲Yt〜Y(4),Y(4)〜Ybそれぞれを対象
として黒ビツト分布SY(y)重心座標Y(2),Y(4)
を検出し、更にこれまでに検出された重心座標Y
(2),Y(4),Y(6)でY軸方向の文字枠を分割した
夫々の範囲Yt〜Y(2),Y(2)〜Y(4),Y(4)〜
Y(6),Y(6)〜Ybを対象として黒ビツト分布SY
(y)の重心座標を検出することによつて、計7個の重
心座標Y(1)〜Y(7)を検出する。
漢字「天」と「夫」の入力文字パターン(第2図
(a))の場合については、第2図(b),(c)の黒
ビツト数分布(SX(x),SY(y))図中に重心座標X
(1)〜X(7)、Y(1)〜Y(7)を示す。
(a))の場合については、第2図(b),(c)の黒
ビツト数分布(SX(x),SY(y))図中に重心座標X
(1)〜X(7)、Y(1)〜Y(7)を示す。
文字枠分割点決定部7は、X,Y軸方向の分割数をNX,NYと
し、重心検出部6よりうけたX,Y軸各方向の分割座標系
列をDX(ki),DY(kj)として、X,Y軸各方向の重心座標
系列X(Mp),Y(Mq)を分割座標候補として、重心座標
番号Mp,Mqを分割座標番号ki,kjにほぼ均等に対応づけて
分割座標系列DX(ki),DY(kj)を決定するものであ
る。
し、重心検出部6よりうけたX,Y軸各方向の分割座標系
列をDX(ki),DY(kj)として、X,Y軸各方向の重心座標
系列X(Mp),Y(Mq)を分割座標候補として、重心座標
番号Mp,Mqを分割座標番号ki,kjにほぼ均等に対応づけて
分割座標系列DX(ki),DY(kj)を決定するものであ
る。
この実施例における分割単位領域の分割形式は、X軸方
向に関する分割数としてNX=4,5,6,8なる4形式を取る
ことができ、同様にY軸方向に関する分割数NYとしてNY
=4,5,6,8なる4形式を取ることができ、X軸方向の分
割座標番号をki(ki=1〜NX-1,NX=4,5,6,8)とし且つ
Y軸方向の分割座標番号をkj(kj=1〜NY-1,NY=4,5,
6,8)として、文字枠を夫々NX,NYなる個数の領域に分割
する分割座標系列DX(ki),DY(kj)を決定する。X,Y軸
各方向の重心座標番号Mp,MqとX,Y軸方向の分割座標番号
ki,kjをほぼ均等に対応づけて分割座標列DX(ki),DY
(kj)を決定するために用いるテーブルを第1表に示
す。
向に関する分割数としてNX=4,5,6,8なる4形式を取る
ことができ、同様にY軸方向に関する分割数NYとしてNY
=4,5,6,8なる4形式を取ることができ、X軸方向の分
割座標番号をki(ki=1〜NX-1,NX=4,5,6,8)とし且つ
Y軸方向の分割座標番号をkj(kj=1〜NY-1,NY=4,5,
6,8)として、文字枠を夫々NX,NYなる個数の領域に分割
する分割座標系列DX(ki),DY(kj)を決定する。X,Y軸
各方向の重心座標番号Mp,MqとX,Y軸方向の分割座標番号
ki,kjをほぼ均等に対応づけて分割座標列DX(ki),DY
(kj)を決定するために用いるテーブルを第1表に示
す。
このテーブルを参照して、X,Y軸各方向の分割数NX,NYに
対応してこのテーブルから重心座標番号Mp,Mqを読み出
し、その重心座標番号Mp,Mqに対応した重心座標X
(Mp),Y(Mq)を分割座標DX(ki),DY(kj)として決
定する。
対応してこのテーブルから重心座標番号Mp,Mqを読み出
し、その重心座標番号Mp,Mqに対応した重心座標X
(Mp),Y(Mq)を分割座標DX(ki),DY(kj)として決
定する。
第1表のテーブルは、重心検出部6で検出する重心座標
の個数MX,MYが7個の場合であるが、一般的な場合にお
いても、X,Y各方向の分割数の重心座標が含まれるよう
に対応させ、且つその際余分の重心座標が残つた場合は
両端の領域から順に1個多い重心座標が含まれるように
対応させることによつて作ることができる。
の個数MX,MYが7個の場合であるが、一般的な場合にお
いても、X,Y各方向の分割数の重心座標が含まれるよう
に対応させ、且つその際余分の重心座標が残つた場合は
両端の領域から順に1個多い重心座標が含まれるように
対応させることによつて作ることができる。
第3図には、X,Y軸各方向の分割数NX,NYとしてNX=NY=
5なる分割数が指定された場合について、分割座標系列
DX(ki),DY(kj)と重心座標系列X(Mp),Y(Mq)と
の対応関係を示す。
5なる分割数が指定された場合について、分割座標系列
DX(ki),DY(kj)と重心座標系列X(Mp),Y(Mq)と
の対応関係を示す。
なお、分割数NX,NYは入力文字の複雑度に応じて分割数N
X,NYを決定し、或いはいつたんリジエクトされた場合に
分割数NX,NYを変更して再度文字認識を行なわせるもの
である。
X,NYを決定し、或いはいつたんリジエクトされた場合に
分割数NX,NYを変更して再度文字認識を行なわせるもの
である。
以上の様に文字枠分割点決定部7では、分割単位領域の
分割形式は、X軸方向に関する分割数としてNX=4,5,6,
8なる4形式、Y軸方向に関する分割数としてNY=4,5,
6,8なる4形式をとることができる。本実施例では説明
の簡略化のため、分割数をNX=NY=4として以下説明す
る。この場合、X軸方向については、重心座標X
(M2),X(M4),X(M6)に対応する分割座標DX(1),D
X(2),DX(3)、Y軸方向については、重心座標Y
(M2),Y(M4),Y(M6)に対応する分割座標DY(1),D
Y(2),DY(3)を決定する。
分割形式は、X軸方向に関する分割数としてNX=4,5,6,
8なる4形式、Y軸方向に関する分割数としてNY=4,5,
6,8なる4形式をとることができる。本実施例では説明
の簡略化のため、分割数をNX=NY=4として以下説明す
る。この場合、X軸方向については、重心座標X
(M2),X(M4),X(M6)に対応する分割座標DX(1),D
X(2),DX(3)、Y軸方向については、重心座標Y
(M2),Y(M4),Y(M6)に対応する分割座標DY(1),D
Y(2),DY(3)を決定する。
正規化分割領域長計算部8は、文字枠検出部4で検出さ
れたX方向の文字枠座標Xl,XrとY軸方向の文字枠座標Y
t,Yb、及び文字枠分割点決定部7で決定されたX軸方向
の分割座標DX(1)、DX(2)、DX(3)とY軸方向の
分割座標DY(1)、DY(2)、DY(3)を受けて、各軸
上において各分割座標で分割される各領域の長さを、上
記両端座標間の長さで正規化した正規化分割領域長系列
を以下の式によつて計算する。
れたX方向の文字枠座標Xl,XrとY軸方向の文字枠座標Y
t,Yb、及び文字枠分割点決定部7で決定されたX軸方向
の分割座標DX(1)、DX(2)、DX(3)とY軸方向の
分割座標DY(1)、DY(2)、DY(3)を受けて、各軸
上において各分割座標で分割される各領域の長さを、上
記両端座標間の長さで正規化した正規化分割領域長系列
を以下の式によつて計算する。
X軸正規化分割座標系列; X軸両端座標間長;LX=Xr−Xl+1 ……(7) Y軸正規化分割座標系列; Y軸両端座標間長;LY=Yb−Yt+1 ……(9) ただし、DX(0)=Xl、DX(4)=Xr、DY(0)=Yt、
DY(4)=Ybである。
DY(4)=Ybである。
漢字「天」と「夫」夫々の入力文字パターンにおける分
割座標DX(0)〜DX(4)、DY(0)〜DY(4)、X軸
方向の正規化分割領域長BEX(1)〜BEX(4)、Y軸方
向の正規化分割領域長BEY(1)〜BEY(4)を各入力文
字パターンと共に第2図(a)に示す。
割座標DX(0)〜DX(4)、DY(0)〜DY(4)、X軸
方向の正規化分割領域長BEX(1)〜BEX(4)、Y軸方
向の正規化分割領域長BEY(1)〜BEY(4)を各入力文
字パターンと共に第2図(a)に示す。
正規化分割領域長計算部8で得られた入力文字パターン
の特徴情報としての正規化分割領域系列fi={BEX
(I)、BEY(I)|I=1〜4}は識別部9に与えられ
る。
の特徴情報としての正規化分割領域系列fi={BEX
(I)、BEY(I)|I=1〜4}は識別部9に与えられ
る。
辞書メモリ10には、入力文字パターンの場合と同様にし
て計算された標準パターンに対する特徴情報としての正
規化分割領域系列giが予め登録されている。
て計算された標準パターンに対する特徴情報としての正
規化分割領域系列giが予め登録されている。
識別部9は入力文字パターン及び標準パターンの特徴情
報の類似度を測定し、最も類似する標準パターンの文字
コードを入力文字パターン名として認識し、その文字コ
ードを文字コード出力端子11に出力する。本実施例で
は、辞書メモリ10内の標準パターンの正規化分割領域長
系列giと入力文字パターンの正規化分割領域長系列fiと
の間における下記のユークリツド距離(D)の最小値を
与える標準パターンを最も類似する標準パターンとす
る。
報の類似度を測定し、最も類似する標準パターンの文字
コードを入力文字パターン名として認識し、その文字コ
ードを文字コード出力端子11に出力する。本実施例で
は、辞書メモリ10内の標準パターンの正規化分割領域長
系列giと入力文字パターンの正規化分割領域長系列fiと
の間における下記のユークリツド距離(D)の最小値を
与える標準パターンを最も類似する標準パターンとす
る。
なおまた、前記実施例においてはテーブルを採用するこ
とによつて重心座標と分割座標とを対応づけたが、所定
の手順のフローチヤートの演算処理を実行させることに
よつても対応づけることができる。この場合のフローチ
ヤートを第4図に示す。なお、第4図における除算の結
果はすべて小数点以下切り捨てである。
とによつて重心座標と分割座標とを対応づけたが、所定
の手順のフローチヤートの演算処理を実行させることに
よつても対応づけることができる。この場合のフローチ
ヤートを第4図に示す。なお、第4図における除算の結
果はすべて小数点以下切り捨てである。
第4図において、ステツプS1で重心個数MXを分割数NXで
割つた数Mαを求め、ステツプS2,S3でMX/NXの剰余R1と
そのR1を2で割った商R2を求める。又、ステツプS4で分
割数の中央値kαを求め、ステツプS5,S6で分割番号kiと
重心番号Mpを0にセツトする。又、ステツプS7,S8,S9
で、分割番号kiを1つ増加する毎に、前に、設定されて
いる商R2を1つ減じ、重心番号MpをMαずつ増加させ
る。ステツプS10で商R2が負でないことを調べ、商R2が
負でない限りステツプS11で重心番号Mrの数を1つ増
し、ステツプS12でその重心番号Mpを分割番号kiに対応
づけ、分割座標DX(ki)を決定する。商R2が負の場合、
ステツプS13で現在の分割番号kiが中央値kαより大きい
か否かを判定し、大きい場合は重心番号Mrを1つ増した
ものを、小さい場合はステツプS9で設定された重心番号
Mrを、ステツプS12において分割番号kiに対応づけ、分
割座標DX(ki)を決定し、ステツプS14で分割番号kiが
(NX-1)に一致したことを検出して終了する。
割つた数Mαを求め、ステツプS2,S3でMX/NXの剰余R1と
そのR1を2で割った商R2を求める。又、ステツプS4で分
割数の中央値kαを求め、ステツプS5,S6で分割番号kiと
重心番号Mpを0にセツトする。又、ステツプS7,S8,S9
で、分割番号kiを1つ増加する毎に、前に、設定されて
いる商R2を1つ減じ、重心番号MpをMαずつ増加させ
る。ステツプS10で商R2が負でないことを調べ、商R2が
負でない限りステツプS11で重心番号Mrの数を1つ増
し、ステツプS12でその重心番号Mpを分割番号kiに対応
づけ、分割座標DX(ki)を決定する。商R2が負の場合、
ステツプS13で現在の分割番号kiが中央値kαより大きい
か否かを判定し、大きい場合は重心番号Mrを1つ増した
ものを、小さい場合はステツプS9で設定された重心番号
Mrを、ステツプS12において分割番号kiに対応づけ、分
割座標DX(ki)を決定し、ステツプS14で分割番号kiが
(NX-1)に一致したことを検出して終了する。
以上述べた本実施例の文字図形認識方式の特徴情報であ
る分割領域長系列の有効性を以下に説明する。
る分割領域長系列の有効性を以下に説明する。
例えば第2図(a)にそれぞれ示される「天」と「夫」
の入力文字パターンにおいて、両パターンの相異点とな
る中央縦ストロークの上部の突き出しの有無がBEY
(1)において顕著な差となつてあらわれ、正規化分割
領域長系列が文字図形パターンの差異を有効に反映して
いることが明らかである。
の入力文字パターンにおいて、両パターンの相異点とな
る中央縦ストロークの上部の突き出しの有無がBEY
(1)において顕著な差となつてあらわれ、正規化分割
領域長系列が文字図形パターンの差異を有効に反映して
いることが明らかである。
以上のように本実施例によれば、入力文字パターンの走
査と所定の演算によって得られる正規化分割領域長系列
を特徴情報としたので簡単な処理の高速な文字図形認識
を実現することができる。
査と所定の演算によって得られる正規化分割領域長系列
を特徴情報としたので簡単な処理の高速な文字図形認識
を実現することができる。
(発明の効果) 以上詳細に説明したように本発明によれば、従来の認識
方式の特徴情報抽出における、輪郭追跡や細線化等の複
雑なパターン処理を行なうことなく、入力文字図形パタ
ーンを走査するだけで得られる所定の軸上における黒ビ
ツト数分布から、重心を利用して特徴情報である正規化
した分割領域長系列を得ているので、簡単な処理の高速
な文字認識が実現できる。
方式の特徴情報抽出における、輪郭追跡や細線化等の複
雑なパターン処理を行なうことなく、入力文字図形パタ
ーンを走査するだけで得られる所定の軸上における黒ビ
ツト数分布から、重心を利用して特徴情報である正規化
した分割領域長系列を得ているので、簡単な処理の高速
な文字認識が実現できる。
第1図は本発明による文字図形認識方式の一実施例を示
す機能ブロツク図、第2図は入力文字パターン例と、重
心座標系列、分割座標系列、正規化分割領域長系列との
関係を示す図、第3図は重心座標系列と分割座標系列と
の対応関係を示す図、第4図は分割座標系列の他の決定
方法を示すフローチヤートである。 1……光入力、2……光電変換部、3……パターンレジ
スタ、4……文字枠検出部、5……文字投影作成部、6
……重心検出部、7……文字枠分割点決定部、8……正
規化分割領域長計算部、9……識別部、10……辞書メモ
リ、11……出力端子
す機能ブロツク図、第2図は入力文字パターン例と、重
心座標系列、分割座標系列、正規化分割領域長系列との
関係を示す図、第3図は重心座標系列と分割座標系列と
の対応関係を示す図、第4図は分割座標系列の他の決定
方法を示すフローチヤートである。 1……光入力、2……光電変換部、3……パターンレジ
スタ、4……文字枠検出部、5……文字投影作成部、6
……重心検出部、7……文字枠分割点決定部、8……正
規化分割領域長計算部、9……識別部、10……辞書メモ
リ、11……出力端子
フロントページの続き (72)発明者 山下 義征 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 (56)参考文献 特開 昭58−123171(JP,A) 特開 昭61−150086(JP,A)
Claims (1)
- 【請求項1】媒体上の文字図形を読取って量子化して得
られるパターンを記憶する記憶手段を備え、前記パター
ンに基づいて、文字図形を認識する文字図形認識方式に
おいて、 (a)前記パターンを走査して文字図形の外接枠を検出
する第1の検出手段、 (b)前記パターンを走査して所定の2つの軸に投影し
た各軸方向の黒ビット数分布を作成する作成手段、 (c)前記2つの軸方向の前記外接枠内の範囲で各黒ビ
ット数分布の重心座標を決定し、決定した各重心座標で
外接枠内の範囲を分割した各分割範囲に対し各黒ビット
数分布の重心座標を決定する過程を繰り返して各軸方向
の重心座標系列を検出する第2の検出手段、 (d)前記重心座標系列に基づいて各軸方向の分割座標
系列を決定する決定手段、 (e)前記分割座標系列で分割される前記外接枠の各領
域の長さを対応する軸方向の外接枠の長さで正規化した
各軸方向の分割領域長系列を計算する計算手段、 (f)前記分割領域系列と予め計算された標準パターン
の分割領域長系列とを照合して前記パターンの文字図形
を認識する認識手段とを具備することを特徴とする文字
図形認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62061241A JPH0799534B2 (ja) | 1987-03-18 | 1987-03-18 | 文字図形認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62061241A JPH0799534B2 (ja) | 1987-03-18 | 1987-03-18 | 文字図形認識方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63228390A JPS63228390A (ja) | 1988-09-22 |
| JPH0799534B2 true JPH0799534B2 (ja) | 1995-10-25 |
Family
ID=13165536
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62061241A Expired - Fee Related JPH0799534B2 (ja) | 1987-03-18 | 1987-03-18 | 文字図形認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0799534B2 (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58123171A (ja) * | 1982-01-18 | 1983-07-22 | Oki Electric Ind Co Ltd | 文字認識方式 |
-
1987
- 1987-03-18 JP JP62061241A patent/JPH0799534B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPS63228390A (ja) | 1988-09-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111275049A (zh) | 一种文字图像骨架特征描述符获取的方法及装置 | |
| CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
| JPH0799534B2 (ja) | 文字図形認識方式 | |
| JPH0656625B2 (ja) | 特徴抽出方式 | |
| JPH0799535B2 (ja) | 文字図形認識方式 | |
| JPH0799536B2 (ja) | 文字図形認識方式 | |
| JPS6214277A (ja) | 画像処理方式 | |
| JP3095470B2 (ja) | 文字認識装置 | |
| JP2785747B2 (ja) | 文字読取装置 | |
| JP2616994B2 (ja) | 特徴抽出装置 | |
| JPH0656624B2 (ja) | 特徴抽出方式 | |
| JPH0664629B2 (ja) | 文字認識方式 | |
| JP2576491B2 (ja) | 特徴抽出方式 | |
| JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
| JP2576494B2 (ja) | 特徴抽出方式 | |
| JPH0147835B2 (ja) | ||
| JPH0147829B2 (ja) | ||
| JPH09114990A (ja) | 画像認識方法 | |
| JPH0646418B2 (ja) | 特徴抽出方式 | |
| JPH01187684A (ja) | 文字認識装置 | |
| JPH0580711B2 (ja) | ||
| JPH0632080B2 (ja) | 文字認識方式 | |
| JPH0438024B2 (ja) | ||
| JPS5837780A (ja) | 文字認識方式 | |
| JPH0226267B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |