JPH0150954B2 - - Google Patents
Info
- Publication number
- JPH0150954B2 JPH0150954B2 JP57097606A JP9760682A JPH0150954B2 JP H0150954 B2 JPH0150954 B2 JP H0150954B2 JP 57097606 A JP57097606 A JP 57097606A JP 9760682 A JP9760682 A JP 9760682A JP H0150954 B2 JPH0150954 B2 JP H0150954B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- size
- input
- written
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
本発明は、オンライン手書き文字認識装置に係
り、特に、筆記者の負担軽減と文字記入速度の低
下防止とを図つたオンライン手書き文字認識装置
に関するものである。
従来技術とその問題点を第1図、第2図により
説明する。第1図において、1はダブレツト(座
標入力装置)、2は文字記入用シート、3は入力
ペン、4は前処理部、5は特徴抽出回路、、6は
マツチング回路、7は最小値選択回路、8はコー
ド変換回路、9は出力端、10はUP/DOWN検
出回路、11はストローク数検出回路、12は標
準パターンメモリ、13は位置比較回路、14は
指示枠位置メモリ、15は大文字/小文字フラグ
メモリである。筆記者は、入力ペン3によつて、
タブレツト1上に配置されている文字記入用シー
ト2の各文字記入枠2―1内に文字を筆記する。
このとき、タブレツト1は、入力ペン3のペン
先のXY座標の位置情報を、一定時間(標本化周
期)ごとに出力ライン1―3より出力する。ま
た、入力ペン3には、入力ペン3が文字記入用シ
ート2に圧着しているか否かを検出するスイツチ
が内蔵されており、このスイツチ出力も、Z軸情
報として、前記XY座標の位置情報とともに標本
化周期ごとに出力ライン1―3より出力される。
これらのX,Y,Z軸情報は、筆跡情報として
前処理部4に供給される。前処理部4では、ま
ず、Z軸情報を見て、入力ペン3が文字記入用シ
ート2に圧着しているデータ(以下筆跡点と呼
ぶ)のみを選択して取り込み以下の正規化処理を
する。
筆跡点の系列には冗長な点を含んでいる。それ
は、文字記入時のペン先の移動が一定速度ではな
く、隣接する筆跡点間の空間的な距離が非常に近
接しているものでもあるからである。このため
に、筆跡冗長点の除去が行なわれる。除去の方法
は、ストローク(入力ペン3が文字記入用シート
2に圧着してから離れるまでに描かれた一つの線
分、筆跡点系列)の始点から一定距離はなれた筆
跡点を再標本化点とし、次に、この再標化点から
同様に一定距離はなれた筆跡点を再び再標本化点
とする処理をストロークの終点まで行なう。つま
り、各ストロークの筆跡点系列を、時間空間系列
から距離空間系列に変換する(以下この処理を再
標本化処理と呼ぶ)。
次に、前処理部4は、再標本化処理された1文
字分のデータに対して、位置と大きさの正規化を
行なう。文字記入用シート2のどの文字記入枠2
―1に文字を筆記するかによつて筆跡点のXY座
標値が異なること、及び文字記入枠2―1内のど
の位置に文字を筆記するかによつても筆跡点の
XY座標値が異なることのために、1文字単位ご
とに、文字の重心位置が一定となるように座標変
換するのが、位置の正規化である。また、文字記
入枠2―1に記入される文字の大きさは筆記者に
よつて異なるため、記入文字の大きさが一定とな
るように各再標本化点の座標変換を行なうのが大
きさの正規化である。これは、文字の重心位置に
対する各再標本化点の距離の平均が一定になるよ
うにすることで行なわれる。
このように前処理された入力文字データは、特
徴抽出回路5によつて、以後の処理が容易に行な
えるように、情報量を低減した形で表現される。
例えば、Mストロークからなる入力文字I〓は、第
m番目に記入されたストロークをImとして
I〓=(I1,I2,…,IM)
というように、ストロークの筆記順に表現する。
また、各ストロークI1〜IMは、それぞれストロー
クの始点(書き始めの筆跡点)から終点(書き終
わりの筆跡点)までの1ストロークの線分をN等
分するN+1個の折線近似点の系列で表現する。
つまり、第m番目のストロークInは、折線近似点
Pn1,Pn2,…,PnN+1の系列を用いて
In=(Pn1,Pn2,…,PnN+1)
と表現する。ここで折線近似点Pnoは
Pno=(xno,yno)
で示されるXY座標値である。
このように特徴抽出回路5で記述された入力文
字は、マツチング回路6の一方の入力端に供給さ
れる。マツチング回路6の他方の入力端には、予
め認識対象の各文字ごとに、入力文字に対すると
同様な前処理、特徴抽出された多数の筆記者によ
る入力文字の平均的なパターンが、標準パターン
メモリ12より供給される。ここで、文字θに対
する標準パターンS〓〓を
S〓〓=(S〓1,S〓2,…,S〓M)
とする。ただし、Mは文字θのストローク数でS〓
nは
S〓n=(P〓n1,P〓n2,…,P〓nN+1)
と表現される第m番目のストロークである。
P〓noは
P〓no=(x〓no,y〓no)
と表現される、第m番目のストロークの線分をN
等分する折線近似点の第n番目のXY座標値であ
る。
マツチング回路6では、入力文字I〓と、このI〓の
ストローク数Mに等しいストローク数の標準パタ
ーンS〓〓との距離D(θ)を次のように計算する。
D(θ)=M
〓m=1
dS(S〓n,In) (7)
ここで、Inは入力文字I〓の第m番目のストロー
ク、S〓nは標準パターンS〓〓の第m番目のストロー
ク、dS(S〓n,In)は両パターンの第m番目のスト
ロークS〓n,In間の距離を示し
dS(S〓n,In)=N+1
〓n=1
dP
(P〓no,Pno) (8)
である。N+1はストロークの折線近似点数、P〓
no,Pnoは両パターンの第m番目のストロークの
第n番目の折線近似点、dP(P〓no,Pno)は両パ
ターンの第m番目のストロークの第n番目の折線
近似点間の距離を示し
dP(P〓no,Pno)=√(〓no−no)2
+(〓no−no)2(9)
である。
以上の(7)〜(9)式をまとめて、マツチング回路6
は、両パターン間距離D(θ)として
D(θ)M
〓m=1 N+1
〓
〓n=1
√(〓no−no)2+(〓no−no)2(10)
を計算する。ただし、x〓no,xnoは第m番目のス
トロークの第n番目の折線近似点のX座標値、y〓
no,ynoは同じくY座標値である。
ここで、入力文字I〓のストローク数Mに等しい
標準パターンがL個あれば、マツチング回路6は
このL個の標準パターンに対して順次入力文字I〓
とのパターン間距離D(θ)を計算し、結果を、
最小値選択回路7に供給する。
なお、入力文字I〓のストローク数は、タブレツ
ト1からのZ軸情報をもとに、UP/DOWN検出
回路10によつて、入力ペン3のUP,DOWNを
検出し、そして、UPからDOWNへの変化を、ス
トローク数検出回路11によつて、1文字分にわ
たり、計数することによつて求める。ストローク
数検出回路11の出力は、標準パターンメモリ1
2を制御し、入力文字I〓のストローク数Mに等し
い標準パターンS〓〓を選択し、マツチング回路6に
供給する。
最小値選択回路7は、順次供給されるパターン
間距離のL個D(θ1)〜D(θL)のうちの最小値を
検出する。検出した最小値がD(θ1)であるとす
れば、入力文字I〓は、標準パターンがS〓〓1の文字で
あると認識し、標準パターンS〓〓1に対応する文字
コードを標準パターンメモリ12より取り込みこ
れをコード変換回路8に出力する。
以上のような従来のオンライン手書き文字認識
方式において問題となるのは、例えば仮名文字
「キヤ」「キユ」「キヨ」における大文字「キ」と
小文字「ヤ」「ユ」「ヨ」のような、大文字と小文
字の入力方式と認識方式である、なんとなれば、
これらの小文字は、大文字と形状を全く同一に
し、、大きさが異なるのみであり、そして、入力
文字の大きさの異なりは、従来技術では、前処理
部における正規化によつて、認識部では全く同一
文字となつてしまい、大文字であるか小文字であ
るかの判断ができないことになるからである。
例えば、第2図のaのように「ツ」という仮名
を文字記入枠2―1の枠内一ぱいに書いた場合
と、cのように文字記入枠2―1のすみに小さく
書いた場合とで、前処理結果は、b,dのように
W0を重心点として、全く等しいパターンとなつ
てしまう。このように大文字と小文字の文字パタ
ーンが同一形状となるものは、日本字の片仮名、
平仮名ばかりでなく、英字にも存在する。
これに対処して、従来、大文字であるか小文字
であるかの情報を、筆記時にタブレツト1を介し
て筆記者が供給する方式が採用されていた。例え
ば、第1図に示すように、タブレツト1に大文字
指示枠1―1と小文字指示枠1―2とを設け、ど
ちらかの指示枠を入力ペン3で押圧することによ
つて、以後の入力文字は大文字であること、ある
いは小文字であることを宣言する。そして認識部
では、位置比較回路13において、指示枠1―
1,1―2に対応する座標値(指示枠位置メモリ
14に記憶されている)を比較用基準として、入
力ペン3がどちらの指示枠を押圧したか、あるい
は全く押圧していないかを検出し、検出結果に対
応して、大文字/小文字フラグメモリ15をセツ
トする。
ここで、大文字/小文字フラグメモリ15の出
力Fを、大文字の場合F=1、小文字の場合F=
0とする。また、大文字の「ツ」の文字コードを
A5C4、小文字の「ツ」の文字コードをA5C3と
し、「ツ」の標準パターンに対して大文字の文字
コードA5C4を与えたとする。そして、「ツ」を入
力ペン3で筆記した場合を見ると、最小値選択回
路7の出力には文字コードA5C4が出力される。
この文字コードはコード変換回路8に供給され
る。コード変換回路8は、大文字/小文字フラグ
メモリ15からの指示がF=1(大文字指示)の
ときはそのまま文字コードA5C4を出力し、F=
0(小文字指示)のときは、小文字に対応する文
字コードA5C3を出力する。つまり、コード変換
回路8は、大文字に対応する小文字の文字コード
対応表を内部にもち、これを用いて、F=0のと
きは大文字の文字コードを小文字の文字コードに
変換して出力する。
しかし上記した従来方式には、文字を記入する
以外に大文字であるか小文字であるかの指示をも
しなければならず、筆記者にとつて負担となるば
かりでなく、入力速度を低下させるという問題が
ある。
本発明の目的は、従来技術での上記した問題点
を解決し、筆記者の負担を軽減し、文字記入速度
の低下を防止するとともに、英字に対する認識能
率を向上させることのできるオンライン手書き文
字認識装置を提供することにある。
本発明の特徴は、上記目的を達成するために、
筆記文字の大きさを検出する文字サイズ検出手段
と、この検出値と設定値とを比較して設定値より
大きいとき大文字、小さいとき小文字と判定する
文字サイズ判定手段と、筆記文字の文字サイズに
は依存しないで筆記文字をパターン認識した結果
に対応する文字コードと上記サイズ判定結果信号
とを入力に受けてサイズ判定結果が大文字のとき
は筆記文字に対応する文字コードをそのまま出力
しサイズ判定結果が小文字のときは入力に受けた
文字コードをもとに所定のコード変換を行なつて
出力するコード変換手段とを備えた構成とするに
ある。
以下、本発明の一実施例を第3図により説明す
る。第3図において、4―1は再標本化回路、4
―2は位置正規化回路、4―3は重心点抽出回
路、4―4は大きさ正規化回路、4―5は平均半
径抽出回路、16は比較回路であり、その他は第
1図の場合と同じである。入力された文字の筆跡
情報はタブレツトの出力ライン1―3より再標本
化回路4―1に入力され、ここでは前述したよう
に、各ストロークの筆跡点のうちの冗長点を除去
し、各ストロークの筆跡点系列を時空記系列から
距離空間系列に変換する。つまり、ストロークの
始点から終点までの線分を一定距離間隔で再標本
化する。
この再標本化された入力文字I〓の第m番目のス
トロークInを再標本化点Qn1,Qn2…,QnE(m)
の系列で表現し
In=(Qn1,Qn2,…,QnE(m))
とする。ただし、Qneは第m番目のストロークの
第e番目の再標本化点、E(m)は第m番目のス
トロークの再標本化点の数である。また、再標本
化点Qneは、XY座標値を示し
Qne=(Xne,Yne)である。
こうして再標本化された入力文字データは、重
心点抽出回路4―3に供給され、入力文字の重心
位置W0が抽出される。この重心位置W0は、一文
字分の全再標本化点Qne(m=1〜M,e=1〜
E(m))のX座標値の平均値X0,Y座標値の平
均値Y0をXY座標値とするもので
W0=(X0,Y0)
と表現される。
次に、位置正規化回路4―2において、この重
心位置W0を新たなXY座標軸の原点とするよう
に、各再標本化点Qneの座標値を変換する。つま
り
Qne=(Xne−X0,Yne−Y0)
のように、各再標本化点QneのXY座標値Xne,
Yneから、X0,Y0を減算する。ここで
xne=Xne−X0
yne=Yne−Y0
とすると、重心位置はx=0,y=0となる。
次に、上記のように位置の正規化処理が行なわ
れた入力文字データに対して、平均半径抽出回路
4―5において、入力文字の大きさ、ここでは入
力文字の平均半径Rを
R=1/UM
〓m=1 E(n)
〓e=1
{|xme|+|yne|}
として求める。ここで、U=M
〓m=1
E(m)で入力文
字の再標本化点数であり、Mは入力文字のストロ
ーク数、|xne|,|yne|は入力文字の重心位置
W0を原点とする第m番目のストロークの第e番
目の再標本化点のX軸値、Y軸値の絶対値であ
る。即ち、各再標本化点Qneの重心位置W0から
の距離の平均値として平均半径Rを求めたことに
なる。この平均半径Rは、文字を大きく記入する
ほど大きな値となるものであり、入力文字の大き
さに対応するパラメータである。
大きさ正規化回路4―4は、この平均半径Rが
設定値R0となるように、各再標本化点Qneの座標
値を変換する。この変換処理後の再標本化点Qne
のX,Y軸の値をx〓ne,y〓neとすれば、大きさの正
規化は
x〓ne=R0/Rxne
y〓ne=R0/Ryne
のように、入力文字の平均半径Rで各XY座標値
を正規化(除算)することである。
この入力文字の平均半径Rは、また、比較回路
16の一方の入力端に入力され、他方の入力端に
入力される設定値Rthと比較される。つまり、比
較回路16は、入力文字が設定値よりも大きいか
否かを判定する。判定結果はコード変換回路8に
供給され、コード変換回路8の動作を制御する。
大きさ正規化回路4―4の出力信号は特徴抽出
回路5に供給され、従来技術で説明したように、
入力文字が情報量圧縮された形で表現されそし
て、マツチング回路6において標準パターンとの
マツチング計算(パターン間距離の計算)を行な
う。
標準パターンメモリ12には、英字に関しては
A,B,C,…等の大文字、仮名文字に関しても
ア、イ、ウ、…ツ等の大文字の、多数の筆記者に
よつて記入され前述の前処理、特徴抽出が行なわ
れたパターンの平均的なパターンを、その文字に
対応する文字コードとともに記憶させておく。ま
た、このとき、文字のストローク数によつて分類
して、記憶させておく。
ここで、第4図の図1、図2のように、文字記
入枠2―1に英字大文字「A」を第1ストローク
I1「∧」、第2ストロークI2「―」の2ストローク
で記入したとすると、出力ライン1―3の筆跡情
報は、前処理、特徴抽出が行なわれ、マツチング
回路6で、標準パターンメモリ内の2ストローク
からなる標準パターンとのマツチング計算(パタ
ーン間距離の計算)が行なわれ、結果が順次、最
小値選択回路7に供給される。そして、最小値選
択回路7において、パターン間距離D(θ)の最
小値を検出して、その最小値に対応する標準パタ
ーンの文字コードをコード変換回路8に供給す
る。
ここで、標準パターンとその文字(大文字)に
対応する文字コードを第1表の左部のようにし、
またその大文字に対応する小文字の文字コードを
第1表の右部のように設定したとする。
The present invention relates to an online handwritten character recognition device, and more particularly to an online handwritten character recognition device that reduces the burden on a scribe and prevents a decrease in character entry speed. The prior art and its problems will be explained with reference to FIGS. 1 and 2. In Figure 1, 1 is a doublet (coordinate input device), 2 is a character entry sheet, 3 is an input pen, 4 is a preprocessing section, 5 is a feature extraction circuit, 6 is a matching circuit, and 7 is a minimum value selection circuit. , 8 is a code conversion circuit, 9 is an output end, 10 is an UP/DOWN detection circuit, 11 is a stroke number detection circuit, 12 is a standard pattern memory, 13 is a position comparison circuit, 14 is an instruction frame position memory, 15 is a capital letter / Lowercase flag memory. The scribe uses the input pen 3 to
Characters are written in each character entry frame 2-1 on the character entry sheet 2 placed on the tablet 1. At this time, the tablet 1 outputs the positional information of the XY coordinates of the tip of the input pen 3 from the output lines 1-3 at regular intervals (sampling period). In addition, the input pen 3 has a built-in switch that detects whether or not the input pen 3 is pressed against the character entry sheet 2, and the output of this switch also provides the position information of the XY coordinates as Z-axis information. It is also output from output lines 1-3 every sampling period. These X, Y, and Z axis information are supplied to the preprocessing section 4 as handwriting information. The preprocessing unit 4 first looks at the Z-axis information, selects and imports only the data that the input pen 3 presses onto the character entry sheet 2 (hereinafter referred to as handwriting points), and performs the following normalization process. . The series of handwriting points includes redundant points. This is because the pen tip does not move at a constant speed when writing characters, and the spatial distance between adjacent handwriting points is very close. For this purpose, redundant handwriting points are removed. The removal method is to resample handwriting points that are a certain distance away from the starting point of a stroke (one line segment drawn from when the input pen 3 presses on the character entry sheet 2 until it leaves the character writing sheet 2, a series of handwriting points). Then, the process of again setting handwriting points that are a certain distance away from this re-marking point as re-sampling points is performed until the end point of the stroke. That is, the handwriting point series of each stroke is converted from a time-space series to a distance-space series (hereinafter, this process will be referred to as resampling process). Next, the preprocessing unit 4 normalizes the position and size of the data for one character that has been resampled. Which character entry frame 2 on character entry sheet 2
The XY coordinate values of the handwriting point differ depending on where the character is written in 2-1.
Since the XY coordinate values are different, position normalization involves converting the coordinates of each character so that the center of gravity of the character remains constant. In addition, since the size of the characters written in the character entry frame 2-1 differs depending on the scribe, it is necessary to perform coordinate transformation of each resampling point so that the size of the characters written is constant. This is the normalization of This is done by ensuring that the average distance of each resampling point to the center of gravity of the character is constant. The input character data preprocessed in this manner is expressed by the feature extraction circuit 5 in a form with a reduced amount of information so that subsequent processing can be easily performed.
For example, an input character I〓 consisting of M strokes is expressed in the writing order of the strokes, such as I〓=(I 1 , I 2 , . . . , I M ), where the mth stroke written is Im.
In addition, each stroke I 1 to I M is made up of N+1 broken line approximation points that divide the line segment of one stroke from the start point (starting handwriting point) to the end point (finishing handwriting point) into N equal parts. Express as a series.
In other words, the mth stroke I n is the approximate point of the broken line
Using the sequence of P n1 , P n2 , ..., P nN+1, it is expressed as I n = (P n1 , P n2 , ..., P nN+1 ). Here, the broken line approximate point P no is the XY coordinate value shown by P no = (x no , y no ). The input characters described by the feature extraction circuit 5 in this manner are supplied to one input terminal of the matching circuit 6. At the other input terminal of the matching circuit 6, a standard pattern memory stores an average pattern of characters input by a large number of scribes, which has undergone the same preprocessing and feature extraction as for the input characters for each character to be recognized. 12. Here, let the standard pattern S〓〓 for the character θ be S〓〓=(S〓 1 , S〓 2 ,..., S〓 M ). However, M is the number of strokes of the character θ and S〓
n is the m-th stroke expressed as S〓 n = (P〓 n1 , P〓 n2 , . . . , P〓 nN+1 ). P〓 no is the line segment of the m-th stroke expressed as P〓 no = (x〓 no , y〓 no )
This is the nth XY coordinate value of the approximate point of the polygonal line that divides into equal parts. The matching circuit 6 calculates the distance D (θ) between the input character I〓 and the standard pattern S〓 whose stroke number is equal to the stroke number M of this I〓 as follows. D (θ) = M 〓 m=1 dS (S〓 n , I n ) (7) Here, I n is the mth stroke of the input character I〓, and S〓 n is the mth stroke of the standard pattern S〓〓. The m-th stroke, dS (S〓 n , I n ) indicates the distance between the m-th stroke S〓 n , I n of both patterns, and dS (S〓 n , I n )= N+1 〓 n= 1 dP (P〓 no , P no ) (8). N+1 is the number of stroke line approximation points, P〓
no , P no are the n-th broken line approximate points of the m-th strokes of both patterns, and dP (P〓 no , P no ) are the points between the n-th broken line approximate points of the m-th strokes of both patterns. Indicates the distance dP (P〓 no , P no ) = √ (〓 no − no ) 2
+(〓 no − no ) 2 (9). Combining the above equations (7) to (9), matching circuit 6
is the distance between both patterns D ( θ ) .
Calculate. However, x〓 no , x no is the X coordinate value of the nth broken line approximate point of the mth stroke, y〓
no and y no are the Y coordinate values as well. Here, if there are L standard patterns equal to the number of strokes M of the input character I〓, the matching circuit 6 sequentially matches the input character I〓 to these L standard patterns.
Calculate the inter-pattern distance D(θ) with
It is supplied to the minimum value selection circuit 7. The number of strokes of the input character I〓 is determined by detecting UP and DOWN of the input pen 3 by the UP/DOWN detection circuit 10 based on the Z-axis information from the tablet 1, and then from UP to DOWN. The stroke number detection circuit 11 counts the change in the number of strokes over one character. The output of the stroke number detection circuit 11 is stored in the standard pattern memory 1.
2, selects a standard pattern S〓 equal to the number of strokes M of the input character I〓, and supplies it to the matching circuit 6. The minimum value selection circuit 7 detects the minimum value of L inter-pattern distances D(θ 1 ) to D(θ L ) sequentially supplied. If the detected minimum value is D(θ 1 ), the input character I〓 is recognized as a character whose standard pattern is S〓〓 1 , and the character code corresponding to the standard pattern S〓〓 1 is set as the standard. It is fetched from the pattern memory 12 and outputted to the code conversion circuit 8. The problem with the conventional online handwritten character recognition method described above is that, for example, the uppercase letter ``ki'' and the lowercase letters ``ya'', ``yu'', and ``yo'' in the kana characters ``kiya'', ``kiyu'', and ``kiyo'' are difficult to recognize. It is an input method and recognition method for uppercase and lowercase letters.
These lowercase letters have exactly the same shape as the uppercase letters, and differ only in size. In the conventional technology, the difference in the size of input characters is normalized in the preprocessing unit, and is not recognized in the recognition unit. This is because the characters will be exactly the same, making it impossible to determine whether they are uppercase or lowercase. For example, when the kana ``tsu'' is written in the entire text box 2-1 as shown in a in Figure 2, and when it is written small in the corner of the text box 2-1 as shown in c. Then, the preprocessing results are as shown in b and d.
With W 0 as the center of gravity, the pattern becomes exactly the same. In this way, uppercase and lowercase letter patterns with the same shape are Japanese katakana,
It exists not only in hiragana but also in English. In order to cope with this problem, a method has been adopted in the past in which a scribe supplies information on whether a letter is an uppercase or a lowercase letter via the tablet 1 when writing. For example, as shown in FIG. 1, the tablet 1 is provided with an uppercase letter instruction frame 1-1 and a lowercase letter instruction frame 1-2, and by pressing either of the instruction frames with the input pen 3, subsequent input can be performed. Declares a character to be uppercase or lowercase. Then, in the recognition section, the position comparison circuit 13 selects the instruction frame 1--
Using the coordinate values corresponding to 1 and 1-2 (stored in the instruction frame position memory 14) as a reference for comparison, it is detected which instruction frame is pressed by the input pen 3, or whether it is not pressed at all. Then, the uppercase/lowercase flag memory 15 is set in accordance with the detection result. Here, the output F of the uppercase/lowercase flag memory 15 is set to F=1 for uppercase letters and F=1 for lowercase letters.
Set to 0. Also, the character code for the capital letter “tsu” is
Assume that A5C4, the character code for the lowercase "tsu" is A5C3, and the uppercase character code A5C4 is given to the standard pattern for "tsu". When the character "tsu" is written with the input pen 3, the minimum value selection circuit 7 outputs the character code A5C4.
This character code is supplied to the code conversion circuit 8. When the instruction from the uppercase/lowercase flag memory 15 is F=1 (uppercase instruction), the code conversion circuit 8 directly outputs the character code A5C4, and F=
When 0 (lowercase letter instruction), the character code A5C3 corresponding to lowercase letters is output. That is, the code conversion circuit 8 internally has a character code correspondence table of lowercase letters corresponding to uppercase letters, and uses this to convert the uppercase character code to a lowercase character code when F=0 and outputs the converted character code. However, in the conventional method described above, in addition to writing the letters, it is also necessary to indicate whether the letters are uppercase or lowercase, which not only burdens the scribe but also reduces the input speed. There is. The purpose of the present invention is to provide online handwritten character recognition that can solve the above-mentioned problems in the prior art, reduce the burden on scribes, prevent a decrease in character entry speed, and improve the recognition efficiency for English characters. The goal is to provide equipment. In order to achieve the above object, the features of the present invention are as follows:
a font size detection means for detecting the size of a written character; a font size determination means for comparing the detected value with a set value and determining that it is an uppercase letter when it is larger than the set value; and a lowercase letter when it is smaller than the set value; receives the character code corresponding to the result of pattern recognition of the written character and the above size judgment result signal as input, and when the size judgment result is an uppercase letter, outputs the character code corresponding to the written character as is, and the size judgment result When the character code is a lowercase letter, the code conversion means performs a predetermined code conversion based on the input character code and outputs the converted code. An embodiment of the present invention will be described below with reference to FIG. In Fig. 3, 4-1 is a resampling circuit;
-2 is a position normalization circuit, 4-3 is a centroid point extraction circuit, 4-4 is a size normalization circuit, 4-5 is an average radius extraction circuit, 16 is a comparison circuit, and the others are as in Figure 1. is the same as The handwriting information of the input characters is input to the resampling circuit 4-1 from the output line 1-3 of the tablet, and as described above, redundant points among the handwriting points of each stroke are removed, and each stroke is Convert the handwriting point series from a spatiotemporal series to a metric space series. In other words, the line segments from the start point to the end point of the stroke are resampled at regular distance intervals. The mth stroke I n of this resampled input character I is resampled at points Q n1 , Q n2 ..., Q nE (m)
Expressed as a series of I n = (Q n1 , Q n2 , ..., Q nE (m)). However, Q ne is the e-th resampling point of the m-th stroke, and E(m) is the number of resampling points of the m-th stroke. Further, the resampling point Q ne indicates the XY coordinate value and is Q ne =(X ne , Y ne ). The input character data resampled in this way is supplied to the centroid point extraction circuit 4-3, and the centroid position W 0 of the input character is extracted. This centroid position W 0 is the total resampling point Q ne for one character (m=1~M, e=1~
The average value X 0 of the X coordinate value and the average value Y 0 of the Y coordinate value of E(m)) are expressed as W 0 =(X 0 , Y 0 ). Next, in the position normalization circuit 4-2, the coordinate values of each re-sampling point Qne are transformed so that this center of gravity position W0 becomes the origin of the new XY coordinate axes. In other words, as Q ne = (X ne −X 0 , Y ne −Y 0 ), the XY coordinate value X ne of each resampling point Q ne ,
Subtract X 0 and Y 0 from Y ne . Here, if x ne =X ne -X 0 and y ne =Y ne -Y 0 , then the center of gravity will be x=0 and y=0. Next, for the input character data whose position has been normalized as described above, the average radius extraction circuit 4-5 calculates the size of the input character, in this case the average radius R of the input character, by R=1. /U M 〓 m=1 E(n) 〓 e=1 {|xme|+|y ne |}. Here, U= M 〓 m=1 E(m) is the number of resampling points of the input character, M is the number of strokes of the input character, |x ne |, |y ne | is the center of gravity position of the input character
These are the absolute values of the X-axis value and Y-axis value of the e-th resampling point of the m-th stroke with W 0 as the origin. That is, the average radius R is determined as the average value of the distance of each resampling point Q ne from the center of gravity position W 0 . This average radius R becomes a larger value as the characters are written larger, and is a parameter corresponding to the size of the input characters. The size normalization circuit 4-4 converts the coordinate values of each resampling point Qne so that this average radius R becomes the set value R0 . The resampling point Q ne after this transformation process
Let the values of the X and Y axes of This is to normalize (divide) each XY coordinate value by the average radius R. This average radius R of the input characters is also input to one input terminal of the comparator circuit 16 and compared with a set value Rth input to the other input terminal. In other words, the comparison circuit 16 determines whether the input character is larger than the set value. The determination result is supplied to the code conversion circuit 8, and the operation of the code conversion circuit 8 is controlled. The output signal of the magnitude normalization circuit 4-4 is supplied to the feature extraction circuit 5, and as explained in the prior art,
The input character is expressed in a form with the amount of information compressed, and a matching circuit 6 performs a matching calculation (calculation of distance between patterns) with a standard pattern. In the standard pattern memory 12, capital letters such as A, B, C, . The average pattern of the processed and feature-extracted patterns is stored together with the character code corresponding to that character. Also, at this time, the characters are classified and stored according to the number of strokes. Here, as shown in Figures 1 and 2 of Figure 4, write the uppercase alphabetic letter "A" in the character entry frame 2-1 with the first stroke.
Assuming that the handwriting information on output lines 1-3 is written with two strokes: I 1 "∧" and the second stroke I 2 "-", the handwriting information on output lines 1-3 is pre-processed and feature extracted, and then stored in the standard pattern memory in the matching circuit 6. A matching calculation (calculation of inter-pattern distance) with a standard pattern consisting of two strokes is performed, and the results are sequentially supplied to the minimum value selection circuit 7. Then, the minimum value selection circuit 7 detects the minimum value of the inter-pattern distance D(θ) and supplies the character code of the standard pattern corresponding to the minimum value to the code conversion circuit 8. Here, set the standard pattern and the character code corresponding to the character (uppercase) as shown in the left part of Table 1,
It is also assumed that the character codes of lowercase letters corresponding to the uppercase letters are set as shown on the right side of Table 1.
【表】
最小値選択回路7において、大文字「A」に対
するパターン間距離が最小となつたとき、最小値
選択回路7は、大文字「A」に付与した文字コー
ドA3C1をコー変換回路8に供給する。そして、
第4図の図1、図2の英字大文字「A」の筆記に
対して、平均半径抽出回路4―5で抽出した平均
半径R(1),R(2)が、設定値Rthより大きいか否か
が、比較回路16で比較される。ここでは
RthR(1) …図1の場合
Rth>R(2) …図2の場合
と判定されたとすると、コード変換回路8は、図
1の場合は、入力文字コードA3C1(「A」に対す
る文字コード)をそのまま出力し、図2の場合
は、小さく「A」が記入されたとして、入力文字
コードA3C1(「A」に対する文字コードを基に、
対応する英字小文字「a」の文字コードA3E1を、
第1表の大文字―小文字の文字コード対応テーブ
ル(コード変換回路8に内蔵)を参照して、出力
する。
片仮名「ツ」を第4図の図3、図4のように筆
記した場合も同様である。これらの様子を第2表
にまとめて示している。[Table] In the minimum value selection circuit 7, when the distance between patterns for the capital letter "A" becomes the minimum, the minimum value selection circuit 7 supplies the character code A3C1 given to the capital letter "A" to the code conversion circuit 8. . and,
Are the average radii R (1) and R ( 2) extracted by the average radius extraction circuit 4-5 larger than the set value Rth for the writing of the capital letter "A" in Figures 1 and 2 in Figure 4? Comparison circuit 16 compares whether or not it is true. Here, if it is determined that RthR (1) ...in the case of Figure 1 Rth>R (2) ...in the case of Figure 2, the code conversion circuit 8 converts the input character code A3C1 (character for "A") in the case of Figure 1 In the case of Figure 2, assuming that a small "A" is written, the input character code A3C1 (based on the character code for "A") is output as is.
The character code A3E1 of the corresponding lowercase alphabet "a" is
It outputs by referring to the uppercase-lowercase character code correspondence table (built in the code conversion circuit 8) shown in Table 1. The same is true when the katakana ``tsu'' is written as shown in FIGS. 3 and 4 of FIG. These conditions are summarized in Table 2.
【表】
(注) 大きく…文字記入枠一ぱいに大
きく記入
小さく…文字記入枠に対して小さ
く記入することを意味する。
以上の実施例では、位置の正規化を入力文字の
重心位置を原点にするようにし、また入力文字の
大きさを、入力文字の重心位置と再標本化点との
平均距離(平均半径)とし、この平均半径を基に
大きさの正規化を行なう構成のものについて説明
したが、本発明はこれに限定されず上記に代え
て、位置の正規化を、入力文字の外接矩形の中心
位置を原点にするようにし、また入力文字の大き
さを、上記外接矩形の対角線長とし、この対角線
長を基に、一定の対角線長となるように、大きさ
の正規化を行なう構成とすることもできる。
以上説明したように、本発明によれば、入力文
字の大きさを検出し、検出結果が一定値以上のと
きは大文字、一定値より小さいときは小文字と判
定し、その判定された文字に対応する文字コード
を出力する構成としたことにより、従来、入力ペ
ンを大文字、小文字の指示枠エリア内に押圧する
ことによる入力文字の大文字、小文字の指示操作
を不必要とし、筆記者の負担を除くとともに、文
字入力速度の低下を防止することができるように
なり、また、文字が曲線を主体に構成されている
英字小文字を認識対象外としたことにより、従
来、英字小文字が曲線を主体にしているが故に筆
記者によつて多種多様の変形があつて認識率の低
下を生じていたのを防止することができる効果が
ある。[Table] (Note) Larger… Fill in the text box in larger size.
Small...means to write small in the character entry frame.
In the above example, the position is normalized so that the center of gravity of the input character is the origin, and the size of the input character is set to the average distance (average radius) between the center of gravity of the input character and the resampling point. , a configuration has been described in which the size is normalized based on this average radius, but the present invention is not limited to this, and instead of the above, position normalization is performed by using the center position of the circumscribed rectangle of the input character. Alternatively, the input character size may be set to the diagonal length of the circumscribed rectangle, and the size may be normalized based on this diagonal length so that the diagonal length is a constant. can. As explained above, according to the present invention, the size of an input character is detected, and when the detection result is larger than a certain value, it is judged as an uppercase letter, and when it is smaller than a certain value, it is judged as a lowercase letter, and the size of the input character is determined. By having a configuration that outputs the character code to be input, it becomes unnecessary to specify the uppercase and lowercase letters of input characters by pressing the input pen into the uppercase and lowercase letter indication frame area, thereby eliminating the burden on the scribe. At the same time, it has become possible to prevent a decrease in character input speed, and by excluding lowercase letters that are mainly composed of curved lines from being recognized, lowercase letters that were previously composed of mainly curved lines are no longer recognized. This has the effect of preventing a reduction in recognition rate due to various deformations caused by the scribe.
第1図は従来例の構成図、第2図は入力文字と
前処理結果を示す図、第3図は本発明の一実施例
構成図、第4図は本発明の文字筆記例を示す図で
ある。
符号の説明、1…タブレツト、2…文字記入用
シート、2―1…文字記入枠、3…入力ペン、4
…前処理部、4―4…大きさ正規化回路、4―5
…平均半径抽出回路、5…特徴抽出回路、7…最
小値選択回路、8…コード変換回路、12…標準
パターンメモリ、16…比較回路。
Fig. 1 is a block diagram of a conventional example, Fig. 2 is a diagram showing input characters and preprocessing results, Fig. 3 is a block diagram of an embodiment of the present invention, and Fig. 4 is a diagram showing an example of character writing according to the present invention. It is. Explanation of symbols, 1...Tablet, 2...Character entry sheet, 2-1...Character entry frame, 3...Input pen, 4
...Preprocessing section, 4-4...Size normalization circuit, 4-5
...Average radius extraction circuit, 5. Feature extraction circuit, 7. Minimum value selection circuit, 8. Code conversion circuit, 12. Standard pattern memory, 16. Comparison circuit.
Claims (1)
ブレツトより出力される筆記文字の筆跡情報をも
とに筆記された文字を認識するオンライン手書き
文字認識装置において、筆記文字の大きさを検出
する文字サイズ検出手段と、この検出値と設定値
とを比較し設定値より大きいとき大文字、小さい
とき小文字と判定する文字サイズ判定手段と、筆
記文字の文字サイズには依存しないで筆記文字を
パターン認識した結果に対応する文字コードと上
記サイズ判定結果信号とを入力に受けてサイズ判
定結果が大文字のときは筆記文字に対応する文字
コードをそのまま出力しサイズ判定結果が小文字
のときは入力に受けた文字コードをもとに所定の
コード変換を行なつて出力するコード変換手段と
を備えたことを特徴とするオンライン手書き文字
認識装置。 2 特許請求の範囲第1項記載の装置において、
前記文字サイズ検出手段は、筆記文字の各ストロ
ークの線分を一定距離間隔ごとに抽出した再標本
化点をもとに得た筆記文字の重心点と上記各再標
化点との距離の平均値を筆記文字の大きさとする
文字サイズ検出手段であることを特徴とするオン
ライン手書き文字認識装置。 3 特許請求の範囲第1項記載の装置において、
前記文字サイズ検出手段は、筆記文字に外接する
矩形の対角線長を筆記文字の大きさとする文字サ
イズ検出手段であることを特徴とするオンライン
手書き文字認識装置。[Scope of Claims] 1. In an online handwritten character recognition device that writes characters on a tablet with an input pen and recognizes the written characters based on handwriting information of the written characters output from the tablet, font size detection means for detecting the font size; font size determination means for comparing the detected value with a set value and determining it as an uppercase letter when it is larger than the set value; and a lowercase letter when it is smaller than the set value; It receives the character code corresponding to the result of character pattern recognition and the above size judgment result signal as input, and when the size judgment result is an uppercase letter, the character code corresponding to the written character is output as is, and when the size judgment result is a lowercase letter, the character code corresponding to the written character is output as is. What is claimed is: 1. An online handwritten character recognition device comprising code conversion means for converting a predetermined code based on a character code received as input and outputting the converted code. 2. In the device according to claim 1,
The character size detecting means calculates the average distance between the center of gravity of the written character and each of the remarking points, which is obtained based on the resampling points extracted from the line segments of each stroke of the written character at regular distance intervals. An online handwritten character recognition device characterized in that it is a character size detection means whose value is the size of a handwritten character. 3. In the device according to claim 1,
The online handwritten character recognition device is characterized in that the character size detection means is a character size detection means that determines the size of the handwritten character to be the diagonal length of a rectangle circumscribing the handwritten character.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57097606A JPS58214972A (en) | 1982-06-09 | 1982-06-09 | Online handwritten character recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57097606A JPS58214972A (en) | 1982-06-09 | 1982-06-09 | Online handwritten character recognition device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58214972A JPS58214972A (en) | 1983-12-14 |
| JPH0150954B2 true JPH0150954B2 (en) | 1989-11-01 |
Family
ID=14196877
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57097606A Granted JPS58214972A (en) | 1982-06-09 | 1982-06-09 | Online handwritten character recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58214972A (en) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60107708A (en) * | 1983-11-17 | 1985-06-13 | Tdk Corp | Magnetic head |
| JPS60237584A (en) * | 1984-05-09 | 1985-11-26 | Sanyo Electric Co Ltd | Character recognition system |
| JPH0646419B2 (en) * | 1984-05-22 | 1994-06-15 | シャープ株式会社 | Method of distinguishing between uppercase and lowercase in handwritten character recognition |
| JPS61249483A (en) * | 1985-04-26 | 1986-11-06 | 松下電器産業株式会社 | Laser medical apparatus |
| JPS621086A (en) * | 1985-06-26 | 1987-01-07 | Toshiba Corp | Character input device |
| JPS6320265U (en) * | 1986-07-18 | 1988-02-10 | ||
| JPH01159723A (en) * | 1987-12-16 | 1989-06-22 | Fujitsu Ltd | Hand written character inputting device |
| JPH03223986A (en) * | 1989-12-26 | 1991-10-02 | Fuji Facom Corp | Method for rejecting recognized result |
-
1982
- 1982-06-09 JP JP57097606A patent/JPS58214972A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58214972A (en) | 1983-12-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3176023B2 (en) | Handwriting input collation method and apparatus | |
| US7778464B2 (en) | Apparatus and method for searching for digital ink query | |
| JPH0150954B2 (en) | ||
| KR19980058361A (en) | Korean Character Recognition Method and System | |
| JPH069064B2 (en) | Handwriting recognition device | |
| JPH0150955B2 (en) | ||
| JPH0351029B2 (en) | ||
| JPH0437468B2 (en) | ||
| JPH03126188A (en) | Character recognizing device | |
| JPH0436431B2 (en) | ||
| JP3139701B2 (en) | Online handwritten input character recognition method and apparatus using fuzzy vector and recording medium for executing the method | |
| JP2803892B2 (en) | Character recognition device | |
| JPH0436432B2 (en) | ||
| JPH0776980B2 (en) | Character recognition method | |
| JP3140989B2 (en) | Online handwritten input character recognition method and apparatus by stroke and recording medium for executing the method | |
| JP2851865B2 (en) | Character recognition device | |
| JPH01124082A (en) | Character recognizing device | |
| JPS63301383A (en) | Handwritten character recognition device | |
| JP3051628B2 (en) | Character recognition method and device | |
| JPH0728951A (en) | Online character recognition system | |
| JPH0646419B2 (en) | Method of distinguishing between uppercase and lowercase in handwritten character recognition | |
| JPS62236088A (en) | Recognizing device of character with sonant mark and p-sonant mark | |
| JPS6215681A (en) | Recognizing system for on-line handwritten character | |
| JPS61255487A (en) | On-line hand-written character recognition device | |
| JPH04353964A (en) | Document generation device |