JPH0533434B2 - - Google Patents
Info
- Publication number
- JPH0533434B2 JPH0533434B2 JP61152336A JP15233686A JPH0533434B2 JP H0533434 B2 JPH0533434 B2 JP H0533434B2 JP 61152336 A JP61152336 A JP 61152336A JP 15233686 A JP15233686 A JP 15233686A JP H0533434 B2 JPH0533434 B2 JP H0533434B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- time
- end point
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010606 normalization Methods 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 description 10
- 238000000034 method Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明はオンラインで入力された文字の筆跡よ
り、1個以上連続して書かれた文字を認識するオ
ンライン連続文字認識装置に関するものである。DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to an online continuous character recognition device that recognizes one or more consecutively written characters from the handwriting of characters input online.
(従来の技術)
従来、連続して書かれた文字列中から使用者が
1文字の終わりを指示することなしにその文字列
を認識する装置には例えば、「特願昭30−173421
号」(以下、文献(1)と称す)記載のオンライン連
続文字認識装置があつた。以下、この装置を例に
とつて従来のオンライン連続文字認識装置を説明
する。(Prior Art) Conventionally, a device that recognizes a string of consecutively written characters without the user instructing the end of one character includes, for example, the Japanese Patent Application No. 173421.
There was an online continuous character recognition device described in "No. 1" (hereinafter referred to as Reference (1)). Hereinafter, a conventional online continuous character recognition device will be explained using this device as an example.
この装置では、切れ目なく書かれた文字をも含
む連続して書かれた文字を入力パターンとし、こ
のパターンと予め認識装置内に保持されている標
準パターンとパターンマツチングすることにより
文字を認識する。 This device uses continuously written characters, including characters written without breaks, as an input pattern, and recognizes the characters by pattern matching this pattern with a standard pattern stored in the recognition device in advance. .
入力された文字列は文字を構成する線分の方向
角aiの時系列パターン
A={ai|i=1、2、……、} (1)
に交換される。この時系列パターンを入力パター
ンAとする。同様にして各文字ごとの標準パター
ンは方向角bjの時系列パターン
BC={bn j|j=1、2、……、Sn、……、Jn} (2)
として装置内に保持されている。ここでnは文字
名を表す。この時系列パターンを連続文字パター
ンBCとする。連続文字パターンBCは一文字の書
き始めから書き終わりまでのパターンを表す孤立
文字パターンBI
BI={bn j|j=1、2、……、Sn} (3)
と文字の書き終わりから書き始めからまでの文字
間ストロークを表すBS
BS={bn j|j=Sn+1、Sn+2、……、Jn}(4)
とからなる。 The input character string is exchanged into a time-series pattern of direction angles a i of line segments constituting the characters A={a i |i=1, 2, . . . , } (1). Let this time-series pattern be input pattern A. Similarly, the standard pattern for each character is stored in the device as a time series pattern of direction angle b j as BC = {b n j | j = 1, 2, ..., S n , ..., J n } (2) Retained. Here, n represents a character name. Let this time series pattern be a continuous character pattern BC. Continuous character pattern BC is an isolated character pattern BI that represents the pattern from the beginning of writing to the end of one character BI = {b n j | j = 1, 2, ..., S n } (3) BS representing the inter-character strokes from the beginning consists of BS = {b n j | j = S n +1, S n +2, ..., J n } (4).
この連続文字パターンBCの中に含まれる孤立
文字パターンBIの終点Snを記憶した終点テーブ
ル
Ej(n)=Sn (5)
が連続文字パターンBCと同様に装置内に保持さ
れている。 An end point table Ej(n)=S n (5) storing the end point S n of the isolated character pattern BI included in the continuous character pattern BC is held in the device in the same way as the continuous character pattern BC.
この連続文字パターンBCを1個以上連結し、
入力パターンとマツチングするための文字列標準
パターンを合成する。しかし、最後に連結される
1個のパターンだけは終点テーブルEjに記載され
ている終点までの孤立文字パターンBIとする。 Connect one or more of these continuous character patterns BC,
Synthesizes a standard string pattern for matching with the input pattern. However, only one pattern to be connected at the end is an isolated character pattern BI up to the end point listed in the end point table Ej.
ここで、入力パターンAのi番目のデータと、
標準パターンBCのj番目のデータの間の距離を、
方向角aiとbjの間のなす角度で表す。この距離を
ポイント間距離
do(i、j)=|ai−bn j| (6)
とする。入力パターンAと文字列標準パターンの
パターン間距離Dは、このポイント間距離do(i、
j)を時間方向に累積した値が最小となるよう
に、入力パターンAと文字列標準パターンを時間
軸について整合させた時のポイント間距離do(i、
j)の累積値とする。このようにして合成した文
字列標準パターンと入力パターンAとのパターン
間距離Dが最小となる連続文字パターンBCの組
み合わせを認識結果とする。 Here, the i-th data of input pattern A,
The distance between the j-th data of standard pattern BC is
It is expressed as the angle formed between the direction angles a i and b j . Let this distance be the point-to-point distance d o (i, j)=|a i −b n j | (6). The inter-pattern distance D between the input pattern A and the character string standard pattern is the point-to-point distance d o (i,
The distance between points d o (i,
Let it be the cumulative value of j). The combination of consecutive character patterns BC that minimizes the inter-pattern distance D between the character string standard pattern synthesized in this way and the input pattern A is set as a recognition result.
この時間軸についての整合は、文献(1)中に述べ
られているDPマツチング法により行うことがで
きる。入力パターンAの時刻iにおいて連続文字
パターンBCとのDPマツチングは漸化式
go(i、j)=
do(i、j)+mingo(i−1、j)
go(i−1、j−1) (7)
をj=1、2、……jに対して計算することによ
り時刻iまでの最小累積距離が得られる。ただ
し、初期値としてgo(0、0)=0、go(0、j)=
∽(j=1、2、……jn)を与える。 This matching on the time axis can be performed by the DP matching method described in document (1). DP matching of input pattern A with continuous character pattern BC at time i is the recurrence formula go ( i, j) = d o (i, j) + ming o (i-1, j) go (i-1, By calculating j-1) (7) for j=1, 2, . . . , the minimum cumulative distance up to time i can be obtained. However, as initial values, go (0, 0) = 0, go (0, j) =
Give ∽(j=1, 2,...j n ).
この漸化式演算と同時に、後に最小のパターン
間距離を与える標準パターンの組み合せをたどる
るために必要な経路値ho(i、j)について
ho(i、j)=|#
|ho(i−1、j)
:go(i−1、j)
が最小の時
ho(i−1、j−1):go(i−1、j−1)
が最小の時 (8)
なる代入演算を行う。ただし、初期値としてho
(0、0)=0とする。経路値ho(i、j)には、
時刻i、jにおいて(7)式の漸化式演算を行う時、
その境界距離がどこで与えられたか、つまり標準
パターンの始端が入力パターンのどこに対応して
いるかという境界値が保存されている。 At the same time as this recurrence formula operation, for the path value h o (i, j) required to trace the combination of standard patterns that gives the minimum inter-pattern distance, h o (i, j) = | # | h o (i-1, j): When g o (i-1, j) is the minimum ho (i-1, j-1): When g o (i-1, j-1) is the minimum (8 ) performs the assignment operation. However, as the initial value h o
Let (0, 0)=0. For the route value h o (i, j),
When performing the recurrence formula calculation of equation (7) at times i and j,
The boundary value indicating where the boundary distance was given, that is, where the starting edge of the standard pattern corresponds to the input pattern, is stored.
文字名n、時刻iまでの最小累積距離go(i、
jn)の中でnについて最小なもの
T=
minn
go(i、jn) (9)
が次の時刻i+1における漸化式演算の境界距離
となる。すなわち、
go(i、0)=T (10)
となる。また、その時の経路の境界値は
ho(i、0)=i (11)
で与えられる。 Character name n, minimum cumulative distance to time i g o (i,
The minimum value for n among j n ) (T= min n g o (i, j n ) (9) becomes the boundary distance of the recurrence formula operation at the next time i+1. That is, go (i, 0)=T (10). Moreover, the boundary value of the route at that time is given by h o (i, 0)=i (11).
また、(9)式を満足する文字名ntとその時の経路
値hot(i、jnt)をそれぞれ境界文字名N(i)と境界
経路L(i)に次のように代入しておく。 Also, substitute the character name nt that satisfies equation (9) and the path value h ot (i, j nt ) at that time into the boundary character name N(i) and boundary path L(i), respectively, as follows. .
n(i)=nt (12)
L(i)=hot(i、jnt) (13)
境界文字名n(i)と境界経路L(i)には、標準パタ
ーンの終端Jnにおいてその累積距離が最小となる
標準パターンの文字名ntとその標準パターンの始
端の位置が記憶される。つまり、文字名n(i)の標
準パターンが時刻L(i)からiまでの部分に整合し
たことがわかる。 n(i)=nt (12) L(i)=h ot (i, j nt ) (13) The boundary character name n(i) and the boundary path L( i ) include its The character name nt of the standard pattern with the minimum cumulative distance and the position of the starting edge of the standard pattern are stored. In other words, it can be seen that the standard pattern of the character name n(i) matches the portion from time L(i) to i.
一方、入力パターンAの最後の部分は孤立文字
パターンBIに対する最小パターン間距離を求め
なければならない。そこで、入力パターンAの終
点i=Iにおいては終点テーブルEj(n)より孤立文
字パターンBIの終点
Sn=Ej(n) (14)
を求め(7)、(8)式の漸化式演算と代入演算をj=
1、2、……Snの孤立文字パターンBIの部分に
対してのみ行う。これにより、パターン間距離D
が
D=
minn
go(I、Sn) (15)
のごとく求まる。 On the other hand, for the last part of the input pattern A, the minimum inter-pattern distance for the isolated character pattern BI must be found. Therefore, at the end point i=I of input pattern A, find the end point S n =Ej(n) (14) of the isolated character pattern BI from the end point table Ej(n), and calculate the recurrence formula of equation (7) and (8). and the assignment operation j=
1, 2, . . . Perform only on the isolated character pattern BI portion of S n . As a result, the inter-pattern distance D
is found as D= min n go (I, S n ) (15).
以上の認識結果は次のように得られる。前述の
境界文字名N(i)には時刻iにおいて累積距離が最
小となつた標準パターンの文字名nが保存されて
いる。また、境界経路L(i)にはその境界値が保存
されている。i=Iにおいて、境界文字名N(i)の
値
nr=N(i) (16)
が時刻L(i)からIまでの部分に整合した標準パタ
ーンの文字名nrとなる。続いてiの値をL(i)と置
き換えて同様にN(i)の値を求める。L(i)=0とな
るまでL(i)をたどることによつて認識結果が時刻
と逆順に得られる。 The above recognition results are obtained as follows. The above-mentioned boundary character name N(i) stores the character name n of the standard pattern whose cumulative distance is the minimum at time i. Further, the boundary value is stored in the boundary route L(i). When i=I, the value nr=N(i) (16) of the boundary character name N(i) becomes the character name nr of the standard pattern that matches the portion from time L(i) to I. Next, the value of N(i) is found in the same way by replacing the value of i with L(i). By tracing L(i) until L(i)=0, recognition results are obtained in reverse order of time.
(発明が解決しようとする問題点)
従来、入力パターンと標準パターンのポイント
間距離do(i、j)は位置情報を使わずに、方向
角などを用いていた。これは、入力パターンの文
字間の境界が分らず、入力文字列の位置情報と、
一文字ごとに分離された標準パターンの位置情報
の比較ができなかつたためである。しかし、カタ
カナの「コ」と「ユ」を認識する場合など、違い
は最終ストロークの終点の横方向の位置だけであ
り、方向角などでは判別ができなかつた。(Problems to be Solved by the Invention) Conventionally, the point-to-point distance d o (i, j) between the input pattern and the standard pattern has been determined using a direction angle, etc., without using position information. This is because the boundaries between characters in the input pattern are not known, and the position information of the input string and
This is because it was not possible to compare the positional information of standard patterns separated for each character. However, when recognizing the katakana letters ``ko'' and ``yu'', the only difference is the lateral position of the end point of the final stroke, and it is not possible to distinguish based on the direction angle.
このように従来、文字の位置情報が使用できな
いために認識できない文字が存在した。本発明の
目的はその問題点を解決したオンライン文字認識
装置を提供することにある。 As described above, conventionally, there were characters that could not be recognized because character position information could not be used. An object of the present invention is to provide an online character recognition device that solves this problem.
(問題点を解決するための手段)
本発明によるオンライン連続文字認識装置は、
筆記される文字の筆跡を時系列の入力パターンと
して読み込む入力部と;前記入力パターンの位置
情報の正規化を文字間の境界を用いて行なう行な
う;正規化部と1文字を表す孤立文字パターン
に、文字の終点から次の文字の始点までの文字間
ストロークを連結した標準パターンを記憶する為
の標準パターン記憶部と;前記孤立文字パターン
の終点を記憶する終点テーブルと;前記標準パタ
ーンを0個以上連結したパターンの最後に、終点
を前記終点テーブル中に記憶された終点とした孤
立文字パターンを連結した文字列標準パターンを
もとに、前記入力パターンを位置情報を用いて認
識する認識部とにより構成される。(Means for solving the problem) The online continuous character recognition device according to the present invention has the following features:
an input section that reads the handwriting of written characters as a time-series input pattern; normalizes the positional information of the input pattern using boundaries between characters; a normalization section that reads the handwriting of characters as a time-series input pattern; , a standard pattern storage unit for storing a standard pattern in which inter-character strokes from the end point of a character to the start point of the next character are connected; an end point table for storing the end point of the isolated character pattern; and 0 standard patterns. a recognition unit that recognizes the input pattern using positional information based on a character string standard pattern in which an isolated character pattern whose end point is the end point stored in the end point table is connected to the end of the connected pattern; Consisted of.
(作用)
本発明のオンライン文字認識装置においては、
入力された文字列と標準パターンのマツチング時
において、時刻i−1において最適となる経路を
取る時の境界値、つまり入力パターンの文字間の
境界(以後、文字境界と称す)を保存する。そし
て、その境界値を原点とすることで、入力文字列
中の一文字について位置の正規化を行い、その位
置情報をマツチング時のポイント間距離として用
いる。(Operation) In the online character recognition device of the present invention,
When matching an input character string with a standard pattern, the boundary value when taking the optimal route at time i-1, that is, the boundary between characters in the input pattern (hereinafter referred to as character boundary) is saved. Then, by setting the boundary value as the origin, the position of one character in the input character string is normalized, and the position information is used as the distance between points during matching.
本装置では入力された文字列は文字を構成する
入力点の位置座標(axi、ayi)の時系列パターン
A={(axi、ayi)|i=1、2、……、I} (17)
に変換される。この時系列パターンの入力パター
ンAとする。同様にして各文字ごとの標準パター
ンは位置座標(bxi、byi)
BC={(bxn j、byn j)|
j=1、2、……、Sn、……、Jn} (18)
として装置内に保持されている。この時系列パタ
ーンを連続文字パターンBCとする。これらのパ
ターンの位置座標の原点(以下、位置原点と称
す)は文字列または、文字の書き始めの点とす
る。連続文字パターンBCは一文字の書き始めか
ら書き終りまでのパターンを表す孤立文字パター
ンBI
BI={(bxn j、byn j)|
j=1、2、……、Sn} (19)
と文字の書き終わりから書き始めからまでの文字
間ストロークを表すBS
BS={(bxn j、byn j)|
j=Sn+1、Sn+2、……、Jn} (20)
とからなる。 In this device, the input character string is a time-series pattern of position coordinates (ax i , ay i ) of the input points that make up the character A = {(ax i , ay i ) | i = 1, 2, ..., I } Converted to (17). Let this time-series pattern be input pattern A. Similarly, the standard pattern for each character is the position coordinates (bx i , by i ) BC = {(bx n j , by n j ) | j = 1, 2, ..., S n , ..., J n } (18) is held within the device. Let this time series pattern be a continuous character pattern BC. The origin of the position coordinates of these patterns (hereinafter referred to as the position origin) is the character string or the starting point of writing the character. The continuous character pattern BC is an isolated character pattern BI that represents the pattern from the beginning to the end of one character. BI = {(bx n j , by n j ) | j = 1, 2, ..., S n } (19) BS representing the stroke between characters from the end of writing to the beginning of writing BS = {(bx n j , by n j ) | j = S n +1, S n +2, ..., J n } (20) Become.
この連続文字パターンBCの中に含まれる孤立
文字パターンBIの終点Snを記憶した終点テーブ
ル
Ej(n)=Sn (21)
が連続文字パターンBCと同様に装置内に保持さ
れている。 An end point table Ej(n)=S n (21) storing the end point S n of the isolated character pattern BI included in the continuous character pattern BC is held in the device in the same way as the continuous character pattern BC.
この連続文字パターンBCを1個以上連結し、
入力パターンとマツチングするための文字列標準
パターンを合成する。しかし、最後に連結される
1個のパターンだけは終点テーブルEjに記載され
ている終点までの孤立文字パターンBIとする。 Connect one or more of these continuous character patterns BC,
Synthesizes a standard string pattern for matching with the input pattern. However, only one pattern to be connected at the end is an isolated character pattern BI up to the end point listed in the end point table Ej.
ここで、入力パターンAの時刻iにおける位置
座標(axi、ayi)の正規化を次のように行なう。
入力パターンAの時刻Kにおける位置座標と、標
準パターンBCの時刻Lにおける位置座標とが最
適に対応付けられた時、つまり時刻(K、L)ま
での累積距離が最小となる時標準パターンBCの
始端である文字境界と対応づけられた入力パター
ンの時刻Hを求める。入力パターンAの時刻iに
おける位置座標より時刻hにおける位置座標を減
算することにより正規化が行われる。すなわち時
刻(K、L)までにマツチングされた最小累積距
離を与える文字境界を
h=ho(K、L) (22)
とすれば、時刻hにおける位置原点で正規化した
位置座標(以下、正規化入力パターンと称す)は
(axi、axh、ayi−ayh)となる。 Here, the position coordinates (ax i , ay i ) of input pattern A at time i are normalized as follows.
When the position coordinates of input pattern A at time K and the position coordinates of standard pattern BC at time L are optimally correlated, that is, when the cumulative distance to time (K, L) is the minimum, standard pattern BC The time H of the input pattern associated with the character boundary that is the starting edge is determined. Normalization is performed by subtracting the position coordinates of input pattern A at time h from the position coordinates at time i. In other words, if the character boundary that gives the minimum cumulative distance matched up to time (K, L) is h = h o (K, L) (22), then the position coordinate (hereinafter referred to as (referred to as normalized input pattern) becomes (ax i , ax h , ay i −ay h ).
この時刻iにおける正規化入力パターンと時刻
jにおける文字名Nの標準パターン
(bxn j、byn j)とのポイト間距離を
do(i、j、K、L)=|(axi、ax
ho(K、L))−bxn j|+|(ayi−ay
ho(K、L))−byn j| (23)
とする。 The point-to-point distance between the normalized input pattern at time i and the standard pattern of character name N (bx n j , by n j ) at time j is d o (i, j, K, L) = | (ax i , ax h o(K , L) )−bx n j |+|(ay i −ay h o(K , L) )−by n j | (23).
入力パターンAと文字列標準パターンのパター
ン間距離Dは、このポイント間距離do(i、j、
K、L)を時間方向に累積した値が最小となるよ
うに、入力パターンAと文字列標準パターンを時
間軸について整合させた時のポイント間距離do
(i、j、K、L)の累積値とする。このように
して合成した文字列標準パターンと入力パターン
Aとのパターン間距離Dが最小となる連続文字パ
ターンBCの組み合わせを認識結果とする。 The inter-pattern distance D between the input pattern A and the character string standard pattern is the point-to-point distance d o (i, j,
The distance between points d o when input pattern A and character string standard pattern are aligned on the time axis so that the cumulative value of K, L) in the time direction is the minimum
Let it be the cumulative value of (i, j, K, L). The combination of consecutive character patterns BC that minimizes the inter-pattern distance D between the character string standard pattern synthesized in this way and the input pattern A is set as a recognition result.
この時間軸についての整合は、DPマツチング
法により行う。入力パターンAの時刻iにおいて
連続文字パターンBCとのDPマツチングは漸化式
go(i、j)=min|#
go(i−1、j)+do(i、j、i−1、j)
go(i−1、j−1)+do(i、j、i−1、j−1
)(24)
ただし、
go(0、0)=0、go(0、j)=∽(j=1、
2、……、Jn)をj=1、2、……、Jnに対して
計算することにより時刻iまでの最小累積距離が
得られる。 This matching on the time axis is performed using the DP matching method. DP matching of input pattern A with continuous character pattern BC at time i is a recurrence formula g o (i, j) = min | # g o (i-1, j) + d o (i, j, i-1, j) g o (i-1, j-1) + d o (i, j, i-1, j-1
)(24) However, go (0, 0) = 0, go (0, j) = ∽ (j = 1,
2, . . . , J n ) for j=1, 2 , .
この漸化式演算と同時に、後に最小のパターン
間距離を与える標準パターンの組み合わせをたど
るために必要な経路値ho(i、j)については従
来技術と同様に(8)式のような代入演算が行われ
る。また、ho(i、j)は次の時刻i+1におい
て入力パターンAを正規化するための境界値hと
しても用いられる。 At the same time as this recurrence formula operation, the path value h o (i, j) required to trace the combination of standard patterns that gives the minimum inter-pattern distance is substituted as in equation (8) in the same way as in the prior art. An operation is performed. Further, h o (i, j) is also used as a boundary value h for normalizing the input pattern A at the next time i+1.
以後の認識処理は従来技術の(9)〜(16)式と全く同
様にして行われ、最後に認識結果が得られて終了
する。 The subsequent recognition processing is performed in exactly the same manner as in equations (9) to (16) of the prior art, and finally, the recognition result is obtained and the process ends.
以上のように、入力文字列と標準パターンのマ
ツチング時における、境界値を位置原点とするこ
とによつて、位置情報の使用が可能となり、従
来、方向角では認識できなかつた文字も認識する
ことができる。 As described above, by using the boundary value as the positional origin when matching an input character string and a standard pattern, it is possible to use positional information, and it is now possible to recognize characters that could not be recognized using direction angles in the past. I can do it.
さらに本発明で用いるポイント間距離は他にも do(i、j、K、L)={[(axi、ax ho(K、L))−bxn j]2+[(ayi、ay ho(K、L))−bxn j]2}1/2 (25) など様々な位置情報が使用できる。 Furthermore, the distance between points used in the present invention is also d o (i, j, K, L) = {[(ax i , ax ho (K , L) ) − bx n j ] 2 + [(ay i , ay h o(K , L) )−bx n j ] 2 } 1/2 (25) Various position information can be used.
また、標準パターンとして「特願昭60−110743
号」記載の連続文字パターンと孤立文字パターン
や、「特願昭61−53397号」に記載の孤立文字パタ
ーンと文字間パターンを使用する場合などについ
ても全く同様に本発明が使用できる。 In addition, as a standard pattern “Patent Application 1986-110743”
The present invention can be used in exactly the same way when using the continuous character pattern and isolated character pattern described in "Japanese Patent Application No. 1982-53397" and the isolated character pattern and intercharacter pattern described in "Japanese Patent Application No. 1983-53397."
DPマツチングに用いる漸化式も(24)式の他
に、日経エレクトロニクス誌、昭和58年11月7日
号P.171〜P.208に「連続発声した単語音声を効率
的に認識する2段DPマツチング」(追江)と題し
て発表された文献中に延べられた様々な漸化式が
使用できる。 In addition to equation (24), the recurrence formula used for DP matching is also included in the Nikkei Electronics magazine, November 7, 1988 issue, pages 171 to 208, "A two-stage method for efficiently recognizing continuously uttered word sounds. Various recurrence formulas published in the literature entitled "DP Matching" (Oie) can be used.
(実施例)
以下に本発明の一実施例について図面を用いて
説明する。第1図は本発明の一実施例を示す構成
図である。(Example) An example of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the present invention.
標準パターン記憶部130には(18)式に対応した
連続文字パターンBCが、また、終点テーブルEj
200は、(21)式に対応する終点Snが、それぞ
れ文字名n(n=1、2、……、N)について記
憶されている。 The standard pattern storage unit 130 contains a continuous character pattern BC corresponding to equation (18), and an end point table Ej.
In 200, end points S n corresponding to equation (21) are stored for each character name n (n=1, 2, . . . , N).
漸化式値go(i、j)と経路値ho(i、j)を記
憶し、時刻jおよび文字名nによつて番地指定さ
れるGメモリ170とHメモリ180とを用意す
る。同様に(9)、(12)、(13)式に対応して境界距離、境
界文字名、境界経路を記憶し時刻iによつて番地
指定されるTメモリ210、Nメモリ230とL
メモリ220をそれぞれ用意する。 A G memory 170 and an H memory 180 are prepared in which the recurrence formula value go (i, j) and the path value ho (i, j) are stored and whose addresses are specified by time j and character name n. Similarly, the T memory 210, N memory 230, and L memory 210, which store the boundary distance, boundary character name, and boundary route corresponding to equations (9), (12), and (13), and are addressed by time i.
Each memory 220 is prepared.
タブレツト100より入力された文字列データ
は前処理部110おいて位置座標の時系列データ
に変換される。この時系列データは入力パターン
バツフア120に送られ、入力パターン(axi、
ayi)として保持される。これと同時にGメモリ
170にj=1、2、……、Jとn=1、2、…
…、Nについて∽(メモリが許す最大の数値)が
セツトされる。同様にTメモリ210にはT(0)
=0、T(i)=∽(i=1、2、……、I)がセツ
トされ、Hメモリ180は全て0でクリアされ
る。また、入力パターンの終点Iは前処理部11
0から終点検出部260に送られ、保持される。 Character string data input from the tablet 100 is converted into time series data of position coordinates in a preprocessing section 110. This time series data is sent to the input pattern buffer 120, and the input pattern (ax i ,
ay i ). At the same time, j = 1, 2, ..., J and n = 1, 2, ... are stored in the G memory 170.
..., ∽ (the maximum value allowed by the memory) is set for N. Similarly, T(0) is stored in the T memory 210.
=0, T(i)=∽(i=1, 2, . . . , I) are set, and the H memory 180 is cleared with all 0s. Furthermore, the end point I of the input pattern is determined by the preprocessing unit 11.
0 is sent to the end point detection unit 260 and held.
以上の初期化が終了すると、制御部250より
時刻信号iが1、2、……、Iと出力され、これ
に同期して処理が行われる。この時刻iにおい
て、制御部250よりの文字指定信号nは1、
2、……、Nのごとく変化する。時刻信号iによ
つて入力パターンバツフア120から入力パター
ン(axi、ayi)が正規化部270に送られる。正
規化部270では後に述べるDPマツチング部1
60からの境界値信号h1,h2いより(23)式
のごとく入力パターンの正規化を行なう。そして
h1,h2に対応した正規化入力パターンa1i,
a2iを距離計算部140に出力する。同時に、
文字指定信号nと標準パターン時刻信号jにより
前記標準パターン記憶部130より読みだされる
標準パターンbn jも距離計算部140に送られる。
距離計算部140では正規化入力パターンa1i,
a2iと標準パターンbn jとのそれぞれのポイント
間距離d1,d2が(24)式のごとく計算され
る。このポイント間距離d1,d2はDPマツチ
ング部160に送られ、文字名nについてその最
小累積距離が計算される。 When the above initialization is completed, the control unit 250 outputs the time signal i as 1, 2, . . . , I, and processing is performed in synchronization with this. At this time i, the character designation signal n from the control unit 250 is 1,
It changes like 2,...,N. Input patterns (ax i , ay i ) are sent from the input pattern buffer 120 to the normalization unit 270 according to the time signal i. The normalization unit 270 includes a DP matching unit 1, which will be described later.
From the boundary value signals h1 and h2 from 60, the input pattern is normalized as shown in equation (23). Then, the normalized input pattern a1 i corresponding to h1 and h2,
a2 i is output to the distance calculation section 140. at the same time,
The standard pattern b n j read out from the standard pattern storage section 130 using the character designation signal n and the standard pattern time signal j is also sent to the distance calculation section 140 .
The distance calculation unit 140 uses the normalized input patterns a1 i ,
The inter-point distances d1 and d2 between a2 i and the standard pattern b n j are calculated as shown in equation (24). These point-to-point distances d1 and d2 are sent to the DP matching section 160, and the minimum cumulative distance is calculated for the character name n.
次にnについての1サイクル内の動作を説明す
る。DPマツチング部160の詳細構成例を第2
図に示す。文字指定信号nが指定されるとTメモ
リ210よりT(i−1)が信号線T2に読みだ
されg1・レジスタ1601に記入され、h1・
レジスタ1606にはi−1なる数値が書き込ま
れる。 Next, the operation within one cycle for n will be explained. A detailed configuration example of the DP matching unit 160 is shown in the second example.
As shown in the figure. When the character designation signal n is specified, T(i-1) is read out from the T memory 210 onto the signal line T2, written into the g1 register 1601, and written into the h1 register.
A numerical value i-1 is written into register 1606.
続いて標準パターン時刻信号jが1にセツトさ
れると、g1・レジスタ1601の内容はg2・
レジスタ1602に転送され、また、h1・レジ
スタ1606の内容はh2・レジスタ1607に
転送される。同時にGメモリ170よりG(n、
1)が読み出されg1・レジスタ1601に記入
され、Hメモリ180よりH(n、1)が読みだ
されh1・レジスタ1606に記入される。この
時点でg2・レジスタ1602とh2・レジスタ
1607の中に保持される値はそれぞれ漸化式
(24)、(8)の境界条件g(i−1、0)とh(i−
1、0)に対応している。また、g1・レジスタ
1601とh1・レジスタ1606の中に保持さ
れる値はそれぞれgo(i−1、1)とho(i−1、
1)となつている。 Subsequently, when the standard pattern time signal j is set to 1, the contents of the g1 register 1601 become g2.
The contents of the h1 register 1606 are transferred to the h2 register 1607. At the same time, G(n,
1) is read out and written into the g1 register 1601, and H(n, 1) is read out from the H memory 180 and written into the h1 register 1606. At this point, the values held in g2 register 1602 and h2 register 1607 are the boundary conditions g(i-1, 0) and h(i-
1, 0). Also, the values held in g1 register 1601 and h1 register 1606 are go (i-1, 1) and ho (i-1,
1).
以後は順次、標準パターン時刻信号jが増加さ
れながら(24)、(8)式の計算が繰り返し実行され
る。標準パターン時刻信号が一般的にjなる値を
とる時の動作を以下に説明する。この時点ではg
1・レジスタ1601、g2・レジスタ1602
にはそれぞれg1=go(i−1、j)、g2=go
(i−1、j−1)が、またh1・レジスタ16
06、h2・レジスタ1607にはそれぞれ境界
値h1=ho(i−1、j)、h2=hn(i−1、j−
1)が保持されている。このh1,h2の値が前
述の正規化部270に送られ、時刻i=h1にお
ける入力パターンの位置座標(axh1、ayh2)を入
力パターンバツフア120から求め、(23)式の
ごとくa1i(axi−axh1、ayi−ayh1)とし入力パタ
ーンの正規化を行なう。h2についても同様にa
2(axi−axh2、ayi−ayh2)とし正規化を行なう。
これらの正規化入力パターンa1,a2iは前述
のように距離計算部140に送られ、それそれ標
準パターンbn jとのポイント間距離d1,d2が計
算される。 Thereafter, the calculations of equations (24) and (8) are repeatedly executed while the standard pattern time signal j is sequentially increased. The operation when the standard pattern time signal generally takes the value j will be described below. At this point g
1・Register 1601, g2・Register 1602
are respectively g1=g o (i-1, j) and g2=g o
(i-1, j-1) is also h1/register 16
06, h2 register 1607 has boundary values h1=h o (i-1, j) and h2=hn (i-1, j-
1) is maintained. The values of h1 and h2 are sent to the normalization unit 270, which calculates the position coordinates (ax h1 , ay h2 ) of the input pattern at time i=h1 from the input pattern buffer 120, and calculates a1 as shown in equation (23). The input pattern is normalized as i (ax i −ax h1 , ay i −ay h1 ). Similarly for h2, a
2 (ax i −ax h2 , ay i −ay h2 ) and perform normalization.
These normalized input patterns a1, a2 i are sent to the distance calculating section 140 as described above, and the point-to-point distances d1, d2 from each standard pattern b n j are calculated.
DPマツチング部160に送られたd1,d2
はそれぞれ加算器1603,1604によつて、
g1・レジス1601、g2・レジスタ1602
に保持されているg1、g2との和g1+d1、
g2+d2が計算され、最小値検出部1608に
送られる。最小値検出部1604では信号g1+
d1とg2+d2と最小値が決定され最小値信号
gmとして出力される。同時にこの最小値がg1
+d1、g2+d2のいずれであつたかに対応し
て、それぞれ1、2の値をとるスイツチ信号cが
出力される。 d1 and d2 sent to the DP matching section 160
are calculated by adders 1603 and 1604, respectively,
g1 register 1601, g2 register 1602
The sum of g1 and g2 held in g1+d1,
g2+d2 is calculated and sent to minimum value detection section 1608. In the minimum value detection section 1604, the signal g1+
The minimum value of d1 and g2+d2 is determined and the minimum value signal
Output as gm. At the same time, this minimum value is g1
A switch signal c having a value of 1 or 2 is output depending on whether the value is +d1 or g2+d2.
こうして得られる最小値信号gmは信号sg2とし
て漸化式(24)の計算結果go(i、j)となる。
また信号sg2は新たなG(n、j)としてGメモリ
170に記入される。マルチプレクサ1605で
は前記のスイツチ信号cに制御されてh1・レジ
スタ1606、h2・レジスタ1607よりの信
号h1,h2が選択される。すなわち、c=1に
対してh1が、c=2に対してh2が選ばれる。
この結果、出力される信号sh2は(8)式の計算結果
ho(i、j)となつている。この信号sh2はHメモ
リ180に新たなH(n、j)の値として書き込
まれる。 The minimum value signal gm thus obtained becomes the signal sg2, which is the calculation result go (i, j) of recurrence formula (24).
Further, the signal sg2 is written into the G memory 170 as a new G(n,j). The multiplexer 1605 selects signals h1 and h2 from the h1 register 1606 and h2 register 1607 under the control of the switch signal c. That is, h1 is selected for c=1, and h2 is selected for c=2.
As a result, the output signal sh2 is the calculation result of equation (8)
It becomes h o (i, j). This signal sh2 is written into the H memory 180 as a new value of H(n,j).
以上の過程がj=Jnまで繰り返された時点でgo
(i、Jn)とho(j、Jn)とが得られる。これらの
信号はそれぞれ信号T1,hとして出力される。
かくしてDPマツチング部160の動作が1回終
了する。 When the above process is repeated until j=J n , g o
(i, J n ) and ho (j, J n ) are obtained. These signals are output as signals T1 and h, respectively.
Thus, the operation of the DP matching section 160 is completed once.
DPマツチング部160からの信号T1とTメ
モリ210からの信号T2は比較回路190に送
られ比較される。T1<T2なる時は比較回路1
90より書き込みパルスWpが出力される。これ
によつて、Tメモリ210には信号T1=go(i、
Jn)が、Lメモリ220にはh=ho(i、Jn)が、
そして、Nメモリ230には文字指定信号nがそ
れぞれT(i)、L(i)、n(i)として記入される。これ
に対してT1>T2なる時はこれらの記入処理は
なされない。 Signal T1 from DP matching section 160 and signal T2 from T memory 210 are sent to comparison circuit 190 and compared. When T1<T2, comparison circuit 1
A write pulse Wp is output from 90. As a result, the signal T1= go (i,
J n ) is stored in the L memory 220, and h= ho (i, J n ) is stored in the L memory 220.
Then, character designation signals n are written in the N memory 230 as T(i), L(i), and n(i), respectively. On the other hand, when T1>T2, these entry processes are not performed.
文字指定信号nが1、2、……、Nと変化され
る間に上記と同様な処理が繰り返されて時刻iに
おける処理が終了する。この結果、Tメモリ21
0には(9)式のごとくgo(i、Jn)のnについての
最小値が保持される。さらに、この過程が時刻i
について1、2、……、Iと繰り返されてるが、
終点Iにおける処理はこれまでとは異なる。 Processing similar to the above is repeated while the character designation signal n is changed to 1, 2, . . . , N, and the processing at time i ends. As a result, T memory 21
0 holds the minimum value of g o (i, J n ) with respect to n, as in equation (9). Furthermore, this process is performed at time i
Regarding 1, 2, ..., I is repeated,
The processing at end point I is different from before.
終点検出部260では時刻信号iを終点Iと比
較し、i=Iとなつた時点で終点テーブルEj20
0に終点信号eを送る。終点テーブルEj200は
終点信号eを受け取ると、標準パターン記憶部1
30に対して文字指定信号nに対した終点Snを送
る。標準パターン記憶部130は送られてきたこ
の値を用いて、距離計算部140に出力する標準
パターンの終点をSnとする。つまり、標準パター
ンのjについてのデータはbn j(j=1、2、……、
Sn)となる。この後の距離計算や漸化式計算はj
=1、2、……、Sについて行う。以後の処理は
今までと同様であり、文字指定信号nについて
1、2、……、Nと変化させることにより時刻I
における処理が終了する。以上でパターン間距離
DがT(I)の値として求まつたことになる。 The end point detection unit 260 compares the time signal i with the end point I, and when i=I, the end point table Ej20 is
Send end point signal e to 0. When the end point table Ej200 receives the end point signal e, the standard pattern storage section 1
30, the end point S n for the character designation signal n is sent. Using this sent value, the standard pattern storage section 130 sets the end point of the standard pattern to be output to the distance calculation section 140 as S n . In other words, the data for j of the standard pattern is b n j (j=1, 2, ...,
S n ). Subsequent distance calculations and recurrence formula calculations are done using j
=1, 2, ..., S. The subsequent processing is the same as before, and by changing the character designation signal n to 1, 2, ..., N, the time I
The process at ends. In the above manner, the inter-pattern distance D has been found as the value of T(I).
続いて認識結果を得るための判定処理が開始さ
れる。判定部240はLメモリとNMメモリから
L(i)とN(i)を参照して(16)式におけるように認識結
果nrを出力する。i=Iの値をNメモリに与え、
その時のN(i)の値を結果として出力し、続いてi
の値をLメモリに出力しL(i)の値を得る。新た
に、L(i)の値をiとしてNメモリに与え、同様に
してN(i)の値を結果として出力する。この処理を
L(i)=0となるまで繰り返すことによつて認識結
果nrが時刻iと逆順に出力される。 Subsequently, a determination process for obtaining a recognition result is started. The determination unit 240 refers to L(i) and N(i) from the L memory and the NM memory and outputs the recognition result nr as in equation (16). Give the value of i=I to N memory,
The value of N(i) at that time is output as a result, and then i
The value of is output to the L memory to obtain the value of L(i). The value of L(i) is newly given as i to the N memory, and the value of N(i) is similarly output as a result. By repeating this process until L(i)=0, the recognition results nr are output in the reverse order of time i.
(発明の効果)
本発明によれば、従来のオンライン連続文字認
識装置において、不可能であつた位置座標の違い
による文字の判別を可能とし、より認識率の高い
オンライン文字認識装置が得られる。(Effects of the Invention) According to the present invention, it is possible to discriminate characters based on differences in positional coordinates, which was impossible in conventional online continuous character recognition devices, and an online character recognition device with a higher recognition rate can be obtained.
第1図は本発明の一実施例を示すブロツク図、
第2図はその実施例におけるDPマツチング部の
詳細構成図である。
100……タブレツト、110……前処理部、
120……入力パターンバツフア、130……標
準パターン記憶部、140……距離計算部、15
0……距離記憶部、160……DPマツチグ部、
170……Gメモリ、180……Hメモリ、19
0……比較部、200……終点テーブル、210
……Tメモリ、220……Lメモリ、230……
nメモリ、240……判定部、250……制御
部、260……終点検出部、270……正規化
部。
FIG. 1 is a block diagram showing one embodiment of the present invention;
FIG. 2 is a detailed configuration diagram of the DP matching section in this embodiment. 100...tablet, 110...pretreatment section,
120...Input pattern buffer, 130...Standard pattern storage unit, 140...Distance calculation unit, 15
0... Distance storage section, 160... DP Matsushig section,
170...G memory, 180...H memory, 19
0... Comparison section, 200... End point table, 210
...T memory, 220...L memory, 230...
n memory, 240...determination unit, 250...control unit, 260...end point detection unit, 270...normalization unit.
Claims (1)
ンとして読み込む入力部と;前記入力パターンの
位置情報の正規化を文字間の境界を用いて行なう
正規化部と;1文字を表す孤立文字パターンに、
文字の終点から次の文字の始点までの文字間スト
ロークを連結した標準パターンを記憶する標準パ
ターン記憶部と;前記孤立文字パターンの終点を
記憶する終点テーブルと;前記標準パターンを0
個以上連結したパターンの最後に、終点を前記終
点テーブル中に記憶された終点とした孤立文字パ
ターンを連結した文字列標準パターンをもとに、
前記入力パターンを位置情報を用いて認識する認
識部とを有するオンライン連続文字認識装置。1. An input section that reads the handwriting of written characters as a time-series input pattern; A normalization section that normalizes the positional information of the input pattern using boundaries between characters; ,
a standard pattern storage unit that stores a standard pattern that connects inter-character strokes from the end point of a character to the start point of the next character; an end point table that stores the end point of the isolated character pattern;
Based on a character string standard pattern in which an isolated character pattern whose end point is the end point stored in the end point table is concatenated at the end of a pattern in which two or more are connected,
and a recognition unit that recognizes the input pattern using positional information.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61152336A JPS638886A (en) | 1986-06-29 | 1986-06-29 | On-line continuous character recognizing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61152336A JPS638886A (en) | 1986-06-29 | 1986-06-29 | On-line continuous character recognizing device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS638886A JPS638886A (en) | 1988-01-14 |
| JPH0533434B2 true JPH0533434B2 (en) | 1993-05-19 |
Family
ID=15538310
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61152336A Granted JPS638886A (en) | 1986-06-29 | 1986-06-29 | On-line continuous character recognizing device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS638886A (en) |
-
1986
- 1986-06-29 JP JP61152336A patent/JPS638886A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS638886A (en) | 1988-01-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4573196A (en) | Confusion grouping of strokes in pattern recognition method and system | |
| JPH0792815B2 (en) | Pattern recognition method | |
| EP0947980A1 (en) | Noise-rejecting speech recognition system and method | |
| JPH0296800A (en) | Continuous voice recognizing device | |
| JPH0533434B2 (en) | ||
| KR100248601B1 (en) | On-line character recognition method and device | |
| JPH0531798B2 (en) | ||
| JP3198218B2 (en) | Online handwriting recognition method | |
| JPH0527917B2 (en) | ||
| JPS5942908B2 (en) | Real-time character recognition device | |
| JPS62160597A (en) | On-line consecutive character recognition device | |
| JPH0210473B2 (en) | ||
| JPH012187A (en) | Online continuous character recognizer | |
| JPH0291785A (en) | Image recognition method and device | |
| JPS5929909B2 (en) | Online handwritten character recognition method | |
| JPS6242290A (en) | Recognizer for handwritten character | |
| JP2519782B2 (en) | Character separation method | |
| JPS59188787A (en) | Input device of on-line manuscript character | |
| JP2905334B2 (en) | Online handwritten character recognition dictionary creation method and online handwritten character recognition dictionary creation device | |
| JPH0766418B2 (en) | Handwriting recognition device | |
| JPH0527912B2 (en) | ||
| JPH01204196A (en) | Method and device for recognizing continuous numeral and its device | |
| JPH03214198A (en) | Word spotting voice recognizing method | |
| JPS60112187A (en) | Recognition system of online hand written character | |
| JPS6335996B2 (en) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |