JPH0414359B2 - - Google Patents

Info

Publication number
JPH0414359B2
JPH0414359B2 JP56210201A JP21020181A JPH0414359B2 JP H0414359 B2 JPH0414359 B2 JP H0414359B2 JP 56210201 A JP56210201 A JP 56210201A JP 21020181 A JP21020181 A JP 21020181A JP H0414359 B2 JPH0414359 B2 JP H0414359B2
Authority
JP
Japan
Prior art keywords
vector
category
pattern
standard pattern
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56210201A
Other languages
Japanese (ja)
Other versions
JPS58115491A (en
Inventor
Takao Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56210201A priority Critical patent/JPS58115491A/en
Publication of JPS58115491A publication Critical patent/JPS58115491A/en
Publication of JPH0414359B2 publication Critical patent/JPH0414359B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明はベクトルの系列として表現される入力
パタンを認識する装置の改良に関し、特にあらか
じめ用意されたベクトル標準パタンを用いて認識
を行う装置の改良に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an improvement in a device for recognizing an input pattern expressed as a sequence of vectors, and more particularly to an improvement in a device that performs recognition using a vector standard pattern prepared in advance.

一般に音声や図形、文字等のパタンは特徴ベク
トルの系列として表わすことができるが、パタン
をベクトルの系列として表現したとき、あらかじ
め標準的なパタンを用意しておき、これらのパタ
ンと入力されたパタンとの類似度(類似性を表わ
す尺度)を比較することにより認識を行うことが
できる。このとき、日本音響学会講演論文集(昭
和55年度10月)p.391−p.392に見られるように、
ベクトルを単位とした標準パタン(ベクトル標準
パタン)を用意し、カテゴリ標準パタンを、上記
ベクトル標準パタンの組合せにより辞書として表
現することにより処理量を減らすことができる。
しかしこの場合でも、一つのカテゴリに対して多
数の辞書を用意する必要のある場合には、認識時
に多数の辞書を参照しなければならないため処理
量が増大するという問題点があつた。
Generally, patterns such as sounds, figures, characters, etc. can be expressed as a series of feature vectors, but when a pattern is expressed as a series of vectors, standard patterns are prepared in advance, and these patterns and input patterns can be expressed as a series of vectors. Recognition can be performed by comparing the degree of similarity (a measure of similarity) with At this time, as seen in the Proceedings of the Acoustical Society of Japan (October 1982), p.391-p.392,
The amount of processing can be reduced by preparing a standard pattern (vector standard pattern) in which vectors are units, and expressing the category standard pattern as a dictionary using a combination of the vector standard patterns.
However, even in this case, if it is necessary to prepare many dictionaries for one category, there is a problem that the amount of processing increases because many dictionaries must be referred to during recognition.

本発明の目的は、上記のような一つのカテゴリ
に対して多数の辞書が必要な場合でも処理量の少
ないパタン認識装置を実現することにある。
An object of the present invention is to realize a pattern recognition device that requires a small amount of processing even when a large number of dictionaries are required for one category as described above.

一般にパタンSをn個のベクトルから成る系列
|S1,……,o|、またベクトル標準パタンをR1
R2,……で表わすと、パタンSの各ベクトルSi
を、Siと最も類似度の大きくなるベクトル標準パ
タンで置きかえることによりパタンSをn個の記
号から成る記号系列〔L(1),……,L(o)〕で表現す
ることができる。すなわち、ベクトルSiとRjとの
類似度をX(i,j)とすると X(i,Li)= max jX(i,j) (1) 各カテゴリに対してベクトル系列としての標準
パタン(ベクトル系列標準パタンと呼ぶ)が複数
個あるとして、認識対象カテゴリの個数をM,ま
たカテゴリmのベクトル系列標準パタンの個数を
k(m),ベクトル系列標準パタンを A(m) 2,A(m) 2,……,A(m) k(n) とすると、A(m) jは、それぞれ記号系列として次の
ように表現することができる。
In general, the pattern S is a sequence of n vectors |S 1 , ..., o |, and the vector standard pattern is R 1 ,
R 2 , ..., each vector S i of the pattern S
By replacing S with a vector standard pattern that has the highest degree of similarity to S i , the pattern S can be expressed as a symbol sequence [L (1) , . . . , L (o) ] consisting of n symbols. In other words, if the similarity between vectors S i and R j is X (i, j), then: X (i, L i ) = max j (referred to as vector sequence standard patterns), the number of categories to be recognized is M, the number of vector sequence standard patterns of category m is k(m), and the vector sequence standard patterns are A (m) 2 , A (m) 2 , ..., A (m) k(n) , each of A (m) j can be expressed as a symbol sequence as follows.

A(m) j=〔L(m) J(1),L(m) J(2),……,L(m) J(n
)〕, j=1,2,……,k(m) m=1,2,……,M (2) これらをベクトル系列標準パタン辞書と呼ぶ。
A (m) j = [L (m) J (1), L (m) J (2), ..., L (m) J (n
)], j = 1, 2, ..., k (m) m = 1, 2, ..., M (2) These are called vector sequence standard pattern dictionaries.

これらを用いれば次のように認識を行うことが
できる。入力パタンのベクトル系列を|S1,…
…,So|とする。まず入力パタンの各ベクトルSi
とベクトル標準パタンR1,R2との類似度 X(i,1),X(i,2), ……(3) を求める。次に各ベクトル系列標準パタンとの類
似度を辞書を用いて次のように求める。
Using these, recognition can be performed as follows. The vector sequence of the input pattern is |S 1 ,...
..., S o |. First, each vector S i of the input pattern
and the vector standard patterns R 1 , R 2 and the similarity X(i, 1 ), X(i, 2 ), ...(3) is calculated. Next, the degree of similarity with each vector sequence standard pattern is determined using a dictionary as follows.

y(m) j=n 〓i=1 x(i,L(m) J(i)), j=1,2,……,k(m), m=1,2,……,M (4) 次いで y(m)= max j=1,K(m) yj (m) (5) を最大とするmを求めればこれが認識結果とな
る。
y (m) j = n 〓 i=1 x (i, L (m) J (i)), j = 1, 2, ..., k (m), m = 1, 2, ..., M ( 4) Next, find m that maximizes y (m) = max j = 1, K (m) y j (m) (5), and this will be the recognition result.

以上の認識処理では式(4),(5)の実行が必要であ
るが一つのカテゴリについての辞書が多いときに
は式(4),(5)の処理も多くなる。この点を本発明で
は以下のように解決する。
In the above recognition process, it is necessary to execute equations (4) and (5), but when there are many dictionaries for one category, the processing of equations (4) and (5) increases. The present invention solves this problem as follows.

一つのベクトル系列標準パタンを辞書として表
現するかわりに、あるベクトル標準パタンをあら
わす記号jに対して、それがあるカテゴリmの記
号系列上で位置iにある確からしさP(m)(i,
j),(すなわち、カテゴリmのi番目の記号であ
る確からしさ)を定義し、これをすべての記号
j,カテゴリm,位置iの組合せに対して与え
る。これをベクトル標準パタン辞書と呼ぶことに
する。このとき、入力パタンを(1)式の操作に
よつて記号系列に置きかえたものを〔L(1),……,
L(o)〕とすると、カテゴリmに対する類似度を y(m)=n 〓i=1 P(m)(i,L(i)) (6) で表わすことができる。
Instead of expressing one vector series standard pattern as a dictionary, for a symbol j representing a certain vector standard pattern, the probability that it is at position i on the symbol series of a certain category m is expressed as P(m)(i,
j), (that is, the probability that it is the i-th symbol of category m) is defined and given to all combinations of symbol j, category m, and position i. This will be called a vector standard pattern dictionary. At this time, the input pattern is replaced with a symbol sequence by the operation of equation (1), and the result is [L (1) ,...,
L (o) ], the similarity for category m can be expressed as y (m) = n 〓 i=1 P (m) (i, L(i)) (6).

式(6)の実行の一例を、パタンが4個のベクトル
系列で表わされ、カテゴリ数M=3,標準パタン
数が6である場合について以下に示す。
An example of the execution of equation (6) will be shown below for the case where the pattern is represented by a series of four vectors, the number of categories M=3, and the number of standard patterns is six.

入力パタン|S1,S2,S3,S4|が記号系列
〔5,5,2,6〕に変換されたとする。また、
ベクトル標準パタン辞書は第1図のように記述さ
れているとする。このとき類似度y(1),y(2),y(3)
は表中の○印の和として次のように得られる。
Suppose that the input pattern |S 1 , S 2 , S 3 , S 4 | is converted into a symbol sequence [5, 5, 2, 6]. Also,
It is assumed that the vector standard pattern dictionary is described as shown in FIG. In this case, the similarity y (1) , y (2) , y (3)
is obtained as the sum of the ○ marks in the table as follows.

y(1)=0.9+0.8+0.6+0.7=3.0 y(2)=0.4+0.9+0.2+0.3=1.8 y(3)=0.3+0.4+0.3+0.1=1.1 ベクトル標準パタン辞書P(m)(i,j)は、経
験的な知識により記述することも可能であり、ま
た多数のベクトル系列標準パタンを用いて統計的
な方法により得ることも可能である。例えば、前
者の例として、単語音声認識の場合にはベクトル
標準パタンを音韻標準パタンに対応させれば、
P(m)(i,j)は“ある音韻がある単語のある位
置にある確からしさ”を表わすので音声学的な知
識を利用して記述することができる。
y (1) =0.9+0.8+0.6+0.7=3.0 y (2) =0.4+0.9+0.2+0.3=1.8 y (3) =0.3+0.4+0.3+0.1=1.1 Vector standard pattern dictionary P (m) (i, j) can be described by empirical knowledge, or can be obtained by a statistical method using a large number of vector sequence standard patterns. For example, as an example of the former, in the case of word speech recognition, if the vector standard pattern corresponds to the phonological standard pattern,
Since P (m) (i, j) represents "the probability that a certain phoneme is in a certain position of a certain word", it can be described using phonetic knowledge.

本発明による装置は、ベクトル標準パタンを格
納する手段と、上記ベクトル標準パタンを参照し
てベクトルの系列から成る入力パタンをn個の記
号系列に変換する手段と、カテゴリをn個の記号
系列表現したときに記号jがあるカテゴリmの記
号系列上での位置iにある確からしさ(すなわち
カテゴリmのi番目の記号である確からしさ)を
すべての記号j,カテゴリm,位置iの組合せに
対して与えた情報をベクトル標準パタン辞書とし
て格納する手段と、上記ベクトル標準パタン辞書
を参照して上記記号系列から各カテゴリに対する
類似度を得る手段と、上記類似度を最大とするカ
テゴリを認識結果として出力する手段とを含んで
構成される。
The apparatus according to the present invention includes means for storing a vector standard pattern, means for converting an input pattern consisting of a sequence of vectors into a sequence of n symbols by referring to the standard vector pattern, and representing a category as a sequence of n symbols. Then, the probability that symbol j is at position i on the symbol series of category m (that is, the probability that symbol j is the i-th symbol of category m) is calculated for all combinations of symbol j, category m, and position i. means for storing the information given as a vector standard pattern dictionary; means for obtaining the degree of similarity for each category from the symbol series by referring to the vector standard pattern dictionary; and means for determining the category with the maximum degree of similarity as a recognition result. and output means.

このような構成によれば認識処理の実行は式
(4),(5)のかわりに式(6)により行われ、したがつて
処理量の少ないパタン認識装置が実現される。
According to this configuration, recognition processing is executed using the formula
Equation (6) is used instead of (4) and (5), thus realizing a pattern recognition device with a small amount of processing.

以下に実施例の図面を参照して本発明の原理を
説明する。
The principle of the present invention will be explained below with reference to drawings of embodiments.

第2図は本発明による装置の一例を示すブロツ
ク図である。
FIG. 2 is a block diagram showing an example of an apparatus according to the present invention.

入力パタン信号Sは処理部2へ入力される。ベ
クトル標準パタンデータは記憶部1に格納されて
おり、処理部2では入力されたベクトルの系列S
=|S1,……,So|を記憶部1に格納されたベク
トル標準パタンR1,R2……を参照して記号系列
〔L(1),……,L(n)〕に変換し、信号として
出力する。
The input pattern signal S is input to the processing section 2. The vector standard pattern data is stored in the storage unit 1, and the processing unit 2 stores the input vector sequence S.
= |S 1 , ..., S o | into the symbol sequence [L(1), ..., L(n)] with reference to the vector standard patterns R 1 , R 2 ... stored in the storage unit 1 Convert and output as a signal.

なお、ここで入力の各ベクトルを記号に変換す
るには入力の各ベクトルについて、すべてのベク
トル標準パタンとの類似度を求め類似度の最大と
なるベクトル標準パタンに対応する記号を割り当
てればよい。記憶部3にはベクトル標準パタン辞
書が格納されている。処理部4では、処理部2か
ら送られてきた記号系列の信号を、記憶部3に格
納されたベクトル標準パタン辞書を用いて各カテ
ゴリに対する類似度y(1),……,y(M)に変換し出力
する。ここで類似度は(6)式を実行することにより
得られる。処理部5はこれらの類似度の値を比較
し、最大となるmを認識結果のカテゴリ番号とし
て出力する。
Note that in order to convert each input vector into a symbol, for each input vector, find the degree of similarity with all vector standard patterns and assign the symbol corresponding to the vector standard pattern with the maximum degree of similarity. . The storage unit 3 stores a vector standard pattern dictionary. The processing unit 4 uses the vector standard pattern dictionary stored in the storage unit 3 to calculate the similarity of the symbol sequence signal sent from the processing unit 2 to each category y (1) , ..., y (M) Convert and output. Here, the similarity is obtained by executing equation (6). The processing unit 5 compares these similarity values and outputs the maximum m as the category number of the recognition result.

以上、本発明の説明をしたが、ベクトル標準パ
タン辞書で用いられる確からしさの尺度は任意の
ものでよく、式(6)のようにカテゴリに対する類似
度を確からしさの和として表すかわりに積あるい
は最大値、最小値等により表わしてもよい。
Although the present invention has been explained above, the measure of certainty used in the vector standard pattern dictionary may be any arbitrary measure, and instead of expressing the degree of similarity for a category as a sum of likelihoods as in equation (6), it can be expressed as a product or It may be expressed by maximum value, minimum value, etc.

また、説明で用いられる”カテゴリ”という概
念は排他的なものでなくてよい。したがつて例え
ば単語音声認識においてある単語を複数のカテゴ
リに対応させる場合のようにも本発明の原理は成
り立つ。
Furthermore, the concept of "category" used in the explanation does not have to be exclusive. Therefore, the principle of the present invention also holds true, for example, when a word is made to correspond to a plurality of categories in word speech recognition.

説明では入力パタンのベクトル系列のベクトル
の個数、変換された記号系列の記号の個数ともn
としたが、記号系列に変換されたときに一定個数
の記号が得られていればよいのでベクトルの個数
は任意でよい。
In the explanation, both the number of vectors in the vector sequence of the input pattern and the number of symbols in the converted symbol sequence are n.
However, the number of vectors may be arbitrary as long as a certain number of symbols are obtained when converted to a symbol sequence.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はベクトル標準パタン辞書の内容の一例
を示す図、第2図は本発明の一実施例を示すブロ
ツク図である。 図において、1はベクトル標準パタンを格納す
る記憶部、2はベクトル系列を記号系列に変換す
る処理部、3はベクトル標準パタン辞書を格納す
る記憶部、4は各カテゴリに対する類似度を得る
処理部、5は類似度を比較し認識結果を得る処理
部である。
FIG. 1 is a diagram showing an example of the contents of a vector standard pattern dictionary, and FIG. 2 is a block diagram showing an embodiment of the present invention. In the figure, 1 is a storage unit that stores vector standard patterns, 2 is a processing unit that converts a vector sequence into a symbol sequence, 3 is a storage unit that stores a vector standard pattern dictionary, and 4 is a processing unit that obtains the similarity for each category. , 5 is a processing unit that compares the degree of similarity and obtains a recognition result.

Claims (1)

【特許請求の範囲】[Claims] 1 ベクトル標準パタンを格納する手段と、上記
ベクトル標準パタンを参照してベクトルの系列か
ら成る入力パタンをn個の記号(ベクトル標準パ
タンに対応する記号)から成る入力記号系列に変
換する手段と、カテゴリをn個の記号から成る記
号系列で表現したときにあるベクトル標準パタン
に対応する記号jがあるカテゴリmの記号系列上
での位置iにある確からしさをすべての記号j,
カテゴリm,位置iの組合せに対して与えた情報
をベクトル標準パタン辞書として格納する手段
と、上記ベクトル標準パタン辞書を参照して上記
入力記号系列から各カテゴリに対する類似度を得
る手段と、上記類似度を最大とするカテゴリを認
識結果として出力する手段とを含んで構成される
ことを特徴とするパタン認識装置。
1. means for storing a vector standard pattern; means for converting an input pattern consisting of a sequence of vectors into an input symbol sequence consisting of n symbols (symbols corresponding to the vector standard pattern) by referring to the vector standard pattern; When a category is expressed as a symbol series consisting of n symbols, the probability that symbol j corresponding to a certain vector standard pattern is at position i on the symbol series of category m is expressed as all symbols j,
means for storing information given for the combination of category m and position i as a vector standard pattern dictionary; means for obtaining the degree of similarity for each category from the input symbol sequence by referring to the vector standard pattern dictionary; 1. A pattern recognition device comprising: means for outputting a category having a maximum degree as a recognition result.
JP56210201A 1981-12-29 1981-12-29 Pattern recognition equipment Granted JPS58115491A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56210201A JPS58115491A (en) 1981-12-29 1981-12-29 Pattern recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56210201A JPS58115491A (en) 1981-12-29 1981-12-29 Pattern recognition equipment

Publications (2)

Publication Number Publication Date
JPS58115491A JPS58115491A (en) 1983-07-09
JPH0414359B2 true JPH0414359B2 (en) 1992-03-12

Family

ID=16585456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56210201A Granted JPS58115491A (en) 1981-12-29 1981-12-29 Pattern recognition equipment

Country Status (1)

Country Link
JP (1) JPS58115491A (en)

Also Published As

Publication number Publication date
JPS58115491A (en) 1983-07-09

Similar Documents

Publication Publication Date Title
US4829580A (en) Text analysis system with letter sequence recognition and speech stress assignment arrangement
US4400828A (en) Word recognizer
EP0387602B1 (en) Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
EP0769184B1 (en) Speech recognition methods and apparatus on the basis of the modelling of new words
JP2815579B2 (en) Word candidate reduction device in speech recognition
US7406417B1 (en) Method for conditioning a database for automatic speech processing
JP3459712B2 (en) Speech recognition method and device and computer control device
JPS6466698A (en) Voice recognition equipment
US7054814B2 (en) Method and apparatus of selecting segments for speech synthesis by way of speech segment recognition
CN110211562B (en) Voice synthesis method, electronic equipment and readable storage medium
JPH0713594A (en) A method for assessing speech quality in speech synthesis.
EP0562138A1 (en) Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
US7844459B2 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
US20050197838A1 (en) Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously
JPS6332397B2 (en)
US4790017A (en) Speech processing feature generation arrangement
JPH0414359B2 (en)
JPH09179578A (en) Syllable recognition device
JPH08221091A (en) Voice recognition device
JP3240691B2 (en) Voice recognition method
JPH1097270A (en) Voice recognition device
JP2961797B2 (en) Voice recognition device
JP2817406B2 (en) Continuous speech recognition method
JP2702919B2 (en) Sentence-speech converter