JPS6331793B2 - - Google Patents
Info
- Publication number
- JPS6331793B2 JPS6331793B2 JP57218973A JP21897382A JPS6331793B2 JP S6331793 B2 JPS6331793 B2 JP S6331793B2 JP 57218973 A JP57218973 A JP 57218973A JP 21897382 A JP21897382 A JP 21897382A JP S6331793 B2 JPS6331793 B2 JP S6331793B2
- Authority
- JP
- Japan
- Prior art keywords
- standard
- standard pattern
- pattern
- memory
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
<技術分野>
本発明は予め登録された標準パターンと、入力
される音声パターンとのマツチング結果に基いて
音声認識を行う方式の音声認識方式に関する。DETAILED DESCRIPTION OF THE INVENTION <Technical Field> The present invention relates to a speech recognition method that performs speech recognition based on a matching result between a standard pattern registered in advance and an input speech pattern.
<従来技術>
音声認識、特に特定話者用音声認識方式では、
登録の際、数回の発声で一つの語に対し、1個な
いし複数個の標準パターンを持たせている。即ち
第1図に示す様に一つの語に対し、M個の標準パ
ターンが記憶部1に記憶されており、N個の各語
に対し全てM個の標準パターンを持たせている。<Prior art> Speech recognition, especially speaker-specific speech recognition methods,
During registration, one word is uttered several times to have one or more standard patterns. That is, as shown in FIG. 1, M standard patterns are stored in the storage unit 1 for one word, and each of N words has M standard patterns.
第1図の様に語数が増すにつれて、メモリ1の
標準パターン群には、他のグループの標準パター
ンと類似したものが存在してくる。そのため、入
力された音声を認識する場合、類似した標準パタ
ーンにてマツチングを行つた時に、この標準パタ
ーンに対する語であると認識されるといつた、誤
認識が多発することになる。従来では、この様な
誤認識を防止するための手段がなかつた。 As the number of words increases as shown in FIG. 1, the standard pattern group in memory 1 includes standard patterns similar to standard patterns in other groups. Therefore, when recognizing input speech, when matching is performed using a similar standard pattern, erroneous recognition often occurs, such as when the word is recognized as a word corresponding to this standard pattern. Conventionally, there was no means to prevent such misrecognition.
<発明の目的>
本発明は従来の欠点である誤認識を防止し、認
識率の低下を抑えることを目的としている。<Objective of the Invention> An object of the present invention is to prevent erroneous recognition, which is a drawback of the conventional method, and to suppress a decrease in the recognition rate.
<実施例>
本発明は第1図に示す如くメモリ1に語数N個
に対し、夫々M個の標準パターンを記憶させてい
る。この第1図において、P,i,jは、i番目
の語のグループのJ番目の標準パターンであるこ
とを意味している。この第1図の標準パターンの
メモリ1に対して、第2図に示す如くフラグメモ
リ2が用意される。このフラグメモリ2は、標準
パターンのメモリP,i,jに、メモリF,i,
jが対応するもので、後に説明するが、上記メモ
リP,i,jに記憶されている標準パターンが音
声認識する上で不適合であれば“1”を、適当で
あれば“0”を立てる。本発明は、第1図及び第
2図に示すメモリ1,2を用意することで、話者
の音声認識を誤認識することなく確実に認識でき
るようにしたものである。<Embodiment> In the present invention, as shown in FIG. 1, a memory 1 stores M standard patterns for N words. In FIG. 1, P, i, j means the J-th standard pattern of the i-th word group. In contrast to the standard pattern memory 1 shown in FIG. 1, a flag memory 2 is prepared as shown in FIG. This flag memory 2 includes standard pattern memories P, i, j, memories F, i,
j is the corresponding one, and as will be explained later, if the standard pattern stored in the memory P, i, j is not suitable for speech recognition, set "1", and if appropriate, set "0". . In the present invention, by preparing the memories 1 and 2 shown in FIGS. 1 and 2, it is possible to reliably recognize the speaker's voice without erroneously recognizing it.
第3図は本発明の音声認識方式の流れを示すフ
ローチヤートである。この図を参照に本発明を説
明する。 FIG. 3 is a flowchart showing the flow of the speech recognition method of the present invention. The present invention will be explained with reference to this figure.
最初にS1において話者は、1つの語に対しM
個の標準パターンを登録するための音声入力を行
う。標準パターンを作成し、これを登録する場
合、周知の技術を利用すればよく、例えば入力さ
れた音声を多数のバンドパス・フイルタに通して
分割し、音声の特徴データを抽出し、この情報を
標準パターンとしてメモリ1の決められた位置例
えばP,i,jに登録(記録)する。この様に話
者によるN語に対する夫々M個の標準パターンの
登録が終了すれば次のS2に移る。このS1にお
いては従来技術をそのまま利用している。 First, in S1, the speaker selects M for one word.
Perform voice input to register standard patterns. When creating and registering standard patterns, well-known techniques can be used, such as dividing input audio through a number of bandpass filters, extracting audio characteristic data, and using this information. It is registered (recorded) as a standard pattern at a predetermined position in the memory 1, for example, P, i, and j. In this way, when the registration of M standard patterns for N words by the speaker is completed, the process moves to the next step S2. In this S1, the conventional technology is used as is.
次にS2においては、登録されたメモリ1の標
準パターン間のマツチングを行う。これは、標準
パターンのメモリ1より任意のパターンを抜き出
し、これを話者の音声入力として、通常と同様に
音声認識を実行させる。このマツチングの結果、
抜き出した標準パターンが、同一グループ内に属
するものであれば、この標準パターンに対応した
フラグメモリ2に“0”を立てる。今少し説明す
れば、第1図のメモリ1より第1番目のグループ
最初の語の標準パターンP,1,1を読み出し、
このパターンP,1,1を話者の音声入力として
他の全ての標準パターンとのマツチングを行う。 Next, in S2, matching between the registered standard patterns of the memory 1 is performed. This extracts an arbitrary pattern from the standard pattern memory 1, uses it as the speaker's voice input, and executes voice recognition in the same way as usual. As a result of this matching,
If the extracted standard pattern belongs to the same group, "0" is set in the flag memory 2 corresponding to this standard pattern. To explain a little, the standard pattern P, 1, 1 of the first word of the first group is read out from memory 1 in FIG.
This pattern P, 1, 1 is used as the speaker's voice input and is matched with all other standard patterns.
この場合、標準パターンP,1,1とのマツチ
ングは除く。このマツチングの結果、標準パター
ンP,1,1が第1番目のグループでなく、他の
グループとの一致が見られるようであれば、この
標準パターンP,1,1は認識の際の標準パター
ンとしては、不適当であると見なし、P,1,1
に対応したフラグメモリ2のF,1,1を“1”
にする。つまり、一致が見られたグループの語が
音声入力されれば、通常このグループの語である
と認識されるはずであるが、P,1,1の標準パ
ターンとのマツチングが最大であるとして、第1
番目のグループの語であると誤認識されることに
なる。この様に誤認識を防止するために、抜き出
した標準パターンP,1,1が、マツチングによ
り同一グループ(第1番目の語)内になければ、
フラグメモリF,1,1を“1”とする。逆に同
一グループ内にあればF,1,1を“0”とす
る。 In this case, matching with the standard pattern P, 1, 1 is excluded. As a result of this matching, if the standard pattern P,1,1 is not the first group but matches with other groups, this standard pattern P,1,1 is the standard pattern for recognition. is considered inappropriate, and P,1,1
F,1,1 of flag memory 2 corresponding to “1”
Make it. In other words, if a word from a matched group is input by voice, it should normally be recognized as a word from this group, but assuming that the matching with the standard pattern of P, 1, 1 is maximum, 1st
It will be mistakenly recognized as a word in the second group. In order to prevent misrecognition in this way, if the extracted standard patterns P, 1, 1 are not in the same group (first word) by matching,
Set flag memory F,1,1 to "1". Conversely, if they are in the same group, F,1,1 is set to "0".
以上の処理をP,1,2、P,1,3、P,
1,4…、PN,Mについて順に行う。 The above processing is performed as P,1,2,P,1,3,P,
1, 4..., PN, M in order.
即ち、標準パターンの任意のP,i,
ji=1…N;j=1,2…Mを抜き出し、P,i,j以外の
すべての標準パターンとのマツチングを行う。そ
の結果、第i番目の語のグループでなければ、フ
ラグメモリF,i,jを“1”に、第i番目の語
のグループであればF,i,jを“0”にする。
この様に、P,1,1からP,N,Mまでの全標
準パターン間のマツチング処理が終了すれば、第
4図の様に不適当な標準パターンに対応したフラ
グメモリの位置が“1”となる。第4図に示す如
く、F,2,1、F,2,jが“1”となつてい
るので、これに対応した標準パターンメモリ1の
P,2,1、P,2,jが標準パターンとして不
適当であることがわかる。 That is, any P,i, of the standard pattern
j i=1 ... N ; j=1,2 ... M is extracted and matched with all standard patterns other than P, i, and j. As a result, if it is not the i-th word group, the flag memory F, i, j is set to "1", and if it is the i-th word group, F, i, j is set to "0".
In this way, when the matching process between all the standard patterns from P, 1, 1 to P, N, M is completed, the position of the flag memory corresponding to the inappropriate standard pattern is "1" as shown in Figure 4. ” becomes. As shown in Fig. 4, since F,2,1, F,2,j is "1", the corresponding P,2,1, P,2,j of standard pattern memory 1 is standard. It can be seen that this is inappropriate as a pattern.
上述の様にして標準パターン間のマツチングが
終了すればS3に移り、フラグメモリ2を順次見
て、フラグが“1”となつている場合は、標準パ
ターン群の中に不適当なものが存在していること
を話者に知らせる。フラグF,i,jに“1”が
存在すれば、話者はその箇所における標準パター
ンの再登録を行うか否かを決める。ここで、再登
録を行う場合、S5の再登録処理に移る。この再
登録は、フラグメモリの“1”になつている箇所
のみ再登録するよう話者に指示する。つまりフラ
グメモリ2の“1”の部分に対応する語を話者が
音声入力し、初期登録と同様に特徴を抽出した情
報を、調整パターンとして登録する。この様に、
フラグメモリ2の“1”になつている箇所に対応
する標準パターンメモリ11の部分の再登録が全
て終了すれば、S2に移り標準パターン間のマツ
チング処理を繰り返えす。この様にして、標準パ
ターンメモリ内の不適当な標準パターンをなく
し、フラグメモリ2のF,i,j全てが“0”と
なれば、S6の通常の音声認識処理に移る。即
ち、F,i,j全てが“0”になれば不適当な標
準パターンがなくなり、この標準パターンメモリ
1を用いて認識処理を行うことで、認識率の低下
を抑えることができる。 When the matching between the standard patterns is completed as described above, the process moves to S3, and the flag memory 2 is sequentially checked. If the flag is "1", it is determined that there is an inappropriate pattern among the standard patterns. Let the speaker know what you are doing. If "1" exists in the flags F, i, and j, the speaker decides whether or not to re-register the standard pattern at that location. If re-registration is to be performed here, the process moves to re-registration processing in S5. This re-registration instructs the speaker to re-register only the portion of the flag memory that is set to "1". That is, the speaker inputs the word corresponding to the "1" part of the flag memory 2 by voice, and the information from which the features are extracted is registered as an adjustment pattern in the same manner as the initial registration. Like this,
When the re-registration of all the portions of the standard pattern memory 11 corresponding to the portions of the flag memory 2 that are set to "1" is completed, the process moves to S2 and the matching process between the standard patterns is repeated. In this way, when the inappropriate standard pattern in the standard pattern memory is eliminated and all of F, i, and j in the flag memory 2 become "0", the process moves to the normal speech recognition process in S6. That is, when F, i, and j all become "0", there are no inappropriate standard patterns, and by performing recognition processing using this standard pattern memory 1, it is possible to suppress a decrease in the recognition rate.
尚、S4において話者が再登録を指示しなけれ
ば、S6の音声認識処理に移る。しかし、音声認
識において、フラグメモリ2の“1”になつてい
る、対応のメモリ1の標準パターンを認識処理に
は利用しない。つまり、フラグメモリの“0”に
対応するメモリ1の標準パターンと、入力された
音声とのマツチング処理を行うことで音声認識を
行うため、誤認識を防止し、認識率の向上が望め
る。 Note that if the speaker does not instruct re-registration in S4, the process moves to speech recognition processing in S6. However, in speech recognition, the standard pattern in the corresponding memory 1, which is set to "1" in the flag memory 2, is not used for recognition processing. In other words, voice recognition is performed by performing a matching process between the standard pattern in the memory 1 corresponding to "0" in the flag memory and the input voice, thereby preventing erroneous recognition and improving the recognition rate.
<発明の効果>
本発明の音声認識方式によれば、既に登録ずみ
の標準パターン群の中から任意のパターンを抜き
出し、この抜き出したパターンと他の標準パター
ンとのマツチングをとり、このマツチング結果に
より上記パターンが不適当か否か判定し、この判
定結果として不適当な標準パターンであることを
記憶しておくことで、音声認識の際に上記不適当
として記憶された標準パターンを除外して、それ
以外の最適な標準パターンに基づいて音声認識を
行うため、認識率を大幅に向上できることにな
る。<Effects of the Invention> According to the speech recognition method of the present invention, an arbitrary pattern is extracted from a group of standard patterns that have already been registered, the extracted pattern is matched with other standard patterns, and based on this matching result, By determining whether the pattern is inappropriate or not, and storing the fact that it is an inappropriate standard pattern as a result of this determination, the standard pattern stored as inappropriate can be excluded during speech recognition. Since speech recognition is performed based on other optimal standard patterns, the recognition rate can be significantly improved.
第1図は本発明にかかる標準パターンメモリの
記憶状態を示す図、第2図は第1図の標準パター
ンのメモリに対応して設けられたフラグメモリを
示す図、第3図は本発明の認識方式による手順を
示すフローチヤート、第4図は本発明による標準
パターン間のマツチング結果によるフラグメモリ
を示す図である。
1:標準パターンメモリ、2:フラグメモリ。
FIG. 1 is a diagram showing the storage state of the standard pattern memory according to the present invention, FIG. 2 is a diagram showing a flag memory provided corresponding to the standard pattern memory of FIG. 1, and FIG. 3 is a diagram showing the storage state of the standard pattern memory according to the present invention. FIG. 4 is a flowchart showing the procedure according to the recognition method, and is a diagram showing a flag memory based on the matching result between standard patterns according to the present invention. 1: Standard pattern memory, 2: Flag memory.
Claims (1)
し、その特徴を抽出したデータと、予め登録され
た標準パターンとのマツチングをとることで上記
入力された音声の認識を行う音声認識方法におい
て、 N個の語に対して各語毎にM個の標準パターン
を登録するステツプ、 上記登録された標準パターン群の中から任意の
パターンを選び出すステツプ、 該選び出した標準パターンを1つを音声入力デ
ータとして、該標準パターンを除いた他の全ての
標準パターンとの間でマツチングをとるステツ
プ、 該マツチングの結果、上記選び出した標準パタ
ーンが、該標準パターンと同一語のグループと一
致しないのであれば、該選び出した標準パターン
を使用不能な状態として記憶させるステツプ、 上記記憶された標準パターンを除外した他の標
準パターンと入力された音声とマツチングを行い
音声認識するステツプ、 とからなる音声認識方法。[Claims] 1. Recognize the input voice by analyzing the input voice for voice recognition and matching the extracted data with a pre-registered standard pattern. In the speech recognition method, a step of registering M standard patterns for each word for N words, a step of selecting an arbitrary pattern from the group of registered standard patterns, and a step of selecting the selected standard pattern as one. a step of matching one standard pattern with all other standard patterns except for the standard pattern, using one as voice input data, and as a result of the matching, the standard pattern selected above matches a group of words that are the same as the standard pattern; If not, the selected standard pattern is stored in an unusable state, and the input voice is matched with other standard patterns excluding the stored standard pattern to perform voice recognition. Speech recognition method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57218973A JPS59107400A (en) | 1982-12-13 | 1982-12-13 | Voice recognition system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57218973A JPS59107400A (en) | 1982-12-13 | 1982-12-13 | Voice recognition system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59107400A JPS59107400A (en) | 1984-06-21 |
| JPS6331793B2 true JPS6331793B2 (en) | 1988-06-27 |
Family
ID=16728257
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57218973A Granted JPS59107400A (en) | 1982-12-13 | 1982-12-13 | Voice recognition system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59107400A (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5233989B2 (en) * | 2007-03-14 | 2013-07-10 | 日本電気株式会社 | Speech recognition system, speech recognition method, and speech recognition processing program |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5651800A (en) * | 1979-10-04 | 1981-05-09 | Sanyo Electric Co | Sound identifier |
| JPS56123600A (en) * | 1980-03-05 | 1981-09-28 | Hitachi Ltd | Voice input device |
-
1982
- 1982-12-13 JP JP57218973A patent/JPS59107400A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS59107400A (en) | 1984-06-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3388845B2 (en) | Method and apparatus for preventing the input of confusingly similar words | |
| JPH04318900A (en) | Multidirectional simultaneous sound collection type voice recognizing method | |
| JPS6331793B2 (en) | ||
| JP2838848B2 (en) | Standard pattern registration method | |
| JPS5934597A (en) | Voice recognition processor | |
| JPS6059395A (en) | Voice standard feature pattern generation processing system | |
| JPS599080B2 (en) | Voice recognition method | |
| JPS58125099A (en) | Voice recognition equipment | |
| JPS62206596A (en) | Voice recognition system | |
| JPS5934595A (en) | Voice recognition processing system | |
| JPS6315295A (en) | voice recognition device | |
| JPS63213897A (en) | Dictionary update method in speaker recognition device | |
| JPH01154098A (en) | voice recognition device | |
| JPS6353599A (en) | Voice recognition equipment | |
| JPS58159599A (en) | Monosyllabic voice recognition system | |
| JPS59214900A (en) | voice recognition device | |
| JPS6061799A (en) | Voice registration pattern deletion processing system | |
| JPS61278896A (en) | Speaker collator | |
| JPS6346496A (en) | voice recognition device | |
| JPS62111292A (en) | voice recognition device | |
| JPS616694A (en) | Voice registration system | |
| JPS6060696A (en) | Additional correction processing system for voice registration pattern | |
| JPS5915990A (en) | Voice recognition method | |
| JPS6147994A (en) | Voice recognition system | |
| JPS6239749B2 (en) |