JPS60182494A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60182494A
JPS60182494A JP59039230A JP3923084A JPS60182494A JP S60182494 A JPS60182494 A JP S60182494A JP 59039230 A JP59039230 A JP 59039230A JP 3923084 A JP3923084 A JP 3923084A JP S60182494 A JPS60182494 A JP S60182494A
Authority
JP
Japan
Prior art keywords
pattern
standard
standard pattern
input
weighted addition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59039230A
Other languages
English (en)
Inventor
文雄 前原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59039230A priority Critical patent/JPS60182494A/ja
Publication of JPS60182494A publication Critical patent/JPS60182494A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に関するものである。
従来例の構成とその問題点 従来、音声認識装置では入力音声信号を分析することに
よって得られるn次元の特徴ベクトル系列(al、τ2
.・・・、ミニ)に対し、辞1としてあらかじめ装置内
に登録しであるP個の標準パターンベ→P →P クトル淫タリ())+b+・・・ ?”Jl ・・・・
・・ (bl 、b2. ・・・ 。
 2 EP lの中から、これと距離の最も近いもの、もしく
け最も類似性の大きいものをもって認識結果としている
が、このとき入力ベクトル系列(al。
i 、・・・、τ工)と標準パターンベクトル系列のう
ち一氾 →a −2 1つ1例えばベクトル系列(bl、b2.・・・、bM
l(但しQ=1〜P)の比較に際してベクトル系列−;
 、−; ・・・−a I +の一要素ベクトルa と
べ1 2′ →Q →Q →C クトル系列(bl、b2.・・・、bMlの中の一要素
べ→2 クトルbMの市街距離、もしくはコーークリツド距離を
計算し、これをもとに2つのベクトル系列の総距離を、
ダイナミックプログラミングや線形伸縮などの方法を用
いて計算するものが大部分であるO 5 a 但し、市街距離C、ユークリッド距離dfl 、mQ、
m は次式で与えられる。
とするとき ド距離)(2) ところで、辞書として、あらかじめ装置内に登録しであ
る標準パターンベクトル列としては、使用者が認識装置
の使用に先立って、該当パターンを発声しておき、これ
を用いるものが一般である。
ところが、人間の声は、あらかじめ標準パターンを登録
した時点から、時間が経過するに従ってパターンに微妙
な変化が生じ、これが音声認識装置の認識率低下の一因
となっていた。
この原因の対策としては、認識のつど、その発・・・M
工)を、それに該当する標準パターンペクト→2−+2
 →2 →a ミル列(b、b、・・・、b、、・・・bk)1 2 
1 とするとき、 二ρ →a b、=A−b、+(i−A)a 但しAはO〈八く1なる整数 i == 1〜工(但しI−にと仮定)なる式によって
標準パターンに対して入カバターンを重み付き加算する
ことにより、標準ノくターンを、ごく最近発声されたパ
ターンに漸次近づけることができ、認識率の低下が軽減
できる。この手法を「学習−1と呼ぶ。
ところで認識率向上の別の方法として、標準ノ(ターン
を登録するに際して、同一単語を2回もしくはそれ以上
発声し、同一カテゴリーに属する標準パターンを2組も
しくはそれ以上持つやり方が有効である。
ところで上記の重み付き加算による学習を、同一カテゴ
リーに属する複数組の標準パターンに対して行った時、
袂数回の学習により標準パターンがだんだん似かよって
きて、最後にすべてのパターンが一致してし甘うという
現象が生じる。
この結果標準パターンを複数組持つことによる認識率の
改善効果が失われるという欠点を有する。
発明の目的 本発明は上記欠点に鑑み、複数組の標準パターンを持つ
ことによる効果を損わない学習を行なうことのできる音
声認識装置を提供するものである。
発明の構成 本発明は、この目的を達成するために、学習動作が起る
毎に入カバターンと、該当カテゴリーの標準パターンの
各々との間の距離を計算し、距離の最も近いもの、もし
くは距離が一定値以下のものに対して重み付き加算を行
うように構成したものである。
実確例の説明 以下、本発明の一実柿例について図面とともに説明する
。図は本発明の一実椀例における音声認識装置のブロッ
ク図である。
同図において、1は入力音声をn次元のパラメータベク
トル系列(11,τ2.・・・、i工、・・・+’工1
に遂次変換するパラメータ分析部で、フィルタバンク、
フーリエ変換器などにより構成される。2はスイッチで
、標準パターン作成時にはB又はC側に、パターン比較
時にはA 9111 K切りかわる。
5はパターン記憶部■で、第1回目の発声に対して、パ
ラメータ分析部のn次元パラメータベクトルの列を標準
パターン系列(b 、b 。
1.1 2.1 −→P −P → P ・・・、b )、・・・(b 、b 、・・・? bK
 、 1 )J、1 1,1 2.1 として記憶する。6はパターン記憶部…で、同様に、第
2回目の発声に対して標準パターン系列記パラメータベ
クトル系列、−;1.−;2.・・・、;1)とパター
ン記憶部5.並に同6に記憶されている標準パターンと
の距離を計算する距離計算部である。
11は距離計算部10により得られたP個の距離のうち
最小なる標準パターンを認識結果として出力信号m12
に出力する判定部である。3,4゜7.8は各々連動し
たスイッチで認識動作の時はD側に、標準パターンの学
習に際してはl個に到れる。13.15は同じく連動の
切換スイッチであり、入カバターンに対し、パターン記
憶部工に登録されている標準パターンエに対し学習させ
る時はD側に、パターン記憶部Hに登録されている標準
パターン■に対して学習させる時はE側に倒れる。14
は重み付き加算部であって、学習に際して入カバターン
ベクトル列(71,72,・・?rlとパターン記憶部
工もしくは1r(5もしくは6)の標準パターンの間で
重み付き加算を行なう。16はキーボードてあシ、学習
を行わせる場合は操作者がキーボードから、その旨のキ
ーを入力し、このキー人力に応じてスイッチ31497
18がD側に倒れる。17はバッファメモリであり標準
パターンの学習に供する目的で入カバターンを一時蓄え
る。
次に上記のように構成された装置の動作について、標準
パターン作成時、パターン比較時、標準パターン学習時
とに分けて各々説明する。
先づ標準パターン作成時にはスイッチ2をD側にスイッ
チ3,4,7.8をH側に接続し7、第1回目の登録パ
ターンの発声を行う。入力された音声信号をパラメータ
分析部11/i:よりn次元パラメータベクトル系列(
71j、、・・・、Tax)に遂次変換した後、5なる
パターン記憶部工に記憶させる。
この動作をP回縁υ返すことにより、パターン記憶部I
6内に標準パターンベクトル系列の第1グ次にスイッチ
2をD側とし、第2回目の発声を行ない、同様にしてパ
ターン記憶部■6に対して2組目の標準パターンベクト
ル列の第2グループ次にパターン比較の場合について説
明する。パターン比較に際しては、スイッチ2をA側に
接続し、パラメータ分析部1は、入力音声に対応する入
力パラメータベクトル列(71,72,・・・、Ml)
を距離計算部10へ送出する。距離計算部10ではパラ
メータ分析部1.パターン記憶部10から送出された各
信号に対し、式(1) I (2)で示される市街距離
、ユークリッド距離等を用いて距離計算を行なう。この
動作を標準パターンベクトルの第1グループa=1〜P
なるρと第2グループの同じくQ−1〜P’に対して行
い、各々の距離を判定部11に出力する。
判定部11は、これらP個の距離のうち最小のものを判
定し、最小距離を与える標準パターンベクトルを判定結
果として出力信号線12に出力する。
なお認識に際して、パラメータ分析部の出力はバッファ
メモリー17に蓄えられる。これは次に説明する標準パ
ターンの学習に供する目的に使用し、認識動作毎に書き
換えられる。
次に標準パターンの学習に関して説明する。
認識動作が終了した後、標準パターンに対して学習動作
を行わせようとする場合、スイッチ3,4゜7.8をl
個とし、キーボード16より常習動作起動指令、並びに
、認識時に発声した音節もしくは単語に対する正解を与
える。この時判定部11からは認識動作の結果に基づき
、該尚音節のうちパターン記憶部Iの標準パターンとの
マツチング結果とパターン記憶部■とのそれとの距離を
距離削算部10における距離計算結果をもとに比較し、
この結果に基づいて、パターン記憶部■の標準パターン
との距離が近ければスイッチ13並びにスイッチ16を
pに、さもなければスイッチ15をEK切り換え、バッ
ファメモリー17に記憶され並び(/Cハターン記憶部
工もしくはHに記憶されている、キーボード16からの
正解に該当する標準パターンベクトル系列[b* + 
b21・・・*”fflを重み付き加算部14[入力し
、次式により重み付き加算を行う。
但しj−Qとし、0くAく1とする。
この結果、新たに学習後の標準パターンベクトル列とし
て(bl、b2.・・・、可)を作る。
これをスイッチ13を介してパターン記憶部工。
もしくはHに入力し該当標準パターンとして新たに記憶
する。
以上のように本実施例によれば、入力特徴ベクトル列(
”1 、盲、 ?・・・、?工)を一時的に記憶するバ
ッファメモリ17と、キーボード16よシ与えられた、
正解となる認識結果に基づき、正Mに該当する標準パタ
ーンのうち、パターン記憶部工に記憶されているものと
入力特徴ベクトルの距離と、パターンHに記憶されてい
るものとのそれを比較する距離比較器16と、これに基
づき切換えスイッチ13並びにスイッチ16と、バッフ
ァメモリ17の内容と、パターン記憶部の該当パターン
の重み付き加算を行う重み付き加算部とを設けることに
より、複数枚の標準パターン辞書に対して学習を行うに
際し、初数回の学習動作において複数枚の辞書間にパタ
ーンの類似が生ずることを避けることができる。
なお、本実施例は、これをコンビヱータに置き換え、プ
ログラム的にこれを行うことも可能である。又本実柿例
では標準パターン記憶部を2つとしたが、これを3以上
に拡張することは容易である。又この特大カバターンと
距離の近い1つもしくは複数の標準パターンを選択して
重みイτJき加算を行う方法が有効である。さらにこの
場合標準パターンと入カバターンの距離が一定値以上の
時、重み付き加算を行わない方法が有効との実験結果が
得られている。
発明の効果 以上のように本発明は、入力標準パターンに対し認識結
果の正解が与えられた時に正解に該当する複数の標準パ
ターンのうち入カバターンと距離の近いパターンに対し
て、入カバターンとの重み付き加算を行うことにより、
学習を重ねる毎に複数枚の辞書パターンが類似してくる
という従来例のもつ欠点を取り除き、音声認識における
認識率の向上を図ることができ、その工業的価値は大な
るものがある。
【図面の簡単な説明】
図は本発明の一実施例における音声認識装置のブロック
図である。 1・・・・・・パラメータ分析1.5,6・・・・・・
パターン記憶部、10・・・・・・距離計算部、11・
・・・・・判定部:14・・・・・重み付き加算部、1
6・・・・・・キーボード、フ7・・・・・・バッファ
メモリ〇

Claims (1)

  1. 【特許請求の範囲】 (1)入力音声信号に対してパラメータ分析を行い、特
    徴ベクトル列を 入カバターンとして 出力するパラメ
    ータ分析手段と、前記パラメータ分析手段により予め分
    析された音声を標準パターンとして記憶するパターン記
    憶手段と、前記パラメータ分析手段の出力と、前記パタ
    ーン記憶手段に記憶している標準パターンの各々との間
    の距離を計算する距離計算手段と、前記距離計算手段に
    よって得られた距離のうち最小を与える標準パターンを
    Wk結果とする判断手段と、前記パラメータ分析手段の
    出力と前記パラメータ記憶手段の記憶している標準パタ
    ーンのうち入カバターンに該、当するものを重み付き加
    算し、これを新たな標準パターンとして前記パターン記
    憶手段に記憶する重み付き加算手段とを有し、前記パタ
    ーン記憶手段に前記標準パターンを記憶するに際し、同
    一カテゴリーに属する前記標準パターンを複数個設け、
    前記入カバターンと少なくとも一部の前記標準パターン
    について重みつき加算を行うことを特徴する音声認識装
    置。 (功 同一カテゴリーに属する標準パターンのうち入カ
    バターンとの距離が近い少なくとも1つの前記標準パタ
    ーンを選択して重みつき加算を行い新だな標準パターン
    として登録することを特徴とする特許請求の範囲第1項
    記載の音声認識装置。 (3)標準パターンと入カバターンの距離が一定以上の
    時重み付き加算を行わないことを特徴とする特許請求の
    範囲第1項記載の音声認識装置。
JP59039230A 1984-02-29 1984-02-29 音声認識装置 Pending JPS60182494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59039230A JPS60182494A (ja) 1984-02-29 1984-02-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59039230A JPS60182494A (ja) 1984-02-29 1984-02-29 音声認識装置

Publications (1)

Publication Number Publication Date
JPS60182494A true JPS60182494A (ja) 1985-09-18

Family

ID=12547321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59039230A Pending JPS60182494A (ja) 1984-02-29 1984-02-29 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60182494A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6140686A (ja) * 1984-08-01 1986-02-26 Nec Corp 標準パタ−ン登録方式
JPS6243698A (ja) * 1985-08-20 1987-02-25 三洋電機株式会社 音声認識装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114601A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice recognition system
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114601A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice recognition system
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6140686A (ja) * 1984-08-01 1986-02-26 Nec Corp 標準パタ−ン登録方式
JPS6243698A (ja) * 1985-08-20 1987-02-25 三洋電機株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
JPS60182494A (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS6132679B2 (ja)
JPS58149099A (ja) パタ−ン認識方式
JPH0336436B2 (ja)
JPS58134371A (ja) 日本語入力装置
JPH01285996A (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JPS60147797A (ja) 音声認識装置
JPS6146995A (ja) 音声認識システム
JPH0469959B2 (ja)
JPS6140686A (ja) 標準パタ−ン登録方式
JPH0449719B2 (ja)
JPS62119599A (ja) 単語音声認識装置
JPS63148299A (ja) 単語音声認識方法および装置
JPS62226196A (ja) 標準パタン逐次学習方式
JPH01161399A (ja) 音声認識装置における話者適応化方法
JPS63218999A (ja) 音声認識装置
JPS61105599A (ja) 連続音声認識装置
JPS63155195A (ja) 音声認識装置
JPS61279896A (ja) 音声認識装置
JPH02148100A (ja) 音声認識装置
JPS6067996A (ja) 音声認識方法
JPS60130797A (ja) 音声認識装置
JPS61165797A (ja) 音声認識装置