JPH0572600B2 - - Google Patents

Info

Publication number
JPH0572600B2
JPH0572600B2 JP59115064A JP11506484A JPH0572600B2 JP H0572600 B2 JPH0572600 B2 JP H0572600B2 JP 59115064 A JP59115064 A JP 59115064A JP 11506484 A JP11506484 A JP 11506484A JP H0572600 B2 JPH0572600 B2 JP H0572600B2
Authority
JP
Japan
Prior art keywords
overflow
parameters
coefficient
feature
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59115064A
Other languages
English (en)
Other versions
JPS60258599A (ja
Inventor
Yumi Betsusho
Akyoshi Yamada
Masahiro Hamada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59115064A priority Critical patent/JPS60258599A/ja
Publication of JPS60258599A publication Critical patent/JPS60258599A/ja
Publication of JPH0572600B2 publication Critical patent/JPH0572600B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、標準音声特徴パラメータと入力音声
特徴パラメータのマツチング処理を行う音声認識
装置に関するものである。
従来例の構成とその問題点 現在の音声認識装置では、多くの装置が固定小
数点演算を行う必要があり、理論上ではオーバー
フローを起こさない演算が、固定小数点演算によ
る演算誤差のためにオーバーフローを起こし、正
しいパラメータ値が算出されない可能性がある。
このため、演算過程でオーバーフローを起こした
時はオーバーフローを起こしたフレームに関し
て、処理方法を考慮する必要がある。
以下、図面を参照しながら、従来の音声認識装
置について説明する。第1図は、従来の音声認識
装置のブロツク図である。第1図において、1は
音声信号入力端子、2は特徴抽出部、3は照合
部、4は認識部、5は認識結果を出力する出力端
子である。
以上のように構成された音声認識装置について
その動作を説明する。
まず、入力された音声信号を特徴抽出部2で線
形予測分析し、特徴パラメータを抽出する。たと
えば、分析次数10次、フレーム周期12msecフレ
ーム長24msecという条件で分析すれば、単位時
間ごとに10個のPARCOR係数と11個の線形予測
係数が算出される。さらに、特徴パラメータとし
てケプストラム係数を抽出する際には、以上によ
り算出された線形予測係数を用いてケプストラム
分析を行い、単位時間ごとに11個のケプストラム
係数を算出する。PARCOR係数k、線形予測係
数a、及びケプストラム係数cの算出式を、それ
ぞれ、(1)式、(2)式、(3)式に示す。
Ko=−Wo/Uu ……(1) 但し Wo=Wo-1oi=1 an-1 i*ro-i+2 Uo=Uo-1+Ko-1*Wo-1 r:自己相関係数 n:次数 an n=an-1 n+Ko*an-1 o-n+2 ……(2) Co=−ao−1/no-1i=1 i*Ci*ao-i ……(3) 現在の装置で、固定小数点演算により以上の演
算を行うと、演算で扱われる個々の係数がオーバ
ーフローしていなくても、 (1)式内の oi=1 an-1 i*ro-i+2 (2)式内の oi=1 i*Ci*ao-i で個々の係数の積を加算する際に加算過程でオー
バーフローする可能性が高い。例えば、有限語長
16ビツト、小数点以下15ビツトの固定小数点演算
を行つた場合は、特に上記 oi=1 an-1 i*ro-i+2 でオーバーフローを起こす確率が高いことが確か
められている。このようにオーバーフローが生じ
た時には、オーバーフローを起こした係数より高
次の係数の演算は行れない。つまりオーバーフロ
ーを起こしたフレームに関しては、オーバーフロ
ーを起こした係数より低次の係数だけ算出され、
高次の係数は零となる。
次に照合部3では、以上で抽出された音声区間
分のケプストラム係数を用いて、標準音声パター
ンと入力音声パターンをマツチングする。たとえ
ば、ケプストラム係数の市街地距離でDPマツチ
ングする際には、市街地距離算出式は(4)式とな
る。
D=*Mj=1 Ni=1 |CR ij−CI ij| ……(4) 但し CR:標準音声のケプストラム係数 CI:入力音声のケプストラム係数 N:分析次数 M:全フレーム数 D:市街地距離 次に認識部4で、以上で求められた市街地距離
値のうち、最短距離を示す標準音声を認識結果と
して出力する。
しかしながら、上記の従来の構成では、オーバ
ーフローを起こしたフレームの係数が零にもかか
わらずマツチングを行うことで、オーバーフロー
を起こしたフレームでは、意味のない値を距離値
として加算していくために、市街地距離が正しく
求められない。このため、オーバーフローを起こ
すフレームを多く含む音声が誤認識する可能性が
高くなるという問題点を有していた。
発明の目的 本発明は、上記の従来の問題点を解消するもの
で、オーバーフローが起こつても、パターン間距
離に及ぼす影響を少なくし、誤認識を防ぐことが
できる音声認識装置を提供するものである。
発明の構成 本発明は、特徴抽出部と、照合部と、認識部
と、特徴抽出部でパラメータがオーバーフローし
た時は、オーバーフローを起こしたパラメータ及
び本パラメータより高次のパラメータを、これら
のパラメータを含むフレームの前後のフレームの
パラメータで補間する特徴パラメータ補間部とを
備え、補間したパラメータを含む音声パターンを
マツチングすることにより、オーバーフローがパ
ターン間距離に及ぼす影響を少なくし、誤認識を
防ぐことができるものである。
実施例の説明 第2図は、本発明の一実施例における音声認識
装置のブロツク図である。第2図において1は音
声信号入力端子、2aは特徴抽出部、3は照合
部、4は認識部、5は認識結果を出力する出力端
子、6は特徴パラメータ補間部である。
以上のように構成された本実施例の音声認識装
置について、以下その動作を説明する。
まず、入力された音声信号を特徴抽出部2aで
分析し、特徴パラメータを抽出する。演算過程で
PARCOR係数がオーバーフローを起こさない時
は、動作は従来例の特徴抽出部2と同じである
が、PARCOR係数がオーバーフローを起こした
時は、オーバーフローを起こした係数を補間する
ために前後のフレームのPARCOR係数を、特徴
パラメータ補間部6に入力する。
次に、特徴パラメータ補間部6では、オーバー
フローを起こしたパラメータを含むフレームの前
後のフレームのPARCOR係数から、オーバーフ
ローしたPARCOR係数及び、これより高次の係
数を次式により算出する。
kj i=kj-1i+kj+1i/2(i=n〜N) ……(5) 但し K:PARCOR係数 j:オーバーフローを起こした係数を含むフレ
ーム n:オーバーフローを起こした係数の次数 N:分析次数 求めたPARCOR係数を再度特徴抽出部2aに
入力し、線形予測係数、及びケプストラム係数を
特徴パラメータとして抽出する。
次に照合部3では、以上の処理で作成された標
準音声パターンと入力音声パターンのマツチング
を行う。動作は従来例の照合部3と同じである。
次に認識部4で、以上で求められた市街地距離
値のうち、最短距離を示す標準音声を認識結果と
して出力する。
以上の本実施例によれば、オーバーフローした
PARCOR係数値を、前後のフレームのPARCOR
係数値で補間で、補間したPARCOR係数により
算出されたケプストラム係数パターンをDPマツ
チングする。このことにより、PARCOR係数の
オーバーフローが市街地距離に及ぼす影響を少な
くでき、誤認識を防ぐことができる。
なお、本実施例は、特徴抽出部2aで算出され
るパラメータのうち、PARCOR係数が最もオー
バーフローを起こす確率が高いという実験結果に
基づき、PARCOR係数に対して補間処理を行つ
たものであるが、線形予測係数またはケプストラ
ム係数に対して補間処理を行つても良い。但し、
線形予測分析により抽出されるパラメータの中で
は、PARCOR係数は声道の物理量と対応してい
るため、補間値が物理量として意味のあるもので
あることと、オーバーフローしたPARCOR係数
の前後のフレームのPARCOR係数値kj-1 i,kj+1 i
オーバーフローしていないことから、補間値kj i
も、(5)式よりオーバーフローはしないことが保証
される。以上より、補間の対象となるパラメータ
はPARCOR係数が最も良いと考える。
尚、本実施例では、パターン間距離として、(4)
式で定義される市街地距離を使用したが、これは
(6)式で定義されるユークリツド距離を用いてもよ
い。
D=Mj=1 Ni=1 (CR ij−CI ij2 ……(6) 但し CR:標準音声のケプストラム係数 CI:入力音声のケプストラム係数 N:分析次数 M:全フレーム数 D:ユークリツド距離 発明の効果 以上のように本発明によれば、オーバーフロー
を起こしたパラメータ及び前記パラメータより高
次のパラメータをこれらのパラメータを含むフレ
ームの前後のフレームのパラメータで補間するの
で、オーバーフローがパターン間距離に及ぼす影
響を少なくでき、誤認識を防ぐことができその効
果は大なるものがある。
【図面の簡単な説明】
第1図は従来の音声認識装置のブロツク図、第
2図は本発明の一実施例における音声認識装置の
ブロツク図である。 1……音声信号入力端子、2a……特徴抽出
部、3……照合部、4……認識部、5……出力端
子、6……特徴パラメータ補間部。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号の特徴パラメータを線形予測分
    析法により固定小数点演算で算出する際に、演算
    過程でオーバーフローを起こしたパラメータ及び
    本パラメータより高次のパラメータをこれらのパ
    ラメータを含むフレームの前後のフレームのパラ
    メータで補間する特徴パラメータ補間部を具備す
    ることにより音声認識を行うことを特徴とする音
    声認識装置。 2 特徴パラメータ補間部は補間する特徴パラメ
    ータとしてPARCOR係数を対象とすることを特
    徴とする特許請求の範囲第1項記載の音声認識装
    置。
JP59115064A 1984-06-05 1984-06-05 音声認識装置 Granted JPS60258599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59115064A JPS60258599A (ja) 1984-06-05 1984-06-05 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59115064A JPS60258599A (ja) 1984-06-05 1984-06-05 音声認識装置

Publications (2)

Publication Number Publication Date
JPS60258599A JPS60258599A (ja) 1985-12-20
JPH0572600B2 true JPH0572600B2 (ja) 1993-10-12

Family

ID=14653279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59115064A Granted JPS60258599A (ja) 1984-06-05 1984-06-05 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60258599A (ja)

Also Published As

Publication number Publication date
JPS60258599A (ja) 1985-12-20

Similar Documents

Publication Publication Date Title
Sakoe Two-level DP-matching--A dynamic programming-based pattern matching algorithm for connected word recognition
JPS58130396A (ja) 音声認識装置
Vachhani et al. Deep Autoencoder Based Speech Features for Improved Dysarthric Speech Recognition.
JPH07271394A (ja) 確実な電話音声認識のための信号バイアスの除去
JP2003044078A (ja) 発声速度正規化分析を用いた音声認識装置
JPH0572600B2 (ja)
JP3440840B2 (ja) 音声認識方法及びその装置
JPS58105294A (ja) 信号波形認識方式
JP2000206984A (ja) 音声認識装置
JP3015219B2 (ja) 音声認識装置
JPS60257499A (ja) 音声認識装置
JPS62250500A (ja) 単語音声認識装置
JPS62144200A (ja) 連続音声認識装置
JPS62113197A (ja) 音声認識装置
JPS63106699A (ja) ホルマント抽出装置
JPS63231397A (ja) 音声合成用パラメ−タの評価方式
JP2515609B2 (ja) 話者認識方法
JPH0221598B2 (ja)
JPS60118898A (ja) 音声分析方式
JPH042197B2 (ja)
JPH067352B2 (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
Holmes A very-low-cost connected-word recognizer for small vocabularies
JPS625298A (ja) 音声認識装置
JPS63161497A (ja) 音声認識装置