JPS63273900A - パタ−ンマツチング方式 - Google Patents
パタ−ンマツチング方式Info
- Publication number
- JPS63273900A JPS63273900A JP10642087A JP10642087A JPS63273900A JP S63273900 A JPS63273900 A JP S63273900A JP 10642087 A JP10642087 A JP 10642087A JP 10642087 A JP10642087 A JP 10642087A JP S63273900 A JPS63273900 A JP S63273900A
- Authority
- JP
- Japan
- Prior art keywords
- pattern matching
- frequency
- pattern
- section
- residual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 16
- 125000002015 acyclic group Chemical group 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 244000228957 Ferula foetida Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声認識装置におけるパターンマツチング方式
に関し、特に線形予測(LPG)分析による特徴量を用
いた周波数、時間の2軸上のパターンマツチングに関す
るものである。
に関し、特に線形予測(LPG)分析による特徴量を用
いた周波数、時間の2軸上のパターンマツチングに関す
るものである。
不特定話者用の音声認識装置では個人差の正規化を行っ
て、パターンマツチングをしなければならないが、この
個人差は、周波数軸上のものど時間軸上のものとがある
。従来、この2軸上でのパターンマツチング方式として
は、例えば、中周、他[音声スペクトルの時間軸・周波
数軸・強度軸の同時非線形伸縮に基づく不特定話者の単
語音声の認識」電子通信学会論文誌、 ’81/2
Vol、J64−D陽、2に開示されるものがある。こ
の方式では、バンドパスフィルタ列(BPFバンク)に
よる出力の離散値を周波数軸上と時間軸上で動的計画法
(Dynamic Programming Matc
hing;DPM)を行うものである。
て、パターンマツチングをしなければならないが、この
個人差は、周波数軸上のものど時間軸上のものとがある
。従来、この2軸上でのパターンマツチング方式として
は、例えば、中周、他[音声スペクトルの時間軸・周波
数軸・強度軸の同時非線形伸縮に基づく不特定話者の単
語音声の認識」電子通信学会論文誌、 ’81/2
Vol、J64−D陽、2に開示されるものがある。こ
の方式では、バンドパスフィルタ列(BPFバンク)に
よる出力の離散値を周波数軸上と時間軸上で動的計画法
(Dynamic Programming Matc
hing;DPM)を行うものである。
しかしながら、上記パターンマツチング方式では、BP
Fバンクの出力から得られる特徴量を用いているので、
周波数パターンの精細さを正確に取り扱うことが困難で
あるという問題点がある。また、時間軸と周波数軸のD
Pマツチングによる同時パターンマツチングでは、処理
が複雑になってしまうという問題点がある。
Fバンクの出力から得られる特徴量を用いているので、
周波数パターンの精細さを正確に取り扱うことが困難で
あるという問題点がある。また、時間軸と周波数軸のD
Pマツチングによる同時パターンマツチングでは、処理
が複雑になってしまうという問題点がある。
本発明は以上述べた問題点を解決し、2軸上のパターン
マツチングを簡単な処理で正確に行うことが可能な音声
認識装置のパターンマツチング方式を提供することを目
的とする。
マツチングを簡単な処理で正確に行うことが可能な音声
認識装置のパターンマツチング方式を提供することを目
的とする。
本発明は前記問題点を解決するために、線形予測分析に
よる特徴量を用いてパターンマツチングを行う音声認識
装置のパターンマツチング方式において、(a)入力パ
ターン及び標準パターンの線形予測係数あるいは線形予
測より得られる諸係数のデータを記憶すると共に、指定
信号が示す時刻のデータを出力する記憶手段、(b)遅
延素子部をオールバスフィルタで置き換えた適応非巡回
型フィルタから成り前記記憶手段からの入力パターンの
データを周波数変換する第1の変換手段と、遅延素子部
をオールバスフィルタで置き換えた適応非巡回型フィル
タから成り前記記憶手段から標準パターンのデータを周
波数変換する第2の変換手段と、第1の変換手段及び第
2の変換手段の出力データの距離を計算すると共に、該
距離が最小となるように第1の変換手段及び第2の変換
手段のうち少なくとも一方の遅延量を制御して最小の距
離に基づく周波数軸上のパターンマツチングの残差を出
力する制御手段とから構成される第1のパターンマツチ
ング部、及び(c)前記制御手段からの残差に基づいて
、動的計画法による時間軸上でのパターンマツチングを
行って残差を出力すると共に前記記憶手段に指定信号を
与える第2のパターンマツチング部から構成されるもの
である。
よる特徴量を用いてパターンマツチングを行う音声認識
装置のパターンマツチング方式において、(a)入力パ
ターン及び標準パターンの線形予測係数あるいは線形予
測より得られる諸係数のデータを記憶すると共に、指定
信号が示す時刻のデータを出力する記憶手段、(b)遅
延素子部をオールバスフィルタで置き換えた適応非巡回
型フィルタから成り前記記憶手段からの入力パターンの
データを周波数変換する第1の変換手段と、遅延素子部
をオールバスフィルタで置き換えた適応非巡回型フィル
タから成り前記記憶手段から標準パターンのデータを周
波数変換する第2の変換手段と、第1の変換手段及び第
2の変換手段の出力データの距離を計算すると共に、該
距離が最小となるように第1の変換手段及び第2の変換
手段のうち少なくとも一方の遅延量を制御して最小の距
離に基づく周波数軸上のパターンマツチングの残差を出
力する制御手段とから構成される第1のパターンマツチ
ング部、及び(c)前記制御手段からの残差に基づいて
、動的計画法による時間軸上でのパターンマツチングを
行って残差を出力すると共に前記記憶手段に指定信号を
与える第2のパターンマツチング部から構成されるもの
である。
本発明によれば、以上のようにパターンマツチング方式
を構成したので、技術的手段は次のように作用する。記
憶手段(例えばレジスタ)は第2のパターンマツチング
部からの指定信号が示す時刻の入力パターン及び標準パ
ターンの線形予測(LPG)係数(又は線形予測より得
られる諸係数)をそれぞれ第1のパターンマツチング部
の第1の変換手段及び第2変換手段へ転送する。ここで
、制御手段(例えば、後述する距離演算部とパラメータ
決定部)は第1の変換手段及び第1の変換手段のうち少
なくとも一方の遅延量(遅延素子部)を適応的に制御す
ることにより周波数変換を行う。例えば、第1の変換手
段の遅延量のみを制御するものとすると、制御手段は第
1の変換手段及び第2の変換手段の出力データの距離を
計算すると共にその距離が最小となるように第1の変換
手段の遅延量を制御し、最小の距離に基づいて得られる
周波数軸上のパターンマツチングの残差を第2のパター
ンマツチング部へ転送する。第2のパターンマツチング
部では周波数軸上での残差に基づいて、動的計画法(D
Pマツチング)による時間軸のパターンマツチングを行
って、最終的に周波数軸と時間軸の2軸上でのパターン
マツチングの残差を出力する。このように、LPG係数
等を特徴量として用いて、周波数軸上のパターンマツチ
ングとDPマツチングによる時間軸上のパターンマツチ
ングとを同時に行うことができるので、前記従来技術の
問題点を解決できるのである。
を構成したので、技術的手段は次のように作用する。記
憶手段(例えばレジスタ)は第2のパターンマツチング
部からの指定信号が示す時刻の入力パターン及び標準パ
ターンの線形予測(LPG)係数(又は線形予測より得
られる諸係数)をそれぞれ第1のパターンマツチング部
の第1の変換手段及び第2変換手段へ転送する。ここで
、制御手段(例えば、後述する距離演算部とパラメータ
決定部)は第1の変換手段及び第1の変換手段のうち少
なくとも一方の遅延量(遅延素子部)を適応的に制御す
ることにより周波数変換を行う。例えば、第1の変換手
段の遅延量のみを制御するものとすると、制御手段は第
1の変換手段及び第2の変換手段の出力データの距離を
計算すると共にその距離が最小となるように第1の変換
手段の遅延量を制御し、最小の距離に基づいて得られる
周波数軸上のパターンマツチングの残差を第2のパター
ンマツチング部へ転送する。第2のパターンマツチング
部では周波数軸上での残差に基づいて、動的計画法(D
Pマツチング)による時間軸のパターンマツチングを行
って、最終的に周波数軸と時間軸の2軸上でのパターン
マツチングの残差を出力する。このように、LPG係数
等を特徴量として用いて、周波数軸上のパターンマツチ
ングとDPマツチングによる時間軸上のパターンマツチ
ングとを同時に行うことができるので、前記従来技術の
問題点を解決できるのである。
第1図は本発明の一実施例を示すブロック図である。同
図において、1は人力音声信号(入カバターン)から得
られた特徴量としてのLPG係数を記憶するレジスタ、
2は参照音声信号(標準パターン)のLPG係数を一時
記憶するレジスタ、3はレジスタ1,2の出力信号に基
づいて周波数軸上でのパターンマツチングを行う周波数
パターンマツチング(以下SPM部と称する)、4はS
PM部3の出力信号に基づいて時間軸上でのパターンマ
ツチングをDPマツチングにより行うと共にレジスタ1
.2に対し人力データを指定する時間パターンマツチン
グ部(以下DPM部と称する)である。
図において、1は人力音声信号(入カバターン)から得
られた特徴量としてのLPG係数を記憶するレジスタ、
2は参照音声信号(標準パターン)のLPG係数を一時
記憶するレジスタ、3はレジスタ1,2の出力信号に基
づいて周波数軸上でのパターンマツチングを行う周波数
パターンマツチング(以下SPM部と称する)、4はS
PM部3の出力信号に基づいて時間軸上でのパターンマ
ツチングをDPマツチングにより行うと共にレジスタ1
.2に対し人力データを指定する時間パターンマツチン
グ部(以下DPM部と称する)である。
次に動作を説明する。
レジスタ1は、パターンマツチングされる人力音声信号
側のLPG係数の組込い)−(aoC″′)。
側のLPG係数の組込い)−(aoC″′)。
a 、””、 −ap’m’) ; (m= 1 、2
. …、 M ;時刻)が人力し、 DPM部4よりの
信号mで指定される時刻のt、pc係数の組IN(ml
をSPM部3へ送る。同様にして、レジスタ2は参照音
声信号のLPG係数及(111−(a o (k’ 、
五、(−・−・:i、TK))(k=0゜1、・・・k
;時刻)が人力し、DPM部4よりの信号にで指定され
た時刻のLPG係数の組innをSPM部部へ送る。こ
のSPM部3は、人力音声信号側のLPG係数k(、)
と参照音声信号のLPG係数反(klとについて、周波
数軸上てのパターンマツチングを行う。このときの残差
deは、DPM部4へ送られる。DPM部4ではSPM
部3での残差deを基に時間軸上でのパターンマツチン
グをDPマツチングにより行い、最終的に周波数軸と時
間軸の2軸上でのパターンマツチングの残差りが出力さ
れる。
. …、 M ;時刻)が人力し、 DPM部4よりの
信号mで指定される時刻のt、pc係数の組IN(ml
をSPM部3へ送る。同様にして、レジスタ2は参照音
声信号のLPG係数及(111−(a o (k’ 、
五、(−・−・:i、TK))(k=0゜1、・・・k
;時刻)が人力し、DPM部4よりの信号にで指定され
た時刻のLPG係数の組innをSPM部部へ送る。こ
のSPM部3は、人力音声信号側のLPG係数k(、)
と参照音声信号のLPG係数反(klとについて、周波
数軸上てのパターンマツチングを行う。このときの残差
deは、DPM部4へ送られる。DPM部4ではSPM
部3での残差deを基に時間軸上でのパターンマツチン
グをDPマツチングにより行い、最終的に周波数軸と時
間軸の2軸上でのパターンマツチングの残差りが出力さ
れる。
SPM部3の内部構成を第2図に示す。SPM部3は2
つの周波数変換部31.32と距離演算部34とパラメ
ータ決定部33より成る。人力音声信号側の周波数変換
部31はLPG係数A (m )が人力し、パラメータ
決定部33より人力する可変のパラメータαに対応した
周波数変換を行ったLPG係数五(。)を出力する。参
照音声信号側の周波数変換部32は固定のパラメータα
。で、基準となる周波数変換を行い、この実施例では心
理尺度の周波数(メル周波数)への変換とした。入力音
声信号側の周波数変換部31の構造を第3図(a)に示
す。周波数変換部31はLPG係数をタップとした非巡
回型フィルタ(FIRフィルタ)で、遅延素子312、
乗算器31c、加算器31.から構成される。本実施例
では、遅延素子31□をオールバスフィルタで置きかえ
たもので、このフィルタのインパルス応答が周波数変換
にあたる。参照音声信号側の周波数変換部32について
も同様である。オールバスフィルタの伝達関数は、一般
に、 である。第3図(b)に、オールバスフィルタの構成例
を示す。同図はN次のものを示し、それぞれ加算器30
1,303 、パラメータαの乗算器304゜302、
及び遅延器305より構成される。本実施例では各段と
も同一次数のオールバスフィルタとする。1次のオール
バスフィルタを用いたとき、久輸) と久(。)との関
係は、 ^ 1ml i ・・・(2) であり、住、。において、θであった周波数は、久にお
いて、 (13=jan−1(1−ct2)sin θ/2a
+(1−a 2)cos θ)・−(3) に変換される。
つの周波数変換部31.32と距離演算部34とパラメ
ータ決定部33より成る。人力音声信号側の周波数変換
部31はLPG係数A (m )が人力し、パラメータ
決定部33より人力する可変のパラメータαに対応した
周波数変換を行ったLPG係数五(。)を出力する。参
照音声信号側の周波数変換部32は固定のパラメータα
。で、基準となる周波数変換を行い、この実施例では心
理尺度の周波数(メル周波数)への変換とした。入力音
声信号側の周波数変換部31の構造を第3図(a)に示
す。周波数変換部31はLPG係数をタップとした非巡
回型フィルタ(FIRフィルタ)で、遅延素子312、
乗算器31c、加算器31.から構成される。本実施例
では、遅延素子31□をオールバスフィルタで置きかえ
たもので、このフィルタのインパルス応答が周波数変換
にあたる。参照音声信号側の周波数変換部32について
も同様である。オールバスフィルタの伝達関数は、一般
に、 である。第3図(b)に、オールバスフィルタの構成例
を示す。同図はN次のものを示し、それぞれ加算器30
1,303 、パラメータαの乗算器304゜302、
及び遅延器305より構成される。本実施例では各段と
も同一次数のオールバスフィルタとする。1次のオール
バスフィルタを用いたとき、久輸) と久(。)との関
係は、 ^ 1ml i ・・・(2) であり、住、。において、θであった周波数は、久にお
いて、 (13=jan−1(1−ct2)sin θ/2a
+(1−a 2)cos θ)・−(3) に変換される。
第2図の距離演算部34は周波数変換後のLPG係数灰
(。)、λ(k)の距離(異差)dを次式で計算する。
(。)、λ(k)の距離(異差)dを次式で計算する。
d=汝Tm) −久+k)
ス (m) ”; 9Tkl )
=(cio、ct、、・−、dq) ・・・(
4)この結果、得られた距離dはパラメータ決定部33
へ出力される。
4)この結果、得られた距離dはパラメータ決定部33
へ出力される。
パラメータ決定部33は距離dが最小となるように非線
形パラメータ最小2乗法を用いてパラメータαを逐次更
新する。オールバスフィルタとして第3図(b)のもの
を採用した場合には、n回更新したときのオールバスフ
ィルタのパラメータαと距離dを各々α(nl −df
n+ = (dofn)+ dIfn)+・・・dqf
。、)とすると、更新後のパラメータαfn++1は・ glい)はα(。、に対するa 1 ””の変化量であ
り、これを求めるフィルタの構成例を第4図に示す。こ
のフィルタは、オースパスフィルタ(A (Z) )で
置き換えられた遅延素子33Z9乗算器33C9加算器
33a及びA(z)の微分型のフィルタ(A’(z))
33dから構成される同図では出力側に微分型のフィル
タ33dが設けられているが、単位インパルスの入力端
に設けてもよい。この変化量ge(。)は、第4図のフ
ィルタのインパルス応答により時系列で与・((Z−’
−α(n))/(1−α(nlZ−t) ) j−1・
(z−2−1) /(1−d[n1Z−’)2dZ
−([i)である。
形パラメータ最小2乗法を用いてパラメータαを逐次更
新する。オールバスフィルタとして第3図(b)のもの
を採用した場合には、n回更新したときのオールバスフ
ィルタのパラメータαと距離dを各々α(nl −df
n+ = (dofn)+ dIfn)+・・・dqf
。、)とすると、更新後のパラメータαfn++1は・ glい)はα(。、に対するa 1 ””の変化量であ
り、これを求めるフィルタの構成例を第4図に示す。こ
のフィルタは、オースパスフィルタ(A (Z) )で
置き換えられた遅延素子33Z9乗算器33C9加算器
33a及びA(z)の微分型のフィルタ(A’(z))
33dから構成される同図では出力側に微分型のフィル
タ33dが設けられているが、単位インパルスの入力端
に設けてもよい。この変化量ge(。)は、第4図のフ
ィルタのインパルス応答により時系列で与・((Z−’
−α(n))/(1−α(nlZ−t) ) j−1・
(z−2−1) /(1−d[n1Z−’)2dZ
−([i)である。
αの初期値は参照音声信号側の周波数変換部32の固定
のパラメータα。と等しくおく。
のパラメータα。と等しくおく。
距離演算部34は、1α(。+1)/α(n)I〈ε;
(εは閾値)となったとき、次式のde、を出力する。
(εは閾値)となったとき、次式のde、を出力する。
このdeは周波数軸上のパターンマツチングの残差であ
る。
る。
SPMP2O3いて、入力音声信号側のLPG係数a<
m+ と参照音声信号側のLPG係数Anり+の周波数
軸上でパターンマツチングを行ったときの残差をde(
m、K)とする。第5図は、この残差de(m、k)を
もとにDPM部4が時間軸上でのパターンマツチングを
行う様子を示している。de(m、k)は第5図の各格
子点上に存在し、DPM部4は点(1,4)から点が最
小であるような径路を決定する。これは再帰式で求めら
れ、部分和D(m、k)は、1り で与えられる。但し、D(0,0)=0.D(m、0)
=00(III≠O) 、D(0,k)=oo (k≠
O)、de(M+1.に+1)=0とする。最終的に求
めるパターンマツチング残差Deは、De=D (M+
I J+1)/(M十K) −(9)
である。DPM部4はこの残差Deを出力する。
m+ と参照音声信号側のLPG係数Anり+の周波数
軸上でパターンマツチングを行ったときの残差をde(
m、K)とする。第5図は、この残差de(m、k)を
もとにDPM部4が時間軸上でのパターンマツチングを
行う様子を示している。de(m、k)は第5図の各格
子点上に存在し、DPM部4は点(1,4)から点が最
小であるような径路を決定する。これは再帰式で求めら
れ、部分和D(m、k)は、1り で与えられる。但し、D(0,0)=0.D(m、0)
=00(III≠O) 、D(0,k)=oo (k≠
O)、de(M+1.に+1)=0とする。最終的に求
めるパターンマツチング残差Deは、De=D (M+
I J+1)/(M十K) −(9)
である。DPM部4はこの残差Deを出力する。
以上に述べたDPM部4のパターンマツチング法は、径
路に制限を加えてないが、D(m、k)の求め方を、 とし、D(0,0)=O,m≦0かつに≠0のとき、D
(m、k)=OO,[1≠0かつに≦0のとき、D(m
、k)= oo。
路に制限を加えてないが、D(m、k)の求め方を、 とし、D(0,0)=O,m≦0かつに≠0のとき、D
(m、k)=OO,[1≠0かつに≦0のとき、D(m
、k)= oo。
de(M+I、に+1)=Oとして、パターンマツチン
グ残差De=D(M+1.に+1)/(M+K)を求め
るという方法も可能である。
グ残差De=D(M+1.に+1)/(M+K)を求め
るという方法も可能である。
以上の実施例ではSPMP2O3ラメータαの制御方法
として初期値をすべてα=α。(一定)として制御する
場合について述べたが初期値自身を前段階の収束値を用
いる場合、αの収束を速くする効果がある。
として初期値をすべてα=α。(一定)として制御する
場合について述べたが初期値自身を前段階の収束値を用
いる場合、αの収束を速くする効果がある。
また、簡単のためにSPMの周波数変換部31.32に
おいて、すべての段のオールパスフィルタA(z)(3
1,)が、同じパラメータαを持つ場合について述べた
が、各段異なる構成(パラメータの値または次数)のオ
ールパスフィルタ(31°2)を用いてもよい。この場
合の構成列を第6図に示す。
おいて、すべての段のオールパスフィルタA(z)(3
1,)が、同じパラメータαを持つ場合について述べた
が、各段異なる構成(パラメータの値または次数)のオ
ールパスフィルタ(31°2)を用いてもよい。この場
合の構成列を第6図に示す。
更に、同様にDPMの径路制限条件についても異なる条
件を用いてもよいことは明らかである。
件を用いてもよいことは明らかである。
更に、特徴量としてLPG係数を用いて説明したが、L
PGケプストラム係数、あるいはLPGメルケプストラ
ム係数等、線形予測法より求められる諸種の係数を用い
てもよい。
PGケプストラム係数、あるいはLPGメルケプストラ
ム係数等、線形予測法より求められる諸種の係数を用い
てもよい。
更に、以上の実施例では入力音声信号(入力パターン)
側の周波数変換部31のパラメータα、即ち遅延量(周
波数変換量)を適応的に制御していたが、標準パターン
側の周波数変換部32の遅延量を適応的に制御してもよ
いし、計算量は増加するが、双方の周波数変換部の遅延
量を適応的に制御してもよいことは明らかである。
側の周波数変換部31のパラメータα、即ち遅延量(周
波数変換量)を適応的に制御していたが、標準パターン
側の周波数変換部32の遅延量を適応的に制御してもよ
いし、計算量は増加するが、双方の周波数変換部の遅延
量を適応的に制御してもよいことは明らかである。
以上、詳細に説明したように本発明によれば、周波数軸
上のパターンマツチングの機能と時間軸上のパターンマ
ツチングの機能を持ち、この2軸のパターンマツチング
を線形予測係数を用いて、同時に行うので、正確かつ簡
単なマツチング処理となり、不特定話者用の音声認識装
置におけるパターンマツチング方式として、認識率の向
上が期待出来る。
上のパターンマツチングの機能と時間軸上のパターンマ
ツチングの機能を持ち、この2軸のパターンマツチング
を線形予測係数を用いて、同時に行うので、正確かつ簡
単なマツチング処理となり、不特定話者用の音声認識装
置におけるパターンマツチング方式として、認識率の向
上が期待出来る。
第1図は本発明の一実施例を示す構成図、第2図は第1
図の実施例のSPM部の内部構成図、第3図(a) 、
(b)は第2図の周波数変換部の内部構成図、第4図
は変化量g 1fn)を求めるフィルタの回路図、第5
図はDPM部のパターンマツチングの説明図、第6図は
周波数変換部の別の構成例を示す回路図である。 1.2−・・レジスタ、 3・・・パターンマツチング部(SPM部)、4・・・
パターンマツチング部(DPM部)31.32−・・周
波数変換部、 31□、31°2,33.−・・遅延素子(オールバス
フィルタ)、31c、33c、302,304−−−乗
算器、31a、33a、301,303−−−加算器、
33d −・・フィルタ、 305−・・遅延器。
図の実施例のSPM部の内部構成図、第3図(a) 、
(b)は第2図の周波数変換部の内部構成図、第4図
は変化量g 1fn)を求めるフィルタの回路図、第5
図はDPM部のパターンマツチングの説明図、第6図は
周波数変換部の別の構成例を示す回路図である。 1.2−・・レジスタ、 3・・・パターンマツチング部(SPM部)、4・・・
パターンマツチング部(DPM部)31.32−・・周
波数変換部、 31□、31°2,33.−・・遅延素子(オールバス
フィルタ)、31c、33c、302,304−−−乗
算器、31a、33a、301,303−−−加算器、
33d −・・フィルタ、 305−・・遅延器。
Claims (1)
- 【特許請求の範囲】 線形予測分析による特徴量を用いてパターンマッチング
を行う音声認識装置のパターンマッチング方式において
、 (a)入力パターン及び標準パターンの線形予測係数あ
るいは線形予測より得られる諸係数のデータを記憶する
と共に、指定信号が示す時刻のデータを出力する記憶手
段、 (b)遅延素子部をオールパスフィルタで置き換えた適
応非巡回型フィルタから成り前記記憶手段からの入力パ
ターンのデータを周波数変換する第1の変換手段と、遅
延素子部をオールパスフィルタで置き換えた適応非巡回
型フィルタから成り前記記憶手段からの標準パターンの
データを周波数変換する第2の変換手段と、第1の変換
手段及び第2の変換手段の出力データの距離を計算する
と共に、該距離が最小となるように第1の変換手段及び
第2の変換手段のうち少なくとも一方の遅延量を制御し
て最小の距離に基づく周波数軸上のパターンマッチング
の残差を出力する制御手段とから構成される第1のパタ
ーンマッチング部、(c)前記制御手段からの残差に基
づいて、動的計画法による時間軸上でのパターンマッチ
ングを行って残差を出力すると共に前記記憶手段に指定
信号を与える第2のパターンマッチング部、とを具備す
ることを特徴とするパターンマッチング方式。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10642087A JPS63273900A (ja) | 1987-05-01 | 1987-05-01 | パタ−ンマツチング方式 |
| US07/186,577 US4916743A (en) | 1987-04-30 | 1988-04-27 | Pattern matching system |
| EP88303794A EP0290190B1 (en) | 1987-04-30 | 1988-04-27 | Pattern matching system |
| CA000565459A CA1334689C (en) | 1987-04-30 | 1988-04-29 | Pattern matching system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10642087A JPS63273900A (ja) | 1987-05-01 | 1987-05-01 | パタ−ンマツチング方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63273900A true JPS63273900A (ja) | 1988-11-10 |
Family
ID=14433174
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10642087A Pending JPS63273900A (ja) | 1987-04-30 | 1987-05-01 | パタ−ンマツチング方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63273900A (ja) |
-
1987
- 1987-05-01 JP JP10642087A patent/JPS63273900A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Smith et al. | Bark and ERB bilinear transforms | |
| CA1157564A (en) | Sound synthesizer | |
| US4544919A (en) | Method and means of determining coefficients for linear predictive coding | |
| US5978759A (en) | Apparatus for expanding narrowband speech to wideband speech by codebook correspondence of linear mapping functions | |
| EP0814639B1 (en) | Spectral transposition of a digital audio signal | |
| Gardner et al. | Theoretical analysis of the high-rate vector quantization of LPC parameters | |
| Barnwell | Recursive windowing for generating autocorrelation coefficients for LPC analysis | |
| EP0970462B1 (en) | Recognition system | |
| CA1061906A (en) | Speech signal fundamental period extractor | |
| US5687104A (en) | Method and apparatus for generating decoupled filter parameters and implementing a band decoupled filter | |
| Yegnanarayana | Design of recursive group-delay filters by autoregressive modeling | |
| JPS58207100A (ja) | 次数を減らした波形形成多項式を用いるlpc符号化方法 | |
| US4809331A (en) | Apparatus and methods for speech analysis | |
| US20030088417A1 (en) | Speech analysis method and speech synthesis system | |
| US5577160A (en) | Speech analysis apparatus for extracting glottal source parameters and formant parameters | |
| JPS6152479B2 (ja) | ||
| JPS63273900A (ja) | パタ−ンマツチング方式 | |
| Zhao et al. | Sliding window order-recursive least-squares algorithms | |
| US6049814A (en) | Spectrum feature parameter extracting system based on frequency weight estimation function | |
| DE69624207T2 (de) | Sprachkodierer mit Vorrichtung zur Abschätzung der Abweichung des Leistungsverlaufs eines synthetischen Signals von einem Eingangssignal | |
| Smith et al. | The one-filter Keefe clarinet tonehole | |
| Nein et al. | Incorporating error shaping technique into LSF vector quantization | |
| US4899386A (en) | Device for deciding pole-zero parameters approximating spectrum of an input signal | |
| JPS63274999A (ja) | 音声認識装置のパタ−ン・マッチング装置 | |
| JPS58105294A (ja) | 信号波形認識方式 |