JPH021319B2 - - Google Patents
Info
- Publication number
- JPH021319B2 JPH021319B2 JP57079379A JP7937982A JPH021319B2 JP H021319 B2 JPH021319 B2 JP H021319B2 JP 57079379 A JP57079379 A JP 57079379A JP 7937982 A JP7937982 A JP 7937982A JP H021319 B2 JPH021319 B2 JP H021319B2
- Authority
- JP
- Japan
- Prior art keywords
- orthogonal
- straight line
- equation
- coefficient
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000009466 transformation Effects 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000010606 normalization Methods 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Description
【発明の詳細な説明】
本発明は、パターン認識のための特徴抽出を行
う装置に係り、直交変換と最小2乗近似直線を用
いた正規化により、正規化された特徴パラメータ
を求める装置の改良に関する。
う装置に係り、直交変換と最小2乗近似直線を用
いた正規化により、正規化された特徴パラメータ
を求める装置の改良に関する。
従来、音声などにおける個人特性や伝送路特性
の正規化を行う方法としては、音声スペクトルの
最小2乗近似直線を求め、元の音声スペクトルよ
り差し引く方法があり、電子通信学会の信学技報
PRL79―4「非線形スペクトルマツチングによる
単語音声認識の一方式」1979年10月に記載されて
いる。その概要を次に述べる。
の正規化を行う方法としては、音声スペクトルの
最小2乗近似直線を求め、元の音声スペクトルよ
り差し引く方法があり、電子通信学会の信学技報
PRL79―4「非線形スペクトルマツチングによる
単語音声認識の一方式」1979年10月に記載されて
いる。その概要を次に述べる。
音声の個人特性には声道長の相違や放射特性の
相違などがあり、一方伝送路特性には電話回線特
性の相違などがあり、これらの特性を直線a・i
+bでモデル化することができる。第1図の原理
図に示すように音声スペクトルの最小2乗近似直
線を求め、元の音声スペクトルより最小2乗近似
直線を差し引くことにより、個人特性や伝送路特
性のバラツキを取り除いた正規化スペクトルを得
ることができる。以後正規化操作と称する。すな
わち、スペクトルをfi、最小2乗近似直線をa・
i+bとすれば、正規化スペクトルgiは gi=fi−(a・i+b) ……(1) ただし、i=1,…,n で与えられる。また、最小2乗近似直線は誤差E
を E=o 〓i=1 {fi−(a・i+b)}2 ……(2) を最小とするa,bによつて求められる。すなわ
ち ∂E/∂a=0 ……(3) ∂E/∂b ……(4) によりa,bが求められる。
相違などがあり、一方伝送路特性には電話回線特
性の相違などがあり、これらの特性を直線a・i
+bでモデル化することができる。第1図の原理
図に示すように音声スペクトルの最小2乗近似直
線を求め、元の音声スペクトルより最小2乗近似
直線を差し引くことにより、個人特性や伝送路特
性のバラツキを取り除いた正規化スペクトルを得
ることができる。以後正規化操作と称する。すな
わち、スペクトルをfi、最小2乗近似直線をa・
i+bとすれば、正規化スペクトルgiは gi=fi−(a・i+b) ……(1) ただし、i=1,…,n で与えられる。また、最小2乗近似直線は誤差E
を E=o 〓i=1 {fi−(a・i+b)}2 ……(2) を最小とするa,bによつて求められる。すなわ
ち ∂E/∂a=0 ……(3) ∂E/∂b ……(4) によりa,bが求められる。
一方、音声認識に用いる特徴抽出法は、コロナ
社出版の「パターン認識とその応用」の第21頁よ
り第28頁に記載されているように、フーリエ変
換、ウオルシユ・アダマール変換、KL変換
(Karhunen―Loeve変換)のような直交変換によ
る方法が知られている。フーリエ変換を用いる例
では、音声スペクトラムをフーリエ変換しケプス
トラム係数を求め、このケプストラム係数を入力
音声の特徴パラメータとする。
社出版の「パターン認識とその応用」の第21頁よ
り第28頁に記載されているように、フーリエ変
換、ウオルシユ・アダマール変換、KL変換
(Karhunen―Loeve変換)のような直交変換によ
る方法が知られている。フーリエ変換を用いる例
では、音声スペクトラムをフーリエ変換しケプス
トラム係数を求め、このケプストラム係数を入力
音声の特徴パラメータとする。
さらに、従来音声の個人特性や伝送路特性を正
規化した特徴パラメータを得る方法では、初めに
入力パターンの領域での最小2乗近似直線を求
め、入力パターンより最小2乗近似直線を差し引
き、その後直交変換を行つている。この時、最小
2乗近似直線の係数a,bは(2),(3),(4)式より求
められる。具体的には によつて計算される。また、正規化のための計算
である最小2乗近似直線の差し引きは(1)式で与え
られる。この計算にはa・i+bを前もつてテー
ブル化ておけばn+1回の多量の減算を必要とす
る。
規化した特徴パラメータを得る方法では、初めに
入力パターンの領域での最小2乗近似直線を求
め、入力パターンより最小2乗近似直線を差し引
き、その後直交変換を行つている。この時、最小
2乗近似直線の係数a,bは(2),(3),(4)式より求
められる。具体的には によつて計算される。また、正規化のための計算
である最小2乗近似直線の差し引きは(1)式で与え
られる。この計算にはa・i+bを前もつてテー
ブル化ておけばn+1回の多量の減算を必要とす
る。
本発明の目的は、正規化のための最小2乗近似
直線の差し引きすなわち正規化操作を直交変換後
に行うことによつて計算量の少ないパターン特徴
抽出装置を提供することである。
直線の差し引きすなわち正規化操作を直交変換後
に行うことによつて計算量の少ないパターン特徴
抽出装置を提供することである。
次に本発明の原理について説明する。はじめに
加減算は直交変換によつて影響を受けないため、
直交変換をTkで表現すれば、 Tk{fi−(a・i+b)}=Tk(fi) −Tk{(a・i+b)} ……(7) ただし、k=1,…,m が成立する。直交変換Tkは特徴抽出する操作で
ある。直交係数はn′個存在するが通常特徴パラメ
ータとして使用される直交係数の数はnより十分
小さいmである。よつて(7)式は(1)式より計算量が
少ない。例えば音声認識では特徴パラメータとし
てケプストラム係数が用いられるが、その時Tk
はフーリエ変換でありn=128、m=8程度で使
用されるため、(7)式の計算量は(1)式に比して1/
16である。さらにパーセバルの等式より E=o 〓i=1 |fi−(a・i+b)|2 =o′ 〓K=1 |Tk{fi−(a・i+b)}|2 ……(8) であり、線形操作は直交変換の影響を受けないた
め E=o′ 〓K=1 |Tk(fi)−a ・Tk(i)−b・Tk(1)|2 =o′ 〓K=1 〔〔Re{Tk(fi)}−a・Re{Tk(i)} −b・Re{Tk(1)}〕2 +〔Im{Tk(fi)}−a・Im{Tk(i)} −b・Im{Tk(1)}〕2〕 ……(9) ただしRe(x),Im(x)はそれぞれxの実部、
虚部を意味する。
加減算は直交変換によつて影響を受けないため、
直交変換をTkで表現すれば、 Tk{fi−(a・i+b)}=Tk(fi) −Tk{(a・i+b)} ……(7) ただし、k=1,…,m が成立する。直交変換Tkは特徴抽出する操作で
ある。直交係数はn′個存在するが通常特徴パラメ
ータとして使用される直交係数の数はnより十分
小さいmである。よつて(7)式は(1)式より計算量が
少ない。例えば音声認識では特徴パラメータとし
てケプストラム係数が用いられるが、その時Tk
はフーリエ変換でありn=128、m=8程度で使
用されるため、(7)式の計算量は(1)式に比して1/
16である。さらにパーセバルの等式より E=o 〓i=1 |fi−(a・i+b)|2 =o′ 〓K=1 |Tk{fi−(a・i+b)}|2 ……(8) であり、線形操作は直交変換の影響を受けないた
め E=o′ 〓K=1 |Tk(fi)−a ・Tk(i)−b・Tk(1)|2 =o′ 〓K=1 〔〔Re{Tk(fi)}−a・Re{Tk(i)} −b・Re{Tk(1)}〕2 +〔Im{Tk(fi)}−a・Im{Tk(i)} −b・Im{Tk(1)}〕2〕 ……(9) ただしRe(x),Im(x)はそれぞれxの実部、
虚部を意味する。
となり、(3),(4)式より
FI=o′
〓
〓K=1
〔Re{Tk(fi)}・Re{Tk(i)}+Im{Tk(fi)
}・Im{Tk(i)}〕……(10) FK=o′ 〓 〓K=1 〔Re{Tk(fi)}・Re{Tk(1)}+Im{Tk(fi)
}・Im{Tk(1)}〕……(11) I2=o′ 〓K=1 〔Re2{Tk(i)}+Im2{Tk(i)}〕 ……(12) I1=o′ 〓 〓K=1 〔Re{Tk(i)}・Re{Tk(1)}+Im{Tk(i)
}・Im{Tk(1)}〕……(13) K2=o′ 〓K=1 〔Re2{Tk(1)}+Im2{Tk(1)}〕 ……(14) とすれば最小2乗直線のパラメータa,bは FI−a・I2−b・I1=0 ……(15) FK−a・I1−b・K2=0 ……(16) にて求められる。ここで通常kの大きいTk(fi)
は、十分小さくするため、mより大きい項は省略
して FI≒o 〓 〓K=1 〔Re{Tk(fi)}・Re{Tk(i)}+Im{Tk(fi)
}・Im{Tk(i)}〕……(17) FK≒o 〓 〓K=1 〔Re{Tk(fi)}・Re{Tk(1)}+Im{Tk(fi)
}・Im{Tk(1)}〕……(18) を(10),(11)式の代用とすることができる。
}・Im{Tk(i)}〕……(10) FK=o′ 〓 〓K=1 〔Re{Tk(fi)}・Re{Tk(1)}+Im{Tk(fi)
}・Im{Tk(1)}〕……(11) I2=o′ 〓K=1 〔Re2{Tk(i)}+Im2{Tk(i)}〕 ……(12) I1=o′ 〓 〓K=1 〔Re{Tk(i)}・Re{Tk(1)}+Im{Tk(i)
}・Im{Tk(1)}〕……(13) K2=o′ 〓K=1 〔Re2{Tk(1)}+Im2{Tk(1)}〕 ……(14) とすれば最小2乗直線のパラメータa,bは FI−a・I2−b・I1=0 ……(15) FK−a・I1−b・K2=0 ……(16) にて求められる。ここで通常kの大きいTk(fi)
は、十分小さくするため、mより大きい項は省略
して FI≒o 〓 〓K=1 〔Re{Tk(fi)}・Re{Tk(i)}+Im{Tk(fi)
}・Im{Tk(i)}〕……(17) FK≒o 〓 〓K=1 〔Re{Tk(fi)}・Re{Tk(1)}+Im{Tk(fi)
}・Im{Tk(1)}〕……(18) を(10),(11)式の代用とすることができる。
(7),(15),(16)式より次のことが明らかであ
る。すなわち、入力パターンより最小2乗近似直
線を差し引き、直交変換し直交係数を求める従来
の方法は、入力パターン、最小2乗近似直線とも
に直交変換し、入力パターンの直交係数より最小
2乗近似直線の直交係数を差し引く方法と等価で
あり、後者は前者に比して計算量が少ない。ま
た、最小2乗近似直線のパラメータa,bは前者
では(5),(6)式にて与えられ、実際には変数がfiで
あるためo 〓i=0 ・fiとo 〓i=1 fiを計算すればよい。一方、
後者では(15),(16)式にて与えられ、実際には
変数がTk(fi)であるため、(17),(18)式を計
算すればよい。多くの場合、Tk(1)=0であり、
Re{Tk(i)}とIm{Tk(i)}はどちらかがゼロ
になる。また(17),(18)式は後述の(20),
(24)式のように変形でき、kまたはk2に反比例
するため近似的にはmより小さなpまで加算すれ
ば十分である。すなわち(20)′,(24)′式のよ
うになる。よつて計算量を比較すると後者は前者
のp/nと小さくなる。
る。すなわち、入力パターンより最小2乗近似直
線を差し引き、直交変換し直交係数を求める従来
の方法は、入力パターン、最小2乗近似直線とも
に直交変換し、入力パターンの直交係数より最小
2乗近似直線の直交係数を差し引く方法と等価で
あり、後者は前者に比して計算量が少ない。ま
た、最小2乗近似直線のパラメータa,bは前者
では(5),(6)式にて与えられ、実際には変数がfiで
あるためo 〓i=0 ・fiとo 〓i=1 fiを計算すればよい。一方、
後者では(15),(16)式にて与えられ、実際には
変数がTk(fi)であるため、(17),(18)式を計
算すればよい。多くの場合、Tk(1)=0であり、
Re{Tk(i)}とIm{Tk(i)}はどちらかがゼロ
になる。また(17),(18)式は後述の(20),
(24)式のように変形でき、kまたはk2に反比例
するため近似的にはmより小さなpまで加算すれ
ば十分である。すなわち(20)′,(24)′式のよ
うになる。よつて計算量を比較すると後者は前者
のp/nと小さくなる。
以上述べたように、従来直交変換の前に行われ
ていた最小2乗直線を差し引く、すなわち正規化
操作を直交変換の後で行うことが可能であり、さ
らに計算量も少ない。
ていた最小2乗直線を差し引く、すなわち正規化
操作を直交変換の後で行うことが可能であり、さ
らに計算量も少ない。
次に直交変換として具体的にフーリエ変換、
cos変換を用いる場合、直交変換後の正規化操作
(7)式と最小2乗近似直線のパラメータa(15)式
の具体的な計算方法を述べる。始めに直交変換と
してフーリエ変換を用いる場合、すなわち Tk(fi)=o 〓 〓i=1 fi・(cos2kiπ/n+jsin2kiπ/n)=Re(Cf k)
+jIm(Cf k)……(19) にて直交変換を行う場合、(17),(18),(12),
(13),(14)式は FI=o 〓K=1 Im(Cf k)・n/k FK=0 I2=o 〓K=1 n2/k2 I1=0 K2=0 となるので、(15)式へ代入して となる。ここで(20)式の分子の項の1/k
Im(Cf k))はkが大きくなればゼロに近づくため
近似的にはmより小さなpまで加算すれば十分で
ある。よつて(20)式は でおきかえることができる。最小2乗近似直線の
直交係数は、 Tk(a・i+b)=jn/ka ……(21) となり、正規化特徴パラメータをCg kとすれば、
正規化操作(7)式は Cg k=Cf k−jna/k ……(22) となる。すなわち、最小2乗近似直線のパラメー
タaは(20)式にて計算され、最小2乗近似直線
の直交係数は(21)にて計算され正規化操作は
(22)式にて計算できる。
cos変換を用いる場合、直交変換後の正規化操作
(7)式と最小2乗近似直線のパラメータa(15)式
の具体的な計算方法を述べる。始めに直交変換と
してフーリエ変換を用いる場合、すなわち Tk(fi)=o 〓 〓i=1 fi・(cos2kiπ/n+jsin2kiπ/n)=Re(Cf k)
+jIm(Cf k)……(19) にて直交変換を行う場合、(17),(18),(12),
(13),(14)式は FI=o 〓K=1 Im(Cf k)・n/k FK=0 I2=o 〓K=1 n2/k2 I1=0 K2=0 となるので、(15)式へ代入して となる。ここで(20)式の分子の項の1/k
Im(Cf k))はkが大きくなればゼロに近づくため
近似的にはmより小さなpまで加算すれば十分で
ある。よつて(20)式は でおきかえることができる。最小2乗近似直線の
直交係数は、 Tk(a・i+b)=jn/ka ……(21) となり、正規化特徴パラメータをCg kとすれば、
正規化操作(7)式は Cg k=Cf k−jna/k ……(22) となる。すなわち、最小2乗近似直線のパラメー
タaは(20)式にて計算され、最小2乗近似直線
の直交係数は(21)にて計算され正規化操作は
(22)式にて計算できる。
さらに、直交変換としてcos変換を用いる場合
すなわち Tk(fi)=o 〓i=1 fi・coskiπ/n=Cf k ……(23) にて直交変換を行う場合、(17),(18),(12),
(13),(14)式は FI=o 〓K=1 Cf k・n/k2n・{(−1)k−1} FK=0 I2=o 〓K=1 n2/k4π2{(−1)k−1}2 I1=0 K2=0 となるので、(15)式へ代入して となる。ここで(24)式の分子の項のCk/k2は
kが大きくなればゼロに近づくため近似的にはm
より小さなpまで加算すれば十分である。よつて
(24)式は となり、最小2乗近似直線の直交係数は Tk(a・i+b)=an/k2π{(−1)k−1} ……(25) となり、正規化操作(7)式は Cg k=Cf k−an/k2π{(−1)k−1} ……(26) となる。すなわち、最小2乗近似直線のパラメー
タaは(24)式にて計算され、最小2乗近似直線
の直交係数は(25)式にて計算され、正規化操作
は(26)式にて計算できる。
すなわち Tk(fi)=o 〓i=1 fi・coskiπ/n=Cf k ……(23) にて直交変換を行う場合、(17),(18),(12),
(13),(14)式は FI=o 〓K=1 Cf k・n/k2n・{(−1)k−1} FK=0 I2=o 〓K=1 n2/k4π2{(−1)k−1}2 I1=0 K2=0 となるので、(15)式へ代入して となる。ここで(24)式の分子の項のCk/k2は
kが大きくなればゼロに近づくため近似的にはm
より小さなpまで加算すれば十分である。よつて
(24)式は となり、最小2乗近似直線の直交係数は Tk(a・i+b)=an/k2π{(−1)k−1} ……(25) となり、正規化操作(7)式は Cg k=Cf k−an/k2π{(−1)k−1} ……(26) となる。すなわち、最小2乗近似直線のパラメー
タaは(24)式にて計算され、最小2乗近似直線
の直交係数は(25)式にて計算され、正規化操作
は(26)式にて計算できる。
本発明のパターン特徴抽出装置は最小2乗近似
直線にて正規化し、直交変換を行つて正規化特徴
パラメータを得る装置であるから次のような各部
を必要とする。すなわち、入力パターンを直交変
換し直交係数を求める直交変換部と、直交変換前
の領域における最小2乗近似直線の直交係数を求
める近似直交線計算部と、前記近似直線計算部よ
り得られる最小2乗近似直線の直交係数を入力パ
ターンの直交係数から減算する減算部を有してい
る。
直線にて正規化し、直交変換を行つて正規化特徴
パラメータを得る装置であるから次のような各部
を必要とする。すなわち、入力パターンを直交変
換し直交係数を求める直交変換部と、直交変換前
の領域における最小2乗近似直線の直交係数を求
める近似直交線計算部と、前記近似直線計算部よ
り得られる最小2乗近似直線の直交係数を入力パ
ターンの直交係数から減算する減算部を有してい
る。
次に本発明の装置の具体的構成を図面を参照し
ながら説明する。
ながら説明する。
第2図は本発明の第1と第2の実施例の共通の
ブロツク図である。
ブロツク図である。
第1の実施例は直交変換としてリーフエ変換が
用いられる。はじめに直交変換部1では(19)式
のように入力パターンfiをフーリエ変換し、直交
係数である特徴パラメータRe(Cf k)、Im(Cf k)が
求められる。次に近似直線計算部2では(20)、
(21)式のように最小2乗近似直線の直交係数Tk
(a・i+b)が、入力パターンの直交係数Cf kよ
り求められる。さらに減算部3では、(22)式の
ように入力パターンの直交係数より最小2乗近似
直線の直交係数を差し引き、正規化特徴パラメー
タCg kが求められる。
用いられる。はじめに直交変換部1では(19)式
のように入力パターンfiをフーリエ変換し、直交
係数である特徴パラメータRe(Cf k)、Im(Cf k)が
求められる。次に近似直線計算部2では(20)、
(21)式のように最小2乗近似直線の直交係数Tk
(a・i+b)が、入力パターンの直交係数Cf kよ
り求められる。さらに減算部3では、(22)式の
ように入力パターンの直交係数より最小2乗近似
直線の直交係数を差し引き、正規化特徴パラメー
タCg kが求められる。
第3図は直交変換部1としてフーリエ変換によ
る場合の具体的な一実施例を示すブロツク図であ
る。cosテーブル114はcos2kπ/n,k=0〜n −1すなわちcosの値をn個記憶しているテーブ
ルであり、sinテーブル118はsin2kπ/n,k=0 〜n−1すなわちsinの値をn個記憶しているテ
ーブルであり、直交変換制御部119より示され
る信号によりcos又はsinの値を乗算器111又は
115へ出力する。始めに直交変換部1へ入力さ
れた入力パターンfi,i=1〜nは入力メモリ1
10へ一時記憶される。記憶された後第4図に示
したタイミングチヤートに従つて直交変換制御部
119より信号i,ki,clが出力される。ここで
信号iは1よりnまで変化しそれがm回繰返され
る。さらに信号clは信号iが1となる直前に出さ
れる信号であり、信号kiにはR〔kxi,n〕(ただ
しR〔〕はnで割つた余りである)のi=1〜n,
k=1〜mまで変化した値が出力される。すなわ
ち1,2,…,2,3,…,3,6,…の値が出
力される。信号iに従つて入力メモリ110より
fiがi=0よりn−1まで順に読み出され乗算器
111と115へ出力される。また、信号kiに従
つてcosテーブル114とsinテーブル118より
cos2kiπ/nとsin2kiπ/nがそれぞれ読み出され、乗
算 器111と115へそれぞれ出力される。乗算器
111と115はそれぞれfi・cos2kiπ/nとfi・sin 2kiπ/nの乗算を行い、加算器112と116は乗 算器111と115の出力よりo 〓i=1 fi・cos2kiπ/nとo 〓i=1 fi・sin2kiπ/nをそれぞれ求める。すなわち、信 号iの値がnと一致した時点で、アキユムレータ
113と117にフーリエ係数の実部Re(Cf k)と
虚部Im(Cf k)が得られる。
る場合の具体的な一実施例を示すブロツク図であ
る。cosテーブル114はcos2kπ/n,k=0〜n −1すなわちcosの値をn個記憶しているテーブ
ルであり、sinテーブル118はsin2kπ/n,k=0 〜n−1すなわちsinの値をn個記憶しているテ
ーブルであり、直交変換制御部119より示され
る信号によりcos又はsinの値を乗算器111又は
115へ出力する。始めに直交変換部1へ入力さ
れた入力パターンfi,i=1〜nは入力メモリ1
10へ一時記憶される。記憶された後第4図に示
したタイミングチヤートに従つて直交変換制御部
119より信号i,ki,clが出力される。ここで
信号iは1よりnまで変化しそれがm回繰返され
る。さらに信号clは信号iが1となる直前に出さ
れる信号であり、信号kiにはR〔kxi,n〕(ただ
しR〔〕はnで割つた余りである)のi=1〜n,
k=1〜mまで変化した値が出力される。すなわ
ち1,2,…,2,3,…,3,6,…の値が出
力される。信号iに従つて入力メモリ110より
fiがi=0よりn−1まで順に読み出され乗算器
111と115へ出力される。また、信号kiに従
つてcosテーブル114とsinテーブル118より
cos2kiπ/nとsin2kiπ/nがそれぞれ読み出され、乗
算 器111と115へそれぞれ出力される。乗算器
111と115はそれぞれfi・cos2kiπ/nとfi・sin 2kiπ/nの乗算を行い、加算器112と116は乗 算器111と115の出力よりo 〓i=1 fi・cos2kiπ/nとo 〓i=1 fi・sin2kiπ/nをそれぞれ求める。すなわち、信 号iの値がnと一致した時点で、アキユムレータ
113と117にフーリエ係数の実部Re(Cf k)と
虚部Im(Cf k)が得られる。
第5図は近似直線計算部2の具体的構成を示す
ブロツク図である。直交変換部1よりの出力であ
るフーリエ係数の虚部Im(Cf k)k=1よりpまで
が、近似直線計算部2の入力メモリ210へ一時
記憶される。記憶された後、第6図に示したタイ
ミングチヤートに従つて近似直線計算制御部21
7より信号k,l,clが出力される。ここで信号
kはlよりmまで変化し、信号lは1よりmまで
変化する。信号clはアキユムレータ213をクリ
アする信号である。信号kに従つて入力メモリ2
10よりIm(Cf k)がk=1〜pまで順に読み出さ
れ、割算器211によつてIm(Cf k)/kが求めら
れ、加算器212とアキユムレータ213によつ
てその和であるn 〓K=1 Im(Cf k)/kが求められる。
さらに割算器214において定数メモリ215の
定数n 〓K=1 1/k2により割算され(20―a)式に示す近 似直線のパラメータaのn倍すなわちnaが求め
られる。続いて信号lに従つて割算器216の除
算へlが与えられその結果na/lがすなわち(21) 式に示す近似直線の直交係数の虚部が求められ
る。一方、近似直線の直交係数の実部は(21)式
に示されるようにゼロである。
ブロツク図である。直交変換部1よりの出力であ
るフーリエ係数の虚部Im(Cf k)k=1よりpまで
が、近似直線計算部2の入力メモリ210へ一時
記憶される。記憶された後、第6図に示したタイ
ミングチヤートに従つて近似直線計算制御部21
7より信号k,l,clが出力される。ここで信号
kはlよりmまで変化し、信号lは1よりmまで
変化する。信号clはアキユムレータ213をクリ
アする信号である。信号kに従つて入力メモリ2
10よりIm(Cf k)がk=1〜pまで順に読み出さ
れ、割算器211によつてIm(Cf k)/kが求めら
れ、加算器212とアキユムレータ213によつ
てその和であるn 〓K=1 Im(Cf k)/kが求められる。
さらに割算器214において定数メモリ215の
定数n 〓K=1 1/k2により割算され(20―a)式に示す近 似直線のパラメータaのn倍すなわちnaが求め
られる。続いて信号lに従つて割算器216の除
算へlが与えられその結果na/lがすなわち(21) 式に示す近似直線の直交係数の虚部が求められ
る。一方、近似直線の直交係数の実部は(21)式
に示されるようにゼロである。
第7図は減算部3の具体的構成を示すブロツク
図である。減算部3は(7)式に示すように直交変換
部1より出力される直交係数Tk(fi)より最小2
乗近似直線の直交係数Tk(a・i+b)を減算す
る部分である。はじめに直交係数Tk(fi)は直交
変換部1よりm個与えられ入力メモリ31へ一時
記憶される。また直交係数Tk(a・i+b)は近
似直線計算部2よりm個与えられ入力メモリ32
へ一時記憶される。記憶された後、減算制御部3
4より出力される信号kによつて、入力メモリ3
1と32よりそれぞれTk(fi)とTk(a・i+
b)が読み出され、減算器33にて減算され、正
規化されたパラメータTk(fi)−Tk(a・i+b)
が出力される。
図である。減算部3は(7)式に示すように直交変換
部1より出力される直交係数Tk(fi)より最小2
乗近似直線の直交係数Tk(a・i+b)を減算す
る部分である。はじめに直交係数Tk(fi)は直交
変換部1よりm個与えられ入力メモリ31へ一時
記憶される。また直交係数Tk(a・i+b)は近
似直線計算部2よりm個与えられ入力メモリ32
へ一時記憶される。記憶された後、減算制御部3
4より出力される信号kによつて、入力メモリ3
1と32よりそれぞれTk(fi)とTk(a・i+
b)が読み出され、減算器33にて減算され、正
規化されたパラメータTk(fi)−Tk(a・i+b)
が出力される。
また、第2の実施例は直交変換としてcos変換
が用いられる。はじめに直交変換部1では(23)
式のように入力パターンfiをcos変換し、直交係
数である特徴パラメータCf kが求められる。次に
近似直線計算部2で(24),(25)式のように最小
2乗近似直線の直交係数Tk(a・i+b)が、入
力パターンの直交係数Cf kより求められる。さら
に減算部3では(26)式のように入力パターンの
直交係数より最小2乗近似直線の直交係数を差し
引き、正規化特徴パラメータCk gが求められる。
が用いられる。はじめに直交変換部1では(23)
式のように入力パターンfiをcos変換し、直交係
数である特徴パラメータCf kが求められる。次に
近似直線計算部2で(24),(25)式のように最小
2乗近似直線の直交係数Tk(a・i+b)が、入
力パターンの直交係数Cf kより求められる。さら
に減算部3では(26)式のように入力パターンの
直交係数より最小2乗近似直線の直交係数を差し
引き、正規化特徴パラメータCk gが求められる。
第8図はcos変換を行う直交変換部1の具体的
構成を示すブロツク図である。この実施例は、第
1の実施例におけるフーリエ変換を行う直交変換
部1のsinテーブル118、sinの演算用の乗算器
115、加算器116、アキユムレータ117を
除いた構成となつている。動作は第1の実施例に
おけるフーリエ変換を行う直交変換部1と以下に
示す2点を除き同じ動作をする。第1の相異点は
cosテーブルに記憶されるcosの値にある。すなわ
ち、cosテーブル214はcoskπ/n,k=0〜2n− 1の2n個のcosの値を記憶しているテーブルであ
る。第2の相異点は信号kiにある。すなわち信号
kiはR〔kxi,2n〕(ただしR〔 〕は2nで割つた
余りである)のi=1〜n,k=1〜mまで変化
した値が出力される。
構成を示すブロツク図である。この実施例は、第
1の実施例におけるフーリエ変換を行う直交変換
部1のsinテーブル118、sinの演算用の乗算器
115、加算器116、アキユムレータ117を
除いた構成となつている。動作は第1の実施例に
おけるフーリエ変換を行う直交変換部1と以下に
示す2点を除き同じ動作をする。第1の相異点は
cosテーブルに記憶されるcosの値にある。すなわ
ち、cosテーブル214はcoskπ/n,k=0〜2n− 1の2n個のcosの値を記憶しているテーブルであ
る。第2の相異点は信号kiにある。すなわち信号
kiはR〔kxi,2n〕(ただしR〔 〕は2nで割つた
余りである)のi=1〜n,k=1〜mまで変化
した値が出力される。
第9図は、近似直線計算部2の具体的構成を示
すブロツク図である。直交変換部1よりの出力で
ある直交係数の奇数項Cf kk=1,3,…,pま
でが入力メモリ220へ一時記憶される。記憶さ
れた後、第10図に示したタイミングチヤートに
従つて近似直線計算制御部227より信号k,
k2,l2が出力される。ここで信号kは1よりpま
で奇数のみを取つて変化し、信号k2はk2の値が
出力され、信号l2にはl=1〜mまで奇数のみ取
つて変化するl2の値が出力される。信号clはアキ
ユムレータ223をクリアする信号である。信号
kに従つて入力メモリ220よりCf kの奇数項が
k=1,3,…,pまで順に読み出され、割算器
221によつてCk/k2が求められ、加算器22
2とアキユムレータ223によつてその和である
2P′-1 〓 〓K ′=1C2k′−1/(2k′−1)2(ただしk=2k′−1
,
m=2m′−1)が求められる。さらににに割算器
224において定数メモリ225の定数o 〓K=1 1/k4 {(−1)k−1}2により割算され(24)式に示す近
似直線のパラメータaの−n/2π倍すなわち−na/2π が求められる。続いて信号l2に従つて割算器22
6の除数へl2が与えられその結果−an/2l2πすなわち (25)式に示す近似直線の直交係数の奇数項が求
められる。一方、近似直線の直交係数の偶数項は
(25)式に示されるようにゼロである。
すブロツク図である。直交変換部1よりの出力で
ある直交係数の奇数項Cf kk=1,3,…,pま
でが入力メモリ220へ一時記憶される。記憶さ
れた後、第10図に示したタイミングチヤートに
従つて近似直線計算制御部227より信号k,
k2,l2が出力される。ここで信号kは1よりpま
で奇数のみを取つて変化し、信号k2はk2の値が
出力され、信号l2にはl=1〜mまで奇数のみ取
つて変化するl2の値が出力される。信号clはアキ
ユムレータ223をクリアする信号である。信号
kに従つて入力メモリ220よりCf kの奇数項が
k=1,3,…,pまで順に読み出され、割算器
221によつてCk/k2が求められ、加算器22
2とアキユムレータ223によつてその和である
2P′-1 〓 〓K ′=1C2k′−1/(2k′−1)2(ただしk=2k′−1
,
m=2m′−1)が求められる。さらににに割算器
224において定数メモリ225の定数o 〓K=1 1/k4 {(−1)k−1}2により割算され(24)式に示す近
似直線のパラメータaの−n/2π倍すなわち−na/2π が求められる。続いて信号l2に従つて割算器22
6の除数へl2が与えられその結果−an/2l2πすなわち (25)式に示す近似直線の直交係数の奇数項が求
められる。一方、近似直線の直交係数の偶数項は
(25)式に示されるようにゼロである。
さらに第2の実施例における減算部3は、第1
の実施例の減算部3と同一の構成をとることがで
きる。
の実施例の減算部3と同一の構成をとることがで
きる。
以上本発明を実施例に基づき説明したが、これ
らの記載は本発明の範囲を限定するものではな
い。特に本発明の原理の説明では最小2乗近似直
線のパラメータa,bを求める(10)〜(16)式にお
ける直交係数Tk(fi)と正規化操作を行う(7)式に
おける直交係数Tk(fi)は同一のものとしてある
が、最小2乗近似直線は複数の入力パターンの平
均より求める方法、すなわち(10)〜(16)式に用い
られるfiを複数の入力パターンの平均パターン
に置き換えて計算する方法も可能であることは明
白である。
らの記載は本発明の範囲を限定するものではな
い。特に本発明の原理の説明では最小2乗近似直
線のパラメータa,bを求める(10)〜(16)式にお
ける直交係数Tk(fi)と正規化操作を行う(7)式に
おける直交係数Tk(fi)は同一のものとしてある
が、最小2乗近似直線は複数の入力パターンの平
均より求める方法、すなわち(10)〜(16)式に用い
られるfiを複数の入力パターンの平均パターン
に置き換えて計算する方法も可能であることは明
白である。
第1図は本発明を説明するための原理図であ
り、第2図は本発明の実施例のブロツク図であ
り、第3図は第1の実施例の直交変換部1のブロ
ツク図であり、第4図は第3図に対応するタイミ
ングチヤートであり、第5図は第1の実施例の近
似直線計算部2のブロツク図であり、第6図は第
5図に対応するタイミングチヤートであり、第7
図は減算部3のブロツク図であり、第8図は第2
の実施例の直交変換部2のブロツク図であり、第
9図は第2の実施例の近似直線計算部2のブロツ
ク図であり、第10図は第9図に対応するタイミ
ングチヤートである。 図において1は直交変換部、2は近似直線計算
部、3は減算部であり、110と120は入力メ
モリ、111,115と121は乗算器、11
2,116と122は加算器、113,117と
123はアキユムレータ、114と124はcos
テーブル、118はsinテーブル、119と12
9は直交変換制御部であり、210と220は入
力メモリ、211,214,216,221,2
24,226は割算器、212と222は加算
器、213と223はアキユムレータ、215と
225は定数メモリ、217と227は近似直線
制御部であり、31と32は入力メモリ、33は
減算器、34は減算制御部である。
り、第2図は本発明の実施例のブロツク図であ
り、第3図は第1の実施例の直交変換部1のブロ
ツク図であり、第4図は第3図に対応するタイミ
ングチヤートであり、第5図は第1の実施例の近
似直線計算部2のブロツク図であり、第6図は第
5図に対応するタイミングチヤートであり、第7
図は減算部3のブロツク図であり、第8図は第2
の実施例の直交変換部2のブロツク図であり、第
9図は第2の実施例の近似直線計算部2のブロツ
ク図であり、第10図は第9図に対応するタイミ
ングチヤートである。 図において1は直交変換部、2は近似直線計算
部、3は減算部であり、110と120は入力メ
モリ、111,115と121は乗算器、11
2,116と122は加算器、113,117と
123はアキユムレータ、114と124はcos
テーブル、118はsinテーブル、119と12
9は直交変換制御部であり、210と220は入
力メモリ、211,214,216,221,2
24,226は割算器、212と222は加算
器、213と223はアキユムレータ、215と
225は定数メモリ、217と227は近似直線
制御部であり、31と32は入力メモリ、33は
減算器、34は減算制御部である。
Claims (1)
- 1 n次元の特徴パラメータからなる入力パター
ンを直交変換しm(m<n)個の直交係数を求め
る直交変換部と、直交変換前の領域における最小
2乗近似直線の直交係数をp(p<m)個の直交
係数より求める近似直線計算部と、前記近似直線
計算部より得られる最小2乗近似直線の直交係数
を入力パターンの直交係数から減算する減算部を
持つことを特徴とするパターン特徴抽出装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57079379A JPS58196595A (ja) | 1982-05-12 | 1982-05-12 | パタ−ン特徴抽出装置 |
| US07/061,009 US4837828A (en) | 1982-05-12 | 1987-06-11 | Pattern feature extracting system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57079379A JPS58196595A (ja) | 1982-05-12 | 1982-05-12 | パタ−ン特徴抽出装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58196595A JPS58196595A (ja) | 1983-11-16 |
| JPH021319B2 true JPH021319B2 (ja) | 1990-01-11 |
Family
ID=13688232
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57079379A Granted JPS58196595A (ja) | 1982-05-12 | 1982-05-12 | パタ−ン特徴抽出装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US4837828A (ja) |
| JP (1) | JPS58196595A (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60129800A (ja) * | 1983-12-16 | 1985-07-11 | 沖電気工業株式会社 | 音声認識方式 |
| GB2158980B (en) * | 1984-03-23 | 1989-01-05 | Ricoh Kk | Extraction of phonemic information |
| JPS62138900A (ja) * | 1985-12-12 | 1987-06-22 | 日本電気株式会社 | 正規化ケプストラム分析装置 |
| DE4229577A1 (de) * | 1992-09-04 | 1994-03-10 | Daimler Benz Ag | Verfahren zur Spracherkennung mit dem eine Anpassung von Mikrofon- und Sprachcharakteristiken erreicht wird |
| JP2797949B2 (ja) * | 1994-01-31 | 1998-09-17 | 日本電気株式会社 | 音声認識装置 |
| DE4405723A1 (de) * | 1994-02-23 | 1995-08-24 | Daimler Benz Ag | Verfahren zur Geräuschreduktion eines gestörten Sprachsignals |
| US6496795B1 (en) * | 1999-05-05 | 2002-12-17 | Microsoft Corporation | Modulated complex lapped transform for integrated signal enhancement and coding |
| US7010167B1 (en) | 2002-04-30 | 2006-03-07 | The United States Of America As Represented By The National Security Agency | Method of geometric linear discriminant analysis pattern recognition |
| US8306817B2 (en) * | 2008-01-08 | 2012-11-06 | Microsoft Corporation | Speech recognition with non-linear noise reduction on Mel-frequency cepstra |
| CN106548472A (zh) * | 2016-11-03 | 2017-03-29 | 天津大学 | 基于沃尔什哈达玛变换的无参考图像质量评价方法 |
| US12175965B2 (en) * | 2019-07-30 | 2024-12-24 | Dolby Laboratories Licensing Corporation | Method and apparatus for normalizing features extracted from audio data for signal recognition or modification |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4032711A (en) * | 1975-12-31 | 1977-06-28 | Bell Telephone Laboratories, Incorporated | Speaker recognition arrangement |
| US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
| US4520500A (en) * | 1981-05-07 | 1985-05-28 | Oki Electric Industry Co., Ltd. | Speech recognition system |
-
1982
- 1982-05-12 JP JP57079379A patent/JPS58196595A/ja active Granted
-
1987
- 1987-06-11 US US07/061,009 patent/US4837828A/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| US4837828A (en) | 1989-06-06 |
| JPS58196595A (ja) | 1983-11-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2731372C2 (ru) | Способ и система для разложения акустического сигнала на звуковые объекты, а также звуковой объект и его использование | |
| Wang et al. | Chip design of MFCC extraction for speech recognition | |
| US20110058685A1 (en) | Method of separating sound signal | |
| CN109785854A (zh) | 一种经验模态分解和小波阈值去噪相结合的语音增强方法 | |
| JPH021319B2 (ja) | ||
| EP0128298B1 (en) | Orthogonal transformer and apparatus operational thereby | |
| US6711596B1 (en) | Method and apparatus for determining the approximate valve of a logarithmic function | |
| Queffélec et al. | On Bernstein’s inequality for polynomials | |
| WO2016009654A1 (ja) | 雑音抑圧システムと雑音抑圧方法及びプログラムを格納した記録媒体 | |
| US5677984A (en) | Complex cepstrum analyzer for speech signals | |
| JPS6152479B2 (ja) | ||
| Hammam et al. | Blind signal separation with noise reduction for efficient speaker identification | |
| Al-Hayani et al. | The Adomian decomposition method in turning point problems | |
| US11611839B2 (en) | Optimization of convolution reverberation | |
| CA1270568A (en) | Formant pattern matching vocoder | |
| US9268745B2 (en) | Method for fast wavelet transform of a signal | |
| CN113571084A (zh) | 音频处理方法、装置、设备及存储介质 | |
| D'haes et al. | Discrete cepstrum coefficients as perceptual features | |
| JPH0235992B2 (ja) | ||
| US20050004965A1 (en) | Logarithmic arithmetic system | |
| JP3338573B2 (ja) | サブバンド分割演算回路 | |
| JPH113094A (ja) | ノイズ除去装置 | |
| Boikov et al. | Recovering the input signals of discrete dynamical systems | |
| JPH06175691A (ja) | 音声強調装置と音声強調方法 | |
| Nevai et al. | Christoffel functions for weights with jumps |