JPH027080B2 - - Google Patents

Info

Publication number
JPH027080B2
JPH027080B2 JP58069473A JP6947383A JPH027080B2 JP H027080 B2 JPH027080 B2 JP H027080B2 JP 58069473 A JP58069473 A JP 58069473A JP 6947383 A JP6947383 A JP 6947383A JP H027080 B2 JPH027080 B2 JP H027080B2
Authority
JP
Japan
Prior art keywords
walsh
transform
log
spectrum
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58069473A
Other languages
English (en)
Other versions
JPS59195285A (ja
Inventor
Masao Watari
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58069473A priority Critical patent/JPS59195285A/ja
Publication of JPS59195285A publication Critical patent/JPS59195285A/ja
Publication of JPH027080B2 publication Critical patent/JPH027080B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は簡易形音声分析装置の改良に関する。
通常、音声認識装置では、音声波形を分析し、
その分析出力である特徴パラメータの時系列とあ
らかじめ記憶されているパターンとの間で識別計
算を行い、認識結果を求めている。従来、この音
声認識装置に使用されている音声分析としてバン
ドパスフイルタ分析やケプストラム分析や変形ケ
プストラム分析があつた。
音声波は声帯の振動によつて励振された声道か
らの放射出力であると考えることができ、音声信
号G(t)は(1)式のように声道のインパルス応答
R(t)と音源波形S(t)の畳み込みで表わされ
る。
G(t)=R(t)*S(t) ……(1) *は畳み込み操作 (1)式をフーリエ変換すると Gf(ω)=Rf(ω)×Sf(ω) ……(2) となる。音源特性Sf(ω)は周期的な線スペクト
ラムであり、声道特性Rf(ω)は音声スペクトル
Gf(ω)のエンベロープである。このエンベロー
プを得る方法として一定値以上の帯域幅を持つた
バンドパスフイルタを音声帯域内に複数個並べる
バンドパスフイルタ分析がある。一定値以上の帯
域幅を持つことにより音源特性である線スペクト
ルの影響を弱くし複数個並べることによりエンベ
ロープの全体の特性すなわち声道特性を得ること
ができていた。
ところで、より精密な声道特性を得るために
は、バンドパスフイルタの帯域幅を細くする必要
があるが、細くすると音源スペクトルである線ス
ペクトルの影響が大きく表われてくる。このため
バンドパスフイルタの帯域幅はある程度以上細く
することはできず、バンドパスフイルタ分析では
より精密な声道特性を得ることはできなかつた。
一方、声道特性と音源特性を分離し、より精密
な声道特性を求める方法としてケプストラム分析
がある。
ケプストラム分析では、(2)式をさらにlog変換
し、 log|Gf(ω)|=log|Rf(ω)|+log|Sf
(ω)|……(3) 次に逆フーリエ変換によつてケプストラムを得
る。
Gc(q)=Rc(q)+Sc(q) ……(4) この(4)式のように、スペクトラム領域での積が
ケプストラム領域では和となる。音源スペクトル
Sf(ω)である周期的な線スペクトルのケプスト
ラムSc(q)は音源の周期Tpの近傍にのみ表われ
る。一方、声道スペクトルRf(ω)はGf(ω)の
エンベロープとして表われ、そのケプストラム
Rc(q)は低ケフレンシ部へ表われる。すなわ
ち、音声信号をケプストラム分析し、ケフレンシ
の低い成分に音源特性より分離された声道特性を
得ることができる。
さらに特願昭56−069031号明細書(特開昭57−
185098号公報)に記載されているように音声のス
ペクトルの中より帯域内の周波数成分のみを切出
しゼロ周波数までシフトする切出し部を設けるこ
とにより、伝送路の帯域外の特性の影響を除去す
ることができる。また、周波数の高域部を圧縮す
る写像関数による周波数軸のスケール変換例えば
logスケール変換、Melスケール変換などを行う
スケール変換部を設けることにより、高域より低
域へ重みが置かれたすなわち人間の聴覚特性に近
い特性を持つた変形ケプストラムが得られる。前
記スケール変換は第1図に示すような写像関数
Sn=M(Sl)により、伝送路の帯域内のみのデー
タをlogスケールまたはMelスケールへ並び換え
ることである。すなわちSl番目のスペクトルをSn
番目の変形スペクトルとすることである。
しかしながら、前記のバンドパスフイルタ分析
やケプストラム分析や変形ケプストラム分析は、
フーリエ変換を基本としており三角関数系との乗
算を必要とし装置が大型となる欠点があつた。
一方、フーリエ変換の近似的な変換であるウオ
ルシユ変換は±1の2値の直交関数系による変換
であるため、ウオルシユスペクトルは加減算のみ
で求めることができる。このウオルシユ変換を用
いることにより特開昭57−700号公報に記載され
ているように小型の疑似バンドパスフイルタを実
現することが知られている。しかし疑似バンドパ
スフイルタではより細かで精密な声道特性を得ら
れない欠点があつた。
本発明の目的は、ケプストラム分析におけるフ
ーリエ変換をウオルシユ変換へ置き換えることに
より、ケプストラムの近似値を得る小型の装置、
すなわち、より細かで精密な声道特性が得られか
つ小型の音声分析装置を提供することにある。
本発明による音声分析装置は、入力信号のウオ
ルシユ変換を行うウオルシユ変換部と、前記ウオ
ルシユ変換部の出力よりウオルシユパワースペク
トルを求めそのlog変換を行うlog変換部と、ウオ
ルシユ交番数軸のスケール変換を行う写像関数
Sn=M(Sl)により前記log変換部の出力を変形交
番数軸へ写像するスケール変換部と、前記スケー
ル変換部の出力の逆フーリエ変換を行う逆フーリ
エ変換部を有している。
次に本発明で使用するウオルシユ変換について
説明する。
ウオルシユ変換は(5)式で定義されるが、 W=Hi・X ……(5) ただしWはウオルシユスペクトル Xは入力列ベクトル Hiはウオルシユ変換行列であり HiHi-1H1 H1=1 1 1−1 にて求められる。(はクロネツカ積) (5)式を高速に計算する方法である高速ウオルシ
ユ変換(FWTと略称する)が、昭和51年12月電
子通信学会論文試Vol59−A、No.12の第1134頁よ
り第1135頁までの「フーリエ変換とウオルシユ変
換に関する一検討」に記載されている。
入力時系列を逆2進順に並べた列ベクトルを
X、ウオルシユスペクトルをW、変換行列をCと
すれば、 FWTは、 W=C・X =Go・Go-1……G1・X ……(6) とn回の行列の積として表現できる。ここで各Gi
は(7)、(8)、(9)式より決定される。
ただしIiは2i行2i列の単位行列であり、diag( )
は括孤内を対角要素とする対角行列である。ここ
で逆2進順とは自然数を2進表現し、その桁を逆
転させた数と考え、その数の順序に並べることで
あり、n=3の場合X=(X0X4X2X6X1X5X3X7
となる。さらに各Gi となる。
前記の行列Giの各行ともゼロでない要素は2つ
のみであり高速フーリエ変換で用いられるバタフ
ライ演算と同形の演算を表現している。ただし、
その要素は±のみであるため加減算のみで実行で
きる。またウオルシユスペクトルはW=
(W0W2W4W6W7W5W3W1)として求められる。
本発明の音声分析装置は、ケプストラム分析に
おけるフーリエ変換をウオルシユ変換へ置き換え
ることにより、加減算器による簡単な演算器で構
成できる利点を持つている。さらにウオルシユ変
換を用いた疑似バンドパスフイルタ分析装置に比
較し、より細かで精密な声道特性が得られる利点
を持つている。
次に本発明の装置の具体的な構成を図面を参照
しながら説明する。
本発明の実施例は第2図に示すように、第1バ
ツフアメモリ部1、ウオルシユ演算部2、ウオル
シユ変換制御部3、log変換部4、スケール変換
部5、第2バツフアメモリ部6、逆フーリエ演算
部7、逆フーリエ変換制御部8より構成される。
始めに入力時系列データが第1バツフアメモリ部
1へ入力され一時記憶される。記憶された後、第
4図に示したn=4の場合の計算の流れ図に従つ
たウオルシユ変換制御部3の制御信号により、第
1段より第n段まで計算が進められる。第i段の
処理は、第4図に示した第i段の2n-1個のバタフ
ライ演算を実行することであり、(7)式のGiの行列
を乗ずることを意味している。
バタフライ演算は Ya=Xa+Xb Yb=Xa−Xb ……(10) または Ya=Xa−Xb Yb=Xa+Xb ……(11) であり、第3図に示すウオルシユ演算部2にて求
められる。バタフライ演算では始めにXa、Xbが
第1バツフアメモリ部1より読み出され、レジス
タ201,202へそれぞれ一時格納される。加
算器211と減算器212にて(10)または(11)式の加
減算が求められ、その結果であるYa、Ybは第1
バツフアメモリ部1のXa、Xbが記憶されていた
場所へ書かれる。すなわち(10)式を選択した場合、
加算器211の出力は第1バツフアメモリ部1の
Xaが記憶されていた場所へ書かれ、減算器21
2の出力はXbの場所へ書かれる。また(11)式を選
択した場合は、加算器211の出力はXbの場所
へ書かれ、減算器212の出力はXaの場所へ書
かれる。この(10)または(11)式の選択は第1ウオルシ
ユ変換制御部によつて行われる。最終段である第
n段まで前記処理が終了すると、第1バツフアメ
モリ1にウオルシユスペクトラムが得られる。
ウオルシユ変換が終了した後、第5図に示す
log変換部4とスケール変換部5によつて、logパ
ワーウオルシユスペクトルが求められ、スケール
変換を行う写像関数Sn=M(Sl)により変形交番
数軸へ写像を行う。すなわち、スケール変換制御
部51は第6図に示すタイムチヤートに従つた制
御信号を発し、始めに第1バツフアメモリ部1よ
り信号a1に従つてウオルシユスペクトルの偶数
項W2iと奇数項W2i+1を順次読み出し、log変換部
4の乗算器41で2乗され加算器42とアキユム
レータ43を用いてパワーウオルシユスペクトル
(Pi=W2 2i+W2 2i+1)が求められ、つづいてlog変換
部4にてlog変換され、信号a2をアドレスとし
て指示された写像関数値M(i)を写像関数テー
ブルメモリ部52より読み出し、その出力M(i)
を第2バツフアメモリ部6のアドレス信号a3と
してlogパワーウオルシユスペクトル(logPi)を
第2バツフアメモリ部6のM(i)番地へ格納す
る。
ところで、通常音声認識ではケプストラムの低
次の項のみを使用するため、逆フーリエ変換は低
次の項のみ計算すればよい。
すなわち、 WkN-1l=0 Ckl・Xl ……(12) ただし、N=2n、CKl=exp(2πkl/N)j のkの小さい項について計算する。ここでさらに
Xlは偶関数であるので(12)式の虚数部はゼロとな
り、Cklの代りにCklの実数部であるC′kl=cos
(2πkl/N)を使用すればよい。
WkN-1l=0 C′kl・Xl ……(13) (13)式にて計算される逆フーリエ変換は第7
図に示した第2バツフアメモリ部6、逆フーリエ
演算部7、逆フーリエ変換制御部8にて実行され
る。すなわち、逆フーリエ変換制御部8は第8図
に示すタイムチヤートに従つた制御信号を発し、
信号Cl7によつてアキユムレータ72をクリヤ
し、信号b1に従つて第2バツフアメモリ部6よ
り変形logパワーウオルシユスペクトルXl
logPM(i)を順次読み出し、MOD(kl、N)すなわ
ちklをNで割つた余りの値で指示されるアドレス
信号である信号b2に従いcosテーブルメモリ7
4よりC′klを読み出し、乗算器71にてC′kl、Xl
を求め、加算器72とアキユムレータ73によつ
てその和を求める。信号b1がN−1となつた時
アキユムレータ73に逆フーリエ変換値Wkすな
わち疑似ケプストラムが得られる。
以上本発明を実施例に基づき説明したが、これ
らの記載は本発明の範囲を限定するものではな
い。特に本発明の実施例ではFWTのアルゴリズ
ムとして(6)式に示すように入力時系列を逆2進順
に並べG1よりGoまで順次積を取り求めていたが、
(13)式に示すような正順序の時系列X′をGo T
りG1 Tまで順次積を取りその結果として逆2進順
のウオルシユスペクトルW′を得る方法も採用で
きることは明白である。
W′=G1 T・G2 T……Go T・X′ ……(13) また、パワースペクトルをPi=W2 2i+W2 2i+1とし
て求めているが、乗算器を必要としているためPi
=|W2i|+W|2i+1|のように絶対値の和として
パワースペクトルを近似的に求める方法も採用で
きることは明白である。
【図面の簡単な説明】
第1図はスケール変換を示す図であり、第2図
は本発明の実施例のブロツク図であり、第3図は
ウオルシユ演算部2のブロツク図であり、第4図
はウオルシユ変換の計算の流れ図であり、第5図
はlog変換部4とスケール変換部5のブロツク図
であり、第6図はスケール変換のタイムチヤート
であり、第7図は逆フーリエ演算部7のブロツク
図であり、第8図は逆フーリエ変換のタイムチヤ
ートである。 図において、1は第1バツフアメモリ部、2は
ウオルシユ演算部、3はウオルシユ変換制御部、
4はlog変換部、5はスケール変換部、6は第2
バツフアメモリ部、7は逆フーリエ演算部、8は
逆フーリエ変換制御部、201,202はレジス
タ、211は加算器、212は減算器である。第
5図において41は乗算器、42は加算器、43
はアキユムレータ、44はlog変換器、51はス
ケール変換制御部、52は写像関数テーブルメモ
リ、71は乗算器、72は加算器、73はアキユ
ムレータ、74はcosテーブルメモリ部である。

Claims (1)

    【特許請求の範囲】
  1. 1 入力信号のウオルシユ変換を行うウオルシユ
    変換部と、前記ウオルシユ変換部の出力よりウオ
    ルシユパワースペクトルを求めそのlog変換を行
    うlog変換部と、ウオルシユ交番数軸のスケール
    変換を行う写像関数Sm=M(Sl)により前記log
    変換部の出力を変形交番数軸へ写像するスケール
    変換部と、前記スケール変換部の出力の逆フーリ
    エ変換を行う逆フーリエ変換部とを持つことを特
    徴とする音声分析装置。
JP58069473A 1983-04-20 1983-04-20 音声分析装置 Granted JPS59195285A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58069473A JPS59195285A (ja) 1983-04-20 1983-04-20 音声分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58069473A JPS59195285A (ja) 1983-04-20 1983-04-20 音声分析装置

Publications (2)

Publication Number Publication Date
JPS59195285A JPS59195285A (ja) 1984-11-06
JPH027080B2 true JPH027080B2 (ja) 1990-02-15

Family

ID=13403677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58069473A Granted JPS59195285A (ja) 1983-04-20 1983-04-20 音声分析装置

Country Status (1)

Country Link
JP (1) JPS59195285A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05155357A (ja) * 1991-12-06 1993-06-22 Nissan Motor Co Ltd 自動車の樹脂製フロントフェンダー

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05155357A (ja) * 1991-12-06 1993-06-22 Nissan Motor Co Ltd 自動車の樹脂製フロントフェンダー

Also Published As

Publication number Publication date
JPS59195285A (ja) 1984-11-06

Similar Documents

Publication Publication Date Title
US5502747A (en) Method and apparatus for filtering an electronic environment with improved accuracy and efficiency and short flow-through delay
EP3236587B1 (en) Filter system comprising a filter converter and a filter compressor and method for operating the filter system
EP0128298B1 (en) Orthogonal transformer and apparatus operational thereby
JPH027080B2 (ja)
JPS6145408B2 (ja)
JPH0219478B2 (ja)
US20200090637A1 (en) Method and system for implementing a modal processor
JPH08328593A (ja) スペクトル分析方法
JP3830106B2 (ja) 広帯域ディジタル信号の信号スペクトルを規定し、かつこの信号スペクトルに応じてビット配置情報を得る機構
JPH0318720B2 (ja)
JPH0219477B2 (ja)
JPS59195288A (ja) 音声分析装置
JPH0587619A (ja) 音抽出方法及び装置
HK40113578A (en) Filter system comprising a filter converter and a filter compressor and method for operating the filter system
SU1462354A1 (ru) Устройство дл быстрого действительного преобразовани Фурье
CN119400198A (zh) 非负矩阵分解与深度学习的降噪方法、装置、介质及设备
JPS58149098A (ja) デ−タ変換方式
Kunt et al. An overview of digital techniques for processing speech signals
JPH0669741A (ja) D/a変換処理方法
Kunt et al. smrnon SIGNALS'
JPS616698A (ja) 疑似バンドパスフイルタ分析装置
JPH0248917B2 (ja)
JPH04355391A (ja) 模擬信号発生装置
Hugli Signal Procesing Laboratory Swiss Federal Institute of Technology
JPH04324899A (ja) 反射音圧縮装置