JPS6057398A - 正規化方法 - Google Patents
正規化方法Info
- Publication number
- JPS6057398A JPS6057398A JP58166232A JP16623283A JPS6057398A JP S6057398 A JPS6057398 A JP S6057398A JP 58166232 A JP58166232 A JP 58166232A JP 16623283 A JP16623283 A JP 16623283A JP S6057398 A JPS6057398 A JP S6057398A
- Authority
- JP
- Japan
- Prior art keywords
- power
- frame
- normalization
- voice
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声認識に使用する音声の特徴パラメータの正
規化方法に関するものである。
規化方法に関するものである。
従来例の構成とその問題点
従来の音声認識においては、まず音声信号をバントハス
フィルりで構成されるフィルタパンクに通し各バンドパ
スフィルタ出力のパワーを10m5ec〜20m5ec
(以後この間隔をフレームと呼ぶ)毎にめている。次
に、フレーム毎に各バンドパスフィルタ出力のパワーを
全チャンネルのパワーの総和によって正規化し、この正
規化された各チャンネ/L/値の1フレ一ム間のパワー
を音声の特徴がパラメータとしていた。この正規化方法
は、jフレームのiチャンネルの正規化されたパワーを
PM(i。
フィルりで構成されるフィルタパンクに通し各バンドパ
スフィルタ出力のパワーを10m5ec〜20m5ec
(以後この間隔をフレームと呼ぶ)毎にめている。次
に、フレーム毎に各バンドパスフィルタ出力のパワーを
全チャンネルのパワーの総和によって正規化し、この正
規化された各チャンネ/L/値の1フレ一ム間のパワー
を音声の特徴がパラメータとしていた。この正規化方法
は、jフレームのiチャンネルの正規化されたパワーを
PM(i。
j)とすると次式のように表わされる。
(i−1,2,・・M) ・・・(1)&りl、、iハ
バンドバスフィルタのチャンネル、P(i、j)ハjフ
レームのiチャンネルのパワー、Mはバンドパスフィル
タのチャンネルの総数でるる。
バンドバスフィルタのチャンネル、P(i、j)ハjフ
レームのiチャンネルのパワー、Mはバンドパスフィル
タのチャンネルの総数でるる。
従来のこのような正規化は発声の大小変化によって生ず
る音声のフレーム、パワーの!化を吸収する手段として
用いられていたが、音声に騒音が重畳した場合に次のよ
うな問題点が生じる。
る音声のフレーム、パワーの!化を吸収する手段として
用いられていたが、音声に騒音が重畳した場合に次のよ
うな問題点が生じる。
あるフレームの音声パワーが小孕い場合、(工)式の分
母は音声に重畳した騒音のパワーのために沃化を受けや
すい。したがって(1)式によって正規化した値PN(
II3)はPN(1,3)、PN(2,j)・・・、
PN(fvlj)のすべてが本来の音声の特徴とは異な
ってしまう。
母は音声に重畳した騒音のパワーのために沃化を受けや
すい。したがって(1)式によって正規化した値PN(
II3)はPN(1,3)、PN(2,j)・・・、
PN(fvlj)のすべてが本来の音声の特徴とは異な
ってしまう。
第1図は、ある単語を発生した場合の各フィルり出力の
フレームパワーの時間変化を示している。
フレームパワーの時間変化を示している。
第2図は騒音としてホヌノイズが音声に重畳した場合の
各フィルタ出力のフレームパワーの時間変化である。第
3図は@1図に示した各フィルり出力のパワーに(1)
式の正規化を施こした場合の正規化後のパワーの時間変
化を示している。第4図は第3図に示しだパワーに(1
)式の正規化を行なった後のパワーの時間灰化を示して
いる。
各フィルタ出力のフレームパワーの時間変化である。第
3図は@1図に示した各フィルり出力のパワーに(1)
式の正規化を施こした場合の正規化後のパワーの時間変
化を示している。第4図は第3図に示しだパワーに(1
)式の正規化を行なった後のパワーの時間灰化を示して
いる。
騒音が重畳した場合の正規化後のパワーの時間変化(第
4図)と無騒音時(第3図)の正規化後のパワ一時間変
化を比較すると、音声パワーの小さいフレーム(図中の
矢じるし)が変形していることがわかる。また、騒音の
影響を受けやすい音声のパワーの小さいフレームで正規
化後のパワーが大きく表現されている。
4図)と無騒音時(第3図)の正規化後のパワ一時間変
化を比較すると、音声パワーの小さいフレーム(図中の
矢じるし)が変形していることがわかる。また、騒音の
影響を受けやすい音声のパワーの小さいフレームで正規
化後のパワーが大きく表現されている。
したがって従来の正規化方法によってめた音声パワーを
その音声の特徴パターンとしてDPマツチングを行なう
と、騒音が音声に重畳した場合に、音声のパワーの小さ
いフレームの正規化されたパワーと標準音声の対応する
フレームの正規化されたパワーの間のフレーム距離が大
きくなる。このためにフレーム距離の累積和として得ら
れる標準音声と入力音声の間のDPマツチング距離が増
大してしまう欠点があった。
その音声の特徴パターンとしてDPマツチングを行なう
と、騒音が音声に重畳した場合に、音声のパワーの小さ
いフレームの正規化されたパワーと標準音声の対応する
フレームの正規化されたパワーの間のフレーム距離が大
きくなる。このためにフレーム距離の累積和として得ら
れる標準音声と入力音声の間のDPマツチング距離が増
大してしまう欠点があった。
発明の目的
本発明は、上記従来例の欠点を除去するもので、発′声
の大小変化による音声パラメータの灰化を吸収し、騒音
の影響を受けにくい正規化方法を提供することを目的と
するものである。
の大小変化による音声パラメータの灰化を吸収し、騒音
の影響を受けにくい正規化方法を提供することを目的と
するものである。
発明の構成
本発明は、上記目的を達成するために、汁声の特徴パラ
メータとして各フィルり出力のフレームパワーの時系列
値の形状をそのまま用い、DPマツチングの際に対応す
るフレーム距離を算出する時点で、標準音声の全フィル
り出力のパワー値を定数倍するととで正規化を行なうも
のである。定数倍する定数は、DPマツチングの際のフ
レーム距離を算出する時に、標準とする音声のフレーム
のパワー値が最大となるチャンネルの値と入力音声の対
応するチャンネルのパワー値が等しくなるように定める
。このような正規化によると、パワーの小さいフレーム
のパワー値はパワーの大きいフレームのパワー値と比較
して小さく表現されるために、騒音の影響を受けやすい
パワーの小さいフレーム間の距離がDPマツチング距離
に与える影響を小さくすることができる。また、パワー
の最大となるチャンネルに注目しているために、この正
規化は騒音の影暢を受けにくい。したがって、本発明に
よる正規化方法は、DPマツチング距離に与える騒音の
影響を小さくする効果がある。
メータとして各フィルり出力のフレームパワーの時系列
値の形状をそのまま用い、DPマツチングの際に対応す
るフレーム距離を算出する時点で、標準音声の全フィル
り出力のパワー値を定数倍するととで正規化を行なうも
のである。定数倍する定数は、DPマツチングの際のフ
レーム距離を算出する時に、標準とする音声のフレーム
のパワー値が最大となるチャンネルの値と入力音声の対
応するチャンネルのパワー値が等しくなるように定める
。このような正規化によると、パワーの小さいフレーム
のパワー値はパワーの大きいフレームのパワー値と比較
して小さく表現されるために、騒音の影響を受けやすい
パワーの小さいフレーム間の距離がDPマツチング距離
に与える影響を小さくすることができる。また、パワー
の最大となるチャンネルに注目しているために、この正
規化は騒音の影暢を受けにくい。したがって、本発明に
よる正規化方法は、DPマツチング距離に与える騒音の
影響を小さくする効果がある。
実施例の説明
以下に本発明の一実施例について図面とともに説明する
。第5図は本発明の正規化方法の実施例全説明する図で
ある。ここで、パンドバスフィρりをim Lだ標準音
声Sの1番目のフレームのパワを表わすベクトルをSi
とする。ただしSr = (S(i、1)、S(i、2
)・・・+ s(1,M) JT ・・・(2)M:バ
ンドバスフィルりのチャンネlVm数S(i、1)〜S
(i、M) : 1〜Mfτンネルのiフレームのパワ
ーである。
。第5図は本発明の正規化方法の実施例全説明する図で
ある。ここで、パンドバスフィρりをim Lだ標準音
声Sの1番目のフレームのパワを表わすベクトルをSi
とする。ただしSr = (S(i、1)、S(i、2
)・・・+ s(1,M) JT ・・・(2)M:バ
ンドバスフィルりのチャンネlVm数S(i、1)〜S
(i、M) : 1〜Mfτンネルのiフレームのパワ
ーである。
同様に、バンドバスフィルりを通した入力音声のjt&
目のフレームのパワーを表わすペクト/し全Ujとする
。ただし Uj = (U(j、1)、U(j、2)・・・、U(
j、M)” ・・・(3)M:バンドバスフィルりのチ
ャンネ/’総1U(j、1)〜U(j、Δ():1〜M
チャンネルのjフレームのパワーである。
目のフレームのパワーを表わすペクト/し全Ujとする
。ただし Uj = (U(j、1)、U(j、2)・・・、U(
j、M)” ・・・(3)M:バンドバスフィルりのチ
ャンネ/’総1U(j、1)〜U(j、Δ():1〜M
チャンネルのjフレームのパワーである。
DPマツチングは2つの音声の類似度りを各音声から抽
出したパラメータg(i、j)を用いてめる方法である
。類似度りは以下の漸化式計算によって算出する。ここ
でd(i、j)はフレーム距離である。
出したパラメータg(i、j)を用いてめる方法である
。類似度りは以下の漸化式計算によって算出する。ここ
でd(i、j)はフレーム距離である。
d(i、j)−ΣIU(j、k) −L(i、j)XS
(i、k) l ・・・(5)k=1 g(i、j)−oO(j・、40 or 140) −
=<6)g(1,1)=ΣIU(1,k)−L(1,1
)XS(1,k) I ・・・(7)k=+ (5)式をg(1,J)まで計算し、D=g(1,J)
lCx+J>が標準音声Sと入力音声Uの類似度である
。1.Jはそれぞれ標準音声Sと入力音声Uのフレーム
長である。・ ここで、L(i、j)は発声の大小変化によって変化す
るバンドパスフィルタ出力のフレームパワーを正規化す
る定数で、フレーム距離d(i、j)の演算毎に以下の
様に決定する。
(i、k) l ・・・(5)k=1 g(i、j)−oO(j・、40 or 140) −
=<6)g(1,1)=ΣIU(1,k)−L(1,1
)XS(1,k) I ・・・(7)k=+ (5)式をg(1,J)まで計算し、D=g(1,J)
lCx+J>が標準音声Sと入力音声Uの類似度である
。1.Jはそれぞれ標準音声Sと入力音声Uのフレーム
長である。・ ここで、L(i、j)は発声の大小変化によって変化す
るバンドパスフィルタ出力のフレームパワーを正規化す
る定数で、フレーム距離d(i、j)の演算毎に以下の
様に決定する。
L(i、 j) =U(j、K)/max is(i、
k) ;に=1 、2 、−、Mf −(8)ただし、
KはIs(+、k) + k=1+2+ ”’+Mlが
maxとなるkである。
k) ;に=1 、2 、−、Mf −(8)ただし、
KはIs(+、k) + k=1+2+ ”’+Mlが
maxとなるkである。
発明の効果
以上本発明によれば、次のような効果が得られる。
標準音声と同一の音声を発声した場合に、音声に騒音が
重畳すると騒音の影響でバンドパスフィルタ出力のフレ
ームパワーは変化するが、本発明による正規化によれば
、フィルり出力のフレームパワー値の時間変化の形が特
徴パラメータとなるために、全体の形状の変化は少ない
。したがって、DPマツチング距離におよぼす騒音の影
響が小さい。
重畳すると騒音の影響でバンドパスフィルタ出力のフレ
ームパワーは変化するが、本発明による正規化によれば
、フィルり出力のフレームパワー値の時間変化の形が特
徴パラメータとなるために、全体の形状の変化は少ない
。したがって、DPマツチング距離におよぼす騒音の影
響が小さい。
また、発声の大小によるパワーの変化も本発明による正
規化によって標準音声と同形になるため、吸収できる利
点を有する。
規化によって標準音声と同形になるため、吸収できる利
点を有する。
第1図はある音声をバンドパスフィルりを通した場合の
チャンネル毎の10m5ec間のパワー変化を示した図
、第2図は第1図の音声にホスノイズが重畳した場合の
各チャンネル毎の10m5ec間のパワー変化を示した
図、第3図は第1図に示したパワーに従来の正規化をほ
どこした場合の正規化後のパワー変化を示した図、第4
図は第2図に示しだパワーに従来の正規化をほどこした
場合の正規化後のパワー変化を示した図、第5図はDP
マνチングの手順を示す図である。 (S)・・・標準音声、(U)・・・入力音声代理人
森 本 省 弘 第1図 一時間 第2図 ″′″″峙問 第3図 第4図 −峙問
チャンネル毎の10m5ec間のパワー変化を示した図
、第2図は第1図の音声にホスノイズが重畳した場合の
各チャンネル毎の10m5ec間のパワー変化を示した
図、第3図は第1図に示したパワーに従来の正規化をほ
どこした場合の正規化後のパワー変化を示した図、第4
図は第2図に示しだパワーに従来の正規化をほどこした
場合の正規化後のパワー変化を示した図、第5図はDP
マνチングの手順を示す図である。 (S)・・・標準音声、(U)・・・入力音声代理人
森 本 省 弘 第1図 一時間 第2図 ″′″″峙問 第3図 第4図 −峙問
Claims (1)
- 1 標準音声から抽出したパラメータを要素とするベク
トルSの最も大きな要素Sjと、別の入力音声から同様
の手順で抽出したパラメータを要素とするベク)/しU
の要XUiで1.LX5i = Uiとなる様な値りを
Sに乗じてS、Uを正規化する正規化方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58166232A JPS6057398A (ja) | 1983-09-08 | 1983-09-08 | 正規化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58166232A JPS6057398A (ja) | 1983-09-08 | 1983-09-08 | 正規化方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6057398A true JPS6057398A (ja) | 1985-04-03 |
Family
ID=15827557
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58166232A Pending JPS6057398A (ja) | 1983-09-08 | 1983-09-08 | 正規化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6057398A (ja) |
-
1983
- 1983-09-08 JP JP58166232A patent/JPS6057398A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4918735A (en) | Speech recognition apparatus for recognizing the category of an input speech pattern | |
| JPS5844500A (ja) | 音声認識方式 | |
| JPH0222960B2 (ja) | ||
| JPS6057398A (ja) | 正規化方法 | |
| JP2992324B2 (ja) | 音声区間検出方法 | |
| JPH0449952B2 (ja) | ||
| JPS584198A (ja) | 音声認識装置における標準パタ−ン登録方式 | |
| JP2989219B2 (ja) | 音声区間検出方式 | |
| JPS6057397A (ja) | 正規化方法 | |
| JPS6152478B2 (ja) | ||
| JPH03114100A (ja) | 音声区間検出装置 | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JPS58195893A (ja) | 音声認識装置における前処理方法 | |
| JPS59105697A (ja) | 音声認識装置 | |
| JPH0449715B2 (ja) | ||
| JPS6043697A (ja) | 子音と母音の境界検出装置 | |
| JPH0289099A (ja) | 音声認識装置 | |
| JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
| JPS61260299A (ja) | 音声認識装置 | |
| JPH0232400A (ja) | 音声の特徴抽出方法 | |
| JPH0567039B2 (ja) | ||
| JPS6075896A (ja) | 単語音声認識装置 | |
| JPS59211100A (ja) | 登録型音声認識方法 | |
| JPS58223198A (ja) | 音節入力装置 | |
| JPS6029796A (ja) | 音声認識装置 |