JPH10124089A - 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 - Google Patents
音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法Info
- Publication number
- JPH10124089A JPH10124089A JP8282235A JP28223596A JPH10124089A JP H10124089 A JPH10124089 A JP H10124089A JP 8282235 A JP8282235 A JP 8282235A JP 28223596 A JP28223596 A JP 28223596A JP H10124089 A JPH10124089 A JP H10124089A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- affricate
- codebook
- fricative
- narrowband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 LPC合成により音声帯域幅を拡張する際
に、摩擦音、破擦音を明瞭に再現できるようにする。 【解決手段】 入力音声信号をLPC分析フィルタで分
析し、自己相関をパラメータとして、狭帯域コードブッ
ク6で最もマッチするものを検索し、これに対応するパ
ラメータを広帯域コードブック12から出力し、LPC
合成フィルタ11で合成する。これにより、音声の帯域
幅を拡張する。破擦音検出回路7は、入力音声信号の自
己相関の値及びフレームパワーの値を用いて、摩擦音や
破擦音を検出する。摩擦音や破擦音が検出されたら、励
振源の全帯域又は一部の帯域をブーストする。これによ
り、摩擦音や破擦音の場合のパワー不足が改善され、摩
擦音、破擦音を明瞭に再現できる。
に、摩擦音、破擦音を明瞭に再現できるようにする。 【解決手段】 入力音声信号をLPC分析フィルタで分
析し、自己相関をパラメータとして、狭帯域コードブッ
ク6で最もマッチするものを検索し、これに対応するパ
ラメータを広帯域コードブック12から出力し、LPC
合成フィルタ11で合成する。これにより、音声の帯域
幅を拡張する。破擦音検出回路7は、入力音声信号の自
己相関の値及びフレームパワーの値を用いて、摩擦音や
破擦音を検出する。摩擦音や破擦音が検出されたら、励
振源の全帯域又は一部の帯域をブーストする。これによ
り、摩擦音や破擦音の場合のパワー不足が改善され、摩
擦音、破擦音を明瞭に再現できる。
Description
【0001】
【発明の属する技術分野】この発明は、電話回線等の伝
送路を介されることにより周波数帯域が狭帯域に制限さ
れている音声信号から広帯域の音声信号を生成するため
の音声信号処理装置及び方法、並びに、帯域幅拡張装置
及び方法に関する。
送路を介されることにより周波数帯域が狭帯域に制限さ
れている音声信号から広帯域の音声信号を生成するため
の音声信号処理装置及び方法、並びに、帯域幅拡張装置
及び方法に関する。
【0002】
【従来の技術】電話回線の帯域は例えば300〜340
0kHzと狭く、電話回線を介して送られてくる音声信
号の周波数帯域は制限されている。このため、従来のア
ナログ電話回線の音質はあまり良好とは言えない。ま
た、ディジタル携帯電話の音質についても不満がある。
0kHzと狭く、電話回線を介して送られてくる音声信
号の周波数帯域は制限されている。このため、従来のア
ナログ電話回線の音質はあまり良好とは言えない。ま
た、ディジタル携帯電話の音質についても不満がある。
【0003】そこで、受話側で音声帯域幅を拡張し、音
質の改善を図るようにしたシステムが種々提案されてい
る。この中で、予め複数の音声信号のパターンから得ら
れた狭帯域音声信号のパラメータがコードベクタとして
格納された狭帯域コードブックと、これと同一の音声信
号のパターンから得られた広帯域音声信号のパラメータ
がコードベクタとして予め格納された広帯域コードブッ
クとを用意しておき、入力信号を狭帯域コードブックで
分析し、この分析結果に基づいて広帯域コードブックを
用いて音声合成を行なうことにより、音声帯域幅を拡張
し、音質を改善するようにしたシステムが提案されてい
る。
質の改善を図るようにしたシステムが種々提案されてい
る。この中で、予め複数の音声信号のパターンから得ら
れた狭帯域音声信号のパラメータがコードベクタとして
格納された狭帯域コードブックと、これと同一の音声信
号のパターンから得られた広帯域音声信号のパラメータ
がコードベクタとして予め格納された広帯域コードブッ
クとを用意しておき、入力信号を狭帯域コードブックで
分析し、この分析結果に基づいて広帯域コードブックを
用いて音声合成を行なうことにより、音声帯域幅を拡張
し、音質を改善するようにしたシステムが提案されてい
る。
【0004】つまり、図6に示すように、電話回線のよ
うな伝送路を通じて音声信号を伝送する場合、送話側1
01からの音声信号は、伝送路102を介されることに
より周波数帯域が制限される。例えば、送話側101か
らの音声信号の周波数帯域が300Hzから7000H
z程度あったとしても、伝送路102を介されることに
より、受話側103に送られる音声信号の周波数帯域
は、例えば300Hzから3400Hz程度に制限され
る。
うな伝送路を通じて音声信号を伝送する場合、送話側1
01からの音声信号は、伝送路102を介されることに
より周波数帯域が制限される。例えば、送話側101か
らの音声信号の周波数帯域が300Hzから7000H
z程度あったとしても、伝送路102を介されることに
より、受話側103に送られる音声信号の周波数帯域
は、例えば300Hzから3400Hz程度に制限され
る。
【0005】そこで、図7に示すように、予め複数の音
声信号のパターンから得られる狭帯域音声信号のパラメ
ータがコードベクタとして格納された狭帯域コードブッ
ク105と、狭帯域コードブック105に対応して、同
一の音声信号のパターンから得られた広帯域音声信号の
パラメータがコードベクタとして予め格納された広帯域
コードブック106とが用意される。
声信号のパターンから得られる狭帯域音声信号のパラメ
ータがコードベクタとして格納された狭帯域コードブッ
ク105と、狭帯域コードブック105に対応して、同
一の音声信号のパターンから得られた広帯域音声信号の
パラメータがコードベクタとして予め格納された広帯域
コードブック106とが用意される。
【0006】なお、コードブック105及び106は、
例えば、同一の広帯域の音声信号を所定の長さのフレー
ムに分割して複数の音声信号のパターンを形成し、各フ
レーム毎にスペクトラム包絡を分析することにより作成
される。すなわち、コードブック作成時には、広帯域の
音声信号が用いられ、この広帯域の音声信号が所定のフ
レーム毎に分割される。広帯域コードブック106に
は、この広帯域の音声信号を広帯域のまま分析したとき
のスペクトラム包絡情報がコードベクタとして格納され
る。狭帯域コードブック105には、広帯域の音声信号
を例えば300〜3400Hzに帯域制限して分析した
ときのスペクトラム包絡情報がコードベクタとして格納
される。
例えば、同一の広帯域の音声信号を所定の長さのフレー
ムに分割して複数の音声信号のパターンを形成し、各フ
レーム毎にスペクトラム包絡を分析することにより作成
される。すなわち、コードブック作成時には、広帯域の
音声信号が用いられ、この広帯域の音声信号が所定のフ
レーム毎に分割される。広帯域コードブック106に
は、この広帯域の音声信号を広帯域のまま分析したとき
のスペクトラム包絡情報がコードベクタとして格納され
る。狭帯域コードブック105には、広帯域の音声信号
を例えば300〜3400Hzに帯域制限して分析した
ときのスペクトラム包絡情報がコードベクタとして格納
される。
【0007】狭帯域コードブック105及び広帯域コー
ドブック106に格納するスペクトラム包絡情報として
は、従来、LPCケプトラムが用いられている。LPC
ケプトラムは、線形予測係数によるケプトラムであり、
以下の式で示されるようにして求められる。
ドブック106に格納するスペクトラム包絡情報として
は、従来、LPCケプトラムが用いられている。LPC
ケプトラムは、線形予測係数によるケプトラムであり、
以下の式で示されるようにして求められる。
【数1】
【0008】図7において、伝送路102を介して送話
側101から受話側103に送られてきた狭帯域の音声
信号は、先ず、分析回路104に送られる。分析回路1
04で、入力音声信号が所定のフレーム毎に分けられ、
スペクトラム包絡が求められる。分析回路104の出力
が狭帯域コードブック105に送られる。狭帯域コード
ブック105で、分析回路104で分析されたスペクト
ラム包絡と、狭帯域コードブック105に格納されてい
るスペクトラム包絡情報とが比較され、マッチング処理
が行なわれる。そして、狭帯域コードブック105の出
力が広帯域コードブック106に送られ、狭帯域コード
ブック105において最もマッチしているスペクトラム
包絡情報と対応する広帯域のスペクトラム包絡情報が、
広帯域コードブック106から読み出される。
側101から受話側103に送られてきた狭帯域の音声
信号は、先ず、分析回路104に送られる。分析回路1
04で、入力音声信号が所定のフレーム毎に分けられ、
スペクトラム包絡が求められる。分析回路104の出力
が狭帯域コードブック105に送られる。狭帯域コード
ブック105で、分析回路104で分析されたスペクト
ラム包絡と、狭帯域コードブック105に格納されてい
るスペクトラム包絡情報とが比較され、マッチング処理
が行なわれる。そして、狭帯域コードブック105の出
力が広帯域コードブック106に送られ、狭帯域コード
ブック105において最もマッチしているスペクトラム
包絡情報と対応する広帯域のスペクトラム包絡情報が、
広帯域コードブック106から読み出される。
【0009】この広帯域スペクトラム包絡情報が合成回
路107に送られる。合成回路107で、広帯域コード
ブック106から読み出された広帯域のスペクトラム包
絡情報を用いて、音声信号が合成される。この合成され
た音声信号は、広帯域コードブック106を用いて合成
されるので、広帯域の音声信号となる。
路107に送られる。合成回路107で、広帯域コード
ブック106から読み出された広帯域のスペクトラム包
絡情報を用いて、音声信号が合成される。この合成され
た音声信号は、広帯域コードブック106を用いて合成
されるので、広帯域の音声信号となる。
【0010】
【発明が解決しようとする課題】上述のように、従来の
音声帯域幅拡張システムでは、コードブックベクタとし
てLPCケプトラムを用いている。また、音声信号を合
成する際の励振源としては、ノイズとパルス列を用いて
いる。ところが、LPCケプトラムでは、聴感上の歪と
量子化誤差が比較的一致するものの、リニアスケールを
用いる場合より対数スケールが用いられるため、エネル
ギーの小さい部分が重視され、エネルギーの大きい部分
での誤差が大きくなる。このような音声帯域幅拡張シス
テムに用いるには、聴感上では、母音部分での歪をでき
るだけ抑えることが好ましい。したがって、LPCケプ
トラムは、必ずしも最適なものとは言えない。また、励
振源については、広帯域のLPC残差にできるだけ近い
ものが良いはずであるが、ノイズとパルス列を用いた従
来の方式は、これとは程遠いものである。
音声帯域幅拡張システムでは、コードブックベクタとし
てLPCケプトラムを用いている。また、音声信号を合
成する際の励振源としては、ノイズとパルス列を用いて
いる。ところが、LPCケプトラムでは、聴感上の歪と
量子化誤差が比較的一致するものの、リニアスケールを
用いる場合より対数スケールが用いられるため、エネル
ギーの小さい部分が重視され、エネルギーの大きい部分
での誤差が大きくなる。このような音声帯域幅拡張シス
テムに用いるには、聴感上では、母音部分での歪をでき
るだけ抑えることが好ましい。したがって、LPCケプ
トラムは、必ずしも最適なものとは言えない。また、励
振源については、広帯域のLPC残差にできるだけ近い
ものが良いはずであるが、ノイズとパルス列を用いた従
来の方式は、これとは程遠いものである。
【0011】そこで、コードブックベクタとして自己相
関を用い、LPC残差をアップサンプルしたものを励振
源として用い、LPC合成により広帯域音声信号を合成
することが考えられる。自己相関は、対数スケールでは
ないので、母音部分での歪が改善されると考えられる。
ところが、コードブックベクタとして自己相関を用い、
LPC残差をアップサンプルしたものを励振源として用
い、LPC合成により広帯域の音声信号を形成するよう
にすると、特に、摩擦音、破擦音が不足し、歯切れの悪
い音になるという問題が生じる。これは、スペクトラム
包絡の予測が十分でないことも原因に上げられるが、種
として、励振源のパワー不足に起因すると考えられる。
関を用い、LPC残差をアップサンプルしたものを励振
源として用い、LPC合成により広帯域音声信号を合成
することが考えられる。自己相関は、対数スケールでは
ないので、母音部分での歪が改善されると考えられる。
ところが、コードブックベクタとして自己相関を用い、
LPC残差をアップサンプルしたものを励振源として用
い、LPC合成により広帯域の音声信号を形成するよう
にすると、特に、摩擦音、破擦音が不足し、歯切れの悪
い音になるという問題が生じる。これは、スペクトラム
包絡の予測が十分でないことも原因に上げられるが、種
として、励振源のパワー不足に起因すると考えられる。
【0012】すなわち、摩擦音、破擦音の場合、比較的
良くLPC合成による予測が行なわれ、残差のパワーが
小さくなる。ところが、広帯域音声では予測が不十分
で、残差のパワーが小さくならない。このため、摩擦
音、破擦音の帯域を拡張する際には、残差パワーもそれ
と同等に大きくなっていなければならない。ところが、
残差は狭帯域残差から予測して作成されるため、パワー
が十分に大きくなっていない。このため、摩擦音、破擦
音の場合に、励振源のパワーが不足する。
良くLPC合成による予測が行なわれ、残差のパワーが
小さくなる。ところが、広帯域音声では予測が不十分
で、残差のパワーが小さくならない。このため、摩擦
音、破擦音の帯域を拡張する際には、残差パワーもそれ
と同等に大きくなっていなければならない。ところが、
残差は狭帯域残差から予測して作成されるため、パワー
が十分に大きくなっていない。このため、摩擦音、破擦
音の場合に、励振源のパワーが不足する。
【0013】したがって、この発明の目的は、音声帯域
幅を拡張する際に、摩擦音、破擦音を明瞭に再現できる
ようにした音声信号処理装置及び方法、並びに、音声帯
域幅拡張装置及び方法を提供することにある。
幅を拡張する際に、摩擦音、破擦音を明瞭に再現できる
ようにした音声信号処理装置及び方法、並びに、音声帯
域幅拡張装置及び方法を提供することにある。
【0014】
【課題を解決するための手段】この発明は、入力音声信
号を分析し、分析された音声信号に対して信号処理を行
なった後、音声信号を合成するようにした音声信号処理
装置において、入力音声信号の摩擦音や破擦音を検出す
る破擦音検出手段と、摩擦音や破擦音が検出された場合
に、励振源に対してブーストを与えるブースト手段とを
備えるようしたことを特徴とする音声信号処理装置であ
る。
号を分析し、分析された音声信号に対して信号処理を行
なった後、音声信号を合成するようにした音声信号処理
装置において、入力音声信号の摩擦音や破擦音を検出す
る破擦音検出手段と、摩擦音や破擦音が検出された場合
に、励振源に対してブーストを与えるブースト手段とを
備えるようしたことを特徴とする音声信号処理装置であ
る。
【0015】また、この発明は、入力狭帯域音声信号か
ら自己相関のパラメータを求める分析手段と、入力狭帯
域音声信号のLPC残差から励振源を求める励振源形成
手段と、予め複数の音声信号のパターンから得られた狭
帯域音声信号の自己相関のパラメータが格納された狭帯
域コードブックと、予め複数の音声信号のパターンから
得られた広帯域音声信号の自己相関のパラメータが狭帯
域コードブックに対応して格納された広帯域コードブッ
クと、摩擦音、破擦音を検出する破擦音検出手段と、摩
擦音、破擦音が検出されたときに励振源に対してブース
トを与えるブースト手段と、入力狭帯域の音声信号の自
己相関のパラメータと、狭帯域コードブックに格納され
ている入力狭帯域音声信号の自己相関のパラメータとを
比較し、最適なパラメータを検索するマッチング手段
と、マッチング手段での検索結果に基づいて、広帯域コ
ードブックに格納されている広帯域音声信号の自己相関
のパラメータの中から対応するパラメータを読み出し、
この読み出されたパラメータと励振源を基にして出力広
帯域音声信号を合成する合成手段とを備えたことを特徴
とする音声帯域幅拡張装置である。
ら自己相関のパラメータを求める分析手段と、入力狭帯
域音声信号のLPC残差から励振源を求める励振源形成
手段と、予め複数の音声信号のパターンから得られた狭
帯域音声信号の自己相関のパラメータが格納された狭帯
域コードブックと、予め複数の音声信号のパターンから
得られた広帯域音声信号の自己相関のパラメータが狭帯
域コードブックに対応して格納された広帯域コードブッ
クと、摩擦音、破擦音を検出する破擦音検出手段と、摩
擦音、破擦音が検出されたときに励振源に対してブース
トを与えるブースト手段と、入力狭帯域の音声信号の自
己相関のパラメータと、狭帯域コードブックに格納され
ている入力狭帯域音声信号の自己相関のパラメータとを
比較し、最適なパラメータを検索するマッチング手段
と、マッチング手段での検索結果に基づいて、広帯域コ
ードブックに格納されている広帯域音声信号の自己相関
のパラメータの中から対応するパラメータを読み出し、
この読み出されたパラメータと励振源を基にして出力広
帯域音声信号を合成する合成手段とを備えたことを特徴
とする音声帯域幅拡張装置である。
【0016】この発明では、破擦音検出手段は、入力音
声信号の自己相関の値及びフレームパワーの値を用い
て、摩擦音や破擦音を検出するものである。
声信号の自己相関の値及びフレームパワーの値を用い
て、摩擦音や破擦音を検出するものである。
【0017】このように、摩擦音や破擦音を検出する破
擦音検出し、摩擦音や破擦音が検出された場合に、励振
源に対してブーストを与えるよにすると、摩擦音や破擦
音の場合のパワー不足が改善され、摩擦音、破擦音を明
瞭に再現できる。
擦音検出し、摩擦音や破擦音が検出された場合に、励振
源に対してブーストを与えるよにすると、摩擦音や破擦
音の場合のパワー不足が改善され、摩擦音、破擦音を明
瞭に再現できる。
【0018】
【発明の実施の形態】以下、この発明の実施の形態につ
いて図面を参照して説明する。図1は、この発明が適用
された音声帯域幅拡張システムの一例を示すものであ
る。図1において、入力端子1に、周波数帯域が例えば
300Hz〜3400Hzで、サンプリング周波数が8
kHzの狭帯域音声信号が供給される。この狭帯域音声
信号は、LPC(Linear Predictive Coding)分析フィ
ルタ2に供給されると共に、アップサンプル回路3に供
給される。
いて図面を参照して説明する。図1は、この発明が適用
された音声帯域幅拡張システムの一例を示すものであ
る。図1において、入力端子1に、周波数帯域が例えば
300Hz〜3400Hzで、サンプリング周波数が8
kHzの狭帯域音声信号が供給される。この狭帯域音声
信号は、LPC(Linear Predictive Coding)分析フィ
ルタ2に供給されると共に、アップサンプル回路3に供
給される。
【0019】アップサンプル回路3は、サンプリング周
波数を8kHzから16kHzにアップサンプルするた
めのものである。アップサンプル回路3の出力は、30
0Hz〜3400Hzの通過帯域のバンドパスフィルタ
4を介して、加算回路5に供給される。このアップサン
プル回路3、バンドパスフィルタ4、加算回路5に通じ
る経路は、後に説明するように、元の周波数帯域の成分
の信号を、音声合成された高域の音声信号に付加するた
めの経路である。
波数を8kHzから16kHzにアップサンプルするた
めのものである。アップサンプル回路3の出力は、30
0Hz〜3400Hzの通過帯域のバンドパスフィルタ
4を介して、加算回路5に供給される。このアップサン
プル回路3、バンドパスフィルタ4、加算回路5に通じ
る経路は、後に説明するように、元の周波数帯域の成分
の信号を、音声合成された高域の音声信号に付加するた
めの経路である。
【0020】LPC分析フィルタ2は、入力端子1から
の狭帯域音声信号をフレーム化し、10次のLPC分析
を行なうものである。LPC分析の過程で、10次の自
己相関が得られる。この自己相関は狭帯域コードブック
6に送られると共に、破擦音検出回路7に送られる。ま
た、LPC分析フィルタ2で求められたLPC残差は、
アップサンプル回路8に送られる。
の狭帯域音声信号をフレーム化し、10次のLPC分析
を行なうものである。LPC分析の過程で、10次の自
己相関が得られる。この自己相関は狭帯域コードブック
6に送られると共に、破擦音検出回路7に送られる。ま
た、LPC分析フィルタ2で求められたLPC残差は、
アップサンプル回路8に送られる。
【0021】アップサンプル回路8により、狭帯域の音
声のLPC残差がアップサンプルされる。アップサンプ
ル回路8の出力がローパスフィルタ9、ブースト回路1
0をを介して、LPC合成フィルタ11に送られる。こ
のLPC残差をアップサンプルし、高域を抑圧した信号
は、後に説明するように、音声信号を合成する際の励振
源として用いられる。ブースト回路10は、破擦音や摩
擦音が検出された場合に、励振源をブーストするための
もので、ブースト回路10のブースト量は、破擦音検出
回路7の出力により制御される。
声のLPC残差がアップサンプルされる。アップサンプ
ル回路8の出力がローパスフィルタ9、ブースト回路1
0をを介して、LPC合成フィルタ11に送られる。こ
のLPC残差をアップサンプルし、高域を抑圧した信号
は、後に説明するように、音声信号を合成する際の励振
源として用いられる。ブースト回路10は、破擦音や摩
擦音が検出された場合に、励振源をブーストするための
もので、ブースト回路10のブースト量は、破擦音検出
回路7の出力により制御される。
【0022】狭帯域コードブック6には、予め複数の音
声信号のパターンから得られた狭帯域音声信号の10次
の自己相関情報がコードベクタとして格納されている。
狭帯域コードブック6で、LPC分析フィルタ2から得
られた自己相関と、狭帯域コードブック6に格納されて
いる自己相関情報とが比較され、マッチング処理が行な
われる。そして、最もマッチしている自己相関情報のイ
ンデックスが広帯域コードブック12に送られる。
声信号のパターンから得られた狭帯域音声信号の10次
の自己相関情報がコードベクタとして格納されている。
狭帯域コードブック6で、LPC分析フィルタ2から得
られた自己相関と、狭帯域コードブック6に格納されて
いる自己相関情報とが比較され、マッチング処理が行な
われる。そして、最もマッチしている自己相関情報のイ
ンデックスが広帯域コードブック12に送られる。
【0023】広帯域コードブック12には、狭帯域コー
ドブック6と対応して、狭帯域コードブック6を作成し
たときと同一のパターンの音声信号から得られる広帯域
音声信号の20次の自己相関情報がコードベクタとして
格納されている。狭帯域コードブック6で最もマッチし
ている自己相関情報が判断されると、このインデックス
が広帯域コードブック12に送られ、広帯域コードブッ
ク12により、最もマッチしていると判断された狭帯域
の自己相関情報に対応する広帯域の自己相関情報が読み
出される。
ドブック6と対応して、狭帯域コードブック6を作成し
たときと同一のパターンの音声信号から得られる広帯域
音声信号の20次の自己相関情報がコードベクタとして
格納されている。狭帯域コードブック6で最もマッチし
ている自己相関情報が判断されると、このインデックス
が広帯域コードブック12に送られ、広帯域コードブッ
ク12により、最もマッチしていると判断された狭帯域
の自己相関情報に対応する広帯域の自己相関情報が読み
出される。
【0024】自己相関は、時間領域のパラメータで、以
下のようにして求められる。
下のようにして求められる。
【数2】
【0025】広帯域コードブック12は、サンプリング
周波数が16kHzの、0〜8000kHzの広帯域音
声信号を用いて、以下のようにして作成される。すなわ
ち、広帯域コードブック12の作成時には、この広帯域
音声信号が、長さ32m秒、前進20m秒毎のフレーム
に分割され、各フレームで20次の自己相関が求められ
る。これを利用して、GLA(General Lloyd Algorith
m )アルゴリズムにより、8ビットのコードブックが作
成される。これが広帯域コードブック4とされる。ここ
で、広帯域コードブックのi番目のコードベクタにエン
コードされたフレーム番号をAiする。
周波数が16kHzの、0〜8000kHzの広帯域音
声信号を用いて、以下のようにして作成される。すなわ
ち、広帯域コードブック12の作成時には、この広帯域
音声信号が、長さ32m秒、前進20m秒毎のフレーム
に分割され、各フレームで20次の自己相関が求められ
る。これを利用して、GLA(General Lloyd Algorith
m )アルゴリズムにより、8ビットのコードブックが作
成される。これが広帯域コードブック4とされる。ここ
で、広帯域コードブックのi番目のコードベクタにエン
コードされたフレーム番号をAiする。
【0026】狭帯域コードブック6は、広帯域コードブ
ック12を作成したのと同一の音声信号で、サンプリン
グ周波数を8kHzで周波数帯域を300Hz〜340
0Hzに制限したものを用いて作成される。この狭帯域
に制限された音声信号が、広帯域コードブック12を作
成したときと同じ時刻でフレームに分割され、各フレー
ムで10次の自己相関が求められる。そして、フレーム
番号Aiに属するフレームの狭帯域自己相関の重心を求
め、そのベクターを狭帯域のコードブックのi番目のコ
ードベクタとすることで、フレーム番号Aiの広帯域コ
ードブックの広帯域自己相関に対応させるようにする。
ック12を作成したのと同一の音声信号で、サンプリン
グ周波数を8kHzで周波数帯域を300Hz〜340
0Hzに制限したものを用いて作成される。この狭帯域
に制限された音声信号が、広帯域コードブック12を作
成したときと同じ時刻でフレームに分割され、各フレー
ムで10次の自己相関が求められる。そして、フレーム
番号Aiに属するフレームの狭帯域自己相関の重心を求
め、そのベクターを狭帯域のコードブックのi番目のコ
ードベクタとすることで、フレーム番号Aiの広帯域コ
ードブックの広帯域自己相関に対応させるようにする。
【0027】図1において、広帯域コードブック12か
ら読み出された広帯域の自己相関情報は、自己相関−線
形予測係数変換回路13に送られる。自己相関−線形予
測係数変換回路13により、自己相関から線形予測係数
への変換が行なわれる。この線形予測係数がLPC合成
フィルタ11に送られる。
ら読み出された広帯域の自己相関情報は、自己相関−線
形予測係数変換回路13に送られる。自己相関−線形予
測係数変換回路13により、自己相関から線形予測係数
への変換が行なわれる。この線形予測係数がLPC合成
フィルタ11に送られる。
【0028】LPC合成フィルタ11には、LPC分析
フィルタ2からのLPC残差をアップサンプル回路8で
アップサンプルして折返し歪を発生させ、ローパスフィ
ルタ9を介して高域側を抑圧した信号が供給されてい
る。LPC合成フィルタ11で、このLPC残差をアッ
プサンプルし、折返し歪の高域側を抑圧したようなもの
を励振源として用い、自己相関−線形予測係数変換回路
部13からの線形予測係数により、LPC合成が行なわ
れる。これにより、300Hz〜7000Hzの広帯域
の音声信号が合成される。
フィルタ2からのLPC残差をアップサンプル回路8で
アップサンプルして折返し歪を発生させ、ローパスフィ
ルタ9を介して高域側を抑圧した信号が供給されてい
る。LPC合成フィルタ11で、このLPC残差をアッ
プサンプルし、折返し歪の高域側を抑圧したようなもの
を励振源として用い、自己相関−線形予測係数変換回路
部13からの線形予測係数により、LPC合成が行なわ
れる。これにより、300Hz〜7000Hzの広帯域
の音声信号が合成される。
【0029】LPC合成フィルタ11で合成された音声
信号は、バンドストップフィルタ14に供給される。バ
ンドストップフィルタ14は、入力狭帯域音声信号の周
波数帯域の信号成分を除去するものである。バンドスト
ップフィルタ14で、LPC合成フィルタ11で合成さ
れた周波数300Hz〜7000Hzの広帯域の音声信
号の中から、元の狭帯域の音声信号に含まれる300H
z〜3400Hzの信号成分が除去される。このバンド
ストップフィルタ14の出力が加算回路5に供給され
る。
信号は、バンドストップフィルタ14に供給される。バ
ンドストップフィルタ14は、入力狭帯域音声信号の周
波数帯域の信号成分を除去するものである。バンドスト
ップフィルタ14で、LPC合成フィルタ11で合成さ
れた周波数300Hz〜7000Hzの広帯域の音声信
号の中から、元の狭帯域の音声信号に含まれる300H
z〜3400Hzの信号成分が除去される。このバンド
ストップフィルタ14の出力が加算回路5に供給され
る。
【0030】加算回路5で、アップサンプル回路3、バ
ンドパスフィルタ4を介された周波数300Hz〜34
00Hzの元の狭帯域の音声信号の成分と、バンドスト
ップフィルタ14を介された周波数3400Hz〜70
00Hzの音声合成された音声信号の成分とが加算され
る。これにより、周波数帯域が300〜7000Hz
で、サンプリング周波数が16kHzのディジタル音声
信号が得られる。このディジタル音声信号が出力端子1
5から出力される。
ンドパスフィルタ4を介された周波数300Hz〜34
00Hzの元の狭帯域の音声信号の成分と、バンドスト
ップフィルタ14を介された周波数3400Hz〜70
00Hzの音声合成された音声信号の成分とが加算され
る。これにより、周波数帯域が300〜7000Hz
で、サンプリング周波数が16kHzのディジタル音声
信号が得られる。このディジタル音声信号が出力端子1
5から出力される。
【0031】このように、この発明が適用された音声帯
域幅拡張装置では、狭帯域コードブック6を用いて入力
狭帯域音声信号が分析され、広帯域コードブック12を
用いて広帯域の音声信号が合成される。そして、コード
ブックの情報としては、自己相関が用いられる。従来、
一般には、スペクトラム包絡情報としてLPCケプトラ
ムが用いらていたが、実験の結果、LPCケプトラムを
用いるより、対数スケールでない自己相関を用いた方が
聴感上好ましいことが分かったからである。これは、L
PCケプトラムでは、対数スケールを用いているため、
パワーの小さい子音部分では誤差は小さくなるが、パワ
ーの大きい母音部分での誤差が相対的に大きくなるため
であると考えられる。
域幅拡張装置では、狭帯域コードブック6を用いて入力
狭帯域音声信号が分析され、広帯域コードブック12を
用いて広帯域の音声信号が合成される。そして、コード
ブックの情報としては、自己相関が用いられる。従来、
一般には、スペクトラム包絡情報としてLPCケプトラ
ムが用いらていたが、実験の結果、LPCケプトラムを
用いるより、対数スケールでない自己相関を用いた方が
聴感上好ましいことが分かったからである。これは、L
PCケプトラムでは、対数スケールを用いているため、
パワーの小さい子音部分では誤差は小さくなるが、パワ
ーの大きい母音部分での誤差が相対的に大きくなるため
であると考えられる。
【0032】そして、この発明が適用された音声帯域幅
拡張システムでは、励振源として、LPC残差をアップ
サンプルし、折返し歪を発生させ、折返し歪の高域側を
抑圧したものが用いられる。このようにすると、元の音
声のパワーや調波構造が保存されているため、励振源と
して十分な性能が得られる。
拡張システムでは、励振源として、LPC残差をアップ
サンプルし、折返し歪を発生させ、折返し歪の高域側を
抑圧したものが用いられる。このようにすると、元の音
声のパワーや調波構造が保存されているため、励振源と
して十分な性能が得られる。
【0033】このように、コードブック6、12の情報
として自己相関を用い、LPC残差をアップサンプル
し、折返し歪の高域側を抑圧したもの励振源として用い
て音声信号を合成することにより、LPC合成フィルタ
11からは、300Hz〜7000Hzの良好な広帯域
の音声信号が得られる。
として自己相関を用い、LPC残差をアップサンプル
し、折返し歪の高域側を抑圧したもの励振源として用い
て音声信号を合成することにより、LPC合成フィルタ
11からは、300Hz〜7000Hzの良好な広帯域
の音声信号が得られる。
【0034】このようにして、LPC合成フィルタ11
から得られる広帯域の音声信号は、元の帯域の周波数成
分の信号をも含んでおり、これらの処理により元の帯域
の周波数成分に歪が及ぶため、LPC合成フィルタ11
の出力信号をそのまま用いると、元の帯域の周波数成分
の歪の影響が生じる。
から得られる広帯域の音声信号は、元の帯域の周波数成
分の信号をも含んでおり、これらの処理により元の帯域
の周波数成分に歪が及ぶため、LPC合成フィルタ11
の出力信号をそのまま用いると、元の帯域の周波数成分
の歪の影響が生じる。
【0035】そこで、バンドストップフィルタ14によ
り、LPC合成フィルタ11の出力から、300Hz〜
3400Hzの元の帯域の周波数成分を除去し、バンド
パスフィルタ4を介して取り出された300Hz〜34
00Hzの元の音声信号の成分と、LPC合成フィルタ
11で合成された3400Hz〜7000Hzの音声信
号の成分とを加算するようしている。
り、LPC合成フィルタ11の出力から、300Hz〜
3400Hzの元の帯域の周波数成分を除去し、バンド
パスフィルタ4を介して取り出された300Hz〜34
00Hzの元の音声信号の成分と、LPC合成フィルタ
11で合成された3400Hz〜7000Hzの音声信
号の成分とを加算するようしている。
【0036】なお、コードブック作成時の距離計算にお
いて、高次のデータの重みが小さくなるように重み付け
処理を行なうようにしても良い。すなわち、狭帯域コー
ドブック6においては1次から3次までの重みを「1」
とし、それ以上の次数では重みを「0」とし、広帯域コ
ードブック12においては1次から6次までの重みを
「1」とし、それ以上の次数では重みを「0」とする。
このようにすると、メモリ容量の節約ができるばかりで
なく、自己相関パラメータの性質として、大まかなスペ
クトル包絡の再現を重視することになり、より品質の良
い音声が得られる。
いて、高次のデータの重みが小さくなるように重み付け
処理を行なうようにしても良い。すなわち、狭帯域コー
ドブック6においては1次から3次までの重みを「1」
とし、それ以上の次数では重みを「0」とし、広帯域コ
ードブック12においては1次から6次までの重みを
「1」とし、それ以上の次数では重みを「0」とする。
このようにすると、メモリ容量の節約ができるばかりで
なく、自己相関パラメータの性質として、大まかなスペ
クトル包絡の再現を重視することになり、より品質の良
い音声が得られる。
【0037】ところで、このように、コードベクタとし
て自己相関を用い、LPC残差をアップサンプルして高
域を抑圧したものを励振源として、LPC合成により広
帯域の音声信号を形成するようにすると、特に、摩擦
音、破擦音が不足し、歯切れの悪い音になる。これは、
スペクトラム包絡の予測が十分でないことも原因に上げ
られるが、主として、励振源のパワー不足に起因すると
考えられる。
て自己相関を用い、LPC残差をアップサンプルして高
域を抑圧したものを励振源として、LPC合成により広
帯域の音声信号を形成するようにすると、特に、摩擦
音、破擦音が不足し、歯切れの悪い音になる。これは、
スペクトラム包絡の予測が十分でないことも原因に上げ
られるが、主として、励振源のパワー不足に起因すると
考えられる。
【0038】そこで、この発明が適用されたシステムで
は、摩擦音や破擦音を検出する破擦音検出回路7と、摩
擦音や破擦音が検出されたときに、励振源の全帯域又は
一部の帯域をブーストするブースト回路10が設けられ
る。破擦音検出回路7には、LPC分析フィルタ2で求
められた10次の自己相関が供給される。破擦音検出回
路7で、この10次の自己相関のうち、0次のフレーム
パワー、1次の自己相関、2次の自己相関を用いて、摩
擦音や破擦音が入力されたかどうかが検出される。破擦
音検出回路7で摩擦音や破擦音が検出されると、ブース
ト回路10により、励振源の全帯域又は一部の帯域がブ
ーストされる。
は、摩擦音や破擦音を検出する破擦音検出回路7と、摩
擦音や破擦音が検出されたときに、励振源の全帯域又は
一部の帯域をブーストするブースト回路10が設けられ
る。破擦音検出回路7には、LPC分析フィルタ2で求
められた10次の自己相関が供給される。破擦音検出回
路7で、この10次の自己相関のうち、0次のフレーム
パワー、1次の自己相関、2次の自己相関を用いて、摩
擦音や破擦音が入力されたかどうかが検出される。破擦
音検出回路7で摩擦音や破擦音が検出されると、ブース
ト回路10により、励振源の全帯域又は一部の帯域がブ
ーストされる。
【0039】つまり、入力音声信号の自己相関を解析し
た結果、母音の場合と摩擦音や破擦音の場合とでは、0
次の自己相関すなわちフレームパワー、1次の自己相
関、2次の自己相関の位置関係に、以下のような違いが
あることが分かった。すなわち、0次のフレームパワー
をR0、1次の自己相関をR1、2次の自己相関R2と
すると、図2に示すように、入力音声信号が母音の場合
には、0次のフレームパワーR0、1次の自己相関R
1、2次の自己相関R2が略直線上に並ぶ。これに対し
て、図3に示すように、摩擦音や破擦音の場合には、0
次のフレームパワーR0、1次の自己相関R1、2次の
自己相関R2の位置関係が、下に凸に並ぶような関係と
なる。このことから、0次のフレームパワーをR0、1
次の自己相関をR1、2次の自己相関R2の位置関係が
下に凸に並んでいるかどうかを判断すれば、摩擦音や破
擦音の検出が行なえる。
た結果、母音の場合と摩擦音や破擦音の場合とでは、0
次の自己相関すなわちフレームパワー、1次の自己相
関、2次の自己相関の位置関係に、以下のような違いが
あることが分かった。すなわち、0次のフレームパワー
をR0、1次の自己相関をR1、2次の自己相関R2と
すると、図2に示すように、入力音声信号が母音の場合
には、0次のフレームパワーR0、1次の自己相関R
1、2次の自己相関R2が略直線上に並ぶ。これに対し
て、図3に示すように、摩擦音や破擦音の場合には、0
次のフレームパワーR0、1次の自己相関R1、2次の
自己相関R2の位置関係が、下に凸に並ぶような関係と
なる。このことから、0次のフレームパワーをR0、1
次の自己相関をR1、2次の自己相関R2の位置関係が
下に凸に並んでいるかどうかを判断すれば、摩擦音や破
擦音の検出が行なえる。
【0040】このことを利用して、この発明が適用され
たシステムでは、以下の条件を満足するときに摩擦音や
破擦音であると判断される。
たシステムでは、以下の条件を満足するときに摩擦音や
破擦音であると判断される。
【0041】条件(1) R0が一定値以上であり、かつR1が一定値以上であ
り、かつR1/R2が一定値以下である場合には、摩擦
音や破擦音であると判断する。
り、かつR1/R2が一定値以下である場合には、摩擦
音や破擦音であると判断する。
【0042】条件(2) R0が一定値以上、一定値以下であり、かつR1が一定
値以下であり、かつ1−R1>R1−R2である場合に
は、摩擦音や破裂音であると判断する。
値以下であり、かつ1−R1>R1−R2である場合に
は、摩擦音や破裂音であると判断する。
【0043】条件(3) R0が一定値以上、一定値以下であり、かつ(R1−d
c)/(R0−dc)が一定値以下であり、かつ1−R
1>R1−R2である場合には、摩擦音や破裂音である
と判断する。なお、dcはフレームバンド毎に一定の値
である。
c)/(R0−dc)が一定値以下であり、かつ1−R
1>R1−R2である場合には、摩擦音や破裂音である
と判断する。なお、dcはフレームバンド毎に一定の値
である。
【0044】条件(1)又は条件(2)により摩擦音や
破擦音であると判断された場合には、励振源が例えば1
0dBブーストされる。また、条件(3)により摩擦音
や破擦音であると判断された場合には、励振源が例えば
5dBブーストされる。
破擦音であると判断された場合には、励振源が例えば1
0dBブーストされる。また、条件(3)により摩擦音
や破擦音であると判断された場合には、励振源が例えば
5dBブーストされる。
【0045】また、以上のような条件が満たされるとき
に、瞬時に励振源のブーストを行なってしまうと、急に
音が変化して、違和感を与える。そこで、励振源が急激
に変化しないように、フレーム毎に励振源のブーストを
スムージングするようにし、励振源のブーストの変化が
目立たないようにしている。
に、瞬時に励振源のブーストを行なってしまうと、急に
音が変化して、違和感を与える。そこで、励振源が急激
に変化しないように、フレーム毎に励振源のブーストを
スムージングするようにし、励振源のブーストの変化が
目立たないようにしている。
【0046】この発明が適用された音声帯域幅拡張シス
テムにより、良好な特性の音声帯域幅拡張が行なわれる
ことは、実験により明らかである。すなわち、図4は、
この発明が適用された音声帯域幅拡張システムを用いて
音声信号の帯域幅拡張を行なったときの実験結果を示す
ものである。図4Aは、ソースとなる広帯域の音声信号
のスペクトラム図である。このソースとなる音声信号
を、図4Bに示すように帯域制限し、この発明が適用さ
れた音声帯域幅拡張システムにより帯域幅拡張を行なう
ものとする。図4Cは、この信号の帯域幅拡張を行なっ
て得られた音声信号である。図4Aと図4Cとを比較す
れば、この発明が適用された音声帯域幅拡張システムに
より、かなりの精度で音声信号の帯域幅拡張が行なえた
ことが分かる。
テムにより、良好な特性の音声帯域幅拡張が行なわれる
ことは、実験により明らかである。すなわち、図4は、
この発明が適用された音声帯域幅拡張システムを用いて
音声信号の帯域幅拡張を行なったときの実験結果を示す
ものである。図4Aは、ソースとなる広帯域の音声信号
のスペクトラム図である。このソースとなる音声信号
を、図4Bに示すように帯域制限し、この発明が適用さ
れた音声帯域幅拡張システムにより帯域幅拡張を行なう
ものとする。図4Cは、この信号の帯域幅拡張を行なっ
て得られた音声信号である。図4Aと図4Cとを比較す
れば、この発明が適用された音声帯域幅拡張システムに
より、かなりの精度で音声信号の帯域幅拡張が行なえた
ことが分かる。
【0047】なお、この発明は、アナログの電話回線の
音質改善や、ディジタル携帯電話の音質改善に用いるこ
とができる。特に、ディジタル携帯電話では、変調方式
としてVSELPやPSI−CELPが用いられてい
る。VSELPやPSI−CELPでは、線形予測係数
や励振源が使われるので、これらの情報を音声帯域幅拡
張システムにおけるLPC分析やLPC合成の際に用い
ることができる。
音質改善や、ディジタル携帯電話の音質改善に用いるこ
とができる。特に、ディジタル携帯電話では、変調方式
としてVSELPやPSI−CELPが用いられてい
る。VSELPやPSI−CELPでは、線形予測係数
や励振源が使われるので、これらの情報を音声帯域幅拡
張システムにおけるLPC分析やLPC合成の際に用い
ることができる。
【0048】つまり、図5はディジタル携帯電話での適
用例を示すものである。図5に示すように、ディジタル
携帯電話においては、励振源と線形予測係数α1 〜α10
若しくはこれと等価なパラメータが送られてくる。この
励振源が入力端子21に供給され、線形予測係数が入力
端子22に供給される。入力端子21からの励振源は、
LPC合成フィルタ23に送られると共に、アップサン
プル回路24に送られる。入力端子22からの自己相関
係数は、LPC合成フィルタ23に送られる。
用例を示すものである。図5に示すように、ディジタル
携帯電話においては、励振源と線形予測係数α1 〜α10
若しくはこれと等価なパラメータが送られてくる。この
励振源が入力端子21に供給され、線形予測係数が入力
端子22に供給される。入力端子21からの励振源は、
LPC合成フィルタ23に送られると共に、アップサン
プル回路24に送られる。入力端子22からの自己相関
係数は、LPC合成フィルタ23に送られる。
【0049】LPC合成フィルタ23で、入力端子21
からの励振源を基に、入力端子22からの線形予測係数
を用いて、音声信号が合成される。LPC合成フィルタ
23で合成された音声信号は、アップサンプル回路25
に供給される。
からの励振源を基に、入力端子22からの線形予測係数
を用いて、音声信号が合成される。LPC合成フィルタ
23で合成された音声信号は、アップサンプル回路25
に供給される。
【0050】アップサンプル回路25は、サンプリング
周波数をアップサンプルするためのものである。アップ
サンプル回路25の出力は、バンドパスフィルタ26を
介して、加算回路27に供給される。このアップサンプ
ル回路25、バンドパスフィルタ26、加算回路27に
通じる経路は、元の周波数帯域の成分の信号を合成され
た音声信号に付加するための経路である。
周波数をアップサンプルするためのものである。アップ
サンプル回路25の出力は、バンドパスフィルタ26を
介して、加算回路27に供給される。このアップサンプ
ル回路25、バンドパスフィルタ26、加算回路27に
通じる経路は、元の周波数帯域の成分の信号を合成され
た音声信号に付加するための経路である。
【0051】また、LPC合成フィルタ23から線形予
測係数−自己相関変換回路28に線形予測係数が送られ
る。線形予測係数−自己相関変換回路28は、線形予測
係数を自己相関に変換するものである。この自己相関は
狭帯域コードブック29に送られると共に、破擦音検出
回路30に送られる。
測係数−自己相関変換回路28に線形予測係数が送られ
る。線形予測係数−自己相関変換回路28は、線形予測
係数を自己相関に変換するものである。この自己相関は
狭帯域コードブック29に送られると共に、破擦音検出
回路30に送られる。
【0052】また、入力端子21からの励振源は、アッ
プサンプル回路24に送られる。アップサンプル回路2
4の出力がローパスフィルタ31、ブースト回路32を
介して、LPC合成フィルタ33に送られる。ブースト
回路32は、破擦音や摩擦音が検出された場合に励振源
をブーストするためのもので、ブースト回路32のブー
スト量は、破擦音検出回路30の出力により制御され
る。
プサンプル回路24に送られる。アップサンプル回路2
4の出力がローパスフィルタ31、ブースト回路32を
介して、LPC合成フィルタ33に送られる。ブースト
回路32は、破擦音や摩擦音が検出された場合に励振源
をブーストするためのもので、ブースト回路32のブー
スト量は、破擦音検出回路30の出力により制御され
る。
【0053】狭帯域コードブック29には、予め複数の
音声信号のパターンから得られた狭帯域音声信号の自己
相関情報がコードベクタとして格納されている。狭帯域
コードブック29で、線形予測係数−自己相関変換回路
28からの自己相関と、狭帯域コードブック29に格納
されている自己相関情報とが比較され、マッチング処理
が行なわれる。そして、最もマッチしている自己相関情
報のインデックスが広帯域コードブック34に送られ
る。
音声信号のパターンから得られた狭帯域音声信号の自己
相関情報がコードベクタとして格納されている。狭帯域
コードブック29で、線形予測係数−自己相関変換回路
28からの自己相関と、狭帯域コードブック29に格納
されている自己相関情報とが比較され、マッチング処理
が行なわれる。そして、最もマッチしている自己相関情
報のインデックスが広帯域コードブック34に送られ
る。
【0054】広帯域コードブック34には、狭帯域コー
ドブック29と対応して、狭帯域コードブック29を作
成したときと同一のパターンの音声信号から得られる広
帯域音声信号の自己相関情報がコードベクタとして格納
されている。狭帯域コードブック29で最もマッチして
いる自己相関情報が判断されると、このインデックスが
広帯域コードブック34に送られ、広帯域コードブック
34により、最もマッチしていると判断された狭帯域の
自己相関情報に対応する広帯域の自己相関情報が読み出
される。
ドブック29と対応して、狭帯域コードブック29を作
成したときと同一のパターンの音声信号から得られる広
帯域音声信号の自己相関情報がコードベクタとして格納
されている。狭帯域コードブック29で最もマッチして
いる自己相関情報が判断されると、このインデックスが
広帯域コードブック34に送られ、広帯域コードブック
34により、最もマッチしていると判断された狭帯域の
自己相関情報に対応する広帯域の自己相関情報が読み出
される。
【0055】広帯域コードブック34から読み出された
広帯域の自己相関情報は、自己相関−線形予測係数変換
回路35に送られる。自己相関−線形予測係数変換回路
35により、自己相関から線形予測係数への変換が行な
われる。この線形予測係数がLPC合成フィルタ33に
送られる。
広帯域の自己相関情報は、自己相関−線形予測係数変換
回路35に送られる。自己相関−線形予測係数変換回路
35により、自己相関から線形予測係数への変換が行な
われる。この線形予測係数がLPC合成フィルタ33に
送られる。
【0056】LPC合成フィルタ33で、LPC合成が
行なわれる。これにより、広帯域の音声信号が合成され
る。LPC合成フィルタ33で合成された音声信号は、
バンドストップフィルタ36に供給される。バンドスト
ップフィルタ36の出力が加算回路27に供給される。
行なわれる。これにより、広帯域の音声信号が合成され
る。LPC合成フィルタ33で合成された音声信号は、
バンドストップフィルタ36に供給される。バンドスト
ップフィルタ36の出力が加算回路27に供給される。
【0057】加算回路27で、アップサンプル回路2
5、バンドパスフィルタ26を介され元の狭帯域の音声
信号の成分と、バンドストップフィルタ36を介された
音声合成された高域の音声信号の成分とが加算される。
これにより、広帯域の音声信号が得られる。この音声信
号が出力端子37から出力される。
5、バンドパスフィルタ26を介され元の狭帯域の音声
信号の成分と、バンドストップフィルタ36を介された
音声合成された高域の音声信号の成分とが加算される。
これにより、広帯域の音声信号が得られる。この音声信
号が出力端子37から出力される。
【0058】このように、変調方式としてVSELPや
PSI−CELPを用いた携帯電話システムでは、線形
予測係数や励振源が送られてくるので、これらの情報を
用いて、音声帯域幅を拡張することかできる。
PSI−CELPを用いた携帯電話システムでは、線形
予測係数や励振源が送られてくるので、これらの情報を
用いて、音声帯域幅を拡張することかできる。
【0059】
【発明の効果】この発明によれば、入力音声信号をLP
C合成して帯域幅を拡張する際に、摩擦音や破擦音を検
出する破擦音検出し、摩擦音や破擦音が検出された場合
に、励振源に対してブーストを与えるようにしている。
このため、摩擦音や破擦音が入力された場合のパワー不
足が改善され、摩擦音、破擦音を明瞭に再現できる。
C合成して帯域幅を拡張する際に、摩擦音や破擦音を検
出する破擦音検出し、摩擦音や破擦音が検出された場合
に、励振源に対してブーストを与えるようにしている。
このため、摩擦音や破擦音が入力された場合のパワー不
足が改善され、摩擦音、破擦音を明瞭に再現できる。
【図1】この発明が適用された音声帯域幅拡張システム
の構成を示すブロック図である。
の構成を示すブロック図である。
【図2】この発明が適用された音声帯域幅拡張システム
の説明に用いるグラフである。
の説明に用いるグラフである。
【図3】この発明が適用された音声帯域幅拡張システム
の説明に用いるグラフである。
の説明に用いるグラフである。
【図4】この発明が適用された音声帯域幅拡張システム
の効果の説明に用いるスペクトラム図である。
の効果の説明に用いるスペクトラム図である。
【図5】この発明が携帯電話に適用された場合の一例を
示すブロック図である。
示すブロック図である。
【図6】周波数帯域が制限される音声伝送経路の説明に
用いるブロック図である。
用いるブロック図である。
【図7】従来の音声帯域幅拡張システムの説明に用いる
ブロック図である。
ブロック図である。
2・・・LPC分析フィルタ,6・・・狭帯域コードブ
ック,7・・・破擦音検出回路,11・・・LPC合成
フィルタ,12・・・広帯域コードブック
ック,7・・・破擦音検出回路,11・・・LPC合成
フィルタ,12・・・広帯域コードブック
Claims (12)
- 【請求項1】 入力音声信号を分析し、上記分析された
音声信号に対して信号処理を行なった後、音声信号を合
成するようにした音声信号処理装置において、 上記入力音声信号の摩擦音や破擦音を検出する破擦音検
出手段と、 上記摩擦音や破擦音が検出された場合に、励振源に対し
てブーストを与えるブースト手段とを備えるようしたこ
とを特徴とする音声信号処理装置。 - 【請求項2】 上記破擦音検出手段は、少なくとも上記
入力音声信号の自己相関の値及びフレームパワーの値を
用いて、摩擦音や破擦音を検出するものである請求項1
記載の音声信号処理装置。 - 【請求項3】 上記ブースト手段は、ブースト値を除々
に変化させるものである請求項1又は2記載の音声信号
処理装置。 - 【請求項4】 入力音声信号を分析し、上記分析された
音声信号に対して信号処理を行なった後、音声信号を合
成するようにした音声信号処理方法において、 上記入力音声信号の摩擦音や破擦音を検出し、 上記摩擦音や破擦音が検出された場合に、励振源の全帯
域又は一部の帯域をブーストするようしたことを特徴と
する音声信号処理方法。 - 【請求項5】 上記破擦音の検出は、少なくとも上記入
力音声信号の自己相関の値及びフレームパワーの値を用
いて行なうようにした請求項4記載の音声信号処理方
法。 - 【請求項6】 上記ブースト値を除々に変化させるよう
にした請求項4又は5記載の音声信号処理方法。 - 【請求項7】 入力狭帯域音声信号からパラメータを求
める分析手段と、 上記入力狭帯域音声信号のLPC残差から励振源を求め
る励振源形成手段と、 予め複数の音声信号のパターンから得られた狭帯域音声
信号のパラメータが格納された狭帯域コードブックと、 予め複数の音声信号のパターンから得られた広帯域音声
信号のパラメータが上記狭帯域コードブックに対応して
格納された広帯域コードブックと、 摩擦音、破擦音を検出する破擦音検出手段と、 上記摩擦音、破擦音が検出されたときに上記励振源に対
してブーストを与えるブースト手段と、 上記入力狭帯域の音声信号のパラメータと、上記狭帯域
コードブックに格納されている入力狭帯域音声信号のパ
ラメータとを比較し、最適なパラメータを検索するマッ
チング手段と、 上記マッチング手段での検索結果に基づいて、上記広帯
域コードブックに格納されている広帯域音声信号のパラ
メータの中から対応するパラメータを読み出し、上記読
み出されたパラメータと上記励振源を基にして出力広帯
域音声信号を合成する合成手段とを備えたことを特徴と
する音声帯域幅拡張装置。 - 【請求項8】 上記破擦音検出手段は、少なくとも上記
入力音声信号の自己相関の値及びフレームパワーの値を
用いて、摩擦音や破擦音を検出するものである請求項7
記載の音声帯域幅拡張装置。 - 【請求項9】 上記ブースト手段は、ブースト値を除々
に変化させるものである請求項7又は8記載の音声帯域
幅拡張装置。 - 【請求項10】 予め複数の音声信号のパターンから得
られた狭帯域音声信号のパラメータが格納された狭帯域
コードブックと、予め複数の音声信号のパターンから得
られた広帯域音声信号のパラメータが上記狭帯域コード
ブックに対応して格納された広帯域コードブックとを設
け、 入力狭帯域音声信号からパラメータを求める分析し、 上記入力狭帯域音声信号のLPC残差から励振源を求
め、 摩擦音、破擦音を検出し、 上記摩擦音、破擦音が検出されたときに上記励振源に対
してブーストを与え、 上記入力狭帯域の音声信号のパラメータと、上記狭帯域
コードブックに格納されている入力狭帯域音声信号のパ
ラメータとを比較し、最適なパラメータを検索し、 上記マッチングでの検索結果に基づいて、上記広帯域コ
ードブックに格納されている広帯域音声信号のパラメー
タの中から対応するパラメータを読み出し、 上記読み出されたパラメータと上記励振源を基にして出
力広帯域音声信号を合成するようにしたことを特徴とす
る音声帯域幅拡張方法。 - 【請求項11】 上記破擦音や摩擦音は、上記入力音声
信号の自己相関の値及びフレームパワーの値を用いて検
出するものである請求項10記載の音声帯域幅拡張方
法。 - 【請求項12】 上記ブースト値を除々に変化させるよ
うにした請求項10又は11記載の音声帯域幅拡張方
法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8282235A JPH10124089A (ja) | 1996-10-24 | 1996-10-24 | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8282235A JPH10124089A (ja) | 1996-10-24 | 1996-10-24 | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10124089A true JPH10124089A (ja) | 1998-05-15 |
Family
ID=17649823
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8282235A Pending JPH10124089A (ja) | 1996-10-24 | 1996-10-24 | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10124089A (ja) |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004109661A1 (ja) * | 2003-06-05 | 2004-12-16 | Matsushita Electric Industrial Co., Ltd. | 音質調整装置および音質調整方法 |
| US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
| US7529670B1 (en) | 2005-05-16 | 2009-05-05 | Avaya Inc. | Automatic speech recognition system for people with speech-affecting disabilities |
| US7653543B1 (en) | 2006-03-24 | 2010-01-26 | Avaya Inc. | Automatic signal adjustment based on intelligibility |
| US7660715B1 (en) | 2004-01-12 | 2010-02-09 | Avaya Inc. | Transparent monitoring and intervention to improve automatic adaptation of speech models |
| US7675411B1 (en) | 2007-02-20 | 2010-03-09 | Avaya Inc. | Enhancing presence information through the addition of one or more of biotelemetry data and environmental data |
| US7925508B1 (en) | 2006-08-22 | 2011-04-12 | Avaya Inc. | Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns |
| US7962342B1 (en) | 2006-08-22 | 2011-06-14 | Avaya Inc. | Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns |
| WO2011080855A1 (ja) * | 2009-12-28 | 2011-07-07 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
| US8041344B1 (en) | 2007-06-26 | 2011-10-18 | Avaya Inc. | Cooling off period prior to sending dependent on user's state |
| JP2014167558A (ja) * | 2013-02-28 | 2014-09-11 | Oki Electric Ind Co Ltd | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム |
| CN111602197A (zh) * | 2018-01-17 | 2020-08-28 | 日本电信电话株式会社 | 解码装置、编码装置、它们的方法以及程序 |
-
1996
- 1996-10-24 JP JP8282235A patent/JPH10124089A/ja active Pending
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
| WO2004109661A1 (ja) * | 2003-06-05 | 2004-12-16 | Matsushita Electric Industrial Co., Ltd. | 音質調整装置および音質調整方法 |
| US7660715B1 (en) | 2004-01-12 | 2010-02-09 | Avaya Inc. | Transparent monitoring and intervention to improve automatic adaptation of speech models |
| US7529670B1 (en) | 2005-05-16 | 2009-05-05 | Avaya Inc. | Automatic speech recognition system for people with speech-affecting disabilities |
| US7653543B1 (en) | 2006-03-24 | 2010-01-26 | Avaya Inc. | Automatic signal adjustment based on intelligibility |
| US7925508B1 (en) | 2006-08-22 | 2011-04-12 | Avaya Inc. | Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns |
| US7962342B1 (en) | 2006-08-22 | 2011-06-14 | Avaya Inc. | Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns |
| US7675411B1 (en) | 2007-02-20 | 2010-03-09 | Avaya Inc. | Enhancing presence information through the addition of one or more of biotelemetry data and environmental data |
| US8041344B1 (en) | 2007-06-26 | 2011-10-18 | Avaya Inc. | Cooling off period prior to sending dependent on user's state |
| WO2011080855A1 (ja) * | 2009-12-28 | 2011-07-07 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
| US8706497B2 (en) | 2009-12-28 | 2014-04-22 | Mitsubishi Electric Corporation | Speech signal restoration device and speech signal restoration method |
| JP2014167558A (ja) * | 2013-02-28 | 2014-09-11 | Oki Electric Ind Co Ltd | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム |
| CN111602197A (zh) * | 2018-01-17 | 2020-08-28 | 日本电信电话株式会社 | 解码装置、编码装置、它们的方法以及程序 |
| CN111602197B (zh) * | 2018-01-17 | 2023-09-05 | 日本电信电话株式会社 | 解码装置、编码装置、它们的方法以及计算机可读记录介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH10124088A (ja) | 音声帯域幅拡張装置及び方法 | |
| EP1252621B1 (en) | System and method for modifying speech signals | |
| JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
| US6732070B1 (en) | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching | |
| JP3566652B2 (ja) | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 | |
| Spanias | Speech coding: A tutorial review | |
| JP4843124B2 (ja) | 音声信号を符号化及び復号化するためのコーデック及び方法 | |
| RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
| US6757649B1 (en) | Codebook tables for multi-rate encoding and decoding with pre-gain and delayed-gain quantization tables | |
| US6604070B1 (en) | System of encoding and decoding speech signals | |
| KR100421226B1 (ko) | 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용 | |
| EP1141946B1 (en) | Coded enhancement feature for improved performance in coding communication signals | |
| CA2426001C (en) | Method and system for estimating artificial high band signal in speech codec | |
| EP1006510A2 (en) | Signal encoding and decoding system | |
| WO2003010752A1 (fr) | Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale | |
| US7792672B2 (en) | Method and system for the quick conversion of a voice signal | |
| JPH10149199A (ja) | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 | |
| KR20070121254A (ko) | 광대역 부호화 및 복호화 방법 및 장치 | |
| JPH10124089A (ja) | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 | |
| JP2000122679A (ja) | 音声帯域拡張方法及び装置、音声合成方法及び装置 | |
| JP3230782B2 (ja) | 広帯域音声信号復元方法 | |
| JP4287840B2 (ja) | 符号化装置 | |
| WO2004040553A1 (ja) | 帯域拡張装置及び方法 | |
| Gersho | Concepts and paradigms in speech coding | |
| JPH0284700A (ja) | 音声符号化復号化装置 |