JP2000305599A - 音声合成装置及び方法、電話装置並びにプログラム提供媒体 - Google Patents

音声合成装置及び方法、電話装置並びにプログラム提供媒体

Info

Publication number
JP2000305599A
JP2000305599A JP11115415A JP11541599A JP2000305599A JP 2000305599 A JP2000305599 A JP 2000305599A JP 11115415 A JP11115415 A JP 11115415A JP 11541599 A JP11541599 A JP 11541599A JP 2000305599 A JP2000305599 A JP 2000305599A
Authority
JP
Japan
Prior art keywords
signal
wideband
excitation source
linear prediction
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11115415A
Other languages
English (en)
Inventor
Shiro Omori
士郎 大森
Masayuki Nishiguchi
正之 西口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11115415A priority Critical patent/JP2000305599A/ja
Priority to TW089107180A priority patent/TW469421B/zh
Priority to EP00303303A priority patent/EP1047045A3/en
Priority to KR1020000021084A priority patent/KR20000077057A/ko
Priority to US09/556,036 priority patent/US6732075B1/en
Priority to CNB001188240A priority patent/CN1185620C/zh
Publication of JP2000305599A publication Critical patent/JP2000305599A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02BHYDRAULIC ENGINEERING
    • E02B11/00Drainage of soil, e.g. for agricultural purposes
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21DSHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
    • E21D20/00Setting anchoring-bolts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Mining & Mineral Resources (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Structural Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Civil Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Agronomy & Crop Science (AREA)
  • Geology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

(57)【要約】 【課題】 狭帯域信号のサンプリング周波数8kHz、
広帯域信号のサンプリング周波数が16kHzであり、
狭帯域励振源が300−3400Hzに制限されたもの
であるとすると、広帯域励振源は300−3400Hz
および4600−7700Hzとなり、特に3400−
4600Hzの中域にギャップが生じる。 【解決手段】 この音声合成装置では、雑音付加部62
にて、3400−4600Hzの周波数帯域を持つ雑音
信号を生成し、ゲイン調整を行い、ゼロ詰め部61での
ゼロ詰め後の励振源excWに加算する。これにより得
られる広帯域励振源excW’は、よりフラットに近づ
いている。ゲイン調整は、狭帯域励振源もしくはゼロ詰
め後の励振源のパワーを求めるなどを行い、これに応じ
た値とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば通信、放送
によって伝えられる周波数帯域の狭い音声信号またはそ
れを構成するパラメータを受信側で使って広帯域信号を
合成する音声合成装置及び方法に関する。また、その音
声合成装置及び方法を適用した電話装置、さらに上記音
声合成方法をソフトウェアプログラムとして提供するプ
ログラム提供媒体に関する。
【0002】
【従来の技術】従来から、有線電話や移動電話の音質に
は不満の声がある。この原因の一つとして、周波数帯域
幅が300〜3400Hzと狭いことが挙げられる。
【0003】しかし、伝送路の規格が定まっているた
め、この幅を広げることは難しく、したがって、受信側
で帯域外の信号成分を予測し、広帯域信号を生成する様
々な手段が提案されている。
【0004】中でも、一般に音声信号処理によく用いら
れる線形予測(LPC)分析および合成の方法に基づい
て、狭帯域音声信号から求められる線形予測係数αと、
線形予測残差もしくはこれを元に量子化等をって得られ
た励振源の両方を広帯域化し、広帯域化された線形予測
係数αと励振源により広帯域のLPC合成を行うという
方法がある。
【0005】ただし、この方法では、これによって得ら
れた広帯域音声には歪みが含まれるため、このうち原音
声に含まれていた周波数成分においては、合成された広
帯域音声のうちこの成分をフィルタにより除去し、原音
声と加算する。
【0006】ここで、励振源の帯域拡張方法として、励
振源は白色雑音に近いという性質から、各サンプル間に
ゼロ値を挿入することによって、エイリアシング成分を
発生させ、これを広帯域励振源とする方法がある。
【0007】例えば各サンプル間に1つずつゼロ値を挿
入するということは、周波数領域で考えると、スペクト
ルがナイキスト周波数を境に線対称の形に表れる。した
がって、元々白色雑音に近い狭帯域励振源から広帯域励
振源を求める場合に、この方法はある程度有効である。
【0008】
【発明が解決しようとする課題】ところで、例えば狭帯
域信号のサンプリング周波数8kHz、広帯域信号のサ
ンプリング周波数が16kHzであり、狭帯域励振源が
300−3400Hzに制限されたものであるとする
と、上記方法で得られる広帯域励振源は300−340
0Hzおよび4600−7700Hzとなり、特に34
00−4600Hzの中域にギャップが生じる。このた
めに、広帯域LPC合成を行ってもこのギャップの帯域
は生成されず、この帯域を持たない広帯域音声が生成さ
れ、不自然であった。
【0009】このように、帯域拡張をはじめとするLP
C合成を行う系において、励振源の品質が悪いために、
合成された信号の品質が悪くなってしまうということが
あった。
【0010】本発明は、上記実情に鑑みてなされたもの
であり、励振源の品質を改善することで、より品質の良
い広帯域信号を合成できる音声合成装置及び方法の提供
を目的とする。
【0011】また、本発明は、上記音声合成装置及び方
法を適用することで、品質の良い広帯域信号を受信手段
から出力できる電話装置の提供を目的とする。
【0012】また、本発明は、上記音声合成方法をプロ
グラム化して提供することにより、品質の良い広帯域信
号を安価に提供できるプログラム提供媒体の提供を目的
とする。
【0013】
【課題を解決するための手段】本発明に係る音声合成装
置は、上記課題を解決するために、狭帯域信号の線形予
測残差又は励振源を入力パラメータにしたフィルタ合成
により得られた出力信号の一部を用いて広帯域信号を合
成する音声合成装置において、上記線形予測残差又は励
振源に雑音信号を付加する雑音付加手段を備える。
【0014】また、本発明に係る音声合成装置は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成装置において、上記線形予測残差又は励振源を用い
て広帯域励振源を生成する広帯域励振源生成手段と、上
記広帯域励振源に雑音信号を付加する雑音付加手段とを
備える。
【0015】また、本発明に係る音声合成装置は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成装置において、上記線形予測残差又は励振源に雑音
信号を付加する雑音付加手段と、上記雑音付加手段で雑
音信号が付加された線形予測残差又は励振源から広帯域
励振源を生成する広帯域励振源生成手段とを備える。
【0016】また、本発明に係る音声合成装置は、上記
課題を解決するために、狭帯域信号から生成した線形予
測残差を入力パラメータにしたフィルタ合成により得た
出力信号の一部を用いて広帯域信号を合成する音声合成
装置において、上記狭帯域信号を分析して線形予測残差
信号を求める分析手段と、上記分析手段で得られた線形
予測残差信号から広帯域残差信号を生成する広帯域残差
信号生成手段と、上記広帯域残差信号生成手段で生成さ
れた広帯域残差信号の持つ周波数帯域以外の帯域成分を
含む雑音信号を上記広帯域残差信号に付加する雑音付加
手段とを備える。
【0017】また、本発明に係る音声合成装置は、上記
課題をかいけつするために、狭帯域信号から生成した線
形予測残差を入力パラメータにしたフィルタ合成により
得た出力信号の一部を用いて広帯域信号を合成する音声
合成装置において、上記狭帯域信号を分析して線形予測
残差信号を求める分析手段と、上記分析手段で得られた
線形予測残差信号の持つ周波数帯域以外の帯域成分を含
む雑音信号を上記残差信号に付加する雑音付加手段と、
上記雑音付加手段で雑音信号が付加された線形予測残差
信号から広帯域残差信号を生成する広帯域残差信号生成
手段とを備える。
【0018】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成方法において、上記線形予測残差又は励振源に雑音
信号を付加する雑音付加工程を備える。
【0019】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成方法において、上記線形予測残差又は励振源を用い
て広帯域励振源を生成する広帯域励振源生成工程と、上
記広帯域励振源に雑音信号を付加する雑音付加工程とを
備える。
【0020】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号の線形予測残差又は
励振源を入力パラメータにしたフィルタ合成により得ら
れた出力信号の一部を用いて広帯域信号を合成する音声
合成方法において、上記線形予測残差又は励振源に雑音
信号を付加する雑音付加工程と、上記雑音付加工程で雑
音信号が付加された線形予測残差又は励振源から広帯域
励振源を生成する広帯域励振源生成工程とを備える。
【0021】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号から生成した線形予
測残差を入力パラメータにしたフィルタ合成により得た
出力信号の一部を用いて広帯域信号を合成する音声合成
方法において、上記狭帯域信号を分析して線形予測残差
信号を求める分析工程と、上記分析工程で得られた線形
予測残差信号から広帯域残差信号を生成する広帯域残差
信号生成工程と、上記広帯域残差信号生成工程で生成さ
れた広帯域残差信号の持つ周波数帯域以外の帯域成分を
含む雑音信号を上記広帯域残差信号に付加する雑音付加
工程とを備える。
【0022】また、本発明に係る音声合成方法は、上記
課題を解決するために、狭帯域信号から生成した線形予
測残差を入力パラメータにしたフィルタ合成により得た
出力信号の一部を用いて広帯域信号を合成する音声合成
方法において、上記狭帯域信号を分析して線形予測残差
信号を求める分析工程と、上記分析工程で得られた線形
予測残差信号の持つ周波数帯域以外の帯域成分を含む雑
音信号を上記残差信号に付加する雑音付加工程と、上記
雑音付加工程で雑音信号が付加された線形予測残差信号
から広帯域残差信号を生成する広帯域残差信号生成工程
とを備える。
【0023】また、本発明に係る電話装置は、上記課題
を解決するために、伝送信号として狭帯域信号のパラメ
ータをPSI−CELP符号化又はVSELP符号化し
て送信する送信手段と、上記パラメータの内の線形予測
残差又は励振源に雑音信号を付加してからフィルタ合成
により得た出力信号の一部を用いて広帯域信号を合成す
る受信手段とを備える。
【0024】また、本発明に係る電話装置は、上記課題
を解決するために、伝送信号として狭帯域信号のパラメ
ータをPSI−CELP符号化又はVSELP符号化し
て送信する送信手段と、上記パラメータの内の線形予測
残差又は励振源を用いて広帯域励振源を生成し、この広
帯域励振源に雑音信号を付加してからフィルタ合成によ
り得た出力信号の一部を用いて広帯域信号を合成する受
信手段とを備える。
【0025】また、本発明に係る電話装置は、上記課題
を解決するために、伝送信号として狭帯域信号のパラメ
ータをPSI−CELP符号化又はVSELP符号化し
て送信する送信手段と、上記パラメータの内の線形予測
残差又は励振源に雑音信号を付加し、この雑音信号が付
加された線形予測誤差又は励振源から広帯域励振源を生
成し、この広帯域励振源を用いたフィルタ合成により得
た出力信号の一部を用いて広帯域信号を合成する受信手
段とを備える。
【0026】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号の線形予測
残差又は励振源を入力パラメータにしたフィルタ合成に
より得られた出力信号の一部を用いて広帯域信号を合成
するためのプログラムを提供するプログラム提供媒体に
おいて、上記線形予測残差又は励振源を用いて広帯域励
振源を生成する広帯域励振源生成手順と、上記広帯域励
振源に雑音信号を付加する雑音付加手順とを備える音声
合成プログラムを提供する。
【0027】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号の線形予測
残差又は励振源を入力パラメータにしたフィルタ合成に
より得られた出力信号の一部を用いて広帯域信号を合成
するためのプログラムを提供するプログラム提供媒体に
おいて、上記線形予測残差又は励振源に雑音信号を付加
する雑音付加手順と、上記雑音付加手順で雑音信号が付
加された線形予測残差又は励振源から広帯域励振源を生
成する広帯域励振源生成手順とを備える音声合成プログ
ラムを提供する。
【0028】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号から生成し
た線形予測残差を入力パラメータにしたフィルタ合成に
より得た出力信号の一部を用いて広帯域信号を合成する
ためのプログラムを提供するプログラム提供媒体におい
て、上記狭帯域信号を分析して線形予測残差信号を求め
る分析手順と、上記分析手順で得られた線形予測残差信
号から広帯域残差信号を生成する広帯域残差信号生成手
順と、上記広帯域残差信号生成手順で生成された広帯域
残差信号の持つ周波数帯域以外の帯域成分を含む雑音信
号を上記広帯域残差信号に付加する雑音信号付加手順と
を備える音声合成プログラムを提供する。
【0029】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、狭帯域信号から生成し
た線形予測残差を入力パラメータにしたフィルタ合成に
より得た出力信号の一部を用いて広帯域信号を合成する
ためのプログラムを提供するプログラム提供媒体におい
て、上記狭帯域信号を分析して線形予測残差信号を求め
る分析手順と、上記分析手順で得られた線形予測残差信
号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
記残差信号に付加する雑音付加手順と、上記雑音付加手
順で雑音信号が付加された線形予測残差信号から広帯域
残差信号を生成する広帯域残差信号生成手順とを備える
音声合成プログラムを提供する。
【0030】すなわち、本来励振源となる信号に、あえ
て別の雑音信号を加算し、合成された信号の品質を改善
する。
【0031】特に、狭帯域励振源のパワー等によりゲイ
ンが調整された3400−4600Hzの雑音成分を別
途生成しておき、ゼロ詰めによって得られた広帯域励振
源に加算し、これを広帯域励振源とする。あるいは、3
400−4000Hzの雑音成分を別途生成しておき、
狭帯域励振源に加算し、その後でゼロ詰めを行い、広帯
域励振源とすれば、ギャップが解消される。
【0032】上記音声合成装置及び方法によれば、線形
予測係数αおよび励振源もしくは予測残差excが与えら
れ、このうちのexcに別途用意した雑音信号が加算さ
れ、これをexc’と呼ぶとすると、その後にαをフィル
タ係数とする合成フィルタに、exc’が入力され、フィ
ルタ処理により出力信号が得られる。
【0033】また、狭帯域信号の合成に用いられるフィ
ルタ係数αNから、何らかの予測手段により広帯域化さ
れたフィルタ係数αWが求められ、励振源もしくは予測
残差excNは、ゼロ詰めによりエイリアシングが発生し
た信号にされ、さらに別途用意した雑音信号が加算さ
れ、これをexcWと呼ぶとすると、その後にαWをフィ
ルタ係数とする合成フィルタに、excWが入力され、フ
ィルタ処理により出力信号が得られる。
【0034】また、狭帯域信号の合成に用いられるフィ
ルタ係数αNから、何らかの予測手段により広帯域化さ
れたフィルタ係数αWが求められ、励振源もしくは予測
残差excNは、別途用意した雑音信号が加算され、さら
にゼロ詰めによりエイリアシングが発生した信号にさ
れ、これをexcWと呼ぶとすると、その後にαWをフィ
ルタ係数とする合成フィルタに、excWが入力され、フ
ィルタ処理により出力信号が得られる。
【0035】また、狭帯域信号が入力されると、線形予
測分析等の分析が行われ、この結果狭帯域係数αNが得
られ、逆フィルタにより予測残差信号excNが得られ、
何らかの予測手段により広帯域化されたフィルタ係数α
Wが求められ、励振源もしくは予測残差excNは、ゼロ
詰めによりエイリアシングが発生した信号にされ、さら
に別途用意した雑音信号が加算され、これをexcWと呼
ぶとすると、その後にαWをフィルタ係数とする合成フ
ィルタに、excWが入力され、フィルタ処理により出力
信号が得られる。
【0036】また、狭帯域信号が入力されると、線形予
測分析等の分析が行われ、この結果狭帯域係数αNが得
られ、逆フィルタにより予測残差信号excNが得られ、
何らかの予測手段により広帯域化されたフィルタ係数α
Wが求められ、励振源もしくは予測残差excNは、別途
用意した雑音信号が加算され、さらにゼロ詰めによりエ
イリアシングが発生した信号にされ、これをexcWと呼
ぶとすると、その後にαWをフィルタ係数とする合成フ
ィルタに、excWが入力され、フィルタ処理により出力
信号が得られる。
【0037】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。狭帯域音声信号用のパ
ラメータを用いたフィルタ合成により得た広帯域音声信
号の一部を上記狭帯域音声信号に加算して広帯域信号を
合成できる音声合成方法を適用した音声合成装置を実施
の形態とする。以下には、いくつかの具体例を示す。
【0038】先ず、音声合成装置の第1の具体例を図1
に示す。この音声合成装置には、周波数帯域が300H
z〜3400Hzで、サンプリング周波数が8KHzの
狭帯域音声信号sndNと、その狭帯域音声の合成に用い
られる線形予測係数αNと、励振源excNとが、各入力
端子57、51、53から供給される。
【0039】線形予測係数αNと励振源excNが上記狭
帯域音声信号sndNに関するパラメータである。但し、
これらパラメータと入力信号は全てが独立ではなく、線
形予測係数αN及び励振源excNは、狭帯域音声信号snd
Nを線形予測分析して求めることができる。この場合ex
cNは正確には線形予測残差である。あるいは逆に線形
予測係数αN及び励振源excNから、フィルタ合成によ
り狭帯域音声信号sndNを求めることもできる。また、
狭帯域音声信号sndNに前処理を施してから線形予測分
析して線形予測係数αNおよび励振源excNを求めるこ
ともできるし、さらに量子化をされたものを線形予測係
数αNおよび励振源excNとする等ができる。同様に線
形予測係数αNおよび励振源(線形予測残差)excNか
ら、フィルタ合成した後に後処理を加えたものを狭帯域
音声信号sndNとすること等ができる。
【0040】この音声合成装置は、入力端子51から供
給された線形予測係数αNを広帯域化するα広帯域化部
52と、入力端子53から供給された励振源excNを広
帯域化するゼロ詰め部61と、このゼロ詰め部61から
の広帯域化励振源excWに雑音信号を付加する雑音付加
部62と、雑音付加部62で雑音信号が付加された広帯
域励振源excW’を入力としα広帯域化部52からの広
帯域線形予測係数αWをフィルタ係数として広帯域音声
信号をLPC合成する広帯域LPC合成部55と、広帯
域LPC合成部55からの合成出力音声信号から狭帯域
音声信号の持っている周波数帯域を抑圧する帯域抑圧部
56と、入力端子57から供給された狭帯域音声信号sn
dNのサンプリング周波数を広帯域音声信号用の16K
Hzにするオーバーサンプル部58と、オーバーサンプ
ル部58からの狭帯域音声信号sndN’と帯域抑圧部5
6からの出力信号とを加算する加算器59とを備え、出
力端子60から広帯域音声信号sndWを出力する。
【0041】α広帯域化部52は、狭帯域スペクトル包
絡を表すパラメータである線形予測係数αNから、これ
よりも広い周波数帯域のスペクトル包絡を表すパラメー
タである広帯域化線形予測係数αWを求める。具体的に
は、狭帯域線形予測係数αNを自己相関rNに変換し、
この自己相関rNを狭帯域音声用のコードブックを用い
て量子化し、その量子化データを広帯域音声用のコード
ブックを用いて逆量子化して広帯域自己相関rWを求
め、この広帯域自己相関rWを広帯域線形予測係数αW
に変換する。
【0042】ゼロ詰め部61は、広帯域音声のサンプリ
ング周波数が狭帯域音声のサンプリング周波数のn倍で
ある場合、各サンプル間にn−1のゼロ値を挿入する。
これによって、サンプリング周波数を合わせるととも
に、エイリアシング成分が発生する。もともと励振源の
周波数特性はフラットに近いため、エイリアシングも当
然フラットに近く、広帯域の励振源excWとして利用が
できる。
【0043】しかしながら、狭帯域励振源excNが0H
zからナイキスト周波数までフラットではない場合、エ
イリアシング成分も、これに対応する部分がフラットで
はない。例えば狭帯域励振源が300−3400Hzに
制限されており、サンプリング周波数を2倍にするため
に1サンプルおきにゼロ値を挿入すると、広帯域励振源
excWは300−3400Hzおよび4600−770
0Hzとなり、特に3400−4600Hzの中域成分
を持たず、品質が良くない。
【0044】そこで、この図1に示す音声合成装置で
は、雑音付加部62にて、3400−4600Hzの周
波数帯域を持つ雑音信号を生成し、ゲイン調整を行い、
ゼロ詰め部61でのゼロ詰め後の励振源excWに加算す
る。これにより得られる広帯域励振源excW’は、より
フラットに近づいている。ゲイン調整は、狭帯域励振源
もしくはゼロ詰め後の励振源のパワーを求めるなどを行
い、これに応じた値とする。あるいは、コーデックに適
用する場合、雑音コードブックに乗じるべきゲイン値な
どがパラメータによってあらかじめ与えられていれば、
励振源のパワーを求めずに、これをそのまま用いる、も
しくはこれに応じた値を求める等を行っても良い。
【0045】広帯域LPC合成部55は、上記α広帯域
化部52で求められた広帯域化線形予測係数αWをフィ
ルタ係数とし、上記雑音付加部62からのexcW’を入
力とすることで、フィルタ合成を行い、広帯域の音声信
号を合成する。
【0046】帯域抑圧部56は、元々入力信号である狭
帯域音声信号の持っている周波数帯域を抑圧する。これ
は、上記広帯域LPC合成部55で得られる信号には歪
みが含まれるので、元々持っている帯域に関してはその
まま使うためである。
【0047】オーバーサンプル部58は、サンプリング
周波数を広帯域音声信号のものに合わせる。
【0048】加算器59は、帯域抑圧部56で得られた
信号とオーバーサンプル部58で得られた信号を加算す
る。両者の周波数帯域は異なっており、両者を加算する
ことで出力である広帯域音声信号sndWが得られる。
【0049】この第1の具体例の全体的な動作は以下の
通りとなる。入力端子51から線形予測係数αN、入力
端子53から狭帯域励振源excN、及び入力端子57か
ら狭帯域音声信号sndNが入力されると、先ず、狭帯域
線形予測係数αNがα広帯域化部52で広帯域化され広
帯域線形予測係数αWが得られる。一方で狭帯域励振源
excNが広帯域化されるが、まずゼロ詰め部61でゼロ
詰めが行われ、雑音付加部62で生成された雑音信号が
加算され、より品質の良い広帯域励振源excWが生成さ
れる。これらを用いて広帯域LPC合成部55でLPC
合成が行われ、第一の広帯域の音声信号が得られる。
【0050】次に、この第一の広帯域の音声信号のう
ち、狭帯域音声が持つ周波数帯域が帯域抑圧部56で抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndNは広帯域音声信号のサンプリング周波数に
オーバーサンプル部58でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器59で加算され、最終的
な広帯域音声信号sndWが出力端子60から出力され
る。
【0051】したがって、この第1の具体例では、励振
源の品質を改善することでより品質のよい広帯域信号を
得られる。
【0052】ここで、帯域抑圧部56は、厳密に狭帯域
音声の持つ周波数帯域のみを抑圧するのではなく、例え
ば低域を全て抑圧してしまうハイパスフィルタ等でも良
い。また、第一の広帯域音声信号もしくは第二の広帯域
音声信号に、さらにゲインを乗じたり、フィルタ処理を
行って周波数特性を変化させる等を行っても良い。
【0053】比較のため図2には、従来の音声合成装置
の構成を示す。上記図1に示した音声合成装置と異なる
のは、狭帯域励振源excNに対する処理系である。図2
に示す音声合成装置では、励振源の広帯域化部(exc広
帯域化部)54により狭帯域励振源excNを広帯域化し
ている。
【0054】このexc広帯域化部54は、狭帯域音声信
号と広帯域音声信号のサンプリング周波数が異なる場
合、サンプリング周波数を広帯域音声信号に合わせる機
能を持ち、さらに狭帯域励振源excNの持つ周波数帯域
よりも広い周波数帯域を持つ広帯域励振源excWを求め
る。
【0055】この図2に示した従来の音声合成装置の全
体的な動作は以下の通りとなる。入力端子51から線形
予測係数αN、入力端子53から狭帯域励振源excN、
及び入力端子57から狭帯域音声信号sndNが入力され
ると、先ず、狭帯域線形予測係数αNがα広帯域化部5
2で広帯域化され広帯域線形予測係数αWが得られる。
一方で狭帯域励振源excNがexc広帯域化部54で広帯域
化される。これらを用いて広帯域LPC合成部55でL
PC合成が行われ、第一の広帯域の音声信号が得られ
る。
【0056】そして、この第一の広帯域の音声信号のう
ち、狭帯域音声が持つ周波数帯域が帯域抑圧部56で抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndNは広帯域音声信号のサンプリング周波数に
オーバーサンプル部58でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器59で加算され、最終的
な広帯域音声信号sndWが出力端子60から出力され
る。
【0057】しかし、狭帯域信号のサンプリング周波数
8kHz、広帯域信号のサンプリング周波数が16kH
zであり、狭帯域励振源が300−3400Hzに制限
されたものであるとすると、上記exc広帯域化部54に
より得られる広帯域励振源excWは300−3400H
zおよび4600−7700Hzとなり、特に3400
−4600Hzの中域にギャップが生じる。このため
に、広帯域LPC合成部55で広帯域LPC合成を行っ
てもこのギャップの帯域は生成されず、この帯域を持た
ない広帯域音声が生成され、不自然であった。
【0058】そこで、上記図1に示した音声合成装置
は、本来励振源となる信号に、あえて別の雑音信号を加
算し、合成された信号の品質を改善している。
【0059】すなわち、狭帯域励振源excNをゼロ詰め
して広帯域化した後、雑音信号を加算して広帯域音声信
号を合成している。特に、狭帯域励振源のパワー等によ
りゲインが調整された3400−4600Hzの雑音成
分を別途生成しておき、ゼロ詰めによって得られた広帯
域励振源に加算しこれを広帯域励振源としている。
【0060】次に、音声合成装置の第2の具体例を図3
に示す。この図3に示す音声合成装置にも、周波数帯域
が300Hz〜3400Hzで、サンプリング周波数が
8KHzの狭帯域音声信号sndNと、その狭帯域音声の
合成に用いられる線形予測係数αNと、励振源excNと
が、各入力端子57、51、53から供給される。
【0061】上記第1の具体例と異なるのは狭帯域励振
源excNの処理系であり、他の構成は上記図1と同様で
あるので、同符号を付し説明を省略する。
【0062】具体的には、3400−4000Hzの雑
音成分を雑音付加部71で別途生成しておき、狭帯域励
振源excNに付加し、その後ゼロ詰め部72でゼロ詰め
を行い、広帯域励振源excWとしている。すなわち、雑
音信号を狭帯域励振源excNに付加してから、広帯域励
振源excWを求め、広帯域音声信号を合成している。
【0063】狭帯域励振源として利用されるexcNの周
波数特性はフラットに近い。しかしながら、これが0H
zからナイキスト周波数までフラットではない場合、ゼ
ロ詰め部72によって広帯域化された励振源excWもフ
ラットではなくなる。例えば狭帯域励振源が300−3
400Hzに制限されており、サンプリング周波数を2
倍にするために1サンプルおきにゼロ値を挿入すると、
広帯域励振源は300−3400Hzおよび4600−
7700Hzとなり、3400−4600Hzの中域成
分を持たず、品質が良くない。
【0064】そこで雑音付加部71は、3400−40
00Hzの周波数帯域を持つ雑音信号を生成し、ゲイン
調整を行い、励振源excNに付加している。これにより
得られる狭帯域励振源は、よりフラットに近づいてい
る。ゲイン調整は、狭帯域励振源パワーを求めるなどを
行い、これに応じた値とする。あるいは、コーデックに
適用する場合、雑音コードブックに乗じるべきゲイン値
などがパラメータによってあらかじめ与えられていれ
ば、励振源のパワーを求めずに、これをそのまま用い
る、もしくはこれに応じた値を求める等を行っても良
い。
【0065】ゼロ詰め部72は、広帯域音声のサンプリ
ング周波数が狭帯域音声のサンプリング周波数のn倍で
ある場合、各サンプル間にn−1のゼロ値を挿入する。
これによって、サンプリング周波数を合わせるととも
に、エイリアシング成分が発生する。雑音を付加された
狭帯域励振源の周波数特性は、当初よりいっそうフラッ
トに近い。従って、ゼロ詰めによって得られるエイリア
シングもフラットに近く、品質の良い広帯域励振源とし
て利用ができる。
【0066】この第2の具体例の全体的な動作は以下の
通りとなる。入力端子51から線形予測係数αN、入力
端子53から狭帯域励振源excN、及び入力端子57か
ら狭帯域音声信号sndNが入力されると、先ず、狭帯域
線形予測係数αNが広帯域化され広帯域線形予測係数α
Wが得られる。一方で狭帯域励振源excNが広帯域化さ
れるが、まず雑音付加部71で生成された雑音信号が加
算され、ゼロ詰め部72でゼロ詰めが行われ、より品質
の良い広帯域励振源excWとなる。これらを用いて広帯
域LPC合成部55で広帯域のLPC合成が行われ、第
一の広帯域の音声信号が得られる。そして、この第一の
広帯域の音声信号のうち、狭帯域音声信号が持つ周波数
帯域が抑圧され、第二の広帯域音声信号となる。一方で
狭帯域音声信号sndNは広帯域音声信号のサンプリング
周波数にオーバーサンプル部58でオーバーサンプルさ
れ、上記第二の広帯域音声信号と加算器59で加算さ
れ、出力端子60から最終的な広帯域音声信号sndWが
出力される。
【0067】この第2の具体例においても、励振源の品
質を改善することでより品質のよい広帯域信号を得られ
る。
【0068】図4には音声合成装置の第3の具体例を示
す。この図4に示す音声合成装置には、周波数帯域が3
00Hz〜3400Hzで、サンプリング周波数が8K
Hzの狭帯域音声信号sndNのみが入力端子57から供
給される。
【0069】上記第1の具体例と異なるのは、αNとex
cNをLPC分析部81により求めていることである。
他の構成は上記図1と全く同様であり、同符号を付し説
明を省略する。
【0070】LPC分析部81は、狭帯域音声sndNが
入力端子57から入力されると、これを線形予測分析
し、線形予測係数αN及びこれを用いた逆フィルタの結
果である線形予測残差excNを得る。
【0071】このLPC分析部81で得られた線形予測
係数αNおよび線形予測残差excNを、上記第1の具体
例で述べた図1中の線形予測係数αNおよび励振源exc
Nとしてそのまま、もしくは何らかの後処理を用いて整
形をし、使用することで音声の広帯域化を行うのがこの
具体例である。
【0072】この第3の具体例の全体的な動作は以下の
通りとなる。入力端子57から狭帯域音声sndNが入力
されると、LPC分析部81は線形予測分析を行い、狭
帯域線形予測係数αNおよび狭帯域線形予測残差excN
が得られる。そして狭帯域線形予測係数αNがα広帯域
化部52で広帯域化され広帯域線形予測係数αWが得ら
れる。一方で狭帯域励振源excNが広帯域化されるが、
まずゼロ詰め部61でゼロ詰めが行われ、雑音付加部6
2で生成された雑音信号が加算され、より品質の良い広
帯域励振源excW’となる。これらを用いて広帯域LP
C合成部55で広帯域のLPC合成が行われ、第一の広
帯域の音声信号が得られる。次に、この第一の広帯域の
音声信号のうち、狭帯域音声信号が持つ周波数帯域が抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndNは広帯域音声信号のサンプリング周波数に
オーバーサンプル部58でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器59で加算され、最終的
な広帯域音声信号sndWが出力端子60から出力され
る。
【0073】この第3の具体例においても、励振源の品
質を改善することでより品質のよい広帯域信号を得られ
る。
【0074】図5には音声合成装置の第4の具体例を示
す。この図5に示す音声合成装置にも、上記第3の具体
例と同様に、周波数帯域が300Hz〜3400Hz
で、サンプリング周波数が8KHzの狭帯域音声信号sn
dNのみが入力端子57から供給される。
【0075】上記第3の具体例と異なるのは、LPC分
析部81で求めた線形予測残差excNを処理する系であ
り、他の構成は上記図4と同様であるので、同符号を付
し説明を省略する。
【0076】具体的には、3400−4000Hzの雑
音成分を雑音付加部71で別途生成しておき、線形予測
残差excNに付加し、その後ゼロ詰め部72でゼロ詰め
を行い、広帯域励振源excWとしている。すなわち、雑
音信号を狭帯域線形予測残差excNに付加してから、広
帯域励振源excWを求め、広帯域音声信号を合成してい
る。
【0077】この第4の具体例の全体的な動作は以下の
通りとなる。入力端子57から狭帯域音声sndNが入力
されると、LPC分析部81は線形予測分析を行い、狭
帯域線形予測係数αNおよび狭帯域線形予測残差excN
が得られる。そして狭帯域線形予測係数αNがα広帯域
化部52で広帯域化され広帯域線形予測係数αWが得ら
れる。一方で線形予測残差excNが広帯域化されるが、
まず雑音付加部71で生成された雑音信号が付加され、
ゼロ詰め部72でゼロ詰めが行われ、より品質の良い広
帯域励振源excW’となる。これらを用いて広帯域LP
C合成部55で広帯域のLPC合成が行われ、第一の広
帯域の音声信号が得られる。次に、この第一の広帯域の
音声信号のうち、狭帯域音声信号が持つ周波数帯域が抑
圧され、第二の広帯域音声信号となる。一方で狭帯域音
声信号sndNは広帯域音声信号のサンプリング周波数に
オーバーサンプル部58でオーバーサンプルされ、上記
第二の広帯域音声信号と加算器59で加算され、最終的
な広帯域音声信号sndWが出力端子60から出力され
る。
【0078】この第4の具体例においても、励振源の品
質を改善することでより品質のよい広帯域信号を得られ
る。
【0079】図6には音声合成装置の第5の具体例を示
す。この図6に示す音声合成装置の入力端子1には、周
波数帯域が例えば300Hz〜3400Hzで、サンプ
リング周波数が8kHzの狭帯域音声信号が供給され
る。
【0080】この第5の具体例となる音声合成装置は、
広帯域有声音及び無声音から抽出した有声音用及び無声
音用パラメータを用いて予め作成した広帯域有声音用コ
ードブック12と広帯域無声音用コードブック14と、
上記広帯域音声を周波数帯域制限して得た周波数帯域が
例えば300Hz〜3400Hzの狭帯域音声信号から
抽出した有声音用及び無声音用パラメータにより予め作
成した狭帯域有声音用コードブック7と狭帯域無声音用
コードブック10とを備える。
【0081】また、この音声合成装置は、入力端子1か
ら入力され、フレーム化回路2により、160サンプル
毎にフレーミング(サンプリング周波数は8kHzであ
るので1フレームは20msec)された上記狭帯域信
号に基づいて励振源を求める励振源形成手段となるゼロ
詰め部16と、このゼロ詰め部16からの励振源に雑音
信号を付加する雑音付加部91と、上記入力狭帯域信号
を20msecの1フレーム毎に有声音(V)と無声音
(UV)に判定する有声音(V)/無声音(UV)判定
部5と、この有声音(V)/無声音(UV)判定部5か
らの有声音(V)/無声音(UV)判定結果に基づいて
狭帯域有声音用及び無声音用の線形予測係数αを出力す
るLPC(線形予測符号化)分析回路3と、このLPC
分析回路3からの線形予測係数αをパラメータの一種で
ある自己相関rに変換する線形予測係数→自己相関(α
→r)変換回路4と、このα→r変換回路4からの狭帯
域有声音用自己相関を狭帯域有声音用コードブック8を
用いて量子化する狭帯域有声音用量子化器7と、上記α
→r変換回路4からの狭帯域無声音用自己相関を狭帯域
無声音用コードブック10を用いて量子化する狭帯域無
声音用量子化器9と、狭帯域有声音用量子化器7からの
狭帯域有声音用量子化データを広帯域有声音用コードブ
ック12を用いて逆量子化する広帯域有声音用逆量子化
器11と、狭帯域無声音用量子化器9からの狭帯域無声
音用量子化データを広帯域無声音用コードブック14を
用いて逆量子化する広帯域無声音用逆量子化器13と、
広帯域有声音用逆量子化器11からの逆量子化データと
なる広帯域有声音用自己相関を広帯域有声音用の線形予
測係数に変換すると共に広帯域無声音用逆量子化器13
からの逆量子化データとなる広帯域無声音用自己相関を
広帯域無声音用の線形予測係数に変換する自己相関→線
形予測係数(r→α)変換回路15と、このr→α変換
回路15からの広帯域有声音用線形予測係数と広帯域無
声音用線形予測係数と雑音付加部91で雑音信号が付加
された励振源とに基づいて広帯域音声を合成するLPC
合成回路17とを備えてなる。
【0082】また、この音声合成装置は、フレーム化回
路2でフレーミングされた狭帯域音声のサンプリング周
波数を8kHzから16kHzにオーバーサンプリング
するオーバーサンプル回路19と、LPC合成回路17
からの合成出力から入力狭帯域音声信号の周波数帯域3
00Hz〜3400Hzの信号成分を除去するバンドス
トップフィルタ(BSF)18と、このBSF18から
のフィルタ出力にオーバーサンプル回路19からのサン
プリング周波数16kHzの周波数帯域300Hz〜3
400Hzの基の狭帯域音声信号の成分とを加算する加
算器20とを備えている。そして、出力端子21から
は、周波数帯域が300〜7000Hzで、サンプリン
グ周波数が16kHzのディジタル音声信号が出力され
る。
【0083】ここで、広帯域有声音用コードブック12
と広帯域無声音用コードブック14と、狭帯域有声音用
コードブック8と狭帯域無声音用コードブック10の作
成について説明する。
【0084】先ず、広帯域有声音用コードブック12と
広帯域無声音用コードブック14は、フレーム化回路2
でのフレーミングと同様に例えば20msec毎にフレ
ーミングした、周波数帯域が例えば300Hz〜700
0Hzの広帯域音声信号を、有声音(V)と無声音(U
V)に分け、この広帯域有声音及び無声音から抽出した
有声音用及び無声音用パラメータを用いて作成する。
【0085】また、狭帯域有声音用コードブック7と狭
帯域無声音用コードブック10は、上記広帯域音声を周
波数帯域制限して得た周波数帯域が例えば300Hz〜
3400Hzの狭帯域音声信号から抽出した有声音用及
び無声音用パラメータにより作成する。
【0086】図7は、上記4つのコードブックを作成す
るにあたっての学習データの作り方を説明するための図
である。図7に示すように、広帯域の学習用音声信号を
用意し、ステップS1で1フレーム20msecにフレ
ーミングする。また、上記広帯域の学習用音声信号をス
テップS2で帯域制限して狭帯域とした信号についても
上記ステップS1でのフレーミングと同じタイミングの
フレーム位相によりステップS3でフレーミングする。
そして、狭帯域音声の各フレームにおいて、例えばフレ
ームエネルギーやゼロクロスの値等を調べることによっ
てステップS4で有声音(V)か無声音(UV)かの判
別を行う。
【0087】ここで、コードブックの品質を良いものと
するために、有声音(V)から無声音(UV)、UVか
らVへの遷移状態のものや、VともUVとも判別しがた
いものは除外してしまい、確実にVであるものと、確実
にUVであるもののみを利用する。このようにして、学
習用狭帯域Vフレームの集まりと、同うVフレームの集
まりを作成する。
【0088】次に、広帯域フレームもVとUVに分類す
るが、狭帯域フレームと同じタイミングでフレーミング
されているため、その判別結果を用いて、狭帯域でVと
判別された狭帯域フレームと同じ時刻の広帯域フレーム
はVとし、UVと判別された狭帯域フレームと同じ時刻
の広帯域フレームはUVとする。以上により、学習用デ
ータが作成される。ここで、狭帯域でVにもUVにも分
類されなかったものは、広帯域でも同様であることは言
うまでもない。
【0089】また、図示しないが、これと対称な方法で
学習データを作ることも可能である。すなわち、広帯域
フレームを用いてV/UVの判別を行い、その判別結果
を用いて狭帯域フレームのV/UVを分類するというも
のである。
【0090】続いて、ここで得られた学習データを用
い、図8に示すようにコードブックを作成する。図8に
示すように、まず広帯域V(またはUV)フレームの集
まりを用いて広帯域V(UV)コードブックを学習し作
成する。
【0091】先ず、ステップS6に示すように、各広帯
域フレームにおいて、例えばdn次までの自己相関パラ
メータを抽出する。自己相関パラメータは以下の(1)
式に基づいて算出される。
【0092】
【数1】
【0093】ここで、xは入力信号、φ(xi)はi次
の自己相関、Nはフレーム長である。
【0094】この各フレームのdw次元の自己相関パラ
メータから、GLA(Generalized Llo
yd Algorithm)により次元dw、サイズs
wの広帯域V(UV)コードブックをステップS7で作
成する。
【0095】ここで、各広帯域V(UV)フレームの自
己相関パラメータが、作成されたコードブックの、どの
コードベクタに量子化されるかをエンコード結果から調
べる。そしてコードベクタごとに、そのベクタに量子化
された各広帯域V(UV)フレームに対応する、すなわ
ち同じ時刻の各狭帯域V(UV)フレームから求められ
るdn次元の自己相関パラメータ同士の例えば重心を算
出し、これをステップS8で狭帯域コードベクタとす
る。これをすべてのコードベクタに対して行うことによ
り、狭帯域コードブックが生成される。
【0096】また、図9に示すように、これと対称な方
法も可能である。すなわち、先にステップS9からステ
ップS10で狭帯域フレームのパラメータを用いて学習
することにより狭帯域コードブックを作成し、ステップ
S11で対応する広帯域フレームのパラメータの重心を
求めるというものである。
【0097】以上により狭帯域V/UV、広帯域V/U
Vの4つのコードブックが作成される。
【0098】次に、これらのコードブックを使用して、
実際に狭帯域音声が入力されたときに、広帯域音声を出
力する、上記音声合成方法を適用した音声合成装置の動
作について図10を参照しながら説明する。
【0099】入力端子1から入力された上記狭帯域音声
信号は、先ずステップS21でフレーム化回路2により
160サンプル(20msec)毎にフレーミングされ
る。そして各フレームについて、LPC分析回路3で、
ステップS23のようにLPC分析が行われ、線形予測
係数αパラメータとLPC残差に分けられる。αパラメ
ータはステップS24でα→r変換回路4により自己相
関rに変換される。
【0100】また、フレーミングされた信号は、ステッ
プS22でV/UV判定回路5により、V/UVの判別
が行われており、ここで、Vと判定されると、α→r変
換回路4からの出力を切り替えるスイッチ6は、狭帯域
有声音量子化回路7に接続され、UVと判定されると、
狭帯域無声音量子化回路9に接続される。
【0101】ただし、ここでのV/UVの判別は、コー
ドブック作成時とは異なり、VにもUVにも属さないフ
レームは発生させず、必ずどちらかに振り分ける。実際
には、UVの方が、高域エネルギーが大きいために、高
域を予測した場合、大きなエネルギーとなる傾向がある
が、V/UV判断が難しいもの等をUVと誤って判断し
た場合に異音を発生することにつながる。したがって、
コードブック作成時にはVともUVとも判別できなかっ
たものは、Vとするよう設定している。
【0102】UV判定回路5がVと判定したときには、
ステップS25では、スイッチ6からの有声音用自己相
関rを狭帯域V量子化回路7に供給し、狭帯域Vコード
ブック8を用いて量子化する。一方、UV判定回路5が
Vであるときには、ステップS25では、スイッチ6か
らの無声音用自己相関rを狭帯域UV量子化回路9に供
給し、狭帯域UVコードブック10を用いて量子化す
る。
【0103】そして、ステップS26でそれぞれ対応す
る広帯域V逆量子化回路11又は広帯域UV逆量子化回
路13により広帯域Vコードブック12又は広帯域UV
コードブック14を用いて逆量子化され、これにより広
帯域自己相関が得られる。
【0104】そして、広帯域自己相関はステップS27
でr→α変換回路15により広帯域αに変換される。
【0105】一方で、LPC分析回路3からのLPC残
差は、ステップS28でゼロ詰め部16によりサンプル
間にゼロが詰められることでアップサンプルされ、エイ
リアシングにより広帯域化される。そして、この広帯域
励振源にステップS28−1で雑音付加部91により雑
音信号が付加され、その後LPC合成回路17に供給さ
れる。
【0106】そして、ステップS29で、LPC合成回
路17が広帯域αと雑音信号が付加された広帯域励振源
とを、LPC合成し、広帯域の音声信号が得られる。
【0107】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれる。
特に入力狭帯域音声の周波数範囲に関しては、入力音声
をそのまま利用したほうが良い。
【0108】したがって、入力狭帯域音声の周波数範囲
をステップS30でBSF18を用いたフィルタリング
により除去してから、ステップ31でオーバーサンプル
回路19により狭帯域音声をオーバーサンプルしたもの
と、ステップS32で加算する。これにより、帯域幅拡
張された広帯域音声信号が得られる。ここで、前記加算
時にゲインの調節、また高域の若干の抑圧等を行い、聴
感上の品質を向上させることも可能である。
【0109】この第5の具体例で特徴的なのは、雑音付
加部91にて、3400−4600Hzの周波数帯域を
持つ雑音信号を生成し、ゲイン調整を行い、ゼロ詰め部
16でのゼロ詰め後の励振源excWに付加している点で
ある。これにより得られる広帯域励振源excWは、より
フラットに近づいている。ゲイン調整は、狭帯域励振源
もしくはゼロ詰め後の励振源のパワーを求めるなどを行
い、これに応じた値とする。あるいは、コーデックに適
用する場合、雑音コードブックに乗じるべきゲイン値な
どがパラメータによってあらかじめ与えられていれば、
励振源のパワーを求めずに、これをそのまま用いる、も
しくはこれに応じた値を求める等を行っても良い。
【0110】以上、図6に示した第5の具体例となる音
声合成装置でも、励振源の品質を改善することでより品
質のよい広帯域信号を得られる。
【0111】また、この音声合成装置では、都合4つの
コードブックで、自己相関パラメータを使用することを
前提としたが、これは自己相関に限るものではない。た
とえば、LPCケプストラムでも良好な効果が得られる
し、スペクトル包絡を予測するという観点から、スペク
トル包絡そのものをパラメータとしても良い。
【0112】また、上記音声合成装置では、狭帯域V
(UV)用のコードブック8及び10を用いたが、これ
らを用いずに、コードブック用のRAM容量を削減する
ことも可能である。
【0113】この場合の音声合成装置の構成を図11に
示す。この図11に示す音声合成装置は、狭帯域V(U
V)用のコードブック8及び10の代わりに、広帯域コ
ードブック内の各コードベクトルより演算によって狭帯
域V(UV)パラメータを求める演算回路25及び26
を用いている。他の構成は上記図6と同様である。
【0114】コードブックに使うパラメータを自己相関
とした場合、広帯域自己相関と狭帯域自己相関には以下
の(2)式のような関係が成り立つ。
【0115】
【数2】
【0116】このために、広帯域自己相関φ(xw)か
ら狭帯域自己相関φ(xn)を演算によって算出するこ
とが可能で、理論的に広帯域ベクタと狭帯域ベクタを両
方持つ必要がない。ここで、φは自己相関、xnは狭帯
域信号、xwは広帯域信号、hは帯域制限フィルタのイ
ンパルス応答である。
【0117】すなわち、狭帯域自己相関は、広帯域自己
相関と、帯域制限フィルタのインパルス応答の自己相関
との畳み込みで求められる。
【0118】したがって、この音声合成装置は、上記図
10の代わりに、図12のように行える。すなわち、入
力端子1から入力された上記狭帯域音声信号は、先ずス
テップS41でフレーム化回路2により160サンプル
(20msec)毎にフレーミングされる。そして各フ
レームについて、LPC分析回路3で、ステップS43
のようにLPC分析が行われ、線形予測係数αパラメー
タとLPC残差に分けられる。αパラメータはステップ
S44でα→r変換回路4により自己相関rに変換され
る。
【0119】また、フレーミングされた信号は、ステッ
プS42でV/UV判定回路5により、V/UVの判別
が行われており、ここで、Vと判定されると、α→r変
換回路4からの出力を切り替えるスイッチ6は、狭帯域
有声音量子化回路7に接続され、UVと判定されると、
狭帯域無声音量子化回路9に接続される。
【0120】このV/UVの判別も、コードブック作成
時とは異なり、VにもUVにも属さないフレームは発生
させず、必ずどちらかに振り分ける。
【0121】UV判定回路5がVと判定したときには、
ステップS46では、スイッチ6からの有声音用自己相
関rを狭帯域V量子化回路7に供給して、量子化する。
しかし、この量子化は狭帯域用のコードブックを用いる
のではなく、上述したように演算回路25によりステッ
プS45で求めた狭帯域V用パラメータを用いる。
【0122】一方、UV判定回路5がVであるときに
は、ステップS46では、スイッチ6からの無声音用自
己相関rを狭帯域UV量子化回路9に供給して量子化す
るが、ここでも、狭帯域UVコードブックを用いずに、
演算回路26で演算により求めた狭帯域UV用パラメー
タを用いて量子化する。
【0123】そして、ステップS47でそれぞれ対応す
る広帯域V逆量子化回路11又は広帯域UV逆量子化回
路13により広帯域Vコードブック12又は広帯域UV
コードブック14を用いて逆量子化し、これにより広帯
域自己相関が得られる。
【0124】そして、広帯域自己相関はステップS48
でr→α変換回路15により広帯域αに変換される。
【0125】一方で、LPC分析回路3からのLPC残
差は、ステップS49でゼロ詰め部16によりサンプル
間にゼロが詰められることでアップサンプルされ、エイ
リアシングにより広帯域化される。そして、この広帯域
励振源にステップS49−1で雑音付加部91により雑
音信号が付加され、その後LPC合成回路17に供給さ
れる。
【0126】そして、ステップS50で、LPC合成回
路17が広帯域αと雑音信号が付加された広帯域励振源
とを、LPC合成し、広帯域の音声信号が得られる。
【0127】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれる。
特に入力狭帯域音声の周波数範囲に関しては、入力音声
をそのまま利用したほうが良い。
【0128】したがって、入力狭帯域音声の周波数範囲
をステップS51でBSF18を用いたフィルタリング
により除去してから、ステップ52でオーバーサンプル
回路19により狭帯域音声をオーバーサンプルしたもの
と、ステップS53で加算する。
【0129】このように、図11に示した音声合成装置
では、量子化時に狭帯域コードブックのコードベクタと
比較することによって量子化するのではなく、広帯域コ
ードブックから演算によって求められるコードベクタと
の比較で量子化する。これにより、広帯域コードブック
が分析、合成の両用となり、狭帯域コードブックを保持
するメモリが不要となる。もちろん、この音声合成装置
によっても、励振源の品質を改善することでより品質の
よい広帯域信号を得られる。
【0130】しかしながら、この図11に示した音声合
成装置では、メモリ容量を節約する効果よりも、演算に
よる処理量が増えることが問題となる場合も考えられ
る。そこで、コードブックは広帯域のみとしつつ、演算
量も増やさない音声合成方法を適用した図13に示す音
声合成装置を説明する。この図13に示す音声合成装置
は、上記図11に示した演算回路25及び26の代わり
に、上記広帯域コードブック内の各コードベクトルを部
分的に抽出して狭帯域パラメータを求める部分抽出回路
28及び29を用いている。他の構成は上記図6又は図
11と同様である。
【0131】先に示した帯域制限フィルタのインパルス
応答の自己相関は、周波数領域では、次の(3)式で示
すように帯域制限フィルタのパワースペクトル特性とな
る。
【0132】
【数3】
【0133】ここで、この帯域制限フィルタのパワー特
性と等しい周波数特性を持つ、もう一つの帯域制限フィ
ルタを考え、この周波数特性をH’とすれば、上記
(3)式は次の(4)式になる。
【0134】
【数4】
【0135】この(4)式で示される新たなフィルタの
通過域、阻止域は当初の帯域制限フィルタと同等であ
り、減衰特性が2乗となる。したがって、この新たなフ
ィルタもまた、帯域制限フィルタと言える。
【0136】これを考慮すると、狭帯域自己相関は、広
帯域自己相関と帯域制限フィルタのインパルス応答との
畳み込み、すなわち広帯域自己相関を帯域制限した次の
(5)式のように単純化される。
【0137】
【数5】
【0138】ここで、コードブックに使用するパラメー
タを自己相関とする場合、そもそも現実にVにおいて
は、自己相関パラメータは1次よりも2次が小さく、2
次よりも3次がさらに小さく、という具合に、なだらか
な単調減少の曲線を描く傾向がある。
【0139】一方で、狭帯域信号と広帯域信号との関係
は、広帯域信号をローパスしたものを狭帯域信号として
いるため、狭帯域自己相関は、広帯域自己相関をローパ
スすることによって理論的に求められる。
【0140】しかしながら、そもそも広帯域自己相関が
なだらかであるため、ローパスしてもほとんど変化がな
く、このローパス処理は省略しても影響がない。したが
って、広帯域自己相関を狭帯域自己相関そのものとして
利用することが可能である。ただし、広帯域信号のサン
プリング周波数は、狭帯域信号のサンプリング周波数の
2倍としているため、実際には、狭帯域自己相関は広帯
域自己相関の1次おきに取ったものとなる。
【0141】すなわち、広帯域自己相関コードベクタを
1次おきに取ったものは、狭帯域自己相関コードベクタ
と同等に扱うことができ、入力狭帯域音声の自己相関
は、広帯域コードブックによって量子化することがで
き、狭帯域コードブックが不要ということである。
【0142】また、UVにおいては、先に述べたよう
に、高域エネルギーが大きく、予測を誤ると影響が大の
ため、V/UV判断をV側に偏らせてあり、UVと判断
されるのは、UVである確度が高い場合のみである。そ
のため、UV用コードブックサイズはV用よりも小さく
しており、互いにはっきりと異なるベクタのみが登録さ
れている。したがって、UVの自己相関はVほどなだら
かな曲線ではないにも関わらず、広帯域自己相関コード
ベクタを1次おきに取ったものと入力狭帯域信号の自己
相関とを比較することで、広帯域自己相関コードベクタ
をローパスしたものと同等の、すなわち狭帯域コードブ
ックが存在する場合と同等の量子化が可能である。すな
わち、VもUVも、狭帯域コードブックが不要となる。
【0143】以上のように、コードブックに使用するパ
ラメータを自己相関とした場合は、入力狭帯域音声の自
己相関を、広帯域コードベクタを1次おきに取ったもの
と比較することで量子化できる。この動作は、上記図1
2のステップS45で部分抽出回路28及び29に広帯
域コードブックのコードベクトルを1次おきに取らせる
ことにより実現できる。
【0144】ここで、コードブックに使用するパラメー
タを、スペクトル包絡とした場合について考える。この
場合、明らかであるが、狭帯域スペクトルは、広帯域ス
ペクトルの一部であるから、狭帯域スペクトルのコード
ブックは不要である。狭帯域入力音声のスペクトル包絡
を、広帯域スペクトル包絡コードベクタの一部と比較を
することによって量子化が可能であることは言うまでも
ない。
【0145】次に、本発明に係る音声合成方法及び装置
の適用例について図面を参照しながら説明する。この適
用例は、入力された複数種類の符号化パラメータを用い
て音声を合成する音声合成装置を受信機側に備えた、図
14に示すディジタル携帯電話装置である。
【0146】先ず、このディジタル携帯電話装置の構成
を説明しておく。ここでは、送信機側と受信機側を別々
に記しているが、実際には一つの携帯電話装置内にまと
めて内蔵されている。
【0147】送信機側では、マイクロホン31から入力
された音声信号を、A/D変換器32によりディジタル
信号に変換し、音声符号化器33により符号化してから
送信器34で出力ビットに送信処理を施し、アンテナ3
5から送信する。
【0148】このとき、音声符号化器33は、伝送路に
より制限される狭帯域化を考慮した符号化パラメータを
送信器34に供給する。例えば、符号化パラメータとし
ては、励振源に関するパラメータや、線形予測係数αな
どがある。
【0149】また、受信機側では、アンテナ36で捉え
た電波を、受信器37で受信し、音声復号化器38で上
記符号化パラメータを復号し、音声合成部39で上記復
号化パラメータを用いて音声を合成し、D/A変換器4
0でアナログ音声信号に戻して、スピーカ41から出力
する。
【0150】このディジタル携帯電話装置における、上
記音声合成装置の第1の具体例を図15に示す。この図
15に示す音声合成装置は、上記ディジタル携帯電話装
置の送信側の音声符号化器33から送られてきた符号化
パラメータを用いて音声を合成する装置であるため、音
声符号化器33での符号化方法に従った復号化を音声復
号化器38で行う。
【0151】音声符号器33での符号化方法がPSI−
CELP(Pitch Synchronus Inn
ovation−CELP:ピッチ同期雑音励振源−C
ELP)符号化方式によるものであるとすれば、音声復
号化器38での復号化方法もPSI−CELPによる。
【0152】音声復号化器38は、上記符号化パラメー
タの内の第1の符号化パラメータである励振源に関する
パラメータから狭帯域励振源を復号した後、ゼロ詰め部
16に送る。また、上記符号化パラメータの内の第2の
符号化パラメータである線形予測係数に関するパラメー
タをαに変換しα→r(線形予測係数→自己相関)変換
回路4に供給する。また、上記符号化パラメータの内の
第3の符号化パラメータである有声音/無声音判定フラ
グに関するものをV/UV判定回路5に供給する。
【0153】音声合成装置は、上記音声復号化器38
と、ゼロ詰め部16と、このゼロ詰め部16からの広帯
域励振源に雑音信号を付加する雑音付加部91と、α→
r変換回路4と、V/UV判定回路5の他、広帯域有声
音及び無声音から抽出した有声音用及び無声音用パラメ
ータを用いて予め作成した広帯域有声音用コードブック
12と広帯域無声音用コードブック14とを備える。
【0154】さらに、この音声合成装置は、広帯域有声
音用コードブック12と広帯域無声音用コードブック1
4内の各コードベクトルを部分抽出して狭帯域パラメー
タを求める部分抽出回路28及び部分抽出回路29と、
α→r変換回路4からの狭帯域有声音用自己相関を部分
抽出回路28からの狭帯域パラメータを用いて量子化す
る狭帯域有声音用量子化器7と、上記α→r変換回路4
からの狭帯域無声音用自己相関を部分抽出回路29から
の狭帯域パラメータを用いて量子化する狭帯域無声音用
量子化器9と、狭帯域有声音用量子化器7からの狭帯域
有声音用量子化データを広帯域有声音用コードブック1
2を用いて逆量子化する広帯域有声音用逆量子化器11
と、狭帯域無声音用量子化器9からの狭帯域無声音用量
子化データを広帯域無声音用コードブック14を用いて
逆量子化する広帯域無声音用逆量子化器13と、広帯域
有声音用逆量子化器11からの逆量子化データとなる広
帯域有声音用自己相関を広帯域有声音用の線形予測係数
に変換すると共に広帯域無声音用逆量子化器13からの
逆量子化データとなる広帯域無声音用自己相関を広帯域
無声音用の線形予測係数に変換する自己相関→線形予測
係数(r→α)変換回路15と、このr→α変換回路1
5からの広帯域有声音用線形予測係数と広帯域無声音用
線形予測係数と雑音付加部91からの雑音信号が付加さ
れた広帯域励振源とに基づいて広帯域音声を合成するL
PC合成回路17とを備えてなる。
【0155】また、この音声合成装置は、音声復号化器
38で復号化された狭帯域音声データのサンプリング周
波数を8kHzから16kHzにオーバーサンプリング
するオーバーサンプル回路19と、LPC合成回路17
からの合成出力から入力狭帯域音声データの周波数帯域
300Hz〜3400Hzの信号成分を除去するバンド
ストップフィルタ(BSF)18と、このBSF18か
らのフィルタ出力にオーバーサンプル回路19からのサ
ンプリング周波数16kHzの周波数帯域300Hz〜
3400Hzの基の狭帯域音声データ成分を加算する加
算器20とを備えている。
【0156】ここで、上記広帯域有声音及び無声音用コ
ードブック12及び14は、上記図7〜図9に示した手
順に基づいて作成できる。学習用データとしては、コー
ドブックの品質を良いものとするために、有声音(V)
から無声音(UV)、UVからVへの遷移状態のもの
や、VともUVとも判別しがたいものは除外してしま
い、確実にVであるものと、確実にUVであるもののみ
を利用する。このようにして、学習用狭帯域Vフレーム
の集まりと、同UVフレームの集まりを作成する。次
に、上記広帯域有声音及び無声音用コードブック12及
び14を用い、実際に送信側から伝送されてきた符号化
パラメータを用いて音声を合成する動作について図16
を参照しながら説明する。
【0157】先ず、音声復号化器38でデコードされた
線形予測係数αは、ステップS61でα→r変換回路4
により自己相関rに変換される。
【0158】また、音声復号化器38でデコードされた
有声音/無声音判定フラグに関するパラメータはステッ
プS62でV/UV判定回路5により解読され、V/U
Vの判別が行われる。
【0159】ここで、Vと判定されると、α→r変換回
路4からの出力を切り替えるスイッチ6は、狭帯域有声
音量子化回路7に接続され、UVと判定されると、狭帯
域無声音量子化回路9に接続される。
【0160】このV/UVの判別も、コードブック作成
時とは異なり、VにもUVにも属さないフレームは発生
させず、必ずどちらかに振り分ける。
【0161】UV判定回路5がVと判定したときには、
ステップS64では、スイッチ6からの有声音用自己相
関rを狭帯域V量子化回路7に供給して、量子化する。
しかし、この量子化は狭帯域用のコードブックを用いる
のではなく、上述したように部分抽出回路28によりス
テップS63で求めた狭帯域V用パラメータを用いる。
【0162】一方、UV判定回路5がUVであるときに
は、ステップS63では、スイッチ6からの無声音用自
己相関rを狭帯域UV量子化回路9に供給して量子化す
るが、ここでも、狭帯域UVコードブックを用いずに、
部分抽出回路29で演算により求めた狭帯域UV用パラ
メータを用いて量子化する。
【0163】そして、ステップS65でそれぞれ対応す
る広帯域V逆量子化回路11又は広帯域UV逆量子化回
路13により広帯域Vコードブック12又は広帯域UV
コードブック14を用いて逆量子化し、これにより広帯
域自己相関が得られる。
【0164】そして、広帯域自己相関はステップS66
でr→α変換回路15により広帯域αに変換される。
【0165】一方で、音声復号化器38からの励振源に
関するパラメータは、ステップS67でゼロ詰め部16
によりサンプル間にゼロが詰められることでアップサン
プルされ、エイリアシングにより広帯域化される。そし
て、この広帯域励振源にステップS67−1で雑音付加
部91から雑音信号が付加されてから、LPC合成回路
17に供給される。
【0166】そして、ステップS68で、LPC合成回
路17が広帯域αと広帯域励振源とを、LPC合成し、
広帯域の音声信号が得られる。
【0167】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれる。
特に入力狭帯域音声の周波数範囲に関しては、入力音声
をそのまま利用したほうが良い。
【0168】したがって、入力狭帯域音声の周波数範囲
をステップS69でBSF18を用いたフィルタリング
により除去してから、ステップ70でオーバーサンプル
回路19により符号化音声データをオーバーサンプルし
たものと、ステップS71で加算する。
【0169】このように、図15に示した音声合成装置
では、量子化時に狭帯域コードブックのコードベクタと
比較することによって量子化するのではなく、広帯域コ
ードブックから部分抽出して求められるコードベクタと
の比較で量子化する。
【0170】すなわち、デコード中にαパラメータが得
られるので、これを利用し、αから狭帯域自己相関に変
換、これを広帯域コードブックの各ベクタを1次おきに
とったものと比較をし、量子化する。そして同じベクタ
の今度は全部を用いて逆量子化することで広帯域自己相
関を得る。そして広帯域自己相関から広帯域αに変換す
る。このときに、ゲイン調整および高域の若干の抑圧も
先の説明同様に行い、聴感上の品質を向上させている。
【0171】これにより、広帯域コードブックが分析、
合成の両用となり、狭帯域コードブックを保持するメモ
リが不要となる。
【0172】もちろん、この音声合成装置でも、雑音付
加部91で3400−4600Hzの周波数帯域を持つ
雑音信号を生成し、ゲイン調整を行い、ゼロ詰め部16
でのゼロ詰め後の励振源excWに付加している。これに
より得られる広帯域励振源は、よりフラットに近づいて
おり、品質のよい広帯域信号を得られる。
【0173】なお、PSI−CELPによる音声復号化
器38からの符号化パラメータを用いて音声を合成する
音声合成装置としては、図17に示す音声合成装置も考
えられる。この図17に示す音声合成装置は、部分抽出
回路28及び部分抽出回路29の代わりに、広帯域コー
ドブック内の各コードベクトルより演算によって狭帯域
V(UV)パラメータを求める演算回路25及び26を
用いている。他の構成は上記図15と同様である。
【0174】次に、上記ディジタル携帯電話装置におけ
る、上記音声合成装置の第2の具体例を図18に示す。
この図18に示す音声合成装置も、上記ディジタル携帯
電話装置の送信側の音声符号化器33から送られてきた
符号化パラメータを用いて音声を合成する装置であるた
め、音声符号化器33での符号化方法に従った復号化を
音声復号化器46で行う。
【0175】音声符号器33での符号化方法がVSEL
P(Vector Sum excited Linea
r Prediction:ベクトル和励起線形予測)
符号化方式によるものであるとすれば、この音声復号化
器46での復号化方法もVSELPによる。
【0176】音声復号化器46は、上記符号化パラメー
タの内の第1の符号化パラメータである励振源に関する
パラメータを励振源切り換え部47に供給する。また、
上記符号化パラメータの内の第2の符号化パラメータで
ある線形予測係数αをα→r(線形予測係数→自己相
関)変換回路4に供給する。また、上記符号化パラメー
タの内の第3の符号化パラメータである有声音/無声音
判定フラグに関するものをV/UV判定回路5に供給す
る。
【0177】上記図15及び図17に示したPSI−C
ELPを用いた音声合成装置と異なるのは、励振源切り
換え回路47をゼロ詰め部16の前段に設けている点で
ある。
【0178】PSI−CELPは、コーデック自体、特
にVを聴感上滑らかに聞こえるような処理を行っている
が、VSELPにはこれがなく、このために帯域幅拡張
したときに若干雑音が混入したように聞こえる。そこ
で、広帯域励振源を作成する際に、励振源切り換え回路
47により図19のような処理を施す。
【0179】VSELPの励振源は、コーデックに利用
されるパラメータbeta(長期予測係数),bL
[i](長期フィルタ状態),gamma1(利得),
c1[i](励起コードベクタ)により、beta*b
L[i]+gamma1*c1[i]として作成される
が、このうち前者がピッチ成分、後者がノイズ成分を表
すので、これをbeta*bL[i]とgamma1*
c1[i]に分け、ステップS87で、一定の時間範囲
において、前者のエネルギーが大きい場合にはピッチが
強い有声音と考えられるため、ステップS88でYES
に進み、励振源をパルス列とし、ピッチ成分のない部分
ではNOに進み0に抑圧して、ステップS89でゼロ詰
めする。ここでは雑音付加はしない。また、ステップS
87でエネルギーが大きくない場合には1のサンプル値
と2のサンプル値で合成し、ステップS94でゼロ詰め
を行ってからステップS95で雑音付加を行い、その
後、ステップS90でLPC合成する。これにより、V
SELPにおける有声音の聴感上の品質が向上した。
【0180】なお、VSELPによる音声復号化器46
からの符号化パラメータを用いて音声を合成する音声合
成装置としては、図20に示す音声合成装置も考えられ
る。この図20に示す音声合成装置は、部分抽出回路2
8及び部分抽出回路29の代わりに、広帯域コードブッ
ク内の各コードベクトルより演算によって狭帯域V(U
V)パラメータを求める演算回路25及び26を用いて
いる。他の構成は上記図18と同様である。
【0181】なお、このような音声合成装置において
も、図6に示したような広帯域有声音及び無声音から抽
出した有声音用及び無声音用パラメータを用いて予め作
成した広帯域有声音用コードブック12と広帯域無声音
用コードブック14と、上記広帯域音声を周波数帯域制
限して得た周波数帯域が例えば300Hz〜3400H
zの狭帯域音声信号から抽出した有声音用及び無声音用
パラメータにより予め作成した狭帯域有声音用コードブ
ック7と狭帯域無声音用コードブック10とを用いての
音声合成処理も可能である。
【0182】また、低域から高域を予測するものだけに
限定するものではない。また、広帯域スペクトルを予測
する手段においては、信号を音声に限るものではない。
【0183】なお、本発明は、低域から高域を予測する
ものだけに限定するものではない。また、広帯域スペク
トルを予測する手段においては、信号を音声に限るもの
ではない。さらに、線形予測分析に限らず、PARCO
R分析などを用いても良い。
【0184】また、本発明に係る音声合成方法をソフト
ウェアプログラムとして例えばROMのような記録媒体
に記録しておけば、パーソナルコンピュータ上で音声合
成装置をソフト的に構成できる。
【0185】図21にはパーソナルコンピュータの具体
的構成例を示す。ROM(ReadOnly Memo
ry)101には、上記音声合成方法をソフトウェア化
した音声合成プログラムが記憶されている。CPU(C
entral Processing Unit)10
2は、ROM101に記憶された上記音声合成プログラ
ムを読み出し実行することで、上述してきた音声合成装
置として動作する。
【0186】RAM(Random Access M
emory)103は、CPU102の動作上必要なプ
ログラムやデータなどを記憶する。入力装置104は、
例えば、マイク、外部インターフェースなどで構成され
る。出力装置105は、例えば、ディスプレイや、スピ
ーカなどで構成され、必要な情報を出力する。
【0187】
【発明の効果】このように、本発明に係る音声合成装置
及び方法によれば、励振源の品質を改善することで、よ
り品質の良い広帯域信号を得られるようになる。
【0188】また、本発明に係る電話装置によれば、品
質の良い広帯域信号を受信手段から出力できる。
【0189】また、本発明に係るプログラム提供媒体に
よれば、上記音声合成方法をプログラム化して提供する
ことにより、品質の良い広帯域信号を安価に提供でき
る。
【図面の簡単な説明】
【図1】本発明の音声合成装置の実施の形態の第1の具
体例の構成を示すブロック図である。
【図2】上記第1の具体例に対する比較例としての従来
の音声合成装置のブロック図である。
【図3】上記実施の形態の第2の具体例の構成を示すブ
ロック図である。
【図4】上記実施の形態の第3の具体例の構成を示すブ
ロック図である。
【図5】上記実施の形態の第4の具体例の構成を示すブ
ロック図である。
【図6】上記実施の形態の第5の具体例の構成を示すブ
ロック図である。
【図7】上記図6に示した第5の具体例に用いているコ
ードブック用のデータを作成する方法を説明するための
フローチャートである。
【図8】上記図6に示した第5の具体例となる音声合成
装置に用いているコードブックを作成する方法を説明す
るためのフローチャートである。
【図9】上記図6に示した音声帯域合成装置に用いてい
るコードブックを作成する他の方法を説明するためのフ
ローチャートである。
【図10】上記図6に示した音声合成置の動作を説明す
るためのフローチャートである。
【図11】上記図6に示した音声合成装置からコードブ
ックの数を減らした変形例の構成を示すブロック図であ
る。
【図12】上記図11に示す変形例の動作を説明するた
めのフローチャートである。
【図13】上記図6に示した音声合成装置からコードブ
ックの数を減らした他の変形例の構成を示すブロック図
である。
【図14】本発明に係る音声合成方法及び装置を受信機
側に適用したディジタル携帯電話装置の構成を示すブロ
ック図である。
【図15】音声復号化器にPSI−CELP方式を採用
した音声合成装置の構成を示すブロック図である。
【図16】上記図15に示した音声合成装置の動作を説
明するためのフローチャートである。
【図17】音声復号化器にPSI−CELP方式を採用
した音声合成装置の他の構成を示すブロック図である。
【図18】音声復号化器にVSELP方式を採用した音
声合成装置の構成を示すブロック図である。
【図19】上記図18に示した音声合成装置の動作を説
明するためのフローチャートである。
【図20】音声復号化器にVSELP方式を採用した音
声合成装置の他の構成を示すブロック図である。
【図21】本発明に係るプログラム提供媒体をROMか
ら読み出して実行するパーソナルコンピュータの構成を
示すブロック図である。
【符号の説明】
52 α広帯域化部、55 広帯域LPC合成部、56
帯域抑圧部、61ゼロ詰め部、62 雑音付加部

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 狭帯域信号の線形予測残差又は励振源を
    入力パラメータにしたフィルタ合成により得られた出力
    信号の一部を用いて広帯域信号を合成する音声合成装置
    において、 上記線形予測残差又は励振源に雑音信号を付加する雑音
    付加手段を備えることを特徴とする音声合成装置。
  2. 【請求項2】 上記雑音信号は、上記線形予測残差又は
    励振源の持つ周波数帯域以外の帯域成分を含むことを特
    徴とする請求項1記載の音声合成装置。
  3. 【請求項3】 狭帯域信号の線形予測残差又は励振源を
    入力パラメータにしたフィルタ合成により得られた出力
    信号の一部を用いて広帯域信号を合成する音声合成装置
    において、 上記線形予測残差又は励振源を用いて広帯域励振源を生
    成する広帯域励振源生成手段と、 上記広帯域励振源に雑音信号を付加する雑音付加手段と
    を備えることを特徴とする音声合成装置。
  4. 【請求項4】 上記雑音信号は、上記広帯域励振源の持
    つ周波数帯域以外の帯域成分を含むことを特徴とする請
    求項3記載の音声合成装置。
  5. 【請求項5】 狭帯域信号の線形予測残差又は励振源を
    入力パラメータにしたフィルタ合成により得られた出力
    信号の一部を用いて広帯域信号を合成する音声合成装置
    において、 上記線形予測残差又は励振源に雑音信号を付加する雑音
    付加手段と、 上記雑音付加手段で雑音信号が付加された線形予測残差
    又は励振源から広帯域励振源を生成する広帯域励振源生
    成手段とを備えることを特徴とする音声合成装置。
  6. 【請求項6】 上記雑音信号は狭帯域励振源の持つ周波
    数帯域以外の帯域成分を含むことを特徴とする請求項5
    記載の音声合成装置。
  7. 【請求項7】 狭帯域信号から生成した線形予測残差を
    入力パラメータにしたフィルタ合成により得た出力信号
    の一部を用いて広帯域信号を合成する音声合成装置にお
    いて、 上記狭帯域信号を分析して線形予測残差信号を求める分
    析手段と、 上記分析手段で得られた線形予測残差信号から広帯域残
    差信号を生成する広帯域残差信号生成手段と、 上記広帯域残差信号生成手段で生成された広帯域残差信
    号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
    記広帯域残差信号に付加する雑音付加手段とを備えるこ
    とを特徴とする音声合成装置。
  8. 【請求項8】 上記雑音信号は、広帯域励振源の持つ周
    波数帯域以外の帯域成分を含むことを特徴とする請求項
    7記載の音声合成装置。
  9. 【請求項9】 狭帯域信号から生成した線形予測残差を
    入力パラメータにしたフィルタ合成により得た出力信号
    の一部を用いて広帯域信号を合成する音声合成装置にお
    いて、 上記狭帯域信号を分析して線形予測残差信号を求める分
    析手段と、 上記分析手段で得られた線形予測残差信号の持つ周波数
    帯域以外の帯域成分を含む雑音信号を上記残差信号に付
    加する雑音付加手段と、 上記雑音付加手段で雑音信号が付加された線形予測残差
    信号から広帯域残差信号を生成する広帯域残差信号生成
    手段とを備えることを特徴とする音声合成装置。
  10. 【請求項10】 上記雑音信号は狭帯域励振源の持つ周
    波数帯域以外の帯域成分を含むことを特徴とする請求項
    9記載の音声合成装置。
  11. 【請求項11】 狭帯域信号の線形予測残差又は励振源
    を入力パラメータにしたフィルタ合成により得られた出
    力信号の一部を用いて広帯域信号を合成する音声合成方
    法において、 上記線形予測残差又は励振源に雑音信号を付加する雑音
    付加工程を備えることを特徴とする音声合成方法。
  12. 【請求項12】 上記雑音信号は、上記線形予測残差又
    は励振源の持つ周波数帯域以外の帯域成分を含むことを
    特徴とする請求項11記載の音声合成方法。
  13. 【請求項13】 狭帯域信号の線形予測残差又は励振源
    を入力パラメータにしたフィルタ合成により得られた出
    力信号の一部を用いて広帯域信号を合成する音声合成方
    法において、 上記線形予測残差又は励振源を用いて広帯域励振源を生
    成する広帯域励振源生成工程と、 上記広帯域励振源に雑音信号を付加する雑音付加工程と
    を備えることを特徴とする音声合成方法。
  14. 【請求項14】 上記雑音信号は、上記広帯域励振源の
    持つ周波数帯域以外の帯域成分を含むことを特徴とする
    請求項13記載の音声合成方法。
  15. 【請求項15】 狭帯域信号の線形予測残差又は励振源
    を入力パラメータにしたフィルタ合成により得られた出
    力信号の一部を用いて広帯域信号を合成する音声合成方
    法において、 上記線形予測残差又は励振源に雑音信号を付加する雑音
    付加工程と、 上記雑音付加工程で雑音信号が付加された線形予測残差
    又は励振源から広帯域励振源を生成する広帯域励振源生
    成工程とを備えることを特徴とする音声合成方法。
  16. 【請求項16】 上記雑音信号は狭帯域励振源の持つ周
    波数帯域以外の帯域成分を含むことを特徴とする請求項
    15記載の音声合成方法。
  17. 【請求項17】 狭帯域信号から生成した線形予測残差
    を入力パラメータにしたフィルタ合成により得た出力信
    号の一部を用いて広帯域信号を合成する音声合成方法に
    おいて、 上記狭帯域信号を分析して線形予測残差信号を求める分
    析工程と、 上記分析工程で得られた線形予測残差信号から広帯域残
    差信号を生成する広帯域残差信号生成工程と、 上記広帯域残差信号生成工程で生成された広帯域残差信
    号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
    記広帯域残差信号に付加する雑音付加工程とを備えるこ
    とを特徴とする音声合成方法。
  18. 【請求項18】 上記雑音信号は、広帯域励振源の持つ
    周波数帯域以外の帯域成分を含むことを特徴とする請求
    項17記載の音声合成方法。
  19. 【請求項19】 狭帯域信号から生成した線形予測残差
    を入力パラメータにしたフィルタ合成により得た出力信
    号の一部を用いて広帯域信号を合成する音声合成方法に
    おいて、 上記狭帯域信号を分析して線形予測残差信号を求める分
    析工程と、 上記分析工程で得られた線形予測残差信号の持つ周波数
    帯域以外の帯域成分を含む雑音信号を上記残差信号に付
    加する雑音付加工程と、 上記雑音付加工程で雑音信号が付加された線形予測残差
    信号から広帯域残差信号を生成する広帯域残差信号生成
    工程とを備えることを特徴とする音声合成方法。
  20. 【請求項20】 上記雑音信号は狭帯域励振源の持つ周
    波数帯域以外の帯域成分を含むことを特徴とする請求項
    19記載の音声合成方法。
  21. 【請求項21】 伝送信号として狭帯域信号のパラメー
    タをPSI−CELP符号化又はVSELP符号化して
    送信する送信手段と、 上記パラメータの内の線形予測残差又は励振源に雑音信
    号を付加してからフィルタ合成により得た出力信号の一
    部を用いて広帯域信号を合成する受信手段とを備えるこ
    とを特徴とする電話装置。
  22. 【請求項22】 伝送信号として狭帯域信号のパラメー
    タをPSI−CELP符号化又はVSELP符号化して
    送信する送信手段と、 上記パラメータの内の線形予測残差又は励振源を用いて
    広帯域励振源を生成し、この広帯域励振源に雑音信号を
    付加してからフィルタ合成により得た出力信号の一部を
    用いて広帯域信号を合成する受信手段とを備えることを
    特徴とする電話装置。
  23. 【請求項23】 伝送信号として狭帯域信号のパラメー
    タをPSI−CELP符号化又はVSELP符号化して
    送信する送信手段と、 上記パラメータの内の線形予測残差又は励振源に雑音信
    号を付加し、この雑音信号が付加された線形予測誤差又
    は励振源から広帯域励振源を生成し、この広帯域励振源
    を用いたフィルタ合成により得た出力信号の一部を用い
    て広帯域信号を合成する受信手段とを備えることを特徴
    とする電話装置。
  24. 【請求項24】 狭帯域信号の線形予測残差又は励振源
    を入力パラメータにしたフィルタ合成により得られた出
    力信号の一部を用いて広帯域信号を合成するためのプロ
    グラムを提供するプログラム提供媒体において、 上記線形予測残差又は励振源を用いて広帯域励振源を生
    成する広帯域励振源生成手順と、 上記広帯域励振源に雑音信号を付加する雑音付加手順と
    を備える音声合成プログラムを提供することを特徴とす
    るプログラム提供媒体。
  25. 【請求項25】 狭帯域信号の線形予測残差又は励振源
    を入力パラメータにしたフィルタ合成により得られた出
    力信号の一部を用いて広帯域信号を合成するためのプロ
    グラムを提供するプログラム提供媒体において、 上記線形予測残差又は励振源に雑音信号を付加する雑音
    付加手順と、 上記雑音付加手順で雑音信号が付加された線形予測残差
    又は励振源から広帯域励振源を生成する広帯域励振源生
    成手順とを備える音声合成プログラムを提供することを
    特徴とするプログラム提供媒体。
  26. 【請求項26】 狭帯域信号から生成した線形予測残差
    を入力パラメータにしたフィルタ合成により得た出力信
    号の一部を用いて広帯域信号を合成するためのプログラ
    ムを提供するプログラム提供媒体において、 上記狭帯域信号を分析して線形予測残差信号を求める分
    析手順と、 上記分析手順で得られた線形予測残差信号から広帯域残
    差信号を生成する広帯域残差信号生成手順と、 上記広帯域残差信号生成手順で生成された広帯域残差信
    号の持つ周波数帯域以外の帯域成分を含む雑音信号を上
    記広帯域残差信号に付加する雑音信号付加手順とを備え
    る音声合成プログラムを提供することを特徴とするプロ
    グラム提供媒体。
  27. 【請求項27】 狭帯域信号から生成した線形予測残差
    を入力パラメータにしたフィルタ合成により得た出力信
    号の一部を用いて広帯域信号を合成するためのプログラ
    ムを提供するプログラム提供媒体において、 上記狭帯域信号を分析して線形予測残差信号を求める分
    析手順と、 上記分析手順で得られた線形予測残差信号の持つ周波数
    帯域以外の帯域成分を含む雑音信号を上記残差信号に付
    加する雑音付加手順と、 上記雑音付加手順で雑音信号が付加された線形予測残差
    信号から広帯域残差信号を生成する広帯域残差信号生成
    手順とを備える音声合成プログラムを提供することを特
    徴とするプログラム提供媒体。
JP11115415A 1999-04-22 1999-04-22 音声合成装置及び方法、電話装置並びにプログラム提供媒体 Withdrawn JP2000305599A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP11115415A JP2000305599A (ja) 1999-04-22 1999-04-22 音声合成装置及び方法、電話装置並びにプログラム提供媒体
TW089107180A TW469421B (en) 1999-04-22 2000-04-17 Sound synthesizing apparatus and method, telephone apparatus, and program service medium
EP00303303A EP1047045A3 (en) 1999-04-22 2000-04-19 Sound synthesizing apparatus and method
KR1020000021084A KR20000077057A (ko) 1999-04-22 2000-04-20 음성합성장치 및 방법, 전화장치 및 프로그램 제공매체
US09/556,036 US6732075B1 (en) 1999-04-22 2000-04-20 Sound synthesizing apparatus and method, telephone apparatus, and program service medium
CNB001188240A CN1185620C (zh) 1999-04-22 2000-04-22 声音合成装置和方法以及电话装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11115415A JP2000305599A (ja) 1999-04-22 1999-04-22 音声合成装置及び方法、電話装置並びにプログラム提供媒体

Publications (1)

Publication Number Publication Date
JP2000305599A true JP2000305599A (ja) 2000-11-02

Family

ID=14662017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11115415A Withdrawn JP2000305599A (ja) 1999-04-22 1999-04-22 音声合成装置及び方法、電話装置並びにプログラム提供媒体

Country Status (6)

Country Link
US (1) US6732075B1 (ja)
EP (1) EP1047045A3 (ja)
JP (1) JP2000305599A (ja)
KR (1) KR20000077057A (ja)
CN (1) CN1185620C (ja)
TW (1) TW469421B (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004025625A1 (ja) * 2002-09-12 2004-03-25 Sony Corporation 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
JP2004184472A (ja) * 2002-11-29 2004-07-02 Kenwood Corp 信号補間装置、音響再生装置、信号補間方法及びプログラム
JP2004309686A (ja) * 2003-04-04 2004-11-04 Toshiba Corp 広帯域音声符号化方法及び広帯域音声符号化装置
WO2006120931A1 (ja) * 2005-05-11 2006-11-16 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置及びこれらの方法
JP2009229519A (ja) * 2008-03-19 2009-10-08 Oki Electric Ind Co Ltd 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
JP2010044412A (ja) * 2009-11-09 2010-02-25 Toshiba Corp 広帯域音声符号化方法及び広帯域音声符号化装置
US7788105B2 (en) 2003-04-04 2010-08-31 Kabushiki Kaisha Toshiba Method and apparatus for coding or decoding wideband speech
JP2012514763A (ja) * 2009-02-04 2012-06-28 モトローラ モビリティ インコーポレイテッド 修正離散コサイン変換音声符号化器用の帯域幅拡大方法及び装置
JP2012181561A (ja) * 2012-06-27 2012-09-20 Toshiba Corp 信号処理装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
DE60212696T2 (de) * 2001-11-23 2007-02-22 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
CN100375398C (zh) * 2002-05-27 2008-03-12 艾利森电话股份有限公司 有色干扰识别
EP1431958B1 (en) 2002-12-16 2018-07-18 Sony Mobile Communications Inc. Apparatus connectable to or incorporating a device for generating speech, and computer program product therefor
EP1482482A1 (de) 2003-05-27 2004-12-01 Siemens Aktiengesellschaft Frequenzerweiterung für Synthesizer
CN101107650B (zh) * 2005-01-14 2012-03-28 松下电器产业株式会社 语音切换装置及语音切换方法
KR100724736B1 (ko) * 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
CN101479790B (zh) * 2006-06-29 2012-05-23 Nxp股份有限公司 噪声合成
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
CN102063905A (zh) * 2009-11-13 2011-05-18 数维科技(北京)有限公司 一种用于音频解码的盲噪声填充方法及其装置
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN117746842A (zh) * 2023-11-21 2024-03-22 中国船舶集团有限公司第七〇四研究所 自主航行船舶隧道推进器声音信号的特征提取与模拟方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW224191B (ja) * 1992-01-28 1994-05-21 Qualcomm Inc
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
US5502713A (en) * 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JP3335841B2 (ja) * 1996-05-27 2002-10-21 日本電気株式会社 信号符号化装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668319B2 (en) 2002-09-12 2010-02-23 Sony Corporation Signal processing system, signal processing apparatus and method, recording medium, and program
US7986797B2 (en) 2002-09-12 2011-07-26 Sony Corporation Signal processing system, signal processing apparatus and method, recording medium, and program
WO2004025625A1 (ja) * 2002-09-12 2004-03-25 Sony Corporation 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
CN1302457C (zh) * 2002-09-12 2007-02-28 索尼株式会社 信号处理系统、信号处理设备和方法
JP2004184472A (ja) * 2002-11-29 2004-07-02 Kenwood Corp 信号補間装置、音響再生装置、信号補間方法及びプログラム
US7788105B2 (en) 2003-04-04 2010-08-31 Kabushiki Kaisha Toshiba Method and apparatus for coding or decoding wideband speech
US8260621B2 (en) 2003-04-04 2012-09-04 Kabushiki Kaisha Toshiba Speech coding method and apparatus for coding an input speech signal based on whether the input speech signal is wideband or narrowband
US8315861B2 (en) 2003-04-04 2012-11-20 Kabushiki Kaisha Toshiba Wideband speech decoding apparatus for producing excitation signal, synthesis filter, lower-band speech signal, and higher-band speech signal, and for decoding coded narrowband speech
US8249866B2 (en) 2003-04-04 2012-08-21 Kabushiki Kaisha Toshiba Speech decoding method and apparatus which generates an excitation signal and a synthesis filter
US8160871B2 (en) 2003-04-04 2012-04-17 Kabushiki Kaisha Toshiba Speech coding method and apparatus which codes spectrum parameters and an excitation signal
JP2004309686A (ja) * 2003-04-04 2004-11-04 Toshiba Corp 広帯域音声符号化方法及び広帯域音声符号化装置
US7978771B2 (en) 2005-05-11 2011-07-12 Panasonic Corporation Encoder, decoder, and their methods
CN101176148B (zh) * 2005-05-11 2011-06-15 松下电器产业株式会社 编码装置、解码装置和其方法
WO2006120931A1 (ja) * 2005-05-11 2006-11-16 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置及びこれらの方法
JP2009229519A (ja) * 2008-03-19 2009-10-08 Oki Electric Ind Co Ltd 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
JP2012514763A (ja) * 2009-02-04 2012-06-28 モトローラ モビリティ インコーポレイテッド 修正離散コサイン変換音声符号化器用の帯域幅拡大方法及び装置
JP2014016622A (ja) * 2009-02-04 2014-01-30 Motorola Mobility Llc 修正離散コサイン変換音声符号化器用の帯域幅拡大方法及び装置
JP2010044412A (ja) * 2009-11-09 2010-02-25 Toshiba Corp 広帯域音声符号化方法及び広帯域音声符号化装置
JP2012181561A (ja) * 2012-06-27 2012-09-20 Toshiba Corp 信号処理装置

Also Published As

Publication number Publication date
KR20000077057A (ko) 2000-12-26
US6732075B1 (en) 2004-05-04
EP1047045A3 (en) 2001-03-21
TW469421B (en) 2001-12-21
CN1185620C (zh) 2005-01-19
CN1274146A (zh) 2000-11-22
EP1047045A2 (en) 2000-10-25

Similar Documents

Publication Publication Date Title
JP2000305599A (ja) 音声合成装置及び方法、電話装置並びにプログラム提供媒体
JP4132154B2 (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
AU763471B2 (en) A method and device for adaptive bandwidth pitch search in coding wideband signals
CA2562916C (en) Coding of audio signals
CN1185626C (zh) 修改语音信号的系统和方法
CN1307614C (zh) 合成语音的方法和装置
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
US20080208575A1 (en) Split-band encoding and decoding of an audio signal
US20080297380A1 (en) Signal decoding apparatus and signal decoding method
CA2262787C (en) Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
WO2011080855A1 (ja) 音声信号復元装置および音声信号復元方法
JP2006513457A (ja) 音声を可変レートで符号化および復号する方法
JP2000200099A (ja) エコ―消去装置及び方法、並びに音声再生装置
KR20000047944A (ko) 수신장치 및 방법과 통신장치 및 방법
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JP2010213350A (ja) 中継装置
Bhatt et al. A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods
JP4099879B2 (ja) 帯域幅拡張方法及び装置
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
Bhatt Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060704