JPH0636158B2 - 音声分析合成方法及び装置 - Google Patents
音声分析合成方法及び装置Info
- Publication number
- JPH0636158B2 JPH0636158B2 JP61289708A JP28970886A JPH0636158B2 JP H0636158 B2 JPH0636158 B2 JP H0636158B2 JP 61289708 A JP61289708 A JP 61289708A JP 28970886 A JP28970886 A JP 28970886A JP H0636158 B2 JPH0636158 B2 JP H0636158B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- signal
- sound
- analysis
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004458 analytical method Methods 0.000 title claims description 39
- 238000001308 synthesis method Methods 0.000 title claims description 8
- 238000013139 quantization Methods 0.000 claims description 79
- 230000015572 biosynthetic process Effects 0.000 claims description 27
- 238000003786 synthesis reaction Methods 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 230000005236 sound signal Effects 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- PSVRFUPOQYJOOZ-QNPWAGBNSA-O 2-[hydroxy-[(2r)-2-[(5z,8z,11z,14z)-icosa-5,8,11,14-tetraenoyl]oxy-3-octadecanoyloxypropoxy]phosphoryl]oxyethyl-trimethylazanium Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC PSVRFUPOQYJOOZ-QNPWAGBNSA-O 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) この発明は音声分析合成方法及びその装置、特に音声の
符号化に関するものである。
符号化に関するものである。
(従来の技術) 従来、この種の技術としてザ・ベル・システム・テクニ
カル・ジャーナル(The Bell System Technical Journa
l)、55[8](1976−10)(米)P.1069-1085に記載さ
れる帯域分割型音声分析合成方式(Sub−Band Coding方
式とも呼ばれ、以降SBC方式と略す)が知られてい
る。このSBC方式は第4図に示されるように音声信号
の周波数帯域を複数(通常4〜8)の帯域(図中、
、及びで示す。)に分割し、各分割チャネルの出
力を別々に符号化、復号化する方式である。
カル・ジャーナル(The Bell System Technical Journa
l)、55[8](1976−10)(米)P.1069-1085に記載さ
れる帯域分割型音声分析合成方式(Sub−Band Coding方
式とも呼ばれ、以降SBC方式と略す)が知られてい
る。このSBC方式は第4図に示されるように音声信号
の周波数帯域を複数(通常4〜8)の帯域(図中、
、及びで示す。)に分割し、各分割チャネルの出
力を別々に符号化、復号化する方式である。
第5図にこのSBC方式の基本的な回路構成を示す。ま
た、第6図(A)〜(E)は第5図の回路の動作を説明
するための図である。以下、第5図、第6図(A)〜
(E)を用いてSBC方式の動作を説明する。
た、第6図(A)〜(E)は第5図の回路の動作を説明
するための図である。以下、第5図、第6図(A)〜
(E)を用いてSBC方式の動作を説明する。
先ず、分析器の動作は次の通りである。マイク(図示せ
ず)等から入力されたアナログ音声信号は、ローパスフ
ィルタ(図示せず)に入力されて所定のサンプリング周
波数の1/2以上の周波数成分を除去された後、A/D変
換器(図示せず)で所定のサンプリング周波数において
アナログ信号からディジタル信号S(n)に変換され
る。ここでnはサンプル番号である。このディジタル化
された入力信号S(n)はバンドパスフィルタ50に入力
され、第6図(A)に示す如く特定の帯域成分(ここで
は、W1k−W2k)が抽出される。次にこのバンドパ
スフィルタ50の出力信号は乗算器51において第6図
(B)に示したW1kとなる周波数をもったコサイン波
(cos波)と乗算されることによりcos変調が施さ
れ、第6図(C)の如く(0−Wk)の基底帯域にシフ
トされる。このとき生じる2W1k以上の不要な周波数
成分Rk(ω)(例えば、第6図(C)で点線で示した
成分)をローパスフィルタ52によって除去する。このよ
うにして得られる信号rk(n)はWk以下の周波数成
分しか必要としないものであるから、2Wkのサンプリ
ング周波数でサンプリングすれば必要かつ十分な情報が
保たれる。このためにダウンサンプリング部53によって
必要以上に高いサンプリング周波数を2Wkに落として
ダウンサンプリングを行い、このダウンサンプリングし
た信号を符号器54で符号化し、符号化された信号を合成
器へ伝送する。
ず)等から入力されたアナログ音声信号は、ローパスフ
ィルタ(図示せず)に入力されて所定のサンプリング周
波数の1/2以上の周波数成分を除去された後、A/D変
換器(図示せず)で所定のサンプリング周波数において
アナログ信号からディジタル信号S(n)に変換され
る。ここでnはサンプル番号である。このディジタル化
された入力信号S(n)はバンドパスフィルタ50に入力
され、第6図(A)に示す如く特定の帯域成分(ここで
は、W1k−W2k)が抽出される。次にこのバンドパ
スフィルタ50の出力信号は乗算器51において第6図
(B)に示したW1kとなる周波数をもったコサイン波
(cos波)と乗算されることによりcos変調が施さ
れ、第6図(C)の如く(0−Wk)の基底帯域にシフ
トされる。このとき生じる2W1k以上の不要な周波数
成分Rk(ω)(例えば、第6図(C)で点線で示した
成分)をローパスフィルタ52によって除去する。このよ
うにして得られる信号rk(n)はWk以下の周波数成
分しか必要としないものであるから、2Wkのサンプリ
ング周波数でサンプリングすれば必要かつ十分な情報が
保たれる。このためにダウンサンプリング部53によって
必要以上に高いサンプリング周波数を2Wkに落として
ダウンサンプリングを行い、このダウンサンプリングし
た信号を符号器54で符号化し、符号化された信号を合成
器へ伝送する。
次に、合成器において分析器と全く逆の処理を行うこと
により、分析器から送られてきた信号を復号する。すな
わち、符号化された信号を復号器55によって復号した
後、補間部56によって分析器でダウンサンプリングされ
た信号を元のサンプリング周波数に戻すためにアップサ
ンプリングを行う。この補間部56からの出力信号は、乗
算器57において第6図(D)に示したW1kとなる周波
数をもったcos波と乗算されることにより復調され、
第6図(E)に示した如く基底帯域(0−Wk)から再
びもとの周波数帯域(W1k−W2k)に戻された後、
バンドパスフィルタ58によって信号中の(W1k−W
2k)以外の帯域の成分を除去する。
により、分析器から送られてきた信号を復号する。すな
わち、符号化された信号を復号器55によって復号した
後、補間部56によって分析器でダウンサンプリングされ
た信号を元のサンプリング周波数に戻すためにアップサ
ンプリングを行う。この補間部56からの出力信号は、乗
算器57において第6図(D)に示したW1kとなる周波
数をもったcos波と乗算されることにより復調され、
第6図(E)に示した如く基底帯域(0−Wk)から再
びもとの周波数帯域(W1k−W2k)に戻された後、
バンドパスフィルタ58によって信号中の(W1k−W
2k)以外の帯域の成分を除去する。
このようにして、合成器から信号Sk(n)が出力され
る。
る。
上記一連の処理を各分割帯域(チャネル)毎にそれぞれ
行い、最後に全チャネルの出力を加算して出力音声信号
を得る。
行い、最後に全チャネルの出力を加算して出力音声信号
を得る。
以上がSBC方式の基本的な動作内容であるが、第5図
の回路構成を直接装置化することはあまりなく、回路量
を削減するためにバンドパスフィルタ50、58を用いない
第7図のような構成のSBC方式も提案されている。
の回路構成を直接装置化することはあまりなく、回路量
を削減するためにバンドパスフィルタ50、58を用いない
第7図のような構成のSBC方式も提案されている。
次に、この第7図の回路の動作を説明する。
先ず、分析器において、ディジタル化された入力信号S
(n)は複素信号ejωk n[ここでωk=(W1k+
W2k)/2]にて複素変調される。この複素変調は、
乗算器61aによるcos変調(変調波はcosω
kn)、乗算器61bによるサイン(sin)変調(変調
波はsinωkn)により行われる。乗算器61a、61bの
出力は帯域幅(0−ωk/2)のローパスフィルタ62
a、62bにそれぞれ入力されフィルタリングされる。この
ようにして、ローパスフィルタ62aからは複素信号a
k(n)+jbk(n)の実部ak(n)が、ローパス
フィルタ62bからは複素信号ak(n)+jbk(n)
の虚部bk(n)がそれぞれ出力される。各信号a
k(n)、bk(n)はそれぞれダウンサンプリング部
63a、63bによって周波数Wkにダウンサンプリングされ
た後、符号器64によって符号化され、合成器側へ伝送さ
れる。合成器においては符号化された信号は復号器65に
よって復号された後、補間器66a、66bによって元のサン
プリング周波数に戻され、次に帯域幅(0−ωk/2)
のローパスフィルタ67a、67bを通してフィルタリングさ
れた後、乗算器68aによるcos波との乗算、乗算器68b
によるsin波との乗算によって復調され、さらに加算
器69で信号のcos成分とsin成分とが加算され、当
該分割帯域の信号が合成される。
(n)は複素信号ejωk n[ここでωk=(W1k+
W2k)/2]にて複素変調される。この複素変調は、
乗算器61aによるcos変調(変調波はcosω
kn)、乗算器61bによるサイン(sin)変調(変調
波はsinωkn)により行われる。乗算器61a、61bの
出力は帯域幅(0−ωk/2)のローパスフィルタ62
a、62bにそれぞれ入力されフィルタリングされる。この
ようにして、ローパスフィルタ62aからは複素信号a
k(n)+jbk(n)の実部ak(n)が、ローパス
フィルタ62bからは複素信号ak(n)+jbk(n)
の虚部bk(n)がそれぞれ出力される。各信号a
k(n)、bk(n)はそれぞれダウンサンプリング部
63a、63bによって周波数Wkにダウンサンプリングされ
た後、符号器64によって符号化され、合成器側へ伝送さ
れる。合成器においては符号化された信号は復号器65に
よって復号された後、補間器66a、66bによって元のサン
プリング周波数に戻され、次に帯域幅(0−ωk/2)
のローパスフィルタ67a、67bを通してフィルタリングさ
れた後、乗算器68aによるcos波との乗算、乗算器68b
によるsin波との乗算によって復調され、さらに加算
器69で信号のcos成分とsin成分とが加算され、当
該分割帯域の信号が合成される。
上記一連の処理を各分割帯域(チャネル)毎にそれぞれ
行い、最後に全チャネルの出力を加算して出力音声信号
を得る。
行い、最後に全チャネルの出力を加算して出力音声信号
を得る。
以上がSBC方式の動作原理であるが、この方式は音声
信号そのものを符号化する方式に比べ以下のような特長
がある。
信号そのものを符号化する方式に比べ以下のような特長
がある。
各チャネルの量子化誤差は白色雑音に近く、周波数スペ
クトル上の全域に広がるが、そのうち各チャネルの帯域
内の雑音だけしか各チャネルには落ちてこないため、量
子化雑音を軽減出来る。また、各チャネルの量子化誤差
はその周波数帯域内の信号のみに関係し、音声のように
低周波成分が大きく、高周波成分が小さい信号において
は周波数の高い帯域のチャネルでの誤差は信号全体から
見れば僅かな誤差にしかならない。さらに、音声信号の
うち高い周波数の成分は雑音成分が主であり、この帯域
での誤差は聴覚上あまり影響しない。
クトル上の全域に広がるが、そのうち各チャネルの帯域
内の雑音だけしか各チャネルには落ちてこないため、量
子化雑音を軽減出来る。また、各チャネルの量子化誤差
はその周波数帯域内の信号のみに関係し、音声のように
低周波成分が大きく、高周波成分が小さい信号において
は周波数の高い帯域のチャネルでの誤差は信号全体から
見れば僅かな誤差にしかならない。さらに、音声信号の
うち高い周波数の成分は雑音成分が主であり、この帯域
での誤差は聴覚上あまり影響しない。
従って、このような性質を考慮して帯域の分割方法や各
チャネルの信号に与える量子化ビット数を設定すること
により、音声信号を直接符号化する方式に比べ、約1/2
程度の情報量で実現出来る。すなわち、8kHzでサンプ
リングされたPCM音声に対し、これを直接、例えばA
DPCM符号化した場合、約30Kビット/秒程度の情報
量が必要であるが、SBCでは聴覚上ほぼ同品質の合成
音が16Kビット/秒前後の情報量で得ることが出来る。
チャネルの信号に与える量子化ビット数を設定すること
により、音声信号を直接符号化する方式に比べ、約1/2
程度の情報量で実現出来る。すなわち、8kHzでサンプ
リングされたPCM音声に対し、これを直接、例えばA
DPCM符号化した場合、約30Kビット/秒程度の情報
量が必要であるが、SBCでは聴覚上ほぼ同品質の合成
音が16Kビット/秒前後の情報量で得ることが出来る。
(発明が解決しようとする問題点) ところで、当然のなりゆきとして高品質の合成音をさら
に少ない情報量で実現したいという要求がある。しかし
SBC方式は基本的には波形符号化方式であるから情報
圧縮も10Kビット/秒程度が限界で、この領域によると
量子化ビット数の不足から、量子化雑音により合成音ザ
ラツキが目立ったり、或は帯域の不足から音がこもった
り、音韻性がくずれてしまうという問題点があった。
に少ない情報量で実現したいという要求がある。しかし
SBC方式は基本的には波形符号化方式であるから情報
圧縮も10Kビット/秒程度が限界で、この領域によると
量子化ビット数の不足から、量子化雑音により合成音ザ
ラツキが目立ったり、或は帯域の不足から音がこもった
り、音韻性がくずれてしまうという問題点があった。
このような問題点の解決を図るため、この出願の発明者
等は種々の研究等を行った。これら研究によると、現在
のところ、音声波形を直接符号化するADPCM方式や
APCM方式、或は前述の如く帯域分割した波形を符号
化するSBC方式など波形符号化方式に属する方式では
無音区間の圧縮は全くではないが、あまり行われていな
い。特にSBC方式では例がないようである。しかし、
よく知られているように通常の会話音声の中には相当量
の無音区間が含まれており、会話が途切れている区間は
もちろんのこと、連続的に会話が続いている区間におい
ても息つぎや閉鎖区間を伴う破裂音などで全体の20%近
い無音区間が生じる。従って、これらの区間を音声区間
に含めて情報量を同じように与えるのは無駄である。ま
た、SBC方式のように帯域分割を行う方式ではチャネ
ル毎に振幅がある部分と、ほとんどないという場合があ
る。すなわち、人間の耳は音声をスペクトル上のピーク
(ホルマント)の位置、大きさなどによって、それぞれ
の音韻を聞き分けており、スペクトルの谷の部分は比較
的音声情報としての重要度は低い。さらに、音声の信号
レベルが小さい音ではこの谷の部分はほとんどノイズレ
ベル以下という場合がままある。実際上このような部分
は無音として取り扱っても音韻性を損なうことはほとん
どない。また、周波数帯域分割を行わない音声分析合成
方式での無音圧縮では、全帯域に対して一律に有音/無
音の判定を下すわけであるから、ノイズのレベルが大き
い場合、有音/無音の判定レベルを大きくすれば音声パ
ワーの小さい摩擦音などの音声区間までも無音と判定さ
れて失われてしまい、逆に、判定レベルを小さくすれば
ノイズのみの区間も有音と判定され情報圧縮の効果が得
られない。
等は種々の研究等を行った。これら研究によると、現在
のところ、音声波形を直接符号化するADPCM方式や
APCM方式、或は前述の如く帯域分割した波形を符号
化するSBC方式など波形符号化方式に属する方式では
無音区間の圧縮は全くではないが、あまり行われていな
い。特にSBC方式では例がないようである。しかし、
よく知られているように通常の会話音声の中には相当量
の無音区間が含まれており、会話が途切れている区間は
もちろんのこと、連続的に会話が続いている区間におい
ても息つぎや閉鎖区間を伴う破裂音などで全体の20%近
い無音区間が生じる。従って、これらの区間を音声区間
に含めて情報量を同じように与えるのは無駄である。ま
た、SBC方式のように帯域分割を行う方式ではチャネ
ル毎に振幅がある部分と、ほとんどないという場合があ
る。すなわち、人間の耳は音声をスペクトル上のピーク
(ホルマント)の位置、大きさなどによって、それぞれ
の音韻を聞き分けており、スペクトルの谷の部分は比較
的音声情報としての重要度は低い。さらに、音声の信号
レベルが小さい音ではこの谷の部分はほとんどノイズレ
ベル以下という場合がままある。実際上このような部分
は無音として取り扱っても音韻性を損なうことはほとん
どない。また、周波数帯域分割を行わない音声分析合成
方式での無音圧縮では、全帯域に対して一律に有音/無
音の判定を下すわけであるから、ノイズのレベルが大き
い場合、有音/無音の判定レベルを大きくすれば音声パ
ワーの小さい摩擦音などの音声区間までも無音と判定さ
れて失われてしまい、逆に、判定レベルを小さくすれば
ノイズのみの区間も有音と判定され情報圧縮の効果が得
られない。
ところで、音声のスペクトルはノイズのスペクトルに比
べ、その音韻性を表わす特徴的な偏りを持っているた
め、音声を複数の帯域に分け、各帯域毎に無音判定を行
えば、帯域全体でみた音声パワーが小さい場合でもパワ
ーの偏った帯域の成分は保存され、それ以外のノイズ成
分だけしか持たない帯域の情報は削除されるため、音韻
性の確保、情報圧縮両方の効果を得ることが出来る。
べ、その音韻性を表わす特徴的な偏りを持っているた
め、音声を複数の帯域に分け、各帯域毎に無音判定を行
えば、帯域全体でみた音声パワーが小さい場合でもパワ
ーの偏った帯域の成分は保存され、それ以外のノイズ成
分だけしか持たない帯域の情報は削除されるため、音韻
性の確保、情報圧縮両方の効果を得ることが出来る。
従って、この出願の第一発明の目的は音声信号のチャネ
ル毎にその振幅レベルから無音区間の有無を判定し符号
化の必要ないチャネルの信号を圧縮する音声分析合成方
法を提供することにある。
ル毎にその振幅レベルから無音区間の有無を判定し符号
化の必要ないチャネルの信号を圧縮する音声分析合成方
法を提供することにある。
さらに、この出願の第二発明の目的は、このような音声
分析合成方法を実施するための装置を提供することにあ
る。
分析合成方法を実施するための装置を提供することにあ
る。
(問題点を解決するための手段) 第一発明の目的の達成を図るため、この発明によれば、
一定時間区間(フレーム長)毎に、各分割チャネルの出
力信号の振幅レベルを判定し、 前記振幅レベルが各チャネル毎に定められた基準レベル
を越えているチャネルの出力信号のみを符号化すること
を特徴とする。
一定時間区間(フレーム長)毎に、各分割チャネルの出
力信号の振幅レベルを判定し、 前記振幅レベルが各チャネル毎に定められた基準レベル
を越えているチャネルの出力信号のみを符号化すること
を特徴とする。
さらに、第二発明の目的の達成を図るため、この発明の
音声分析合成装置によれば、 一定時間区間(フレーム長)毎に各分割チャネル信号の
振幅レベルを検出する振幅レベル検出部と、この振幅レ
ベル及び各分割チャネル毎に定められた基準レベルの大
小を比較して有音又は無音を判定し有音時には分割チャ
ネル信号の符号化情報を及び無音時には分割チャネル信
号の符号化を行わないことにより圧縮するための無音判
定信号を符号化器にそれぞれ出力するレベル判定部とを
有する分析側無音検出器を設けたことを特徴とする。
音声分析合成装置によれば、 一定時間区間(フレーム長)毎に各分割チャネル信号の
振幅レベルを検出する振幅レベル検出部と、この振幅レ
ベル及び各分割チャネル毎に定められた基準レベルの大
小を比較して有音又は無音を判定し有音時には分割チャ
ネル信号の符号化情報を及び無音時には分割チャネル信
号の符号化を行わないことにより圧縮するための無音判
定信号を符号化器にそれぞれ出力するレベル判定部とを
有する分析側無音検出器を設けたことを特徴とする。
この第二発明の実施に当っては、分析側からの符号化さ
れた分割チャネル信号を有音時にのみ復号化するための
復号化信号を及び無音時には復号化器の出力を零レベル
にするための無音判定信号を復号化器にそれぞれ出力す
るための合成側無音検出器を設けるのが好適である。
れた分割チャネル信号を有音時にのみ復号化するための
復号化信号を及び無音時には復号化器の出力を零レベル
にするための無音判定信号を復号化器にそれぞれ出力す
るための合成側無音検出器を設けるのが好適である。
さらに、この第二発明の好適実施例によれば、振幅レベ
ル検出部には、各分割チャネル信号の振幅レベルの絶対
値を出力する絶対値回路と、フレーム長内での振幅レベ
ルの絶対値の最大値を最大振幅レベルとして出力する最
大値検出回路とを設けることが出来る。
ル検出部には、各分割チャネル信号の振幅レベルの絶対
値を出力する絶対値回路と、フレーム長内での振幅レベ
ルの絶対値の最大値を最大振幅レベルとして出力する最
大値検出回路とを設けることが出来る。
さらに、この第二発明の他の実施例によれば、レベル判
定部には、最大振幅レベルに対応しかつ符号化器での量
子化ステップ幅を定めるための量子化レベルに変換した
後この量子化レベルを符号化する量子化レベル変換符号
化回路と、この量子化レベルが基準レベルを越えていな
い無音時の量子化レベルの符号化結果を無音判定信号と
して出力し及び越えている有音時の量子化レベルの符号
化結果を出力する分析側無音判定回路と、この符号化結
果を復号した後量子化ステップ幅に変換して符号化器に
出力する分析側量子化ステップ幅復号変換回路とを具
え、 さらに、分析側から合成側に送られてきた符号化結果が
前記基準レベルを越えていない無音時の符号化結果を無
音判定信号として復号化器へ出力し及び越えている有音
時の符号化結果を出力する合成側無音判定回路と、この
有音時の符号化結果を分析側から合成側へ送られてきた
符号化された分割チャネル信号の復号化のための量子化
ステップ幅に変換してこの復号化器に出力する合成側量
子化ステップ幅変換回路とを設けるのが好適である。
定部には、最大振幅レベルに対応しかつ符号化器での量
子化ステップ幅を定めるための量子化レベルに変換した
後この量子化レベルを符号化する量子化レベル変換符号
化回路と、この量子化レベルが基準レベルを越えていな
い無音時の量子化レベルの符号化結果を無音判定信号と
して出力し及び越えている有音時の量子化レベルの符号
化結果を出力する分析側無音判定回路と、この符号化結
果を復号した後量子化ステップ幅に変換して符号化器に
出力する分析側量子化ステップ幅復号変換回路とを具
え、 さらに、分析側から合成側に送られてきた符号化結果が
前記基準レベルを越えていない無音時の符号化結果を無
音判定信号として復号化器へ出力し及び越えている有音
時の符号化結果を出力する合成側無音判定回路と、この
有音時の符号化結果を分析側から合成側へ送られてきた
符号化された分割チャネル信号の復号化のための量子化
ステップ幅に変換してこの復号化器に出力する合成側量
子化ステップ幅変換回路とを設けるのが好適である。
尚、上述において、全てのチャネルに対し、同じ判定基
準レベルを設けることは妥当ではなく、それぞれのチャ
ネルの周波数帯域に応じて判定基準レベルすなわち無音
レベルを選定する。
準レベルを設けることは妥当ではなく、それぞれのチャ
ネルの周波数帯域に応じて判定基準レベルすなわち無音
レベルを選定する。
(作用) このように、この出願の第一及び第二発明によれば、音
声がほぼ定常であると見なせる例えば5〜30msの一定
時間区間を予め定め、このフレーム長毎に、周波数分割
された各チャネルにおける有音/無音の判定を行い、各
チャネルにおいて有音区間と判定された区間のみそのチ
ャネルの出力信号を符号化して伝送する。又無音区間に
おいてはそのチャネルの出力信号は符号化せずに圧縮し
て合成側において「0」レベル信号を復号して出力す
る。このように無音区間において音声情報量の圧縮を行
う。
声がほぼ定常であると見なせる例えば5〜30msの一定
時間区間を予め定め、このフレーム長毎に、周波数分割
された各チャネルにおける有音/無音の判定を行い、各
チャネルにおいて有音区間と判定された区間のみそのチ
ャネルの出力信号を符号化して伝送する。又無音区間に
おいてはそのチャネルの出力信号は符号化せずに圧縮し
て合成側において「0」レベル信号を復号して出力す
る。このように無音区間において音声情報量の圧縮を行
う。
(実施例) 以下、図面を参照して、この発明の実施例につき説明す
る。
る。
第1図はこの発明の実施例を説明するための第7図に示
したSBC方式の帯域分割型音声合成装置に本発明を適
用した場合の実施例を示すブロック図であり、各チャネ
ル成分の符号化にはAPCMを用いている。また第1図
は1つのチャネルのみについて記してある。
したSBC方式の帯域分割型音声合成装置に本発明を適
用した場合の実施例を示すブロック図であり、各チャネ
ル成分の符号化にはAPCMを用いている。また第1図
は1つのチャネルのみについて記してある。
第1図において、10は入力端子、11a及び11bは乗算器、
12a及び12bはローパスフィルタ(LPF)、13a及び13b
はR:1のダウンサンプリング部でこれらは分析側の装
置構成部分であって、第7図に示した分析器の構成に対
応する。さらに、合成側の装置構成部分も、第7図の合
成器の構成と対応して構成してあり、16a及び16bは1:
Rの補間器、17a及び17bはローパスフィルタ(LP
F)、18a及び18bは乗算器、19は加算器及び20は出力端
子である。14a及び14bは例えばAPCM符号化器であ
り、15a及び15bは例えばAPCM復号化器であるが、こ
の発明の実施例ではこれらAPCM符号化器14a及び14
b、APCM復号化器15a及び15bを後述するように構成
する。
12a及び12bはローパスフィルタ(LPF)、13a及び13b
はR:1のダウンサンプリング部でこれらは分析側の装
置構成部分であって、第7図に示した分析器の構成に対
応する。さらに、合成側の装置構成部分も、第7図の合
成器の構成と対応して構成してあり、16a及び16bは1:
Rの補間器、17a及び17bはローパスフィルタ(LP
F)、18a及び18bは乗算器、19は加算器及び20は出力端
子である。14a及び14bは例えばAPCM符号化器であ
り、15a及び15bは例えばAPCM復号化器であるが、こ
の発明の実施例ではこれらAPCM符号化器14a及び14
b、APCM復号化器15a及び15bを後述するように構成
する。
これらの構成は、従来と同様に音声信号の周波数帯域を
複数の帯域に分割し、各分割チャネル信号を別個に符号
化し合成するようになしてある。
複数の帯域に分割し、各分割チャネル信号を別個に符号
化し合成するようになしてある。
この発明においては、分析側において周波数帯域分割さ
れた各チャネル毎に無音区間の検出を行って検出された
無音区間に対してはAPCM符号化器14a及び14bにおけ
る符号化器114a及び114bで符号化を行わないようにする
ためすなわち圧縮するための無音検出器21a及び21bを設
ける。一方、合成側においては、APCM復号化器15a
及び15bにおける復号化器115a及び115bの復号信号の対
応する無音区間での信号レベルを「0」としてこれら信
号を生成するための無音検出器22a及び22bを設けた構成
とする。そして、この実施例では、これら無音検出器21
a、21b及び22a、22bはそれぞれのAPCM符号化器14
a、14b及びAPCM復号化器15a、15bにおいてAPCM
処理を行う機能を果たしている構成となっている。さら
に、110a、110bは後述するマルチプレクサ及び111a、11
1bは後述するデマルチプレクサである。
れた各チャネル毎に無音区間の検出を行って検出された
無音区間に対してはAPCM符号化器14a及び14bにおけ
る符号化器114a及び114bで符号化を行わないようにする
ためすなわち圧縮するための無音検出器21a及び21bを設
ける。一方、合成側においては、APCM復号化器15a
及び15bにおける復号化器115a及び115bの復号信号の対
応する無音区間での信号レベルを「0」としてこれら信
号を生成するための無音検出器22a及び22bを設けた構成
とする。そして、この実施例では、これら無音検出器21
a、21b及び22a、22bはそれぞれのAPCM符号化器14
a、14b及びAPCM復号化器15a、15bにおいてAPCM
処理を行う機能を果たしている構成となっている。さら
に、110a、110bは後述するマルチプレクサ及び111a、11
1bは後述するデマルチプレクサである。
第2図(A)は、この発明の説明に供する装置の要部を
示すブロック図であり、第1図において構成成分11a〜1
8aまでのcos成分に対するブロックと、構成成分11b
〜18bまでのsin成分に対するブロックとでは変調波
がcosとsinで異なるだけで動作は全く同じである
ため、ここではcos成分に対する側の要部の構成を示
す。
示すブロック図であり、第1図において構成成分11a〜1
8aまでのcos成分に対するブロックと、構成成分11b
〜18bまでのsin成分に対するブロックとでは変調波
がcosとsinで異なるだけで動作は全く同じである
ため、ここではcos成分に対する側の要部の構成を示
す。
以下、第1図及び第2図(A)を参照してこの発明の装
置の一実施例の動作について説明する。
置の一実施例の動作について説明する。
先ず、入力端子10よりディジタル化された音声信号が入
力されると、その信号に対し、乗算器11aにおいてチャ
ネルの中心周波数と同じ周波数を持ったcos波形(c
osωkt)を乗じ振幅変調を行う。但し、kはk番目
のチャネルを表わしている。cos変調された音声信号
はωkの1/2の帯域を持ったローパスフィルタ12aに通さ
れ、このチャネルcos成分の出力ak(n)が抽出さ
れる。次にローパスフィルタ13aの出力ak(n)は、
ダウンサンプリング部13aにおいて(チャネルの帯域
幅)/(元の信号のサンプリング周波数)のサンプルに
ダウンサンプリング(R:1)され、その結果ak(S
R)をAPCM符号化器14aの符号化器114aによって符
号化して伝送する。
力されると、その信号に対し、乗算器11aにおいてチャ
ネルの中心周波数と同じ周波数を持ったcos波形(c
osωkt)を乗じ振幅変調を行う。但し、kはk番目
のチャネルを表わしている。cos変調された音声信号
はωkの1/2の帯域を持ったローパスフィルタ12aに通さ
れ、このチャネルcos成分の出力ak(n)が抽出さ
れる。次にローパスフィルタ13aの出力ak(n)は、
ダウンサンプリング部13aにおいて(チャネルの帯域
幅)/(元の信号のサンプリング周波数)のサンプルに
ダウンサンプリング(R:1)され、その結果ak(S
R)をAPCM符号化器14aの符号化器114aによって符
号化して伝送する。
符号化方式としてここでは、先に述べたようにAPCM
を用いるが、この実施例ではある区間毎に量子化ステッ
プ幅を定め、その区間のデータに対しては現在定めた量
子化ステップ幅を用いて量子化を行うセグメンタルAP
CM(SAPCM)を用いている。
を用いるが、この実施例ではある区間毎に量子化ステッ
プ幅を定め、その区間のデータに対しては現在定めた量
子化ステップ幅を用いて量子化を行うセグメンタルAP
CM(SAPCM)を用いている。
さらに、この発明の主旨である無音圧縮もこのSAPC
M符号化の過程で行っている。以下、符号化の動作につ
いて説明する。
M符号化の過程で行っている。以下、符号化の動作につ
いて説明する。
第2図(A)は第1図におけるAPCM符号化器14a、
APCM復号化器15aでの所要の処理を行わせるため、
この発明によって設けた無音検出器21a及び22aのブロッ
ク構成を主として示したものである。
APCM復号化器15aでの所要の処理を行わせるため、
この発明によって設けた無音検出器21a及び22aのブロッ
ク構成を主として示したものである。
この実施例においては、分析側無音検出器21aを振幅レ
ベル検出部23aと、レベル判定部24aとを以って構成す
る。この振幅レベル検出部23aでは一定時間区間すなわ
ちフレーム長毎に各分割チャネル信号である出力信号a
k(SR)の振幅レベルを検出する。一方、レベル判定
部24aでは、この検出された振幅レベルと、各チャネル
毎に定められた基準レベルとの大小の比較を行って有音
又は無音の判定を行う。振幅レベルが基準レベルを越え
ている有音時には分割チャネル出力のみを符号化する符
号化情報を符号化器114aに出力する。一方、振幅レベル
が基準レベルを越えていない無音区間では符号化を行わ
ないことにより圧縮するための無音判定信号を符号化器
114aに出力する。
ベル検出部23aと、レベル判定部24aとを以って構成す
る。この振幅レベル検出部23aでは一定時間区間すなわ
ちフレーム長毎に各分割チャネル信号である出力信号a
k(SR)の振幅レベルを検出する。一方、レベル判定
部24aでは、この検出された振幅レベルと、各チャネル
毎に定められた基準レベルとの大小の比較を行って有音
又は無音の判定を行う。振幅レベルが基準レベルを越え
ている有音時には分割チャネル出力のみを符号化する符
号化情報を符号化器114aに出力する。一方、振幅レベル
が基準レベルを越えていない無音区間では符号化を行わ
ないことにより圧縮するための無音判定信号を符号化器
114aに出力する。
ところで、通常、ダウンサンプリング後の出力ak(S
R)を符号化するに際し、フレーム内での量子化ステッ
プ幅△Qk(i)(但し、iはフレーム番号)を求める
必要がある。
R)を符号化するに際し、フレーム内での量子化ステッ
プ幅△Qk(i)(但し、iはフレーム番号)を求める
必要がある。
従って、ここでは、好適実施例として、この量子化ステ
ップ幅△Qk(i)を求める過程を利用して前述した無
音判定信号及び符号化情報を形成する場合の分析側無音
検出器21aにつき説明する。この場合、量子化ステップ
幅(以下、単にステップ幅と称する。)△Qk(i)は
フレーム内の信号ak(SR)の最大値が量子化のダイ
ナミックレンジに等しくなるように決める。
ップ幅△Qk(i)を求める過程を利用して前述した無
音判定信号及び符号化情報を形成する場合の分析側無音
検出器21aにつき説明する。この場合、量子化ステップ
幅(以下、単にステップ幅と称する。)△Qk(i)は
フレーム内の信号ak(SR)の最大値が量子化のダイ
ナミックレンジに等しくなるように決める。
先ず、この実施例の振幅レベル検出部23aでは、各分割
チャネル信号ak(SR)の振幅レベルの絶対値を絶対
値回路25で算出し、さらにフレーム内でのその最大値a
maxを最大振幅レベルとして最大値検出回路26で求め
る。この最大値amaxをレベル判定部24aに送る。
チャネル信号ak(SR)の振幅レベルの絶対値を絶対
値回路25で算出し、さらにフレーム内でのその最大値a
maxを最大振幅レベルとして最大値検出回路26で求め
る。この最大値amaxをレベル判定部24aに送る。
当然のことながら符号化で用いたステップ幅△Q
k(i)は復号化器115aでも用いるため、ステップ幅△
Qk(i)を決定する量子化レベル△Q′k(i)を合
成側に送る必要がある。従って、求まった最大値a
maxを、ここでは量子化レベル変換符号化回路27にお
いて対数圧伸してビット数を削減し、合成側へ送出す
る。この最大値amaxの符号化すなわち量子化レベル
△Q′k(i)への変換はテーブルを参照することによ
って行う。このため、この実施例では量子化レベル変換
符号化回路27には△Q′k(i)符号化部28及びテーブ
ルROM29を設ける。
k(i)は復号化器115aでも用いるため、ステップ幅△
Qk(i)を決定する量子化レベル△Q′k(i)を合
成側に送る必要がある。従って、求まった最大値a
maxを、ここでは量子化レベル変換符号化回路27にお
いて対数圧伸してビット数を削減し、合成側へ送出す
る。この最大値amaxの符号化すなわち量子化レベル
△Q′k(i)への変換はテーブルを参照することによ
って行う。このため、この実施例では量子化レベル変換
符号化回路27には△Q′k(i)符号化部28及びテーブ
ルROM29を設ける。
テーブルROM29には第3図(A)の如く出力信号ak
(SR)の全ダイナミックレンジに対して対数的に割り
ふった最大値量子化レベルが昇順に格納してある。この
割りふりはチャネル及び最大値によって異なるが、この
場合、例えば(M+1)(但し、Mは正の整数)段階に
割りふる。この0からM段までを第3図(A)の左枠外
に記し、これに対応する量子化レベルを(量子化レベ
ル)。・・・(量子化レベル)mの如く示してある。
(SR)の全ダイナミックレンジに対して対数的に割り
ふった最大値量子化レベルが昇順に格納してある。この
割りふりはチャネル及び最大値によって異なるが、この
場合、例えば(M+1)(但し、Mは正の整数)段階に
割りふる。この0からM段までを第3図(A)の左枠外
に記し、これに対応する量子化レベルを(量子化レベ
ル)。・・・(量子化レベル)mの如く示してある。
△Q′k(i)符号化部28ではこれらの値と現在求まっ
た最大値amaxと逐次比較し、(量子化レベル)
j−1<amax≦(量子化レベル)jのときの(量子
化レベル)jを量子化結果とし、これを指し示す値jを
符号化結果△qk(i)として出力する。このときテー
ブルROM29の(量子化レベル)oには、無音閾値が格
納されており、△Q′k(i)符号化部28において
「0」が出力された場合、このフレームを無音とみな
す。
た最大値amaxと逐次比較し、(量子化レベル)
j−1<amax≦(量子化レベル)jのときの(量子
化レベル)jを量子化結果とし、これを指し示す値jを
符号化結果△qk(i)として出力する。このときテー
ブルROM29の(量子化レベル)oには、無音閾値が格
納されており、△Q′k(i)符号化部28において
「0」が出力された場合、このフレームを無音とみな
す。
従って、レベル判定部24aに設けた分析側無音判定回路3
0では△Q′k(i)符号化部28からの量子化レベル△
Q′k(i)が一定の基準レベルを越えているか否か、
すなわちこの実施例では符号化結果△qk(i)である
値jが「0」か否かを判定し、「0」であるならば分析
側無音判定回路30から1ビットの無音判定信号を符号化
器114aに送り、この符号化器114aにおいて符号化データ
を生成しないことによって、情報圧縮を行う。この無音
情報に基づく圧縮は任意好適な方式で行えばよい。この
実施例では、iフレームの出力信号が無音フレームと判
定されて符号化結果△qk(i)であるj=「0」の無
音判定信号が符号化器114aに供給されるとすると、符号
化器114aの前段に設けたバッファ回路37から、この符号
化器114aに順次に送られてくる・・・(i−1)フレー
ム、iフレーム、(i+1)フレームといった各フレー
ムの信号成分のうちiフレームの信号成分の符号化を行
わず、その結果・・・(i−1)フレーム、(i+1)
フレーム・・・の時間順次で合成側に信号が符号化器11
4aから出力される。△Q′k(i)符号化部28からの量
子化レベル△Q′k(i)が一定の基準レベルを越えて
いる場合すなわち符号化結果△qk(i)を表わす値j
が「0」でない場合には、この符号化結果△qk(i)
すなわち値jを分析側量子化ステップ幅復号変換回路31
に供給してそこで量子化ステップ幅△Qk(i)に変換
する。この分析側量子化ステップ幅復号変換回路31には
△Qk(i)復号化部32及びテーブルROM33とを設け
てある。△Qk(i)復号化部32においては送られてき
た符号化結果△qk(i)(値j)に対応する量子化ス
テップ幅△Qk(i)を復号し、符号化器114aに送り当
該フレーム区間のak(SR)の量子化を行う。
0では△Q′k(i)符号化部28からの量子化レベル△
Q′k(i)が一定の基準レベルを越えているか否か、
すなわちこの実施例では符号化結果△qk(i)である
値jが「0」か否かを判定し、「0」であるならば分析
側無音判定回路30から1ビットの無音判定信号を符号化
器114aに送り、この符号化器114aにおいて符号化データ
を生成しないことによって、情報圧縮を行う。この無音
情報に基づく圧縮は任意好適な方式で行えばよい。この
実施例では、iフレームの出力信号が無音フレームと判
定されて符号化結果△qk(i)であるj=「0」の無
音判定信号が符号化器114aに供給されるとすると、符号
化器114aの前段に設けたバッファ回路37から、この符号
化器114aに順次に送られてくる・・・(i−1)フレー
ム、iフレーム、(i+1)フレームといった各フレー
ムの信号成分のうちiフレームの信号成分の符号化を行
わず、その結果・・・(i−1)フレーム、(i+1)
フレーム・・・の時間順次で合成側に信号が符号化器11
4aから出力される。△Q′k(i)符号化部28からの量
子化レベル△Q′k(i)が一定の基準レベルを越えて
いる場合すなわち符号化結果△qk(i)を表わす値j
が「0」でない場合には、この符号化結果△qk(i)
すなわち値jを分析側量子化ステップ幅復号変換回路31
に供給してそこで量子化ステップ幅△Qk(i)に変換
する。この分析側量子化ステップ幅復号変換回路31には
△Qk(i)復号化部32及びテーブルROM33とを設け
てある。△Qk(i)復号化部32においては送られてき
た符号化結果△qk(i)(値j)に対応する量子化ス
テップ幅△Qk(i)を復号し、符号化器114aに送り当
該フレーム区間のak(SR)の量子化を行う。
この復号に当り、テーブルROM33には最大値amax
の量子化レベル△Q′k(i)の符号化結果△q
k(i)を表わす値j(=1〜M)に応じた量子化ステ
ップ幅△Qk(i)が△Qjとして格納されており、△
Qk(i)復号化部32ではこのテーブルROM33を参照
することによりこれらステップ幅△Qjを生成して符号
化器114aに供給する。第3図(B)にこのテーブルRO
M33の内容の一例を示してある。これら値j(=1〜
M)を左枠外に記し、これに対応する量子化ステップ幅
△Qk(i)のjに対応するステップ幅△Qj(j=1
〜M)を順次に示してある。
の量子化レベル△Q′k(i)の符号化結果△q
k(i)を表わす値j(=1〜M)に応じた量子化ステ
ップ幅△Qk(i)が△Qjとして格納されており、△
Qk(i)復号化部32ではこのテーブルROM33を参照
することによりこれらステップ幅△Qjを生成して符号
化器114aに供給する。第3図(B)にこのテーブルRO
M33の内容の一例を示してある。これら値j(=1〜
M)を左枠外に記し、これに対応する量子化ステップ幅
△Qk(i)のjに対応するステップ幅△Qj(j=1
〜M)を順次に示してある。
尚、この場合、△Qjは、符号化器114aでの量子化ビッ
ト数をpとすると[(量子化レベル)j/2p−1]の
量をとり得る。
ト数をpとすると[(量子化レベル)j/2p−1]の
量をとり得る。
このように、分析側で分割チャネル信号毎に無音時か有
音時かを判定し符号化器114aにおいて有音時のみの分割
チャネル信号の符号化を行い及び無音時の分割チャネル
信号の符号化を行わないことにより圧縮して合成側に送
出する。
音時かを判定し符号化器114aにおいて有音時のみの分割
チャネル信号の符号化を行い及び無音時の分割チャネル
信号の符号化を行わないことにより圧縮して合成側に送
出する。
第2図(B)は有音時分割チャネル信号ak(SR)を
符号化器114aで符号化して得られた符号化結果Ak(S
R)と、量子化レベル△Q′k(i)の符号化結果△q
k(i)とをマルチプレクサ110aで信号配列して送出さ
れるフレームデータの状態を説明するための説明図であ
り、第2図(C)は無音時における同様なフレームデー
タの状態を説明するための説明図であり、さらに、第2
図(D)は(i+1)フレームが無音iフレーム及び
(i+2)フレームが有音であった場合のマルチプレク
サ110aから送出されるフレームデータの状態の説明図で
ある。
符号化器114aで符号化して得られた符号化結果Ak(S
R)と、量子化レベル△Q′k(i)の符号化結果△q
k(i)とをマルチプレクサ110aで信号配列して送出さ
れるフレームデータの状態を説明するための説明図であ
り、第2図(C)は無音時における同様なフレームデー
タの状態を説明するための説明図であり、さらに、第2
図(D)は(i+1)フレームが無音iフレーム及び
(i+2)フレームが有音であった場合のマルチプレク
サ110aから送出されるフレームデータの状態の説明図で
ある。
第2図(B)からも理解出来るように、iフレームが有
音時のフレームデータは、フレーム長をL(正の整数)
個のダウンサンプルとすると、先頭に量子化レベルの符
号化結果△qk(i)があり、これに続いてL個の分割
チャネル信号の符号化結果Ak(n′)、Ak(n′+
1)、・・・Ak(n′+L−1)(但し、n′=S
R)が続いている。
音時のフレームデータは、フレーム長をL(正の整数)
個のダウンサンプルとすると、先頭に量子化レベルの符
号化結果△qk(i)があり、これに続いてL個の分割
チャネル信号の符号化結果Ak(n′)、Ak(n′+
1)、・・・Ak(n′+L−1)(但し、n′=S
R)が続いている。
iフレームが無音であると、その場合には符号化器110a
からの分割チャネル信号の符号化結果Ak(i)は生じ
ていないので、第2図(C)に示すようにフレームデー
タは量子化レベルの符号化結果△qk(i)のみとな
る。
からの分割チャネル信号の符号化結果Ak(i)は生じ
ていないので、第2図(C)に示すようにフレームデー
タは量子化レベルの符号化結果△qk(i)のみとな
る。
さらに、iフレームが有音(i+1)フレームが無音、
(i+2)フレームが有音であると、第2図(D)に示
すようにiフレームのフレームデータは量子化レベルの
符号化結果△qk(i)が先頭で続いてiフレームの分
割チャネル信号のL個の符号化結果Ak(n′)、Ak
(n′+1)、・・・、Ak(n′+L−1)があり、
これに続いて(i+1)フレームの量子化レベルの符号
化結果△qk(i+1)が続き、さらにこれに続いて
(i+2)フレームの量子化レベルの符号化結果△qk
(i+2)及びその分割チャネル信号のL個の符号化結
果Ak(n′)、・・・、Ak(n′+L−1)が続い
たデータとなる。
(i+2)フレームが有音であると、第2図(D)に示
すようにiフレームのフレームデータは量子化レベルの
符号化結果△qk(i)が先頭で続いてiフレームの分
割チャネル信号のL個の符号化結果Ak(n′)、Ak
(n′+1)、・・・、Ak(n′+L−1)があり、
これに続いて(i+1)フレームの量子化レベルの符号
化結果△qk(i+1)が続き、さらにこれに続いて
(i+2)フレームの量子化レベルの符号化結果△qk
(i+2)及びその分割チャネル信号のL個の符号化結
果Ak(n′)、・・・、Ak(n′+L−1)が続い
たデータとなる。
一方、合成側では分析側より送られてくるフレームデー
タをデマルチプレクサ111aにおいて量子化レベルの符号
化結果△qk(i)と、分割チャネル信号の符号化結果
Ak(SR)とに分け量子化レベルの符号化結果△qk
(i)を合成側無音検出器22aで受け取る。この実施例
ではこの無音検出器22aを合成側無音判定回路34及び合
成側量子ステップ幅復号変換回路35を以って構成する。
この合成側無音判定回路34においては、分析側無音判定
回路30と同様に受信した符号化結果△qk(i)に対応
する量子化レベル△Q′k(i)が基準レベルを越えて
いない場合すなわちこの実施例では例えばj=「0」で
あるし判定した場合には、無音判定信号を復号化器15a
に送出し、復号化器115aにおいて対応するフレーム区間
分の「0」レベルの出力を発生する。送られてきた符号
化結果△qk(i)に対応する量子化レベル△Q′
k(i)が「0」でない場合には分析側同様△Q
k(i)復号化器36においてテーブルROM37を参照し
て復号化信号としての量子化ステップ幅△Qjを復号
し、これを復号化器115aに供給し、そこでこの量子化ス
テップ幅△Qjを用いて分析側で量子化された符号化結
果Ak(SR)を復号して分割チャネル信号ak′(S
R)を得る。この合成側量子化ステップ幅復号変換回路
35は前述した分析側量子化ステップ幅復号変換回路31と
同様に作用する。
タをデマルチプレクサ111aにおいて量子化レベルの符号
化結果△qk(i)と、分割チャネル信号の符号化結果
Ak(SR)とに分け量子化レベルの符号化結果△qk
(i)を合成側無音検出器22aで受け取る。この実施例
ではこの無音検出器22aを合成側無音判定回路34及び合
成側量子ステップ幅復号変換回路35を以って構成する。
この合成側無音判定回路34においては、分析側無音判定
回路30と同様に受信した符号化結果△qk(i)に対応
する量子化レベル△Q′k(i)が基準レベルを越えて
いない場合すなわちこの実施例では例えばj=「0」で
あるし判定した場合には、無音判定信号を復号化器15a
に送出し、復号化器115aにおいて対応するフレーム区間
分の「0」レベルの出力を発生する。送られてきた符号
化結果△qk(i)に対応する量子化レベル△Q′
k(i)が「0」でない場合には分析側同様△Q
k(i)復号化器36においてテーブルROM37を参照し
て復号化信号としての量子化ステップ幅△Qjを復号
し、これを復号化器115aに供給し、そこでこの量子化ス
テップ幅△Qjを用いて分析側で量子化された符号化結
果Ak(SR)を復号して分割チャネル信号ak′(S
R)を得る。この合成側量子化ステップ幅復号変換回路
35は前述した分析側量子化ステップ幅復号変換回路31と
同様に作用する。
次に、第1図に戻って、復号された分割チャネル信号
a′k(SR)は、補間器16aによって補間されて元の
サンプリング周期に戻され、ローパスフィルタ17aを通
り、さらに、乗算器18aにおいてcosωknを乗ぜら
れて再び元の周波数帯域に復元される。
a′k(SR)は、補間器16aによって補間されて元の
サンプリング周期に戻され、ローパスフィルタ17aを通
り、さらに、乗算器18aにおいてcosωknを乗ぜら
れて再び元の周波数帯域に復元される。
以上の処理を他のチャネルも同様にして行い、最後に全
チャネルの出力結果を加算し、合成結果として出力す
る。
チャネルの出力結果を加算し、合成結果として出力す
る。
この発明は上述した実施例にのみ限定されるものではな
く、多くの変形又は変更を行うことが出来る。
く、多くの変形又は変更を行うことが出来る。
例えば、上述した実施例ではセグメントAPCM方式に
つき説明したが、この出願に係る発明はこれに限定され
るものではなく、帯域分割型の符号化復号化方法及び装
置に広く適用して好適である。
つき説明したが、この出願に係る発明はこれに限定され
るものではなく、帯域分割型の符号化復号化方法及び装
置に広く適用して好適である。
さらに、上述した実施例では合成側無音検出器及び分析
側無音検出器を用いてAPCM処理を行っているが、A
PCM処理自体は別の回路構成で行ってこれら検出器で
無音を検出させるのみであっても良い。
側無音検出器を用いてAPCM処理を行っているが、A
PCM処理自体は別の回路構成で行ってこれら検出器で
無音を検出させるのみであっても良い。
さらに、上述した実施例では、無音区間の検出を最大振
幅レベルを用いて行っているが、平均振幅レベルを用い
て行うことも出来る。又、上述した実施例では量子化ス
テップ幅の導出過程を利用しているため、レベル判定部
24aを量子化レベル変換符号化回路27、分析側無音判定
回路30及び分析側量子化ステップ幅復号変換回路を以っ
て構成しているが、このレベル判定部24aの構成自体他
の任意好適な構成とすることが出来る。又このような量
子化ステップ幅の導出過程を利用しない構成で無音区間
の符号化を行わずに無音区間のみ符号化を行って圧縮す
る場合には、レベル判定部24aを振幅レベルと基準レベ
ルとの比較を行ってその大小に応じた制御信号を符号化
器114aに送出する分析側無音判定回路とすると共に、合
成側無音判定回路も対応した構成とすればよい。
幅レベルを用いて行っているが、平均振幅レベルを用い
て行うことも出来る。又、上述した実施例では量子化ス
テップ幅の導出過程を利用しているため、レベル判定部
24aを量子化レベル変換符号化回路27、分析側無音判定
回路30及び分析側量子化ステップ幅復号変換回路を以っ
て構成しているが、このレベル判定部24aの構成自体他
の任意好適な構成とすることが出来る。又このような量
子化ステップ幅の導出過程を利用しない構成で無音区間
の符号化を行わずに無音区間のみ符号化を行って圧縮す
る場合には、レベル判定部24aを振幅レベルと基準レベ
ルとの比較を行ってその大小に応じた制御信号を符号化
器114aに送出する分析側無音判定回路とすると共に、合
成側無音判定回路も対応した構成とすればよい。
(発明の効果) 以上述べたように、この発明によれば本来無音である区
間はもちろんのこと、有音区間においても、ほとんど出
力のないチャネルの成分をデータから除去しているた
め、少ない情報量で合成音が生成出来る。また、各チャ
ネルで無音判定を行っているため、不要なノイズ成分が
削減され、結果的に高品質な合成音を得ることが出来
る。
間はもちろんのこと、有音区間においても、ほとんど出
力のないチャネルの成分をデータから除去しているた
め、少ない情報量で合成音が生成出来る。また、各チャ
ネルで無音判定を行っているため、不要なノイズ成分が
削減され、結果的に高品質な合成音を得ることが出来
る。
第1図はこの発明の説明に供する、SBC方式の音声分
析合成装置の実施例を示すブロック図、 第2図(A)は第1図に示した装置の要部を示すブロッ
ク図、 第2図(B)〜(D)は分析側から合成側へ送られるフ
レームデータの状態説明図、 第3図(A)及び(B)はこの発明に使用するテーブル
ROMの内容を説明するための図、 第4図はSBC方式の説明図、 第5図は従来のSBC方式音声分析合成器の構成図、 第6図は第5図の装置の動作を説明するための図、 第7図は他の従来のSBC方式音声分析合成器の構成図
である。 10…入力端子、11a、11b…乗算器 12a、12b…ローパスフィルタ(LPF) 13a、13b…(R:1の)ダウンサンプリング部 14a、14b…APCM符号化器 15a、15b…APCM復号化器 16a、16b…(1:Rの)補間器 17a、17b…ローパスフィルタ(LPF) 18a、18b…乗算器、19…加算器 20…出力端子、21a〜22b…無音検出器 23a…振幅レベル検出部 24a…レベル判定部 25…絶対値回路、26…最大値検出回路 27…量子化レベル変換符号化回路 28…△Q′k(i)符号化部 29、33、37…テーブルROM 30…分析側無音判定回路 31…分析側量子化ステップ幅復号変換回路 32…△Qk(i)復号化部 34…合成側無音判定回路 35…合成側量子化ステップ幅復号変換回路 36…△Qk(i)復号化部 37…バッファ回路。
析合成装置の実施例を示すブロック図、 第2図(A)は第1図に示した装置の要部を示すブロッ
ク図、 第2図(B)〜(D)は分析側から合成側へ送られるフ
レームデータの状態説明図、 第3図(A)及び(B)はこの発明に使用するテーブル
ROMの内容を説明するための図、 第4図はSBC方式の説明図、 第5図は従来のSBC方式音声分析合成器の構成図、 第6図は第5図の装置の動作を説明するための図、 第7図は他の従来のSBC方式音声分析合成器の構成図
である。 10…入力端子、11a、11b…乗算器 12a、12b…ローパスフィルタ(LPF) 13a、13b…(R:1の)ダウンサンプリング部 14a、14b…APCM符号化器 15a、15b…APCM復号化器 16a、16b…(1:Rの)補間器 17a、17b…ローパスフィルタ(LPF) 18a、18b…乗算器、19…加算器 20…出力端子、21a〜22b…無音検出器 23a…振幅レベル検出部 24a…レベル判定部 25…絶対値回路、26…最大値検出回路 27…量子化レベル変換符号化回路 28…△Q′k(i)符号化部 29、33、37…テーブルROM 30…分析側無音判定回路 31…分析側量子化ステップ幅復号変換回路 32…△Qk(i)復号化部 34…合成側無音判定回路 35…合成側量子化ステップ幅復号変換回路 36…△Qk(i)復号化部 37…バッファ回路。
Claims (5)
- 【請求項1】音声信号の周波数帯域を複数の帯域に分割
し、各分割チャネル信号を個別に符号化して合成する音
声分析合成方法において、 一定時間区間(フレーム長)毎の各分割チャネル信号の
振幅レベルを判定し、 前記振幅レベルが各分割チャネル毎に定められた基準レ
ベルを越えている分割チャネル信号のみを符号化する ことを特徴とする音声分析合成方法。 - 【請求項2】音声信号の周波数帯域を複数の帯域に分割
して得た各分割チャネル信号を個別に符号化して出力す
る符号化器と、符号化された分割チャネル信号を受信し
て合成する復号化器とを含む帯域分割型の音声分析合成
装置において、 一定時間区間(フレーム長)毎に各分割チャネル信号の
振幅レベルを検出する振幅レベル検出部と、該振幅レベ
ル及び各分割チャネル毎に定められた基準レベルの大小
を比較して有音又は無音を判定し有音時には分割チャネ
ル信号の符号化情報を及び無音時には分割チャネル信号
の符号化を行わないことにより圧縮するための無音判定
信号を符号化器にそれぞれ出力するレベル判定部とを有
する分析側無音検出器を具えることを特徴とする音声分
析合成装置。 - 【請求項3】分析側からの符号化された分割チャネル信
号を有音時にのみ復号化するための復号化信号を及び無
音時には前記復号化器の出力を零レベルにするための無
音判定信号を前記復号化器にそれぞれ出力するための合
成側無音検出器を具えることを特徴とする特許請求の範
囲第2項に記載の音声分析合成装置。 - 【請求項4】前記振幅レベル検出部は、各分割チャネル
信号の振幅レベルの絶対値を出力する絶対値回路と、フ
レーム長内での振幅レベルの絶対値の最大値を最大振幅
レベルとして出力する最大値検出回路とを具えることを
特徴とする特許請求の範囲第2項又は第3項に記載の音
声分析合成装置。 - 【請求項5】前記レベル判定部は、前記最大振幅レベル
に対応しかつ前記符号化器での量子化ステップ幅を定め
るための量子化レベルに変換した後この量子化レベルを
符号化する量子化レベル変換符号化回路と、該量子化レ
ベルが前記基準レベルを越えていない無音時の量子化レ
ベルの符号化結果を無音判定信号として出力し及び越え
ている有音時の量子化レベルの符号化結果を出力する分
析側無音判定回路と、該符号化結果を復号した後前記量
子化ステップ幅に変換して前記符号化器に出力する分析
側量子化ステップ幅復号変換回路とを具え、 さらに、分析側から合成側に送られてきた前記符号化結
果が前記基準レベルを越えていない無音時の符号化結果
を無音判定信号として前記復号化器へ出力し及び越えて
いる有音時の符号化結果を出力する合成側無音判定回路
と、該有音時の符号化結果を前記分析側から合成側へ送
られてきた符号化された分割チャネル信号の復号化のた
めの量子化ステップ幅に変換して前記復号化器に出力す
る合成側量子化ステップ幅変換回路とを具えることを特
徴とする特許請求の範囲第4項に記載の音声分析合成装
置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61289708A JPH0636158B2 (ja) | 1986-12-04 | 1986-12-04 | 音声分析合成方法及び装置 |
| US07/453,149 US5054073A (en) | 1986-12-04 | 1989-12-19 | Voice analysis and synthesis dependent upon a silence decision |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61289708A JPH0636158B2 (ja) | 1986-12-04 | 1986-12-04 | 音声分析合成方法及び装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63142399A JPS63142399A (ja) | 1988-06-14 |
| JPH0636158B2 true JPH0636158B2 (ja) | 1994-05-11 |
Family
ID=17746722
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61289708A Expired - Lifetime JPH0636158B2 (ja) | 1986-12-04 | 1986-12-04 | 音声分析合成方法及び装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5054073A (ja) |
| JP (1) | JPH0636158B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1996013826A1 (en) * | 1994-10-28 | 1996-05-09 | Nippon Steel Corporation | Coded data decoding device and video/audio multiplexed data decoding device using it |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5313531A (en) * | 1990-11-05 | 1994-05-17 | International Business Machines Corporation | Method and apparatus for speech analysis and speech recognition |
| JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
| US5313552A (en) * | 1991-03-27 | 1994-05-17 | Unisys Corporation | Apparatus for quantizing an input group of data samples into one of N quantized groups of data via a process on less than N/2 reference groups of data samples |
| JP2518765B2 (ja) * | 1991-05-31 | 1996-07-31 | 国際電気株式会社 | 音声符号化通信方式及びその装置 |
| US5694519A (en) * | 1992-02-18 | 1997-12-02 | Lucent Technologies, Inc. | Tunable post-filter for tandem coders |
| JP3185415B2 (ja) * | 1992-11-26 | 2001-07-09 | ソニー株式会社 | 圧縮データ再生記録装置及び方法 |
| JP3186315B2 (ja) * | 1993-02-27 | 2001-07-11 | ソニー株式会社 | 信号圧縮装置、信号伸張装置、信号送信装置、信号受信装置及び信号送受信装置 |
| US5535299A (en) * | 1993-11-02 | 1996-07-09 | Pacific Communication Sciences, Inc. | Adaptive error control for ADPCM speech coders |
| US5754127A (en) * | 1994-02-05 | 1998-05-19 | Sony Corporation | Information encoding method and apparatus, and information decoding method and apparatus |
| JPH08101698A (ja) * | 1994-09-30 | 1996-04-16 | Shogo Nakamura | 音響信号圧縮伸張装置及び音響信号圧縮伸張方法 |
| US5706392A (en) * | 1995-06-01 | 1998-01-06 | Rutgers, The State University Of New Jersey | Perceptual speech coder and method |
| US6138036A (en) * | 1997-03-13 | 2000-10-24 | Oki Telecom, Inc. | Wireless telephone with voice data interface mode |
| JP3119204B2 (ja) * | 1997-06-27 | 2000-12-18 | 日本電気株式会社 | 音声符号化装置 |
| US6240299B1 (en) * | 1998-02-20 | 2001-05-29 | Conexant Systems, Inc. | Cellular radiotelephone having answering machine/voice memo capability with parameter-based speech compression and decompression |
| JP3670217B2 (ja) * | 2000-09-06 | 2005-07-13 | 国立大学法人名古屋大学 | 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法 |
| CN100380441C (zh) * | 2001-05-11 | 2008-04-09 | 皇家菲利浦电子有限公司 | 检测给定类型节目的方法和设备、无声检测器和接收器 |
| US7668715B1 (en) * | 2004-11-30 | 2010-02-23 | Cirrus Logic, Inc. | Methods for selecting an initial quantization step size in audio encoders and systems using the same |
| JP4087400B2 (ja) * | 2005-09-15 | 2008-05-21 | 株式会社東芝 | 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム |
| JP6759927B2 (ja) * | 2016-09-23 | 2020-09-23 | 富士通株式会社 | 発話評価装置、発話評価方法、および発話評価プログラム |
| JP6731362B2 (ja) * | 2017-03-02 | 2020-07-29 | 学校法人東北学院 | 音声のコーディング・デコーディング方法 |
| CN117082291A (zh) * | 2023-07-28 | 2023-11-17 | 中移互联网有限公司 | 通话语音合成方法、装置、电子设备及存储介质 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4280192A (en) * | 1977-01-07 | 1981-07-21 | Moll Edward W | Minimum space digital storage of analog information |
| FR2389277A1 (fr) * | 1977-04-29 | 1978-11-24 | Ibm France | Procede de quantification a allocation dynamique du taux de bits disponible, et dispositif de mise en oeuvre dudit procede |
| US4110560A (en) * | 1977-11-23 | 1978-08-29 | Gte Sylvania Incorporated | Communication apparatus |
| US4374304A (en) * | 1980-09-26 | 1983-02-15 | Bell Telephone Laboratories, Incorporated | Spectrum division/multiplication communication arrangement for speech signals |
| US4376874A (en) * | 1980-12-15 | 1983-03-15 | Sperry Corporation | Real time speech compaction/relay with silence detection |
| US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
| GB8330885D0 (en) * | 1983-11-18 | 1983-12-29 | British Telecomm | Data transmission |
| US4704730A (en) * | 1984-03-12 | 1987-11-03 | Allophonix, Inc. | Multi-state speech encoder and decoder |
-
1986
- 1986-12-04 JP JP61289708A patent/JPH0636158B2/ja not_active Expired - Lifetime
-
1989
- 1989-12-19 US US07/453,149 patent/US5054073A/en not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1996013826A1 (en) * | 1994-10-28 | 1996-05-09 | Nippon Steel Corporation | Coded data decoding device and video/audio multiplexed data decoding device using it |
Also Published As
| Publication number | Publication date |
|---|---|
| US5054073A (en) | 1991-10-01 |
| JPS63142399A (ja) | 1988-06-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0636158B2 (ja) | 音声分析合成方法及び装置 | |
| EP1262956B1 (en) | Signal encoding method and apparatus | |
| US5873059A (en) | Method and apparatus for decoding and changing the pitch of an encoded speech signal | |
| AU2009267529B2 (en) | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing | |
| CA2099655C (en) | Speech encoding | |
| US7529662B2 (en) | LPC-to-MELP transcoder | |
| US6539355B1 (en) | Signal band expanding method and apparatus and signal synthesis method and apparatus | |
| CA2562916C (en) | Coding of audio signals | |
| US7596492B2 (en) | Apparatus and method for concealing highband error in split-band wideband voice codec and decoding | |
| EP0154381B1 (en) | Digital speech coder with baseband residual coding | |
| US6289311B1 (en) | Sound synthesizing method and apparatus, and sound band expanding method and apparatus | |
| US6278387B1 (en) | Audio encoder and decoder utilizing time scaling for variable playback | |
| FI119576B (fi) | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin | |
| US20030195745A1 (en) | LPC-to-MELP transcoder | |
| KR20000047944A (ko) | 수신장치 및 방법과 통신장치 및 방법 | |
| WO2001065542A1 (en) | Voice encoding/decoding device and method therefor | |
| JP2581696B2 (ja) | 音声分析合成器 | |
| JP3649854B2 (ja) | 音声符号化装置 | |
| JP3594829B2 (ja) | Mpegオーディオの復号化方法 | |
| JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
| JPH11145846A (ja) | 信号圧縮伸張装置及び方法 | |
| JP2973966B2 (ja) | 音声通信装置 | |
| KR100210444B1 (ko) | 대역 분할을 통한 음성신호 부호화 방법 | |
| EP1164577A2 (en) | Method and apparatus for reproducing speech signals |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |