JPH0636158B2

JPH0636158B2 - 音声分析合成方法及び装置

Info

Publication number: JPH0636158B2
Application number: JP61289708A
Authority: JP
Inventors: 隆矢頭
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1986-12-04
Filing date: 1986-12-04
Publication date: 1994-05-11
Anticipated expiration: 2009-05-11
Also published as: US5054073A; JPS63142399A

Description

【発明の詳細な説明】（産業上の利用分野）この発明は音声分析合成方法及びその装置、特に音声の
符号化に関するものである。

（従来の技術）従来、この種の技術としてザ・ベル・システム・テクニ
カル・ジャーナル（The Bell System Technical Journa
l）、55［８］（1976−10）（米）P.1069-1085に記載さ
れる帯域分割型音声分析合成方式（Sub−Band Coding方
式とも呼ばれ、以降ＳＢＣ方式と略す）が知られてい
る。このＳＢＣ方式は第４図に示されるように音声信号
の周波数帯域を複数（通常４〜８）の帯域（図中、
、及びで示す。）に分割し、各分割チャネルの出
力を別々に符号化、復号化する方式である。

第５図にこのＳＢＣ方式の基本的な回路構成を示す。ま
た、第６図（Ａ）〜（Ｅ）は第５図の回路の動作を説明
するための図である。以下、第５図、第６図（Ａ）〜
（Ｅ）を用いてＳＢＣ方式の動作を説明する。

先ず、分析器の動作は次の通りである。マイク（図示せ
ず）等から入力されたアナログ音声信号は、ローパスフ
ィルタ（図示せず）に入力されて所定のサンプリング周
波数の1/2以上の周波数成分を除去された後、Ａ／Ｄ変
換器（図示せず）で所定のサンプリング周波数において
アナログ信号からディジタル信号Ｓ_（ｎ）に変換され
る。ここでｎはサンプル番号である。このディジタル化
された入力信号Ｓ_（ｎ）はバンドパスフィルタ50に入力
され、第６図（Ａ）に示す如く特定の帯域成分（ここで
は、Ｗ_１ｋ−Ｗ_２ｋ）が抽出される。次にこのバンドパ
スフィルタ50の出力信号は乗算器51において第６図
（Ｂ）に示したＷ_１ｋとなる周波数をもったコサイン波
（ｃｏｓ波）と乗算されることによりｃｏｓ変調が施さ
れ、第６図（Ｃ）の如く（０−Ｗ_ｋ）の基底帯域にシフ
トされる。このとき生じる２Ｗ_１ｋ以上の不要な周波数
成分Ｒ_ｋ（ω）（例えば、第６図（Ｃ）で点線で示した
成分）をローパスフィルタ52によって除去する。このよ
うにして得られる信号ｒ_ｋ（ｎ）はＷ_ｋ以下の周波数成
分しか必要としないものであるから、２Ｗ_ｋのサンプリ
ング周波数でサンプリングすれば必要かつ十分な情報が
保たれる。このためにダウンサンプリング部53によって
必要以上に高いサンプリング周波数を２Ｗ_ｋに落として
ダウンサンプリングを行い、このダウンサンプリングし
た信号を符号器54で符号化し、符号化された信号を合成
器へ伝送する。

次に、合成器において分析器と全く逆の処理を行うこと
により、分析器から送られてきた信号を復号する。すな
わち、符号化された信号を復号器55によって復号した
後、補間部56によって分析器でダウンサンプリングされ
た信号を元のサンプリング周波数に戻すためにアップサ
ンプリングを行う。この補間部56からの出力信号は、乗
算器57において第６図（Ｄ）に示したＷ_１ｋとなる周波
数をもったｃｏｓ波と乗算されることにより復調され、
第６図（Ｅ）に示した如く基底帯域（０−Ｗ_ｋ）から再
びもとの周波数帯域（Ｗ_１ｋ−Ｗ_２ｋ）に戻された後、
バンドパスフィルタ58によって信号中の（Ｗ_１ｋ−Ｗ
_２ｋ）以外の帯域の成分を除去する。

このようにして、合成器から信号Ｓ_ｋ（ｎ）が出力され
る。

上記一連の処理を各分割帯域（チャネル）毎にそれぞれ
行い、最後に全チャネルの出力を加算して出力音声信号
を得る。

以上がＳＢＣ方式の基本的な動作内容であるが、第５図
の回路構成を直接装置化することはあまりなく、回路量
を削減するためにバンドパスフィルタ50、58を用いない
第７図のような構成のＳＢＣ方式も提案されている。

次に、この第７図の回路の動作を説明する。

先ず、分析器において、ディジタル化された入力信号Ｓ
_（ｎ）は複素信号ｅ^ｊω_ｋ ^ｎ［ここでω_ｋ＝（Ｗ_１ｋ＋
Ｗ_２ｋ）／２］にて複素変調される。この複素変調は、
乗算器61aによるｃｏｓ変調（変調波はｃｏｓω
_ｋｎ）、乗算器61bによるサイン（ｓｉｎ）変調（変調
波はｓｉｎω_ｋｎ）により行われる。乗算器61a、61bの
出力は帯域幅（０−ω_ｋ／２）のローパスフィルタ62
a、62bにそれぞれ入力されフィルタリングされる。この
ようにして、ローパスフィルタ62aからは複素信号ａ
_ｋ（ｎ）＋ｊｂ_ｋ（ｎ）の実部ａ_ｋ（ｎ）が、ローパス
フィルタ62bからは複素信号ａ_ｋ（ｎ）＋ｊｂ_ｋ（ｎ）
の虚部ｂ_ｋ（ｎ）がそれぞれ出力される。各信号ａ
_ｋ（ｎ）、ｂ_ｋ（ｎ）はそれぞれダウンサンプリング部
63a、63bによって周波数Ｗ_ｋにダウンサンプリングされ
た後、符号器64によって符号化され、合成器側へ伝送さ
れる。合成器においては符号化された信号は復号器65に
よって復号された後、補間器66a、66bによって元のサン
プリング周波数に戻され、次に帯域幅（０−ω_ｋ／２）
のローパスフィルタ67a、67bを通してフィルタリングさ
れた後、乗算器68aによるｃｏｓ波との乗算、乗算器68b
によるｓｉｎ波との乗算によって復調され、さらに加算
器69で信号のｃｏｓ成分とｓｉｎ成分とが加算され、当
該分割帯域の信号が合成される。

以上がＳＢＣ方式の動作原理であるが、この方式は音声
信号そのものを符号化する方式に比べ以下のような特長
がある。

各チャネルの量子化誤差は白色雑音に近く、周波数スペ
クトル上の全域に広がるが、そのうち各チャネルの帯域
内の雑音だけしか各チャネルには落ちてこないため、量
子化雑音を軽減出来る。また、各チャネルの量子化誤差
はその周波数帯域内の信号のみに関係し、音声のように
低周波成分が大きく、高周波成分が小さい信号において
は周波数の高い帯域のチャネルでの誤差は信号全体から
見れば僅かな誤差にしかならない。さらに、音声信号の
うち高い周波数の成分は雑音成分が主であり、この帯域
での誤差は聴覚上あまり影響しない。

従って、このような性質を考慮して帯域の分割方法や各
チャネルの信号に与える量子化ビット数を設定すること
により、音声信号を直接符号化する方式に比べ、約1/2
程度の情報量で実現出来る。すなわち、８ｋHzでサンプ
リングされたＰＣＭ音声に対し、これを直接、例えばＡ
ＤＰＣＭ符号化した場合、約30Ｋビット／秒程度の情報
量が必要であるが、ＳＢＣでは聴覚上ほぼ同品質の合成
音が16Ｋビット／秒前後の情報量で得ることが出来る。

（発明が解決しようとする問題点）ところで、当然のなりゆきとして高品質の合成音をさら
に少ない情報量で実現したいという要求がある。しかし
ＳＢＣ方式は基本的には波形符号化方式であるから情報
圧縮も10Ｋビット／秒程度が限界で、この領域によると
量子化ビット数の不足から、量子化雑音により合成音ザ
ラツキが目立ったり、或は帯域の不足から音がこもった
り、音韻性がくずれてしまうという問題点があった。

このような問題点の解決を図るため、この出願の発明者
等は種々の研究等を行った。これら研究によると、現在
のところ、音声波形を直接符号化するＡＤＰＣＭ方式や
ＡＰＣＭ方式、或は前述の如く帯域分割した波形を符号
化するＳＢＣ方式など波形符号化方式に属する方式では
無音区間の圧縮は全くではないが、あまり行われていな
い。特にＳＢＣ方式では例がないようである。しかし、
よく知られているように通常の会話音声の中には相当量
の無音区間が含まれており、会話が途切れている区間は
もちろんのこと、連続的に会話が続いている区間におい
ても息つぎや閉鎖区間を伴う破裂音などで全体の20％近
い無音区間が生じる。従って、これらの区間を音声区間
に含めて情報量を同じように与えるのは無駄である。ま
た、ＳＢＣ方式のように帯域分割を行う方式ではチャネ
ル毎に振幅がある部分と、ほとんどないという場合があ
る。すなわち、人間の耳は音声をスペクトル上のピーク
（ホルマント）の位置、大きさなどによって、それぞれ
の音韻を聞き分けており、スペクトルの谷の部分は比較
的音声情報としての重要度は低い。さらに、音声の信号
レベルが小さい音ではこの谷の部分はほとんどノイズレ
ベル以下という場合がままある。実際上このような部分
は無音として取り扱っても音韻性を損なうことはほとん
どない。また、周波数帯域分割を行わない音声分析合成
方式での無音圧縮では、全帯域に対して一律に有音／無
音の判定を下すわけであるから、ノイズのレベルが大き
い場合、有音／無音の判定レベルを大きくすれば音声パ
ワーの小さい摩擦音などの音声区間までも無音と判定さ
れて失われてしまい、逆に、判定レベルを小さくすれば
ノイズのみの区間も有音と判定され情報圧縮の効果が得
られない。

ところで、音声のスペクトルはノイズのスペクトルに比
べ、その音韻性を表わす特徴的な偏りを持っているた
め、音声を複数の帯域に分け、各帯域毎に無音判定を行
えば、帯域全体でみた音声パワーが小さい場合でもパワ
ーの偏った帯域の成分は保存され、それ以外のノイズ成
分だけしか持たない帯域の情報は削除されるため、音韻
性の確保、情報圧縮両方の効果を得ることが出来る。

従って、この出願の第一発明の目的は音声信号のチャネ
ル毎にその振幅レベルから無音区間の有無を判定し符号
化の必要ないチャネルの信号を圧縮する音声分析合成方
法を提供することにある。

さらに、この出願の第二発明の目的は、このような音声
分析合成方法を実施するための装置を提供することにあ
る。

（問題点を解決するための手段）第一発明の目的の達成を図るため、この発明によれば、
一定時間区間（フレーム長）毎に、各分割チャネルの出
力信号の振幅レベルを判定し、前記振幅レベルが各チャネル毎に定められた基準レベル
を越えているチャネルの出力信号のみを符号化すること
を特徴とする。

さらに、第二発明の目的の達成を図るため、この発明の
音声分析合成装置によれば、一定時間区間（フレーム長）毎に各分割チャネル信号の
振幅レベルを検出する振幅レベル検出部と、この振幅レ
ベル及び各分割チャネル毎に定められた基準レベルの大
小を比較して有音又は無音を判定し有音時には分割チャ
ネル信号の符号化情報を及び無音時には分割チャネル信
号の符号化を行わないことにより圧縮するための無音判
定信号を符号化器にそれぞれ出力するレベル判定部とを
有する分析側無音検出器を設けたことを特徴とする。

この第二発明の実施に当っては、分析側からの符号化さ
れた分割チャネル信号を有音時にのみ復号化するための
復号化信号を及び無音時には復号化器の出力を零レベル
にするための無音判定信号を復号化器にそれぞれ出力す
るための合成側無音検出器を設けるのが好適である。

さらに、この第二発明の好適実施例によれば、振幅レベ
ル検出部には、各分割チャネル信号の振幅レベルの絶対
値を出力する絶対値回路と、フレーム長内での振幅レベ
ルの絶対値の最大値を最大振幅レベルとして出力する最
大値検出回路とを設けることが出来る。

さらに、この第二発明の他の実施例によれば、レベル判
定部には、最大振幅レベルに対応しかつ符号化器での量
子化ステップ幅を定めるための量子化レベルに変換した
後この量子化レベルを符号化する量子化レベル変換符号
化回路と、この量子化レベルが基準レベルを越えていな
い無音時の量子化レベルの符号化結果を無音判定信号と
して出力し及び越えている有音時の量子化レベルの符号
化結果を出力する分析側無音判定回路と、この符号化結
果を復号した後量子化ステップ幅に変換して符号化器に
出力する分析側量子化ステップ幅復号変換回路とを具
え、さらに、分析側から合成側に送られてきた符号化結果が
前記基準レベルを越えていない無音時の符号化結果を無
音判定信号として復号化器へ出力し及び越えている有音
時の符号化結果を出力する合成側無音判定回路と、この
有音時の符号化結果を分析側から合成側へ送られてきた
符号化された分割チャネル信号の復号化のための量子化
ステップ幅に変換してこの復号化器に出力する合成側量
子化ステップ幅変換回路とを設けるのが好適である。

尚、上述において、全てのチャネルに対し、同じ判定基
準レベルを設けることは妥当ではなく、それぞれのチャ
ネルの周波数帯域に応じて判定基準レベルすなわち無音
レベルを選定する。

（作用）このように、この出願の第一及び第二発明によれば、音
声がほぼ定常であると見なせる例えば５〜30ｍｓの一定
時間区間を予め定め、このフレーム長毎に、周波数分割
された各チャネルにおける有音／無音の判定を行い、各
チャネルにおいて有音区間と判定された区間のみそのチ
ャネルの出力信号を符号化して伝送する。又無音区間に
おいてはそのチャネルの出力信号は符号化せずに圧縮し
て合成側において「０」レベル信号を復号して出力す
る。このように無音区間において音声情報量の圧縮を行
う。

（実施例）以下、図面を参照して、この発明の実施例につき説明す
る。

第１図はこの発明の実施例を説明するための第７図に示
したＳＢＣ方式の帯域分割型音声合成装置に本発明を適
用した場合の実施例を示すブロック図であり、各チャネ
ル成分の符号化にはＡＰＣＭを用いている。また第１図
は１つのチャネルのみについて記してある。

第１図において、10は入力端子、11a及び11bは乗算器、
12a及び12bはローパスフィルタ（ＬＰＦ）、13a及び13b
はＲ：１のダウンサンプリング部でこれらは分析側の装
置構成部分であって、第７図に示した分析器の構成に対
応する。さらに、合成側の装置構成部分も、第７図の合
成器の構成と対応して構成してあり、16a及び16bは１：
Ｒの補間器、17a及び17bはローパスフィルタ（ＬＰ
Ｆ）、18a及び18bは乗算器、19は加算器及び20は出力端
子である。14a及び14bは例えばＡＰＣＭ符号化器であ
り、15a及び15bは例えばＡＰＣＭ復号化器であるが、こ
の発明の実施例ではこれらＡＰＣＭ符号化器14a及び14
b、ＡＰＣＭ復号化器15a及び15bを後述するように構成
する。

これらの構成は、従来と同様に音声信号の周波数帯域を
複数の帯域に分割し、各分割チャネル信号を別個に符号
化し合成するようになしてある。

この発明においては、分析側において周波数帯域分割さ
れた各チャネル毎に無音区間の検出を行って検出された
無音区間に対してはＡＰＣＭ符号化器14a及び14bにおけ
る符号化器114a及び114bで符号化を行わないようにする
ためすなわち圧縮するための無音検出器21a及び21bを設
ける。一方、合成側においては、ＡＰＣＭ復号化器15a
及び15bにおける復号化器115a及び115bの復号信号の対
応する無音区間での信号レベルを「０」としてこれら信
号を生成するための無音検出器22a及び22bを設けた構成
とする。そして、この実施例では、これら無音検出器21
a、21b及び22a、22bはそれぞれのＡＰＣＭ符号化器14
a、14b及びＡＰＣＭ復号化器15a、15bにおいてＡＰＣＭ
処理を行う機能を果たしている構成となっている。さら
に、110a、110bは後述するマルチプレクサ及び111a、11
1bは後述するデマルチプレクサである。

第２図（Ａ）は、この発明の説明に供する装置の要部を
示すブロック図であり、第１図において構成成分11a〜1
8aまでのｃｏｓ成分に対するブロックと、構成成分11b
〜18bまでのｓｉｎ成分に対するブロックとでは変調波
がｃｏｓとｓｉｎで異なるだけで動作は全く同じである
ため、ここではｃｏｓ成分に対する側の要部の構成を示
す。

以下、第１図及び第２図（Ａ）を参照してこの発明の装
置の一実施例の動作について説明する。

先ず、入力端子10よりディジタル化された音声信号が入
力されると、その信号に対し、乗算器11aにおいてチャ
ネルの中心周波数と同じ周波数を持ったｃｏｓ波形（ｃ
ｏｓω_ｋｔ）を乗じ振幅変調を行う。但し、ｋはｋ番目
のチャネルを表わしている。ｃｏｓ変調された音声信号
はω_ｋの1/2の帯域を持ったローパスフィルタ12aに通さ
れ、このチャネルｃｏｓ成分の出力ａ_ｋ（ｎ）が抽出さ
れる。次にローパスフィルタ13aの出力ａ_ｋ（ｎ）は、
ダウンサンプリング部13aにおいて（チャネルの帯域
幅）／（元の信号のサンプリング周波数）のサンプルに
ダウンサンプリング（Ｒ：１）され、その結果ａ_ｋ（Ｓ
Ｒ）をＡＰＣＭ符号化器14aの符号化器114aによって符
号化して伝送する。

符号化方式としてここでは、先に述べたようにＡＰＣＭ
を用いるが、この実施例ではある区間毎に量子化ステッ
プ幅を定め、その区間のデータに対しては現在定めた量
子化ステップ幅を用いて量子化を行うセグメンタルＡＰ
ＣＭ（ＳＡＰＣＭ）を用いている。

さらに、この発明の主旨である無音圧縮もこのＳＡＰＣ
Ｍ符号化の過程で行っている。以下、符号化の動作につ
いて説明する。

第２図（Ａ）は第１図におけるＡＰＣＭ符号化器14a、
ＡＰＣＭ復号化器15aでの所要の処理を行わせるため、
この発明によって設けた無音検出器21a及び22aのブロッ
ク構成を主として示したものである。

この実施例においては、分析側無音検出器21aを振幅レ
ベル検出部23aと、レベル判定部24aとを以って構成す
る。この振幅レベル検出部23aでは一定時間区間すなわ
ちフレーム長毎に各分割チャネル信号である出力信号ａ
_ｋ（ＳＲ）の振幅レベルを検出する。一方、レベル判定
部24aでは、この検出された振幅レベルと、各チャネル
毎に定められた基準レベルとの大小の比較を行って有音
又は無音の判定を行う。振幅レベルが基準レベルを越え
ている有音時には分割チャネル出力のみを符号化する符
号化情報を符号化器114aに出力する。一方、振幅レベル
が基準レベルを越えていない無音区間では符号化を行わ
ないことにより圧縮するための無音判定信号を符号化器
114aに出力する。

ところで、通常、ダウンサンプリング後の出力ａ_ｋ（Ｓ
Ｒ）を符号化するに際し、フレーム内での量子化ステッ
プ幅△Ｑ_ｋ（ｉ）（但し、ｉはフレーム番号）を求める
必要がある。

従って、ここでは、好適実施例として、この量子化ステ
ップ幅△Ｑ_ｋ（ｉ）を求める過程を利用して前述した無
音判定信号及び符号化情報を形成する場合の分析側無音
検出器21aにつき説明する。この場合、量子化ステップ
幅（以下、単にステップ幅と称する。）△Ｑ_ｋ（ｉ）は
フレーム内の信号ａ_ｋ（ＳＲ）の最大値が量子化のダイ
ナミックレンジに等しくなるように決める。

先ず、この実施例の振幅レベル検出部23aでは、各分割
チャネル信号ａ_ｋ（ＳＲ）の振幅レベルの絶対値を絶対
値回路25で算出し、さらにフレーム内でのその最大値ａ
_ｍａｘを最大振幅レベルとして最大値検出回路26で求め
る。この最大値ａ_ｍａｘをレベル判定部24aに送る。

当然のことながら符号化で用いたステップ幅△Ｑ
_ｋ（ｉ）は復号化器115aでも用いるため、ステップ幅△
Ｑ_ｋ（ｉ）を決定する量子化レベル△Ｑ′_ｋ（ｉ）を合
成側に送る必要がある。従って、求まった最大値ａ
_ｍａｘを、ここでは量子化レベル変換符号化回路27にお
いて対数圧伸してビット数を削減し、合成側へ送出す
る。この最大値ａ_ｍａｘの符号化すなわち量子化レベル
△Ｑ′_ｋ（ｉ）への変換はテーブルを参照することによ
って行う。このため、この実施例では量子化レベル変換
符号化回路27には△Ｑ′_ｋ（ｉ）符号化部28及びテーブ
ルＲＯＭ29を設ける。

テーブルＲＯＭ29には第３図（Ａ）の如く出力信号ａ_ｋ
（ＳＲ）の全ダイナミックレンジに対して対数的に割り
ふった最大値量子化レベルが昇順に格納してある。この
割りふりはチャネル及び最大値によって異なるが、この
場合、例えば（Ｍ＋１）（但し、Ｍは正の整数）段階に
割りふる。この０からＭ段までを第３図（Ａ）の左枠外
に記し、これに対応する量子化レベルを（量子化レベ
ル）。・・・（量子化レベル）_ｍの如く示してある。

△Ｑ′_ｋ（ｉ）符号化部28ではこれらの値と現在求まっ
た最大値ａ_ｍａｘと逐次比較し、（量子化レベル）
_ｊ−１＜ａ_ｍａｘ≦（量子化レベル）_ｊのときの（量子
化レベル）_ｊを量子化結果とし、これを指し示す値ｊを
符号化結果△ｑ_ｋ（ｉ）として出力する。このときテー
ブルＲＯＭ29の（量子化レベル）_ｏには、無音閾値が格
納されており、△Ｑ′_ｋ（ｉ）符号化部28において
「０」が出力された場合、このフレームを無音とみな
す。

従って、レベル判定部24aに設けた分析側無音判定回路3
0では△Ｑ′_ｋ（ｉ）符号化部28からの量子化レベル△
Ｑ′_ｋ（ｉ）が一定の基準レベルを越えているか否か、
すなわちこの実施例では符号化結果△ｑ_ｋ（ｉ）である
値ｊが「０」か否かを判定し、「０」であるならば分析
側無音判定回路30から１ビットの無音判定信号を符号化
器114aに送り、この符号化器114aにおいて符号化データ
を生成しないことによって、情報圧縮を行う。この無音
情報に基づく圧縮は任意好適な方式で行えばよい。この
実施例では、ｉフレームの出力信号が無音フレームと判
定されて符号化結果△ｑ_ｋ（ｉ）であるｊ＝「０」の無
音判定信号が符号化器114aに供給されるとすると、符号
化器114aの前段に設けたバッファ回路37から、この符号
化器114aに順次に送られてくる・・・（ｉ−１）フレー
ム、ｉフレーム、（ｉ＋１）フレームといった各フレー
ムの信号成分のうちｉフレームの信号成分の符号化を行
わず、その結果・・・（ｉ−１）フレーム、（ｉ＋１）
フレーム・・・の時間順次で合成側に信号が符号化器11
4aから出力される。△Ｑ′_ｋ（ｉ）符号化部28からの量
子化レベル△Ｑ′_ｋ（ｉ）が一定の基準レベルを越えて
いる場合すなわち符号化結果△ｑ_ｋ（ｉ）を表わす値ｊ
が「０」でない場合には、この符号化結果△ｑ_ｋ（ｉ）
すなわち値ｊを分析側量子化ステップ幅復号変換回路31
に供給してそこで量子化ステップ幅△Ｑ_ｋ（ｉ）に変換
する。この分析側量子化ステップ幅復号変換回路31には
△Ｑ_ｋ（ｉ）復号化部32及びテーブルＲＯＭ33とを設け
てある。△Ｑ_ｋ（ｉ）復号化部32においては送られてき
た符号化結果△ｑ_ｋ（ｉ）（値ｊ）に対応する量子化ス
テップ幅△Ｑ_ｋ（ｉ）を復号し、符号化器114aに送り当
該フレーム区間のａ_ｋ（ＳＲ）の量子化を行う。

この復号に当り、テーブルＲＯＭ33には最大値ａ_ｍａｘ
の量子化レベル△Ｑ′_ｋ（ｉ）の符号化結果△ｑ
_ｋ（ｉ）を表わす値ｊ（＝１〜Ｍ）に応じた量子化ステ
ップ幅△Ｑ_ｋ（ｉ）が△Ｑ_ｊとして格納されており、△
Ｑ_ｋ（ｉ）復号化部32ではこのテーブルＲＯＭ33を参照
することによりこれらステップ幅△Ｑ_ｊを生成して符号
化器114aに供給する。第３図（Ｂ）にこのテーブルＲＯ
Ｍ33の内容の一例を示してある。これら値ｊ（＝１〜
Ｍ）を左枠外に記し、これに対応する量子化ステップ幅
△Ｑ_ｋ（ｉ）のｊに対応するステップ幅△Ｑ_ｊ（ｊ＝１
〜Ｍ）を順次に示してある。

尚、この場合、△Ｑ_ｊは、符号化器114aでの量子化ビッ
ト数をｐとすると［（量子化レベル）_ｊ／２^ｐ−１］の
量をとり得る。

このように、分析側で分割チャネル信号毎に無音時か有
音時かを判定し符号化器114aにおいて有音時のみの分割
チャネル信号の符号化を行い及び無音時の分割チャネル
信号の符号化を行わないことにより圧縮して合成側に送
出する。

第２図（Ｂ）は有音時分割チャネル信号ａ_ｋ（ＳＲ）を
符号化器114aで符号化して得られた符号化結果Ａ_ｋ（Ｓ
Ｒ）と、量子化レベル△Ｑ′_ｋ（ｉ）の符号化結果△ｑ
_ｋ（ｉ）とをマルチプレクサ110aで信号配列して送出さ
れるフレームデータの状態を説明するための説明図であ
り、第２図（Ｃ）は無音時における同様なフレームデー
タの状態を説明するための説明図であり、さらに、第２
図（Ｄ）は（ｉ＋１）フレームが無音ｉフレーム及び
（ｉ＋２）フレームが有音であった場合のマルチプレク
サ110aから送出されるフレームデータの状態の説明図で
ある。

第２図（Ｂ）からも理解出来るように、ｉフレームが有
音時のフレームデータは、フレーム長をＬ（正の整数）
個のダウンサンプルとすると、先頭に量子化レベルの符
号化結果△ｑ_ｋ（ｉ）があり、これに続いてＬ個の分割
チャネル信号の符号化結果Ａ_ｋ（ｎ′）、Ａ_ｋ（ｎ′＋
１）、・・・Ａ_ｋ（ｎ′＋Ｌ−１）（但し、ｎ′＝Ｓ
Ｒ）が続いている。

ｉフレームが無音であると、その場合には符号化器110a
からの分割チャネル信号の符号化結果Ａ_ｋ（ｉ）は生じ
ていないので、第２図（Ｃ）に示すようにフレームデー
タは量子化レベルの符号化結果△ｑ_ｋ（ｉ）のみとな
る。

さらに、ｉフレームが有音（ｉ＋１）フレームが無音、
（ｉ＋２）フレームが有音であると、第２図（Ｄ）に示
すようにｉフレームのフレームデータは量子化レベルの
符号化結果△ｑ_ｋ（ｉ）が先頭で続いてｉフレームの分
割チャネル信号のＬ個の符号化結果Ａ_ｋ（ｎ′）、Ａ_ｋ
（ｎ′＋１）、・・・、Ａ_ｋ（ｎ′＋Ｌ−１）があり、
これに続いて（ｉ＋１）フレームの量子化レベルの符号
化結果△ｑ_ｋ（ｉ＋１）が続き、さらにこれに続いて
（ｉ＋２）フレームの量子化レベルの符号化結果△ｑ_ｋ
（ｉ＋２）及びその分割チャネル信号のＬ個の符号化結
果Ａ_ｋ（ｎ′）、・・・、Ａ_ｋ（ｎ′＋Ｌ−１）が続い
たデータとなる。

一方、合成側では分析側より送られてくるフレームデー
タをデマルチプレクサ111aにおいて量子化レベルの符号
化結果△ｑ_ｋ（ｉ）と、分割チャネル信号の符号化結果
Ａ_ｋ（ＳＲ）とに分け量子化レベルの符号化結果△ｑ_ｋ
（ｉ）を合成側無音検出器22aで受け取る。この実施例
ではこの無音検出器22aを合成側無音判定回路34及び合
成側量子ステップ幅復号変換回路35を以って構成する。
この合成側無音判定回路34においては、分析側無音判定
回路30と同様に受信した符号化結果△ｑ_ｋ（ｉ）に対応
する量子化レベル△Ｑ′_ｋ（ｉ）が基準レベルを越えて
いない場合すなわちこの実施例では例えばｊ＝「０」で
あるし判定した場合には、無音判定信号を復号化器15a
に送出し、復号化器115aにおいて対応するフレーム区間
分の「０」レベルの出力を発生する。送られてきた符号
化結果△ｑ_ｋ（ｉ）に対応する量子化レベル△Ｑ′
_ｋ（ｉ）が「０」でない場合には分析側同様△Ｑ
_ｋ（ｉ）復号化器36においてテーブルＲＯＭ37を参照し
て復号化信号としての量子化ステップ幅△Ｑ_ｊを復号
し、これを復号化器115aに供給し、そこでこの量子化ス
テップ幅△Ｑ_ｊを用いて分析側で量子化された符号化結
果Ａ_ｋ（ＳＲ）を復号して分割チャネル信号ａ_ｋ′（Ｓ
Ｒ）を得る。この合成側量子化ステップ幅復号変換回路
35は前述した分析側量子化ステップ幅復号変換回路31と
同様に作用する。

次に、第１図に戻って、復号された分割チャネル信号
ａ′_ｋ（ＳＲ）は、補間器16aによって補間されて元の
サンプリング周期に戻され、ローパスフィルタ17aを通
り、さらに、乗算器18aにおいてｃｏｓω_ｋｎを乗ぜら
れて再び元の周波数帯域に復元される。

以上の処理を他のチャネルも同様にして行い、最後に全
チャネルの出力結果を加算し、合成結果として出力す
る。

この発明は上述した実施例にのみ限定されるものではな
く、多くの変形又は変更を行うことが出来る。

例えば、上述した実施例ではセグメントＡＰＣＭ方式に
つき説明したが、この出願に係る発明はこれに限定され
るものではなく、帯域分割型の符号化復号化方法及び装
置に広く適用して好適である。

さらに、上述した実施例では合成側無音検出器及び分析
側無音検出器を用いてＡＰＣＭ処理を行っているが、Ａ
ＰＣＭ処理自体は別の回路構成で行ってこれら検出器で
無音を検出させるのみであっても良い。

さらに、上述した実施例では、無音区間の検出を最大振
幅レベルを用いて行っているが、平均振幅レベルを用い
て行うことも出来る。又、上述した実施例では量子化ス
テップ幅の導出過程を利用しているため、レベル判定部
24aを量子化レベル変換符号化回路27、分析側無音判定
回路30及び分析側量子化ステップ幅復号変換回路を以っ
て構成しているが、このレベル判定部24aの構成自体他
の任意好適な構成とすることが出来る。又このような量
子化ステップ幅の導出過程を利用しない構成で無音区間
の符号化を行わずに無音区間のみ符号化を行って圧縮す
る場合には、レベル判定部24aを振幅レベルと基準レベ
ルとの比較を行ってその大小に応じた制御信号を符号化
器114aに送出する分析側無音判定回路とすると共に、合
成側無音判定回路も対応した構成とすればよい。

（発明の効果）以上述べたように、この発明によれば本来無音である区
間はもちろんのこと、有音区間においても、ほとんど出
力のないチャネルの成分をデータから除去しているた
め、少ない情報量で合成音が生成出来る。また、各チャ
ネルで無音判定を行っているため、不要なノイズ成分が
削減され、結果的に高品質な合成音を得ることが出来
る。

【図面の簡単な説明】

第１図はこの発明の説明に供する、ＳＢＣ方式の音声分
析合成装置の実施例を示すブロック図、第２図（Ａ）は第１図に示した装置の要部を示すブロッ
ク図、第２図（Ｂ）〜（Ｄ）は分析側から合成側へ送られるフ
レームデータの状態説明図、第３図（Ａ）及び（Ｂ）はこの発明に使用するテーブル
ＲＯＭの内容を説明するための図、第４図はＳＢＣ方式の説明図、第５図は従来のＳＢＣ方式音声分析合成器の構成図、第６図は第５図の装置の動作を説明するための図、第７図は他の従来のＳＢＣ方式音声分析合成器の構成図
である。 10…入力端子、11a、11b…乗算器 12a、12b…ローパスフィルタ（ＬＰＦ） 13a、13b…（Ｒ：１の）ダウンサンプリング部 14a、14b…ＡＰＣＭ符号化器 15a、15b…ＡＰＣＭ復号化器 16a、16b…（１：Ｒの）補間器 17a、17b…ローパスフィルタ（ＬＰＦ） 18a、18b…乗算器、19…加算器 20…出力端子、21a〜22b…無音検出器 23a…振幅レベル検出部 24a…レベル判定部 25…絶対値回路、26…最大値検出回路 27…量子化レベル変換符号化回路 28…△Ｑ′_ｋ（ｉ）符号化部 29、33、37…テーブルＲＯＭ 30…分析側無音判定回路 31…分析側量子化ステップ幅復号変換回路 32…△Ｑ_ｋ（ｉ）復号化部 34…合成側無音判定回路 35…合成側量子化ステップ幅復号変換回路 36…△Ｑ_ｋ（ｉ）復号化部 37…バッファ回路。

Claims

【特許請求の範囲】

【請求項１】音声信号の周波数帯域を複数の帯域に分割
し、各分割チャネル信号を個別に符号化して合成する音
声分析合成方法において、一定時間区間（フレーム長）毎の各分割チャネル信号の
振幅レベルを判定し、前記振幅レベルが各分割チャネル毎に定められた基準レ
ベルを越えている分割チャネル信号のみを符号化することを特徴とする音声分析合成方法。
【請求項２】音声信号の周波数帯域を複数の帯域に分割
して得た各分割チャネル信号を個別に符号化して出力す
る符号化器と、符号化された分割チャネル信号を受信し
て合成する復号化器とを含む帯域分割型の音声分析合成
装置において、一定時間区間（フレーム長）毎に各分割チャネル信号の
振幅レベルを検出する振幅レベル検出部と、該振幅レベ
ル及び各分割チャネル毎に定められた基準レベルの大小
を比較して有音又は無音を判定し有音時には分割チャネ
ル信号の符号化情報を及び無音時には分割チャネル信号
の符号化を行わないことにより圧縮するための無音判定
信号を符号化器にそれぞれ出力するレベル判定部とを有
する分析側無音検出器を具えることを特徴とする音声分
析合成装置。
【請求項３】分析側からの符号化された分割チャネル信
号を有音時にのみ復号化するための復号化信号を及び無
音時には前記復号化器の出力を零レベルにするための無
音判定信号を前記復号化器にそれぞれ出力するための合
成側無音検出器を具えることを特徴とする特許請求の範
囲第２項に記載の音声分析合成装置。
【請求項４】前記振幅レベル検出部は、各分割チャネル
信号の振幅レベルの絶対値を出力する絶対値回路と、フ
レーム長内での振幅レベルの絶対値の最大値を最大振幅
レベルとして出力する最大値検出回路とを具えることを
特徴とする特許請求の範囲第２項又は第３項に記載の音
声分析合成装置。
【請求項５】前記レベル判定部は、前記最大振幅レベル
に対応しかつ前記符号化器での量子化ステップ幅を定め
るための量子化レベルに変換した後この量子化レベルを
符号化する量子化レベル変換符号化回路と、該量子化レ
ベルが前記基準レベルを越えていない無音時の量子化レ
ベルの符号化結果を無音判定信号として出力し及び越え
ている有音時の量子化レベルの符号化結果を出力する分
析側無音判定回路と、該符号化結果を復号した後前記量
子化ステップ幅に変換して前記符号化器に出力する分析
側量子化ステップ幅復号変換回路とを具え、さらに、分析側から合成側に送られてきた前記符号化結
果が前記基準レベルを越えていない無音時の符号化結果
を無音判定信号として前記復号化器へ出力し及び越えて
いる有音時の符号化結果を出力する合成側無音判定回路
と、該有音時の符号化結果を前記分析側から合成側へ送
られてきた符号化された分割チャネル信号の復号化のた
めの量子化ステップ幅に変換して前記復号化器に出力す
る合成側量子化ステップ幅変換回路とを具えることを特
徴とする特許請求の範囲第４項に記載の音声分析合成装
置。