JP6904209B2

JP6904209B2 - オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム

Info

Publication number: JP6904209B2
Application number: JP2017199673A
Authority: JP
Inventors: 鈴木　政直; 政直鈴木; 晃釜野; 洋平岸; 美由紀白川
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-07-28
Filing date: 2017-10-13
Publication date: 2021-07-14
Anticipated expiration: 2037-10-13
Also published as: JP2019028419A

Description

本発明は、オーディオ符号化装置等に関する。

近年、テレビ放送、ラジオ放送、インターネットラジオ、音楽配信等にＳＢＲ（Spectral Band Replication）が用いられている。ＳＢＲは、音声・音楽などの音信号を圧縮・伸長する符号化技術である。

ＳＢＲに基づく符号化を行う従来の符号化装置と、従来の復号装置について説明する。

図３５は、従来の符号化装置の一例を示す図である。図３５に示すように、従来の符号化装置１０は、低域信号抽出部１１、低域符号化部１２、高域情報抽出部１３、高域符号化部１４、多重化部１５を有する。

低域信号抽出部１１は、外部装置から音信号を取得し、音信号の低域信号を抽出する処理部である。低域信号抽出部１１は、低域信号を、低域符号化部１２に出力する。

図３６は、音信号の周波数スペクトルを示す図である。図３６の横軸は、周波数に対応する軸であり、縦軸は、音信号の電力（値）に対応する軸である。たとえば、所定の周波数未満の周波数帯域を「低域」とし、所定の周波数以上の周波数帯域を「高域」とする。低域の音信号を「低域信号」とし、高域の音信号を「高域信号」とする。図３６に示す例では、帯域５ａが低域となり、帯域５ｂが高域となる。

低域符号化部１２は、低域信号を符号化することで、「低域符号」を生成する処理部である。たとえば、低域符号化部１２は、ＡＡＣ（Advanced Audio Coding）に基づいて、符号化を行う。低域符号化部１２は、低域符号を、多重化部１５に出力する。

高域情報抽出部１３は、外部装置から音信号を取得し、音信号に基づいて高域情報を抽出する処理部である。高域情報抽出部１３は、高域情報を高域符号化部１４に出力する。

高域情報には、包絡電力、トーン周波数、周波数分解能が含まれる。包絡電力は、音信号の周波数スペクトルの高域について、包絡線を示すものであり、たとえば、図３６の包絡電力６ａに対応する。

トーン周波数は、トーンの存在する周波数を示す。たとえば、トーンは、電力の値が突出して大きい電力である。図３６に示す例では、トーン６ｂに示すものとなり、トーン周波数は、線分７に対応する周波数となる。周波数分解能は、周波数の分解能（最小単位）を示すものである。

高域符号化部１４は、高域情報を符号化することで、「高域符号」を生成する処理部である。高域符号化部１４は、高域符号を、多重化部１５に出力する。

多重化部１５は、低域符号と、高域符号とを多重化することで、ストリームを生成する処理部である。多重化部１５は、ストリームを、ネットワークを介して、復号装置に送信する。

図３７は、従来の復号装置の一例を示す図である。図３７に示すように、従来の復号装置２０は、分離部２１、低域復号部２２、高域生成部２３、高域復号部２４、高域整形部２５を有する。

分離部３１は、符号化装置１０からストリームを取得し、取得したストリームを、低域符号と高域符号とに分離する処理部である。分離部２１は、低域符号を、低域復号部２２に出力する。分離部２１は、高域符号を、高域復号部２４に出力する。

低域復号部２２は、低域符号を復号することで、低域信号を抽出する処理部である。低域復号部２２は、低域信号を、高域生成部２３に出力する。

高域生成部２３は、低域信号の波形を、高域側に複製することで、高域信号を生成する処理部である。高域生成部２３は、低域信号と高域信号とを合わせた信号情報を、高域整形部２５に出力する。

高域復号部２４は、高域符号を復号することで、高域情報を抽出する処理部である。高域復号部２４は、高域情報を、高域整形部２５に出力する。上記のように、高域情報には、包絡電力、トーン周波数、周波数分解能が含まれる。

高域整形部２５は、高域情報を基にして、信号情報の高域信号を整形する処理部である。高域整形部２５は、整形した信号情報を、外部装置に出力する。

図３８は、従来の復号装置の処理を説明するための図である。図３８のステップＳ１０〜Ｓ１１に示す周波数スペクトルの横軸は周波数に対応する軸であり、縦軸は電力（値）に対応する軸である。図３８のステップＳ１０について説明する。復号装置２０の高域生成部２３は、低域信号８ａの波形を、高域側に複製することで、高域信号８ｂを生成する。

図３８のステップＳ１１について説明する。復号装置２０の高域整形部２５は、粗い分解能で、包絡電力に合わせて、高域信号８ｂを整形することで、信号８ｃを生成する。

図３８のステップＳ１２について説明する。復号装置２０の高域整形部２５は、信号８ｃに、トーン周波数に対応する周波数位置にトーン８ｄを付加することで、信号情報８ｅを生成する。この信号情報８ｅが復号した音信号となる。

国際公開第２０１４／１９９６３２号特開２０１６−１７３５９７号公報

しかしながら、上述した従来技術では、音信号の音質が劣化するという問題がある。

たとえば、トーンが低域と高域との境界にある場合、高域側の分解能が粗いことにより、復号時に、低域とずれた周波数にトーンが生成されることがある。低域とずれた周波数にトーンが生成されると、隣接した２つのトーンが生成され、うなりが発生し、音質が劣化する。

図３９は、従来技術の問題を説明するための図である。たとえば、入力音の時間波形および周波数スペクトルを、時間波形３０ａ、周波数スペクトル３１ａとする。復号音の時間波形および周波数スペクトルを時間波形３０ｂ、周波数スペクトル３１ｂとする。時間波形３０ａ，３０ｂの横軸は時間に対応する軸であり、縦軸は、電力（値）に対応する軸である。周波数スペクトル３１ａ，３１ｂの横軸は周波数に対応する軸であり、縦軸は電力（値）に対応する軸である。

たとえば、入力音自体にはうなりは発生していないが、低域と高域の境界に１つのトーンが存在している。ここで、図３８で説明したように、復号装置２０が信号情報を生成すると、信号情報には、２つのトーン３２ａ，３２ｂが含まれてしまい、うなりの原因となる。

図４０は、高域のトーンがずれる理由を説明するための図である。ステップＳ２１について説明する。たとえば、低域信号には、ある電力値３５ａと、トーン３６ａが存在し、トーン３６ａが存在する周波数を境界とする。復号装置２０の高域生成部２３は、低域信号を高域側に複製することで、高域信号を生成する。たとえば、高域信号には、電力値３５ａに基づき複製された電力値３５ｂと、トーン３６ａに基づき複製された電力値（トーン）３６ｂが含まれる。

ステップＳ２２について説明する。復号装置２０の高域整形部２５は、高域信号を包絡情報９に基づいて整形する。たとえば、分解能が粗いと、包絡情報９は、トーン３６ａの影響により、境界の値が大きくなり、右端側の値が小さくなるように調整されている。このため、電力値３５ｂが、トーン３６ａと同等の大きさとなる電力値３５ｂ’に整形され、トーン３６ｂが、電力値３６ｂ’に整形される。このうち、トーン３６ａと、電力値３５ｂ’とがうなり成分となり、音質が劣化する。

１つの側面では、本発明は、音信号の音質が劣化することを抑止することができるオーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラムを提供することを目的とする。

第１の案では、オーディオ符号化装置は、判定部と、符号化部と、多重化部とを有する。判定部は、入力信号の低域と高域との境界にトーンが含まれるか否かを判定する。符号化部は、境界にトーンが含まれている場合に、低域、又は、高域の一方のトーンを抑圧し、入力信号の低域を符号化することで、低域符号を生成し、入力信号の高域を符号化することで、高域符号を生成する。多重化部は、低域符号と高域符号を多重化することで、符号化ストリームを生成する。

音信号の音質が劣化することを抑止することができる。

図１は、本実施例１に係るシステムの構成を示す図である。図２は、本実施例１に係るオーディオ符号化装置の構成を示す機能ブロック図である。図３は、本実施例１に係る判定部の構成を示す機能ブロック図である。図４は、ＢＰＦを説明するための図である。図５は、本実施例１に係る低域補正部の構成を示す機能ブロック図である。図６は、動的マスキング閾値を説明するための図である。図７は、本実施例１に係る低域補正部の処理を説明するための図である。図８は、本実施例１に係る高域補正部の構成を示す機能ブロック図である。図９は、本実施例１に係る高域補正部の処理を説明するための図である。図１０は、本実施例１に係る判定部の処理手順を示すフローチャート（１）である。図１１は、本実施例１に係る判定部の処理手順を示すフローチャート（２）である。図１２は、本実施例１に係るオーディオ符号化装置の処理手順を示すフローチャートである。図１３は、本実施例１に係るオーディオ符号化装置の効果を説明するための図である。図１４は、本実施例２に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１５は、本実施例２に係る入力信号補正部の構成を示す機能ブロック図である。図１６Ａは、本実施例３に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１６Ｂは、本実施例３に係る補正制御部の処理を説明するための図である。図１７Ａは、本実施例４に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１７Ｂは、本実施例４に係る補正制御部の処理を説明するための図である。図１８は、本実施例５に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１９は、本実施例５に係る高域補正部の構成を示す機能ブロック図である。図２０は、本実施例５に係る高域補正部の処理を説明するための図である。図２１は、判定部のその他の処理手順を示すフローチャートである。図２２は、オーディオ符号化装置の問題を説明するための図である。図２３は、低域の信号を非相関化したことによる問題を説明するための図である。図２４は、本実施例６に係るシステムの構成を示す図である。図２５は、本実施例６に係るオーディオ符号化装置の構成を示す機能ブロック図である。図２６は、時間周波数信号のデータ構造の一例を示す図である。図２７は、逆フィルタレベルの判定手順を示すフローチャートである。図２８は、本実施例６に係る低域補正部の処理手順を示すフローチャートである。図２９は、符号化ストリームのデータ構造の一例を示す図である。図３０は、本実施例６に係る復号装置の構成を示す機能ブロック図である。図３１は、本実施例６に係るオーディオ符号化装置の処理手順を示すフローチャートである。図３２は、本実施例６に係る復号装置の処理手順を示すフローチャートである。図３３は、オーディオ符号化装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。図３４は、復号装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。図３５は、従来の符号化装置の一例を示す図である。図３６は、音信号の周波数スペクトルを示す図である。図３７は、従来の復号装置の一例を示す図である。図３８は、従来の復号装置の処理を説明するための図である。図３９は、従来技術の問題を説明するための図である。図４０は、高域のトーンがずれる理由を説明するための図である。

以下に、本願の開示するオーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

図１は、本実施例１に係るシステムの構成を示す図である。図１に示すように、このシステムは、オーディオ符号化装置１００と、復号装置２０とを有する。オーディオ符号化装置１００は、ネットワーク５０を介して、復号装置２０に接続される。

オーディオ符号化装置１００は、外部装置から音信号を取得し、音信号を符号化する装置である。たとえば、オーディオ符号化装置１００は、トーンが低域・高域の境界にあることを検出した場合に、低域側のトーンまたは高域側のトーンの一方を抑圧した後、低域符号および高域符号を多重化してストリームを生成する。オーディオ符号化装置１００は、ストリームを復号装置２０に送信する。ストリームは、符号化ストリームに対応する。

復号装置２０は、オーディオ符号化装置１００からストリームを受信し、ストリームを復号する装置である。復号装置２０の説明は、図３７で説明した復号装置２０の説明と同様である。

図２は、本実施例１に係るオーディオ符号化装置の構成を示す機能ブロック図である。図２に示すように、このオーディオ符号化装置１００は、低域信号抽出部１１０、高域情報抽出部１２０、判定部１３０、低域補正部１４０、低域符号化部１５０、高域補正部１６０、高域符号化部１７０、多重化部１８０を有する。たとえば、低域信号抽出部１１０、高域情報抽出部１２０、低域補正部１４０、低域符号化部１５０、高域補正部１６０、高域符号化部１７０は、符号化部に対応する。

低域信号抽出部１１０は、外部装置から音信号を取得し、音信号の低域に含まれる低域信号を抽出する処理部である。低域信号抽出部１１０は、低域信号を、低域補正部１４０に出力する。管理者は、低域の上限周波数を予め設定しておくものとする。

高域情報抽出部１２０は、外部装置から音信号を取得し、音信号の高域から、高域情報を抽出する処理部である。高域情報抽出部１２０は、高域情報を、高域補正部１６０に出力する。高域情報には、包絡電力、トーン周波数、周波数分解能が含まれる。管理者は、高域の下限周波数を予め設定しておくものとする。また、高域の下限周波数は、低域の上限周波数より低い帯域でも良い。

たとえば、高域情報抽出部１２０は、音信号を周波数スペクトルに変換し、周波数スペクトルの高域側の包絡線の形状を包絡電力として抽出する。高域情報抽出部１２０は、周波数スペクトルの高域について、電力が閾値以上となる周波数を、トーン周波数として抽出する。周波数分解能は、予め設定されているものとする。

判定部１３０は、外部装置から音信号を取得し、音信号の低域と高域との境界にトーンが含まれるか否かを判定する処理部である。また、判定部１３０は、境界にトーンが含まれると判定した場合に、低域のトーンを抑圧するのか、高域のトーンを抑圧するのかを判定する。低域と高域との境界は、低域の上限から高域の下限の間の帯域とする。また、低域の上限から高域の下限の間の帯域の上下に幅を持たせても良い。例えば、「境界の帯の下限−ε〜境界の帯域の上限＋ε」としても良い。

図３は、本実施例１に係る判定部の構成を示す機能ブロック図である。図３に示すように、この判定部１３０は、ＢＰＦ（Band Pass Filter）１３１と、トーン検出部１３２と、補正判定部１３３とを有する。

ＢＰＦ１３１は、音信号のうち、低域と高域との境界付近の音信号を通過させるフィルタである。ＢＰＦ１３１を通過した音信号は、トーン検出部１３２に出力される。

図４は、ＢＰＦを説明するための図である。図４において、横軸は周波数に対応する軸であり、縦軸は電力に対応する軸である。低域と高域との境界６０を含むように、幅６０ａのＢＰＦを適用する。幅６０ａは、低域の上限と、高域の下限を基にして、決定されても良い。たとえば、幅６０ａを「低域の上限−α〜高域の下限＋α」としても良い。また、高域の下限周波数≦低域の下限周波数の場合は、幅６０ａを「高域の下限−α〜低域の上限＋α」としても良い。

ここでは一例として、音信号から、境界付近の音信号を抽出する場合に、ＢＰＦ１３１を用いたが、これに限定されるものではない。たとえば、ＦＦＴ（Fast Fourier Transform）、ＭＤＣＴ（Modified Discrete Cosine Transform）、ＱＭＦ（Quadrature Mirror Filter）変換等を用いて、境界付近の音信号を抽出しても良い。

トーン検出部１３２は、境界付近の音信号にトーンが含まれているか否かを判定する処理部である。たとえば、トーン検出部１３２は、境界付近の音信号を基にして、トーン性を示す数値を算出し、トーン性を示す数値が閾値以上である場合に、トーンが含まれていると判定する。トーン検出部１３２に関する以下の説明では、境界付近の音信号を、単に音信号と表記する。トーン検出部１３２は、第１のトーン検出処理または第２のトーン検出処理を実行することで、トーンの有無を検出する。

第１のトーン検出処理の一例について説明する。トーン検出部１３２は、式（１）に基づいて、音信号のパワースペクトルの平坦性の逆数を、トーン性を示す数値Ｔ１として算出する。数値Ｔ１が小さいほど、音信号の周波数スペクトルの波形がより平坦であり、トーンが含まれている可能性が低いと言える。式（１）において、Ｘ（ω）は、周波数ωに対応する音信号の電力を示す。

トーン検出部１３２は、数値Ｔ１が閾値ＴＨ１よりも大きい場合に、音信号にトーンが含まれていると判定する。一方、トーン検出部１３２は、数値Ｔ１が閾値ＴＨ１よりも大きくない場合に、音信号にトーンが含まれていないと判定する。

第２のトーン検出処理の一例について説明する。トーン検出部１３２は、式（２）、（３ａ）に基づいて、音信号の時間領域に関して、時刻ｉにおける音信号の値ｘ（ｉ）での自己相関Ｒ（ｊ）を求め、自己相関Ｒ（ｊ）の最大値を、トーン性を示す数値Ｔ２として算出する。トーン検出部１３２は、数値Ｔ２が閾値ＴＨ２よりも大きい場合に、音信号にトーンが含まれていると判定する。一方、トーン検出部１３２は、数値Ｔ２が閾値ＴＨ２よりも大きくない場合に、音信号にトーンが含まれていないと判定する。

Ｔ２＝ｍａｘ（Ｒ（ｊ））・・・（３ａ）

トーン検出部１３２は、第１のトーン検出処理または第２のトーン検出処理を実行し、トーン有りと判定した場合には、トーン有の情報を、補正判定部１３３に出力する。また、トーン検出部１３２は、トーン電力を、低域補正部１４０および高域補正部１６０に出力する。トーン電力は、低域と高域との境界に存在するトーンの電力である。

一方、トーン検出部１３２は、トーン無と判定した場合には、トーン無の情報を、補正判定部１３３に出力する。

補正判定部１３３は、トーン検出部１３２から「トーン有」である旨の情報を取得した場合には、符号化条件を取得し、符号化条件を基にして、音信号の低域のトーンを抑圧するのか、高域のトーンを抑圧するのかを判定する処理部である。符号化条件は、たとえば、符号化のビットレートの情報を含む。符号化条件の情報は、管理者が入力しても良いし、補正判定部１３３に予め設定しておいても良い。

補正判定部１３３は、符号化条件に含まれるビットレートの値が、閾値以上である場合に、符号化条件が高レートであると判定する。補正判定部１３３は、高レートであると判定した場合に、高域のトーンを抑圧すると判定し、制御信号を、高域補正部１６０に出力する。

補正判定部１３３は、符号化条件に含まれるビットレートの値が、閾値未満である場合に、符号化条件が低レートであると判定する。補正判定部１３３は、低レートであると判定した場合に、低域のトーンを抑圧すると判定し、制御信号を、低域補正部１４０に出力する。

図２の説明に戻る。低域補正部１４０は、判定部１３０から制御信号を受け付けた場合に、低域信号に含まれる境界のトーン成分を抑圧することで、低域信号を補正する処理部である。低域補正部１４０は、補正した低域信号を、低域符号化部１５０に出力する。

低域補正部１４０は、判定部１３０から制御信号を受け付けていない場合には、低域信号抽出部１１０から受け付ける低域信号を、そのまま、低域符号化部１５０に出力する。

図５は、本実施例１に係る低域補正部の構成を示す機能ブロック図である。図５に示すように、この低域補正部１４０は、スイッチ１４１と、抑圧ゲイン算出部１４２と、平滑化部１４３と、トーン抑圧部１４４とを有する。

スイッチ１４１は、判定部１３０から取得する制御信号に応じて、低域信号の経路を切り替えるスイッチである。スイッチ１４１は、制御信号を受け付けていない場合には、端子１４１ａと端子１４１ｂとを接続することで、低域信号をそのまま通過させる。スイッチ１４１は、制御信号を受け付けた場合には、端子１４１ａと端子１４１ｃとを接続することで、低域信号を、トーン抑圧部１４４に入力する。

抑圧ゲイン算出部１４２は、低域信号のトーンを動的マスキング閾値以下に抑圧するゲインを算出する処理部である。動的マスキング閾値は、抑圧対象のトーンが存在する周波数と、トーン電力との組に応じて決定される閾値である。

図６は、動的マスキング閾値を説明するための図である。図６において、横軸は周波数に対応する軸であり、縦軸は電力に対応する軸である。たとえば、トーンが隣接する場合であっても、トーン電力が動的マスキング閾値未満である場合には、トーンが聞こえなくなる。

トーン６５Ａの動的マスキング閾値は、閾値６６となる。トーン６５Ａのトーン電力は閾値６６以上であるため、トーン６５Ａの音は聞こえる。一方、トーン６５Ａのトーン電力を抑圧して、トーン６５Ｂに補正すると、閾値６６未満となり、トーン６５Ｂの音は聞こえない。

トーン６５Ｃの動的マスキング閾値は、閾値６７となる。トーン６５Ｃのトーン電力は閾値６７以上であるため、トーン６５Ｃの音は聞こえる。一方、トーン６５Ｃのトーン電力を抑圧して、トーン６５Ｄに補正すると、閾値６７未満となり、トーン６５Ｄの音は聞こえない。

抑圧ゲイン算出部１４２は、トーンの周波数およびトーン電力と、動的マスキング閾値とを対応づけたテーブルを参照して、動的マスキング閾値を特定する。たとえば、トーンの周波数を、低域と高域との境界の周波数とする。抑圧ゲイン算出部１４２は、トーン電力と、動的マスキング閾値とを比較して、トーン電力が動的マスキング閾値未満となる抑圧ゲインを特定する。抑圧ゲイン算出部１４２は、抑圧ゲインを平滑化部１４３に出力する。

平滑化部１４３は、低域信号のトーン成分をなだらかに抑圧するために、段階的に大きくする抑圧ゲインを、トーン抑圧部１４４に出力する処理部である。たとえば、平滑化部１４３は、抑圧ゲインを初期値から徐々に大きくしていき、最終的に、抑圧ゲインの大きさを、抑圧ゲイン算出部１４２から通知される抑圧ゲインの大きさになるように調整する。

トーン抑圧部１４４は、平滑化部１４３から取得する抑圧ゲインを、トーン成分に乗算することで、境界のトーンを抑圧し、低域信号を補正する処理部である。トーン抑圧部１４４は、補正した低域信号を、低域符号化部１５０に出力する。

図７は、本実施例１に係る低域補正部の処理を説明するための図である。図７において、補正前の低域信号の周波数スペクトルを、周波数スペクトル７０ａとする。補正後の低域信号の周波数スペクトルを、周波数スペクトル７０ｂとする。周波数スペクトル７０ａ，７０ｂの横軸は、周波数に対応する軸であり、周波数スペクトル７０ａ，７０ｂの縦軸は、電力に対応する軸である。

周波数スペクトル７０ａに示すように、境界にトーン７１ａがある。トーン７１ａに対応する動的マスキング閾値を、動的マスキング閾値７２とする。トーン抑圧部１４４は、トーン７１ａが動的マスキング閾値７２未満となるような抑圧ゲインを与えることで、トーン７１ａを、トーン７１ｂに補正する。これにより、トーン７１ｂが、動的マスキング閾値７２未満となり、聞こえなくなるため、音信号の音質が劣化することができる。

図２の説明に戻る。低域符号化部１５０は、低域補正部から低域信号を取得し、低域信号をビット列に符号化することで、低域符号を生成する処理部である。たとえば、低域符号化部１５０は、ＡＡＣに基づいて、符号化を行う。低域符号化部１５０は、低域符号を、多重化部１８０に出力する。

高域補正部１６０は、判定部１３０から制御信号を受け付けた場合に、高域情報に含まれる境界の包絡電力を抑圧することで、高域情報を補正する処理部である。高域補正部１６０は、補正した高域情報を、高域符号化部１７０に出力する。

高域補正部１６０は、判定部１３０から制御信号を受け付けていない場合には、高域情報抽出部１２０から取得する高域情報を、そのまま、高域符号化部１７０に出力する。

図８は、本実施例１に係る高域補正部の構成を示す機能ブロック図である。図８に示すように、この高域補正部１６０は、スイッチ１６１と、抑圧ゲイン算出部１６２と、平滑化部１６３と、トーン抑圧部１６４とを有する。

スイッチ１６１は、判定部１３０から取得する制御信号に応じて、高域情報の経路を切り替えるスイッチである。スイッチ１６１は、制御信号を受け付けていない場合には、端子１６１ａと端子１６１ｂとを接続することで、高域情報をそのまま通過させる。スイッチ１６１は、制御信号を受け付けた場合には、端子１６１ａと端子１６１ｃとを接続することで、高域情報を、トーン抑圧部１６４に入力する。

抑圧ゲイン算出部１６２は、高域情報に含まれる境界の包絡電力（トーン電力）を動的マスキング閾値以下に抑圧するゲインを算出する処理部である。動的マスキング閾値は、境界の周波数と、境界の包絡電力との組に応じて決定される閾値である。

抑圧ゲイン算出部１６２は、境界の周波数および境界の包絡電力と、動的マスキング閾値とを対応づけたテーブルを参照して、動的マスキング閾値を特定する。抑圧ゲイン算出部１６２は、境界の包絡電力と、動的マスキング閾値とを比較して、包絡電力が動的マスキング閾値未満となる抑圧ゲインを特定する。抑圧ゲイン算出部１６２は、抑圧ゲインを平滑化部１６３に出力する。

平滑化部１６３は、包絡電力の値をなだらかに抑圧するために、段階的に大きくする抑圧ゲインを、トーン抑圧部１６４に出力する処理部である。たとえば、平滑化部１６３は、抑圧ゲインを初期値から徐々に大きくしていき、最終的に、抑圧ゲインの大きさを、抑圧ゲイン算出部１６２から通知される抑圧ゲインの大きさになるように調整する。

トーン抑圧部１６４は、平滑化部１６３から取得する抑圧ゲインを、境界の包絡電力に乗算することで、高域情報を補正する処理部である。境界の包絡電力を抑制することで、復号装置２０で復号される境界のトーンが、動的マスキング閾値未満となる。トーン抑圧部１６４は、補正した高域情報を、高域符号化部１７０に出力する。なお、トーン抑圧部１６４は、高域情報に含まれる包絡電力、トーン周波数、周波数分解能のうち、包絡電力のみ補正し、トーン周波数、周波数分解能の補正は行わないものとする。

図９は、本実施例１に係る高域補正部の処理を説明するための図である。図９において、補正前の包絡電力７６ａを、周波数スペクトル７５ａ上に示す。補正後の包絡電力７６ｂを、周波数スペクトル７５ｂ上に示す。周波数スペクトル７５ａ，７５ｂの横軸は、周波数に対応する軸であり、周波数スペクトル７５ａ，７５ｂの縦軸は、電力に対応する軸である。また、低域と高域との境界を、境界７７とする。

たとえば、境界７７付近の包絡電力７６ａに対応する動的マスキング閾値を、動的マスキング閾値７８とする。トーン抑圧部１６４は、境界７７の包絡電力７６ａが、動的マスキング閾値７８未満となるように、包絡電力７６ａを抑圧した包絡電力７６ｂを生成することで、高域情報を補正する。包絡電力７６ｂは、動的マスキング閾値７８未満であるため、この包絡電力７６ｂを基に復号される境界のトーン成分が抑えられる。

図２の説明に戻る。多重化部１８０は、低域符号と、高域符号とを多重化することで、ストリームを生成する処理部である。多重化部１８０は、ストリームを、ネットワーク５０を介して、復号装置２０に送信する。

次に、本実施例１に係るオーディオ符号化装置１００の判定部１３０の処理手順について説明する。図１０は、本実施例１に係る判定部の処理手順を示すフローチャート（１）である。図１０に示すように、オーディオ符号化装置１００の判定部１３０は、トーン性Ｔを算出する（ステップＳ１０１）。ステップＳ１０１において、判定部１３０は、第１のトーン検出処理によりトーン性Ｔ１を算出しても良いし、第２のトーン検出処理によりトーン性Ｔ２を算出しても良い。

判定部１３０は、トーン性Ｔが、閾値ＴＨよりも大きいか否かを判定する（ステップＳ１０２）。ステップＳ１０２において、判定部１３０は、トーン性Ｔ１を算出した場合には、閾値ＴＨ１と比較する。判定部１３０は、トーン性Ｔ２を算出した場合には、閾値ＴＨ２と比較する。

判定部１３０は、トーン性Ｔが閾値ＴＨよりも大きい場合には（ステップＳ１０２，Ｙｅｓ）、トーン有と判定する（ステップＳ１０４）。一方、判定部１３０は、トーン性Ｔが閾値ＴＨよりも大きくない場合には（ステップＳ１０２，Ｎｏ）、トーン無と判定する（ステップＳ１０３）。判定部１３０は、トーン電力を計算する（ステップＳ１０５）。

図１１は、本実施例１に係る判定部の処理手順を示すフローチャート（２）である。図１１に示すように、オーディオ符号化装置１００の判定部１３０は、トーン検出結果が、トーン有りであるか否かを判定する（ステップＳ２０１）。判定部１３０は、トーン検出結果が、トーン有りでない場合には（ステップＳ２０１，Ｎｏ）、補正処理を実行しない旨の制御信号を出力する（ステップＳ２０２）。なお、ステップＳ２０２において、判定部１３０は、補正処理を実行しないと判定した場合に、制御信号の出力を抑止しても良い。

判定部１３０は、トーン検出結果が、トーン有りの場合には（ステップＳ２０１，Ｙｅｓ）、符号化条件のビットレートが所定値以上であるか否かを判定する（ステップＳ２０３）。判定部１３０は、符号化条件のビットレートが所定値以上である場合には（ステップＳ２０３，Ｙｅｓ）、高域補正を行う旨の、制御信号を高域補正部１６０に出力する（ステップＳ２０４）。

判定部１３０は、符号化条件のビットレートが所定値以上でない場合には（ステップＳ２０３，Ｎｏ）、低域補正を行う旨の、制御信号を低域補正部１４０に出力する（ステップＳ２０５）。

次に、本実施例１に係るオーディオ符号化装置１００の処理手順の一例について説明する。図１２は、本実施例１に係るオーディオ符号化装置の処理手順を示すフローチャートである。図１２に示すように、このオーディオ符号化装置１００は、音信号を受け付ける（ステップＳ３０１）。

オーディオ符号化装置１００の低域信号抽出部１１０は、音信号から低域信号を抽出する（ステップＳ３０２）。オーディオ符号化装置１００の高域情報抽出部１２０は、音信号から高域情報を抽出する（ステップＳ３０３）。

オーディオ符号化装置１００の判定部１３０は、境界におけるトーンの有無を判定する。判定部１３０は、トーン有の場合には、低域を補正するのか、高域を補正するのかを判定する（ステップＳ３０４）。

オーディオ符号化装置１００の低域補正部１４０は、低域を補正すると判定された場合に、低域信号を補正する（ステップＳ３０５）。オーディオ符号化装置１００の高域補正部１６０は、高域を補正すると判定された場合に、高域情報の包絡電力を補正する（ステップＳ３０６）。

オーディオ符号化装置１００の低域符号化部１５０は、低域信号を符号化して、低域符号を生成する（ステップＳ３０７）。オーディオ符号化装置１００の高域符号化部１７０は、高域情報を符号化して、高域符号を生成する（ステップＳ３０８）。

オーディオ符号化装置１００の多重化部１８０は、低域符号と高域符号とを多重化したストリームを生成する（ステップＳ３０９）。多重化部１８０は、ストリームを復号装置２０に送信する（ステップＳ３１０）。

次に、本実施例１に係るオーディオ符号化装置１００の効果について説明する。オーディオ符号化装置１００は、トーンが低域・高域の境界にあることを検出した場合に、低域側または高域側のトーンの一方を抑圧した後に、低域符号および高域符号を多重化したストリームを生成する。これにより、音信号の音質が劣化することを抑止することができる。

たとえば、オーディオ符号化装置１００は、トーンが境界にあることを検出し、低域信号のトーンを抑圧することで、たとえば、図３９のトーン３２ａが小さくなる。これにより、うなり成分がなくなり、音質劣化を抑止できる。オーディオ符号化装置１００は、トーンが境界にあることを検出し、高域情報のトーン（包絡電力）を抑圧することで、たとえば、図３９のトーン３２ｂが小さくなる。これにより、うなり成分がなくなり、音質劣化を抑止できる。

オーディオ符号化装置１００は、符号化条件のビットレートと閾値との比較により、低域のトーンを抑圧するのか、高域のトーンを抑圧するのかを判定し、判定結果に応じた帯域のトーンを抑圧する。これにより、ビットレートに応じて、音質の劣る方の帯域で、補正を行うことができる。たとえば、ビットレートが高レートの場合には、高域の音質が劣るため、高域を補正する。一方、ビットレートが低レートの場合には、低域の音質が劣るため、低域を補正する。

図１３は、本実施例１に係るオーディオ符号化装置の効果を説明するための図である。図１３において、スペクトラム８１ａ、時間波形８２ａは、原音（正解）のスペクトラムおよび時間波形である。一例として、チェンバロの響きが衰退するトーン（１６ｂｉｔ、４８ｋＨｚ、ｍｏｎｏ）を原音として用いた。また、低域と高域との境界を６．７ｋＨｚとした。

スペクトラム８１ｂ、時間波形８２ｂは、従来の符号化装置１０が符号化したストリームを復号装置２０が復号した信号に関する、スペクトラムおよび時間波形である。スペクトラム８１ｃ、時間波形８２ｃは、オーディオ符号化装置１００が符号化したストリームを復号装置２０が復号した信号に関する、スペクトラムおよび時間波形である。

スペクトラム８１ａ〜８１ｃの横軸は時間に対応する軸であり、縦軸は周波数に対応する軸である。また、スペクトラム８１ａ〜８１ｃでは、明暗により電力値の大小を表しており、明るい部分は、電力が大きく、暗い部分は、電力が小さい。時間波形８２ａ〜８２ｃの横軸は時間に対応する軸であり、縦軸は振幅に対応する軸である。

スペクトラム８１ａ〜８１ｃを比較、および、時間波形８２ａ〜８２ｃを比較すると、従来技術と比較して、オーディオ符号化装置１００の符号化は、ゆらぎが抑えられ、音質劣化を抑止できている。

ところで、図２に示したオーディオ符号化装置１００は、低域補正部１４０および高域補正部１６０のいずれか一方を有していれば良く、必ずしも、低域補正部１４０および高域補正部１６０の双方を有していなくても良い。

たとえば、オーディオ符号化装置１００が、低域補正部１４０を有し、高域補正部１６０を有していない場合には、境界のトーンが検出される度に、低域補正部１４０が、低域信号の補正を行う。一方、オーディオ符号化装置１００が、低域補正部１４０を有しておらず、高域補正部１６０を有している場合には、境界のトーンが検出される度に、高域補正部１６０が、高域情報の包絡電力の補正を行う。このように構成することで、オーディオ符号化装置１００のハードウェア資源を節約しつつ、音信号の劣化を抑止することができる。

図１４は、本実施例２に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１４に示すように、このオーディオ符号化装置２００は、判定部２１０と、入力信号補正部２２０とを有する。オーディオ符号化装置２００は、低域信号抽出部１１０、高域情報抽出部１２０、低域符号化部１５０、高域符号化部１７０、多重化部１８０を有する。

判定部２１０は、外部装置から音信号を取得し、音信号の低域と高域との境界にトーンが含まれるか否かを判定する処理部である。また、判定部２１０は、境界にトーンが含まれると判定した場合に、制御信号と、トーン電力を入力信号補正部２２０に出力する。判定部２１０が、境界にトーンが含まれるか否かを判定する処理は、実施例１に示した判定部１３０の処理と同様である。

入力信号補正部２２０は、判定部２１０から制御信号を受け付けた場合に、音信号に含まれる境界のトーン成分を抑圧することで、音信号を補正する処理部である。入力信号補正部２２０は、補正した音信号を、低域信号抽出部１１０に出力する。

図１５は、本実施例２に係る入力信号補正部の構成を示す機能ブロック図である。図１５に示すように、この入力信号補正部２２０は、スイッチ２２１と、抑圧ゲイン算出部２２２と、平滑化部２２３と、トーン抑圧部２２４とを有する。

スイッチ２２１は、判定部２１０から取得する制御信号に応じて、音信号の経路を切り替えるスイッチである。スイッチ２２１は、制御信号を受け付けていない場合には、端子２２１ａと端子２２１ｂとを接続することで、音信号をそのまま通過させる。スイッチ２２１は、制御信号を受け付けた場合には、端子２２１ａと端子２２１ｃとを接続することで、音信号を、トーン抑圧部２２４に入力する。

抑圧ゲイン算出部２２２は、音信号の境界に位置するトーンを動的マスキング閾値以下に抑圧するゲインを算出する処理部である。抑圧ゲイン算出部２２２は、抑圧ゲインを平滑化部２２３に出力する。抑圧ゲイン算出部２２２が、抑圧ゲインを算出する処理は、実施例１に示した抑圧ゲイン算出部１４２の処理に対応する。

平滑化部２２３は、音信号のトーン成分をなだらかに抑圧するために、段階的に大きくする抑圧ゲインを、トーン抑圧部２２４に出力する処理部である。たとえば、平滑化部２２３は、抑圧ゲインを初期値から徐々に大きくしていき、最終的に、抑圧ゲインの大きさを、抑圧ゲイン算出部２２２から通知される抑圧ゲインの大きさになるように調整する。

トーン抑圧部２２４は、平滑化部２２３から取得する抑圧ゲインを、音信号の境界のトーン成分に乗算することで、境界のトーンを抑圧し、低域信号を補正する処理部である。トーン抑圧部２２４は、補正した音信号を、低域信号抽出部１１０に出力する。

図１４の説明に戻る。低域信号抽出部１１０、高域情報抽出部１２０、低域符号化部１５０、高域符号化部１７０、多重化部１８０に関する説明は、実施例１に示した、低域信号抽出部１１０、高域情報抽出部１２０、低域符号化部１５０、高域符号化部１７０、多重化部１８０に関する説明と同様であるため、同一の符号を付して説明を省略する。

次に、本実施例２に係るオーディオ符号化装置２００の効果について説明する。トーンが低域・高域の境界にあることを検出した場合に、音信号の境界のトーンを抑圧した後に、低域符号および高域符号を多重化したストリームを生成する。これにより、音信号の音質が劣化することを抑止することができる。また、原音となる音信号のトーンを抑圧しておくため、低域、高域のいずれのトーンを抑圧するのかを判定する処理をスキップすることができるため、処理負荷を軽減することができる。また、ハードウェア資源を節約することも可能になる。

図１６Ａは、本実施例３に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１６Ａに示すように、オーディオ符号化装置３００は、低域信号抽出部１１０、高域情報抽出部１２０、高域符号化部１７０、多重化部１８０、補正制御部３１０、低域符号化部３２０を有する。

低域信号抽出部１１０、高域情報抽出部１２０、高域符号化部１７０、多重化部１８０に関する説明は、実施例１に説明した低域信号抽出部１１０、高域情報抽出部１２０、高域符号化部１７０、多重化部１８０に関する説明と同様である。

補正制御部３１０は、低域信号を符号化する際の対象となる帯域を制限する処理部である。補正制御部３１０は、符号化部の一例である。実施例３に関して、以下の説明では、低域信号を符号化する際の対象となる帯域を、「符号化対象帯域」と表記する。

図１６Ｂは、本実施例３に係る補正制御部の処理を説明するための図である。図１６Ｂに示す周波数スペクトル８５の横軸は、周波数に対応する軸であり、縦軸は、音信号の電力（値）に対応する軸である。たとえば、音信号の境界８６には、トーン８６ａが存在している。

たとえば、符号化対象帯域のデフォルトの帯域は、符号化対象帯域８７ａとなる。補正制御部３１０は、符号化対象帯域８７ａを、符号化対象帯域８７ｂに補正する。たとえば、補正制御部３１０は、符号化対象帯域８７ｂは、符号化対象帯域８７ａの上限を１サブバンド分低域にずらしたものに対応する。補正制御部３１０は、補正した符号化対象帯域の情報を、低域符号化部３２０に出力する。

低域符号化部３２０は、低域信号抽出部１１０から低域信号を取得し、低域信号をビット列に符号化することで、低域符号を生成する処理部である。低域符号化部３２０は、低域符号を、多重化部１８０に出力する。なお、低域符号化部３２０は、補正制御部３１０から受け付ける、符号化対象帯域８７ｂに含まれる低域信号を符号化する。符号化対象帯域８７ｂには、境界８６のトーン８６ａが含まれないので、このトーン８６ａが、低域符号に含まれないこととなり、結果として、音質劣化を抑止することが可能となる。

次に、本実施例３に係るオーディオ符号化装置３００の効果について説明する。オーディオ符号化装置３００は、低域信号を符号化する場合に、トーンの存在する境界を除いた、符号化対象帯域の音信号に対して符号化を行う。これにより、境界のトーンが、低域信号に含まれないため、音質劣化を抑止することが可能となる。

図１７Ａは、本実施例４に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１７Ａに示すように、オーディオ符号化装置３０１は、低域信号抽出部１１０、低域符号化部１５０、高域符号化部１７０、多重化部１８０、補正制御部３０２、高域情報抽出部３０３を有する。

低域信号抽出部１１０、低域符号化部１５０、高域符号化部１７０、多重化部１８０に関する説明は、実施例１に説明した低域信号抽出部１１０、低域符号化部１５０、高域符号化部１７０、多重化部１８０に関する説明と同様である。

補正制御部３０２は、高域信号を符号化する際の対象となる帯域を制限する処理部である。補正制御部３０２は、符号化部の一例である。実施例４に関して、以下の説明では、高域信号を符号化する際の対象となる帯域を、「符号化対象帯域」と表記する。

図１７Ｂは、本実施例４に係る補正制御部の処理を説明するための図である。図１７Ｂに示す周波数スペクトル８５の横軸は、周波数に対応する軸であり、縦軸は、音信号の電力（値）に対応する軸である。たとえば、音信号の境界８６には、トーン８６ａが存在している。

たとえば、符号化対象帯域のデフォルトの帯域は、符号化対象帯域８９ａとなる。補正制御部３０２は、符号化対象帯域８９ａを、符号化対象帯域８９ｂに補正する。たとえば、符号化対象帯域８９ｂは、符号化対象帯域８９ａの下限を１サブバンド分高域にずらしたものに対応する。補正制御部３０２は、補正した符号化対象帯域の情報を、高域情報抽出部３０３に出力する。

高域情報抽出部３０３は、外部装置から音信号を取得し、音信号の高域（図１７Ｂに示した符号化対象帯域８９ｂ）から、高域情報を抽出する処理部である。高域情報抽出部３０３は、高域情報を、高域符号化部１７０に出力する。図１７Ｂで説明したように、符号化対象帯域８９ｂには、トーン８６ａが存在していない。

次に、本実施例４に係るオーディオ符号化装置３０１の効果について説明する。オーディオ符号化装置３０１は、高域信号を符号化する場合に、トーンの存在する境界を除いた、符号化対象帯域の音信号に対して符号化を行う。これにより、境界のトーンが、高域信号に含まれないため、音質劣化を抑止することが可能となる。

図１８は、本実施例５に係るオーディオ符号化装置の構成を示す機能ブロック図である。図１８に示すように、このオーディオ符号化装置４００の構成は、低域信号抽出部１１０、高域情報抽出部１２０、判定部１３０、低域補正部１４０、低域符号化部１５０、高域符号化部１７０、多重化部１８０、高域補正部４１０を有する。高域補正部４１０は、符号化部の一例である。

低域信号抽出部１１０、高域情報抽出部１２０、判定部１３０、低域補正部１４０、低域符号化部１５０、高域符号化部１７０、多重化部１８０に関する説明は、図２に示した各処理部に関する説明と同様であるため、同様の符号を付して説明を省略する。

高域補正部４１０は、判定部１３０から制御信号を受け付けた場合に、高域情報に含まれるトーン周波数を補正することで、高域情報を補正する処理部である。たとえば、トーン周波数の情報には、分解能に応じて分割された高域の複数の帯域について、トーンの有無に関する情報が含まれている。高域補正部４１０は、境界に対応する帯域のトーンの有無が「有」となっている場合に、境界に対応する帯域のトーンの有無を「無」に補正する。

図１９は、本実施例５に係る高域補正部の構成を示す機能ブロック図である。図１９に示すように、この高域補正部４１０は、スイッチ４１１と、追加トーン抑圧部４１２とを有する。

スイッチ４１１は、判定部１３０から取得する制御信号に応じて、高域情報の経路を切り替えるスイッチである。スイッチ４１１は、制御信号を受け付けていない場合には、端子４１１ａと端子４１１ｂとを接続することで、高域情報をそのまま通過させる。スイッチ４１１は、制御信号を受け付けた場合には、端子４１１ａと端子４１１ｃとを接続することで、高域情報を、追加トーン抑圧部４１２に入力する。

追加トーン抑圧部４１２は、高域情報に含まれるトーン周波数を補正する処理部である。図２０は、本実施例５に係る高域補正部の処理を説明するための図である。図２０において、周波数スペクトル９０の横軸は、周波数に対応する軸であり、縦軸は、信号の電力に対応する軸である。図２０に示す例では、境界９１にトーン９２が含まれている。

たとえば、トーン周波数は、該当する帯域にトーンがあるか否かを「０」または「１」で示す情報であり、分割される帯域の細かさは、周波数分解能に応じたものとなる。トーンがある場合には、該当する帯域のブロックに「１」が設定され、トーンがない場合には、該当する帯域のブロックに「０」が設定される。

図２０に示したトーン周波数９５ａ，９５ｂは、各帯域対応するブロック２１〜２５が含まれる。このうち、ブロック２１が、境界９１の帯域に対応するブロックとなる。トーン周波数９５ａは、補正前のトーン周波数であり、トーン周波数９５ｂは、補正後のトーン周波数である。

追加トーン抑圧部４１２は、トーン周波数９５ａのブロック２１に「１」が設定されている場合には、ブロック２１を「０」に補正することで、トーン周波数９５ｂを生成する。追加トーン抑圧部４１２は、補正したトーン周波数９５ｂと、包絡電力と、周波数分解能とを含む高域情報を、高域符号化部１７０に出力する。

次に、本実施例５に係るオーディオ符号化装置４００の効果について説明する。オーディオ符号化装置４００は、境界にトーンが存在する場合には、高域情報のトーン周波数を補正することで、境界にトーンが存在しないことにする。これにより、補正された高域情報に基づいて復号される高域信号の境界には、トーンが生成されなくなるため、音質劣化を抑止することが可能となる。

ところで、実施例１〜５に示したオーディオ符号化装置１００〜４００の処理は一例である。ここでは、オーディオ符号化装置のその他の処理について説明を行う。ここでは、図２に示したオーディオ符号化装置１００のブロック図を用いて説明を行う。

オーディオ符号化装置１００の判定部１３０は、低域の誤差電力と、高域の誤差電力とを比較して、低域のトーンを抑圧するのか、高域のトーンを抑圧するのかを判定しても良い。

たとえば、音信号（原音）の低域信号を第１低域信号と表記し、低域符号を復号した低域信号を第２低域信号と表記する。低域の誤差電力を、第１低域信号と第２低域信号との差分値とする。音信号（原音）の高域信号を第１高域信号と表記し、高域符号に基づき復号した高域信号を第２高域信号と表記する。高域の誤差電力を、第１高域信号と第２高域信号との差分値とする。

判定部１３０は、低域の誤差電力＞高域の誤差電力となる場合には、高域のトーンを抑圧すると判定する。一方、判定部１３０は、低域の誤差電力≦高域の誤差電力となる場合には、低域のトーンを抑圧すると判定する。

図２１は、判定部のその他の処理手順を示すフローチャートである。図２１に示すように、オーディオ符号化装置１００の判定部１３０は、トーン検出結果が、トーン有りであるか否かを判定する（ステップＳ４０１）。判定部１３０は、トーン検出結果が、トーン有りでない場合には（ステップＳ４０１，Ｎｏ）、補正処理を実行しない旨の制御信号を出力する（ステップＳ４０２）。なお、ステップＳ４０２において、判定部１３０は、補正処理を実行しないと判定した場合に、制御信号の出力を抑止しても良い。

判定部１３０は、トーン検出結果が、トーン有りの場合には（ステップＳ４０１，Ｙｅｓ）、低域の誤差電力＞高域の誤差電力となるか否かを判定する（ステップＳ４０３）。判定部１３０は、低域の誤差電力＞高域の誤差電力となる場合には（ステップＳ４０３，Ｙｅｓ）、高域補正を行う旨の、制御信号を高域補正部１６０に出力する（ステップＳ４０４）。

判定部１３０は、低域の誤差電力＞高域の誤差電力とならない場合には（ステップＳ４０３，Ｎｏ）、低域補正を行う旨の、制御信号を低域補正部１４０に出力する（ステップＳ４０５）。

上記のように、低域の誤差電力と、高域の誤差電力との比較により、実際にトーンを抑圧した帯域が適切であったか否かをフィードバックすることで、音質を改善するための、トーンを抑圧する帯域を適切に選択することができる。

実施例６の説明を行う前に、上述した実施例１で説明したオーディオ符号化装置１００の問題について説明する。オーディオ符号化装置１００により生成された符号化ストリームを復号装置２０が復号する際、復号装置２０の逆フィルタモードの設定に応じて、図２２で説明するように、復号後の音信号の品質が劣化する場合がある。

図２２は、オーディオ符号化装置の問題を説明するための図である。図２２に示す音信号の周波数スペクトル９０１は、横軸が周波数に対応する軸であり、縦軸が電力（値）に対応する軸である。周波数スペクトル９０１の低域と高域との境界９０２の付近には、トーン９０３が含まれている。

たとえば、オーディオ符号化装置１００は、境界９０２付近のトーン９０３を検出すると、低域に含まれるトーン９０３を抑圧することで、低域信号を補正し、低域信号を符号化した低域符号を生成する。オーディオ符号化装置１００は、低域符号と、高域情報を符号化した高域符号とを多重化することで、符号化ストリームを生成し、復号装置２０に出力する。

復号装置２０は、オーディオ符号化装置１００から受信した符号化ストリームを復号することで、周波数スペクトル９１０を生成することになる。ここで、復号装置２０の処理に応じて、周波数スペクトル９２０が生成される場合がある。周波数スペクトル９１０，９２０に関して、横軸は周波数に対応する軸であり、縦軸は電力（値）に対応する軸である。

周波数スペクトル９１０は、適切に復号された周波数スペクトルであり、境界９１１の付近にトーン９１２が含まれている。一方、周波数スペクトル９２０は、境界９２１の付近にトーンが含まれておらず、音信号の品質が劣化する。

続いて、周波数スペクトル９２０の境界９２１付近において、トーンが生成されない理由について説明する。たとえば、ＳＢＲ技術を利用する復号装置２０には、逆フィルタモードのオン、オフの機能が備わっている。

復号装置２０は、逆フィルタモードが「オフ」となっている場合には、周波数スペクトルの低域をそのまま高域に複製して、音信号を生成する。このように、復号装置２０が、低域の周波数スペクトルをそのまま高域に複製する処理を行う場合には、図２２に示した周波数スペクトル９１０が生成され、音信号の品質が劣化することはない。

一方、復号装置２０は、逆フィルタモードが「オン」となっている場合には、周波数スペクトルの低域を非相関化してから高域に複製して、音信号を生成する。このように、復号装置２０が、低域信号を非相関化してから高域を複製すると、高域にトーンが生成されず、図２２に示した周波数スペクトル９２０が生成され、音信号の品質が劣化する。

図２３は、低域の信号を非相関化したことによる問題を説明するための図である。図２３において、各周波数スペクトル９３０〜９３２の横軸は周波数に対応する軸であり、縦軸は電力（値）に対応する軸である。

復号装置２０は、周波数スペクトル９３０の低域を非相関化することで、周波数スペクトル９３１を生成する。復号装置２０は、周波数スペクトル９３１の帯域９３１ａを選択し、選択した帯域９３１ａの周波数スペクトルを高域に複製することで、周波数スペクトル９３２を生成する。復号装置２０は、周波数スペクトル９３２に対して包絡調整を行うことで、最終的な周波数スペクトルを復号する。図２３で説明したように、低域の信号を非相関化してから高域を複製すると、復号された周波数スペクトルには、高域にトーンが生成されない。

図２２および図２３で説明した問題を解消するために、本実施例６に係るオーディオ符号化装置は、逆フィルタモードのオン、オフに応じて、低域信号の補正の有無を制御する。たとえば、オーディオ符号化装置は、逆フィルタモードが「オフ」の場合には、低域信号の補正を行うことで、トーンを抑圧する。一方、オーディオ符号化装置は、逆フィルタモードが「オン」の場合には、低域信号の補正を行わないことで、低域信号のトーンを抑圧しない。このように、逆フィルタモードのオン、オフに応じて、トーンの抑圧の制御を行い、復号装置２０が復号を行う場合における、音信号の品質劣化の問題を解消する。

図２４は、本実施例６に係るシステムの構成を示す図である。図２４に示すように、このシステムは、オーディオ符号化装置６００と、復号装置７００とを有する。オーディオ符号化装置６００は、ネットワーク５０を介して、復号装置７００に接続される。

図２５は、本実施例６に係るオーディオ符号化装置の構成を示す機能ブロック図である。図２５に示すように、このオーディオ符号化装置６００は、符号化部６００ａと、判定部６０４と、多重化部６０９とを有する。符号化部６００ａは、時間周波数変換部６０１と、高域情報抽出部６０２と、高域符号化部６０３と、低域抽出部６０５と、低域補正部６０６と、周波数時間変換部６０７と、低域符号化部６０８とを含む。

時間周波数変換部６０１は、音信号を時間周波数信号に変換する処理部である。時間周波数変換部６０１は、時間周波数信号を、高域情報抽出部６０２、判定部６０４、低域抽出部６０５に出力する。

たとえば、時間周波数変換部６０１は、式（３）で定義されるＱＭＦ（Quadrature Mirror Filter）フィルタバンクを用いて、音信号ｓ［ｎ］を、周波数信号Ｓ［ｋ］［ｎ］に変換する。式（３）において、ｎは時間を表す変数であり、ｋは周波数を表す変数である。

時間周波数変換部６０１は、各時間と各周波数の周波数信号Ｓとを対応づけることで、時間周波数信号Ｌ［ｋ］［ｎ］を生成する。図２６は、時間周波数信号のデータ構造の一例を示す図である。図２６において、横軸は時間に対応する軸であり、縦軸は周波数に対応する軸である。時間周波数信号は、時間毎の周波数スペクトルの情報を含む。たとえば、Ｓ（０，０）、Ｓ（１，０）、・・・Ｓ（６３，０）は、時間ｎ＝０における、周波数と周波数信号Ｓの値（電力値に相当）との関係を示す周波数スペクトルの情報である。

図２５の説明に戻る。高域情報抽出部６０２は、時間周波数信号の高域から、高域情報を抽出する処理部である。高域情報抽出部６０２は、抽出した高域情報を、高域符号化部６０３に出力する。高域情報には、包絡電力、トーン周波数、周波数分解能が含まれる。高域情報を抽出する処理は、実施例１で説明した高域情報抽出部１２０の処理と同様である。

また、高域情報抽出部６０２は、時間周波数信号を基にして、復号装置７００に設定される逆フィルタモードがオンであるかオフであるかを推定する。高域情報抽出部６０２は、推定した逆フィルタモードの情報を、低域補正部６０６に出力する。

高域情報抽出部６０２は、時間周波数信号のトーン成分の平均値を算出する。トーン成分の平均値を「帯域トーン成分」と表記する。高域情報抽出部６０２は、帯域トーン成分を用いて、フレーム内の平均電力を計算する。フレームは、時間周波数信号を所定時間毎に分割したデータに対応する。高域情報抽出部６０２は、前フレームの帯域トーン成分を用いて、現フレームの帯域トーン成分を平滑化する。

高域情報抽出部６０２は、平滑化された帯域トーン成分と、平均電力とを基にして、逆フィルタモードのオン、オフを判定する。たとえば、高域情報抽出部６０２は、図２７で説明するような閾値比較を行うことで、逆フィルタレベルを判定する。図２７は、逆フィルタレベルの判定手順を示すフローチャートである。図２７に示す第１〜第４閾値は、事前に設定されているものとする。なお、第１閾値〜第３閾値の大小関係は、第１閾値＜第２閾値＜第３閾値とする。

図２７に示すように、高域情報抽出部６０２は、帯域トーン成分が第１閾値未満である場合には（ステップＳ３１，Ｎｏ）、逆フィルタレベル＝０と判定し（ステップＳ３２）、ステップＳ３８に移行する。

高域情報抽出部６０２は、帯域トーン成分が第１閾値以上である場合には（ステップＳ３１，Ｙｅｓ）、ステップＳ３３に移行する。高域情報抽出部６０２は、帯域トーン成分が第２閾値未満である場合には（ステップＳ３３，Ｎｏ）、逆フィルタレベル＝１と判定し（ステップＳ３４）、ステップＳ３８に移行する。

高域情報抽出部６０２は、帯域トーン成分が第２閾値以上である場合には（ステップＳ３３，Ｙｅｓ）、ステップＳ３５に移行する。高域情報抽出部６０２は、帯域トーン成分が第３閾値未満である場合には（ステップＳ３５，Ｎｏ）、逆フィルタレベル＝２と判定し（ステップＳ３６）、ステップＳ３８に移行する。

高域情報抽出部６０２は、帯域トーン成分が第３閾値以上である場合には（ステップＳ３５，Ｙｅｓ）、逆フィルタレベル＝３と判定し（ステップＳ３７）、ステップＳ３８に移行する。

高域情報抽出部６０２は、平均電力が第４閾値未満であるか否かを判定する（ステップＳ３８）。高域情報抽出部６０２は、平均電力が第４閾値未満である場合には（ステップＳ３８，Ｙｅｓ）、逆フィルタレベルを０に更新し（ステップＳ３９）、逆フィルタレベルを判定する処理を終了する。一方、高域情報抽出部６０２は、平均電力が第４閾値以上である場合には（ステップＳ３８，Ｎｏ）、逆フィルタレベルを判定する処理を終了する。

ほとんど無音の信号に対して逆フィルタの処理を行わないようにするため、平均電力が微小な場合には、逆フィルタレベルを「０」に設定する。このため、第４閾値は、微小な値が設定される。

高域情報抽出部６０２は、図２７に示す処理を実行し、逆フィルタレベルが「０」である場合には、逆フィルタモード「オフ」の情報を、低域補正部６０６に出力する。高域情報抽出部６０２は、逆フィルタレベルが「１」以上である場合には、逆フィルタモード「オン」の情報を、低域補正部６０６に出力する。

図２５の説明に戻る。高域符号化部６０３は、高域情報を符号化することで、高域符号を生成する処理部である。高域符号化部６０３は、高域符号を、多重化部６０９に出力する。

判定部６０４は、時間周波数信号を基にして、音信号の低域と高域との境界にトーンが含まれるか否かを判定する処理部である。判定部６０４は、境界にトーンが含まれると判定した場合には、制御信号を低域補正部６０６に出力する。判定部６０４が、音信号の低域と高域との境界にトーンが含まれるか否かを判定する処理は、判定部１３０の処理と同様である。

低域抽出部６０５は、時間周波数信号の低域の情報を抽出する処理部である。低域抽出部６０５は、抽出した低域の情報を、低域補正部６０６に出力する。管理者は、低域の上限周波数を予め設定しておくものとする。

低域補正部６０６は、逆フィルタモードの情報および制御信号を基にして、低域補正を行う処理部である。具体的に、低域補正部６０６は、逆フィルタモードが「オフ」であり、かつ、制御信号を受信した場合（トーンが含まれる場合）に、低域補正を行う。低域補正部６０６は、時間周波数信号の低域に対して、低域補正を行う。たとえば、低域補正部６０６は、時間周波数信号の低域に含まれるトーン成分を抑圧することで、低域補正を行う。低域補正部６０６は、低域補正を行った時間周波数信号を、周波数時間変換部６０７に出力する。

一方、低域補正部６０６は、逆フィルタモードが「オン」の場合、または、制御信号を受信しない場合（トーンが含まれない場合）に、低域補正を行わず、時間周波数信号の低域の情報を、周波数時間変換部６０７に出力する。

図２８は、本実施例６に係る低域補正部の処理手順を示すフローチャートである。図２８に示すように、低域補正部６０６は、逆フィルタモードがオンであるか否かを判定する（ステップＳ５０）。低域補正部６０６は、逆フィルタモードがオンである場合には（ステップＳ５０，Ｙｅｓ）、トーンを抑圧していない時間周波数信号の低域の情報を周波数時間変換部６０７に出力する（ステップＳ５１）。

一方、低域補正部６０６は、逆フィルタモードがオフである場合には（ステップＳ５０，Ｎｏ）、制御信号を受信したか否かを判定する（ステップＳ５２）。低域補正部６０６は、制御信号を受信していない場合には（ステップＳ５２，Ｎｏ）、ステップＳ５１に移行する。

低域補正部６０６は、制御信号を受信した場合には（ステップＳ５２，Ｙｅｓ）、時間周波数信号の低域に含まれるトーン成分を抑圧する（ステップＳ５３）。低域補正部６０６は、トーンを抑圧した時間周波数信号の低域の情報を周波数時間変換部６０７に出力する（ステップＳ５４）。

図２５の説明に戻る。周波数時間変換部６０７は、時間周波数信号を低域信号に変換する処理部である。周波数時間変換部６０７は、低域信号を、低域符号化部６０８に出力する。

たとえば、周波数時間変換部６０７は、式（４）で定義されるフィルタバンクにより、時間周波数信号Ｓ’［ｋ］［ｎ］を、低域信号ｓ_ｌｏｗ（ｎ）に変換する。式（４）において、Ｋ_ｌｏｗ＝３２、Ｎ_ｌｏｗ＝１２８とする。ここで、時間周波数信号Ｓ’［ｋ］［ｎ］は、低域補正部６０６により、低域補正が行われた時間周波数信号または、低域補正が行われていない時間周波数信号に対応する。

低域符号化部６０８は、低域信号をビット列に符号化することで、低域符号を生成する処理部である。たとえば、低域符号化部６０８は、ＡＡＣに基づいて、符号化を行う。低域符号化部６０８は、低域符号を、多重化部６０９に出力する。

多重化部６０９は、低域符号と、高域符号とを多重化することで、符号化ストリームを生成する処理部である。多重化部６０９は、符号化ストリームを、ネットワーク５０を介して、復号装置７００に送信する。

たとえば、多重化部６０９は、符号化ストリームを、ＭＰＥＧ−４ＡＤＴＳ（Audio Data Transport Stream）形式で出力する。図２９は、符号化ストリームのデータ構造の一例を示す図である。図２９に示すように、符号化ストリーム９５０は、複数のＡＤＴＳフレーム９５１〜９５４を含む。図示を省略するが、符号化ストリーム９５０は、ＡＤＴＳフレーム９５１〜９５４以外のＡＤＴＳフレームを含む。

たとえば、ＡＤＴＳフレーム９５２は、ＡＤＴＳヘッダ９６０と、ＲＡＷデータブロック９６１とを含む。ＲＡＷデータブロック９６１には、低域符号９７０と、ＦＩＬＬエレメント９７１が格納される。また、ＦＩＬＬエレメント９７１には、高域符号９７２が格納される。ＡＤＴＳフレーム９５１，９５３，９５４のデータ構造は、ＡＤＴＳフレーム９５２のデータ構造と同様である。

次に、図２４に示した復号装置７００について説明する。図３０は、本実施例６に係る復号装置の構成を示す機能ブロック図である。図３０に示すように、この復号装置７００は、符号分離部７０１と、低域復号部７０２と、分析ＱＭＦ部７０３と、高域逆量子化部７０４と、高域生成部７０５と、包絡調整部７０６と、合成部７０７とを有する。

符号分離部７０１は、オーディオ符号化装置６００から符号化ストリームを受信し、符号化ストリームに含まれる低域符号と、高域符号とを分離する処理部である。符号分離部７０１は、低域符号を低域復号部７０２に出力する。符号分離部７０１は、高域符号を高域逆量子化部７０４に出力する。

低域復号部７０２は、低域符号を復号することで、低域信号を生成する処理部である。低域復号部７０２は、低域信号を分析ＱＭＦ部７０３に出力する。

分析ＱＭＦ部７０３は、式（３）で定義されるＱＭＦフィルタバンクを用いて、低域信号を、時間周波数信号に変換する処理部である。この時間周波数信号は、各時間の低域の周波数スペクトルに対応する情報である。以下の説明では、低域信号を変換することで得られる時間周波数信号を「低域周波数信号」と表記する。

高域逆量子化部７０４は、高域符号を復号することで、高域情報を抽出する処理部である。高域逆量子化部７０４は、抽出した高域情報を、高域生成部７０５に出力する。高域情報には、包絡電力、トーン周波数、周波数分解能が含まれる。

高域生成部７０５は、低域周波数信号を基にして、高域信号を生成する処理部である。高域生成部７０５が生成する高域信号は、時間と周波数との関係を示す高域の周波数スペクトルに対応する情報である。高域生成部７０５は、高域信号と高域情報とを包絡調整部７０６に出力する。

以下では、逆フィルタモードがオフの場合の、高域生成部７０５の処理と、逆フィルタモードがオンの場合の、高域生成部７０５の処理について説明する。逆フィルタモードのオン、オフは、高域生成部７０５に予め設定される。

逆フィルタモードが「オフ」の場合の、高域生成部７０５の処理について説明する。高域生成部７０５は、低域周波数信号をそのまま高域側に複製することで、高域信号を生成する。

逆フィルタモードが「オン」の場合の、高域生成部７０５の処理について説明する。高域生成部７０５は、逆フィルタモードが「オン」の場合には、低域周波数信号に対して、逆フィルタを実行（非相関化を実行）し、逆フィルタを実行した低域周波数信号を高域側に複製することで、高域信号を生成する。高域生成部７０５が低域周波数信号に対して実行する非相関化は、低域周波数信号に対する補正の一例である。

包絡調整部７０６は、高域情報に含まれる周波数分解能および包絡電力を基にして、高域信号を調整する処理部である。また、包絡調整部７０６は、トーン周波数を基にして、高域信号にトーン成分を付与する。包絡調整部７０６は、調整済みの高域信号を、合成部７０７に出力する。

合成部７０７は、分析ＱＭＦ部７０３から出力される低域周波数信号と、包絡調整部７０６から出力される調整済みの高域信号とを合成することで、音信号を復号する処理部である。合成部７０７は、復号した音信号を出力する。

次に、本実施例６に係るオーディオ符号化装置６００の処理手順の一例について説明する。図３１は、本実施例６に係るオーディオ符号化装置の処理手順を示すフローチャートである。図３１に示すように、オーディオ符号化装置６００の時間周波数変換部６０１は、音信号を受け付ける（ステップＳ５０１）。時間周波数変換部６０１は、音信号に対して時間周波数変換を実行する（ステップＳ５０２）。

オーディオ符号化装置６００の高域情報抽出部６０２は、音信号（時間周波数信号）から高域情報を抽出する（ステップＳ５０３）。オーディオ符号化装置６００の高域符号化部６０３は高域情報を符号化し、高域符号を生成する（ステップＳ５０４）。高域情報抽出部６０２は、逆フィルタモードのオン、オフを推定する（ステップＳ５０５）。

オーディオ符号化装置６００の低域抽出部６０５は、音信号（時間周波数信号）から低域信号を抽出する（ステップＳ５０６）。低域補正部６０６は、補正判定処理を実行する（ステップＳ５０７）。ステップＳ５０７の補正判定処理の処理手順は、図２８で説明した処理手順に対応する。

オーディオ符号化装置６００の周波数時間変換部６０７は、低域信号に対して周波数時間変換を実行する（ステップＳ５０８）。低域符号化部６０８は、低域信号を符号化し、低域符号を生成する（ステップＳ５０９）。

オーディオ符号化装置６００の多重化部６０９は、低域符号と高域符号とを多重化した符号化ストリームを生成する（ステップＳ５１０）。多重化部６０９は、符号化ストリームを復号装置７００に送信する（ステップＳ５１１）。

次に、本実施例６に係る復号装置７００の処理手順の一例について説明する。図３２は、本実施例６に係る復号装置の処理手順を示すフローチャートである。図３２に示すように、復号装置７００の符号分離部７０１は符号化ストリームを受信し、低域符号および高域符号を分離する（ステップＳ６０１）。

復号装置７００の低域復号部７０２は、低域符号を復号することで低域信号を生成する（ステップＳ６０２）。復号装置７００の分析ＱＭＦ部７０３は、ＱＭＦフィルタバンクを用いて、低域周波数信号を生成する（ステップＳ６０３）。

復号装置７００の高域逆量子化部７０４は、高域符号に対して高域逆量子化を行うことで高域情報を生成する（ステップＳ６０４）。復号装置７００の高域生成部７０５は、逆フィルタモードがオンであるか否かを判定する（ステップＳ６０５）。

高域生成部７０５は、逆フィルタモードがオフである場合には（ステップＳ６０５，Ｎｏ）、ステップＳ６０７に移行する。一方、高域生成部７０５は、逆フィルタモードがオンである場合には（ステップＳ６０５，Ｙｅｓ）、低域周波数信号に対する逆フィルタ処理を実行する（ステップＳ６０６）。

高域生成部７０５は、低域周波数信号を複製して高域信号を生成する（ステップＳ６０７）。復号装置７００の包絡調整部７０６は、高域情報を基にして高域信号の包絡を調整する（ステップＳ６０８）。

復号装置７００の合成部７０７は、低域周波数信号と高域信号とを合成することで、音信号を復号する（ステップＳ６０９）。合成部７０７は、音信号を出力する（ステップＳ６１０）。

次に、本実施例６に係るオーディオ符号化装置６００の効果について説明する。オーディオ符号化装置６００は、逆フィルタモードのオン、オフに応じて、低域信号の補正の有無を制御する。たとえば、オーディオ符号化装置６００は、逆フィルタモードが「オフ」の場合には、低域信号の補正を行うことで、トーンを抑圧する。一方、オーディオ符号化装置６００は、逆フィルタモードが「オン」の場合には、低域信号の補正を行わないことで、低域信号のトーンを抑圧しない。このように、逆フィルタモードのオン、オフに応じて、トーンの抑圧の制御を行い、復号装置７００が復号を行う場合における、音信号の品質劣化の問題を解消する。

オーディオ符号化装置６００は、逆フィルタモードが「オフ」の場合には、低域信号の補正を行うことで、トーンを抑圧するので、低域と高域との境界付近に、トーンが複数生成することにより発生するうねりを抑止し、音信号の品質劣化の問題を解消する。

また、オーディオ符号化装置６００は、逆フィルタモードが「オン」の場合には、低域信号の補正を行わないことで、低域と高域との境界付近に、トーンが発生しないことによる音声劣化の問題を解消する。

オーディオ符号化装置６００は、音信号に含まれるトーン成分の平均値および音信号の平均電力を基にして、逆フィルタモードがオンであるかオフであるかを推定する。これにより、復号装置７００側で逆フィルタを実行するか否かを、音信号の特徴に合わせて自動で、推定することができる。

本実施例６に係る復号装置７００は、逆フィルタモードのオン、オフに応じて、低域信号の周波数スペクトルを補正（低域に対する逆フィルタを実行）し、補正した低域信号の周波数スペクトルを用いて、高域信号を復号する。上記のように、オーディオ符号化装置６００は、逆フィルタモードがオンの場合には、低域信号のトーン成分の補正が行われていないので、逆フィルタモードを実行しても、復号した音信号の境界付近に、トーン成分が残り、音質劣化の問題を解消することができる。

次に、上記実施例に示したオーディオ符号化装置１００（２００，３００，３０１，４００，６００）と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図３３は、オーディオ符号化装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

図３３に示すように、コンピュータ５００は、各種演算処理を実行するＣＰＵ５０１と、ユーザからのデータの入力を受け付ける入力装置５０２と、ディスプレイ５０３とを有する。また、コンピュータ５００は、記憶媒体からプログラム等を読み取る読み取り装置５０４と、外部装置との間でデータの授受を行うインターフェース装置５０５とを有する。また、コンピュータ５００は、各種情報を一時記憶するＲＡＭ５０６と、ハードディスク装置５０７とを有する。そして、各装置５０１〜５０７は、バス５０８に接続される。

ハードディスク装置５０７は、判定プログラム５０７ａ、符号化プログラム５０７ｂ、多重化プログラム５０７ｃを有する。ＣＰＵ５０１は、判定プログラム５０７ａ、符号化プログラム５０７ｂ、多重化プログラム５０７ｃを読み出してＲＡＭ５０６に展開する。

判定プログラム５０７ａは、判定プロセス５０６ａとして機能する。符号化プログラム５０７ｂは、符号化プロセス５０６ｂとして機能する。多重化プログラム５０７ｃは、多重化プロセス５０６ｃとして機能する。

判定プロセス５０６ａの処理は、判定部１３０，２１０，６０４の処理に対応する。符号化プロセス５０６ｂの処理は、低域信号抽出部１１０、高域情報抽出部１２０、低域補正部１４０、入力信号補正部２２０、低域符号化部１５０，３２０、高域補正部１６０，４１０、高域符号化部１７０、符号化部６００ａの処理に対応する。多重化プロセス５０６ｃの処理は、多重化部１８０，６０９の処理に対応する。

次に、上記実施例に示した復号装置７００と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図３４は、復号装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

図３４に示すように、コンピュータ５５０は、各種演算処理を実行するＣＰＵ５５１と、ユーザからのデータの入力を受け付ける入力装置５５２と、ディスプレイ５５３とを有する。また、コンピュータ５５０は、記憶媒体からプログラム等を読み取る読み取り装置５５４と、外部装置との間でデータの授受を行うインターフェース装置５５５とを有する。また、コンピュータ５５０は、各種情報を一時記憶するＲＡＭ５５６と、ハードディスク装置５５７とを有する。そして、各装置５５１〜５５７は、バス５５８に接続される。

ハードディスク装置５５７は、分離プログラム５５７ａ、低域復号プログラム５５７ｂ、高域生成プログラム５５７ｃ、合成プログラム５５７ｄを有する。ＣＰＵ５５１は、分離プログラム５５７ａ、低域復号プログラム５５７ｂ、高域生成プログラム５５７ｃ、合成プログラム５５７ｄを読み出してＲＡＭ５５６に展開する。

分離プログラム５５７ａは、分離プロセス５５６ａとして機能する。低域復号プログラム５５７ｂは、低域復号プロセス５５６ｂとして機能する。高域生成プログラム５５７ｃは、高域生成プロセス５５６ｃとして機能する。合成プログラム５５７ｄは、合成プロセス５５６ｄとして機能する。

分離プロセス５５６ａの処理は、符号分離部７０１の処理に対応する。低域復号プロセス５５６ｂの処理は、低域復号部７０２の処理に対応する。高域生成プロセス５５６ｃは、高域生成部７０５の処理に対応する。合成プロセス５５６ｄの処理は、合成部７０７の処理に対応する。

なお、各プログラム５０７ａ〜５０７ｃ，５５７ａ〜５５７ｄについては、必ずしも最初からハードディスク装置５０７，５５７に記憶させておかなくても良い。例えば、コンピュータ５００，５５０に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ５００，５５０が各プログラム５０７ａ〜５０７ｃ，５５７ａ〜５５７ｄを読み出して実行するようにしても良い。

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。

（付記１）入力信号の低域と高域との境界にトーンが含まれるか否かを判定する判定部と、
前記境界にトーンが含まれている場合に、前記低域、又は、前記高域の一方のトーンを抑圧し、前記入力信号の前記低域を符号化することで、低域符号を生成し、前記入力信号の前記高域を符号化することで、高域符号を生成する符号化部と、
低域符号と高域符号を多重化することで、符号化ストリームを生成する多重化部と
を有することを特徴とするオーディオ符号化装置。

（付記２）前記符号化部は、前記高域の入力信号の周波数スペクトルから包絡情報を抽出し、前記包絡情報を含む高域情報を符号化することで、前記高域符号を生成し、前記高域のトーンを抑圧する場合には、前記境界付近における前記包絡情報の値を抑制することを特徴とする付記１に記載のオーディオ符号化装置。

（付記３）前記判定部は、符号化するビットレートと閾値との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする付記１または２に記載のオーディオ符号化装置。

（付記４）前記判定部は、前記低域の入力信号と前記低域符号を復号した入力信号との第１誤差、および、前記高域の入力信号と前記高域符号を復号した入力信号との第２誤差を算出し、前記第１誤差と第２誤差との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする付記１または２に記載のオーディオ符号化装置。

（付記５）前記符号化部は、トーンを抑圧する場合に、段階的にトーンの大きさを小さくしていくことを特徴とする付記１〜４のいずれか一つに記載のオーディオ符号化装置。

（付記６）前記符号化部は、前記境界にトーンが含まれている場合に、前記高域の下限を、所定周波数分だけ高域側にずらすことで、高域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、高域符号を生成することを特徴とする付記１に記載のオーディオ符号化装置。

（付記７）前記符号化部は、前記境界にトーンが含まれている場合に、前記低域の上限を、所定周波数分だけ低域側にずらすことで、低域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、低域符号を生成することを特徴とする付記１に記載のオーディオ符号化装置。

（付記８）前記高域情報は、高域を所定幅で分割した帯域毎にトーンの有無を示すトーン周波数の情報を更に含み、前記符号化部は、前記境界に対応する帯域のトーンの有無を、無に設定することを特徴とする付記２に記載のオーディオ符号化装置。

（付記９）前記符号化部は、前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域をそのまま複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧した後に、前記低域符号を生成し、
前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域を非相関化した後に複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧することなく、前記低域符号を生成することを特徴とする付記１に記載のオーディオ符号化装置。

（付記１０）前記符号化部は、前記入力信号に含まれるトーン成分の平均値および前記入力信号の平均値を基にして、前記復号装置が、前記低域を非相関化した後に、前記低域符号を生成するか否かを判定することを特徴とする付記９に記載のオーディオ符号化装置。

（付記１１）コンピュータが実行するオーディオ符号化方法であって、
入力信号の低域と高域との境界にトーンが含まれるか否かを判定し、
前記境界にトーンが含まれている場合に、前記低域、又は、前記高域の一方のトーンを抑圧し、
前記入力信号の前記低域を符号化することで低域符号を生成し、
前記入力信号の前記高域を符号化することで、高域符号を生成し、
低域符号と高域符号を多重化することで、符号化ストリームを生成する
処理を実行することを特徴とするオーディオ符号化方法。

（付記１２）前記高域の入力信号の周波数スペクトルから包絡情報を抽出し、前記包絡情報を含む高域情報を符号化することで、前記高域符号を生成する処理を更に実行し、前記トーンを抑圧する処理は、前記高域のトーンを抑圧する場合には、前記境界付近における前記包絡情報の値を抑制することを特徴とする付記１１に記載のオーディオ符号化方法。

（付記１３）前記トーンを抑圧する処理は、符号化するビットレートと閾値との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする付記１１または１２に記載のオーディオ符号化方法。

（付記１４）前記トーンを抑圧する処理は、前記低域の入力信号と前記低域符号を復号した入力信号との第１誤差、および、前記高域の入力信号と前記高域符号を復号した入力信号との第２誤差を算出し、前記第１誤差と第２誤差との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする付記１１または１２に記載のオーディオ符号化方法。

（付記１５）前記トーンを抑圧する処理は、トーンを抑圧する場合に、段階的にトーンの大きさを小さくしていくことを特徴とする付記１１〜１４のいずれか一つに記載のオーディオ符号化方法。

（付記１６）前記高域符号を生成する処理は、前記境界にトーンが含まれている場合に、前記高域の下限を、所定周波数分だけ高域側にずらすことで、高域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、高域符号を生成することを特徴とする付記１１に記載のオーディオ符号化方法。

（付記１７）前記低域符号を生成する処理は、前記境界にトーンが含まれている場合に、前記低域の上限を、所定周波数分だけ低域側にずらすことで、低域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、高域符号を生成することを特徴とする付記１１に記載のオーディオ符号化方法。

（付記１８）前記高域情報は、高域を所定幅で分割した帯域毎にトーンの有無を示すトーン周波数の情報を更に含み、前記高域符号を生成する処理は、前記境界に対応する帯域のトーンの有無を、無に設定することを特徴とする付記１２に記載のオーディオ符号化方法。

（付記１９）前記低域符号を生成する処理は、前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域をそのまま複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧した後に、前記低域符号を生成し、
前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域を非相関化した後に複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧することなく、前記低域符号を生成することを特徴とする付記１１に記載のオーディオ符号化方法。

（付記２０）前記低域符号を生成する処理は、前記入力信号に含まれるトーン成分の平均値および前記入力信号の平均値を基にして、前記復号装置が、前記低域を非相関化した後に、前記低域符号を生成するか否かを判定することを特徴とする付記１９に記載のオーディオ符号化方法。

（付記２１）コンピュータに、
入力信号の低域と高域との境界にトーンが含まれるか否かを判定し、
前記境界にトーンが含まれている場合に、前記低域、又は、前記高域の一方のトーンを抑圧し、
前記入力信号の前記低域を符号化することで低域符号を生成し、
前記入力信号の前記高域を符号化することで、高域符号を生成し、
低域符号と高域符号を多重化することで、符号化ストリームを生成する
処理を実行させることを特徴とするオーディオ符号化プログラム。

（付記２２）前記高域の入力信号の周波数スペクトルから包絡情報を抽出し、前記包絡情報を含む高域情報を符号化することで、前記高域符号を生成する処理を更に実行し、前記トーンを抑圧する処理は、前記高域のトーンを抑圧する場合には、前記境界付近における前記包絡情報の値を抑制することを特徴とする付記２１に記載のオーディオ符号化プログラム。

（付記２３）前記トーンを抑圧する処理は、符号化するビットレートと閾値との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする付記２１または２２に記載のオーディオ符号化プログラム。

（付記２４）前記トーンを抑圧する処理は、前記低域の入力信号と前記低域符号を復号した入力信号との第１誤差、および、前記高域の入力信号と前記高域符号を復号した入力信号との第２誤差を算出し、前記第１誤差と第２誤差との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする付記２１または２２に記載のオーディオ符号化プログラム。

（付記２５）前記トーンを抑圧する処理は、トーンを抑圧する場合に、段階的にトーンの大きさを小さくしていくことを特徴とする付記２１〜２４のいずれか一つに記載のオーディオ符号化プログラム。

（付記２６）前記高域符号を生成する処理は、前記境界にトーンが含まれている場合に、前記高域の下限を、所定周波数分だけ高域側にずらすことで、高域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、高域符号を生成することを特徴とする付記２１に記載のオーディオ符号化プログラム。

（付記２７）前記低域符号を生成する処理は、前記境界にトーンが含まれている場合に、前記低域の上限を、所定周波数分だけ低域側にずらすことで、低域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、低域符号を生成することを特徴とする付記２１に記載のオーディオ符号化プログラム。

（付記２８）前記高域情報は、高域を所定幅で分割した帯域毎にトーンの有無を示すトーン周波数の情報を更に含み、前記高域符号を生成する処理は、前記境界に対応する帯域のトーンの有無を、無に設定することを特徴とする付記２２に記載のオーディオ符号化プログラム。

（付記２９）前記低域符号を生成する処理は、前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域をそのまま複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧した後に、前記低域符号を生成し、
前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域を非相関化した後に複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧することなく、前記低域符号を生成することを特徴とする付記２１に記載のオーディオ符号化プログラム。

（付記３０）前記低域符号を生成する処理は、前記入力信号に含まれるトーン成分の平均値および前記入力信号の平均値を基にして、前記復号装置が、前記低域を非相関化した後に、前記低域符号を生成するか否かを判定することを特徴とする付記２１に記載のオーディオ符号化プログラム。

（付記３１）符号化ストリームを低域符号と高域符号に分離する符号分離部と、
前記低域符号を復号することで低域信号を生成する低域復号部と、
前記低域信号の周波数スペクトルを非相関化するか否かの制御情報を基にして、前記低域信号の周波数スペクトルを非相関化し、
前記高域符号を復号することで、音信号の周波数スペクトルの包絡情報を含む高域情報を生成し、前記低域信号の周波数スペクトルと、前記高域情報とを基にして、高域信号を生成する高域生成部と、
前記低域信号と前記高域信号とを合成することで、前記音信号を生成する合成部と
を有することを特徴とする復号装置。

（付記３２）コンピュータが実行する復号方法であって、
符号化ストリームを低域符号と高域符号に分離し、
前記低域符号を復号することで低域信号を生成し、
前記低域信号の周波数スペクトルを非相関化するか否かの制御情報を基にして、前記低域信号の周波数スペクトルを非相関化し、
前記高域符号を復号することで、音信号の周波数スペクトルの包絡情報を含む高域情報を生成し、前記低域信号の周波数スペクトルと、前記高域情報とを基にして、高域信号を生成し、
前記低域信号と前記高域信号とを合成することで、前記音信号を生成する
処理を実行することを特徴とする復号方法。

（付記３３）コンピュータに、
符号化ストリームを低域符号と高域符号に分離し、
前記低域符号を復号することで低域信号を生成し、
前記低域信号の周波数スペクトルを非相関化するか否かの制御情報を基にして、前記低域信号の周波数スペクトルを非相関化し、
前記高域符号を復号することで、音信号の周波数スペクトルの包絡情報を含む高域情報を生成し、前記低域信号の周波数スペクトルと、前記高域情報とを基にして、高域信号を生成し、
前記低域信号と前記高域信号とを合成することで、前記音信号を生成する
処理を実行させることを特徴とする復号プログラム。

５０ネットワーク
１００，２００，３００，３０１，４００，６００オーディオ符号化装置
１１０低域信号抽出部
１２０，６０２高域情報抽出部
１３０，２１０，６０４判定部
１４０，６０６低域補正部
１５０，３２０，６０８低域符号化部
１６０，４１０高域補正部
１７０高域符号化部
１８０，６０９多重化部
２２０入力信号補正部
３１０補正制御部
６０１時間周波数変換部
６０３高域符号化部
６０５低域抽出部
６０７周波数時間変換部
７００復号装置
７０１符号分離部
７０２低域復号部
７０３分析ＱＭＦ部
７０４高域逆量子化部
７０５高域生成部
７０６包絡調整部
７０７合成部

Claims

入力信号の低域と高域との境界にトーンが含まれるか否かを判定する判定部と、
前記境界にトーンが含まれている場合に、前記低域、又は、前記高域の一方のトーンを抑圧し、前記入力信号の前記低域を符号化することで、低域符号を生成し、前記入力信号の前記高域を符号化することで、高域符号を生成する符号化部と、
低域符号と高域符号を多重化することで、符号化ストリームを生成する多重化部と
を有することを特徴とするオーディオ符号化装置。
前記符号化部は、前記高域の入力信号の周波数スペクトルから包絡情報を抽出し、前記包絡情報を含む高域情報を符号化することで、前記高域符号を生成し、前記高域のトーンを抑圧する場合には、前記境界付近における前記包絡情報の値を抑制することを特徴とする請求項１に記載のオーディオ符号化装置。
前記判定部は、符号化するビットレートと閾値との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする請求項１または２に記載のオーディオ符号化装置。
前記判定部は、前記低域の入力信号と前記低域符号を復号した入力信号との第１誤差、および、前記高域の入力信号と前記高域符号を復号した入力信号との第２誤差を算出し、前記第１誤差と第２誤差との比較結果を基にして、前記低域のトーンを抑圧するのか、前記高域のトーンを抑圧するのかを判定することを特徴とする請求項１または２に記載のオーディオ符号化装置。
前記符号化部は、前記境界にトーンが含まれている場合に、前記高域の下限を、所定周波数分だけ高域側にずらすことで、高域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、高域符号を生成することを特徴とする請求項１に記載のオーディオ符号化装置。
前記符号化部は、前記境界にトーンが含まれている場合に、前記低域の上限を、所定周波数分だけ低域側にずらすことで、低域を符号化する際の帯域を補正し、補正した帯域に対応する入力信号を符号化して、低域符号を生成することを特徴とする請求項１に記載のオーディオ符号化装置。
前記高域情報は、高域を所定幅で分割した帯域毎にトーンの有無を示すトーン周波数の情報を更に含み、前記符号化部は、前記境界に対応する帯域のトーンの有無を、無に設定することを特徴とする請求項２に記載のオーディオ符号化装置。
前記符号化部は、前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域をそのまま複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧した後に、前記低域符号を生成し、
前記符号化ストリームを復号する復号装置が、前記入力信号の前記低域を非相関化した後に複製することで、前記入力信号の前記高域を生成する処理を行う場合に、前記低域に含まれる前記トーンを抑圧することなく、前記低域符号を生成することを特徴とする請求項１に記載のオーディオ符号化装置。
前記符号化部は、前記入力信号に含まれるトーン成分の平均値および前記入力信号の平均値を基にして、前記復号装置が、前記低域を非相関化した後に、前記低域符号を生成するか否かを判定することを特徴とする請求項８に記載のオーディオ符号化装置。
コンピュータが実行するオーディオ符号化方法であって、
入力信号の低域と高域との境界にトーンが含まれるか否かを判定し、
前記境界にトーンが含まれている場合に、前記低域、又は、前記高域の一方のトーンを抑圧し、
前記入力信号の前記低域を符号化することで低域符号を生成し、
前記入力信号の前記高域を符号化することで、高域符号を生成し、
低域符号と高域符号を多重化することで、符号化ストリームを生成する
処理を実行することを特徴とするオーディオ符号化方法。
コンピュータに、
入力信号の低域と高域との境界にトーンが含まれるか否かを判定し、
前記境界にトーンが含まれている場合に、前記低域、又は、前記高域の一方のトーンを抑圧し、
前記入力信号の前記低域を符号化することで低域符号を生成し、
前記入力信号の前記高域を符号化することで、高域符号を生成し、
低域符号と高域符号を多重化することで、符号化ストリームを生成する
処理を実行させることを特徴とするオーディオ符号化プログラム。