WO2012102149A1

WO2012102149A1 - 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体

Info

Publication number: WO2012102149A1
Application number: PCT/JP2012/050970
Authority: WO
Inventors: 守谷　健弘; 登原田; 祐介日和▲崎▼; 優鎌本
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 2011-01-25
Filing date: 2012-01-18
Publication date: 2012-08-02
Anticipated expiration: 2013-07-25
Also published as: RU2013134463A; CN103329199B; JPWO2012102149A1; KR20130111611A; US9711158B2; RU2554554C2; EP2650878A1; US20130311192A1; KR101740359B1; CN103329199A; JP5596800B2; EP2650878B1; KR20160080115A; ES2558508T3; EP2650878A4

Abstract

　音響信号の低ビットでの符号化による品質を低演算量で改善する符号化技術を提供する。フレーム毎に、音響信号の周期性に対応するサンプルの間隔Ｔ、または、音響信号の基本周波数の整数倍に対応するサンプルの間隔Ｔを、間隔Ｔの候補の集合Ｓの中から決定する間隔決定処理と、間隔決定処理で決定された間隔Ｔを符号化して補助情報を得る補助情報生成処理を含む。間隔決定処理は、補助情報で表現可能な間隔ＴのＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を集合Ｓとして、間隔Ｔを決定する。

Description

符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体

　本発明は、音響信号の符号化技術に関する。より詳しくは、音響信号を周波数領域に変換して得られた周波数領域のサンプル列の符号化と当該符号化処理の際にサンプル列の並べ替えの指標となる周期性特徴量（例えば基本周波数やピッチ周期）を決定する技術に関する。

　低ビット（例えば10kbit/s～20kbit/s程度）の音声信号や音響信号の符号化方法として、DFT（離散フーリエ変換）やMDCT（変形離散コサイン変換）などの直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX（transform coded excitation：変換符号化励振）符号化モードを持ち、この中ではDFT係数を8サンプルごとに正規化してベクトル量子化している。

　また、TwinVQ（Transform domain Weighted Interleave Vector Quantization）では、MDCT係数全体を固定の規則で並べ替えた後のサンプルの集まりがベクトルとして符号化される。この際、例えば、MDCT係数からピッチ周期ごとの大きな成分を抽出し、ピッチ周期に対応する情報を符号化し、さらにピッチ周期ごとの大きな成分を取り除いた残りのMDCT係数列を並べ替えて、並べ替え後のMDCT係数列を所定サンプル数ごとにベクトル量子化することにより符号化する方法などが採用される場合もある。TwinVQに関する文献として非特許文献１，２を例示できる。

　また、等間隔にサンプルを抽出して符号化する技術として例えば特許文献１を例示できる。

特開２００９－１５６９７１号公報

T. Moriya, N. Iwakami, A. Jin, K. Ikeda, and S. Miki, "A Design of Transform Coder for Both Speech and Audio Signals at 1 bit/sample," Proc. ICASSP'97, pp. 1371-1374, 1997. J.Herre, E. Allamanche, K. Brandenburg, M. Dietz, B.Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami, T. Norimatsu, M. Tsushima, T. Ishikawa, "The integrated Filterbank Based Scalable MPEG-4 Audio Coder," 105th Convention Audio Engineering Society, 4810, 1998.

　AMR-WB+をはじめ、TCXに基づく符号化では周期性に基づく周波数領域の係数の振幅のばらつきは考慮されていないため、ばらつきの大きい振幅をまとめて符号化すると符号化効率は低下してしまう。TCXでの量子化や符号化には各種変形例があるが、例えば、量子化により離散値となったMDCT係数を周波数の低いほうから並べた系列をエントロピー符号化によって圧縮を行う場合を考える。この場合、複数のサンプルを１シンボル（符号化単位）とし、そのシンボルの直前のシンボルに依存して割り当て符号を適応的に制御する。一般に、振幅が小さければ短い符号が割り当てられ、振幅が大きい場合には長い符号が割り当てられる。シンボルの直前のシンボルに依存して割り当て符号を適応的に制御するため、振幅の小さい値が連続すると、ますます短い符号が割り当てられる一方、小さい振幅のサンプルのあとに急に大きな振幅が出現すると非常に長い符号が割り当てられてしまう。

　また、従来のTwinVQは、所定サンプルにより構成されるベクトルの全てに同じ符号帳の符号を割り当てる固定長符号のベクトル量子化を用いることを前提として設計されており、可変長符号化を使ってMDCT係数を符号化することは一切想定されていなかった。

　本発明は、このような技術的背景に鑑みて、離散信号、特に音声音響ディジタル信号の低ビットでの符号化による品質を低演算量で改善する符号化技術と当該符号化の際に実施されるサンプル列の並べ替えの指標となる周期性特徴量を決定する技術を提供することを目的とする。

　本発明の符号化技術によると、フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、フレーム毎に、音響信号の周期性に対応するサンプルの間隔Ｔ、または、音響信号の基本周波数の整数倍に対応するサンプルの間隔Ｔを、間隔Ｔの候補の集合Ｓの中から決定する間隔決定処理と、間隔決定処理で決定された間隔Ｔを符号化して補助情報を得る補助情報生成処理と、（１）サンプル列の全てのサンプルが含まれ、かつ、（２）間隔決定処理で決定された間隔Ｔに基づいて、サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として、並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化処理とを有する。間隔決定処理では、補助情報で表現可能な間隔ＴのＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を集合Ｓとして、間隔Ｔを決定する。

　間隔決定処理は、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補に隣接する値または／および所定の差分を持つ値を集合Ｓに加える追加処理を更に含んでもよい。

　間隔決定処理は、補助情報で表現可能な間隔ＴのＺ個の候補のうちの一部であるＺ₁個の候補から、現在のフレームの音響信号または／およびサンプル列から求まる指標に基づいて選択した一部の候補をＺ_２個の候補（ただしＺ_２＜Ｚ_１）とする予備選択処理を更に含んでもよい。

　間隔決定処理は、補助情報で表現可能な間隔ＴのＺ個の候補のうちの一部であるＺ₁個の候補から、現在のフレームの音響信号または／およびサンプル列から求まる指標に基づいて一部の候補を選択する予備選択処理と、予備選択処理で選択された候補と、予備選択処理で選択された候補に隣接する値または／および所定の差分を持つ値とのセットをＺ_２個の候補とする第二追加処理を更に含んでもよい。

　間隔決定処理は、現在のフレームの音響信号または／およびサンプル列から求まる指標に基づいて、集合Ｓに含まれる間隔Ｔの候補のうちの一部の候補を選択する第二予備選択処理と、第二予備選択処理で選択された一部の候補により構成される集合を対象として上記間隔Ｔを決定する最終選択処理とを含んでもよい。

　現在のフレームの音響信号の定常性の大きさを表す指標値が大きいほど、集合Ｓにて、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補が占める割合が大きくなるようにしてもよい。

　現在のフレームの音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、集合ＳにはＺ_２個の候補のみが含まれるようにしてもよい。

　現在のフレームの音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きい、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きい、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さい、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さい、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きい、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きい、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さい、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さい、
(e-1)「現在のフレームの上記音響信号のパワー」が大きい、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きい、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さい、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さい、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である。

　サンプル列符号化処理は、並べ替え前のサンプル列を符号化して得られる符号列と、並べ替え後のサンプル列を符号化して得られる符号列と補助情報、のうち符号量が少ない方を出力する処理を含んでもよい。

　サンプル列符号化処理は、並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と補助情報の符号量との合計が、並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値より少ない場合には、並べ替え後のサンプル列を符号化して得られる符号列と補助情報とを出力し、並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値が、並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と補助情報の符号量との合計より少ない場合には、並べ替え前のサンプル列を符号化して得られる符号列を出力するようにしてもよい。

　直前のフレームで出力した符号列が並べ替え後のサンプル列を符号化して得られた符号列である場合のほうが、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合よりも、集合Ｓにて、所定フレーム数だけ過去のフレームにおいて間隔決定処理の対象となった候補が占める割合が大きくなるようにしてもよい。

　直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合には、集合ＳにはＺ_２個の候補のみが含まれるようにしてもよい。

　現在のフレームが時間的に先頭にあるフレームである場合、直前のフレームが本発明の符号化方法以外で符号化された場合、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合、の何れかに該当する場合には、集合ＳにはＺ_２個の候補のみが含まれるようにしてもよい。

　また、本発明による、フレーム単位の音響信号の周期性特徴量を決定する方法は、フレーム毎に、音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定処理と、周期性特徴量決定処理で得られた周期性特徴量を符号化して補助情報を得る補助情報生成処理とを有する。周期性特徴量決定処理では、補助情報で表現可能な周期性特徴量のＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を周期性特徴量の候補の集合Ｓとして、周期性特徴量を決定する。

　周期性特徴量決定処理は、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補に隣接する値または／および所定の差分を持つ値を集合Ｓに加える追加処理を更に含んでもよい。

　現在のフレームの音響信号の定常性の大きさを表す指標値が大きいほど、集合Ｓにて、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定処理の対象となった候補が占める割合が大きいようにしてもよい。

　本発明によると、例えば、音響信号に由来する周波数領域のサンプル列に含まれる少なくとも一部のサンプルを、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように並べ替えることにより、サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように並べ替えるという少ない演算量で実行可能な処理を行うことにより、符号化効率の向上や量子化歪の軽減などが実現される。また、音響信号の定常区間の性質に基づき、過去のフレームで考慮された周期性特徴量や上記間隔の候補を考慮することによって、現在のフレームにおける周期性特徴量や上記間隔の決定を効率良く行うことができる。

符号化装置の実施形態の機能構成例を示す図。符号化方法の実施形態の処理手順を示す図。サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。復号装置の実施形態の機能構成例を示す図。復号方法の実施形態の処理手順を示す図。間隔Ｔを決定するための処理機能の一例を示す図。間隔Ｔを決定するための処理手順の一例を示す図。間隔Ｔを決定するための処理手順の変形例を示す図。符号化装置の実施形態の変形例を示す図。

　図面を参照しながら本発明の実施形態を説明する。なお、重複する構成要素には同じ参照符号を当てて重複説明を省略する。

　本発明は、所定の時間区間の音響信号に由来する周波数領域のサンプル列を量子化する枠組みの中で、周波数領域のサンプルの特徴量に基づくサンプルの並べ替えによって量子化歪を小さくしつつ、可変長符号化を利用することで符号量を少なくするという符号化の改善を特徴の一つとする。以下、所定の時間区間をフレームと呼称する。例えば基本周期が比較的明瞭なフレームでは周期性に合わせたサンプルの並べ替えによって大きな振幅のサンプルを集中させることにより符号化の改善が実現する。ここで、音響信号に由来する周波数領域のサンプル列として、例えば、フレーム単位の音声音響ディジタル信号が時間領域から周波数領域に変換して得られるDFT係数列やMDCT係数列、このような係数列に対して正規化や重み付けや量子化などの処理が適用された係数列などを例示することができる。以下、MDCT係数列を例にとって本発明の実施形態を説明する。

[実施形態]
「符号化処理」
　最初に図１～図４を参照して符号化処理を説明する。本発明の符号化処理は、例えば、周波数領域変換部１と重み付け包絡正規化部２と正規化利得計算部３と量子化部４と並べ替え部５と符号化部６とを備える図１の符号化装置１００、または、周波数領域変換部１と重み付け包絡正規化部２と正規化利得計算部３と量子化部４と並べ替え部５と符号化部６と間隔決定部７と補助情報生成部８を備える図１０の符号化装置１００ａにより行われる。ただし、符号化装置１００または符号化装置１００ａは周波数領域変換部１と重み付け包絡正規化部２と正規化利得計算部３と量子化部４とは必ずしも備える必要は無く、例えば、符号化装置１００は並べ替え部５と符号化部６、符号化装置１００ａは並べ替え部５と符号化部６と間隔決定部７と補助情報生成部８とにより構成されることもある。なお、図１０に例示される符号化装置１００ａでは間隔決定部７が並べ替え部５と符号化部６と補助情報生成部８を含むが、このような構成に限定されるものではない。

「周波数領域変換部１」
　まず、周波数領域変換部１がフレーム単位で音声音響ディジタル信号を周波数領域のＮ点のMDCT係数列に変換する（ステップＳ１）。

　一般論として、符号化側ではMDCT係数列を量子化して、量子化されたMDCT係数列を符号化して、得られた符号列を復号側へ伝送し、復号側では当該符号列から量子化されたMDCT係数列を再構成し、さらに逆MDCT変換によって時間領域の音声音響ディジタル信号を再構成することができる。ところで、MDCT係数の振幅は近似的に通常のDFTのパワースペクトルと同じ振幅包絡（パワースペクトル包絡）を持つ。このため、振幅包絡の対数値に比例する情報割り当てを行うことによって、全帯域のMDCT係数の量子化歪（量子化誤差）を均一に分散させることができ、全体の量子化歪を小さくすることができ、加えて情報圧縮も実現される。なお、パワースペクトル包絡は線形予測分析によって求められた線形予測係数を使って効率よく推定することができる。このような量子化誤差を制御する方法としては、各MDCT係数の量子化ビットを適応的に割り当てる（振幅を平坦にした後で量子化のステップ幅を調整する）方法や、重み付けベクトル量子化により適応的に重みをつけて符号を決定する方法がある。ここでは、本発明の実施形態において実行される量子化方法の一例を説明するが、説明する量子化方法に限定されるものではないことに留意されたい。

「重み付け包絡正規化部２」
　重み付け包絡正規化部２が、フレーム単位の音声音響ディジタル信号に対する線形予測分析によって求められた線形予測係数を用いて推定された音声音響ディジタル信号のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する（ステップＳ２）。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部２は、パワースペクトル包絡を鈍らせた重み付けパワースペクトル包絡係数列を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。

[重み付け包絡正規化処理の具体例]
　N点のMDCT係数列の各係数X(1)，・・・，X(N)に対応するパワースペクトル包絡係数列の各係数W(1)，・・・，W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるｐ次自己回帰過程により、時刻ｔの時間信号x(t)は、ｐ時点まで遡った過去の自分自身の値x(t-1)，・・・，x(t-p)と予測残差e(t)と線形予測係数α₁，・・・，α_pによって式（１）で表される。このとき、パワースペクトル包絡係数列の各係数W(n)［1≦n≦N］は式（２）で表される。exp（・）はネイピア数を底とする指数関数、ｊは虚数単位、σ²は予測残差エネルギーである。

　線形予測係数は、周波数領域変換部１に入力された音声音響ディジタル信号を重み付け包絡正規化部２によって線形予測分析して得られたものでもよいし、符号化装置１００内または符号化装置１００ａ内に在る図示しない他の手段によって音声音響ディジタル信号を線形予測分析して得られたものであってもよい。このような場合には、重み付け包絡正規化部２が線形予測係数を用いてパワースペクトル包絡係数列の各係数W(1)，・・・，W(N)を求める。また、符号化装置１００内または符号化装置１００ａ内に在る他の手段（パワースペクトル包絡係数列計算部９）によってパワースペクトル包絡係数列の各係数W(1)，・・・，W(N)が既に得られている場合には、重み付け包絡正規化部２は、このパワースペクトル包絡係数列の各係数W(1)，・・・，W(N)を用いることができる。なお、後述する復号装置２００でも符号化装置１００または符号化装置１００ａで得られた値と同じ値を得る必要があるため、量子化された線形予測係数および／またはパワースペクトル包絡係数列が利用される。以後の説明において、特に断りが無い限り、「線形予測係数」ないし「パワースペクトル包絡係数列」は量子化された線形予測係数ないしパワースペクトル包絡係数列を意味する。また、線形予測係数は例えば従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を予測係数符号とする符号化技術、などである。符号化装置１００内または符号化装置１００ａ内に在る他の手段によってパワースペクトル包絡係数列が得られる構成である場合は、符号化装置１００内または符号化装置１００ａ内に在る他の手段において線形予測係数が従来的な符号化技術によって符号化されて予測係数符号が復号側へ伝送される。

　ここでは、重み付け包絡正規化処理の具体例として二つの例を示すが、本発明ではこれらの例に限定されるものではない。
＜例１＞
　重み付け包絡正規化部２は、MDCT係数列の各係数X(1)，・・・，X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値W_γ(1)，・・・，W_γ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W_γ(1)，・・・，X(N)/W_γ(N)を得る処理を行う。補正値W_γ(n)［1≦n≦N］は式（３）で与えられる。但し、γは１以下の正の定数であり、パワースペクトル係数を鈍らせる定数である。

＜例２＞
　重み付け包絡正規化部２は、MDCT係数列の各係数X(1)，・・・，X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗（０＜β＜１）の値W(1)^β，・・・，W(N)^βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)^β，・・・，X(N)/W(N)^βを得る処理を行う。

　この結果、フレーム単位の重み付け正規化MDCT係数列が得られるが、重み付け正規化MDCT係数列は入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないが、入力されたMDCT係数列のパワースペクトル包絡と類似の大小関係を有するもの、すなわち、低い周波数に対応する係数側の領域にやや大きな振幅を持ち、ピッチ周期に起因する微細構造をもつもの、となる。

　なお、重み付け包絡正規化処理に対応する逆処理、つまり、重み付け正規化MDCT係数列からMDCT係数列を復元する処理が復号側にて行われるため、パワースペクトル包絡係数列から重み付けパワースペクトル包絡係数列を算出する方法を符号化側と復号側で共通の設定にしておくことが必要である。

「正規化利得計算部３」
　次に、正規化利得計算部３が、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数（以下、利得という。）を求める（ステップＳ３）。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部３は、フレームごとに、重み付け正規化MDCT係数列の各係数をこの利得で正規化（除算）する。

「量子化部４」
　次に、量子化部４が、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップＳ３の処理で決定された量子化ステップ幅で量子化する（ステップＳ４）。

「並べ替え部５」
　ステップＳ４の処理で得られたフレーム単位の量子化MDCT係数列は、本実施形態の要部である並べ替え部５の入力となるが、並べ替え部５の入力は、ステップＳ１～ステップＳ４の各処理で得られた係数列に限定されない。例えば、重み付け包絡正規化部２による正規化が適用されていない係数列や量子化部４による量子化が適用されていない係数列であってもよい。このことを明示的に理解するため、以下、並べ替え部５の入力を音響信号に由来する「周波数領域のサンプル列」あるいは単に「サンプル列」と呼称することにする。この実施形態では、ステップＳ４の処理で得られた量子化MDCT係数列が「周波数領域のサンプル列」に相当し、この場合、周波数領域のサンプル列を構成するサンプルは量子化MDCT係数列に含まれる係数に相当する。

　並べ替え部５は、フレームごとに、（１）周波数領域のサンプル列の全てのサンプルを含み、かつ、（２）サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように周波数領域のサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する（ステップＳ５）。ここで「サンプルの大きさを反映する指標」とは、例えばサンプルの振幅の絶対値やパワー（自乗値）であるが、これらに限定されない。

[並べ替え処理の詳細]
　この並べ替え処理の具体例を説明する。例えば、並べ替え部５は、（１）サンプル列の全てのサンプルを含み、かつ、（２）サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。

　この理由は、基本周波数や高調波（基本周波数の整数倍波）に対応するサンプルとそれらの近傍のサンプルの振幅の絶対値やパワーは、基本周波数と高調波を除く周波数領域に対応するサンプルの振幅の絶対値やパワーよりも大きいという音響信号、特に音声や楽音などに顕著な特徴に基づく。ここで、音声や楽音などの音響信号から抽出される音響信号の周期性の特徴量（例えばピッチ周期）は、基本周波数と等価なものであるから、音響信号の周期性の特徴量（例えばピッチ周期）やその整数倍に対応するサンプルとそれらの近傍のサンプルの振幅の絶対値やパワーは、周期性特徴量やその整数倍を除く周波数領域に対応するサンプルの振幅の絶対値やパワーよりも大きいという特徴も認められる。

　そして、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルは、低周波側に一まとまりになるように集められる。以下、音響信号の周期性または基本周波数に対応するサンプルと当該音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔（以下、単に間隔という）を表す記号をＴとする。

　具体例として、並べ替え部５は、入力されたサンプル列から、間隔Ｔの整数倍に対応するサンプルF(nT)の前後のサンプルF(nT-1)，F(nT+1)を含めた３個のサンプルF(nT-1)，F(nT)，F(nT+1)を選択する。F(j)は、周波数に対応するサンプルインデックスを表す番号jに対応するサンプルである。nは、１からnT+1が予め設定した対象サンプルの上限Ｎを超えない範囲の各整数とする。n=1は基本周波数に対応し、ｎ＞１は高調波に対応する。周波数に対応するサンプルインデックスを表す番号jの最大値をjmaxとする。nに応じて選択されたサンプルの集まりをサンプル群と呼称する。上限Ｎは、jmaxと一致させてもよいが、音声や楽音などの音響信号では高域におけるサンプルの指標は一般的に十分に小さいことが多いので、後述する符号化効率の向上のために大きい指標を有するサンプルを低周波側に集めるという観点から、Ｎはjmaxよりも小さい値であってもよい。例えば、Ｎはjmaxの半分程度の値であってもよい。上限Ｎに基づいて定まるnの最大値をnmaxとすると、入力されたサンプル列に含まれるサンプルのうち、最低の周波数から第１の所定の周波数nmax*T+1までの各周波数に対応するサンプルが並べ替えの対象となる。なお、記号＊は乗算を表す。

　並べ替え部５は、選択されたサンプルF(j)を、元の番号jの大小関係を保ったままサンプル列の先頭から順に配置してサンプル列Ａを生成する。例えば、ｎが１から５までの各整数を表す場合、並べ替え部５は、第１のサンプル群F(T-1)，F(T)，F(T+1)、第２のサンプル群F(2T-1)，F(2T)，F(2T+1)、第３のサンプル群F(3T-1)，F(3T)，F(3T+1)、第４のサンプル群F(4T-1)，F(4T)，F(4T+1)、第５のサンプル群F(5T-1)，F(5T)，F(5T+1)をサンプル列の先頭から並べる。つまり、１５個のサンプルF(T-1)，F(T)，F(T+1)，F(2T-1)，F(2T)，F(2T+1)，F(3T-1)，F(3T)，F(3T+1)，F(4T-1)，F(4T)，F(4T+1)，F(5T-1)，F(5T)，F(5T+1)がこの順番でサンプル列の先頭から並べられ、これら１５個のサンプルがサンプル列Ａを構成する。

　さらに、並べ替え部５は、選択されなかったサンプルF(j)を、元の番号jの大小関係を保ったままサンプル列Ａの最後から順に配置する。選択されなかったサンプルF(j)は、サンプル列Ａを構成するサンプル群の間に位置するサンプルであり、このような連続した一まとまりのサンプルをサンプルセットと呼称する。つまり、上述の例であれば、第１のサンプルセットF(1)，…，F(T-2)、第２のサンプルセットF(T+2)，…，F(2T-2)、第３のサンプルセットF(2T+2)，…，F(3T-2)、第４のサンプルセットF(3T+2)，…，F(4T-2)、第５のサンプルセットF(4T+2)，…，F(5T-2)、第６のサンプルセットF(5T+2)，…F(jmax)がサンプル列Ａの最後から順に並べられ、これらのサンプルがサンプル列Ｂを構成する。

　要するに、この例であれば、入力されたサンプル列F(j)（1≦j≦jmax）は、F(T-1)，F(T)，F(T+1)，F(2T-1)，F(2T)，F(2T+1)，F(3T-1)，F(3T)，F(3T+1)，F(4T-1)，F(4T)，F(4T+1)，F(5T-1)，F(5T)，F(5T+1)，F(1)，…，F(T-2)，F(T+2)，…，F(2T-2)，F(2T+2)，…，F(3T-2)，F(3T+2)，…，F(4T-2)，F(4T+2)，…，F(5T-2)，F(5T+2)，…F(jmax)に並べ替えられることになる（図３参照）。

　なお、低周波数帯域では、音響信号の周期性や基本周波数に対応するサンプルやその整数倍のサンプル以外のサンプルでも、各サンプルは振幅やパワーが大きな値を持つことが多い。そこで、最低の周波数から所定の周波数ｆまでの各周波数に対応するサンプルの並べ替えを行わないようにしてもよい。例えば、所定の周波数ｆをnT+αとすれば、並べ替え前のサンプルF(1)，…，F(nT+α)を並べ替えず、並べ替え前のF(nT+α+1)以降のサンプルを並べ替えの対象とする。αは０以上かつTよりもある程度小さい整数（例えばT/2を超えない整数）に予め設定されている。ここでnは２以上の整数であってもよい。あるいは、並べ替え前の最低周波数に対応するサンプルから連続するP個のサンプルF(1)，…，F(P)を並べ替えないようにして、並べ替え前のF(P+1)以降のサンプルを並べ替えの対象としてもよい。この場合、所定の周波数ｆはPである。並べ替えの対象となるサンプルの集まりに対する並べ替えの基準は上述のとおりである。なお、第１の所定の周波数が設定されている場合、所定の周波数ｆ（第２の所定の周波数）は第１の所定の周波数よりも小さい。

　例えば、並べ替え前のサンプルF(1)，…，F(T+1)を並べ替えず、並べ替え前のF(T+2)以降のサンプルを並べ替えの対象とする場合、上述の並べ替えの基準に従うと、入力されたサンプル列F(j)（1≦j≦jmax）は、F(1)，…，F(T+1)，F(2T-1)，F(2T)，F(2T+1)，F(3T-1)，F(3T)，F(3T+1)，F(4T-1)，F(4T)，F(4T+1)，F(5T-1)，F(5T)，F(5T+1)，F(T+2)，…，F(2T-2)，F(2T+2)，…，F(3T-2)，F(3T+2)，…，F(4T-2)，F(4T+2)，…，F(5T-2)，F(5T+2)，…F(jmax)に並べ替えられることになる（図４参照）。なお、図３および図４では、周波数領域のサンプル列に含まれる全てのサンプルが０以上の値であるかの如く図示してあるが、これは、サンプルの並べ替えによって低域側に、より大きな振幅を持つサンプルが偏ることを分かりやすく図示するための便宜に過ぎない。周波数領域のサンプル列に含まれる各サンプルは正または負またはゼロの値をとる場合があり、このような場合であっても、上述の並べ替え処理あるいは後述の並べ替え処理を実行すればよい。

　並べ替えの対象となる番号jの最大値を決定付ける上限Ｎあるいは第１の所定の周波数を全てのフレームに共通の値とせずに、フレーム毎に異なる上限Ｎあるいは第１の所定の周波数を設定してもよい。この場合、フレームごとに上限Ｎあるいは第１の所定の周波数を指定する情報を復号側へ送ればよい。また、並べ替えの対象となる番号jの最大値を指定するのではなく、並べ替えるサンプル群の個数を指定してもよく、この場合、サンプル群の個数をフレーム毎に設定して、サンプル群の個数を指定する情報を復号側へ送ってもよい。もちろん、並べ替えるサンプル群の個数を全てのフレームに共通としてもよい。また、第２の所定の周波数ｆについても、全てのフレームに共通の値とせずに、フレーム毎に異なる第２の所定の周波数ｆを設定してもよい。この場合、フレームごとに第２の所定の周波数を指定する情報を復号側へ送ればよい。

　このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すことになる。この理由として、周波数領域のサンプル列は音響信号、特に音声信号や楽音信号の特徴として、一般的に高周波成分が少ないという事実が挙げられる。換言すれば、並べ替え部５は、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。

　さらに、この実施形態では低域側に、周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ったが、逆に高域側に、周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ってもよい。この場合、サンプル列Ａではサンプル群が逆順で並べられ、サンプル列Ｂではサンプルセットが逆順で並べられ、低域側にサンプル列Ｂが配置されサンプルＢの後ろにサンプル列Ａが配置される。つまり、上述の例であれば、低域側から、第６のサンプルセットF(5T+2)，…F(jmax)、第５のサンプルセットF(4T+2)，…，F(5T-2)、第４のサンプルセットF(3T+2)，…，F(4T-2)、第３のサンプルセットF(2T+2)，…，F(3T-2)、第２のサンプルセットF(T+2)，…，F(2T-2)、第１のサンプルセットF(1)，…，F(T-2)、第５のサンプル群F(5T-1)，F(5T)，F(5T+1)、第４のサンプル群F(4T-1)，F(4T)，F(4T+1)、第３のサンプル群F(3T-1)，F(3T)，F(3T+1)、第２のサンプル群F(2T-1)，F(2T)，F(2T+1)、第１のサンプル群F(T-1)，F(T)，F(T+1)の順番でサンプルが並べられる。
　このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え部５は、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。

　間隔Ｔは整数ではなく小数（たとえば5.0、5.25、5.5、5.75）であってもよい。この場合、例えば、R(nT)をnTを四捨五入した値として、F(R(nT-1))，F(R(nT))，F(R(nT+1))が選択されることになる。

「符号化部６」
　符号化部６が、入力された並べ替え後のサンプル列を符号化し、得られた符号列を出力する（ステップＳ６）。符号化部６は、入力された並べ替え後のサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。つまり、並べ替えによってフレーム内で低域側（あるいは高域側）に振幅の大きなサンプルが集められているので、符号化部６はその偏りに適した可変長符号化を行う。並べ替え後のサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側（フレームの先頭に近い側）に振幅の大きなサンプルが集められている場合を例に採って説明する。

[符号化の具体例]
　具体例として、符号化部６は、大きな振幅に対応する指標をもつサンプルが集まっている領域ではサンプルごとにライス符号化（ゴロム-ライス符号化ともいう）を適用する。

　この領域以外の領域では、符号化部６は、複数のサンプルごとにエントロピー符号化（ハフマン符号化や算術符号化など）を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つ選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号（記号""で囲まれたバイナリ値）を使うことができ、符号化部６は選択情報も符号列に含めて出力する。
"1"：ライス符号化を適用しない。
"01"：ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001"：ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001"：ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001"：ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000"：ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。

　なお、このような選択肢の中からどれを選択すればよいかを決める方法として、符号化処理で得られる各ライス符号化に対応する符号列の符号量を比較し、最も符号量が小さい選択肢を選択するという方法を採用すればよい。

　また、並べ替え後のサンプル列に０の振幅を持つサンプルが長く続く領域が現れると、０の振幅を持つサンプルの連続数を例えばランレングス符号化することにより平均符号量を削減できる。このような場合、符号化部６は、（１）大きな振幅に対応する指標をもつサンプルが集まっている領域ではサンプルごとにライス符号化を適用し、（２）この領域以外の領域では、（ａ）０の振幅を持つサンプルが連続する領域では、０の振幅を持つサンプルの連続数を表す符号を出力する符号化を行い、（ｂ）残りの領域では、複数のサンプルごとにエントロピー符号化（ハフマン符号化や算術符号化など）を適用する。このような場合であっても、上述のようなライス符号化の選択を行ってもよい。このような場合、どの領域にランレングス符号化が適用されたかを表す情報も復号側へ伝送される必要があり、例えばこの情報は上記の符号列に含められる。さらに、エントロピー符号化に属する複数の符号化方法を選択肢として用意してある場合には、いずれの符号化を選択したかを特定するための情報も復号側へ伝送される必要があり、例えばこの情報は上記の符号列に含められる。

[間隔Ｔの決定方法]
　間隔Ｔの決定方法について説明する。簡便な決定方法の一例として、間隔Ｔの異なるＺ個の候補Ｔ₁，Ｔ₂，…，Ｔ_Zを予め用意しておき、並べ替え部５が各候補Ｔ_i（i=1,2,…,Z）についてサンプル列に含まれるサンプルの並べ替えを実施し、後述する符号化部６が各候補Ｔ_iに基づいて得られたサンプル列に対応する符号列の符号量を得て、最小の符号量を与えた候補Ｔ_iを間隔Ｔとして選択するという決定方法を挙げることができる。サンプル列に含まれるサンプルの並べ替えを特定する補助情報、例えば、間隔Ｔを符号化して得られる符号、は符号化部６から出力される。

　適切な間隔Ｔを決定するためには、Ｚは十分に大きい数であることが望ましい。しかし、Ｚが十分に大きい数であると、全ての候補について実際の符号量を計算するためにかなりの演算処理量が必要となり、効率の観点から問題となる場合があるかもしれない。このような観点から演算処理量を削減するために、Ｚ個の候補に対して予備選択処理を適用して候補の数をＹ個に絞り込むことが考えられる。ここで予備選択処理とは、各候補に基づいて得られた並べ替え後のサンプル列（場合によっては並べ替え前のサンプル列）に対応する符号列の符号量を近似的に求める、（符号量の推定値を求める）、あるいは当該符号列の符号量を反映する指標、あるいは当該符号列の符号量の大小と関連が認められる指標（ただし、ここでの指標は「符号量」とは異なる）を求めることにより、最終選択処理の対象となる候補を選ぶ処理をいう。最終選択処理は、サンプル列に対応する符号列の実際の符号量に基づいて間隔Ｔを選択する処理である。予備選択処理の具体的な処理内容は種々考えられるが、いずれにせよ予備選択処理で得られたＹ個の候補それぞれについてサンプル列に対応する符号列の符号量の算出を実際に行い、最小の符号量を与えた候補Ｔ_j（Ｔ_j∈S_Y；ただしS_YはＹ個の候補の集合を表す）を間隔Ｔとして選択する。Ｙは少なくともＹ＜Ｚを満たすことが必須であるが、演算処理量の有意義な削減の観点からは、例えばＹ≦Ｚ／２を満たすように、ＹはＺに比べてある程度小さい値に設定しておくことが好ましい。一般に符号量を算出する処理は多大な演算処理量を要するが、この演算処理量をＡとし、予備選択処理の演算処理量はその1/10程度の演算処理量A/10と仮定すると、Ｚ個の候補の全てについて符号量を算出する処理を行うとこの演算処理量はZAであり、他方、Ｚ個の候補について予備選択処理を行い、予備選択処理で選定されたＹ個の候補について符号量を算出する処理を行うと、全体の演算処理量は（ZA/10+YA）になる。この場合、Y＜9Z／10を満たすならば、予備選択処理を経由する方法の方が少ない演算処理量で間隔Ｔを決定できることがわかる。

　本発明では、さらに少ない演算処理量で間隔Ｔを決定する方法を提供し、この実施の形態の説明に先立ち、低演算処理量で間隔Ｔを決定するコンセプトを説明する。

　一般的に、音声や楽音などの音響信号では、複数のフレームに跨る定常的な信号区間では音響信号の周期性特徴量が当該複数のフレームに亘ってゆるやかに変化することが多い。従って、或るフレームＸ_tの時間的に直前のフレームＸ_t-1において決定された間隔Ｔ_t-1を考慮することによって、当該フレームＸ_tにおける間隔Ｔ_tを効率良く決定することができると考えられる。ただし、フレームＸ_t-1において決定された間隔Ｔ_t-1がフレームＸ_tにおいても適切な間隔Ｔ_tであるとは限らないので、フレームＸ_t-1において決定された間隔Ｔ_t-1のみを考慮に入れるのではなく、フレームＸ_t-1において間隔Ｔ_t-1を決定する際に用いられた間隔Ｔの候補を、フレームＸ_tにおいて間隔Ｔ_tを決定する際の間隔Ｔの候補に含めることが好ましい。

　他方、複数のフレームに跨る非定常的な信号区間では、隣接するフレーム間であっても、音響信号の周期性特徴量の連続性を期待することは難しい。従って、図示しない別途の手段によって複数のフレームに跨る信号区間が定常的な信号区間であるか非定常的な信号区間であるかの判定がされていない状況であるならば、「フレームＸ_t-1において間隔Ｔ_t-1を決定する際に用いられた間隔Ｔの候補の中から、フレームＸ_tにおける間隔Ｔ_tを探索する」という方針が好ましい結果を齎すとは必ずしも言えない。つまり、当該状況の下では、フレームＸ_t-1において間隔Ｔ_t-1を決定する際に用いられた間隔Ｔの候補に依存しない間隔Ｔの候補の中からも、フレームＸ_tにおける間隔Ｔ_tを探索できるようにした方がよいのである。

　このようなコンセプトに基づく実施の形態を具体的に説明する（図７と図８参照）。この実施形態では、図１０に示すように符号化装置１００ａには間隔決定部７が備えられ、間隔決定部７内に並べ替え部５と符号化部６と補助情報生成部８とが備えられる。

（Ａ）予備選択処理（ステップＳ７１）
　サンプル列に含まれるサンプルの並べ替えを特定する補助情報によって表現することが可能な間隔Ｔの候補は、補助情報を固定長符号化するか可変長符号化するか等の後述する符号化方法と対応して予め定められている。間隔決定部７は、この予め定められている間隔Ｔの異なるＺ個の候補Ｔ₁，Ｔ₂，…，Ｔ_Zの中から予め決定されたＺ₁個の候補を記憶しておく（Ｚ₁＜Ｚ）。その目的は予備選択処理の対象となる候補の数を少なくすることにある。予備選択処理の対象となる候補には、Ｔ₁，Ｔ₂，…，Ｔ_Zのうち、そのフレームの間隔Ｔとして好ましいものをできるだけ多く含むことが望まれる。しかし実際には予備選択処理を行う前の段階では好ましさは不明であるので、間隔決定部７は、例えば、Ｚ個の候補Ｔ₁，Ｔ₂，…，Ｔ_Zの中から等間隔に選択したＺ₁個の候補を予備選択処理の対象とする。例えば「Ｚ個の候補Ｔ₁，Ｔ₂，…，Ｔ_Zの中の奇数番目の候補を予備選択処理の対象とする」（この場合、Ｚ₁=ceil(Z/2)となる。ceil(・)は天井関数である）という基準でＺ個の候補Ｔ₁，Ｔ₂，…，Ｔ_Zの中のＺ₁個の候補を予備選択処理の対象とすればよい。Ｚ個の候補の集合をS_Zとし（S_Z={Ｔ₁，Ｔ₂，…，Ｔ_Z}）、Ｚ₁個の候補の集合をS_Z1とする。

　間隔決定部７は、予備選択処理の対象とされたＺ₁個の候補について上述の選択処理を実施する。この選択処理で絞り込まれた候補の数をＺ₂個とする。既述のとおり、予備選択処理の具体的な処理内容は種々考えられるが、並べ替え後のサンプル列に対応する符号列の符号量の大小と関連が認められる指標に基づく方法としては、例えば、サンプルの指標の低域への集中度や、周波数軸で最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数に基づいてＺ₂個の候補を決定することが考えられる。

　具体的には、Ｚ₂の値を予め設定していない場合には次のような予備選択処理を行う。間隔決定部７は、それぞれの候補について、当該候補に基づいて上記で説明したサンプル列の並べ替えを行い、並べ替えられた後のサンプル列の低域側から例えば1/4の領域に含まれるサンプルの振幅の絶対値の和をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この和が予め定められた閾値と比較して大きければ、当該候補を選択する。あるいは、間隔決定部７は、それぞれの候補について、当該候補に基づいて上記で説明したサンプル列の並べ替えを行い、並べ替えられた後のサンプル列において最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この連続数が予め定められた閾値と比較して大きければ、当該候補を選択する。並べ替えは並べ替え部５が行なう。この場合、決定された候補の数がＺ₂であり、フレームごとにＺ₂の値は変わりえる。

　Ｚ₂の値を予め設定している場合には次のような予備選択処理を行う。Ｚ₁個の候補それぞれについて、間隔決定部７は、各候補に基づく上記で説明したサンプル列の並べ替えを行い、サンプルが並べ替えられた後のサンプル列の低域側から例えば1/4の領域に含まれるサンプルの振幅の絶対値の和をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この和の値の大きい方からＺ₂個の候補を選択する。あるいは、Ｚ₁個の候補それぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、サンプルが並べ替えられた後のサンプル列において最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数をサンプル列に対応する符号列の符号量の大小と関連が認められる指標として求め、この連続数の大きい方からＺ₂個の候補を選択する。サンプル列の並べ替えは並べ替え部５が行なう。この場合、どのフレームでもＺ₂の値は同じである。当然であるが、Ｚ＞Ｚ₁＞Ｚ₂なる関係を少なくとも満たす。Ｚ₂個の候補の集合をS_Z2とする。

（Ｂ）追加処理（ステップＳ７２）
　次に、間隔決定部７は、（Ａ）の予備選択処理で得られた候補の集合S_Z2に一つまたは複数の候補を追加する処理を行う。この追加処理を行う目的は、フレームごとにＺ₂の値が変わりえる場合にＺ₂の値が小さくなりすぎて上述の最終選択処理における間隔Ｔの探索範囲が狭くなりすぎることを防止すること、あるいは、Ｚ₂の値がある程度大きな値であったとしても、上述の最終選択処理において適切な間隔Ｔが決定される可能性を少しでも広げること、である。なお、本発明の間隔Ｔの決定方法の目的は、演算処理量を従来技術より少なくすることであるから、集合S_Z2の要素（候補）の数を|S_Z2|と表せば|S_Z2|=Ｚ₂であり、追加される候補の数をＱとすると、ＱがＺ₂＋Ｑ＜Ｚを満たすことが必須条件となる。さらに好ましい条件は、ＱがＺ₂＋Ｑ＜Ｚ₁を満たすことである。追加される候補は、例えば、集合S_Z2に含まれる候補Ｔ_kの前後の候補Ｔ_k-1，Ｔ_k+1∈S_Zとしてもよい（ここでの「前後」とは、集合S_Z={Ｔ₁，Ｔ₂，…，Ｔ_Z}に値の大きさに基づく順序Ｔ₁＜Ｔ₂＜…＜Ｔ_Zを導入したときの前後を意味する）。この理由は（Ａ）の予備選択処理の対象であるＺ₁個の候補に候補Ｔ_k-1，Ｔ_k+1が含まれていない可能性があるからである。ただし、候補Ｔ_k-1，Ｔ_k+1∈S_Z1であって候補Ｔ_k-1，Ｔ_k+1が集合S_Z2に含まれない場合、候補Ｔ_k-1，Ｔ_k+1を追加しないようにしてもよい。また、追加される候補は、集合S_Zから選択されればよく、例えば、集合S_Z2に含まれる候補Ｔ_kについて、Ｔ_k－α（ただし、Ｔ_k－α∈S_Z）および／またはＴ_k＋β（ただし、Ｔ_k＋β∈S_Z）を新しい候補として追加するようにしてもよい。ここでα，βは例えば予め定められた正の実数値である。α＝βであってもよい。Ｔ_k－αおよび／またはＴ_k＋βが集合S_Z2に含まれる他の候補と重複する場合は、このＴ_k－αおよび／またはＴ_k＋βを追加しないようにする（追加しても意味がないからである）。Ｚ₂＋Ｑ個の候補の集合をS_Z3とする。続いて、（Ｄ１）または（Ｄ２）の処理が行われる。

（Ｄ）予備選択処理（ステップＳ７３）
（Ｄ１－ステップＳ７３１）間隔決定部７は、間隔Ｔを決定する対象のフレームが時間的に先頭のフレームである場合、集合S_Z3に含まれるＺ₂＋Ｑ個の候補について上述の予備選択処理を実施する。この予備選択処理で絞り込まれた候補の数をＹ個とする。ＹはＹ＜Ｚ₂＋Ｑを満たす。

　既述のとおり、予備選択処理の具体的な処理内容は種々考えられるが、例えば、（Ａ）における予備選択処理と同じ内容の処理を行ってもよい（ただし、出力される候補の数は異なる（つまり、Ｙ≠Ｚ₂））。この場合、Ｙの値がフレームごとに変わりえることに留意しなければならない。（Ａ）における予備選択処理と異なる内容の予備選択処理を行うならば、例えば、集合S_Z3に含まれるＺ₂＋Ｑ個の候補それぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ換え後のサンプル列を符号化して得られる符号列の符号量を近似的に求める予め定められた近似式などを利用して、近似的符号量（符号量の推定値）を求める。サンプル列の並べ替えは並べ替え部５が行なう。（Ａ）における予備選択処理で並べ替え後のサンプル列が得られている候補については、（Ａ）における予備選択処理で得られた並べ替え後のサンプル列を用いてもよい。この場合、Ｙの値が予め設定されていないならば、近似的符号量が予め定められた閾値以下となる候補を後述の（Ｅ）符号量算出処理の対象となる候補として決定すればよく（この場合、決定された候補の数がＹである）、Ｙの値が予め設定されているならば、近似的符号量の小さい方からＹ個の候補を後述の（Ｅ）最終選択処理の対象となる候補として決定すればよい。Ｙ個の候補はメモリに記憶され、これらＹ個の候補は、時間的に２番目のフレームにおける間隔Ｔの決定の際に後述の（Ｃ）または（Ｄ２）の処理にて利用される。（Ｄ１）の処理の後、（Ｅ）の最終選択処理が行われる。

　なお、（Ａ）の予備選択処理と同じ内容の予備選択処理を（Ｄ１）で行う場合であって、（Ａ）の予備選択処理において並べ替え後のサンプル列を符号化して得られる符号列の符号量の大小と関連が認められる指標と閾値との比較により候補を選択する場合は、（Ａ）の予備選択処理で選択された候補は（Ｄ１）の予備選択処理でも必ず選択されるため、（Ｂ）の追加処理で追加された候補についてのみ当該指標と当該閾値との比較により候補を選択する処理を行い、ここで選択された候補と（Ａ）の予備選択処理で選択された候補とを（Ｅ）の最終選択処理の対象となる候補とすればよい。ただし、（Ｅ）の最終選択処理は演算処理量が多いため、（Ｄ１）の予備選択処理ではＹの値を予め設定した固定値とし、近似的符号量の小さい方からＹ個の候補を（Ｅ）の最終選択処理の対象となる候補として決定するほうが好ましい。

　（Ｄ２－ステップＳ７３２）間隔決定部７は、間隔Ｔを決定する対象のフレームが時間的に先頭のフレームでない場合、和集合S_Z3∪S_Pに含まれる高々Ｚ₂＋Ｑ＋Ｙ＋Ｗ個（ただし、|S_P|=Ｙ＋Ｗ）の候補について上述の予備選択処理を実施する。ここで和集合S_Z3∪S_Pについて説明する。間隔Ｔを決定する対象のフレームをＸ_t，フレームＸ_tの時間的に直前のフレームをＸ_t-1とする。集合S_Z3は上述の（Ａ）－（Ｂ）の処理で得られたフレームＸ_tにおける候補の集合であり、集合S_Z3に含まれる候補の数はＺ₂＋Ｑである。集合S_Pは、フレームＸ_t-1において間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合S_Yと、当該集合S_Yに対して後述する（Ｃ）の追加処理によって追加される候補の集合S_Wとの和集合である。集合S_Yはメモリに記憶されている。|S_Y|=Ｙ，|S_W|=Ｗであり、少なくとも|S_Z3∪S_P|＜Ｚが必須条件である。和集合S_Z3∪S_Pに含まれる高々Ｚ₂＋Ｑ＋Ｙ＋Ｗ個の候補について上述の予備選択処理を実施する。この予備選択処理で絞り込まれた候補の数をＹ個とする。ＹはＹ＜|S_Z3∪S_P|≦Ｚ₂＋Ｑ＋Ｙ＋Ｗを満たす。既述のとおり、予備選択処理の具体的な処理内容は種々考えられるが、例えば、上述の（Ｂ）における予備選択処理と同じ内容の処理を行ってもよい（ただし、出力される候補の数は異なる（つまり、Ｙ≠Ｚ₂））。この場合、Ｙの値がフレームごとに変わりえることに留意しなければならない。上述の（Ｂ）における予備選択処理と異なる内容の予備選択処理を行うならば、例えば、|S_Z3∪S_P|個の候補それぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ換え後のサンプル列を符号化して得られる符号列の符号量を近似的に求める予め定められた近似式などを利用して、近似的符号量（符号量の推定値）を求める。サンプル列の並べ替えは並べ替え部５が行なう。（Ａ）における予備選択処理で並べ替え後のサンプル列が得られている候補については、（Ａ）における予備選択処理で得られた並べ替え後のサンプル列を用いてもよい。この場合、Ｙの値が予め設定されていないならば、近似的符号量が予め定められた閾値以下となる候補を後述の（Ｅ）の最終選択処理の対象となる候補として決定すればよく（この場合、決定された候補の数がＹである）、Ｙの値が予め設定されているならば、近似的符号量の小さい方からＹ個の候補を後述の（Ｅ）の最終選択処理の対象となる候補として決定すればよい。Ｙ個の候補はメモリに記憶され、これらＹ個の候補は、時間的に次のフレームにおける間隔Ｔの決定の際に実施される（Ｄ２）の処理にて利用される。（Ｄ２）の処理の後、（Ｅ）の最終選択処理が行われる。

　なお、（Ａ）の予備選択処理と同じ内容の予備選択処理を（Ｄ２）で行う場合であって、（Ａ）の予備選択処理において並べ換え後のサンプル列を符号化して得られる符号列の符号量の大小と関連が認められる指標と閾値との比較により候補を選択する場合は、（Ａ）の予備選択処理で選択された候補は（Ｄ２）の予備選択処理でも必ず選択されるため、（Ｂ）の追加処理で追加された候補とフレームＸ_t-1において間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補と（Ｃ）の追加処理で追加された候補について当該指標と当該閾値との比較により候補を選択する処理を行い、ここで選択された候補と（Ａ）の予備選択処理で選択された候補とを（Ｅ）の最終選択処理の対象となる候補とすればよい。ただし、（Ｅ）の最終選択処理は演算処理量が多いため、（Ｄ２）の予備選択処理ではＹの値を予め設定した固定値とし、近似的符号量の小さい方からＹ個の候補を（Ｅ）の最終選択処理の対象となる候補として決定するほうが好ましい。

（Ｃ）追加処理（ステップＳ７４）
　間隔決定部７は、フレームＸ_t-1において間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合S_Yに一つまたは複数の候補を追加する処理を行う。集合S_Yに対して追加される候補は、例えば、集合S_Yに含まれる候補Ｔ_mの前後の候補Ｔ_m-1，Ｔ_m+1∈S_Zとしてもよい（ここでの「前後」とは、集合S_Z={Ｔ₁，Ｔ₂，…，Ｔ_Z}に値の大きさに基づく順序Ｔ₁＜Ｔ₂＜…＜Ｔ_Zを導入したときの前後を意味する）。また、追加される候補は、集合S_Zから選択されればよく、例えば、集合S_Yに含まれる候補Ｔ_mについて、Ｔ_m－γ（ただし、Ｔ_m－γ∈S_Z）および／またはＴ_m＋η（ただし、Ｔ_m＋η∈S_Z）を新しい候補として追加するようにしてもよい。ここでγ，ηは例えば予め定められた正の実数値である。γ＝ηであってもよい。Ｔ_m－γおよび／またはＴ_m＋ηが集合S_Yに含まれる他の候補と重複する場合は、このＴ_m－γおよび／またはＴ_m＋ηを追加しないようにする（追加しても意味がないからである）。続いて、（Ｄ２）の処理が行われる。

（Ｅ）最終選択処理（ステップＳ７５）
　間隔決定部７はＹ個の候補のそれぞれについて、各候補に基づく上記で説明したサンプル列の並べ替えを行い、並べ替え後のサンプル列を符号化して符号列を得て、符号列の実際の符号量を求め、最小の符号量を与えた候補を間隔Ｔとして選択する。サンプル列の並べ替えは並べ替え部５が行ない、並べ替え後のサンプル列の符号化は符号化部６が行う。（Ａ）または（Ｄ）における予備選択処理で並べ替え後のサンプル列が得られている候補については、予備選択処理で得られた並べ替え後のサンプル列を入力として符号化部６が符号化を行えばよい。

　なお、（Ｂ）の追加処理、（Ｃ）の追加処理、（Ｄ）の予備選択処理は必須ではなく、これらのうち少なくともいずれか一つを行わない実施構成であってもよい。（Ｂ）の追加処理を行わない場合、集合S_Z3の要素（候補）の数を|S_Z3|と表せば、Ｑ＝０であるから|S_Z3|＝Ｚ_２である。（Ｄ）の予備選択処理を行わない場合には、集合S_Z3に含まれる高々Ｚ₂＋Ｑ個の候補（間隔Ｔを決定する対象のフレームが時間的に先頭のフレームである場合）または和集合S_Z3∪S_Pに含まれる高々Ｚ₂＋Ｑ＋Ｙ＋Ｗ個の候補（間隔Ｔを決定する対象のフレームが時間的に先頭のフレームでない場合）が（Ｅ）の最終選択処理の対象となる。

　上記の間隔Ｔの決定に関する説明では、「先頭のフレーム」を「時間的に先頭のフレーム」としたが、このようなフレームに限定されるものではない。「先頭のフレーム」は、次の（１）―（３）の条件Ａを満たすフレーム以外のフレームであればよい（図９参照）。
＜条件Ａ＞
フレームについて、
（１）当該フレームが時間的に先頭ではなく、
（２）一つ前のフレームが本発明の符号化方法に従って符号化されたものであり、かつ、
（３）一つ前のフレームが上述の並べ替え処理の適用を受けている。

　上述の説明では、（Ｄ２）の処理にて、集合S_Yを、「直前のフレームＸ_t-1において間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合」としたが、集合S_Yは「間隔Ｔを決定する対象のフレームよりも時間的に前の複数のフレームのそれぞれにおいて間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合の和集合」であってもよい。つまり、過去のフレームの個数をｍとすれば、集合S_Yは、フレームＸ_t-1において間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合S_t-1と、フレームＸ_t-2において間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合S_t-2と、・・・、フレームＸ_t-mにおいて間隔Ｔを決定する際に後述の（Ｅ）の最終選択処理の対象となった候補の集合S_t-mとの和集合、すなわちS_Y=S_t-1∪S_t-2∪…∪S_t-mである。ただし、ｍが大きいと演算処理量が増大するので、Ｚ，Ｚ₁，Ｚ₂，Ｑの値などにもよるが、ｍは１，２，３のいずれかとすることが好ましい。

　符号量を算出する処理の演算処理量をＡとし、予備選択処理の演算処理量はその1/10程度の演算処理量A/10と仮定すると、Ｚ，Ｚ₁，Ｚ₂，Ｑ，Ｗ，Ｙが固定値として予め設定されている場合に（Ａ），（Ｂ），（Ｃ），（Ｄ２）の各処理を実施したときの演算処理量は高々((Z₁+Z₂+Q+Y+W)A/10+YA）となる。ここでZ₂+Q≒3Z₂，Y+W≒3Yとすると、演算処理量は((Z₁+3Z₂+3Y)A/10+YA）となる。上述の演算処理量（ZA/10+YA）と比較した場合、Z>(Z₁+3Z₂+3Y)を満たすようにＺ，Ｚ₁，Ｚ₂，Ｙを設定すれば演算処理量を削減できることになる。例えば一例としてZ=256、Z₁=64、Z₂=Y=8とすることができる。

　S_Z={Ｔ₁，Ｔ₂，…，Ｔ_Z}はフレームごとに同じでも異なってもよい。また、Ｚの値はフレームごとに同じでも異なってもよい。ただし、（Ｅ）の最終選択処理の対象となる候補の数はＺよりも小さくなることが要求されるので、（Ｄ２）の処理にて|S_Y|がＺ以上である場合には、例えば、メモリから読み込んだ集合S_Yに対して上述の（Ａ）の予備選択処理と同様の指標を用いた候補の絞り込みを行い、（Ｅ）の最終選択処理の対象となる候補の数がＺよりも小さくなるようにすればよい。また、（Ｄ）の予備選択処理を行わない場合であって|S_Z3∪S_P|≧Ｚの場合にもS_Z3∪S_Pに対して上述の（Ａ）の予備選択処理と同様の指標を用いた候補の絞り込みを行い、（Ｅ）の最終選択処理の対象となる候補の数がＺよりも小さくなるようにすればよい。

＜間隔Ｔの決定方法の変形例＞
　音声や楽音などの音響信号では複数のフレームに跨る定常的な信号区間では現在のフレームと過去のフレームとの相関が高いことが多い。定常信号の持つこのような性質を利用して、（Ｄ２）の処理にてS_Z3とS_Pの比率を変えることによって圧縮性能を維持しつつ、より処理演算量を下げることができる。なお、ここでの比率は、S_Z3に対するS_Pの比として定められていてもよいし、S_Pに対するS_Z3の比として定められていてもよいし、S_Z3∪S_PにおけるS_Pの占有率として定められていてもよいし、S_Z3∪S_PにおけるS_Z3の占有率として定められていてもよい。

　或る信号区間の定常性が大きいか否かは、例えば定常性の大きさを表す指標値が閾値以上であるか否か、または、閾値より大きいか否か、により判断することができる。定常性の大きさを表す指標値は、例えば、下記に示されるものである。以下、間隔Ｔを決定する対象のフレームを現フレームと呼称し、現フレームの時間的に直前のフレームを直前フレームと呼称する。定常性の大きさを表す指標値は、
(a-1)「現フレームの音響信号の予測利得」が大きい、
(a-2)「現フレームの音響信号の予測利得の推定値」が大きい、
(b-1)「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分が小さい、
(b-2)「直前フレームの音響信号の予測利得の推定値」と「現フレームの音響信号の予測利得の推定値」との差分が小さい
(c-1)「現フレームに含まれる音響信号のサンプルの振幅の和」が大きい、
(c-2)「現フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きい、
(d-1)「直前フレームに含まれる音響信号のサンプルの振幅の和」と「現フレームに含まれる音響信号のサンプルの振幅の和」との差分が小さい、
(d-2)「直前フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現フレームに含まれる音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さい、
(e-1)「現フレームの音響信号のパワー」が大きい、
(e-2)「現フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きい、
(f-1)「直前フレームの音響信号のパワー」と「現フレームの音響信号のパワー」との差分が小さい、
(f-2)「直前フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現フレームの音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さい、
ほど大きくなる値である。

　なお、予測利得は予測符号化における原信号のエネルギーの予測誤差信号のエネルギーに対する比であって、この値は、重み付け包絡正規化部２が出力した当該フレームの重み付け正規化MDCT係数列に含まれるサンプルの値の絶対値の総和に対する周波数領域変換部１が出力した当該フレームのMDCT係数列に含まれるサンプルの値の絶対値の総和の比、または、当該フレームの重み付け正規化MDCT係数列に含まれるサンプルの値の二乗の総和に対する当該フレームのMDCT係数列に含まれるサンプルの値の二乗の総和の比、の値にほぼ比例する。そこで、「フレームの音響信号の予測利得」と大小関係が等価な値として前記の何れかの比の値を用いることができる。
　「フレームの音響信号の予測利得」は、重み付け包絡正規化部２で用いる当該フレームの線形予測係数と対応するm次のPARCOR係数をk_mとしたとき、

により計算されるＥのことである。ここで、線形予測係数と対応するPARCOR 係数は、量子化前の全次のPARCOR係数とする。なお、線形予測係数と対応するPARCOR 係数として、一部の次数(例えば、1次からP₂次まで。ただし、P₂＜P。）の量子化前のPARCOR係数、または、一部または全次の量子化後のPARCOR係数、を用いてＥを計算した場合は、計算されたＥは「フレームの音響信号の予測利得の推定値」となる。
　「フレームに含まれる音響信号のサンプルの振幅の和」とは、当該フレームに含まれる音声音響ディジタル信号のサンプル値の絶対値の総和、または、周波数領域変換部１が出力した当該フレームのMDCT係数列に含まれるサンプルの値の絶対値の総和、である。
　「フレームの音響信号のパワー」とは、当該フレームに含まれる音声音響ディジタル信号のサンプル値の二乗の総和、または、周波数領域変換部１が出力した当該フレームのMDCT係数列に含まれるサンプルの値の二乗の総和、である。

　なお、例示された(a)～(f)のいずれか一つを定常性の大小判定に用いてもよいし、例示された(a)～(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いてもよい。前者の場合、間隔決定部７が、例えば(a)の「現フレームの音響信号の予測利得」だけを用いて、「現フレームの音響信号の予測利得」Ｇと予め定められた閾値εとの間にε＜Ｇが成立した場合に定常性が大きいと判断し、あるいは、例えば(b)の「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分だけを用いて、「直前フレームの音響信号の予測利得」と「現フレームの音響信号の予測利得」との差分Ｇ_diffと予め定められた閾値τとの間にＧ_diff＜τが成立した場合に定常性が大きいと判断する。後者の場合、間隔決定部７が、例えば(c)と(e)の両基準を用いて、「現フレームに含まれる音響信号のサンプルの振幅の和」Ａcと予め定められた閾値ξとの間にξ＜Ａcが成立し且つ「現フレームの音響信号のパワー」Ｐcと予め定められた閾値δとの間にδ＜Ｐcが成立した場合に定常性が大きいと判断し、あるいは、例えば(a)と(c)と(f)の基準を用いて、「現フレームの音響信号の予測利得」Ｇと予め定められた閾値εとの間にε＜Ｇが成立し又は「現フレームに含まれる音響信号のサンプルの振幅の和」Ａcと予め定められた閾値ξとの間にξ＜Ａcが成立し、且つ、「直前フレームの音響信号のパワー」と「現フレームの音響信号のパワー」との差分Ｐ_diffと予め定められた閾値θとの間にＰ_diff＜θが成立した場合に定常性が大きいと判断する。

　このような定常性の大小判定によって変更されるS_Z3とS_Pの比率は、例えば予め間隔決定部７内のルックアップテーブルに定められているとする。通常、定常性が大きいと判定された場合、S_Z3∪S_PにおいてS_Pの比率が高まるように（相対的にS_Z3の比率が低くなるように、あるいはS_Z3∪S_PにおいてS_Pの比率が５０％を超えるように）設定され、定常性が大きくないと判定された場合、S_Z3∪S_PにおいてS_Pの比率が低くなるように（相対的にS_Z3の比率が高くなるように、あるいはS_Z3∪S_PにおいてS_Pの比率が５０％を超えないように）、あるいは当該比率が同程度となるように設定される。定常性が大きいと判定された場合、（Ｄ２）の処理にて、ルックアップテーブルを参照してS_Pの比率（あるいはS_Z3の比率）を決定し、S_PとS_Z3に含まれる候補の数が当該比率に適合するように、例えば上述の（Ａ）の予備選択処理と同様の指標が大きいものから候補を選択する処理によって集合S_Z3に含まれる候補の数を減らす。反対に、定常性が大きくないと判定された場合、（Ｄ２）の処理にて、ルックアップテーブルを参照してS_Pの比率（あるいはS_Z3の比率）を決定し、S_PとS_Z3に含まれる候補の数が当該比率に適合するように、例えば上述の（Ａ）の処理と同様の指標が大きいものから候補を選択する処理によって集合S_Pに含まれる候補の数を調整する。このような処理によると、（Ｄ２）の処理の対象となる候補の数を減らせると同時に、現フレームの間隔Ｔが候補として含まれるであろう方の集合の比率を高めることができ、効率よく間隔Ｔを決定することが可能になる。なお、定常性が大きくないと判定された場合、S_Pを空集合としてもよい。つまり、この場合、過去のフレームにおいて（Ｅ）の最終選択処理の対象となった候補を現フレームにおける（Ｄ）の予備選択処理の対象に含めないようにするのである。

　また、ルックアップテーブルに、定常性の大小の程度に応じてS_Z3とS_Pの異なる比率を設定しておく実施構成も可能である。例えば(a)の基準の「現フレームの音響信号の予測利得」だけを用いて定常性の大小を判定する場合、「現フレームの音響信号の予測利得」Ｇに対して複数の閾値ε₁，ε₂，…，ε_k-1，ε_k（ただし、ε₁＜ε₂＜…＜ε_k-1＜ε_k）が予め与えられており、ルックアップテーブルに、
Ｇ＜ε₁　　　⇒　S_Z3∪S_PにおけるS_Pの比率：１０％
ε₁≦Ｇ＜ε₂　⇒　S_Z3∪S_PにおけるS_Pの比率：２０％
…
ε_k-1≦Ｇ＜ε_k　⇒　S_Z3∪S_PにおけるS_Pの比率：８０％
ε_k≦Ｇ　　　　⇒　S_Z3∪S_PにおけるS_Pの比率：９０％
と予め定めておくのである。ここでは(a)の基準の「現フレームの音響信号の予測利得」だけを用いる例について説明したが、他の基準はもとより、上記(a)～(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いる場合であっても、ルックアップテーブルに、定常性の大小の程度に応じてS_Z3とS_Pの異なる比率を設定しておくことができる。

　以上の説明では、（Ｄ２）の処理で集合S_Z3とS_Pが定まっている状況にて、定常性の大小判定に基づいてS_Z3とS_Pの比率を変更する実施の例を説明したが、定常性の大小判定を集合S_Z3とS_Pの決定よりも前に行う実施も可能である。例えば、ルックアップテーブルに、Ｙの値との関係で定常性の大小の判定結果に応じたＺ₁，Ｚ₂，Ｑ，Ｗの値を予め設定しておく。定常性が大きいと判定された場合に対応するＺ₁，Ｚ₂，Ｑの値のうち少なくともいずれか（好ましくはＺ₂やＱ）が、Ｙ＋Ｗの値（ただし、Ｗ＝０も可とする）に比して|S_Z3|が小さくなるように小さい値に設定される（あるいはＷが大きい値に設定される）。定常性が大きくないと判定された場合に対応するＺ₁，Ｚ₂，Ｑの値のうち少なくともいずれか（好ましくはＺ₂やＱ）が、Ｙ＋Ｗの値（ただし、Ｗ＝０も可とする）に比して|S_Z3|が大きくなるように大きい値に設定される（あるいはＷが小さい値に設定される）。

　定常性の大小判定を集合S_Z3とS_Pの決定よりも前に行う実施の形態においても、ルックアップテーブルに、定常性の大小の程度に応じたＺ₁，Ｚ₂，Ｑの値を設定しておくことが可能である。例えば(a)の基準の「現フレームの音響信号の予測利得」だけを用いて定常性の大小を判定する場合、「現フレームの音響信号の予測利得」Ｇに対して複数の閾値ε₁，ε₂，…，ε_k-1，ε_k（ただし、ε₁＜ε₂＜…＜ε_k-1＜ε_k）が予め与えられており、ルックアップテーブルに、
Ｇ＜ε₁　　　⇒　Ｚ₂＝１６，Ｑ＝３０
ε₁≦Ｇ＜ε₂　⇒　Ｚ₂＝１２，Ｑ＝２０
…
ε_k-1≦Ｇ＜ε_k　⇒　Ｚ₂＝４，Ｑ＝４
ε_k≦Ｇ　　　　⇒　Ｚ₂＝２，Ｑ＝０
と予め定めておくのである。ここでは(a)の基準の「現フレームの音響信号の予測利得」だけを用いる例について説明したが、他の基準はもとより、上記(a)～(f)のうち二つ以上の間の論理和や論理積を定常性の大小判定に用いる場合であっても、ルックアップテーブルに、定常性の大小の程度に応じたＺ₁，Ｚ₂，Ｑの値を設定しておくことができる。

［周期性特徴量決定方法］
　これまで少ない演算処理量で間隔Ｔを決定する方法を説明したが、当該方法によって決定されるべき対象は間隔Ｔに限定されない。当該方法は、例えば、サンプルの並べ替えの際に上記サンプル群を特定するための情報である音響信号の周期性特徴量（例えば基本周波数やピッチ周期など）を決定する方法としても使用することができる。すなわち、間隔決定部７を周期性特徴量決定装置として機能させ、並べ替え後のサンプル列を符号化して得られる符号列を出力することなく、間隔Ｔを周期性特徴量として決定してもよい。この場合、上述の[間隔Ｔの決定方法]の説明にて、「間隔Ｔ」を「ピッチ周期」に読み替えればよく、または、サンプル列のサンプリング周波数を「間隔Ｔ」で除算した値を「基本周波数」とすればよく、少ない演算処理量でサンプルの並べ替えのための基本周波数やピッチ周期を決定することができる。

[サンプル列に含まれるサンプルの並べ替えを特定する補助情報]
　符号化部６または補助情報生成部８は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報、すなわち、音響信号の周期性を表す情報、または基本周波数を表す情報、または音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔Ｔを表す情報を出力する。なお、符号化部６が補助情報を出力する場合、サンプル列の符号化処理の中で補助情報を得る処理を行ってもよいし、当該符号化処理と別の処理として補助情報を得る処理を行ってもよい。例えば間隔Ｔをフレーム毎に決定する場合は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報もフレーム毎に出力されることになる。サンプル列に含まれるサンプルの並べ替えを特定する補助情報は、周期性、基本周波数または間隔Ｔをフレーム毎に符号化して得られる。この符号化は固定長符号化であってもよいし、可変長符号化して平均符号量を削減してもよい。固定長符号化する場合は、例えば、補助情報と当該補助情報を一意に特定可能な符号とが対応付けられて記憶されており、入力された補助情報に対応する符号を出力する構成となる。可変長符号化する場合は、前フレームの間隔Ｔと現フレームの間隔Ｔの差分を可変長符号化した情報を間隔Ｔを表す情報としもよい。この場合は、例えば、間隔Ｔの差分値と当該差分値を一意に特定可能な符号とが対応付けられて記憶されており、入力された前フレームの間隔Ｔと現フレームの間隔Ｔの差分に対応する符号を出力する構成となる。同様に、前フレームの基本周波数と現フレームの基本周波数の差分を可変長符号化した情報を基本周波数を表す情報としてもよい。また、nを複数の選択肢から選択可能な場合には、nの上限値あるいは上述の上限Ｎを補助情報に含めてもよい。

[集めるサンプルの個数]
　また、この実施形態では、各サンプル群に含まれるサンプルの個数が、周期性や基本周波数ないしその整数倍に対応するサンプル（以下、中心サンプルという）とその前後１サンプルの計３サンプルであるという固定された個数の例を示したが、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報も補助情報に含める。
　例えば、選択肢として、
（１）中心サンプルのみ、F(nT)
（２）中心サンプルとその前後１サンプルの計３サンプル、F(nT-1)，F(nT)，F(nT+1)
（３）中心サンプルとその前２サンプルの計３サンプル、F(nT-2)，F(nT-1)，F(nT)
（４）中心サンプルとその前３サンプルの計４サンプル、F(nT-3)，F(nT-2)，F(nT-1)，F(nT)
（５）中心サンプルとその後２サンプルの計３サンプル、F(nT)，F(nT+1)，F(nT+2)
（６）中心サンプルとその後３サンプルの計４サンプル、F(nT)，F(nT+1)，F(nT+2)，F(nT+3)
が設定されている場合に、（４）が選択されたならば、この（４）が選択されたことを表す情報が補助情報に含められる。この例であれば、選択された選択肢を表す情報として３ビットあれば十分である。

　なお、このような選択肢の中からどれを選択すればよいか決める方法として、並べ替え部５では各選択肢に対応する並べ替えを実施し符号化部６で各選択肢に対応する符号列の符号量を得て、最も符号量が小さい選択肢を選択するという方法を採用すればよい。この場合は、サンプル列に含まれるサンプルの並べ替えを特定する補助情報は並べ替え部５からではなく符号化部６から出力される。この方法は、nを選択可能な場合にも妥当する。

　ただし、選択肢としては、例えば、間隔Ｔに関する選択肢、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせに関する選択肢、nに関する選択肢があり、これらの選択肢の全ての組み合わせは相当の数になることが予想される。これらの選択肢の全ての組み合わせについて最終的な符号量を計算するには処理量がかかり、効率の観点から問題となる場合があるかもしれない。このような観点から処理量を削減するために、下記のような近似処理を用いることが好ましい。つまり、符号化部６では、選択肢の全ての組み合わせについて簡易で近似的な方法で符号量の推定値である近似的符号量を求め、例えば近似的符号量が最小のものから所定の複数の候補を選択する等にて好ましいと推定される複数の候補を絞り込み、絞り込まれた候補（選択された候補）中で最小の符号量を与えた選択肢を選択すれば、少ない処理量で最終的な符号量をほぼ最適に小さくできる。

　一つの例として、まず、サンプル群に含まれるサンプル数を“３サンプル”に固定した上で間隔Ｔの候補を少数に絞り込み、各候補に対して、サンプル群に含まれるサンプル数を組み合わせて、最も好ましい選択肢を選択するようにしてもよい。

　あるいは、近似的にサンプルの指標の和を測定し、サンプルの指標の低域への集中度や、周波数軸で最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数で選択肢を決定してもよい。具体的には、並べ替え後のサンプル列の振幅の絶対値の和を全体のサンプル列の低域側から1/4の領域について求め、その総和が予め定められた閾値と比較して大きければ、好ましい並べ替えであることが想定される。また、並べ替え後のサンプル列の最高周波数から低域側に向かってゼロの振幅を持つサンプルの連続数が最長となる選択肢を選択する方法に拠ると、低域に指標の大きいサンプルが集中していることを意味しており、これも好ましい並べ替えであることが想定される。

　上述のような近似処理で選択肢を決定すると、処理量は少ないが、必ずしも最終的な符号量を最小とするサンプル列に含まれるサンプルの並べ替えが選択できない場合が生じる。このため、上述のような近似処理で複数の候補を選択し、これら少数の候補だけについて最終的に符号量を正確に計算して最も好ましい（符号量が小さくなる）ものを選択すればよい。

［変形例］
　なお、サンプル列に含まれるサンプルの並べ替えによる利点が無い場合も考えられる。このような場合には並べ替え前のサンプル列を符号化すべきである。そこで、並べ替え部５からは並べ替え前のサンプル列(並べ替えを行っていないサンプル列)も出力し、符号化部６は並べ替え前のサンプル列も可変長符号化して符号列を得て、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量とを比較する。

　並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量のほうが少ない場合には、並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。

　並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量のほうが少ない場合には、並べ替え後のサンプル列を可変長符号化して得られた符号列と補助情報を出力する。

　並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量と補助情報の符号量との合計符号量と、が同一である場合は、並べ替え前のサンプル列を可変長符号化して得られた符号列と、並べ替え後のサンプル列を可変長符号化して得られた符号列と補助情報と、の何れか一方を出力する。何れを出力するかは、予め定めておく。

　また、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す第２補助情報も出力する（図１０参照）。この第２補助情報として１ビットを使えば十分である。

　なお、既述のように並べ替え後のサンプル列を可変長符号化して得られる符号列の近似的符号量すなわち符号量の推定値を得た場合には、並べ替え後のサンプル列を可変長符号化して得られる符号列の符号量に代えて、並べ替え後のサンプル列を可変長符号化して得られる符号列の近似的符号量を用いてもよい。また同様に、並べ替え前のサンプル列を可変長符号化して得られる符号列の近似的符号量すなわち符号量の推定値を得て、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量に代えて、並べ替え前のサンプル列を可変長符号化して得られる符号列の近似的符号量すなわち符号量の推定値を用いてもよい。

　また、予め予測利得またはその推定値がある定められた閾値より大きい場合のみサンプル列に含まれるサンプルの並べ替えを適用することに決めておくこともできる。これは予測利得が大きいときには声帯振動や楽器の振動が強く、周期性も高い場合が多いという音声や楽音の性質を利用するものである。予測利得は原音のエネルギーを予測残差のエネルギーで割ったものである。線形予測係数やPARCOR係数をパラメータとして使う符号化においては、量子化済みのパラメータを符号化装置と復号装置で共通に使うことができる。そこで、例えば、符号化部６は、符号化装置１００内の図示しない別の手段によって求めたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i)）を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は並べ替え後のサンプル列を可変長符号化して得られた符号列を出力し、そうでない場合は並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この例のように符号化装置と復号装置で共通に使うことができる場合は、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す第２補助情報を出力する必要は無い。すなわち、予測がきかない雑音的音声や無音時には効果が小さい可能性が高いので並べ替えをしないと決めておくほうが補助情報や計算の無駄が少ない。

　なお、並べ替え部５において、予測利得または予測利得の推定値の計算を行い、予測利得または予測利得の推定値がある定められた閾値より大きい場合はサンプル列に対する並べ替えを行って並べ替え後のサンプル列を符号化部６に出力し、そうでない場合はサンプル列に対する並べ替えを行なわずに並べ替え部５に入力されたサンプル列そのものを符号化部６に出力し、符号化部６では並べ替え部５から出力されたサンプル列を可変長符号化する構成としてもよい。

　なお、この構成の場合には、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。

　なお、ここで例示したライス符号化、エントロピー符号化、ランレングス符号化はいずれも周知であるからその詳細な説明を省略する。

「復号処理」
　続いて図５～図６を参照して復号処理を説明する。
　復号装置２００では、符号化装置１００または符号化装置１００ａによる符号化処理と逆順の処理でMDCT係数が再構成される。復号装置２００には、少なくとも、上記利得情報と、上記補助情報と、上記符号列が入力される。なお、符号化装置１００ａから第２補助情報が出力された場合にはこの第２補助情報も復号装置２００に入力される。

「復号部１１」
　まず、復号部１１が、フレームごとに、入力された符号列を選択情報に応じて復号して周波数領域のサンプル列を出力する（ステップＳ１１）。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部１１による復号処理の詳細は符号化装置１００の符号化部６による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部１１の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、どのような符号化方法が実行されたかは選択情報によって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する。

「回復部１２」
　次に、回復部１２が、フレームごとに、入力された補助情報に従って、復号部１１が出力した周波数領域のサンプル列から元のサンプルの並びを得る（ステップＳ１２）。ここで「元のサンプルの並び」とは、符号化装置１００の並べ替え部５に入力された「周波数領域のサンプル列」に相当する。上述のとおり、符号化装置１００の並べ替え部５による並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えを特定する情報は補助情報に含まれている。よって、回復部１２は補助情報に基づいて復号部１１が出力した周波数領域のサンプル列を元のサンプルの並びに戻すことができる。

　なお、補助情報に並べ替えを行ったか否かを表す第２補助情報が入力される構成も有り得る。この構成では、回復部１２は、並べ替えを行ったか否かを表す第２補助情報が並べ替えを行ったことを示すものである場合は復号部１１が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、並べ替えを行っていないことを示すものである場合は復号部１１が出力した周波数領域のサンプル列をそのまま出力する。

　また、予測利得または予測利得の推定値の大小により並べ替えを行ったか否かを判断する構成も有り得る。この構成では、回復部１２は、例えば、復号装置２００内の図示しない別の手段から入力されたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i)）を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は復号部１１が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、そうでない場合は復号部１１が出力した周波数領域のサンプル列をそのまま出力する。

　回復部１２による回復処理の詳細は符号化装置１００の並べ替え部５による並べ替え処理の詳細に対応するので、当該並べ替え処理の説明をここに援用し、その並べ替え処理の逆順の処理（逆の並べ替え）が回復部１２の行う回復処理であることを明記し、これをもって回復処理の詳細な説明とする。なお、理解の一助のため、上述の並べ替え処理の具体例に対応する回復処理の一例を説明する。

　例えば、並べ替え部５がサンプル群を低域側に集めてF(T-1)，F(T)，F(T+1)，F(2T-1)，F(2T)，F(2T+1)，F(3T-1)，F(3T)，F(3T+1)，F(4T-1)，F(4T)，F(4T+1)，F(5T-1)，F(5T)，F(5T+1)，F(1)，…，F(T-2)，F(T+2)，…，F(2T-2)，F(2T+2)，…，F(3T-2)，F(3T+2)，…，F(4T-2)，F(4T+2)，…，F(5T-2)，F(5T+2)，…F(jmax)を出力した上述の例であると、回復部１２には復号部１１が出力した周波数領域のサンプル列F(T-1)，F(T)，F(T+1)，F(2T-1)，F(2T)，F(2T+1)，F(3T-1)，F(3T)，F(3T+1)，F(4T-1)，F(4T)，F(4T+1)，F(5T-1)，F(5T)，F(5T+1)，F(1)，…，F(T-2)，F(T+2)，…，F(2T-2)，F(2T+2)，…，F(3T-2)，F(3T+2)，…，F(4T-2)，F(4T+2)，…，F(5T-2)，F(5T+2)，…F(jmax)が入力される。
そして、補助情報には、例えば、間隔Ｔに関する情報や、ｎが１以上５以下の各整数であることを表す情報や、サンプル群には３サンプルが含まれることを特定する情報などが含められている。従って、回復部１２は、この補助情報に基づいて、入力されたサンプル列F(T-1)，F(T)，F(T+1)，F(2T-1)，F(2T)，F(2T+1)，F(3T-1)，F(3T)，F(3T+1)，F(4T-1)，F(4T)，F(4T+1)，F(5T-1)，F(5T)，F(5T+1)，F(1)，…，F(T-2)，F(T+2)，…，F(2T-2)，F(2T+2)，…，F(3T-2)，F(3T+2)，…，F(4T-2)，F(4T+2)，…，F(5T-2)，F(5T+2)，…F(jmax)を元のサンプルの並びF(j)（1≦j≦jmax）に戻すことができる。

「逆量子化部１３」
　次に、逆量子化部１３が、フレームごとに、回復部１２が出力した元のサンプルの並びF(j)（1≦j≦jmax）を逆量子化する（ステップＳ１３）。上述の例に対応させて述べれば、逆量子化によって、符号化装置１００の量子化部４に入力された「利得で正規化された重み付け正規化MDCT係数列」が得られる。

「利得乗算部１４」
　次に、利得乗算部１４が、フレームごとに、逆量子化部１３が出力した「利得で正規化された重み付け正規化MDCT係数列」の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得る（ステップＳ１４）。

「重み付け包絡逆正規化部１５」
　次に、重み付け包絡逆正規化部１５が、フレームごとに、利得乗算部１４が出力した「正規化された重み付け正規化MDCT係数列」の各係数に重み付けパワースペクトル包絡値を除算することで「MDCT係数列」を得る（ステップＳ１５）。

「時間領域変換部１６」
　次に、時間領域変換部１６が、フレームごとに、重み付け包絡逆正規化部１５が出力した「MDCT係数列」を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る（ステップＳ１６）。

　ステップＳ１３からＳ１６の各処理は従来的処理であるから詳細な説明を省略したが、例えば、上記各非特許文献に詳しい。

　実施形態から明らかなように、例えば基本周波数が明瞭である場合には、基本周波数に応じてサンプル列を並べ替えたものを符号化することによって、効率の高い符号化ができる（すなわち平均符号長を小さくできる）。また、サンプル列に含まれるサンプルの並べ替えによって局所領域ごとに同等か同程度の指標を有するサンプルが集中するので、可変長符号化の効率化だけでなく、量子化歪の軽減や符号量の削減が可能となっている。

＜符号化装置／復号装置のハードウェア構成例＞
　上述の実施形態に関わる符号化装置／復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ＣＰＵ（Central Processing Unit）〔キャッシュメモリなどを備えていてもよい。〕、メモリであるＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置／復号装置に、ＣＤ－ＲＯＭなどの記憶媒体を読み書きできる装置（ドライブ）などを設けるとしてもよい。

　符号化装置／復号装置の外部記憶装置には、符号化／復号を実行するためのプログラム並びにこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。

　符号化装置の記憶部には、音声音響信号に由来する周波数領域のサンプル列に含まれるサンプルの並べ替えを行うためのプログラム、並べ替えで得られたサンプル列の符号化のためのプログラムなどが記憶されている。

　復号装置の記憶部には、入力された符号列を復号するためのプログラム、復号で得られたサンプル列を符号化装置で並べ替えが行われる前のサンプル列に回復するためのプログラムなどが記憶されている。

　符号化装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてＲＡＭに読み込まれて、ＣＰＵで解釈実行・処理される。この結果、ＣＰＵが所定の機能（並べ替え部、符号化部）を実現することで符号化が実現される。

　復号装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてＲＡＭに読み込まれて、ＣＰＵで解釈実行・処理される。この結果、ＣＰＵが所定の機能（復号部、回復部）を実現することで符号化が実現される。

＜補記＞
　本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

　また、上記実施形態において説明したハードウェアエンティティ（符号化装置／復号装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

　　　フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
　　　フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔Ｔ、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Ｔを、間隔Ｔの候補の集合Ｓの中から決定する間隔決定ステップと、
　　　上記間隔決定ステップで決定された間隔Ｔを符号化して補助情報を得る補助情報生成ステップと、
　　　（１）上記サンプル列の全てのサンプルが含まれ、かつ、
　　　（２）上記間隔決定ステップで決定された間隔Ｔに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化ステップとを有し、
　　　上記間隔決定ステップは、
　　　上記補助情報で表現可能な間隔ＴのＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を上記集合Ｓとして、上記間隔Ｔを決定するステップである
ことを特徴とする符号化方法。
　　　請求項１に記載の符号化方法であって、
　　　上記間隔決定ステップは、
　　　上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補に隣接する値または／および所定の差分を持つ値を上記集合Ｓに加える追加ステップを更に含む
ことを特徴とする符号化方法。
　　　請求項１または請求項２に記載の符号化方法であって、
　　　上記間隔決定ステップは、
　　　上記補助情報で表現可能な間隔ＴのＺ個の候補のうちの一部であるＺ₁個の候補から、現在のフレームの上記音響信号または／およびサンプル列から求まる指標に基づいて選択した一部の候補を上記Ｚ_２個の候補（ただしＺ_２＜Ｚ_１）とする予備選択ステップを更に含む
ことを特徴とする符号化方法。
　　　請求項１または請求項２に記載の符号化方法であって、
　　　上記間隔決定ステップは、
　　　上記補助情報で表現可能な間隔ＴのＺ個の候補のうちの一部であるＺ₁個の候補から、現在のフレームの上記音響信号または／およびサンプル列から求まる指標に基づいて一部の候補を選択する予備選択ステップと、
　　　上記予備選択ステップで選択された候補と、上記予備選択ステップで選択された候補に隣接する値または／および所定の差分を持つ値とのセットを上記Ｚ_２個の候補とする第二追加ステップを更に含む
ことを特徴とする符号化方法。
　　　請求項１から請求項４の何れかに記載の符号化方法であって、
　　　上記間隔決定ステップは、
　　　現在のフレームの上記音響信号または／およびサンプル列から求まる指標に基づいて、上記集合Ｓに含まれる間隔Ｔの候補のうちの一部の候補を選択する第二予備選択ステップと、
　　　上記第二予備選択ステップで選択された一部の候補により構成される集合を対象として上記間隔Ｔを決定する最終選択ステップとを含む
こと特徴とする符号化方法。
　　　請求項１から請求項５の何れかに記載の符号化方法であって、
　　　現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Ｓにて、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補が占める割合が大きい
ことを特徴とする符号化方法。
　　　請求項１から請求項６の何れかに記載の符号化方法であって、
　　　現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Ｓには上記Ｚ_２個の候補のみが含まれる
ことを特徴とする符号化方法。
　　　請求項６または請求項７に記載の符号化方法であって、上記現在のフレームの上記音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きい、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きい、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さい、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さい、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きい、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きい、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さい、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さい、
(e-1)「現在のフレームの上記音響信号のパワー」が大きい、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きい、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さい、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さい、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である
ことを特徴とする符号化方法。
　　　請求項１から請求項５の何れかに記載の符号化方法であって、
　　　上記サンプル列符号化ステップは、
　　　上記並べ替え前のサンプル列を符号化して得られる符号列と、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報、のうち符号量が少ない方を出力するステップを含む
ことを特徴とする符号化方法。
　　　請求項１から請求項５の何れかに記載の符号化方法であって、
　　　上記サンプル列符号化ステップは、
　　　上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計が、上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値より少ない場合には、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報とを出力し、
　　　上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値が、上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計より少ない場合には、上記並べ替え前のサンプル列を符号化して得られる符号列を出力する
ことを特徴とする符号化方法。
　　　請求項９または請求項１０に記載の符号化方法であって、
　　　直前のフレームで出力した符号列が並べ替え後のサンプル列を符号化して得られた符号列である場合のほうが、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合よりも、上記集合Ｓにて、上記所定フレーム数だけ過去のフレームにおいて間隔決定ステップの対象となった候補が占める割合が大きい
ことを特徴とする符号化方法。
　　　請求項９から請求項１１のいずれかに記載の符号化方法であって、
　　　直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合には、上記集合Ｓには上記Ｚ_２個の候補のみが含まれる
ことを特徴とする符号化方法。
　　　請求項９から請求項１１のいずれかに記載の符号化方法であって、
　　　現在のフレームが時間的に先頭にあるフレームである場合、直前のフレームが上記の符号化方法以外で符号化された場合、直前のフレームで出力した符号列が並べ替え前のサンプル列を符号化して得られた符号列である場合、の何れかに該当する場合には、上記集合Ｓには上記Ｚ_２個の候補のみが含まれる
ことを特徴とする符号化方法。
　　　フレーム単位の音響信号の周期性特徴量を決定する方法であって、
　　　フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定ステップと、
　　　周期性特徴量決定ステップで得られた周期性特徴量を符号化して補助情報を得る補助情報生成ステップとを有し、
　　　上記周期性特徴量決定ステップは、
　　　上記補助情報で表現可能な周期性特徴量のＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を周期性特徴量の候補の集合Ｓとして、上記周期性特徴量を決定するステップである
ことを特徴とする周期性特徴量決定方法。
　　　請求項１４に記載の周期性特徴量決定方法であって、
　　　上記周期性特徴量決定ステップは、
　　　上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補に隣接する値または／および所定の差分を持つ値を上記集合Ｓに加える追加ステップを更に含む
ことを特徴とする周期性特徴量決定方法。
　　　請求項１４または請求項１５に記載の周期性特徴量決定方法であって、
　　　現在のフレームの上記音響信号の定常性の大きさを表す指標値が大きいほど、上記集合Ｓにて、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定ステップの対象となった候補が占める割合が大きい
ことを特徴とする周期性特徴量決定方法。
　　　請求項１６に記載の周期性特徴量決定方法であって、
　　　現在のフレームの上記音響信号の定常性の大きさを表す指標値が所定の条件より小さい場合には、上記集合Ｓには上記Ｚ_２個の候補のみが含まれる
ことを特徴とする周期性特徴量決定方法。
　　　請求項１６または請求項１７に記載の周期性特徴量決定方法であって、上記現在のフレームの上記音響信号の定常性の大きさを表す指標値は、
(a-1)「現在のフレームの上記音響信号の予測利得」が大きい、
(a-2)「現在のフレームの上記音響信号の予測利得の推定値」が大きい、
(b-1)「直前のフレームの予測利得」と「現在のフレームの予測利得」との差分が小さい、
(b-2)「直前のフレームの予測利得の推定値」と「現在のフレームの予測利得の推定値」との差分が小さい、
(c-1)「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」が大きい、
(c-2)「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」が大きい、
(d-1)「直前のフレームに含まれる上記音響信号のサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプルの振幅の和」との差分が小さい、
(d-2)「直前のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」と「現在のフレームに含まれる上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列に含まれるサンプルの振幅の和」との差分が小さい、
(e-1)「現在のフレームの上記音響信号のパワー」が大きい、
(e-2)「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」が大きい、
(f-1)「直前のフレームの上記音響信号のパワー」と「現在のフレームの上記音響信号のパワー」との差分が小さい、
(f-2)「直前のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」と「現在のフレームの上記音響信号のサンプル列を周波数領域に変換して得られたサンプル列のパワー」との差分が小さい、の少なくともいずれか一つの条件を満たす場合に、大きくなる値である
ことを特徴とする周期性特徴量決定方法。
　　　フレーム単位の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
　　　フレーム毎に、上記音響信号の周期性に対応するサンプルの間隔Ｔ、または、上記音響信号の基本周波数の整数倍に対応するサンプルの間隔Ｔを、間隔Ｔの候補の集合Ｓの中から決定する間隔決定部と、
　　　上記間隔決定部によって決定された間隔Ｔを符号化して補助情報を得る補助情報生成部と、
　　　（１）上記サンプル列の全てのサンプルが含まれ、かつ、
　　　（２）上記間隔決定部によって決定された間隔Ｔに基づいて、上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として、上記並べ替え後のサンプル列を符号化して符号列を得るサンプル列符号化部とを含み、
　　　上記間隔決定部は、
　　　上記補助情報で表現可能な間隔ＴのＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて間隔決定部による処理対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、上記所定フレーム数だけ過去のフレームにおいて間隔決定部による処理対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を上記集合Ｓとして、上記間隔Ｔを決定する
ことを特徴とする符号化装置。
　　　請求項１９に記載の符号化装置であって、
　　　上記サンプル列符号化部は、
　　　上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計が、上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値より少ない場合には、上記並べ替え後のサンプル列を符号化して得られる符号列と上記補助情報とを出力し、
　　　上記並べ替え前のサンプル列を符号化して得られる符号列の符号量またはその推定値が、上記並べ替え後のサンプル列を符号化して得られる符号列の符号量またはその推定値と上記補助情報の符号量との合計より少ない場合には、上記並べ替え前のサンプル列を符号化して得られる符号列を出力する
ことを特徴とする符号化装置。
　　　フレーム単位の音響信号の周期性特徴量を決定する周期性特徴量決定装置であって、
　　　フレーム毎に、上記音響信号の周期性特徴量を、周期性特徴量の候補の集合の中から決定する周期性特徴量決定部と、
　　　周期性決定部によって得られた周期性特徴量を符号化して補助情報を得る補助情報生成部とを含み、
　　　上記周期性決定部は、
　　　上記補助情報で表現可能な周期性特徴量のＺ個の候補のうちの、所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部による処理対象となった候補に依存せずに選択されたＺ_２個の候補（ただし、Ｚ_２＜Ｚ）と、上記所定フレーム数だけ過去のフレームにおいて周期性特徴量決定部による処理対象となった候補と、によるＹ個の候補（ただし、Ｙ＜Ｚ）により構成される集合を周期性特徴量の候補の集合Ｓとして、上記周期性特徴量を決定する
ことを特徴とする周期性特徴量決定装置。
　　　請求項１から請求項１３のいずれかに記載された符号化方法、または、請求項１４から請求項１８のいずれかに記載された周期性特徴量決定方法、の各ステップをコンピュータに実行させるためのプログラム。
　　　請求項１から請求項１３のいずれかに記載された符号化方法、または、請求項１４から請求項１８のいずれかに記載された周期性特徴量決定方法、の各ステップをコンピュータに実行させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。