JPH1173200A

JPH1173200A - 音響信号の符号化方法およびコンピュータ読み取り可能な記録媒体

Info

Publication number: JPH1173200A
Application number: JP9249636A
Authority: JP
Inventors: Toshio Motegi; 敏雄茂出木
Original assignee: Dai Nippon Printing Co Ltd
Current assignee: Dai Nippon Printing Co Ltd
Priority date: 1997-08-29
Filing date: 1997-08-29
Publication date: 1999-03-16

Abstract

(57)【要約】【課題】アナログ音響信号をＭＩＤＩデータにより符
号化する。【解決手段】アナログ音響信号をＰＣＭによりデジタ
ル化し、単位区間Ｕ１〜Ｕ７に分割し、各区間ごとに代
表周波数と代表強度を求める。代表周波数に対応するノ
ートナンバーを有し、代表強度に対応するベロシティー
を有し、単位区間長に対応するデルタタイムを有するＭ
ＩＤＩ符号データＣ１〜Ｃ７を個々の単位区間ごとに定
義する。符号データＣ１〜Ｃ７を２つのトラックに分離
配置し、各符号データのデルタタイムを延長することに
より、時間軸上で両トラックの符号データが部分的に重
なるようにする。重なった符号データは和音として提示
される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音響信号の符号化方
法に関し、時系列の強度信号として与えられる音響信号
を符号化し、これを復号化して再生する技術に関する。

【０００２】

【従来の技術】音響信号を符号化する技術として、ＰＣ
Ｍ（Pulse Code Modulation ）の手法は最も普及してい
る手法であり、現在、オーディオＣＤやＤＡＴなどの記
録方式として広く利用されている。このＰＣＭの手法の
基本原理は、アナログ音響信号を所定のサンプリング周
波数でサンプリングし、各サンプリング時の信号強度を
量子化してデジタルデータとして表現する点にあり、サ
ンプリング周波数や量子化ビット数を高くすればするほ
ど、原音を忠実に再生することが可能になる。ただ、サ
ンプリング周波数や量子化ビット数を高くすればするほ
ど、必要な情報量も増えることになる。そこで、できる
だけ情報量を低減するための手法として、信号の変化差
分のみを符号化するＡＤＰＣＭ（Adaptive Differentia
l Pulse Code Modulation ）の手法も用いられている。

【０００３】一方、電子楽器による楽器音を符号化しよ
うという発想から生まれたＭＩＤＩ（Musical Instrume
nt Digital Interface）規格も、パーソナルコンピュー
タの普及とともに盛んに利用されるようになってきてい
る。このＭＩＤＩ規格による符号データ（以下、ＭＩＤ
Ｉデータという）は、基本的には、楽器のどの鍵盤キー
を、どの程度の強さで弾いたか、という楽器演奏の操作
を記述したデータであり、このＭＩＤＩデータ自身に
は、実際の音の波形は含まれていない。そのため、実際
の音を再生する場合には、楽器音の波形を記憶したＭＩ
ＤＩ音源が別途必要になる。しかしながら、上述したＰ
ＣＭの手法で音を記録する場合に比べて、情報量が極め
て少なくてすむという特徴を有し、その符号化効率の高
さが注目を集めている。このＭＩＤＩ規格による符号化
および復号化の技術は、現在、パーソナルコンピュータ
を用いて楽器演奏、楽器練習、作曲などを行うソフトウ
エアに広く採り入れられており、カラオケ、ゲームの効
果音といった分野でも広く利用されている。

【０００４】

【発明が解決しようとする課題】上述したように、ＰＣ
Ｍの手法により音響信号を符号化する場合、十分な音質
を確保しようとすれば情報量が膨大になり、データ処理
の負担が重くならざるを得ない。したがって、通常は、
ある程度の情報量に抑えるため、ある程度の音質に妥協
せざるを得ない。もちろん、ＭＩＤＩ規格による符号化
の手法を採れば、非常に少ない情報量で十分な音質をも
った音の再生が可能であるが、上述したように、ＭＩＤ
Ｉ規格そのものが、もともと楽器演奏の操作を符号化す
るためのものであるため、広く一般音響への適用を行う
ことはできない。別言すれば、ＭＩＤＩデータを作成す
るためには、実際に楽器を演奏するか、あるいは、楽譜
の情報を用意する必要がある。

【０００５】このように、従来用いられているＰＣＭの
手法にしても、ＭＩＤＩの手法にしても、それぞれ音響
信号の符号化方法としては一長一短があり、一般の音響
信号について、少ない情報量で十分な音質を確保するこ
とはできない。ところが、一般の音響信号についても効
率的な符号化を行いたいという要望は、益々強くなって
きている。

【０００６】そこで本発明は、音響信号に対して効率的
な符号化を行うことができる音響信号の符号化方法を提
供することを目的とする。

【０００７】

【課題を解決するための手段】

(1) 本発明の第１の態様は、時系列の強度信号として
与えられる音響信号を符号化するための音響信号の符号
化方法において、符号化対象となる音響信号を、デジタ
ルの音響データとして取り込む入力段階と、この音響デ
ータの時間軸上に、複数の単位区間を設定する区間設定
段階と、個々の単位区間内の音響データに基づいて、個
々の単位区間を代表する所定の代表周波数および代表強
度を定義し、時間軸上での個々の単位区間の始端位置お
よび終端位置を示す情報と代表周波数および代表強度を
示す情報とを含む符号データを生成し、個々の単位区間
の音響データを個々の符号データによって表現する符号
化段階と、を行い、更に符号化段階において、単位区間
の長さを延長する区間延長処理を行うようにしたもので
ある。

【０００８】(2) 本発明の第２の態様は、上述の第１
の態様に係る音響信号の符号化方法において、符号化段
階において、時間軸を共通とする複数のトラックを定義
し、区間設定段階で設定された個々の単位区間を複数の
トラックに分離して再配置するトラック分離処理を行
い、各トラックごとにそれぞれ区間延長処理を行うよう
にしたものである。

【０００９】(3) 本発明の第３の態様は、上述の第２
の態様に係る音響信号の符号化方法において、あるトラ
ックに配置された単位区間が、別なトラックに配置され
た別な単位区間に対して、共通の時間軸上で少なくとも
一部分が重複するように、各トラックごとの区間延長処
理を行うようにしたものである。

【００１０】(4) 本発明の第４の態様は、上述の第１
〜第３の態様に係る音響信号の符号化方法において、単
位区間延長処理を行った後、互いに類似した符号データ
をもつ単位区間が所定の基準間隔以下の間隔をおいて存
在していた場合に、これらの単位区間を１つの単位区間
に統合する区間統合処理を行い、統合前の個々の単位区
間の符号データに基いて、統合後の単位区間の符号デー
タを決定するようにしたものである。

【００１１】(5) 本発明の第５の態様は、上述の第２
の態様に係る音響信号の符号化方法において、トラック
分離処理を行う際に、互いに類似した符号データをもつ
近接した単位区間を同一トラック上に再配置するように
したものである。

【００１２】(6) 本発明の第６の態様は、上述の第１
〜第５の態様に係る音響信号の符号化方法において、単
位区間延長処理を行う際に、最大区間長Ｌmax と最小区
間長Ｌmin とを設定し、各区間を、隣接する区間に接触
するまで、最大でＬmax まで延長する処理を行うととも
に、区間長がＬmin 未満の区間を削除する処理を行うよ
うにしたものである。

【００１３】(7) 本発明の第７の態様は、上述の第１
〜第６の態様に係る音響信号の符号化方法において、符
号化段階で、代表周波数に基づいてノートナンバーを定
め、代表強度に基づいてベロシティーを定め、単位区間
の長さに基づいてデルタタイムを定め、１つの単位区間
の音響データを、ノートナンバー、ベロシティー、デル
タタイムで表現されるＭＩＤＩ形式の符号データに変換
し、時間軸上で重複する単位区間に対しては異なるチャ
ンネルを割り当てるようにしたものである。

【００１４】(8) 本発明の第８の態様は、上述の第１
〜第７の態様に係る音響信号の符号化方法を実行する音
響信号の符号化のためのプログラムをコンピュータ読み
取り可能な記録媒体に記録するようにしたものである。

【００１５】(9) 本発明の第８の態様は、上述の第１
〜第７の態様に係る音響信号の符号化方法により符号化
された符号データをコンピュータ読み取り可能な記録媒
体に記録するようにしたものである。

【００１６】

【発明の実施の形態】以下、本発明を図示する実施形態
に基づいて説明する。本願発明は、特願平９−６７４６
７号明細書に開示された発明（以下、先願発明という）
を基本発明とした改良発明に相当するものである。した
がって、以下の説明では、まず、§１〜§３において先
願発明に係る符号化方法を説明することにする。

【００１７】§１．先願発明に係る音響信号の符号化
方法の基本原理はじめに、先願発明に係る音響信号の符号化方法の基本
原理を図１を参照しながら説明する。いま、図１の上段
に示すように、時系列の強度信号としてアナログ音響信
号が与えられたものとしよう。図示の例では、横軸に時
間軸ｔ、縦軸に信号強度Ａをとってこの音響信号を示し
ている。先願発明では、まずこのアナログ音響信号を、
デジタルの音響データとして取り込む処理を行う。これ
は、従来の一般的なＰＣＭの手法を用い、所定のサンプ
リング周波数でこのアナログ音響信号をサンプリング
し、信号強度Ａを所定の量子化ビット数を用いてデジタ
ルデータに変換する処理を行えばよい。ここでは、説明
の便宜上、ＰＣＭの手法でデジタル化した音響データの
波形も、図１の上段のアナログ音響信号と同一の波形で
示すことにする。

【００１８】次に、このデジタル音響データの時間軸ｔ
上に複数の単位区間を設定する。図示の例では、６つの
単位区間Ｕ１〜Ｕ６が設定されている。第ｉ番目の単位
区間Ｕｉは、時間軸ｔ上の始端ｓｉおよび終端ｅｉの座
標値によって、その時間軸ｔ上での位置と長さとが示さ
れる。たとえば、単位区間Ｕ１は、始端ｓ１〜終端ｅ１
までの（ｅ１−ｓ１）なる長さをもつ区間である。

【００１９】こうして、複数の単位区間が設定された
ら、個々の単位区間内の音響データに基づいて、個々の
単位区間を代表する所定の代表周波数および代表強度を
定義する。ここでは、第ｉ番目の単位区間Ｕｉについ
て、代表周波数Ｆｉおよび代表強度Ａｉが定義された状
態が示されている。たとえば、第１番目の単位区間Ｕ１
については、代表周波数Ｆ１および代表強度Ａ１が定義
されている。代表周波数Ｆ１は、始端ｓ１〜終端ｅ１ま
での区間に含まれている音響データの周波数成分の代表
値であり、代表強度Ａｉは、同じく始端ｓ１〜終端ｅ１
までの区間に含まれている音響データの信号強度の代表
値である。単位区間Ｕ１内の音響データに含まれる周波
数成分は、通常、単一ではなく、信号強度も変動するの
が一般的である。先願発明のポイントは、１つの単位区
間について、単一の代表周波数と単一の代表強度を定義
し、これら代表値を用いて符号化を行う点にある。

【００２０】すなわち、個々の単位区間について、それ
ぞれ代表周波数および代表強度が定義されたら、時間軸
ｔ上での個々の単位区間の始端位置および終端位置を示
す情報と、定義された代表周波数および代表強度を示す
情報と、により符号データを生成し、個々の単位区間の
音響データを個々の符号データによって表現するのであ
る。単一の周波数をもち、単一の信号強度をもった音響
信号が、所定の期間だけ持続する、という事象を符号化
する手法として、ＭＩＤＩ規格に基づく符号化を利用す
ることができる。ＭＩＤＩ規格による符号データ（ＭＩ
ＤＩデータ）は、いわば音符によって音を表現したデー
タということができ、図１では、下段に示す音符によっ
て、最終的に得られる符号データの概念を示している。

【００２１】結局、各単位区間内の音響データは、代表
周波数Ｆ１に相当する音程情報（ＭＩＤＩ規格における
ノートナンバー）と、代表強度Ａ１に相当する強度情報
（ＭＩＤＩ規格におけるベロシティー）と、単位区間の
長さ（ｅ１−ｓ１）に相当する長さ情報（ＭＩＤＩ規格
におけるデルタタイム）と、をもった符号データに変換
されることになる。このようにして得られる符号データ
の情報量は、もとの音響信号のもつ情報量に比べて、著
しく小さくなり、飛躍的な符号化効率が得られることに
なる。これまで、ＭＩＤＩデータを生成する手法として
は、演奏者が実際に楽器を演奏するときの操作をそのま
ま取り込んで符号化するか、あるいは、楽譜上の音符を
データとして入力するしかなかったが、上述した手法を
用いれば、実際のアナログ音響信号からＭＩＤＩデータ
を直接生成することが可能になる。

【００２２】もっとも、上述した手法による符号化方法
を実用化するためには、いくつか留意すべき点がある。
第１の留意点は、再生時に音源を用意する必要があると
いう点である。上述の手法によって最終的に得られる符
号データには、もとの音響信号の波形データそのものは
含まれていないため、何らかの音響波形のデータをもっ
た音源が必要になる。たとえば、ＭＩＤＩデータを再生
する場合には、ＭＩＤＩ音源が必要になる。もっとも、
ＭＩＤＩ規格が普及した現在では、種々のＭＩＤＩ音源
が入手可能であり、実用上は大きな問題は生じない。た
だ、もとの音響信号に忠実な再生音を得るためには、も
との音響信号に含まれていた音響波形に近似した波形デ
ータをもったＭＩＤＩ音源を用意する必要がある。適当
なＭＩＤＩ音源を用いた再生を行うことができれば、む
しろもとの音響信号よりも高い音質で、臨場感あふれる
再生音を得ることも可能になる。

【００２３】第２の留意点は、１つの単位区間に含まれ
る音響データの周波数を、単一の代表周波数に置き換え
てしまうという基本原理に基づく符号化手法であるた
め、非常に幅の広い周波数成分を同時に含んでいるよう
な音響信号の符号化には不向きであるという点である。
もちろん、この符号化手法は、どのような音響信号に対
しても適用可能であるが、人間の声音のように、非常に
周波数レンジの広い音響信号に対して符号化を行って
も、再生時に十分な再現性は得られなくなる。このよう
な問題に対処するには、時間軸上で重複するように複数
の単位区間を定義するようにし、各単位区間ごとにそれ
ぞれ別個に符号化を行うようにすればよい。この手法に
ついては、§６において述べることにする。

【００２４】第３の留意点は、効率的で再現性の高い符
号化を行うためには、単位区間の設定方法に工夫を凝ら
す必要があるという点である。先願発明の基本原理は、
上述したように、もとの音響データを複数の単位区間に
分割し、各単位区間ごとに、単一周波数および単一強度
を示す符号データに変換するという点にある。したがっ
て、最終的に得られる符号データは、単位区間の設定方
法に大きく依存することになる。最も単純な単位区間の
設定方法は、時間軸上で、たとえば１０ｍｓごとという
ように、等間隔に単位区間を一義的に定義する方法であ
る。しかしながら、この方法では、符号化対象となるも
との音響データにかかわらず、常に一定の方法で単位区
間の定義が行われることになり、必ずしも効率的で再現
性の高い符号化は期待できない。したがって、実用上
は、もとの音響データの波形を解析し、個々の音響デー
タに適した単位区間の設定を行うようにするのが好まし
い。

【００２５】効率的な単位区間の設定を行う１つのアプ
ローチは、音響データの中で周波数帯域が近似した区間
を１つのまとまった単位区間として抽出するという方法
である。単位区間内の周波数成分は１つの代表周波数に
よって置き換えられてしまうので、この代表周波数とあ
まりにかけ離れた周波数成分が含まれていると、再生時
の再現性が低減する。したがって、ある程度近似した周
波数が持続する区間を１つの単位区間として抽出するこ
とは、再現性のよい効率的な符号化を行う上で重要であ
る。このアプローチを採る場合、具体的には、もとの音
響データの周波数の変化点を認識し、この変化点を境界
とする単位区間の設定を行うようにすればよい。

【００２６】効率的な単位区間の設定を行うもう１つの
アプローチは、音響データの中で信号強度が近似した区
間を１つのまとまった単位区間として抽出するという方
法である。単位区間内の信号強度は１つの代表強度によ
って置き換えられてしまうので、この代表強度とあまり
にかけ離れた信号強度が含まれていると、再生時の再現
性が低減する。したがって、ある程度近似した信号強度
が持続する区間を１つの単位区間として抽出すること
は、再現性のよい効率的な符号化を行う上で重要であ
る。このアプローチを採る場合、具体的には、もとの音
響データの信号強度の変化点を認識し、この変化点を境
界とする単位区間の設定を行うようにすればよい。

【００２７】§２．先願発明に係る音響信号の符号化
方法の実用的な手順図２は、先願発明のより実用的な手順を示す流れ図であ
る。この手順は、入力段階Ｓ１０、変極点定義段階Ｓ２
０、区間設定段階Ｓ３０、符号化段階Ｓ４０の４つの大
きな段階から構成されている。入力段階Ｓ１０は、符号
化対象となる音響信号を、デジタルの音響データとして
取り込む段階である。変極点定義段階Ｓ２０は、後の区
間設定段階Ｓ３０の準備段階ともいうべき段階であり、
取り込んだ音響データの波形について変極点（ローカル
ピーク）を求める段階である。また、区間設定段階Ｓ３
０は、この変極点に基づいて、音響データの時間軸上に
複数の単位区間を設定する段階であり、符号化段階Ｓ４
０は、個々の単位区間の音響データを個々の符号データ
に変換する段階である。符号データへの変換原理は、既
に§１で述べたとおりである。すなわち、個々の単位区
間内の音響データに基づいて、個々の単位区間を代表す
る所定の代表周波数および代表強度を定義し、時間軸上
での個々の単位区間の始端位置および終端位置を示す情
報と、代表周波数および代表強度を示す情報と、によっ
て符号データが生成されることになる。以下、これらの
各段階において行われる処理を順に説明する。

【００２８】＜＜＜２．１入力段階＞＞＞入力段
階Ｓ１０では、サンプリング処理Ｓ１１と直流成分除去
処理Ｓ１２とが実行される。サンプリング処理Ｓ１１
は、符号化の対象となるアナログ音響信号を、デジタル
の音響データとして取り込む処理であり、従来の一般的
なＰＣＭの手法を用いてサンプリングを行う処理であ
る。この実施形態では、サンプリング周波数：４４．１
ｋＨｚ、量子化ビット数：１６ビットという条件でサン
プリングを行い、デジタルの音響データを用意してい
る。

【００２９】続く、直流成分除去処理Ｓ１２は、入力し
た音響データに含まれている直流成分を除去するデジタ
ル処理である。たとえば、図３に示す音響データは、振
幅の中心レベルが、信号強度を示すデータレンジの中心
レベル（具体的なデジタル値としては、たとえば、１６
ビットでサンプリングを行い、０〜６５５３５のデータ
レンジが設定されている場合には３２７６８なる値。以
下、説明の便宜上、図３のグラフに示すように、データ
レンジの中心レベルに０をとり、サンプリングされた個
々の信号強度の値を正または負で表現する）よりもＤだ
け高い位置にきている。別言すれば、この音響データに
は、値Ｄに相当する直流成分が含まれていることにな
る。サンプリング処理の対象になったアナログ音響信号
に直流成分が含まれていると、デジタル音響データにも
この直流成分が残ることになる。そこで、直流成分除去
処理Ｓ１２によって、この直流成分Ｄを除去する処理を
行い、振幅の中心レベルとデータレンジの中心レベルと
を一致させる。具体的には、サンプリングされた個々の
信号強度の平均が０になるように、直流成分Ｄを差し引
く演算を行えばよい。これにより、正および負の両極性
デジタル値を信号強度としてもった音響データが用意で
きる。

【００３０】＜＜＜２．２変極点定義段階＞＞＞
変極点定義段階Ｓ２０では、変極点探索処理Ｓ２１と同
極性変極点の間引処理Ｓ２２とが実行される。変極点探
索処理Ｓ２１は、取り込んだ音響データの波形について
変極点を求める処理である。図４は、図３に示す音響デ
ータの一部を時間軸に関して拡大して示したグラフであ
る。このグラフでは、矢印Ｐ１〜Ｐ６の先端位置の点が
変極点（極大もしくは極小の点）に相当し、各変極点は
いわゆるローカルピークに相当する点となる。このよう
な変極点を探索する方法としては、たとえば、サンプリ
ングされたデジタル値を時間軸に沿って順に注目してゆ
き、増加から減少に転じた位置、あるいは減少から増加
に転じた位置を認識すればよい。ここでは、この変極点
を図示のような矢印で示すことにする。

【００３１】各変極点は、サンプリングされた１つのデ
ジタルデータに対応する点であり、所定の信号強度の情
報（矢印の長さに相当）をもつとともに、時間軸ｔ上で
の位置の情報をもつことになる。図５は、図４に矢印で
示す変極点Ｐ１〜Ｐ６のみを抜き出して示した図であ
る。以下の説明では、この図５に示すように、第ｉ番目
の変極点Ｐｉのもつ信号強度（絶対値）を矢印の長さａ
ｉとして示し、時間軸ｔ上での変極点Ｐｉの位置をｔｉ
として示すことにする。結局、変極点探索処理Ｓ２１
は、図３に示すような音響データに基づいて、図５に示
すような各変極点に関する情報を求める処理ということ
になる。

【００３２】ところで、図５に示す各変極点Ｐ１〜Ｐ６
は、交互に極性が反転する性質を有する。すなわち、図
５の例では、奇数番目の変極点Ｐ１，Ｐ３，Ｐ５は上向
きの矢印で示され、偶数番目の変極点Ｐ２，Ｐ４，Ｐ６
は下向きの矢印で示されている。これは、もとの音響デ
ータ波形の振幅が正負交互に現れる振動波形としての本
来の姿をしているためである。しかしながら、実際に
は、このような本来の振動波形が必ずしも得られるとは
限らず、たとえば、図６に示すように、多少乱れた波形
が得られる場合もある。この図６に示すような音響デー
タに対して変極点探索処理Ｓ２１を実行すると、個々の
変極点Ｐ１〜Ｐ７のすべてが検出されてしまうため、図
７に示すように、変極点を示す矢印の向きは交互に反転
するものにはならない。しかしながら、単一の代表周波
数を定義する上では、向きが交互に反転した矢印列が得
られるのが好ましい。

【００３３】同極性変極点の間引処理Ｓ２２は、図７に
示すように、同極性のデジタル値をもった変極点（同じ
向きの矢印）が複数連続した場合に、絶対値が最大のデ
ジタル値をもった変極点（最も長い矢印）のみを残し、
残りを間引きしてしまう処理である。図７に示す例の場
合、上向きの３本の矢印Ｐ１〜Ｐ３のうち、最も長いＰ
２のみが残され、下向きの３本の矢印Ｐ４〜Ｐ６のう
ち、最も長いＰ４のみが残され、結局、間引処理Ｓ２２
により、図８に示すように、３つの変極点Ｐ２，Ｐ４，
Ｐ７のみが残されることになる。この図８に示す変極点
は、図６に示す音響データの波形の本来の姿に対応した
ものになる。

【００３４】＜＜＜２．３区間設定段階＞＞＞既
に述べたように、先願発明に係る符号化方法において、
効率的で再現性の高い符号化を行うためには、単位区間
の設定方法に工夫を凝らす必要がある。その意味で、図
２に示す各段階のうち、区間設定段階Ｓ３０は、実用上
非常に重要な段階である。上述した変極点定義段階Ｓ２
０は、この区間設定段階Ｓ３０の準備段階になってお
り、単位区間の設定は、個々の変極点の情報を利用して
行われる。すなわち、この区間設定段階Ｓ３０では、変
極点に基づいて音響データの周波数もしくは信号強度の
変化点を認識し、この変化点を境界とする単位区間を設
定する、という基本的な考え方に沿って処理が進められ
る。

【００３５】図５に示すように、矢印で示されている個
々の変極点Ｐ１〜Ｐ６には、それぞれ信号強度ａ１〜ａ
６が定義されている。しかしながら、個々の変極点Ｐ１
〜Ｐ６それ自身には、周波数に関する情報は定義されて
いない。区間設定段階Ｓ３０において最初に行われる固
有周波数定義処理Ｓ３１は、個々の変極点それぞれに、
所定の固有周波数を定義する処理である。本来、周波数
というものは、時間軸上の所定の区間内の波について定
義される物理量であり、時間軸上のある１点について定
義されるべきものではない。ただ、ここでは便宜上、個
々の変極点について、疑似的に固有周波数なるものを定
義することにする（一般に、物理学における「固有周波
数」という文言は、物体が音波などに共鳴して振動する
物体固有の周波数を意味するが、本願における「固有周
波数」とは、このような物体固有の周波数を意味するも
のではなく、個々の変極点それぞれに定義された疑似的
な周波数、別言すれば、信号のある瞬間における基本周
波数を意味するものである。）。

【００３６】いま、図９に示すように、多数の変極点の
うち、第ｎ番目〜第（ｎ＋２）番目の変極点Ｐ（ｎ），
Ｐ（ｎ＋１），Ｐ（ｎ＋２）に着目する。これら各変極
点には、それぞれ信号値ａ（ｎ），ａ（ｎ＋１），ａ
（ｎ＋２）が定義されており、また、時間軸上での位置
ｔ（ｎ），ｔ（ｎ＋１），ｔ（ｎ＋２）が定義されてい
る。ここで、これら各変極点が、音響データ波形のロー
カルピーク位置に相当する点であることを考慮すれば、
図示のように、変極点Ｐ（ｎ）とＰ（ｎ＋２）との間の
時間軸上での距離φは、もとの波形の１周期に対応する
ことがわかる。そこで、たとえば、第ｎ番目の変極点Ｐ
（ｎ）の固有周波数ｆ（ｎ）なるものを、ｆ（ｎ）＝１
／φと定義すれば、個々の変極点について、それぞれ固
有周波数を定義することができる。時間軸上での位置ｔ
（ｎ），ｔ（ｎ＋１），ｔ（ｎ＋２）が、「秒」の単位
で表現されていれば、 φ＝（ｔ（ｎ＋２）−ｔ（ｎ））であるから、ｆ（ｎ）＝１／（ｔ（ｎ＋２）−ｔ（ｎ））として定義できる。

【００３７】なお、実際のデジタルデータ処理の手順を
考慮すると、個々の変極点の位置は、「秒」の単位では
なく、サンプル番号ｘ（サンプリング処理Ｓ１１におけ
る何番目のサンプリング時に得られたデータであるかを
示す番号）によって表されることになるが、このサンプ
ル番号ｘと実時間「秒」とは、サンプリング周波数ｆｓ
によって一義的に対応づけられる。たとえば、第ｍ番目
のサンプルｘ（ｍ）と第（ｍ＋１）番目のサンプルｘ
（ｍ＋１）との間の実時間軸上での間隔は、１／ｆｓに
なる。

【００３８】さて、このようにして個々の変極点に定義
された固有周波数は、物理的には、その変極点付近のロ
ーカルな周波数を示す量ということになる。隣接する別
な変極点との距離が短ければ、その付近のローカルな周
波数は高く、隣接する別な変極点との距離が長ければ、
その付近のローカルな周波数は低いということになる。
もっとも、上述の例では、後続する２つ目の変極点との
間の距離に基づいて固有周波数を定義しているが、固有
周波数の定義方法としては、この他どのような方法を採
ってもかまわない。たとえば、第ｎ番目の変極点の固有
周波数ｆ（ｎ）を、先行する第（ｎ−２）番目の変極点
との間の距離を用いて、ｆ（ｎ）＝１／（ｔ（ｎ）−ｔ（ｎ−２））と定義することもできる。また、前述したように、後続
する２つ目の変極点との間の距離に基づいて、固有周波
数ｆ（ｎ）を、ｆ（ｎ）＝１／（ｔ（ｎ＋２）−ｔ（ｎ））なる式で定義した場合であっても、最後の２つの変極点
については、後続する２つ目の変極点が存在しないの
で、先行する変極点を利用して、ｆ（ｎ）＝１／（ｔ（ｎ）−ｔ（ｎ−２））なる式で定義すればよい。

【００３９】あるいは、後続する次の変極点との間の距
離に基づいて、第ｎ番目の変極点の固有周波数ｆ（ｎ）
を、ｆ（ｎ）＝（１／２）・１／（ｔ（ｎ＋１）−ｔ
（ｎ））なる式で定義することもできるし、後続する３つ目の変
極点との間の距離に基づいて、ｆ（ｎ）＝（３／２）・１／（ｔ（ｎ＋３）−ｔ
（ｎ））なる式で定義することもできる。結局、一般式を用いて
示せば、第ｎ番目の変極点についての固有周波数ｆ
（ｎ）は、ｋ個離れた変極点（ｋが正の場合は後続する
変極点、負の場合は先行する変極点）との間の時間軸上
での距離に基づいて、ｆ（ｎ）＝（ｋ／２）・１／（ｔ（ｎ＋ｋ）−ｔ
（ｎ））なる式で定義することができる。ｋの値は、予め適当な
値に設定しておけばよい。変極点の時間軸上での間隔が
比較的小さい場合には、ｋの値をある程度大きく設定し
た方が、誤差の少ない固有周波数を定義することができ
る。ただし、ｋの値をあまり大きく設定しすぎると、ロ
ーカルな周波数としての意味が失われてしまうことにな
り好ましくない。

【００４０】こうして、固有周波数定義処理Ｓ３１が完
了すると、個々の変極点Ｐ（ｎ）には、信号強度ａ
（ｎ）と、固有周波数ｆ（ｎ）と、時間軸上での位置ｔ
（ｎ）とが定義されることになる。

【００４１】さて、§１では、効率的で再現性の高い符
号化を行うためには、１つの単位区間に含まれる変極点
の周波数が所定の近似範囲内になるように単位区間を設
定するという第１のアプローチと、１つの単位区間に含
まれる変極点の信号強度が所定の近似範囲内になるよう
に単位区間を設定するという第２のアプローチとがある
ことを述べた。ここでは、この２つのアプローチを用い
た単位区間の設定手法を、具体例に即して説明しよう。

【００４２】いま、図１０に示すように、９つの変極点
Ｐ１〜Ｐ９のそれぞれについて、信号強度ａ１〜ａ９と
固有周波数ｆ１〜ｆ９とが定義されている場合を考え
る。この場合、第１のアプローチに従えば、個々の固有
周波数ｆ１〜ｆ９に着目し、互いに近似した固有周波数
をもつ空間的に連続した変極点の一群を１つの単位区間
とする処理を行えばよい。たとえば、固有周波数ｆ１〜
ｆ５がほぼ同じ値（第１の基準値）をとり、固有周波数
ｆ６〜ｆ９がほぼ同じ値（第２の基準値）をとってお
り、第１の基準値と第２の基準値との差が所定の許容範
囲を越えていた場合、図１０に示すように、第１の基準
値の近似範囲に含まれる固有周波数ｆ１〜ｆ５をもつ変
極点Ｐ１〜Ｐ５を含む区間を単位区間Ｕ１とし、第２の
基準値の近似範囲に含まれる固有周波数ｆ６〜ｆ９をも
つ変極点Ｐ６〜Ｐ９を含む区間を単位区間Ｕ２として設
定すればよい。先願発明による手法では、１つの単位区
間については、単一の代表周波数が与えられることにな
るが、このように、固有周波数が互いに近似範囲内にあ
る複数の変極点が存在する区間を１つの単位区間として
設定すれば、代表周波数と個々の固有周波数との差が所
定の許容範囲内に抑えられることになり、大きな問題は
生じない。

【００４３】続いて、固有周波数が近似する変極点を１
グループにまとめて、１つの単位区間を定義するための
具体的な手法の一例を以下に示す。たとえば、図１０に
示すように、９つの変極点Ｐ１〜Ｐ９が与えられた場
合、まず変極点Ｐ１とＰ２について、固有周波数を比較
し、両者の差が所定の許容範囲ｆｆ内にあるか否かを調
べる。もし、｜ｆ１−ｆ２｜＜ｆｆであれば、変極点Ｐ１，Ｐ２を第１の単位区間Ｕ１に含
ませる。そして、今度は、変極点Ｐ３を、この第１の単
位区間Ｕ１に含ませてよいか否かを調べる。これは、こ
の第１の単位区間Ｕ１についての平均固有周波数（ｆ１
＋ｆ２）／２と、ｆ３との比較を行い、｜（ｆ１＋ｆ２）／２−ｆ３｜＜ｆｆであれば、変極点Ｐ３を第１の単位区間Ｕ１に含ませれ
ばよい。更に、変極点Ｐ４に関しては、｜（ｆ１＋ｆ２＋ｆ３）／３−ｆ４｜＜ｆｆであれば、これを第１の単位区間Ｕ１に含ませることが
でき、変極点Ｐ５に関しては、｜（ｆ１＋ｆ２＋ｆ３＋ｆ４）／４−ｆ５｜＜ｆｆであれば、これを第１の単位区間Ｕ１に含ませることが
できる。ここで、もし、変極点Ｐ６について、｜（ｆ１＋ｆ２＋ｆ３＋ｆ４＋ｆ５）／５−ｆ６｜＞ｆ
ｆなる結果が得られたしまった場合、すなわち、固有周波
数ｆ６と、第１の単位区間Ｕ１の平均固有周波数との差
が、所定の許容範囲ｆｆを越えてしまった場合、変極点
Ｐ５とＰ６との間に不連続位置が検出されたことにな
り、変極点Ｐ６を第１の単位区間Ｕ１に含ませることは
できない。そこで、変極点Ｐ５をもって第１の単位区間
Ｕ１の終端とし、変極点Ｐ６は別な第２の単位区間Ｕ２
の始端とする。そして、変極点Ｐ６とＰ７について、固
有周波数を比較し、両者の差が所定の許容範囲ｆｆ内に
あるか否かを調べ、もし、｜ｆ６−ｆ７｜＜ｆｆであれば、変極点Ｐ６，Ｐ７を第２の単位区間Ｕ２に含
ませる。そして、今度は、変極点Ｐ８に関して、｜（ｆ６＋ｆ７）／２−ｆ８｜＜ｆｆであれば、これを第２の単位区間Ｕ２に含ませ、変極点
Ｐ９に関して、｜（ｆ６＋ｆ７＋ｆ８）／３−ｆ９｜＜ｆｆであれば、これを第２の単位区間Ｕ２に含ませる。

【００４４】このような手法で、不連続位置の検出を順
次行ってゆき、各単位区間を順次設定してゆけば、上述
した第１のアプローチに沿った区間設定が可能になる。
もちろん、上述した具体的な手法は、一例として示した
ものであり、この他にも種々の手法を採ることができ
る。たとえば、平均値と比較する代わりに、常に隣接す
る変極点の固有周波数を比較し、差が許容範囲ｆｆを越
えた場合に不連続位置と認識する簡略化した手法を採っ
てもかまわない。すなわち、ｆ１とｆ２との差、ｆ２と
ｆ３との差、ｆ３とｆ４との差、…というように、個々
の差を検討してゆき、差が許容範囲ｆｆを越えた場合に
は、そこを不連続位置として認識すればよい。

【００４５】以上、第１のアプローチについて述べた
が、第２のアプローチに基づく単位区間の設定も同様に
行うことができる。この場合は、個々の変極点の信号強
度ａ１〜ａ９に着目し、所定の許容範囲ａａとの比較を
行うようにすればよい。もちろん、第１のアプローチと
第２のアプローチとの双方を組み合わせて、単位区間の
設定を行ってもよい。この場合は、個々の変極点の固有
周波数ｆ１〜ｆ９と信号強度ａ１〜ａ９との双方に着目
し、両者がともに所定の許容範囲ｆｆおよびａａ内に入
っていれば、同一の単位区間に含ませるというような厳
しい条件を課してもよいし、いずれか一方が許容範囲内
に入っていれば、同一の単位区間に含ませるというよう
な緩い条件を課してもよい。

【００４６】なお、この区間設定段階Ｓ３０において
は、上述した各アプローチに基づいて単位区間の設定を
行う前に、絶対値が所定の許容レベル未満となる信号強
度をもつ変極点を除外する処理を行っておくのが好まし
い。たとえば、図１１に示す例のように所定の許容レベ
ルＬＬを設定すると、変極点Ｐ４の信号強度ａ４と変極
点Ｐ９の信号強度ａ９は、その絶対値がこの許容レベル
ＬＬ未満になる。このような場合、変極点Ｐ４，Ｐ９を
除外する処理を行うのである。このような除外処理を行
う第１の意義は、もとの音響信号に含まれていたノイズ
成分を除去することにある。通常、音響信号を電気的に
取り込む過程では、種々のノイズ成分が混入することが
多く、このようなノイズ成分までも含めて符号化が行わ
れると好ましくない。

【００４７】もっとも、許容レベルＬＬをある程度以上
に設定すると、ノイズ成分以外のものも除外されること
になるが、このようにノイズ成分以外の信号を除外する
ことも、場合によっては、十分に意味のある処理にな
る。すなわち、この除外処理を行う第２の意義は、もと
の音響信号に含まれていた情報のうち、興味の対象外と
なる情報を除外することにある。たとえば、図１の上段
に示す音響信号は、人間の心音を示す信号であるが、こ
の音響信号のうち、疾患の診断などに有効な情報は、振
幅の大きな部分（各単位区間Ｕ１〜Ｕ６の部分）に含ま
れており、それ以外の部分の情報はあまり役にたたな
い。そこで、所定の許容レベルＬＬを設定し、無用な情
報部分を除外する処理を行うと、より効率的な符号化が
可能になる。

【００４８】また、心音や肺音のように、生体が発生す
る生理的リズム音における比較的振幅の小さな成分は、
生体内で発生する反響音であることが多く、このような
反響音は、符号化の時点で一旦除外してしまっても、再
生時にエコーなどの音響効果を加えることにより容易に
付加することが可能である。このような点においても、
許容レベル未満の変極点を除外する処理は意味をもつ。

【００４９】なお、許容レベル未満の変極点を除外する
処理を行った場合は、除外された変極点の位置で分割さ
れるように単位区間定義を行うようにするのが好まし
い。たとえば、図１１に示す例の場合、除外された変極
点Ｐ４，Ｐ９の位置（一点鎖線で示す）で分割された単
位区間Ｕ１，Ｕ２が定義されている。このような単位区
間定義を行えば、図１の上段に示す音響信号のように、
信号強度が許容レベル以上の区間（単位区間Ｕ１〜Ｕ６
の各区間）と、許容レベル未満の区間（単位区間Ｕ１〜
Ｕ６以外の区間）とが交互に出現するような音響信号の
場合、非常に的確な単位区間の定義が可能になる。

【００５０】これまで、区間設定段階Ｓ３０で行われる
効果的な区間設定手法の要点を述べてきたが、ここで
は、より具体的な手順を述べることにする。図２の流れ
図に示されているように、この区間設定段階Ｓ３０は、
４つの処理Ｓ３１〜Ｓ３４によって構成されている。固
有周波数定義処理Ｓ３１は、既に述べたように、各変極
点について、それぞれ近傍の変極点との間の時間軸上で
の距離に基づいて所定の固有周波数を定義する処理であ
る。ここでは、図１２に示すように、変極点Ｐ１〜Ｐ１
７のそれぞれについて、固有周波数ｆ１〜ｆ１７が定義
された例を考える。

【００５１】続く、レベルによるスライス処理Ｓ３２
は、絶対値が所定の許容レベル未満となる信号強度をも
つ変極点を除外し、除外された変極点の位置で分割され
るような区間を定義する処理である。ここでは、図１２
に示すような変極点Ｐ１〜Ｐ１７に対して、図１３に示
すような許容レベルＬＬを設定した場合を考える。この
場合、変極点Ｐ１，Ｐ２，Ｐ１１，Ｐ１６，Ｐ１７が、
許容レベル未満の変極点として除外されることになる。
図１４では、このようにして除外された変極点を破線の
矢印で示す。この「レベルによるスライス処理Ｓ３２」
では、更に、除外された変極点の位置で分割されるよう
な区間Ｋ１，Ｋ２が定義される。ここでは、１つでも除
外された変極点が存在する場合には、その位置の左右に
異なる区間を設定するようにしており、結果的に、変極
点Ｐ３〜Ｐ１０までの区間Ｋ１と、変極点Ｐ１２〜Ｐ１
５までの区間Ｋ２とが設定されることになる。なお、こ
こで定義された区間Ｋ１，Ｋ２は、暫定的な区間であ
り、必ずしも最終的な単位区間になるとは限らない。

【００５２】次の不連続部分割処理Ｓ３３は、時間軸上
において、変極点の固有周波数もしくは信号強度の値が
不連続となる不連続位置を探し、処理Ｓ３２で定義され
た個々の区間を、更にこの不連続位置で分割することに
より、新たな区間を定義する処理である。たとえば、上
述の例の場合、図１５に示すような暫定区間Ｋ１，Ｋ２
が定義されているが、ここで、もし暫定区間Ｋ１内の変
極点Ｐ６とＰ７との間に不連続が生じていた場合は、こ
の不連続位置で暫定区間Ｋ１を分割し、図１６に示すよ
うに、新たに暫定区間Ｋ１−１とＫ１−２とが定義さ
れ、結局、３つの暫定区間Ｋ１−１，Ｋ１−２，Ｋ２が
形成されることになる。不連続位置の具体的な探索手法
は既に述べたとおりである。たとえば、図１５の例の場
合、｜（ｆ３＋ｆ４＋ｆ５＋ｆ６）／４−ｆ７｜＞ｆｆの場合に、変極点Ｐ６とＰ７との間に固有周波数の不連
続が生じていると認識されることになる。同様に、変極
点Ｐ６とＰ７との間の信号強度の不連続は、｜（ａ３＋ａ４＋ａ５＋ａ６）／４−ａ７｜＞ａａの場合に認識される。

【００５３】不連続部分割処理Ｓ３３で、実際に区間分
割を行うための条件としては、固有周波数の不連続が生じた場合にのみ区間の分割を
行う、信号強度の不連続が生じた場合にのみ区間の分割を行
う、固有周波数の不連続か信号強度の不連続かの少なくと
も一方が生じた場合に区間の分割を行う、固有周波数の不連続と信号強度の不連続との両方が生
じた場合にのみ区間の分割を行う、など、種々の条件を設定することが可能である。あるい
は、不連続の度合いを考慮して、上述の〜を組み合
わせるような複合条件を設定することもできる。

【００５４】こうして、不連続部分割処理Ｓ３３によっ
て得られた区間（上述の例の場合、３つの暫定区間Ｋ１
−１，Ｋ１−２，Ｋ２）を、最終的な単位区間として設
定することもできるが、ここでは更に、区間統合処理Ｓ
３４を行っている。この区間統合処理Ｓ３４は、不連続
部分割処理Ｓ３３によって得られた区間のうち、一方の
区間内の変極点の固有周波数もしくは信号強度の平均
と、他方の区間内の変極点の固有周波数もしくは信号強
度の平均との差が、所定の許容範囲内であるような２つ
の隣接区間が存在する場合に、この隣接区間を１つの区
間に統合する処理である。たとえば、上述の例の場合、
図１７に示すように、区間Ｋ１−２と区間Ｋ２とを平均
固有周波数で比較した結果、｜（ｆ７＋ｆ８＋ｆ９＋ｆ１０）／４−（ｆ１２＋ｆ１
３＋ｆ１４＋ｆ１５）／４｜＜ｆｆのように、平均の差が所定の許容範囲ｆｆ以内であった
場合には、区間Ｋ１−２と区間Ｋ２とは統合されること
になる。もちろん、平均信号強度の差が許容範囲ａａ以
内であった場合に統合を行うようにしてもよいし、平均
固有周波数の差が許容範囲ｆｆ内という条件と平均信号
強度の差が許容範囲ａａ以内という条件とのいずれか一
方が満足された場合に統合を行うようにしてもよいし、
両条件がともに満足された場合に統合を行うようにして
もよい。また、このような種々の条件が満足されていて
も、両区間の間の間隔が時間軸上で所定の距離以上離れ
ていた場合（たとえば、多数の変極点が除外されたため
に、かなりの空白区間が生じているような場合）は、統
合処理を行わないような加重条件を課すことも可能であ
る。

【００５５】かくして、この区間統合処理Ｓ３４を行っ
た後に得られた区間が、最終的な単位区間として設定さ
れることになる。上述の例では、最終的に、図１８に示
すように、単位区間Ｕ１（図１７の暫定区間Ｋ１−１）
と、単位区間Ｕ２（図１７で統合された暫定区間Ｋ１−
２およびＫ２）とが設定される。

【００５６】なお、ここに示す実施態様では、こうして
得られた単位区間の始端と終端を、その区間に含まれる
最初の変極点の時間軸上の位置を始端とし、その区間に
含まれる最後の変極点の時間軸上の位置を終端とする、
という定義で定めることにする。したがって、図１８に
示す例では、単位区間Ｕ１は時間軸上の位置ｔ３〜ｔ６
までの区間であり、単位区間Ｕ２は時間軸上の位置ｔ７
〜ｔ１５までの区間となる。

【００５７】＜＜＜２．４符号化段階＞＞＞次
に、図２の流れ図に示されている符号化段階Ｓ４０につ
いて説明する。ここに示す実施形態では、この符号化段
階Ｓ４０は、符号データ生成処理Ｓ４１と、符号データ
修正処理Ｓ４２とによって構成されている。符号データ
生成処理Ｓ４１は、区間設定段階Ｓ３０において設定さ
れた個々の単位区間内の音響データに基づいて、個々の
単位区間を代表する所定の代表周波数および代表強度を
定義し、時間軸上での個々の単位区間の始端位置および
終端位置を示す情報と、代表周波数および代表強度を示
す情報とを含む符号データを生成する処理であり、この
処理により、個々の単位区間の音響データは個々の符号
データによって表現されることになる。一方、符号デー
タ修正処理Ｓ４２は、後述するように、生成された符号
データを、復号化に用いる再生音源装置の特性に適合さ
せるために修正する処理である。

【００５８】符号データ生成処理Ｓ４１における符号デ
ータ生成の具体的手法は、非常に単純である。すなわ
ち、個々の単位区間内に含まれる変極点の固有周波数に
基づいて代表周波数を定義し、個々の単位区間内に含ま
れる変極点のもつ信号強度に基づいて代表強度を定義れ
ばよい。これを図１８の例で具体的に示そう。この図１
８に示す例では、変極点Ｐ３〜Ｐ６を含む単位区間Ｕ１
と、変極点Ｐ７〜Ｐ１５（ただし、Ｐ１１は除外されて
いる）を含む単位区間Ｕ２とが設定されている。ここに
示す実施形態では、単位区間Ｕ１（始端ｔ３，終端ｔ
６）については、図１９上段に示すように、代表周波数
Ｆ１および代表強度Ａ１が、Ｆ１＝（ｆ３＋ｆ４＋ｆ５＋ｆ６）／４Ａ１＝（ａ３＋ａ４＋ａ５＋ａ６）／４なる式で演算され、単位区間Ｕ２（始端ｔ７，終端ｔ１
５）については、図１９下段に示すように、代表周波数
Ｆ２および代表強度Ａ２が、Ｆ２＝（ｆ７＋ｆ８＋ｆ９＋ｆ１０＋ｆ１２＋ｆ１３＋
ｆ１４＋ｆ１５）／８Ａ２＝（ａ７＋ａ８＋ａ９＋ａ１０＋ａ１２＋ａ１３＋
ａ１４＋ａ１５）／８なる式で演算される。別言すれば、代表周波数および代
表強度は、単位区間内に含まれる変極点の固有周波数お
よび信号強度の単純平均値となっている。もっとも、代
表値としては、このような単純平均値だけでなく、重み
を考慮した加重平均値をとってもかまわない。たとえ
ば、信号強度に基づいて個々の変極点に重みづけをし、
この重みづけを考慮した固有周波数の加重平均値を代表
周波数としてもよい。あるいは、単位区間内に含まれる
変極点のもつ信号強度のうちの最大値を代表強度とする
こともできる。

【００５９】こうして個々の単位区間に、それぞれ代表
周波数および代表強度が定義されれば、時間軸上での個
々の単位区間の始端位置と終端位置は既に得られている
ので、個々の単位区間に対応する符号データの生成が可
能になる。たとえば、図１８に示す例の場合、図２０に
示すように、５つの区間Ｅ０，Ｕ１，Ｅ１，Ｕ２，Ｅ２
を定義するための符号データを生成することができる。
ここで、区間Ｕ１，Ｕ２は、前段階で設定された単位区
間であり、区間Ｅ０，Ｅ１，Ｅ２は、各単位区間の間に
相当する空白区間である。各単位区間Ｕ１，Ｕ２には、
それぞれ代表周波数Ｆ１，Ｆ２と代表強度Ａ１，Ａ２が
定義されているが、空白区間Ｅ０，Ｅ１，Ｅ２は、単に
始端および終端のみが定義されている区間である。

【００６０】図２１は、図２０に示す個々の区間に対応
する符号データの構成例を示す図表である。この例で
は、１行に示された符号データは、区間名（実際には、
不要）と、区間の始端位置および終端位置と、代表周波
数および代表強度と、によって構成されている。一方、
図２２は、図２０に示す個々の区間に対応する符号デー
タの別な構成例を示す図表である。図２１に示す例で
は、各単位区間の始端位置および終端位置を直接符号デ
ータとして表現していたが、図２２に示す例では、各単
位区間の始端位置および終端位置を示す情報として、区
間長Ｌ１〜Ｌ４（図２０参照）を用いている。なお、図
２１に示す構成例のように、単位区間の始端位置および
終端位置を直接符号データとして用いる場合には、実際
には、空白区間Ｅ０，Ｅ１，…についての符号データは
不要である（図２１に示す単位区間Ｕ１，Ｕ２の符号デ
ータのみから、図２０の構成が再現できる）。

【００６１】先願発明に係る音響信号の符号化方法によ
って、最終的に得られる符号データは、この図２１ある
いは図２２に示すような符号データである。もっとも、
符号データとしては、各単位区間の時間軸上での始端位
置および終端位置を示す情報と、代表周波数および代表
強度を示す情報とが含まれていれば、どのような構成の
データを用いてもかまわない。最終的に得られる符号デ
ータに、上述の情報さえ含まれていれば、所定の音源を
用いて音声の再生（復号化）が可能になる。たとえば、
図２０に示す例の場合、時刻０〜ｔ３の期間は沈黙を守
り、時刻ｔ３〜ｔ６の期間に周波数Ｆ１に相当する音を
強度Ａ１で鳴らし、時刻ｔ６〜ｔ７の期間は沈黙を守
り、時刻ｔ７〜ｔ１５の期間に周波数Ｆ２に相当する音
を強度Ａ２で鳴らせば、もとの音響信号の再生が行われ
ることになる。

【００６２】§３．ＭＩＤＩ形式の符号データを用い
る実施形態＜＜＜３．１ＭＩＤＩデータへの変換原理＞＞＞
上述したように、先願発明に係る音響信号の符号化方法
では、最終的に、個々の単位区間についての始端位置お
よび終端位置を示す情報と、代表周波数および代表強度
を示す情報とが含まれた符号データであれば、どのよう
な形式の符号データを用いてもかまわない。しかしなが
ら、実用上は、そのような符号データとして、ＭＩＤＩ
形式の符号データを採用するのが最も好ましい。ここで
は、ＭＩＤＩ形式の符号データを採用した具体的な実施
形態を示す。

【００６３】図２３は、一般的なＭＩＤＩ形式の符号デ
ータの構成を示す図である。図示のとおり、このＭＩＤ
Ｉ形式では、「ノートオン」データもしくは「ノートオ
フ」データが、「デルタタイム」データを介在させなが
ら存在する。「デルタタイム」データは、１〜４バイト
のデータで構成され、所定の時間間隔を示すデータであ
る。一方、「ノートオン」データは、全部で３バイトか
ら構成されるデータであり、１バイト目は常にノートオ
ン符号「９０ H」に固定されており（ Hは１６進数を示
す）、２バイト目にノートナンバーＮを示すコードが、
３バイト目にベロシティーＶを示すコードが、それぞれ
配置される。ノートナンバーＮは、音階（一般の音楽で
いう全音７音階の音階ではなく、ここでは半音１２音階
の音階をさす）の番号を示す数値であり、このノートナ
ンバーＮが定まると、たとえば、ピアノの特定の鍵盤キ
ーが指定されることになる（Ｃ−２の音階がノートナン
バーＮ＝０に対応づけられ、以下、Ｎ＝１２７までの１
２８通りの音階が対応づけられる。ピアノの鍵盤中央の
ラの音（Ａ３音）は、ノートナンバーＮ＝６９にな
る）。ベロシティーＶは、音の強さを示すパラメータで
あり（もともとは、ピアノの鍵盤などを弾く速度を意味
する）、Ｖ＝０〜１２７までの１２８段階の強さが定義
される。

【００６４】同様に、「ノートオフ」データも、全部で
３バイトから構成されるデータであり、１バイト目は常
にノートオフ符号「８０ H」に固定されており、２バイ
ト目にノートナンバーＮを示すコードが、３バイト目に
ベロシティーＶを示すコードが、それぞれ配置される。
「ノートオン」データと「ノートオフ」データとは対に
なって用いられる。たとえば、「９０ H，６９，８０」
なる３バイトの「ノートオン」データは、ノートナンバ
ーＮ＝６９に対応する鍵盤中央のラのキーを押し下げる
操作を意味し、以後、同じノートナンバーＮ＝６９を指
定した「ノートオフ」データが与えられるまで、そのキ
ーを押し下げた状態が維持される（実際には、ピアノな
どのＭＩＤＩ音源の波形を用いた場合、有限の時間内
に、ラの音の波形は減衰してしまう）。ノートナンバー
Ｎ＝６９を指定した「ノートオフ」データは、たとえ
ば、「８０ H，６９，５０」のような３バイトのデータ
として与えられる。「ノートオフ」データにおけるベロ
シティーＶの値は、たとえばピアノの場合、鍵盤キーか
ら指を離す速度を示すパラメータになる。

【００６５】なお、上述の説明では、ノートオン符号
「９０ H」およびノートオフ符号「８０ H」は固定であ
ると述べたが、これらの符号の下位４ビットは必ずしも
０に固定されているわけではなく、チャネル番号０〜１
５のいずれかを特定するコードとして利用することがで
き、チャネルごとにそれぞれ別々の楽器の音色について
のオン・オフを指定することができる。

【００６６】このように、ＭＩＤＩデータは、もともと
楽器演奏の操作に関する情報（別言すれば、楽譜の情
報）を記述する目的で利用されている符号データである
が、先願発明に係る音響信号の符号化方法への利用にも
適している。すなわち、各単位区間についての代表周波
数Ｆに基づいてノートナンバーＮを定め、代表強度Ａに
基づいてベロシティーＶを定め、単位区間の長さＬに基
づいてデルタタイムＴを定めるようにすれば、１つの単
位区間の音声データを、ノートナンバー、ベロシティ
ー、デルタタイムで表現されるＭＩＤＩ形式の符号デー
タに変換することが可能になる。このようなＭＩＤＩデ
ータへの具体的な変換方法を図２４に示す。

【００６７】まず、ＭＩＤＩデータのデルタタイムＴ
は、単位区間の区間長Ｌ（単位：秒）を用いて、Ｔ＝Ｌ・７６８なる簡単な式で定義できる。ここで、数値「７６８」
は、四分音符を基準にして、その長さ分解能（たとえ
ば、長さ分解能を１／２に設定すれば八分音符まで、１
／８に設定すれば三十二分音符まで表現可能：一般の音
楽では１／１６程度の設定が使われる）を、ＭＩＤＩ規
格での最小値である１／３８４に設定し、メトロノーム
指定を四分音符＝１２０（毎分１２０音符）にした場合
のＭＩＤＩデータによる表現形式における時間分解能を
示す固有の数値である。

【００６８】また、ＭＩＤＩデータのノートナンバーＮ
は、１オクターブ上がると、周波数が２倍になる対数尺
度の音階では、単位区間の代表周波数Ｆ（単位：Ｈｚ）
を用いて、Ｎ＝（１２／ｌｏｇ_１０２）・（ｌｏｇ_１０（Ｆ／４４
０）＋６９なる式で定義できる。ここで、右辺第２項の数値「６
９」は、ピアノ鍵盤中央のラの音（Ａ３音）のノートナ
ンバー（基準となるノートナンバー）を示しており、右
辺第１項の数値「４４０」は、このラの音の周波数（４
４０Ｈｚ）を示しており、右辺第１項の数値「１２」
は、半音を１音階として数えた場合の１オクターブの音
階数を示している。

【００６９】更に、ＭＩＤＩデータのベロシティーＶ
は、単位区間の代表強度Ａと、その最大値Ａmax とを用
いて、Ｖ＝（Ａ／Ａmax ）・１２７なる式で、Ｖ＝０〜１２７の範囲の値を定義することが
できる。なお、通常の楽器の場合、「ノートオン」デー
タにおけるベロシティーＶと、「ノートオフ」データに
おけるベロシティーＶとは、上述したように、それぞれ
異なる意味をもつが、この実施形態では、「ノートオ
フ」データにおけるベロシティーＶとして、「ノートオ
ン」データにおけるベロシティーＶと同一の値をそのま
ま用いるようにしている。

【００７０】前章の§２では、図２０に示すような２つ
の単位区間Ｕ１，Ｕ２内の音声データに対して、図２１
あるいは図２２に示すような符号データが生成される例
を示したが、ＭＩＤＩデータを用いた場合、単位区間Ｕ
１，Ｕ２内の音声データは、図２５の図表に示すような
各データ列で表現されることになる。ここで、ノートナ
ンバーＮ１，Ｎ２は、代表周波数Ｆ１，Ｆ２を用いて上
述の式により得られた値であり、ベロシティーＶ１，Ｖ
２は、代表強度Ａ１，Ａ２を用いて上述の式により得ら
れた値である。

【００７１】＜＜＜３．２ＭＩＤＩデータの修正処
理＞＞＞図２に示す流れ図における符号化段階Ｓ４０
では、符号データ生成処理Ｓ４１の後に、符号データ修
正処理Ｓ４２が行われる。符号データ生成処理Ｓ４１
は、上述した具体的な手法により、たとえば、図２５に
示すようなＭＩＤＩデータ列を生成する処理であり、符
号データ修正処理Ｓ４２は、このようなＭＩＤＩデータ
列に対して、更に修正を加える処理である。後述するよ
うに、図２５に示すようなＭＩＤＩデータ列に基づい
て、音声を再生（復号化）するには、実際の音声の波形
データをもった再生音源装置（ＭＩＤＩ音源）が必要に
なるが、このＭＩＤＩ音源の特性は個々の音源ごとに様
々であり、必要に応じて、用いるＭＩＤＩ音源の特性に
適合させるために、ＭＩＤＩデータに修正処理を加えた
方が好ましい場合がある。以下に、このような修正処理
が必要な具体的な事例を述べる。

【００７２】いま、図２６の上段に示すように、区間長
Ｌｉをもった単位区間Ｕｉ内の音声データが所定のＭＩ
ＤＩデータ（修正前のＭＩＤＩデータ）によって表現さ
れていた場合を考える。すなわち、この単位区間Ｕｉに
は、代表周波数Ｆｉおよび代表強度Ａｉが定義されてお
り、代表周波数Ｆｉ，代表強度Ａｉ，区間長Ｌｉに基づ
いて、ノートナンバーＮｉ，ベロシティーＶｉ，デルタ
タイムＴｉが設定されていることになる。このとき、こ
のＭＩＤＩデータを再生するために用いる予定のＭＩＤ
Ｉ音源のノートナンバーＮｉに対応する再生音の波形
が、図２６の中段に示すようなものであったとしよう。
この場合、単位区間Ｕｉの単位長Ｌｉよりも、ＭＩＤＩ
音源の再生音の持続時間ＬＬｉの方が短いことになる。
したがって、修正前のＭＩＤＩデータを、このＭＩＤＩ
音源を用いてそのまま再生すると、本来の音が鳴り続け
なければならない時間Ｌｉよりも短い持続時間ＬＬｉ
で、再生音は減衰してしまうことになる。このような事
態が生じると、もとの音響信号の再現性が低下してしま
う。

【００７３】そこで、このような場合、単位区間を複数
の小区間に分割し、各小区間ごとにそれぞれ別個の符号
データを生成する修正処理を行うとよい。この図２６に
示す例の場合、図の下段に示すように、もとの単位区間
Ｕｉを、２つの小区間Ｕｉ１，Ｕｉ２に分割し、それぞ
れについて別個のＭＩＤＩデータを生成するようにして
いる。個々の小区間Ｕｉ１，Ｕｉ２に定義される代表周
波数および代表強度は、いずれも分割前の単位区間Ｕｉ
の代表周波数Ｆｉおよび代表強度Ａｉと同じであり、区
間長だけがＬｉ／２になったわけであるから、修正後の
ＭＩＤＩデータとしては、結局、ノートナンバーＮｉ，
ベロシティーＶｉ，デルタタイムＴｉ／２を示すＭＩＤ
Ｉデータが２組得られることになる。

【００７４】一般のＭＩＤＩ音源では、通常、再生音の
持続時間はその再生音の周波数に応じて決まる。特に、
心音などの音色についての音源では、再生音の周波数を
ｆ（Ｈｚ）とした場合、その持続時間は５／ｆ（秒）程
度である。したがって、このような音源を用いたときに
は、特定の単位区間Ｕｉについて、代表周波数Ｆｉと区
間長Ｌｉとの関係が、Ｌｉ＞５／Ｆｉとなるような場合
には、Ｌｉ／ｍ＜５／Ｆｉとなるような適当な分割数ｍ
を求め、上述した修正処理により、単位区間Ｕｉをｍ個
の小区間に分割するような処理を行うのが好ましい。

【００７５】続いて、修正処理が必要な別な事例を示そ
う。いま、再生に用いる予定のＭＩＤＩ音源の再生音
が、図２７の左側に示すような周波数レンジを有してい
るのに対し、生成された一連のＭＩＤＩデータに基づく
再生音の周波数レンジが、図２７の右側に示すように、
低音側にオフセット量ｄだけ偏りを生じていたとしよ
う。このような場合、再生音はＭＩＤＩ音源の一部の周
波数帯域のみを使って提示されるようになるため、一般
的には好ましくない。そこで、ＭＩＤＩデータの周波数
の平均が、ＭＩＤＩ音源の周波数レンジの中心（この例
では、４４０Ｈｚの基準ラ音（ノートナンバーＮ＝６
９））に近付くように、ＭＩＤＩデータ側の周波数（ノ
ートナンバー）を全体的に引き上げる修正処理を行い、
図２８に示すように、オフセット量ｄが０になるように
するとよい。

【００７６】もっとも、音響信号の性質によっては、む
しろ低音側にシフトした状態のままで再生した方が好ま
しいものもあり、上述のような修正処理によって必ずし
も良好な結果が得られるとは限らない。したがって、個
々の音響信号の性質を考慮した上で、このような修正処
理を行うか否かを適宜判断するのが好ましい。

【００７７】この他にも、用いるＭＩＤＩ音源によって
は、特性に適合させるために種々の修正処理が必要な場
合がある。たとえば、１オクターブの音階差が２倍の周
波数に対応していないような特殊な規格のＭＩＤＩ音源
を用いた場合には、この規格に適合させるように、ノー
トナンバーの修正処理などが必要になる。

【００７８】上述した符号化のための種々の処理は、実
際には、コンピュータを用いた演算によって行われるこ
とになるが、その演算負担はＦＦＴなどの演算に比べる
と軽く、市販の汎用パーソナルコンピュータを用いても
十分にリアルタイムでの処理が可能である。したがっ
て、上述した処理を汎用パーソナルコンピュータに実行
させるためのプログラムを記述し、このプログラムをフ
ロッピーディスクやＣＤ−ＲＯＭなどの媒体に記録して
配布するようにすれば、汎用パーソナルコンピュータを
本発明に係る音響信号の符号化方法を実行するための装
置として利用することができる。また、本発明に係る符
号化方法で符号化したデータは、この汎用パーソナルコ
ンピュータによって、フロッピーディスクやＣＤ−ＲＯ
Ｍなどの媒体に記録して配布したり、通信回線を介して
伝送したりすることもできる。

【００７９】§４．単位区間延長の基本概念本発明は、これまで述べてきた先願発明を改良し、より
品質の高い再生が可能な符号化を実現したものである。
その基本概念は、上述した符号化方法に、更に個々の単
位区間を延長する処理を付加する点にある。本願発明者
は、上述した符号化方法で得られる個々の符号データに
ついて、その単位区間を時間軸上で引き延ばすことによ
り、再生時（復号時）の品質が向上することを見出だし
たのである。

【００８０】たとえば、上述した符号化方法により、図
２９に示すような符号データＣ１〜Ｃ７が得られた場合
を考える。各符号データＣ１〜Ｃ７は、それぞれ各単位
区間Ｕ１〜Ｕ７の始点位置から終点位置に至るまでの期
間、所定の代表周波数に対応する音を所定の代表強度に
対応する振幅強度で提示することを示している。本願発
明者が行った実験によると、図２９に示すような符号デ
ータＣ１〜Ｃ７をこのまま復号化して再生するよりも、
各符号データＣ１〜Ｃ７で示される個々の単位区間Ｕ１
〜Ｕ７を延長した後に復号化して再生した場合の方が、
より品質の高い再生音が得られた。

【００８１】このような結果が得られたひとつの理由
は、上述した符号化方法を実施すると、最終的に得られ
る個々の符号データの単位区間が、本来の長さよりも短
くなる傾向にあるためであると、本願発明者は考えてい
る。たとえば、図２９に示す符号データＣ１〜Ｃ７の間
隙には、空白区間が存在する。このような空白区間は、
元になった音響データにもともと含まれていた場合もあ
るが、図２のステップＳ３２において行われるスライス
処理によって新たに生じた可能性もある。すなわち、ス
ライス処理によって、許容レベル未満の信号強度をもつ
変極点が除外されてしまった場合、その部分に新たな空
白区間が生じることになる。単位区間の延長処理を行う
と、スライス処理によって除外されてしまった情報が補
完されることになり、再生音の品質向上に寄与するもの
と考えられる。

【００８２】単位区間の延長処理を行うことにより、再
生音の品質向上がもたらされる別な理由は、人間の耳
が、ある程度以上の長さをもった音でなければ、音とし
て十分に認識することができないという特性を有するた
めと思われる。たとえば、図２９に示す例における符号
データＣ６は、単位区間Ｕ６に相当する期間にわたって
所定の音を提示することを示しているが、この単位区間
Ｕ６の長さがあまり短いと、人間の耳には、符号データ
Ｃ６に基く再生音を十分に認識することができなくな
る。単位区間の延長処理により、単位区間Ｕ６の長さが
延長されると、このような問題が解消するため、再生音
の品質が向上するものと思われる。

【００８３】ただ、図２９に示す状態のままでは、十分
な効果をもった延長処理を行うことはできない。なぜな
ら、各単位区間はたかだか隣接する単位区間との間に存
在する空白区間を限度として延長できるにすぎないから
である。そこで、本願発明者は、時間軸を共通とする複
数のトラックを定義し、区間設定段階で設定された個々
の単位区間を複数のトラックに分離して再配置するトラ
ック分離処理を行い、各トラックごとにそれぞれ区間延
長処理を行う方法を案出した。たとえば、図２９に示す
ように、時間軸ｔ上に単位区間Ｕ１〜Ｕ７が設定され、
符号データＣ１〜Ｃ７が生成されている場合、図３０に
示すように、これらの符号データ（単位区間）を２つの
トラックＡ，Ｂに分離して再配置するのである。トラッ
クＡ，Ｂはいずれも共通の時間軸ｔを有しており、各符
号データはもとの時間軸に対応する位置に再配置される
ことになる。

【００８４】図示の例では、奇数番目の符号データをト
ラックＡに、偶数番目の符号データをトラックＢに配置
するようにしている。このように、複数のトラックへ分
離して再配置すれば、各単位区間の間に確保される空白
区間が広がることになり、十分な区間延長処理が可能に
なる。図３１は、図３０に示す２つのトラックＡ，Ｂ上
に再配置された各単位区間Ｕ１〜Ｕ７を、それぞれ最大
区間長Ｌmax になるまで延長し、新たな単位区間ＵＵ１
〜ＵＵ７を形成した例を示している。この単位区間延長
処理により、符号データＣ１〜Ｃ７は、新たな符号デー
タＣＣ１〜ＣＣ７に置換されることになるが、この置換
では各単位区間の区間長のみが変更され、音程および強
度には変化はない。たとえば、符号データがＭＩＤＩ形
式のデータの場合、符号データＣＣ１は、ノートナンバ
ーおよびベロシティーに関しては符号データＣ１と同一
であり、デルタタイムだけが変更されることになる。

【００８５】図３１の例では、トラックＡに配置された
単位区間とトラックＢに配置された単位区間とが、共通
の時間軸ｔ上で部分的に重複していることがわかる。た
とえば、符号データＣＣ５の後半には、符号データＣＣ
６の前半が重複しており、この重複期間では、符号デー
タＣＣ５とＣＣ６とが和音として再生されることにな
る。同様に、符号データＣＣ７の前半には、符号データ
ＣＣ６の後半が重複しており、この重複期間では、符号
データＣＣ７とＣＣ６とが和音として再生されることに
なる。複数のトラックへの分離処理を行うことにより、
同一時間軸上に複数の符号データを重複配置することが
可能になり、和音としての再生が可能になる。このよう
な和音としての再生は、再生音の品質を向上させるにあ
たり極めて有効である。一般に、符号化の対象となった
音響信号には、もともと多数の周波数成分が含まれてい
る。和音としての再生を行うことにより、音質向上が図
れるのは、複数の周波数成分の同時再生により、もとの
音響信号により近い音を再現できるようになるためと思
われる。

【００８６】なお、符号化効率をより向上させる上で
は、単位区間の延長処理を行った後、必要に応じて、区
間統合処理を行うようにするのが好ましい。たとえば、
図３１に示す例において、同一のトラックＡ上に隣接配
置されている符号データＣＣ５およびＣＣ７が、互いに
類似した符号データ（たとえば、ＭＩＤＩデータの場
合、ノートナンバーが類似もしくは同一のデータ）であ
り、かつ、両データの間隙ｄが所定の基準間隔以下であ
った場合、各符号データの単位区間ＵＵ５，ＵＵ７を１
つの単位区間に統合する処理を行うとよい。この単位区
間ＵＵ５，ＵＵ７の統合により、符号データＣＣ５，Ｃ
Ｃ７も１つの符号データに統合されることになるが、統
合後の符号データの内容は、統合前の符号データの内容
に基いて適宜決定すればよい。たとえば、ＭＩＤＩデー
タの場合、統合前の２つの符号データにおけるノートナ
ンバーの最小値およびベロシティーの最大値を、統合後
の符号データの値とすればよい。

【００８７】図３２は、上述した単位区間の延長処理を
採り入れた場合の符号化方法の全手順を示す流れ図であ
る。ここで、ステップＳ１０の入力段階、ステップＳ２
０の変極点定義段階、ステップＳ３０の区間設定段階
は、図２に示した流れ図の各段階と同じであるが、ステ
ップＳ４０の符号化段階では、ステップＳ４１の符号デ
ータ生成処理Ｓ４１とステップＳ４２の符号データ修正
処理との間に、新たに、ステップＳ５０のトラック分離
処理、ステップＳ６０の単位区間延長処理、ステップＳ
７０の区間統合処理が付加されている。なお、ステップ
Ｓ５０，Ｓ６０，Ｓ７０の各処理は、ステップＳ４１の
符号データ生成処理の前段階に挿入するようにしてもか
まわない。

【００８８】ステップＳ５０のトラック分離処理は、図
２９に示すような符号データＣ１〜Ｃ７を、図３０に示
すように、複数のトラックＡ，Ｂに分離して再配置する
処理である。次のステップＳ６０の単位区間延長処理
は、図３０に示すような各トラックごとの符号データＣ
１〜Ｃ７の単位区間を延長し、図３１に示すような符号
データＣＣ１〜ＣＣ７を得る処理である。続くステップ
Ｓ７０の区間統合処理は、必要に応じて、互いに類似し
た符号データをもつ単位区間が同一トラック上で所定の
基準間隔以下の間隔をおいて隣接配置されていた場合
に、これらの単位区間を１つの単位区間に統合する処理
である。この場合、統合後の符号データは統合前の個々
の符号データに基いて作成される。

【００８９】§５．単位区間延長の具体的処理手順図３３は、ステップＳ５０のトラック分離処理の具体的
な手順の一例を示す流れ図である。図３０に示す例で
は、奇数番目の単位区間Ｕ１，Ｕ３，Ｕ５，Ｕ７をトラ
ックＡに配置し、偶数番目の単位区間Ｕ２，Ｕ４，Ｕ６
をトラックＢに配置するという交互配置の手法を採って
いたが、ステップＳ７０の区間統合処理を行う場合、で
きるだけ区間統合が行われやすい方法でトラック分離を
行うのが好ましい。図３３に示す手順でトラック分離処
理を行えば、互いに類似した符号データをもつ近接した
単位区間が同一トラック上に再配置されるようなトラッ
ク分離が行われるため、ステップＳ７０において区間統
合が行われやすくなる。この図３３に示す手順では、複
数Ｉ個のトラックに分離する一般例が示されているが、
ここでは便宜上、図３４に示すような１２個の符号デー
タＣ１〜Ｃ１２を、図３５に示すような３つのトラック
Ａ，Ｂ，Ｃに分離する場合（Ｉ＝３の場合）を例にとっ
て説明する。なお、図３４に示す符号データＣ１〜Ｃ１
２には、図示のとおり、Ｎ１，Ｎ２，Ｎ３のうちのいず
れかのノートナンバーが定義されているものとする。

【００９０】まず、ステップＳ５１において、パラメー
タｉを初期値１に設定する。パラメータｉは、何番目の
トラックについての配置処理を行っているかを示してお
り、ｉ＝１の場合、第１番目のトラックＡについての配
置処理が行われることになる。続くステップＳ５２で
は、先頭の符号データを抽出し、ｉ番目のトラックに配
置する処理が行われる。すなわち、図３４の例の場合、
先頭の符号データＣ１が第１番目のトラックＡに配置さ
れることになる。次のステップＳ５３では、直前に抽出
された符号データに対して、所定範囲内の後続する符号
データに類似する符号データがあるか否かが探索され
る。この実施例では、「所定範囲内の後続する符号デー
タ」として、「後続する３番目までの符号データ」とい
う条件を定めている。たとえば、図３４の例の場合、符
号データＣ１に対する「後続する３番目までの符号デー
タ」は、符号データＣ２，Ｃ３，Ｃ４ということにな
る。ステップＳ５３では、この３つの符号データＣ２，
Ｃ３，Ｃ４の中で、符号データＣ１に類似する符号デー
タがあるか否かが探索される。いかなる場合に、「類似
する」と判断するかは、適宜定めることができるが、こ
こでは、ノートナンバーが一致した場合に「類似する」
と判断することにする。上述の例の場合、符号データＣ
１のノートナンバーＮ１と同一のノートナンバーを有す
る符号データＣ３が、類似する符号データとして探索さ
れることになる。

【００９１】こうして、類似する符号データが探索され
ると、ステップＳ５４からステップＳ５５へと分岐し、
この類似する符号データを抽出し、ｉ番目のトラックに
配置する処理が行われる。上述の例の場合、類似する符
号データＣ３が抽出され、第１番目のトラックＡに配置
される。そして、再びステップＳ５３の処理が実行され
る。すなわち、今度は、直前に抽出された符号データＣ
３に対して、「後続する３番目までの符号データ」の中
で、類似する符号データの有無が探索され、符号データ
Ｃ４が類似データとして抽出されることになる。かくし
て、「後続する３番目までの符号データ」の中に、類似
する符号データ（この例の場合、同一のノートナンバー
を有する符号データ）がある限り、この類似する符号デ
ータが抽出され、同一のトラックに次々と配置されてゆ
く。図示の例では、トラックＡに、符号データＣ１，Ｃ
３，Ｃ４が配置されることになる。

【００９２】ところが、符号データＣ４に後続する３番
目までの符号データＣ５，Ｃ６，Ｃ７の中には、符号デ
ータＣ４と同一のノートナンバーを有する符号データは
ないので、ステップＳ５４からステップＳ５６へと分岐
することになる。このステップＳ５６では、所定の符号
データを抽出し、ｉ番目のトラックに配置する処理が行
われる。「所定の符号データ」としては、この例では
「後続する３番目の符号データ」と定めている。したが
って、符号データＣ４に後続する３番目の符号データＣ
７が抽出され、トラックＡに配置される。

【００９３】今度は、この符号データＣ７に対して、ス
テップＳ５３における探索が行われ、その結果、同一の
ノートナンバーをもった符号データＣ９が探索されるこ
とになる。そこで、ステップＳ５４からステップＳ５５
へと分岐し、符号データＣ９を抽出して、トラックＡに
配置する処理が行われる。同様に、この符号データＣ９
に対して、ステップＳ５３における探索が行われ、その
結果、同一のノートナンバーをもった符号データＣ１０
が探索されることになる。そして、ステップＳ５４から
ステップＳ５５へと分岐し、符号データＣ１０を抽出し
て、トラックＡに配置する処理が行われる。

【００９４】次に、この符号データＣ１０に対して、ス
テップＳ５３における探索処理が行われるが、図示の例
では、符号データＣ１０については、２つの後続符号デ
ータＣ１１，Ｃ１２しか残っておらず、後続する３番目
の符号データを探索する前に、符号データ列は終了して
しまう。このように、符号データ列が終了した場合は、
ステップＳ５４からステップＳ５７へと分岐し、パラメ
ータｉの値が１だけ更新される。この例の場合、ｉ＝２
となり、今度は第２番目のトラックＢについての配置処
理が実行されることになる。すなわち、ステップＳ５８
からステップＳ５２へと戻り、残っている先頭の符号デ
ータＣ２が抽出され、第２番目のトラックＢに配置され
ることになる。以下、同様にトラックＢへの配置が実行
され、図３５に示すように、符号データＣ５，Ｃ６，Ｃ
８，Ｃ１１が配置されることになる。符号データＣ１１
の配置が完了すると、符号データ列が終了するので、ス
テップＳ５４からステップＳ５７へと分岐し、パラメー
タｉが３に更新される。

【００９５】この時点で、ｉ＝Ｉとなるので、ステップ
Ｓ５８からステップＳ５９へと分岐し、残りの符号デー
タをすべてｉ番目のトラックに配置する処理が行われ
る。上述の例では、最後に残った符号データＣ１２が第
３番目のトラックＣに配置されることになる。

【００９６】かくして、図３４に示す符号データＣ１〜
Ｃ１２が、図３５に示すように３つのトラックＡ，Ｂ，
Ｃに再配置されたことになる。ここで留意すべき点は、
互いに類似した符号データ（この例の場合、同一のノー
トナンバーをもった符号データ）をもつ近接した単位区
間が同一トラック上に再配置されている点である。たと
えば、図３５に示すトラックＡでは、符号データＣ１，
Ｃ３，Ｃ４が近接して配置されており、符号データＣ
７，Ｃ９，Ｃ１０も近接して配置されている。また、ト
ラックＢでは、符号データＣ２，Ｃ５，Ｃ６およびＣ
８，Ｃ１１が近接して配置されている。このように近接
配置された類似符号データの一部は、後の区間統合処理
で統合されることになる。

【００９７】図３６は、図３５に示す３つのトラックに
分離された符号データに対して、それぞれ単位区間延長
処理を行った結果を示す図である。この例では、最大区
間長Ｌmax を図のように定義し、各区間を、隣接する区
間に接触するまで、最大でＬmax まで延長する処理が行
われている。その結果、符号データＣ１〜Ｃ１２は、そ
れぞれ符号データＣＣ１〜ＣＣ１２に置換されることに
なる。この例では、符号データＣＣ３，ＣＣ５，ＣＣ９
は、いずれも後続する符号データに接触したため、最大
区間長Ｌmax まで延長することはできなかったが、他の
符号データはいずれも最大区間長Ｌmax まで延長されて
いる。

【００９８】図３７は、図３６に示す単位区間延長処理
後の符号データに対して、区間統合処理を行った結果を
示す図である。すなわち、互いに類似した符号データを
もつ単位区間が同一トラック上で所定の基準間隔以下の
間隔をおいて隣接配置されていた場合に、これらの単位
区間を１つの単位区間に統合する処理が行われている。
具体的には、符号データＣＣ３，ＣＣ４が符号データＣ
Ｃ３４に統合され、符号データＣＣ５，ＣＣ６が符号デ
ータＣＣ５６に統合され、符号データＣＣ９，ＣＣ１０
が符号データＣＣ９１０に統合されている。このような
区間統合処理により、データ量を圧縮させることがで
き、符号化効率を更に向上させることができる。

【００９９】図３８は、ステップＳ６０の単位区間延長
処理の具体的な手順の一例を示す流れ図である。ここに
示す手順では、個々の単位区間を延長するだけでなく、
基準に満たない短い単位区間を削除する処理も併せて行
っている。すなわち、まずステップＳ６１において、単
位区間延長処理を行う際の最大区間長Ｌmax と最小区間
長Ｌmin とを設定する。最大区間長Ｌmax は、隣接する
単位区間に接触しない限り延長が許される最大の区間長
を示しており、最小区間長Ｌmin は、区間長がＬmin 未
満の区間を削除するという基準を示している。この図３
８に示す手順では、最大区間長Ｌmax および最小区間長
Ｌmin の意義に適した処理が行われるよう、パラメータ
Ｌthを用いたループ処理を行っている。パラメータＬth
は、ステップＳ６２において初期値０に設定されるが、
ステップＳ６６において、ΔＬずつ徐々に増加するパラ
メータになっており、最終的にステップＳ６４において
Ｌmin に達したと判断されるまで、ステップＳ６３〜Ｓ
６６のループ処理が繰り返し行われることになる。

【０１００】まず、ステップＳ６３では、後続区間に接
触するまで、各区間を最大Ｌmax まで延長する処理が行
われる。そして、ステップＳ６４において、パラメータ
Ｌth≧Ｌmin と判断されない限り、ステップＳ６５へと
進み、区間長ＬがパラメータＬth未満である区間が存在
した場合に、その区間が削除される。このような処理
が、ステップＳ６６で、パラメータＬthの値をΔＬずつ
増加させながら繰り返し実行されることになる。

【０１０１】この図３８の手順に示す単位区間延長処理
の理解を深めるために、図３９に示すようなトラックＡ
を例にとって、具体的な処理内容を説明しよう。この例
では、４つの符号データＣ１〜Ｃ４がトラックＡに配置
されており、最大区間長Ｌmax と最小区間長Ｌmin とが
図示されている長さに設定されていたものとする。

【０１０２】まず、ステップＳ６３において、各区間に
対する延長が行われる。その結果、トラックＡの各符号
データは、図４０(a) に示すようになる。すなわち、符
号データＣ３，Ｃ４は、最大区間長Ｌmax に至るまで延
長されて符号データＣＣ３，ＣＣ４となり、符号データ
Ｃ１，Ｃ２は後続する符号データに接触するまで延長さ
れて符号データＣＣ１，ＣＣ２となる。この状態では、
もはやこれ以上延長できる単位区間は存在しない。しか
しながら、ステップＳ６３〜Ｓ６６に至るループを繰り
返し実行するうちに、パラメータＬthは０から徐々に増
加してゆくことになり、やがて、符号データＣＣ２の区
間長がパラメータＬth未満になる。すると、ステップＳ
６５において、符号データＣＣ２に対する削除処理が実
行され、図４０(b) に示すように、トラックＡ上から符
号データＣＣ２は削除されることになる。続いて、この
削除処理後のステップＳ６３の実行によって、符号デー
タＣＣ１は最大区間長Ｌmax に至るまで延長されて、図
４０(c) に示すように、符号データＣＣＣ１となる。や
がて、パラメータＬthが最小区間長Ｌmin に到達する
と、ステップＳ６４からの分岐により、この処理手順は
終了する。かくして、最大区間長Ｌmax までの延長処理
とともに、最小区間長Ｌmin 未満の単位区間の削除処理
が行われたことになる。

【０１０３】この後、ステップＳ７０の区間統合処理が
行われる。たとえば、同じノートナンバーを有し、基準
間隔ｄ以下の間隔をおいて隣接配置されている符号デー
タを統合の対象とするような設定を行った場合、図４０
(c) に示すように、間隔ｄをおいて隣接配置されている
符号データＣＣＣ１とＣＣ３とは統合の対象となり、図
４０(d) に示すように、新たな符号データＣＣＣ１３に
よって置換されることになる。

【０１０４】§６．代表周波数の異なる単位区間を重
複定義する手法これまで述べてきた符号化方法は、生体の発生するリズ
ム音、波や風などの自然が発生するリズム音というよう
に、個々の単位区間内にある程度限定された周波数成分
のみを含む音響信号の符号化には、実用上十分な再現性
を確保することができる。しかしながら、いわゆるヴォ
ーカル音響と呼ばれている人間の声音のように、非常に
幅の広い周波数成分を同時に含んでいるような音響信号
を符号化した場合、必ずしも十分な再現性を確保するこ
とはできない。特に、人間の声音には、ホルマントと呼
ばれる特性（倍音以外の高調波成分が混在する特性）が
あることが知られており、上述した方法では十分な再現
性をもった符号化ができないことは、理論的にも裏付け
られる。一般的な楽器では、ある特定の音程を演奏する
と、演奏した音程に対応する周波数成分とともに、その
整数倍の周波数成分（倍音高調波成分）が得られる。し
たがって、このような楽器の演奏波形をＭＩＤＩ音源と
して利用すれば、上述した符号化方法でも倍音高調波成
分を含んだ音を再現することができる。ところが、ホル
マントを有する人間の声音には、倍音以外の高調波成分
が含まれているため、十分な再現性を確保することがで
きなくなる。

【０１０５】以下に述べる手法は、ホルマントを有する
人間の声音の符号化にも十分に対応できるような改良を
施したものである。図４１に、この手法の基本概念を示
す。図４１の中段には、時系列の強度信号としてのデジ
タル音響データの波形が示されており、この波形より下
側には、高域周波数に着目した処理が示され、この波形
より上側には、低域周波数に着目した処理が示されてい
る。すなわち、図の下半分に示された高域周波数に着目
した処理では、高域単位区間Ｕｈ（１）〜Ｕｈ（６）が
設定され、これら各単位区間について、それぞれ代表周
波数Ｆｈ（１）〜Ｆｈ（６）と代表強度Ａｈ（１）〜Ａ
ｈ（６）が定義されており、最終的に図の最下段に示さ
れているような高域符号データが生成されることにな
る。一方、図の上半分に示された低域周波数に着目した
処理では、低域単位区間Ｕｌ（１）〜Ｕｌ（４）が設定
され、これら各単位区間について、それぞれ代表周波数
Ｆｌ（１）〜Ｆｌ（４）と代表強度Ａｌ（１）〜Ａｌ
（４）が定義されており、最終的に図の最上段に示され
ているような低域符号データが生成されることになる。

【０１０６】ここで重要な点は、高域単位区間Ｕｈ
（１）〜Ｕｈ（６）と低域単位区間Ｕｌ（１）〜Ｕｌ
（４）とが、時間軸ｔ上において、少なくともその一部
分が重複しているという点である。もちろん、時間軸ｔ
を図の左から右へと辿っていった場合、高域単位区間の
みしか設定されていない部分や、低域単位区間のみしか
設定されていない部分が存在し、また、いずれの単位区
間も設定されていない部分も存在し得るが、少なくとも
時間軸ｔ上の一部分には、高域単位区間と低域単位区間
とが重複して設定された区間が存在することになる。こ
うして重複設定された単位区間について、それぞれ独立
して代表周波数および代表強度を定めて符号化すれば、
時間軸上で重複した符号データが得られることになる。
たとえば、図４１に示す例の場合、最下段に示された高
域符号データと、最上段に示された低域符号データと
は、時間軸ｔ上において少なくとも部分的には重なって
おり、再生時には、和音として演奏されることになる。
なお、図示されている音符は概念を示すためのものであ
り、図の中段に示された波形や各単位区間とは直接関連
していない。このように、時間軸上で少なくとも部分的
に重複する単位区間を設定し、各単位区間ごとにそれぞ
れ別個に符号化を行うようにすれば、再生時には、種々
の周波数成分を含んだ和音としての形式で音の再現が可
能になる。

【０１０７】この§６で述べる符号化手順は、§５まで
に述べた符号化手順とほぼ同様に行うことができる。す
なわち、図２あるいは図３２の流れ図に示すように、入
力段階Ｓ１０において、符号化対象となる音響信号を、
デジタルの音響データとして取り込む処理が行われ、続
いて、変極点定義段階Ｓ２０において、取り込んだ音響
データの波形について変極点を求める処理が行われる。
ここまでの処理は、既に述べた手順と全く同じである。
次に、区間設定段階Ｓ３０において、単位区間の設定が
行われるが、ここでは、前述したように、時間軸上で少
なくとも部分的に重複するような区間設定が行われるこ
とになる。また、符号化段階Ｓ４０では、各単位区間ご
とに符号化する処理が行われるが、この処理も重複設定
された各単位区間ごとに行われることになる。

【０１０８】区間設定段階Ｓ３０において最初に行われ
る処理は、既に述べたように、固有周波数定義処理Ｓ３
１である。この時点では、既に、変極点探索処理Ｓ２１
によって、音響データ波形についての個々の変極点が探
索され、同極性変極点の間引処理Ｓ２２によって、同極
性のデジタル値をもった変極点が複数連続する場合に、
絶対値が最大のデジタル値をもった変極点のみを残す間
引きが行われており、正の信号値をもつ変極点と負の信
号値をもつ変極点とが交互に現れる状態になっている。
固有周波数定義処理Ｓ３１は、このような各変極点のそ
れぞれに対して、近傍の情報に基いて固有周波数を定義
する処理であるが、本手法では、１つの変極点に対して
固有周波数を定義する方法を複数通り設定するように
し、これら複数通りの方法を用いて、各変極点に複数通
りの固有周波数を定義するようにしている。

【０１０９】ここでは、ヴォーカル音響信号に対して用
いるのに適した２通りの具体的な固有周波数定義方法を
説明する。いま、変極点定義段階Ｓ２０を経ることによ
り、図４２にその一部が示されているような変極点群が
得られた場合を考える。図４２には、この変極点群のう
ちの第ｎ番目の変極点Ｐ（ｎ）〜第（ｎ＋１２）番目の
変極点Ｐ（ｎ＋１２）が示されている。このような変極
点群には、２つの周波数成分が含まれていることがわか
る。すなわち、変極点Ｐ（ｎ）とＰ（ｎ＋２）との距離
φｈを一周期とする高域周波数成分と、変極点Ｐ（ｎ）
とＰ（ｎ＋６）との距離φｌを一周期とする低域周波数
成分とである。ヴォーカル音響信号に対して変極点の定
義を行うと、図４２に示すような特徴が顕著に現れる。
これは、前述したように、人間の音声はホルマントとい
う特徴を有するためである。図４２に示す例において、
正の信号強度をもつ変極点Ｐ（ｎ），Ｐ（ｎ＋２），Ｐ
（ｎ＋４），Ｐ（ｎ＋６），Ｐ（ｎ＋８）…に注目すれ
ば、信号強度が大中小大中小…と変化していることがわ
かる。この大中小という変化の周期が周期φｌに相当
し、低域周波数成分を示すことになる。これに対し、同
極性の変極点の出現周期が周期φｈに相当し、高域周波
数成分を示すことになる。

【０１１０】結局、個々の変極点に対して固有周波数を
定義する第１の方法として、同極性の変極点が現れる周
期φｈを探索し、この周期φｈに基いて固有周波数を定
義する方法を採れば、高域固有周波数ｆｈを定義するこ
とができる。また、個々の変極点に対して固有周波数を
定義する第２の方法として、近似した信号強度をもつ変
極点が現れる周期φｌを探索し、この周期φｌに基いて
固有周波数を定義する方法を採れば、低域固有周波数ｆ
ｌを定義することができる。より具体的には、各変極点
について、それぞれ所定の条件を満たす特定の変極点を
探索し、探索された変極点との間の時間軸上での距離に
基いて固有周波数を定義すればよい。たとえば、図４２
において、変極点Ｐ（ｎ）についての高域固有周波数ｆ
ｈを定義するには、「後続して最初に出現する同極性の
変極点」という条件を設定して探索を行えばよい。その
結果、この条件を満たす変極点Ｐ（ｎ＋２）が探索され
ることになるので、両変極点の時間軸上での距離φｈを
周期とする周波数が定義される。同様に、変極点Ｐ
（ｎ）についての低域固有周波数ｆｌを定義するには、
「変極点Ｐ（ｎ）のもつ信号強度にほぼ等しい信号強度
をもち、後続して最初に出現する変極点（信号強度に符
号をもたせておけば、当然同極性の変極点になる）」と
いう条件を設定して探索を行えばよい。その結果、この
条件を満たす変極点Ｐ（ｎ＋６）が探索されることにな
るので、両変極点の時間軸上での距離φｌを周期とする
周波数が定義される。このように、探索条件を変えるこ
とにより、同一の変極点に対して複数通りの固有周波数
を定義することが可能になる。

【０１１１】上述の手法によれば、第ｎ番目の変極点Ｐ
（ｎ）についての高域固有周波数ｆｈ（ｎ）は、§２．
３で述べたように、任意の整数ｋを用いて、ｆｈ（ｎ）＝（ｋ／２）・１／（ｔ（ｎ＋ｋ）−ｔ
（ｎ））なる式で得られることになる。すなわち、第ｎ番目の変
極点Ｐ（ｎ）に対してｋ個離れた変極点Ｐ（ｎ＋ｋ）を
探索し（ｋが正の場合は後続する変極点、負の場合は先
行する変極点）、変極点Ｐ（ｎ）の時間軸上での位置ｔ
（ｎ）と探索された変極点Ｐ（ｎ＋ｋ）の時間軸上での
位置ｔ（ｎ＋ｋ）との差の逆数に基いて、高域固有周波
数ｆｈ（ｎ）が得られることになる。既に述べたよう
に、ｋの値は、ある程度大きく設定した方が、誤差の少
ない固有周波数を定義することができるが、あまり大き
く設定しすぎると、ローカルな周波数としての意味が失
われてしまう。

【０１１２】図４２に示す例の場合、変極点Ｐ（ｎ）に
ついての高域固有周波数ｆｈ（ｎ）は、図示の周期φｈ
の逆数として定義することができ、ｆｈ（ｎ）＝１／φｈ＝１／（ｔ（ｎ＋２）−ｔ（ｎ））なる式で与えられるが、これは上述の式における係数ｋ
＝２に設定した場合に他ならない。もちろん、係数ｋ＝
４に設定すれば、変極点Ｐ（ｎ＋４）を探索対象とし
て、ｆｈ（ｎ）＝２・（１／（ｔ（ｎ＋４）−ｔ（ｎ）））なる式により、高域固有周波数ｆｈ（ｎ）の値を定義す
ることもできる。

【０１１３】一方、第ｎ番目の変極点Ｐ（ｎ）について
の低域固有周波数ｆｌ（ｎ）は、ｆｌ（ｎ）＝１／（ｔ（ｎ＋ｋ）−ｔ（ｎ））なる式で得られることになる。ただし、右辺の分母に示
されている係数ｋは任意の整数ではなく、所定の条件を
満たす整数でなければならない。すなわち、整数ｋで特
定される変極点Ｐ（ｎ＋ｋ）が、変極点Ｐ（ｎ）のもつ
信号強度に対して所定の誤差範囲内にある信号強度をも
つ変極点のうち、変極点（ｎ）に最も近い後続する変極
点となるようにしなければならない。あるいは、整数ｋ
を負にとって、先行する変極点を探索対象とする場合に
は、整数ｋで特定される変極点Ｐ（ｎ＋ｋ）が、変極点
Ｐ（ｎ）のもつ信号強度に対して所定の誤差範囲内にあ
る信号強度をもつ変極点のうち、変極点（ｎ）に最も近
い先行する変極点となるようにしてもかまわない。この
式の意味するところは、要するに、変極点Ｐ（ｎ）のも
つ信号強度とほぼ同じ信号強度をもった最も近い変極点
Ｐ（ｎ＋ｋ）を探索し、変極点Ｐ（ｎ）の時間軸上での
位置ｔ（ｎ）と探索された変極点Ｐ（ｎ＋ｋ）の時間軸
上での位置ｔ（ｎ＋ｋ）との差の逆数に基いて、低域固
有周波数ｆｌ（ｎ）を決定するということである。

【０１１４】図４２に示す例の場合、変極点Ｐ（ｎ）に
ついての低域固有周波数ｆｌ（ｎ）は、図示の周期φｌ
の逆数として定義することができ、ｆｌ（ｎ）＝１／φｌ＝１／（ｔ（ｎ＋６）−ｔ（ｎ））なる式で与えられるが、これは上述の式における係数ｋ
＝６に設定した場合に他ならない。すなわち、図４２の
例では、変極点Ｐ（ｎ＋６）が、変極点Ｐ（ｎ）のもつ
信号強度に対して所定の誤差範囲内にある信号強度を有
し、変極点Ｐ（ｎ）に最も近い後続する変極点として探
索されたことになる。なお、理論的には、必ずしも最も
近い後続する変極点（もしくは最も近い先行する変極
点）を探索対象とする必要はない。たとえば、２番目に
近い後続する変極点Ｐ（ｎ＋１２）を探索対象とした場
合であっても、ｆｌ（ｎ）＝２・（１／（ｔ（ｎ＋１２）−ｔ
（ｎ）））なる式で低域固有周波数ｆｌ（ｎ）を定義することがで
き、一般に、ｚ番目に近い後続もしくは先行する変極点
Ｐ（ｎ＋ｋ）を探索対象とした場合、ｆｌ（ｎ）＝ｚ・（１／（ｔ（ｎ＋ｋ）−ｔ（ｎ）））なる式で低域固有周波数ｆｌ（ｎ）を定義することがで
きる。

【０１１５】かくして、本発明の場合、図２の流れ図に
おけるステップＳ３１の固有周波数定義処理は、個々の
変極点に対してそれぞれ複数通りの固有周波数が定義さ
れることになる。そして、ステップＳ３２〜Ｓ３４の個
々の処理は、複数通りの固有周波数についてそれぞれ別
個に行われ、ステップＳ４１〜Ｓ４２の個々の処理も、
複数通りの固有周波数についてそれぞれ別個に行われる
ことになる。結局、時間軸上で重複するような複数の符
号データが生成されることになり、これらの符号データ
を時間軸上で重複して再生することにより、ホルマント
特性を有する人間の声音についても実用的なレベルでの
再現性が確保できることになる。

【０１１６】たとえば、図４２に示す具体例において、
ｎ＝１として、各変極点をＰ１〜Ｐ１３で表わした場
合、各変極点にそれぞれ高域固有周波数を定義すれば、
図４３に示すような固有周波数ｆｈｘおよび信号強度ａ
ｘをもった変極点群が定義されることになり、各変極点
にそれぞれ低域固有周波数を定義すれば、図４４に示す
ような固有周波数ｆｌｘおよび信号強度ａｘをもった変
極点群が定義されることになる（ただし、ｘ＝１〜１
３）。このような２通りの変極点群に対して、それぞれ
別個独立して、ステップＳ３２におけるレベルによるス
ライス処理、ステップＳ３３における不連続部分割処
理、ステップＳ３４における区間統合処理を実行すれ
ば、２通りの単位区間が設定されることになる。ここ
で、図４３に示すような高域固有周波数をもつ変極点群
に基いて設定された単位区間は、各変極点に与えられた
高域固有周波数が所定の近似範囲となるような一群の変
極点を含む区間として設定されることになり、図４４に
示すような低域固有周波数をもつ変極点群に基いて設定
された単位区間は、各変極点に与えられた低域固有周波
数が所定の近似範囲となるような一群の変極点を含む区
間として設定されることになる。要するに、ステップＳ
３０の区間設定段階では、同一の方法で定義された固有
周波数が所定の近似範囲内となるような一群の変極点を
含む区間を１つの単位区間と設定する処理が行われる。
固有周波数の定義は、複数通りの方法で行われるため、
時間軸上で重複する複数の単位区間が定義されることに
なる。

【０１１７】ステップＳ４０の符号化段階では、各単位
区間について、それぞれ別個独立して代表周波数および
代表強度が定義される。すなわち、単位区間内に含まれ
る変極点について定義された複数通りの固有周波数のう
ち、当該単位区間の設定に関与した固有周波数に基い
て、当該単位区間の代表周波数が定義され、当該単位区
間に含まれる変極点のもつ信号強度に基いて当該単位区
間の代表強度が定義される。たとえば、図４１に示す例
の場合、高域単位区間Ｕｈ（１）については、この区間
Ｕｈ（１）内に含まれる変極点について定義された複数
通りの固有周波数のうち、当該単位区間の設定に関与し
た高域固有周波数に基いて代表周波数Ｆｈ（１）が定義
されることになり、この区間Ｕｈ（１）内に含まれる変
極点のもつ信号強度に基いて代表強度Ａｈ（１）が定義
されることになる。

【０１１８】なお、§３．１で説明したＭＩＤＩデータ
への変換原理によると、個々の単位区間に相当するＭＩ
ＤＩデータのベロシティーＶを、単位区間の代表強度Ａ
を最大値Ａmax で規格化して、１２７を乗じることによ
り、Ｖ＝（Ａ／Ａmax ）・１２７なる式で定義し、Ｖ＝０〜１２７の値をとるベロシティ
ーＶを求めていたが、いわゆるヴォーカル音声信号を符
号化する場合には、規格化した値の平方根をとって、Ｖ＝（Ａ／Ａmax ）^１／２・１２７なる式でベロシティーＶを定義するか、あるいは対数を
とって、Ｖ＝ｌｏｇ（Ａ／Ａmax ）・１２７＋１２７（ただし、Ｖ＜０の場合は、Ｖ＝０とする）なる式でベロシティーＶを定義した方が、より自然な再
生音が得られるようになり好ましい。

【０１１９】最後に、この§６で述べた手法と、§４，
§５で述べた区間延長を行う手法とを組み合わせた実施
形態を示しておく。いま、図４５(a) に示すような音響
データが与えられた場合を考えよう。このような音響デ
ータに対して、変極点が探索され、各変極点について固
有周波数と信号強度とが求められるが、この§６で述べ
た手法によれば、図４５(b) に示すような低域固有周波
数ｆｌの定義と、図４５(c) に示すような高域固有周波
数ｆｈの定義とが行われることになる。そして、低域固
有周波数に基いて設定された単位区間について、図４５
(d) に示すような低域符号データＣ１１，Ｃ１２が定義
され、高域固有周波数に基いて設定された単位区間につ
いて、図４５(e) に示すような高域符号データＣ２１〜
Ｃ２５が定義される。

【０１２０】続いて、これらの各符号データに対して、
それぞれ単位区間延長処理を施す。ただし、ここで示す
実施形態では、図４５(d) に示す低域符号データに対し
ては、トラック分離処理を行うことなしに区間延長処理
を行うこととし、図４５(e)に示す高域符号データに対
しては、トラック分離処理によって２つのトラックに分
離した後、各トラックごとに区間延長処理を行うことに
する。すなわち、図４５(e) に示す高域符号データのう
ちの符号データＣ２１，Ｃ２３，Ｃ２４は、図４６(a)
に示すようにトラックＡに再配置され、符号データＣ２
２，Ｃ２５は、図４６(b) に示すようにトラックＢに再
配置される。そして、トラックＡ上の符号データＣ２
１，Ｃ２３，Ｃ２４に対して単位区間延長処理を施すこ
とにより、図４７に示すような符号データＣＣ２１，Ｃ
Ｃ２３，ＣＣ２４が得られ、トラックＢ上の符号データ
Ｃ２２，Ｃ２５に対して単位区間延長処理を施すことに
より、図４７に示すような符号データＣＣ２２，ＣＣ２
５が得られる。一方、図４５(d) に示す低域符号データ
Ｃ１１，Ｃ１２に対して単位区間延長処理を施し、これ
をトラックＣに配置すれば、図４７に示すような符号デ
ータＣＣ１１，ＣＣ１２が得られる。

【０１２１】結局、図４７に示すように、時間軸ｔを共
通とする３つのトラックＡ，Ｂ，Ｃが設定され、各トラ
ックに分離した状態で、延長処理が施された符号データ
がそれぞれ配置されることになる。したがって、再生時
には、３つのトラックの和音として再生音が提示される
ことになる。ただ、符号化方法のプロセスを考慮する
と、３つのトラックの意味合いは若干異なっている。す
なわち、符号データをトラックＡとトラックＢに分離し
たのは、単位区間延長処理の便宜のためであるのに対
し、トラックＡ，ＢとトラックＣとを設けたのは、高域
固有周波数に基いて定義された符号データを前者に配置
し、低域固有周波数に基いて定義された符号データを後
者に配置するためである。

【０１２２】なお、上述の実施形態では、低域符号デー
タについては単位区間延長処理の便宜のためのトラック
分離処理を行っていないが、高域符号データと同様にト
ラック分離処理を行うようにしてもかまわない。もっと
も、実用上は、低域符号データに関しては、単位区間延
長処理のために十分な空白区間が確保できる場合が多い
ので、高域符号データに対してのみトラック分離処理を
行うようにしても十分である。

【０１２３】

【発明の効果】以上のとおり本発明によれば、音響信号
に対して効率的な符号化を行うことができるようにな
る。

【図面の簡単な説明】

【図１】先願発明に係る音響信号の符号化方法の基本原
理を示す図である。

【図２】先願発明に係る音響信号の符号化方法の実用的
な手順を示す流れ図である。

【図３】入力した音響データに含まれている直流成分を
除去するデジタル処理を示すグラフである。

【図４】図３に示す音響データの一部を時間軸に関して
拡大して示したグラフである。

【図５】図４に矢印で示す変極点Ｐ１〜Ｐ６のみを抜き
出した示した図である。

【図６】多少乱れた音響データの波形を示すグラフであ
る。

【図７】図６に矢印で示す変極点Ｐ１〜Ｐ７のみを抜き
出した示した図である。

【図８】図７に示す変極点Ｐ１〜Ｐ７の一部を間引処理
した状態を示す図である。

【図９】個々の変極点について、固有周波数を定義する
方法を示す図である。

【図１０】個々の変極点に関する情報に基づいて、単位
区間を設定する具体的手法を示す図である。

【図１１】所定の許容レベルＬＬに基づくスライス処理
を示す図である。

【図１２】単位区間設定の対象となる多数の変極点を矢
印で示した図である。

【図１３】図１２に示す変極点に対して、所定の許容レ
ベルＬＬに基づくスライス処理を行う状態を示す図であ
る。

【図１４】図１３に示すスライス処理によって変極点を
除外し、暫定区間Ｋ１，Ｋ２を設定した状態を示す図で
ある。

【図１５】図１４に示す暫定区間Ｋ１についての不連続
位置を探索する処理を示す図である。

【図１６】図１５で探索された不連続位置に基づいて、
暫定区間Ｋ１を分割し、新たな暫定区間Ｋ１−１とＫ１
−２とを定義した状態を示す図である。

【図１７】図１６に示す暫定区間Ｋ１−２，Ｋ２につい
ての統合処理を示す図である。

【図１８】図１７に示す統合処理によって、最終的に設
定された単位区間Ｕ１，Ｕ２を示す図である。

【図１９】各単位区間についての代表周波数および代表
強度を求める手法を示す図である。

【図２０】５つの区間Ｅ０，Ｕ１，Ｅ１，Ｕ２，Ｅ２を
定義するための符号データを示す図である。

【図２１】図２０に示す単位区間Ｕ１，Ｕ２内の音響デ
ータを符号化して得られる符号データの一例を示す図表
である。

【図２２】図２０に示す単位区間Ｕ１，Ｕ２内の音響デ
ータを符号化して得られる符号データの別な一例を示す
図表である。

【図２３】一般的なＭＩＤＩ形式の符号データの構成を
示す図である。

【図２４】各単位区間内の音響データについてのＭＩＤ
Ｉデータへの具体的な変換方法を示す図である。

【図２５】図２０に示す単位区間Ｕ１，Ｕ２内の音響デ
ータを、ＭＩＤＩデータを用いて符号化した状態を示す
図表である。

【図２６】生成したＭＩＤＩデータに対して修正処理が
必要な第１の事例を示す図である。

【図２７】生成したＭＩＤＩデータに対して修正処理が
必要な第２の事例を示す図である。

【図２８】図２７に示す事例における修正後の状態を示
す図である。

【図２９】先願発明の符号化方法により得られる符号デ
ータの一例を示す図である。

【図３０】図２９に示す符号データを２つのトラック
Ａ，Ｂに分離して再配置した状態を示す図である。

【図３１】図３０に示す２つのトラックＡ，Ｂ上に再配
置された各単位区間Ｕ１〜Ｕ７を、それぞれ最大区間長
Ｌmax になるまで延長し、新たな単位区間ＵＵ１〜ＵＵ
７を形成した例を示す図である。

【図３２】本発明に係る単位区間の延長処理を採り入れ
た場合の符号化方法の全手順を示す流れ図である。

【図３３】図３２に示すステップＳ５０のトラック分離
処理の具体的な手順の一例を示す流れ図である。

【図３４】図３３に示す手順の説明に用いる符号データ
列を示す図である。

【図３５】図３４に示す符号データを３つのトラック
Ａ，Ｂ，Ｃに分離して再配置した状態を示す図である。

【図３６】図３５に示す各トラック上の符号データに対
して単位区間延長処理を施した状態を示す図である。

【図３７】図３６に示すトラックＡ，Ｂ上の符号データ
に対して区間統合処理を施した状態を示す図である。

【図３８】図３２に示すステップＳ６０の単位区間延長
処理の具体的な手順の一例を示す流れ図である。

【図３９】図３８に示す手順の説明に用いる符号データ
列を示す図である。

【図４０】図３９に示す符号データに対して、図３８に
示す手順を実行した状態を示す図である。

【図４１】時間軸上に少なくとも一部が重複するよう
に、高域単位区間および低域単位区間をそれぞれ定義
し、各単位区間にそれぞれ異なる周波数を定義する符号
化方法の基本原理を示す図である。

【図４２】個々の変極点について、それぞれ高域固有周
波数と低域固有周波数との２通りの固有周波数を定義す
る方法を示す図である。

【図４３】図４２に示す個々の変極点について、高域固
有周波数と信号強度とを定義した状態を示す図である。

【図４４】図４２に示す個々の変極点について、低域固
有周波数と信号強度とを定義した状態を示す図である。

【図４５】同一の音響データに基いて低域符号データと
高域符号データとを生成する処理の概念図である。

【図４６】図４５(e) に示す高域符号データを２つのト
ラックに分離して再配置した状態を示す図である。

【図４７】図４５(d) に示す低域符号データおよび図４
６に示す高域符号データ１および２を別個のトラックに
分離し、単位区間延長処理を施した状態を示す図であ
る。

【符号の説明】

Ａ，Ａ１〜Ａ６，Ａｉ…代表強度Ａｈ（１）〜Ａｈ（６）…高域代表強度Ａｌ（１）〜Ａｌ（４）…低域代表強度Ａmax …代表強度の最大値ａ１〜ａ１３…変極点の信号強度ａａ…許容範囲Ｃ１〜Ｃ１２，Ｃ２１〜Ｃ２５…符号データＣＣ１〜ＣＣ１２，ＣＣ２１〜ＣＣ２５，ＣＣＣ１…延
長処理後の符号データＣＣ３４，ＣＣ５６，ＣＣ９１０，ＣＣＣ１３…統合処
理後の符号データＤ…直流成分ｄ…オフセット量／単位区間の間隙Ｅ０，Ｅ１，Ｅ２…空白区間ｅ１〜ｅ６…終端位置Ｆ，Ｆ１〜Ｆ６，Ｆｉ…代表周波数Ｆｈ（１）〜Ｆｈ（６）…高域代表周波数Ｆｌ（１）〜Ｆｌ（４）…低域代表周波数ｆ１〜ｆ１７…変極点の固有周波数ｆｈ１〜ｆｈ１３…変極点の高域固有周波数ｆｌ１〜ｆｌ１３…変極点の低域固有周波数ｆａ，ｆｂ，ｆｃ…周波数特性ｆｆ…許容範囲ｆｓ…サンプリング周波数Ｋ１，Ｋ１−１，Ｋ１−２，Ｋ２…暫定区間Ｌ，Ｌ１〜Ｌ４，Ｌｉ…区間長ＬＬ…許容レベルＬＬｉ…再生音の持続時間Ｌmax …最大区間長Ｌmin …最小区間長Ｌth…区間長パラメータＮ，Ｎ１，Ｎ２，Ｎ３，Ｎｉ…ノートナンバーＰ１〜Ｐ１７…変極点ｓ１〜ｓ６…始端位置Ｔ，Ｔｉ…デルタタイムｔ１〜ｔ１７…時間軸上の位置Ｕ１〜Ｕ７，Ｕｉ，Ｕｉ１，Ｕｉ２…単位区間ＵＵ１〜ＵＵ６…延長処理後の単位区間Ｕｈ（１）〜Ｕｈ（６）…高域単位区間Ｕｌ（１）〜Ｕｌ（４）…低域単位区間ｆＶ，Ｖｉ…ベロシティーｘ…サンプル番号 φ，φｈ，φｌ…周期

Claims

【特許請求の範囲】

【請求項１】時系列の強度信号として与えられる音響
信号を符号化するための符号化方法であって、符号化対象となる音響信号を、デジタルの音響データと
して取り込む入力段階と、前記音響データの時間軸上に、複数の単位区間を設定す
る区間設定段階と、個々の単位区間内の音響データに基づいて、個々の単位
区間を代表する所定の代表周波数および代表強度を定義
し、時間軸上での個々の単位区間の始端位置および終端
位置を示す情報と前記代表周波数および前記代表強度を
示す情報とを含む符号データを生成し、個々の単位区間
の音響データを個々の符号データによって表現する符号
化段階と、を有し、前記符号化段階において、単位区間の長さを延
長する区間延長処理を行うことを特徴とする音響信号の
符号化方法。
【請求項２】請求項１に記載の符号化方法において、符号化段階において、時間軸を共通とする複数のトラッ
クを定義し、区間設定段階で設定された個々の単位区間
を複数のトラックに分離して再配置するトラック分離処
理を行い、各トラックごとにそれぞれ区間延長処理を行
うことを特徴とする音響信号の符号化方法。
【請求項３】請求項２に記載の符号化方法において、あるトラックに配置された単位区間が、別なトラックに
配置された別な単位区間に対して、共通の時間軸上で少
なくとも一部分が重複するように、各トラックごとの区
間延長処理を行うことを特徴とする音響信号の符号化方
法。
【請求項４】請求項１〜３のいずれかに記載の符号化
方法において、単位区間延長処理を行った後、互いに類似した符号デー
タをもつ単位区間が所定の基準間隔以下の間隔をおいて
存在していた場合に、これらの単位区間を１つの単位区
間に統合する区間統合処理を行い、統合前の個々の単位
区間の符号データに基いて、統合後の単位区間の符号デ
ータを決定するようにしたことを特徴とする音響信号の
符号化方法。
【請求項５】請求項２に記載の符号化方法において、トラック分離処理を行う際に、互いに類似した符号デー
タをもつ近接した単位区間を同一トラック上に再配置す
るようにしたことを特徴とする音響信号の符号化方法。
【請求項６】請求項１〜５のいずれかに記載の符号化
方法において、単位区間延長処理を行う際に、最大区間長Ｌmax と最小
区間長Ｌmin とを設定し、各区間を、隣接する区間に接
触するまで、最大でＬmax まで延長する処理を行うとと
もに、区間長がＬmin 未満の区間を削除する処理を行う
ことを特徴とする音響信号の符号化方法。
【請求項７】請求項１〜６のいずれかに記載の符号化
方法において、符号化段階で、代表周波数に基づいてノートナンバーを
定め、代表強度に基づいてベロシティーを定め、単位区
間の長さに基づいてデルタタイムを定め、１つの単位区
間の音響データを、ノートナンバー、ベロシティー、デ
ルタタイムで表現されるＭＩＤＩ形式の符号データに変
換し、時間軸上で重複する単位区間に対しては異なるチ
ャンネルを割り当てることを特徴とする音響信号の符号
化方法。
【請求項８】請求項１〜７のいずれかに記載の符号化
方法を実行する音響信号の符号化のためのプログラムが
記録されたコンピュータ読み取り可能な記録媒体。
【請求項９】請求項１〜７のいずれかに記載の符号化
方法により符号化された符号データが記録されたコンピ
ュータ読み取り可能な記録媒体。