JPH1173726A

JPH1173726A - 信号処理装置

Info

Publication number: JPH1173726A
Application number: JP9233416A
Authority: JP
Inventors: Yoshihiko Takenaka; 吉彦竹中; Junichi Imamura; 純一今村
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 1997-08-29
Filing date: 1997-08-29
Publication date: 1999-03-16
Anticipated expiration: 2017-08-29
Also published as: DE69828849T2; JP3925993B2; EP0899892A2; US6034315A; DE69828849D1; EP0899892B1; EP0899892A3

Abstract

(57)【要約】【課題】記録する曲の曲調に応じて最適な特性を使用
して圧縮符号化を行うことが可能な音楽信号の信号処理
装置を提供する。【解決手段】入力デジタルオーディオ信号は符号化手
段に入力されてスペクトル信号に変換され、その後圧縮
のための特性に基づいて圧縮符号化される。一方、入力
デジタルオーディオ信号は特性制御手段にも入力され、
その信号により構成される曲の曲調が判断される。特性
制御手段は、判断した曲調に応じて、予め用意された複
数の特性からその曲調に最適な特性を選択する。符号化
手段は、こうして曲調制御手段により選択された特性に
基づいて、その曲調に適合した圧縮符号化を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はミニディスク（Mini
Disc、以下「ＭＤ」という。）に関し、より詳細には
ＭＤへのオーディオ信号の記録時における信号処理に関
する。

【０００２】

【従来の技術】ＭＤにおいては、コンパクトディスク
（Compact Disc、以下「ＣＤ」という。）に比べて情
報を約１／５に圧縮するために、ＡＴＲＡＣ（Adaptive
TRansform Acoustic Coding）と呼ばれるオーディオデ
ータ高能率符号化方式を採用している。ＡＴＲＡＣにお
ける考え方は、人間の聴覚特性を考慮し、人間が感知で
きないような信号の冗長部分を除去して圧縮を行うとい
うものである。言い換えれば、元信号と圧縮後の信号に
差異が生じる（即ち、量子化雑音が生じる）ことを前提
とし、その雑音を人間が感知できないように制御しつつ
圧縮を行うのである。

【０００３】具体的には、ＡＴＲＡＣでは人間の聴覚上
の性質に関連する等ラウドネス特性（最小可聴限曲線）
やマスキング効果などを利用して高能率符号化を行う。
これについて例を挙げて説明する。図７（Ａ）におい
て、曲線１００は最小可聴限曲線を示し、この曲線より
下側のレベルの音は人間の耳には聞こえないとされる。
いま、入力信号に図中の音Ａ及び音Ｂが含まれていると
すると、音Ｂは人間の耳に聞こえるが、音Ａは最小可聴
限曲線の下側に位置するので人間の耳には聞こえない。
従って、ＡＴＲＡＣではこの音Ｂは有効な信号として記
録するが、音Ａは記録を行わない（間引いてしまう）。
或いは、量子化ビット配分を極端に減少させて符号化を
行う。

【０００４】図７（Ｂ）には、最小可聴限曲線１００に
加え、音Ｃによるマスキング特性１１０を示す。音Ｂは
最小可聴限特性１００より上側に位置するが、その近傍
にある音Ｃによりマスクされて人間の耳には聞こえな
い。従って、ＡＴＲＡＣでは音Ｂも冗長部分として取り
除いて圧縮を行う。

【０００５】

【発明が解決しようとする課題】上述のように、ＡＴＲ
ＡＣにおける信号圧縮の手法は、圧縮処理におけるパラ
メータである最小可聴限曲線、マスキング特性などをど
のように設定するかに依存する。この点、従来において
はこれらそれぞれについて、予め決定された一つの特性
のみを使用してＡＴＲＡＣによる符号化を行うのが一般
的であった。

【０００６】しかし、ＡＴＲＡＣにより圧縮符号化を行
う際に使用する最小可聴限曲線やマスキング特性の設定
に依存して、記録される信号、即ち音楽の感じはかなり
異なったものとなる。従って、種々のジャンル、曲調の
音楽を一つの特性のみを使用して記録すると、原音（原
曲）に対して必ずしも最適の圧縮符号化がされるとは限
らず、記録、再生した曲に迫力が感じられない、高域が
耳障りであるなどというように曲に合った記録ができな
いことが生じうる。

【０００７】本発明は、以上の点に鑑みてなされたもの
であり、記録する曲の曲調に応じて最適な特性を使用し
て圧縮符号化を行うことが可能な音楽信号の信号処理装
置を提供することを課題とする。

【０００８】

【課題を解決するための手段】上記の課題を解決するた
め、請求項１記載の発明は、信号処理装置において、入
力デジタルオーディオ信号からスペクトル信号を生成
し、生成されたスペクトル信号を、圧縮のためのパラメ
ータについての特性に基づいて圧縮符号化する符号化手
段と、前記入力デジタルオーディオ信号から、その信号
により構成される曲の曲調を判断し、判断結果に基づい
て、予め用意された複数の前記特性のうちの一つを選択
する特性制御手段と、を備え、前記符号化手段は、前記
特性制御手段により選択された前記特性を使用して符号
化を行うように構成する。

【０００９】上記のように構成された信号処理装置によ
れば、入力デジタルオーディオ信号は符号化手段に入力
されてスペクトル信号に変換され、その後圧縮のための
特性に基づいて圧縮符号化される。一方、入力デジタル
オーディオ信号は特性制御手段にも入力され、その信号
により構成される曲の曲調が判断される。特性制御手段
は、判断した曲調に応じて、あるパラメータについて予
め用意された複数の特性からその曲調に最適な特性を選
択する。符号化手段は、こうして曲調制御手段により選
択された特性に基づいて、その曲調に適合した圧縮符号
化を行う。

【００１０】請求項２記載の発明は、請求項１記載の信
号処理装置において、前記特性制御手段は、継続的に曲
調の判断を行い、リアルタイムで前記特性の選択を行う
ように構成する。

【００１１】上記のように構成された信号処理装置によ
れば、入力信号の符号化中にリアルタイムで曲調が判断
され、特性が選択される。即ち、入力オーディオ信号の
曲調に応じて適宜特性が変更されながら圧縮符号化が行
われるので、一つの曲中などにおいても曲調の変化に追
従して最適な特性を使用して符号化が達成される。

【００１２】請求項３記載の発明は、請求項１又は２に
記載の信号処理装置において、前記特性制御手段は、前
記入力デジタルオーディオ信号を複数の帯域に分割する
帯域分割手段と、帯域分割された各々の帯域の信号のピ
ークレベルを検出する手段と、検出されたピークレベル
に基づいて曲調を判断する判断手段と、を備えるように
構成する。

【００１３】上記のように構成された情報処理装置によ
れば、入力デジタルオーディオ信号は帯域分割手段によ
り複数の帯域に分割され、それぞれの帯域についてピー
クレベルが検出され、検出されたピークレベルに基づい
て曲調が判断される。

【００１４】請求項４記載の発明は、請求項１乃至３の
いずれかに記載の信号処理装置において、前記パラメー
タは最小可聴限特性又はマスキング特性の少なくとも一
方を含むように構成する。

【００１５】上記のように構成された信号処理装置によ
れば、入力オーディオ信号の曲調に応じて選択された最
適な最小可聴限特性、マスキング特性に基づいてエンコ
ーダによる符号化が実行される。

【００１６】

【発明の実施の形態】以下、図面を参照して本発明の好
適な実施の形態について説明する。

【００１７】原理説明まず、本発明の原理について簡単に説明する。前述のよ
うに、ＡＴＲＡＣによる符号化においては、符号化の際
に使用するパラメータ、具体的には、最小可聴限曲線、
マスキング特性、符号化すべき信号を時間的に切り分け
る際の時間幅（後述のサウンドグループ）などを実際に
どう設定するかが重要であり、その設定により記録され
る音楽の感じもかなり異なってくる。この点に鑑み、本
発明では記録されるべき音楽信号の曲調をリアルタイム
で分析、判断し、その結果に応じて、各パラメータ毎に
その音楽信号の符号化に最適な特性を予め用意された複
数の特性から選択して使用するように構成する。これに
より、記録される音楽の種類、曲調に応じた最適な特性
を使用して最適な圧縮符号化が可能となる。

【００１８】ＭＤ記録装置次に、本発明の好適な実施形態について図面を参照して
説明する。図１は、本発明の実施形態に係るＭＤ記録装
置１の信号処理系を示すブロック図である。

【００１９】ＭＤ記録装置１において、ＭＤディスク１
８に記録されるべき入力信号Ｓ1はＡ／Ｄ変換器８に入
力され、サンプリング周波数４４．１ｋＨｚ、１６から
２０ビットで標本化、量子化されてデジタル信号Ｓ2と
して出力される。デジタル信号Ｓ2は、ＡＴＲＡＣエン
コーダ１０及び曲調分析部１２へ送られる。

【００２０】図２に曲調分析部１２の構成を示す。曲調
分析部１２は、ローパスフィルタ２０及び複数のバンド
パスフィルタ２１、２２を有し、Ａ／Ｄ変換器８から入
力されたデジタル信号Ｓ2を帯域分割する。分割する帯
域の好ましい例は、ＡＴＲＡＣエンコーダ１０内で帯域
分割される３帯域（即ち、低域：０〜約５．５kHz、中
域：約５．５〜１１kHz、高域：約１１〜２２kHz）と一
致させることである。これは、ＡＴＲＡＣエンコーダ内
では、この３帯域に信号を帯域分割した後、最小可聴限
曲線などを当てはめて圧縮符号化を行うからである。但
し、３帯域以上のもっと細かい帯域に分割して、より細
かな周波数帯毎に分析を行うことも可能である。また、
各フィルタとしては、ＱＭＦ（Quadrature Mirror Filt
er）を使用することが好ましい。これは、帯域分割によ
り生じるエイリアシング成分を帯域合成時にキャンセル
することができるからである。但し、他のフィルタ構成
を使用することも可能である。

【００２１】こうして帯域分割された信号は、夫々レベ
ル検出回路２３、２４、２５へ入力される。レベル検出
回路２３、２４、２５は、夫々入力された信号の所定時
間幅ごとに信号中のピーク（最大）レベルを検出し、Ｃ
ＰＵ１４へ送る。この際ピークレベルを検出する時間幅
は、好ましくはＡＴＲＡＣエンコーダ１０内で音楽信号
を時間分割する最小単位である１つのサウンドグループ
（符号化ブロックとも呼ぶ、最大１１．６msec）とする
ことが好ましい。その理由は、後段のＡＴＲＡＣエンコ
ーダ１０はこの単位で信号の圧縮符号化を行うため、そ
れと同一の単位で曲調を分析することが適切だからであ
る。但し、各マイコン、ＬＳＩなどの間の通信に時間を
要することから１つのサウンドグループ単位での分析が
不可能な場合には、数個のサウンドグループに相当する
時間幅を単位として曲調の判断を行う。

【００２２】ＣＰＵ１４は、各レベル検出回路２３、２
４、２５からの検出信号を受け取り、その内容に基づい
てＡＴＲＡＣエンコーダ１０内の符号化で使用すべき各
パラメータ（サウンドグループのビット配分及び時間
幅、最小可聴限曲線、マスキング特性）についての特性
を決定し、適当な特性を選択する選択信号ＳｃをＡＴＲ
ＡＣエンコーダ１０へ供給する。

【００２３】ＣＰＵ１４は、各レベル検出回路から送ら
れる各帯域毎のピークレベル信号のある時間範囲におけ
る推移から、例えば、低レベルの高域信号が多い、中域
信号のレベル変化が小さい、などの曲調を判断し、個々
の場合に最適と考えられるサウンドグループのビット配
分及び時間幅、最小可聴限特性及びマスキング特性を決
定する。なお、その決定方法の詳細については更に後述
する。

【００２４】ＡＴＲＡＣエンコーダ１０は、各パラメー
タについて、符号化の際に使用する複数の特性を予め用
意しており、外部からの制御信号Ｓｃによりそれらを選
択できるように構成されている。各パラメータについて
の複数の特性としては、以下のようなものが予め用意さ
れる。まず、サウンドグループの時間幅については、Ａ
ＴＲＡＣ上規定されている最大値である１１．６msecの
他、これより短い複数の時間幅を選択することができ
る。また、サウンドグループのビット配分も任意に決め
ることができる。最小可聴限曲線については全般的にレ
ベルの高い曲線、全般的にレベルの低い曲線、高域側を
多少高め（又は低め）にした曲線などの複数の特性が用
意される。マスキング特性としては、急峻な特性（即
ち、近傍の信号がマスクされにくい）特性や緩やかな特
性（近傍の信号がマスクされやすい）などが用意されて
いる。そして、ＣＰＵ１４から供給される制御信号Ｓｃ
に基づいて、各パラメータについて夫々最適なものを一
つずつ選択して圧縮符号化を行う。従って、入力信号の
曲調に基づいて、符号化時にＡＴＲＡＣエンコーダ１０
内で使用される特性は必要に応じて時々刻々と変更され
ることになる。

【００２５】こうして符号化された信号Ｓ3は記録部１
６に送られ、ＭＤディスク１８に記録される。

【００２６】次に、曲調分析部１２及びＣＰＵ１４によ
り行われる、各パラメータについての特性の決定方法に
ついて説明する。ＡＴＲＡＣエンコーダ１０において変
更可能な特性は、上述のように、サウンドグループのビ
ット配分及び時間幅、最小可聴限曲線及びマスキング特
性である。これらについて順に説明する。

【００２７】（１）サウンドグループのビット配分及び
時間幅ＡＴＲＡＣでは、符号化されるべき入力信号は、まず、
所定の時間幅に切り分けられる。この切り分けられた時
間窓の一単位をサウンドグループ（又は、符号化ブロッ
ク）といい、ＡＴＲＡＣ上では最大１１．６msecと規定
されている。従って、この最大値以下の範囲で複数の時
間幅を使用して符号化を行うことができる。また、各サ
ウンドグループに対する量子化ビット数の配分も任意に
決定することができる。

【００２８】図３は、サウンドグループのビット配分を
変更した例であり、図３（Ａ）はビット配分の少ない場
合、図３（Ｂ）はビット配分の多い場合である。ビット
配分を増加させることにより、量子化雑音の少ない符号
化が可能となる。

【００２９】図４は、サウンドグループの時間幅を変更
した例であり、図４（Ｂ）は図４（Ａ）に比べて時間幅
を小さく設定している。このため、レベル方向のビット
配分量が増加し、原音により近いレベルの符号化（記
録）データが得られている。従って、例えばクラシック
系の音楽において、曲の余韻の部分を重要視する場合な
どには、この時間幅を短く設定することにより余韻部分
を原音に忠実な、歪感の少ない音とすることができる。

【００３０】（２）最小可聴限曲線最小可聴限曲線とは、人間の耳に聞こえる音圧レベルを
周波数に対してプロットした曲線である。即ち、この曲
線よりレベルの低い音は人間の耳には聞こえないとされ
る。ＡＴＲＡＣエンコーダでは、この曲線を複数用意
し、いずれか一つを選択して圧縮符号化を行う。符号化
の際には、基本的にこの曲線よりもレベルの低い音（信
号）を取り除き、又は相当小さい量子化ビット数で符号
化する。なお、最小可聴限曲線又は後述のマスキング特
性によって、符号化されない信号と適当な量子化ビット
数では符号化されない信号の両方を含めて、以下「符号
化されない」と表現することとする。

【００３１】図５（Ａ）及び（Ｂ）にある同一の信号
（即ち、同一のスペクトル）を異なる２つの最小可聴限
曲線を用いて符号化する場合を示す。図３（Ａ）の曲線
はレベルの高い最小可聴限曲線であり、図５（Ｂ）の曲
線はレベルの低い最小可聴限曲線である。図から分かる
ように、図５（Ａ）の曲線を使用すると符号化されない
信号が、図５（Ｂ）の曲線を使用すると符号化されるこ
とになる。ＡＴＲＡＣでは、入力信号を低域、中域、高
域の３帯域に分割した後に圧縮符号化を行うので、いず
れかの帯域の信号に対して使用する最小可聴限曲線を低
く設定すれば、その帯域の信号を多く記録することがで
きる。例えば、通常の音楽では高域信号は中域、低域信
号と比較して信号レベルが低い（低レベルの信号が多く
含まれている）のが一般的である。従って、ロック系の
音楽など、高域信号もある程度重視したいような場合に
は、高域信号の符号化に使用する最小可聴限曲線として
レベルの低いものを選択すれば高域の豊富な記録を行う
ことができる。また、クラシック系の曲などで特に高域
信号が重要でないという場合には、高域の最小可聴限曲
線を高めに設定し、代わりに中域の曲線を低めに設定し
て中域の音の厚みを増すようにすることもできる。

【００３２】ロック系であるとか、クラシック系である
という曲調については、ＣＰＵ１４が曲調分析部１２か
ら受け取るデータにより判断する。例えば、高域におい
て比較的高いピークレベルの信号が周期的に現れるよう
な場合はロック系の曲調であると判断し、中域において
平均して高いレベルの信号が連続的に、急峻な変化なく
現れるような場合はクラシック系の曲調と判断すること
ができる。なお、これらはあくまでも一例であり、種々
の基準に従って曲調を判断することができる。

【００３３】（３）マスキング特性マスキング特性とは、ある音Ｃについて、それと近い周
波数でそれよりレベルの大きい音Ｄが同時に存在する場
合に、音Ｃが音Ｄの存在によって聞こえなくなくことを
いう（図６（Ａ）参照）。図６（Ａ）及び（Ｂ）に同一
のスペクトルについて異なるマスキング特性を適用した
場合を示す。図６（Ａ）のマスキング特性は比較的緩や
かな特性であり、図６（Ｂ）の特性は比較的急峻な特性
である。図示のように、図６（Ａ）の緩やかな特性を使
用すると音Ｃは符号化されないこととなるが、図６
（Ｂ）の急峻な特性を使用すると音Ｃも符号化されるこ
ととなる。従って、例えばロック系の音楽のように比較
的高レベルの信号が頻繁に現れる場合には、図６（Ｂ）
のようにマスキング特性を急峻にして高レベルの信号の
近傍の音がマスクされにくくしたほうが良い場合があ
る。

【００３４】以上説明したように、本発明においては、
ＭＤに記録されるべき信号の曲調を判断し、その結果に
基づいて、ＡＴＲＡＣにおいて使用される複数のパラメ
ータの特性（最小可聴限特性、マスキング特性など）の
うち最適なものを選択、変更するように構成している。
また、この曲調の判断及び特性の選択、変更は、好まし
くは１つのサウンドグループである所定の時間を単位と
して継続的に行う。従って、一つの楽曲中に曲調が変化
する場合でも、その変化に追従するように特性が時々刻
々と変化することになるので、個々の曲の曲調に適合し
た符号化、記録を行うことが可能となる。

【００３５】

【発明の効果】請求項１記載の発明によれば、特性制御
手段は入力オーディオ信号の曲調に基づいて複数の特性
のうち最適なものを選択し、符号化手段は選択された特
性に基づいて入力オーディオ信号の圧縮符号化を行う。
従って、入力信号の曲調に適合した特性を使用して圧縮
符号化を行うことができる。

【００３６】請求項２記載の発明によれば、入力オーデ
ィオ信号の曲調に応じて適宜特性が変更されながら圧縮
符号化が行われるので、一つの曲中などにおいても曲調
の変化に追従して最適な特性を使用して符号化が達成さ
れる。

【００３７】請求項３記載の発明によれば、入力デジタ
ル信号が複数の帯域に分割されて曲調が判断されるので
各帯域の信号成分に基づいて細かな曲調判断が可能とな
る。また、ピークレベルに基づいて曲調判断を行うので
比較的単純な回路により構成することができる。

【００３８】請求項４記載の発明によれば、入力オーデ
ィオ信号の曲調に応じて選択された最適な最小可聴限特
性、マスキング特性に基づいてエンコーダによる最適な
符号化が実行される。

【図面の簡単な説明】

【図１】本発明の実施形態に係るＭＤ記録装置の信号記
録系の構成を示すブロック図である。

【図２】図１に示す曲調分析部の構成を示すブロック図
である

【図３】ビット配分を変化させた場合のＡＴＲＡＣによ
る符号化処理を示す図である。

【図４】サウンドグループのビット配分を変化させた場
合のＡＴＲＡＣによる符号化処理を示す図である。

【図５】サウンドグループの時間幅を変化させた場合の
ＡＴＲＡＣによる符号化処理を示す図である。

【図６】マスキング特性を変化させた場合のＡＴＲＡＣ
による符号化処理を示す図である。

【図７】ＡＴＲＡＣにおける圧縮処理の考え方を説明す
る図である。

【符号の説明】

１…ＭＤ記録装置８…Ａ／Ｄ変換器１０…ＡＴＲＡＣエンコーダ１２…曲調分析部１４…ＣＰＵ１６…記録部１８…ＭＤディスク２０…ローパスフィルタ２１、２２…バンドパスフィルタ２３、２４、２５…レベル検出回路

Claims

【特許請求の範囲】

【請求項１】入力デジタルオーディオ信号からスペク
トル信号を生成し、生成されたスペクトル信号を、圧縮
のために使用されるパラメータについての特性に基づい
て圧縮符号化する符号化手段と、前記入力デジタルオーディオ信号から、その信号により
構成される曲の曲調を判断し、判断結果に基づいて、予
め用意された複数の前記特性のうちの一つを選択する特
性制御手段と、を備え、前記符号化手段は、前記特性制御手段により選択された
前記特性を使用して符号化を行う信号処理装置。
【請求項２】前記特性制御手段は、継続的に曲調の判
断を行い、リアルタイムで前記特性の選択を行う請求項
１記載の信号処理装置。
【請求項３】前記特性制御手段は、前記入力デジタルオーディオ信号を複数の帯域に分割す
る帯域分割手段と、帯域分割された各々の帯域の信号のピークレベルを検出
する手段と、検出されたピークレベルに基づいて曲調を判断する判断
手段と、を備える請求項１又は２に記載の信号処理装
置。
【請求項４】前記パラメータは最小可聴限特性又はマ
スキング特性の少なくとも一方を含む請求項１乃至３の
いずれかに記載の信号処理装置。