JP6790251B2 - マルチチャネルオーディオ信号処理方法、装置、およびシステム - Google Patents
マルチチャネルオーディオ信号処理方法、装置、およびシステム Download PDFInfo
- Publication number
- JP6790251B2 JP6790251B2 JP2019516957A JP2019516957A JP6790251B2 JP 6790251 B2 JP6790251 B2 JP 6790251B2 JP 2019516957 A JP2019516957 A JP 2019516957A JP 2019516957 A JP2019516957 A JP 2019516957A JP 6790251 B2 JP6790251 B2 JP 6790251B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- stereo parameter
- nth frame
- parameter set
- nth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
第Nのフレームのオーディオ信号が音声信号を含むことを検出すると、エンコーダは、第1のステレオパラメータセット生成方式に基づいて、第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、第Nのフレームのステレオパラメータセットを符号化し、あるいは第Nのフレームのオーディオ信号が音声信号を含まないことを検出すると、第Nのフレームのオーディオ信号が事前設定された音声フレーム符号化条件を満たすと判断した場合、エンコーダは、第1のステレオパラメータセット生成方式に基づいて、第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、第Nのフレームのステレオパラメータセットを符号化し、または第Nのフレームのオーディオ信号が事前設定された音声フレーム符号化条件を満たさないと判断した場合、エンコーダは、第2のステレオパラメータセット生成方式に基づいて、第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たすと判断すると、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化し、もしくは第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないとき、エンコーダはステレオパラメータを符号化せず、
第1のステレオパラメータセット生成方式および第2のステレオパラメータセット生成方式は、以下の条件のうちの少なくとも1つを満たす:
ステレオパラメータセットに含まれるステレオパラメータのタイプの数であり、第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに含まれるステレオパラメータのタイプの数であり、第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータセットに含まれるステレオパラメータの数であり、第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに含まれるステレオパラメータの数であり、第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータの時間領域解像度であり、第1のステレオパラメータセット生成方式で規定された時間領域解像度は、ステレオパラメータの時間領域解像度であり、第2のステレオパラメータセット生成方式で規定された時間領域解像度よりも低くない、またはステレオパラメータの周波数領域解像度であり、第1のステレオパラメータセット生成方式で規定された周波数領域解像度は、ステレオパラメータの周波数領域解像度であり、第2のステレオパラメータセット生成方式で規定された周波数領域解像度よりも低くない。
第1の符号化方式で規定された符号化レートは、第2の符号化方式で規定された符号化レートよりも小さくなく、かつ/または第Nのフレームのステレオパラメータセット内の任意のステレオパラメータについて、第1の符号化方式で規定された量子化精度は、第2の符号化方式で規定された量子化精度よりも低くない。
DLはILDが第1の規格から逸脱する程度を表し、第1の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第2のアルゴリズムに基づいて決定され、Tは0より大きい正の整数であり、
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータがチャネル間時間差ITDを含む場合、事前設定されたステレオパラメータ符号化条件はDT≧D1を含み、
DTはITDが第2の規格から逸脱する程度を表し、第2の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第3のアルゴリズムに基づいて決定され、Tは0より大きい正の整数であり、または
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータがチャネル間位相差IPDを含む場合、事前設定されたステレオパラメータ符号化条件はDP≧D2を含み、
DPはIPDが第3の規格から逸脱する程度を表し、第3の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第4のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
ここで、ILD(m)は、第Nのフレームのオーディオ信号が第mのサブ周波数帯域内の2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、Mは、第Nのフレームのオーディオ信号を送信するために占有されるサブ周波数帯域の総数であり、
第Nのフレームのビットストリームが第1のタイプのフレームであると判断した場合、デコーダは、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、または
第Nのフレームのビットストリームが第2のタイプのフレームであるとデコーダが判断した場合、以下の2つのケースが含まれる:
第Nのフレームのビットストリームが第3のタイプのフレームであると判断すると、デコーダは、第Nのフレームのビットストリームを復号して第Nのフレームのステレオパラメータセットを取得し、所定の第1のアルゴリズムに基づいて第Nのフレームのダウンミックス信号を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、もしくは
第Nのフレームのビットストリームが第4のタイプのフレームであるとき、デコーダは、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得し、kは0より大きい正の整数であり、所定の第1のアルゴリズムに基づいて第Nのフレームのダウンミックス信号を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元する。
第Nのフレームのビットストリームが第1のタイプのフレームであるとデコーダが判断した場合、以下の2つのケースが含まれる:
第Nのフレームのビットストリームが第5のタイプのフレームであるとき、デコーダは、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、もしくは
第Nのフレームのビットストリームが第6のタイプのフレームであるとき、デコーダは、第Nのフレームのビットストリームを復号して第Nのフレームのダウンミックス信号を取得し、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、または
第Nのフレームのビットストリームが第2のタイプのフレームである場合、デコーダは所定の第1のアルゴリズムに基づいて第Nのフレームのダウンミックス信号を取得し、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元する。
第Nのフレームのビットストリームが第1のタイプのフレームであるとデコーダが判断した場合、以下の2つのケースが含まれる:
第Nのフレームのビットストリームが第5のタイプのフレームであるとき、第Nのフレームのビットストリームを復号した後に、デコーダは、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、もしくは
第Nのフレームのビットストリームが第6のタイプのフレームであるとき、第Nのフレームのビットストリームを復号した後に、デコーダは、第Nのフレームのダウンミックス信号を取得し、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、または
第Nのフレームのビットストリームが第2のタイプのフレームであるとデコーダが判断した場合、以下の2つのケースが含まれる:
第Nのフレームのビットストリームが第3のタイプのフレームであるとき、デコーダは、第Nのフレームのビットストリームを復号して第Nのフレームのステレオパラメータセットを取得し、所定の第1のアルゴリズムに基づいて第Nのフレームのダウンミックス信号を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元し、もしくは
第Nのフレームのビットストリームが第4のタイプのフレームであるとき、デコーダは、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得し、kは0より大きい正の整数であり、所定の第1のアルゴリズムに基づいて第Nのフレームのダウンミックス信号を取得し、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元する。
第Nのフレームのオーディオ信号が音声信号を含むことを信号検出ユニットが検出すると、または第Nのフレームのオーディオ信号が音声信号を含まず、第Nのフレームのオーディオ信号が事前設定された音声フレーム符号化条件を満たすことを信号検出ユニットが検出すると、信号検出ユニットは、第Nのフレームのステレオパラメータセットを生成するように第1のパラメータ生成ユニットに指示し、具体的には、第1のパラメータ生成ユニットは、第1のステレオパラメータセット生成方式に基づいて、第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、具体的には、パラメータ符号化ユニットが第1のパラメータ符号化ユニットおよび第2のパラメータ符号化ユニットを含むとき、第1のパラメータ符号化ユニットは第Nのフレームのステレオパラメータセットを符号化し、第1のパラメータ符号化ユニットによって規定された符号化方式は第1の符号化方式であり、第2のパラメータ符号化ユニットによって規定された符号化方式は第2の符号化方式であり、具体的には、第1の符号化方式で規定された符号化レートは、第2の符号化方式で規定された符号化レートよりも小さくなく、かつ/または第Nのフレームのステレオパラメータセット内の任意のステレオパラメータについて、第1の符号化方で規定された量子化精度は、第2の符号化方式で規定された量子化精度よりも低くなく、
第Nのフレームのオーディオ信号が音声信号を含まないことを信号検出ユニットが検出すると、第2のパラメータ生成ユニットは、第2のステレオパラメータセット生成方式に基づいて、第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たすとパラメータ検出ユニットが判断すると、パラメータ符号化ユニットは、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化し、具体的には、パラメータ符号化ユニットが第1のパラメータ符号化ユニットおよび第2のパラメータ符号化ユニットを含むとき、第2のパラメータ符号化ユニットは第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化し、または
第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないとパラメータ検出ユニットが判断すると、パラメータ符号化ユニットはステレオパラメータセットの符号化をスキップし、
第1のステレオパラメータセット生成方式および第2のステレオパラメータセット生成方式は、以下の条件のうちの少なくとも1つを満たす:
ステレオパラメータセットに含まれるステレオパラメータのタイプの数であり、第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに含まれるステレオパラメータのタイプの数であり、第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータセットに含まれるステレオパラメータの数であり、第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに含まれるステレオパラメータの数であり、第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータの時間領域解像度であり、第1のステレオパラメータセット生成方式で規定された時間領域解像度は、ステレオパラメータの時間領域解像度であり、第2のステレオパラメータセット生成方式で規定された時間領域解像度よりも低くない、またはステレオパラメータの周波数領域解像度であり、第1のステレオパラメータセット生成方式で規定された周波数領域解像度は、ステレオパラメータの周波数領域解像度であり、第2のステレオパラメータセット生成方式で規定された周波数領域解像度よりも低くない。
第1の符号化方式で規定された符号化レートは、第2の符号化方式で規定された符号化レートよりも小さくなく、かつ/または第Nのフレームのステレオパラメータセット内の任意のステレオパラメータについて、第1の符号化方式で規定された量子化精度は、第2の符号化方式で規定された量子化精度よりも低くない。
DLはILDが第1の規格から逸脱する程度を表し、第1の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第2のアルゴリズムに基づいて決定され、Tは0より大きい正の整数であり、
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータがチャネル間時間差ITDを含む場合、事前設定されたステレオパラメータ符号化条件はDT≧D1を含み、
DTはITDが第2の規格から逸脱する程度を表し、第2の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第3のアルゴリズムに基づいて決定され、Tは0より大きい正の整数であり、または
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータがチャネル間位相差IPDを含む場合、事前設定されたステレオパラメータ符号化条件はDP≧D2を含み、
DPはIPDが第3の規格から逸脱する程度を表し、第3の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第4のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
ここで、ILD(m)は、第Nのフレームのオーディオ信号が第mのサブ周波数帯域内の2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、Mは、第Nのフレームのオーディオ信号を送信するために占有されるサブ周波数帯域の総数であり、
復号ユニットは、第Nのフレームのビットストリームが第1のタイプのフレームであると判断された場合、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、または第Nのフレームのビットストリームが第2のタイプのフレームであると判断された場合、第Nのフレームのビットストリームを復号して第Nのフレームのステレオパラメータセットを取得するようにさらに構成され、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータは、所定の第3のアルゴリズムに基づいて、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するためにデコーダによって使用され、
信号復元ユニットは、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するように構成される。
復号ユニットは、第Nのフレームのビットストリームが第1のタイプのフレームであると判断された場合、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、または第Nのフレームのビットストリームが第2のタイプのフレームであると判断された場合、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得するようにさらに構成され、kは0より大きい正の整数であり、
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータは、所定の第3のアルゴリズムに基づいて第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するためにデコーダによって使用され、
信号復元ユニットは、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するように構成される。
復号ユニットは、第Nのフレームのビットストリームが第1のタイプのフレームであると判断された場合、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、または第Nのフレームのビットストリームが第2のタイプのフレームであると判断された場合、第Nのフレームのビットストリームが第3のタイプのフレームであるとき、第Nのフレームのビットストリームを復号して第Nのフレームのステレオパラメータセットを取得し、もしくは第Nのフレームのビットストリームが第4のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得するようにさらに構成され、kは0より大きい正の整数であり、
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータは、所定の第3のアルゴリズムに基づいて、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するためにデコーダによって使用され、
信号復元ユニットは、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するように構成される。
復号ユニットは、第Nのフレームのビットストリームが第1のタイプのフレームであると判断された場合、第Nのフレームのビットストリームが第5のタイプのフレームであるとき、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、もしくは第Nのフレームのビットストリームが第6のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得し、または第Nのフレームのビットストリームが第2のタイプのフレームであると判断された場合、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得するようにさらに構成され、
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータは、所定の第3のアルゴリズムに基づいて、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するためにデコーダによって使用され、kは0より大きい正の整数であり、
信号復元ユニットは、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するように構成される。
復号ユニットは、第Nのフレームのビットストリームが第1のタイプのフレームであると判断された場合、第Nのフレームのビットストリームが第5のタイプのフレームであるとき、第Nのフレームのビットストリームを復号して、第Nのフレームのダウンミックス信号と第Nのフレームのステレオパラメータセットの両方を取得し、もしくは第Nのフレームのビットストリームが第6のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得するようにさらに構成され、または
復号ユニットは、第Nのフレームのビットストリームが第2のタイプのフレームであると判断された場合、第Nのフレームのビットストリームが第3のタイプのフレームであるとき、第Nのフレームのビットストリームを復号して第Nのフレームのステレオパラメータセットを取得し、もしくは第Nのフレームのビットストリームが第4のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、kフレームのステレオパラメータセットに従って第Nのフレームのステレオパラメータセットを取得するようにさらに構成され、
第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータは、所定の第3のアルゴリズムに基づいて、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するためにデコーダによって使用され、kは0より大きい正の整数であり、
デコーダは信号復元ユニットをさらに含み、
信号復元ユニットは、第3のアルゴリズムに基づいて、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータに従って、第Nのフレームのダウンミックス信号を第Nのフレームのオーディオ信号に復元するように構成される。
DTはITDが第2の規格から逸脱する程度を表し、第2の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第4のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
DPはIPDが第3の規格から逸脱する程度を表し、第3の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第5のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
ここで、ILD(m)は、第Nのフレームのオーディオ信号が第mのサブ周波数帯域内の2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、Mは、第Nのフレームのオーディオ信号を送信するために占有されるサブ周波数帯域の総数であり、
第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさすと判断すると、第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化し、または第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないと判断すると、ステレオパラメータセットの符号化をスキップする。
DLはILDが第1の規格から逸脱する程度を表し、第1の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第2のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
DTはITDが第2の規格から逸脱する程度を表し、第2の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第3のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
DPはIPDが第3の規格から逸脱する程度を表し、第3の規格は、第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第4のアルゴリズムに基づいて決定され、Tは0より大きい正の整数である。
ここで、ILD(m)は、第Nのフレームのオーディオ信号が第mのサブ周波数帯域内の2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、Mは、第Nのフレームのオーディオ信号を送信するために占有されるサブ周波数帯域の総数であり、
310 信号符号化ユニット
311 第1の信号符号化ユニット
312 第2の信号符号化ユニット
320 パラメータ生成ユニット
321 第1のパラメータ生成ユニット
322 第2のパラメータ生成ユニット
330 パラメータ符号化ユニット
331 第1のパラメータ符号化ユニット
332 第2のパラメータ符号化ユニット
340 パラメータ検出ユニット
400 受信ユニット
410 復号ユニット
420 信号復元ユニット
500 エンコーダ
510 デコーダ
Claims (25)
- マルチチャネルオーディオ信号処理方法であって、
エンコーダにより、第Nのフレームのダウンミックス信号が音声信号を備えるかどうかを検出するステップであって、前記第Nのフレームのダウンミックス信号が、所定の第1のアルゴリズムに基づいて複数のチャネルのうちの2つのチャネル上の第Nのフレームのオーディオ信号がミキシングされた後に取得され、Nが0より大きい正の整数である、ステップと、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを検出すると、前記第Nのフレームのダウンミックス信号を符号化するステップ、または
前記第Nのフレームのダウンミックス信号が前記音声信号を備えないことを前記エンコーダが検出すると、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たすと判断した場合、前記第Nのフレームのダウンミックス信号を符号化するステップ、もしくは前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たさないと判断した場合、前記第Nのフレームのダウンミックス信号の符号化をスキップするステップと
を備え、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを検出すると、前記第Nのフレームのダウンミックス信号を符号化する前記ステップが、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを検出すると、事前設定された音声フレーム符号化レートに従って前記第Nのフレームのダウンミックス信号を符号化するステップを備え、または
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たすと判断した場合、前記第Nのフレームのダウンミックス信号を符号化する前記ステップが、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たすと判断した場合、事前設定された音声フレーム符号化レートに従って前記第Nのフレームのダウンミックス信号を符号化するステップ、もしくは
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記事前設定された音声フレーム符号化条件を満たさないが、事前設定された無音挿入記述子(SID)符号化条件を満たすと判断した場合、事前設定されたSIDフレーム符号化レートに従って前記第Nのフレームのダウンミックス信号を符号化するステップであって、前記SID符号化レートが前記音声フレーム符号化レートよりも大きくない、ステップ
を備え、
前記第Nのフレームのオーディオ信号が前記音声信号を備えることを前記エンコーダが検出すると、
前記エンコーダにより、第1のステレオパラメータセット生成方式に基づいて、前記第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、前記第Nのフレームのステレオパラメータセットを符号化するステップ、あるいは
前記第Nのフレームのオーディオ信号が前記音声信号を備えないことを前記エンコーダが検出すると、
前記第Nのフレームのオーディオ信号が前記事前設定された音声フレーム符号化条件を満たすと判断した場合、前記エンコーダにより、第1のステレオパラメータセット生成方式に基づいて、前記第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得し、前記第Nのフレームのステレオパラメータセットを符号化するステップ、または
前記第Nのフレームのオーディオ信号が前記事前設定された音声フレーム符号化条件を満たさないと判断した場合、前記エンコーダにより、第2のステレオパラメータセット生成方式に基づいて、前記第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得するステップと、
前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たすと判断すると、前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化するステップ、もしくは前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないと判断すると、前記ステレオパラメータセットの符号化をスキップするステップと
をさらに備え、
前記第1のステレオパラメータセット生成方式および前記第2のステレオパラメータセット生成方式が、以下の条件のうちの少なくとも1つを満たす:
ステレオパラメータセットに備えられたステレオパラメータのタイプの数であり、前記第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに備えられたステレオパラメータのタイプの数であり、前記第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータセットに備えられたステレオパラメータの数であり、前記第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに備えられたステレオパラメータの数であり、前記第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータの時間領域解像度であり、前記第1のステレオパラメータセット生成方式で規定された時間領域解像度は、対応するステレオパラメータの時間領域解像度であり、前記第2のステレオパラメータセット生成方式で規定された時間領域解像度よりも低くない、またはステレオパラメータの周波数領域解像度であり、前記第1のステレオパラメータセット生成方式で規定された周波数領域解像度は、対応するステレオパラメータの周波数領域解像度であり、前記第2のステレオパラメータセット生成方式で規定された周波数領域解像度よりも低くない、
マルチチャネルオーディオ信号処理方法。 - 前記方法が、
前記エンコーダにより、前記第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得するステップであって、前記第NのフレームのステレオパラメータセットがZ個のステレオパラメータを備え、前記Z個のステレオパラメータが、前記エンコーダが前記所定の第1のアルゴリズムに基づいて前記第Nのフレームのオーディオ信号をミキシングするときに使用されるパラメータを備え、Zが0より大きい正の整数である、ステップと、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを検出すると、前記第Nのフレームのステレオパラメータセットを符号化するステップ、または
前記第Nのフレームのダウンミックス信号が前記音声信号を備えないことを前記エンコーダが検出すると、前記エンコーダにより、前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たすと判断した場合、前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化するステップ、もしくは前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないと判断した場合、前記ステレオパラメータセットの符号化をスキップするステップと
をさらに備える、請求項1に記載の方法。 - 前記エンコーダにより、前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化する前記ステップが、
前記エンコーダにより、事前設定されたステレオパラメータ次元縮小規則に基づいて、前記第Nのフレームのステレオパラメータセット内の前記Z個のステレオパラメータに従ってX個のターゲットステレオパラメータを取得するステップであって、Xが0より大きくZ以下の正の整数である、ステップと、
前記エンコーダにより、前記X個のターゲットステレオパラメータを符号化するステップと
を備える、請求項2に記載の方法。 - 前記エンコーダにより、前記第Nのフレームのステレオパラメータセットを符号化する前記ステップが、
前記エンコーダにより、第1の符号化方式に従って前記第Nのフレームのステレオパラメータセットを符号化するステップ
を備え、
前記エンコーダにより、前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化する前記ステップが、
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記音声フレーム符号化条件を満たすとき、前記第1の符号化方式に従って前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータを符号化するステップ、または
前記エンコーダにより、前記第Nのフレームのダウンミックス信号が前記音声フレーム符号化条件を満たさないとき、第2の符号化方式に従って前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータを符号化するステップ
を備え、
前記第1の符号化方式で規定された符号化レートが、前記第2の符号化方式で規定された符号化レートよりも小さくなく、かつ/または前記第Nのフレームのステレオパラメータセット内の任意のステレオパラメータについて、前記第1の符号化方式で規定された量子化精度が、前記第2の符号化方式で規定された量子化精度よりも低くない、
請求項1から3のいずれか一項に記載の方法。 - 前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータがチャネル間レベル差ILDを備える場合、前記事前設定されたステレオパラメータ符号化条件がDL≧D0を備え、
DLが、前記ILDが第1の規格から逸脱する程度を表し、前記第1の規格が、前記第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第2のアルゴリズムに基づいて決定され、Tが0より大きい正の整数であり、
前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータがチャネル間時間差ITDを備える場合、前記事前設定されたステレオパラメータ符号化条件がDT≧D1を備え、
DTが、前記ITDが第2の規格から逸脱する程度を表し、前記第2の規格が、前記第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第3のアルゴリズムに基づいて決定され、Tが0より大きい正の整数であり、
または
前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータがチャネル間位相差IPDを備える場合、前記事前設定されたステレオパラメータ符号化条件がDP≧D2を備え、
DPが、前記IPDが第3の規格から逸脱する程度を表し、前記第3の規格が、前記第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第4のアルゴリズムに基づいて決定され、Tが0より大きい正の整数である、
請求項1から4のいずれか一項に記載の方法。 - DL、DT、およびDPが、それぞれ、以下の式:
および
を満たし、
ILD(m)が、前記第Nのフレームのオーディオ信号が第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、Mが、前記第Nのフレームのオーディオ信号を送信するために占有されるサブ周波数帯域の総数であり、
が、前記第mのサブ周波数帯域内で前記第Nのフレームのステレオパラメータセットに先行する前記Tフレームのステレオパラメータセット内のILDの平均値であり、Tが0より大きい正の整数であり、ILD[−t](m)が、前記第Nのフレームのオーディオ信号に先行する第tのフレームのオーディオ信号が、前記第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、前記ITDが、前記第Nのフレームのオーディオ信号が前記2つのチャネル上でそれぞれ送信されるときに生じる時間差であり、
が、前記第Nのフレームのステレオパラメータセットに先行する前記Tフレームのステレオパラメータセット内のITDの平均値であり、ITD[−t]が、前記第Nのフレームのオーディオ信号に先行する前記第tのフレームのオーディオ信号が前記2つのチャネル上でそれぞれ送信されるときに生じる時間差であり、IPD(m)が、前記第Nのフレームのオーディオ信号の一部が前記第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じる位相差であり、
が、前記第mのサブ周波数帯域内の前記第Nのフレームのステレオパラメータセットに先行する前記Tフレームのステレオパラメータセット内のIPDの平均値であり、IPD[−t](m)が、前記第Nのフレームのオーディオ信号に先行する前記第tのフレームのオーディオ信号が、前記第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じる位相差である、請求項5に記載の方法。 - マルチチャネルオーディオ信号処理方法であって、
デコーダにより、ビットストリームを受信するステップであって、前記ビットストリームが第Nのフレームのステレオパラメータセットおよび少なくとも2つのフレームを備え、前記少なくとも2つのフレームが、少なくとも1つの第1のタイプのフレームおよび少なくとも1つの第2のタイプのフレームを備え、前記第1のタイプのフレームがダウンミックス信号を備え、前記第2のタイプのフレームがダウンミックス信号を備えない、ステップと、
Nが1より大きい正の整数である第Nのフレームのビットストリームについて、
デコーダにより、前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断した場合、第Nのフレームのダウンミックス信号を取得するために、前記第Nのフレームのビットストリームを復号するステップ、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断した場合、前記デコーダにより、事前設定された第1の規則に従って、第Nのフレームのダウンミックス信号に先行する少なくとも1フレームのダウンミックス信号内のmフレームのダウンミックス信号を特定し、所定の第1のアルゴリズムに基づいて、前記mフレームのダウンミックス信号に従って前記第Nのフレームのダウンミックス信号を取得するステップであって、mが0より大きい正の整数である、ステップと
を備え、
前記第Nのフレームのダウンミックス信号が、所定の第2のアルゴリズムに基づいて、複数のチャネルのうちの2つのチャネル上で第Nのフレームのオーディオ信号をミキシングすることにより、エンコーダによって取得される、マルチチャネルオーディオ信号処理方法。 - 前記第1のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、前記第2のタイプのフレームがステレオパラメータセットを備えるが、ダウンミックス信号を備えず、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断した場合、前記第Nのフレームのビットストリームを復号する前記ステップの後に、前記方法が、
前記デコーダにより、第Nのフレームのステレオパラメータセットを取得するステップ
をさらに備え、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号するステップであって、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用される、
ステップと、
前記デコーダにより、前記所定の第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するステップと
をさらに備える、請求項7に記載の方法。 - 前記第1のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、前記第2のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断した場合、前記第Nのフレームのビットストリームを復号する前記ステップの後に、前記方法が、
前記デコーダにより、第Nのフレームのステレオパラメータセットを取得するステップ
をさらに備え、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得するステップであって、kが0より大きい正の整数であり、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用される、
ステップと、
前記デコーダにより、前記所定の第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するステップと
をさらに備える、請求項7に記載の方法。 - 前記第1のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、第3のタイプのフレームがステレオパラメータセットを備えるが、ダウンミックス信号を備えず、第4のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、前記第3のタイプのフレームおよび前記第4のタイプのフレームの各々が、前記第2のタイプのフレームの1つのケースであり、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断した場合、前記第Nのフレームのビットストリームを復号する前記ステップの後に、前記方法が、
前記デコーダにより、第Nのフレームのステレオパラメータセットを取得するステップ
をさらに備え、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第3のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号するステップ、もしくは
前記第Nのフレームのビットストリームが前記第4のタイプのフレームであるとき、前記デコーダにより、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得するステップであって、kが0より大きい正の整数であり、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用される、
ステップと、
前記デコーダにより、前記所定の第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するステップと
をさらに備える、請求項7に記載の方法。 - 第5のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、第6のタイプのフレームがダウンミックス信号を備えるが、ステレオパラメータセットを備えず、前記第5のタイプのフレームおよび前記第6のタイプのフレームの各々が、前記第1のタイプのフレームの1つのケースであり、前記第2のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第5のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号するステップ、もしくは
前記第Nのフレームのビットストリームが前記第6のタイプのフレームであるとき、前記デコーダにより、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得するステップ
を備え、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得するステップであって、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、kが0より大きい正の整数である、
ステップと、
前記デコーダにより、前記第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するステップと
をさらに備える、請求項7に記載の方法。 - 第5のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、第6のタイプのフレームがダウンミックス信号を備えるが、ステレオパラメータセットを備えず、前記第5のタイプのフレームおよび前記第6のタイプのフレームの各々が、前記第1のタイプのフレームの1つのケースであり、第3のタイプのフレームがステレオパラメータセットを備えるが、ダウンミックス信号を備えず、第4のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、前記第3のタイプのフレームおよび前記第4のタイプのフレームの各々が、前記第2のタイプのフレームの1つのケースであり、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第5のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号するステップ、もしくは
前記第Nのフレームのビットストリームが前記第6のタイプのフレームであるとき、前記デコーダにより、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得するステップ
を備え、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると前記デコーダが判断した後に、前記方法が、
前記デコーダにより、前記第Nのフレームのビットストリームが前記第3のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号するステップ、もしくは
前記第Nのフレームのビットストリームが前記第4のタイプのフレームであるとき、前記デコーダにより、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得するステップであって、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、kが0より大きい正の整数である、
ステップと、
前記デコーダにより、前記所定の第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するステップと
をさらに備える、請求項7に記載の方法。 - 第Nのフレームのダウンミックス信号が音声信号を備えるかどうかを検出するように構成された信号検出ユニットであって、前記第Nのフレームのダウンミックス信号が、所定の第1のアルゴリズムに基づいて複数のチャネルのうちの2つのチャネル上の第Nのフレームのオーディオ信号がミキシングされた後に取得され、Nが0より大きい正の整数である、信号検出ユニットと、
前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを前記信号検出ユニットが検出すると、前記第Nのフレームのダウンミックス信号を符号化するように構成された信号符号化ユニットと
を備えたエンコーダであって、
前記信号符号化ユニットが、前記第Nのフレームのダウンミックス信号が前記音声信号を備えないことを前記信号検出ユニットが検出すると、
前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たすと前記信号検出ユニットが判断した場合、前記第Nのフレームのダウンミックス信号を符号化すること、もしくは前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たさないと前記信号検出ユニットが判断した場合、前記第Nのフレームのダウンミックス信号の符号化をスキップすること
を行うように構成され、
前記信号符号化ユニットが、第1の信号符号化ユニットおよび第2の信号符号化ユニットを備え、前記第1の信号符号化ユニットが、具体的に、
前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを前記信号検出ユニットが検出すると、事前設定された音声フレーム符号化レートに従って前記第Nのフレームのダウンミックス信号を符号化すること、または
前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たすと前記信号検出ユニットが判断した場合、事前設定された音声フレーム符号化レートに従って前記第Nのフレームのダウンミックス信号を符号化すること
を行うように構成され、
前記第2の信号符号化ユニットが、具体的に、
前記第Nのフレームのダウンミックス信号が事前設定された音声フレーム符号化条件を満たさないが、事前設定された無音挿入記述子(SID)符号化条件を満たすと前記信号検出ユニットが判断した場合、事前設定されたSIDフレーム符号化レートに従って前記第Nのフレームのダウンミックス信号を符号化することであって、前記SID符号化レートが前記音声フレーム符号化レートよりも大きくない、符号化すること
を行うように構成され、
パラメータ生成ユニットが、第1のパラメータ生成ユニットおよび第2のパラメータ生成ユニットを備え、
前記第1のパラメータ生成ユニットが、前記第Nのフレームのオーディオ信号が前記音声信号を備えることを前記信号検出ユニットが検出する場合、又は前記第Nのフレームのオーディオ信号が前記音声信号を備えないことを前記信号検出ユニットが検出し、前記第Nのフレームのオーディオ信号が前記事前設定された音声フレーム符号化条件を満たすと前記信号検出ユニットが判断する場合、第1のステレオパラメータセット生成方式に基づいて、前記第Nのフレームのオーディオ信号に従って前記第Nのフレームのステレオパラメータセットを取得するように構成され、パラメータ符号化ユニットが前記第Nのフレームのステレオパラメータセットを符号化し、
前記第2のパラメータ生成ユニットが、前記第Nのフレームのオーディオ信号が前記音声信号を備えないことを前記信号検出ユニットが検出し、前記第Nのフレームのオーディオ信号が前記事前設定された音声フレーム符号化条件を満たさないと前記信号検出ユニットが判断すると、
第2のステレオパラメータセット生成方式に基づいて、前記第Nのフレームのオーディオ信号に従って前記第Nのフレームのステレオパラメータセットを取得するように構成され、
前記パラメータ符号化ユニットは、前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たすと前記パラメータ検出ユニットが判断すると、前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化すること、または前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないと前記パラメータ検出ユニットが判断すると、前記ステレオパラメータセットの符号化をスキップするように構成され、
前記第1のステレオパラメータセット生成方式および前記第2のステレオパラメータセット生成方式が、以下の条件のうちの少なくとも1つを満たす:
ステレオパラメータセットに備えられたステレオパラメータのタイプの数であり、前記第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに備えられたステレオパラメータのタイプの数であり、前記第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータセットに備えられたステレオパラメータの数であり、前記第1のステレオパラメータセット生成方式で規定された数は、ステレオパラメータセットに備えられたステレオパラメータの数であり、前記第2のステレオパラメータセット生成方式で規定された数よりも少なくない、ステレオパラメータの時間領域解像度であり、前記第1のステレオパラメータセット生成方式で規定された時間領域解像度は、対応するステレオパラメータの時間領域解像度であり、前記第2のステレオパラメータセット生成方式で規定された時間領域解像度よりも低くない、またはステレオパラメータの周波数領域解像度であり、前記第1のステレオパラメータセット生成方式で規定された周波数領域解像度は、対応するステレオパラメータの周波数領域解像度であり、前記第2のステレオパラメータセット生成方式で規定された周波数領域解像度よりも低くない、
エンコーダ。 - パラメータ生成ユニット、パラメータ符号化ユニット、およびパラメータ検出ユニットをさらに備え、
前記パラメータ生成ユニットが、前記第Nのフレームのオーディオ信号に従って第Nのフレームのステレオパラメータセットを取得するように構成され、前記第NのフレームのステレオパラメータセットがZ個のステレオパラメータを備え、前記Z個のステレオパラメータが、前記エンコーダが前記所定の第1のアルゴリズムに基づいて前記第Nのフレームのオーディオ信号をミキシングするときに使用されるパラメータを備え、Zが0より大きい正の整数であり、
前記パラメータ符号化ユニットが、前記第Nのフレームのダウンミックス信号が前記音声信号を備えることを前記信号検出ユニットが検出すると、前記第Nのフレームのステレオパラメータセットを符号化するように構成され、または
前記パラメータ符号化ユニットが、前記第Nのフレームのダウンミックス信号が前記音声信号を備えないことを前記信号検出ユニットが検出すると、
前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たすと前記パラメータ検出ユニットが判断した場合、前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータを符号化すること、もしくは前記第Nのフレームのステレオパラメータセットが事前設定されたステレオパラメータ符号化条件を満たさないと前記パラメータ検出ユニットが判断した場合、前記ステレオパラメータセットの符号化をスキップすること
を行うように構成される、
請求項13に記載のエンコーダ。 - 前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータを符号化するとき、前記パラメータ符号化ユニットが、具体的に、
事前設定されたステレオパラメータ次元縮小規則に基づいて、前記第Nのフレームのステレオパラメータセット内の前記Z個のステレオパラメータに従ってX個のターゲットステレオパラメータを取得し、前記X個のターゲットステレオパラメータを符号化することであって、Xが0より大きくZ以下の正の整数である、符号化すること
を行うように構成される、
請求項14に記載のエンコーダ。 - 前記パラメータ符号化ユニットが、第1のパラメータ符号化ユニットおよび第2のパラメータ符号化ユニットを備え、
前記第1のパラメータ符号化ユニットが、前記第Nのフレームのダウンミックス信号が前記音声信号を備え、前記第Nのフレームのダウンミックス信号が前記音声フレーム符号化条件を満たすことを前記信号検出ユニットが検出すると、第1の符号化方式に従って前記第Nのフレームのステレオパラメータセットを符号化するように構成され、
前記第2のパラメータ符号化ユニットが、具体的に、前記第Nのフレームのダウンミックス信号が前記音声フレーム符号化条件を満たさないとき、第2の符号化方式に従って前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータを符号化するように構成され、
前記第1の符号化方式で規定された符号化レートが、前記第2の符号化方式で規定された符号化レートよりも小さくなく、かつ/または前記第Nのフレームのステレオパラメータセット内の任意のステレオパラメータについて、前記第1の符号化方式で規定された量子化精度が、第2の符号化方式で規定された量子化精度よりも低くない、
請求項13から15のいずれか一項に記載のエンコーダ。 - 前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータがチャネル間レベル差ILDを備える場合、前記事前設定されたステレオパラメータ符号化条件がDL≧D0を備え、
DLが、前記ILDが第1の規格から逸脱する程度を表し、前記第1の規格が、前記第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第2のアルゴリズムに基づいて決定され、Tが0より大きい正の整数であり、
前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータがチャネル間時間差ITDを備える場合、前記事前設定されたステレオパラメータ符号化条件がDT≧D1を備え、
DTが、前記ITDが第2の規格から逸脱する程度を表し、前記第2の規格が、前記第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第3のアルゴリズムに基づいて決定され、Tが0より大きい正の整数であり、
または
前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータがチャネル間位相差IPDを備える場合、前記事前設定されたステレオパラメータ符号化条件がDP≧D2を備え、
DPが、前記IPDが第3の規格から逸脱する程度を表し、前記第3の規格が、前記第Nのフレームのステレオパラメータセットに先行するTフレームのステレオパラメータセットに従って、所定の第4のアルゴリズムに基づいて決定され、Tが0より大きい正の整数である、
請求項13から16のいずれか一項に記載のエンコーダ。 - DL、DT、およびDPが、それぞれ、以下の式:
および
を満たし、
ILD(m)が、前記第Nのフレームのオーディオ信号が第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、Mが、前記第Nのフレームのオーディオ信号を送信するために占有されるサブ周波数帯域の総数であり、
が、前記第mのサブ周波数帯域内で前記第Nのフレームのステレオパラメータセットに先行する前記Tフレームのステレオパラメータセット内のILDの平均値であり、Tが0より大きい正の整数であり、ILD[−t](m)が、前記第Nのフレームのオーディオ信号に先行する第tのフレームのオーディオ信号が、前記第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じるレベル差であり、前記ITDが、前記第Nのフレームのオーディオ信号が前記2つのチャネル上でそれぞれ送信されるときに生じる時間差であり、
が、前記第Nのフレームのステレオパラメータセットに先行する前記Tフレームのステレオパラメータセット内のITDの平均値であり、ITD[−t]が、前記第Nのフレームのオーディオ信号に先行する前記第tのフレームのオーディオ信号が前記2つのチャネル上でそれぞれ送信されるときに生じる時間差であり、IPD(m)が、前記第Nのフレームのオーディオ信号の一部が前記第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じる位相差であり、
が、前記第mのサブ周波数帯域内の前記第Nのフレームのステレオパラメータセットに先行する前記Tフレームのステレオパラメータセット内のIPDの平均値であり、IPD[−t](m)が、前記第Nのフレームのオーディオ信号に先行する前記第tのフレームのオーディオ信号が、前記第mのサブ周波数帯域内の前記2つのチャネル上でそれぞれ送信されるときに生じる位相差である、請求項17に記載のエンコーダ。 - ビットストリームを受信するように構成された受信ユニットであって、前記ビットストリームが第Nのフレームのステレオパラメータセットおよび少なくとも2つのフレームを備え、前記少なくとも2つのフレームが、少なくとも1つの第1のタイプのフレームおよび少なくとも1つの第2のタイプのフレームを備え、前記第1のタイプのフレームがダウンミックス信号を備え、前記第2のタイプのフレームがダウンミックス信号を備えない、受信ユニットと、
Nが1より大きい正の整数である第Nのフレームのビットストリームについて、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断した場合、第Nのフレームのダウンミックス信号を取得するために、前記第Nのフレームのビットストリームを復号すること、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断した場合、事前設定された第1の規則に従って、第Nのフレームのダウンミックス信号に先行する少なくとも1フレームのダウンミックス信号内のmフレームのダウンミックス信号を特定し、所定の第1のアルゴリズムに基づいて、前記mフレームのダウンミックス信号に従って前記第Nのフレームのダウンミックス信号を取得することであって、mが0より大きい正の整数である、取得すること
を行うように構成された復号ユニットと
を備え、
前記第Nのフレームのダウンミックス信号が、所定の第2のアルゴリズムに基づいて、複数のチャネルのうちの2つのチャネル上で第Nのフレームのオーディオ信号をミキシングすることにより、エンコーダによって取得される、デコーダ。 - 前記第1のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、前記第2のタイプのフレームがステレオパラメータセットを備えるが、ダウンミックス信号を備えず、
前記復号ユニットが、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断された場合、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断された場合、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること
を行うようにさらに構成され、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、
前記デコーダが、信号復元ユニットをさらに備え、
前記信号復元ユニットが、前記所定の第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するように構成される、
請求項19に記載のデコーダ。 - 前記第1のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、前記第2のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、
前記復号ユニットが、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断された場合、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断された場合、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得することであって、kが0より大きい正の整数である、取得すること
を行うようにさらに構成され、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、
前記デコーダが、信号復元ユニットをさらに備え、
前記信号復元ユニットが、前記第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するように構成される、
請求項19に記載のデコーダ。 - 前記第1のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、第3のタイプのフレームがステレオパラメータセットを備えるが、ダウンミックス信号を備えず、第4のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、前記第3のタイプのフレームおよび前記第4のタイプのフレームの各々が、前記第2のタイプのフレームの1つのケースであり、
前記復号ユニットが、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断された場合、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断された場合、前記第Nのフレームのビットストリームが前記第3のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、もしくは前記第Nのフレームのビットストリームが前記第4のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得することであって、kが0より大きい正の整数である、取得すること
を行うようにさらに構成され、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、
前記デコーダが、信号復元ユニットをさらに備え、
前記信号復元ユニットが、前記第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するように構成される、
請求項19に記載のデコーダ。 - 第5のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、第6のタイプのフレームがダウンミックス信号を備えるが、ステレオパラメータセットを備えず、前記第5のタイプのフレームおよび前記第6のタイプのフレームの各々が、前記第1のタイプのフレームの1つのケースであり、前記第2のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、
前記復号ユニットが、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断された場合、前記第Nのフレームのビットストリームが前記第5のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、もしくは前記第Nのフレームのビットストリームが前記第6のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得すること、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断された場合、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得すること
を行うようにさらに構成され、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、kが0より大きい正の整数であり、
前記デコーダが、信号復元ユニットをさらに備え、
前記信号復元ユニットが、前記第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するように構成される、
請求項19に記載のデコーダ。 - 第5のタイプのフレームがダウンミックス信号とステレオパラメータセットの両方を備え、第6のタイプのフレームがダウンミックス信号を備えるが、ステレオパラメータセットを備えず、前記第5のタイプのフレームおよび前記第6のタイプのフレームの各々が、前記第1のタイプのフレームの1つのケースであり、第3のタイプのフレームがステレオパラメータセットを備えるが、ダウンミックス信号を備えず、第4のタイプのフレームがダウンミックス信号もステレオパラメータセットも備えず、前記第3のタイプのフレームおよび前記第4のタイプのフレームの各々が、前記第2のタイプのフレームの1つのケースであり、
前記復号ユニットが、
前記第Nのフレームのビットストリームが前記第1のタイプのフレームであると判断された場合、前記第Nのフレームのビットストリームが前記第5のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、もしくは前記第Nのフレームのビットストリームが前記第6のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得すること、または
前記第Nのフレームのビットストリームが前記第2のタイプのフレームであると判断された場合、前記第Nのフレームのビットストリームが前記第3のタイプのフレームであるとき、第Nのフレームのステレオパラメータセットを取得するために、前記第Nのフレームのビットストリームを復号すること、もしくは前記第Nのフレームのビットストリームが前記第4のタイプのフレームであるとき、事前設定された第2の規則に従って、第Nのフレームのステレオパラメータセットに先行する少なくとも1フレームのステレオパラメータセット内のkフレームのステレオパラメータセットを特定し、所定の第4のアルゴリズムに基づいて、前記kフレームのステレオパラメータセットに従って前記第Nのフレームのステレオパラメータセットを取得すること
を行うようにさらに構成され、
前記第Nのフレームのステレオパラメータセット内の少なくとも1つのステレオパラメータが、所定の第3のアルゴリズムに基づいて、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するために、前記デコーダによって使用され、kが0より大きい正の整数であり、
前記デコーダが、信号復元ユニットをさらに備え、
前記信号復元ユニットが、前記所定の第3のアルゴリズムに基づいて、前記第Nのフレームのステレオパラメータセット内の前記少なくとも1つのステレオパラメータに従って、前記第Nのフレームのダウンミックス信号を前記第Nのフレームのオーディオ信号に復元するように構成される、
請求項19に記載のデコーダ。 - 請求項13から18のいずれか一項に記載のエンコーダと、請求項19から24のいずれか一項に記載のデコーダとを備える、符号化および復号システム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/CN2016/100617 WO2018058379A1 (zh) | 2016-09-28 | 2016-09-28 | 一种处理多声道音频信号的方法、装置和系统 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019533189A JP2019533189A (ja) | 2019-11-14 |
| JP6790251B2 true JP6790251B2 (ja) | 2020-11-25 |
Family
ID=61763024
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019516957A Active JP6790251B2 (ja) | 2016-09-28 | 2016-09-28 | マルチチャネルオーディオ信号処理方法、装置、およびシステム |
Country Status (8)
| Country | Link |
|---|---|
| US (5) | US10593339B2 (ja) |
| EP (2) | EP3511934B1 (ja) |
| JP (1) | JP6790251B2 (ja) |
| KR (3) | KR20190052122A (ja) |
| CN (5) | CN117351965A (ja) |
| MX (1) | MX395045B (ja) |
| MY (1) | MY200195A (ja) |
| WO (1) | WO2018058379A1 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6790251B2 (ja) * | 2016-09-28 | 2020-11-25 | 華為技術有限公司Huawei Technologies Co.,Ltd. | マルチチャネルオーディオ信号処理方法、装置、およびシステム |
| CN110556119B (zh) | 2018-05-31 | 2022-02-18 | 华为技术有限公司 | 一种下混信号的计算方法及装置 |
| KR20210154807A (ko) * | 2019-04-18 | 2021-12-21 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 다이얼로그 검출기 |
| DK4165629T3 (da) * | 2020-06-11 | 2025-06-02 | Dolby Laboratories Licensing Corp | Fremgangsmåder og indretninger til kodning og afkodning af rumlig baggrundsstøj i et multikanalsindgangssignal |
| CN115917643B (zh) * | 2020-06-24 | 2025-05-02 | 日本电信电话株式会社 | 声音信号解码方法、声音信号解码装置、计算机程序产品以及记录介质 |
| JP7614328B2 (ja) * | 2020-07-30 | 2025-01-15 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号を符号化する、又は符号化オーディオシーンを復号化する装置、方法及びコンピュータープログラム |
| CN115410584A (zh) * | 2021-05-28 | 2022-11-29 | 华为技术有限公司 | 多声道音频信号的编码方法和装置 |
| WO2024051955A1 (en) * | 2022-09-09 | 2024-03-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata |
| CN119895493A (zh) * | 2022-09-13 | 2025-04-25 | 瑞典爱立信有限公司 | 自适应声道间时间差估计 |
Family Cites Families (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0713586B2 (ja) | 1987-02-20 | 1995-02-15 | 三機工業株式会社 | 自動車エンジン実験用移動油水制御装置 |
| JP2835483B2 (ja) * | 1993-06-23 | 1998-12-14 | 松下電器産業株式会社 | 音声判別装置と音響再生装置 |
| JP2728122B2 (ja) * | 1995-05-23 | 1998-03-18 | 日本電気株式会社 | 無音圧縮音声符号化復号化装置 |
| WO1998041978A1 (en) * | 1997-03-19 | 1998-09-24 | Hitachi, Ltd. | Method and device for detecting starting and ending points of sound section in video |
| EP1238489B1 (en) * | 1999-12-13 | 2008-03-05 | Broadcom Corporation | Voice gateway with downstream voice synchronization |
| JP3526269B2 (ja) | 2000-12-11 | 2004-05-10 | 株式会社東芝 | ネットワーク間中継装置及び該中継装置における転送スケジューリング方法 |
| US7657706B2 (en) | 2003-12-18 | 2010-02-02 | Cisco Technology, Inc. | High speed memory and input/output processor subsystem for efficiently allocating and using high-speed memory and slower-speed memory |
| KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
| JP2008286904A (ja) * | 2007-05-16 | 2008-11-27 | Panasonic Corp | オーディオ複号化装置 |
| CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
| EP2218068A4 (en) * | 2007-11-21 | 2010-11-24 | Lg Electronics Inc | METHOD AND APPARATUS FOR SIGNAL PROCESSING |
| EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
| KR101797033B1 (ko) * | 2008-12-05 | 2017-11-14 | 삼성전자주식회사 | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 |
| CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
| CN101661749A (zh) * | 2009-09-23 | 2010-03-03 | 清华大学 | 一种语音和音乐双模切换编/解码的方法 |
| KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
| US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
| JP5299327B2 (ja) | 2010-03-17 | 2013-09-25 | ソニー株式会社 | 音声処理装置、音声処理方法、およびプログラム |
| EP2609592B1 (en) | 2010-08-24 | 2014-11-05 | Dolby International AB | Concealment of intermittent mono reception of fm stereo radio receivers |
| US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
| CN103180899B (zh) | 2010-11-17 | 2015-07-22 | 松下电器(美国)知识产权公司 | 立体声信号的编码装置、解码装置、编码方法及解码方法 |
| WO2013068634A1 (en) * | 2011-11-10 | 2013-05-16 | Nokia Corporation | A method and apparatus for detecting audio sampling rate |
| CN103188595B (zh) * | 2011-12-31 | 2015-05-27 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
| US9036526B2 (en) * | 2012-11-08 | 2015-05-19 | Qualcomm Incorporated | Voice state assisted frame early termination |
| US9905232B2 (en) | 2013-05-31 | 2018-02-27 | Sony Corporation | Device and method for encoding and decoding of an audio signal |
| CN105304080B (zh) * | 2015-09-22 | 2019-09-03 | 科大讯飞股份有限公司 | 语音合成装置及方法 |
| US10319385B2 (en) * | 2015-09-25 | 2019-06-11 | Voiceage Corporation | Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget |
| US20170134282A1 (en) | 2015-11-10 | 2017-05-11 | Ciena Corporation | Per queue per service differentiation for dropping packets in weighted random early detection |
| JP6790251B2 (ja) * | 2016-09-28 | 2020-11-25 | 華為技術有限公司Huawei Technologies Co.,Ltd. | マルチチャネルオーディオ信号処理方法、装置、およびシステム |
| CN109285536B (zh) * | 2018-11-23 | 2022-05-13 | 出门问问创新科技有限公司 | 一种语音特效合成方法、装置、电子设备及存储介质 |
-
2016
- 2016-09-28 JP JP2019516957A patent/JP6790251B2/ja active Active
- 2016-09-28 EP EP16917134.5A patent/EP3511934B1/en active Active
- 2016-09-28 CN CN202311261449.9A patent/CN117351965A/zh active Pending
- 2016-09-28 CN CN202311267474.8A patent/CN117392988A/zh active Pending
- 2016-09-28 KR KR1020197011605A patent/KR20190052122A/ko not_active Ceased
- 2016-09-28 WO PCT/CN2016/100617 patent/WO2018058379A1/zh not_active Ceased
- 2016-09-28 CN CN201680010600.3A patent/CN108140393B/zh active Active
- 2016-09-28 KR KR1020227012057A patent/KR102480710B1/ko active Active
- 2016-09-28 CN CN202311261321.2A patent/CN117476018A/zh active Pending
- 2016-09-28 MY MYPI2019001667A patent/MY200195A/en unknown
- 2016-09-28 EP EP21163871.3A patent/EP3910629A1/en active Pending
- 2016-09-28 KR KR1020217028255A patent/KR102387162B1/ko active Active
- 2016-09-28 MX MX2019003417A patent/MX395045B/es unknown
- 2016-09-28 CN CN202311262035.8A patent/CN117351966A/zh active Pending
-
2019
- 2019-03-28 US US16/368,208 patent/US10593339B2/en active Active
-
2020
- 2020-02-04 US US16/781,421 patent/US10984807B2/en active Active
-
2021
- 2021-04-16 US US17/232,679 patent/US11922954B2/en active Active
-
2024
- 2024-01-23 US US18/420,007 patent/US12315522B2/en active Active
-
2025
- 2025-04-29 US US19/193,171 patent/US20250329336A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| US20210312932A1 (en) | 2021-10-07 |
| MY200195A (en) | 2023-12-13 |
| US20200273468A1 (en) | 2020-08-27 |
| CN108140393A (zh) | 2018-06-08 |
| EP3511934B1 (en) | 2021-04-21 |
| US12315522B2 (en) | 2025-05-27 |
| KR20210111898A (ko) | 2021-09-13 |
| US20240233736A1 (en) | 2024-07-11 |
| US10984807B2 (en) | 2021-04-20 |
| EP3511934A4 (en) | 2019-08-14 |
| CN117392988A (zh) | 2024-01-12 |
| KR20220053030A (ko) | 2022-04-28 |
| US11922954B2 (en) | 2024-03-05 |
| BR112019005983A2 (pt) | 2019-10-01 |
| US10593339B2 (en) | 2020-03-17 |
| US20190221219A1 (en) | 2019-07-18 |
| KR102480710B1 (ko) | 2022-12-22 |
| EP3511934A1 (en) | 2019-07-17 |
| EP3910629A1 (en) | 2021-11-17 |
| JP2019533189A (ja) | 2019-11-14 |
| CN117351965A (zh) | 2024-01-05 |
| MX395045B (es) | 2025-03-24 |
| CN117351966A (zh) | 2024-01-05 |
| MX2019003417A (es) | 2019-10-07 |
| CN117476018A (zh) | 2024-01-30 |
| WO2018058379A1 (zh) | 2018-04-05 |
| US20250329336A1 (en) | 2025-10-23 |
| KR102387162B1 (ko) | 2022-04-14 |
| CN108140393B (zh) | 2023-10-20 |
| KR20190052122A (ko) | 2019-05-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6790251B2 (ja) | マルチチャネルオーディオ信号処理方法、装置、およびシステム | |
| US10089997B2 (en) | Method for predicting high frequency band signal, encoding device, and decoding device | |
| KR101449434B1 (ko) | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 | |
| JP2022126688A (ja) | 快適雑音の生成のサポート | |
| EP2702588B1 (en) | Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder | |
| US9123328B2 (en) | Apparatus and method for audio frame loss recovery | |
| US20250210051A1 (en) | Encoder and encoding method for discontinuous transmission of parametrically coded independent streams with metadata | |
| KR20120069906A (ko) | 묵음 구간 정보를 사용한 오디오 신호의 부호화/복호화 장치 및 방법 | |
| BR112019005983B1 (pt) | Método de processamento de sinal de áudio de multicanais, codificador, decodificador e sistema de codificação e decodificação | |
| EP4584783A1 (en) | Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190508 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190508 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200529 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200615 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200915 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201005 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201104 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6790251 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
