TW201413708A

TW201413708A - 解碼裝置及方法、編碼裝置及方法、以及程式

Info

Publication number: TW201413708A
Application number: TW102122170A
Authority: TW
Inventors: Mitsuyuki Hatanaka; Toru Chinen
Original assignee: Sony Corp
Priority date: 2012-07-02
Filing date: 2013-06-21
Publication date: 2014-04-01
Also published as: RU2014106516A; CN103782339A; WO2014007094A1; BR112014004126A2; JP2018142003A; US20140156289A1; CN103782339B; US9542952B2; JPWO2014007094A1; RU2648590C2; EP2741284A1; AU2013284702A1; EP2741284A4; KR20150032648A; EP2741284B1; TWI517142B; JP6504419B2; JP6331093B2; CA2843254A1

Abstract

本技術是有關於，能夠獲得更有臨場感之高品質聲音的解碼裝置及方法、編碼裝置及方法、以及程式。編碼裝置，係在編碼位元串流的PCE中的註解領域裡，儲存揚聲器配置資訊，並且為了使註解領域中所被儲存之其他一般註解和揚聲器配置資訊能後區別，而還在註解領域中儲存有同步字組和識別資訊。在編碼位元串流的解碼時，藉由註解領域中所被記錄的同步字組和識別資訊，判定是否有儲存揚聲器配置資訊，以相應於該判定結果的揚聲器配置，來輸出編碼位元串流中所含之音訊資料。本技術係可適用於編碼裝置。

Description

解碼裝置及方法、編碼裝置及方法、以及程式

本技術係有關於解碼裝置及方法、編碼裝置及方法、以及程式，尤其是有關於，能夠獲得更具臨場感之高品質聲音的解碼裝置及方法、編碼裝置及方法、以及程式。

近年來，世界各國都在推進動態影像配訊服務或數位電視播送、次世代典藏之導入，在聲音部分係除了先前的立體聲播送以外，對應5.1聲道之多聲道的也開始普及。

另一方面，朝向更高畫質化、更高像素數的次世代高解析度電視的檢討也正在進行著，伴隨於此，聲音部分也能夠超越5.1多聲道，為了實現更具臨場感而朝平面方向及垂直方向的聲道擴充正受到期待。

又，作為關於音訊資料之編碼的技術，將來自不同聲道的複數窗，群組化成數個磚，以改善編碼效率的技術，也已被提出(例如參照專利文獻1)。

[先前技術文獻]

[專利文獻]

[專利文獻1]日本特開2010-217900號公報

然而，在上述的技術中，要獲得有臨場感之高品質聲音，是有困難的。

例如，國際標準化規格的MPEG(Moving Picture Experts Group)-2 AAC(Advanced Audio Coding)及MPEG-4 AAC規格的多聲道編碼中，只有平面方向的揚聲器配置之規定及從5.1聲道往立體聲道之降轉混音資訊之規定而已。因此，無法充分支援水平面及垂直方向的聲道擴充。

本技術係有鑑於此種狀況而研發，目的在於能夠獲得更具臨場感之高品質聲音。

本技術之第1側面的解碼裝置，係具備：解碼部，係將編碼位元串流中所含之音訊資料，予以解碼；和讀出部，係從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；和輸出部，係基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。

可將前記音源位置資訊設計成，用來表示前記音源之高度是與使用者大約同高、前記使用者之上方、或前記使用者之下方之哪一者的資訊。

前記可儲存任意資料之領域中，係可儲存有用來識別前記音源位置資訊之有無的識別資訊；可令前記讀出部，基於前記識別資訊而讀出前記音源位置資訊。

可設計成，在前記可儲存任意資料之領域中，作為前記識別資訊而儲存有預先決定之第1識別資訊、和基於前記音源位置資訊而被算出的第2識別資訊。

可令前記讀出部，當前記可儲存任意資料之領域中所含之前記第1識別資訊是預先決定之特定資訊，且從前記可儲存任意資料之領域所讀出之前記第2識別資訊是與基於已被讀出之前記音源位置資訊而被算出的前記第2識別資訊一致時，則認定前記音源位置資訊是有效之資訊。

可設計成，前記第2識別資訊，係根據對於含有前記音源位置資訊之資訊進行位元組對齊而獲得之資訊，而被算出。

本技術之第1側面的解碼方法或程式，係含有以下步驟：將編碼位元串流中所含之音訊資料，予以解碼；從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。

在本技術的第1側面中，編碼位元串流中所含之音訊資料會被解碼；從可儲存前記編碼位元串流之任意資料的領域，會讀出前記音訊資料的關於音源之高度之音源位置資訊；基於前記音源位置資訊，而會輸出已被解碼之前記音訊資料。

本技術之第2側面的編碼裝置，係具備：取得部，係取得關於音源之高度之音源位置資訊；和編碼部，係將音訊資料及前記音源位置資訊予以編碼；和打包部，係將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。

可設計成，前記可儲存任意資料之領域中，係儲存有前記音源位置資訊，還有用來識別前記音源位置資訊之有無的識別資訊。

可設計成，在前記可儲存任意資料之領域中係還儲存有：用來指示對含前記音源位置資訊之資訊執行位元組對齊的資訊、以及用來指示將根據前記位元組對齊所得到之資訊而被算出的前記第2識別資訊、和前記可儲存任意資料之領域中所儲存之前記第2識別資訊進行比對的資訊。

本技術之第2側面的編碼方法或程式，係含有以下步驟：取得關於音源之高度之音源位置資訊；將音訊資料及前記音源位置資訊予以編碼；將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。

在本技術的第2側面中，關於音源之高度之音源位置資訊會被取得；音訊資料及前記音源位置資訊會被編碼；已被編碼之前記音源位置資訊，會被儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。

若依據本技術的第1側面及第2側面，則可獲得更具臨場感之高品質聲音。

11‧‧‧編碼裝置

21‧‧‧輸入部

22‧‧‧編碼部

23‧‧‧打包部

51‧‧‧解碼裝置

61‧‧‧分離部

62‧‧‧解碼部

63‧‧‧輸出部

91‧‧‧編碼裝置

101‧‧‧PCE編碼部

102‧‧‧DSE編碼部

103‧‧‧音訊元素編碼部

111‧‧‧同步字組編碼部

112‧‧‧配置資訊編碼部

113‧‧‧識別資訊編碼部

114‧‧‧擴充資訊編碼部

115‧‧‧降轉混音資訊編碼部

141‧‧‧解碼裝置

151‧‧‧切換部

152‧‧‧降轉混音處理部

161‧‧‧PCE解碼部

162‧‧‧DSE解碼部

163‧‧‧音訊元素解碼部

171‧‧‧同步字組偵測部

172‧‧‧識別資訊算出部

173‧‧‧擴充偵測部

174‧‧‧降轉混音資訊解碼部

181‧‧‧排序處理部

211‧‧‧切換部

212‧‧‧切換部

213‧‧‧降轉混音部

214‧‧‧切換部

215‧‧‧增益調整部

216‧‧‧切換部

217‧‧‧降轉混音部

218‧‧‧增益調整部

241‧‧‧輸入端子

242‧‧‧乘算部

243‧‧‧乘算部

244‧‧‧乘算部

245‧‧‧加算部

246‧‧‧加算部

247‧‧‧輸出端子

271‧‧‧輸入端子

272‧‧‧乘算部

273‧‧‧乘算部

274‧‧‧乘算部

275‧‧‧乘算部

276‧‧‧加算部

277‧‧‧加算部

278‧‧‧加算部

279‧‧‧輸出端子

301‧‧‧輸入端子

302‧‧‧乘算部

303‧‧‧乘算部

304‧‧‧乘算部

305‧‧‧乘算部

306‧‧‧加算部

307‧‧‧加算部

308‧‧‧輸出端子

331‧‧‧輸入端子

332‧‧‧乘算部

333‧‧‧乘算部

334‧‧‧乘算部

335‧‧‧乘算部

336‧‧‧加算部

337‧‧‧加算部

338‧‧‧輸出端子

361‧‧‧輸入端子

362‧‧‧乘算部

363‧‧‧乘算部

364‧‧‧乘算部

365‧‧‧乘算部

366‧‧‧加算部

367‧‧‧加算部

368‧‧‧加算部

369‧‧‧加算部

370‧‧‧加算部

371‧‧‧加算部

372‧‧‧輸出端子

401‧‧‧輸入端子

402‧‧‧乘算部

403‧‧‧乘算部

404‧‧‧乘算部

405‧‧‧乘算部

406‧‧‧加算部

407‧‧‧減算部

408‧‧‧減算部

409‧‧‧加算部

410‧‧‧加算部

411‧‧‧加算部

412‧‧‧加算部

413‧‧‧加算部

414‧‧‧輸出端子

501‧‧‧CPU

502‧‧‧ROM

503‧‧‧RAM

504‧‧‧匯流排

505‧‧‧輸出入介面

506‧‧‧輸入部

507‧‧‧輸出部

508‧‧‧記錄部

509‧‧‧通訊部

510‧‧‧驅動機

511‧‧‧可移除式媒體

[圖1]揚聲器配置的說明圖。

[圖2]揚聲器對映之一例的圖示。

[圖3]編碼位元串流的說明圖。

[圖4]height_extension_element之語法的圖示。

[圖5]揚聲器之配置高度的說明圖。

[圖6]MPEG4 ancillary data之語法的圖示。

[圖7]bs_info()之語法的圖示。

[圖8]ancillary_data_status()之語法的圖示。

[圖9]downmixing_levels_MPEG4()之語法的圖示。

[圖10]audio_coding_mode()之語法的圖示。

[圖11]MPEG4_ext_ancillary_data()之語法的圖示。

[圖12]ext_ancillary_data_status()之語法的圖示。

[圖13]ext_downmixing_levels()之語法的圖示。

[圖14]各係數之適用對象的說明圖。

[圖15]ext_downmixing_global_gains()之語法的圖示。

[圖16]ext_downmixing_lfe_level()之語法的圖示。

[圖17]降轉混音的說明圖。

[圖18]對dmix_lfe_idx所決定之係數的說明圖。

[圖19]對dmix_a_idx與dmix_b_idx所決定之係數的說明圖。

[圖20]drc_presentation_mode之語法的圖示。

[圖21]drc_presentation_mode的說明圖。

[圖22]編碼裝置之構成例的圖示。

[圖23]說明編碼處理的流程圖。

[圖24]解碼裝置之構成例的圖示。

[圖25]說明解碼處理的流程圖。

[圖26]編碼裝置之構成例的圖示。

[圖27]說明編碼處理的流程圖。

[圖28]解碼裝置之構成例的圖示。

[圖29]降轉混音處理部之構成例的圖示。

[圖30]降轉混音部之構成例的圖示。

[圖31]降轉混音部之構成例的圖示。

[圖32]降轉混音部之構成例的圖示。

[圖33]降轉混音部之構成例的圖示。

[圖34]降轉混音部之構成例的圖示。

[圖35]降轉混音部之構成例的圖示。

[圖36]說明解碼處理的流程圖。

[圖37]說明排序處理的流程圖。

[圖38]說明排序處理的流程圖。

[圖39]說明降轉混音處理的流程圖。

[圖40]電腦之構成例的圖示。

以下，參照圖面，說明適用了本技術的實施形態。

〈第1實施形態〉〔關於本技術之概要〕

首先說明本技術之概要。

本技術係有關於音訊資料的編碼、解碼。例如，在MPEG-2 AAC或MPEG-4 AAC規格的多聲道編碼中，無法具有水平面及垂直方向之聲道擴充所需的資訊。

又，在這些多聲道編碼中，也不具有聲道擴充過之內容的降轉混音資訊，不知道各聲道的適切混合比，因此在再生聲道數較少的攜帶型機器上，再生音會變得很難聽。

於是，在本技術中，係藉由以下特徵(1)至(4)，而可獲得更具臨場感之高品質聲音。

(1)在既存的AAC規格所規定的PCE(Program_config_element)內的註解領域中，記錄垂直方向的揚聲器配置資訊。

(2)在特徵(1)的情況下，為了識別一般註解和垂直方向的揚聲器配置資訊，在編碼裝置側將同步字組與CRC檢查碼這2個識別資訊予以編碼，在解碼裝置上，係進行2個識別資訊的比對，若符合則取得揚聲器配置資訊。

(3)將音訊資料的降轉混音資訊，記錄至輔助資料領域(DSE(data_stream_element))。

(4)從6.1聲道或7.1聲道往2聲道的降轉混音，係設計成從6.1聲道或7.1聲道往5.1聲道的降轉混音，其後進行從5.1聲道往2聲道之降轉混音的2階段之處理。

藉由如此使用垂直方向的揚聲器配置資訊，就可不只在平面、還可重現垂直方向的音像，比起先前的平面多聲道之再生，可達成臨場感更高的再生。

又，藉由將從6.1聲道或7.1聲道往5.1聲道或2聲道的降轉混音資訊予以傳輸，即使使用一個編碼資料也能以最適合於各個再生環境的聲道數來再生音訊。此外，在不支援本技術的先前之解碼裝置中，垂直方向之資訊係被當作一般註解而被忽視即進行音訊資料之解碼，因此不會損及相容性。

〔關於揚聲器之配置〕

其次，說明音訊資料再生時的各揚聲器之配置。

例如，如圖1所示，假設使用者是從正面觀察電視受像機等之顯示裝置的顯示畫面TVS。亦即，假設在顯示畫面TVS的圖中，使用者是位於前方側。

此種情況下，假設配置有圍繞使用者的13個揚聲器Lvh,Rvh,Lrs,Ls,L,Lc,C,Rc,R,Rs,Rrs,Cs,LFE。

以下，將這些揚聲器Lvh,Rvh,Lrs,Ls,L,Lc,C,Rc,R,Rs,Rrs,Cs,LFE所再生的音訊資料(聲音)的聲道，分別稱作Lvh,Rvh,Lrs,Ls,L,Lc,C,Rc,R,Rs,Rrs,Cs,LFE。

如圖2所示，聲道L係為「Front Left」，聲道R係為「Front Right」，聲道C係為「Front Center」。

又，聲道Ls係為「Left Surround」，聲道Rs係為「Right Surround」，聲道Lrs係為「Left Rear」，聲道Rrs係為「Right Rear」，聲道Cs係為「Center Back」。

再者，聲道Lvh係為「Left High Front」，聲道Rvh係為「Right High Front」，聲道LFE係為「Low-Frequency-Effect」。

回到圖1之說明，揚聲器Lvh及揚聲器Rvh，係分別被配置在使用者的前方上側之左右，這些揚聲器Rvh,Lvh所被配置的層係為「Top layer」。

又，揚聲器L,C,R，係分別被配置在使用者的前方之左側、中央、右側，揚聲器Lc,Rc，係分別被配置在揚聲器L與C之間、及揚聲器R與C之間。再者，揚聲器Ls,Rs，係分別被配置在使用者的左右，揚聲器Lrs,Rrs,Cs，係分別被配置在使用者的後方左側、後方右側、及後方。

這些揚聲器Lrs,Ls,L,Lc,C,Rc,R,Rs,Rrs,Cs，係大約位於使用者耳朵高度的平面上，以圍繞使用者的方式而被配置，這些揚聲器所被配置的層係為「Middle layer」。

然後，揚聲器LFE係被配置在使用者的前方下側，揚聲器LFE所被配置的層係為「LFE layer」。

〔關於編碼位元串流〕

若將這些各聲道的音訊資料予以編碼，則會獲得例如圖3所示的編碼位元串流。亦即，圖3係圖示了AAC音框的編碼位元串流之語法。

圖3的編碼位元串流，係由「Header/sideinfo」、「PCE」、「SCE」、「CPE」、「LFE」、「DSE」、「FIL(DRC)」、及「FIL(END)」所構成，在此例中，編碼位元串流裡係含有3個「CPE」。

例如，在「PCE」中係含有音訊資料的關於各聲道之資訊，在此例中係含有音訊資料的關於混音降轉之資訊「Matrix-mixdown」、和關於揚聲器配置(高度資訊)之資訊「Height Infomation」。「PCE」中係含有可儲存自由註解的註解領域(註解欄位)「comment_field_data」，「comment_field_data」中係含有擴充領域「height_extension_element」。註解領域，係為可儲存一般註解等、任意資料之領域。此「height_extension_element」內，係含有關於揚聲器配置之高度的資訊「Height Infomation」。

在「SCE」中係含有單聲道的音訊資料，在「CPE」中係含有聲道對、亦即2個聲道的音訊資料，在「LFE」中係含有LFE聲道的音訊資料。例如，在「SCE」中係儲存有C或Cs等之聲道的音訊資料，在「CPE」中係儲存有L或R、Lvh或Rvh等之聲道的音訊資料。

又，「DSE」係為輔助資料領域，「DSE」中係儲存有自由的資料。在此例中，在「DSE」裡，作為音訊資料的關於降轉混音之資訊是含有：「Downmix 5.1ch to 2ch」、「Dynamic Range Control」、「DRC Presentation Mode」、「Downmix 6.1ch and 7.1ch to 5.1ch」、「global gain downmixing」、及「LFE downmixing」。

再者，在「FIL(DRC)」中係含有關於聲音之動態範圍限制的資訊，例如在「FIL(DRC)」中係含有「Program Reference Level」及「Dynamic Range Control」。

〔關於註解欄位〕

如上述，「PCE」的「comment_field_data」中係含有「height_extension_element」，藉此而實現垂直方向的揚聲器配置資訊所致之多聲道再生。亦即，藉由被配置在「Top layer」或「Middle layer」等各高度之層的揚聲器，就可再生具有臨場感的高品質聲音。

在此種「height_extension_element」中，係例如圖4所示般地含有用來進行與其他一般註解做識別所需的同步字組等。亦即，圖4係「height_extension_element」之語法的圖示。

在圖4中，「PCE_HEIGHT_EXTENSION_SYNC」係表示同步字組。

又，「front_element_height_info[i]」、「side_element_height_info[i]」、及「back_element_height_info[i]」，係分別表示從視聽者來看而位於前方、側方、及後方的各揚聲器之高度，亦即層。

然後，「byte_alignment()」係表示進行位元組對齊，「height_info_crc_check」係表示作為識別資訊而被使用的CRC檢查碼。又，根據從「PCE_HEIGHT_EXTENSION_SYNC」至「byte_alignment()」之間所被讀取的資訊，亦即同步字組、各揚聲器之配置資訊(各聲道之資訊)、位元組對齊，而算出CRC檢查碼。然後，判定所被算出之CRC檢查碼、和「height_info_crc_check」所示之CRC檢查碼是否一致，若這些是一致，則視為關於各揚聲器之配置的資訊係被正確讀取。「crc_cal()！=height_info_crc_check」係表示要進行上述的CRC檢查碼之比對。

此外，音源的位置、亦即關於揚聲器之配置(高度)之資訊的「front_element_height_info[i]」、「side_element_height_info[i]」、及「back_element_height_info[i]」，係例如圖5所示般地被決定。

亦即，若「front_element_height_info[i]」、「side_element_height_info[i]」、及「back_element_height_info[i]」之各資訊係為「0」、「1」、「2」，則視為這些揚聲器之高度是「Normal height」、「Top speaker」、「Bottom Speaker」。亦即，係為「Middle layer」、「Top layer」、及「LFE layer」。

〔關於DSE〕

接著說明「DSE」，亦即「data_stream_element()」的「data_stream_byte[]」中所含之輔助資料領域「MPEG4 ancillary data」。藉由該「MPEG4 ancillary data」，音訊資料的從6.1聲道或7.1聲道，往5.1聲道或2聲道之降轉混音DRC控制就成為可能。

圖6係「MPEG4 ancillary data」之語法的圖示。在「MPEG4 ancillary data」中係含有：「bs_info()」、「ancillary_data_status()」、「downmixing_levels_MPEG4()」、「audio_coding_mode()」、「Compression_value」、及「MPEG4_ext_ancillary_data()」。

此處，「Compression_value」係對應於圖3的「Dynamic Range Control」。又，「bs_info()」、「ancillary_data_status()」、「downmixing_levels_MPEG4()」、「audio_coding_mode()」、及「MPEG4_ext_ancillary_data()」之語法，係分別如圖7乃至圖11所示。

例如，在「bs_info()」中係如圖7所示，含有「mpeg_audio_type」、「dolby_surround_mode」、「drc_presentation_mode」、及「pseudo_surround_enable」。

「drc_presentation_mode」係對應於圖3所示的「DRC Presentation Mode」。又，在「pseudo_surround_enable」中係含有：表示從5.1聲道往2聲道之降轉混音之處理程序的資訊、亦即是用來表示要在複數種降轉混音處理手法中採用哪種手法來進行降轉混音的資訊。

然後隨著例如圖8所示的「ancillary_data_status()」中所含之「ancillary_data_extension_status」是0還是1，而會進行不同的處理。若「ancillary_data_extension_status」為1，則進行對圖6的「MPEG4 ancillary data」中的「MPEG4_ext_ancillary_data()」之存取，進行降轉混音DRC控制。相對於此，若「ancillary_data_extension_status」為0，則進行和先前一樣的處理。藉此，就可確保與既存規格之相容性。

圖8的「ancillary_data_status()」中所含之「downmixing_levels_MPEG4_status」，係用來指定從5.1聲道往2聲道之降轉混音時所被使用之係數(混合比)的資訊。亦即，若「downmixing_levels_MPEG4_status」為1，則由圖9所示之「downmixing_levels_MPEG4()」中所儲存之資訊而定的係數會被使用，進行降轉混音。

在圖9的「downmixing_levels_MPEG4()」中，作為用來特定降轉混音之係數所需的資訊，是含有「center_mix_level_value」與「surround_mix_level_value」。這些「center_mix_level_value」與「surround_mix_level_value」所對應之係數的值，係由例如後述的圖19的表來決定。

此外，圖9的「downmixing_levels_MPEG4()」，係對應於圖3的「Downmix 5.1ch to 2ch」。

又，在圖11的「MPEG4_ext_ancillary_data()」中係含有「ext_ancillary_data_status()」、「ext_downmixing_levels()」、「ext_downmixing_global_gains()」、及「ext_downmixing_lfe_level()」。

在「MPEG4_ext_ancillary_data()」中係儲存有，為了將目前為止的5.1聲道之音訊資料的操作，將聲道數擴充成7.1或6.1聲道之音訊資料時，所必須之資訊。

具體而言，在「ext_ancillary_data_status()」中係含有：表示是否進行從比5.1聲道還多之聲道往5.1聲道之降轉混音的資訊(旗標)、表示在降轉混音之際是否進行增益控制的資訊、表示在降轉混音中是否利用LFE聲道的資訊。

在「ext_downmixing_levels()」中係儲存有用來特定在進行降轉混音時所被使用之係數(混合比)所需之資訊，在「ext_downmixing_global_gains()」中係含有增益調整時的關於增益之資訊。又，在「ext_downmixing_lfe_level()」中係儲存有用來特定在進行降轉混音時所被使用之LEF聲道之係數(混合比)所需之資訊。

更詳言之，例如「ext_ancillary_data_status()」的語法，係如圖12所示。於「ext_ancillary_data_status()」中，「ext_downmixing_levels_status」係表示是否從6.1聲道或7.1聲道降轉混音成5.1聲道。亦即，表示是否有「ext_downmixing_levels()」。此一「ext_downmixing_levels_status」，係對應於圖3的「Downmix 6.1ch and 7.1ch to 5.1ch」。

又，「ext_downmixing_global_gains_status」係表示是否進行全域增益控制，是對應於圖3的「global gain downmixing」。亦即，表示是否有「ext_downmixing_global_gains()」。「ext_downmixing_lfe_level_status」係表示，從5.1聲道降轉混音成2聲道時，是否使用LFE聲道，是對應於圖3的「LFE downmixing」。

再者，圖11的「MPEG4_ext_ancillary_data()」中的「ext_downmixing_levels()」之語法係如圖13所示，圖13所示的「dmix_a_idx」及「dmix_b_idx」，係表示降轉混音時之混合比(係數)的資訊。

又，「ext_downmixing_levels()」所決定的「dmix_a_idx」及「dmix_b_idx」，和7.1聲道之音訊資料進行降轉混音時，這些「dmix_a_idx」及「dmix_b_idx」所被適用之成分的對應，係如圖14所示。

圖11的「MPEG4_ext_ancillary_data()」中的「ext_downmixing_global_gains()」、及「ext_downmixing_lfe_level()」之語法，係如圖15及圖16所示。

例如，在圖15的「ext_downmixing_global_gains()」中係含有：表示往5.1聲道進行降轉混音時的增益之符號的「dmx_gain_5_sign」和其增益「dmx_gain_5_idx」、表示往2聲道進行降轉混音時的增益之符號的「dmx_gain_2_sign」和其增益「dmx_gain_2_idx」。

然後，在圖16的「ext_downmixing_lfe_level()」中係含有「dmix_lfe_idx」，此「dmix_lfe_idx」係為表示降轉混音時之LFE聲道的混合比(係數)。

〔關於降轉混音〕

又，圖7所示的「bs_info()」的語法中的「pseudo_surround_enable」，係表示降轉混音之處理程序，該處理程序係如圖17所示。此處係圖示了，「pseudo_surround_enable」為0時與1時的2種處理程序。

此處，說明音訊資料的降轉混音處理。

首先，說明從5.1聲道往2聲道之降轉混音。此情況下，將降轉混音後的L聲道及R聲道，分別令作L’聲道及R’聲道，則會進行如下的處理。

亦即，若「pseudo_surround_enable」為0，則進行下式(1)之計算，求出L’聲道及R’聲道的音訊資料。

L’=L+C×b+Ls×a+LFE×c R’=R+C×b+Rs×a+LFE×c．．．(1)

相對於此，若「pseudo_surround_enable」為1，則進行下式(2)之計算，求出L’聲道及R’聲道的音訊資料。

L’=L+C×b-a×(Ls+Rs)+LFE×c R’=R+C×b+a×(Ls+Rs)+LFE×c．．．(2)

此外，式(1)及式(2)中，L、R、C、Ls、Rs、及LFE，係為構成5.1聲道的各聲道，分別表示參照圖1及圖2所說明過的L、R、C、Ls、Rs、及LFE的各聲道。

又，於式(1)及式(2)中，c係為圖16所示之「ext_downmixing_lfe_level()」中所含之「dmix_lfe_idx」之值所決定的定數，例如，相對於「dmix_lfe_idx」之各值的定數c之值，係如圖18所示。此外，更詳言之，當圖12的「ext_ancillary_data_status()」中的「ext_downmixing_lfe_level_status」是0的時候，LFE聲道係不被使用於式(1)及式(2)的計算。另一方面，若「ext_downmixing_lfe_level_status」為1，則被乘算至LFE聲道的定數c之值，係基於圖18所示的表而決定。

再者，於式(1)及式(2)中，a及b係圖13所示的「ext_downmixing_levels()」中所含之「dmix_a_idx」及「dmix_b_idx」之值所決定的定數。此外，式(1)及式(2)中的a及b亦可為，由圖9所示的「downmixing_levels_MPEG4()」中的「center_mix_level_value」及「surround_mix_level_value」之值所決定的定數。

例如，對「dmix_a_idx」及「dmix_b_idx」、或「center_mix_level_value」及「surround_mix_level_value」之各值的定數a及b之值，係如圖19所示。在此例中，由於在「dmix_a_idx」及「dmix_b_idx」、和「center_mix_level_value」及「surround_mix_level_value」間，會參照相同的表，因此降轉混音所需之定數(係數)的a及b之值係為相同。

接著說明，從7.1聲道或6.1聲道，往5.1聲道之降轉混音。

包含從使用者來看位於後方的揚聲器Lrs,Rrs 之聲道的聲道C,L,R,Ls,Rs,Lrs,Rrs,LFE的音訊資料，被轉換成由C’,L’,R’,Ls’,Rs’,LFE’所成之5.1聲道的音訊資料時，會進行下式(3)之計算。此處，聲道C’,L’,R’,Ls’,Rs’,LFE’係表示降轉混音後的聲道C,L,R,Ls,Rs,LFE。又，在式(3)中，C,L,R,Ls,Rs,Lrs,Rrs,LFE係表示聲道C,L,R,Ls,Rs,Lrs,Rrs,LFE的音訊資料。

C’=C L’=L R’=R Ls’=Ls×d1+Lrs×d2 Rs’=Rs×d1+Rrs×d2 LFE’=LFE．．．(3)

此外，於式(3)中，d1及d2係為定數，這些定數d1及d2係例如圖19所示，是對「dmix_a_idx」及「dmix_b_idx」之各值所決定的定數。

又，包含從使用者來看位於前方的揚聲器Lc,Rc之聲道的聲道C,L,R,Lc,Rc,Ls,Rs,LFE的音訊資料，被轉換成由C’,L’,R’,Ls’,Rs’,LFE’所成之5.1聲道的音訊資料時，會進行下式(4)之計算。此處，聲道C’,L’,R’,Ls’,Rs’,LFE’係表示降轉混音後的聲道C,L,R,Ls,Rs,LFE。又，在式(4)中，C,L,R,Lc,Rc,Ls,Rs,LFE係表示聲道C,L,R,Lc,Rc,Ls,Rs,LFE的音訊資料。

C’=C+e1×(Lc+Rc) L’=L+Lc×e2 R’=R+Rc×e2 Ls’=Ls Rs’=Rs LFE’=LFE．．．(4)

此外，於式(4)中，e1及e2係為定數，這些定數e1及e2係例如圖19所示，是對「dmix_a_idx」及「dmix_b_idx」之各值所決定的定數。

然後，包含從使用者來看位於前方上側的揚聲器Rvh,Lvh之聲道的聲道C,L,R,Lvh,Rvh,Ls,Rs,LFE的音訊資料，被轉換成由C’,L’,R’,Ls’,Rs’,LFE’所成之5.1聲道的音訊資料時，會進行下式(5)之計算。此處，聲道C’,L’,R’,Ls’,Rs’,LFE’係表示降轉混音後的聲道C,L,R,Ls,Rs,LFE。又，在式(5)中，C,L,R,Lvh,Rvh,Ls,Rs,LFE係表示聲道C,L,R,Lvh,Rvh,Ls,Rs,LFE的音訊資料。

C’=C L’=L×f1+Lvh×f2 R’=R×f1+Rvh×f2 Ls’=Ls Rs’=Rs LFE’=LFE．．．(5)

此外，於式(5)中，f1及f2係為定數，這些定數f1及f2係例如圖19所示，是對「dmix_a_idx」及「dmix_b_idx」之各值所決定的定數。

又，從6.1聲道往5.1聲道進行降轉混音時，係如以下。亦即，從聲道C,L,R,Ls,Rs,Cs,LFE的音訊資料，轉換成由C’,L’,R’,Ls’,Rs’,LFE’所成之5.1聲道的音訊資料時，會進行下式(6)之計算。此處，聲道C’,L’,R’,Ls’,Rs’,LFE’係表示降轉混音後的聲道C,L,R,Ls,Rs,LFE。又，在式(6)中，C,L,R,Ls,Rs,Cs,LFE係表示聲道C,L,R,Ls,Rs,Cs,LFE的音訊資料。

C’=C L’=L R’=R Ls’=Ls×g1+Cs×g2 Rs’=Rs×g1+Cs×g2 LFE’=LFE．．．(6)

此外，於式(6)中，g1及g2係為定數，這些定數g1及g2係例如圖19所示，是對「dmix_a_idx」及「dmix_b_idx」之各值所決定的定數。

然後，說明對降轉混音之音量補正的全域增益。

全域降轉混音增益，係用來補正因降轉混音所造成之變大或變小的聲音之音量。dmx_gain5係表示從7.1聲道或6.1聲道往5.1聲道之降轉混音的補正值，dmx_gain2係表示從5.1聲道往2聲道之降轉混音的補正值。又，dmx_gain2係用來支援，不支援7.1聲道的解碼裝置或位元串流。

再者，其應用與動作，係和DRC heavy compression類似。又，編碼裝置係可適宜針對音框的較長期間或極短期間做選擇性評估，決定全域降轉混音增益。

從7.1聲道往2聲道之降轉混音時，增益係被結合，亦即會適用(dmx_gain5+dmx_gain2)。dmx_gain5與dmx_gain2，係使用6位元無符號的整數，以0.25dB刻度而被量化。

因此，將dmx_gain5與dmx_gain2結合而成者，係為±15.75dB之範圍的值。這些係為對已被解碼之目前音框的音訊資料的樣本所適用的增益值。

具體而言，往5.1聲道進行降轉混音時，係如以下。亦即，對於藉由降轉混音所得到之聲道C’,L’,R’,Ls’,Rs’,LFE’的音訊資料，進行增益補正，來當作C”,L”,R”,Ls”,Rs”,LFE”的各聲道的音訊資料時，會進行下式(7)之計算。

L”=L’×dmx_gain5 R”=R’×dmx_gain5 C”=C’×dmx_gain5 Ls”=Ls’×dmx_gain5 Rs”=Rs’×dmx_gain5 LFE”=LFE’×dmx_gain5．．．(7)

此處，dmx_gain5係為純量值，是從圖15所示的「dmx_gain_5_sign」與「dmx_gain_5_idx」，藉由下式(8)而求出的增益值。

dmx_gain5=10^{(dmx_gain_5_idx/20)} if dmx_gain_5_sign==1 dmx_gain5=10^{(-dmx_gain_5_idx/20)} if dmx_gain_5_sign==0．．．(8)

同樣地，往2聲道進行降轉混音時，係如以下。亦即，對於藉由降轉混音所得到之聲道L’,R’的音訊資料，進行增益補正，來當作L”,R”的各聲道的音訊資料時，會進行下式(9)之計算。

L”=L’×dmx_gain2 R”=R’×dmx_gain2．．．(9)

此處，dmx_gain2係為純量值，是從圖15所示的「dmx_gain_2_sign」與「dmx_gain_2_idx」，藉由下式(10)而求出的增益值。

dmx_gain2=10^{(dmx_gain_2_idx/20)} if dmx_gain_2_sign==1 dmx_gain2=10^{(-dmx_gain_2_idx/20)} if dmx_gain_2_sign==0．．．(10)

此外，從7.1聲道降轉混音成2聲道時，亦可進行從7.1聲道往5.1聲道、從5.1聲道往2聲道之降轉混音後，對所獲得之訊號(資料)進行增益調整。此種情況下，對音訊資料所適用的增益值dmx_gain_7to2，係如下式(11)所示，可藉由結合dmx_gain5與dmx_gain2來獲得。

dmx_gain_7to2=dmx_gain_2×dmx_gain_5．．．(11)

又，從6.1聲道降轉混音成2聲道的時候，也是和從7.1聲道降轉混音成2聲道的情況相同。

再者，例如從7.1聲道降轉混音成2聲道時，進行式(7)或式(9)之計算，以2階段來進行增益補正時，就可輸出5.1聲道的音訊資料、和2聲道的音訊資料。

〔關於DRC Presentation mode〕

又，圖7中所示的「bs_info()」中所含之「drc_presentation_mode」係如圖20所示。亦即，圖20係「drc_presentation_mode」之語法的圖示。

「drc_presentation_mode」為「01」時，則視為「DRC presentation mode 1」、「drc_presentation_mode」為「10」時，則視為「DRC presentation mode 2」。然後，「DRC presentation mode 1」及「DRC presentation mode 2」中，係如圖21所示般地進行增益控制。

〔編碼裝置的構成例〕

其次，說明適用了本技術之具體的實施形態。

圖22係適用了本技術之編碼裝置的一實施形態之構成例的圖。編碼裝置11係由輸入部21、編碼部22、及打包部23所構成。

輸入部21，係從外部取得音訊資料、和關於該音訊資料之資訊，然後供給至編碼部22。例如，作為關於音訊資料之資訊，會取得有關揚聲器之配置(配置高度)的資訊等。

編碼部22，係將從輸入部21所供給之音訊資料、和關於音訊資料之資訊，進行編碼然後供給至打包部23。打包部23，係將從編碼部22所供給之音訊資料或關於音訊資料之資訊，進行打包，生成圖3所示的編碼位元串流並輸出之。

〔編碼處理之說明〕

然後，參照圖23的流程圖，說明編碼裝置11所進行的編碼處理。

於步驟S11中，輸入部21係取得音訊資料、和關於該音訊資料之資訊，然後供給至編碼部22。例如，7.1聲道的各聲道之音訊資料、和圖4所示之「height_extension_element」中所儲存之關於揚聲器之配置的資訊(以下稱作揚聲器配置資訊)等，會被取得。

於步驟S12中，編碼部22，係將從輸入部21所供給之各聲道的音訊資料，進行編碼。

於步驟S13中，編碼部22，係將從輸入部21所供給之揚聲器配置資訊，進行編碼。此時，編碼部22係生成圖4的「height_extension_element」中所含之「PCE_HEIGHT_EXTENSION_SYNC」中所儲存的同步字組，或生成「height_info_crc_check」中所儲存之識別資訊亦即CRC檢查碼，然後將這些同步字組或CRC檢查碼，連同編碼後的揚聲器配置資訊，一起供給至打包部23。

又，編碼部22係將編碼位元串流之生成上所必須之資訊，予以生成，連同已被編碼之音訊資料或揚聲器配置資訊，一起供給至打包部23。

於步驟S14中，打包部23係將從編碼部22所供給之音訊資料或揚聲器配置資訊，進行位元打包而生成圖3的編碼位元串流並輸出之。此時，打包部23係將揚聲器配置資訊或同步字組、CRC檢查碼等，儲存至「PCE」，將音訊資料儲存至「SCE」或「CPE」。

一旦編碼位元串流被輸出，編碼處理就結束。

如以上所述，編碼裝置11係將關於各層之揚聲器配置的資訊亦即揚聲器配置資訊，包含在編碼位元串流中，將所編碼而成的音訊資料予以輸出。藉由如此使用垂直方向的揚聲器配置資訊，就可不只在平面、還可重現垂直方向的音像，可達成臨場感更高的聲音再生。

〔解碼裝置的構成例〕

接著說明，將從編碼裝置11所輸出之編碼位元串流予以接收並解碼的解碼裝置。

圖24係此種解碼裝置之構成例的圖示。解碼裝置51係由分離部61、解碼部62、及輸出部63所構成。

分離部61係將從編碼裝置11所發送過來的編碼位元串流予以接收，並且將編碼位元串流進行位元解包然後供給至解碼部62。

解碼部62，係將從分離部61所供給之編碼位元串流、亦即各聲道的音訊資料或揚聲器配置資訊等，予以解碼，將這些解碼所得之音訊資料，供給至輸出部63。解碼部62係因應需要而還會進行音訊資料的降轉混音等。

輸出部63，係將從解碼部62所供給之音訊資料，隨應於解碼部62所指示的揚聲器配置(揚聲器對映)而輸出。從輸出部63所輸出之各聲道的音訊資料，係被供給至各聲道的揚聲器而再生。

〔解碼處理之說明〕

接著，參照圖25的流程圖，說明解碼裝置51所進行的解碼處理。

於步驟S41中，解碼部62係將音訊資料予以解碼。

亦即，分離部61係將從編碼裝置11所發送過來的編碼位元串流予以接收，並且將編碼位元串流進行位元解包。然後，分離部61係將位元解包而得到的音訊資料，和揚聲器配置資訊等之各種資訊，供給至解碼部62。解碼部62，係將從分離部61所供給之音訊資料予以解碼，供給至輸出部63。

於步驟S42中，解碼部62係從分離部61所供給的資訊中，偵測出同步字組。具體而言，從圖4的「height_extension_element」中偵測出同步字組。

於步驟S43中，解碼部62係判定是否偵測到同步字組。於步驟S43中，若判定為有偵測到同步字組，則於步驟S44中，解碼部62係將揚聲器配置資訊予以解碼。

亦即，解碼部62，係從圖4的「height_extension_element」，逐一讀取「front_element_height_info[i]」、「side_element_height_info[i]」、「back_element_height_info[i]」等資訊。藉此，就可得知要將各音訊資料，該用哪個位置(聲道)的揚聲器來再生。

於步驟S45中，解碼部62係生成識別資訊。亦即，解碼部62係根據，在「height_extension_element」的「PCE_HEIGHT_EXTENSION_SYNC」至「byte_alignment()」之間所被讀取的資訊，亦即同步字組、揚聲器配置資訊、及位元組對齊，來算出CRC檢查碼，當作識別資訊。

於步驟S46中，解碼部62係將步驟S45所生成之識別資訊、和圖4所示之「height_extension_element」的「height_info_crc_check」中所含之識別資訊，進行比較，判定這些識別資訊是否一致。

於步驟S46中若判定為識別資訊是一致，則解碼部62，係將解碼所得之音訊資料，供給至輸出部63，並且，基於所得到的揚聲器配置資訊，來指示音訊資料的輸出，處理係前進至步驟S47。

於步驟S47中，輸出部63，係將從解碼部62所供給之音訊資料，隨應於解碼部62所指示的揚聲器配置(揚聲器對映)而輸出，解碼處理係結束。

相對於此，於步驟S43中若判定為未偵測到同步字組，或是於步驟S46中若判定為識別資訊不一致，則於步驟S48中，輸出部63，係以預先決定之揚聲器配置，來輸出音訊資料。

亦即，步驟S48之處理會被進行的情況，係為未從「height_extension_element」正確讀出揚聲器配置資訊的時候。此種情況下，解碼部62係將音訊資料供給至輸出部63，並且，使各聲道之音訊資料，以預先決定之各聲道的揚聲器進行再生的方式，來指示音訊資料的輸出。如此一來，輸出部63係依照解碼部62之指示而輸出音訊資料，結束解碼處理。

如以上所述，解碼裝置51係將編碼位元串流中所含之音訊資料或揚聲器配置資訊予以解碼，基於揚聲器配置資訊而輸出音訊資料。由於在揚聲器配置資訊中係含有關於垂直方向的揚聲器之配置的資訊，因此就可不只在平面、還可重現垂直方向的音像，可達成臨場感更高的聲音再生。

此外，更詳言之，在音訊資料的解碼時，係因應需要而還會進行音訊資料的降轉混音等之處理。

此情況下，例如解碼部62係若圖6所示之「MPEG4 ancillary data」中的「ancillary_data_status()」內的「ancillary_data_extension_status」是「1」，則讀取「MPEG4_ext_ancillary_data()」。然後，解碼部62係讀取圖11所示之「MPEG4_ext_ancillary_data()」中所含之各資訊，進行音訊資料的降轉混音或增益補正。

例如，解碼部62係將7.1聲道或6.1聲道的音訊資料，降轉混音成5.1聲道的音訊資料，或再把5.1聲道的音訊資料降轉混音成2聲道的音訊資料等等。

又，此時，解碼部62係因應需要而將LFE聲道的音訊資料，用於降轉混音。此外，對各聲道乘算的係數，係參照圖13所示的「ext_downmixing_levels()」或圖 16所示的「ext_downmixing_lfe_level()」而被決定。然後，在降轉混音時的增益補正中，會參照圖15所示的「ext_downmixing_global_gains()」。

〔編碼裝置的構成例〕

接著說明，以上所說明之編碼裝置與解碼裝置的更詳細之構成例，和這些裝置的更詳細動作。

圖26係編碼裝置的更詳細構成例的圖示。

編碼裝置91係由輸入部21、編碼部22、及打包部23所構成。此外，圖26中，和圖22對應的部份，係標示同一符號，並適宜地省略其說明。

編碼部22係具備PCE編碼部101、DSE編碼部102、及音訊元素編碼部103。

PCE編碼部101係基於從輸入部21所供給之資訊，來進行PCE的編碼。亦即，PCE編碼部101係因應需要而進行各資訊的編碼，同時生成要被儲存在PCE中的各資訊。PCE編碼部101係具備同步字組編碼部111、配置資訊編碼部112、及識別資訊編碼部113。

同步字組編碼部111係將同步字組予以編碼，將已被編碼之同步字組，當作要被儲存在PCE之註解領域中所含之擴充領域裡的資訊。配置資訊編碼部112，係將從輸入部21所供給之表示關於各音訊資料的揚聲器之高度(層)的揚聲器配置資訊，予以編碼，當作要儲存在註解領域內之擴充領域裡的資訊。

識別資訊編碼部113，係進行識別資訊的編碼。例如，識別資訊編碼部113係因應需要而基於同步字組及揚聲器配置資訊來生成CRC檢查碼作為識別資訊，當作要儲存在註解領域內之擴充領域裡的資訊。

DSE編碼部102係基於從輸入部21所供給之資訊，來進行DSE的編碼。亦即，DSE編碼部102係因應需要而進行各資訊的編碼，同時生成要被儲存在DSE中的各資訊。DSE編碼部102係具備擴充資訊編碼部114及降轉混音資訊編碼部115。

擴充資訊編碼部114，係將用來表示DSE之擴充領域「MPEG4_ext_ancillary_data()」裡是否含有擴充資訊的資訊(旗標)，予以編碼。降轉混音資訊編碼部115，係將音訊資料的關於降轉混音之資訊，予以編碼。音訊元素編碼部103，係將從輸入部21所供給之音訊資料，予以編碼。

編碼部22，係將各種資料之編碼所得到的被儲存在各元素中的資訊，供給至打包部23。

〔編碼處理之說明〕

此處，參照圖27的流程圖，說明編碼裝置91所進行的編碼處理。此外，該編碼處理係為參照圖23之流程圖所說明過之處理的更詳細之處理。

於步驟S71中，輸入部21係取得音訊資料、和該音訊資料之編碼上所必須之資訊，並供給至編碼部 22。

例如，輸入部21係取得各聲道的PCM(Pulse Code Modulation)資料、表示各聲道之揚聲器配置的資訊、用來特定降轉混音係數所需的資訊、及表示編碼位元串流之位元速率的資訊，來作為音訊資料。此處，所謂用來特定降轉混音係數所需的資訊，係當進行從7.1或6.1聲道往5.1聲道之降轉混音、及從5.1聲道往2聲道之降轉混音時，用來表示對各聲道之音訊資料進行乘算之係數的資訊。

又，輸入部21係將今後所欲取得之編碼位元串流的檔名，加以取得。該檔名係在編碼側的裝置上被適宜地使用。

於步驟S72中，音訊元素編碼部103係將從輸入部21所供給之音訊資料，予以編碼，當作要儲存至SCE、CPE、及LFE之各元素的資料。此時，音訊資料係以根據從輸入部21供給至編碼部22的位元速率、和音訊資料以外之其他資訊之編碼量所決定的位元速率，而被編碼。

又，例如C聲道或Cs聲道的音訊資料會被編碼，被當成要儲存至SCE的資料，L聲道或R聲道的音訊資料會被編碼，被當成要儲存至CPE的資料。然後，LFE聲道的音訊資料會被編碼，被當成要儲存至LFE的資料。

於步驟S73中，同步字組編碼部111係基於從輸入部21所供給之資訊來將同步字組予以編碼，將已被編碼之同步字組當作要儲存至圖4所示之「height_extension_element」中所含之「PCE_HEIGHT_EXTENSION_SYNC」的資訊。

於步驟S74中，配置資訊編碼部112，係將從輸入部21所供給之各音訊資料的揚聲器配置資訊，予以編碼。

已被編碼之揚聲器配置資訊，係在打包部23中按照音源位置、亦即符合揚聲器配置的順序，而被儲存在「height_extension_element」內。亦即，用來表示從使用者來看被配置在其前方的揚聲器所再生的各聲道的揚聲器高度(音源之高度)的揚聲器配置資訊，係被當成「front_element_height_info[i]」而儲存在「height_extension_element」內。

接續於「front_element_height_info[i]」，用來表示從使用者來看被配置在其側方的揚聲器所再生的各聲道的揚聲器高度的揚聲器配置資訊，係被當成「side_element_height_info[i]」而儲存在「height_extension_element」內。然後，在其之後，用來表示從使用者來看被配置在其後方的揚聲器所再生的各聲道的揚聲器高度的揚聲器配置資訊，係被當成「back_element_height_info[i]」而儲存在「height_extension_element」內。

於步驟S75中，識別資訊編碼部113，係進行識別資訊的編碼。例如，識別資訊編碼部113係因應需要而基於同步字組及揚聲器配置資訊來生成CRC檢查碼作為識別資訊，當作要儲存在「height_extension_element」之「height_info_crc_check」裡的資訊。同步字組和CRC檢查碼，係為用來識別編碼位元串流中是否有揚聲器配置資訊所需的資訊。

又，識別資訊編碼部113係生成用來指示位元組對齊之執行的資訊，當作要儲存至「height_extension_element」的「byte_alignment()」之資訊。然後，識別資訊編碼部113係生成用來指示識別資訊之比對的資訊，當作要儲存至「height_extension_element」中的「if(crc_cal()！=height_info_crc_check)」之資訊。

藉由以上步驟S73至步驟S75之處理，應儲存至PCE的註解領域中所含之擴充領域、亦即「height_extension_element」的資訊，就被生成。

於步驟S76中，PCE編碼部101係根據從輸入部21所供給之資訊、或目前為止所生成之擴充領域之資訊等，來進行PCE的編碼。

例如，PCE編碼部101係將藉由前方、側方、及後方所分別被配置之揚聲器進行再生的各聲道之數目、或用來表示各音訊資料是C,L,R等聲道當中的哪個聲道之資料的資訊等，當作要被儲存至PCE的資訊而加以生成。

於步驟S77中，擴充資訊編碼部114係基於從輸入部21所供給之資訊，來將用來表示DSE之擴充領域中是否含有擴充資訊的資訊，予以編碼，當作要儲存至圖8之「ancillary_data_status()」之「ancillary_data_extension_status」的資訊。例如，在「ancillary_data_extension_status」中係儲存有用來表示是否含有擴充資訊之資訊、亦即「0」或「1」來作為表示擴充資訊之有無的資訊。

於步驟S78中，降轉混音資訊編碼部115係基於從輸入部21所供給之資訊，來將音訊資料的關於降轉混音之資訊，予以編碼。

例如，降轉混音資訊編碼部115係進行，用來特定從輸入部21所供給之降轉混音係數所需之資訊的編碼。具體而言，降轉混音資訊編碼部115係將用來表示在從5.1聲道往2聲道之降轉混音進行時對各聲道的音訊資料所乘算之係數的資訊，予以編碼，當作要儲存至圖9之「downmixing_levels_MPEG4()」的「center_mix_level_value」及「surround_mix_level_value」。

又，降轉混音資訊編碼部115係將用來表示在從5.1聲道往2聲道之降轉混音進行時對LFE聲道的音訊資料所乘算之係數的資訊，予以編碼，當作要儲存至圖16之「ext_downmixing_lfe_level()」的「dmix_lfe_idx」。同樣地，降轉混音資訊編碼部115係將從輸入部21所供給之表示往2聲道之降轉混音之處理程序的資訊，予以編碼，當作要儲存至圖7之「bs_info()」的「pseudo_surround_enable」。

再者，降轉混音資訊編碼部115係將用來表示在從7.1或6.1聲道往5.1聲道之降轉混音進行時對各聲道的音訊資料所乘算之係數的資訊，予以編碼，當作要儲存至圖13之「ext_downmixing_levels」的「dmix_a_idx」及「dmix_b_idx」。

又，降轉混音資訊編碼部115係將用來表示在從5.1聲道往2聲道之降轉混音中是否使用LFE聲道的資訊，予以編碼，當作要儲存至位於擴充領域的圖11之「ext_ancillary_data_status()」內的、圖12之「ext_downmixing_lfe_level_status」的資訊。

再者，降轉混音資訊編碼部115係將降轉混音時進行增益調整所必須之資訊，予以編碼，當作要儲存至圖11之「MPEG4_ext_ancillary_data()」內的「ext_downmixing_global_gains」的資訊。

於步驟S79中，DSE編碼部102係根據從輸入部21所供給之資訊、或目前為止所生成之關於降轉混音之資訊等，來進行DSE的編碼。

藉由以上的處理，就會獲得應儲存至PCE、SCE、CPE、LFE、及DSE之各元素的資訊。編碼部22，係將這些應儲存至各元素的資訊，供給至打包部23。又，編碼部22係因應需要而生成「Header/Sideinfo」或「FIL(DRC)」、「FIL(END)」等之元素，供給至打包部23。

於步驟S80中，打包部23係將從編碼部22所供給之音訊資料或揚聲器配置資訊等，進行位元打包而生成圖3的編碼位元串流並輸出之。例如打包部23係藉由在PCE或DSE中儲存從編碼部22所供給之資訊，以生成編碼位元串流。一旦編碼位元串流被輸出，編碼處理就結束。

如以上所述，編碼裝置91係將揚聲器配置資訊、關於降轉混音之資訊、表示擴充領域中是否含有擴充資訊的資訊等，包含在編碼位元串流中，而輸出已被編碼之音訊資料。藉由如此將揚聲器配置資訊、關於降轉混音之資訊等儲存在編碼位元串流中，在編碼位元串流的解碼側，就可獲得更具臨場感之高品質聲音。

例如，藉由在編碼位元串流中儲存垂直方向的揚聲器配置資訊，在解碼側就可不只在平面、還可重現垂直方向的音像，可達成臨場感更高的聲音再生。

而且，在編碼位元串流中係含有用來識別揚聲器配置資訊的複數識別資訊(識別碼)，以用來識別被儲存在註解領域內之擴充領域裡的資訊究竟是揚聲器配置資訊、還是其他註解等之文字資訊。此處，作為識別資訊，係為被配置在揚聲器配置資訊前方的同步字組、和由揚聲器配置資訊等之已被儲存之資訊內容而決定的CRC檢查碼，是被含在編碼位元串流中。

藉由將這2個識別資訊包含在編碼位元串流中，就可更為確實地特定編碼位元串流中所含的資訊是否為揚聲器配置資訊。其結果為，可使用所獲得的揚聲器配置資訊，獲得更具臨場感之高品質聲音。

又，在編碼位元串流中，作為音訊資料的降轉混音所需之資訊，是在DSE中含有「pseudo_surround_enable」。若依據此資訊，則可在複數方法之中指定哪種來作為從5.1聲道往2聲道之降轉混音處理的方法，因此可更加提高音訊資料之解碼側的自由度。

具體而言，在本實施形態中，作為從5.1聲道往2聲道之降轉混音處理的方法，係有上述計算式(1)的方法、和計算式(2)的方法。例如，假設在解碼側上，藉由降轉混音所得的2聲道的音訊資料是再被傳輸至再生裝置，而於再生裝置中，2聲道的音訊資料係被轉換成5.1聲道的音訊資料然後被再生。

此種情況下，式(1)所致之方法和式(2)所致之方法，關於以其中哪一種方法所獲得之音訊資料，係在最終獲得之5.1聲道的音訊資料進行再生時，有可能無法獲得事先想定的適切音響效果。

可是，在編碼裝置91上所得的編碼位元串流中，可藉由「pseudo_surround_enable」來指定可以在解碼側上獲得想定音響效果的降轉混音方法，因此在解碼側上可以獲得更具臨場感之高品質聲音。

甚至，在編碼位元串流中，表示是否含有擴充資訊之資訊(旗標)，係被儲存在「ancillary_data_extension_status」中。因此，若參照該資訊，就可特定擴充領域「MPEG4_ext_ancillary_data()」裡是否含有擴充資訊。

例如，在此例中，「ext_ancillary_data_status()」、「ext_downmixing_levels()」、「ext_downmixing_global_gains」、及「ext_downmixing_lfe_level()」係因應需要而被儲存在擴充領域中來作為擴充資訊。

若能獲得此種擴充資訊，則可用更高的自由度來將音訊資料進行降轉混音，在解碼側上可獲得多樣的音訊資料。其結果為，可獲得更具臨場感之高品質聲音。

〔解碼裝置的構成例〕

接著，說明解碼裝置的更詳細構成。

圖28係解碼裝置的更詳細構成例的圖示。此外，圖28中，和圖24對應的部份，係標示同一符號，並適宜地省略其說明。

解碼裝置141係由分離部61、解碼部62、切換部151、降轉混音處理部152、及輸出部63所構成。

分離部61係將從編碼裝置91所輸出之編碼位元串流予以接收並解包，供給至解碼部62，並且取得降轉混音形式參數與音訊資料的檔名。

此處，降轉混音形式參數，係於解碼裝置141中，表示編碼位元串流中所含之音訊資料的降轉混音之形式的資訊。例如，作為降轉混音形式參數，係含有：從7.1聲道或是6.1聲道往5.1聲道進行降轉混音之意旨的資訊、從7.1聲道或是6.1聲道往2聲道進行降轉混音之意旨的資訊、從5.1聲道往2聲道進行降轉混音之意旨的資訊、或是不進行降轉混音之意旨的資訊。

藉由分離部61而取得的降轉混音形式參數，係供給至切換部151及降轉混音處理部152。又，藉由分離部61而取得的檔名，係在解碼裝置141中被適宜使用。

解碼部62係進行從分離部61所供給之編碼位元串流的解碼。解碼部62係由PCE解碼部161、DSE解碼部162、及音訊元素解碼部163所構成。

PCE解碼部161，係將編碼位元串流中所含之PCE予以解碼，將其結果所得之資訊，供給至降轉混音處理部152及輸出部63。在PCE解碼部161中係設置有同步字組偵測部171和識別資訊算出部172。

同步字組偵測部171，係從位於PCE之註解領域內的擴充領域，偵測出同步字組，讀出同步字組。又，識別資訊算出部172係基於從位於PCE之註解領域內的擴充領域所讀出的資訊，來算出識別資訊。

DSE解碼部162，係將編碼位元串流中所含之 DSE予以解碼，將其結果所得之資訊，供給至降轉混音處理部152。在DSE解碼部162中係設置有擴充偵測部173和降轉混音資訊解碼部174。

擴充偵測部173係偵測DSE之「MPEG4_ancillary_data()」中，是否含有擴充資訊。降轉混音資訊解碼部174，係進行DSE中所含之關於降轉混音之資訊的解碼。

音訊元素解碼部163，係將編碼位元串流中所含之音訊資料予以解碼，供給至切換部151。

切換部151係基於從分離部61所供給之降轉混音形式參數，而將從解碼部62所供給之音訊資料的輸出目標，切換成降轉混音處理部152或輸出部63之任一者。

降轉混音處理部152係基於來自分離部61的降轉混音形式參數、及來自解碼部62的資訊，而將從切換部151所供給之音訊資料進行降轉混音，將其結果所得之音訊資料，供給至輸出部63。

輸出部63，係基於從解碼部62所供給之資訊，來將從切換部151或降轉混音處理部152所供給之音訊資料，予以輸出。輸出部63係具備有排序處理部181。排序處理部181，係基於從PCE解碼部161所供給之資訊，來將從切換部151所供給之音訊資料進行排序，並予以輸出。

〔降轉混音處理部之構成例〕

又，圖28的降轉混音處理部152，更詳細而言是構成如圖29所示。亦即，降轉混音處理部152係由切換部211、切換部212、降轉混音部213-1至降轉混音部213-4、切換部214、增益調整部215、切換部216、降轉混音部217-1、降轉混音部217-2、及增益調整部218所構成。

切換部211，係將從切換部151所供給之音訊資料，供給至切換部212或切換部216之任一者。例如，音訊資料的輸出目標，係當音訊資料是7.1聲道或6.1聲道之資料時，就被設成切換部212，當音訊資料是5.1聲道之資料時，就被設成切換部216。

切換部212，係將從切換部211所供給之音訊資料，供給至降轉混音部213-1至降轉混音部213-4之任一者。例如，切換部212所致之音訊資料的輸出目標，係當音訊資料是6.1聲道之資料時，就被設成降轉混音部213-1。

又，當音訊資料是L,Lc,C,Rc,R,Ls,Rs,LFE之各聲道的資料時，切換部212係將來自切換部211的音訊資料，供給至降轉混音部213-2。當音訊資料是L,R,C,Ls,Rs,Lrs,Rrs,LFE之各聲道的資料時，切換部212係將來自切換部211的音訊資料，供給至降轉混音部213-3。

再者，當音訊資料是L,R,C,Ls,Rs,Lvh, Rvh,LFE之各聲道的資料時，切換部212係將來自切換部211的音訊資料，供給至降轉混音部213-4。

降轉混音部213-1至降轉混音部213-4，係將從切換部212所供給之音訊資料，降轉混音成5.1聲道的音訊資料，供給至切換部214。此外，以下，若沒有特別需要區分降轉混音部213-1至降轉混音部213-4時，則也會單純稱作降轉混音部213。

切換部214，係將從降轉混音部213所供給之音訊資料，供給至增益調整部215或切換部216之任一者。例如，編碼位元串流中所含之音訊資料，是要被降轉混音成5.1聲道時，切換部214係向增益調整部215供給音訊資料。相對於此，編碼位元串流中所含之音訊資料，是要被降轉混音成2聲道時，切換部214係向切換部216供給音訊資料。

增益調整部215，係調整從切換部214所供給之音訊資料的增益，供給至輸出部63。

切換部216，係將從切換部211或切換部214所供給之音訊資料，供給至降轉混音部217-1或降轉混音部217-2。例如，隨應於編碼位元串流的DSE中所含之「pseudo_surround_enable」之值，來切換切換部216所致之音訊資料的輸出目標。

降轉混音部217-1及降轉混音部217-2，係將從切換部216所供給之音訊資料，降轉混音成2聲道的資料，供給至增益調整部218。此外，以下，若沒有特別需要區分降轉混音部217-1及降轉混音部217-2時，則也會單純稱作降轉混音部217。

增益調整部218，係調整從降轉混音部217所供給之音訊資料的增益，供給至輸出部63。

〔降轉混音部之構成例〕

再來說明圖29的降轉混音部213及降轉混音部217的更詳細之構成例。

圖30係圖29之降轉混音部213-1的構成例的圖示。

降轉混音部213-1係由輸入端子241-1至輸入端子241-7、乘算部242至乘算部244、加算部245、加算部246、及輸出端子247-1至輸出端子247-6所構成。

對輸入端子241-1至輸入端子241-7，係分別從切換部212，供給L,R,C,Ls,Rs,Cs,LFE之各聲道的音訊資料。

輸入端子241-1至輸入端子241-3，係將從切換部212所供給之音訊資料，透過輸出端子247-1至輸出端子247-3，而直接供給至切換部214。亦即，被供給至降轉混音部213-1的L,R,C之各聲道的音訊資料，係直接當成降轉混音後的L,R,C之各聲道的音訊資料而輸出至後段。

輸入端子241-4至輸入端子241-6，係將從切換部212所供給之音訊資料，供給至乘算部242至乘算部 244。乘算部242係對從輸入端子241-4所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部245。

乘算部243係對從輸入端子241-5所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部246。乘算部244係對從輸入端子241-6所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部245及加算部246。

加算部245，係將從乘算部242所供給之音訊資料、和從乘算部244所供給之音訊資料，予以加算，供給至輸出端子247-4。輸出端子247-4，係將從加算部245所供給之音訊資料，當作降轉混音後的Ls聲道之音訊資料而供給至切換部214。

加算部246，係將從乘算部243所供給之音訊資料、和從乘算部244所供給之音訊資料，予以加算，供給至輸出端子247-5。輸出端子247-5，係將從加算部246所供給之音訊資料，當作降轉混音後的Rs聲道之音訊資料而供給至切換部214。

輸入端子241-7，係將從切換部212所供給之音訊資料，透過輸出端子247-6，而直接供給至切換部214。亦即，被供給至降轉混音部213-1的LFE聲道的音訊資料，係直接當成降轉混音後的LFE聲道的音訊資料而輸出至後段。

此外，以下，在沒有特別區分輸入端子241-1至輸入端子241-7的情況下，亦單純稱作輸入端子241；在沒有特別區分輸出端子247-1至輸出端子247-6的情況下，亦單純稱作輸出端子247。

如此，在降轉混音部213-1中，會進行相當於上述式(6)之計算的處理。

圖31係圖29之降轉混音部213-2的構成例的圖示。

降轉混音部213-2係由輸入端子271-1至輸入端子271-8、乘算部272至乘算部275、加算部276、加算部277、加算部278、及輸出端子279-1至輸出端子279-6所構成。

對輸入端子271-1至輸入端子271-8，係分別從切換部212，供給L,Lc,C,Rc,R,Ls,Rs,LFE之各聲道的音訊資料。

輸入端子271-1至輸入端子271-5，係將從切換部212所供給之音訊資料，分別供給至加算部276、乘算部272及乘算部273、加算部277、乘算部274及乘算部275、以及加算部278。

乘算部272及乘算部273係對從輸入端子271-2所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部276及加算部277。又，乘算部274及乘算部275係對從輸入端子271-4所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部277及加算部278。

加算部276，係將從輸入端子271-1所供給之音訊資料、和從乘算部272所供給之音訊資料，予以加算，供給至輸出端子279-1。輸出裝置279-1，係將從加算部276所供給之音訊資料，當作降轉混音後的L聲道之音訊資料而供給至切換部214。

加算部277，係將從輸入端子271-3所供給之音訊資料、從乘算部273所供給之音訊資料、及從乘算部274所供給之音訊資料，予以加算，供給至輸出端子279-2。輸出裝置279-2，係將從加算部277所供給之音訊資料，當作降轉混音後的C聲道之音訊資料而供給至切換部214。

加算部278，係將從輸入端子271-5所供給之音訊資料、和從乘算部275所供給之音訊資料，予以加算，供給至輸出端子279-3。輸出裝置279-3，係將從加算部278所供給之音訊資料，當作降轉混音後的R聲道之音訊資料而供給至切換部214。

輸入端子271-6至輸入端子271-8，係將從切換部212所供給之音訊資料，透過輸出端子279-4至輸出端子279-6，而直接供給至切換部214。亦即，被供給至降轉混音部213-2的Ls,Rs,LFE之各聲道的音訊資料，係直接當成降轉混音後的Ls,Rs,LFE之各聲道的音訊資料而輸出至後段。

此外，以下，在沒有特別區分輸入端子271-1至輸入端子271-8的情況下，亦單純稱作輸入端子271；在沒有特別區分輸出端子279-1至輸出端子279-6的情況下，亦單純稱作輸出端子279。

如此，在降轉混音部213-2中，會進行相當於上述式(4)之計算的處理。

再者，圖32係圖29之降轉混音部213-3的構成例的圖示。

降轉混音部213-3係由輸入端子301-1至輸入端子301-8、乘算部302至乘算部305、加算部306、加算部307、及輸出端子308-1至輸出端子308-6所構成。

對輸入端子301-1至輸入端子301-8，係分別從切換部212，供給L,R,C,Ls,Rs,Lrs,Rrs,LFE之各聲道的音訊資料。

輸入端子301-1至輸入端子301-3，係將從切換部212所供給之音訊資料，透過輸出端子308-1至輸出端子308-3，而直接供給至切換部214。亦即，被供給至降轉混音部213-3的L,R,C之各聲道的音訊資料，係直接當成降轉混音後的L,R,C之各聲道的音訊資料而輸出至後段。

輸入端子301-4至輸入端子301-7，係將從切換部212所供給之音訊資料，供給至乘算部302至乘算部305。乘算部302至乘算部305，係對從輸入端子301-4至輸入端子301-7所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部306、加算部307、加算部306、及加算部307。

加算部306，係將從乘算部302所供給之音訊資料、和從乘算部304所供給之音訊資料，予以加算，供給至輸出端子308-4。輸出端子308-4，係將從加算部306所供給之音訊資料，當作降轉混音後的Ls聲道之音訊資料而供給至切換部214。

加算部307，係將從乘算部303所供給之音訊資料、和從乘算部305所供給之音訊資料，予以加算，供給至輸出端子308-5。輸出裝置308-5，係將從加算部307所供給之音訊資料，當作降轉混音後的Rs聲道之音訊資料而供給至切換部214。

輸入端子301-8，係將從切換部212所供給之音訊資料，透過輸出端子308-6，而直接供給至切換部214。亦即，被供給至降轉混音部213-3的LFE聲道的音訊資料，係直接當成降轉混音後的LFE聲道的音訊資料而輸出至後段。

此外，以下，在沒有特別區分輸入端子301-1至輸入端子301-8的情況下，亦單純稱作輸入端子301；在沒有特別區分輸出端子308-1至輸出端子308-6的情況下，亦單純稱作輸出端子308。

如此，在降轉混音部213-3中，會進行相當於上述式(3)之計算的處理。

圖33係圖29之降轉混音部213-4的構成例的圖示。

降轉混音部213-4係由輸入端子331-1至輸入端子331-8、乘算部332至乘算部335、加算部336、加算部337、及輸出端子338-1至輸出端子338-6所構成。

對輸入端子331-1至輸入端子331-8，係分別從切換部212，供給L,R,C,Ls,Rs,Lvh,Rvh,LFE之各聲道的音訊資料。

輸入端子331-1及輸入端子331-2，係將從切換部212所供給之音訊資料，分別供給至乘算部332及乘算部333。又，輸入端子331-6及輸入端子331-7，係將從切換部212所供給之音訊資料，分別供給至乘算部334及乘算部335。

乘算部332至乘算部335，係對從輸入端子331-1、輸入端子331-2、輸入端子331-6、及輸入端子331-7所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部336、加算部337、加算部336、及加算部337。

加算部336，係將從乘算部332所供給之音訊資料、和從乘算部334所供給之音訊資料，予以加算，供給至輸出端子338-1。輸出端子338-1，係將從加算部336所供給之音訊資料，當作降轉混音後的L聲道之音訊資料而供給至切換部214。

加算部337，係將從乘算部333所供給之音訊資料、和從乘算部335所供給之音訊資料，予以加算，供給至輸出端子338-2。輸出端子338-2，係將從加算部337所供給之音訊資料，當作降轉混音後的R聲道之音訊資料而供給至切換部214。

輸入端子331-3至輸入端子331-5、及輸入端子331-8，係將從切換部212所供給之音訊資料，透過輸出端子338-3至輸出端子338-5、及輸出端子338-6，而直接供給至切換部214。亦即，被供給至降轉混音部213-4的C,Ls,Rs,LFE之各聲道的音訊資料，係直接當成降轉混音後的C,Ls,Rs,LFE之各聲道的音訊資料而輸出至後段。

此外，以下，在沒有特別區分輸入端子331-1至輸入端子331-8的情況下，亦單純稱作輸入端子331；在沒有特別區分輸出端子338-1至輸出端子338-6的情況下，亦單純稱作輸出端子338。

如此，在降轉混音部213-4中，會進行相當於上述式(5)之計算的處理。

接著說明，圖29的降轉混音部217的更詳細之構成例。

圖34係圖29之降轉混音部217-1的構成例的圖示。

降轉混音部217-1係由輸入端子361-1至輸入端子361-6、乘算部362至乘算部365、加算部366至加算部371、輸出端子372-1、及輸出端子372-2所構成。

對輸入端子361-1至輸入端子361-6，係分別從切換部216，供給L,R,C,Ls,Rs,LFE之各聲道的音訊資料。

輸入端子361-1至輸入端子361-6，係分別將從切換部216所供給之音訊資料，供給至加算部366、加算部369、及乘算部362至乘算部365。

乘算部362至乘算部365，係對從輸入端子361-3至輸入端子361-6所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部366及加算部369、加算部367、加算部370、以及加算部368及加算部371。

加算部366，係將從輸入端子361-1所供給之音訊資料、和從乘算部362所供給之音訊資料，予以加算，供給至加算部367。加算部367，係將從加算部366所供給之音訊資料、和從乘算部363所供給之音訊資料，予以加算，供給至加算部368。

加算部368，係將從加算部367所供給之音訊資料、和從乘算部365所供給之音訊資料，予以加算，供給至輸出端子372-1。輸出端子372-1，係將從加算部368所供給之音訊資料，當作降轉混音後的L聲道之音訊資料而供給至增益調整部218。

加算部369，係將從輸入端子361-2所供給之音訊資料、和從乘算部362所供給之音訊資料，予以加算，供給至加算部370。加算部370，係將從加算部369所供給之音訊資料、和從乘算部364所供給之音訊資料，予以加算，供給至加算部371。

加算部371，係將從加算部370所供給之音訊資料、和從乘算部365所供給之音訊資料，予以加算，供給至輸出端子372-2。輸出端子372-2，係將從加算部371所供給之音訊資料，當作降轉混音後的R聲道之音訊資料而供給至增益調整部218。

此外，以下，在沒有特別區分輸入端子361-1至輸入端子361-6的情況下，亦單純稱作輸入端子361；在沒有特別區分輸出端子372-1及輸出端子372-2的情況下，亦單純稱作輸出端子372。

如此，在降轉混音部217-1中，會進行相當於上述式(1)之計算的處理。

又，圖35係圖29之降轉混音部217-2的構成例的圖示。

降轉混音部217-2係由輸入端子401-1至輸入端子401-6、乘算部402至乘算部405、加算部406、減算部407、減算部408、加算部409至加算部413、輸出端子414-1、及輸出端子414-2所構成。

對輸入端子401-1至輸入端子401-6，係分別從切換部216，供給L,R,C,Ls,Rs,LFE之各聲道的音訊資料。

輸入端子401-1至輸入端子401-6，係分別將從切換部216所供給之音訊資料，供給至加算部406、加算部410、及乘算部402至乘算部405。

乘算部402至乘算部405，係對從輸入端子401-3至輸入端子401-6所供給之音訊資料，乘算降轉混音所需之係數，供給至加算部406及加算部410、減算部407及加算部411、減算部408及加算部412、以及加算部409及加算部413。

加算部406，係將從輸入端子401-1所供給之音訊資料、和從乘算部402所供給之音訊資料，予以加算，供給至減算部407。減算部407，係從加算部406所供給之音訊資料中，減去從乘算部403所供給之音訊資料，供給至減算部408。

減算部408，係從減算部407所供給之音訊資料中，減去從乘算部404所供給之音訊資料，供給至加算部409。加算部409，係將從減算部408所供給之音訊資料、和從乘算部405所供給之音訊資料，予以加算，供給至輸出端子414-1。輸出端子414-1，係將從加算部409所供給之音訊資料，當作降轉混音後的L聲道之音訊資料而供給至增益調整部218。

加算部410，係將從輸入端子401-2所供給之音訊資料、和從乘算部402所供給之音訊資料，予以加算，供給至加算部411。加算部411，係將從加算部410所供給之音訊資料、和從乘算部403所供給之音訊資料，予以加算，供給至加算部412。

加算部412，係將從加算部411所供給之音訊資料、和從乘算部404所供給之音訊資料，予以加算，供給至加算部413。加算部413，係將從加算部412所供給之音訊資料、和從乘算部405所供給之音訊資料，予以加算，供給至輸出端子414-2。輸出端子414-2，係將從加算部413所供給之音訊資料，當作降轉混音後的R聲道之音訊資料而供給至增益調整部218。

此外，以下，在沒有特別區分輸入端子401-1至輸入端子401-6的情況下，亦單純稱作輸入端子401；在沒有特別區分輸出端子414-1及輸出端子414-2的情況下，亦單純稱作輸出端子414。

如此，在降轉混音部217-2中，會進行相當於上述式(2)之計算的處理。

〔解碼處理之說明〕

接著，參照圖36的流程圖，說明解碼裝置141所進行的解碼處理。

於步驟S111中，分離部61係取得從編碼裝置91所輸出的編碼位元串流、和降轉混音形式參數。例如，降轉混音形式參數係從解碼裝置所被設置的資訊處理裝置取得。

又，分離部61係將已取得之降轉混音形式參數，供給至切換部151及降轉混音處理部152，並且因應需要而取得音訊資料的輸出檔名並適宜使用。

於步驟S112中，分離部61係將編碼位元串流予以解包，將其結果所得之各元素，供給至解碼部62。

於步驟S113中，PCE解碼部161係將從分離部61所供給之PCE，予以解碼。例如PCE解碼部161係從PCE的註解領域讀出擴充領域「height_extension_element」，或從PCE讀出關於揚聲器配置之資訊等等。此處，作為關於揚聲器配置之資訊係會讀出，例如，藉由使用者的前方、側方、及後方所分別被配置之揚聲器進行再生的各聲道之數目、或用來表示各音訊資料是C,L,R等之哪一聲道之資料的資訊。

於步驟S114中，DSE解碼部162係將從分離部61所供給之DSE，予以解碼。例如DSE解碼部162係從DSE讀出「MPEG4 ancillary data」，或甚至還會從「MPEG4 ancillary data」讀出必要之資訊等。

具體而言，例如，DSE解碼部162的降轉混音資訊解碼部174，係從圖9所示的「downmixing_levels_MPEG4()」，讀出「center_mix_level_value」或「surround_mix_level_value」來作為用來特定降轉混音所用之係數的資訊，供給至降轉混音處理部152。

於步驟S115中，音訊元素解碼部163係進行從分離部61所供給之SCE、CPE、及LFE的各元素中所儲存之音訊資料的解碼。藉此，各聲道的PCM資料就被當成音訊資料而取得。

已被解碼之音訊資料的聲道、亦即水平面上的配置位置等，係藉由該音訊資料所被儲存之SCE等的元素、或DSE之解碼所得的關於揚聲器配置之資訊，就可特定。但是，在此時點上，由於關於揚聲器配置之高度的資訊的揚聲器配置資訊未被讀出，因此各聲道的高度(層)係為尚未特定的狀態。

音訊元素解碼部163，係將解碼所得之音訊資料，供給至切換部151。

於步驟S116中，切換部151係基於從分離部61所供給之降轉混音形式參數，而判定是否進行音訊資料的降轉混音。例如降轉混音形式參數是表示不進行降轉混音時，則判定為不進行降轉混音。

於步驟S116中，若判定為不進行降轉混音，則切換部151係將從解碼部62所供給之音訊資料，供給至排序處理部181，處理係前進至步驟S117。

於步驟S117中，解碼裝置141進行排序處理，將各音訊資料按照揚聲器配置而予以排序、輸出。然後，一旦音訊資料被輸出，則解碼處理就結束。此外，排序處理的細節，將於後述。

相對於此，於步驟S116中若判定為要進行降轉混音，則切換部151係將從解碼部62所供給之音訊資料，供給至降轉混音處理部152的切換部211，處理係前進至步驟S118。

於步驟S118中，解碼裝置141係進行降轉混音處理，將各音訊資料，降轉混音成降轉混音形式參數所示之聲道數的音訊資料，並輸出之。然後，一旦音訊資料被輸出，則解碼處理就結束。此外，降轉混音處理的細節，將於後述。

如以上所述，解碼裝置141係將編碼位元串流予以解碼，輸出音訊資料。

〔排序處理的說明〕

接著，參照圖37及圖38的流程圖，說明圖36的步驟S117之處理所對應的排序處理。

於步驟S141中，同步字組偵測部171係將從PCE之註解領域(擴充領域)讀出同步字組所需的參數cmt_byte，當作cmt_byte=PCE的註解領域的位元組數。亦即，註解領域的位元組數會被設定，來作為參數cmt_byte之值。

於步驟S142中，同步字組偵測部171係從PCE的註解領域，進行預先決定之同步字組之資料量份的資料讀出。例如在圖4的例子中，同步字組「PCE_HEIGHT_EXTENSION_SYNC」係為8位元，亦即是1位元組，因此從PCE之註解領域的開頭起讀出1位元組份的資料。

於步驟S143中，PCE解碼部161係判定步驟S142所讀出之資料是否和同步字組一致。亦即，判定所被讀出之資料是否為同步字組。

於步驟S143中，若判定為與同步字組不一致，則於步驟S144中，同步字組偵測部171係將參數cmt_byte之值，減少所讀出之資料量份。此情況下，參數cmt_byte之值係減少1位元組。

於步驟S145中，同步字組偵測部171，係判定是否參數cmt_byte>0。亦即，判定參數cmt_byte是否大於0，換言之係判定註解領域的資料是否全部都已被讀出。

步驟S145中，當判定參數cmt_byte>0，則尚未從註解領域讀出所有資料，因此處理會回到步驟S142，重複上述處理。亦即，接續於註解領域的目前為止所被讀出之資料，同步字組的資料量份的資料會被讀出，與同步字組進行比對。

相對於此，於步驟S145中，若判定不是參數cmt_byte>0時，則處理係往步驟S146前進。如此處理往步驟S146前進的情況是，雖然註解領域的全部資料都被讀出，但並未從註解領域偵測出同步字組的情形。

於步驟S146中，PCE解碼部161，係認為沒有揚聲器配置資訊，將該意旨之資訊供給至排序處理部181，處理係往步驟S164前進。如此，在「height_extension_element」中，藉由將同步字組配置在揚聲器配置資訊的緊臨前方，就能簡單且確實地特定，註解領域中所含之資訊是否為揚聲器配置資訊。

又，於步驟S143中，若判定為從註解領域所讀出之資料是與同步字組一致，則因為偵測到同步字組，所以為了讀出同步字組之後緊臨的揚聲器配置資訊，處理係前進至步驟S147。

於步驟S147中，PCE解碼部161，係將用來讀出從使用者來看被配置在前方的揚聲器所再生的音訊資料的揚聲器配置資訊所需的參數num_fr_elem之值，當作屬於前方的元素數。

此處，所謂屬於前方的元素數，係為被配置在使用者前方之揚聲器所再生的音訊資料之數目(聲道數)，該元素數係被儲存在PCE中。因此，參數num_fr_elem的值，係為必須要從「height_extension_element」中讀出，被配置在前方之揚聲器所再生之音訊資料的揚聲器配置資訊之數目。

於步驟S148中，PCE解碼部161係判定是否為參數num_fr_elem>0。

於步驟S148中，若判定為參數num_fr_elem大於0，則由於尚有應讀出之揚聲器配置資訊，因此處理係往步驟S149前進。

於步驟S149中，PCE解碼部161係讀出，接續於註解領域的同步字組而被配置的1元素份的揚聲器配置資訊。在圖4的例子中，由於1個揚聲器配置資訊係為2位元，因此註解領域的目前為止所被讀出之資料的緊臨後方配置的2位元之資料，會被視為1個揚聲器配置資訊而被讀出。

此外，「height_extension_element」中的揚聲器配置資訊的配置位置、或音訊資料，是被儲存在SCE等之元素中，因此可以特定各揚聲器配置資訊是屬於有關哪個音訊資料的資訊。

於步驟S150中，PCE解碼部161係讀出了1個揚聲器配置資訊，因此將參數num_fr_elem之值增加 1。一旦參數num_fr_elem被更新，則其後，處理係回到步驟S148，重複上述之處理。亦即，下個揚聲器配置資訊會被讀出。

又，於步驟S148中，若判定不是參數num_fr_elem>0時，則前方之元素的揚聲器配置資訊係全都被讀出，因此處理係前進至步驟S151。

於步驟S151中，PCE解碼部161，係將用來讀出從使用者來看被配置在側方的揚聲器所再生的音訊資料的揚聲器配置資訊所需的參數num_side_elem之值，當作屬於側方的元素數。

此處，所謂屬於側方的元素數，係為被配置在使用者側方之揚聲器所再生的音訊資料之數目，該元素數係被儲存在PCE中。

於步驟S152中，PCE解碼部161係判定是否為參數num_side_elem>0。

於步驟S152中，若判定參數num_side_elem大於0，則於步驟S153中，PCE解碼部161，係將註解領域的目前為止所讀出之資料之後所被配置的1元素份的揚聲器配置資訊，予以讀出。步驟S153所讀出的揚聲器配置資訊，係為使用者側方之聲道的揚聲器配置資訊，亦即「side_element_height_info[i]」。

於步驟S154中，PCE解碼部161係將參數num_side_elem之值增加1。一旦參數num_side_elem被更新，則其後，處理係回到步驟S152，重複上述之處理。

又，於步驟S152中，若判定不是參數num_side_elem>0時，則側方之元素的揚聲器配置資訊係全都被讀出，因此處理係前進至步驟S155。

於步驟S155中，PCE解碼部161，係將用來讀出從使用者來看被配置在後方的揚聲器所再生的音訊資料的揚聲器配置資訊所需的參數num_back_elem之值，當作屬於後方的元素數。

此處，所謂屬於後方的元素數，係為被配置在使用者後方之揚聲器所再生的音訊資料之數目，該元素數係被儲存在PCE中。

於步驟S156中，PCE解碼部161係判定是否為參數num_back_elem>0。

於步驟S156中，若判定參數num_back_elem大於0，則於步驟S157中，PCE解碼部161，係將註解領域的目前為止所讀出之資料之後所被配置的1元素份的揚聲器配置資訊，予以讀出。步驟S157所讀出的揚聲器配置資訊，係為使用者後方之聲道的揚聲器配置資訊，亦即「back_element_height_info[i]」。

於步驟S158中，PCE解碼部161係將參數num_back_elem之值增加1。一旦參數num_back_elem被更新，則其後，處理係回到步驟S156，重複上述之處理。

又，於步驟S156中，若判定不是參數 num_back_elem>0時，則後方之元素的揚聲器配置資訊係全都被讀出，因此處理係前進至步驟S159。

於步驟S159中，識別資訊算出部172係進行位元組對齊。

例如，在圖4的「height_extension_element」中，係接續於揚聲器配置資訊，儲存有用來指示位元組對齊之執行的資訊「byte_alignment()」，因此識別資訊算出部172係一旦讀出該資訊，就執行位元組對齊。

具體而言，識別資訊算出部172係以使得「height_extension_element」中的從「PCE_HEIGHT_EXTENSION_SYNC」至「byte_alignment()」之前方之間所被讀取之資訊的資料量，會變成8位元之種數倍的資料量的方式，而在這些資訊的後方，附加所定的資料。亦即，以使得所被讀出之同步字組、揚聲器配置資訊、及所被附加之資料的合計資料量會是8位元之整數倍的方式，來進行位元組對齊。

在此例中，音訊資料的聲道數、亦即編碼位元串流中所含之揚聲器配置資訊之數目，係為預先決定的所定範圍內之數目。因此，藉由位元組對齊所得到之資料，亦即同步字組、揚聲器配置資訊、及所被附加之資料所構成的1個資料(以下稱作對齊資料)，必定會變成所定資料量的資料。

換言之，對齊資料的資料量，是不會隨著「height_extension_element」中所含之揚聲器配置資訊之數目、亦即音訊資料的聲道數而變，一定會是所定之資料量。因此，PCE解碼部161，係在對齊資料已被生成的時點上，若對齊資料並非所定資料量的情況下，則認為目前為止所讀出之揚聲器配置資訊並非正確的揚聲器配置資訊，亦即視為無效。

於步驟S160中，識別資訊算出部172係在「height_extension_element」中，將步驟S159中所讀出之「byte_alignment()」所接續之識別資訊，亦即「height_info_crc_check」中所儲存之資訊，予以讀出。此處，例如讀出CRC檢查碼來作為識別資訊。

於步驟S161中，識別資訊算出部172係根據步驟S159所求出的對齊資料，來算出識別資訊。例如，算出CRC檢查碼來作為識別資訊。

於步驟S162中，PCE解碼部161係判定步驟S160所讀出的識別資訊、和步驟S161所算出的識別資訊，是否一致。

此外，PCE解碼部161係若對齊資料並非所定資料量的情況下，則不進行步驟S160及步驟S161之處理，於步驟S162中，判定為識別資訊不一致。

於步驟S162中，若判定為識別資訊不一致，則於步驟S163中，PCE解碼部161係將已讀出之揚聲器配置資訊視為無效，將該意旨之資訊，供給至排序處理部181及降轉混音處理部152。然後，其後處理係往步驟S164前進。

一旦進行步驟S163之處理、或是進行步驟S146之處理，則於步驟S164中，排序處理部181係以預先決定之揚聲器配置，輸出從切換部151所供給之音訊資料。

此時，例如排序處理部181係根據從PCE解碼部161所供給之從PCE讀出的關於揚聲器配置之資訊等，來決定各音訊資料的揚聲器配置。此外，揚聲器配置決定之際，排序處理部181所利用的資訊的參照目標，係依存於利用音訊資料的服務或應用程式，隨著音訊資料的聲道數等而事前決定。

一旦進行步驟S164之處理，則排序處理係結束，藉此，圖36的步驟S117之處理也結束，所以解碼處理係結束。

另一方面，於步驟S162中，若判定為識別資訊一致，則於步驟S165中，PCE解碼部161係將已讀出之揚聲器配置資訊視為有效，將揚聲器配置資訊供給至排序處理部181及降轉混音處理部152。又，此時，PCE解碼部161係將從PCE所讀出之關於揚聲器配置之資訊，也供給至排序處理部181及降轉混音處理部152。

於步驟S166中，排序處理部181係以根據從PCE解碼部161所供給之揚聲器配置資訊等所決定的揚聲器配置，將從切換部151所供給之音訊資料予以輸出。亦即，各聲道的音訊資料，係按照揚聲器配置資訊等所決定之順序而被排序，然後往後段輸出。一旦進行步驟S166 之處理，則排序處理係結束，藉此，圖36的步驟S117之處理也結束，所以解碼處理係結束。

如以上，解碼裝置141係進行來自PCE之註解領域的同步字組或CRC檢查碼之比對然後讀出揚聲器配置資訊，以相應於揚聲器配置資訊的配置，來輸出已被解碼之音訊資料。

如此，藉由讀出揚聲器配置資訊而決定揚聲器配置(音源位置)，垂直方向的音像重現就成為可能，可獲得更具臨場感之高品質聲音。

又，藉由使用同步字組和CRC檢查碼來讀出揚聲器配置資訊，就可更確實地從可能儲存有其他文字資訊的註解領域，讀出揚聲器配置資訊。亦即，可更確實地識別揚聲器配置資訊和其他資訊。

尤其是，在解碼裝置141中，根據同步字組一致、CRC檢查碼一致、及對齊資料之資料量一致這3個要素，來進行揚聲器配置資訊與其他資訊之識別，因此可抑制揚聲器配置資訊的誤偵測。藉由如此抑制揚聲器配置資訊的誤偵測，可以用正確的揚聲器配置來再生音訊資料，可獲得更具臨場感之高品質聲音。

[降轉混音處理之說明]

然後，參照圖39的流程圖，說明圖36的步驟S118之處理所對應的降轉混音處理。此時，從切換部151往降轉混音處理部152的切換部211會供給各聲道的音訊資料。

於步驟S191中，DSE解碼部162的擴充偵測部173，係從DSE的「MPEG4_ancillary_data()」內的「ancillary_data_status()」，讀出「ancillary_data_extension_status」。

步驟S192中，擴充偵測部173係判定所讀出的「ancillary_data_extension_status」是否為1。

於步驟S192中，若「ancillary_data_extension_status」並非1，亦即被判定為0時，則於步驟S193中，降轉混音處理部152係以預先決定之方法，來進行音訊資料的降轉混音。

例如降轉混音處理部152係使用從降轉混音資訊解碼部174所供給的「center_mix_level_value」或「surround_mix_level_value」所決定的係數，將來自切換部151的音訊資料進行降轉混音，供給至輸出部63。

此外，亦可設計成，若「ancillary_data_extension_status」為0，則無論如何都會進行降轉混音處理。

於步驟S194中，輸出部63，係將從降轉混音處理部152所供給之音訊資料，直接輸出至後段，結束降轉混音處理。藉此，圖36的步驟S118之處理就結束，因此解碼處理也結束。

相對於此，於步驟S192中，若判定「ancillary_data_extension_status」為1，則處理係往步驟S195前進。

於步驟S195中，降轉混音資訊解碼部174係讀出圖11所示的「MPEG4_ext_ancillary_data()」的「ext_downmixing_levels()」內的資訊，供給至降轉混音處理部152。藉此，例如圖13的「dmix_a_idx」及「dmix_b_idx」，就被讀出。

此外，若「MPEG4_ext_ancillary_data()」中所含之圖12所示的「ext_downmixing_levels_status」為0的情況下，則不進行「dmix_a_idx」及「dmix_b_idx」之讀出。

於步驟S196中，降轉混音資訊解碼部174係讀出「MPEG4_ext_ancillary_data()」的「ext_downmixing_global_gains()」內的資訊，供給至降轉混音處理部152。藉此，例如圖15所示的資訊，亦即「dmx_gain_5_sign」、「dmx_gain_5_idx」、「dmx_gain_2_sign」、及「dmx_gain_2_idx」，就被讀出。

此外，這些資訊的讀出，係當「MPEG4_ext_ancillary_data()」中所含之圖12所示的「ext_downmixing_global_gains_status」為0時，就不會進行。

於步驟S197中，降轉混音資訊解碼部174係讀出「MPEG4_ext_ancillary_data()」的「ext_downmixing_lfe_level()」內的資訊，供給至降轉混音處理部152。藉此，例如圖16所示的「dmix_lfe_idx」就被讀出。

此外，更詳言之，降轉混音資訊解碼部174係將圖12所示的「ext_downmixing_lfe_level_status」予以讀出，隨著「ext_downmixing_lfe_level_status」之值而進行「dmix_lfe_idx」之讀出。

亦即，「dmix_lfe_idx」之讀出，係當「MPEG4_ext_ancillary_data()」中所含之「ext_downmixing_lfe_level_status」為0時，就不進行。此情況下，在以下所說明的音訊資料從5.1聲道往2聲道之降轉混音中，LFE聲道的音訊資料係不被使用。亦即，對LFE聲道的音訊資料進行乘算的係數係為0。

於步驟S198中，降轉混音資訊解碼部174係從圖7所示的「MPEG4 ancillary data」的「bs_info()」，讀出被儲存在「pseudo_surround_enable」內的資訊，供給至降轉混音處理部152。

於步驟S199中，降轉混音處理部152係基於從分離部61所供給之降轉混音形式參數，而判定音訊資料是否為2聲道之輸出。

例如，降轉混音形式參數，是表示要進行從7.1聲道或是6.1聲道往2聲道的降轉混音、或從5.1聲道往2聲道之降轉混音時，則判定是2聲道之輸出。

於步驟S199中，若判定是2聲道之輸出，則處理係前進至步驟S200。此時，切換部214的輸出目標，係被切換至切換部216。

於步驟S200中，降轉混音處理部152係基於從分離部61而來之降轉混音形式參數，而判定音訊資料是否為5.1聲道之輸入。例如降轉混音形式參數是表示要進行從5.1聲道往2聲道之降轉混音時，則判定輸入是5.1聲道。

於步驟S200中，若判定輸入不是5.1聲道，則處理係往步驟S201前進，進行從7.1聲道或6.1聲道往2聲道的降轉混音。

此情況下，切換部211係將從切換部151所供給之音訊資料，供給至切換部212。又，切換部212係根據從PCE解碼部161所供給之關於揚聲器配置之資訊，而將從切換部211所供給之音訊資料，供給至降轉混音部213-1至降轉混音部213-4之某一者。例如，當音訊資料是6.1聲道之資料時，則各聲道的音訊資料係被供給至降轉混音部213-1。

於步驟S201中，降轉混音部213係根據從降轉混音資訊解碼部174所供給的從「ext_downmixing_levels()」所讀出的「dmix_a_idx」及「dmix_b_idx」，進行往5.1聲道的降轉混音處理。

例如，當音訊資料是被供給至降轉混音部213-1時，降轉混音部213-1係參照圖19所示的表，將對「dmix_a_idx」及「dmix_b_idx」之值所決定的定數，分別設成定數g1及g2。然後，降轉混音部213-1係將定數g1及g2，分別當作乘算部242與乘算部243、及乘算部 244中所使用的係數，進行式(6)之演算，生成5.1聲道的音訊資料，供給至切換部214。

同樣地，當音訊資料是被供給至降轉混音部213-2時，降轉混音部213-2係將對「dmix_a_idx」及「dmix_b_idx」之值所決定的定數，分別設成定數e1及e2。然後，降轉混音部213-2係將定數e1及e2，分別當作乘算部273與乘算部274、及乘算部272與乘算部275中所使用的係數，來進行式(4)之演算，將所得到的5.1聲道之音訊資料，供給至切換部214。

又，當音訊資料是被供給至降轉混音部213-3時，降轉混音部213-3係將對「dmix_a_idx」及「dmix_b_idx」之值所決定的定數，分別設成定數d1及d2。然後，降轉混音部213-3係將定數d1及d2，分別當作乘算部302與乘算部303、及乘算部304與乘算部305中所使用的係數，來進行式(3)之演算，將所得到的音訊資料，供給至切換部214。

然後，當音訊資料是被供給至降轉混音部213-4時，降轉混音部213-4係將對「dmix_a_idx」及「dmix_b_idx」之值所決定的定數，分別設成定數f1及f2。然後，降轉混音部213-4係將定數f1及f2，分別當作乘算部332與乘算部333、及乘算部334與乘算部335中所使用的係數，來進行式(5)之演算，將所得到的音訊資料，供給至切換部214。

一旦5.1聲道的音訊資料被供給至切換部 214，則切換部214係將來自降轉混音部213的音訊資料，供給至切換部216。然後，切換部216係隨著從降轉混音資訊解碼部174所供給的「pseudo_surround_enable」之值，而將來自切換部214的音訊資料，供給至降轉混音部217-1或降轉混音部217-2。

例如，若「pseudo_surround_enable」之值是0，則音訊資料係被供給至降轉混音部217-1，若「pseudo_surround_enable」之值是1，則音訊資料係被供給至降轉混音部217-2。

於步驟S202中，降轉混音部217係基於從降轉混音資訊解碼部174所供給之關於降轉混音之資訊，來進行從切換部216所供給之音訊資料的往2聲道之降轉混音處理。亦即，基於「downmixing_levels_MPEG4()」內的資訊，和「ext_downmixing_lfe_level()」內的資訊，來進行往2聲道的降轉混音處理。

例如，當音訊資料是被供給至降轉混音部217-1時，降轉混音部217-1係參照圖19的表，將對「center_mix_level_value」及「surround_mix_level_value」之值所決定的定數，分別設成定數a及b。又，降轉混音部217-1係參照圖18所示的表，將對「dmix_lfe_idx」之值所決定的定數設成定數c。

然後，降轉混音部217-1係將定數a、b、及c 當作乘算部363與乘算部364、乘算部362、及乘算部365中所使用的係數，進行式(1)之演算，將所得到的2聲道之音訊資料，供給至增益調整部218。

又，當音訊資料是被供給至降轉混音部217-2時，降轉混音部217-2係和降轉混音部217-1之情形同樣地決定定數a、b、及c。然後，降轉混音部217-2係將定數a、b、及c當作乘算部403與乘算部404、乘算部402、及乘算部405中所使用的係數，進行式(2)之演算，將所得到的音訊資料，供給至增益調整部218。

於步驟S203中，增益調整部218係根據從降轉混音資訊解碼部174所供給的從「ext_downmixing_global_gains()」所讀出的資訊，進行來自降轉混音部217的音訊資料的增益調整。

具體而言，增益調整部218係根據從「ext_downmixing_global_gains()」所讀出「dmx_gain_5_sign」、「dmx_gain_5_idx」、「dmx_gain_2_sign」、及「dmx_gain_2_idx」，來計算式(11)，算出增益值dmx_gain_7to2。然後，增益調整部218，係對各聲道的音訊資料乘算增益值dmx_gain_7to2，供給至輸出部63。

於步驟S204中，輸出部63，係將從增益調整部218所供給之音訊資料，直接輸出至後段，結束降轉混音處理。藉此，圖36的步驟S118之處理就結束，因此解碼處理也結束。

此外，從輸出部63輸出音訊資料的情況，係有從排序處理部181輸出音訊資料時，和來自降轉混音處理部152的音訊資料被直接輸出時。在輸出部63的後段，係可預先決定這些音訊資料的2種輸出之何者會被使用。

又，於步驟S200中，若判定輸入是5.1聲道，則處理係往步驟S205前進，進行從5.1聲道往2聲道的降轉混音。

此情況下，切換部211係將從切換部151所供給之音訊資料，供給至切換部216。又，切換部216係隨著從降轉混音資訊解碼部174所供給的「pseudo_surround_enable」之值，而將來自切換部211的音訊資料，供給至降轉混音部217-1或降轉混音部217-2。

於步驟S205中，降轉混音部217係基於從降轉混音資訊解碼部174所供給之關於降轉混音之資訊，來進行從切換部216所供給之音訊資料的往2聲道之降轉混音處理。此外，在步驟S205中，係進行和步驟S202相同的處理。

於步驟S206中，增益調整部218係根據從降轉混音資訊解碼部174所供給的從「ext_downmixing_global_gains()」所讀出的資訊，進行來自降轉混音部217的音訊資料的增益調整。

具體而言，增益調整部218係根據從「ext_downmixing_global_gains()」所讀出「dmx_gain_2_sign」及「dmx_gain_2_idx」，來計算式(9)，將其結果所得之音訊資料，供給至輸出部63。

於步驟S207中，輸出部63，係將從增益調整部218所供給之音訊資料，直接輸出至後段，結束降轉混音處理。藉此，圖36的步驟S118之處理就結束，因此解碼處理也結束。

然後，於步驟S199中，若不是2聲道之輸出，亦即判定是5.1聲道之輸出時，則處理係往步驟S208前進，進行從7.1聲道或6.1聲道往5.1聲道的降轉混音。

此情況下，切換部211係將從切換部151所供給之音訊資料，供給至切換部212。又，切換部212係根據從PCE解碼部161所供給之關於揚聲器配置之資訊，而將從切換部211所供給之音訊資料，供給至降轉混音部213-1至降轉混音部213-4之某一者。然後，切換部214的輸出目標係被設成增益調整部215。

於步驟S208中，降轉混音部213係根據從降轉混音資訊解碼部174所供給的從「ext_downmixing_levels()」所讀出的「dmix_a_idx」及「dmix_b_idx」，進行往5.1聲道的降轉混音處理。此外，在步驟S208中，係進行和步驟S201相同的處理。

一旦往5.1聲道的降轉混音處理被進行，音訊資料是從降轉混音部213往切換部214供給，則切換部 214係將所被供給的音訊資料，供給至增益調整部215。

於步驟S209中，增益調整部215係根據從降轉混音資訊解碼部174所供給的從「ext_downmixing_global_gains()」所讀出的資訊，進行來自切換部214的音訊資料的增益調整。

具體而言，增益調整部215係根據從「ext_downmixing_global_gains()」所讀出「dmx_gain_5_sign」及「dmx_gain_5_idx」，來計算式(7)，將其結果所得之音訊資料，供給至輸出部63。

於步驟S210中，輸出部63，係將從增益調整部215所供給之音訊資料，直接輸出至後段，結束降轉混音處理。藉此，圖36的步驟S118之處理就結束，因此解碼處理也結束。

如以上，解碼裝置141係基於從編碼位元串流所讀出的資訊，來進行音訊資料的降轉混音。

例如，在編碼位元串流中，係在DSE含有「pseudo_surround_enable」，因此可在複數方法當中，以最適合於音訊資料的方法，進行從5.1聲道往2聲道的降轉混音處理。藉此，在解碼側上，可獲得更具臨場感之高品質聲音。

又，在編碼位元串流中，表示是否含有擴充資訊之資訊，係被儲存在「ancillary_data_extension_status」中。因此，若參照該資訊，則可特定出擴充領域裡是否含有擴充資訊。若能獲得此種擴充資訊，則可用更高的自由度來將音訊資料進行降轉混音，因此可獲得更具臨場感之高品質聲音。

順便一提，上述一連串處理，係可藉由硬體來執行，也可藉由軟體來執行。在以軟體來執行一連串之處理時，構成該軟體的程式，係可安裝至電腦。此處，電腦係包含：被組裝在專用硬體中的電腦、或藉由安裝各種程式而可執行各種機能的例如通用之個人電腦等。

圖40係以程式來執行上述一連串處理的電腦的硬體之構成例的區塊圖。

於電腦中，CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503，係藉由匯流排504而被彼此連接。

在匯流排504上係還連接有輸出入介面505。輸出入介面505上係連接有：輸入部506、輸出部507、記錄部508、通訊部509、及驅動機510。

輸入部506，係由鍵盤、滑鼠、麥克風、攝像元件等所成。輸出部507係由顯示器、揚聲器等所成。記錄部508，係由硬碟或非揮發性記憶體等所成。通訊部509係由網路介面等所成。驅動機510係驅動：磁碟、光碟、光磁碟、或半導體記憶體等之可移除式媒體511。

在如以上構成的電腦中，藉由CPU501而例如將記錄部508中所記錄之程式透過輸出入介面505及匯流排504，而載入至RAM503裡並加以執行，就可進行上述一連串處理。

電腦(CPU501)所執行的程式，係可記錄在例如封裝媒體等之可移除式媒體511中而提供。又，程式係可透過區域網路、網際網路、數位衛星播送這類有線或無線的傳輸媒介而提供。

在電腦中，程式係藉由將可移除式媒體511裝著至驅動機510，就可透過輸出入介面505，安裝至記錄部508。又，程式係可透過有線或無線之傳輸媒體，以通訊部509接收之，安裝至記錄部508。除此以外，程式係可事前安裝在ROM502或記錄部508中。

此外，電腦所執行的程式，係可為依照本說明書所說明之順序而在時間序列上進行處理的程式，也可平行地、或呼叫進行時等必要之時序上進行處理的程式。

又，本技術的實施形態係不限定於上述實施形態，在不脫離本技術主旨的範圍內可做各種變更。

例如，本技術係亦可將1個機能透過網路而分擔給複數台裝置，採取共通進行處理的雲端運算之構成。

又，上述的流程圖中所說明的各步驟，係可由1台裝置來執行以外，亦可由複數台裝置來分擔執行。

甚至，若1個步驟中含有複數處理的情況下，該1個步驟中所含之複數處理，係可由1台裝置來執行以外，也可由複數台裝置來分擔執行。

甚至，本技術係亦可採取以下構成。

[1]一種解碼裝置，係具備：解碼部，係將編碼位元串流中所含之音訊資料，予以解碼；和讀出部，係從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；和輸出部，係基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。

[2]如[1]所記載之解碼裝置，其中，前記音源位置資訊，係為用來表示前記音源之高度是與使用者大約同高、前記使用者之上方、或前記使用者之下方之哪一者的資訊。

[3]如[1]或[2]所記載之解碼裝置，其中，前記可儲存任意資料之領域中，係儲存有用來識別前記音源位置資訊之有無的識別資訊；前記讀出部，係基於前記識別資訊而讀出前記音源位置資訊。

[4]如[3]所記載之解碼裝置，其中，在前記可儲存任意資料之領域中，作為前記識別資訊而儲存有預先決定之第1識別資訊、和基於前記音源位置資訊而被算出的第2識別資訊。

[5]如[4]所記載之解碼裝置，其中，前記讀出部，係當前記可儲存任意資料之領域中所含之前記第1識別資訊是預先決定之特定資訊，且從前記可儲存任意資料之領域所讀出之前記第2識別資訊是與基於已被讀出之前記音源位置資訊而被算出的前記第2識別資訊一致時，則認定前記音源位置資訊是有效之資訊。

[6]如[5]所記載之解碼裝置，其中，前記第2識別資訊，係根據對於含有前記音源位置資訊之資訊進行位元組對齊而獲得之資訊，而被算出。

[7]一種解碼方法，係含有以下步驟：將編碼位元串流中所含之音訊資料，予以解碼；從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。

[8]一種程式，係令電腦執行包含以下步驟之處理：將編碼位元串流中所含之音訊資料，予以解碼；從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。

[9]一種編碼裝置，係具備：取得部，係取得關於音源之高度之音源位置資訊；和編碼部，係將音訊資料及前記音源位置資訊予以編碼；和打包部，係將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。

[10]如[9]所記載之編碼裝置，其中，前記音源位置資訊，係為用來表示前記音源之高度是與使用者大約同高、前記使用者之上方、或前記使用者之下方之哪一者的資訊。

[11]如[9]或[10]所記載之編碼裝置，其中，前記可儲存任意資料之領域中，係儲存有前記音源位置資訊，還有用來識別前記音源位置資訊之有無的識別資訊。

[12]如[11]所記載之編碼裝置，其中，在前記可儲存任意資料之領域中，作為前記識別資訊而儲存有預先決定之第1識別資訊、和基於前記音源位置資訊而被算出的第2識別資訊。

[13]如[12]所記載之編碼裝置，其中，在前記可儲存任意資料之領域中係還儲存有：用來指示對含前記音源位置資訊之資訊執行位元組對齊的資訊、以及用來指示將根據前記位元組對齊所得到之資訊而被算出的前記第2識別資訊、和前記可儲存任意資料之領域中所儲存之前記第2識別資訊進行比對的資訊。

[14]一種編碼方法，係含有以下步驟：取得關於音源之高度之音源位置資訊；將音訊資料及前記音源位置資訊予以編碼；將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。

[15]一種程式，係令電腦執行包含以下步驟之處理：取得關於音源之高度之音源位置資訊；將音訊資料及前記音源位置資訊予以編碼；將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。

Claims

一種解碼裝置，係具備：解碼部，係將編碼位元串流中所含之音訊資料，予以解碼；和讀出部，係從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；和輸出部，係基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。
如請求項1所記載之解碼裝置，其中，前記音源位置資訊，係為用來表示前記音源之高度是與使用者大約同高、前記使用者之上方、或前記使用者之下方之哪一者的資訊。
如請求項2所記載之解碼裝置，其中，前記可儲存任意資料之領域中，係儲存有用來識別前記音源位置資訊之有無的識別資訊；前記讀出部，係基於前記識別資訊而讀出前記音源位置資訊。
如請求項3所記載之解碼裝置，其中，在前記可儲存任意資料之領域中，作為前記識別資訊而儲存有預先決定之第1識別資訊、和基於前記音源位置資訊而被算出的第2識別資訊。
如請求項4所記載之解碼裝置，其中，前記讀出部，係當前記可儲存任意資料之領域中所含之前記第1識別資訊是預先決定之特定資訊，且從前記可儲存任意資料之領域所讀出之前記第2識別資訊是與基於已被讀出之前記音源位置資訊而被算出的前記第2識別資訊一致時，則認定前記音源位置資訊是有效之資訊。
如請求項5所記載之解碼裝置，其中，前記第2識別資訊，係根據對於含有前記音源位置資訊之資訊進行位元組對齊而獲得之資訊，而被算出。
一種解碼方法，係含有以下步驟：將編碼位元串流中所含之音訊資料，予以解碼；從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。
一種程式，係令電腦執行包含以下步驟之處理：將編碼位元串流中所含之音訊資料，予以解碼；從可儲存前記編碼位元串流之任意資料的領域，讀出前記音訊資料的關於音源之高度之音源位置資訊；基於前記音源位置資訊，而輸出已被解碼之前記音訊資料。
一種編碼裝置，係具備：取得部，係取得關於音源之高度之音源位置資訊；和編碼部，係將音訊資料及前記音源位置資訊予以編碼；和打包部，係將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。
如請求項9所記載之編碼裝置，其中，前記音源位置資訊，係為用來表示前記音源之高度是與使用者大約同高、前記使用者之上方、或前記使用者之下方之哪一者的資訊。
如請求項10所記載之編碼裝置，其中，前記可儲存任意資料之領域中，係儲存有前記音源位置資訊，還有用來識別前記音源位置資訊之有無的識別資訊。
如請求項11所記載之編碼裝置，其中，在前記可儲存任意資料之領域中，作為前記識別資訊而儲存有預先決定之第1識別資訊、和基於前記音源位置資訊而被算出的第2識別資訊。
如請求項12所記載之編碼裝置，其中，在前記可儲存任意資料之領域中係還儲存有：用來指示對含前記音源位置資訊之資訊執行位元組對齊的資訊、以及用來指示將根據前記位元組對齊所得到之資訊而被算出的前記第2識別資訊、和前記可儲存任意資料之領域中所儲存之前記第2識別資訊進行比對的資訊。
一種編碼方法，係含有以下步驟：取得關於音源之高度之音源位置資訊；將音訊資料及前記音源位置資訊予以編碼；將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。
一種程式，係令電腦執行包含以下步驟之處理：取得關於音源之高度之音源位置資訊；將音訊資料及前記音源位置資訊予以編碼；將已被編碼之前記音源位置資訊，儲存在可儲存任意資料之領域，生成含有已被編碼之前記音訊資料和前記音源位置資訊的編碼位元串流。