TW201717631A - 於多層視訊檔案中支援隨機存取及層與子層之切換 - Google Patents

於多層視訊檔案中支援隨機存取及層與子層之切換 Download PDF

Info

Publication number
TW201717631A
TW201717631A TW105133093A TW105133093A TW201717631A TW 201717631 A TW201717631 A TW 201717631A TW 105133093 A TW105133093 A TW 105133093A TW 105133093 A TW105133093 A TW 105133093A TW 201717631 A TW201717631 A TW 201717631A
Authority
TW
Taiwan
Prior art keywords
sample
track
group
layer
logic box
Prior art date
Application number
TW105133093A
Other languages
English (en)
Inventor
范尼 翰睿
王益魁
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201717631A publication Critical patent/TW201717631A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一種器件於儲存一多層位元串流之一檔案中產生含有用於一播放軌之後設資料的一播放軌邏輯框。該器件於該播放軌邏輯框中產生含有一樣本群組描述項之一樣本描述邏輯框。另外,該器件於該播放軌邏輯框中產生用於該播放軌之一樣本至群組邏輯框。該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中。該樣本至群組邏輯框指定存在於該播放軌中的層當中的目標層。該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像。該樣本群組為以下中之一者:一時間子層存取樣本群組且該特定圖像類型為一時間子層存取圖像類型或一逐步時間子層存取樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型。

Description

於多層視訊檔案中支援隨機存取及層與子層之切換
本發明係關於視訊編碼及解碼。
數位視訊能力可併入至廣泛範圍之器件中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話(所謂的「智慧型電話」)、視訊電話會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如,由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)定義之標準、高效率視訊寫碼(HEVC)標準及此等標準之擴展中所描述的技術。該等視訊器件可藉由實施此等視訊壓縮技術更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。 視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測來減少或移除視訊序列中固有的冗餘。對於基於區塊之視訊寫碼,可將視訊片段(亦即,視訊訊框或視訊訊框之一部分)分割成視訊區塊。使用關於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼圖像之框內寫碼(I)片段中的視訊區塊。圖像之經框間寫碼(P或B)片段中的視訊區塊可使用關於同一圖像中之相鄰區塊中之參考樣本的空間預測或關於其他參考圖像中之參考樣本的時間預測。圖像可被稱作「訊框」。 空間或時間預測產生待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。經框間寫碼區塊係根據指向形成預測性區塊之參考樣本之區塊的運動向量來編碼,且殘餘資料指示經寫碼區塊與預測性區塊之間的差。根據框內寫碼模式及殘餘資料來編碼經框內寫碼區塊。為進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生隨後可經量化之殘餘係數。 在多視圖寫碼及可調式視訊寫碼中,經編碼視訊資料之位元串流包括多層。在多視圖寫碼中,不同層可對應於不同視圖。在可調式視訊寫碼中,除基礎層之外的層(亦即,增強層)可包括對位元串流之較低層提供質量增強(例如,時間增強、空間增強)的經編碼圖像。L-HEVC係指支援多層視訊寫碼之HEVC的擴展。 可在不影響視訊解碼器之能力的情況下將一層之「時間子層」的經寫碼圖像自該層移除以正確地解碼相同層之較低時間子層。移除時間子層之經寫碼圖像可降低該層之訊框速率。不同層之時序並列圖像可稱為屬於同一時間子層。大體而言,具有更大識別符(亦即,時間識別符)之時間子層在解碼時具有更高訊框速率。時間子層向上切換可指自解碼第一時間子層切換至解碼第二時間子層,其中第二時間子層之時間識別符大於第一時間子層之時間識別符。此切換可與開始將尚未經轉發之某一子層之NAL單元轉發直至該點相關聯。在HEVC中,存在兩種與子層切換點相關聯之圖像類型,即時間子層存取(TSA)圖像類型及逐步時間子層存取(STSA)圖像類型。 經編碼視訊資料可儲存於檔案中。用於儲存多層HEVC位元串流(亦即,L-HEVC位元串流)之檔案格式正在研發中。在檔案格式中,檔案之每一播放軌可包括一系列樣本。播放軌之每一樣本可包括一或多個時間上並列之經編碼圖像。因此,播放軌可包括屬於一或多個不同層之經編碼圖像。用於L-HEVC之檔案格式的草案具有識別含有TSA及STSA圖像之樣本的經定義之樣本至群組邏輯框。然而,至少由於播放軌可包括屬於不同層之經編碼圖像,因此用於L-HEVC之檔案格式的草案可不定義用於有效時間子層切換之充足資訊。
一般而言,本發明係關於以基於ISO之媒體檔案格式及基於其導出之檔案格式儲存視訊內容。更特定言之,本發明描述在檔案內的播放軌之樣本未對準時用於定義操作點資訊樣本群組之技術。應注意,術語「操作點(operation point)」及「操作點(operating point)」在本文中可互換地使用。 在一個實例中,本發明描述一種處理視訊資料之方法,該方法包含:於儲存多層位元串流的檔案中產生含有用於播放軌之後設資料的播放軌邏輯框,該位元串流包含形成該視訊資料之圖像表示的位元之序列,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之序列,其中產生播放軌邏輯框包含:於播放軌邏輯框中產生含有樣本群組描述項的樣本描述邏輯框;以及於播放軌邏輯框中產生播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本,該樣本至群組邏輯框指定存在於播放軌之層當中的目標層,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且該樣本群組為以下中之一者:時間子層存取(TSA)樣本群組且該特定圖像類型為時間子層存取圖像類型或逐步時間子層存取(STSA)樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。 在另一實例中,本發明描述一種處理視訊資料之方法,該方法包含:自儲存多層位元串流的檔案獲得含有用於播放軌之後設資料的播放軌邏輯框,該位元串流包含形成視訊資料之圖像表示的位元之序列,該播放軌含有媒體內容,該播放軌之媒體內容包含樣本之序列,其中獲得播放軌邏輯框包含:自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框;以及自播放軌邏輯框獲得播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本;基於樣本至群組邏輯框中之語法元素判定存在於播放軌中之層當中的目標層,該等目標層中之每一者含有屬於特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型;以及基於包括含有該特定時間子層之經寫碼圖像的層的目標層將TSA或STSA樣本群組中之樣本識別為適合於時間子層向上切換至特定時間子層。 在另一實例中,本發明描述一種用於處理視訊資料之器件,該器件包含:一或多個處理電路,其經組態以:於儲存多層位元串流的檔案中產生含有用於播放軌之後設資料的播放軌邏輯框,該多層位元串流包含形成視訊資料之圖像表示的位元之序列,該播放軌含有媒體內容,播放軌之媒體內容包含樣本之序列,其中一或多個處理電路經組態以使得作為產生播放軌邏輯框之部分,一或多個處理電路:於播放軌邏輯框中產生含有樣本群組描述項之樣本描述邏輯框;以及於播放軌邏輯框中產生播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本,樣本至群組邏輯框指定存在於播放軌中之層當中的目標層,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型;及資料儲存媒體,其耦合至一或多個處理電路,該資料儲存媒體經組態以儲存檔案。 在另一實例中,本發明描述一種用於處理視訊資料之器件,該器件包含:資料儲存媒體,其經組態以儲存檔案,該檔案儲存包含形成視訊資料之圖像表示之位元之序列的多層位元串流;及一或多個處理電路,其耦合至資料儲存媒體,該一或多個處理電路經組態以:自檔案獲得含有用於播放軌之後設資料的播放軌邏輯框,該播放軌含有媒體內容,播放軌之媒體內容包含樣本之序列,其中一或多個處理電路經組態以使得作為獲得播放軌邏輯框之部分,該一或多個處理電路:自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框;以及自播放軌邏輯框獲得播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本;基於樣本至群組邏輯框中之語法元素判定存在於播放軌中之層當中的目標層,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型;以及基於包括含有特定時間子層之經寫碼圖像的層的目標層將TSA或STSA樣本群組中之樣本識別為適合於時間子層向上切換至特定時間子層。 在另一實例中,本發明描述一種用於處理視訊資料之器件,該器件包含:用於在儲存多層位元串流的檔案中產生含有用於播放軌之後設資料的播放軌邏輯框的構件,該多層位元串流包含形成視訊資料之圖像表示的位元之序列,該播放軌含有媒體內容,該播放軌之媒體內容包含樣本之序列,其中用於產生播放軌邏輯框之構件包括:用於在播放軌邏輯框中產生含有樣本群組描述項之樣本描述邏輯框的構件;用於在播放軌邏輯框中產生播放軌之樣本至群組邏輯框的構件,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本,樣本至群組邏輯框指定存在於播放軌中之層當中的目標層,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型;及用於儲存檔案之構件。 在另一實例中,本發明描述一種用於處理視訊資料之器件,該器件包含:用於儲存檔案之構件,該檔案儲存包含形成視訊資料之圖像表示之位元之序列的多層位元串流;及用於自檔案獲得含有用於播放軌之後設資料的播放軌邏輯框的構件,該播放軌含有媒體內容,播放軌之媒體內容包含樣本之序列,其中用於獲得播放軌邏輯框之構件包含:用於自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框的構件;及自播放軌邏輯框獲得播放軌之樣本至群組邏輯框的構件,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本;用於基於樣本至群組邏輯框中之語法元素判定存在於播放軌中之層當中的目標層的構件,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型;及用於基於包括含有特定時間子層之經寫碼圖像的層的目標層將TSA或STSA樣本群組中之樣本識別為適合於時間子層向上切換至特定時間子層。 在另一實例中,本發明描述一種具有儲存於其上之指令的電腦可讀儲存媒體,該等指令在經執行時使得用於處理視訊資料之器件:於儲存多層位元串流的檔案中產生含有用於播放軌之後設資料的播放軌邏輯框,該多層位元串流包含形成視訊資料之圖像表示的位元之序列,該播放軌含有媒體內容,播放軌之媒體內容包含樣本之序列,其中,作為使得器件產生播放軌邏輯框之部分,該等指令使得器件:於播放軌邏輯框中產生含有樣本群組描述項之樣本描述邏輯框;以及於播放軌邏輯框中產生播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本,樣本至群組邏輯框指定存在於播放軌中之層當中的目標層,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。 在另一實例中,本發明描述具有儲存於其上之指令的電腦可讀儲存媒體,該等指令在經執行時使得用於處理視訊資料之器件:儲存檔案,該檔案儲存包含形成視訊資料之圖像表示的位元之序列的多層位元串流;以及自檔案獲得含有用於播放軌之後設資料的播放軌邏輯框,該播放軌含有媒體內容,播放軌之媒體內容包含樣本之序列,其中作為使得器件獲得播放軌邏輯框之部分,該等指令使得器件:自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框;以及自播放軌邏輯框獲得播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本;基於樣本至群組邏輯框中之語法元素判定存在於播放軌中之層當中的目標層,該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型;以及基於包括含有特定時間子層之經寫碼圖像的層的目標層將TSA或STSA樣本群組中之樣本識別為適合於時間子層向上切換至特定時間子層。 在附圖及以下描述中闡明本發明之一或多個實例的細節。其他特徵、目標及優勢自描述、圖式及申請專利範圍將係顯而易見的。
本申請案主張2015年10月14日申請之美國臨時專利申請案第62/241,713號之權益,該申請案之全部內容在此以引用之方式併入。 一般而言,本發明係關於以國際標準組織(ISO)基媒體檔案格式(ISOBMFF)及基於ISO基媒體檔案格式之檔案格式儲存視訊內容。本發明之特定技術在儲存於一或多個播放軌中之多層位元串流中支援隨機存取及層與子層之切換。 舉例而言,基於ISO基媒體檔案格式之檔案格式經研發用於攜載經編碼視訊資料之多層位元串流,諸如分層高效視訊寫碼(L-HEVC)位元串流。多層位元串流包含多個層。各層包含在不同輸出時間發生之一序列經編碼圖像(亦即,經寫碼圖像)。在可調式視訊寫碼之情況下,多層位元串流之層可包括基礎層及一或多個增強層。基礎層可不參考該等增強層中之任一者來解碼。該等增強層可在空間上或時間上增強基礎層。舉例而言,增強層可比基礎層具有更高的訊框速率。因此,增強層可包括輸出時間之經編碼圖像且基礎層不包括該輸出時間之經編碼圖像。在其中多層位元串流之第一層包括在輸出時間之經編碼圖像且多層位元串流之第二層不包括輸出時間之經編碼圖像之情況下,認為第一層中之經編碼圖像未與第二層中之經編碼圖像對準。在多視圖視訊寫碼中,多層位元串流之層可對應於不同視圖中之經編碼圖像。 符合檔案格式之檔案包含被稱為「邏輯框(box)」之一組資料結構。檔案之邏輯框可包括媒體資料邏輯框,該等媒體資料邏輯框中之每一者包括一或多個樣本。樣本可包括相同存取單元(亦即,具有相同輸出時間)中之一或多個經編碼圖像。舉例而言,樣本可包括具有相同輸出時間但在不同層中之經編碼圖像。 另外,檔案之邏輯框可包括一或多個含有用於檔案之播放軌的後設資料之播放軌邏輯框。舉例而言,播放軌邏輯框可包括樣本表邏輯框。用於播放軌之後設資料包括一或多個樣本描述項。各樣本與播放軌之樣本描述項中之一者相關聯。據說樣本屬於基於播放軌之樣本表邏輯框(STBL)中所列出之樣本的播放軌。由於播放軌之單獨樣本可包括屬於多個層之經編碼圖像且此等層之經編碼圖像可未對準,因此播放軌之不同樣本可包括不同數目之經編碼圖像。 樣本群組為播放軌中之樣本群組。用於播放軌之後設資料可包括一或多個樣本至群組邏輯框及一或多個樣本群組描述邏輯框。樣本至群組邏輯框含有一或多個樣本群組項。樣本群組描述邏輯框包括一或多個群組描述項,亦被稱作樣本群組描述項。各群組描述項包括關於(亦即,描述)樣本群組之資訊。播放軌之樣本至群組邏輯框之各對應樣本群組項將播放軌之一或多個樣本映射至樣本群組。樣本群組描述邏輯框包含對樣本群組之描述。 樣本群組之樣本共用共同特性。舉例而言,用於攜載L-HEVC位元串流之檔案格式的草案定義若干類型之樣本群組。舉例而言,播放軌可包括一或多個時間子層存取(TSA)樣本群組,該等樣本群組可表示為『tsas』樣本群組。『tsas』樣本群組之各對應樣本含有一或多個TSA圖像。TSA圖像實現在該TSA圖像處向上切換至含有TSA圖像之子層或緊接著較低子層之任何較高子層。在另一實例中,播放軌可包括一或多個逐步時間子層存取(STSA)樣本群組,該等樣本群組可表示為『stsa』樣本群組。『stsa』樣本群組之各對應樣本含有一或多個STSA圖像。STSA圖像實現在該STSA圖像上向上切換至緊接著較低子層之含有STSA圖像之子層。因此,與TSA圖像相比,STSA不必實現向上切換至任何較高子層,僅至含有STSA圖像之子層。 用於攜載L-HEVC位元串流之檔案格式的最新草案在儲存於一或多個播放軌中之多層位元串流中並不充分支援隨機存取及層與子層之切換。舉例而言,用於攜載L-HEVC位元串流之檔案格式的草案並不提供用於描述『tsas』及『stsa』樣本群組之目標層的機制。舉例而言,用於『tsas』及『stsa』樣本群組之群組描述項並不指定目標層。 然而,判定用於『tsas』及『stsa』樣本之目標層的能力可有益於特定應用。舉例而言,研究一種具有兩個層且各層中有四個時間子層之SHVC位元串流(720p及1080p - 15幀/秒(fps)、30 fps、60 fps及120 fps)。在此實例中,假設由於不良網路條件,視訊播放機將解碼及回放在15 fps時降至1080p (亦即,操作特定增強層(EL)及時間子層0)。在此實例中,考慮在應用希望變回更高解析度及更高訊框速率播放時存在若干可能性。舉例而言,若應用希望以最高訊框速率播放,則可能需要應用找到其中特定EL具有TSA圖像之存取單元(AU)。然而,在基礎層(BL)而不在EL中具有TSA之存取單元不能用作開始解碼EL之最高時間子層的點。在『tsas』群組描述項中無目標層之指示的情況下,應用可判定樣本包括TSA,但TSA不在特定EL中。因此,在不能夠判定『tsas』群組描述項中之該等目標層的情況下,應用可不能夠判定樣本是否為時間子層向上切換至特定EL之合適位置。類似情況將適用於『stsa』樣本群組應用。因此,指定用於如本發明中所描述之『tsas』及『stsa』樣本群組之目標層可改良計算器件(例如,內容傳送網路器件、串流伺服器等)輔助時間子層切換之功能,反過來其可增強解碼器件在表現視訊資料之品質位準上之性能,該視訊資料適合於在其上傳輸經編碼視訊資料之媒體或網路的頻寬。 圖1為說明可利用本發明之技術的實例視訊寫碼系統10的方塊圖。如本文中所使用,術語「視訊寫碼器」大體上係指視訊編碼器及視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」大體上可指視訊編碼或視訊解碼。 如圖1中所展示,視訊寫碼系統10包括源器件12及目的地器件14。源器件12產生經編碼之視訊資料。因此,源器件12可被稱作視訊編碼器件或視訊編碼裝置。目的地器件14可解碼由源器件12產生之經編碼視訊資料。因此,目的地器件14可被稱作視訊解碼器件或視訊解碼裝置。源器件12及目的地器件14可為視訊寫碼器件或視訊寫碼裝置之實例。本發明可使用術語「視訊處理器件」來指代處理視訊資料之器件。源器件12及目的地器件14為視訊處理器件之實例。其他類型之視訊處理器件包括多工及解多工媒體資料(諸如MPEG-2資料串流)之器件。 源器件12及目的地器件14可包含廣泛範圍之器件,該等器件包括桌上型電腦、行動計算器件、筆記型(例如,膝上型)電腦、平板電腦、機頂盒、諸如所謂的「智慧型」電話之電話手持機、電視、攝影機、顯示器件、數位媒體播放機、視訊遊戲控制台、車載電腦或類似者。 目的地器件14可經由頻道16自源器件12接收經編碼視訊資料。頻道16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14之一或多個媒體或器件。在一個實例中,頻道16可包含使源器件12能夠即時地將經編碼視訊資料直接傳輸至目的地器件14之一或多個通信媒體。在此實例中,源器件12可根據諸如無線通信協定之通訊標準來調變經編碼視訊資料,且可將經調變視訊資料傳輸至目的地器件14。一或多個通信媒體可包括無線及/或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。一或多個通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或全球網路(例如,網際網路))之部分。一或多個通信媒體可包括路由器、交換器、基地台,或促進自源器件12至目的地器件14之通信的其他設備。 在另一實例中,頻道16可包括儲存由源器件12產生之經編碼視訊資料的儲存媒體。在此實例中,目的地裝置14可(例如)經由磁碟存取或卡存取而存取儲存媒體。儲存媒體可包括多種本端存取式資料儲存媒體,諸如藍光光碟、DVD、CD-ROM、快閃記憶體,或用於儲存經編碼視訊資料之其他合適的數位儲存媒體。 在另一實例中,頻道16可包括儲存由源器件12產生之經編碼視訊資料的檔案伺服器或另一中間儲存器件。在此實例中,目的地器件14可經由串流或下載而存取儲存於檔案伺服器或其他中間儲存器件處的經編碼視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地器件14之類型的伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、檔案傳送協定(file transfer protocol;FTP)伺服器、網路附接儲存(network attached storage;NAS)器件及本端磁碟機。 目的地器件14可經由諸如網際網路連接之標準資料連接存取經編碼視訊資料。資料連接之實例類型可包括適用於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜數據機等)或兩者之組合。經編碼視訊資料自檔案伺服器的傳輸可為串流傳輸、下載傳輸或兩者之組合。 本發明之技術不限於無線應用或設定。該等技術可應用於支援多種多媒體應用之視訊寫碼,諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸,例如經由網際網路編碼儲存於資料儲存媒體上之視訊資料、解碼儲存於資料儲存媒體上之視訊資料,或其他應用。在一些實例中,視訊寫碼系統10可經組態以支援單向或雙向視訊傳輸,從而支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。 圖1中所說明之視訊寫碼系統10僅為實例,且本發明之技術可應用於不必包括編碼器件與解碼器件之間的任何資料通信的視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,自經由網路或類似者而串流傳輸之本端記憶體擷取資料。視訊編碼器件可編碼資料且將資料儲存至記憶體,及/或視訊解碼器件可自記憶體擷取資料並解碼資料。在許多實例中,由彼此不通信但簡單地將資料編碼至記憶體及/或自記憶體擷取並解碼資料之器件來執行編碼及解碼。 在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些實例中,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。視訊源18可包括例如視訊攝影機之視訊俘獲器件、含有先前所俘獲之視訊資料的視訊封存檔、用以自視訊內容提供者接收視訊資料的視訊饋入介面、及/或用於產生視訊資料之電腦圖形系統,或視訊資料之此等源的組合。 視訊編碼器20可編碼來自視訊源18之視訊資料。在一些實例中,源器件12經由輸出介面22將經編碼視訊資料直接傳輸至目的地器件14。在其他實例中,經編碼視訊資料亦可儲存於儲存媒體或檔案伺服器上,以供目的地器件14稍後存取以用於解碼及/或播放。 在圖1之實例中,目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些實例中,輸入介面28包括接收器及/或數據機。輸入介面28可經由頻道16接收經編碼視訊資料。顯示器件32可與目的地器件14整合或可在目的地器件14外部。大體而言,顯示器件32顯示經解碼視訊資料。顯示器件32可包含各種顯示器件,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。 視訊編碼器20及視訊解碼器30各自可實施為各種合適電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。若該等技術部分實施於軟體中,則器件可儲存指令以供合適之非暫時性電腦可讀儲存媒體中之軟體使用且可使用一或多個處理器(例如,處理電路)在硬體中執行該等指令,從而執行本發明之技術。可將前述內容(包括硬體、軟體、硬體與軟體之組合等)中之任一者視為一或多個處理器。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別器件中之組合式編碼器/解碼器(CODEC)的部分。 本發明可大體上指視訊編碼器20或將某些資訊「傳訊」或「傳輸」至另一器件(諸如視訊解碼器30)之其他器件。術語「傳訊」或「傳輸」可大體上指用於解碼經壓縮視訊資料之語法元素及/或其他資料的通信。此通信可即時地或接近即時地發生。替代性地,此通信可在一時間跨度內發生,諸如可在編碼時在經編碼位元串流中將語法元素儲存至電腦可讀儲存媒體時發生,接著,可在儲存至此媒體之後由解碼器件在任一時間擷取該等語法元素。 此外,在圖1之實例中,視訊寫碼系統10包括檔案產生器件34。檔案產生器件34可接收藉由源器件12產生之經編碼視訊資料。檔案產生器件34可產生包括經編碼視訊資料之檔案。目的地器件14可接收由檔案產生器件34產生之檔案。在各種實例中,源器件12及/或檔案產生器件34可包括各種類型之計算器件。舉例而言,源器件12及/或檔案產生器件34可包含視訊編碼器件、媒體察覺網路元件(MANE)、DASH察覺網路元件(DANE)、伺服器計算器件、個人計算器件、專用計算器件、商購計算器件或另一類型之計算器件。在一些實例中,檔案產生器件34為內容傳遞網路之部分。源器件12及/或檔案產生器件34可經由諸如鏈路16之頻道自源器件12接收經編碼視訊資料。此外,目的地器件14可經由諸如鏈路16之頻道自檔案產生器件34接收檔案。檔案產生器件34可視為視訊器件。如圖1之實例中所示,檔案產生器件34可包含記憶體31,該記憶體經組態以儲存含有經編碼視訊內容之檔案。 在一些實例中,源器件12或另一計算器件可產生包括經編碼視訊資料之檔案。為了易於解釋,本發明將源器件12通常描述為產生檔案。然而,應理解此等描述可大體上適用於計算器件。 描述於本發明中之技術可以各種視訊寫碼標準使用,包括不與特定視訊寫碼標準相關的視訊寫碼技術。視訊寫碼標準之實例包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual、ITU-T H.264或ISO/IEC MPEG-4 AVC,包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展,及高效視訊寫碼(HEVC),亦被稱作ITU-T H.265及ISO/IEC 23008-2,包括其可調式寫碼擴展(亦即,可調式高效視訊寫碼,SHVC)及多視圖擴展(亦即,多視圖高效視訊寫碼,MV-HEVC)。HEVC標準亦可被稱作Rec. ITU-T H .265 | ISO/IEC 23008-2。 ITU-T SG 16 WP 3及ISO/IEC JTC 1/SC 29/WG 11 (日本劄幌之第18次會議,2014年6月30日至2014年7月9日)之JCT-VC (JCTVC-R1013_v6)之題為「草案高效率視訊寫碼(HEVC)第2版、組合之格式範圍延伸(RExt)、可擴展性(SHVC),及多視圖(MV-HEVC)延伸」之HEVC草案規範(下文中稱為「JCTVC-R1013」或「Rec.ITU-T H.265 | ISO/IEC 23008-2」)自http://phenix.int-evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC-R1013-v6.zip獲得。MV-HEVC併入為Rec. ITU-T H.265 | ISO/IEC 23008-2之Annex G。SHVC併入為Rec. ITU-T H.265 | ISO/IEC 23008-2之Annex H。 在HEVC及其他視訊寫碼標準中,視訊序列通常包括一系列圖像。圖像亦可被稱作「訊框」。圖像可包括一或多個樣本陣列。舉例而言,圖像可包括三個樣本陣列,標示為SL 、SCb 及SCr 。SL 為明度樣本之二維陣列(亦即,區塊)。SCb 為Cb色度樣本之二維陣列。SCr 為Cr色度樣本之二維陣列。在其他個例中,圖像可為單色的且可僅包括明度樣本陣列。 為了產生圖像之經編碼表示,視訊編碼器20可產生一組寫碼樹型單元(CTU)。該等CTU中之每一者可包括明度樣本之寫碼樹型區塊(CTB)、色度樣本之兩個對應寫碼樹型區塊,及用於寫碼寫碼樹型區塊之樣本的語法結構。因此,圖像之SL 陣列可分割成CTB,圖像之SCb 陣列可分割成CTB,且圖像之SCr 陣列可分割成CTB。寫碼樹型區塊可為樣本之N×N區塊。CTU亦可被稱作「樹型區塊」或「最大寫碼單元(LCU)」。HEVC之CTU可廣泛地類似於諸如H.264/AVC之其他標準的巨集區塊。然而,CTU未必限於特定大小,且可包括一或多個寫碼單元(CU)。片段可包括按掃描次序(諸如,光柵掃描次序)連續排序的整數數目個CTU。 為了產生經寫碼CTU,視訊編碼器20可對CTU之寫碼樹型區塊遞迴地執行四分樹分割,以將寫碼樹型區塊劃分成寫碼區塊,因此命名為「寫碼樹型單元」。寫碼區塊為樣本之N×N區塊。CU可包括具有明度樣本陣列、Cb樣本陣列及Cr樣本陣列之圖像的明度樣本之寫碼區塊及色度樣本之兩個對應寫碼區塊,及用於寫碼該等寫碼區塊之樣本的語法結構。在單色圖像或具有三個單獨色彩平面之圖像中,CU可包含單個寫碼區塊及用於寫碼該寫碼區塊之樣本的語法結構。 視訊編碼器20可將CU之寫碼區塊分割為一或多個預測區塊。預測區塊可為應用相同預測的樣本之矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可為圖像之明度樣本的預測區塊,圖像之色度樣本的兩個對應預測區塊,及用以對該等預測區塊樣本進行預測的語法結構。視訊編碼器20可產生CU之每一PU的明度、Cb及Cr預測區塊之預測性明度、Cb及Cr區塊。在單色圖像或具有三個單獨色彩平面之圖像中,PU可包含單個預測區塊及用於預測該預測區塊的語法結構。視訊編碼器20可使用框內預測或框間預測來產生PU之預測性區塊。 在視訊編碼器20產生CU之一或多個PU的預測性區塊之後,視訊編碼器20可產生CU之殘餘區塊。CU之殘餘區塊中之每一樣本指示CU之PU的預測性區塊中之樣本與CU之寫碼區塊中之對應樣本之間的差異。舉例而言,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中之每一樣本指示CU之PU之預測性明度區塊中的明度樣本與CU之明度寫碼區塊中的對應樣本之間的差異。另外,視訊編碼器20可產生CU之Cb殘餘區塊。CU之Cb殘餘區塊中之每一樣本可指示CU之PU之預測性Cb區塊中的Cb樣本與CU之Cb寫碼區塊中的對應樣本之間的差異。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中之每一樣本可指示CU之PU之預測性Cr區塊中的Cr樣本與CU之Cr寫碼區塊中的對應樣本之間的差異。 此外,視訊編碼器20可使用四分樹分割將CU之殘餘區塊(例如,明度、Cb及Cr殘餘區塊)分解成一或多個變換區塊(例如,明度、Cb及Cr變換區塊)。變換區塊可為應用相同變換之樣本的矩形區塊。CU之變換單元(TU)可為明度樣本之變換區塊、色度樣本之兩個對應變換區塊及用以對該等變換區塊樣本進行變換的語法結構。因此,CU之每一TU可與明度變換區塊、Cb變換區塊及Cr變換區塊相關聯。與TU相關聯之明度變換區塊可為CU之明度殘餘區塊之子區塊。Cb變換區塊可為CU之Cb殘餘區塊之子區塊。Cr變換區塊可為CU之Cr殘餘區塊之子區塊。在單色圖像或具有三個單獨色彩平面之圖像中,TU可包含單個變換區塊及用以變換該變換區塊之樣本的語法結構。 視訊編碼器20可將一或多個變換應用於TU之變換區塊以產生TU之係數區塊。舉例而言,視訊編碼器20可將一或多個變換應用於TU之明度變換區塊以產生TU之明度係數區塊。視訊編碼器20可將一或多個轉變應用於TU之Cb變換區塊以產生TU之Cb係數區塊。視訊編碼器20可將一或多個變換應用於TU之Cr變換區塊以產生TU之Cr係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。 在產生係數區塊(例如,明度係數區塊、Cb係數區塊或Cr係數區塊)之後,視訊編碼器20可量化係數區塊。量化大體上指變換係數經量化以可能減少用以表示變換係數的資料之量從而提供進一步壓縮之過程。在視訊編碼器20量化係數區塊之後,視訊編碼器20可熵編碼指示經量化變換係數之語法元素。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文自適應性二進位算術寫碼(CABAC)。視訊編碼器20可在位元流中輸出經熵編碼之語法元素。 視訊編碼器20可輸出位元串流。位元串流可包括形成經寫碼圖像及相關聯資料之表示的位元之序列。位元串流可包含網路抽象層(NAL)單元之序列。該等NAL單元中之每一者包括NAL單元標頭且封裝原始位元組序列有效負載(RBSP)。NAL單元標頭可包括指示NAL單元類型碼之語法元素。藉由NAL單元之NAL單元標頭指定的NAL單元類型碼指示NAL單元之類型。RBSP可為含有封裝在NAL單元內的整數數目個位元組之語法結構。在一些情況下,RBSP包括零個位元。位元串流之NAL單元可包括經熵編碼之語法元素。 不同類型之NAL單元可封裝不同類型之RBSP。舉例而言,不同類型之NAL單元可封裝用於視訊參數集(VPS)、序列參數集(SPS)、圖像參數集(PPS)、經寫碼片段、補充增強資訊(SEI)等的不同RBSP。舉例而言,第一類型之NAL單元可封裝PPS之RBSP,第二類型之NAL單元可封裝經寫碼片段之RBSP,第三類型之NAL單元可封裝補充增強資訊(SEI)之RBSP等。封裝視訊寫碼資料之RBSP (與參數集及SEI訊息之RBSP相反)的NAL單元可被稱作視訊寫碼層(VCL) NAL單元。舉例而言,JCTVC-R1013將術語VCL NAL單元定義為用於經寫碼片段分段NAL單元及NAL單元之子集的集合術語,該等NAL單元具有經分類為JCTVC-R1013中之VCL NAL單元之nal_unit_type的保留值。SEI含有並非自VCL NAL單元解碼經寫碼圖像之樣本必需的資訊。 在圖1之實例中,視訊解碼器30接收由視訊編碼器20產生之位元串流。另外,視訊解碼器30可解析位元串流以自位元串流獲得語法元素。視訊解碼器30可至少部分基於自位元串流獲得之語法元素來重建視訊資料之圖像。重建視訊資料之程序可大體上與由視訊編碼器20執行之程序互逆。舉例而言,視訊解碼器30可使用框內預測或框間預測來判定當前CU之PU之預測性區塊。另外,視訊解碼器30可反量化當前CU之TU之係數區塊。視訊解碼器30可對係數區塊執行反變換以重建當前CU之TU的變換區塊。藉由將當前CU之PU的預測性區塊之樣本添加至當前CU之TU的變換區塊之相對應樣本,視訊解碼器30可重建當前CU之寫碼區塊。藉由重建圖像之每一CU的寫碼區塊,視訊解碼器30可重建圖像。 在多視圖寫碼中,可存在來自不同視點的相同場景之多個視圖。在多視圖寫碼之上下文中,術語「存取單元」可用以指代對應於同一時間實例的圖像的集合。因此,視訊資料可經概念化為隨時間發生之一系列存取單元。「視圖分量」可為單個存取單元中之視圖的經寫碼表示。在本發明中,「視圖」可指代與相同視圖識別符相關聯之視圖分量之序列。在一些實例中,視圖分量可為紋理視圖分量(亦即,紋理圖像)或深度視圖分量(亦即,深度圖像)。分層HEVC (亦即,L-HEVC)可指代用於傳輸可具有多層視訊資料之HEVC位元串流的技術,使用MV-HEVC或SHVC寫碼此位元串流。 在MV-HEVC及SHVC中,視訊編碼器20可產生包含一系列NAL單元之位元串流。位元串流之不同NAL單元可與位元串流之不同層相關聯。可將層定義為具有相同層識別符的VCL NAL單元及相關聯非VCL NAL單元之集合。層可等效於多視圖視訊寫碼中之視圖。在多視圖視訊寫碼中,層可含有具有不同時間執行個體之相同層的所有視圖分量。每一視圖分量可為屬於特定時間執行個體之特定視圖的視訊場景之經寫碼圖像。在多視圖或3維視訊寫碼之一些實例中,層可含有特定視圖之所有經寫碼深度圖像或特定視圖之經寫碼紋理圖像。在3D視訊寫碼之其他實例中,層可含有特定視圖之紋理視圖分量及深度視圖分量兩者。類似地,在可調式視訊寫碼之上下文中,層通常對應於具有不同於其他層中之經寫碼圖像之視訊特性的經寫碼圖像。此等視訊特性通常包括空間解析度及品質位準(例如,信雜比)。在HEVC及其擴展中,可在一層內藉由將具有特定時間位準之圖像群組定義為一子層來達成時間可按比例調整性。 對於位元串流之每一各別層,可在不參考任何較高層中之資料之情況下解碼較低層中之資料。在可調式視訊寫碼中,例如,可在不參考增強層中之資料之情況下解碼基礎層中之資料。大體而言,NAL單元可僅封裝單層之資料。因此,可自位元串流移除封裝位元串流之最高剩餘層之資料的NAL單元而不影響位元串流之剩餘層中之資料的可解碼性。在多視圖寫碼中,較高層可包括額外視圖分量。在SHVC中,較高層可包括信雜比(SNR)增強資料、空間增強資料及/或時間增強資料。在MV-HEVC及SHVC中,若視訊解碼器可在不參考任何其他層之資料之情況下解碼層中的圖像,則該層可被稱為「基礎層」。基礎層亦可被稱作層0。基礎層可符合HEVC基礎規格(例如,Rec. ITU-T H.265 | ISO/IEC 23008-2)。 在可調式視訊寫碼中,不同於基礎層之層可被稱作「增強層」,且可提供增強自位元串流解碼之視訊資料之視覺品質的資訊。可調式視訊寫碼可增強空間解析度、信雜比(亦即,品質)或時間速率。在可調式視訊寫碼(例如,SHVC)中,「層表示」可為單個存取單元中的空間層之經寫碼表示。為易於解釋,本發明可將視圖分量及/或層表示稱作「視圖分量/層表示」或簡單地稱作「圖像」。 多視圖寫碼支援視圖間預測。視圖間預測類似於HEVC中所使用的框間預測,且可使用相同語法元素。然而,當視訊寫碼器對當前視訊單元(諸如,PU)執行視圖間預測時,視訊編碼器20可將處於與當前視訊單元相同之存取單元中但處於不同視圖中的圖像用作參考圖像。相反地,習知框間預測僅將不同存取單元中的圖像用作參考圖像。因此,對一個層中之圖像的解碼可取決於對另一層中之圖像的解碼。從而,一個層可被稱為取決於另一個層。對於任何兩個層,若第一層取決於第二層,則第二層可被稱為第一層之參考層。 在多視圖寫碼中,若視訊解碼器(例如,視訊解碼器30)可無需參考任何其他視圖中之圖像而解碼視圖中的圖像,則該視圖可被稱作「基礎視圖」。當對非基礎視圖中之一者中的圖像進行寫碼時,視訊寫碼器(諸如視訊編碼器20或視訊解碼器30)可在圖像與視訊寫碼器當前正寫碼的圖像處於不同視圖中但在同一時間執行個體(亦即,存取單元)內時將圖像添加至參考圖像清單中。類似於其他框間預測參考圖像,視訊寫碼器可在參考圖像清單之任何位置處插入視圖間預測參考圖像。 NAL單元可包括標頭(亦即,NAL單元標頭)及有效負載(例如,RBSP)。NAL單元標頭可包括層識別符語法元素。在HEVC中,此層識別符語法元素可被表示為nuh_reserved_zero_6bits語法元素或nuh_layer_id語法元素。具有指定不同值之nuh_layer_id語法元素的NAL單元屬於位元串流之不同層。因此,在多視圖寫碼、MV-HEVC、SVC或SHVC中,NAL單元之nuh_layer_id語法元素指定NAL單元之層識別符(亦即,層ID)。若NAL單元涉及多視圖寫碼、MV-HEVC或SHVC中之基礎層,則NAL單元之nuh_layer_id語法元素等於0。可在不參考位元串流之任何其他層中之資料的情況下解碼位元串流之基礎層中的資料。若NAL單元不涉及多視圖寫碼、MV-HEVC或SHVC中之基礎層,則nuh_layer_id語法元素可具有非零值。在多視圖寫碼中,位元串流之不同層可對應於不同視圖。在SVC或SHVC中,不同於基礎層之層可被稱作「增強層」,且可提供增強自位元串流解碼之視訊資料之視覺品質的資訊。 此外,可在不參考相同層內之其他圖像的情況下解碼單一層內的一些圖像。因此,可自位元串流移除封裝層的某些圖像之資料的NAL單元而不影響該層中之其他圖像的可解碼性。移除封裝此等圖像之資料的NAL單元可降低位元串流的訊框速率。可在不參考層內其他圖像的情況下解碼的層內圖像的子集可在本文中被稱作「子層」或「時間子層」。 NAL單元可包括時間識別符語法元素。在HEVC中,時間識別符語法元素可被稱為temporal_id語法元素。NAL單元之時間識別符(例如,temporal_id)語法元素指定NAL單元之時間識別符。NAL單元之時間識別符識別與NAL單元相關聯之時間子層。因此,位元串流之每一時間子層可與不同時間識別符相關聯。若第一NAL單元之時間識別符小於第二NAL單元之時間識別符,則可在不參考由第二NAL單元封裝之資料的情況下解碼由第一NAL單元封裝的資料。 位元串流可與複數個操作點相關聯。在一些實例中,位元串流之每一操作點可與一組層識別符(亦即,一組nuh_reserved_zero_6bits值或nuh_layer_id值)及時間識別符相關聯。可將該組層識別符標示為OpLayerIdSet,且可將時間識別符標示為TemporalID。若NAL單元之層識別符在操作點之層識別符集合中且NAL單元之時間識別符小於或等於操作點之時間識別符,則NAL單元與操作點相關聯。因此,操作點可為藉由子位元串流提取程序之操作而自另一位元串流產生的位元串流,其中另一位元串流、目標最高TemporalId及目標層識別符清單作為至子位元串流提取程序的輸入。操作點可包括與操作點相關聯之每一NAL單元。在一些實例中,操作點不包括不與操作點相關聯的VCL NAL單元。 在HEVC中,每一NAL單元包括指示NAL單元之NAL單元類型之語法元素(例如nal_unit_type)。此外,在HEVC中,視訊解碼器30可基於NAL單元之NAL單元類型識別與複數個圖像類型中之一者相關聯之NAL單元。此等圖像類型可包括瞬時解碼再新(IDR)圖像、清潔隨機存取(CRA)圖像、時間子層存取(TSA)圖像、斷鏈存取(BLA)圖像及不為IDR、CRA或TSA圖像之經寫碼圖像。 HEVC及其他視訊寫碼標準提供用於使能夠隨機存取至位元串流中之機制。隨機存取係指自位元串流中之非第一經寫碼圖像之經寫碼圖像開始解碼位元串流。隨機存取位元流可在諸如廣播及串流之各種視訊應用中為所需的。隨機存取位元流可使使用者能夠在任何時間調諧至程式中,以在不同頻道之間切換,以跳轉至視訊之特定部分,或以切換至用於串流調適(例如位元速率之調適、訊框速率之調適、空間解析度之調適等)之不同位元串流。將隨機存取點(RAP)圖像以規律的間隔插入至位元串流中可實現隨機存取。RAP圖像之實例類型包括IDR圖像、CRA圖像及BLA圖像。因此,IDR圖像、CRA圖像及BLA圖像統稱為隨機存取點(RAP)圖像。 IDR圖像僅含有I片段(亦即,僅使用框內預測之片段)。IDR圖像可為按解碼次序在位元串流中之第一圖像,或可稍後出現在位元串流中。每一IDR圖像為按解碼次序CVS之第一圖像。如HEVC及H.264/AVC中指定之IDR圖像可用於隨機存取。然而,按解碼次序在IDR圖像之後的圖像不可使用在IDR圖像之前解碼的圖像作為參考。因此,取決於IDR圖像用於隨機存取之位元串流與使用額外類型之隨機存取圖像的位元串流相比可具有顯著較低的寫碼效率。IDR存取單元為含有IDR圖像之存取單元。 IDR圖像可使得解碼程式將所有參考圖像標記為「未用於參考」。由於標記為「未用於參考」之參考圖像可自儲存參考圖像之經解碼圖像緩衝器(DPB)移除,因此IDR圖像可清理出DPB。按解碼次序在IDR圖像之後的所有經寫碼圖像可經解碼而無需自按解碼次序先於IDR圖像的任何圖像之框間預測。按解碼次序的每一寫碼視訊序列之第一圖像為IDR圖像或BLA圖像,或亦為位元串流之第一圖像的CRA圖像。當存取單元之經寫碼圖像為IDR圖像時,存取單元可被稱作IDR存取單元。在一些實例中,經寫碼視訊序列為存取單元之序列,該序列包括以下各者或由以下各者按解碼次序組成:IDR存取單元,接著不為IRAP存取單元之零或多個存取單元,該等存取單元之NoRaslOutputFlag等於1,包括至多所有後續存取單元但不包括任何後續IDR存取單元。 理想地,以此方式之頻道切換及跳轉應以最小量之延遲進行。可藉由在視訊位元流中以規律的間隔包括隨機存取圖像來實現頻道切換及跳轉。IDR圖像可用於H.264/AVC及HEVC兩者中作為隨機存取圖像。換言之,在H.264/AVC及HEVC兩者中指定之IDR圖像可用於隨機存取。然而,由於IDR圖像開始經寫碼視訊序列且可始終清理DPB,因此按解碼次序在IDR圖像之後的圖像不可使用按解碼次序在IDR圖像之前解碼的圖像用於參考。因此,取決於IDR圖像用於隨機存取之位元串流可具有顯著較低的寫碼效率(例如低6%之寫碼效率)。為改良寫碼效率,HEVC中之CRA圖像可允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像使用在CRA之前解碼之圖像用於參考。 CRA及TSA圖像類型在HEVC中為新的且不可用於H.264/AVC規範中。CRA圖像類型促進自視訊序列中間的任何隨機存取點(RAP)開始的解碼。在視訊序列中插入CRA圖像可比將IDR圖像插入至同一視訊序列中更有效。在HEVC中,自CRA圖像開始的位元串流可為符合位元串流。亦即,以CRA圖像開始之位元串流之部分可符合HEVC規範。TSA圖像可用以指示有效時間子層切換點。  CRA圖像允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像使用在CRA之前解碼之圖像用於參考。按解碼次序在CRA圖像之後,但按輸出次序在CRA圖像之前的圖像被稱作與CRA圖像相關聯之前置圖像(或CRA圖像之前置圖像)。亦即,為了改良寫碼效率,在HEVC中引入CRA圖像以允許按解碼次序在CRA圖像之後但按輸出次序在CRA圖像之前的圖像使用在CRA圖像前解碼的圖像用於參考。CRA存取單元為其中經寫碼圖像為CRA圖像之存取單元。 若解碼自IDR圖像或按解碼次序在該CRA圖像前出現之CRA圖像開始,則可正確地解碼CRA圖像之前置圖像。然而,在發生自CRA圖像的隨機存取時,CRA圖像之前置圖像可能不可解碼。因此,視訊解碼器在隨機存取解碼期間通常解碼CRA圖像之前置圖像。為防止自取決於解碼開始處而可能不可用之參考圖像的誤差傳播,按解碼次序及輸出次序兩者在CRA圖像後之圖像無一者可使用按解碼次序或輸出次序在CRA圖像前之任何圖像(其包括前置圖像)作為參考。 在引入CRA圖像之後,在HEVC中引入斷鏈存取(BLA)圖像,且斷鏈存取(BLA)圖像係基於CRA圖像之概念。BLA圖像通常源自在CRA圖像之位置處拼接的位元串流,且在該拼接之位元串流中將該拼接點CRA圖像改變成BLA圖像。含有RAP圖像之存取單元在本文中可被稱作RAP存取單元。BLA存取單元為含有BLA圖像之存取單元。 BLA圖像與CRA圖像之間的一差異如下。對於CRA圖像,若解碼開始於按解碼次序在CRA圖像前之RAP圖像,則可正確地解碼相關聯之前置圖像。然而,當發生自CRA圖像之隨機存取時(亦即,當解碼自該CRA圖像開始時,或換言之,當該CRA圖像為位元串流中之第一圖像時),則可能不正確地解碼與該CRA圖像相關聯之前置圖像。相比之下,可能不存在與BLA圖像相關聯之前置圖像可解碼之情形,即使當解碼自按解碼次序在BLA圖像前之RAP圖像開始時。 與特定CRA圖像或特定BLA圖像相關聯之前置圖像中之一些可正確地解碼,即使當該特定CRA圖像或該特定BLA圖像為位元串流中之第一圖像時。此等前置圖像可被稱作可解碼前置圖像(DLP)。其他前置圖像可被稱作不可解碼前置圖像(NLP)。NLP亦可被稱作標記為拋棄(TFD)圖像。 在位元串流中之任何點處,諸如MANE、DANE之器件或其他類型之器件可在較低子層中之圖像仍可解碼之基礎上開始移除較高子層之NAL單元,此係因為用於較低子層中之圖像的解碼程式不取決於較高子層之NAL單元。移除具有高於某一值之時間識別符的所有NAL單元的動作可被稱作時間向下切換。時間向下切換可始終是可能的。 時間子層向上切換可指自解碼第一時間子層切換至解碼第二時間子層,其中第二時間子層之時間識別符大於第一時間子層之時間識別符。此切換可與開始將尚未經轉發之某一子層之NAL單元轉發直至該點相關聯。在一些實例中,若經切換之層中之圖像中無一者取決於在同一子層中在位元串流中執行切換的點之前的任一圖像的情況下,僅可能為時間向上切換。在位元串流中時間向上切換為可能的點可被稱為子層切換點。 在HEVC中,存在兩種與子層切換點相關聯之圖像類型,即時間子層存取(TSA)圖像類型及逐步時間子層存取(STSA)圖像類型。TSA及STSA圖像類型可用於指示時間子層切換點。TSA圖像實現在該TSA圖像處向上切換至含有TSA圖像之子層或緊接著較低子層之任何較高子層。STSA圖像實現在該STSA圖像處向上切換至緊接著較低子層之含有STSA圖像之子層。因此,與TSA圖像相比,STSA不必實現向上切換至任何較高子層,僅至含有STSA圖像之子層。因此,與大體上時間向上切換相比,在第二子層之時間識別符確切地比第一時間子層之時間識別符大1的情況下,逐步時間子層向上切換可包含自解碼第一時間子層切換至解碼第二時間子層的動作。 在HEVC及其他編碼解碼中,框內隨機存取點(IRAP)存取單元為其中具有層識別符等於0之經寫碼圖像為IRAP圖像的存取單元。IRAP圖像僅含有I片段且可為BLA圖像、CRA圖像或IDR圖像。因此,BLA圖像、CRA圖像及IDR圖像可為不同類型之IRAP圖像的實例。在HEVC中,在位元串流中按解碼次序之第一圖像一定為IRAP圖像。若必要參數集在其需要經活化時為可使用的,則可在未對按解碼次序於IRAP圖像之前的任何圖像執行解碼程式的情況下正確地解碼IRAP圖像及按解碼次序之所有後續非隨機存取跳過前置(RASL)圖像。在位元串流中可存在僅含有並非IRAP圖像之I片段的圖像。 經編碼視訊資料可儲存於符合各種檔案格式標準的檔案中。檔案格式標準包括ISO基媒體檔案格式(ISOBMFF,ISO/IEC 14496-12),及自ISOBMFF導出之其他格式,包括MPEG-4檔案格式(ISO/IEC 14496-15)、3GPP檔案格式(3GPP TS 26.244)及AVC檔案格式(ISO/IEC 14496-15)。儘管最初設計用於儲存,但ISOBMFF已經論證對串流而言(例如,對漸進式下載或經由HTTP之動態自適應串流(DASH)而言)非常有價值。為了串流目的,可使用在ISOBMFF中定義之電影片段。 ISO/IEC 14496-12及14496-15之新版本的草案本文可分別在http://phenix.int-evry.fr/mpeg/doc_end_user/documents/111_Geneva/wg11/w15177-v6-w15177.zip及http://phenix.int-evry.fr/mpeg/doc_end_user/ documents/112_Warsaw/wg11/w15479-v2-w15479.zip處得到。在一些實例中,ISO/IEC 14496-12及14496-15之新版本的草案本文可在下文被稱作「當前草案檔案格式標準」。將ISOBMFF用作用於許多編碼解碼器封裝格式(諸如,AVC檔案格式)以及用於許多多媒體容器格式(諸如,MPEG-4檔案格式、3GPP檔案格式(3GP)及DVB檔案格式)之基礎。 除諸如音訊及視訊之連續媒體之外,諸如影像之靜態媒體以及後設資料可儲存於符合ISOBMFF之檔案中。根據ISOBMFF構造之檔案可用於許多目的,包括本端媒體檔案回放、漸進式下載遠端檔案、用於DASH之節段、用於待串流之內容的容器及其封包化指令及錄入所接收之即時媒體串流。 邏輯框為ISOBMFF中之基本語法結構。邏輯框包括四字元寫碼邏輯框類型、邏輯框之位元組計數及有效負載。ISOBMFF檔案包括邏輯框之序列或由邏輯框之序列組成,且邏輯框可含有其他邏輯框。ISOBMFF定義各種類型之邏輯框。為使邏輯框之語法及語義發展,邏輯框可包括指示邏輯框之語法及語義版本之版本語法元素。舉例而言,具有版本語法元素等於0之邏輯框可具有第一語法而具有版本語法元素等於1之相同類型的邏輯框可具有第二不同語法。 檔案中之邏輯框可包括含有用於存在於檔案中之連續媒體串流的後設資料的電影邏輯框(「moov」)。可將連續媒體串流中之每一者在檔案中表示為一播放軌。舉例而言,電影邏輯框可含有關於電影之後設資料(例如,樣本之間的邏輯及時序關係,及亦指向樣本之位置的指標)。電影邏輯框可包括若干類型之子邏輯框。電影邏輯框中之子邏輯框可包括一或多個播放軌邏輯框。 播放軌邏輯框可包括關於電影之個別播放軌的資訊。播放軌邏輯框可包括指定單一播放軌之總資訊的播放軌標頭邏輯框。另外,播放軌邏輯框可包括含有媒體資訊邏輯框之媒體邏輯框。媒體資訊邏輯框可包括含有索引播放軌中之媒體樣本的資料的樣本表邏輯框。樣本表邏輯框中之資訊可用以按時間(且對於播放軌之樣本中之每一者,按類型、大小、容器及至樣本之彼容器的偏移)定位樣本。因此,用於播放軌之後設資料圍封(例如,容納在)在播放軌邏輯框(「trak」)中。播放軌之媒體內容圍封在媒體資料邏輯框(「mdat」)中或直接在單獨檔案中。播放軌之媒體內容可包含樣本之序列或由樣本之序列組成,諸如音訊或視訊存取單元。 此外,ISOBMFF指定以下類型之播放軌:媒體播放軌、暗示播放軌及定時後設資料播放軌。媒體播放軌含有基本的媒體串流。暗示播放軌包括媒體傳輸指令或表示接收之封包流。定時後設資料播放軌包含時間同步後設資料。 用於每一播放軌之後設資料包括一系列樣本描述項。各樣本描述項提供在播放軌中使用之寫碼或封裝格式及用於處理該格式所需之初始化資料。每一樣本與播放軌之樣本描述項中之一者相關聯。 ISOBMFF實現藉由各種機構指定樣本特定後設資料。樣本表邏輯框(「stbl」)內之特定邏輯框已經標準化以回應普通需求。樣本表邏輯框含有一樣本表,該樣本表含有媒體樣本於播放軌中之所有時間及資料索引。使用樣本表邏輯框中之表,可能可及時定位樣本、判定其類型(例如I-訊框或非I-訊框)及判定其大小、容器,及至彼容器之偏移。舉例而言,同步樣本邏輯框(「stss」)為樣本表邏輯框內之邏輯框。同步樣本邏輯框(「stss」)係用以列舉播放軌之隨機存取樣本。本發明可將由同步樣本邏輯框列出之樣本稱作為同步樣本。若樣本中之視訊資料NAL單元指示樣本中含有之經寫碼圖像為IDR圖像,則認為樣本為同步樣本。樣本分群機構實現根據四字元分群類型將樣本映射成共用指定為檔案中之樣本群組描述項之同一特性的樣本之群組。已在ISOBMFF中指定若干分群類型。 電影片段邏輯框為頂級邏輯框。每一電影片段邏輯框提供將預先位於電影邏輯框中之資訊。電影片段邏輯框可含有一或多個播放軌片段(「traf」)邏輯框。在電影片段內存在一組播放軌片段(按播放軌為零或多個)。播放軌片段轉而含有零或多個播放軌行程,其中之每一者記錄彼播放軌之樣本的連續行程。舉例而言,每一播放軌行程可含有按某一次序(諸如解碼次序)連續的圖像之樣本。播放軌片段邏輯框於14996-12規範中予以定義,且包含用於一或多個播放軌片段之後設資料。舉例而言,播放軌片段邏輯框可包括播放軌片段標頭邏輯框,該播放軌片段標頭邏輯框指示播放軌ID、基本資料偏移、樣本描述索引、預設樣本歷時、預設樣本大小及預設樣本旗標。播放軌片段邏輯框可包括一或多個播放軌片段行程邏輯框,每一者記錄播放軌之連續樣本集。舉例而言,播放軌片段邏輯框可包括指示樣本計數、資料偏移、樣本旗標、樣本歷時、樣本大小、樣本組成時間偏移等等之語法元素。在此等結構內,許多欄位係可選的,且可經預設。 樣本分群為將播放軌中之樣本中之每一者指配為一個樣本群組中之一員。樣本群組中之樣本不需要為連續的。樣本群組可由兩個資料結構表示:SampleToGroup邏輯框及SampleGroupDescription邏輯框。SampleToGroup邏輯框亦可被稱作樣本至群組邏輯框。SampleGroupDescription邏輯框亦可被稱作樣本群組描述邏輯框。SampleToGroup邏輯框表示將樣本指配至樣本群組。SampleGroupDescription邏輯框描述相應樣本群組之特性。 樣本表樣本表邏輯框可包括一或多個SampleToGroup邏輯框及一或多個樣本群組描述邏輯框(亦即,SampleGroupDescription邏輯框)。SampleToGroup邏輯框可用以判定樣本屬於之樣本群組,以及該樣本群組之相關聯描述。換言之,SampleToGroup邏輯框可指示樣本屬於之群組。SampleToGroup邏輯框可具有「sbgp」之邏輯框類型。 SampleToGroup邏輯框可包括分群類型元素(例如,grouping_type)。在一些情況下,在本發明中,邏輯框之元素亦可被稱作語法元素。分群類型元素可為識別樣本分群之類型(亦即,用以形成樣本群組之規則)的整數。此外,SampleToGroup邏輯框可包括一或多個項(亦即,樣本群組項)。SampleToGroup邏輯框中之每一樣本群組項可與播放軌中之一系列不同的非重疊連續樣本相關聯。每一樣本群組項可指示樣本計數元素(例如,sample_count)及群組描述索引元素(例如,group_description_index)。樣本群組項之樣本計數元素可指示與樣本群組項相關聯之樣本的數目。換言之,樣本群組項之樣本計數元素可為給出具有相同樣本群組描述符之連續樣本的數目的整數。群組描述索引元素可識別SampleGroupDescription邏輯框內的含有與樣本群組項相關聯之樣本之描述的群組描述項。多個樣本群組項之群組描述索引元素可識別相同SampleGroupDescription邏輯框。 ISOBMFF規範指定適用於DASH之六種類型串流存取點(SAP)。前兩個SAP類型(類型1及類型2)對應於H.264/AVC及HEVC中之IDR圖像。第三SAP類型(類型3)對應於開放GOP隨機存取點,因此對應於HEVC中之BLA或CRA圖像。第四種SAP類型(類型4)對應於漸次性解碼再新(GDR)隨機存取點。 當前草案檔案格式規範可存在一或多個問題。舉例而言,為輔助L-HEVC檔案中之隨機存取及層與子層之切換,若干樣本分群機構可供使用,諸如:串流存取點(『sap』)樣本群組、隨機存取(『rap』)點樣本群組、同步樣本(『sync』)樣本群組、隨機存取恢復(『roll』)樣本群組、時間子層存取(『tsas』)樣本群組及逐步時間子層存取(『stsa』)樣本群組。 L-HEVC使同一存取單元(AU)中之不同層的圖像為不同NAL單元類型。舉例而言,在同一AU內,基礎層中之圖像為IRAP圖像,而增強層中之圖像可為非IRAP圖像。由於L-HEVC使同一AU中之不同層的圖像為不同NAL單元類型,因此其適用於指示含有特定圖像類型(例如,IRAP或TSA等)之層。 在用於以檔案格式儲存L-HEVC層之14496-15的當前草案規範中,已指定用於描述串流存取點分群(『sap』樣本群組)之目標層(亦即,含有某一類型之圖像類型的層)的機構。特定言之,在當前草案檔案格式規範中,『sap』樣本群組邏輯框包括grouping_type_parameter語法結構,該語法結構包括target_layers語法元素及layer_id_method_idc語法元素。用於播放軌之『sap』樣本群組邏輯框中之target_layers語法元素指定用於SAP之目標層。target_layers語法元素之語義取決於layer_id_method_idc語法元素之值。等於0之layer_id_method_idc語法元素指定該等目標層由所有由播放軌表示之層構成。由所導出之媒體格式規範指定不等於0之layer_id_method_idc。 然而,可存在與描述目標層之機構相關的若干問題。舉例而言,一個問題涉及『sap』及『roll』樣本群組之描述。當前草案檔案格式規範包括以下描述:對於藉由 L - HEVC 樣本項 類型所描述之視訊資料 隨機存取恢復樣本群組識別全部 L - HEVC 位元串流中之隨機存取恢復且串流存取點樣本群組識別全部 L - HEVC 位元串流中之隨機存取點。 然而,措辭「在全部L-HEVC位元串流中」並不明確。『sap』及『roll』樣本群組為播放軌層級樣本分群,而非位元串流或檔案層級樣本分群。此意味著每一播放軌可含有『sap』樣本群組及/或『roll』樣本群組且若藉由超過一個播放軌表示位元串流,則在該等播放軌中之大於一者中可存在大於一個『sap』或『roll』樣本群組。播放軌中之每一『sap』或『roll』樣本群組應涵蓋該播放軌內之樣本,且可能在含有存在於播放軌中之層的參考層的其他播放軌中。因此,若指定『sap』或『roll』樣本群組識別最高層包含於播放軌中之L-HEVC子位元串流,而非全部L-HEVC位元串流之隨機存取點或隨機存取恢復點,則應更明確。實際上,應使得『sap』或『roll』之描述更確切,以便由此等樣本群組提供之任何資訊對於全部L-HEVC位元串流之任何有效子集而言為正確的。對於適用於多層位元串流之任何其他樣本群組(諸如『rap』及『sync』樣本群組)同樣需要類似描述。 另一問題涉及用於除『sap』外之樣本分群的目標層描述。如上文所描述,存取單元中之未對準之圖像類型的案例可在除串流存取點案例之外的案例中發生。然而,用於描述目標層之機構僅指定用於『sap』樣本群組,而對於其他樣本分群(諸如『rap』、『sync』、『roll』、『tsas』及『stsa』樣本群組)為缺失的。 另一問題涉及目標層之範疇。當解碼自串流存取點(例如,隨機存取事件中)開始時,不僅存取播放軌之NAL單元,而且存取操作點之存取單元中之所有NAL單元,包括儲存於其他播放軌中之彼等(例如,若操作點之所需層儲存於超過一個播放軌中)。然而,固有的係目標層之範疇應涵蓋操作點之所有層。然而,在用於對『sap』樣本群組之目標層描述的當前機構中,目標層僅描述攜載於含有『sap』樣本群組之播放軌中的層。此外,使該等目標層僅包括攜載於含有該樣本群組之播放軌中的層具有以下所描述之問題。 另一問題涉及在獲得操作點之『sap』樣本群組中所涉及的額外工作。操作點可包括可攜載於一或多個播放軌中之一或多個層。當操作點之層攜載於超過一個播放軌中時,為能夠在所有所需層之SAP上獲得資訊,需要自操作點之所有所需播放軌提取並合併所有『sap』樣本群組資訊。 另一問題涉及缺失操作點之『sap』樣本群組。如上所述,需要自操作點之所有所需播放軌提取並合併所有『sap』樣本群組資訊。然而,由於『sap』樣本群組為視情況選用之樣本分群,因此不保證所有播放軌具有此資訊。當操作點中之播放軌無『sap』樣本群組時,操作點之『sap』樣本群組資訊(亦即,在提取並合併所有需要播放軌中之可用的『sap』樣本群組之後)並不完整。 另一問題涉及『sap』樣本群組根本無IRAP樣本之可能性。由於IRAP圖像可在含有多層圖像之AU中未對準,因此播放軌含有IRAP AU之圖像,但彼播放軌中之圖像不為IRAP圖像係有可能的。圖2為說明其中播放軌中之圖像為IRAP AU之部分但不為IRAP圖像之實例案例的概念圖。特定言之,圖2說明其中播放軌中之圖像為IRAP AU之部分但其不為IRAP圖像的實例案例。在圖2之實例中,假設所需操作點包括BL (基礎層)、EL1 (增強層1)、EL2 (增強層2)及EL3 (增強層3),以使得需要播放軌01及播放軌02兩者重建操作點之AU且兩個播放軌亦具有『sap』樣本群組資訊。根據同步樣本(且每一同步樣本亦為串流存取點)之定義,AUN + 1 為串流存取點AU且應將彼AU中之EL2及EL3圖像視為串流存取點並在播放軌02中之『sap』樣本群組中列出。 在當前檔案格式規範中,並未明確地指定圖2中所示之AUN + 1 中之 EL2及EL3圖像是否一定指定為屬於『sap』樣本群組(若此樣本群組存在)。在需要此要求的情況下,則當操作點所需之播放軌當中的至少一個播放軌具有『sap』樣本群組時,操作點所需之所有播放軌一定具有『sap』樣本群組。 此外,在圖2之實例中,假設AUN + 1 中之BL及EL1圖像包括於存在於播放軌01中之『sap』樣本群組中。在此情況下,當前檔案格式規範並未明確地指定如何確保AUN + 1 中之EL2及EL3圖像包括於存在於播放軌02中之『sap』樣本群組中。另外,可能需要但目前尚未規定要求存在於操作點所需之播放軌中之『sap』樣本群組為時間上對準的約束條件。大體而言,『約束條件』為對由資料符合之格式所指定之資料(諸如檔案或位元串流)之內容的需求或限制,但資料之語法未必需要。 另一問題涉及對L-HEVC播放軌中之layer_id_method_idc之值的約束。在當前檔案格式草案規範中,當『sap』樣本項用於L-HEVC之上下文時,約束『sap』樣本群組描述之版本一定為1且layer_id_method_idc之值一定等於1。此約束似乎為冗餘的且可禁止傳訊資訊之更高效方法。如上所述,layer_id_method_idc之當前語義實際上如下定義:layer_id_method_idc指定target_layers之語義。等於0之layer_id_method_idc指定該等目標層由存在於播放軌中之所有層構成。由所導出之媒體格式規範指定不等於0之layer_id_method_idc。樣本群組版本及layer_id_method_idc之其他值可用於更高效傳訊。舉例而言,在L-HEVC之上下文中,可能定義在『sap』樣本群組之版本等於0時,layer_id_method_idc之值經推斷等於0,其亦意味著所有層皆為目標層。 以下技術可提供上述問題中之一或多者的解決方案及/或緩解上述問題中之一或多者。該等技術中之一些可獨立地應用,且其中之一些可組合地應用。 根據本發明之第一技術,針對適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組,應要求或指定來自該等樣本群組之資訊對位元串流之任何有效子集而言為正確的。在HEVC之上下文中,位元串流之有效子集意味著位元串流之子集可藉由符合此檔案格式規範(ISO/IEC 14996-15)之檔案解析器解析且可藉由符合HEVC規範之解碼器解碼。在第一技術之一些實例中,來自樣本群組之資訊對於自整個位元串流基於位元串流所呈現之操作點來創建之任何子位元串流而言為正確的。適用於多層位元串流之樣本群組之實例包括(但不必限於):『sap』、『sync』、『rap』、『roll』、『tsas』及『stsa』樣本群組。在一些實例中,已提出針對適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組,應要求或指定來自樣本群組之資訊對於任何操作點而言為正確的。因此,在一些實例中,器件(例如,源器件12、檔案產生器件34等)可產生檔案以使得針對適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組,來自樣本群組之資訊對於多層位元串流之任何有效子集而言為正確的。 在第一技術之一個實例中,可藉由將以下本文添加至當前檔案格式規範:「針對適用於藉由HEVC寫碼之資料的所有樣本群組及其導出項(例如,L-HEVC),不論使用L-HEVC資料之何種有效子集,由樣本群組提供之資訊為真」來實施第一技術。 替代地,在一些實例中,可藉由將以下本文添加至當前檔案格式規範:「若『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組用於HEVC及L-HEVC兩者可相容之播放軌中,則不論使用L-HEVC資料(可能僅HEVC資料)之何種有效子集,由樣本群組提供之資訊為真」來實施第一技術。 替代地,在一些實例中,可藉由將以下本文添加至當前檔案格式規範:「若『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組用於HEVC及L-HEVC兩者可相容之播放軌中,則不論使用L-HEVC資料之哪一個操作點,由樣本群組提供之資訊為真」來實施第一技術。 根據本發明之第二技術,已提出針對適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組,描述該等目標層(亦即,其中特定圖像類型-TSA、STSA、與恢復點SE訊息相關之圖像的層等)。在一些實例中,將描述串流存取點(『sap』)樣本群組之目標層的此技術應用於其他樣本群組。 根據本發明之第二技術,器件(例如,源器件12、檔案產生器件34或另一器件)在用於儲存多層位元串流之檔案中產生圍封用於播放軌之後設資料的播放軌邏輯框。大體而言,產生邏輯框可包含將表示邏輯框之資料儲存至檔案中。播放軌含有媒體內容。播放軌之媒體內容可包含一序列樣本或由一序列樣本構成。該序列樣本中之每一樣本可對應於一存取單元。作為產生播放軌邏輯框之部分,該器件在播放軌邏輯框中可包括含有樣本群組描述項之樣本描述邏輯框。該器件在播放軌邏輯框亦可包括播放軌之樣本至群組邏輯框。樣本至群組邏輯框將播放軌之樣本映射至樣本群組。樣本群組包含共用由樣本群組描述項所指定之一特性的樣本。樣本至群組邏輯框在存在於播放軌中之層中指定目標層。舉例而言,樣本至群組邏輯框可包括在存在於播放軌中之層中指定目標層之語法元素。該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像。在一些情況下,樣本群組為『tsas』樣本群組且該特定圖像類型為時間子層存取圖像類型。在一些情況下,樣本群組為『stsa』樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。 在本發明之第二技術之另一實例中,器件(例如,目的地器件14、MANE或另一器件)可自儲存多層位元串流之檔案中獲得圍封用於播放軌之後設資料的播放軌邏輯框,該多層位元串流包含形成視訊資料之圖像表示的位元之序列。獲得資料(諸如操作點參考播放軌)可包含讀取資料、解析資料或以其他方式執行某些動作以得到、獲取或擁有資料。播放軌可含有媒體內容。播放軌之媒體內容可包含樣本之序列。該樣本序列中之每一樣本可對應於一存取單元。作為獲得播放軌邏輯框之部分,該器件可自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框。另外,作為獲得播放軌邏輯框之部分,該器件可自播放軌邏輯框獲得播放軌之樣本至群組邏輯框。樣本至群組邏輯框可將播放軌之樣本映射至樣本群組中。樣本群組可包含共用由樣本群組描述項所指定之一特性的樣本。此外,該器件可基於樣本至群組邏輯框中之語法元素判定存在於播放軌中之層當中的目標層。該等目標層中之每一者可含有屬於一特定圖像類型之至少一個圖像。在此實例中,樣本群組為以下中之一者:『tsas』樣本群組且該特定圖像類型為時間子層存取圖像類型,或『stsa』樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。此外,該器件可基於包括含有特定時間子層之經寫碼圖像的層將TSA或STSA樣本群組中之樣本識別為適合於時間子層向上切換至特定時間子層。 此外,對於『rap』、『sync』及『roll』樣本群組,能夠判定該等目標層(亦即,能夠判定含有一或多個IRAP圖像之層)可有助於應用程式(例如,視訊播放機、檔案解析器)以理解直至可執行解碼之層及在隨機存取事件發生時之預期輸出。舉例而言,假設位元串流具有兩個層,若指示目的地器件14以快進(例如,對某些存取單元執行隨機存取),則目的地器件14可判定下一存取單元(AU)開始解碼之位置(例如,包括用於該等相應層之隨機存取點資料的AU)將目的地器件14在其中基礎層(BL)具有IRAP圖像但增強層(EL)具有非IRAP圖像之AU處執行隨機存取的形式稱作分層式啟動解碼。在分層式啟動解碼中,目的地器件14之視訊解碼器30僅解碼BL圖像且在IRAP圖像稍後出現時解碼BL及EL圖像兩者。因此,在此情況下,目的地器件14可以低解析度回放位元串流一段時間且隨後(尤其在視訊解碼器30解碼EL IRAP圖像之後)呈現較高解析度。在另一方面,若目的地器件14在其中BL及EL兩者皆具有IRAP圖像之AU處執行隨機存取,則目的地器件14之視訊解碼器30直接始於該點解碼BL及EL兩者,其意味著目的地器件14直接自高解析度播放。『rap』、『sync』及『roll』樣本群組產生資訊以輔助目的地器件14、視訊解碼器30或其他應用程式選擇開始執行隨機存取時的樣本/AU。 根據本發明之第三技術,適用於多層之樣本分群中的目標層之範疇不僅為存在於含有樣本分群之播放軌中的層而且亦包括由存在於播放軌中之層直接地及間接地參考的所有層。舉例而言,播放軌之樣本分群邏輯框(亦即,SampleToGroup邏輯框)並非僅指示播放軌中之哪些層為目標層,該樣本分群邏輯框亦可指示播放軌之層的哪些參考層為目標層。舉例而言,第一播放軌可包括第一層及第二層。在此實例中,第二播放軌可包括第三層及第四層。此外,在此實例中,第三層可為第二層之參考層。在此實例中,第一播放軌之樣本分群邏輯框可指示第一層及第三層為目標層。 在一些實例中,可藉由將以下本文包括於檔案格式標準中來實施本發明之第二及/或第三技術。9.7.6 用於隨機存取及層 / 子層切換之樣本群組 當樣本群組用於多層內容時,下文為適用的: -     若樣本群組描述邏輯框及樣本至群組邏輯框之版本等於1,則grouping_type_parameter之語法及語義指定如下: {     unsigned int(28)   target_layers;     unsigned int(4)     layer_id_method_idc; } target_layers指定存在於播放軌中之所有層當中所指示之目標層,該播放軌含有樣本群組及由存在於含有樣本群組之播放軌中的層直接地及間接地參考的所有層。target_layers之語義取決於layer_id_method_idc之值。當layer_id_method_idc等於0時,預留target_layers。 1.   layer_id_method_idc指定target_layers之語義。等於0之layer_id_method_idc指定該等目標層由存在於播放軌中之所有層及由存在於播放軌中之層直接地及間接地參考的所有層構成。以下指定不等於0之layer_id_method_idc。 -     另外,若樣本群組描述邏輯框及樣本至群組邏輯框之版本等於0,則該等目標層由存在於播放軌中之所有層及由存在於播放軌中的層直接地及間接地參考的所有層構成。 欄位target_layers之長度為28位元。欄位中之每一位元表示layerList中之一層,該layerList含有存在於播放軌中之層及存在於其他播放軌中之參考層。將始於LSB之此欄位之每一位元按層ID之遞升次序映射至layerList中之該系列層ID。 舉例而言,若播放軌與含有層ID 0、1、4、10及29之layerList相關聯,則將層ID 0映射至最低有效位元,將層ID 1映射至第二最低有效位元,將層ID 4映射至第三最低有效位元,將層ID 10映射至第四最低有效位元,且將層ID 29映射至第五最低有效位元。 在存取單元中,其樣本包括於同步樣本樣本群組、隨機存取點樣本群組或串流存取點樣本群組中且具有nuh_layer_id等於一之所指示目標層的圖像為IRAP圖像。 在存取單元中,其樣本包括於隨機存取恢復樣本群組中且具有nuh_layer_id等於一之所指示目標層的圖像為漸次性解碼再新圖像。 在存取單元中,其樣本包括於時間子層存取樣本群組中且具有nuh_layer_id等於一之所指示目標層的圖像為TSA圖像。 在存取單元中,其樣本包括於逐步時間子層存取樣本群組中且具有nuh_layer_id等於一之所指示目標層的圖像為STSA圖像。 11 用於上文所述之實例使用案例之 target _ layer 欄位的位元型樣 9.8.2 層資訊樣本群組 9.8.2.1 定義 邏輯框類型:『linf』 容器:SampleGroupDescriptionBox(『sgpd』) 必選:每一L-HEVC播放軌中之是 數量:一或多個『linf』樣本群組項 播放軌攜載之系列層及子層在層資訊樣本群組中傳訊。每一L-HEVC播放軌將攜載一『linf』樣本群組。9.8.2.2 語法 類別LayerInfoGroupEntry延伸VisualSampleGroupEntry(『linf』)) {      保留無符號的整數(2);      無符號的整數(6) num_layers_in_track;      對於(i=0; i<num_layers_in_track; i++) {         保留無符號的整數(4);         無符號的整數(6) layer_id;         無符號的整數(3) min_sub_layer_id;         無符號的整數(3) max_sub_layer_id;      } }9.8.2.3 語義 num_layers_in_track:與此樣本群組相關聯的此播放軌之任何樣本中攜載的層之數目。 layer_id:相關聯樣本中攜載之層的層ID。此欄位之執行個體將在迴圈中為遞升次序。 min_sub_layer_id:用於播放軌內的層中之子層之最小TemporalId值。 2.   max_sub_layer_id:用於播放軌內的層中之子層之最大TemporalId值。 3.   使layerList為在此播放軌中攜載的層的層ID及在其他播放軌中攜載並藉由在此播放軌中攜載之層直接或間接參考的層的層ID之清單。layerList中之層ID係按層ID值之遞升次序而定序。舉例而言,假設此播放軌攜載具有層ID 4及5的層且其參考具有等於0及1之層ID的層,則與此播放軌相關聯的layerList為{0、1、4、5}。 因此,至少根據本發明之第二技術,器件(例如,源器件12、檔案產生器件34或另一器件)可在樣本至群組邏輯框中包括第一語法元素(例如,target_layers)及第二語法元素(例如,layer_id_method_idc)。第一語法元素指定該等目標層。第二語法元素指定第一語法元素之語義。類似地,在一實例中,第一語法元素(例如,target_layers)可指示存在於播放軌中之目標層。在此實例中,器件(例如,目的地器件14、MANE或另一器件)可自樣本至群組邏輯框獲得第二語法元素(例如,layer_id_method_idc),該第二語法元素指定第一語法元素之語義。在此實例中,該器件可根據由第二語法元素指定之語義解釋第一語法元素以判定該等目標層。 根據本發明之第四技術,針對適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組,適用於操作點之樣本群組為用於操作點之所需播放軌中之播放軌中的各別樣本群組,其含有操作點之最高層的樣本。舉例而言,在一特定實例中,操作點包括第一層及第二層。在此實例中,第二層為操作點之最高層。在此實例中,檔案之第一播放軌包括第一層且檔案之第二播放軌包括第二層。此外,在此實例中,第一播放軌及第二播放軌兩者皆包括同一類型之樣本群組(例如,『sap』)。因此,在此實例中,由於第二播放軌包括操作點之最高層,因此第二播放軌中之樣本群組適用於操作點。若樣本群組之樣本中的操作點之經編碼圖像具有一特定特性,則包含具有該特定特性之樣本的樣本群組適用於操作點。舉例而言,若『sap』樣本群組之每一樣本包括為串流存取點且在操作點中之經編碼圖像,則『sap』樣本群組適用於操作點。由於僅單個樣本群組適用於操作點,因此可不必要自包括操作點之層的所有播放軌提取並合併所有樣本群組資訊。此可解決上文所述之關於在獲得用於操作點之『sap』樣本群組中所涉及的額外工作的問題。 在第四技術之一些實例中,已提出適用於操作點之『sap』、『sync』、『rap』、『roll』、『tsas』或『stsa』樣本群組為用於操作點所需播放軌中之播放軌中的各別樣本群組,其含有操作點之最高層的樣本。因此,先前段關於『sap』樣本群組之實例可適用於『sync』、『rap』、『roll』、『tsas』或『stsa』樣本群組。舉例而言,器件(例如,源器件12、檔案產生器件34或另一器件)可基於含有操作點之最高層的樣本的播放軌傳訊該播放軌中之樣本群組。類似地,器件(例如,目的地器件14、MANE或另一器件)可基於含有操作點之最高層的樣本的播放軌判定該播放軌包括該樣本群組。因此,此等實例類似於先前段中所提供之實例,但適用於額外樣本群組類型。在第四技術之一些實例中,適用於操作點之『sap』、『sync』、『rap』、『roll』、『tsas』或『stsa』樣本群組為各別樣本群組之集合,其中各別樣本群組之集合中之合併目標層包括操作點之所有層。此段中所提供之實例可解決上文所述之關於缺失用於操作點之『sap』樣本群組的問題。 根據本發明之第五技術,對於第四技術施加以下約束:第一,在用於操作點這所需播放軌當中的至少一個播放軌具有『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組時,操作點所需之所有播放軌一定亦分別具有相應的樣本群組。舉例而言,假設操作點包括第一層及第二層。在此實例中,第一層在第一播放軌中且第二層在第二播放軌中。此外,在此實例中,若第一播放軌具有『sap』樣本群組,則約束條件要求第二播放軌具有『sap』樣本群組。在此實例中,若第一播放軌具有『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組,則應用上述情況。 根據本發明之第五技術之第二約束條件,操作點所需之存在於播放軌中之『sap』、『rap』、『sync』、『roll』、『tsas』及『stsa』樣本群組為時間上對準的。舉例而言,對於特定解碼時間,若第一層具有圖像,則第二層一定亦具有圖像。 根據本發明之第六技術,藉由將術語『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組改變成適用於多層位元串流之所有樣本群組來提出第五技術中之約束條件。舉例而言,根據本發明之第六技術,上文所述之關於第五技術之限制並非僅適用於『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組,上文所述之關於第五技術之限制亦相對於適用於L-HEVC檔案格式之所有類型的樣本群組來應用。 根據本發明之第七技術,當『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組用於L-HEVC之上下文且各別樣本群組描述之版本等於0時,據推斷含有樣本群組之播放軌中的所有層及由播放軌中之層直接且間接參考的可能所有層均為目標層。在一些實例中,其意味著當樣本群組描述之版本等於0時,則推斷layer_id_method_idc之值等於0。舉例而言,樣本群組描述具有一版本。當樣本群組描述之版本不等於0時,存在額外資訊(亦即,所謂的grouping_parameter)在樣本至群組邏輯框中傳訊。對於彼等群組類型,此grouping_parameter用以指示該(該等)目標層。第七技術使得彼等分群具有等於0之版本且當版本等於0時,解釋檔案之器件能夠判定所有層為目標層。 根據本發明之第八技術,藉由將術語『sap』、『rap』、『sync』、『roll』、『tsas』或『stsa』樣本群組改變成適用於多層位元串流之所有樣本群組來提出第七技術中之約束條件。因此,對於所有分群類型,當樣本群組描述之版本為0時,解釋檔案之器件能夠針對所有分群類型判定所有層為目標層。 本發明之第九技術涉及『sbas』播放軌參考。使最低操作點為由分別具有dependency_id、temporal_id及quality_id之最小值的DTQ (dependency_id、temporal_id及quality_id)組合表示之所有操作點中的一者。DTQ為在H.264/AVC中所指定之概念。特定言之,如H.264/AVC規範之第G.7.4.1.1項所描述,dependency_id指定NAL單元之依附性識別符,temporal_id指定NAL單元之時間識別符且quality_id指定NAL單元之品質識別符。具有旗標「complete_representation」集合且含有最低操作點之播放軌將提名為『可調式基本播放軌』。為同一可調式經編碼資訊之部分的所有其他播放軌將以播放軌參考類型『sbas』(可調式基本)的方式與此基本播放軌有關。根據本發明之第九技術,適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組(若存在)將僅容納於由其他播放軌使用『sbas』播放軌參考所參考之播放軌中。舉例而言,檔案格式可指定要求適用於多層位元串流之所有樣本群組在可調式基本播放軌中的限制。替代地,在一些實例中,對於適用於多層位元串流(例如,L-HEVC位元串流)之所有樣本群組(若存在),其將僅容納於攜載操作點資訊之播放軌中。 本發明提出若干技術(例如,上文所述之第一至第九技術)。此等技術中之一些可獨立地應用,且其中之一些可組合地應用。舉例而言,第一、第二、第三及/或第四技術之實例可組合使用;第一、第二、第三及/或第五技術之實例可組合使用;第一、第二、第三及/或第六技術之實例可組合使用;且以此類推可組合使用,此為不詳盡之組合列表。 圖3為說明根據本發明之一或多種技術之檔案300之實例結構的方塊圖。檔案300可由各種器件(諸如源器件12 (圖1)、檔案產生器件34 (圖1)或另一器件)產生。在圖3之實例中,檔案300包括電影邏輯框302及複數個媒體資料邏輯框304。儘管在圖3之實例中說明為在同一檔案中,但在其他實例中,電影邏輯框302及媒體資料邏輯框304可在單獨的檔案中。如上所指示,邏輯框可為由唯一類型識別符及長度定義之目標導向式建構嵌段。舉例而言,邏輯框可為ISOBMFF中之基本語法結構,包括四字元寫碼邏輯框類型、邏輯框之位元組計數及有效負載。 電影邏輯框302可含有用於檔案300之播放軌的後設資料。檔案300之每一播放軌可包含媒體資料之連續串流。媒體資料邏輯框304中之每一者可包括一或多個樣本305。樣本305中之每一者可包含音訊或視訊存取單元。如在本發明中其他處所描述,在多視圖寫碼(例如,MV-HEVC及3D-HEVC)及可調式視訊寫碼(例如,SHVC)中,每一存取單元可包含多個經寫碼圖像。舉例而言,存取單元可包括用於每一層之一或多個經寫碼圖像。 此外,在圖3之實例中,電影邏輯框302包括播放軌邏輯框306。播放軌邏輯框306可圍封用於檔案300之播放軌的後設資料。在其他實例中,電影邏輯框302可包括用於檔案300之不同播放軌的多個播放軌邏輯框。播放軌邏輯框306包括媒體邏輯框307。媒體邏輯框307可含有聲明關於播放軌內之媒體資料的資訊之所有目標。媒體框307包括媒體資訊邏輯框308。媒體資訊邏輯框308可含有聲明播放軌之媒體的特徵資訊之所有目標。媒體資訊邏輯框308包括樣本表邏輯框309。樣本表邏輯框309可指定樣本特定後設資料。樣本表邏輯框309可包括零個或多個SampleToGroup邏輯框及零個或多個SampleGroupDescription邏輯框。 在圖3之實例中,樣本表邏輯框309包括SampleToGroup邏輯框310及SampleGroupDescription邏輯框312。在其他實例中,樣本表邏輯框309可包括除SampleToGroup邏輯框310及SampleGroupDescription邏輯框312以外的其他邏輯框,及/或可包括多個SampleToGroup邏輯框及SampleGroupDescription邏輯框。 SampleToGroup邏輯框310可將樣本(例如,樣本305中之特定者)映射至樣本之群組。SampleGroupDescription邏輯框312可指定由樣本之群組(亦即,樣本群組)中之樣本共用的性質。 此外,在圖3之實例中,SampleToGroup邏輯框310包括grouping_type語法元素313 (亦即,分群類型語法元素)、grouping_type_parameter語法結構314 (亦即,分群類型參數語法結構)、entry_count語法元素316 (亦即,項計數語法元素)及一或多個樣本群組項318。Grouping_type語法元素313為識別樣本分群之類型(亦即,用以形成樣本群組之準則),且將其鏈接至其具有相同分群類型值之樣本群組描述表的整數。在一些實例中,針對播放軌存在具有用於grouping_type語法元素313之同一值的SampleToGroup邏輯框310之至多一個出現。 Grouping_type_parameter語法結構314包括target_layers語法元素320 (亦即,目標層語法元素)及layer_id_method_idc語法元素322。Target_layers語法元素320指示用於與SampleToGroup邏輯框310相對應之樣本群組的目標層。layer_id_method_idc語法元素322指示用於解釋target_layers語法元素320之語義。 Entry_count語法元素316指示樣本群組項318之數目。樣本群組項318中之每一者包括sample_count語法元素324 (亦即,樣本計數語法元素)及group_description_index語法元素326 (亦即,群組描述索引語法元素)。Sample_count語法元素324可指示與含有sample_count語法元素324之樣本群組項相關聯的樣本之數目。Group_description_index語法元素326可在SampleGroupDescription邏輯框(例如,SampleGroupDescription邏輯框312)內識別含有與含有group_description_index語法元素326之樣本群組項相關聯的樣本描述的群組描述項。Group_description_index語法元素326可介於1至SampleGroupDescription邏輯框312中之樣本群組項之數目的範圍內。具有值0之Group_description_index語法元素326指示樣本為藉由grouping_type語法元素313指示的類型之無群組的成員。 根據本發明之第二技術,grouping_type語法元素313可指示SampleToGroup邏輯框310為『sap』、『sync』、『rap』、『roll』、『tsas』或『stsa』樣本群組且可包括target_layers語法元素320。 另外,在圖3之實例中,SampleGroupDescription邏輯框312包括grouping_type語法元素328、entry_count語法元素330及一或多個群組描述項332。Grouping_type語法元素328為識別與SampleGroupDescription邏輯框312相關聯的SampleToGroup邏輯框(例如,SampleToGroup邏輯框310)的整數。Entry_count語法元素330指示SampleGroupDescription邏輯框中的群組描述項332之數目。群組描述項332中之每一者可包括樣本群組之描述。 圖4為說明根據本發明之一或多種技術的檔案450之實例結構之方塊圖。檔案450可由各種器件(諸如源器件12 (圖1)、檔案產生器件34 (圖1)或另一器件)產生。在圖4之實例中,檔案450包括一或多個電影片段邏輯框452及複數個媒體資料邏輯框454。電影片段邏輯框可用於將較大媒體串流分段為較小塊。儘管在圖4之實例中說明為在同一檔案中,但在其他實例中,電影片段邏輯框452及媒體資料邏輯框454可在單獨的檔案中。媒體資料邏輯框454中之每一者可包括一或多個樣本456。電影片段邏輯框中之每一者對應於一電影片段。每一電影片段可包含一組播放軌片段。每播放軌可存在零個或多個播放軌片段。 在圖4之實例中,電影片段邏輯框452提供關於對應電影片段之資訊。此資訊將先前已處於諸如電影邏輯框302 (圖3)之電影邏輯框中。電影片段邏輯框452可包括播放軌片段邏輯框458。播放軌片段邏輯框458對應於播放軌片段,且提供關於播放軌片段的資訊。 舉例而言,在圖4之實例中,播放軌片段邏輯框458可包括含有關於對應於播放軌片段邏輯框458之播放軌片段的資訊的一或多個SampleToGroup邏輯框462及一或多個SampleGroupDescription邏輯框464。 此外,在圖4之實例中,SampleToGroup邏輯框462包括grouping_type語法元素470 (亦即,分群類型語法元素)、grouping_type_parameter語法結構472 (亦即,分群類型參數語法結構)、entry_count語法元素474 (亦即,項計數語法元素)及一或多個樣本群組項476。Grouping_type_parameter語法結構472包括target_layers語法元素478 (亦即,目標層語法元素)及layer_id_method_idc語法元素480。Target_layers語法元素478指示用於與SampleToGroup邏輯框462相對應之樣本群組的目標層。layer_id_method_idc語法元素480指示用於解釋target_layers語法元素478之語義。樣本群組項476中之每一者包括sample_count語法元素482 (亦即,樣本計數語法元素)及group_description_index語法元素484 (亦即,群組描述索引語法元素)。Grouping_type語法元素470、entry_count語法元素474、target_layers語法元素478、layer_id_method_idc語法元素480、sample_count語法元素482及group_description_index語法元素484可具有與相對於圖3之實例所描述之相應語法元素相同的語義。 根據本發明之第二技術,grouping_type語法元素470可指示SampleToGroup邏輯框462為『sap』、『sync』、『rap』、『roll』、『tsas』或『stsa』樣本群組且可包括target_layers語法元素478。 另外,在圖4之實例中,SampleGroupDescription邏輯框464中之每一者可包括grouping_type語法元素486、entry_count語法元素488及一或多個群組描述項490。Grouping_type語法元素486、entry_count語法元素488及群組描述項490可具有與相對於圖3之實例所描述之相應語法元素及結構相同的語義。 圖5為說明實例視訊編碼器20的方塊圖。出於解釋之目的而提供圖5,且不應將該圖視為對如本發明中所廣泛例示及描述之技術的限制。出於解釋之目的,本發明在HEVC寫碼之上下文中描述視訊編碼器20。然而,本發明之技術可適用於其他寫碼標準或方法。 在圖5之實例中,視訊編碼器20包括預測處理單元100、視訊資料記憶體101、殘餘產生單元102、變換處理單元104、量化單元106、反量化單元108、反變換處理單元110、重建構單元112、濾波器單元114、經解碼圖像緩衝器116及熵編碼單元118。預測處理單元100包括框間預測處理單元120及框內預測處理單元126。框間預測處理單元120可包括運動估計單元及運動補償單元(未示出)。在其他實例中,視訊編碼器20可包括較多、較少或不同功能之組件。 視訊資料記憶體101可儲存待由視訊編碼器20之組件編碼的視訊資料。儲存於視訊資料記憶體101中之視訊資料可(例如)自視訊源18 (圖1)獲得。經解碼圖像緩衝器116可為儲存用於由視訊編碼器20在編碼視訊資料(例如,以框內或框間寫碼模式)時使用之參考視訊資料的參考圖像記憶體。視訊資料記憶體101及經解碼圖像緩衝器116可由各種記憶體器件中之任一者形成,諸如,動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。可由同一記憶體器件或單獨記憶體器件提供視訊資料記憶體101及經解碼圖像緩衝器116。在各種實例中,視訊資料記憶體101可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件而言在晶片外。 視訊編碼器20接收視訊資料。視訊編碼器20可編碼視訊資料之圖像之片段中的每一CTU。 該等CTU中之每一者可與相等大小的明度寫碼樹型區塊(CTB)及圖像之對應CTB相關聯。作為編碼CTU之部分,預測處理單元100可執行四分樹分割以將CTU之CTB分割成逐漸較小的區塊。較小區塊可為CU之寫碼區塊。 視訊編碼器20可編碼CTU之CU以產生CU之經編碼表示(亦即,經寫碼CU)。作為編碼CU之部分,預測處理單元100可分割與CU之一或多個PU當中的CU相關聯之寫碼區塊。因此,每一PU可與明度預測區塊及對應的色度預測區塊相關聯。視訊編碼器20及視訊解碼器30可支援具有各種大小之PU。 框間預測處理單元120可藉由對CU中之每一PU執行框間預測而產生PU之預測性資料。PU之預測性資料可包括PU之預測性區塊及PU之運動資訊。框內預測處理單元126可藉由對PU執行框內預測而產生用於PU之預測性資料。PU之預測性資料可包括PU之預測性區塊及各種語法元素。 預測處理單元100可自由框間預測處理單元120產生的PU之預測性資料或由框內預測處理單元126產生的PU之預測性資料當中選擇CU之PU的預測性資料。在一些實例中,預測處理單元100基於預測性資料之集合的速率/失真量度而選擇用於CU之PU的預測性資料。所選擇之預測性資料的預測性區塊在本文中可被稱作所選擇之預測性區塊。 殘餘產生單元102可基於CU之寫碼區塊及用於CU之PU的選定預測性區塊而產生用於CU之殘餘區塊。舉例而言,殘餘產生單元102可產生CU之殘餘區塊,使得殘餘區塊中之每一樣本具有等於CU之寫碼區塊中的樣本與CU之PU的對應選定預測性區塊中之對應樣本之間的差的值。 變換處理單元104可執行四分樹分割以將與CU相關聯之殘餘區塊分割成與CU之TU相關聯的變換區塊。因此,TU可與明度變換區塊及兩個色度變換區塊相關聯。變換處理單元104可藉由將一或多個變換應用於TU之變換區塊而產生用於CU之每一TU的變換係數區塊。在此等實例中,變換區塊可經處理為變換係數區塊。 量化單元106可量化係數區塊中之變換係數。量化程序可減小與該等係數中之一些或全部相關聯的位元深度。反量化單元108及反變換處理單元110可分別將反量化及反變換應用於係數區塊,以自係數區塊重建構殘餘區塊。重建構單元112可將經重建構之殘餘區塊添加至來自由預測處理單元100產生之一或多個預測性區塊的對應樣本,以產生與TU相關聯的經重建變換區塊。 藉由以此方式重構CU之每一TU的變換區塊,視訊編碼器20可重建構CU之寫碼區塊。 過濾器單元114可執行一或多個解區塊操作以減少與CU相關聯之寫碼區塊中的區塊假影。在濾波器單元114對經重構寫碼區塊執行一或多個解區塊操作之後,經解碼之圖像緩衝器116可儲存經重建構之寫碼區塊。框間預測處理單元120可使用含有經重建構寫碼區塊之參考圖像,以對其他圖像之PU執行框間預測。另外,框內預測處理單元126可使用經解碼圖像緩衝器116中之經重建構寫碼區塊來對與CU相同之圖像中的其他PU執行框內預測。 熵編碼單元118可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼單元118可自量化單元106接收係數區塊,且可自預測處理單元100接收語法元素。熵編碼單元118可對資料執行一或多個熵編碼操作,以產生經熵編碼之資料。視訊編碼器20可輸出包括由熵編碼單元118產生之經熵編碼資料的位元串流。舉例而言,位元串流可包括表示CU之RQT的資料。 此外,在圖5之實例中,檔案處理單元128可獲得由視訊編碼器20產生之位元串流。檔案處理單元128可藉由器件(諸如源器件12、檔案產生器件34、內容遞送網路器件或另一類型之器件)之一或多個處理器或處理電路來實施。檔案處理單元128可產生儲存由視訊編碼器20產生之位元串流的檔案。電腦可讀媒體130可接收由檔案處理單元128產生的檔案。在一些實例中,電腦可讀媒體130包含諸如記憶體、光學光碟、磁碟或計算器件能夠自其讀取資料的其他類型之非暫時性儲存媒體之電腦可讀儲存媒體。在其中電腦可讀媒體130包含電腦可讀儲存媒體之一些實例中,電腦可讀儲存媒體可形成器件(諸如源器件12 (圖1)、檔案產生器件34 (圖1)、內容遞送網路器件或另一類型器件)之部分。在一些實例中,電腦可讀取媒體130包含電腦可讀通信媒體,諸如光纖、通信電纜、電磁波或計算器件能夠自其讀取資料的其他類型之媒體。 根據本發明之技術,檔案處理單元128可產生含有用於播放軌之後設資料的播放軌邏輯框。作為產生播放軌邏輯框之部分,檔案處理單元128可在播放軌邏輯框中產生含有樣本群組描述項的樣本描述邏輯框。此外,作為產生播放軌邏輯框之部分,檔案處理單元128可在播放軌邏輯框中產生用於播放軌之樣本至群組邏輯框。樣本至群組邏輯框將播放軌之樣本映射至樣本群組中,該樣本群組包含共享由該樣本群組描述項所指定之一特性的樣本。樣本至群組邏輯框可指定存在於播放軌中之層當中的目標層。該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像。舉例而言,樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。 圖6為說明實例視訊解碼器30的方塊圖。出於解釋之目的而提供圖6,且其並不限制如本發明中所廣泛例示及描述之技術。出於解釋之目的,本發明描述在HEVC寫碼之上下文中的視訊解碼器30。然而,本發明之技術可適用於其他寫碼標準或方法。 在圖6之實例中,視訊解碼器30包括熵解碼單元150、視訊資料記憶體151、預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158、濾波器單元160,及經解碼圖像緩衝器162。預測處理單元152包括運動補償單元164及框內預測處理單元166。在其他實例中,視訊解碼器30可包括較多、較少或不同功能之組件。 視訊資料記憶體151可儲存待由視訊解碼器30之組件解碼的視訊資料,諸如經編碼視訊位元串流。可(例如)自頻道16,(例如)自本端視訊源(諸如攝像機)經由視訊資料之有線或無線網路通信或藉由存取實體資料儲存媒體來獲得儲存於視訊資料記憶體151中之視訊資料。視訊資料記憶體151可形成儲存來自經編碼視訊位元串流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。經解碼圖像緩衝器162可為儲存視訊解碼器30 (例如)以框內或框間寫碼模式解碼視訊資料所使用之參考視訊資料的參考圖像記憶體。視訊資料記憶體151及經解碼圖像緩衝器162可由各種記憶體器件中之任一者形成,諸如,動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。可由同一記憶體器件或單獨記憶體器件提供視訊資料記憶體151及經解碼圖像緩衝器162。在各種實例中,視訊資料記憶體151可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件而言在晶片外。 視訊資料記憶體151接收且儲存位元串流之經編碼視訊資料(例如,NAL單元)。熵解碼單元150可自CPB接收經編碼視訊資料(例如,NAL單元)並解析NAL單元以獲得語法元素。熵解碼單元150可熵解碼NAL單元中之經熵編碼語法元素。預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158及濾波器單元160可基於自位元串流提取之語法元素產生經解碼視訊資料。熵解碼單元150可執行大體上與熵編碼單元118之彼程序互逆的程序。 除自位元串流獲得語法元素之外,視訊解碼器30可對未經分割之CU執行重建構操作。為對CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由對CU之每一TU執行重建構操作,視訊解碼器30可重建構CU之殘餘區塊。 作為對CU之TU執行重建構操作之部分,反量化單元154可對與TU相關聯之係數區塊進行反量化(亦即,解量化)。在反量化單元154反量化係數區塊之後,反變換處理單元156可將一或多個反變換應用於係數區塊,以便產生與TU相關聯之殘餘區塊。舉例而言,反轉變處理單元156可將反DCT、反整數變換、反Karhunen-Loeve變換(KLT)、反旋轉變換、反定向變換或另一反變換應用於係數區塊。 若使用框內預測編碼PU,則框內預測處理單元166可執行框內預測以產生PU之預測性區塊。框內預測處理單元166可使用框內預測模式來基於樣本空間相鄰區塊產生PU之預測性區塊。框內預測處理單元166可基於自位元串流獲得的一或多個語法元素判定用於PU之框內預測模式。 若使用框間預測編碼PU,則熵解碼單元150可判定PU之運動資訊。運動補償單元164可基於PU之運動資訊而判定一或多個參考區塊。運動補償單元164可基於一或多個參考區塊產生PU之預測性區塊。 重建構單元158可使用CU之TU的變換區塊及CU之PU的預測性區塊(亦即,框內預測資料或框間預測資料)作為可適用以重建CU之寫碼區塊。舉例而言,重建構單元158可將該等變換區塊之樣本添加至該等預測性區塊之相應樣本中以重建構CU之寫碼區塊。 濾波器單元160可執行解區塊操作以減少與CU之寫碼區塊相關聯的區塊假影。視訊解碼器30可將CU之寫碼區塊儲存於經解碼圖像緩衝器162中。經解碼圖像緩衝器162可提供參考圖像以用於後續運動補償、框內預測及在顯示器件(諸如,圖1之顯示器件32)上的呈現。舉例而言,視訊解碼器30可基於經解碼圖像緩衝器162中之區塊對其他CU之PU執行框內預測或框間預測操作。 在圖6之實例中,電腦可讀媒體148包含諸如記憶體、光學光碟、磁碟或計算器件能夠自其讀取資料的其他類型的非暫時性儲存媒體之電腦可讀儲存媒體。在其中電腦可讀媒體148包含電腦可讀儲存媒體之一些實例中,電腦可讀儲存媒體可形成器件(諸如源器件12 (圖1)、檔案產生器件34 (圖1)、內容遞送網路器件或另一類型器件)之部分。在一些實例中,電腦可讀取媒體148包含電腦可讀通信媒體,諸如光纖、通信電纜、電磁波或計算器件能夠自其讀取資料的其他類型之媒體。 此外,在圖6之實例中,檔案處理單元149自電腦可讀取媒體148接收檔案或檔案之部分。檔案處理單元149可藉由器件(諸如目的地器件14、MANE、內容遞送網路器件或另一類型之器件)之一或多個處理器或處理電路來實施。 檔案處理單元149可處理檔案。舉例而言,檔案處理單元149可自檔案獲得NAL單元。在圖6之實例中,藉由視訊解碼器30接收之經編碼視訊位元串流可包含自檔案獲得之NAL單元。 根據本發明之技術,檔案處理單元149可自儲存多層位元串流之檔案獲得含有用於播放軌之後設資料的播放軌邏輯框,該多層位元串流包含形成視訊資料之圖像表示的位元之序列。作為獲得播放軌邏輯框之部分,檔案處理單元149可自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框。此外,作為獲得播放軌邏輯框之部分,檔案處理單元149可自播放軌邏輯框獲得用於播放軌之樣本至群組邏輯框,該樣本至群組邏輯框將播放軌之樣本映射至樣本群組中。樣本群組可包含共用由樣本群組描述項所指定之一特性的樣本。此外,檔案處理單元149可基於樣本至群組邏輯框中之語法元素判定存在於播放軌中的層當中的目標層。該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像。樣本群組為以下中之一者:TSA樣本群組且該特定圖像類型為時間子層存取圖像類型,或STSA樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。檔案處理單元149可基於包括含有特定時間子層之經寫碼圖像的層的目標層將TSA或STSA樣本群組中之一樣本識別為適合於時間子層向上切換至特定時間子層。檔案處理單元149可自識別樣本提取經編碼視訊資料且將所提取之視訊資料提供至視訊解碼器30,由此實現時間子層向上切換。 圖7為說明根據本發明之技術的實例操作的流程圖。將本發明之流程圖提供為實例。在其他實例中,可執行較多、較少或不同的操作或可以不同次序或同時執行動作。 在圖7之實例中,源器件12之視訊源18可獲得視訊資料(180)。舉例而言,如在本發明中其他處所描述之,視訊源18可包含自所偵測光獲得視訊資料之一或多個攝像機。視訊資料可包含圖像之序列。此外,在圖7之實例中,源器件12之視訊編碼器20可產生包含形成視訊資料之圖像表示的位元之序列的多層位元串流(182)。舉例而言,視訊編碼器20可根據如在本發明中其他處所描述之L-HEVC編碼解碼器產生多層位元串流。 隨後,器件可產生儲存多層位元串流之檔案(184)。儲存檔案可包含將表示檔案之資料儲存至資料儲存媒體。在一些實例中,源器件12 (圖1)內之單元產生檔案。在一些實例中,諸如檔案產生器件34 (圖1)之單獨器件產生檔案。在一些實例中,檔案處理單元128 (圖5)產生檔案。在圖7之實例中,作為產生檔案之部分,該器件可產生樣本(186)。大體而言,產生樣本可包含儲存表示樣本之資料。樣本可包括多層位元串流之相同存取單元之一或多個經寫碼圖像的NAL單元。產生樣本可包含產生含有NAL單元之集合的邏輯框。此外,作為產生檔案之部分,該器件可識別共用一特性之樣本(188)。舉例而言,該器件可識別包括TSA圖像或STSA圖像之樣本。此外,在圖7之實例中,該器件可產生播放軌邏輯框(190)。以下所描述之圖8提供其中器件產生播放軌邏輯框的實例操作。如下所述,該器件可產生將播放軌之樣本映射至樣本群組中的樣本至群組邏輯框,其中樣本群組包含共用該特性之樣本。 圖8為說明其中根據本發明之技術產生播放軌邏輯框的處理視訊資料之實例操作的流程圖。圖8之實例符合上文所述之本發明之第二技術。 在圖8之實例中,器件(例如,源器件12 (圖1)、檔案產生器件34 (圖1)、檔案處理單元128 (圖4)或另一器件或單元)在儲存多層位元串流之檔案中產生圍封用於播放軌之後設資料的播放軌邏輯框(200)。大體而言,產生邏輯框可包含儲存表示邏輯框之資料。播放軌含有媒體內容。播放軌之媒體內容可包含樣本之序列或由樣本之序列構成。該序列樣本中之每一樣本可對應於一存取單元。作為產生播放軌邏輯框之部分,該器件在播放軌邏輯框中可包括含有樣本群組描述項之樣本描述邏輯框(202)。將樣本描述邏輯框包括於播放軌邏輯框中可包含將資料儲存至資料儲存媒體以使得所儲存之資料經解釋為播放軌邏輯框之部分。該器件在播放軌邏輯框亦可包括用於播放軌之樣本至群組邏輯框(204)。將樣本至群組邏輯框包括於播放軌邏輯框中可包含將資料儲存至資料儲存媒體以使得所儲存之資料經解釋為播放軌邏輯框之部分。樣本至群組邏輯框將播放軌之樣本映射至樣本群組中。樣本群組包含共用由樣本群組描述項所指定之一特性的樣本。樣本至群組邏輯框指定存在於播放軌中的層當中的目標層。舉例而言,樣本至群組邏輯框可包括指定存在於播放軌中的層當中的目標層的語法元素。該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像。在一些情況下,樣本群組為『tsas』樣本群組且該特定圖像類型為時間子層存取圖像類型。在一些情況下,樣本群組為『stsa』樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。 圖9為說明根據本發明之技術的實例操作的流程圖。在圖9之實例中,諸如目的地器件14 (圖1)之器件或實施檔案處理單元149 (圖6)之器件可獲得檔案或檔案之部分(220)。舉例而言,該器件可下載檔案或接收檔案之部分的串流。在一些實例中,該器件可自本端儲存器獲得檔案。 另外,在圖9之實例中,該器件可發送含有藉由檔案封裝之多層位元串流的第一時間子層的檔案之檔案提取單元樣本(222)。在一些實例中,該器件可經由一或多個通信媒體發送樣本。在一些實例中,可經由內部互連件將樣本發送或儲存至電腦可讀儲存媒體中之一特定位置。此外,如圖9之實例中示出,檔案提取單元可自檔案之樣本(包括識別之樣本)提取經編碼視訊資料(224)。在一些實例中,檔案處理單元149 (圖6)執行檔案提取單元之作用。可藉由自檔案複製經編碼視訊資料而自檔案提取經編碼視訊資料。視訊解碼器30可解碼自檔案提取之經編碼視訊資料(226)。視訊解碼器30可以在本發明中其他處所描述之方式解碼經編碼視訊資料。目的地器件14之顯示器件32可輸出經解碼視訊資料(228)。 此外,在圖9之實例中,該器件可做出執行時間子層向上切換至第二時間子層的判定(230)。第二時間子層可具有比第一時間子層之時間識別符更大之時間識別符。在一些實例中,該器件可回應於來自目的地器件14、視訊解碼器30或另一器件或單元之要求做出執行時間子層向上切換的判定。在一些實例中,該器件可回應於其他事件(諸如偵測到網路通量增加)做出執行時間子層向上切換的判定。 回應於做出執行時間子層向上切換的判定,該器件可識別含有第二時間子層之TSA或STSA圖像的檔案之樣本(232)。若第二時間子層之時間識別符比第一時間子層之時間識別符大1,則STSA圖像為可接受的。作為識別樣本之部分,該器件可執行圖10之程序。因此,如下文相對於圖10所描述,基於TSA或STSA樣本群組之樣本至群組邏輯框中所指定之目標層為特定時間子層,該器件可判定特定樣本包括第二時間子層之TSA或STSA圖像。 該器件可將識別樣本及識別樣本屬於之播放軌的潛在後續樣本傳送至檔案提取單元。因此,該器件可將含有第二時間子層之經寫碼圖像的檔案的樣本傳送至檔案提取單元(234)。檔案提取單元可自檔案之樣本(包括識別樣本)提取經編碼視訊資料(224)。視訊解碼器30可解碼自檔案提取之經編碼視訊資料(226)。因此,當視訊解碼器30接收識別樣本之經編碼視訊資料時,視訊解碼器30可開始解碼特定時間子層之經編碼視訊資料。以此方式,視訊解碼器30可執行時間子層向上切換。目的地器件14之顯示器件32可輸出經解碼視訊資料(228)。 圖10為說明根據本發明之技術用於處理視訊資料之器件的實例操作的流程圖。圖10之操作可由諸如目的地器件14 (圖1)、MANE、檔案伺服器、串流伺服器或另一類型器件之各種器件執行。 在圖10之實例中,該器件自檔案獲得圍封用於播放軌之後設資料的播放軌邏輯框(250)。播放軌可含有媒體內容。播放軌之媒體內容可包含樣本之序列。該序列樣本中之每一樣本可對應於一存取單元。 此外,在圖10之實例中,作為獲得播放軌邏輯框之部分,該器件可自播放軌邏輯框獲得含有樣本群組描述項之樣本描述邏輯框(252)。舉例而言,該器件可讀取檔案中之樣本描述邏輯框。此外,作為獲得播放軌邏輯框之部分,該器件可自播放軌邏輯框獲得用於播放軌之樣本至群組邏輯框(254)。舉例而言,該器件可讀取檔案中之樣本至群組邏輯框。樣本至群組邏輯框可將播放軌之樣本映射至樣本群組中。樣本群組可包含共用由樣本群組描述項所指定之一特性的樣本。 在圖10之實例中,該器件可基於樣本至群組邏輯框中之語法元素(例如,target_layers語法元素)判定存在於播放軌中的層當中的目標層(256)。該等目標層中之每一者可含有屬於一特定圖像類型之至少一個圖像。樣本群組可為以下中之一者:『tsas』樣本群組且該特定圖像類型為時間子層存取圖像類型,或『stsa』樣本群組且該特定圖像類型為逐步時間子層存取圖像類型。 此外,該器件可基於包括含有特定時間子層之經寫碼圖像的一層的目標層將TSA或STSA樣本群組中之樣本識別為適合於時間子層向上切換至特定時間子層(258)。特定時間子層可為上文相對於圖9所提及之第二時間子層。因此,特定時間子層為待發生向上切換到的時間子層。假設特定時間子層之經寫碼圖像屬於特定層,若樣本包括屬於特定層之TSA或STSA圖像,則樣本可適合於時間子層向上切換至特定時間子層。舉例而言,若特定時間子層之經寫碼圖像處於層2中且由給定播放軌之TSA或STSA樣本群組所指示之目標層包括層2,則該器件可將給定播放軌之TSA或STSA樣本群組的樣本識別為適合於時間子層向上切換至特定時間子層。 應理解,本文所描述之所有技術可單獨地或以組合方式使用。應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同序列執行、可添加、合併或完全省略(例如,對於實踐該等技術而言並非所有所描述之動作或事件皆為必要的)。此外,在某些實例中,可(例如)經由多線程處理、中斷處理或多個處理器同時而非依序執行動作或事件。另外,雖然出於清晰目的,本發明之某些態樣被描述為由單一模組或單元執行,但應理解,本發明之技術可由與視訊寫碼器相關聯之單元或模組之組合來執行。 出於說明的目的,已相對於HEVC標準描述本發明之某些態樣。然而,本發明中所描述之技術可適用於其他視訊寫碼程序,包括尚未開發之其他標準或專屬視訊寫碼程序。 上文所描述之技術可藉由源器件12、目的地器件14、檔案產生器件34或其他器件執行。視訊編碼器20及視訊解碼器30可大體上被稱作視訊寫碼器。同樣地,視訊寫碼可指視訊編碼或視訊解碼(在可適用時)。 雖然在上文描述該等技術的各種態樣之特定組合,但提供此等組合僅為了說明本發明中描述的技術之實例。因此,本發明之技術不應限於此等實例組合且可涵蓋本發明中描述之技術的各種態樣之任何可設想組合。 在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而在電腦可讀媒體上儲存或傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體,其對應於有形媒體,諸如資料儲存媒體,或包括有助於將電腦程式自一處傳送至另一處(例如,根據通信協定)之任何媒體的通信媒體。以此方式,電腦可讀媒體大體可對應於(1)非暫時性的有形電腦可讀儲存媒體,或(2)諸如訊號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包含電腦可讀媒體。處理器可以各種方式耦合至資料儲存媒體。舉例而言,處理器可經由內部器件互連件、有線或無線網路連接或另一通信媒體耦合至資料儲存媒體。 藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體或可用以儲存呈指令或資料結構之形式之所要的程式碼且可由電腦存取的任何其他媒體。此外,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸纜線、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、訊號或其他暫時性媒體,而實際上有關於非暫時性有形儲存媒體。如本文所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位多功能光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟用雷射以光學方式再現資料。以上各者之組合亦應包括於電腦可讀媒體之範疇內。 本發明中所描述之功能可藉由固定功能及/或可程式化處理電路執行。舉例而言,指令可藉由固定功能及/或可程式化處理電路執行。指令可由一或多個處理器執行,該一或多個處理器諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體電路或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指代前述結構或適用於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供在經組態用於編碼及解碼之專屬硬體及/或軟體模組內,或併入合併之編碼解碼器中。此外,該等技術可在一或多個電路或邏輯元件中充分實施。處理電路可以各種方式耦合至其他組件。舉例而言,處理電路可經由內部器件互連件、有線或無線網路連接或另一通信媒體耦合至其他組件。 可以多種器件或設備實施本發明之技術,該等器件或設備包括無線手機、積體電路(IC)或IC之集合(例如,晶片集合)。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之器件的功能態樣,但未必需要藉由不同硬體單元來實現。實際上,如上文所描述,各種單元可結合合適的軟體及/或韌體組合於編碼解碼器硬體單元中或由包括如上文所描述之一或多個處理器的互操作硬體單元之集合提供。 已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。
10‧‧‧視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
31‧‧‧記憶體
32‧‧‧顯示器件
34‧‧‧檔案產生器件
100‧‧‧預測處理單元
101‧‧‧視訊資料記憶體
102‧‧‧殘餘產生單元
104‧‧‧變換處理單元
106‧‧‧量化單元
108‧‧‧反量化單元
110‧‧‧反變換處理單元
112‧‧‧重建構單元
114‧‧‧濾波器單元
116‧‧‧經解碼圖像緩衝器
118‧‧‧熵編碼單元
120‧‧‧框間預測處理單元
126‧‧‧框內預測處理單元
128‧‧‧檔案處理單元
130‧‧‧電腦可讀媒體
148‧‧‧電腦可讀媒體
149‧‧‧檔案處理單元
150‧‧‧熵解碼單元
151‧‧‧視訊資料記憶體
152‧‧‧預測處理單元
154‧‧‧反量化單元
156‧‧‧反變換處理單元
158‧‧‧重建構單元
160‧‧‧濾波器單元
162‧‧‧經解碼圖像緩衝器
164‧‧‧運動補償單元
166‧‧‧框內預測處理單元
180‧‧‧步驟
182‧‧‧步驟
184‧‧‧步驟
186‧‧‧步驟
188‧‧‧步驟
190‧‧‧步驟
200‧‧‧步驟
202‧‧‧步驟
204‧‧‧步驟
220‧‧‧步驟
222‧‧‧步驟
224‧‧‧步驟
226‧‧‧步驟
228‧‧‧步驟
230‧‧‧步驟
232‧‧‧步驟
234‧‧‧步驟
250‧‧‧步驟
252‧‧‧步驟
254‧‧‧步驟
256‧‧‧步驟
258‧‧‧步驟
300‧‧‧檔案
302‧‧‧電影邏輯框
304‧‧‧媒體資料邏輯框
305‧‧‧樣本
306‧‧‧播放軌邏輯框
307‧‧‧媒體邏輯框
308‧‧‧媒體資訊邏輯框
309‧‧‧樣本表邏輯框
310‧‧‧SampleToGroup邏輯框
312‧‧‧SampleGroupDescription邏輯框
313‧‧‧grouping_type語法元素
314‧‧‧grouping_type_parameter語法結構
316‧‧‧entry_count語法元素
318‧‧‧樣本群組項
320‧‧‧target_layers語法元素
322‧‧‧layer_id_method_idc語法元素
324‧‧‧sample_count語法元素
326‧‧‧group_description_index語法元素
328‧‧‧grouping_type語法元素
330‧‧‧entry_count語法元素
332‧‧‧群組描述項
450‧‧‧檔案
452‧‧‧電影片段邏輯框
454‧‧‧媒體資料邏輯框
456‧‧‧樣本
458‧‧‧播放軌片段邏輯框
462‧‧‧SampleToGroup邏輯框
464‧‧‧SampleGroupDescription邏輯框
470‧‧‧grouping_type語法元素
472‧‧‧grouping_type_parameter語法結構
474‧‧‧entry_count語法元素
476‧‧‧樣本群組項
478‧‧‧target_layers語法元素
480‧‧‧layer_id_method_idc語法元素
482‧‧‧sample_count語法元素
484‧‧‧group_description_index語法元素
486‧‧‧grouping_type語法元素
488‧‧‧entry_count語法元素
490‧‧‧群組描述項
圖1為說明可利用本發明中所描述之技術的實例視訊寫碼系統的方塊圖。 圖2為說明其中播放軌中之圖像為內部隨機存取點(IRAP)存取單元(AU)之部分而非IRAP圖像之實例案例的概念圖。 圖3為說明根據本發明之一或多種技術的檔案之實例結構之方塊圖。 圖4為說明根據本發明之一或多種技術的檔案之實例結構之方塊圖。 圖5為說明實例視訊編碼器的方塊圖。 圖6為說明實例視訊解碼器的方塊圖。 圖7為說明根據本發明之技術的實例操作的流程圖。 圖8為說明根據本發明之技術的其中產生播放軌邏輯框的處理視訊資料之實例操作的流程圖。 圖9為說明根據本發明之技術的實例操作的流程圖。 圖10為說明根據本發明之技術的用於處理視訊資料之器件的實例操作的流程圖。
10‧‧‧視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
31‧‧‧記憶體
32‧‧‧顯示器件
34‧‧‧檔案產生器件

Claims (24)

  1. 一種處理視訊資料之方法,該方法包含: 於儲存一多層位元串流之一檔案中產生含有用於一播放軌之後設資料的一播放軌邏輯框,該位元串流包含形成該視訊資料之圖像之一表示的位元之一序列,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中產生該播放軌邏輯框包含: 於該播放軌邏輯框中產生含有一樣本群組描述項之一樣本描述邏輯框;以及 於該播放軌邏輯框中產生用於該播放軌之一樣本至群組邏輯框, 該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本, 該樣本至群組邏輯框指定該播放軌中所存在之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型。
  2. 如請求項1之方法,其中包括該樣本至群組邏輯框包含: 於該樣本至群組邏輯框中包括一第一語法元素及一第二語法元素,該第一語法元素指定該等目標層,該第二語法元素指定該第一語法元素之語義。
  3. 如請求項1之方法,其中包括該樣本至群組邏輯框包含: 於該樣本至群組邏輯框中包括指定在由存在於該播放軌中之該等層直接或間接參考的層當中的該等目標層之一語法元素。
  4. 如請求項1之方法, 其中該樣本群組可適用於一操作點,且 該方法進一步包含基於含有該操作點之一最高層的樣本的該播放軌傳訊該播放軌中之該樣本群組。
  5. 一種處理視訊資料之方法,該方法包含: 自儲存一多層位元串流之一檔案獲得含有用於一播放軌之後設資料的一播放軌邏輯框,該位元串流包含形成該視訊資料之圖像之一表示的位元之一序列,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中獲得該播放軌邏輯框包含: 自該播放軌邏輯框獲得含有一樣本群組描述項之一樣本描述邏輯框;及 自該播放軌邏輯框獲得用於該播放軌之一樣本至群組邏輯框,該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本; 基於該樣本至群組邏輯框中之一語法元素判定存在於該播放軌中之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型;以及 基於包括含有該特定時間子層之經寫碼圖像的一層的該等目標層將該TSA或STSA樣本群組中之一樣本識別為適合於時間子層向上切換至一特定時間子層。
  6. 如請求項5之方法,其中該語法元素為一第一語法元素,獲得該樣本至群組邏輯框包含: 自該樣本至群組邏輯框獲得一第二語法元素,該第二語法元素指定該第一語法元素之語義;及 根據由該第二語法元素所指定之該等語義解釋該第一語法元素以判定該等目標層。
  7. 如請求項5之方法,其中該語法元素指定由存在於該播放軌中之該等層直接或間接參考的層當中的該等目標層。
  8. 如請求項5之方法, 其中該樣本群組可適用於一操作點,且 該方法進一步包含基於含有一操作點之一最高層的樣本的一播放軌來判定該播放軌包括該樣本群組。
  9. 一種用於處理視訊資料之器件,該器件包含: 一或多個處理電路,其經組態以: 於儲存一多層位元串流之一檔案中產生含有用於一播放軌之後設資料的一播放軌邏輯框,該多層位元串流包含形成該視訊資料之圖像之一表示的位元之一序列,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中該一或多個處理電路經組態以使得作為產生該播放軌邏輯框之部分,該一或多個處理電路: 於該播放軌邏輯框中產生含有一樣本群組描述項之一樣本描述邏輯框;以及 於該播放軌邏輯框中產生用於該播放軌之一樣本至群組邏輯框, 該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本, 該樣本至群組邏輯框指定該播放軌中所存在之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型;及 一資料儲存媒體,其耦合至該一或多個處理電路,該資料儲存媒體經組態以儲存該檔案。
  10. 如請求項9之器件,其中該一或多個處理電路經組態以使得作為包括該播放軌邏輯框中之該樣本至群組邏輯框之部分,該一或多個處理電路: 於該樣本至群組邏輯框中包括一第一語法元素及一第二語法元素,該第一語法元素指定該等目標層,該第二語法元素指定該第一語法元素之語義。
  11. 如請求項9之器件,其中該一或多個處理電路經組態以使得作為包括該播放軌邏輯框中之該樣本至群組邏輯框之部分,該一或多個處理電路: 於該樣本至群組邏輯框中包括指定由存在於該播放軌中之該等層直接或間接參考的層當中的該等目標層之一語法元素。
  12. 如請求項9之器件, 其中該樣本群組可適用於一操作點,且 該一或多個處理電路經組態以基於含有該操作點之一最高層的樣本的該播放軌來傳訊該播放軌中之該樣本群組。
  13. 一種用於處理視訊資料之器件,該器件包含: 一資料儲存媒體,其經組態以儲存一檔案,該檔案儲存包含形成該視訊資料之圖像之一表示的位元之一序列的一多層位元串流;及 一或多個處理電路,其耦合至該資料儲存媒體,該一或多個處理電路經組態以: 自該檔案獲得含有用於一播放軌之後設資料的一播放軌邏輯框,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中該一或多個處理電路經組態以使得作為獲得該播放軌邏輯框之部分,該一或多個處理電路: 自該播放軌邏輯框獲得含有一樣本群組描述項之一樣本描述邏輯框;及 自該播放軌邏輯框獲得用於該播放軌之一樣本至群組邏輯框,該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本; 基於該樣本至群組邏輯框中之一語法元素判定存在於該播放軌中之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型;及 基於包括含有該特定時間子層之經寫碼圖像的一層的該等目標層將該TSA或STSA樣本群組中之一樣本識別為適合於時間子層向上切換至一特定時間子層。
  14. 如請求項13之器件,其中該語法元素為一第一語法元素,該一或多個處理電路經組態以: 自該樣本至群組邏輯框獲得一第二語法元素,該第二語法元素指定該第一語法元素之語義;及 根據由該第二語法元素所指定之該等語義解釋該第一語法元素以判定該等目標層。
  15. 如請求項13之器件,其中該一或多個處理電路經組態以基於該樣本至群組邏輯框中之一語法元素來判定該等目標層,該樣本至群組邏輯框指定由存在於該播放軌中之該等層直接或間接參考的層當中的該等目標層。
  16. 如請求項13之器件, 其中該樣本群組可適用於一操作點,且 該一或多個處理電路經進一步組態以基於含有一操作點之一最高層的樣本的一播放軌來判定該播放軌包括該樣本群組。
  17. 一種用於處理視訊資料之器件,該器件包含: 用於在儲存一多層位元串流之一檔案中產生含有用於一播放軌之後設資料的一播放軌邏輯框的構件,該多層位元串流包含形成該視訊資料之圖像之一表示的位元之一序列,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中用於產生該播放軌邏輯框之該構件包含: 用於在該播放軌邏輯框中產生含有一樣本群組描述項之一樣本描述邏輯框的構件;及 用於在該播放軌邏輯框中產生用於該播放軌之一樣本至群組邏輯框的構件, 該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本, 該樣本至群組邏輯框指定該播放軌中所存在之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型;及 用於儲存該檔案之構件。
  18. 如請求項17之器件,其中該語法元素為一第一語法元素,且用於包括該播放軌邏輯框中之該樣本至群組邏輯框之該構件包含: 在該樣本至群組邏輯框中包括一第二語法元素之構件,該第二語法元素指定該第一語法元素之語義。
  19. 一種用於處理視訊資料之器件,該器件包含: 用於儲存一檔案之構件,該檔案儲存包含形成該視訊資料之圖像之一表示的位元之一序列的一多層位元串流;及 用於自該檔案獲得含有用於一播放軌之後設資料的一播放軌邏輯框的構件,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中用於獲得該播放軌邏輯框之該構件包含: 用於自該播放軌邏輯框獲得含有一樣本群組描述項之一樣本描述邏輯框的構件;及 用於自播放軌邏輯框獲得用於該播放軌之一樣本至群組邏輯框的構件,該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由樣本群組描述項所指定之一特性的樣本; 用於基於該樣本至群組邏輯框中之一語法元素判定存在於該播放軌中之層當中的目標層的構件, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型;及 用於基於包括含有該特定時間子層之經寫碼圖像的一層的該等目標層將該TSA或STSA樣本群組中之一樣本識別為適合於時間子層向上切換至一特定時間子層。
  20. 如請求項19之器件,其進一步包含: 用於自該樣本至群組邏輯框中獲得一第一語法元素及一第二語法元素的構件,該第一語法元素指定該等目標層,該第二語法元素指定該第一語法元素之語義;及 用於根據由該第二語法元素所指定之該等語義解釋該第一語法元素以判定該等目標層的構件。
  21. 一種具有儲存於其上之指令的電腦可讀儲存媒體,該等指令在經執行時使得用於處理視訊資料之一器件: 在儲存包含一多層位元串流之一檔案中產生含有用於一播放軌之後設資料的一播放軌邏輯框,該多層位元串流包含形成該視訊資料之圖像之一表示的位元之一序列,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中,作為使得該器件產生該播放軌邏輯框之部分,該等指令使得該器件: 於該播放軌邏輯框中產生含有一樣本群組描述項之一樣本描述邏輯框;及 於該播放軌邏輯框中產生用於該播放軌之一樣本至群組邏輯框, 該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本, 該樣本至群組邏輯框指定該播放軌中所存在之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型。
  22. 如請求項21之電腦可讀儲存媒體,其中,作為組態該器件以包括該播放軌邏輯框中之該樣本至群組邏輯框之部分,該等指令使得該器件: 於該樣本至群組邏輯框中包括一第一語法元素及一第二語法元素,該第一語法元素指定該等目標層,該第二語法元素指定該第一語法元素之語義。
  23. 一種具有儲存於其上之指令的電腦可讀儲存媒體,該等指令在經執行時使得用於處理視訊資料之一器件: 儲存一檔案,該檔案儲存包含形成該視訊資料之圖像之一表示的位元之一序列的一多層位元串流;及 自該檔案獲得含有用於一播放軌之後設資料的一播放軌邏輯框,該播放軌含有媒體內容,該播放軌之該媒體內容包含樣本之一序列,其中作為使得該器件獲得該播放軌邏輯框之部分,該等指令使得該器件: 自該播放軌邏輯框獲得含有一樣本群組描述項之一樣本描述邏輯框;及 自該播放軌邏輯框獲得用於該播放軌之一樣本至群組邏輯框,該樣本至群組邏輯框將該播放軌之樣本映射至一樣本群組中,該樣本群組包含共用由該樣本群組描述項所指定之一特性的樣本; 基於該樣本至群組邏輯框中之一語法元素判定存在於該播放軌中之層當中的目標層, 該等目標層中之每一者含有屬於一特定圖像類型之至少一個圖像,且 該樣本群組為以下中之一者: 一時間子層存取(TSA)樣本群組且該特定圖像類型為一時間子層存取圖像類型,或 一逐步時間子層存取(STSA)樣本群組且該特定圖像類型為一逐步時間子層存取圖像類型;及 基於包括含有該特定時間子層之經寫碼圖像的一層的該等目標層將該TSA或STSA樣本群組中之一樣本識別為適合於時間子層向上切換至一特定時間子層。
  24. 如請求項23之電腦可讀資料儲存媒體,其中該語法元素為一第一語法元素,且該等指令組態該一或多個處理電路以: 自該樣本至群組邏輯框獲得一第二語法元素,該第二語法元素指定該第一語法元素之語義;及 根據由該第二語法元素所指定之該等語義解釋該第一語法元素以判定該等目標層。
TW105133093A 2015-10-14 2016-10-13 於多層視訊檔案中支援隨機存取及層與子層之切換 TW201717631A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562241713P 2015-10-14 2015-10-14
US15/286,273 US20170111642A1 (en) 2015-10-14 2016-10-05 Support of random access and switching of layers and sub-layers in multi-layer video files

Publications (1)

Publication Number Publication Date
TW201717631A true TW201717631A (zh) 2017-05-16

Family

ID=57200104

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105133093A TW201717631A (zh) 2015-10-14 2016-10-13 於多層視訊檔案中支援隨機存取及層與子層之切換

Country Status (5)

Country Link
US (1) US20170111642A1 (zh)
EP (1) EP3363204B1 (zh)
CN (1) CN108353191B (zh)
TW (1) TW201717631A (zh)
WO (1) WO2017066075A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110999312B (zh) * 2017-06-15 2022-01-21 Lg电子株式会社 发送360度视频的方法、接收360度视频的方法、发送360度视频的装置和接收360度视频的装置
EP3928520A4 (en) 2019-03-11 2022-08-17 Huawei Technologies Co., Ltd. STEP BY DECODE REFRESHMENT IN VIDEO ENCODING
GB2585052B (en) * 2019-06-26 2023-07-26 Canon Kk Method and apparatus for encapsulating panorama images in a file
CN115299049B (zh) * 2020-03-20 2025-07-04 字节跳动有限公司 视频编解码中子图片信息的使用
US11451811B2 (en) * 2020-04-05 2022-09-20 Tencent America LLC Method and apparatus for video coding
CN115516864A (zh) * 2020-05-20 2022-12-23 北京达佳互联信息技术有限公司 用于视频编解码中的语法元素的信令的方法和装置
CN115552911A (zh) * 2020-05-20 2022-12-30 北京达佳互联信息技术有限公司 视频编解码中语法元素的通用约束信息和信令
US12375691B2 (en) 2020-09-17 2025-07-29 Lg Electronics Inc. Method and apparatus for generating/receiving media file which signals output layer set information, and computer-readable recording medium storing media file
US11750815B2 (en) 2020-09-17 2023-09-05 Lemon, Inc. Versatile video coding track coding
US11611752B2 (en) 2020-10-07 2023-03-21 Lemon Inc. Adaptation parameter set storage in video coding
CN112565815B (zh) 2020-10-16 2022-05-24 腾讯科技(深圳)有限公司 文件封装方法、文件传输方法、文件解码方法及相关设备
KR20230091114A (ko) 2020-10-26 2023-06-22 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Vvc 비디오 코딩의 디코더 구성 정보
CN116325766A (zh) * 2020-12-15 2023-06-23 Lg电子株式会社 生成/接收包含层信息的媒体文件的方法和设备及媒体文件传送方法
US11997293B2 (en) * 2021-04-15 2024-05-28 Lemon Inc. Sub-picture track level indicator
US11677934B2 (en) * 2021-09-24 2023-06-13 Apple Inc. Encoding and decoding video content

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070108434A (ko) * 2006-01-09 2007-11-12 한국전자통신연구원 SVC(Scalable Video Coding)파일포맷에서의 데이터 공유 개선방법
WO2012047158A1 (en) * 2010-10-05 2012-04-12 Telefonaktiebolaget L M Ericsson (Publ) A client, a content creator entity and methods thereof for media streaming
US20140092953A1 (en) * 2012-10-02 2014-04-03 Sharp Laboratories Of America, Inc. Method for signaling a step-wise temporal sub-layer access sample
US10038899B2 (en) * 2012-10-04 2018-07-31 Qualcomm Incorporated File format for video data
GB2516826B (en) * 2013-07-23 2016-06-22 Canon Kk Method, device and computer program for encapsulating partitioned timed media data by creating tracks to be independently encapsulated in at least one media f
US9712843B2 (en) * 2013-10-23 2017-07-18 Qualcomm Incorporated Multi-layer video file format designs
MY185338A (en) * 2015-02-04 2021-05-06 Ericsson Telefon Ab L M Drap identification and decoding

Also Published As

Publication number Publication date
CN108353191B (zh) 2020-11-17
EP3363204A1 (en) 2018-08-22
CN108353191A (zh) 2018-07-31
WO2017066075A1 (en) 2017-04-20
EP3363204B1 (en) 2020-08-19
US20170111642A1 (en) 2017-04-20

Similar Documents

Publication Publication Date Title
TWI651961B (zh) 於多層位元流檔案格式中操作點取樣群組之對齊
EP3363204B1 (en) Support of random access and switching of layers and sub-layers in multi-layer video files
TWI676387B (zh) 多層位元流之檔案中之參數集信令
TWI645710B (zh) 多層視訊檔案格式設計
TWI558177B (zh) 用於處理視訊資料及儲存經寫碼視訊資料之方法、器件及非暫時性電腦可讀儲存媒體
TWI675588B (zh) 於分層視訊檔案格式中之樣本條目及操作點發訊設計
TW201743611A (zh) 以高效率視訊寫碼及分層高效率視訊寫碼檔案格式之圖塊分組及樣本之映射
CN107251559B (zh) 一种处理视频数据的方法及装置
CN117223290A (zh) 用于基于eos样本组生成/接收媒体文件的方法和设备以及用于发送媒体文件的方法