TWI511572B - 具有包含多個編碼圖案區段之網路提取層之視訊寫碼 - Google Patents

具有包含多個編碼圖案區段之網路提取層之視訊寫碼 Download PDF

Info

Publication number
TWI511572B
TWI511572B TW101140888A TW101140888A TWI511572B TW I511572 B TWI511572 B TW I511572B TW 101140888 A TW101140888 A TW 101140888A TW 101140888 A TW101140888 A TW 101140888A TW I511572 B TWI511572 B TW I511572B
Authority
TW
Taiwan
Prior art keywords
syntax elements
syntax element
offset
nal unit
encoded image
Prior art date
Application number
TW101140888A
Other languages
English (en)
Other versions
TW201342921A (zh
Inventor
Ye-Kui Wang
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201342921A publication Critical patent/TW201342921A/zh
Application granted granted Critical
Publication of TWI511572B publication Critical patent/TWI511572B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

具有包含多個編碼圖案區段之網路提取層之視訊寫碼
本發明係關於視訊寫碼(亦即,視訊資料之編碼及/或解碼)。
本申請案主張於2011年11月4日申請之美國臨時專利申請案第61/555,932號及於2011年11月8日申請之美國臨時專利申請案第61/557,259號之權利,該兩個申請案之全部內容特此以引用之方式併入。
可將數位視訊能力併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型電腦或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電傳會議器件、視訊串流器件及其類似者。數位視訊器件實施視訊壓縮技術,諸如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(進階視訊寫碼(AVC))定義之標準、目前在開發中之高效率視訊寫碼(HEVC)標準及此等標準之擴展中所描述的彼等視訊壓縮技術。視訊器件可藉由實施此等視訊壓縮技術來更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中所固有之冗餘。對於基於區 塊之視訊寫碼,可將視訊切片(亦即,視訊圖框或視訊圖框之部分)分割成視訊區塊,視訊區塊亦可被稱作樹區塊、寫碼單元(CU)及/或寫碼節點。圖像之經框內寫碼(I)切片中的視訊區塊係使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼。圖像之經框間寫碼(P或B)切片中的視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他參考圖像中之參考樣本的時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間或時間預測產生待寫碼之區塊的預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本的區塊之運動向量及指示經寫碼區塊與預測性區塊之間的差之殘餘資料來編碼經框間寫碼區塊。根據框內寫碼模式及殘餘資料來編碼經框內寫碼區塊。為了進一步壓縮,可將殘餘資料自像素域變換至變換域,從而產生殘餘係數,該等殘餘係數接著可經量化。可掃描最初排列成二維陣列之經量化係數以便產生係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。
一般而言,一視訊編碼器產生一位元串流,該位元串流包括表示一經熵編碼之第一語法元素之一可變長度值、表示一經熵編碼之第二語法元素之一可變長度值及表示偏移語法元素之固定長度值。該等偏移語法元素中之每一者的 長度可基於該第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定。一網路提取層(NAL)單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定。一視訊解碼器接收該位元串流,熵解碼該第一語法元素及該第二語法元素,且使用該第一語法元素及該第二語法元素來剖析該等偏移語法元素。該視訊解碼器使用該等偏移語法元素來判定該等經編碼圖像區段之在該NAL單元內的位置。該視訊解碼器解碼該等經編碼圖像區段。
在一態樣中,本發明描述一種方法,該方法包含熵編碼一第一語法元素、一第二語法元素及一系列偏移語法元素。該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定。一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定。該方法亦包含產生一位元串流,該位元串流包括表示該經熵編碼之第一語法元素之一可變長度值、表示該經熵編碼之第二語法元素之一可變長度值及表示該等偏移語法元素之固定長度值。
在另一態樣中,本發明描述一種計算器件,該計算器件包含經組態以熵編碼一第一語法元素、一第二語法元素及一系列偏移語法元素之一或多個處理器。該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於該第二語 法元素來判定。一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定。該一或多個處理器亦經組態以產生一位元串流,該位元串流包括表示該經熵編碼之第一語法元素之一可變長度值、表示該經熵編碼之第二語法元素之一可變長度值及表示該等偏移語法元素之固定長度值。
在另一態樣中,本發明描述一種計算器件,該計算器件包含用於熵編碼一第一語法元素、一第二語法元素及一系列偏移語法元素之構件。該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定。一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定。該計算器件亦包含用於產生一位元串流之構件,該位元串流包括表示該經熵編碼之第一語法元素之一可變長度值、表示該經熵編碼之第二語法元素之一可變長度值及表示該等偏移語法元素之固定長度值。
在另一態樣中,本發明描述一種電腦可讀儲存媒體,其儲存在由一計算器件之一或多個處理器執行時組態該計算器件以熵編碼一第一語法元素、一第二語法元素及一系列偏移語法元素的指令。該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定。一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定。另外,該等指令組態該計算器件以產 生一位元串流,該位元串流包括表示該經熵編碼之第一語法元素之一可變長度值、表示該經熵編碼之第二語法元素之一可變長度值及表示該等偏移語法元素之固定長度值。
在另一態樣中,本發明描述一種用於解碼視訊資料之方法。該方法包含接收一位元串流,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素。該方法亦包含熵解碼該第一語法元素及該第二語法元素。此外,該方法包含基於該第一語法元素判定該等偏移語法元素中之每一者的長度。該方法亦包含基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目。另外,該方法包含至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素。此外,該方法包含基於該等偏移語法元素判定一NAL單元內之複數個經編碼圖像區段的位置。該方法亦包含解碼該等經編碼圖像區段。
在另一態樣中,本發明描述一種計算器件,該計算器件包含經組態以接收一位元串流之一或多個處理器,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素。該一或多個處理器亦經組態以熵解碼該第一語法元素及該第二語法元素。該一或多個處理器亦經組態以基於該第一語法元素判定該等偏移語法元素中之 每一者的長度。另外,該一或多個處理器經組態以基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目。該一或多個處理器亦經組態以至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素。此外,該一或多個處理器經組態以基於該等偏移語法元素判定NAL單元內之複數個經編碼圖像區段的位置。該一或多個處理器亦經組態以解碼該等經編碼圖像區段。
在另一態樣中,本發明描述一種計算器件,該計算器件包含用於接收一位元串流之構件,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素。該計算器件亦包含用於熵解碼該第一語法元素及該第二語法元素之構件。另外,該計算器件包含用於基於該第一語法元素判定該等偏移語法元素中之每一者的長度之構件。該計算器件亦包含用於基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目之構件。此外,該計算器件包含用於至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素之構件。另外,該計算器件包含用於基於該等偏移語法元素判定NAL單元內之複數個經編碼圖像區段的位置之構件。該計算器件亦包含用於解碼該等經編碼圖像區段之構件。
在另一態樣中,本發明描述一種電腦可讀儲存媒體,其 儲存在由一計算器件之一或多個處理器執行時組態該計算器件以接收一位元串流的指令,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素。此外,該等指令使該計算器件熵解碼該第一語法元素及該第二語法元素。該等指令亦使該計算器件基於該第一語法元素判定該等偏移語法元素中之每一者的長度。另外,該等指令使該計算器件基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目。另外,該等指令使該計算器件至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素。該等指令亦使該計算器件基於該等偏移語法元素判定一NAL單元內之複數個經編碼圖像區段的位置。另外,該等指令使該計算器件解碼該等經編碼圖像區段。
本發明之一或多個實例之細節陳述於隨附圖式及以下描述中。其他特徵、目標及優勢將自該描述、該等圖式及申請專利範圍而顯而易見。
圖像包括複數個樹區塊。樹區塊與圖像內之二維像素區塊相關聯。視訊編碼器將圖像劃分成複數個圖像區段。舉例而言,視訊編碼器可將圖像劃分成熵切片、影像塊或波前並列處理(WPP)波。換言之,本發明可使用術語「圖像區段」來一般地指代熵切片、影像塊或WPP波。圖像區段 與圖像之樹區塊的非重疊子集相關聯。舉例而言,圖像之每一樹區塊可與圖像區段中之恰好一者相關聯。視訊編碼器可產生包括與切片相關聯之一或多個經編碼圖像區段的經寫碼切片網路提取層(NAL)單元。
在一些實例中,視訊解碼器可並列地解碼切片之經編碼圖像區段。為了並列地解碼切片之經編碼圖像區段,視訊編碼器可在經寫碼切片NAL單元內用信號發出經編碼圖像區段之入口點。經編碼圖像區段之入口點可為經編碼圖像區段之第一位元的位置。因為視訊解碼器能夠判定經編碼圖像區段之入口點,所以視訊解碼器可能夠將不同經編碼圖像區段指派給解碼器之不同處理核心以供並列解碼。
為了用信號發出影像塊之入口點,視訊編碼器可產生一系列偏移語法元素。偏移語法元素中之每一者可指示影像塊中之位元組的數目。另外,視訊編碼器可產生兩個額外語法元素。切片中之影像塊的數目可基於第一額外語法元素來判定。用於偏移語法元素中之每一者中的位元之數目可基於第二額外語法元素來判定。在現有實施中,額外語法元素中之每一者在位元串流中始終使用5位元無正負號整數來表示。
始終將額外語法元素表示為5位元無正負號整數可不必要地增加位元串流中之位元的數目。此外,始終將額外語法元素表示為5位元無正負號整數可將偏移語法元素之數目限於32。根據本發明之一或多種技術,視訊編碼器可熵編碼(例如,使用無正負號整數0階指數哥倫布寫碼語法元 素ue(v),其中左位元居首)額外語法元素。因為視訊編碼器熵編碼額外語法元素,所以在位元串流中使用位元之可變長度序列來表示額外語法元素。在許多狀況下,位元之此等可變長度序列可使用少於5位元之位元無正負號整數來表示額外語法元素。另外,此等額外語法元素之熵寫碼可允許視訊編碼器用信號發出32個以上偏移語法元素。
在一些例子中,特定視訊解碼器可未經組態以並列地解碼經編碼圖像區段。亦即,一些視訊解碼器可在並列處理方面具有不同能力。在此等例子中,用以用信號發出經編碼圖像區段之入口點的位元對視訊解碼器無用。
根據本發明之技術,視訊編碼器可產生含有視訊資料之複數個經編碼圖像區段的VCL NAL單元。另外,視訊編碼器可產生補充增強資訊(SEI)訊息,SEI訊息指示NAL單元內之經編碼圖像區段的入口點。為了解釋容易起見,本發明可將指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之SEI訊息稱作「入口點SEI訊息」。可(例如)在非VCL NAL單元(諸如,具有SEI類型之非VCL NAL單元)中提供入口點SEI訊息。
媒體感知網路元件(MANE)可經組態有指示特定視訊解碼器之組態的資料。基於此資料,MANE可經組態以僅在視訊解碼器經組態以並列地解碼經編碼圖像區段的情況下將入口點SEI訊息傳輸至視訊解碼器。因為MANE不傳輸視訊解碼器未經組態以使用之資料,所以可節省頻寬。此外,因為入口點係在SEI訊息中用信號發出,所以無論經 寫碼切片NAL單元是否包括指示經寫碼圖像區段之位置的資料,皆可不需要在經寫碼切片NAL單元中用信號發出。此情形幫助減少經寫碼切片NAL單元中之位元的數目且藉此進一步節省頻寬。
附加圖式說明實例。在附加圖式中由參考數字指示之元件對應於以下描述中由相似參考數字指示之元件。在本發明中,具有以序數詞(例如,「第一」、「第二」、「第三」等)開始之名稱的元件未必暗示元件具有特定次序。更確切而言,此等序數詞僅用以指代相同或類似類型之不同元件。
圖1為說明可利用本發明之技術的實例視訊寫碼系統10之方塊圖。如本文中所描述地使用,術語「視訊寫碼器」一般地指代視訊編碼器及視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」可一般地指代視訊編碼或視訊解碼。
如圖1中所展示,視訊寫碼系統10包括源器件12及目的地器件14。源器件12產生經編碼視訊資料。因此,源器件12可被稱作視訊編碼器件或視訊編碼裝置。目的地器件14可解碼由源器件12產生之經編碼視訊資料。因此,目的地器件14可被稱作視訊解碼器件或視訊解碼裝置。源器件12及目的地器件14可為視訊寫碼器件或視訊寫碼裝置之實例。
源器件12及目的地器件14可包含廣泛範圍之器件,包括桌上型電腦、行動計算器件、筆記型(例如,膝上型)電腦、平板電腦、機上盒、諸如所謂的「智慧型」電話之電 話手機、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、車用電腦(in-car computer)或其類似者。
目的地器件14可經由頻道16自源器件12接收經編碼視訊資料。頻道16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14之類型之媒體或器件。在一實例中,頻道16可包含使源器件12能夠即時將經編碼視訊資料直接傳輸至目的地器件14之一或多個通信媒體。在此實例中,源器件12可根據諸如無線通信協定之通信標準調變經編碼視訊資料,且可將經調變視訊資料傳輸至目的地器件14。一或多個通信媒體可包括無線及/或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。一或多個通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或全球網路(例如,網際網路))的部分。一或多個通信媒體可包括路由器、交換器、基地台或促進自源器件12至目的地器件14之通信的其他設備。
在另一實例中,頻道16可包括儲存由源器件12產生之經編碼視訊資料的儲存媒體。在此實例中,目的地器件14可經由磁碟存取或卡存取來存取儲存媒體。儲存媒體可包括多種本端存取之資料儲存媒體,諸如藍光光碟、DVD、CD-ROM、快閃記憶體或用於儲存經編碼視訊資料之其他合適數位儲存媒體。
在另一實例中,頻道16可包括儲存由源器件12產生之經編碼視訊的檔案伺服器或另一中間儲存器件。在此實例中,目的地器件14可經由串流傳輸或下載來存取儲存於檔 案伺服器或其他中間儲存器件處之經編碼視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地器件14之類型之伺服器。實例檔案伺服器包括web伺服器(例如,用於網站)、檔案傳送協定(FTP)伺服器、網路附接儲存(NAS)器件及本端磁碟機。
目的地器件14可經由諸如網際網路連接之標準資料連接來存取經編碼視訊資料。資料連接之實例類型可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或兩者之組合。經編碼視訊資料自檔案伺服器之傳輸可為串流傳輸、下載傳輸或兩者之組合。
本發明之技術不必限於無線應用或設定。該等技術可應用於視訊寫碼以支援多種多媒體應用,諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸(例如,經由網際網路)、編碼視訊資料以儲存於資料儲存媒體上、解碼儲存於資料儲存媒體上之視訊資料,或其他應用。在一些實例中,視訊寫碼系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些實例中,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。視訊源18可包括視訊俘獲器件(例如,視訊攝影機)、含有先前俘獲之視訊資料的視訊存檔、自視訊內容提供者接收視訊資料之視訊饋入 介面及/或用於產生視訊資料之電腦圖形系統,或視訊資料之此等源的組合。
視訊編碼器20可編碼來自視訊源18之視訊資料。在一些實例中,源器件12可經由輸出介面22將經編碼視訊資料直接傳輸至目的地器件14。經編碼視訊資料亦可儲存至儲存媒體或檔案伺服器上以供稍後由目的地器件14存取以用於解碼及/或播放。
在圖1之實例中,目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些實例中,輸入介面28可包括接收器及/或數據機。目的地器件14之輸入介面28可經由頻道16接收經編碼視訊資料。顯示器件32可與目的地器件14整合或可在目的地器件14外部。一般而言,顯示器件32顯示經解碼視訊資料。顯示器件32可包含多種顯示器件,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中之高效率視訊寫碼(HEVC)標準之視訊壓縮標準操作且可遵照HEVC測試模型(HM)。被稱作「HEVC工作草案4」或「WD4」之即將到來的HEVC標準之新近草案在Bross等人的「WD4:Working Draft 4 of High-Efficiency Video Coding」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11視訊寫碼聯合協作小組(JCT-VC)於2011年7月在意大利都靈的第6次會議)中描述,WD4可自2012年9月27日起自http://phenix.int-evry.fr/jct/doc_end_user/documents/6_Torino/ wg11/JCTVC-F803-v3.zip下載,WD4之全部內容以引用之方式併入本文中。
或者,視訊編碼器20及視訊解碼器30可根據其他專屬或工業標準來操作,其他專屬或工業標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦稱作ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。然而,本發明之技術不限於任何特定寫碼標準或技術。
此外,圖1僅為實例且本發明之技術可應用於未必包括編碼器件與解碼器件之間的任何資料通信之視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,資料可自本端記憶體擷取、經由網路串流傳輸,或其類似者。編碼器件可編碼資料且將資料儲存至記憶體,及/或解碼器件可自記憶體擷取資料且解碼資料。在許多實例中,藉由並不彼此通信而是簡單地編碼資料至記憶體及/或自記憶體擷取資料且解碼資料之器件執行編碼及解碼。
視訊編碼器20及視訊解碼器30各自可實施為諸如以下各者之多種合適電路中之任一者:一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。若部分地以軟體實施技術,則器件可將軟體之指令儲存於合適的非暫時性電腦可讀儲存媒體中且可使用一或多個處理器以硬體執行指令從而執行本發明之技術。前文中之任一者 (包括硬體、軟體、硬體及軟體之組合等)可被視為一或多個處理器。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可作為組合式編碼器/解碼器(CODEC)之部分而整合於各別器件中。
本發明大體上可涉及視訊編碼器20將特定資訊「用信號發出」至諸如視訊解碼器30之另一器件。然而,應理解,視訊編碼器20可藉由將特定語法元素與視訊資料之各種經編碼部分相關聯來用信號發出資訊。亦即,視訊編碼器20可藉由將特定語法元素儲存至視訊資料之各種經編碼部分來「用信號發出」資料。在一些狀況下,此等語法元素可在藉由視訊解碼器30接收及解碼之前經編碼及儲存(例如,在儲存系統中)。因此,術語「用信號發出」大體上可指代語法元素及/或用以解碼經壓縮視訊資料之其他資料之傳達。此傳達可即時地或近即時地發生。或者,此通信可在時間跨度內發生,諸如可在編碼時將語法元素儲存至電腦可讀儲存媒體時在經編碼位元串流中發生,語法元素接著可在儲存至此媒體之後的任何時間藉由解碼器件擷取。
如上文簡要地提及,視訊編碼器20編碼視訊資料。視訊資料可包含一或多個圖像。該等圖像中之每一者可為形成視訊之部分的靜態影像。在一些例子中,圖像可被稱作視訊「圖框」。視訊編碼器20可產生包括形成視訊資料之經寫碼表示的位元序列之位元串流。該位元串流可包括經寫 碼圖像及相關聯之資料。經寫碼圖像為圖像之經寫碼表示。
為了產生位元串流,視訊編碼器20可產生一系列經寫碼圖像及相關聯之資料。經寫碼圖像可為視訊資料中之圖像的經編碼表示。相關聯之資料可包括序列參數集(SPS)、圖像參數集(PPS)、調適參數集(APS)及其他語法結構。SPS可含有適用於圖像之零個或零個以上序列的參數。PPS可含有適用於零個或零個以上圖像之參數。APS可含有適用於零個或零個以上圖像之參數。APS中之參數可為相比PPS中之參數更有可能改變的參數。
為了產生圖像之經編碼表示,視訊編碼器20可將圖像分割成複數個樹區塊。在一些例子中,樹區塊可被稱作最大寫碼單元(LCU)或「寫碼樹區塊」。HEVC之樹區塊可廣泛地類似於諸如H.264/AVC之先前標準的巨集區塊。然而,樹區塊未必限於特定大小且可包括一或多個寫碼單元(CU)。
樹區塊中之每一者可與圖像內之大小相等的不同像素區塊相關聯。每一像素可包含明度(Y)樣本、Cb色度樣本及Cr色度樣本。因此,每一樹區塊可與明度(Y)樣本區塊、圖像之Cb色度樣本區塊及圖像之Cr色度樣本區塊相關聯。出於解釋容易起見,本發明可將像素之二維陣列稱作像素區塊且可將樣本之二維陣列稱作樣本區塊。視訊編碼器20可使用四分樹分割來將與樹區塊相關聯之像素區塊分割成與CU相關聯的像素區塊(因此名稱為「樹區塊」)。
視訊編碼器20可將圖像分割成複數個切片。切片中之每一者可包括整數個樹區塊。作為編碼圖像之部分,視訊編碼器20可產生圖像之每一切片的經編碼表示(亦即,經寫碼切片)。為了產生經寫碼切片,視訊編碼器20可編碼切片之每一樹區塊以產生切片之樹區塊中的每一者之經編碼表示(亦即,經寫碼樹區塊)。
為了產生經寫碼樹區塊,視訊編碼器20可對與樹區塊相關聯之像素區塊遞回地執行四分樹分割以將像素區塊劃分成逐步減小的像素區塊。較小像素區塊中之每一者可與CU相關聯。經分割CU可為像素區塊被分割成與其他CU相關聯之像素區塊的CU。未經分割CU可為像素區塊未被分割成與其他CU相關聯之像素區塊的CU。
視訊編碼器20可針對每一未經分割CU產生一或多個預測單元(PU)。CU之PU中的每一者可與CU之像素區塊內的不同像素區塊相關聯。視訊編碼器20可針對CU之每一PU產生預測性像素區塊。PU之預測性像素區塊可為像素之區塊。
視訊編碼器20可使用框內預測或框間預測來產生PU之預測性像素區塊。若視訊編碼器20使用框內預測來產生PU之預測性像素區塊,則視訊編碼器20可基於與PU相關聯之圖像的經解碼像素產生PU之預測性像素區塊。若視訊編碼器20使用框間預測來產生PU之預測性像素區塊,則視訊編碼器20可基於不同於與PU相關聯之圖像的一或多個圖像之經解碼像素產生PU之預測性像素區塊。
視訊編碼器20可基於CU之PU的預測性像素區塊產生CU之殘餘像素區塊。CU之殘餘像素區塊可指示CU之PU的預測性像素區塊中之樣本與CU之原始像素區塊中之對應樣本之間的差。
此外,作為編碼未經分割CU之部分,視訊編碼器20可對CU之殘餘像素區塊執行遞回四分樹分割以將CU之殘餘像素區塊分割成與CU之變換單元(TU)相關聯之一或多個較小殘餘像素區塊。以此方式,CU之每一TU可與明度(Y)樣本之殘餘樣本區塊及色度(Cr及Cb)樣本之兩個殘餘樣本區塊相關聯。
視訊編碼器20可對與TU相關聯之殘餘樣本區塊應用一或多個變換以產生與TU相關聯之係數區塊(亦即,係數之區塊)。在概念上,係數區塊可為係數之二維矩陣。視訊編碼器20可對係數區塊執行量化程序。量化大體上指代對係數進行量化以可能減少用以表示係數之資料的量從而提供進一步壓縮的程序。
視訊編碼器20可產生表示經量化係數區塊中之係數的語法元素之集合。視訊編碼器20可將諸如內容脈絡自適應性二進位算術寫碼(CABAC)操作之熵編碼操作應用於此等語法元素中之至少一些。作為執行熵編碼操作之部分,視訊編碼器20可選擇寫碼內容脈絡。在CABAC之狀況下,寫碼內容脈絡可指示值0及值1分格之機率。在內容脈絡自適應性可變長度寫碼(CAVLC)之狀況下,寫碼內容脈絡可為可變長度碼之集合。視訊編碼器20可使用寫碼內容脈絡來 編碼一或多個語法元素。
由視訊編碼器20產生之位元串流可包括一系列網路提取層(NAL)單元。NAL單元中之每一者可為含有NAL單元中之資料的類型之指示及含有資料之位元組的語法結構。舉例而言,NAL單元可含有表示SPS、PPS、經寫碼切片、補充增強資訊(SEI)、存取單元定界符、填充資料或另一類型之資料的資料。NAL單元中之資料可包括各種語法結構。經寫碼切片NAL單元為包括經寫碼切片之NAL單元。「VCL NAL單元」為用於經分類為VCL NAL單元之具有nal_unit_type之保留值的經寫碼切片NAL單元及NAL單元之子集的共同術語。
SEI NAL單元為包括SEI訊息之NAL單元。SEI訊息包括可用於錯誤恢回復、定時、輸出等之資訊。然而,在解碼程序中不需要SEI訊息。換言之,視訊解碼器可能夠在不使用SEI訊息中之資訊的情況下解碼視訊資料。因此,在諸如H.264/AVC或HEVC之視訊寫碼標準的情境下,SEI訊息為規範的(亦即,非資訊性的)且在順應式視訊解碼器可選擇簡單地捨棄存在於位元串流中之任何SEI訊息的意義上為可選的。此外,可不必傳輸與視訊資料相關聯之SEI訊息以便視訊解碼器能夠解碼視訊資料。
視訊編碼器20可將圖像劃分成複數個圖像區段。圖像區段可與圖像之樹區塊的非重疊子集相關聯。視訊編碼器20可以各種方式將圖像劃分成複數個圖像區段。如下文所描述,視訊編碼器20可將圖像劃分成複數個熵切片、複數個 影像塊或複數個波前並列處理(WPP)波。本發明可使用術語「圖像區段」來一般地指代熵切片、影像塊及WPP波。
如上文所提及,視訊編碼器20可將圖像劃分成複數個熵切片。熵切片亦可被稱作輕量切片、具有短切片標頭之切片或短切片。熵切片可包括正常切片之CU的子集。在一些實例中,視訊編碼器20可在熵切片當中分割CU以使得熵切片中無一包括比上限多的分格(例如,經熵寫碼位元)。在一些例子中,單一經寫碼切片NAL單元可包括切片之多個熵切片。在其他實例中,在單獨NAL單元中可包括每一熵切片。
允許跨越熵切片邊界之圖像中預測。舉例而言,若視訊寫碼器正對特定PU執行框內預測,則視訊寫碼器可使用來自相鄰PU之樣本,即使相鄰PU在不同於特定PU之熵切片中亦如此。在此實例中,若相鄰PU在不同於特定PU之切片中,則視訊寫碼器可不能夠使用來自相鄰PU之樣本。
然而,在視訊寫碼器正對與特定PU相關聯之資料執行熵寫碼時,若特定PU及相鄰PU在同一熵切片中,則僅允許視訊寫碼器基於與相鄰PU相關聯之資訊選擇寫碼內容脈絡。因為此限制,視訊寫碼器可能夠對切片之多個熵切片並列地執行熵寫碼(亦即,熵編碼或解碼)操作。然而,視訊解碼器30不能夠並列地重建構切片之多個熵切片的像素區塊。
在一些實例中,視訊編碼器20可將圖像劃分成一或多個影像塊。影像塊中之每一者可包含圖像中之整數個樹區 塊。視訊編碼器20可藉由界定兩個或兩個以上垂直影像塊邊界及兩個或兩個以上水平影像塊邊界而將圖像劃分成影像塊。圖像之每一垂直側可被視為垂直影像塊邊界。當前圖像之每一水平側可被視為水平影像塊邊界。舉例而言,若視訊編碼器20界定圖像之四個垂直影像塊邊界及三個水平影像塊邊界,則將當前圖像劃分成六個影像塊。
諸如視訊編碼器20或視訊解碼器30之視訊寫碼器可根據光柵掃描次序寫碼圖像之影像塊。此外,視訊寫碼器可根據光柵掃描次序寫碼影像塊內之每一樹區塊。以此方式,視訊寫碼器可在寫碼圖像之另一影像塊的任何樹區塊之前寫碼圖像之給定影像塊的每一樹區塊。因此,視訊寫碼器寫碼圖像之樹區塊的次序在將圖像分割成多個影像塊之情況下與在不將圖像分割成多個影像塊之情況下可不同。
在一些例子中,只要特定CU及空間上相鄰之CU屬於同一影像塊且只要特定CU及空間上相鄰之CU屬於同一切片,視訊寫碼器即可使用與空間上相鄰之CU相關聯之資訊來對特定CU執行框內預測。空間上相鄰之CU可為與鄰近於與特定CU相關聯之像素區塊的像素區塊相關聯之CU。在一些例子中,只要特定CU及空間上相鄰之CU在同一影像塊內,視訊寫碼器即可使用與空間上相鄰之CU相關聯之資訊來選擇用於CABAC編碼特定CU之語法元素的內容脈絡。因為此等限制,視訊寫碼器可能夠並列地寫碼多個影像塊之樹區塊。
舉例而言,跨越影像塊邊界之包括像素值預測、運動預 測、寫碼模式預測及熵寫碼內容脈絡預測之圖像中預測可藉由旗標tile_boundary_independence_idc來控制。若該旗標等於1,則不允許跨越影像塊邊界之圖像中預測。否則,允許跨越影像塊邊界之圖像中預測,亦為圖像邊界或切片邊界之影像塊邊界除外。若不允許圖像中預測,則與在圖像中不存在影像塊或等效地存在僅一個影像塊的狀況相比較,影像塊之功能性可將改變樹區塊掃描次序。若允許圖像中預測,則除了改變樹區塊掃描次序之外,影像塊亦可提供可用於並列寫碼(編碼及/或解碼)之獨立分割。
不管是否允許跨越影像塊邊界之圖像中預測,視訊編碼器20皆可將單一熵切片中之多個經編碼影像塊包括於單一NAL單元中。在此狀況下,即使允許跨越影像塊邊界之圖像中預測,仍不允許跨越影像塊邊界之熵寫碼內容脈絡預測。此外,在NAL單元可含有僅單一熵切片且熵切片僅包括單一影像塊之CU的實例中,可不需要用信號發出熵切片之每一經寫碼影像塊的入口點,此係因為經寫碼影像塊在單獨NAL單元中。
在其他實例中,視訊寫碼器可使用波前並列處理(WPP)來寫碼圖像。若視訊寫碼器使用WPP來寫碼圖像,則視訊寫碼器可將圖像之樹區塊劃分成複數個「WPP波」。WPP波中之每一者可對應於圖像中之樹區塊的不同列。若視訊寫碼器使用WPP來寫碼圖像,則視訊寫碼器可開始寫碼樹區塊之頂列。在視訊寫碼器已寫碼頂列之兩個或兩個以上樹區塊之後,視訊寫碼器可開始與寫碼樹區塊之頂列並列 地寫碼樹區塊之次頂列。在視訊寫碼器已寫碼次頂列之兩個或兩個以上樹區塊之後,視訊寫碼器可開始與寫碼樹區塊的較高列並列地寫碼樹區塊之頂部起第三列。此型樣可沿圖像中之樹區塊的列往下繼續。
若視訊寫碼器正使用WPP來寫碼圖像,則只要空間上相鄰之CU在當前樹區塊之左方、左上方、上方或右上方,視訊寫碼器即可使用與在當前樹區塊之外的空間上相鄰之CU相關聯之資訊來對當前樹區塊中之特定CU執行框內預測。若當前樹區塊為不同於最頂列之列中的最左樹區塊,則視訊寫碼器可使用與緊接之較高列的第二樹區塊相關聯之資訊來選擇用於CABAC編碼當前樹區塊之語法元素的內容脈絡。否則,若當前樹區塊並非列中之最左樹區塊,則視訊寫碼器可使用與當前樹區塊左方之樹區塊相關聯之資訊來選擇用於CABAC編碼當前樹區塊之語法元素的內容脈絡。以此方式,視訊寫碼器可在編碼緊接之較高列之兩個或兩個以上樹區塊之後基於緊接之較高列之CABAC狀態來初始化列之CABAC狀態。
在一些實例中,若視訊寫碼器正使用WPP來寫碼圖像,則圖像之唯一影像塊的邊界為圖像之水平及垂直邊緣。因此,圖像之唯一影像塊的大小可與圖像相同。視訊寫碼器可將圖像及因此圖像之單一影像塊劃分成多個WPP波。
如上文所提及,視訊編碼器20可產生包括切片之經編碼表示的經寫碼切片NAL單元。切片可與整數個連續經寫碼樹區塊相關聯。經寫碼切片NAL單元可包括切片標頭及切 片資料。切片資料可包括與切片相關聯之每一樹區塊的經編碼表示。
視訊編碼器20可產生經寫碼切片NAL單元以使得根據樹區塊所屬於之圖像區段在切片資料內分組樹區塊之經編碼表示。舉例而言,經寫碼切片NAL單元可包括與第一圖像區段相關聯之每一經寫碼樹區塊,其後接著為與第二圖像區段相關聯之每一經寫碼樹區塊,其後接著為與第三圖像區段相關聯之每一經寫碼樹區塊,等等。
出於解釋容易起見,本發明可使用術語「經編碼圖像區段」、「經寫碼子切片」、「經寫碼子串流」來指代與單一圖像區段(例如,熵切片、影像塊或WPP波)相關聯之在經寫碼切片NAL單元內的經寫碼樹區塊之群組。然而,應瞭解,可存在圖像區段可包括多個切片中之樹區塊的情形。下文所描述之圖10說明影像塊包括屬於多個切片之樹區塊且切片包括屬於多個影像塊之樹區塊的例子。
視訊解碼器30可接收由視訊編碼器20產生之位元串流。位元串流可包括藉由視訊編碼器20編碼之視訊資料的經寫碼表示。視訊解碼器30可對位元串流執行剖析操作。作為執行剖析操作之部分,視訊解碼器30可自位元串流提取語法元素。作為自位元串流提取語法元素之部分,視訊解碼器30可對位元串流中之資料執行熵解碼(例如,CABAC解碼)操作。視訊解碼器30可基於自位元串流提取之語法元素重建構視訊資料之圖像。基於語法元素重建構視訊資料之程序可與藉由視訊編碼器20執行以產生語法元素之程序 大體上互反。
視訊解碼器30可基於與CU相關聯之語法元素產生CU之PU的預測性像素區塊。另外,視訊解碼器30可對與CU之TU相關聯的係數區塊進行反量化。視訊解碼器30可對係數區塊執行反變換以重建構與CU之TU相關聯的殘餘像素區塊。視訊解碼器30可基於預測性像素區塊及殘餘像素區塊重建構CU之像素區塊。以此方式,視訊解碼器30可基於位元串流中之語法元素重建構CU之像素區塊。
如上文所提及,視訊解碼器30之一些實施可能夠並列地解碼不同圖像區段之像素區塊。舉例而言,若經寫碼切片NAL單元包括第一經編碼圖像區段及第二經編碼圖像區段,則視訊解碼器30可能夠並列地解碼第一經編碼圖像區段之像素區塊及第二經編碼圖像區段之像素區塊。
視訊解碼器30可將經寫碼切片NAL單元儲存於記憶體中。記憶體可為位元組可定址的。因為視訊解碼器30將經寫碼切片NAL單元儲存於位元組可定址記憶體中,所以若經編碼圖像區段之開始在一位元組內發生,則視訊解碼器30可不能夠指示與經編碼圖像區段之開始相關聯的記憶體位址。因此,若經編碼圖像區段中之一或多者在一位元組內開始,則視訊解碼器30可不能夠並列地解碼經編碼圖像區段。或者,視訊解碼器30可使用逐位元記憶體定址或逐位元組加逐位元定址來實現並列地解碼經編碼圖像區段,但實施及計算複雜性增加。
為了解決此問題,視訊編碼器20可以使得經寫碼切片 NAL單元內之經編碼圖像區段中的每一者為位元組對準之方式產生經寫碼切片NAL單元。亦即,經寫碼切片NAL單元內之經編碼圖像區段中的每一者可在位元組邊界處開始。若經編碼圖像區段為位元組對準的,則經編碼圖像區段之第一位元為記憶體中之可定址位元組的第一位元,且經編碼圖像區段之最後位元為記憶體中之可定址位元組的最後位元。因此,對於記憶體中之每一位元組定址之儲存位置,儲存位置並不儲存與多個經編碼圖像區段相關聯之位元。
此外,若視訊解碼器30並列地解碼經編碼圖像區段,則視訊解碼器30可將不同經編碼圖像區段指派給不同處理核心。處理核心可並列地解碼經編碼圖像區段。另外,處理核心可向記憶體請求切片標頭。作為回應,記憶體可將切片標頭發送至處理核心。以此方式,處理核心中之每一者可能夠在解碼經編碼圖像區段時使用切片標頭。然而,若切片標頭不為位元組對準的,則記憶體可不能夠在亦不發送不在切片標頭中之某資訊的情況下將切片標頭發送至處理核心。舉例而言,若切片標頭不為位元組對準的,則視訊解碼器30可轉碼切片標頭以使得切片標頭為位元組對準的。轉碼切片標頭可增加視訊解碼器30之複雜性,且可要求處理核心經組態以處理經轉碼切片標頭。
為了產生經編碼圖像區段中之每一者為位元組對準的經寫碼切片NAL單元,視訊編碼器20可填補經寫碼切片NAL單元之切片標頭以使得切片標頭在位元組邊界處結束。亦 即,切片標頭之最後位元可為記憶體中之可定址位元組的最後位元。填補經寫碼切片NAL單元之切片標頭可涉及將位元附加至切片標頭之末尾直至切片標頭為位元組對準的為止。
以此方式,視訊編碼器20可產生複數個經編碼圖像區段,經編碼圖像區段中之每一者與視訊資料中之圖像中的寫碼單元之不同集合相關聯。另外,視訊編碼器20可產生含有切片標頭及複數個經編碼圖像區段之NAL單元,切片標頭包括使切片標頭與位元組邊界對準之一或多個填補位元。類似地,視訊解碼器30可接收NAL單元。NAL單元可含有切片標頭及視訊資料之複數個經編碼圖像區段。切片標頭可包括使切片標頭與位元組邊界對準之一或多個填補位元。視訊解碼器30可並列地解碼經編碼圖像區段中之兩者或兩者以上。
為了並列地解碼經編碼圖像區段,視訊解碼器30可將經編碼圖像區段指派給並列地執行之不同解碼執行緒。解碼執行緒可執行於不同處理核心上。為了將經編碼圖像區段指派給不同解碼執行緒,視訊解碼器30可需要判定與經編碼圖像區段之開始相關聯的記憶體位址。
為了使得視訊解碼器30能夠判定與經編碼圖像區段之開始相關聯的記憶體位址,經寫碼切片NAL單元之切片標頭可包括入口點偏移。在一些實例中,入口點偏移可指示相對於另一點之經編碼圖像區段之記憶體位址的偏移。在一些實例中,偏移可相對於經寫碼切片NAL單元之開始。舉 例而言,經寫碼切片NAL單元之切片標頭中的入口點偏移可指示特定經編碼圖像區段在經寫碼切片NAL單元之第312個位元組處開始。在另一實例中,經寫碼切片NAL單元中之經編碼圖像區段的入口點偏移可相對於經寫碼切片NAL單元中之前一經編碼圖像區段的第一位元。舉例而言,入口點偏移可指示經寫碼切片NAL單元中之特定經編碼圖像區段可在經寫碼切片NAL單元中之前一經編碼圖像區段之後124個位元組處開始。此外,在一些實例中,入口點偏移可指示經編碼圖像區段之以位元或位元組計的長度。
除了指示入口點偏移之偏移語法元素之外,根據本發明之一或多種技術,視訊編碼器20亦可將兩個額外語法元素包括於切片標頭中。切片中之影像塊的數目可基於額外語法元素中之第一者來判定。用於偏移語法元素中之每一者中的位元之數目可基於額外語法元素中之第二者來判定。根據本發明之技術,視訊編碼器20可熵編碼(例如,指數哥倫布編碼)額外語法元素。因為視訊編碼器20熵編碼額外語法元素,所以在位元串流中使用位元之可變長度序列來表示額外語法元素。使用位元之可變長度序列來表示額外語法元素可產生包括比在使用位元之固定長度序列來表示額外語法元素時的位元少之位元的位元串流,且可使得視訊編碼器20能夠用信號發出比由使用(例如)5位元之固定長度寫碼所允許的偏移語法元素多之偏移語法元素。
以此方式,視訊編碼器20可熵編碼第一語法元素、第二 語法元素及一系列偏移語法元素。偏移語法元素中之每一者的長度可基於第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於第二語法元素來判定。NAL單元內之複數個經編碼圖像區段的位置可基於偏移語法元素來判定。此外,視訊編碼器20可產生位元串流,該位元串流包括表示經熵編碼之第一語法元素之可變長度值、表示經熵編碼之第二語法元素之可變長度值及表示偏移語法元素之固定長度值。
視訊解碼器30可接收位元串流,該位元串流包括表示第一額外語法元素之可變長度值、表示第二額外語法元素之經熵編碼之可變長度值及一系列偏移語法元素。視訊解碼器30可熵解碼第一額外語法元素及第二額外語法元素。此外,視訊解碼器30可基於第一語法元素判定偏移語法元素中之每一者的長度,且可基於第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目。視訊解碼器30可至少部分基於偏移語法元素中之每一者的長度及該系列偏移語法元素中之偏移語法元素的數目剖析來自位元串流之偏移語法元素。視訊解碼器30可接著至少部分基於偏移語法元素判定一NAL單元內之複數個經編碼圖像區段的位置。
此外,替代在經寫碼切片NAL單元之切片標頭中指示入口點偏移或除了在經寫碼切片NAL單元之切片標頭中指示入口點偏移以外,經寫碼切片NAL單元之切片資料可包括入口點標記。入口點標記可指定對入口點標記而言唯一之位元型樣。入口點標記可在緊接於每一經編碼圖像區段之 前的切片資料中出現,切片資料之第一經編碼圖像區段除外。視訊編碼器30可藉由遍及切片資料進行掃描及識別入口點標記來判定與經編碼圖像區段之開始相關聯的記憶體位址。
在切片標頭中包括入口點偏移或在切片資料中包括入口點標記可在視訊解碼器30經組態以並列地解碼多個經編碼圖像區段的情況下為有用的。然而,一些視訊解碼器未經組態以並列地解碼多個經編碼圖像區段。由未經組態以並列地解碼多個經編碼圖像區段之視訊解碼器所要求的硬體可比由經組態以並列地解碼多個經編碼圖像區段之視訊解碼器所要求的硬體簡單。更簡單硬體可較不昂貴且可消耗較少能量。
若視訊解碼器30未經組態以並列地解碼多個經編碼圖像區段,則視訊解碼器30不使用入口點偏移或入口點標記。因此,若視訊解碼器30未經組態以並列地解碼多個經編碼圖像區段,則在藉由視訊解碼器30接收之位元串流中包括入口點偏移及/或入口點標記會不必要地增加位元串流中之位元的數目。
根據本發明之一或多種技術,視訊編碼器20可經組態以使得視訊編碼器20不將入口點偏移及/或入口點標記包括於經寫碼切片NAL單元中。更確切而言,視訊編碼器20可產生指示經寫碼切片NAL單元中之經編碼圖像區段之入口點的SEI訊息。舉例而言,視訊編碼器20可產生包括經寫碼切片NAL單元中之經編碼圖像區段之入口點偏移的SEI 訊息。換言之,SEI訊息可藉由指定經寫碼切片NAL單元內之經編碼圖像區段的位元組偏移來指示入口點。
圖2為說明經組態以實施本發明之技術的實例視訊編碼器20之方塊圖。出於解釋目的而提供圖2且不應將其視為限制如本發明中廣泛地例示及描述之技術。出於解釋目的,本發明在HEVC寫碼之情境下描述視訊編碼器20。然而,本發明之技術可適用於其他寫碼標準或方法。
在圖2之實例中,視訊編碼器20包括複數個功能組件。視訊編碼器20之功能組件包括預測處理單元100、殘餘產生單元102、變換處理單元104、量化單元106、反量化單元108、反變換處理單元110、重建構單元112、濾波器單元113、經解碼圖像緩衝器114及熵編碼單元116。預測處理單元100包括框間預測處理單元121及框內預測處理單元126。框間預測處理單元121包括運動估計單元122及運動補償單元124。在其他實例中,視訊編碼器20可包括更多、更少或不同功能組件。此外,運動估計單元122及運動補償單元124可高度整合,但出於解釋目的在圖2之實例中分離地表示。
視訊編碼器20可接收視訊資料。視訊編碼器20可自各種源接收視訊資料。舉例而言,視訊編碼器20可自視訊源18(圖1)或另一源接收視訊資料。視訊資料可表示一系列圖像。為了編碼視訊資料,視訊編碼器20可編碼圖像中之每一者的每一切片。作為編碼切片之部分,視訊編碼器20可編碼切片中之每一樹區塊。
視訊編碼器20可根據光柵掃描次序編碼切片中之樹區塊。換言之,視訊編碼器20可按如下次序來編碼切片之樹區塊:跨越切片中之樹區塊的最頂列自左至右進行,接著跨越樹區塊之下一較低列自左至右進行,等等,直至視訊編碼器20已編碼切片中之樹區塊中的每一者為止。
作為根據光柵掃描次序編碼樹區塊之結果,可已編碼在特定樹區塊之上方及左方的樹區塊,但尚未編碼在特定樹區塊之下方及右方的樹區塊。因此,視訊編碼器20可能夠在編碼特定樹區塊時存取藉由編碼在特定樹區塊之上方及左方的樹區塊而產生之資訊。然而,視訊編碼器20可不能夠在編碼特定樹區塊時存取藉由編碼在特定樹區塊之下方及右方的樹區塊而產生之資訊。
作為編碼樹區塊之部分,預測處理單元100可對與樹區塊相關聯之像素區塊執行四分樹分割以將像素區塊劃分成逐步減小的像素區塊。較小像素區塊可與CU相關聯。舉例而言,預測處理單元100可將樹區塊之像素區塊中的每一者分割成四個大小相等之子區塊,將子區塊中之一或多者分割成四個大小相等之子區塊,等等。
與CU相關聯之像素區塊之大小的範圍可為8×8像素直至與具有最大64×64樣本或更大之樹區塊相關聯的像素區塊之大小。在本發明中,「N×N」與「N乘N」可互換使用以指代依據垂直及水平尺寸之像素區塊的像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16像素區塊在垂直方向上具有16個像素(y=16),且在水平方向上具有16個 像素(x=16)。同樣地,N×N區塊一般在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數值。
視訊編碼器20可編碼樹區塊之CU以產生CU之經編碼表示(亦即,經寫碼CU)。視訊編碼器20可根據z掃描次序編碼樹區塊之CU。換言之,視訊編碼器20可按左上方CU、右上方CU、左下方CU及接著右下方CU之彼次序編碼該等CU。在視訊編碼器20編碼經分割CU時,視訊編碼器20可根據z掃描次序編碼與經分割CU之像素區塊的子區塊相關聯之CU。換言之,視訊編碼器20可按與左上方子區塊相關聯之CU、與右上方子區塊相關聯之CU、與左下方子區塊相關聯之CU及接著與右下方子區塊相關聯之CU的彼次序編碼該等CU。
作為根據z掃描次序編碼樹區塊之CU的結果,可已編碼在特定CU之上方、左上方、右上方、左方及左下方的CU。尚未編碼在特定CU之下方或右方的CU。因此,視訊編碼器20可能夠在編碼特定CU時存取藉由編碼與特定CU相鄰之一些CU而產生的資訊。然而,視訊編碼器20可不能夠在編碼特定CU時存取藉由編碼與特定CU相鄰之其他CU而產生的資訊。
作為編碼CU之部分,預測處理單元100可在CU之一或多個PU當中分割CU之像素區塊。視訊編碼器20及視訊解碼器30可支援各種PU大小。假定特定CU之大小為2N×2N,視訊編碼器20及視訊解碼器30可支援2N×2N或N×N之PU大 小以供框內預測,且支援2N×2N、2N×N、N×2N、N×N或類似大小的對稱PU大小以供框間預測。視訊編碼器20及視訊解碼器30亦可支援2N×nU、2N×nD、nL×2N及nR×2N之PU大小的不對稱分割以供框間預測。
框間預測處理單元121可對CU之每一PU執行框間預測。框間預測可提供時間壓縮。框間預測處理單元121可產生PU之預測性資料。PU之預測性資料可包括對應於PU之預測性樣本區塊及PU之運動資訊。運動估計單元122可產生PU之運動資訊。在一些例子中,運動估計單元122可使用合併模式或進階運動向量預測(AMVP)模式來用信號發出PU之運動資訊。運動補償單元124可基於不同於與PU相關聯之圖像的一或多個圖像(亦即,參考圖像)之像素產生PU之預測性像素區塊。
切片可為I切片、P切片或B切片。運動估計單元122及運動補償單元124可取決於PU是在I切片中,在P切片中抑或在B切片中而對CU之PU執行不同操作。在I切片中,對所有PU進行框內預測。因此,若PU在I切片中,則運動估計單元122及運動補償單元124不對PU執行框間預測。
若PU在P切片中,則含有PU之圖像與稱作「清單0」之參考圖像清單相關聯。在一些實例中,清單0中所列出之每一參考圖像按顯示次序在圖像之前出現。清單0中之參考圖像中的每一者可用於其他圖像之框間預測。運動估計單元122可搜尋清單0中之參考圖像以查找P切片中之PU的參考區塊。PU之參考區塊可為最緊密地對應於PU之像素 區塊的像素區塊。運動估計單元122可使用多種量度來判定參考圖像中之像素區塊對應於PU之像素區塊的緊密程度。舉例而言,運動估計單元122可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度來判定參考圖像中之像素區塊對應於PU之像素區塊的緊密程度。
運動估計單元122可產生指示含有P切片中之PU的參考區塊之清單0中之參考圖像的參考圖像索引及指示PU與參考區塊之間的空間移位之運動向量。運動估計單元122可產生變化精度之運動向量。舉例而言,運動估計單元122可產生在四分之一像素精度、八分之一像素精度或其他分數像素精度下的運動向量。在分數像素精度之狀況下,可自參考圖像中之整數位置像素值內插參考區塊值。運動估計單元122可輸出參考圖像索引及運動向量作為PU之運動資訊。運動補償單元124可基於與PU之運動資訊相關聯的參考區塊產生PU之預測性樣本區塊。
若PU在B切片中,則含有PU之圖像可與稱作「清單0」及「清單1」之兩個參考圖像清單相關聯。在一些實例中,清單1中所列出之每一參考圖像按顯示次序在當前圖像之後出現。此外,若PU在B切片中,則運動估計單元122可對PU執行單向框間預測或雙向框間預測。為了對PU執行單向框間預測,運動估計單元122可搜尋清單0或清單1之參考圖像以查找PU之參考區塊。運動估計單元122可產生指示參考圖像之清單0或清單1中含有參考區塊之位置的參考圖像索引及指示PU與參考區塊之間的空間移位之運動 向量。
為了對PU執行雙向框間預測,運動估計單元122可搜尋清單0中之參考圖像以查找PU之參考區塊,且亦可搜尋清單1中之參考圖像以查找PU之另一參考區塊。運動估計單元122可產生指示參考圖像之清單0及清單1中含有參考區塊之位置的參考圖像索引。另外,運動估計單元122可產生指示參考區塊與PU之間的空間移位之運動向量。PU之運動資訊可包括PU之參考圖像索引及運動向量。運動補償單元124可基於藉由PU之運動資訊指示的參考區塊產生PU之預測性樣本區塊。
作為對CU執行編碼操作之部分,框內預測處理單元126可對CU之PU執行框內預測。框內預測可提供空間壓縮。框內預測處理單元126可基於與PU相同之圖像中的經解碼樣本產生PU之預測性資料。PU之預測性資料可包括PU之預測性樣本區塊及各種語法元素。框內預測處理單元126可對I切片、P切片及B切片中之PU執行框內預測。
為了對PU執行框內預測,框內預測處理單元126可使用多個框內預測模式來產生PU之預測性資料的多個集合。為了使用框內預測模式來產生PU之預測性資料的集合,框內預測處理單元126可使樣本在與框內預測模式相關聯之方向及/或梯度上自相鄰PU之樣本區塊跨越PU之樣本區塊延伸。假定PU、CU及樹區塊之左至右、上至下編碼次序,相鄰PU可在PU之上方、右上方、左上方或左方。框內預測處理單元126可使用各種數目個框內預測模式,例如, 33個定向框內預測模式。在一些實例中,框內預測模式之數目可取決於PU之大小。
預測處理單元100可自CU之PU之藉由框間預測處理單元121產生的預測性資料或該PU之藉由框內預測處理單元126產生的預測性資料當中選擇該PU之預測性資料。在一些實例中,預測處理單元100基於預測性資料之集合的位元率/失真量度選擇CU之PU的預測性資料。
預測處理單元100可執行四分樹分割以將CU之殘餘像素區塊分割成子區塊。每一未經劃分之殘餘像素區塊可與CU之不同TU相關聯。與CU之TU相關聯的殘餘像素區塊之大小及位置可或可不基於CU之PU的像素區塊之大小及位置。稱作「殘餘四分樹」(RQT)之四分樹結構可包括與殘餘像素區塊中之每一者相關聯的節點。CU之TU可對應於RQT之葉節點。
因為TU之殘餘像素區塊的像素包含Y、Cb及Cr樣本,所以TU中之每一者可與Y樣本之樣本區塊、Cb樣本之樣本區塊及Cr樣本之樣本區塊相關聯。殘餘產生單元102可藉由自CU之樣本區塊的對應樣本減去CU之PU的預測性樣本區塊而產生CU之殘餘樣本區塊。
變換處理單元104可藉由將一或多個變換應用於與TU相關聯之殘餘樣本區塊而產生CU之每一TU的係數區塊。係數區塊中之每一者可為係數之2D矩陣。變換處理單元104可將各種變換應用於與TU相關聯之殘餘樣本區塊。舉例而言,變換處理單元104可將離散餘弦變換(DCT)、定向變 換或概念上類似之變換應用於與TU相關聯之殘餘樣本區塊。
量化單元106可對與TU相關聯之係數區塊中的係數進行量化。量化程序可減少與係數中之一些或全部相關聯的位元深度。舉例而言,可在量化期間將n 位元係數降值捨位至m 位元係數,其中n 大於m 。量化單元106可基於與CU相關聯之量化參數(QP)值對與CU之TU相關聯的係數區塊進行量化。視訊編碼器20可藉由調整與CU相關聯之QP值來調整應用於與CU相關聯之係數區塊的量化之程度。
視訊編碼器20可以各種方式將QP值與CU相關聯。舉例而言,視訊編碼器20可對與CU相關聯之樹區塊執行位元率-失真分析。在位元率-失真分析中,視訊編碼器20可藉由以不同QP值來多次編碼樹區塊而產生樹區塊之多個經寫碼表示。視訊編碼器20可在特定QP值與樹區塊之經寫碼表示中具有最低位元速率及失真量度之CU相關聯時用信號通知特定QP值與CU相關聯。
反量化單元108及反變換處理單元110可分別將反量化及反變換應用於係數區塊以自係數區塊重建構殘餘樣本區塊。重建構單元112可將經重建構殘餘樣本區塊與來自由預測處理單元100產生之一或多個預測性樣本區塊之對應樣本相加以產生與TU相關聯之經重建構樣本區塊。藉由以此方式重建構CU之每一TU的樣本區塊,視訊編碼器20可重建構CU之樣本區塊。
濾波器單元113可執行解區塊操作以減少與CU相關聯之 樣本區塊中的區塊假影。經解碼圖像緩衝器114可在濾波器單元113對經重建構樣本區塊執行一或多個解區塊操作之後儲存經重建構樣本區塊。運動估計單元122及運動補償單元124可使用含有經重建構樣本區塊之參考圖像來對後續圖像之PU執行框間預測。另外,框內預測處理單元126可使用經解碼圖像緩衝器114中之經重建構樣本區塊來對與CU相同之圖像中的其他PU執行框內預測。
熵編碼單元116可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼單元116可自量化單元106接收係數區塊且可自預測處理單元100接收語法元素。熵編碼單元116可對資料執行一或多個熵編碼操作以產生經熵編碼資料。舉例而言,視訊編碼器20可對資料執行內容脈絡自適應性可變長度寫碼(CAVLC)操作、CABAC操作、可變至可變(V2V)長度寫碼操作、基於語法之內容脈絡自適應性二進位算術寫碼(SBAC)操作、機率區間分割熵(PIPE)寫碼操作、指數哥倫布寫碼或另一類型之熵編碼操作。熵編碼單元116可輸出包括經熵編碼資料之位元串流。
作為對資料執行熵編碼操作之部分,熵編碼單元116可選擇內容脈絡模型。若熵編碼單元116正執行CABAC操作,則內容脈絡模型可指示對特定分格具有特定值之機率之估計。在CABAC之內容脈絡中,術語「分格」可用以指代語法元素之二進位化版本的位元。
如上文所論述,視訊編碼器20可產生包括視訊資料之經編碼表示的位元串流。視訊資料之經編碼表示可包括複數 個NAL單元。NAL單元可包括經寫碼切片NAL單元,經寫碼切片NAL單元包括切片之經寫碼表示。因為切片可包括與多個圖像區段(例如,熵切片、影像塊或WPP波)相關聯之樹區塊,所以經寫碼切片NAL單元可包括多個經編碼圖像區段。如上文所指示,經編碼圖像區段可為經寫碼切片NAL單元內之與單一圖像區段相關聯的經寫碼樹區塊之群組。
經寫碼切片NAL單元中之每一者可包括切片標頭及切片資料。經寫碼切片NAL單元之切片資料可包括切片中之每一樹區塊的經寫碼表示。在一些例子中,切片之樹區塊可與不同圖像區段相關聯。因此,單一經寫碼切片NAL單元之切片資料可包括與多個圖像區段相關聯之經編碼樹區塊。如上文所指示,術語「經編碼圖像區段」及「經寫碼子切片」可用以指代經寫碼切片NAL單元內之與單一圖像區段相關聯的經寫碼樹區塊之群組。
視訊解碼器30可經組態以並列地剖析或解碼多個經編碼圖像區段。為了促進多個經編碼圖像區段之同時剖析或解碼,經編碼圖像區段中之每一者可為位元組對準的。亦即,經編碼圖像區段之第一位元為記憶體中之可定址位元組的第一位元,且經編碼圖像區段之最後位元為記憶體中之可定址位元組的最後位元。
為了確保經寫碼切片NAL單元之切片資料中的經編碼圖像區段為位元組對準的,經寫碼切片NAL單元之切片標頭可根據本發明之技術在位元組邊界處終止。在一些例子 中,切片標頭之開始及末尾兩者可為位元組對準的。舉例而言,視訊編碼器20可產生具有切片之位元組對準之切片標頭的經寫碼切片NAL單元,該等切片包括多個經編碼之位元組對準之熵切片、影像塊或WPP波(亦即,經編碼圖像區段)中的樹區塊。
在一些實例中,視訊編碼器20可將旗標(例如,slice_header_byte_aligned_flag)包括於諸如SPS、PPS或APS之參數集中。若該旗標等於1,則參考該參數集之每一經寫碼切片NAL單元之切片標頭為位元組對準的。在此等實例中,若該旗標等於0,則參考該參數集之每一經寫碼切片NAL單元之切片標頭可或可不為位元組對準的。在其他實例中,可使旗標之語意相反。在其他實例中,經寫碼切片NAL單元之切片標頭始終為位元組對準的。此情形可等效於上文所提及之旗標不存在,及旗標之值始終推斷為等於1。
以此方式,視訊編碼器20可產生包括參數集之NAL單元,且視訊解碼器30可接收該NAL單元。在不同實例中,參數集可為SPS、PPS或APS。參數集可包括指示參考該參數集之切片標頭是否為位元組對準的語法元素。
在視訊編碼器20產生位元組對準之切片標頭的實例中,切片標頭可遵照各種語法。舉例而言,視訊編碼器20可產生遵照下文表1中所指示之實例語法的切片標頭。
出於解釋容易起見,自表1之實例語法省略現有語法元素。在表1之實例語法中,bit_equal_to_one語法元素為具有等於一之值的位元。byte_aligned()函式可傳回指示切片標頭是否為位元組對準之值。
此外,根據本發明之技術,位元串流可包括一或多個SEI訊息,該一或多個SEI訊息指示經寫碼切片NAL單元中之經編碼圖像區段的入口點。為了解釋容易起見,本發明可將指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之SEI訊息稱作「入口點SEI訊息」。
在一些實例中,SEI訊息包括指定SEI訊息之有效負載類型的payloadType語法元素。在一些此等實例中,入口點SEI訊息之payloadType語法元素可與任何其他類型之SEI訊息的payloadType語法元素不同。因此,入口點SEI訊息可包括指示入口點SEI訊息屬於指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之類型之SEI訊息的語法元素。
位元串流可包括SEI NAL單元,SEI NAL單元包括入口點SEI訊息。在一些實例中,SEI NAL單元中之入口點SEI 訊息可適用於緊接在SEI NAL單元之後的經寫碼切片NAL單元。因此,視訊解碼器30可至少部分基於在位元串流中緊接在含有複數個經編碼圖像區段之NAL單元之前的SEI NAL單元判定SEI訊息適用於含有該複數個經編碼圖像區段之NAL單元。出於解釋容易起見,SEI訊息所適用於之經寫碼切片NAL單元可在本發明中被稱作入口點SEI訊息之經寫碼切片NAL單元。
在一些實例中,SEI訊息與指示SEI訊息適用於之單元的層級相關聯。入口點SEI訊息可適用於在含有入口點SEI訊息之SEI NAL單元之後的經寫碼切片NAL單元。或者,入口點SEI訊息可適用於包括於在含有入口點SEI訊息之SEI NAL單元之後的經寫碼切片NAL單元中之經寫碼切片。因此,入口點SEI訊息可為NAL單元層級SEI訊息或切片層級SEI訊息。
此外,在一些實例中,若經寫碼切片NAL單元為圖像之第一視訊寫碼層(VCL)NAL單元,則含有適用於經寫碼切片NAL單元之入口點SEI訊息的SEI NAL單元可具有等於10之NAL單元類型。否則,若經寫碼切片NAL單元不為圖像之第一VCL NAL單元,則含有適用於經寫碼切片NAL單元之入口點SEI訊息的SEI NAL單元可具有等於11之NAL單元類型。「VCL NAL單元」為經分類為VCL NAL單元之具有nal_unit_type之保留值的經寫碼切片NAL單元及NAL單元之子集的共同術語。不為VCL NAL單元之類型之NAL單元可被稱作非VCL NAL單元。非VCL NAL單元之實例類型包 括SPS NAL單元、PPS NAL單元、SEI NAL單元等。nal_unit_type為NAL單元之標頭中的指定NAL單元之NAL單元類型的語法元素。
視訊編碼器20可產生具有各種語法之入口點SEI訊息。舉例而言,視訊編碼器20可產生具有下文表2中所說明之語法的入口點SEI訊息。
在表2之實例語法中,offset_len_minus10語法元素加上10指定substream_offset[i]語法元素之以位元計的長度。以此方式,偏移語法元素中之每一者的長度等於offset_len_minus10語法元素加上10之值。此外,在表2之實例語法中,num_offsets_minus1語法元素加上1指定入口點SEI訊息中之substream_offset[i]語法元素的數目。
在表2之實例語法中,substream_offset[i]語法元素指定第i個偏移(以位元組計)。入口點SEI訊息之經寫碼切片NAL單元可由num_offsets_minus1加上2個經編碼圖像區段組成,其中經編碼圖像區段索引值為0、1、2、...、num_offsets_minus1+1。經編碼圖像區段0可由入口點SEI訊息之經寫碼切片NAL單元的位元組0至 substream_offset[0]-1(包括0及substream_offset[0]-1)組成。經編碼圖像區段k 可由入口點SEI訊息之經寫碼切片NAL單元的位元組substream_offset[k -1]至substream_offset[k ]-1(包括substream_offset[k -1]及substream_offset[k ]-1)組成,其中k 在1至num_offsets_minus1+1(包括1及num_offsets_minus1+1)之範圍中。
以此方式,視訊編碼器20可用信號發出可由此判定偏移語法元素之以位元計之長度的語法元素。另外,視訊編碼器20可用信號發出可由此判定該系列偏移語法元素中之偏移語法元素之數目的語法元素。此外,視訊編碼器20可用信號發出該系列偏移語法元素,其中該系列偏移語法元素中之偏移語法元素指示NAL單元內之經編碼圖像區段的位元組偏移。同樣地,視訊解碼器30可在位元串流中接收指定一系列偏移語法元素之以位元計之長度的語法元素。視訊解碼器30亦可在位元串流中接收指定該系列偏移語法元素中之偏移語法元素之數目的語法元素。另外,視訊解碼器30可在位元串流中接收該系列偏移語法元素,其中該系列偏移語法元素中之偏移語法元素指示NAL單元內之經編碼圖像區段的位元組偏移。
在不同於表2之實例語法的一些實例語法中,substream_offset[i]之長度為1、2、3及4個位元組中之一者。substream_offset[i]之長度可藉由具有等於分別對應於1、2、3及4個位元組之長度的0、1、2或3之值的語法元素來指示。在此等實例中,此語法元素可替換表2之 offset_len_minus10語法元素。此外,在入口點SEI訊息之各種其他實例語法中,用offset_len_minus8語法元素來替換表2之offset_len_minus10語法元素,且substream_offset[i]語法元素之最小長度為八個位元。
如上文所描述,可允許跨越圖像區段(例如,熵切片、經寫碼影像塊或波前波)之圖像中預測。因此,一經編碼圖像區段之解碼可取決於另一經編碼圖像區段之解碼。在一些實例中,經編碼圖像區段囊封於不同NAL單元中且NAL單元囊封於不同封包(例如,即時傳輸協定(RTP)封包)中。因為不同NAL單元可含有相依經編碼圖像區段,所以此等NAL單元中之一者的遺失可防止視訊解碼器30解碼其他NAL單元中之經編碼圖像區段。因此,包括含於一封包中之多個NAL單元可為有利的。在一些習知CODEC中,封包化器可不能夠自經寫碼切片NAL單元之NAL單元標頭中的資訊判定經寫碼切片NAL單元含有經編碼圖像區段。更確切而言,在此等CODEC中,指示經寫碼切片NAL單元含有經編碼圖像區段之資訊可僅存在於經寫碼切片NAL單元之切片標頭中。熵編碼經寫碼切片NAL單元之切片標頭。因此,判定經寫碼切片NAL單元含有經編碼圖像區段可要求封包化器熵解碼經寫碼切片NAL單元之切片標頭,此舉增加封包化器之複雜性。
為了減小封包化器之複雜性,可將相異NAL單元類型分配給含有單一經編碼圖像區段之NAL單元,針對該NAL單元允許跨越圖像區段邊界之圖像中預測。此外,可將不同 NAL單元類型分配給含有具有不同應用範疇之資訊的SEI NAL單元。
視訊編碼器20可以各種方式指示NAL單元之類型。舉例而言,視訊編碼器20可將「nal_unit_type」語法元素包括於NAL單元之NAL單元標頭中以指示NAL單元之類型。在一些實例中,「nal_unit_type」語法元素可為六個位元。在此等實例中,藉由「nal_unit_type」語法元素指定之值的範圍可為0至63。在本發明中,除非以其他方式指示,否則假設範圍為包括性的。具有等於0或在48至63之範圍中的「nal_unit_type」語法元素之NAL單元可不影響解碼程序。更確切而言,具有等於0或在48至63之範圍中的「nal_unit_type」語法元素之NAL單元可如由應用所判定來使用。對於具有等於0或在48至63之範圍中的「nal_unit_type」語法元素之NAL單元,不指定解碼程序。不同應用可使用具有等於0或在48至63之範圍中的「nal_unit_type」語法元素之NAL單元以用於不同目的。因此,將不同NAL單元類型分配給含有具有不同應用範疇之資訊的SEI NAL單元。在其他實例中,「nal_unit_type」語法元素可為五個位元,如在HEVC WD4中。在「nal_unit_type」語法元素為五個位元之實例中,「nal_unit_type」語法元素之值的範圍可為0至31。
下文所呈現之表3說明「nal_unit_type」語法元素之值、NAL單元之內容及NAL單元之原始位元組序列有效負載(RBSP)語法結構與NAL單元類型類別之間的實例關係。
在表3之實例中,具有在1至6之範圍中的「nal_unit_type」語法元素之NAL單元為經寫碼切片NAL單元。若NAL單元 含有與特定圖像之切片或子切片相關聯的資料且NAL單元具有等於5或6之「nal_unit_type」語法元素,則具有等於1至4之「nal_unit_type」語法元素的NAL單元可不含有與特定圖像相關聯之資料。若NAL單元含有與特定圖像之切片或子切片相關聯的資料且NAL單元具有等於5或6之「nal_unit_type」語法元素,則圖像可為瞬時解碼器再新(IDR)圖像。如表3中所指示,含有經寫碼子切片之NAL單元及不含有經寫碼子切片之經寫碼切片NAL單元可包括遵照相同語法之RBSP。
若NAL單元具有等於2、4或6之「nal_unit_type」語法元素,則NAL單元含有子切片。舉例而言,若NAL單元含有與具有等於1之「lightweight_slice_flag」的切片(亦即,輕量切片)相關聯之資料,則NAL單元可具有「nal_unit_type」語法元素,該「nal_unit_type」語法元素具有2、4或6之值。出於解釋容易起見,具有等於2、4或6之「nal_unit_type」語法元素的NAL單元可在本文中被稱作子切片NAL單元。因此,含有經寫碼子切片之NAL單元可屬於與不含有經寫碼子切片之經寫碼切片NAL單元不同的NAL單元類型。舉例而言,含有經寫碼子切片之NAL單元可包括指定與藉由不含有經寫碼子切片之經寫碼切片NAL單元的類型語法元素指定之數字不同的數字之類型語法元素。在解碼期間,視訊解碼器30可要求來自另一切片或子切片之資料以便執行子切片內之圖像中預測。
若NAL單元具有等於10或11之「nal_unit_type」語法元 素,則NAL單元為SEI NAL單元。具有等於10之「nal_unit_type」語法元素的SEI NAL可含有可應用於一或多個完整經寫碼圖像之SEI訊息。具有等於10之「nal_unit_type」語法元素的SEI NAL單元可在經寫碼圖像之第一VCL NAL單元之前。
具有等於11之「nal_unit_type」語法元素的SEI NAL單元可在本文中被稱作子圖像SEI NAL單元。子圖像SEI NAL單元可含有適用於經寫碼圖像之一或多個連續VCL NAL單元之清單的SEI訊息。該清單可包括經寫碼圖像之所有VCL NAL單元的真子集,且不包括經寫碼圖像之第一VCL NAL單元。子圖像SEI NAL單元可在包括於子圖像SEI NAL單元中之SEI訊息應用於之VCL NAL單元的清單之第一VCL NAL單元之前。
在其他實例中,「nal_unit_type」語法元素之值可具有不同於表3中所指示之含義的含義。舉例而言,在其他實例中,框內切片(亦即,I切片)及框間切片(亦即,P切片及B切片)可具有不同NAL單元類型。換言之,可存在用於I切片之「nal_unit_type」語法元素的第一值及用於P切片及B切片之「nal_unit_type」語法元素的第二值。在另外其他實例中,可存在用於I切片之「nal_unit_type」語法元素的第一值、用於P切片之「nal_unit_type」語法元素的第二值及用於B切片之「nal_unit_type」語法元素的第三值。在另外其他實例中,可存在用於含有表示短切片(亦即,具有等於1之「lightweight_slice_header」語法元素的切片) 之資料的NAL單元及含有表示完整切片(亦即,具有等於0之「lightweight_slice_header」語法元素的切片)之資料的NAL單元之「nal_unit_type」語法元素的不同值。
在表3之另一實例替代例中,SEI訊息可分類為若干層級。層級中之每一者可與「nal_unit_type」語法元素之不同值相關聯。SEI訊息之層級可包括:
1)序列層級:適用於一或多個完整經寫碼視訊序列。
2)子序列層級:適用於一個以上經寫碼圖像但少於一個經寫碼視訊序列。
3)圖像層級:適用於一個存取單元中之所有VCL NAL單元。
4)子圖像層級:適用於存取單元中之所有VCL NAL單元的真子集。舉例而言,在子圖像層級處之SEI訊息可適用於涵蓋所關注之特定區的VCL NAL單元、如H.264/AVC標準之附件G中所定義之層表示的VCL NAL單元、如H.264/AVC標準之附件H中所定義之視圖分量的VCL NAL單元,或如由H.264/AVC標準所定義之冗餘經寫碼圖像的VCL NAL單元。
可將位元串流劃分成一系列存取單元。存取單元中之每一者可含有一個經寫碼圖像及零個或零個以上非VCL NAL單元。位元串流之第一存取單元以位元串流之第一NAL單元開始。在經寫碼圖像之最後VCL NAL單元之後的後續NAL單元中之任一者中的第一者可指定新存取單元之開始。
●存取單元定界符NAL單元(當存在時)。
●序列參數集NAL單元(當存在時)。
●圖像參數集NAL單元(當存在時)。
●調適參數集NAL單元(當存在時)。
●具有等於10之「nal_unit_type」的SEI NAL單元(當存在時)。
●具有在14至29之範圍中的「nal_unit_type」之NAL單元(當存在時)。
●經寫碼圖像之第一VCL NAL單元(始終存在)。
視訊編碼器20及視訊解碼器30可遵守關於存取單元內之經寫碼圖像及非VCL NAL單元之次序的以下約束:
●當存取單元定界符NAL單元存在時,存取單元定界符NAL為第一NAL單元。在任何存取單元中可僅存在一個存取單元定界符NAL單元。
●當SEI NAL單元具有等於10之「nal_unit_type」語法元素時,SEI NAL單元在經寫碼圖像之第一VCL NAL單元之前。
●當SEI NAL單元具有等於11之「nal_unit_type」語法元素時,SEI NAL單元在經寫碼圖像之第一VCL NAL單元之後,且在SEI NAL單元所適用於之第一VCL NAL單元之前。因此,SEI NAL單元在經寫碼圖像之最後VCL NAL單元之前。
●當SEI NAL單元含有緩衝週期SEI訊息時,SEI NAL單元可具有等於10之「nal_unit_type」語法元素,且緩 衝週期SEI訊息為存取單元中之第一SEI NAL單元的第一SEI訊息有效負載。
●具有等於0、11、13或在30至63之範圍中的「nal_unit_type」語法元素之NAL單元不在經寫碼圖像之第一VCL NAL單元之前。
SPS NAL單元、PPS NAL單元或APS NAL單元可存在於存取單元中,但可不在存取單元內之主要經寫碼圖像的最後VCL NAL單元之後。
以此方式,視訊編碼器20可實施用於編碼視訊資料之方法。該方法可包含產生複數個NAL單元。該方法亦可包含基於NAL單元之NAL單元類型識別含有經寫碼子切片之NAL單元的子集。另外,該方法可包含產生含有NAL單元之子集的封包。類似地,視訊解碼器30可實施用於解碼視訊資料之方法,該方法包含接收含有多個NAL單元之封包,該等NAL單元中之每一者含有經寫碼子切片,該等NAL單元中之每一者包括類型指示符,該類型指示符指示NAL單元屬於含有經寫碼子切片(亦即,經編碼圖像區段)之NAL單元的類型。用於解碼視訊資料之方法亦可包含解碼子切片。
在其他實例中,視訊編碼器20可產生含有與多個子切片相關聯之資料的單一NAL單元。舉例而言,視訊編碼器20可產生含有與多個輕量切片相關聯之資料的單一經寫碼切片NAL單元。在此等實例中,NAL單元內之輕量切片可為位元組對準,且視訊編碼器20可用信號發出與子切片中之 每一者相關聯的資料之位元組偏移,與子切片中之第一者相關聯的資料除外。視訊解碼器30可使用位元組偏移來將子切片中之不同子切片分配給不同處理核心以供解碼。以此方式,視訊解碼器30可並列地解碼與子切片相關聯之資料。然而,若視訊解碼器30不並列地解碼子切片,則視訊解碼器30可忽略位元組偏移。因此,若視訊解碼器30不並列地解碼子切片,則發送位元組偏移可降低效率。
在一些實例中,影像塊可用以實現漸次解碼再新(gradual decoding refresh,GDR)。舉例而言,視訊編碼器20可以相同方式將圖像序列中之每一圖像分割成影像塊。舉例而言,視訊編碼器20可使用相同的九個垂直影像塊邊界將圖像中之每一者分割成八個影像塊。在此實例中,最左影像塊可為影像塊0,自左起第二影像塊可為影像塊1,等等。圖像中之每一者含有至少一P切片。因此,序列中之每一圖像的至少部分取決於至少另一圖像。在序列之第一圖像(亦即,圖像0)中,框內寫碼影像塊0中之所有樹區塊,且框間寫碼第一圖像之所有剩餘影像塊中之樹區塊。在序列之第二圖像(亦即,圖像1)中,框內寫碼影像塊1中之所有樹區塊,且框間寫碼第二圖像之所有剩餘影像塊中之樹區塊。此型樣可在序列中之圖像內繼續。換言之,對於在0至序列中之圖像的數目減去1之範圍中的任何值N,在圖像之序列的圖像N中,框內寫碼影像塊N/8中之所有樹區塊且框間寫碼所有其他影像塊中之樹區塊。在先前句子中,「/」指示模除(亦即,模運算符)。具有索引值N使得 N/8等於0之每一圖像可在如下意義上用作隨機存取點:若解碼自該圖像開始,則可完全解碼除了接下來之七個圖像外的所有圖像。在其他實例中,可使用其他數目個影像塊。舉例而言,視訊編碼器20可實施每一圖像具有僅兩個影像塊之GDR。
隨機存取指代自任何經寫碼圖像(特別是自不為視訊位元串流中之第一經寫碼圖像的經寫碼圖像)開始之經寫碼視訊位元串流之解碼。若可在解碼自picP開始時正確地解碼按解碼次序及輸出次序兩者在經寫碼圖像picQ之後的所有經寫碼圖像,則經寫碼圖像picP為隨機存取點(RAP)。picQ可或可不與picP相同。RAP可為IDR圖像或非IDR圖像。可在無自按解碼次序在IDR圖像之前的任何圖像之框間預測的情況下解碼按解碼次序在IDR圖像之後的所有經寫碼圖像。非IDR圖像係不為IDR圖像之任何圖像。
非IDR隨機存取點係以下條件為真之經寫碼圖像:
●非IDR隨機存取點(picR)不為IDR圖像。
●令picR之圖像次序計數(POC)為rPoc,令picA為按解碼次序及輸出次序兩者在同一經寫碼視訊序列中之picR之後的圖像,且令picA之POC為aPoc。當在picR處執行隨機存取時(亦即,當解碼自picR開始時),可正確地解碼在同一經寫碼視訊序列中且按輸出次序在圖像picA之後的所有圖像。
若當在非IDR RAP處執行隨機存取時可正確地解碼在與非IDR RAP相同之經寫碼視訊序列中且按輸出次序在非 IDR RAP之後的所有圖像,則非IDR RAP為清潔隨機存取(clean random access,CRA)圖像。若此情形為真,則非IDR RAP可被稱作漸次解碼再新(GDR)圖像。
GDR序列中之每一圖像可具有其自身之PPS。PPS中之每一者指定影像塊邊界。換言之,指示影像塊邊界之語法元素可針對GDR序列上之每一圖像在PPS中重複。此情形可浪費位元且可強加對頻帶內PPS更新之需要,此舉可強加錯誤回復問題。
在一些實例中,視訊編碼器20可使得能夠改變影像塊邊界,其中圖像僅包括兩個影像塊。舉例而言,視訊編碼器20可將圖像序列中之每一圖像分割成一對影像塊。在此例子中,視訊編碼器20可使得能夠改變僅具有不在圖像邊界處之單一垂直或水平影像塊邊界的圖像之影像塊邊界。影像塊邊界可在圖像間移動。舉例而言,若影像塊邊界垂直,則影像塊邊界可自左向右或自右向左移動。若影像塊邊界水平,則影像塊邊界可向上或向下移動。
可以各種方式用信號發出影像塊邊界之移動。舉例而言,視訊編碼器20可產生一或多個語法元素,該一或多個語法元素指示序列內之影像塊邊界在圖像間之移動。此等語法元素可位於各種語法結構內。舉例而言,視訊編碼器20可產生參數集,該參數集包括指示影像塊邊界之移動及位置的語法元素中之至少一些。在此實例中,參數集可為SPS、PPS、APS或另一類型之參數集。在一些此等實例中,可結合SPS及/或PPS中之語法元素指示影像塊邊界之 移動及位置。在其他實例中,僅藉由APS或切片標頭中之一或多個語法元素來指示影像塊邊界之移動及位置。在其他實例中,視訊編碼器20可產生切片標頭,該切片標頭包含指示影像塊邊界之移動及位置的一或多個語法元素。
在又一實例中,SPS及切片標頭中之語法元素指示影像塊邊界之移動及位置。在此實例中,表4提供SPS RBSP之語法。表5提供切片標頭之語法。表4之SPS RBSP及表5之切片標頭中的語法元素一起用信號發出影像塊邊界之移動。
在表4中,「dynamic_tile_boundary_flag」語法元素指示影像塊邊界是否可動態地改變。舉例而言,若「dynamic_tile_boundary_flag」語法元素等於1,則影像塊邊界可動態地改變。若「dynamic_tile_boundary_flag」語法元素等於0,則影像塊邊界不動態地改變。若「num_tile_columns_minus1」及「num_tile_rows_minus1」語法元素之總和不等於1,則「dynamic_tile_boundary_flag」語法元素可不等於1。若「dynamic_tile_boundary_flag」語法元素不存在,則視訊解碼器30可推斷「dynamic_tile_boundary_flag」語法元素等於0。「dynamic_tile_boundary_flag」語法元素可僅在僅存在兩個垂直影像塊或兩個水平影像塊的情況下等於1。
此外,表4之「tile_boundary_change_direction_flag」語法元素可指定影像塊邊界之移動方向。舉例而言,若「tile_boundary_change_direction_flag」語法元素等於0且影像塊邊界垂直,則影像塊邊界可自一圖像至下一圖像自左向右移動。若「tile_boundary_change_direction_flag」語法元素等於1且影像塊邊界垂直,則影像塊邊界可自一圖像至下一圖像自右向左移動。若「tile_boundary_change_direction_flag」語法元素等於0且影像塊邊界水平,則影像塊邊界可自上而下移動。若「tile_boundary_change_direction_flag」語法元素等於1且影像塊邊界水平,則影像塊邊界可自下而上移動。
表4之「tile_boundary_change_rate_minus1」語法元素可 指定影像塊邊界自一圖像移動至下一圖像之樹區塊列或行的數目。舉例而言,若影像塊邊界垂直,則「tile_boundary_change_rate_minus1」語法元素可指示影像塊邊界自一圖像移動至下一圖像之樹區塊行的數目。若影像塊邊界水平,則「tile_boundary_change_rate_minus1」語法元素可指示影像塊邊界自一圖像移動至下一圖像之樹區塊列的數目。列或行之數目可等於「tile_boundary_change_rate_minus1」語法元素加上1。舉例而言,可變「TileBoundaryChangeRate」之值可藉由將1與「tile_boundary_change_rate_minus1」語法元素相加來導出。出於解釋容易起見,「tile_boundary_change_rate_minus1」語法元素可被稱作速率語法元素。
視訊解碼器30可使用表5之「tile_boundary_change_cycle」語法元素來導出影像塊邊界之位置。出於解釋容易起見,「tile_boundary_change_cycle」語法元素可被稱作循環語法元素。循環語法元素可指示與序列中之圖像相關聯的循環。若影像塊邊界垂直,則「tile_boundary_change_cycle」語法元素可藉由用以下公式指示之位元的數目來表示:Ceil(Log2(PicWidthInLcus÷TileBoundaryChangeRate+1))
在以上公式中,Ceil(...)為頂值函數,Log2(...)為底數為2之對數函數,且「PicWidthInLcus」為LCU(亦即,樹區塊)中之圖像的寬度。此外,若影像塊邊界垂直,則「tile_boundary_change_cycle」語法元素之值的範圍可為0至藉由以下公式指示之值: Ceil(PicWidthInLcus÷TileBoundaryChangeRate)。
若影像塊邊界水平,則「tile_boundary_change_cycle」元素可藉由用以下公式指示之位元的數目來表示:Ceil(Log2(PicHeightInLcus÷TileBoundaryChangeRate+1))
在以上公式中,「PicHeightInLcus」為LCU(亦即,樹區塊)中之圖像的高度。此外,若影像塊邊界水平,則「tile_boundary_change_cycle」語法元素之值的範圍可為0至藉由以下公式指示之值:Ceil(PicHeightInLcus÷TileBoundaryChangeRate)。
若影像塊邊界垂直(亦即,「num_tile_columns_minus1」語法元素等於1),則視訊解碼器30可如下導出影像塊邊界之位置。若「tile_boundary_change_direction_flag」語法元素等於0,則左方影像塊之樹區塊的寬度等於「tile_boundary_change_cycle」*「TileBoundaryChangeRate」。「TileBoundaryChangeRate」變數等於「tile_boundary_change_rate_minus1」語法元素加上1。否則,若「tile_boundary_change_direction_flag」語法元素等於1,則右方影像塊之樹區塊的寬度等於「tile_boundary_change_cycle」*「TileBoundaryChangeRate」。
若影像塊邊界水平(亦即,「num_tile_rows_minus1」語法元素等於1),則視訊解碼器30可如下導出影像塊邊界之位置。若「tile_boundary_change_direction_flag」語法元素等於0,則上部影像塊之樹區塊的高度等於「tile_boundary_change_cycle」*「TileBoundaryChangeRate」。 若「tile_boundary_change_direction_flag」語法元素等於1,則下部影像塊之樹區塊的高度等於「tile_boundary_change_cycle」*「TileBoundaryChangeRate」。
在表5中,將變數「IdrPicFlag」指定為IdrPicFlag=((nal_unit_type==5||nal_unit_type==6)?1:0)。
換言之,若含有切片標頭之NAL單元的「nal_unit_type」語法元素具有5或6之值,則變數「IdrPicFlag」具有1之值。
在另一實例中,表6說明圖像參數集RBSP之實例語法。PPS RBSP及表5之切片標頭的語法元素可一起用信號發出影像塊邊界之移動及位置。
表6之「dynamic_tile_boundary_flag」語法元素、「tile_boundary_change_direction_flag」語法元素及「tile_boundary_change_rate_minus1」語法元素可具有與表4之對應元素相同的語意。表4、表5及表6之其他語法元素可具有定義於上文所提及之JCTVC文件JCTVC-F335中或定義於HEVC WD4中的語意。在一些實例中,除了表4之語法之外或作為表4之語法之替代例,視訊編碼器20及視訊解碼器30可使用表6之語法。
以此方式,視訊編碼器20可執行用於編碼視訊資料之方法。用於編碼視訊資料之方法可包含將圖像序列中之每一圖像分割成一對影像塊,影像塊邊界分離該對影像塊。編碼方法亦可包含產生一或多個語法元素,該一或多個語法 元素指示序列內之影像塊邊界在圖像間的移動。同樣地,視訊解碼器30可執行用於解碼視訊資料之方法。解碼方法可包含接收視訊資料之位元串流中的一或多個語法元素,該一或多個語法元素指示圖像序列內之影像塊邊界在圖像間的移動。解碼方法亦可包含針對圖像中之每一者基於語法元素判定影像塊邊界之位置。
圖3為說明經組態以實施本發明之技術的實例視訊解碼器30之方塊圖。出於解釋目的而提供圖3且其並不限制如本發明中廣泛地例示及描述之技術。出於解釋目的,本發明在HEVC寫碼之情境下描述視訊解碼器30。然而,本發明之技術可適用於其他寫碼標準或方法。
在圖3之實例中,視訊解碼器30包括複數個功能組件。視訊解碼器30之功能組件包括熵解碼單元150、預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158、濾波器單元159及經解碼圖像緩衝器160。預測處理單元152包括運動補償單元162及框內預測處理單元164。在其他實例中,視訊解碼器30可包括更多、更少或不同功能組件。
視訊解碼器30可接收包含複數個語法元素之位元串流。熵解碼單元150可剖析位元串流以自位元串流提取語法元素。作為剖析位元串流之部分,熵解碼單元150可熵解碼位元串流中之經熵編碼語法元素。預測處理單元152、反量化單元154、反變換處理單元156、重建構單元158及濾波器單元159可基於自位元串流提取之語法元素產生經解 碼視訊資料。
位元串流可包含一系列NAL單元。位元串流之NAL單元可包括SPS NAL單元、PPS NAL單元、SEI NAL單元等。作為剖析位元串流之部分,熵解碼單元150可自SPS NAL單元提取SPS且熵解碼SPS,自PPS NAL單元提取PSS且熵解碼PSS,自SEI NAL單元提取SEI訊息且熵解碼SEI訊息,等等。
另外,位元串流之NAL單元可包括經寫碼切片NAL單元。作為剖析位元串流之部分,熵解碼單元150可自經寫碼切片NAL單元提取經寫碼切片且熵解碼經寫碼切片。經寫碼切片中之每一者可包括切片標頭及切片資料。切片標頭可含有關於切片之語法元素。切片標頭中之語法元素可包括識別與含有切片之圖像相關聯的PPS之語法元素。熵解碼單元150可對經寫碼切片標頭中之語法元素執行熵解碼操作(諸如,CABAC解碼操作)以恢復切片標頭。
作為自經寫碼切片NAL單元提取切片資料之部分,熵解碼單元150可自切片資料中之經寫碼CU提取語法元素。經提取語法元素可包括與係數區塊相關聯之語法元素。熵解碼單元150可對語法元素中之一些執行CABAC解碼操作。
作為對語法元素執行CABAC解碼之部分,熵解碼單元150可識別寫碼內容脈絡。熵解碼單元150可將區間劃分成下部子區間及上部子區間。子區間中之一者可與值0相關聯且另一子區間可與值1相關聯。子區間之寬度可與藉由經識別寫碼內容脈絡指示之相關聯值之機率成比例。若經 編碼值在下部子區間內,則熵解碼單元150可解碼具有與下部子區間相關聯之值的分格。若經編碼值在上部子區間內,則熵解碼單元150可解碼具有與上部子區間相關聯之值的分格。為了解碼語法元素之下一分格,熵解碼單元150可重複此等步驟,其中區間為含有經編碼值之子區間。在熵解碼單元150對下一分格重複此等步驟時,熵解碼單元150可使用基於藉由經識別寫碼內容脈絡及經解碼分格指示之機率的經修改機率。熵解碼單元150可解二進位化(de-binarize)該等分格以恢復語法元素。
另外,視訊解碼器30可對未經分割CU執行重建構操作。為了對未經分割CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由針對CU之每一TU執行重建構操作,視訊解碼器30可重建構與CU相關聯之殘餘像素區塊。
作為對CU之TU執行重建構操作之部分,反量化單元154可對與TU相關聯之係數區塊進行反量化(亦即,解量化)。反量化單元154可使用與TU之CU相關聯的QP值來判定量化之程度,且同樣地,判定反量化單元154所應用之反量化的程度。
在反量化單元154對係數區塊進行反量化之後,反變換處理單元156可將一或多個反變換應用於係數區塊以便產生與TU相關聯之殘餘樣本區塊。舉例而言,反變換處理單元156可將反DCT、反整數變換、反卡忽南-拉維(Karhunen-Loeve)變換(KLT)、反旋轉變換、反定向變換或 另一反變換應用於係數區塊。
若在跳過模式下編碼PU或使用合併模式編碼PU之運動資訊,則運動補償單元162可產生PU之合併候選者清單。運動補償單元162可識別合併候選者清單中之選定合併候選者。運動補償單元162可基於與藉由選定合併候選者指示之運動資訊相關聯的一或多個參考區塊產生PU之預測性樣本區塊。
若使用AMVP模式編碼PU之運動資訊,則運動補償單元162可產生清單0 MV預測子候選者清單及/或清單1 MV預測子候選者清單。運動補償單元162可判定選定清單0 MV預測子候選者及/或選定清單1 MV預測子候選者。接下來,運動補償單元162可基於清單0運動向量差(MVD)、清單1 MVD、藉由選定清單0 MV預測子候選者指定之清單0運動向量及/或藉由選定清單1 MV預測子候選者指定之清單1運動向量來判定PU之清單0運動向量及/或PU之清單1運動向量。運動補償單元162可基於與清單0運動向量及清單0參考圖像索引及/或清單1運動向量及清單1參考圖像索引相關聯之參考區塊來產生PU之預測性樣本區塊。
在一些實例中,運動補償單元162可藉由基於內插濾波器執行內插來改進PU之預測性樣本區塊。待用於以子像素精度執行運動補償之內插濾波器的識別符可包括於語法元素中。運動補償單元162可在PU之預測性樣本區塊的產生期間使用由視訊編碼器20使用之相同內插濾波器來計算參考區塊之子整數(sub-integer)樣本的內插值。運動補償單 元162可根據所接收語法資訊判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器產生預測性樣本區塊。
若使用框內預測來編碼PU,則框內預測處理單元164可執行框內預測以產生PU之預測性樣本區塊。舉例而言,框內預測處理單元164可基於位元串流中之語法元素判定PU之框內預測模式。框內預測處理單元164可使用框內預測模式基於空間上相鄰之PU之樣本區塊產生PU之預測性資料(例如,預測性樣本)。
重建構單元158可使用與CU之TU相關聯的殘餘樣本區塊及CU之PU的預測性樣本區塊(亦即,框內預測資料或框間預測資料)在適當時重建構CU之樣本區塊。詳言之,重建構單元158可將殘餘樣本區塊之樣本與預測性樣本區塊的對應樣本相加來重建構CU之樣本區塊。
濾波器單元159可執行解區塊操作以減少與CU相關聯之區塊假影。視訊解碼器30可將CU之樣本區塊儲存於經解碼圖像緩衝器160中。經解碼圖像緩衝器160可提供用於後續運動補償、框內預測及呈現於顯示器件(諸如,圖1之顯示器件32)上的參考圖像。舉例而言,視訊解碼器30可基於經解碼圖像緩衝器160中之樣本區塊對其他CU之PU執行框內預測或框間預測操作。
圖4為說明根據本發明之一或多種技術之視訊編碼器20的實例操作200之流程圖。在圖4之實例中,視訊編碼器20可編碼視訊資料之切片的圖像區段(例如,影像塊、波、 熵切片等)(202)。切片可包括多個寫碼單元。藉由編碼圖像區段,視訊編碼器20產生經編碼圖像區段。視訊編碼器20可產生包括切片之經編碼圖像區段的經寫碼切片NAL單元(204)。
另外,視訊編碼器20可產生指示經寫碼圖像區段之入口點的SEI訊息(206)。亦即,SEI訊息可指示經寫碼圖像區段之在經寫碼切片NAL單元中的位置。SEI訊息可具有上文所描述之格式。舉例而言,視訊編碼器20可產生包括SEI訊息之SEI NAL單元。
視訊編碼器20可輸出包括經寫碼切片NAL單元及SEI訊息之位元串流(208)。位元串流包括視訊資料之經編碼表示。視訊編碼器20可以各種方式輸出位元串流。舉例而言,視訊編碼器20可在諸如網際網路之通信網路上傳輸位元串流。在另一實例中,視訊編碼器20可將位元串流輸出至諸如硬碟機或記憶體之電腦可讀儲存媒體。
圖5為說明根據本發明之一或多種技術之視訊解碼器30的實例操作250之流程圖。在圖5之實例中,視訊解碼器30可接收含有複數個經編碼圖像區段之經寫碼切片NAL單元(252)。另外,視訊解碼器30可接收(例如)在非VCL NAL單元中之SEI訊息,該SEI訊息指示經寫碼切片NAL單元中之經編碼圖像區段的入口點(254)。視訊解碼器30可以各種方式接收經寫碼切片NAL單元及SEI訊息。舉例而言,視訊解碼器30可經由諸如網際網路之通信網路自遠端伺服器接收經寫碼切片NAL單元及SEI訊息。在另一實例中,視訊 解碼器30可自諸如硬碟機或記憶體之電腦可讀儲存媒體接收經寫碼切片NAL單元及SEI訊息。
視訊解碼器30可至少部分基於SEI訊息中所指示之入口點來判定經編碼圖像區段之在經寫碼切片NAL單元中的位置(256)。舉例而言,SEI訊息可指示特定經編碼圖像區段在經寫碼切片NAL單元之切片資料的第256個位元組處開始。視訊解碼器30可解碼經編碼圖像區段(258)。在一些實例中,視訊解碼器30可並列地解碼經編碼圖像區段中之兩者或兩者以上。
視訊解碼器30可輸出經編碼圖像區段之經解碼像素區塊(260)。在一些實例中,視訊解碼器30輸出經解碼像素區塊以用於在顯示器件32處顯示。在另一實例中,視訊解碼器30可將經解碼像素區塊輸出至視訊編碼器。在此實例中,作為視訊轉碼操作之部分,視訊編碼器可重新編碼經解碼像素區塊。
圖6為根據本發明之一或多種技術之視訊編碼器20的用於產生具有位元組對準之切片標頭的經寫碼切片NAL單元之實例操作280之流程圖。在圖6之實例中,視訊編碼器20可產生複數個經編碼圖像區段(282)。經編碼圖像區段中之每一者與視訊資料中之圖像中的CU之不同集合相關聯。此外,視訊編碼器20可產生含有切片標頭及複數個經編碼圖像區段之NAL單元(284)。切片標頭可包括將切片標頭與位元組邊界對準之一或多個填補位元。
圖7為說明根據本發明之一或多種技術之視訊編碼器20 的用以產生位元組對準之切片標頭的實例操作300之流程圖。在圖7之實例中,視訊編碼器20可產生切片標頭(302)。另外,視訊編碼器20可判定參數集(例如,序列參數集、圖像參數集、調適參數集等)中之語法元素是否指示切片標頭必須與位元組邊界對準(304)。
若語法元素指示切片標頭必須與位元組邊界對準(304之「是」),則視訊編碼器20可判定切片標頭是否與位元組邊界對準(306)。若切片標頭未與位元組邊界對準(306之「否」),則視訊編碼器20可將位元附加至切片標頭(308)。在將位元附加至切片標頭之後,視訊編碼器20可再次判定切片標頭是否與位元組邊界對準(306)。以此方式,視訊編碼器20可繼續將位元附加至切片標頭直至切片標頭為位元組對準的為止。
若切片標頭與位元組邊界對準(306之「是」)或若語法元素指示切片標頭無需與位元組邊界對準(304之「否」),則操作300完成。
圖8為根據本發明之一或多種技術之視訊解碼器30的實例操作330之流程圖,其中視訊解碼器30接收具有位元組對準之切片標頭的經寫碼切片NAL單元。在圖8之實例中,視訊解碼器30可接收NAL單元(332)。NAL單元可含有切片標頭及視訊資料之複數個經編碼圖像區段。切片標頭可包括將切片標頭與位元組邊界對準之一或多個填補位元。視訊解碼器30可並列地解碼經編碼圖像區段中之兩者或兩者以上(334)。
圖9為說明波前並列處理之概念圖。如上文所描述,可將圖像分割成像素區塊,該等像素區塊中之每一者與樹區塊相關聯。圖9將與樹區塊相關聯之像素區塊說明為白色正方形之柵格。圖像包括樹區塊列350A至350E(統稱為「樹區塊列350」)。
第一執行緒可寫碼樹區塊列350A中之樹區塊。同時,其他執行緒可寫碼樹區塊列350B、350C及350D中之樹區塊。在圖9之實例中,第一執行緒當前正寫碼樹區塊352A,第二執行緒當前正寫碼樹區塊352B,第三執行緒當前正寫碼樹區塊352C,且第四執行緒當前正寫碼樹區塊352D。本發明可將樹區塊352A、352B、352C及352D通稱為「當前樹區塊352」。因為視訊寫碼器可在已寫碼緊接之較高列之兩個以上樹區塊之後開始寫碼樹區塊列,所以當前樹區塊352彼此水平地移位兩個樹區塊之寬度。
在圖9之實例中,執行緒可使用來自藉由粗灰色箭頭指示的樹區塊之資料來對當前樹區塊352中之CU執行框內預測或框間預測。執行緒亦可使用來自一或多個參考圖框之資料來執行CU之框間預測。為了寫碼給定樹區塊,執行緒可基於與先前經寫碼樹區塊相關聯之資訊選擇一或多個CABAC內容脈絡。執行緒可使用一或多個CABAC內容脈絡來對與給定樹區塊之第一CU相關聯的語法元素執行CABAC寫碼。若給定樹區塊不為列之最左樹區塊,則執行緒可基於與在給定樹區塊左方的樹區塊之最後CU相關聯之資訊選擇一或多個CABAC內容脈絡。若給定樹區塊 為列之最左樹區塊,則執行緒可基於與在給定樹區塊上方及右方兩個樹區塊處的樹區塊之最後CU相關聯之資訊選擇一或多個CABAC內容脈絡。執行緒可使用來自藉由細黑色箭頭指示之樹區塊的最後CU之資料來選擇當前樹區塊352之第一CU的CABAC內容脈絡。
圖10為說明經分割成多個影像塊402A、402B、402C、402D、402E及402F(統稱為「影像塊402」)之圖像400的實例樹區塊寫碼次序之概念圖。圖像400中之每一正方形區塊表示與樹區塊相關聯之像素區塊。粗虛線指示實例影像塊邊界。不同類型之交叉影線對應於不同切片。
像素區塊中之編號指示按圖像400之影像塊寫碼次序的對應樹區塊(LCU)之位置。如圖10之實例中所說明,首先寫碼影像塊402A中之樹區塊,其後接著寫碼影像塊402B中之樹區塊,其後接著寫碼影像塊402C中之樹區塊,其後接著寫碼影像塊402D中之樹區塊,其後接著寫碼影像塊402E中之樹區塊,其後接著寫碼影像塊402F中之樹區塊。在影像塊402中之每一者內,根據光柵掃描次序寫碼樹區塊。
視訊編碼器可為圖像400產生四個經寫碼切片NAL單元。第一經寫碼切片NAL單元可包括樹區塊1至18之經編碼表示。第一經寫碼切片NAL單元之切片資料可包括兩個經編碼圖像區段。第一經編碼圖像區段可包括樹區塊1至9之經編碼表示。第二經編碼圖像區段可包括樹區塊10至18之經編碼表示。因此,第一經寫碼切片NAL單元可包括含 有多個影像塊之切片的經編碼表示。
第二經寫碼切片NAL單元可包括樹區塊19至22之經編碼表示。第二經寫碼切片NAL單元之切片資料可包括單一經編碼圖像區段。第三經寫碼切片NAL單元可包括樹區塊23至27之經編碼表示。第三經寫碼切片NAL單元之切片資料可包括僅單一經編碼圖像區段。因此,影像塊402C可含有多個切片。第四經寫碼切片NAL單元可包括樹區塊28至45之經編碼表示。第四經寫碼切片NAL單元之切片資料可包括三個經編碼圖像區段,影像塊402D、402E及402F中之每一者一個。因此,第四經寫碼切片NAL單元可包括含有多個影像塊之切片的經編碼表示。
圖11為根據本發明之一或多個態樣之視訊編碼器20的用以產生位元串流之實例操作430之流程圖,該位元串流包括表示與NAL單元內之經編碼圖像區段的偏移相關聯之語法元素之可變長度值。在圖11之實例中,視訊編碼器20可熵編碼第一語法元素、第二語法元素及一系列偏移語法元素(432)。該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定。該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定。NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定。視訊編碼器20可產生位元串流,該位元串流包括表示經熵編碼之第一語法元素的可變長度值、表示經熵編碼之第二語法元素的可變長度值及表示偏移語法元素之固定長度值(434)。
圖12為說明根據本發明之一或多個態樣之視訊解碼器的用以解碼藉由位元串流表示之視訊資料的實例操作450之流程圖,該位元串流包括表示與NAL單元中之經編碼圖像區段的偏移相關聯之語法元素之可變長度值。在圖12之實例中,視訊解碼器30接收位元串流,該位元串流包括表示第一語法元素的經熵編碼之可變長度值、表示第二語法元素的經熵編碼之可變長度值及一系列偏移語法元素(452)。另外,視訊解碼器30可熵解碼第一語法元素及第二語法元素(454)。視訊解碼器30可基於第一語法元素判定偏移語法元素中之每一者的長度(456)。視訊解碼器30可基於第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目(458)。
另外,視訊解碼器30可至少部分基於偏移語法元素中之每一者的長度及該系列偏移語法元素中之偏移語法元素的數目剖析偏移語法元素(460)。在一些實例中,在視訊解碼器30剖析偏移語法元素時,視訊解碼器30針對偏移語法元素中之每一者執行固定長度解碼。固定長度解碼亦可被稱作特殊模式之熵解碼。類似地,固定長度編碼亦可被稱作特殊模式之熵編碼。
視訊解碼器30可基於偏移語法元素判定NAL單元內之複數個經編碼圖像區段的位置(462)。在一些實例中,NAL單元之切片標頭包括第一語法元素、第二語法元素及該系列偏移語法元素。在其他實例中,SEI訊息包括第一語法元素、第二語法元素及該系列偏移語法元素。此外,視訊解 碼器30可解碼經編碼圖像區段(464)。
在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體來實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體來傳輸,且藉由基於硬體之處理單元來執行。電腦可讀媒體可包括電腦可讀儲存媒體或通信媒體,電腦可讀儲存媒體對應於諸如資料儲存媒體之有形媒體,通信媒體包括促進電腦程式(例如)根據通信協定自一處傳送至另一處的任何媒體。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性之有形電腦可讀儲存媒體或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術之指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
作為實例而非限制,此電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用於儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接可適當地稱作電腦可讀媒體。舉例而言,若使用同軸纜線、光纖纜線、雙絞線、數位用戶線(DSL),或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸指令,則同軸纜線、光纖纜線、雙絞線、DSL,或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲 存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而替代地針對非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟藉由雷射以光學方式再現資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
可藉由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用,術語「處理器」可指代前述結構或適於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,可將本文所描述之功能性提供於經組態以用於編碼及解碼之專用硬體及/或軟體模組內,或併入於組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可實施於廣泛多種器件或裝置中,包括無線手機、積體電路(IC)或IC之集合(例如,晶片組)。本發明中描述各種組件、模組或單元以強調經組態以執行所揭示之技術的器件之功能態樣,但未必需要藉由不同硬體單元實現。更確切而言,如上文所描述,各種單元可組合於編碼解碼器硬體單元中或由交互操作之硬體單元之集合(包括如上文所描述之一或多個處理器)結合合適軟體及/或韌體來提供。
已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧視訊器件
100‧‧‧預測處理單元
102‧‧‧殘餘產生單元
104‧‧‧變換處理單元
106‧‧‧量化單元
108‧‧‧反量化單元
110‧‧‧反變換處理單元
112‧‧‧重建構單元
113‧‧‧濾波器單元
114‧‧‧經解碼圖像緩衝器
116‧‧‧熵編碼單元
121‧‧‧框間預測處理單元
122‧‧‧運動估計單元
124‧‧‧運動補償單元
126‧‧‧框內預測處理單元
150‧‧‧熵解碼單元
152‧‧‧預測處理單元
154‧‧‧反量化單元
156‧‧‧反變換處理單元
158‧‧‧重建構單元
159‧‧‧濾波器單元
160‧‧‧經解碼圖像緩衝器
162‧‧‧運動補償單元
164‧‧‧框內預測處理單元
200‧‧‧實例操作
250‧‧‧實例操作
280‧‧‧用於產生具有位元組對準之切片標頭之經寫碼切片NAL單元的實例操作
300‧‧‧用以產生位元組對準之切片標頭的實例操作
330‧‧‧接收具有位元組對準之切片標頭的經寫碼切 片NAL單元之實例操作
350‧‧‧樹區塊列
350A‧‧‧樹區塊列
350B‧‧‧樹區塊列
350C‧‧‧樹區塊列
350D‧‧‧樹區塊列
350E‧‧‧樹區塊列
352‧‧‧當前樹區塊
352A‧‧‧樹區塊
352B‧‧‧樹區塊
352C‧‧‧樹區塊
352D‧‧‧樹區塊
400‧‧‧圖像
402‧‧‧影像塊
402A‧‧‧影像塊
402B‧‧‧影像塊
402C‧‧‧影像塊
402D‧‧‧影像塊
402E‧‧‧影像塊
402F‧‧‧影像塊
430‧‧‧用以產生位元串流之實例操作
450‧‧‧用以解碼藉由位元串流表示之視訊資料的實例操作
圖1為說明可利用本發明中所描述之技術的實例視訊寫碼系統之方塊圖。
圖2為說明可實施本發明中所描述之技術的實例視訊編碼器之方塊圖。
圖3為說明可實施本發明中所描述之技術的實例視訊解碼器之方塊圖。
圖4為說明根據本發明之一或多種技術之視訊編碼器的實例操作之流程圖。
圖5為說明根據本發明之一或多種技術之視訊解碼器的實例操作之流程圖。
圖6為根據本發明之一或多種技術之視訊編碼器的用於產生具有位元組對準之切片標頭的經寫碼切片NAL單元之實例操作之流程圖。
圖7為說明根據本發明之一或多種技術之視訊編碼器的用以產生位元組對準之切片標頭的實例操作之流程圖。
圖8為根據本發明之一或多種技術之視訊解碼器的實例操作之流程圖,其中該視訊解碼器接收具有位元組對準之切片標頭的經寫碼切片NAL單元。
圖9為說明波前並列處理之概念圖。
圖10為說明在將圖像分割成複數個影像塊時之實例寫碼次序的概念圖。
圖11為根據本發明之一或多個態樣之視訊編碼器的用以產生位元串流之實例操作之流程圖,該位元串流包括表示與NAL單元內之經編碼圖像區段的偏移相關聯之語法元素之可變長度值。
圖12為根據本發明之一或多個態樣之視訊解碼器的用以解碼藉由位元串流表示之視訊資料的實例操作之流程圖,該位元串流包括表示與NAL單元內之經編碼圖像區段的偏移相關聯之語法元素之可變長度值。
10‧‧‧實例視訊寫碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧視訊器件

Claims (34)

  1. 一種用於編碼視訊資料之方法,該方法包含:熵編碼一第一語法元素及一第二語法元素;產生一系列偏移語法元素,其中該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定,該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定,且一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及產生形成該視訊資料之一經寫碼表示的一位元串流,該位元串流包括表示該經熵編碼之第一語法元素的一可變長度值、表示該經熵編碼之第二語法元素的一可變長度值及表示該等偏移語法元素之固定長度值。
  2. 如請求項1之方法,其中該系列偏移語法元素指示該等經編碼圖像區段相對於該NAL單元內之先前經編碼圖像區段的位元組偏移。
  3. 如請求項1之方法,其進一步包含產生一補充增強資訊(SEI)訊息,該SEI訊息包括該第一語法元素、該第二語法元素及該系列偏移語法元素。
  4. 如請求項3之方法,其中該SEI訊息包括一語法元素,該語法元素指示該SEI訊息屬於指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之一類型之SEI訊息。
  5. 如請求項4之方法,其進一步包含產生含有該SEI訊息之一SEI NAL單元。
  6. 如請求項1之方法,其中該等偏移語法元素中之每一者的該等長度等於該第一語法元素加上10之一值。
  7. 一種計算器件,其包含:一儲存媒體,其經組態以儲存視訊資料;及一或多個處理器,其經組態以執行以下步驟:熵編碼一第一語法元素及一第二語法元素;產生一系列偏移語法元素,其中該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定,該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定,且一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及產生形成該視訊資料之一經寫碼表示的一位元串流,該位元串流包括表示該經熵編碼之第一語法元素的一可變長度值、表示該經熵編碼之第二語法元素的一可變長度值及表示該等偏移語法元素之固定長度值。
  8. 如請求項7之計算器件,其中該系列偏移語法元素指示該等經編碼圖像區段相對於該NAL單元內之先前經編碼圖像區段的位元組偏移。
  9. 如請求項7之計算器件,其中該一或多個處理器經組態 以產生一補充增強資訊(SEI)訊息,該SEI訊息包括該第一語法元素、該第二語法元素及該系列偏移語法元素。
  10. 如請求項9之計算器件,其中該SEI訊息包括一語法元素,該語法元素指示該SEI訊息屬於指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之一類型之SEI訊息。
  11. 如請求項7之計算器件,其進一步包含產生含有該SEI訊息之一SEI NAL單元。
  12. 如請求項7之計算器件,其中該等偏移語法元素中之每一者的該等長度等於該第一語法元素加上10之一值。
  13. 如請求項7之計算器件,其中該計算器件包含一視訊編碼器。
  14. 一種計算器件,其包含:用於熵編碼一第一語法元素及一第二語法元素之構件;產生一系列偏移語法元素之構件,其中該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定,該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定,且一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及用於產生形成視訊資料之一經寫碼表示的一位元串流 之構件,該位元串流包括表示該經熵編碼之第一語法元素的一可變長度值、表示該經熵編碼之第二語法元素的一可變長度值及表示該等偏移語法元素之固定長度值。
  15. 一種非暫時性的電腦可讀儲存媒體,其具有儲存在其上由一計算器件之一或多個處理器執行時組態該計算器件以執行以下步驟的指令:熵編碼一第一語法元素及一第二語法元素;產生一系列偏移語法元素,其中該等偏移語法元素中之每一者的長度可基於該第一語法元素來判定,該系列偏移語法元素中之偏移語法元素的數目可基於該第二語法元素來判定,且一NAL單元內之複數個經編碼圖像區段的位置可基於該等偏移語法元素來判定,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及產生形成視訊資料之一經寫碼表示的一位元串流,該位元串流包括表示該經熵編碼之第一語法元素的一可變長度值、表示該經熵編碼之第二語法元素的一可變長度值及表示該等偏移語法元素之固定長度值。
  16. 一種用於解碼視訊資料之方法,該方法包含:接收形成該視訊資料之一經寫碼表示的一位元串流,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列固定長度偏移語法元素; 熵解碼該第一語法元素及該第二語法元素;基於該第一語法元素判定該等偏移語法元素中之每一者的長度;基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目;至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素;基於該等偏移語法元素判定一網路提取層(NAL)單元內之複數個經編碼圖像區段的位置,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及解碼該等經編碼圖像區段。
  17. 如請求項16之方法,其中該系列偏移語法元素指示該等經編碼圖像區段相對於該NAL單元內之先前經編碼圖像區段的位元組偏移。
  18. 如請求項16之方法,其中該位元串流包括一補充增強資訊(SEI)訊息,該SEI訊息包括該第一語法元素、該第二語法元素及該系列偏移語法元素。
  19. 如請求項18之方法,其中該SEI訊息包括一語法元素,該語法元素指示該SEI訊息屬於指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之一類型之SEI訊息。
  20. 如請求項16之方法,其中該位元串流包括一SEI NAL單 元,該SEI NAL單元包括該SEI訊息。
  21. 如請求項20之方法,其中該SEI NAL單元在該位元串流中緊接在含有該複數個經編碼圖像區段之該NAL單元之前;且其中該方法進一步包含至少部分基於在該位元串流中緊接在含有該複數個經編碼圖像區段之該NAL單元之前的該SEI NAL單元來判定該SEI訊息適用於含有該複數個經編碼圖像區段之該NAL單元。
  22. 如請求項16之方法,其進一步包含將該等經編碼圖像區段提供至不同處理核心以用於並列解碼該等經編碼圖像區段,及在該等處理核心中解碼該等各別經編碼圖像區段。
  23. 如請求項16之方法,其中該等偏移語法元素中之每一者的該等長度等於該第一語法元素加上10之一值。
  24. 一種計算器件,其包含:一資料儲存媒體,其經組態以儲存視訊資料;及一或多個處理器,其經組態以執行以下步驟:接收形成該視訊資料之一經寫碼表示的一位元串流,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素;熵解碼該第一語法元素及該第二語法元素;基於該第一語法元素判定該等偏移語法元素中之每一者的長度; 基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目;至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素;基於該等偏移語法元素判定一網路提取層(NAL)單元內之複數個經編碼圖像區段的位置,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及解碼該等經編碼圖像區段。
  25. 如請求項24之計算器件,其中該系列偏移語法元素指示該等經編碼圖像區段相對於該NAL單元內之先前經編碼圖像區段的位元組偏移。
  26. 如請求項24之計算器件,其中該位元串流包括一補充增強資訊(SEI)訊息,該SEI訊息包括該第一語法元素、該第二語法元素及該系列偏移語法元素。
  27. 如請求項26之計算器件,其中該SEI訊息包括一語法元素,該語法元素指示該SEI訊息屬於指示經寫碼切片NAL單元中之經編碼圖像區段的入口點之一類型之SEI訊息。
  28. 如請求項24之計算器件,其中該位元串流包括一SEI NAL單元,該SEI NAL單元包括該SEI訊息。
  29. 如請求項28之計算器件, 其中該SEI NAL單元在該位元串流中緊接在含有該複數個經編碼圖像區段之該NAL單元之前;且其中該一或多個處理器經組態以至少部分基於在該位元串流中緊接在含有該複數個經編碼圖像區段之該NAL單元之前的該SEI NAL單元來判定該SEI訊息適用於含有該複數個經編碼圖像區段之該NAL單元。
  30. 如請求項24之計算器件,其中該一或多個處理器經組態以將該等經編碼圖像區段提供至不同處理核心以用於並列解碼該等經編碼圖像區段。
  31. 如請求項24之計算器件,其中該計算器件包含一視訊解碼器。
  32. 如請求項24之計算器件,其中該第一語法元素加上10之一值等於該系列偏移語法元素之以位元為單位的該長度。
  33. 一種計算器件,其包含:用於接收形成視訊資料之一經寫碼表示的一位元串流之構件,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素;用於熵解碼該第一語法元素及該第二語法元素之構件;用於基於該第一語法元素判定該等偏移語法元素中之每一者的長度之構件;用於基於該第二語法元素判定該系列偏移語法元素中 之偏移語法元素的數目之構件;用於至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖析該等偏移語法元素之構件;用於基於該等偏移語法元素判定一網路提取層(NAL)單元內之複數個經編碼圖像區段的位置之構件,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及用於解碼該等經編碼圖像區段之構件。
  34. 一種非暫時性的電腦可讀儲存媒體,其具有儲存在其上由一計算器件之一或多個處理器執行時組態該計算器件以執行以下步驟的指令:接收形成視訊資料之一經寫碼表示的一位元串流,該位元串流包括表示一第一語法元素之一經熵編碼之可變長度值、表示一第二語法元素之一經熵編碼之可變長度值及一系列偏移語法元素;熵解碼該第一語法元素及該第二語法元素;基於該第一語法元素判定該等偏移語法元素中之每一者的長度;基於該第二語法元素判定該系列偏移語法元素中之偏移語法元素的數目;至少部分基於該等偏移語法元素中之每一者的該等長度及該系列偏移語法元素中之偏移語法元素的該數目剖 析該等偏移語法元素;基於該等偏移語法元素來判定一網路提取層(NAL)單元內之複數個經編碼圖像區段的位置,其中該等經編碼圖像區段中之每一各別者包括在該NAL單元內之與一各別熵切片、影像塊或波前並列處理(WPP)波相關聯的經寫碼樹區塊之一各別群組;及解碼該等經編碼圖像區段。
TW101140888A 2011-11-04 2012-11-02 具有包含多個編碼圖案區段之網路提取層之視訊寫碼 TWI511572B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161555932P 2011-11-04 2011-11-04
US201161557259P 2011-11-08 2011-11-08
US13/666,442 US9124895B2 (en) 2011-11-04 2012-11-01 Video coding with network abstraction layer units that include multiple encoded picture partitions

Publications (2)

Publication Number Publication Date
TW201342921A TW201342921A (zh) 2013-10-16
TWI511572B true TWI511572B (zh) 2015-12-01

Family

ID=47190183

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101140888A TWI511572B (zh) 2011-11-04 2012-11-02 具有包含多個編碼圖案區段之網路提取層之視訊寫碼

Country Status (12)

Country Link
US (1) US9124895B2 (zh)
EP (1) EP2774366B1 (zh)
JP (1) JP5837217B2 (zh)
KR (1) KR101654441B1 (zh)
CN (1) CN104160702B (zh)
BR (1) BR112014010330B1 (zh)
DK (1) DK2774366T3 (zh)
ES (1) ES2892341T3 (zh)
HU (1) HUE056412T2 (zh)
IN (1) IN2014CN03343A (zh)
TW (1) TWI511572B (zh)
WO (1) WO2013067311A1 (zh)

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9819968B2 (en) * 2011-01-12 2017-11-14 Texas Instruments Incorporated Method and apparatus for error detection in CABAC
US9215473B2 (en) 2011-01-26 2015-12-15 Qualcomm Incorporated Sub-slices in video coding
CN103718553B (zh) * 2011-08-11 2017-03-01 太阳专利托管公司 图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置
US9077998B2 (en) 2011-11-04 2015-07-07 Qualcomm Incorporated Padding of segments in coded slice NAL units
US20130113882A1 (en) * 2011-11-08 2013-05-09 Sony Corporation Video coding system and method of operation thereof
CN108600753B (zh) 2011-12-29 2020-10-27 Lg 电子株式会社 视频编码和解码方法和使用该方法的装置
EP4274227A3 (en) * 2012-02-04 2023-11-29 LG Electronics Inc. Video encoding method, video decoding method, and device using same
CN104365100A (zh) * 2012-04-15 2015-02-18 三星电子株式会社 用于并行处理的视频编码方法和装置以及视频解码方法和装置
WO2013165215A1 (ko) * 2012-05-04 2013-11-07 엘지전자 주식회사 영상 정보 저장 방법 및 영상 정보 파싱 방법 그리고 이를 이용하는 장치
EP4686201A3 (en) 2012-06-25 2026-04-01 Huawei Technologies Co., Ltd. Method for signaling a gradual temporal layer access picture
ES2961943T3 (es) 2012-06-26 2024-03-14 Lg Electronics Inc Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento que almacena información de video codificada
US9621905B2 (en) * 2012-06-29 2017-04-11 Qualcomm Incorporated Tiles and wavefront parallel processing
US8928730B2 (en) * 2012-07-03 2015-01-06 DigitalOptics Corporation Europe Limited Method and system for correcting a distorted input image
CA2878807C (en) * 2012-07-09 2018-06-12 Vid Scale, Inc. Codec architecture for multiple layer video coding
JP5680257B2 (ja) 2012-08-09 2015-03-04 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像復号方法および画像復号装置
US9242602B2 (en) 2012-08-27 2016-01-26 Fotonation Limited Rearview imaging systems for vehicle
SG11201501400QA (en) 2012-09-26 2015-04-29 Panasonic Ip Corp America Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
CN102883163B (zh) * 2012-10-08 2014-05-28 华为技术有限公司 用于运动矢量预测的运动矢量列表建立的方法、装置
US9788002B2 (en) * 2012-11-29 2017-10-10 Samsung Electronics Co., Ltd. Image processing apparatus and method
US9172923B1 (en) 2012-12-20 2015-10-27 Elemental Technologies, Inc. Sweep dependency based graphics processing unit block scheduling
JP5990342B2 (ja) * 2013-01-04 2016-09-14 サムスン エレクトロニクス カンパニー リミテッド スライスセグメントのエントロピー符号化方法及びその装置、スライスセグメントのエントロピー復号化方法及びその装置
US20140219331A1 (en) * 2013-02-06 2014-08-07 Magnum Semiconductor, Inc. Apparatuses and methods for performing joint rate-distortion optimization of prediction mode
EP3021586A4 (en) * 2013-07-07 2016-12-07 Wilus Inst Standards & Technology Inc METHOD AND APPARATUS FOR PROCESSING VIDEO SIGNAL
WO2015007751A1 (en) 2013-07-15 2015-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Layer characteristic signaling in multi-layered coding
US20150049105A1 (en) * 2013-08-13 2015-02-19 Mediatek Inc. Data processing apparatus for transmitting/receiving indication information of pixel data grouping setting via display interface and related data processing method
US9336558B2 (en) 2013-09-27 2016-05-10 Apple Inc. Wavefront encoding with parallel bit stream encoding
US9224187B2 (en) 2013-09-27 2015-12-29 Apple Inc. Wavefront order to scan order synchronization
KR102280170B1 (ko) * 2013-10-04 2021-07-21 삼성전자주식회사 프레임의 특성에 따라 부하를 분배하는 방법 및 장치
US10091519B2 (en) * 2013-10-14 2018-10-02 Electronics And Telecommunications Research Institute Multilayer-based image encoding/decoding method and apparatus
US9621919B2 (en) * 2013-10-23 2017-04-11 Qualcomm Incorporated Multi-layer video file format designs
BR112016008992B1 (pt) * 2013-11-01 2023-04-18 Sony Corporation Dispositivos e métodos de transmissão e de recepção
US9736488B2 (en) * 2013-11-27 2017-08-15 Nxp Usa, Inc. Decoding for high efficiency video transcoding
EP3107297A4 (en) * 2014-02-10 2017-09-06 Nec Corporation Video encoding device, video encoding method, and program
US20150262404A1 (en) * 2014-03-13 2015-09-17 Huawei Technologies Co., Ltd. Screen Content And Mixed Content Coding
US10645404B2 (en) * 2014-03-24 2020-05-05 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
CN103957471B (zh) 2014-05-05 2017-07-14 华为技术有限公司 网络视频播放的方法和装置
US10257529B2 (en) 2014-06-30 2019-04-09 Intel Corporation Techniques for generating wave front groups for parallel processing a video frame by a video encoder
US10123028B2 (en) * 2014-09-17 2018-11-06 Mediatek Inc. Syntax parsing apparatus with multiple syntax parsing circuits for processing multiple image regions within same frame or processing multiple frames and related syntax parsing method
TWI511530B (zh) * 2014-12-09 2015-12-01 Univ Nat Kaohsiung 1St Univ Sc Distributed video coding system and decoder for distributed video coding system
US9854261B2 (en) * 2015-01-06 2017-12-26 Microsoft Technology Licensing, Llc. Detecting markers in an encoded video signal
GB2534409A (en) * 2015-01-23 2016-07-27 Sony Corp Data encoding and decoding
CN105992018B (zh) * 2015-02-11 2019-03-26 阿里巴巴集团控股有限公司 流媒体转码方法和装置
CN106210728B (zh) * 2015-04-10 2019-08-30 上海澜至半导体有限公司 用于视频解码的电路、方法和视频解码器
EP3276957A4 (en) * 2015-05-12 2018-02-28 Samsung Electronics Co., Ltd. Image encoding method and device for sample value compensation and image decoding method and device for sample value compensation
US20170134732A1 (en) * 2015-11-05 2017-05-11 Broadcom Corporation Systems and methods for digital media communication using syntax planes in hierarchical trees
JP6906940B2 (ja) 2015-12-28 2021-07-21 株式会社半導体エネルギー研究所 半導体装置
WO2017171438A1 (ko) * 2016-03-30 2017-10-05 한국전자통신연구원 픽쳐 분할 정보를 사용하는 비디오의 부호화 및 복호화를 위한 방법 및 장치
CN116170588A (zh) * 2016-03-30 2023-05-26 韩国电子通信研究院 使用画面划分信息对视频进行编码和解码的方法和设备
JP6336524B2 (ja) * 2016-07-25 2018-06-06 株式会社高速屋 データ圧縮符号化方法、その装置、及び、そのプログラム
KR20230079466A (ko) * 2017-04-11 2023-06-07 브이아이디 스케일, 인크. 면 연속성을 사용하는 360 도 비디오 코딩
US10452552B2 (en) * 2017-04-17 2019-10-22 Intel Corporation Memory-based dependency tracking and cache pre-fetch hardware for multi-resolution shading
US10506258B2 (en) * 2017-07-13 2019-12-10 Google Llc Coding video syntax elements using a context tree
US11418816B2 (en) 2017-09-20 2022-08-16 Vid Scale, Inc. Handling face discontinuities in 360-degree video coding
CN118101936B (zh) * 2018-04-19 2025-12-26 Oppo广东移动通信有限公司 用于处理图像的方法及其设备
CN112585970B (zh) 2018-06-21 2024-07-09 瑞典爱立信有限公司 灵活图块分区
EP3811624A1 (en) 2018-06-21 2021-04-28 Telefonaktiebolaget LM Ericsson (publ) Tile shuffling for 360 degree video decoding
CN112640455B (zh) 2018-06-21 2024-06-14 瑞典爱立信有限公司 视频编码中具有子图块的图块分区
CN110868594B (zh) 2018-08-28 2023-04-07 北京字节跳动网络技术有限公司 分割方法的冗余移除
EP3846474A4 (en) 2018-08-29 2022-06-08 Sharp Kabushiki Kaisha VIDEO DECODER AND VIDEO ENCODER
US10375416B1 (en) * 2018-09-05 2019-08-06 Tencent America LLC Segment types in video coding
FI3847817T3 (fi) * 2018-09-14 2024-06-26 Huawei Tech Co Ltd Viipalointi ja ruudukointi videokoodauksessa
CN112823525B (zh) 2018-10-02 2024-12-06 瑞典爱立信有限公司 基于图块组id对图片进行编码和解码
CN118450131A (zh) * 2018-10-31 2024-08-06 上海天荷电子信息有限公司 定长码单元含多个编码参数变长码的数据解码方法和装置
US10972755B2 (en) * 2018-12-03 2021-04-06 Mediatek Singapore Pte. Ltd. Method and system of NAL unit header structure for signaling new elements
EP3900345A4 (en) * 2018-12-20 2022-03-02 Telefonaktiebolaget LM Ericsson (publ) NORMATIVE RECOVERY POINT INDICATION
CN118945342A (zh) * 2018-12-20 2024-11-12 瑞典爱立信有限公司 视频编码和解码中改进的片地址信令
CN113366855B (zh) 2019-02-03 2025-06-24 北京字节跳动网络技术有限公司 基于条件的非对称四叉树分割
EP3928512A4 (en) * 2019-03-11 2022-06-22 Huawei Technologies Co., Ltd. STEP BY DECODE REFRESHMENT IN VIDEO ENCODING
CN113906744A (zh) * 2019-03-15 2022-01-07 北京达佳互联信息技术有限公司 视频编解码中无损编解码的信令
EP3942819A4 (en) * 2019-04-10 2022-05-25 Huawei Technologies Co., Ltd. SLICE ENTRY POINTS IN VIDEO ENCODING
CN116233436B (zh) * 2019-06-20 2025-03-21 腾讯美国有限责任公司 视频解码方法、设备和计算机可读存储介质
BR112021026875A2 (pt) * 2019-07-05 2022-02-22 Huawei Tech Co Ltd Extração de fluxo de bits de codificação de vídeo com sinalização de identificador
CN114731419B (zh) * 2019-09-05 2025-08-22 寰发股份有限公司 视频编解码方法和装置
CN114270834B (zh) * 2019-09-20 2025-05-02 Jvc建伍株式会社 图像转换装置以及图像解码装置
US11356685B2 (en) * 2019-09-23 2022-06-07 Qualcomm Incorproated Signaling number of sub-pictures in high-level syntax for video coding
BR112022005411A2 (pt) 2019-09-24 2022-06-21 Huawei Tech Co Ltd Sinalização de cabeçalho de imagem em codificação de vídeo
US12058335B2 (en) * 2019-11-22 2024-08-06 Lg Electronics Inc. Image coding method based on entry point-related information in video or image coding system
KR20220114562A (ko) * 2019-12-20 2022-08-17 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 비디오 스트림들에서 상이한 nal 유닛 타입들의 nal 유닛들을 혼합하기 위한 디코더, 인코더 및 방법들
CN119835408A (zh) 2019-12-24 2025-04-15 韩国电子通信研究院 图像编码/解码方法以及装置
EP4058935A4 (en) 2019-12-26 2023-01-18 ByteDance Inc. TECHNIQUES FOR IMPLEMENTING A DECODE ORDER IN AN ENCODED IMAGE
WO2021142370A1 (en) 2020-01-09 2021-07-15 Bytedance Inc. Constraints on value ranges in video bitstreams
US11405649B2 (en) * 2020-02-18 2022-08-02 Mediatek Inc. Specifying slice chunks of a slice within a tile
KR20260023606A (ko) * 2020-02-21 2026-02-20 두인 비전 컴퍼니 리미티드 비디오 코딩의 슬라이스 및 타일 파티셔닝
JP7460784B2 (ja) 2020-02-21 2024-04-02 北京字節跳動網絡技術有限公司 スライスおよびタイルを含むピクチャのコーディング
US11792432B2 (en) 2020-02-24 2023-10-17 Tencent America LLC Techniques for signaling and identifying access unit boundaries
WO2021197862A1 (en) * 2020-03-31 2021-10-07 Nokia Technologies Oy Merge candidate list for gradual decoding refresh
WO2021252465A1 (en) 2020-06-09 2021-12-16 Bytedance Inc. Subpicture sub-bitstream extraction process enhancements
CN119318141A (zh) * 2022-06-15 2025-01-14 Oppo广东移动通信有限公司 用于点云编解码的方法、系统和装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5471248A (en) * 1992-11-13 1995-11-28 National Semiconductor Corporation System for tile coding of moving images
EP0614317A3 (en) 1993-03-05 1995-01-25 Sony Corp Decoding video signals.
US5532744A (en) 1994-08-22 1996-07-02 Philips Electronics North America Corporation Method and apparatus for decoding digital video using parallel processing
JP2003174650A (ja) 2001-09-27 2003-06-20 Canon Inc 画像符号化装置、可変長符号化装置、制御装置およびそれらの方法
US6919826B1 (en) * 2003-12-19 2005-07-19 Sun Microsystems, Inc. Systems and methods for efficient and compact encoding
JP4374548B2 (ja) 2005-04-15 2009-12-02 ソニー株式会社 復号装置および方法、記録媒体、並びに、プログラム
US7595743B1 (en) 2005-10-26 2009-09-29 Lsi Corporation System and method for reducing storage requirements for content adaptive binary arithmetic coding
US8115804B2 (en) 2006-01-12 2012-02-14 Lg Electronics Inc. Processing multiview video
CN100471279C (zh) * 2006-02-13 2009-03-18 清华大学 一种基于上下文自适应变长解码的方法
KR100949975B1 (ko) 2006-03-30 2010-03-29 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
US7656326B2 (en) * 2006-06-08 2010-02-02 Via Technologies, Inc. Decoding of context adaptive binary arithmetic codes in computational core of programmable graphics processing unit
US8699583B2 (en) 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
JP5484902B2 (ja) 2006-07-13 2014-05-07 クゥアルコム・インコーポレイテッド サイクルを整列したフラグメントを使用する微細粒度スケーラビリティを備えた映像符号化
US8218908B2 (en) 2006-11-02 2012-07-10 Canon Kabushiki Kaisha Mixed content image compression with two edge data representations
JP5156088B2 (ja) 2007-03-23 2013-03-06 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
BR122018004903B1 (pt) 2007-04-12 2019-10-29 Dolby Int Ab ladrilhamento em codificação e decodificação de vídeo
US8619874B2 (en) 2007-04-13 2013-12-31 Apple Inc. Method and system for video encoding and decoding
KR20100014553A (ko) 2007-04-25 2010-02-10 엘지전자 주식회사 비디오 신호의 인코딩/디코딩 방법 및 장치
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8542748B2 (en) 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
BR122021000421B1 (pt) 2008-04-25 2022-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Referenciação de sub-fluxo flexível dentro de um fluxo de dados de transporte
US8311111B2 (en) 2008-09-11 2012-11-13 Google Inc. System and method for decoding using parallel processing
CA2757789A1 (en) 2008-10-30 2010-05-06 Gvbb Holdings S.A.R.L. Image encoding apparatus, image encoding method, and image encoding program
JP2010183305A (ja) 2009-02-05 2010-08-19 Sony Corp 信号処理装置及び信号処理方法
US9047217B2 (en) 2009-08-27 2015-06-02 Cleversafe, Inc. Nested distributed storage unit and applications thereof
FR2951896A1 (fr) 2009-10-23 2011-04-29 France Telecom Procede d'encapsulation de sous-flux de donnees, procede de desencapsulation et programmes d'ordinateur correspondants
US20120075436A1 (en) 2010-09-24 2012-03-29 Qualcomm Incorporated Coding stereo video data
US9313514B2 (en) 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization
IL210169A0 (en) 2010-12-22 2011-03-31 Yehuda Binder System and method for routing-based internet security
US9060174B2 (en) 2010-12-28 2015-06-16 Fish Dive, Inc. Method and system for selectively breaking prediction in video coding
US9215473B2 (en) 2011-01-26 2015-12-15 Qualcomm Incorporated Sub-slices in video coding
US9325999B2 (en) 2011-03-10 2016-04-26 Sharp Kabushiki Kaisha Video decoder for slices
US9077998B2 (en) 2011-11-04 2015-07-07 Qualcomm Incorporated Padding of segments in coded slice NAL units

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1#BROSS B ET AL: "WD4: Working Draft 4 of High-Efficiency Video Coding", 6. JCT-VC MEETING; 97. MPEG MEETING; 14-7-2011 - 22-7-2011; TORINO; (JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16 ); no. JCTVC-F803, 8 September 2011 (2011-09-08) *

Also Published As

Publication number Publication date
TW201342921A (zh) 2013-10-16
KR101654441B1 (ko) 2016-09-09
EP2774366B1 (en) 2021-09-08
IN2014CN03343A (zh) 2015-09-04
BR112014010330A2 (pt) 2017-04-18
KR20140093254A (ko) 2014-07-25
JP5837217B2 (ja) 2015-12-24
ES2892341T3 (es) 2022-02-03
BR112014010330B1 (pt) 2022-05-10
CN104160702A (zh) 2014-11-19
US9124895B2 (en) 2015-09-01
WO2013067311A1 (en) 2013-05-10
CN104160702B (zh) 2018-10-26
EP2774366A1 (en) 2014-09-10
JP2014535223A (ja) 2014-12-25
HUE056412T2 (hu) 2022-02-28
DK2774366T3 (da) 2021-10-04
US20130114735A1 (en) 2013-05-09

Similar Documents

Publication Publication Date Title
TWI511572B (zh) 具有包含多個編碼圖案區段之網路提取層之視訊寫碼
EP3123726B1 (en) Generic use of hevc sei messages for multi-layer codecs
TWI520575B (zh) 用於視訊寫碼之訊框封裝立體三維(3d)視訊資料之指示
JP6960945B2 (ja) 別々のファイルトラックにおけるシーケンス終了およびビットストリーム終了nalユニット
US9521393B2 (en) Non-nested SEI messages in video coding
CN105052156B (zh) Irap存取单元与位流切换及拼接
TWI478588B (zh) 在視訊寫碼中波前平行處理之使用的指示
US9794558B2 (en) Support of non-HEVC base layer in HEVC multi-layer extensions
US10264272B2 (en) Device and method for scalable coding of video information
TW201515440A (zh) 多層內容脈絡中之影像塊及波前處理
KR20160070769A (ko) 멀티-계층 비디오 코덱들에 대한 멀티-모드 추출의 지원
TW201404174A (zh) 片段及波前平行處理
CN105637884A (zh) 多层视频文件格式设计
HK1198236B (zh) 在视频译码中波前平行处理的使用的指示
HK1198403B (zh) 在视频译码中波前平行处理的子流