JP2017520940A - 階層符号化されたコンテンツを多重化するための方法および装置 - Google Patents

階層符号化されたコンテンツを多重化するための方法および装置 Download PDF

Info

Publication number
JP2017520940A
JP2017520940A JP2016546770A JP2016546770A JP2017520940A JP 2017520940 A JP2017520940 A JP 2017520940A JP 2016546770 A JP2016546770 A JP 2016546770A JP 2016546770 A JP2016546770 A JP 2016546770A JP 2017520940 A JP2017520940 A JP 2017520940A
Authority
JP
Japan
Prior art keywords
bitstream
content
time
video
base layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016546770A
Other languages
English (en)
Other versions
JP2017520940A5 (ja
Inventor
リカルド ジュリアン
リカルド ジュリアン
シャンペル メアリー−リュク
シャンペル メアリー−リュク
リャック ピンサック ジョアン
リャック ピンサック ジョアン
ゲーデ セリーヌ
ゲーデ セリーヌ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2017520940A publication Critical patent/JP2017520940A/ja
Publication of JP2017520940A5 publication Critical patent/JP2017520940A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • H04N21/26216Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints involving the channel capacity, e.g. network bandwidth
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/2625Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for delaying content or additional data distribution, e.g. because of an extended sport event
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4383Accessing a communication channel
    • H04N21/4384Accessing a communication channel involving operations to reduce the access time, e.g. fast-tuning for reducing channel switching latency
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/631Multimode Transmission, e.g. transmitting basic layers and enhancement layers of the content over different transmission paths or transmitting with different error corrections, different keys or with different transmission protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

階層符号化されたコンテンツが、固定容量ネットワークリンクを介して送信される場合、基底レイヤと増強レイヤにおいて同様の時間インスタンスにおいてビットレートピークが生じる可能性がある。帯域幅をより効率的に使用するのに、本原理は、基底レイヤビットストリームまたは増強レイヤビットストリームに遅延を追加すること、およびビットの「制限を超えた」部分を時間窓によってシフトすることなどの異なる方法を提案する。受信機側で、本原理は、ビットストリームにおいて追加された遅延を所与としてさえ、ユーザがチャネルを迅速に変更することを可能にする異なるチャネル変更機構を提供する。詳細には、復号器が、増強レイヤが利用可能になるのを待つ必要なしに、基底レイヤコンテンツをレンダリングすることを開始することが可能である。1つの実施形態において、基底レイヤコンテンツを復号することは、増強レイヤコンテンツと時間軸上で整合させるために減速される。

Description

本出願は、参照により全体が本明細書に組み込まれている2014年1月14日に出願した以下の欧州特許出願第14305052.4号の出願日の利益を主張するものである。
本発明は、多重化するための方法および装置に関し、より詳細には、階層符号化されたコンテンツに対応する複数のビットストリームを多重化するための方法および装置、ならびにそれを処理するための方法および装置に関する。
オーディオビデオ(AV)ストリームをトランスポートする際、1つの一般的な課題は、各AVサービスの品質が許容閾値を超えたままであることを確実にしながら、固定容量ネットワークリンク(固定帯域幅を有する)内で可能な限り多数のストリーム(チャネル)を送信することである。
固定ビットレート(CBR)ストリームを使用している場合、簡単な時分割多重化が、AVサービス間で利用可能な帯域幅を共有するのに、しばしば、使用される。これは、各サービスに対する帯域幅割当ての点で簡単であるが、これは、残念ながら、AV符号化の点で非効率である。実際、CBR符号化を使用している場合、シーケンスは、それらの複雑度にかかわらず同一のビットレートで符号化される。
可変ビットレート(VBR)符号化は、より低いビットレートが、より低い複雑度を有するシーケンスに関して使用されることを確実にしながら、より高い複雑度を有するシーケンス(例えば、より多くの詳細、より多くの動きを有するシーケンス)により高いビットレートを費やすことを可能にする。オーディオ/ビデオコンテンツの複雑度は、通常、そのオーディオ/ビデオコンテンツの符号化に所与の場合においてどれだけのビットレートが用いられるかを決定するために計算される。
いくつかのVBRストリームを、固定容量ネットワークリンク内でトランスポートすることができる。例えば、図1Aが、破線において示されるとおり、固定容量を有するネットワークリンクを介して一緒に送信される例示的なシーケンスHD1、HD2、HD3、およびHD4を示す。固定容量ネットワークリンク内でいくつかのVBRストリームをトランスポートする際、我々は、いくつかのVBRストリームの集約からもたらされるストリームが、ネットワークリンク容量を超えないことを確実にし、かつ利用可能な総帯域幅の最大限の活用を望む。この問題のよくあるソリューションは、統計的多重化である。
統計的多重化は、1つのストリームからの統計的に、より高い複雑度のシーンが、同一のネットワークリンクにおける別のストリームからのより低い複雑度のシーンと同時に生じることが可能であるという想定に基づく。したがって、複雑なシーンを符号化するために使用される追加の帯域幅は、それほど複雑でないシーンを同時に符号化することの帯域幅節約に由来することが可能である。統計的多重化は、すべてのAVストリームの複雑度を、通常、リアルタイムで評価し、次に、すべてのストリームの複雑度を考慮に入れて、ストリームのそれぞれの間で利用可能な総帯域幅を割り当てる。いくつかのストリームが帯域幅を求めて競合する場合、簡単な優先順位などのさらなる機構を、帯域幅共有に関して決定を行うのに使用することができる。
本発明は、従来技術の欠点のうちのいくつかを改善することを目指す。詳細には、いくつかの実施形態において、本発明は、多重化の後のビットレートピークを低減することを可能にする。本原理は、後段で説明されるとおり、第1のビットストリームおよび第2のビットストリームにアクセスするステップであって、この第1のビットストリームは、階層符号化されたコンテンツの基底レイヤおよびこの階層符号化されたコンテンツの増強レイヤの一方に対応し、この第2のビットストリームは、この階層符号化されたコンテンツのこの基底レイヤおよびこの階層符号化されたコンテンツのこの増強レイヤの他方に対応するステップ、この第2のビットストリームを第1の時間だけ遅延させるステップ、ならびにこの第1のビットストリームとこの遅延された第2のビットストリームを多重化するステップを含む、この第1のビットストリームおよびこの第2のビットストリームを処理する方法を提供する。
実施形態によれば、この方法は、ネットワークリンクの容量を超えるこの多重化されたストリームにおけるビットを決定するステップ、およびこの決定されたビットを第2の時間だけタイムシフトするステップをさらに含む。
実施形態によれば、この方法は、この階層符号化されたコンテンツに関する符号化パラメータに応じてこの第1の時間を決定するステップであって、この符号化パラメータは、GOP(Group of Picture)長およびGOP構造の少なくともいずれかを含むステップをさらに含む。変形形態によれば、この第1の時間は、GOPとともに変化する。
実施形態によれば、この方法は、この多重化されたストリーム、およびこの第1の時間を表す情報を送信するステップをさらに含む。
また、本原理は、これらのステップを実行するための装置も提供する。
実施形態によれば、この装置は、サーバーとビデオマルチプレクサのいずれかの内部に配置される。
実施形態によれば、この装置は、送信アンテナと、送信アンテナに対するインターフェースと、ビデオ符号器と、ビデオメモリと、ビデオサーバーと、ビデオカメラに対するインターフェースと、ビデオカメラとを備える。
また、本原理は、後段で説明されるとおり、第1のビットストリームを復号して、プログラムコンテンツの第1の表現にするステップ、この第1のビットストリームをこの復号するステップから遅延の後、第2のビットストリームを復号して、このプログラムコンテンツの第2の表現にするステップであって、この第1のビットストリームは、階層符号化されたコンテンツの基底レイヤおよびこの階層符号化されたコンテンツの増強レイヤの一方に対応し、この第2のビットストリームは、この階層符号化されたコンテンツのこの基底レイヤおよびこの階層符号化されたコンテンツのこの増強レイヤの他方に対応するステップ、ならびにこの第1の表現およびこの第2の表現に対応する信号を、レンダリングするために出力するステップを含む、この第1のビットストリームおよびこの第2のビットストリームを処理する方法も提供する。
実施形態によれば、この方法は、この第1のビットストリーム、この第2のビットストリーム、およびトランスポートストリームのうちの少なくとも1つの中で指定された速度より遅い速度でこの第1の表現をレンダリングするステップをさらに含む。
実施形態によれば、この方法は、この第1の表現のこのレンダリングとこの第2の表現のこのレンダリングが時間軸上で整合された後、この指定された速度でこの第1の表現をレンダリングするステップをさらに含む。
実施形態によれば、この方法は、この第1のビットストリーム、この第2のビットストリーム、およびトランスポートストリームからのこの遅延を表す情報を逆多重化するステップをさらに含む。
また、本原理は、これらのステップを実行するための装置も提供する。
実施形態によれば、この装置は、以下、すなわち、アンテナまたはアンテナに対するインターフェース、通信インターフェース、ビデオ復号器、ビデオメモリ、およびディスプレイのうちの1つまたは複数を備える。
また、本原理は、前述される方法による、第1のビットストリームおよび第2のビットストリームを処理するための命令が記憶されているコンピュータ可読記憶媒体も提供する。
固定容量ネットワークリンクを介して送信される4つの例示的なシーケンスを例示する図である。 固定容量ネットワークリンクを介して送信される階層符号化からの基底レイヤビットストリームおよび増強レイヤビットストリームを例示する図である。 本原理の実施形態による、基底レイヤビットストリーム(HD1)との関係で遅延Dだけシフトされた増強レイヤビットストリーム(UHD1)を例示する図である。 本原理の実施形態による、多重化を実行するための例示的な方法を示す流れ図である。 本原理の実施形態による、チャネル変更を実行するための例示的な方法を示す流れ図である。 本原理の実施形態による、チャネル変更を実行するための別の例示的な方法を示す流れ図である。 「リプレー」モードにおいて、図4に示される方法により、時間とともにユーザに何を提示することができるかを例示する図である。 「待機」モードにおいて、図4に示される方法により、時間とともにユーザに何を提示することができるかを例示する図である。 図5に示される方法により、時間とともにユーザに何を提示することができるかを例示する図である。 図5に示される方法により、基底レイヤレンダリングと増強レイヤレンダリングが整合されることが可能であることを示す図である。 基底レイヤと、増強レイヤとをそれぞれが有する2つのチャネルからのビットストリームを例示する図である。 本原理の実施形態による、ビットの「制限を超えた」部分が時間窓だけシフトされることを例示する図である。 本原理の実施形態による、例示的な送信システムを示すブロック図である。 本原理の実施形態による、例示的な受信システムを示すブロック図である。 本原理の実施形態による、別の例示的な受信システムを示すブロック図である。
同一のコンテンツの2つの表現をトランスポートする際、それらのそれぞれを別々に符号化するのではなく、階層符号化を使用して、それらを同一のネットワークリンク上で同時にトランスポートすることが有利である可能性がある。階層符号化では、基底レイヤ(BL)が基本品質を提供する一方で、相次ぐ増強レイヤ(EL)が、その品質をインクリメントに改良する。例えば、同一のコンテンツのHDバージョンとUltraHD(UHD)バージョンの両方が、基底レイヤがメディアのHDバージョンを包含し、増強レイヤがHDコンテンツからUltraHDコンテンツを再構築するのに必要とされる追加の情報を包含する1つの階層符号化されたコンテンツとして配信されることが可能である。
階層符号化において、基底レイヤおよび増強レイヤは、異なる品質を有する同一のコンテンツを表現するので、それらの符号化複雑度(および、したがって、符号化後の適切な品質のためのそれらのビットレート要求)は、通常は同様の傾向に従い、それらのビットレートは、通常は同様の時間インスタンスにおいてピークおよび低下を示す。そのようなビットレートピークは、異なるストリームからのピークおよび低下が統計的にまれにしか併存しないはずであると想定する統計的多重化に問題をもたらす可能性がある。詳細には、異なるビットストリームからの同時のビットレートピークが、総帯域幅使用の点で全体的なピークを生じさせる可能性があり、基底レイヤと増強レイヤの両方に関するビットレート要求は、このサービスに用いられるネットワークリンク容量を超える可能性がある。
例えば、図1Bに示されるとおり、同一のコンテンツのHDバージョンおよびUltraHDバージョンが、階層符号化を使用して符号化され、もたらされるBLビットストリームおよびELビットストリーム(HD1およびUHD1)が、破線において示されるとおり、固定容量を有するネットワークリンクを介して一緒に送信される。HD1とUHD1は、ほとんど同時にビットレートピークを有し、合計ビットレートは、そのビットレートピークの周辺で利用可能な最大帯域幅を超える。帯域幅オーバフローを回避するのに、より低いビットレートを、したがって、より低いサービス品質を、HD1ビットストリームまたはUHD1ビットストリームを再生成するのに使用することができる。
本原理において、我々は、コンテンツを階層符号化するために統計的多重化を採用する異なる方法を提案する。1つの実施形態において、我々は、異なる層からのビットレートピークがもはや同時に生じることなく、かつ全体的なピークの振幅を小さくすることができるように増強レイヤビットストリームまたは基底レイヤビットストリームに遅延を導入する。
以下の例において、我々は、階層符号化において1つだけの増強レイヤが存在し、かつ階層符号化は、ビデオコンテンツに適用されるものと想定することが可能である。本原理は、より多くの増強レイヤが存在する場合に適用することができ、かつ他のタイプの媒体に、例えば、オーディオコンテンツに適用することができる。本出願において、我々は、基底レイヤに対応する元のコンテンツまたは復号されたコンテンツを参照するのに「BLバージョン」または「BLコンテンツ」という用語を使用し、増強レイヤに対応する元のコンテンツまたは復号されたコンテンツを参照するのに「ELバージョン」または「ELコンテンツ」という用語を使用する。ELバージョンを復号するのに、基底レイヤが、通常、必要とされることに留意されたい。
図2は、増強レイヤビットストリーム(UHD1)が遅延Dだけシフトされる例を示す。遅延を導入することにより、図1Bに示される高いピークが、今や、Dの期間にわたって間隔を空けられた2つのより低いピークに変換される。
図3は、本原理の実施形態による多重化を実行するための例示的な方法300を示す。図3は、ステップ305において開始する。ステップ310において、それは、初期設定を実行し、例えば、遅延Dの期間を決定し、また、基底レイヤビットストリームまたは増強レイヤビットストリームが遅延されるべきかどうかを決定することも可能である。ステップ320において、例えば、階層コーダまたはサーバーから、基底レイヤビットストリームおよび増強レイヤビットストリームにアクセスする。ステップ330において、基底レイヤビットストリームまたは増強レイヤビットストリームが、Dの期間だけ遅延される。場合により、遅延された基底レイヤおよび増強レイヤからのビットストリームは、次に、ステップ340において多重化される。方法300は、ステップ399において終了する。
遅延Dは、固定とすることができ、符号化パラメータに基づいて、例えばMPEG標準により規定される、例えばGOP(Group of Picture)長およびGOP構造に基づいて決定することが可能である。1つの例において、遅延Dは、GOP長の期間の半分に設定することが可能である。また、GOPごとにDの値を変えることも可能である。1つの例において、Dは、符号化構造(Intraのみ、IPPPP、IBBB、またはランダムアクセス)および/またはGOP長に依存してGOPとともに変化することが可能である。別の例において、増強レイヤの品質が非常に低い場合、遅延は、増強レイヤビットレートピークが小さい可能性があるため、小さいことも可能である。我々がGOPごとの遅延Dを変える場合、復号器は、そのバッファサイズを決定するのにDの最大値(Dmax)を知る必要があり、Dmaxは、復号器に通知されなければならない。
いくつかのGOP構造、例えば、I0P8B4B2b1b3B6b5b7において、第1の画像(I0)と表示順序における第2の画像(b1)の受信の間に相当な遅延が存在する。データが復号の時点で尽きるシナリオを回避するのに、本出願において、我々は、GOPを復号することを開始する前に、GOP全体が必要とされるものと想定する。また、本原理を、復号が異なる時点で開始する場合に適用することもできる。
従来のMPEGビデオ符号化では、最大チャネル変更時間(ザップ時間としても知られる)は、通常、2つのGOP時間である。階層符号化に関して、増強レイヤは、基底レイヤが受信されて、復号された後にしか復号することができないので、増強レイヤに関するチャネル変更時間は、2つの最大GOP時間と等しく、最大GOP時間は、所与のレイヤを復号するのに必要とされる基底レイヤおよび増強レイヤの中で使用される最も大きいGOP時間である。BLとELが同一のGOPサイズを有する場合、チャネル変更時間は、2つのGOP時間であり、従来のMPEGビデオ符号化の場合と同一である。
方法300において示されるとおり、増強レイヤまたは基底レイヤに遅延を追加することができる。増強レイヤとの関係で基底レイヤに遅延が追加された(すなわち、増強レイヤが基底レイヤより前に送信される)場合、基底レイヤの第1のGOP全体(BL GOP)が受信されて、表示の準備ができている時点で、増強レイヤの第1のGOP全体(EL GOP)もまた、受信されていることが可能であり、レンダリングは、ELバージョンにて直接に開始することが可能である。増強レイヤにおいて、基底レイヤにおいてよりも長いGOPが使用される場合(これは、しばしば該当する)、第1のEL GOPは、第1のBL GOPが受信された際、完全に受信されていない可能性があり、基底レイヤが、最初にレンダリングされなければならず、増強レイヤに切り換えることは、後述するように基底レイヤとの関係で増強レイヤに遅延が追加されるシナリオに関して実行することができる。増強レイヤとの関係で基底レイヤに遅延を追加することの1つの利点は、ライブのイベントの場合を除いて、通常、問題ではない、追加の再生遅延が存在する可能性があるものの、増強レイヤに関するチャネル変更時間が低減されることである。
基底レイヤとの関係で増強レイヤに遅延が追加された場合、増強レイヤのチャネル変更時間は、(2つのGOP時間+D)になる。この追加の遅延Dは、チャネル変更時間をあまりにも長くする可能性がある。また、それは、ユーザが、所与のコンテンツに関して、ELバージョン(例えば、UltraHD)と比べて、BLバージョン(例えば、HD)上でなぜチャネルがはるかに迅速に変わるのかをユーザが理解するのを困難にする可能性もある。
チャネル変更時間を短縮するため、本原理は、例えば、方法400および500において後段でさらに説明されるとおり、ELコンテンツに関して異なるチャネル変更機構を提供する。
図4は、本原理の実施形態によるチャネル変更を実行するための例示的な方法400を示す。ステップ410において、ユーザが、新たなストリームへのチャネル変更を要求すると(時間T0において)、それは、その新たなストリームのBLビットストリーム、および、場合により、ELビットストリームを受信する。ステップ420において、1つの完全なBL GOPが受信されるまで(時間T1において)BL(およびEL)のバッファリングを続ける。ステップ430において、BLコンテンツを復号して、ディスプレイにレンダリングする。この時点までに行われることは、BLに関する典型的なチャネル変更であることに留意されたい。
時間T1において、我々はBLコンテンツを表示することができるが、ELビットストリームはDだけ遅延されているので、ELコンテンツを表示することはできない。表記を簡易にするため、レンダリングされるべき第iのフレームを表すのにFiを使用する。ステップ440において、1つの完全なEL GOPが受信されるまで(時間T2において)、ELビットストリームをバッファリングしながら、BLコンテンツの復号およびレンダリングを続ける。
時間T2において、復号器が、今や、ELコンテンツに関する第1のフレームF0を復号して、表示する準備ができているが、BLコンテンツに関する第1のフレームF0は、ELがD(D=T2−T1)だけ遅延されているので、時間T1において既にレンダリングされている。その2つのレイヤを再同期するのに、以下の2つのモードを使用することができる。すなわち、
「リプレー」モード:ディスプレイが、時間T2においてELバージョンに切り換わり、第1のELフレームは、再びF0となる。すなわち、コンテンツは、短い期間にわたって後戻りする、またはリプレーされているように見えることが可能である。
「待機」モード:ディスプレイが、表示フレームFn(BL)から表示フレームFn+1(EL)に切り換わるために時間T2において一時停止される。
時間T2において、ユーザは、例えば、ポップアップを介して、ELバージョンに切り換えるオプションを有する(ステップ450)。ユーザが決定を行っている間(例えば、ポップアップがユーザに提示される際)、BLバージョンが、依然として背景でレンダリングされることが可能である。ユーザがELバージョンに切り換えないことを選択した場合、ステップ460においてBL復号およびBLレンダリングが続く。そうではなく、ユーザがELバージョンに切り換えることを決定した場合、ステップ470において、復号器が、例えば、「リプレー」モードまたは「待機」モードを使用して、ELフレームの復号およびレンダリングを開始する。
方法400の利点は、それが簡単であることであり、ユーザが、BLバージョンを見ることによっていくつかのチャネルにわたって迅速に変えることを可能にし、彼には、ELバージョンだけを観るオプションが、それが実際に利用可能である場合にのみ提供される。1つの実施形態において、復号器が、そのようなオプションを表示するか、またはELバージョンが利用可能になると、常に自動的にELバージョンに切り換えるかを決定するようにユーザ設定を提案することが可能である。
ユーザがBLバージョンからELバージョンに切り換えた場合、品質は、相当に向上する可能性があり、ユーザは、品質の急な向上に気づく可能性がある。品質遷移を平滑にするのに、我々は、例えば、Yuriy Reznik、Eduardo Asbun、Zhifeng Chen、およびRahul Vanamによる「Method and apparatus for smooth stream switching in MPEG/3GPP−DASH」という名称の米国特許出願第13/868,968号明細書において説明される方法を使用して、BLからELへの漸進的「アップスケーリング」を使用することができる。
図6Aは、ユーザがチャネル変更を要求したことに応答して、方法400により時間とともにユーザに何を提示することができるかを示し、ユーザは、「リプレー」モードにおいてELバージョンに切り換えることを選択する。時間T0において、ユーザが、チャネル変更を要求する。時間T1において、完全なBL GOPが利用可能になり、それは、BLに関するフレームF0から開始して、BLコンテンツを復号して、レンダリングする。時間T2において、完全なEL GOPが利用可能になり、それは、ELストリームを復号する。バッファリングされたBLコンテンツも使用して、それは、F0のELバージョンをレンダリングする。全体として、レンダリングされるシーケンスは、F0(BL)、F1(BL)、F2(BL)、...、Fn(BL)、F0(EL)、F1(EL)、F2(EL)、...、Fn(EL)、Fn+1(EL)、Fn+2(EL)、...である。「リプレー」モードにおいて、フレーム0からフレームFnは、2回、最初にBLバージョンにおいて、次にELバージョンにおいて再生されることに留意されたい。
図6Bは、ユーザがチャネル変更を要求したことに応答して、方法400により時間とともにユーザに何を提示することができるかを示し、ユーザは、「待機」モードにおいてELバージョンに切り換えることを選択する。時間T0において、ユーザがチャネル変更を要求する。時間T1において、完全なBL GOPが利用可能になり、BLに関するフレームF0から開始して、BLコンテンツを復号およびレンダリングする。時間T2において、完全なEL GOPが利用可能になり、それは、ELストリームを復号する。時間T1から時間T2までの間に、フレームF0からFkがレンダリングされている。BLコンテンツのレンダリングは、時間T2において、ELコンテンツの第(k+1)のフレームが利用可能になるまで、期間にわたって一時停止される。全体として、レンダリングされるシーケンスは、F0(BL)、F1(BL)、F2(BL)、...、Fk(BL)、一時停止(D)、Fk+1(EL)、Fk+2(EL)、...である。「待機」モードにおいて、表示されるビデオは、BLバージョンがELバージョンに切り換わる際、一時停止を示すことが可能である。
図5は、本原理の別の実施形態によるチャネル変更を実行するための別の例示的な方法500を示す。一般性を失わず、我々は、BLのフレームレートとELのフレームレートが同一であるものと想定する。本原理は、フレームレートが異なる場合にも依然として適用することができる。
ステップ510において、基底レイヤビットストリームにアクセスする。ステップ520において、完全なBL GOPが受信された時点で復号が開始できるまでBLストリームをバッファリングする。ステップ530において、それは、増強レイヤビットストリームにアクセスする。それは、完全なEL GOPが受信された時点で復号が開始できるまで、ステップ540においてELストリームをバッファリングする。遅延Dの追加により、BLは、NフレームだけELに先行し、ここで、
である。
遅延Dにより、復号の開始時に、BLおよびELからの復号されたフレームが整合されていない可能性がある。BLコンテンツとELコンテンツのレンダリングを時間軸上で整合させるため、これらの実施形態は、それらが整合される前に、ステップ560においてm%だけBLのレンダリングを遅くすることを提案する。ビデオコンテンツは、通常、ビットストリームの中で再生のために指定されたフレームレートでレンダリングされることに留意されたい。しかし、方法500において、BLとELを整合させるために、BLのレンダリングは、その特定のフレームレートよりもm%遅い。したがって、BLコンテンツとELコンテンツの両方はある時刻T3において整合され、同一のフレームを同時に提供する。ステップ550において、BLコンテンツとELコンテンツが整合されていると決定した場合、ステップ570において、BLおよびELをビットストリームの中で指定された通常の速度でレンダリングする。方法500を使用して、復号器が、フレームフローを中断させることなしにBLからELにシームレスに切り換えることが可能である。
時間T3は、以下の式を使用して得ることができる。すなわち、
3=T1+D*100/m
である。mの選択が重要である。mが大きいほど、ユーザが、減速効果に気づく可能性がより高く、したがって、mを低く保つことが重要である。他方、mが小さいほど、BLとELが(時間T3において)整合されるのに長い時間を要する。復号器において決定されるべきトレードオフが存在する。そのような復号器設定は、ユーザに提示されることも、されないことも可能である。
レンダリング速度の低下が十分に低い(すなわち、小さい値のm)場合、ビデオ上の減速は、通常ユーザによってほとんど知覚可能ではない。しかし、オーディオストリームの減速は、より気づきやすく、我々は、その減速を隠すために音声のピッチを変更する何らかの既存のソリューションを使用することが可能である。
図6Cは、ユーザがチャネル変更を要求したことに応答して、方法500により、時間とともにユーザに何を提示することができるかを示す。時間T0において、ユーザが、チャネル変更を要求する。時間T1において、完全なBL GOPが利用可能になり、それは、BLに関するフレームF0から開始して、BLコンテンツを復号して、レンダリングする。時間T2において、完全なEL GOPが利用可能になり、それは、ELコンテンツを復号する。時間T3において、BLコンテンツの復号とELコンテンツの復号が、整合される。時間T1から時間T3までの間に、BLコンテンツが、ELが追いつくようにより遅い速度でレンダリングされ、ELストリームは、復号されるが、レンダリングされない。時間T3の後、BLコンテンツとELコンテンツの両方が、通常の速度でレンダリングされる。図6Aとは異なり、各フレームは、1回だけ再生され、BLからELへの切り換えは、シームレスである。
10個のフレームを例として使用して、図6Dは、BLレンダリングとELレンダリングが、方法500により、どのように整合されることが可能であるかを示す。減速係数に依存して、BLとELの両方を整合させるのにいくつかのGOPが必要とされる可能性があることに留意されたい。
前述したとおり、基底レイヤビットストリームまたは増強ビットストリームに遅延を追加することは、BLストリームとELストリームの同時のビットレートピークを減らすのに役立ち、このため、帯域幅をより効率的に使用する。しかし、それは、ときとして、帯域幅オーバフローを完全に解消するのに十分でない可能性がある。したがって、遅延Dを追加することに加えて、本原理は、ビットストリームを送信する際に時間窓Wを使用することも提案する。
時間窓がどのように機能するかを示すのに、図7Aは、基底レイヤと増強レイヤの間で遅延を使用しない2つのチャネルからのビットストリームを示す。図における各バーは、本出願における説明の目的で1つの時間単位に対応する。チャネル1に関するコンテンツが、2つのレイヤ、HD1およびUHD1を使用して符号化され、チャネル2に関するコンテンツもまた、2つのレイヤ、HD2およびUHD2を使用して符号化される。各チャネルは、チャネル1に関して時間=5周辺に、チャネル2に関して時間=12周辺に1つのピークを有する。図7Aに示されるとおり、集約されたビットストリームは、最大帯域幅を超える。
ビットストリームを固定帯域幅に合わせるために、帯域幅を超えるビットは、後方または前方に、時間窓W内でシフトされる。したがって、すべてのストリームは、ネットワークリンク容量内で送信することができる。表記を簡易にするため、我々は、帯域幅を超えるビットの部分を、「制限を超えた」部分(UHD2’)と表す。図7Aに示されるのと同一のビットストリーム上で機能する、時間窓を使用する1つの例が、図7Bに示される。図7Bに示されるとおり、t4からt=12までの制限を超えるすべてのデータが、窓(t=1からt=22まで)に広げられる。予備のビットレートが利用可能になるとすぐに、我々は、それらを「制限を超えた」データのために使用する。1つの実施形態において、システムは、現在の時間に関する開始時間と終了時間を含む、スライド窓のパラメータを決定する。時間窓は、時間ごとに異なることが可能であり、必ずしも現在の時間を中心としていない。
我々は、ビットストリームを多重化するために遅延Dおよび時間窓Wを導入することについて説明してきた。これら2つの機構は、別々に、または併せて使用することができる。遅延Dを導入する際、BLストリーム全体またはELストリーム全体が時間軸上でシフトされる。対照的に、時間窓Wを使用する際、我々は、最初に、すべてのビットストリームの全体的なビットレートが、許される最大ビットレートを超えるかどうかを決定し、「制限を超えた」部分が存在する場合、我々は、その「制限を超えた」部分を再分配する。さらに、前段で説明されるとおり、遅延Dが、符号化パラメータに基づいて決定される、または所定の値をとることが可能である。対照的に、時間シフトWは、時間窓を使用する場合、ビットレートピークがどこにあるか、およびどこで予備のビットレートが利用可能であるかに依存する。
時間窓が、ビットの「制限を超えた」部分をシフトするのに使用される場合、遅延を使用するために前段で説明されるチャネル変更機構(例えば、方法400および500)が、依然として適用可能である。詳細には、T3の値は、時間窓が単独で使用される場合にW(Dに取って代わり)を用いて、または遅延Dと時間窓の両方が使用される場合にW+D(Dに取って代わり)を用いて計算することができる。
遅延Dと時間窓の両方を使用してさえ、集約されたビットストリームは、ネットワークリンク容量を依然として超える可能性がある。この場合、同一のネットワークリンク内の1つまたはいくつかのストリームのビットレートを低減して、ビットストリームをネットワークリンクに適合させることが可能であり、または、さらに1つまたは複数のビットストリームをドロップする必要があるかもしれない。
本原理は、帯域幅をより効率的に使用するように、基底レイヤビットストリームまたは増強レイヤビットストリームに遅延を追加すること、および時間窓内でビットの「制限を超えた」部分をシフトすることなどの、異なる方法を提案する。特に、我々の方法は、統計的多重化の通常の想定を満足させない、階層符号化されたコンテンツを送信するためにうまく機能する。
受信機側で、本原理は、さらにビットストリームにおいて追加された遅延があれば、ユーザがチャネルを迅速に変更することを可能にする異なるチャネル変更機構を提供する。詳細には、復号器が、ELが利用可能になるのを待つ必要なしに、BLコンテンツをレンダリングすることを開始することが可能である。有利には、これは、ユーザが、彼がより長い時間にわたって観ることを望む何かを彼が目にするまで、多くのチャネルの間でチャネルを迅速に変更することを可能にする。また、本原理は、彼がある期間ビデオを観た後、ELバージョンに切り換えることを望むかどうかを決定するのに使用するためのオプションも提供する。
上記において、階層符号化のために使用することができる様々な方法について説明した。本原理は、例えば、H.264 SVCまたはSHVCとすることもできるが、これらには限定されない標準に準拠する、スケーラブルビデオ符号化に適用することも可能である。多重化方法およびチャネル変更機構は、MPEG−2トランスポート、MMT(MPEGメディアトランスポート)プロトコル、またはATSC(Advanced Television Systems Committee)トランスポートプロトコルなどの任意のトランスポートプロトコルと一緒に使用することができる。
図8は、例示的な送信システム800を示す。例えば、オーディオデータおよびビデオデータであるが、これには限定されない入力データが、メディア符号器810において符号化される。入力データは、カメラ、カムコーダからのものとすること、またはオーディオデータおよびビデオデータにアクセスを有するサーバーから受信することができる。符号化されたデータは、マルチプレクサ820において多重化され、送信機840において送信される。例えば、方法300において示されるとおり遅延を追加し、時間窓を使用する、本原理による多重化機構は、マルチプレクサ820に配置された遅延モジュール(830)において使用することができる。また、遅延モジュール830は、メディア符号器810に配置されること、またはメディア符号器810とマルチプレクサ820の間に別個のモジュールとして置かれることも可能である。送信システムは、帯域幅が高価なリソースである典型的なブロードキャストTV環境において使用することができ、またはオーディオビジュアルサービスを提供するモバイルデバイスにおいて使用することができる。特定の実施形態によれば、送信システム(または装置)は、サーバーとビデオマルチプレクサのうちのいずれかの内部に配置される。特定の実施形態によれば、送信システム(または装置)は、以下、すなわち、送信アンテナ、送信アンテナに対するインターフェース、ビデオ符号器、ビデオメモリ、ビデオサーバー、ビデオカメラに対するインターフェース、およびビデオカメラのうちの1つまたは複数を備える。
図9は、例示的な受信システム900を示す。システム900の入力データは、トランスポートビットストリーム、例えば、システム800の出力であることが可能である。データは、受信機910において受信され、デマルチプレクサ920において逆多重化され、メディア復号器930において復号され、次に、メディアレンダリングモジュール940において再生のためにレンダリングされる。メディアレンダリングモジュールは、別のモジュールとして実現することができ、またはメディア復号器930の一部とすることができる。方法400および500などのチャネル変更機構は、デマルチプレクサ920またはメディア復号器930において実現することができる。
図10は、ポータブルメディアデバイス(例えば、モバイル電話)、ゲームデバイス、セットトップボックス、TVセット、タブレット、およびコンピュータの内部で実現することができる別の例示的な受信システム1000を示す。概略において、図10のビデオ受信機システムにおいて、ブロードキャストプログラムコンテンツを表現するオーディオデータ、ビデオデータ、および関連するデータを伝送する信号で変調されたブロードキャスト搬送波が、アンテナ10によって受信され、ユニット13によって処理される。もたらされるディジタル出力信号が、復調器15によって復調される。ユニット15からの復調された出力が、復号器17によってトレリス復調され、バイト長データセグメントにマップされ、逆インターリーブされ、リードソロモン誤り訂正される。ユニット17からの出力データは、多重化オーディオ成分、ビデオ成分、およびデータ成分を表すプログラムを包含するMPEG対応のトランスポートデータストリーム、例えば、MMTトランスポートストリームの形態である。ユニット17からのトランスポートストリームは、ユニット22によって逆多重化されてオーディオ成分、ビデオ成分、およびデータ成分にされ、これらが、復号器100のその他の要素によってさらに処理される。
復号器(100)が、ユーザがチャネル変更を要求すると、方法400および500において説明されるものなどの、本原理によりチャネル変更を実行することが可能である。1つのモードにおいて、復号器100は、それぞれユニット50および55の上で表示およびオーディオ再現のためにMPEG復号されたデータを提供する。別のモードにおいて、ユニット17からのトランスポートストリームが、復号器100によって処理されて、記憶デバイス90を介して記憶媒体105上に記憶するためにMPEG対応のデータストリームを提供する。
ユーザが、閲覧のために、リモートコントロールユニット70を使用することによって、TVチャネル、またはプログラムガイドなどのスクリーン上のメニューを選択する。プロセッサ60が、インターフェース65を介してリモートコントロールユニット70から提供された選択情報を使用して、閲覧のために所望されるプログラムチャネルを受信するように図10の要素を適切に構成する。プロセッサ60は、プロセッサ62と、コントローラ64とを備える。ユニット62が、プログラムガイドと、システム情報とを含むプログラム特有の情報を処理し(すなわち、構文解析し、揃え、組み立て)、コントローラ64が、復号器100を操作する際に要求される残りの制御機能を実行する。ユニット60の機能は、図10に示されるとおり別々の要素62および64として実現することができるものの、それらは、代わりとして、単一のプロセッサ内に実現されてもよい。例えば、ユニット62および64の機能は、マイクロプロセッサのプログラミングされた命令内に組み込まれてもよい。プロセッサ60は、入力信号フォーマットおよび符号化タイプを復調し、復号するようにプロセッサ13、復調器15、復号器17、および復号器システム100を構成する。
図10を詳細に検討すると、アンテナ10によって受信されたオーディオデータ、ビデオデータ、および関連するデータを表すプログラムを伝送する信号で変調された搬送波が、入力プロセッサ13によってディジタル形態に変換され、処理される。プロセッサ13は、入力信号を、さらなる処理に適したより低い周波数の帯域にダウンコンバートするための無線周波数(RF)チューナ段および中間周波数(IR)ミクサー段および増幅段を含む。
例示的な目的で、ビデオ受信機ユーザが、リモートコントロールユニット70を使用して閲覧のためにサブチャネル(SC)を選択するものと想定する。プロセッサ60が、インターフェース65を介してリモートコントロールユニット70から提供された選択情報を使用して、選択されたサブチャネルSCに対応する物理チャネルを受信するように復号器100の要素を適切に構成する。
プロセッサ22に提供される出力データは、いくつかのサブチャネルを介して配信される多くのプログラムに関するプログラムチャネルコンテンツおよびプログラム特有の情報を包含するトランスポートデータストリームの形態になっている。
プロセッサ22が、復号器17によって提供される入来のパケットのパケット識別子(PID)を、サブチャネルSC上で送信されているビデオストリーム、オーディオストリーム、およびサブピクチャストリームのPID値とマッチングする。これらのPID値は、プロセッサ60によってユニット22内部の制御レジスタの中にあらかじめロードされる。プロセッサ22は、サブチャネルSC上で送信されるプログラムを構成するパケットをキャプチャし、それらを、ビデオ復号器25、オーディオ復号器35にそれぞれ出力するためのMPEG対応のビデオストリーム、オーディオストリームに形成する。ビデオストリームおよびオーディオストリームは、選択されたサブチャネルSCプログラムコンテンツを表現する圧縮されたビデオデータおよびオーディオデータを包含する。
復号器25が、ユニット22からのMPEG対応のパケット化されたビデオデータを復号し、伸張して、ピクセルデータを表す伸張されたプログラムを、表示のためにデバイス50に提供する。同様に、オーディオプロセッサ35が、ユニット22からのパケット化されたオーディオデータを復号し、関連する伸張されたビデオデータと同期された、復号されたオーディオデータを、オーディオ再現のためにデバイス55に提供する。
図10のシステムの記憶モードにおいて、ユニット17からの出力データは、記憶のためにMPEG対応のデータストリームを提供するように復号器100によって処理される。このモードにおいて、プログラムは、リモートユニット70およびインターフェース65を介してユーザによって記憶のために選択される。
プロセッサ60が、プロセッサ22と連携して、選択されたプログラムのパケット化されたコンテンツデータと、関連するプログラム特有の情報とを包含する合成のMPEG対応のデータストリームを形成する。合成のデータストリームは、記憶インターフェース95に出力される。記憶インターフェース95は、データにおけるギャップおよびビットレート変動を小さくするように合成のデータストリームをバッファリングする。もたらされるバッファリングされたデータは、媒体105上に記憶するのに適するように記憶デバイス90によって処理される。記憶デバイス90は、チャネル符号化、インターリーブ、およびリードソロモン符号化などの知られている誤り符号化技法を使用してインターフェース95からのバッファリングされたデータストリームを符号化して、記憶するのに適した符号化されたデータストリームを生成する。ユニット90は、凝縮された(condensed)プログラム特有の情報を組み込んだ、もたらされる符号化されたデータストリームを媒体105上に記憶する。
特定の実施形態によれば、受信システム(または装置)は、以下、すなわち、アンテナまたはアンテナに対するインターフェース、通信インターフェース(例えば、有線リンクもしくは有線ネットワークまたはワイヤレスリンクもしくはワイヤレスネットワークからの)、ビデオ復号器、ビデオメモリ、およびディスプレイのうちの1つまたは複数を備える。
本明細書で説明される実現形態は、例えば、方法またはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号において実現することができる。実現の単一の形態(例えば、方法としてだけ説明される)の脈絡においてのみ説明される場合でも、説明される特徴の実現形態は、他の形態(例えば、装置またはプログラム)において実現されることも可能である。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアにおいて実現することができる。方法は、例えばコンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイスを含む処理デバイスを一般に参照する、例えばプロセッサなどの、例えば装置において実現することができる。また、プロセッサは、例えば、コンピュータ、セル電話、ポータブル/携帯情報端末(「PDA」)、およびエンドユーザ間の情報の通信を円滑にする他のデバイスなどの通信デバイスも含む。
第1のビットストリームおよび第2のビットストリームを処理する方法の特定の実施形態によれば、第1のビットストリームおよび第2のビットストリームが、送信アンテナと、送信アンテナに対するインターフェースと、ビデオ符号器と、ビデオメモリと、ビデオサーバーと、ビデオカメラに対するインターフェースと、ビデオカメラとを備えるセットに属するソースからアクセスされる。この方法の変形形態によれば、多重化された第1のビットストリームと第2のビットストリームが、送信アンテナと、送信アンテナに対するインターフェースと、通信インターフェースと、ビデオメモリと、ビデオサーバーインターフェースと、クライアントデバイスとを備えるセットに属する出力先に送られる。
第1のビットストリームおよび第2のビットストリームの復号を含む方法の特定の実施形態によれば、第1のビットストリームおよび第2のビットストリームは、復号より前に、受信アンテナと、受信アンテナに対するインターフェースと、通信インターフェースと、ビデオメモリとを備えるセットに属するソースからアクセスされる。この方法の変形形態によれば、レンダリングのための第1の表現および第2の表現に対応する信号が、ビデオ復号器と、ビデオメモリと、ディスプレイとを備えるセットに属する出力先に出力される。
本原理の「1つの実施形態」または「実施形態」または「1つの実現形態」または「実現形態」、ならびにそれらの変更形態について述べることは、その実施形態に関連して説明される特定の特徴、構造、特性などが、本原理の少なくとも1つの実施形態に含まれることを意味する。このため、本明細書全体の様々な箇所において出現する「1つの実施形態において」または「実施形態において」または「1つの実現形態において」または「実現形態において」という句、ならびに他の任意の変更形態の出現は、必ずしもすべて同一の実施形態を参照しているわけではない。
さらに、本出願、またはその特許請求の範囲は、様々な情報を「決定すること」について述べることが可能である。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を取り出すことのうちの1つまたは複数を含むことが可能である。
さらに、本出願またはその特許請求の範囲は、様々な情報に「アクセスすること」について述べることが可能である。情報にアクセスすることは、例えば、情報を受信すること、情報を(例えば、メモリから)取り出すこと、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの1つまたは複数を含むことが可能である。
さらに、本出願またはその特許請求の範囲は、様々な情報を「受信すること」について述べることが可能である。受信することは、「アクセスすること」と同様に、幅広い用語であるように意図されている。情報を受信することは、例えば、情報にアクセスすること、または情報を(例えば、メモリから)取り出すことのうちの1つまたは複数を含むことが可能である。さらに、「受信すること」は、典型的には、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することなどの動作中に1つの方法または別の方法で関与する。
当業者には明白なとおり、実現形態は、例えば、記憶される、または送信することができる情報を伝送するようにフォーマットされた様々な信号を生成することが可能である。情報は、例えば、方法を実行するための命令、または説明される実現形態のうちの1つによって生成されるデータを含むことが可能である。例えば、信号は、説明される実施形態のビットストリームを伝送するようにフォーマットすることができる。そのような信号は、例えば、電磁波(例えば、スペクトルの無線周波数部分を使用する)として、またはベースバンド信号としてフォーマットすることができる。このフォーマットすることは、例えば、データストリームを符号化すること、およびその符号化されたデータストリームで搬送波を変調することを含むことが可能である。信号が伝送する情報は、例えば、アナログ情報またはディジタル情報であることが可能である。信号は、知られているとおり、様々な異なる有線リンクまたはワイヤレスリンクを介して送信することができる。信号は、プロセッサ可読媒体上に記憶することができる。

Claims (15)

  1. 第1のビットストリームおよび第2のビットストリームを処理する方法であって、
    前記第1のビットストリームおよび前記第2のビットストリームにアクセスするステップ(320)であって、前記第1のビットストリームは、階層符号化されたコンテンツの基底レイヤおよび前記階層符号化されたコンテンツの増強レイヤの一方に対応し、前記第2のビットストリームは、前記階層符号化されたコンテンツの前記基底レイヤおよび前記階層符号化されたコンテンツの前記増強レイヤの他方に対応する、前記ステップと、
    前記第2のビットストリームを第1の時間だけ遅延させるステップ(330)と、
    前記第1のビットストリームと前記遅延された第2のビットストリームとを多重化するステップ(340)と、
    を含む、前記方法。
  2. ネットワークリンクの容量を超える前記多重化されたストリームにおけるビットを決定するステップと、
    前記決定されたビットを第2の時間だけタイムシフトするステップと、
    をさらに含む、請求項1に記載の方法。
  3. 前記階層符号化されたコンテンツに関する符号化パラメータに応じて前記第1の時間を決定するステップであって、前記符号化パラメータは、GOP(Group of Picture)長とGOP構造の少なくともいずれかを含む、前記ステップをさらに含む、請求項1または2に記載の方法。
  4. 前記第1の時間は、GOPとともに変化する、請求項3に記載の方法。
  5. 前記多重化されたストリーム、および前記第1の時間を表す情報を送信するステップをさらに含む、請求項1乃至4のいずれか一項に記載の方法。
  6. 第1のビットストリームおよび第2のビットストリームを処理する方法であって、
    前記第1のビットストリームを、プログラムコンテンツの第1の表現に復号するステップ(430、570)と、
    前記第1のビットストリームを前記復号するステップからの遅延の後、前記第2のビットストリームを、前記プログラムコンテンツの第2の表現に復号するステップ(470、570)であって、前記第1のビットストリームは、階層符号化されたコンテンツの基底レイヤおよび前記階層符号化されたコンテンツの増強レイヤの一方に対応し、前記第2のビットストリームは、前記階層符号化されたコンテンツの前記基底レイヤおよび前記階層符号化されたコンテンツの前記増強レイヤの他方に対応する、前記ステップと、
    前記第1の表現および前記第2の表現に対応する信号を、レンダリングするために出力するステップ(470、570)と、
    を含む、前記方法。
  7. 前記第1のビットストリーム、前記第2のビットストリーム、およびトランスポートストリームのうちの少なくとも1つにおいて指定された速度より遅い速度で前記第1の表現をレンダリングするステップ(560)をさらに含む、請求項6に記載の方法。
  8. 前記第1の表現の前記レンダリングと前記第2の表現の前記レンダリングが時間軸上で整合された後、前記指定された速度で前記第1の表現をレンダリングするステップ(570)をさらに含む、請求項7に記載の方法。
  9. 前記第1のビットストリーム、前記第2のビットストリーム、およびトランスポートストリームからの前記遅延を表す情報を逆多重化するステップをさらに含む、請求項6に記載の方法。
  10. 請求項1乃至9のいずれかにより第1のビットストリームおよび第2のビットストリームを処理するための装置。
  11. サーバーおよびビデオマルチプレクサのいずれかの内部に配置される、請求項10に記載の装置。
  12. 送信アンテナ、送信アンテナに対するインターフェース、ビデオ符号器、ビデオメモリ、ビデオサーバー、ビデオカメラに対するインターフェース、およびビデオカメラのうちの1つまたは複数を備える、請求項10または11に記載の装置。
  13. ポータブルメディアデバイス、モバイル電話、ゲームデバイス、セットトップボックス、TVセット、タブレット、ラップトップ、および集積回路のうちの1つの内部に配置される、請求項10に記載の装置。
  14. アンテナまたはアンテナに対するインターフェース、通信インターフェース、ビデオ復号器、ビデオメモリ、およびディスプレイのうちの1つまたは複数を備える、請求項13に記載の装置。
  15. 請求項1乃至9のいずれかにより第1のビットストリームおよび第2のビットストリームを処理するための命令を記憶している、コンピュータ可読記憶媒体。
JP2016546770A 2014-01-14 2015-01-13 階層符号化されたコンテンツを多重化するための方法および装置 Pending JP2017520940A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14305052.4 2014-01-14
EP14305052.4A EP2894860A1 (en) 2014-01-14 2014-01-14 Method and apparatus for multiplexing layered coded contents
PCT/IB2015/000018 WO2015107409A1 (en) 2014-01-14 2015-01-13 Method and apparatus for multiplexing layered coded contents

Publications (2)

Publication Number Publication Date
JP2017520940A true JP2017520940A (ja) 2017-07-27
JP2017520940A5 JP2017520940A5 (ja) 2018-02-15

Family

ID=50023503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016546770A Pending JP2017520940A (ja) 2014-01-14 2015-01-13 階層符号化されたコンテンツを多重化するための方法および装置

Country Status (6)

Country Link
US (1) US20160337671A1 (ja)
EP (2) EP2894860A1 (ja)
JP (1) JP2017520940A (ja)
KR (1) KR20160108342A (ja)
CN (1) CN106416268A (ja)
WO (1) WO2015107409A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020171008A (ja) * 2019-04-02 2020-10-15 エヌビーシーユニバーサル メディア リミテッド ライアビリティ カンパニー 高速チャネル変更のためのシステム及び方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015146378A1 (ja) 2014-03-24 2015-10-01 株式会社 東芝 多重化装置、受信装置、多重化方法及び遅延調整方法
US9689976B2 (en) 2014-12-19 2017-06-27 Xidrone Systems, Inc. Deterent for unmanned aerial systems
KR101654898B1 (ko) * 2015-04-15 2016-09-07 고려대학교 산학협력단 적응형 스트리밍 서비스를 수신하는 방법
GB2538997A (en) 2015-06-03 2016-12-07 Nokia Technologies Oy A method, an apparatus, a computer program for video coding
EP3244623A1 (en) 2016-05-13 2017-11-15 Thomson Licensing Method and apparatus for bandwidth optimization using staggercast
JP6823540B2 (ja) * 2017-05-29 2021-02-03 日本電信電話株式会社 映像処理方法、映像処理システム及び映像送信装置
CN116155875A (zh) * 2021-11-22 2023-05-23 华为技术有限公司 一种数据传输的方法及通信装置
CN114786017A (zh) * 2022-04-06 2022-07-22 广州市香港科大霍英东研究院 基于无线摄像头的视频流传输方法及无线摄像头

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000102017A (ja) * 1998-09-24 2000-04-07 Mitsubishi Electric Corp 画像符号化装置および画像符号化方式
JP2000261809A (ja) * 1999-03-05 2000-09-22 Kdd Corp 画像特徴に応じた画像符号化装置
JP2002010251A (ja) * 2000-06-19 2002-01-11 Matsushita Electric Ind Co Ltd 映像信号符号化装置および映像信号復号化装置
JP2003032689A (ja) * 2001-07-18 2003-01-31 Sharp Corp 画像符号化装置、画像復号化装置及び動画像伝送システム
JP2007124155A (ja) * 2005-10-26 2007-05-17 Alpine Electronics Inc 車載動画像圧縮装置及びドライブレコーダ
WO2008129649A1 (ja) * 2007-04-13 2008-10-30 Pioneer Corporation 受信装置、受信方法、受信プログラムおよびコンピュータに読み取り可能な記録媒体
JP2009302704A (ja) * 2008-06-11 2009-12-24 Panasonic Corp デコード装置、情報処理システムおよび動画像記録再生システム
JP2010087827A (ja) * 2008-09-30 2010-04-15 Sharp Corp 送信装置、受信装置、送信方法、受信方法、プログラム、及び、記録媒体
JP2010093410A (ja) * 2008-10-06 2010-04-22 Alaxala Networks Corp パケット中継装置
WO2010054719A1 (en) * 2008-11-12 2010-05-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Reducing a tune-in delay into a scalable encoded data stream
JP2012529205A (ja) * 2009-06-05 2012-11-15 ▲ホア▼▲ウェイ▼技術有限公司 チャネル切替を処理するための方法、システム、および関連デバイス
US20120320911A1 (en) * 2011-06-14 2012-12-20 University-Industry Cooperation Group Of Kyung Hee University Method and apparatus for transmitting data packet of multimedia service using media characteristics

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI113124B (fi) * 1999-04-29 2004-02-27 Nokia Corp Tiedonsiirto
JP2003308277A (ja) * 2002-04-17 2003-10-31 Sony Corp 端末装置、データ送信装置、データ送受信システム及びデータ送受信方法
WO2005106850A1 (ja) * 2004-04-28 2005-11-10 Matsushita Electric Industrial Co., Ltd. 階層符号化装置および階層符号化方法
BRPI0510329A8 (pt) * 2004-05-03 2018-05-22 Thomson Res Funding Corporation Aparelho e método para habilitar uma mudança de canal
JP2006304272A (ja) * 2005-03-25 2006-11-02 Matsushita Electric Ind Co Ltd 送信装置
US8044592B2 (en) * 2008-05-22 2011-10-25 Tony Chou Lamp heat dissipating structure
US20100118938A1 (en) * 2008-11-12 2010-05-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder and method for generating a stream of data
US9118939B2 (en) * 2010-12-20 2015-08-25 Arris Technology, Inc. SVC-to-AVC rewriter with open-loop statistical multiplexer
CN102629893B (zh) * 2012-03-30 2014-07-02 清华大学 多描述分层编码的信息发送方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000102017A (ja) * 1998-09-24 2000-04-07 Mitsubishi Electric Corp 画像符号化装置および画像符号化方式
JP2000261809A (ja) * 1999-03-05 2000-09-22 Kdd Corp 画像特徴に応じた画像符号化装置
JP2002010251A (ja) * 2000-06-19 2002-01-11 Matsushita Electric Ind Co Ltd 映像信号符号化装置および映像信号復号化装置
JP2003032689A (ja) * 2001-07-18 2003-01-31 Sharp Corp 画像符号化装置、画像復号化装置及び動画像伝送システム
JP2007124155A (ja) * 2005-10-26 2007-05-17 Alpine Electronics Inc 車載動画像圧縮装置及びドライブレコーダ
WO2008129649A1 (ja) * 2007-04-13 2008-10-30 Pioneer Corporation 受信装置、受信方法、受信プログラムおよびコンピュータに読み取り可能な記録媒体
JP2009302704A (ja) * 2008-06-11 2009-12-24 Panasonic Corp デコード装置、情報処理システムおよび動画像記録再生システム
JP2010087827A (ja) * 2008-09-30 2010-04-15 Sharp Corp 送信装置、受信装置、送信方法、受信方法、プログラム、及び、記録媒体
JP2010093410A (ja) * 2008-10-06 2010-04-22 Alaxala Networks Corp パケット中継装置
WO2010054719A1 (en) * 2008-11-12 2010-05-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Reducing a tune-in delay into a scalable encoded data stream
JP2012529205A (ja) * 2009-06-05 2012-11-15 ▲ホア▼▲ウェイ▼技術有限公司 チャネル切替を処理するための方法、システム、および関連デバイス
US20120320911A1 (en) * 2011-06-14 2012-12-20 University-Industry Cooperation Group Of Kyung Hee University Method and apparatus for transmitting data packet of multimedia service using media characteristics

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAOKANG YANG; NAM LING: "STATISTICAL MULTIPLEXING BASED ON MPEG-4 FINE GRANULARITY SCALABILITY CODING", THE JOURNAL OF VLSI SIGNAL PROCESSING, vol. VOL:42 NR:1, JPN5016013336, 1 January 2006 (2006-01-01), pages 69 - 77, ISSN: 0004073749 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020171008A (ja) * 2019-04-02 2020-10-15 エヌビーシーユニバーサル メディア リミテッド ライアビリティ カンパニー 高速チャネル変更のためのシステム及び方法

Also Published As

Publication number Publication date
US20160337671A1 (en) 2016-11-17
CN106416268A (zh) 2017-02-15
EP3095243A1 (en) 2016-11-23
EP2894860A1 (en) 2015-07-15
WO2015107409A1 (en) 2015-07-23
KR20160108342A (ko) 2016-09-19

Similar Documents

Publication Publication Date Title
JP2017520940A (ja) 階層符号化されたコンテンツを多重化するための方法および装置
KR101011612B1 (ko) 무선장치에서 멀티―프로그램 뷰잉
EP2452481B1 (en) System and method of transmitting content from a mobile device to a wireless display
US8085855B2 (en) Video quality adaptation based upon scenery
US7430222B2 (en) Media stream splicer
CN1717935B (zh) 根据请求进行ⅰ图像插入
JP5400165B2 (ja) 高速チャネル変更
US20090293093A1 (en) Content server, information processing apparatus, network device, content distribution method, information processing method, and content distribution system
JP2017520940A5 (ja) レイヤードコード化コンテンツを多重化する方法および装置
US20140223502A1 (en) Method of Operating an IP Client
US20160127728A1 (en) Video compression apparatus, video playback apparatus and video delivery system
US20120266198A1 (en) Fast Binding of a Cloud Based Streaming Server Structure
CN101188758A (zh) 图像信息传输系统和图像信息传输方法
CN101321275A (zh) 视频流的处理系统和处理方法
CN102474653A (zh) 用于可配置的分组流处理延迟的系统和方法
US20110088069A1 (en) Network device, information processing apparatus, stream switching method, information processing method, program, and content distribution system
JP5592716B2 (ja) 映像送信装置
JPWO2009017229A1 (ja) 動画像データ配信システム、その方法及びそのプログラム
KR101992533B1 (ko) 실시간 iptv 방송에서의 채널 전환 시스템
JP6501503B2 (ja) 電子機器及び信号処理方法
WO2010110241A1 (ja) コンテンツ受信装置、コンテンツ配信装置、コンテンツ配信システム、コンテンツ受信方法およびプログラム
KR100713363B1 (ko) 이동통신 시스템에서 엠펙 전송 장치 및 방법
JP2023531910A (ja) ユーザインターフェースを提供するシステム、装置、及び方法
Murithi IP multicast in digital television transmission infrastructure
JP2013255208A (ja) 映像符号化装置、映像符号化方法及び映像符号化プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20161202

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20161202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181012

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190710