WO2019139099A1 - 送信装置、送信方法、受信装置および受信方法 - Google Patents
送信装置、送信方法、受信装置および受信方法 Download PDFInfo
- Publication number
- WO2019139099A1 WO2019139099A1 PCT/JP2019/000591 JP2019000591W WO2019139099A1 WO 2019139099 A1 WO2019139099 A1 WO 2019139099A1 JP 2019000591 W JP2019000591 W JP 2019000591W WO 2019139099 A1 WO2019139099 A1 WO 2019139099A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- information
- stream
- image
- viewpoint
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/21805—Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2362—Generation or processing of Service Information [SI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/462—Content or additional data management e.g. creating a master electronic programme guide from data received from the Internet and a Head-end or controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
Definitions
- FIG. 1 shows an example of the configuration of an MPEG-DASH-based stream delivery system 30.
- a media stream and an MPD (Media Presentation Description) file are transmitted through a communication network transmission line (communication transmission line).
- the stream delivery system 30 includes a DASH stream file server 31 and a DASH MPD server 32, N service receivers 33-1, 33-2, ..., 33-N, and a CDN (Content Delivery Network) 34. It is connected via the connection.
- the DASH stream file server 31 responds to the request of the segment of the predetermined stream sent from the service receiver 33 (33-1, 33-2, ..., 33-N) via the CDN 34, The segments of the stream are sent via the CDN 34 to the requesting receiver.
- the service receiver 33 refers to the value of the rate described in the Media Presentation Description (MPD) file and selects the stream of the optimal rate according to the state of the network environment in which the client is located. And make a request.
- MPD Media Presentation Description
- FIG. 2 shows an example of the relationship between structures arranged hierarchically in the MPD file.
- the media presentation Media Presentation
- the representation includes segment info.
- this segment info as shown in FIG. 2 (e), an initialization segment and a plurality of media segments (Media) in which information for each segment into which the period is further divided are described Segment) exists.
- Media media segments
- address (url) information and the like for actually acquiring segment data such as video and audio.
- the coded stream corresponding to the requested divided area is transmitted.
- the transmission band it is possible to prevent the transmission band from being unnecessarily wide, and efficient use of the transmission band becomes possible.
- the service receiver 200 requests the service transmission system (distribution server) 100 to transmit a predetermined number of coded streams corresponding to the display area, receives and decodes the predetermined number of coded streams, and displays the display area. Obtain the image data of and display the image.
- the service receiver 200 also receives rendering meta information when receiving a predetermined number of coded streams. As described above, the rendering meta information includes information of the grouped viewpoint grids.
- scaling_ratio_horizontal and “scaling_ratio_vertical” indicate scaling ratios from the original size of the projection image (see FIGS. 5 (b) and (c)).
- the “scaling_ratio_horizontal” field indicates the horizontal scaling ratio from the original size of the projection image.
- scaling_ratio_vertical indicates the vertical scaling ratio from the original size of the projection image.
- FIG. 16A shows an example of display of the user of group 1.
- the user of group 1 refers to a user who is enabled to use the viewpoint grid included in group 1 according to the user's attribute or contract content.
- FIG. 16 (b) shows an example of the display of the user of group 2.
- the illustrated example shows a state in which the viewpoint grid of VpB is selected by the user operation, and an image in which the viewpoint grid of VpB is the center position as the main image (image of display range B, FIG. The dashed-dotted line frame corresponding to VpB of) is displayed.
- a UI image is displayed at the lower right position in the illustrated example so as to be superimposed on the main image.
- a rectangular area m1 indicating the range of the entire image is shown, and in the rectangular area m1, a rectangular area m2 indicating the present display range is shown.
- the ID of the viewpoint grid corresponding to the current display range is "B"
- "E" indicating the ID of the selectable viewpoint grid is within the rectangular area m1. It is displayed in the corresponding position of.
- FIG. 18A shows an example of display of the user of group 1.
- the illustrated example shows a state in which the viewpoint grid of VpD is selected by the user operation, and an image in which the viewpoint grid of VpD is the center position as the main image (image of display range D, FIG. 17 (a The dashed-dotted line frame corresponding to VpD of) is displayed.
- a UI image is displayed at the lower right position in the illustrated example so as to be superimposed on the main image.
- a rectangular area m1 indicating the range of the entire image is shown
- a rectangular area m2 indicating the present display range is shown.
- a rectangular area m1 indicating the range of the entire image is shown, and in the rectangular area m1, a rectangular area m3 indicating the image range of group 1 and a rectangular area m4 indicating the image range of group 3 are indicated.
- a rectangular area m2 indicating the current display range is shown in the rectangular area m3.
- the ID of the viewpoint grid corresponding to the current display range is "A”, and "B”, "C”, which indicate the IDs of selectable viewpoint grids.
- "D” and “E” are shown at corresponding positions in the rectangular areas m3 and m4.
- the “moof” box contains control information.
- the entity of a signal (transmission medium) such as video and audio is placed.
- a “moof” box and a “mdat” box make up a movie fragment. Since a fragment obtained by fragmenting the transmission medium is included in the “mdat” box of one movie fragment, control information included in the “moof” box becomes control information on the fragment.
- the 8-bit field "frame_rate” indicates the frame rate (full frame rate) of the partition (divided picture).
- a 1-bit field of "tile_partition_flag” indicates whether or not the picture is divided in a tile system. For example, “1” indicates that the picture is divided in the tile system, and “0” indicates that the picture is not divided in the tile system.
- a 1-bit field of "tile_base_flag” indicates whether it is a base container or not in the case of tile system. For example, “1” indicates that it is a base container, and "0” indicates that it is a container other than the base container.
- the service receiver 200 can decode up to four partitions.
- the four partitions indicated by the arrow P indicate examples of partitions corresponding to the display area selected in this case.
- the transmission request unit 206 determines switching of a set of MP4 streams of a predetermined number of partitions corresponding to the display area, in order to set the display area as a decoding range. Request the service transmission system 100 to transmit a new set (delivery stream set).
- the coded stream is extracted from the MP4 stream of these partitions and decoded by the video decoder 204. That is, the decoding range in this case is a partition at the positions of (H0, V1), (H1, V1), (H2, V1), (H0, V2), (H1, V2), (H2, V2) .
- the coded stream is extracted from the MP4 stream of these partitions and decoded by the video decoder 204. That is, the decoding range in this case is a partition at the positions of (H1, V1), (H2, V1), (H3, V1), (H1, V2), (H2, V2), (H3, V2) .
- the switching frequency of the delivery stream set accompanying the movement of the display area is suppressed low. It is possible to improve the display performance in VR reproduction.
- the control unit 201 includes a CPU (Central Processing Unit), and controls the operation of each unit of the service receiver 200 based on a control program.
- the UI unit 201a is for performing a user interface, and for example, a pointing device for the user to operate the movement of the display area or a microphone for the user to input voice for instructing the movement of the display area by voice. Etc. are included in this.
- the sensor unit 201 b includes various sensors for acquiring information on user status and environment, and includes, for example, an attitude detection sensor and the like mounted on a head mounted display (HMD).
- HMD head mounted display
- FIG. 41 shows a configuration example of an MMT stream in the case where tile streams are configured as a single stream.
- MPU packet video MPU1” of the tile stream identified by ID1.
- NAL units of “AUD”, “VPS”, “SPS”, “PPS”, “PSEI”, “SLICE”, and “SSEI” are arranged.
- the information of the extraction position "Conformance_window” is inserted in "SPS”.
- an SEI message having rendering metadata is inserted in “SSEI”.
- transmitting and receiving system 10 which consists of service transmitting system 100 and service receiver 200
- the composition of the transmitting and receiving system which can apply this art is not limited to this.
- the service receiver 200 is a set top box and display connected by a digital interface such as, for example, a high-definition multimedia interface (HDMI).
- HDMI high-definition multimedia interface
- a transmitting unit that transmits a coded stream obtained by coding image data of a wide viewing angle image, and transmitting rendering meta information including information of a predetermined number of viewpoints registered by grouping
- a transmitter comprising: (2) The transmission device according to (1), wherein the wide-viewing-angle image is a projection image obtained by plane-packing a part or all of a spherical captured image. (3) The transmission apparatus according to (1) or (2), wherein the information of the viewpoint has information of an azimuth angle and an elevation angle indicating a position of the viewpoint.
- the main feature of the present technology is to transmit rendering meta information including information of a predetermined number of grouped viewpoint grids together with a coded stream obtained by coding image data of a wide viewing angle image. It is possible to display certain partial images in a wide viewing angle image consistently among receivers according to applications or users (see FIGS. 12 and 15 to 20).
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
用途別あるいはユーザ別に広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示可能とする。 広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信する。例えば、ビューポイントの情報は、このビューポイントの位置を示すアジマス角度(方位情報)およびエレベーション角度(仰角情報)の情報を持つ。
Description
本技術は、送信装置、送信方法、受信装置および受信方法に関し、詳しくは、広視野角画像を送信する送信装置等に関する。
広視野角画像は、広視野角に対応するミラーやレンズなどを用いてキャプチャされたものである。例えば、特許文献1には、広視野角画像としての全方位画像などの記載がある。
広視野角画像の動画像データを送信する場合、受信側においては、表示の際に変換の仕方によって表示対象部分が異なってくる。そのため、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示させたい場合に、従来は、その方法が存在しないという問題があった。
本技術の目的は、用途別あるいはユーザ別に、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示可能とすることにある。
本技術の概念は、
広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信する送信部を備える
送信装置にある。
広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信する送信部を備える
送信装置にある。
本技術において、送信部により、広視野角画像の画像データを符号化して得られた符号化ストリームが送信されると共に、レンダリング用メタ情報が送信される。このレンダリング用メタ情報には、グループ分けして登録された所定数のビューポイントの情報が含まれている。例えば、広視野角画像は、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られたプロジェクション画像である、ようにされてもよい。また、例えば、ビューポイントの情報は、このビューポイントの位置を示すアジマス角度(方位情報)およびエレベーション角度(仰角情報)の情報を持つ、ようにされてもよい。
例えば、送信部は、レンダリング用メタ情報を、符号化ストリームのレイヤおよび/またはこの符号化ストリームを含むコンテナのレイヤに挿入して送信する、ようにされてもよい。この場合、例えば、送信部は、符号化ストリームに関するメタ情報を持つメタファイルをさらに送信し、このメタファイルに、符号化ストリームおよび/またはコンテナのレイヤにレンダリング用メタ情報の挿入があることを示す識別情報が含まれる、ようにされてもよい。
また、この場合、例えば、コンテナは、ISOBMFFであり、送信部は、レンダリング用メタ情報を、moovボックスに挿入して送信する、ようにされてもよい。また、この場合、コンテナは、ISOBMFFであり、送信部は、レンダリング用メタ情報を、広視野角画像の画像データを符号化して得られた符号化ストリームを含むトラックとは別のトラックで送信する、ようにされてもよい。
また、この場合、例えば、コンテナは、MPEG2-TSであり、送信部は、レンダリング用メタ情報を、プログラム・マップ・テーブルに挿入して送信する、ようにされてもよい。また、この場合、例えば、コンテナは、MMTストリームであり、送信部は、レンダリング用メタ情報を、MMT・パッケージ・テーブルに挿入して送信する、ようにされてもよい。
また、例えば、広視野角画像の画像データを符号化して得られた符号化ストリームは、この広視野角画像を分割して得られた分割領域に対応した符号化ストリームである、ようにされてもよい。この場合、例えば、各分割領域の符号化ストリームは、広視野角画像の各分割領域を個別に符号化することで得られる、ようにされてもよい。また、この場合、例えば、各分割領域の符号化ストリームは、広視野角画像の各分割領域をタイルとするタイル機能を用いた符号化を行うことで得られる、ようにされてもよい。また、この場合、例えば、ビューポイントの情報は、このビューポイントが位置する分割領域の情報を含む、ようにされてもよい。
このように本技術においては、広視野角画像の画像データを符号化して得られた符号化ストリームと共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信するものである。そのため、受信側では、符号化ストリームを復号化して得られた広視野角画像の画像データをレンダリング用メタ情報に基づいて処理して表示用画像データを得ることができ、用途別あるいはユーザ別に、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示することが可能となる。
また、本技術の他の概念は、
広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を受信する受信部と、
上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記レンダリング用メタ情報に基づいて処理して表示用画像データを得る処理部を備える
受信装置にある。
広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を受信する受信部と、
上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記レンダリング用メタ情報に基づいて処理して表示用画像データを得る処理部を備える
受信装置にある。
本技術において、受信部により、広視野角画像の画像データを符号化して得られた符号化ストリームが受信されると共に、レンダリング用メタ情報が受信される。このレンダリング用メタ情報には、グループ分けして登録された所定数のビューポイントの情報が含まれている。
処理部により、符号化ストリームを復号化した得られた広視野角画像の画像データがレンダリング用メタ情報に基づいて処理されて表示用画像データが得られる。例えば、処理部は、ユーザの属性あるいは契約内容によって決定されたグループのビューポイントの情報を用いる、ようにされてもよい。この場合、例えば、処理部は、ユーザ操作で選択されたビューポイントの情報で示される位置をセンター位置とする表示用画像データを得る、ようにされてもよい。
また、例えば、受信部は、広視野角画像の画像データを符号化して得られた符号化ストリームとして、広視野角画像を分割して得られた各分割領域の符号化ストリームを受信し、処理部は、各分割領域に対応した符号化ストリームのうち表示用画像データを得るために用いる所定数の分割領域の符号化ストリームを復号化する、ようにされてもよい。この場合、例えば、受信部は、所定数の分割領域の符号化ストリームの送信を配信サーバに要求し、この配信サーバからこの所定数の分割領域の符号化ストリームを受信する、ようにされてもよい。
このように本技術においては、符号化ストリームを復号化して得られた広視野角画像の画像データを、グループ分けして登録された所定数のビューポイントの情報が含まれているレンダリング用メタ情報に基づいて処理して表示用画像データを得るものである。そのため、用途別あるいはユーザ別に、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示することが可能となる。
本技術によれば、用途別あるいはユーザ別に、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示できる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
1.実施の形態
2.変形例
<1.実施の形態>
[MPEG-DASHベースのストリーム配信システムの概要]
最初に、本技術を適用し得るMPEG-DASHベースのストリーム配信システムの概要を説明する。
[MPEG-DASHベースのストリーム配信システムの概要]
最初に、本技術を適用し得るMPEG-DASHベースのストリーム配信システムの概要を説明する。
図1は、MPEG-DASHベースのストリーム配信システム30の構成例を示している。この構成例では、メディアストリームとMPD(Media Presentation Description )ファイルが、通信ネットワーク伝送路(通信伝送路)を通じて送信される。このストリーム配信システム30は、DASHストリームファイルサーバ31およびDASH MPDサーバ32に、N個のサービス受信機33-1,33-2,・・・,33-Nが、CDN(Content Delivery Network)34を介して、接続された構成となっている。
DASHストリームファイルサーバ31は、所定のコンテンツのメディアデータ(ビデオデータ、オーディオデータ、字幕データなど)に基づいて、DASH仕様のストリームセグメント(以下、適宜、「DASHセグメント」という)を生成し、サービス受信機からのHTTP要求に応じてセグメントを送出する。このDASHストリームファイルサーバ31は、ストリーミング専用のサーバであってもよいし、また、ウェブ(Web)サーバで兼用されることもある。
また、DASHストリームファイルサーバ31は、サービス受信機33(33-1,33-2,・・・,33-N)からCDN34を介して送られてくる所定ストリームのセグメントの要求に対応して、そのストリームのセグメントを、CDN34を介して、要求元の受信機に送信する。この場合、サービス受信機33は、MPD(Media Presentation Description)ファイルに記載されているレートの値を参照して、クライアントの置かれているネットワーク環境の状態に応じて、最適なレートのストリームを選択して要求を行う。
DASH MPDサーバ32は、DASHストリームファイルサーバ31において生成されるDASHセグメントを取得するためのMPDファイルを生成するサーバである。コンテンツマネジメントサーバ(図示せず)からのコンテンツメタデータと、DASHストリームファイルサーバ31において生成されたセグメントのアドレス(url)をもとに、MPDファイルを生成する。なお、DASHストリームファイルサーバ31とDASH MPDサーバ32は、物理的に同じものであってもよい。
MPDのフォーマットでは、ビデオやオーディオなどのそれぞれのストリーム毎にリプレゼンテーション(Representation)という要素を利用して、それぞれの属性が記述される。例えば、MPDファイルには、レートの異なる複数のビデオデータストリーム毎に、リプレゼンテーションを分けてそれぞれのレートが記述される。サービス受信機33では、そのレートの値を参考にして、上述したように、サービス受信機33が置かれているネットワーク環境の状態に応じて、最適なストリームを選択できる。
図2は、MPDファイルに階層的に配置されている各構造体の関係の一例を示している。図2(a)に示すように、MPDファイル全体としてのメディア・プレゼンテーション(Media Presentation)には、時間間隔で区切られた複数のピリオド(Period)が存在する。例えば、最初のピリオドはスタートが0秒から、次のピリオドはスタートが100秒から、などとなっている。
図2(b)に示すように、ピリオドには、複数のアダプテーションセット(AdaptationSet)が存在する。各アダプテーションセットはビデオやオーディオ等のメディアタイプの違いや、同じメディアタイプでも言語の違い、視点の違い等に依存する。図2(c)に示すように、アダプテーションセットには複数のリプレゼンテーション(Representation)が存在する。各リプレゼンテーションはストリーム属性、例えばレートの違い等に依存する。
図2(d)に示すように、リプレゼンテーションには、セグメントインフォ(SegmentInfo)が含まれている。このセグメントインフォには、図2(e)に示すように、イニシャライゼーション・セグメント(Initialization Segment)と、ピリオドをさらに細かく区切ったセグメント(Segment)毎の情報が記述される複数のメディア・セグメント(Media Segment)が存在する。メディアセグメントには、ビデオやオーディオなどのセグメントデータを実際に取得するためのアドレス(url)の情報等が存在する。
なお、アダプテーションセットに含まれる複数のリプレゼンテーションの間では、ストリームのスイッチングを自由に行うことができる。これにより、受信側のネットワーク環境の状態に応じて、最適なレートのストリームを選択でき、途切れのないビデオ配信が可能となる。
[送受信システムの構成例]
図3は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、サービス送信システム100とサービス受信機200により構成されている。この送受信システム10において、サービス送信システム100は、上述の図1に示すストリーム配信システム30のDASHストリームファイルサーバ31およびDASH MPDサーバ32に対応する。また、この送受信システム10において、サービス受信機200は、上述の図1に示すストリーム配信システム30のサービス受信機33(33-1,33-2,・・・,33-N)に対応する。
図3は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、サービス送信システム100とサービス受信機200により構成されている。この送受信システム10において、サービス送信システム100は、上述の図1に示すストリーム配信システム30のDASHストリームファイルサーバ31およびDASH MPDサーバ32に対応する。また、この送受信システム10において、サービス受信機200は、上述の図1に示すストリーム配信システム30のサービス受信機33(33-1,33-2,・・・,33-N)に対応する。
サービス送信システム100は、DASH/MP4、つまりメタファイルとしてのMPDファイルと、ビデオやオーディオなどのメディアストリーム(メディアセグメント)が含まれるMP4(ISOBMFF)ストリームを、通信ネットワーク伝送路(図1参照)を通じて、送信する。
MP4ストリームには、広視野角画像の画像データを符号化して得られた符号化ストリーム、この実施の形態においては、広視野角画像を分割して得られた各分割領域(パーティション)に対応した符号化ストリーム(符号化画像データ)が含まれる。ここで、広視野角画像は球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られたプロジェクション画像(Projection picture)とされるが、これに限定されるものではない。
符号化ストリームおよび/またはコンテナのレイヤに、レンダリング用メタ情報が挿入されている。レンダリング用メタ情報がビデオストリームのレイヤに挿入されることで、コンテナの種類によらず、レンダリング用メタ情報の動的な変更が可能となる。このレンダリング用メタ情報には、グループ分けして登録された所定数のビューポイントの情報、従ってグループ分けされた所定数のビューポイントグリッドの情報が含まれている。ビューポイントは表示画像のセンター位置を示し、登録されたビューポイントを「ビューポイントグリッド」と称する。ここで、ビューポイントグリッドの情報には、アジマス角度(方位情報)とエレベーション角度(仰角情報)の情報が含まれる。
なお、広視野角画像の各分割領域に対応した符号化ストリームの全てを送信することも考えられるが、この実施の形態においては、要求された分割領域に対応した符号化ストリームが送信される。これにより、伝送帯域を無駄に広くとることを防止でき、伝送帯域の効率的な使用が可能となる。
MPDファイルには、コンテナおよび/またはビデオストリームのレイヤにレンダリング用メタ情報の挿入があることを示す識別情報、後方互換性情報、さらにはプロジェクション画像のフォーマットタイプ情報が挿入されている。
サービス受信機200は、サービス送信システム100から通信ネットワーク伝送路(図1参照)を通じて送られてくる上述のMP4(ISOBMFF)ストリームを受信する。サービス受信機200は、MPDファイルから、広視野角画像の各分割領域に対応した符号化ストリームに関するメタ情報を取得する。
サービス受信機200は、例えば、表示領域に対応した所定数の符号化ストリームの送信をサービス送信システム(配信サーバ)100に要求し、その所定数の符号化ストリームを受信して復号化し、表示領域の画像データを得て画像表示をする。サービス受信機200は、所定数の符号化ストリームを受信する際に、レンダリング用メタ情報も受信する。このレンダリング用メタ情報には、上述したように、グループ分けされたビューポイントグリッドの情報が含まれている。
サービス受信機200は、所定数の符号化ストリームを復号化して得られた広視野角画像の画像データをこのレンダリング用メタ情報に基づいて処理して、表示用画像データを得る。例えば、サービス受信機200は、ユーザの属性あるいは契約内容によって決定されたグループの所定数のビューポイントグリッドのうち、ユーザ操作部で選択された所定のビューポイントグリッドをセンター位置とする表示用画像データを得る。
図4は、送受信システム10のシステム全体の構成例を概略的に示している。サービス送信システム100は、360°画キャプチャ部102と、平面パッキング部103と、ビデオエンコーダ104と、コンテナエンコーダ105と、ストレージ106を有している。
360°画キャプチャ部102は、所定数のカメラで被写体を撮像して、広視野角画像、この実施の形態においては球面キャプチャ画像(360°VR画像)の画像データを得る。例えば、360°画キャプチャ部102は、魚眼レンズによる撮影を含む、球面キャプチャ画像またはその一部である180°以上の視野角を持つ、超広視野角の前面画像および後面画像を得る。
平面パッキング部103は、360°画キャプチャ部102で得られた球面キャプチャ画像の一部または全部を切り取って平面パッキングしてプロジェクション画像(Projection picture)を得る。この場合、プロジェクション画像のフォーマットタイプとしては、例えば、エクイレクタングラー(Equirectangular)、クロスキュービック(Cross-cubic)などが選択される。なお、平面パッキング部103では、プロジェクション画像に必要に応じてスケーリングを施し、所定の解像度のプロジェクション画像を得ることが行われる。
図5(a)は、カメラ102で得られる球面キャプチャ画像としての、超広視野角の前面画像および後面画像の一例を示している。図5(b)は、平面パッキング部103で得られるプロジェクション画像の一例を示している。この例は、プロジェクション画像のフォーマットタイプがエクイレクタングラーである場合の例である。また、この例は、図5(a)に示す各画像において破線で示す緯度で切出した場合の例である。図5(c)は、スケーリング後のプロジェクション画像の一例を示している。
図4に戻って、ビデオエンコーダ104は、平面パッキング部103からのプロジェクション画像の画像データに対して、例えば、MPEG4-AVCあるいはHEVCなどの符号化を施して符号化画像データを得、この符号化画像データを含むビデオストリームを生成する。ビデオストリームのSPS NALユニットには、切り出し位置情報が挿入されている。例えば、HEVCの符号化では「conformance_window」が対応し、MPEG4-AVCの符号化では「frame_crop_offset」が対応する。
図6は、HEVCの符号化におけるSPS NALユニットの構造例(Syntax)を示している。「pic_width_in_luma_samples」のフィールドは、プロジェクション画像の水平方向の解像度(画素サイズ)を示している。「pic_height_in_luma_samples」のフィールドは、プロジェクション画像の垂直方向の解像度(画素サイズ)を示している。そして、「conformance_window_flag」が立っているとき、切り出し位置情報が存在する。この切り出し位置情報は、プロジェクション画像の左上を基点(0,0)としたオフセット情報とされる。
「conf_win_left_offset」のフィールドは、切り出し位置の左端位置を示している。「conf_win_right_offset」のフィールドは、切り出し位置の右端位置を示している。「conf_win_top_offset」のフィールドは、切り出し位置の上端位置を示している。「conf_win_bottom_offset」のフィールドは、切り出し位置の下端位置を示している。
この実施の形態において、この切り出し位置情報で示される切り出し位置の中心は、プロジェクション画像の基準点と一致するようにされる。ここで、切出し位置の中心をO(p,q)とすると、p,qは、それぞれ、以下の数式で表される。
p = ( conf_win_right_offset - conf_win_left_offset ) * 1/2
+ conf_win_left_offset
q = ( conf_win_bottom_offset - conf_win_top_offset ) * 1/2
+ conf_win_top_offset
+ conf_win_left_offset
q = ( conf_win_bottom_offset - conf_win_top_offset ) * 1/2
+ conf_win_top_offset
図7は、切出し位置の中心O(p,q)がプロジェクション画像の基準点RP(x,y)と一致するようにされることを示している。図示の例において、「projection_pic_size_horizontal」はプロジェクション画像の水平画素サイズを示し、「projection_pic_size_vertical」はプロジェクション画像の垂直画素サイズを示している。なお、VR対応端末ではプロジェクション画像をレンダリングして表示ビュー(表示画像)を得ることが可能とされるが、デフォルトビューは基準点RP(x,y)を中心としたものとされる。
この場合、例えば、プロジェクション画像が、基準点RP(x,y)を中心位置とするデフォルトリージョンを含む複数のリージョンからなるとき、切出し位置情報で示される位置はデフォルトリージョンの位置と一致するようにされる。この場合、切り出し位置情報で示される切り出し位置の中心O(p,q)は、プロジェクション画像の基準点RP(x,y)と一致する。
図4に戻って、ビデオエンコーダ104は、プロジェクション画像を複数のパーティション(分割領域)に分割し、各パーティションに対応した符号化ストリームを得る。図8は、プロジェクション画像のフォーマットタイプがエクイレクタングラーである場合における分割例を示している。
ビデオエンコーダ104は、プロジェクション画像の各パーティションに対応した符号化ストリームを得るために、例えば、各パーティションを個別に符号化するか、あるいはプロジェクション画像の全体を一括して符号化するが、各パーティションをタイルとするタイル機能を用いた符号化をする。これにより、受信側では、各パーティションに対応した符号化ストリームを独立してデコードすることが可能となる。
ビデオエンコーダ104は、アクセスユニット(AU)の“SEIs”の部分に、レンダリングメタデータ(レンダリング用メタ情報)を持つSEIメッセージ(SEI message)を挿入する。図9は、レンダリングメタデータ(Rendering_metadata)の構造例(Syntax)を示している。図10は、その構造例における主要な情報の内容(Semantics)を示している。
「rendering_metadata_id」の16ビットフィールドは、レンダリングメタデータ構造体を識別するIDである。「rendering_metadata_length」の16ビットフィールドは、レンダリングメタデータ構造体のバイトサイズを示す。
「start_offset_sphere_latitude」、「start_offset_sphere_longitude」、「end_offset_sphere_latitude」、「end_offset_sphere_longitude」の各16ビットフィールドは、球面キャプチャ画像を平面パッキングする場合の切り取り範囲の情報を示す(図11(a)参照)。「start_offset_sphere_latitude」のフィールドは、球面からの切り取り開始オフセットの緯度(垂直方向)を示す。「start_offset_sphere_longitude」のフィールドは、球面からの切り取り開始オフセットの経度(水平方向)を示す。「end_offset_sphere_latitude」のフィールドは、球面からの切り取り終了オフセットの緯度(垂直方向)を示す。「end_offset_sphere_longitude」のフィールドは、球面からの切り取り終了オフセットの経度(水平方向)を示す。
「projection_pic_size_horizontal」、「projection_pic_size_vertical」の各16ビットフィールドは、プロジェクション画像(projection picture)のサイズ情報を示す(図11(b)参照)。「projection_pic_size_horizontal」のフィールドは、プロジェクション画像のサイズでトップ・レフト(top-left)からの水平画素カウントを示す。「projection_pic_size_vertical」のフィールドは、プロジェクション画像のサイズでトップ・レフト(top-left)からの垂直画素カウントを示す。
「scaling_ratio_horizontal」、「scaling_ratio_vertical」の各16ビットフィールドは、プロジェクション画像の元のサイズからのスケーリング比を示す(図5(b)、(c)参照)。「scaling_ratio_horizontal」のフィールドは、プロジェクション画像の元のサイズからの水平スケーリング比を示す。「scaling_ratio_vertical」のフィールドは、プロジェクション画像の元のサイズからの垂直スケーリング比を示す。
「reference_point_horizontal」、「reference_point_vertical」の各16ビットフィールドは、プロジェクション画像の基準点RP(x,y)の位置情報を示す(図11(b)参照)。「reference_point_horizontal」のフィールドは、基準点RP(x,y)の水平画素位置“x”を示す。「reference_point_vertical」のフィールドは、基準点RP(x,y)の垂直画素位置“y”を示す。
「format_type」の5ビットフィールドは、プロジェクション画像のフォーマットタイプを示す。例えば、“0”はエクイレクタングラー(Equirectangular)を示し、“1”はクロスキュービック(Cross-cubic)を示し、“2”はパーティションド・クロスキュービック(partitioned cross cubic)を示す。
「backwardcompatible」の1ビットフィールドは、後方互換性の設定がなされているかどうか、つまりビデオストリームのレイヤに挿入された切り出し位置情報で示される切り出し位置の中心O(p,q)がプロジェクション画像の基準点RP(x,y)と一致するように設定されているか否かを示す(図7参照)。例えば、“0”は後方互換性の設定がなされていないことを示し、“1”は後方互換性の設定がなされていることを示す。「viewpoint_grid()」は、グループ分けされたビューポイントグリッドの情報を格納するフィールドである。
図12は、“viewpoint_grid()”の構造例(Syntax)を示している。図13は、その構造例における主要な情報の内容(Semantics)を示している。「number_of_group」の8ビットフィールドは、グループの数を示す。この数だけ以下のフィールドが繰り返される。「group_id」の8ビットフィールドは、グループIDを示す。「category」の8ビットフィールドは、グループのカテゴリ(分類種類)を示す。
「number_of_viewpoint_grids」の8ビットフィールドは、ビューポイントグリッド(viewpoint_grid)の数を示す。この数だけ以下のフィールドが繰り返される。「viewpoint_grid_id」の8ビットフィールドは、ビューポイントグリッドのIDを示す。「region_id」の8ビットフィールドは、ビューポイントグリッドが存在するリージョンのIDを示す。「region_in_stream_flag」の1ビットフィールドは、対象のリージョンが符号化ストリームに含まれているか否かを示す。例えば、“1”は含まれていることを示し、“0”は含まれていないことを示す。
「region_in_stream_flag」が“1”であるとき、つまり対象のリージョンが符号化ストリームに含まれているとき、以下のビューポイントグリッドの位置情報を示すフィールドが存在する。「center_azimuth[j]」の16ビットフィールドは、ビューポイントグリッドのアジマス角度(方位情報)を示す。「center_elevation[j]」の16ビットフィールドは、ビューポイントグリッドのエレベーション角度(仰角情報)を示す。
ここで、ビューポイントグリッドについて説明する。図14(a)は、平面変換後の画像を示している。この画像は、横長の長方形で括られたものであり、上述のプロジェクション画像(図8参照)に対し、歪曲した部分がきちんとした画になるように変換処理を施すことで得られたものである。
図示の例においては、この平面変換後の画像(広視野角画像)内にVpA~VpHの8つのビューポイントがビューポイントグリッドとして登録されている。なお、上述では各ビューポイントグリッドの位置をアジマス角度(方位情報)およびエレベーション角度(仰角情報)で特定するように説明したが、各ビューポイントグリッドの位置(座標値)を基準点RP(x,y)(図9参照)からの画素オフセットで表すことも可能である。受信側では、図14(b)に示すように、A~HのビューポイントグリッドIDで識別される各ビューポイントグリッドから所望のビューポイントグリッドを選択することで、そのビューポイントグリッドをセンター位置とする画像表示が可能となる。
図15(a)は、ビューポイントグリッドのカテゴリによるグループ分けの一例を示している。図示の例においては、グループ1には、VpC,VpD,VpGの3つのビューポイントグリッドが含まれている。また、グループ2には、VpB,VpEの2つのビューポイントグリッドが含まれている。また、グループ3には、VpA,VpF,VpHの3つのビューポイントグリッドが含まれている。図15(b)は、図15(a)の例における、グループIDで括られたカテゴリとビューポイントグリッドIDのリストを示している。
図16(a)は、グループ1のユーザの表示の一例を示している。ここで、グループ1のユーザとは、後述するように、ユーザの属性あるいは契約内容によってグループ1に含まれるビューポイントグリッドの利用が可能とされたユーザをいう。その他のグループのユーザも同様である。これは、他の例においても同様である。
図示の例は、ユーザ操作によって、VpDのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpDのビューポイントグリッドをセンター位置とする画像(表示範囲Dの画像、図15(a)のVpDに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“D”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“C”,“G”が矩形領域m1内の対応する位置に表示されている。
図16(b)は、グループ2のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpBのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpBのビューポイントグリッドをセンター位置とする画像(表示範囲Bの画像、図15(a)のVpBに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“B”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“E”が矩形領域m1内の対応する位置に表示されている。
図16(c)は、グループ3のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpFのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpFのビューポイントグリッドをセンター位置とする画像(表示範囲Fの画像、図15(a)のVpFに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“F”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“A”,“H”が矩形領域m1内の対応する位置に表示されている。
図17(a)は、ビューポイントグリッドの表示可能な画像の範囲をグループ分けする一例を示している。図示の例においては、グループ1には、VpC,VpD,VpEの3つのビューポイントグリッドが含まれている。また、グループ2には、VpB,VpC,VpD,VpE,VpFの5つのビューポイントグリッドが含まれている。また、グループ3には、VpA,VpB,VpC,VpD,VpE,VpF,VpG,VpHの8つのビューポイントグリッドが含まれている。図17(b)は、図17(a)の例における、グループIDで括られたカテゴリとビューポイントグリッドIDのリストを示している。
図18(a)は、グループ1のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpDのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpDのビューポイントグリッドをセンター位置とする画像(表示範囲Dの画像、図17(a)のVpDに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“D”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“C”,“E”が矩形領域m1内の対応する位置に表示されている。
図18(b)は、グループ2のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpDのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpDのビューポイントグリッドをセンター位置とする画像(表示範囲Dの画像、図17(a)のVpDに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“D”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“B”,“C”,“E”,“F”が矩形領域m1内の対応する位置に表示されている。
図18(c)は、グループ3のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpDのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpDのビューポイントグリッドをセンター位置とする画像(表示範囲Dの画像、図17(a)のVpDに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“D”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“A”,“B”,“C”,“E”,“F”,“G”,“H”が矩形領域m1内の対応する位置に表示されている。
図19(a)は、ビューポイントグリッドのカテゴリによる表示可能な画像を分割することによるグループ分けのさらに他の一例を示している。図示の例においては、グループ1のカテゴリは“Left Player”であり、このグループ1には、VpA,VpBの2つのビューポイントグリッドが含まれている。また、グループ2のカテゴリは“Right Player”であり、このグループ2には、VpF,VpG,VpHの3つのビューポイントグリッドが含まれている。また、グループ3のカテゴリは“Shared”であり、このグループ3には、VpC,VpD,VpEの3つのビューポイントグリッドが含まれている。このグループ3に含まれるビューポイントグリッドに関しては、グループ1のユーザもグループ2のユーザも選択可能とされる。図19(b)は、図19(a)の例における、グループIDで括られたカテゴリとビューポイントグリッドIDのリストを示している。
図20(a)は、グループ1のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpAのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpAのビューポイントグリッドをセンター位置とする画像(表示範囲Aの画像、図19(a)のVpAに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では中央下から右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内にグループ1の画像範囲を示す矩形領域m3およびグループ3の画像範囲を示す矩形領域m4が示され、矩形領域m3内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“A”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“B”,“C”,“D”,“E”が矩形領域m3,m4内の対応する位置に示表示されている。
図20(b)は、グループ2のユーザの表示の一例を示している。図示の例は、ユーザ操作によって、VpHのビューポイントグリッドが選択された状態を示しており、メイン画像として、VpHのビューポイントグリッドをセンター位置とする画像(表示範囲Aの画像、図19(a)のVpHに対応した一点鎖線枠参照)が表示されている。そして、このメイン画像に重畳される形で、図示の例では中央下から右下の位置にUI画像が表示されている。このUI画像には、全体画像の範囲を示す矩形領域m1が示され、この矩形領域m1内にグループ2の画像範囲を示す矩形領域m5およびグループ3の画像範囲を示す矩形領域m4が示され、矩形領域m5内に現在の表示範囲を示す矩形領域m2が示されている。また、このUI画像には、現在の表示範囲に対応したビューポイントグリッドのIDは“H”であることが示され、さらに選択可能なビューポイントグリッドのIDを示す“C”,“D”,“E”,“F”,“G”が矩形領域m5,m4内の対応する位置に示表示されている。
図4に戻って、コンテナエンコーダ105は、ビデオエンコーダ104で生成された符号化ストリームを含むコンテナ、ここではMP4ストリームを、配信ストリームとして生成する。この場合、コンテナエンコーダ105は、コンテナのレイヤに、レンダリングメタデータ(図9参照)を挿入する。なお、この実施の形態においては、ビデオストリーム(符号化ストリーム)のレイヤとコンテナのレイヤの双方にレンダリングメタデータを挿入するものであるが、いずれか一方のみに挿入することも考えられる。このようにコンテナエンコーダ105で得られたMP4の配信ストリームは、ストレージ106を介して、サービス受信機200に送信される。
図21は、配信ストリームとしてのMP4ストリームの一例を示している。一般の放送など、送信の途中から画音が出るように、サービスストリーム全体がフラグメント化されて送信される。各ランダムアクセス期間は、イニシャライゼーション・セグメント(IS:initialization segment)から始まり、それに、“styp”、“sidx(Segment index box)”、“ssix(Sub-segment index box)”、“moof(Movie fragment box)”、“mdat(Media data box)”のボックスが続いた構成となっている。
イニシャライゼーション・セグメント(IS)は、ISOBMFF(ISO Base Media File Format)に基づくボックス(Box)構造を持つ。先頭に、ファイルタイプ(File type)を示す“ftyp”ボックスが配置され、それに続いて制御用の“moov”ボックスが配置されている。詳細説明は省略するが、この“moov”ボックス内に、“trak”ボックス、“mdia”ボックス、“minf”ボックス、“stbl”ボックス、“stsd”ボックスおよび“schi”ボックスが階層的に配置され、この“schi”ボックスに、レンダリングメタデータ(Rendering_metadata)(図9参照)が挿入される。
“styp”ボックスにはセグメントタイプ情報が入る。 “sidx”ボックスには、各トラック(track)のレンジ情報が入り、“moof”/“mdat”の位置が示され、“mdat”内の各サンプル(ピクチャ)の位置も示される。“ssix”ボックスには、トラック(track)の区分け情報が入り、I/P/Bタイプの区分けがされる。
“moof”ボックスには制御情報が入る。“mdat”ボックスにはビデオ、オーディオなどの信号(伝送メディア)の実体そのものが入る。“moof”ボックスと“mdat”ボックスによりムービーフラグメント(Movie fragment)が構成されている。1つのムービーフラグメントの“mdat”ボックスには、伝送メディアがフラグメント化(断片化)されて得られた断片が入るので、“moof”ボックスに入る制御情報はその断片に関する制御情報となる。
各ムービーフラグメントの“mdat”ボックスには、プロジェクション画像の符号化画像データ(アクセスユニット)が所定ピクチャ数分、例えば1GOP分だけ配置される。ここで、各アクセスユニットは、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」などのNALユニットにより構成される。なお、「VPS」、「SPS」は、例えば、GOPの先頭ピクチャに挿入される。
SPS NALユニットには、切り出し位置情報としての「conformance_window」の情報が挿入される(図6参照)。また、「SSEI」のNALユニットとして、レンダリングメタデータ(Rendering_metadata)(図9参照)を持つSEIメッセージが挿入される。
この実施の形態において、コンテナエンコーダ105は、各パーティションに対応した符号化ストリームをそれぞれ含む複数のMP4ストリームを生成する。各パーティションをタイルとするタイル機能を用いた符号化を行っている場合、全てのパーティションに対応した符号化ストリームをサブストリームとして含む一つのMP4ストリームを生成することも可能である。しかし、この実施の形態においては、各パーティションに対応した符号化ストリームをそれぞれ含む複数のMP4ストリームが生成されるものとする。
なお、コンテナエンコーダ105は、各パーティションをタイルとするタイル機能を用いた符号化を行っている場合、各パーティションに対応した符号化ストリームをそれぞれ含む複数のMP4ストリームの他に、SPSなどのパラメータセットを含むベース(base)のMP4ストリーム(ベースコンテナ)を生成する。
ここで、各パーティションをタイルとするタイル機能を用いた符号化について、図22を参照して説明する。タイルは、ピクチャを水平そして垂直方向に分割して各々を独立して符号化・復号化できるものである。タイルではピクチャ内の画面内予測やループフィルタそしてエントロピー符号化をリフレッシュできるため、タイルとして分割された領域各々を独立して符号化・復号化が可能になる。
図22(a)は、ピクチャを縦横2分割ずつの計4分割して、各パーティションをタイルとして符号化を行った場合の例を示している。この場合、図22(b)に示すように、タイル分割されたa,b,c,dのパーティション(タイル)に関して、各タイルの先頭データのバイト位置のリストをスライスヘッダに記述することで、独立したデコードが可能になる。
タイルの開始ブロックのピクチャ内の位置関係は、ピクチャのトップ・レフト(top-left)からの相対位置で認識できるので、各パーティション(タイル)の符号化ストリームを別のパケットでコンテナ伝送する場合も、受信側で元のピクチャを再構築することができる。例えば、図22(c)に示すように、一点鎖線の矩形枠で囲むb,dのパーティションの符号化ストリームをデコードすると、このb,dのパーティション(タイル)の表示が可能となる。
なお、各パーティション(タイル)の符号化ストリームを別のパケットでコンテナ伝送する場合、パラメータセットなどのメタ情報は、タイルベースのMP4ストリーム(タイルベースコンテナ)に格納される。そして、各パーティションのMP4ストリーム(タイルコンテナ)には、それぞれ各パーティションに対応した符号化ストリームがスライス情報として格納される。
また、コンテナエンコーダ105は、コンテナのレイヤに、パーティションの画素数およびフレームレートの情報を挿入する。この実施の形態では、MP4ストリームのイニシャライゼーション・セグメント(IS:initialization segment)に、パーティション・デスクリプタ(partition_descriptor)が挿入される。この場合、複数のパーティション・デスクリプタが最大頻度としてピクチャ単位で挿入されてもよい。
図23は、パーティション・デスクリプタの構造例(Syntax)を示している。また、図24は、その構造例における主要な情報の内容(Semantics)を示している。「partition_descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、パーティション・デスクリプタであることを示す。「partition_descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして、以降のバイト数を示す。
「frame_rate」の8ビットフィールドは、パーティション(分割ピクチャ)のフレームレート(フルフレームレート)を示す。「tile_partition_flag」の1ビットフィールドは、タイル方式でピクチャ分割されているか否かを示す。例えば、“1”はタイル方式でピクチャ分割されていることを示し、“0”はタイル方式でピクチャ分割されていないことを示す。「tile_base_flag」の1ビットフィールドは、タイル方式の場合で、ベースコンテナか否かを示す。例えば、“1”はベースコンテナであることを示し、“0”はベースコンテナ以外のコンテナであることを示す。
「partition_ID」の8ビットフィールドは、パーティションのIDを示す。「whole_picture_size_horizontal」の16ビットフィールドは、ピクチャ全体の水平画素数を示す。「whole_picture_size_vertical」の16ビットフィールドは、ピクチャ全体の垂直画素数を示す。
「partition_horizontal_start_position」の16ビットフィールドは、パーティションの水平開始画素位置を示す。「partition_horizontal_end_position」の16ビットフィールドは、パーティションの水平終了画素位置を示す。「partition_vertical_start_position」の16ビットフィールドは、パーティションの垂直開始画素位置を示す。「partition_ vertical_end_position」の16ビットフィールドは、パーティションの垂直終了画素位置を示す。これらの各フィールドは、ピクチャ全体に対するパーティションの位置情報を構成し、また、パーティションの画素数の情報を構成する。
図4に戻って、ストレージ106は、コンテナエンコーダ105で生成された各パーティションのMP4ストリームを一時的に蓄積する。なお、タイル方式で分割されている場合には、ストレージ106は、タイルベースのMP4ストリームも蓄積する。このように蓄積されたMP4ストリームのうち、送信リクエストがあったパーティションのMP4ストリームがサービス受信機200に送信される。なお、なお、タイル方式で分割されている場合には、ベースのMP4ストリームも同時に送信される。
図25は、タイルベースのMP4ストリーム(タイルベースコンテナ)に対応したMPDファイルの記述例を示している。このMPDファイルには、タイルベースコンテナとしての1つのMP4ストリーム(トラック)に対応するアダプテーションセット(AdaptationSet)が存在する。
アダプテーションセットにおいて、「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.Lxxx,xx,hev1.yy.yy.Lxxx,yy”>”」の記述により、ビデオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのビデオストリームはMP4ファイル構造で供給され、HEVC符号化されたビデオストリーム(符号化画像データ)の存在が示されている。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:format_type” value/>」の記述により、プロジェクション画像のフォーマットタイプが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:framerate” value/>」の記述により、ピクチャのフレームレートが示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:tilepartitionflag” value=“1”/>」の記述により、タイル方式でピクチャ分割されていることが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:tilebaseflag” value=“1”/>」の記述により、タイルベースコンテナであることが示される。
また、アダプテーションセットにおいて、ビデオストリームに対応したリプレゼンテーション(Representation)が存在する。このリプレゼンテーションにおいて、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:renderingmetadata” value=“1”/>」の記述により、レンダリングメタデータ(Rendering_metadata)の存在が示される。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:projectiontype” value=“0”/>」の記述により、プロジェクション画像のフォーマットタイプがエクイレクタングラー(Equirectangular)であることが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:backwardcompatible” value=“1”/>」の記述により、後方互換性の設定がなされていること、つまりビデオストリームのレイヤに挿入される切り出し位置情報で示される切り出し位置の中心O(p,q)がプロジェクション画像の基準点RP(x,y)と一致するように設定されていることが示される。
また、このリプレゼンテーションにおいて、「width=“" height=“" frameRate=“"」、「codecs="hev1.xx.xx.Lxxx,xx"」、「level= “0”」の記述により、解像度、フレームレート、コーデックの種類が示され、さらにタグ情報としてレベル“0”が付与されることが示される。また、「<BaseURL>videostreamVR.mp4</BaseURL>」の記述により、このMP4ストリームのロケーション先が、「videostreamVR.mp4」として示される。
図26は、各パーティションのMP4ストリームに対応したMPDファイルの記述例を示している。このMPDファイルには、複数のMP4ストリーム(トラック)のそれぞれに対応するアダプテーションセット(AdaptationSet)が存在する。なお、図示の例においては、図面の簡単化のために、アダプテーションセット(AdaptationSet)を1つだけ示している。
このアダプテーションセットについて説明し、その他のアダプテーションセットについては同様であるので、その説明は省略する。アダプテーションセットにおいて、「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.Lxxx,xx,hev1.yy.yy.Lxxx,yy”>」の記述により、ビデオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのビデオストリームはMP4ファイル構造で供給され、HEVC符号化されたビデオストリーム(符号化画像データ)の存在が示されている。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:format_type” value/>」の記述により、プロジェクション画像のフォーマットタイプが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:framerate” value/>」の記述により、パーティションのフレームレート(フルフレームレート)が示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:tilepartitionflag” value=“1”/>」の記述により、タイル方式でピクチャ分割されているか否かが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:tilebaseflag” value=“0”/>」の記述により、タイルベース以外のコンテナであることが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionid” value=“1”/>」の記述により、パーティションIDが「1」であることが示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:wholepicturesizehorizontal” value/>」の記述により、ピクチャ全体の水平画素数が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:wholepicturesizevertical” value/>」の記述により、ピクチャ全体の垂直画素数が示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionstartpositionhorizontal” value/>」の記述により、パーティションの水平開始画素位置が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitiontartpositionvertical” value/>」の記述により、パーティションの水平終了画素位置が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionendpositionhorizontal” value/>」の記述により、パーティションの垂直開始画素位置が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionendpositionvertical” value/>」の記述により、パーティションの垂直終了画素位置が示される。
また、アダプテーションセットにおいて、ビデオストリームに対応したリプレゼンテーション(Representation)が存在する。このリプレゼンテーションにおいて、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:renderingmetadata” value=“1”/>」の記述により、レンダリングメタデータ(Rendering_metadata)の存在が示される。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:projectiontype” value=“0”/>」の記述により、プロジェクション画像のフォーマットタイプがエクイレクタングラー(Equirectangular)であることが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:backwardcompatible” value=“1”/>」の記述により、後方互換性の設定がなされていること、つまりビデオストリームのレイヤに挿入される切り出し位置情報で示される切り出し位置の中心O(p,q)がプロジェクション画像の基準点RP(x,y)と一致するように設定されていることが示される。
また、このリプレゼンテーションにおいて、「width=“" height=“" frameRate=“"」、「codecs="hev1.xx.xx.Lxxx,xx"」、「level= “0”」の記述により、解像度、フレームレート、コーデックの種類が示され、さらにタグ情報としてレベル“0”が付与されることが示される。また、「<BaseURL>videostreamVR0.mp4</BaseURL>」の記述により、このMP4ストリームのロケーション先が、「videostreamVR0.mp4」として示される。
図27は、各パーティションをタイルとするタイル機能を用いた符号化を行った場合におけるMP4ストリーム(トラック)を概略的に示している。この場合、タイルベースの1つのMP4ストリーム(タイルベースコンテナ)と、4つのパーティションのMP4ストリーム(タイルコンテナ)が存在する。それぞれのMP4ストリームは、同様に、各ランダムアクセス期間が、イニシャライゼーション・セグメント(IS:initialization segment)から始まり、それに、“styp”、“sidx(Segment index box)”、“ssix(Sub-segment index box)”、“moof(Movie fragment box)”、“mdat(Media data box)”のボックスが続いた構成となっている。
イニシャライゼーション・セグメント(IS)は、ISOBMFF(ISO Base Media File Format)に基づくボックス(Box)構造を持つ。このイニシャライゼーション・セグメント(IS)に、パーティション・デスクリプタ(図23参照)が挿入されている。また、このイニシャライゼーション・セグメント(IS)に、レンダリングメタデータ(Rendering_metadata)(図9参照)が挿入されている。タイルベースのMP4ストリーム(タイルベースコンテナ)において、パーティション・デスクリプタでは「tile base flag = 1」となっている。また、第1~第4のパーティションのMP4ストリーム(タイルコンテナ)において、「partition ID」は1~4となっている。
“styp”ボックスにはセグメントタイプ情報が入る。 “sidx”ボックスには、各トラック(track)のレンジ情報が入り、“moof”/“mdat”の位置が示され、“mdat”内の各サンプル(ピクチャ)の位置も示される。“ssix”ボックスには、トラック(track)の区分け情報が入り、I/P/Bタイプの区分けがされる。
“moof”ボックスには制御情報が入る。タイルベースのMP4ストリーム(タイルベースコンテナ)のmdat”ボックスには、「VPS」、「SPS」、「PPS」、「PSEI」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」のNALユニットとして、レンダリングメタデータ(Rendering_metadata)(図9参照)を持つSEIメッセージが挿入されている。一方、各パーティションのMP4ストリーム(タイルコンテナ)のmdat”ボックスには、それぞれのパーティションの符号化画像データを持つ「SLICE」のNALユニットが配置されている。
図28は、各パーティションを個別に符号化した場合におけるMP4ストリーム(トラック)を概略的に示している。この場合、4つのパーティションのMP4ストリームが存在する。それぞれのMP4ストリームは、同様に、各ランダムアクセス期間が、イニシャライゼーション・セグメント(IS:initialization segment)から始まり、それに、“styp”、“sidx(Segment index box)”、“ssix(Sub-segment index box)”、“moof(Movie fragment box)”、“mdat(Media data box)”のボックスが続いた構成となっている。
イニシャライゼーション・セグメント(IS)は、ISOBMFF(ISO Base Media File Format)に基づくボックス(Box)構造を持つ。このイニシャライゼーション・セグメント(IS)に、パーティション・デスクリプタ(図23参照)が挿入されている。また、このイニシャライゼーション・セグメント(IS)に、レンダリングメタデータ(Rendering_metadata)(図9参照)が挿入されている。第1~第4のパーティションのMP4ストリームにおいて、「partition ID」は1~4となっている。
“styp”ボックスにはセグメントタイプ情報が入る。 “sidx”ボックスには、各トラック(track)のレンジ情報が入り、“moof”/“mdat”の位置が示され、“mdat”内の各サンプル(ピクチャ)の位置も示される。“ssix”ボックスには、トラック(track)の区分け情報が入り、I/P/Bタイプの区分けがされる。
“moof”ボックスには制御情報が入る。各パーティションのMP4ストリームのmdat”ボックスには、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」のNALユニットとして、レンダリングメタデータ(Rendering_metadata)(図9参照)を持つSEIメッセージが挿入されている。
図4に戻って、サービス受信機200は、コンテナデコーダ203と、ビデオデコーダ204と、レンダラ205と、送信リクエスト部206を有している。送信リクエスト部206は、プロジェクション画像の各パーティションのうち表示領域に対応した所定数のパーティションのMP4ストリームの送信を、サービス送信システム100に要求する。
この場合、送信リクエスト部206では、デコード能力と、プロジェクション画像の各パーティションの符号化ストリームにおける画素数およびフレームレートの情報に基づき、所定数の値が、デコード可能な最大限あるいはそれに近い値とされる。ここで、各パーティションの符号化ストリームにおける画素数およびフレームレートの情報は、サービス送信システム100から予め受信されるMPDファイル(図25、図26参照)より取得できる。
「最大限の値の算出例」
図29は、8K/60Hz級のプロジェクション画像を、1920×1080(Full HD)のパーティションサイズで分割する例を示している。この場合、パーティションの面内画素数は1920*1080=2073600となり、画素レートは1920*1080*60=124416000となる。この場合、パーティションのデコードに要する複雑度のレベル値は“Level4.1”である。
図29は、8K/60Hz級のプロジェクション画像を、1920×1080(Full HD)のパーティションサイズで分割する例を示している。この場合、パーティションの面内画素数は1920*1080=2073600となり、画素レートは1920*1080*60=124416000となる。この場合、パーティションのデコードに要する複雑度のレベル値は“Level4.1”である。
例えば、サービス受信機200が4K/60Hzのデコード向けである“Level5.1”のデコーダを持つ場合、面内のLuma最大画素数は8912896となり、画素レート(毎秒処理可能な最大画素数)は534773760となる。そのため、この場合には、534773760/124416000=4.29・・・となり、最大限の値は4と算出される。この場合、サービス受信機200では最大で4個のパーティションのデコードが可能である。矢印Pで示す4個のパーティションは、この場合に選択される表示領域に対応したパーティションの例を示している。
また、例えば、サービス受信機200が4K/120Hzのデコード向けである“Level5.2”のデコーダを持つ場合、面内のLuma最大画素数は8912896となり、画素レート(毎秒処理可能な最大画素数)は1069547520となる。そのため、この場合には、1069547520/124416000=8.59・・・となり、最大限の値は8と算出される。この場合、サービス受信機200では最大で8個のパーティションのデコードが可能である。矢印Qで示す8個のパーティションは、この場合に選択される表示領域に対応したパーティションの例を示している。
図4に戻って、コンテナデコーダ203は、サービス送信システム100から送られてくる表示領域に対応した所定数のパーティションのMP4ストリームから各パーティションの符号化ストリームを取り出し、ビデオデコーダ204に送る。なお、タイル方式で分割が行われている場合には、表示領域に対応した所定数のパーティションのMP4ストリームだけでなく、タイルベースのMP4ストリームもサービス送信システム100から送られてくる。そのため、コンテナデコーダ203は、そのタイルベースのMP4ストリームに含まれるパラメータセット情報などを含む符号化ストリームもビデオデコーダ204に送る。
ビデオデコーダ204は、表示領域に対応した所定数のパーティションの符号化ストリームにデコード処理を施して、表示領域に対応した所定数のパーティションの画像データを得る。レンダラ205は、このように得られた所定数のパーティションの画像データに対してレンダリング処理を施し、表示領域に対応したレンダリング画像(画像データ)を得る。
この場合、レンダラ205は、ユーザの属性あるいは契約内容によって決定されたグループからユーザが所定のビューポイントグリッドを選択したとき、そのビューポイントグリッドをセンター位置とする表示用画像データを得る。ユーザは、メイン画像に重畳されるUI画像(図16、図18、図20参照)に基づいて、全体画像の範囲m1における現在の表示範囲を認識でき、また、自分がさらに選択可能なビューポイントグリッドも認識できる。ユーザは、この認識に基づいて、任意のビューポイントグリッドを選択して、表示画像の切り替えを行うことができる。
なお、ユーザは、任意のビューポイントグリッドを選択して表示画像の切り替えを行った後、表示画像のセンター位置をそのビューポイントグリッドの位置からずらすことも可能とされる。ユーザは、ビューポイントグリッドの選択、さらには表示画像のセンター位置のずらしを、例えば、以下のようにして行うことができる。
図30は、表示装置としてHMDが利用される場合の一例を示している。この場合、図30(b)に示すように、HMDを装着しているユーザが首をP1→P2→P3のように左から右に回していくと、HMDで観察される表示領域は、図30(a)に示すように、P1´→P2´→P3´のように移動していく。この場合、例えば、首を急に回した場合、つまり加速度が大きい場合には、その回転方向の次に位置するビューポイントグリッドが選択されて、表示画像が間欠的に変化していく。一方、首をゆっくり回した場合、つまり加速度が小さい場合には、表示領域はスクロール的に連続して変化していく。この場合、ビューポイントグリッドの位置と合ったこと、つまりビューポイントグリッドに同期したことをUI表示してユーザに知らせることも考えられる。図示の例では、P3´の方向でビューポイントグリッドの位置と合って、同期したことを示すマーク、例えばエクスクラメーションマーク「!」が表示されることを示している。
また、図31は、表示装置としてTVなどの表示パネルが利用される場合の一例を示している。この場合、図31(b)に示すように、音声指示をP1→P2→P3のように変化させていくと、表示パネルに表示される表示領域は、図31(a)に示すように、P1´→P2´→P3´のように移動していく。この場合は、表示領域はスクロール的に連続して変化していくが、“左側ビューポイント”、“右側ビューポイント”などの音声指示をすることで、指示方向のビューポイントグリッドが選択されて、表示画像が間欠的に変化していく。この場合、ビューポイントグリッドの位置と合ったこと、つまりビューポイントグリッドに同期したことをUI表示してユーザに知らせることも考えられる。図示の例では、P3´の方向でビューポイントグリッドの位置と合って、同期したことを示すマーク、例えばエクスクラメーションマーク「!」が表示されることを示している。
送信リクエスト部206は、表示領域がデコード範囲外に出ると予測された場合、当該表示領域を含むデコード範囲とするために、表示領域に対応した所定数のパーティションのMP4ストリームのセットの切り替えを決定し、サービス送信システム100に、新たなセット(配信ストリームセット)の送信を要求する。
図32は、表示領域の移動に伴う配信ストリームセットの切り替えの一例を示している。この例は、表示領域に対応した4個のパーティションのMP4ストリームが送信(配信)される例である。表示領域が、図32(a)に示す位置にあるとき、表示領域に対応したパーティションは(H0,V1)、(H1,V1)、(H0,V2)、(H1,V2)の位置の4個のパーティションとなり、これらのパーティションのMP4ストリームが、例えば(1)→(2)→(5)→(6)の順に送信される。
この場合、サービス受信機200では、これらのパーティションのMP4ストリームから符号化ストリームが取り出され、ビデオデコーダ204でデコードされる。すなわち、この場合のデコード範囲は、(H0,V1)、(H1,V1)、(H0,V2)、(H1,V2)の位置のパーティションとなる。
次に、表示領域が、図32(b)に示す位置に移動するとき、表示領域に対応したパーティションは(H1,V1)、(H2,V1)、(H1,V2)、(H2,V2)の位置の4個のパーティションとなる。そのため、配信ストリームセットの切り替えが行われ、これらのパーティションのMP4ストリームが、例えば(2)→(3)→(6)→(7)の順に送信される。
この場合、サービス受信機200では、これらのパーティションのMP4ストリームから符号化ストリームが取り出され、ビデオデコーダ204でデコードされる。すなわち、この場合のデコード範囲は、(H1,V1)、(H2,V1)、(H1,V2)、(H2,V2)の位置のパーティションとなる。
次に、表示領域が、図32(c)に示す位置に移動するとき、表示領域に対応したパーティションは(H2,V1)、(H3,V1)、(H2,V2)、(H3,V2)の位置の4個のパーティションとなる。そのため、配信ストリームセットの切り替えが行われ、これらのパーティションのMP4ストリームが、例えば(3)→(4)→(7)→(8)の順に送信される。
この場合、サービス受信機200では、これらのパーティションのMP4ストリームから符号化ストリームが取り出され、ビデオデコーダ204でデコードされる。すなわち、この場合のデコード範囲は、(H2,V1)、(H3,V1)、(H2,V2)、(H3,V2)の位置のパーティションとなる。
図33は、表示領域の移動に伴う配信ストリームセットの切り替えの他の一例を示している。この例は、表示領域に対応した6個のパーティションのMP4ストリームが送信(配信)される例である。表示領域が、図33(a)の左側に示す位置にあるとき、表示領域に対応したパーティションは(H0,V1)、(H1,V1)、(H2,V1)、(H0,V2)、(H1,V2)、(H2,V2)の位置の6個のパーティションとなり、これらのパーティションのMP4ストリームが、例えば(1)→(2)→(3)→(5)→(6)→(7)の順に送信される。
この場合、サービス受信機200では、これらのパーティションのMP4ストリームから符号化ストリームが取り出され、ビデオデコーダ204でデコードされる。すなわち、この場合のデコード範囲は、(H0,V1)、(H1,V1)、(H2,V1)、(H0,V2)、(H1,V2)、(H2,V2)の位置のパーティションとなる。
次に、表示領域が、図33(a)の右側に示す位置に移動するとき、表示領域に対応したパーティションは(H0,V1)、(H1,V1)、(H2,V1)、(H0,V2)、(H1,V2)、(H2,V2)の位置の6個のパーティションのままとなる。そのため、配信ストリームセットの切り替えはなく、これらのパーティションのMP4ストリームが、例えば(1)→(2)→(3)→(5)→(6)→(7)の順に送信される。
この場合、サービス受信機200では、これらのパーティションのMP4ストリームから符号化ストリームが取り出され、ビデオデコーダ204でデコードされる。すなわち、この場合のデコード範囲は、(H1,V1)、(H2,V1)、(H1,V2)、(H2,V2)の位置のパーティションとなる。
次に、表示領域が、図33(b)に示す位置に移動するとき、表示領域に対応したパーティションは(H1,V1)、(H2,V1)、(H3,V1)、(H1,V2)、(H2,V2)、(H3,V2)の位置の6個のパーティションとなる。そのため、配信ストリームセットの切り替えが行われ、これらのパーティションのMP4ストリームが、例えば(2)→(3)→(4)→(6)→(7)→(8)の順に送信される。
この場合、サービス受信機200では、これらのパーティションのMP4ストリームから符号化ストリームが取り出され、ビデオデコーダ204でデコードされる。すなわち、この場合のデコード範囲は、(H1,V1)、(H2,V1)、(H3,V1)、(H1,V2)、(H2,V2)、(H3,V2)の位置のパーティションとなる。
上述の図32および図33の例から明らかなように、表示領域に対応したパーティションの数を多くする程、表示領域の変化に伴った配信ストリームセットの切り替えの頻度が少なくなることがわかる。配信ストリームセットの切り替えがあると、送信要求をして、新たなセットのMP4ストリームの送信を受けることが必要となり、デコード処理が完了して表示が開始されるまでのタイムラグが発生し、VR再生における表示性能が劣化する。
この実施の形態では、表示領域に対応したパーティションの数を、サービス受信機200のデコード可能な最大限あるいはそれに近い値とされるので、表示領域の移動に伴う配信ストリームセットの切り替え頻度を低く抑えることができ、VR再生における表示性能を改善できる。
「サービス送信システムの構成例」
図34は、サービス送信システム100の構成例を示している。このサービス送信システム100は、制御部101と、ユーザ操作部101aと、360°画キャプチャ部102と、平面パッキング部103と、ビデオエンコーダ104と、コンテナエンコーダ105と、ストレージ106を備える通信部107を有している。
図34は、サービス送信システム100の構成例を示している。このサービス送信システム100は、制御部101と、ユーザ操作部101aと、360°画キャプチャ部102と、平面パッキング部103と、ビデオエンコーダ104と、コンテナエンコーダ105と、ストレージ106を備える通信部107を有している。
制御部101は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、サービス送信システム100の各部の動作を制御する。ユーザ操作部101aは、ユーザが種々の操作を行うためのキーボード、マウス、タッチパネル、リモコンなどである。
360°画キャプチャ部102は、所定数のカメラで被写体を撮像して、球面キャプチャ画像(360°VR画像)の画像データを得る。例えば、360°画キャプチャ部102は、バック・ツー・バック(Back to Back)方式で撮像を行って、球面キャプチャ画像として、それぞれ魚眼レンズを用いて撮像された180°以上の視野角を持つ、超広視野角の前面画像および後面画像を得る(図5(a)参照)。
平面パッキング部103は、360°画キャプチャ部102で得られた球面キャプチャ画像の一部または全部を切り取って平面パッキングして長方形のプロジェクション画像(Projection picture)を得る(図5(b)参照)。この場合、プロジェクション画像のフォーマットタイプとしては、例えば、エクイレクタングラー(Equirectangular)、クロスキュービック(Cross-cubic)などが選択される。なお、平面パッキング部では、プロジェクション画像に必要に応じてスケーリングを施し、所定の解像度のプロジェクション画像を得る(図5(c)参照)。
ビデオエンコーダ104は、平面パッキング部103からのプロジェクション画像の画像データに対して、例えば、MPEG4-AVCあるいはHEVCなどの符号化を施して符号化画像データを得、この符号化画像データを含む符号化ストリームを生成する。この場合、ビデオエンコーダ104は、プロジェクション画像を複数のパーティション(分割領域)に分割し、各パーティションに対応した符号化ストリームを得る。符号化ストリームのSPS NALユニットには、切り出し位置情報が挿入されている(図6の「conformance_window」の情報参照)。
ここで、ビデオエンコーダ104は、プロジェクション画像の各パーティションに対応した符号化ストリームを得るために、例えば、各パーティションを個別に符号化するか、あるいはプロジェクション画像の全体を一括して符号化するが、各パーティションをタイルとするタイル機能を用いた符号化をする。これにより、受信側では、各パーティションに対応した符号化ストリームを独立してデコードすることが可能となる。
また、ビデオエンコーダ104は、アクセスユニット(AU)の“SEIs”の部分に、レンダリングメタデータ(レンダリング用メタ情報)を持つSEIメッセージ(SEI message)を挿入する。レンダリング用メタ情報には、球面キャプチャ画像を平面パッキングする場合の切り取り範囲の情報、プロジェクション画像の元のサイズからのスケーリング比の情報、プロジェクション画像のフォーマットタイプの情報、切り出し位置の中心O(p,q)をプロジェクション画像の基準点RP(x,y)と一致させるという後方互換性の設定がなされているかどうかを示す情報などが挿入されている(図9参照)。
また、このレンダリング用メタ情報には、グループ分けされた所定数のビューポイントグリッドの情報が含まれている(図12参照)。このビューポイントグリッドの情報には、アジマス角度(方位情報)とエレベーション角度(仰角情報)の情報が含まれている。
コンテナエンコーダ105は、ビデオエンコーダ104で生成された符号化ストリームを含むコンテナ、ここではMP4ストリームを、配信ストリームとして生成する。この場合、各パーティションに対応した符号化ストリームをそれぞれ含む複数のMP4ストリームが生成される(図27、図28参照)。この場合、コンテナエンコーダ105は、コンテナのレイヤに、レンダリングメタデータ(図9参照)を挿入する。
ここで、コンテナエンコーダ105は、各パーティションをタイルとするタイル機能を用いた符号化を行っている場合、各パーティションに対応した符号化ストリームをそれぞれ含む複数のMP4ストリームの他に、サブレイヤ情報等を含むSPSなどのパラメータセットを含むベース(base)のMP4(ベースコンテナ)を生成する(図27参照)。
また、コンテナエンコーダ105は、コンテナのレイヤ、具体的には、MP4のイニシャライゼーション・セグメント(IS)に、パーティション・デスクリプタ(図23参照)を挿入する。このパーティション・デスクリプタには、パーティションの画素数およびフレームレートの情報などが含まれている。
通信部107が備えるストレージ106は、コンテナエンコーダ105で生成された各パーティションのMP4ストリームを蓄積する。なお、タイル方式で分割されている場合には、ストレージ106は、タイルベースのMP4ストリームも蓄積する。また、このストレージ106は、例えばコンテナデコーダ105で生成されるMPDファイル(図25、図26参照)も蓄積する。
通信部107は、サービス受信機200からの配信要求リクエストを受信し、それに対応してサービス受信機200にMPDファイルを送信する。サービス受信機200は、このMPDファイルにより、配信ストリームの構成を認識する。
また、通信部107は、サービス受信機200からの表示領域に対応した所定数のパーティションに対応したMP4ストリームの配信要求(送信要求)を受信し、そのMP4ストリームをサービス受信機200に送信する。例えば、サービス受信機200からの配信要求においては、パーティションIDによって、必要とするパーティションが指定される。
「サービス受信機の構成例」
図35は、サービス受信機200の構成例を示している。このサービス受信機200は、制御部201と、UI部201aと、センサ部201bと、通信部202と、コンテナデコーダ203と、ビデオデコーダ204と、レンダラ205と、表示部207を有している。
図35は、サービス受信機200の構成例を示している。このサービス受信機200は、制御部201と、UI部201aと、センサ部201bと、通信部202と、コンテナデコーダ203と、ビデオデコーダ204と、レンダラ205と、表示部207を有している。
制御部201は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、サービス受信機200の各部の動作を制御する。UI部201aは、ユーザインタフェースを行うためものであり、例えば、表示領域の移動をユーザが操作するためのポインティングデバイスや、ユーザが音声で表示領域の移動を指示するために音声入力するためのマイクロホン等もこれに含まれる。センサ部201bは、ユーザ状態や環境の情報を取得するための種々のセンサを備えるものであり、例えば、HMD(Head Mounted Display)に搭載されている姿勢検出センサなどもこれに含まれる。
通信部202は、制御部201の制御のもと、配信要求リクエストをサービス送信システム100に送信し、それに対応してサービス送信システム100からMPDファイル(図25、図26参照)を受信する。通信部202は、このMPDファイルを制御部201に送る。これにより、制御部201は、配信ストリームの構成を認識する。
また、通信部202は、制御部201の制御のもと、表示領域に対応した所定数のパーティションに対応したMP4ストリームの配信要求(送信要求)をサービス送信システム100に送信し、それに対応してサービス送信システム100から所定数のパーティションに対応したMP4ストリームを受信する。
ここで、制御部101は、HMD搭載のジャイロセンサ等で得られる動きの方向と量の情報に基づいて、あるいはユーザ操作によるポインティング情報あるいはユーザの音声UI情報に基づいて、表示領域の移動の方向や速度、さらにはビューポイントグリッドの切り替えの情報を得て、表示領域に対応した所定数のパーティションを選択する。この場合、制御部101は、デコード能力と、MPDファイルから認識された各パーティションの符号化ストリームにおける画素数およびフレームレートの情報に基づき、所定数の値を、デコード可能な最大限あるいはそれに近い値に設定する。図4に示す送信リクエスト部206は、制御部101により構成されている。
また、制御部201は、ユーザ識別の機能を備えている。制御部201は、ユーザの属性(年齢、性別、興味、習熟度、ログイン情報など)あるいは契約内容に基づいて、いかなるユーザかを識別し、当該ユーザが利用可能なビューポイントグリッドのグループを決定する。そして、制御部201は、レンダラ205をユーザが利用可能なグループのビューポイントグリッドを利用する状態とする。
なお、図示の例においては、レンダラ205と表示部207を1系統だけ有するものであるが、例えば、ゲーム機等を想定すると、レンダラ205と表示部207を複数系統有し、複数のユーザがそれぞれ独立した表示画像を見ることができるものも考えられる。その場合には、複数のユーザに関してそれぞれ上述したと同様のユーザ識別を行って、それぞれの系統のレンダラ205をそれぞれのユーザが利用可能なグループのビューポイントグリッドを利用し得るように制御することも可能である。
コンテナデコーダ203は、通信部202で受信された表示領域に対応した所定数のパーティションのMP4ストリームから、“moof”ブロックの情報などに基づいて、各パーティションの符号化ストリームを取り出し、ビデオデコーダ204に送る。なお、タイル方式で分割が行われている場合には、表示領域に対応した所定数のパーティションのMP4ストリームだけでなく、タイルベースのMP4ストリームも通信部202で受信されるため、そのタイルベースのMP4ストリームに含まれるパラメータセット情報などを含む符号化ストリームもビデオデコーダ204に送る。
また、コンテナデコーダ203は、各MP4ストリームのイニシャライゼーション・セグメント(IS)に挿入されているパーティション・デスクリプタ(図23参照)を取り出し、制御部201に送る。制御部201は、このデスクリプタから、各パーティションにおける画素数およびフレームレートの情報を取得する。また、コンテナデコーダ203は、各MP4ストリームから“moov”ブロックの情報などを取り出し、制御部201に送る。“moov”ブロックの情報の一つとしてレンダリングメタデータ(図9参照)が存在し、制御部201はグループ分けされたビューポイントグリッドの情報などを取得する。
ビデオデコーダ204は、コンテナデコーダ203から供給される表示領域に対応した所定数のパーティションの符号化ストリームにデコード処理を施して画像データを得る。また、ビデオデコーダ204は、コンテナデコーダ203で取り出されたビデオストリームに挿入されているパラメータセットやSEIメッセージを抽出し、制御部201に送る。この抽出情報には、SPS NALパケットに挿入されている切り出し位置「conformance_window」の情報、さらにはレンダリングメタデータ(図9参照)を持つSEIメッセージも含まれる。
レンダラ205は、ビデオデコーダ204で得られた所定数のパーティションの画像データに対してレンダリング処理を施し、表示領域に対応したレンダリング画像(画像データ)を得る。この場合、レンダラ205は、ユーザの属性あるいは契約内容によって決定されたグループからユーザが所定のビューポイントグリッドを選択したとき、そのビューポイントグリッドをセンター位置とする表示用画像データを得る。
ユーザは、メイン画像に重畳されるUI画像(図16、図18、図20参照)に基づいて、全体画像の範囲m1における現在の表示範囲を認識でき、また、自分がさらに選択可能なビューポイントグリッドも認識できる。ユーザは、この認識に基づいて、任意のビューポイントグリッドを選択して、表示画像の切り替えを行うことができる(図30、図31参照)。表示部207は、レンダラ205で得られたレンダリング画像(画像データ)を表示する。この表示部207は、例えば、HMD(Head Mounted Display)や表示パネルなどで構成される。制御部201から表示部207には、上述したように、ビューポイントグリッドの位置に同期したことをマーク表示等でユーザに知らせるために(図30、図31参照)、グリッド位置同期通知情報も与えられる。なお、ユーザへの通知は、音で行うことも考えられる。
上述したように、図3に示す送受信システム10において、サービス送信システム100は、広視野角画像の画像データを符号化して得られた符号化ストリームと共に、グループ分けされた所定数のビューポイントグリッドの情報を含むレンダリング用メタ情報を送信するものである。そのため、サービス受信機200では、符号化ストリームを復号化して得られた広視野角画像の画像データをレンダリング用メタ情報に基づいて処理して表示用画像データを得ることができ、用途別あるいはユーザ別に、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示することが可能となる。
<2.変形例>
「MPEG-2 TS、MMTへの適用」
なお、上述実施の形態においては、コンテナがMP4(ISOBMFF)である例を示した。しかし、本技術は、コンテナがMP4に限定されるものではなく、MPEG-2 TSやMMTなどの他のフォーマットのコンテナであっても同様に適用し得る。
「MPEG-2 TS、MMTへの適用」
なお、上述実施の形態においては、コンテナがMP4(ISOBMFF)である例を示した。しかし、本技術は、コンテナがMP4に限定されるものではなく、MPEG-2 TSやMMTなどの他のフォーマットのコンテナであっても同様に適用し得る。
例えば、MPEG-2 TSの場合には、図4に示すサービス送信システム100のコンテナエンコーダ105では、プロジェクション画像の各パーティションの符号化ストリームを含むトランスポートストリーム(Transport Stream)が生成される。
図36は、ビデオ符号化がタイル対応の場合におけるトランスポートストリームの構成例を示している。この構成例では、PID0で識別されるタイルベースの符号化ストリームのPESパケット「video PES0」が存在する。このPESパケット「video PES0」のペイロードには、「AUD」、「VPS」、「SPS」、「PPS」、「PSEI」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」にはレンダリングメタデータ(図9参照)を持つSEIメッセージが挿入されている。
また、PID1~PID4で識別される第1~第4のパーティション(タイル)の符号化ストリームのPESパケット「video PES1」~「video PES4」が存在する。これらのPESパケットのペイロードには、「AUD」、「SLICE」のNALユニットが配置されている。
また、PMTに、PESパケット「video PES0」~「video PES4」に対応したビデオエレメンタリストリームループ(video ES loop)が存在する。各ループには、符号化ストリームに対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、その符号化ストリームに関連する情報を記述するデスクリプタも配置される。このストリームタイプは、ビデオストリームを示す“0x24”とされる。また、デスクリプタの一つとして、パーティション・デスクリプタ(図23参照)と、レンダリングメタデータ(図9参照)を含むレンダリング・メタデータ・デスクリプタが挿入されている。
なお、ビデオ符号化がパーティション毎に独立ストリームに符号化される場合におけるトランスポートストリームの構成例については、図示は省略するが、同様の構成となる。この場合、タイルベースの符号化ストリームのPESパケット「video PES0」に対応する部分がなく、また、第1~第4のパーティションの符号化ストリームのPESパケット「video PES1」~「video PES4」のペイロードには、「AUD」、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」のNALユニットが配置されたものとなる。
また、例えば、MMTの場合には、図4に示すサービス送信システム100のコンテナエンコーダ104では、ビデオストリームを含むMMTストリーム(MMT Stream)が生成される。
図37は、ビデオ符号化がタイル対応の場合におけるMMTストリームの構成例を示している。この構成例では、ID0で識別されるタイルベースの符号化ストリームのMPUパケット「video MPU0」が存在する。このMPUパケット「video MPU0」のペイロードには、「AUD」、「VPS」、「SPS」、「PPS」、「PSEI」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」にはレンダリングメタデータ(図9参照)を持つSEIメッセージが挿入されている。
また、ID1~ID4で識別される第1~第4のパーティション(タイル)の符号化ストリームのMPUパケット「video MPU1」~「video MPU4」が存在する。これらのMPUパケットのペイロードには、「AUD」、「SLICE」のNALユニットが配置されている。
また、MPTに、MPUパケット「video MPU0」~「video MPU4」に対応したビデオアセットループ(video asset loop)が存在する。各ループには、符号化ストリームに対応して、アセットタイプ、アセット識別子(ID)等の情報が配置されると共に、その符号化ストリームに関連する情報を記述するデスクリプタも配置される。このアセットタイプは、ビデオストリームを示す“0x24”とされる。また、デスクリプタの一つとして、パーティション・デスクリプタ(図23参照)と、レンダリングメタデータ(図9参照)を含むレンダリング・メタデータ・デスクリプタが挿入されている。
なお、ビデオ符号化がパーティション毎に独立ストリームに符号化される場合におけるMMTストリームの構成例については、図示は省略するが、同様の構成となる。この場合、タイルベースの符号化ストリームのMPUパケット「video MPU0」に対応する部分がなく、また、第1~第4のパーティションの符号化ストリームのMPUパケット「video MPU1」~「video MPU4」のペイロードには、「AUD」、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」のNALユニットが配置されたものとなる。
また、上述実施の形態においては、ビデオ符号化がタイル対応の場合に、タイルストリームをマルチストリーム構成とする例を示したが、このタイルストリームをシングルストリーム構成とすることも考えられる。
図38は、タイルストリームをシングルストリーム構成とする場合におけるMPDファイルの記述例を示している。このMPDファイルには、タイルストリームに対応したMP4ストリーム(トラック)に対応するアダプテーションセット(AdaptationSet)が存在する。
アダプテーションセットにおいて、「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.Lxxx,xx,hev1.yy.yy.Lxxx,yy”>」の記述により、ビデオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのビデオストリームはMP4ファイル構造で供給され、HEVC符号化されたビデオストリーム(符号化画像データ)の存在が示されている。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:format_type” value/>」の記述により、プロジェクション画像のフォーマットタイプが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:framerate” value/>」の記述により、ピクチャのフレームレート(フルフレームレート)が示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:tilepartitionflag” value=“1”/>」の記述により、タイル方式でピクチャ分割されているか否かが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:tilebaseflag” value=“0”/>」の記述により、タイルベース以外のコンテナであることが示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:wholepicturesizehorizontal” value/>」の記述により、ピクチャ全体の水平画素数が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:wholepicturesizevertical” value/>」の記述により、ピクチャ全体の垂直画素数が示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionid” value/>」の記述により、パーティションIDが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionstartpositionhorizontal” value/>」の記述により、パーティションの水平開始画素位置が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitiontartpositionvertical” value/>」の記述により、パーティションの水平終了画素位置が示される。
「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionendpositionhorizontal” value/>」の記述により、パーティションの垂直開始画素位置が示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:partitionendpositionvertical” value/>」の記述により、パーティションの垂直終了画素位置が示される。また、上述のパーティションIDからサブレイヤのフレームレートまでの記述が、タイル符号化におけるパーティションの数だけ繰り返される。
また、アダプテーションセットにおいて、ビデオストリームに対応したリプレゼンテーション(Representation)が存在する。このリプレゼンテーションにおいて、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:renderingmetadata” value=“1”/>」の記述により、レンダリングメタデータ(Rendering_metadata)の存在が示される。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:projectiontype” value=“0”/>」の記述により、プロジェクション画像のフォーマットタイプがエクイレクタングラー(Equirectangular)であることが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:backwardcompatible” value=“1”/>」の記述により、後方互換性の設定がなされていること、つまりビデオストリームのレイヤに挿入される切り出し位置情報で示される切り出し位置の中心O(p,q)がプロジェクション画像の基準点RP(x,y)と一致するように設定されていることが示される。
また、このリプレゼンテーションにおいて、「width=“" height=“" frameRate=“"」、「codecs="hev1.xx.xx.Lxxx,xx"」、「level= “0”」の記述により、解像度、フレームレート、コーデックの種類が示され、さらにタグ情報としてレベル“0”が付与されることが示される。また、「<BaseURL>videostreamVR.mp4</BaseURL>」の記述により、このMP4ストリームのロケーション先が、「videostreamVR0.mp4」として示される。
図39は、タイルストリームをシングルストリーム構成とする場合におけるMP4ストリーム(トラック)を概略的に示している。この場合、タイルストリームに対応した1つのMP4ストリームが存在する。このMP4ストリームは、同様に、各ランダムアクセス期間が、イニシャライゼーション・セグメント(IS:initialization segment)から始まり、それに、“styp”、“sidx(Segment index box)”、“ssix(Sub-segment index box)”、“moof(Movie fragment box)”、“mdat(Media data box)”のボックスが続いた構成となっている。
イニシャライゼーション・セグメント(IS)は、ISOBMFF(ISO Base Media File Format)に基づくボックス(Box)構造を持つ。このイニシャライゼーション・セグメント(IS)に、パーティション・デスクリプタ(図23参照)およびレンダリング・メタデータ(図9参照)が挿入されている。なお、この場合のパーティション・デスクリプタは、タイル符号化における全てのパーティション(タイル)の情報を含むものとなる。mdat”ボックスには、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」のNALユニットとして、レンダリングメタデータ(Rendering_metadata)(図9参照)を持つSEIメッセージが挿入されている。
図40は、タイルストリームをシングルストリーム構成とする場合におけるトランスポートストリームの構成例を示している。この構成例では、PID1で識別されるタイルストリームのPESパケット「video PES1」が存在する。このPESパケット「video PES1」のペイロードには、「AUD」、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」にはレンダリングメタデータ(図9参照)を持つSEIメッセージが挿入されている。
また、PMTに、PESパケット「video PES1」に対応したビデオエレメンタリストリームループ(video ES1 loop)が存在する。このループには、タイルストリームに対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのタイルストリームに関連する情報を記述するデスクリプタも配置される。このストリームタイプは、ビデオストリームを示す“0x24”とされる。また、デスクリプタの一つとして、パーティション・デスクリプタ(図23参照)と、レンダリングメタデータ(図9参照)を含むレンダリング・メタデータ・デスクリプタが挿入されている。なお、この場合のパーティション・デスクリプタは、タイル符号化における全てのパーティション(タイル)の情報を含むものとなる。
図41は、タイルストリームをシングルストリーム構成とする場合におけるMMTストリームの構成例を示している。この構成例では、ID1で識別されるタイルストリームのMPUパケット「video MPU1」が存在する。このMPUパケット「video MPU1」のペイロードには、「AUD」、「VPS」、「SPS」、「PPS」、「PSEI」、「SLICE」、「SSEI」のNALユニットが配置されている。「SPS」には切出し位置「Conformance_window」の情報が挿入されている。また、「SSEI」にはレンダリングメタデータ(図9参照)を持つSEIメッセージが挿入されている。
また、MPTに、MPUパケット「video MPU1」に対応したビデオアセットループ(video asset1 loop)が存在する。このループには、タイルストリームに対応して、アセットタイプ、アセット識別子(ID)等の情報が配置されると共に、そのタイルストリームに関連する情報を記述するデスクリプタも配置される。このアセットタイプは、ビデオストリームを示す“0x24”とされる。また、デスクリプタの一つとして、パーティション・デスクリプタ(図23参照)と、レンダリングメタデータ(図9参照)を含むレンダリング・メタデータ・デスクリプタが挿入されている。なお、この場合のパーティション・デスクリプタは、タイル符号化における全てのパーティション(タイル)の情報を含むものとなる。
また、上述実施の形態においては、コンテナがMP4である場合に、符号化ビデオの「SLICE」をコンテナするトラックでパーティション・デスクリプタおよびレンダリングメタデータをコンテナする例を示した(図27、図28、図39参照)。しかし、図42、図43、図44に示すように、符号化ビデオの「SLICE」をコンテナするトラック「track1A, 2A, 3A, 4A」に対して、パーティション・デスクリプタおよびレンダリングメタデータを別のトラック「track 1B, 2B, 3B, 4B」の“mdat”でコンテナする構成も考えられる。
図42、図43、図44に示すような構成とすることで、サンプル(Sample)毎に関連するピクチャとの時間的な同期が確保される。この場合、各々のパーティション・デスクリプタおよびレンダリングメタデータを含むトラックは、自身のイニシャライゼーション・セグメント(IS)内の“tref”により、符号化ビデオが含まれるトラックの参照ターゲットを明示する。
また、上述実施の形態においては、サービス送信システム100とサービス受信機200からなる送受信システム10の例を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、サービス受信機200の部分が、例えばHDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびディスプレイとされる場合も考えられる。なお、「HDMI」は登録商標である。
また、本技術は、以下のような構成を取ることもできる。
(1)広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信する送信部を備える
送信装置。
(2)上記広視野角画像は、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られたプロジェクション画像である
前記(1)に記載の送信装置。
(3)上記ビューポイントの情報は、該ビューポイントの位置を示すアジマス角度およびエレベーション角度の情報を持つ
前記(1)または(2)に記載の送信装置。
(4)上記送信部は、上記レンダリング用メタ情報を、上記符号化ストリームのレイヤおよび/または該符号化ストリームを含むコンテナのレイヤに挿入して送信する
前記(1)から(3)のいずれかに記載の送信装置。
(5)上記送信部は、上記符号化ストリームに関するメタ情報を持つメタファイルをさらに送信し、
上記メタファイルに、上記符号化ストリームおよび/または上記コンテナのレイヤに上記レンダリング用メタ情報の挿入があることを示す識別情報が含まれる
前記(4)に記載の送信装置。
(6)上記コンテナは、ISOBMFFであり、
上記送信部は、上記レンダリング用メタ情報を、moovボックスに挿入して送信する
前記(4)に記載の送信装置。
(7)上記コンテナは、ISOBMFFであり、
上記送信部は、上記レンダリング用メタ情報を、上記広視野角画像の画像データを符号化して得られた符号化ストリームを含むトラックとは別のトラックで送信する
前記(4)に記載の送信装置。
(8)上記コンテナは、MPEG2-TSであり、
上記送信部は、上記レンダリング用メタ情報を、プログラム・マップ・テーブルに挿入して送信する
前記(4)に記載の送信装置。
(9)上記コンテナは、MMTストリームであり、
上記送信部は、上記レンダリング用メタ情報を、MMT・パッケージ・テーブルに挿入して送信する
前記(4)に記載の送信装置。
(10)上記広視野角画像の画像データを符号化して得られた符号化ストリームは、上記広視野角画像を分割して得られた各分割領域に対応した符号化ストリームである
前記(1)から(9)のいずれかに記載の送信装置。
(11)上記各分割領域の符号化ストリームは、上記広視野角画像の各分割領域を個別に符号化することで得られる
前記(10)に記載の送信装置。
(12)上記各分割領域の符号化ストリームは、上記広視野角画像の各分割領域をタイルとするタイル機能を用いた符号化を行うことで得られる
前記(10)に記載の送信装置。
(13)上記ビューポイントの情報は、該ビューポイントが位置する分割領域の情報を含む
前記(10)から(12)のいずれかに記載の送信装置。
(14)送信部が、広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を送信するステップを有する
送信方法。
(15)広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を受信する受信部と、
上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記ビューポイントの情報に基づいて処理して表示用画像データを得る処理部を備える
受信装置。
(16)上記処理部は、ユーザの属性あるいは契約内容によって決定されたグループのビューポイントの情報を用いる
前記(15)に記載の受信装置。
(17)上記処理部は、ユーザ操作で選択されたビューポイントの情報で示される位置をセンター位置とする表示用画像データを得る
前記(16)に記載の受信装置。
(18)上記受信部は、上記広視野角画像の画像データを符号化して得られた符号化ストリームとして、上記広視野角画像を分割して得られた各分割領域に対応した符号化ストリームを受信し、
上記処理部は、各分割領域に対応した符号化ストリームのうち上記表示用画像データを得るために用いる所定数の分割領域の符号化ストリームを復号化する
前記(15)から(17)のいずれかに記載の受信装置。
(19)上記受信部は、上記所定数の分割領域の符号化ストリームの送信を配信サーバに要求し、該配信サーバから該所定数の分割領域の符号化ストリームを受信する
前記(18)に記載の受信装置。
(20)受信部が、広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を受信する受信ステップと、
処理部が、上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記レンダリング用メタ情報に基づいて処理して表示用画像データを得る処理ステップを有する
受信方法。
(1)広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信する送信部を備える
送信装置。
(2)上記広視野角画像は、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られたプロジェクション画像である
前記(1)に記載の送信装置。
(3)上記ビューポイントの情報は、該ビューポイントの位置を示すアジマス角度およびエレベーション角度の情報を持つ
前記(1)または(2)に記載の送信装置。
(4)上記送信部は、上記レンダリング用メタ情報を、上記符号化ストリームのレイヤおよび/または該符号化ストリームを含むコンテナのレイヤに挿入して送信する
前記(1)から(3)のいずれかに記載の送信装置。
(5)上記送信部は、上記符号化ストリームに関するメタ情報を持つメタファイルをさらに送信し、
上記メタファイルに、上記符号化ストリームおよび/または上記コンテナのレイヤに上記レンダリング用メタ情報の挿入があることを示す識別情報が含まれる
前記(4)に記載の送信装置。
(6)上記コンテナは、ISOBMFFであり、
上記送信部は、上記レンダリング用メタ情報を、moovボックスに挿入して送信する
前記(4)に記載の送信装置。
(7)上記コンテナは、ISOBMFFであり、
上記送信部は、上記レンダリング用メタ情報を、上記広視野角画像の画像データを符号化して得られた符号化ストリームを含むトラックとは別のトラックで送信する
前記(4)に記載の送信装置。
(8)上記コンテナは、MPEG2-TSであり、
上記送信部は、上記レンダリング用メタ情報を、プログラム・マップ・テーブルに挿入して送信する
前記(4)に記載の送信装置。
(9)上記コンテナは、MMTストリームであり、
上記送信部は、上記レンダリング用メタ情報を、MMT・パッケージ・テーブルに挿入して送信する
前記(4)に記載の送信装置。
(10)上記広視野角画像の画像データを符号化して得られた符号化ストリームは、上記広視野角画像を分割して得られた各分割領域に対応した符号化ストリームである
前記(1)から(9)のいずれかに記載の送信装置。
(11)上記各分割領域の符号化ストリームは、上記広視野角画像の各分割領域を個別に符号化することで得られる
前記(10)に記載の送信装置。
(12)上記各分割領域の符号化ストリームは、上記広視野角画像の各分割領域をタイルとするタイル機能を用いた符号化を行うことで得られる
前記(10)に記載の送信装置。
(13)上記ビューポイントの情報は、該ビューポイントが位置する分割領域の情報を含む
前記(10)から(12)のいずれかに記載の送信装置。
(14)送信部が、広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を送信するステップを有する
送信方法。
(15)広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を受信する受信部と、
上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記ビューポイントの情報に基づいて処理して表示用画像データを得る処理部を備える
受信装置。
(16)上記処理部は、ユーザの属性あるいは契約内容によって決定されたグループのビューポイントの情報を用いる
前記(15)に記載の受信装置。
(17)上記処理部は、ユーザ操作で選択されたビューポイントの情報で示される位置をセンター位置とする表示用画像データを得る
前記(16)に記載の受信装置。
(18)上記受信部は、上記広視野角画像の画像データを符号化して得られた符号化ストリームとして、上記広視野角画像を分割して得られた各分割領域に対応した符号化ストリームを受信し、
上記処理部は、各分割領域に対応した符号化ストリームのうち上記表示用画像データを得るために用いる所定数の分割領域の符号化ストリームを復号化する
前記(15)から(17)のいずれかに記載の受信装置。
(19)上記受信部は、上記所定数の分割領域の符号化ストリームの送信を配信サーバに要求し、該配信サーバから該所定数の分割領域の符号化ストリームを受信する
前記(18)に記載の受信装置。
(20)受信部が、広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を受信する受信ステップと、
処理部が、上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記レンダリング用メタ情報に基づいて処理して表示用画像データを得る処理ステップを有する
受信方法。
本技術の主な特徴は、広視野角画像の画像データを符号化して得られた符号化ストリームと共に、グループ分けされた所定数のビューポイントグリッドの情報を含むレンダリング用メタ情報を送信することで、用途別あるいはユーザ別に、広視野角画像内の一定の部分画像を受信機間で一貫性をもって表示することが可能としたことである(図12、図15-図20参照)。
10・・・送受信システム
100・・・サービス送信システム
101・・・制御部
101a・・・ユーザ操作部
102・・・360°画キャプチャ部
103・・・平面パッキング部
104・・・ビデオエンコーダ
105・・・コンテナエンコーダ
106・・・ストレージ
107・・・通信部
200・・・サービス受信機
201・・・制御部
201a・・・UI部
201b・・・センサ部
202・・・通信部
203・・・コンテナデコーダ
204・・・ビデオデコーダ
205・・・レンダラ
206・・・送信リクエスト部
207・・・表示部
100・・・サービス送信システム
101・・・制御部
101a・・・ユーザ操作部
102・・・360°画キャプチャ部
103・・・平面パッキング部
104・・・ビデオエンコーダ
105・・・コンテナエンコーダ
106・・・ストレージ
107・・・通信部
200・・・サービス受信機
201・・・制御部
201a・・・UI部
201b・・・センサ部
202・・・通信部
203・・・コンテナデコーダ
204・・・ビデオデコーダ
205・・・レンダラ
206・・・送信リクエスト部
207・・・表示部
Claims (20)
- 広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を送信する送信部を備える
送信装置。 - 上記広視野角画像は、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られたプロジェクション画像である
請求項1に記載の送信装置。 - 上記ビューポイントの情報は、該ビューポイントの位置を示すアジマス角度およびエレベーション角度の情報を持つ
請求項1に記載の送信装置。 - 上記送信部は、上記レンダリング用メタ情報を、上記符号化ストリームのレイヤおよび/または該符号化ストリームを含むコンテナのレイヤに挿入して送信する
請求項1に記載の送信装置。 - 上記送信部は、上記符号化ストリームに関するメタ情報を持つメタファイルをさらに送信し、
上記メタファイルに、上記符号化ストリームおよび/または上記コンテナのレイヤに上記レンダリング用メタ情報の挿入があることを示す識別情報が含まれる
請求項4に記載の送信装置。 - 上記コンテナは、ISOBMFFであり、
上記送信部は、上記レンダリング用メタ情報を、moovボックスに挿入して送信する
請求項4に記載の送信装置。 - 上記コンテナは、ISOBMFFであり、
上記送信部は、上記レンダリング用メタ情報を、上記広視野角画像の画像データを符号化して得られた符号化ストリームを含むトラックとは別のトラックで送信する
請求項4に記載の送信装置。 - 上記コンテナは、MPEG2-TSであり、
上記送信部は、上記レンダリング用メタ情報を、プログラム・マップ・テーブルに挿入して送信する
請求項4に記載の送信装置。 - 上記コンテナは、MMTストリームであり、
上記送信部は、上記レンダリング用メタ情報を、MMT・パッケージ・テーブルに挿入して送信する
請求項4に記載の送信装置。 - 上記広視野角画像の画像データを符号化して得られた符号化ストリームは、上記広視野角画像を分割して得られた各分割領域に対応した符号化ストリームである
請求項1に記載の送信装置。 - 上記各分割領域の符号化ストリームは、上記広視野角画像の各分割領域を個別に符号化することで得られる
請求項10に記載の送信装置。 - 上記各分割領域の符号化ストリームは、上記広視野角画像の各分割領域をタイルとするタイル機能を用いた符号化を行うことで得られる
請求項10に記載の送信装置。 - 上記ビューポイントの情報は、該ビューポイントが位置する分割領域の情報を含む
請求項10に記載の送信装置。 - 送信部が、広視野角画像の画像データを符号化して得られた符号化ストリームを送信すると共に、グループ分けして登録された所定数のビューポイントの情報を送信するステップを有する
送信方法。 - 広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を受信する受信部と、
上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記ビューポイントの情報に基づいて処理して表示用画像データを得る処理部を備える
受信装置。 - 上記処理部は、ユーザの属性あるいは契約内容によって決定されたグループのビューポイントの情報を用いる
請求項15に記載の受信装置。 - 上記処理部は、ユーザ操作で選択されたビューポイントの情報で示される位置をセンター位置とする表示用画像データを得る
請求項16に記載の受信装置。 - 上記受信部は、上記広視野角画像の画像データを符号化して得られた符号化ストリームとして、上記広視野角画像を分割して得られた各分割領域に対応した符号化ストリームを受信し、
上記処理部は、各分割領域に対応した符号化ストリームのうち上記表示用画像データを得るために用いる所定数の分割領域の符号化ストリームを復号化する
請求項15に記載の受信装置。 - 上記受信部は、上記所定数の分割領域の符号化ストリームの送信を配信サーバに要求し、該配信サーバから該所定数の分割領域の符号化ストリームを受信する
請求項18に記載の受信装置。 - 受信部が、広視野角画像の画像データを符号化して得られた符号化ストリームを受信すると共に、グループ分けして登録された所定数のビューポイントの情報を含むレンダリング用メタ情報を受信する受信ステップと、
処理部が、上記符号化ストリームを復号化した得られた上記広視野角画像の画像データを上記レンダリング用メタ情報に基づいて処理して表示用画像データを得る処理ステップを有する
受信方法。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201980007260.2A CN111557096A (zh) | 2018-01-12 | 2019-01-10 | 发送装置、发送方法、接收装置和接收方法 |
| JP2019564745A JPWO2019139099A1 (ja) | 2018-01-12 | 2019-01-10 | 送信装置、送信方法、受信装置および受信方法 |
| EP19738277.3A EP3739889A4 (en) | 2018-01-12 | 2019-01-10 | TRANSMISSION DEVICE, TRANSMISSION PROCESS, RECEIVING DEVICE AND RECEPTION PROCESS |
| US16/959,558 US20210084346A1 (en) | 2018-01-12 | 2019-01-10 | Transmission device, transmission method, reception device and reception method |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018003860 | 2018-01-12 | ||
| JP2018-003860 | 2018-01-12 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2019139099A1 true WO2019139099A1 (ja) | 2019-07-18 |
Family
ID=67219567
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2019/000591 Ceased WO2019139099A1 (ja) | 2018-01-12 | 2019-01-10 | 送信装置、送信方法、受信装置および受信方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20210084346A1 (ja) |
| EP (1) | EP3739889A4 (ja) |
| JP (1) | JPWO2019139099A1 (ja) |
| CN (1) | CN111557096A (ja) |
| WO (1) | WO2019139099A1 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021506189A (ja) * | 2018-07-13 | 2021-02-18 | エルジー エレクトロニクス インコーポレイティド | 動的ビューポイントの座標系に関するメタデータを送受信する方法及び装置 |
| JPWO2021177044A1 (ja) * | 2020-03-04 | 2021-09-10 |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7401453B2 (ja) * | 2018-04-05 | 2023-12-19 | ヴィド スケール インコーポレイテッド | 全方位ビデオに対する視点メタデータ |
| EP4162695A4 (en) * | 2020-06-09 | 2023-08-02 | Telefonaktiebolaget LM ERICSSON (PUBL) | Providing semantic information with encoded image data |
| CN116157731B (zh) * | 2020-07-30 | 2026-01-02 | 富士胶片株式会社 | 摄像系统、摄像系统的动作方法及存储介质 |
| EP4264409A1 (en) * | 2020-12-15 | 2023-10-25 | Mankind NV | Device for translation and rotation of screens in a two-dimensional plane and its use |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004192207A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 表示画像制御処理装置、取得画像制御処理装置、画像制御情報通信システム、および方法、並びにコンピュータ・プログラム |
| JP2009200939A (ja) | 2008-02-22 | 2009-09-03 | Sony Corp | 画像処理装置と画像処理方法および画像処理システム |
| WO2017202899A1 (en) * | 2016-05-25 | 2017-11-30 | Koninklijke Kpn N.V. | Spatially tiled omnidirectional video streaming |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3018910B1 (en) * | 2013-07-05 | 2019-11-13 | Saturn Licensing LLC | Transmission device, transmission method, reception device, and reception method |
| JP6505996B2 (ja) * | 2013-08-30 | 2019-04-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 受信方法、及び、受信装置 |
| US9894422B2 (en) * | 2014-02-18 | 2018-02-13 | Lg Electronics Inc. | Method and apparatus for transreceiving broadcast signal for panorama service |
| KR101953679B1 (ko) * | 2014-06-27 | 2019-03-04 | 코닌클리즈케 케이피엔 엔.브이. | Hevc-타일드 비디오 스트림을 기초로 한 관심영역 결정 |
| CN109218755B (zh) * | 2017-07-07 | 2020-08-25 | 华为技术有限公司 | 一种媒体数据的处理方法和装置 |
| JPWO2019031469A1 (ja) * | 2017-08-10 | 2020-07-09 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
| CN111373760A (zh) * | 2017-11-30 | 2020-07-03 | 索尼公司 | 发送设备、发送方法、接收设备和接收方法 |
| CN110035316B (zh) * | 2018-01-11 | 2022-01-14 | 华为技术有限公司 | 处理媒体数据的方法和装置 |
-
2019
- 2019-01-10 EP EP19738277.3A patent/EP3739889A4/en not_active Withdrawn
- 2019-01-10 JP JP2019564745A patent/JPWO2019139099A1/ja not_active Abandoned
- 2019-01-10 CN CN201980007260.2A patent/CN111557096A/zh not_active Withdrawn
- 2019-01-10 US US16/959,558 patent/US20210084346A1/en not_active Abandoned
- 2019-01-10 WO PCT/JP2019/000591 patent/WO2019139099A1/ja not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004192207A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 表示画像制御処理装置、取得画像制御処理装置、画像制御情報通信システム、および方法、並びにコンピュータ・プログラム |
| JP2009200939A (ja) | 2008-02-22 | 2009-09-03 | Sony Corp | 画像処理装置と画像処理方法および画像処理システム |
| WO2017202899A1 (en) * | 2016-05-25 | 2017-11-30 | Koninklijke Kpn N.V. | Spatially tiled omnidirectional video streaming |
Non-Patent Citations (1)
| Title |
|---|
| See also references of EP3739889A4 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021506189A (ja) * | 2018-07-13 | 2021-02-18 | エルジー エレクトロニクス インコーポレイティド | 動的ビューポイントの座標系に関するメタデータを送受信する方法及び装置 |
| JP7030989B2 (ja) | 2018-07-13 | 2022-03-07 | エルジー エレクトロニクス インコーポレイティド | 動的ビューポイントの座標系に関するメタデータを送受信する方法及び装置 |
| JPWO2021177044A1 (ja) * | 2020-03-04 | 2021-09-10 | ||
| WO2021177044A1 (ja) * | 2020-03-04 | 2021-09-10 | ソニーグループ株式会社 | 画像処理装置及び画像処理方法 |
| JP7679829B2 (ja) | 2020-03-04 | 2025-05-20 | ソニーグループ株式会社 | 画像処理装置及び画像処理方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3739889A1 (en) | 2020-11-18 |
| CN111557096A (zh) | 2020-08-18 |
| EP3739889A4 (en) | 2020-11-25 |
| US20210084346A1 (en) | 2021-03-18 |
| JPWO2019139099A1 (ja) | 2020-12-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11109013B2 (en) | Method of transmitting 360-degree video, method of receiving 360-degree video, device for transmitting 360-degree video, and device for receiving 360-degree video | |
| JP6657475B2 (ja) | 全方位ビデオを伝送する方法、全方位ビデオを受信する方法、全方位ビデオの伝送装置及び全方位ビデオの受信装置 | |
| KR102264028B1 (ko) | 전방향 비디오를 전송하는 방법, 전방향 비디오를 수신하는 방법, 전방향 비디오 전송 장치, 전방향 비디오 수신 장치 | |
| CN109076255B (zh) | 发送、接收360度视频的方法及设备 | |
| EP3739889A1 (en) | Transmission device, transmission method, reception device and reception method | |
| KR20200030053A (ko) | 미디어 콘텐츠를 위한 영역별 패킹, 콘텐츠 커버리지, 및 시그널링 프레임 패킹 | |
| US10992961B2 (en) | High-level signaling for fisheye video data | |
| US12407857B2 (en) | Method, an apparatus and a computer program product for video conferencing | |
| CN110999308B (zh) | 发送装置、发送方法、接收装置和接收方法 | |
| CN111034203A (zh) | 处理具有动态逐区封装的全向媒体 | |
| WO2019107175A1 (ja) | 送信装置、送信方法、受信装置および受信方法 | |
| US11341976B2 (en) | Transmission apparatus, transmission method, processing apparatus, and processing method | |
| WO2019181493A1 (ja) | 受信装置、受信方法、送信装置および送信方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19738277 Country of ref document: EP Kind code of ref document: A1 |
|
| ENP | Entry into the national phase |
Ref document number: 2019564745 Country of ref document: JP Kind code of ref document: A |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| ENP | Entry into the national phase |
Ref document number: 2019738277 Country of ref document: EP Effective date: 20200812 |