JP7649792B2 - ボリュメトリック視覚的メディアプロセス方法および装置 - Google Patents
ボリュメトリック視覚的メディアプロセス方法および装置 Download PDFInfo
- Publication number
- JP7649792B2 JP7649792B2 JP2022546009A JP2022546009A JP7649792B2 JP 7649792 B2 JP7649792 B2 JP 7649792B2 JP 2022546009 A JP2022546009 A JP 2022546009A JP 2022546009 A JP2022546009 A JP 2022546009A JP 7649792 B2 JP7649792 B2 JP 7649792B2
- Authority
- JP
- Japan
- Prior art keywords
- group
- volumetric visual
- atlas
- track
- view
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—Three-dimensional [3D] image rendering
- G06T15/08—Volume rendering
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—Three-dimensional [3D] image rendering
- G06T15/10—Geometric effects
- G06T15/20—Perspective computation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/388—Volumetric displays, i.e. systems where the image is built up from picture elements distributed through a volume
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Generation (AREA)
Description
コンピュータプログラム記憶媒体は、その上に記憶されたコードを含む。コードは、プロセッサによって実行されると、説明される方法をプロセッサに実装させる。
本発明はさらに、例えば、以下を提供する。
(項目1)
ボリュメトリック視覚的データ処理の方法であって、前記方法は、
デコーダによって、1つ以上のアトラスサブビットストリームおよび1つ以上のエンコードされたビデオサブビットストリームとして表された3次元場面に関するボリュメトリック視覚的情報を含むビットストリームをデコードすることと、
前記1つ以上のアトラスサブビットストリームをデコードした結果と、前記1つ以上のエンコードされたビデオサブビットストリームをデコードした結果とを使用して、前記3次元場面を再構築することと、
所望の視認位置および/または所望の視認向きに基づいて、前記3次元場面の標的ビューをレンダリングすることと
を含む、方法。
(項目2)
前記再構築することは、前記デコーダによって、前記ボリュメトリック視覚的データの1つ以上のビューが前記標的ビューのレンダリングのために選択されたビューグループに対応するアトラスグループをデコードすることを含む、項目1に記載の方法。
(項目3)
前記デコードすることは、前記アトラスグループをデコードする前、
ファイル解析器によって、前記ビットストリームのファイルストレージにおけるボリュメトリック視覚的パラメータトラックの構文要素に基づいて、前記アトラスグループに対応するボリュメトリック視覚的トラックのグループをカプセル化解除することを含み、
前記ボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックのグループが、前記アトラスグループのための全てのアトラスデータを搬送する、項目1または2に記載の方法。
(項目4)
前記デコードすることは、前記アトラスグループのデコーディングの前、
ファイル解析器によって、前記ビットストリームのファイルストレージにおけるボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む時間指定メタデータトラックの構文要素に基づいて、前記アトラスグループに対応するボリュメトリック視覚的トラックのグループをカプセル化解除することを含み、
前記ボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックのグループが、前記アトラスグループのための全てのアトラスデータを搬送する、項目1または2に記載の方法。
(項目5)
特定のトラックグループタイプおよび特定のトラックグループ識別に従って、前記ボリュメトリック視覚的トラックの前記グループを識別することを含み、前記ボリュメトリック視覚的トラックの前記グループにおけるボリュメトリック視覚的トラックの各々は、前記ボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む、項目3および4に記載の方法。
(項目6)
前記デコーダによって、1つ以上のビューグループ情報に基づいて、前記標的ビューに関するボリュメトリック視覚的データの前記1つ以上のビューを選択することを含み、各ビューグループ情報は、1つ以上のビューを記述する、項目2に記載の方法。
(項目7)
各ビューグループ情報は、前記1つ以上のビューのためのカメラパラメータをさらに含む、項目6に記載の方法。
(項目8)
前記デコーダによって、前記標的ビューのために選択されたボリュメトリック視覚的データの1つ以上のビューに対応する1つ以上のアトラスをデコードすることを含む、項目1に記載の方法。
(項目9)
前記1つ以上のアトラスサブストリームからの情報は、前記ビットストリームのファイル記憶構文構造におけるボリュメトリック視覚的パラメータトラックの構文要素に基づいて、前記1つ以上のアトラスに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化解除することによってデコードされ、
前記1つ以上のボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックは、前記1つ以上のアトラスのための前記アトラスデータの全てを搬送する、項目1または8に記載の方法。
(項目10)
前記1つ以上のアトラスサブストリームからの情報は、前記ビットストリームのファイルストレージにおけるボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む時間指定メタデータトラックの構文要素に基づいて、前記1つ以上のアトラスに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化解除することによってデコードされ、
前記1つ以上のボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックは、前記1つ以上のアトラスのための前記アトラスデータの全てを搬送する、項目1または8に記載の方法。
(項目11)
前記デコーダによって、前記1つ以上のビューのためのビュー情報に基づいて、前記標的ビューのレンダリングのための前記ボリュメトリック視覚的データの前記1つ以上のビューを選択することを含み、各ビュー情報は、対応するビューのカメラパラメータを記述する、項目8に記載の方法。
(項目12)
特定のサンプルエントリタイプに従って、前記ボリュメトリック視覚的パラメータトラックを識別することを含み、
前記ボリュメトリック視覚的パラメータトラックは、特定のトラック参照を伴う1つ以上のボリュメトリック視覚的トラックに対応し、
前記ボリュメトリック視覚的パラメータトラックは、前記特定のトラック参照を伴う前記参照ボリュメトリック視覚的トラックの全てに関する一定パラメータ組および共通アトラスデータを規定する、項目3または9に記載の方法。
(項目13)
特定のサンプルエントリタイプに従って前記時間指定メタデータトラックを識別することを含み、前記特定のサンプルエントリタイプは、前記標的ビューレンダリングのために選択されたボリュメトリック視覚的データの1つ以上のビューが動的であることを示す、項目4または10に記載の方法。
(項目14)
前記1つ以上のエンコードされたビデオサブビットストリームは、
幾何学形状データのための1つ以上のビデオコード化エレメンタリストリームと、
占有率マップデータのためのゼロまたは1つのビデオコード化エレメンタリストリームと、
属性データのためのゼロ以上のビデオコード化エレメンタリストリームと
を含み、
前記幾何学形状データ、前記占有率マップデータ、および前記属性データは、前記3次元場面を記述する、項目1に記載の方法。
(項目15)
ボリュメトリック視覚的データ処理の方法であって、前記方法は、
エンコーダによって、1つ以上のアトラスサブビットストリームと1つ以上のエンコードされたビデオサブビットストリームとを使用して表すことによって、3次元場面に関するボリュメトリック視覚的情報を含むビットストリームを生成することと、
前記ビットストリームに、所望の視認位置および/または所望の視認向きに基づく前記3次元場面の標的ビューのレンダリングを可能にする情報を含むことと
を含む、方法。
(項目16)
前記生成することは、前記エンコーダによって、前記ボリュメトリック視覚的データの1つ以上のビューが前記標的ビューのレンダリングのために選択可能であるビューグループに対応するアトラスグループをエンコードすることを含む、項目15に記載の方法。
(項目17)
前記生成することは、アトラスグループをエンコードするために、前記ビットストリームのファイルストレージにおけるボリュメトリック視覚的パラメータトラックの構文要素に基づいて、前記アトラスグループに対応するボリュメトリック視覚的トラックのグループをカプセル化することを含み、
前記ボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックの前記グループが、前記アトラスグループのための全てのアトラスデータを搬送する、項目15または16に記載の方法。
(項目18)
前記生成することは、アトラスグループをエンコードするために、
前記ビットストリームのファイルストレージにおけるボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む時間指定メタデータトラックの構文要素に基づいて、前記アトラスグループに対応するボリュメトリック視覚的トラックのグループをカプセル化することを含み、前記ボリュメトリック視覚的トラックと前記ボリュメトリック視覚的パラメータトラックとのグループが、前記アトラスグループのための全てのアトラスデータを搬送する、項目15または16に記載の方法。
(項目19)
前記ビットストリームに、特定のトラックグループタイプおよび特定のトラックグループ識別に従って、前記ボリュメトリック視覚的トラックの前記グループを識別する情報を含むことを含み、前記ボリュメトリック視覚的トラックの前記グループにおけるボリュメトリック視覚的トラックの各々は、前記ボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む、項目17および18に記載の方法。
(項目20)
前記エンコーダによって、1つ以上のビューグループ情報に基づいて、前記標的ビューに関するボリュメトリック視覚的データの前記1つ以上のビューをエンコードすることを含み、各ビューグループ情報は、1つ以上のビューを記述する、項目16に記載の方法。
(項目21)
各ビューグループ情報は、前記1つ以上のビューのためのカメラパラメータをさらに含む、項目20に記載の方法。
(項目22)
前記デコーダによって、前記標的ビューのために選択されたボリュメトリック視覚的データの1つ以上のビューに対応する1つ以上のアトラスをエンコードすることを含む、項目15に記載の方法。
(項目23)
前記1つ以上のアトラスサブストリームからの情報は、前記ビットストリームのファイル記憶構文構造におけるボリュメトリック視覚的パラメータトラックの構文要素に基づいて、前記1つ以上のアトラスに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化することによってエンコードされ、
前記1つ以上のボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックは、前記1つ以上のアトラスのための前記アトラスデータの全てを搬送する、項目15または22に記載の方法。
(項目24)
前記1つ以上のアトラスサブストリームからの情報は、前記ビットストリームのファイルストレージにおけるボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む時間指定メタデータトラックの構文要素に基づいて、前記1つ以上のアトラスに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化することによってエンコードされ、
前記1つ以上のボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックは、前記1つ以上のアトラスのための前記アトラスデータの全てを搬送する、項目15または22に記載の方法。
(項目25)
前記1つ以上のビューのためのビュー情報に基づいて前記標的ビューのレンダリングのための前記ボリュメトリック視覚的データの1つ以上のビューを識別する情報を含むことを含み、各ビュー情報は、対応するビューのカメラパラメータを記述する、項目22に記載の方法。
(項目26)
前記ビットストリームに、特定のサンプルエントリタイプに従って前記ボリュメトリック視覚的パラメータトラックを識別するための情報を含むことを含み、
前記ボリュメトリック視覚的パラメータトラックは、特定のトラック参照を伴う1つ以上のボリュメトリック視覚的トラックに対応し、
前記ボリュメトリック視覚的パラメータトラックは、前記特定のトラック参照を伴う前記参照ボリュメトリック視覚的トラックの全てに関する一定パラメータ組および共通アトラスデータを規定する、項目17または23に記載の方法。
(項目27)
前記ビットストリームに、特定のサンプルエントリタイプに従って前記時間指定メタデータトラックを識別するための情報を含むことを含み、前記特定のサンプルエントリタイプは、前記標的ビューレンダリングのために選択されたボリュメトリック視覚的データの1つ以上のビューが動的であることを示す、項目18または項目24に記載の方法。
(項目28)
前記1つ以上のエンコードされたビデオサブビットストリームは、
幾何学形状データのための1つ以上のビデオコード化エレメンタリストリームと、
占有率マップデータのためのゼロまたは1つのビデオコード化エレメンタリストリームと、
属性データのためのゼロ以上のビデオコード化エレメンタリストリームと
を含み、
前記幾何学形状データ、前記占有率マップデータ、および前記属性データは、前記3次元場面を記述する、項目15に記載の方法。
(項目29)
項目1-28のいずれかに記載の方法を実装するように構成されたプロセッサを備えているビデオ処理装置。
(項目30)
コードを記憶しているコンピュータ読み取り可能な媒体であって、前記コードは、項目1-28のうちの任意の1つ以上のものに記載の方法をプロセッサに実装させるための命令をエンコードする、コンピュータ読み取り可能な媒体。
(1.簡潔な議論)
(1.1ビデオベースの点群圧縮(V-PCC))
(1.2 ISOBMFFにおけるV-PCCの搬送)
(1.3 MPEG没入型のビデオ(MIV))
(2.エンコーダ側で考慮される例示的問題点)
(2.1グループベースのエンコーダ)
(3.デコーダ側上で考慮される例示的問題点)
(3.1グループベースのレンダラ)
(3.2複数のアトラスを伴うV-PCCデータの搬送)
(3.3 例示的ファイルフォーマット)
(4.解決策1)
(4.1 例示的実施形態1)
aligned(8) class ViewGroupInfoStruct(camera_parameters_included_flag) {
unsigned int(16) view_group_id;
String view_group_description;
unsigned int(8) num_views;
for (i=0; i < num_views; i++) {
unsigned int(16) view_id;
unsigned int(1) basic_view_flag;
if (camera_parameters_included_flag) {
CameraParametersStruct();
}
}
}
aligned(8) class CameraParametersStruct() {
unsigned int(10) camera_id;
unsigned_int(1) camera_pos_present;
unsigned int(1) camera_ori_present;
unsigned int(1) camera_fov_present;
unsigned int(1) camera_depth_present;
if (camera_pos_present){
signed int(32) camera_pos_x;
signed int(32) camera_pos_y;
signed int(32) camera_pos_z;
}
if (camera_ori_present){
signed int(32) camera_quat_x;
signed int(32) camera_quat_y;
signed int(32) camera_quat_z;
}
if (camera_fov_present){
unsigned int(32) camera_hor_range;
unsigned int(32) camera_ver_range;
}
if (camera_depth_present){
unsigned int(32) camera_near_depth;
unsigned int(32) camera_far_depth;
}
}
サンプルエントリタイプ:「vpcp」
コンテナ: SampleDescriptionBox
必須: はい
数量: 1つ以上のサンプルエントリが、存在し得る
class VPCCConfigurationBox extends Box(’vpcC’) {
VPCCDecoderConfigurationRecord() VPCCConfig;
}
aligned(8) class VPCCParametersSampleEntry() extends VolumetricVisualSampleEntry (’vpcp’) {
VPCCConfigurationBox config;
VPCCUnitHeaderBox unit_header;
}
aligned(8) class VPCCTrackGroupBox extends trackGroupTypeBox(’vptg’){
}
コンテナ:VPCCParametersSampleEntry(「vpcp」)
必須:いいえ
数量: ゼロまたは1
aligned(8) class VPCCViewGroupsBox extends FullBox(’vpvg’,0,0) {
unsigned int(16) num_view_groups;
for (i=0; i < num_view_groups; i++) {
ViewGroupInfoStruct(1);
unsigned int(32) vpcc_track_group_id;
}
}
aligned(8) class DynamicViewGroupSampleEntry extends MetaDataSampleEntry(’dyvg’) {
VPCCViewGroupsBox();
}
aligned(8) DynamicViewGroupSample() {
unsigned int(16) num_view_groups;
for (i=0; i < num_view_groups; i++) {
ViewGroupInfoStruct(camera_parameters_included_flag);
}
}
(4.2 例示的実施形態2)
初期化セグメントは、V-PCCデコーダを初期化するために必要とされる全てのV-PCCトラックに関して共通の全てのシーケンスパラメータ組および非ACL NALユニットを含むものとし、それらは、マルチアトラス V-PCCビットストリームのV-PCCパラメータ組、およびNAL_ASPS、NAL_AAPS、NAL_PREFIX_SEI、またはNAL_SUFFIX_SEINALユニット、および、EOBおよびEOSNALユニット(存在するとき)を含む。
点群に関するメインAdaptationSetのidと、それに続くアトラスAdaptationSetのidおよび点群コンポーネントに対応するAdaptationSetのidとを含む。PreSelectionに関する@codecs属性は、PreSelectionメディアが、ビデオベースの点群であることを示す「vpcp」に設定されるものとする。PreSelectionは、Period要素内のPreSelection要素または適合組レベルにおける事前選択記述子のいずれかを使用して、シグナリングされ得る。
(5.解決策2)
(5.1 例示的実施形態3)
aligned(8) class ViewInfoStruct(camera_parameters_included_flag) {
unsigned int(16) view_id;
unsigned int(16) view_group_id;
String view_description;
unsigned int(1) basic_view_flag;
if (camera_parameters_included_flag) {
CameraParametersStruct();
}
}
コンテナ:VPCCParametersSampleEntry(’vpcp’)
必須:いいえ
数量: ゼロまたは1
aligned(8) class VPCCViewsBox extends FullBox(’vpvw’,0,0) {
unsigned int(16) num_views;
for (i=0; i < num_views; i++) {
ViewInfoStruct(1);
unsigned int(8) num_vpcc_tracks;
for (j=0; j < num_vpcc_tracks; j++) {
unsigned int(32) vpcc_track_id;
}
}
}
aligned(8) class DynamicViewSampleEntry extends MetaDataSampleEntry(’dyvw’) {
VPCCViewsBox();
}
aligned(8) DynamicViewSample() {
unsigned int(16) num_views;
for (i=0; i < num_views; i++)
ViewInfoStruct(camera_parameters_included_flag);
}
}
(5.2 例示的実施形態4)
Claims (14)
- ボリュメトリック視覚的データ処理の方法であって、前記方法は、
デコーダが、1つ以上のアトラスサブビットストリームおよび1つ以上のエンコードされたビデオサブビットストリームとして表された3次元場面に関するボリュメトリック視覚的情報を含むビットストリームをデコードすることと、
前記1つ以上のアトラスサブビットストリームをデコードした結果と、前記1つ以上のエンコードされたビデオサブビットストリームをデコードした結果とを使用して、前記3次元場面を再構築することと、
所望の視認位置および/または所望の視認向きに基づいて、前記3次元場面の標的ビューをレンダリングすることと
を含み、
前記ビットストリームをデコードすることは、
第1のサンプルエントリタイプに従って識別されたボリュメトリック視覚的パラメータトラックの第1の構文要素に基づいて、アトラスグループに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化解除することであって、前記第1の構文要素は、前記ボリュメトリック視覚的パラメータトラックのビューグループ情報を提供し、前記アトラスグループは、同一のビューグループから生成されたすべてのアトラスを含み、前記同一のビューグループから、ボリュメトリック視覚的データの1つ以上のビューが前記標的ビューのレンダリングのために選択され、前記1つ以上のボリュメトリック視覚的トラックにおける各ボリュメトリック視覚的トラックは、第2の構文要素に関連付けられており、前記第2の構文要素は、第2のサンプルエントリタイプに関連付けられており、かつ、対応するボリュメトリック視覚的パラメータトラックのアトラスグループ情報を提供する、ことと、
前記同一のビューグループに対応する前記アトラスグループをデコードすることと
を含み、
前記第1の構文要素および前記第2の構文要素は、前記ビットストリームのファイルストレージに含まれており、前記第1の構文要素および前記第2の構文要素は、それぞれ、前記第1のサンプルエントリタイプおよび前記第2のサンプルエントリタイプに関連付けられており、前記第1のサンプルエントリタイプは、前記ボリュメトリック視覚的パラメータトラックを識別し、前記第2のサンプルエントリタイプは、前記対応するボリュメト
リック視覚的パラメータトラックが前記アトラスグループに対応する前記1つ以上のボリュメトリック視覚的トラックに属することを示す、方法。 - 前記アトラスグループは、前記同一のビューグループに対応し、前記同一のビューグループから、前記ボリュメトリック視覚的データの前記1つ以上のビューが前記標的ビューのレンダリングのために選択される、請求項1に記載の方法。
- 前記アトラスグループに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化解除することは、前記アトラスグループをデコードすることよりも前に実行され、
ボリュメトリック視覚的トラックのグループおよび前記ボリュメトリック視覚的パラメータトラックは、前記アトラスグループのためのすべてのアトラスデータを搬送する、請求項1または請求項2に記載の方法。 - 前記方法は、特定のトラックグループタイプおよび特定のトラックグループ識別に従って、ボリュメトリック視覚的トラックのグループを識別することをさらに含み、前記ボリュメトリック視覚的トラックの前記グループにおけるボリュメトリック視覚的トラックのそれぞれは、前記ボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む、請求項3に記載の方法。
- 前記方法は、
前記デコーダが、1つ以上のビューグループ情報に基づいて、前記標的ビューに関するボリュメトリック視覚的データの前記1つ以上のビューを選択することであって、各ビューグループ情報は、1つ以上のビューを記述する、こと、または、
前記デコーダが、前記1つ以上のビューのためのビュー情報に基づいて、前記標的ビューのレンダリングのための前記ボリュメトリック視覚的データの前記1つ以上のビューを選択することであって、各ビュー情報は、対応するビューのカメラパラメータを記述し、各ビューグループ情報は、前記1つ以上のビューのためのカメラパラメータをさらに含む、こと
をさらに含む、請求項2に記載の方法。 - 前記1つ以上のアトラスサブビットストリームからの情報は、前記アトラスグループに対応する前記1つ以上のボリュメトリック視覚的トラックをカプセル化解除することによってデコードされ、前記1つ以上のボリュメトリック視覚的トラックおよび前記ボリュメトリック視覚的パラメータトラックは、前記アトラスグループのためのすべてのアトラスデータを搬送する、請求項1または請求項5に記載の方法。
- 前記方法は、
前記第2のサンプルエントリタイプに従って、時間指定メタデータトラックを識別することであって、前記第2のサンプルエントリタイプは、標的ビューレンダリングのために選択された前記ボリュメトリック視覚的データの前記1つ以上のビューが動的であることを示す、こと、または、
前記第1のサンプルエントリタイプに従って、前記ボリュメトリック視覚的パラメータトラックを識別することであって、前記ボリュメトリック視覚的パラメータトラックは、特定のトラック参照を伴うすべての参照ボリュメトリック視覚的トラックに関する一定のパラメータ組および共通アトラスデータを規定する、こと
をさらに含む、請求項3または請求項6に記載の方法。 - ボリュメトリック視覚的データ処理の方法であって、前記方法は、
エンコーダが、1つ以上のアトラスサブビットストリームと1つ以上のエンコードされたビデオサブビットストリームとを使用して3次元場面を表すことによって、前記3次元場面に関するボリュメトリック視覚的情報を含むビットストリームを生成することと、
所望の視認位置および/または所望の視認向きに基づいて前記3次元場面の標的ビューのレンダリングを可能にする情報を前記ビットストリームの中に含めることと
を含み、
前記生成することは、
前記エンコーダが、ビューグループに対応するアトラスグループをエンコードすることであって、前記ビューグループから、ボリュメトリック視覚的データの1つ以上のビューが前記標的ビューのレンダリングのために選択され、前記アトラスグループは、前記ビューグループから生成されたすべてのアトラスを含む、ことと、
第1のサンプルエントリタイプに従って識別されたボリュメトリック視覚的パラメータトラックの第1の構文要素に基づいて、前記アトラスグループに対応する1つ以上のボリュメトリック視覚的トラックをカプセル化することと
を含み、
前記1つ以上のボリュメトリック視覚的トラックにおける各ボリュメトリック視覚的トラックは、第2の構文要素に関連付けられており、前記第2の構文要素は、第2のサンプルエントリタイプに関連付けられており、かつ、対応するボリュメトリック視覚的パラメータトラックのアトラスグループ情報を提供し、
前記第1の構文要素および前記第2の構文要素は、前記ビットストリームのファイルストレージに含まれており、前記第1の構文要素および前記第2の構文要素は、それぞれ、前記第1のサンプルエントリタイプおよび前記第2のサンプルエントリタイプに関連付けられており、前記第1のサンプルエントリタイプは、前記ボリュメトリック視覚的パラメータトラックを識別し、前記第2のサンプルエントリタイプは、前記対応するボリュメトリック視覚的パラメータトラックが前記アトラスグループに対応する前記1つ以上のボリュメトリック視覚的トラックに属することを示す、方法。 - 前記カプセル化することは、前記1つ以上のボリュメトリック視覚的トラックを含むボリュメトリック視覚的トラックのグループに対して実行され、前記ボリュメトリック視覚的トラックの前記グループおよび前記ボリュメトリック視覚的パラメータトラックは、前記アトラスグループのためのすべてのアトラスデータを搬送する、請求項8に記載の方法。
- 前記方法は、
特定のトラックグループタイプおよび特定のトラックグループ識別に従って、前記ボリュメトリック視覚的トラックの前記グループを識別する情報を前記ビットストリームの中に含めることであって、前記ボリュメトリック視覚的トラックの前記グループにおけるボリュメトリック視覚的トラックのそれぞれは、前記ボリュメトリック視覚的パラメータトラックへの特定のトラック参照を含む、こと、または、
前記第2のサンプルエントリタイプに従って時間指定メタデータトラックを識別するための情報を前記ビットストリームの中に含めることであって、前記第2のサンプルエントリタイプは、標的ビューレンダリングのために選択された前記ボリュメトリック視覚的データの前記1つ以上のビューが動的であることを示す、こと、または、
前記第1のサンプルエントリタイプに従って前記ボリュメトリック視覚的パラメータトラックを識別するための情報を前記ビットストリームの中に含めることであって、前記ボリュメトリック視覚的パラメータトラックは、特定のトラック参照を伴うすべての参照ボリュメトリック視覚的トラックに関する一定のパラメータ組および共通アトラスデータを規定する、こと
をさらに含む、請求項9に記載の方法。 - 前記1つ以上のアトラスサブビットストリームからの情報は、前記アトラスグループに対応する前記ボリュメトリック視覚的トラックの前記グループをカプセル化することによ
ってエンコードされ、前記ボリュメトリック視覚的トラックの前記グループおよび前記ボリュメトリック視覚的パラメータトラックは、前記アトラスグループのためのすべてのアトラスデータを搬送する、請求項9に記載の方法。 - 前記方法は、前記1つ以上のビューのためのビュー情報に基づいて前記標的ビューのレンダリングのための前記ボリュメトリック視覚的データの前記1つ以上のビューを識別する情報を含めることをさらに含み、前記ビュー情報は、対応するビューのカメラパラメータを記述する、請求項8に記載の方法。
- 前記1つ以上のエンコードされたビデオサブビットストリームは、
幾何学形状データのための1つ以上のビデオコード化エレメンタリストリームと、
占有率マップデータのためのゼロまたは1つのビデオコード化エレメンタリストリームと、
属性データのためのゼロ以上のビデオコード化エレメンタリストリームと
を含み、
前記幾何学形状データおよび前記占有率マップデータおよび前記属性データは、前記3次元場面を記述する、請求項1~12のいずれか1項に記載の方法。 - 請求項1~13のいずれかに記載の方法を実装するように構成されているプロセッサを備えているビデオ処理装置。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/CN2020/084837 WO2021109412A1 (en) | 2020-04-15 | 2020-04-15 | Volumetric visual media process methods and apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023518337A JP2023518337A (ja) | 2023-05-01 |
| JP7649792B2 true JP7649792B2 (ja) | 2025-03-21 |
Family
ID=76221387
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022546009A Active JP7649792B2 (ja) | 2020-04-15 | 2020-04-15 | ボリュメトリック視覚的メディアプロセス方法および装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US12101508B2 (ja) |
| EP (1) | EP4085618A4 (ja) |
| JP (1) | JP7649792B2 (ja) |
| KR (1) | KR20220133207A (ja) |
| CN (1) | CN115039404B (ja) |
| WO (1) | WO2021109412A1 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11838485B2 (en) * | 2020-04-16 | 2023-12-05 | Electronics And Telecommunications Research Institute | Method for processing immersive video and method for producing immersive video |
| US12212779B2 (en) * | 2020-06-05 | 2025-01-28 | Electronics And Telecommunications Research Institute | Method of processing immersive video and method of producing immersive video |
| CN115086635B (zh) * | 2021-03-15 | 2023-04-14 | 腾讯科技(深圳)有限公司 | 多视角视频的处理方法、装置、设备及存储介质 |
| KR102929645B1 (ko) | 2021-06-29 | 2026-02-23 | 돌비 인터네셔널 에이비 | 사전 선택을 시그널링하기 위한 방법, 장치 및 시스템 |
| EP4736458A1 (en) * | 2023-06-27 | 2026-05-06 | Dolby Laboratories Licensing Corporation | Multi-view multiplane-imaging video streaming |
| JP2025069932A (ja) * | 2023-10-18 | 2025-05-01 | キヤノン株式会社 | ボリュメトリックデータビットストリームの処理を改善するための方法、装置、およびコンピュータプログラム |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108282635A (zh) | 2018-02-11 | 2018-07-13 | 中国联合网络通信集团有限公司 | 全景图像生成方法及系统、车联网大数据服务平台 |
| WO2019195547A1 (en) | 2018-04-05 | 2019-10-10 | Vid Scale, Inc. | Viewpoint metadata for omnidirectional video |
| US20190318488A1 (en) | 2018-04-12 | 2019-10-17 | Samsung Electronics Co., Ltd. | 3d point cloud compression systems for delivery and access of a subset of a compressed 3d point cloud |
| US20200014940A1 (en) | 2018-07-09 | 2020-01-09 | Samsung Electronics Co., Ltd. | Point cloud compression using interpolation |
| WO2020013976A1 (en) | 2018-07-12 | 2020-01-16 | Interdigital Vc Holdings, Inc. | Methods and apparatus for volumetric video transport |
| WO2020071112A1 (ja) | 2018-10-02 | 2020-04-09 | ソニー株式会社 | 情報処理装置および情報処理方法 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6675475B2 (ja) * | 2015-08-20 | 2020-04-01 | コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ | メディア・ストリームに基づくタイルド・ビデオの形成 |
| US10771791B2 (en) * | 2016-08-08 | 2020-09-08 | Mediatek Inc. | View-independent decoding for omnidirectional video |
| CN109509260B (zh) * | 2017-09-14 | 2023-05-26 | 阿波罗智能技术(北京)有限公司 | 动态障碍物点云的标注方法、设备及可读介质 |
| WO2019197708A1 (en) * | 2018-04-09 | 2019-10-17 | Nokia Technologies Oy | An apparatus, a method and a computer program for volumetric video |
| EP4072139A3 (en) * | 2019-01-02 | 2022-11-09 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
| US10965932B2 (en) * | 2019-03-19 | 2021-03-30 | Intel Corporation | Multi-pass add-on tool for coherent and complete view synthesis |
| WO2020189903A1 (ko) * | 2019-03-20 | 2020-09-24 | 엘지전자 주식회사 | 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법 |
| US11196977B2 (en) * | 2019-09-24 | 2021-12-07 | Sony Group Corporation | Unified coding of 3D objects and scenes |
-
2020
- 2020-04-15 JP JP2022546009A patent/JP7649792B2/ja active Active
- 2020-04-15 KR KR1020227026479A patent/KR20220133207A/ko active Pending
- 2020-04-15 CN CN202080094122.5A patent/CN115039404B/zh active Active
- 2020-04-15 EP EP20896941.0A patent/EP4085618A4/en active Pending
- 2020-04-15 WO PCT/CN2020/084837 patent/WO2021109412A1/en not_active Ceased
-
2022
- 2022-07-25 US US17/814,762 patent/US12101508B2/en active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108282635A (zh) | 2018-02-11 | 2018-07-13 | 中国联合网络通信集团有限公司 | 全景图像生成方法及系统、车联网大数据服务平台 |
| WO2019195547A1 (en) | 2018-04-05 | 2019-10-10 | Vid Scale, Inc. | Viewpoint metadata for omnidirectional video |
| US20190318488A1 (en) | 2018-04-12 | 2019-10-17 | Samsung Electronics Co., Ltd. | 3d point cloud compression systems for delivery and access of a subset of a compressed 3d point cloud |
| US20200014940A1 (en) | 2018-07-09 | 2020-01-09 | Samsung Electronics Co., Ltd. | Point cloud compression using interpolation |
| WO2020013976A1 (en) | 2018-07-12 | 2020-01-16 | Interdigital Vc Holdings, Inc. | Methods and apparatus for volumetric video transport |
| WO2020071112A1 (ja) | 2018-10-02 | 2020-04-09 | ソニー株式会社 | 情報処理装置および情報処理方法 |
Non-Patent Citations (1)
| Title |
|---|
| Jill M. Boyce et al.,MPEG Immersive Video Coding Standard,Proceedings of the IEEE,米国,IEEE,2021年03月10日,Vol.109,No.9,September 2021,1521-1536,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9374648 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP4085618A1 (en) | 2022-11-09 |
| CN115039404A (zh) | 2022-09-09 |
| KR20220133207A (ko) | 2022-10-04 |
| JP2023518337A (ja) | 2023-05-01 |
| EP4085618A4 (en) | 2023-03-01 |
| US20220360819A1 (en) | 2022-11-10 |
| WO2021109412A1 (en) | 2021-06-10 |
| CN115039404B (zh) | 2025-11-18 |
| US12101508B2 (en) | 2024-09-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7649792B2 (ja) | ボリュメトリック視覚的メディアプロセス方法および装置 | |
| KR102559862B1 (ko) | 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램 | |
| CN111819842B (zh) | 发送360度视频的方法和装置、接收360度视频的方法和装置 | |
| KR102923258B1 (ko) | 3차원 콘텐츠 프로세싱 방법들 및 장치 | |
| JP2022133439A (ja) | メディアコンテンツを送信するための方法、装置及びコンピュータプログラム | |
| US12034982B2 (en) | Volumetric media process methods and apparatus | |
| EP4029275A1 (en) | An apparatus, a method and a computer program for video coding and decoding | |
| EP3873095A1 (en) | An apparatus, a method and a computer program for omnidirectional video | |
| KR20220160646A (ko) | 미디어 파일 캡슐화 방법, 미디어 파일 캡슐화 해제 방법 및 관련 디바이스 | |
| US12137225B2 (en) | Multi-atlas encapsulation of immersive media | |
| HK40088410A (zh) | 媒体文件的封装方法、媒体文件的解封装方法及相关设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220926 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220926 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231107 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231124 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240226 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240501 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240801 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241001 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241119 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250218 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250305 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250310 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7649792 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |