WO2020145117A1

WO2020145117A1 - 画像処理装置および方法

Info

Publication number: WO2020145117A1
Application number: PCT/JP2019/050453
Authority: WO
Inventors: 智隈; 央二中神; 幸司矢野; 加藤　毅
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2019-01-07
Filing date: 2019-12-24
Publication date: 2020-07-16
Anticipated expiration: 2021-07-07
Also published as: KR102943580B1; US20220012849A1; KR20210109538A; EP3905696A4; JP7396302B2; JPWO2020145117A1; CN113261297B; CN113261297A; US11915390B2; EP3905696A1

Abstract

本開示は、画質の低減を抑制することができるようにする画像処理装置および方法に関する。２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成し、その生成された補正情報を符号化する。また、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号し、２Ｄデータと、その補正情報の符号化データが復号されて生成された補正情報とを用いて、３Ｄデータを構築する。本開示は、例えば、情報処理装置、画像処理装置、電子機器、情報処理方法、またはプログラム等に適用することができる。

Description

画像処理装置および方法

　本開示は、画像処理装置および方法に関し、特に、画質の低減を抑制することができるようにした画像処理装置および方法に関する。

　従来、例えばポイントクラウド（Point cloud）のような３次元構造を表す３Ｄデータの符号化方法として、例えばOctree等のような、ボクセル（Voxel）を用いた符号化があった（例えば非特許文献１参照）。

　近年、その他の符号化方法として、例えば、ポイントクラウドの位置情報と属性情報とを小領域毎に２次元平面に投影し、その２次元平面に投影された画像（パッチ）をフレーム画像内に配置し、そのフレーム画像を２次元画像用の符号化方法で符号化する方法（以下、ビデオベースドアプローチ（Video-based approach）とも称する）が提案された（例えば、非特許文献２乃至非特許文献４参照）。

　このビデオベースドアプローチにおいて、フレーム画像の各位置におけるパッチの有無を示すオキュパンシーマップを用いる場合、その解像度を落としてその情報量を低減させることにより、符号化効率を向上させることができる。

　しかしながら、オキュパンシーマップの解像度を低減させると、オキュパンシーマップが示すパッチの範囲と実際のパッチの範囲とが一致しなくなり、３Ｄデータを再構築する際に本来ない点が生成されてしまうおそれがあった。そこで、そのような点の位置をスムーシングにより補正する方法が考えられた。しかしながら、そのようにスムーシングを行っても、PSNR（Peak Signal-to-Noise Ratio）は劣化するおそれがあった。そこで、オキュパンシーマップを低解像度化（NxN精度）することにより生じる余白部分を削る方法が考えられた（例えば、非特許文献５参照）。

　また、高解像度のオキュパンシーマップ（1x1精度）の場合、パッチの重なりがないため、パッチ境界の点の位置が歪むと隣接するパッチとの間に隙間が生じ、３Ｄデータから生成した表示用の２次元画像においてその隙間が穴（欠損部分）となるおそれがあった。そこで、高解像度のオキュパンシーマップ（1x1精度）の境界を広げる方法も考えられた（例えば、非特許文献６参照）。

R. Mekuria, Student Member IEEE, K. Blom, P. Cesar., Member, IEEE, "Design, Implementation and Evaluation of a Point Cloud Codec for Tele-Immersive Video",tcsvt_paper_submitted_february.pdf Tim Golla and Reinhard Klein, "Real-time Point Cloud Compression ," IEEE, 2015 K. Mammou, "Video-based and Hierarchical Approaches Point Cloud Compression" , MPEG m41649, Oct. 2017 K. Mammou,"PCC Test Model Category 2 v0," N17248 MPEG output document, October 2017 Dejun Zhang, Zheng Liu, Vladyslav Zakharchenko, Jianle Chen, Kangying Cai, "[VPCC] New proposal of an adaptive outlier removing method", ISO/IEC JTC1/SC29/WG11 MPEG2018/m44766, October 2018, Macau, China Dejun Zhang, Zheng Liu, Vladyslav Zakharchenko, Jianle Chen, Kangying Cai, "[VPCC] New proposal of an adaptive hole filling method for reconstructed point cloud", ISO/IEC JTC1/SC29/WG11 MPEG2018/m44767, October 2018, Macau, China

　しかしながら、非特許文献５や非特許文献６に記載の方法では、オキュパンシーマップを補正するため、あるパッチの存在を示す領域に他のパッチが含まれてしまい、構築した３Ｄデータが劣化するおそれがあった。そのため、その３Ｄデータを２次元平面に投影した表示用画像の主観画質が低減するおそれがあった。

　本開示は、このような状況に鑑みてなされたものであり、３Ｄデータの表示用２次元画像の画質の低減を抑制することができるようにするものである。

　本技術の一側面の画像処理装置は、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成する補正情報生成部と、前記補正情報生成部により生成された前記補正情報を符号化する補正情報符号化部とを備える画像処理装置である。

　本技術の一側面の画像処理方法は、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成し、生成された前記補正情報を符号化する画像処理方法である。

　本技術の他の側面の画像処理装置は、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号する補正情報復号部と、前記２Ｄデータと、前記補正情報復号部により前記補正情報の符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する構築部とを備える画像処理装置である。

　本技術の他の側面の画像処理方法は、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号し、前記２Ｄデータと、前記補正情報の符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する画像処理方法である。

　本技術の一側面の画像処理装置および方法においては、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報が生成され、その生成された補正情報が符号化される。

　本技術の他の側面の画像処理装置および方法においては、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データが復号され、その２Ｄデータと、補正情報の符号化データが復号されて生成された補正情報とが用いられて、その３Ｄデータが構築される。

オキュパンシーマップが示すパッチの範囲と実際のパッチの範囲との関係の例を説明する図である。補正方法の例を説明する図である。削り方の候補例を示す図である。削り量の例を示す図である。シンタックスの例を示す図である。符号化装置の主な構成例を示すブロック図である。補正情報生成部の主な構成例を示すブロック図である。符号化処理の流れの例を説明するフローチャートである。補正情報生成処理の流れの例を説明するフローチャートである。復号装置の主な構成例を示すブロック図である。３Ｄ再構築部の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。３Ｄデータ再構築処理の流れの例を説明するフローチャートである。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．３Ｄデータ再構築の補正
　２．第１の実施の形態（符号化装置）
　３．第２の実施の形態（復号装置）
　４．付記

　＜１．３Ｄデータ再構築の補正＞
　　＜技術内容・技術用語をサポートする文献等＞
　本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。

　非特許文献１：（上述）
　非特許文献２：TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU（International Telecommunication Union）, "Advanced video coding for generic audiovisual services", H.264, 04/2017
　非特許文献３：TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU（International Telecommunication Union）, "High efficiency video coding", H.265, 12/2016
　非特許文献４：Jianle Chen, Elena Alshina, Gary J. Sullivan, Jens-Rainer, Jill Boyce, "Algorithm Description of Joint Exploration Test Model 4", JVET-G1001_v1, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 7th Meeting: Torino, IT, 13-21 July 2017

　つまり、上述の非特許文献に記載されている内容もサポート要件を判断する際の根拠となる。例えば、非特許文献３に記載されているQuad-Tree Block Structure、非特許文献４に記載されているQTBT（Quad Tree Plus Binary Tree） Block Structureが実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）等の技術用語についても同様に、実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。

　　＜ポイントクラウド＞
　従来、点群の位置情報や属性情報等により３次元構造を表すポイントクラウド（Point cloud）等のデータが存在した。ポイントクラウドはデータ構造が比較的単純であるとともに、十分に多くの点を用いることにより任意の立体構造を十分な精度で表現することができる。

　　＜ビデオベースドアプローチの概要＞
　このようなポイントクラウドの位置情報や属性情報を、小領域毎に２次元平面に投影し、その２次元平面に投影された画像（パッチ）をフレーム画像内に配置し、そのフレーム画像を２次元画像用の符号化方法で符号化するビデオベースドアプローチ（Video-based approach）が提案された。

　このビデオベースドアプローチでは、入力されたポイントクラウド（Point cloud）が複数の小領域に分割され、その小領域毎に各ポイントが２次元平面に投影される（パッチが生成される）。ポイントクラウドは各ポイントの位置情報（Geometry）と属性情報（Texture）とにより構成されるので、この２次元平面への投影は、その位置情報と属性情報のそれぞれについて行われる。

　そして、このパッチは、フレーム画像（２次元画像）に配置される。つまり、位置情報のパッチが配置されたフレーム画像（ジオメトリビデオフレーム（Geometry video frame）とも称する）と、属性情報のパッチが配置されたフレーム画像（カラービデオフレーム（Color video frame）とも称する）とが生成される。

　なお、ジオメトリビデオフレームでは、ポイントの位置情報は、奥行方向の位置情報（デプス値（Depth））として表現される。つまり、そのフレーム画像の各画素値は、このデプス値を示す。

　これらのフレーム画像は、それぞれ、例えばAVC（Advanced Video Coding）やHEVC（High Efficiency Video Coding）等といった、２次元平面画像用の符号化方式により符号化される。

　このように生成された符号化データは、復号側に伝送され、その復号側において復号されてフレーム画像が生成される。そして、そのフレーム画像から各パッチが抽出され、各パッチ（位置情報および属性情報）から３Ｄデータ（ポイントクラウド等）が再構築される。

　　＜オキュパンシーマップ＞
　このようなビデオベースドアプローチの場合、さらに、オキュパンシーマップを用いることもできる。オキュパンシーマップは、所定の画素精度で、ジオメトリビデオフレームの投影画像（パッチ）の有無を示すマップ情報である。例えば、オキュパンシーマップは、NxN画素精度で、すなわち、NxN画素の領域毎に、パッチの有無を示す。例えば、オキュパンシーマップは、パッチが存在するNxN画素の領域を値「１」で示し、パッチが存在しないNxN画素の領域を値「０」で示す。

　このようなオキュパンシーマップが、ジオメトリビデオフレームやカラービデオフレームとは別のデータとして符号化され、復号側に伝送される。デコーダは、このオキュパンシーマップを参照することにより、パッチが存在する領域であるか否かを把握することができるので、符号化・復号により生じるノイズ等の影響を抑制することができ、より正確に３Ｄデータを復元することができる。例えば、符号化・復号によりデプス値が変化しても、デコーダは、オキュパンシーマップを参照することにより、パッチが存在しない領域のデプス値を無視する（３Ｄデータの位置情報として処理しないようにする）ことができる。

　このようなオキュパンシーマップを用いる場合、その解像度を落としてその情報量を低減させることにより、符号化効率を向上させることができる。

　しかしながら、オキュパンシーマップの解像度を低減させると、オキュパンシーマップが示すパッチの範囲と実際のパッチの範囲とが一致しなくなり、３Ｄデータを再構築する際に本来ない点が生成されてしまうおそれがあった。例えば、図１のＡに示されるように、小さい四角で示される位置情報のパッチ境界近傍の画素１１に対して、より低解像度のオキュパンシーマップ１２が生成されると、パッチが拡がり、本来パッチが存在しない領域である余白（図１のＡにおいてグレーで示される部分）が生じるおそれがあった。そこで、スムーシングを行うことによりそのような点の位置を移動させ、余白を低減させる方法が考えられた。しかしながら、スムーシングを行っても、PSNR（Peak Signal-to-Noise Ratio）は劣化するおそれがあった。

　そこで、非特許文献５に記載のように、オキュパンシーマップを低解像度化（NxN精度）することにより生じる余白部分を削る方法が考えられた。しかしながら、非特許文献５に記載の方法では、余白部分を削ることはできても、余白部分を増大させる（拡張する）ことはできず、パッチ間等の隙間により表示用画像に生じる穴（欠損部分）を低減させることは困難であった。むしろ、余白部分の低減により、パッチ同士の重なりが抑制されるため、パッチ間等の隙間の発生が生じやすくなるおそれがあった。

　そこで、非特許文献６に記載のように、高解像度のオキュパンシーマップ（1x1精度）の境界を広げる方法も考えられた。しかしながら、1x1精度のオキュパンシーマップは、上述のように、情報量が増大するおそれがあった。

　そこで、パッチの境界部分において、非特許文献５に記載の方法のように余白部分を低減させ、さらに、非特許文献６に記載の方法のように境界を広げることが考えられる。しかしながら、非特許文献５や非特許文献６に記載の方法では、オキュパンシーマップを補正するため、あるパッチの存在を示す領域に他のパッチが含まれてしまい、再構築した３Ｄデータが劣化するおそれがあった。例えば、図１のＢに示されるようにパッチ２１とパッチ２２の位置が近い場合に、オキュパンシーマップのパッチ２１が存在する領域を拡大させると、点線円２３のように、その領域がパッチ２２と重畳してしまう。このような場合、パッチ２１が存在する領域として点線円２３が切り出されてしまうため、パッチ２１から再構築した３Ｄデータにパッチ２２の情報が含まれてしまうおそれがあった。そのため、その再構築した３Ｄデータを２次元平面に投影した画像（表示用画像とも称する）の主観画質が低減するおそれがあった。

　付言するに、非特許文献６に記載の方法は、スムーシングに対応していないため、スムーシングにより点の位置が移動することによるパッチ間の隙間の発生を抑制することが困難であった。そのため、その隙間により、表示用画像の主観画質が低減するおそれがあった。

　　＜方法１＞
　そこで、図２の表に示される方法１のように、２Ｄデータから３Ｄデータへの変換（３Ｄデータの再構築）において補正を行い、パッチ間の隙間等による穴の発生等を抑制するようにする。例えば、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成し、その生成された補正情報を符号化するようにする。例えば、画像処理装置において、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成する補正情報生成部と、補正情報生成部により生成された補正情報を符号化する補正情報符号化部とを備えるようにする。

　また、例えば、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号し、その２Ｄデータと、その補正情報の符号化データが復号されて生成された補正情報とを用いて、３Ｄデータを構築するようにする。例えば、画像処理装置において、２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号する補正情報復号部と、その２Ｄデータと、補正情報復号部により補正情報の符号化データが復号されて生成された補正情報とを用いて、３Ｄデータを構築する構築部とを備えるようにする。

　このようにすることにより、パッチの境界の補正を、３Ｄデータの補正により実現することができる。したがって、オキュパンシーマップを補正する場合のように、処理対象のパッチから３Ｄデータを再構築する際に他のパッチの情報が追加される等の、３Ｄデータの劣化を抑制することができる。つまり、表示用画像の主観画質の低減を抑制することができる。

　この補正情報は、1x1精度のオキュパンシーマップと、NxN精度のオキュパンシーマップとに基づいて生成するようにしてもよい。例えば、オキュパンシーマップは、1x1精度からNxN精度に低精度化されて符号化されるようにし、補正情報が、符号化前の1x1精度のオキュパンシーマップと、オキュパンシーマップの符号化データを復号して生成したNxN精度のオキュパンシーマップとに基づいて生成されるようにする。このようにオキュパンシーマップを低精度化して符号化することにより、符号化効率の低減を抑制することができる。また、符号化前後のオキュパンシーマップを用いて補正情報を生成することにより、符号化の際に行われるスムーシングを補正情報に反映させることができる。したがって、スムーシングによる表示用画像の主観画質の低減を抑制することができる。

　また補正情報は、さらに、３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の大きさの設定値である余り量に基づいて生成するようにしてもよい。このようにすることにより、余白の補正量を設定値「余り量」によっても制御することができる。例えば、３Ｄデータによっては、単純な符号化前後のオキュパンシーマップの比較では対応が困難な欠損部分が表示用画像に生じることもあり得る。そこで、オキュパンシーマップの比較結果とは独立に余り量を設定することにより、このような欠損部分の発生を抑制することができる。つまり、表示用画像の主観画質の低減をより抑制することができる。なお、この余り量の設定方法は任意である。例えば、この余り量は、ユーザ等の外部からの指示に基づいて設定されるようにしてもよいし、符号化対象の３Ｄデータの解析結果に基づいて設定されるようにしてもよいし、その他の情報に基づいて設定されるようにしてもよい。

　さらに補正情報は、３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含むようにしてもよい。このようにすることにより、この補正情報に基づいて、余白の補正を３Ｄデータの補正に反映させることができる。つまり、パッチの境界の補正を、３Ｄデータの補正により実現することができる。したがって、表示用画像の主観画質の低減を抑制することができる。

　　＜方法１－１＞
　例えば、この余白の補正に関する情報は、その余白の削り方を示す情報（どのように余白を削るかを示す情報）を含むようにしてもよい。つまり、図２の表に示される方法１－１のように、補正方法を伝送するようにしてもよい。このような情報を補正情報に含めることにより、余白をどのように削るかを制御することができる。

　また、この余白の削り方を示す情報は、どのような内容であってもよく、例えば、候補の中から選択された余白の削り方のパタンを示す情報を含むようにしてもよい。例えば、複数の「余白の削り方のパタン」を候補として予め用意し、局所毎に「余白の削り方のパタン」をその候補の中から選択するようにし、補正情報（余白の削り方を示す情報）には、局所毎の、選択された候補を示す情報（例えば選択した候補の識別情報等）が含まれるようにしてもよい。このような情報を補正情報に含めることにより、より簡易な情報により、余白をどのように削るかを制御することができる。例えば全局所の削り方を１画素単位で具体的に指定する場合に比べて、符号量の増大を抑制することができる。

　　＜方法１－２＞
　また、例えば、この余白の補正に関する情報は、その余白の補正量を示す情報（どの程度余白を補正するかを示す情報）を含むようにしてもよい。つまり、図２の表に示される方法１－２のように、補正量を伝送するようにしてもよい。このような情報を補正情報に含めることにより、余白をどの程度補正するかを制御することができる。

　なお、この余白の補正量を示す情報は、余白の削り量を示す情報を含むようにしてもよい。このような情報により、余白をどの程度削るかを制御することができる。また、この余白の補正量を示す情報は、余白の増加量を示す情報を含むようにしてもよい。このような情報により、余白をどの程度増大させるか（太らせるか）を制御することができる。

　　＜方法１－３・方法１－４＞
　また、復号側において補正情報に基づいて補正する３Ｄデータの再構築に用いるオキュパンシーマップの精度は任意である。例えば、NxN精度であってもよい。つまり、図２の表に示される方法１－３のように、NxN精度のオキュパンシーマップを用いた変換（３Ｄデータの再構築）を補正するようにしてもよい。また、1x1精度であってもよい。つまり、図２の表に示される方法１－４のように、1x1精度のオキュパンシーマップを用いた変換（３Ｄデータの再構築）を補正するようにしてもよい。

　　＜余白の削り方のパタン＞
　次に、＜方法１－１＞において説明した「余白の削り方のパタン」の候補について説明する。この候補とするパタン（削り方）は、どのようなパタンであってもよい。その数も任意である。例えば、図３のＡ乃至図３のＨに示されるような８パタンを候補としてもよい。

　図３のＡ乃至図３のＨは、それぞれ、余白の削り方のパタンの例を示す。図３のＡ乃至図３のＨのそれぞれにおいて、各四角は、オキュパンシーマップのデータ単位となるブロック（例えば画素）を示しており、黒色のブロックは、余白から削られるブロックである。つまり、この黒色のブロックは、空のブロック、すなわち、パッチが存在しないことを示す値が設定されるブロックである。

　例えば、図３のＡには、処理対象の局所部分の右下が削られるパタンが示されている。同様に、図３のＢには右上が削られるパタンが示され、図３のＣには左上が削られるパタンが示され、図３のＤには左下が削られるパタンが示されている。

　また、例えば、図３のＥには処理対象の局所部分の右が削られるパタンが示され、図３のＦには上が削られるパタンが示され、図３のＧには左が削られるパタンが示され、図３のＨには下が削られるパタンが示されている。なお、図中、グレーのブロックは、完全に占有されているブロックであるか、または、空のブロックである。

　つまり、この例の場合、どの候補を選択するかによって、どちらの方向から削るかが選択される。

　　＜余白の補正量＞
　次に、＜方法１－２＞において説明した「余白の削り量」について説明する。この余白の削り量は、どのような値であってもよい。例えば図４のＡに示される、右から削るパタン（図３のＥのパタン）の場合、4x4画素からなる処理対象領域（カレント領域）は、余白の補正量が「０」（すなわち初期値（Default））の場合、図４のＢに示されるように、右半分の画素（右側の2x4画素領域）が削られる。同様に、余白の補正量が「－１」の場合、図４のＣに示されるように、カレント領域の右端の画素列（右端の1x4画素領域）が削られる。同様に、余白の補正量が「－２」の場合、図４のＤに示されるように、カレント領域は補正されない（右端の0x4画素領域が削られる）。また、余白の補正量が「－３」の場合、図４のＥに示されるように、カレント領域の右端に1x4画素領域が追加される。つまり、余白が拡張される。

　このように、余白の補正量は、余白の削り量を示すこともできるし、余白の増加量を示すこともできる。

　　＜シンタックス＞
　以上のような補正情報についてのシンタクスの例を図５のＡに示す。グレーの部分が補正情報に関するシンタックスである。omapFilterTypeFrameLevel / omapFilterTypePatchLevelにより、フレームレベルとパッチレベルの余白の削り方（タイプ）とタイプ毎の処理をシグナリングする。また、omapFilterValueFrameLevel / patchList[i].omapFilterValueにより、フレームレベルとパッチ毎の補正量（削る量・増やす量）をシグナリングする。この値は、図５のＢに示される変換表のように、初期値（Default）との差分を表すインデックスとしてもよい。

　＜２．第１の実施の形態＞
　　＜符号化装置＞
　図６は、本技術を適用した画像処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図６に示される符号化装置１００は、ポイントクラウドのような３Ｄデータを２次元平面に投影して２次元画像用の符号化方法により符号化を行う装置（ビデオベースドアプローチを適用した符号化装置）である。

　なお、図６においては、処理部やデータの流れ等の主なものを示しており、図６に示されるものが全てとは限らない。つまり、符号化装置１００において、図６においてブロックとして示されていない処理部が存在したり、図６において矢印等として示されていない処理やデータの流れが存在したりしてもよい。これは、符号化装置１００内の処理部等を説明する他の図においても同様である。

　図６に示されるように符号化装置１００は、パッチ分解部１１１、パッキング部１１２、補助パッチ情報圧縮部１１３、ビデオ符号化部１１４、ビデオ符号化部１１５、OMap符号化部１１６、マルチプレクサ１１７、復号部１１８、および補正情報生成部１１９を有する。

　パッチ分解部１１１は、３Ｄデータの分解に関する処理を行う。例えば、パッチ分解部１１１は、符号化装置１００に入力される、３次元構造を表す３Ｄデータ（例えばポイントクラウド）を取得する（矢印１２１）。また、パッチ分解部１１１は、取得したその３Ｄデータを複数の小領域（コネクションコンポーネント）に分解し、その小領域毎に３Ｄデータを２次元平面に投影し、位置情報のパッチや属性情報のパッチを生成する。

　パッチ分解部１１１は、生成した各パッチに関する情報をパッキング部１１２に供給する（矢印１２２）。また、パッチ分解部１１１は、その分解に関する情報である補助パッチ情報を、補助パッチ情報圧縮部１１３に供給する（矢印１２３）。

　パッキング部１１２は、データのパッキングに関する処理を行う。例えば、パッキング部１１２は、パッチ分解部１１１から供給されるパッチに関する情報を取得する（矢印１２２）。また、パッキング部１１２は、取得した各パッチを２次元画像に配置してビデオフレームとしてパッキングする。例えば、パッキング部１１２は、ポイントの位置を示す位置情報（Geometry）のパッチをビデオフレームとしてパッキングし、ジオメトリビデオフレーム（Geometry video frame(s)）を生成する。また、パッキング部１１２は、その位置情報に付加される色情報等の属性情報（Texture）のパッチを、ビデオフレームとしてパッキングし、カラービデオフレーム（Color video frame(s)）を生成する。さらに、パッキング部１１２は、パッチの有無を示す1x1精度のオキュパンシーマップを生成する。

　パッキング部１１２は、それらを後段の処理部に供給する（矢印１２４）。例えば、パッキング部１１２は、ジオメトリビデオフレームをビデオ符号化部１１４に供給し、カラービデオフレームをビデオ符号化部１１５に供給し、1x1精度のオキュパンシーマップ（1x1 Omap）をOMap符号化部１１６に供給する。また、パッキング部１１２は、そのパッキングに関する制御情報をマルチプレクサ１１７に供給する（矢印１２５）。さらに、パッキング部１１２は、1x1精度のオキュパンシーマップを補正情報生成部１１９に供給する。

　補助パッチ情報圧縮部１１３は、補助パッチ情報の圧縮に関する処理を行う。例えば、補助パッチ情報圧縮部１１３は、パッチ分解部１１１から供給される補助パッチ情報を取得する（矢印１２３）。また、補助パッチ情報圧縮部１１３は、補正情報生成部１１９から供給される補正情報を取得する（矢印１３３）。補助パッチ情報圧縮部１１３は、取得した補助パッチ情報を符号化（圧縮）し、補助パッチ情報の符号化データを生成する。また、補助パッチ情報圧縮部１１３は、取得した補正情報を符号化（圧縮）して補正情報の符号化データを生成し、その補正情報の符号化データを、補助パッチ情報の符号化データに含める。補助パッチ情報圧縮部１１３は、このように生成した補助パッチ情報の符号化データをマルチプレクサ１１７に供給する（矢印１２６）。

　ビデオ符号化部１１４は、ジオメトリビデオフレームの符号化に関する処理を行う。例えば、ビデオ符号化部１１４は、パッキング部１１２から供給されるジオメトリビデオフレームを取得する（矢印１２４）。また、ビデオ符号化部１１４は、その取得したジオメトリビデオフレームを、例えばAVCやHEVC等の任意の２次元画像用の符号化方法により符号化し、ジオメトリビデオフレームの符号化データを生成する。ビデオ符号化部１１４は、生成したジオメトリビデオフレームの符号化データをマルチプレクサ１１７に供給する（矢印１２７）。また、ビデオ符号化部１１４は、そのジオメトリビデオフレームの符号化データを復号部１１８に供給する（矢印１３４）。

　ビデオ符号化部１１５は、カラービデオフレームの符号化に関する処理を行う。例えば、ビデオ符号化部１１５は、パッキング部１１２から供給されるカラービデオフレームを取得する（矢印１２４）。また、ビデオ符号化部１１５は、復号部１１８から供給される、復号されたジオメトリビデオフレームを取得する（矢印１３５）。そして、ビデオ符号化部１１５は、その取得したカラービデオフレームを、取得したジオメトリビデオフレームを用いてリカラーし、属性情報を復号後の位置情報に対応させる。つまり、ビデオ符号化部１１５は、符号化におけるスムーシングにより更新された位置情報に属性情報を対応させる。また、ビデオ符号化部１１５は、このようにリカラーしたカラービデオフレームを、例えばAVCやHEVC等の任意の２次元画像用の符号化方法により符号化し、カラービデオフレームの符号化データを生成する。ビデオ符号化部１１５は、生成したカラービデオフレームの符号化データをマルチプレクサ１１７に供給する（矢印１２８）。

　OMap符号化部１１６は、オキュパンシーマップのビデオフレームの符号化に関する処理を行う。例えば、OMap符号化部１１６は、パッキング部１１２から供給される1x1精度のオキュパンシーマップを取得する（矢印１２４）。OMap符号化部１１６は、その取得した1x1精度のオキュパンシーマップを低精度化し、NxN精度のオキュパンシーマップを生成する。そして、OMap符号化部１１６は、生成したNxN精度のオキュパンシーマップを、例えば算術符号化等の任意の符号化方法により符号化し、NxN精度のオキュパンシーマップの符号化データを生成する。また、OMap符号化部１１６は、生成したNxN精度のオキュパンシーマップの符号化データを、マルチプレクサ１１７に供給する（矢印１２９）。さらに、また、OMap符号化部１１６は、その符号化データを、復号部１１８にも供給する（矢印１３１）。

　マルチプレクサ１１７は、多重化に関する処理を行う。例えば、マルチプレクサ１１７は、補助パッチ情報圧縮部１１３から供給される補助パッチ情報の符号化データを取得する（矢印１２６）。また、例えば、マルチプレクサ１１７は、パッキング部１１２から供給されるパッキングに関する制御情報を取得する（矢印１２５）。また、例えば、マルチプレクサ１１７は、ビデオ符号化部１１４から供給されるジオメトリビデオフレームの符号化データを取得する（矢印１２７）。また、例えば、マルチプレクサ１１７は、ビデオ符号化部１１５から供給されるカラービデオフレームの符号化データを取得する（矢印１２８）。また、例えば、マルチプレクサ１１７は、OMap符号化部１１６から供給されるオキュパンシーマップの符号化データを取得する（矢印１２９）。

　マルチプレクサ１１７は、取得したそれらの情報を多重化して、ビットストリームを生成する。マルチプレクサ１１７は、その生成したビットストリームを符号化装置１００の外部に出力する。

　復号部１１８は、以上のように生成される符号化データの復号に関する処理を行う。例えば、復号部１１８は、OMap符号化部１１６から供給されるNxN精度のオキュパンシーマップの符号化データを取得する（矢印１３１）。また、復号部１１８は、ビデオ符号化部１１４から供給されるジオメトリビデオフレームの符号化データを取得する（矢印１３４）。そして、復号部１１８は、後述する復号装置２００と同様の構成を有し、同様の処理を行う。例えば、復号部１１８は、NxN精度のオキュパンシーマップの符号化データを復号し、NxN精度のオキュパンシーマップを生成する。復号部１１８は、そのNxN精度のオキュパンシーマップを、補正情報生成部１１９に供給する（矢印１３２）。また、復号部１１８は、ジオメトリビデオフレームの符号化データを復号し、ジオメトリビデオフレームを生成する。復号部１１８は、そのジオメトリビデオフレームをビデオ符号化部１１５に供給する（矢印１３５）。

　補正情報生成部１１９は、２次元画像を表す２Ｄデータを用いて再構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の生成に関する処理を行う。例えば、補正情報生成部１１９は、パッキング部１１２から供給される1x1精度のオキュパンシーマップを取得する（矢印１２４）。また、補正情報生成部１１９は、復号部１１８から供給されるNxN精度のオキュパンシーマップを取得する（矢印１３２）。さらに、補正情報生成部１１９は、外部（例えばユーザ等）から入力される余り量の設定を取得する（図示せず）。補正情報生成部１１９は、それらの情報に基づいて、補正情報を生成する。例えば、補正情報生成部１１９は、３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含む補正情報を生成する。補正情報生成部１１９は、生成した補正情報を補助パッチ情報圧縮部１１３に供給する（矢印１３３）。

　このようにすることにより、符号化装置１００は、復号側において、この補正情報に基づいて３Ｄデータを補正させるようにことができる。これにより、３Ｄデータの劣化を抑制することができ、表示用画像の主観画質の低減を抑制することができる。

　なお、これらの処理部（パッチ分解部１１１乃至補正情報生成部１１９）は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU（Central Processing Unit）、ROM（Read Only Memory）、RAM（Random Access Memory）等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。

　　＜補正情報生成部＞
　図７は、補正情報生成部１１９の主な構成例を示すブロック図である。図７に示されるように、補正情報生成部１１９は、タイプ設定部１５１および削り量設定部１５２を有する。

　タイプ設定部１５１は、余白の削り方（余白の補正のタイプ）を設定する。例えば、タイプ設定部１５１は、予め用意された「余白の削り方のパタン」の候補の中から最適なパタンを選択する。例えば、タイプ設定部１５１は、上述したようなオキュパンシーマップの比較結果や余り量の設定に基づいて、このようなパタンの選択（タイプの選択）を行う。

　削り量設定部１５２は、余白の補正量（余白をどの程度補正するか）を設定する。例えば、削り量設定部１５２は、余白の削り量（余白をどの程度削るか）を設定する。また、例えば、削り量設定部１５２は、余白の増加量（余白をどの程度増やすか）を設定する。削り量設定部１５２は、上述したようなオキュパンシーマップの比較結果や余り量の設定に基づいて、このような補正量の設定を行う。

　補正情報生成部１１９は、以上のように設定された余白の補正のタイプや補正量を示す情報を、補正情報として補助パッチ情報圧縮部１１３に供給する。

　　＜符号化処理の流れ＞
　このような符号化装置１００により実行される処理について説明する。最初に、符号化処理の流れの例を、図８のフローチャートを参照して説明する。

　符号化処理が開始されると、符号化装置１００のパッチ分解部１１１は、ステップＳ１０１において、パッチ分解処理を実行し、３Ｄデータをパッチに分解し、各パッチのデータを２次元平面に投影する。

　ステップＳ１０２において、パッキング部１１２は、パッチ分解部１１１によりパッチ毎に２次元平面に投影された３Ｄデータをパッキングし、ジオメトリビデオフレームやカラービデオフレームを生成する。また、パッキング部１１２は、1x1精度のオキュパンシーマップを生成する。

　ステップＳ１０３において、OMap符号化部１１６は、ステップＳ１０２において生成された1x1精度のオキュパンシーマップを低精度化してNxN精度のオキュパンシーマップを生成し、そのNxN精度のオキュパンシーマップを符号化してNxN精度のオキュパンシーマップの符号化データを生成する。

　ステップＳ１０４において、復号部１１８は、ステップＳ１０３において生成されたNxN精度のオキュパンシーマップの符号化データを復号し、NxN精度のオキュパンシーマップを生成する。

　ステップＳ１０５において、補正情報生成部１１９は、補正情報生成処理を実行し、ステップＳ１０２において生成された1x1精度のオキュパンシーマップ、ステップＳ１０４において生成された復号後のNxN精度のオキュパンシーマップ、および余り量に基づいて、補正情報を生成する。この補正情報生成処理については後述する。

　ステップＳ１０６において、パッキング部１１２は、ステップＳ１０２において生成されたジオメトリビデオフレームのディレーションを行う。

　ステップＳ１０７において、ビデオ符号化部１１４は、ステップＳ１０６においてディレーションが行われたジオメトリビデオフレームを符号化し、ジオメトリビデオフレームの符号化データを生成する。

　ステップＳ１０８において、ビデオ符号化部１１４は、ステップＳ１０７において生成されたジオメトリビデオフレームの符号化データを復号し、復号後のジオメトリビデオフレームを生成する。

　ステップＳ１０９において、パッキング部１１２は、ステップＳ１０２において生成されたカラービデオフレームのディレーションを行う。

　ステップＳ１１０において、ビデオ符号化部１１５は、ステップＳ１０９においてディレーションが行われたカラービデオフレームについて、ステップＳ１０８において生成された復号後のジオメトリビデオフレームを用いてリカラー処理を行い、属性情報を、復号後の位置情報に対応させる。

　ステップＳ１１１において、ビデオ符号化部１１５は、ステップＳ１１０においてリカラー処理が行われたカラービデオフレームを符号化し、カラービデオフレームの符号化データを生成する。

　ステップＳ１１２において、補助パッチ情報圧縮部１１３は、ステップＳ１０５の処理により生成された補正情報を含む補助パッチ情報を符号化（圧縮）し、符号化データを生成する。

　ステップＳ１１３において、マルチプレクサ１１７は、以上のように生成された各種情報を多重化し、これらの情報を含むビットストリームを生成する。ステップＳ１１４において、マルチプレクサ１１７は、ステップＳ１１３の処理により生成したビットストリームを符号化装置１００の外部に出力する。ステップＳ１１３の処理が終了すると、符号化処理が終了する。

　　＜補正情報生成処理の流れ＞
　図９のフローチャートを参照して、図８のステップＳ１０５において実行される補正情報生成処理の流れの例を説明する。補正情報生成処理が開始されると、補正情報生成部１１９のタイプ設定部１５１は、ステップＳ１３１において、余白の補正のタイプを設定する。ステップＳ１３２において、削り量設定部１５２は、その余白の補正量（例えば削り量）を設定する。ステップＳ１３３において、補正情報生成部１１９は、それらの情報を補正情報として設定し、補助パッチ情報圧縮部１１３に供給する。

　ステップＳ１３３の処理が終了すると補正情報生成処理が終了し、処理は図８に戻る。

　以上のように各処理を実行することにより、符号化装置１００は、３Ｄデータの補正情報を生成し、復号側において、その補正情報に基づいて３Ｄデータを補正させるようにことができる。これにより、３Ｄデータの劣化を抑制することができ、表示用画像の主観画質の低減を抑制することができる。

　＜３．第２の実施の形態＞
　　＜復号装置＞
　図１０は、本技術を適用した画像処理装置の一態様である復号装置の構成の一例を示すブロック図である。図１０に示される復号装置２００は、ポイントクラウドのような３Ｄデータが２次元平面に投影されて符号化された符号化データを、２次元画像用の復号方法により復号し、３Ｄデータを再構築する装置（ビデオベースドアプローチを適用した復号装置）である。この復号装置２００は、図６の符号化装置１００に対応する復号装置であり、符号化装置１００により生成されたビットストリームを復号して３Ｄデータを再構築することができる。

　なお、図１０においては、処理部やデータの流れ等の主なものを示しており、図１０に示されるものが全てとは限らない。つまり、復号装置２００において、図１０においてブロックとして示されていない処理部が存在したり、図１０において矢印等として示されていない処理やデータの流れが存在したりしてもよい。これは、復号装置２００内の処理部等を説明する他の図においても同様である。

　図１０に示されるように復号装置２００は、デマルチプレクサ２１１、補助パッチ情報復号部２１２、ビデオ復号部２１３、ビデオ復号部２１４、OMap復号部２１５、アンパッキング部２１６、および３Ｄ再構築部２１７を有する。

　デマルチプレクサ２１１は、データの逆多重化に関する処理を行う。例えば、デマルチプレクサ２１１は、復号装置２００に入力されるビットストリームを取得する。このビットストリームは、例えば、符号化装置１００より供給される。デマルチプレクサ２１１は、このビットストリームを逆多重化し、補助パッチ情報の符号化データを抽出し、それを補助パッチ情報復号部２１２に供給する。また、デマルチプレクサ２１１は、逆多重化により、ビットストリームから、ジオメトリビデオフレームの符号化データを抽出し、それをビデオ復号部２１３に供給する。さらに、デマルチプレクサ２１１は、逆多重化により、ビットストリームから、カラービデオフレームの符号化データを抽出し、それをビデオ復号部２１４に供給する。また、デマルチプレクサ２１１は、逆多重化により、ビットストリームから、オキュパンシーマップの符号化データを抽出し、それをOMap復号部２１５に供給する。また、デマルチプレクサ２１１は、逆多重化により、ビットストリームからパッキングに関する制御情報を抽出し、それをアンパッキング部２１６に供給する。

　補助パッチ情報復号部２１２は、補助パッチ情報の符号化データ（補正情報の符号化データを含む）の復号に関する処理を行う。例えば、補助パッチ情報復号部２１２は、デマルチプレクサ２１１から供給される補助パッチ情報の符号化データを取得する。また、補助パッチ情報復号部２１２は、その符号化データを復号し、補助パッチ情報や補正情報を生成する。この補正情報は、符号化側において生成され、符号化側から伝送された情報であり、例えば、３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含む。補助パッチ情報復号部２１２は、その補助パッチ情報を３Ｄ再構築部２１７に供給する。

　ビデオ復号部２１３は、ジオメトリビデオフレームの符号化データの復号に関する処理を行う。例えば、ビデオ復号部２１３は、デマルチプレクサ２１１から供給されるジオメトリビデオフレームの符号化データを取得する。また、例えば、ビデオ復号部２１３は、その符号化データを復号し、ジオメトリビデオフレームを生成する。ビデオ復号部２１３は、そのジオメトリビデオフレームを、アンパッキング部２１６に供給する。

　ビデオ復号部２１４は、カラービデオフレームの符号化データの復号に関する処理を行う。例えば、ビデオ復号部２１４は、デマルチプレクサ２１１から供給されるカラービデオフレームの符号化データを取得する。また、例えば、ビデオ復号部２１４は、その符号化データを復号し、カラービデオフレームを生成する。ビデオ復号部２１４は、そのカラービデオフレームを、アンパッキング部２１６に供給する。

　OMap復号部２１５は、オキュパンシーマップの符号化データの復号に関する処理を行う。例えば、OMap復号部２１５は、デマルチプレクサ２１１から供給されるオキュパンシーマップの符号化データを取得する。また、例えば、OMap復号部２１５は、その符号化データを復号し、オキュパンシーマップを生成する。OMap復号部２１５は、そのオキュパンシーマップを、アンパッキング部２１６に供給する。

　アンパッキング部２１６は、アンパッキングに関する処理を行う。例えば、アンパッキング部２１６は、デマルチプレクサ２１１から供給されるパッキングに関する制御情報を取得する。また、アンパッキング部２１６は、ビデオ復号部２１３から供給されるジオメトリビデオフレームを取得する。さらに、アンパッキング部２１６は、ビデオ復号部２１４から供給されるカラービデオフレームを取得する。また、アンパッキング部２１６は、OMap復号部２１５から供給されるオキュパンシーマップを取得する。アンパッキング部２１６は、取得した制御情報やオキュパンシーマップに基づいてジオメトリビデオフレームやカラービデオフレームをアンパッキングし、位置情報や属性情報のパッチ等を抽出する。アンパッキング部２１６は、その位置情報や属性情報のパッチ等を３Ｄ再構築部２１７に供給する。

　３Ｄ再構築部２１７は、３Ｄデータの再構築に関する処理を行う。例えば、３Ｄ再構築部２１７は、補助パッチ情報復号部２１２から供給される補助パッチ情報および補正情報を取得する。また、３Ｄ再構築部２１７は、アンパッキング部２１６から供給される位置情報や属性情報のパッチ等を取得する。さらに、３Ｄ再構築部２１７は、それらの情報に基づいて、３Ｄデータ（例えばポイントクラウド（Point Cloud））を再構築する。例えば、３Ｄ再構築部２１７は、補助パッチ情報や位置情報や属性情報のパッチ等に基づいて３Ｄデータを再構築し、さらに、補正情報に基づいてその３Ｄデータを補正する。３Ｄ再構築部２１７は、このような処理により得られた３Ｄデータを復号装置２００の外部に出力する。

　この３Ｄデータは、例えば、表示部に供給されてその画像が表示されたり、記録媒体に記録されたり、通信を介して他の装置に供給されたりする。

　このようにすることにより、復号装置２００は、符号化側から供給された補正情報に基づいて３Ｄデータを補正するようにことができる。これにより、３Ｄデータの劣化を抑制することができ、表示用画像の主観画質の低減を抑制することができる。

　なお、これらの処理部（デマルチプレクサ２１１乃至３Ｄ再構築部２１７）は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。

　　＜３Ｄ再構築部＞
　図１１は、図１０の３Ｄ再構築部２１７の主な構成例を示すブロック図である。図１１に示されるように、３Ｄ再構築部２１７は、補正設定部２５１および再構築部２５２を有する。

　補正設定部２５１は、３Ｄデータの補正の制御に関する処理を行う。例えば、補正設定部２５１は、OMap復号部２１５から供給される復号後のNxN精度のオキュパンシーマップを取得する。また、補正設定部２５１は、補助パッチ情報復号部２１２から供給される補正情報を取得する。

　この補正情報が、例えば、設定された余白の削り方（余白の補正のタイプ）を示す情報を含むようにしてもよい。例えば、この補正情報が、予め用意された「余白の削り方のパタン」の候補の中から選択された最適なパタンを示す情報を含むようにしてもよい。

　また、この補正情報が、例えば、設定された余白の補正量（例えば、削り量若しくは増加量、またはその両方）を示す情報を含むようにしてもよい。

　補正設定部２５１は、これらの情報に基づいて、どのように補正を行うかを設定する。補正設定部２５１は、その設定通りの補正を実現するため制御情報を生成し、その制御情報を再構築部２５２に供給する。

　再構築部２５２は、３Ｄデータの再構築に関する処理を行う。例えば、再構築部２５２は、アンパッキング部２１６から供給されるジオメトリビデオフレームから抽出された位置情報や、アンパッキング部２１６から供給されるカラービデオフレームから抽出した属性情報に基づいて、３Ｄデータを再構築する。また、再構築部２５２は、補正設定部２５１の制御に従って（補正設定部２５１から供給された制御情報に従って）３Ｄデータを補正する。再構築部２５２は、生成（補正）した３Ｄデータを復号装置２００の外部に出力する。

　　＜復号処理の流れ＞
　このような復号装置２００により実行される処理について説明する。最初に、復号処理の流れの例を、図１２のフローチャートを参照して説明する。

　復号処理が開始されると、復号装置２００のデマルチプレクサ２１１は、ステップＳ２０１において、ビットストリームを逆多重化する。

　ステップＳ２０２において、補助パッチ情報復号部２１２は、ステップＳ２０１の処理によりビットストリームから抽出された補助パッチ情報の符号化データを復号し、補助パッチ情報や補正情報を生成する。

　ステップＳ２０３において、OMap復号部２１５は、ステップＳ２０１の処理によりビットストリームから抽出されたオキュパンシーマップの符号化データを復号する。

　ステップＳ２０４において、ビデオ復号部２１３は、ステップＳ２０１の処理によりビットストリームから抽出されたジオメトリビデオフレームの符号化データを復号し、ジオメトリビデオフレームを生成する。

　ステップＳ２０５において、ビデオ復号部２１４は、ステップＳ２０１の処理によりビットストリームから抽出されたカラービデオフレームの符号化データを復号し、カラービデオフレームを生成する。

　ステップＳ２０６において、アンパッキング部２１６は、パッキングに関する制御情報やオキュパンシーマップに基づいて、ジオメトリビデオフレームやカラービデオフレームをそれぞれアンパッキングする。

　ステップＳ２０７において、３Ｄ再構築部２１７は、３Ｄデータ再構築処理を実行し、ステップＳ２０２において生成された補助パッチ情報と、ステップＳ２０３乃至ステップＳ２０５において生成された各種情報とに基づいて、例えばポイントクラウド等の３Ｄデータを再構築する。また、３Ｄ再構築部２１７は、ステップＳ２０２において生成された補正情報に基づいて、再構築した３Ｄデータを補正する。ステップＳ２０７の処理が終了すると復号処理が終了する。

　　＜３Ｄデータ再構築処理の流れ＞
　次に、図１２のステップＳ２０７において実行される３Ｄデータ再構築処理の流れの例を、図１３のフローチャートを参照して説明する。

　３Ｄデータ再構築処理が開始されると、補正設定部２５１は、ステップＳ２２１において、復号後のNxN精度のオキュパンシーマップと補正情報とに基づいて、３Ｄデータ再構築に関する補正方法を設定し、制御情報を生成する。

　ステップＳ２２２において、再構築部２５２は、位置情報（ジオメトリデータ）および属性情報（ピクチャデータ）、並びに、ステップＳ２２１において設定した補正方法を用いてポイントクラウド等の３Ｄデータを再構築する。より具体的には、再構築部２５２は、位置情報（ジオメトリデータ）および属性情報（ピクチャデータ）、並びに、補助パッチ情報等に基づいて、３Ｄデータを再構築する。そして、再構築部２５２は、補正設定部２５１から供給される制御情報に従って、再構築した３Ｄデータを補正する。

　以上のように各処理を実行することにより、復号装置２００は、符号化側から供給された補正情報に基づいて３Ｄデータを補正するようにことができる。これにより、３Ｄデータの劣化を抑制することができ、表示用画像の主観画質の低減を抑制することができる。

　＜４．付記＞
　　＜制御情報＞
　以上の各実施の形態において説明した本技術に関する制御情報を符号化側から復号側に伝送するようにしてもよい。例えば、上述した本技術を適用することを許可（または禁止）するか否かを制御する制御情報（例えばenabled_flag）を伝送するようにしてもよい。また、例えば、上述した本技術を適用することを許可（または禁止）する範囲（例えばブロックサイズの上限若しくは下限、またはその両方、スライス、ピクチャ、シーケンス、コンポーネント、ビュー、レイヤ等）を指定する制御情報を伝送するようにしてもよい。

　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図１４は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図１４に示されるコンピュータ９００において、CPU（Central Processing Unit）９０１、ROM（Read Only Memory）９０２、RAM（Random Access Memory）９０３は、バス９０４を介して相互に接続されている。

　バス９０４にはまた、入出力インタフェース９１０も接続されている。入出力インタフェース９１０には、入力部９１１、出力部９１２、記憶部９１３、通信部９１４、およびドライブ９１５が接続されている。

　入力部９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部９１４は、例えば、ネットワークインタフェースよりなる。ドライブ９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア９２１を駆動する。

　以上のように構成されるコンピュータでは、CPU９０１が、例えば、記憶部９１３に記憶されているプログラムを、入出力インタフェース９１０およびバス９０４を介して、RAM９０３にロードして実行することにより、上述した一連の処理が行われる。RAM９０３にはまた、CPU９０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア９２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア９２１をドライブ９１５に装着することにより、入出力インタフェース９１０を介して、記憶部９１３にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部９１４で受信し、記憶部９１３にインストールすることができる。

　その他、このプログラムは、ROM９０２や記憶部９１３に、あらかじめインストールしておくこともできる。

　　＜本技術の適用対象＞
　以上においては、ポイントクラウドデータの符号化・復号に本技術を適用する場合について説明したが、本技術は、これらの例に限らず、任意の規格の３Ｄデータの符号化・復号に対して適用することができる。つまり、上述した本技術と矛盾しない限り、符号化・復号方式等の各種処理、並びに、３Ｄデータやメタデータ等の各種データの仕様は任意である。また、本技術と矛盾しない限り、上述した一部の処理や仕様を省略してもよい。

　また、以上においては、本技術の適用例として符号化装置１００および復号装置２００について説明したが、本技術は、任意の構成に適用することができる。

　例えば、本技術は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機（例えばテレビジョン受像機や携帯電話機）、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置（例えばハードディスクレコーダやカメラ）などの、様々な電子機器に適用され得る。

　また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

　また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　　＜本技術を適用可能な分野・用途＞
　本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。

　　＜その他＞
　なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の２状態を識別する際に用いる情報だけでなく、３以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の２値であってもよいし、３値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報（フラグも含む）は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。

　また、符号化データ（ビットストリーム）に関する各種情報（メタデータ等）は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成する補正情報生成部と、
　前記補正情報生成部により生成された前記補正情報を符号化する補正情報符号化部と
　を備える画像処理装置。
　（２）　前記補正情報生成部は、1x1精度のオキュパンシーマップと、NxN精度のオキュパンシーマップとに基づいて、前記補正情報を生成する
　（１）に記載の画像処理装置。
　（３）　前記補正情報生成部は、さらに、前記３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の大きさの設定値である余り量に基づいて、前記補正情報を生成する
　（２）に記載の画像処理装置。
　（４）　前記補正情報は、前記３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含む
　（１）に記載の画像処理装置。
　（５）　前記余白の補正に関する情報は、前記余白の削り方を示す情報を含む
　（４）に記載の画像処理装置。
　（６）　前記余白の補正に関する情報は、候補の中から選択された前記余白の削り方のパタンを示す情報を含む
　（５）に記載の画像処理装置。
　（７）　前記余白の補正に関する情報は、前記余白の補正量を示す情報を含む
　（４）に記載の画像処理装置。
　（８）　前記余白の補正量を示す情報は、前記余白の削り量を示す情報を含む
　（７）に記載の画像処理装置。
　（９）　前記余白の補正量を示す情報は、前記余白の増加量を示す情報を含む
　（７）に記載の画像処理装置。
　（１０）　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成し、
　生成された前記補正情報を符号化する
　画像処理方法。

　（１１）　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号する補正情報復号部と、
　前記２Ｄデータと、前記補正情報復号部により前記補正情報の符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する構築部と
　を備える画像処理装置。
　（１２）　前記補正情報は、前記３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含む
　（１１）に記載の画像処理装置。
　（１３）　前記余白の補正に関する情報は、前記余白の削り方を示す情報を含む
　（１２）に記載の画像処理装置。
　（１４）　前記余白の補正に関する情報は、候補の中から選択された前記余白の削り方のパタンを示す情報を含む
　（１３）に記載の画像処理装置。
　（１５）　前記余白の補正に関する情報は、前記余白の補正量を示す情報を含む
　（１２）に記載の画像処理装置。
　（１６）　前記余白の補正量を示す情報は、前記余白の削り量を示す情報を含む
　（１５）に記載の画像処理装置。
　（１７）　前記余白の補正量を示す情報は、前記余白の増加量を示す情報を含む
　（１５）に記載の画像処理装置。
　（１８）　前記２Ｄデータの符号化データを復号するビデオ復号部をさらに備え、
　前記構築部は、前記ビデオ復号部により復号されて生成された前記２Ｄデータと、前記補正情報復号部により前記符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する
　（１１）に記載の画像処理装置。
　（１９）　オキュパンシーマップの符号化データを復号するOMap復号部をさらに備え、
　前記構築部は、前記２Ｄデータから前記３Ｄデータを構築する際に前記OMap復号部により復号されて生成されたオキュパンシーマップにより拡大された部分である余白を、前記補正情報復号部により前記補正情報の符号化データが復号されて生成された前記補正情報を用いて補正する
　（１１）に記載の画像処理装置。
　（２０）　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号し、
　前記２Ｄデータと、前記補正情報の符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する
　画像処理方法。

　１００　符号化装置，　１１１　パッチ分解部，　１１２　パッキング部，　１１３　補助パッチ情報圧縮部，　１１４　ビデオ符号化部，　１１５　ビデオ符号化部，　１１６　OMap符号化部，　１１７　マルチプレクサ，　１１８　復号部，　１１９　補正情報生成部，　１５１　タイプ設定部，　１５２　削り量設定部，　２００　復号装置，　２１１　デマルチプレクサ，　２１２　補助パッチ情報復号部，　２１３　ビデオ復号部，　２１４　ビデオ復号部，　２１５　OMap復号部，　２１６　アンパッキング部，　２１７　３Ｄ再構築部，　２５１　補正設定部，　２５２　再構築部

Claims

　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成する補正情報生成部と、
　前記補正情報生成部により生成された前記補正情報を符号化する補正情報符号化部と
　を備える画像処理装置。
　前記補正情報生成部は、1x1精度のオキュパンシーマップと、NxN精度のオキュパンシーマップとに基づいて、前記補正情報を生成する
　請求項１に記載の画像処理装置。
　前記補正情報生成部は、さらに、前記３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の大きさの設定値である余り量に基づいて、前記補正情報を生成する
　請求項２に記載の画像処理装置。
　前記補正情報は、前記３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含む
　請求項１に記載の画像処理装置。
　前記余白の補正に関する情報は、前記余白の削り方を示す情報を含む
　請求項４に記載の画像処理装置。
　前記余白の補正に関する情報は、候補の中から選択された前記余白の削り方のパタンを示す情報を含む
　請求項５に記載の画像処理装置。
　前記余白の補正に関する情報は、前記余白の補正量を示す情報を含む
　請求項４に記載の画像処理装置。
　前記余白の補正量を示す情報は、前記余白の削り量を示す情報を含む
　請求項７に記載の画像処理装置。
　前記余白の補正量を示す情報は、前記余白の増加量を示す情報を含む
　請求項７に記載の画像処理装置。
　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報を生成し、
　生成された前記補正情報を符号化する
　画像処理方法。
　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号する補正情報復号部と、
　前記２Ｄデータと、前記補正情報復号部により前記補正情報の符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する構築部と
　を備える画像処理装置。
　前記補正情報は、前記３Ｄデータの、オキュパンシーマップによって拡大された部分である余白の補正に関する情報を含む
　請求項１１に記載の画像処理装置。
　前記余白の補正に関する情報は、前記余白の削り方を示す情報を含む
　請求項１２に記載の画像処理装置。
　前記余白の補正に関する情報は、候補の中から選択された前記余白の削り方のパタンを示す情報を含む
　請求項１３に記載の画像処理装置。
　前記余白の補正に関する情報は、前記余白の補正量を示す情報を含む
　請求項１２に記載の画像処理装置。
　前記余白の補正量を示す情報は、前記余白の削り量を示す情報を含む
　請求項１５に記載の画像処理装置。
　前記余白の補正量を示す情報は、前記余白の増加量を示す情報を含む
　請求項１５に記載の画像処理装置。
　前記２Ｄデータの符号化データを復号するビデオ復号部をさらに備え、
　前記構築部は、前記ビデオ復号部により復号されて生成された前記２Ｄデータと、前記補正情報復号部により前記符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する
　請求項１１に記載の画像処理装置。
　オキュパンシーマップの符号化データを復号するOMap復号部をさらに備え、
　前記構築部は、前記２Ｄデータから前記３Ｄデータを構築する際に前記OMap復号部により復号されて生成されたオキュパンシーマップにより拡大された部分である余白を、前記補正情報復号部により前記補正情報の符号化データが復号されて生成された前記補正情報を用いて補正する
　請求項１１に記載の画像処理装置。
　２次元画像を表す２Ｄデータを用いて構築する３次元構造を表す３Ｄデータの補正に関する情報である補正情報の符号化データを復号し、
　前記２Ｄデータと、前記補正情報の符号化データが復号されて生成された前記補正情報とを用いて、前記３Ｄデータを構築する
　画像処理方法。