WO2024135335A1

WO2024135335A1 - 情報処理装置および方法

Info

Publication number: WO2024135335A1
Application number: PCT/JP2023/043392
Authority: WO
Inventors: 慧佑宇山; 真人山根
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2022-12-23
Filing date: 2023-12-05
Publication date: 2024-06-27
Anticipated expiration: 2025-06-23
Also published as: EP4641501A1; JPWO2024135335A1; EP4641501A4

Abstract

本開示は、3Dモデリングのための撮像をより容易に行うことができるようにする情報処理装置および方法に関する。第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理を行い、その第１の3Dモデリング処理を制御し、その第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させる。本開示は、例えば、情報処理装置、撮像装置、撮像通信装置、電子機器、情報処理方法、プログラム、または情報処理システム等に適用することができる。

Description

情報処理装置および方法

　本開示は、情報処理装置および方法に関し、特に、3Dモデリングのための撮像をより容易に行うことができるようにした情報処理装置および方法に関する。

　従来、３次元形状を有する3Dオブジェクトの3Dモデリングの手法として、その3Dオブジェクトを多方向から撮像し、得られた複数の撮像画像に基づいて3Dデータを生成するフォトグラメトリと称する手法があった（例えば、特許文献１参照）。また、撮像画像、姿勢情報、深度等の情報に基づいて即時的（リアルタイム）に3Dデータを生成するリアルタイム3Dモデリングと称する手法があった。さらに、近年、撮影画像の姿勢と撮影画像とに基づいてNeural Fieldsを構成し、任意視点での画像や3次元モデルを生成する、Neural Renderingと総称される手法（例えば、NeRF（Neural Radiance Fields）等）が提案された。

特開２０１８－６３６９３号公報

　これらの手法のように撮像画像に基づいて3Dモデリングを行う場合、より高精細な3Dデータを得るためには3Dモデリングへの貢献度が高い撮像画像が求められる。しかしながら、より高精細な3Dデータを得るための3Dモデリングは一般的に負荷が大きく処理時間が長い。そのため、その撮像画像を得るための撮像作業中に3Dモデリング結果を確認することは困難であった。そのため、3Dモデリング結果を確認せずに撮像作業を行わなければならず、3Dモデリングへの貢献度が高い撮像画像を効率よく生成することが困難になり、煩雑な作業が必要になるおそれがあった。

　本開示は、このような状況に鑑みてなされたものであり、3Dモデリングのための撮像をより容易に行うことができるようにするものである。

　本技術の一側面の情報処理装置は、第１の3Dモデリング処理を行う第１の3Dモデリング処理部と、前記第１の3Dモデリング処理を制御し、前記第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させる座標制御部とを備え、前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する処理であり、前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成する処理であり、前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される情報処理装置である。

　本技術の一側面の情報処理方法は、第１の3Dモデリング処理を行い、前記第１の3Dモデリング処理を制御し、前記第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させ、前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成し、前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される情報処理方法である。

　本技術の他の側面の情報処理装置は、第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行う第２の3Dモデリング処理部と、前記第２の3Dモデリング処理を制御し、前記第２の3Dモデリング処理の座標系を前記第１の3Dモデリング処理の座標系と対応させる座標制御部とを備え、前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する処理であり、前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成する処理であり、前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される情報処理装置である。

　本技術の他の側面の情報処理方法は、第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行い、前記第２の3Dモデリング処理を制御し、前記第２の3Dモデリング処理の座標系を前記第１の3Dモデリング処理の座標系と対応させ、前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成し、前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される情報処理方法である。

　本技術の一側面の情報処理装置および方法においては、第１の3Dモデリング処理が行われ、その第１の3Dモデリング処理が制御され、その第１の3Dモデリング処理の座標系が第２の3Dモデリング処理の座標系と対応付けられる。

　本技術の他の側面の情報処理装置および方法においては、第２の3Dモデリング処理が行われ、その第２の3Dモデリング処理が制御され、その第２の3Dモデリング処理の座標系が第１の3Dモデリング処理の座標系と対応付けられる。

フォトグラメトリの概要を説明するための図である。リアルタイム3Dモデリングの概要を説明するための図である。フォトグラメトリとリアルタイム3Dモデリングを比較する図である。 3Dモデリング用の撮像を補助する方法の例を示す図である。撮像制御および撮像案内の様子の例を示す図である。オーバーラップの例を示す図である。被写体からの距離に応じた撮像の様子の例を示す図である。並行した処理の様子の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング結果の出力の例を示す図である。オーバーラップ情報の出力の例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。作業の流れの概要の例を示す図である。インクリメンタル処理の例を示す図である。表示例を示す図である。表示例を示す図である。表示例を示す図である。表示例を示す図である。表示例を示す図である。第１の3Dモデリングの様子の例を示す図である。第２の3Dモデリングの様子の例を示す図である。補正の様子の例を示す図である。撮像作業再開時の様子の例を示す図である。複数ユーザによる撮像作業の様子の例を示す図である。複数ユーザによる撮像作業の様子の例を示す図である。撮像装置の主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。リアルタイム3Dモデリング処理の流れの例を説明するフローチャートである。フォトグラメトリ処理の流れの例を説明するフローチャートである。情報処理システムの主な構成例を示す図である。撮像通信装置の主な構成例を示すブロック図である。撮像装置の主な構成例を示すブロック図である。サーバの主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。 3Dモデリング処理の流れの例を説明する、図４４に続くフローチャートである。撮像通信装置の主な構成例を示すブロック図である。サーバの主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。 3Dモデリング処理の流れの例を説明する、図４８に続くフローチャートである。情報処理システムの主な構成例を示すブロック図である。撮像通信装置の主な構成例を示すブロック図である。サーバの主な構成例を示すブロック図である。情報処理装置の主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。インクリメント3Dモデリング処理の流れの例を説明するフローチャートである。表示制御処理の流れの例を説明するフローチャートである。座標補正処理の流れの例を説明するフローチャートである。撮像通信装置の主な構成例を示すブロック図である。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．3Dモデリング
　２．撮像制御
　３．撮像案内出力
　４．組み合わせ
　５．フィードバック処理
　６．第１の実施の形態（撮像装置）
　７．第２の実施の形態（情報処理システム）
　８．第３の実施の形態（フィードバック処理の適用）
　９．付記

　＜１．3Dモデリング＞
　　＜フォトグラメトリ＞
　従来、３次元形状を有するオブジェクト（本明細書において、3Dオブジェクトとも称する）について、その３次元形状のモデルを生成（再構成）する手法として、その3Dオブジェクトを多方向から撮像し、得られた複数の撮像画像に基づいて3Dデータを生成するフォトグラメトリと称する手法があった。なお、本明細書において、3Dオブジェクトの３次元形状のモデルを生成することを3Dモデリングとも称する。

　フォトグラメトリは、様々な視点で撮影された複数枚の画像から、三角測量の原理を使って、３次元の非常に高精度なモデルを再構成する手法である。なお、本明細書において3Dデータ（3Dモデル）についての「精度」とは、対象となる3Dオブジェクトの３次元形状の再現性（正確さや精細度等）だけでなく、その3Dモデルの表面に適用されるテクスチャの再現性（正確さや精細度等）も含み得るものとする。例えば、図１に示されるカメラ１１－１乃至カメラ１１－５のように、3Dオブジェクト１０を複数の視点から撮像し、複数の撮像画像を得る。そしてそれらの撮像画像等を用いてSfM（Structure from Motion）と称する処理とMVS（Multi view Stereo）と称する処理を行い、さらに、メッシュ化とテクスチャリングを後処理として行って、3Dデータ１５を生成する。

　SfMでは、例えば、撮像画像間で対応点を探索し、エピポーラ拘束によりカメラの位置および姿勢を導出し、そのカメラ位置および姿勢に基づく三角測量により各対応点の３次元空間における位置を特定する。本明細書において、この３次元空間上の点を３次元点とも称する。つまり、各対応点に対応する３次元点を特定する。そして、以上のように特定した３次元点群の全体をバンドル調整により最適化する。

　MVSでは、例えば、以上のように導出された３次元点群を用いて、さらに、密な対応点探索を行い、３次元点を追加する。

　以上のように、フォトグラメトリでは、バンドル調整という誤差を最小にする全体最適化計算が行われるため、非常に高精度な結果を得ることができるが、計算負荷が大きい。また、物理的な計測ではなく、幾何学的な計算に基づくため、原理的にはより高解像度の画像を用いる程、より高精度なモデルを復元することができる。

　　＜リアルタイム3Dモデリング＞
　このようなフォトグラメトリとは異なる3Dモデリングの手法として、撮像画像、姿勢情報、深度等の情報に基づいて即時的（リアルタイム）に3Dデータを生成するリアルタイム3Dモデリングと称する手法があった。この手法の場合、例えば図２に示されるように、カメラ２１を、3Dオブジェクト１０の周辺を点線２２のように移動させながら3Dオブジェクト１０を撮像する。カメラ２１は、イメージセンサだけでなくLidar（Light Detection And Ranging）スキャナ(dToF（Direct Time of Flight）モジュール)を備えており、撮像画像を得るとともに深度（被写体までの距離）を検出する。

　近年、科学技術の発展に伴いdToFモジュールの小型化および高機能化が進み、屋内外問わず、比較的長距離（例えば５ｍ程度）の深度も正確に測定することができる。これにより、コンシューマレベルでリアルタイムのモデリング・キャプチャリングの体験が手軽に可能になった。

　さらに、カメラ２１は慣性センサを備えており、カメラ２１の加速度や角速度（本明細書において、慣性情報とも称する）を検出する。

　リアルタイム3Dモデリングでは、SLAM（Simultaneous Localization and Mapping）と称する処理を行ってカメラ２１の位置および姿勢示す姿勢情報を生成する。また、その姿勢情報と深度を用いてTSDF（Truncated Signed Distance Function）を更新し、MC（Marching Cubes）と称する処理により3Dデータ２５（メッシュおよびテクスチャ）を生成する。

　SLAMでは、例えば、撮像画像と慣性情報に基づいてカメラの位置および姿勢が推定される（自己位置推定）。TSDFの更新では、深度とボクセル（voxel）との対応付けが行われ、ボリューム（Volume）が検出される。MCでは、隣接ボクセルを用いた等値面の計算が行われる。SLAMのリアルタイムの姿勢情報があれば、深度（光線がどこまで届いたか）を複数フレーム重ね合わせることで、（点群を介さずに）ボクセルのボリュームを検出することができる。ボクセル表現にすることで、影になる、撮影しなくてはいけない視点（不足視点）を推定することができる。これにより3Dオブジェクトの穴あき構造や突起構造を検出することができる。

　　＜Neural Rendering＞
　さらに、近年、撮影画像の姿勢と撮影画像とに基づいてNeural Fieldsを構成し、任意視点での画像や3次元モデルを生成する、Neural Renderingと総称される手法（例えば、NeRF（Neural Radiance Fields）等）が提案された。

　　＜比較＞
　このような3Dモデリングの各手法は、その特徴が互いに異なり、いずれかの手法が全てにおいて優れているということはない。図３は、フォトグラメトリとリアルタイム3Dモデリングの特徴を比較したものである。図３に示されるように、手法を比較すると、フォトグラメトリではSfM（自己位置推定を含む）とMVSが用いられるのに対し、リアルタイム3Dモデリングでは自己位置推定（SLAM）とTSDFが用いられる。また、使用されるデータを比較すると、フォトグラメトリの場合は画像データのみが用いられるのに対し、リアルタイム3Dモデリングの場合は画像データに加えて深度と姿勢データが用いられる。また、処理時間を比較すると、フォトグラメトリの場合は数分乃至数十時間の長時間を必要とするが、リアルタイム3Dモデリングの場合は30fps（frame/sec）のように略即時的な（リアルタイムの）処理が可能である。

　また、必要な演算能力を比較すると、フォトグラメトリの場合はハイエンドCPU（Central Processing Unit）およびGPU（Graphics Processing Unit）レベルの演算能力が必要であり、リアルタイム3Dモデリングの場合はモバイルAP（Application Processor）レベルの演算能力が必要である。また、生成されるモデルの精細さを比較すると、フォトグラメトリの場合は撮像画像の解像度、数、撮り方等によるが比較的高精細であり、リアルタイム3Dモデリングの場合は深度や自己位置推定精度等によるが比較的低精細である。

　また、生成される３次元データの内部表現は、フォトグラメトリの場合点群ベースであるのに対し、リアルタイム3Dモデリングの場合ボクセルベースである。また、被写体サイズや分解能の制約はフォトグラメトリの場合無いが、リアルタイム3Dモデリングの場合センサに依存する。また、モデルの絶対精度を比較すると、フォトグラメトリの場合はバンドル調整により最適化されるので比較的高く、リアルタイム3Dモデリングの場合はセンサや自己位置推定精度によるが比較的低い。また、スケールを比較すると、フォトグラメトリの場合、不定である（大きさは分からない）が、リアルタイム3Dモデリングの場合、一意である（絶対的な大きさが分かる）。

　フォトグラメトリとリアルタイム3Dモデリングでは、例えばこのような特徴の違いが存在する。つまり、リアルタイム3Dモデリングを適用する方が、フォトグラメトリやNeural Renderingを適用する場合よりも、3Dモデリングの作業量や処理量を低減させることができる。ただし、フォトグラメトリやNeural Renderingを適用する方が、リアルタイム3Dモデリングを適用する場合よりも高精度な3Dデータを生成することができる。

　　＜3Dモデリングの容易化＞
　例えば、より高精度な3Dデータが得られるようにするためには、上述のように、フォトグラメトリやNeural Renderingを適用すればよい。しかしながら、その場合も、3Dモデリングの作業量や処理量は少ないほど望ましい。3Dモデリングの作業量や処理量を低減させるためには、できるだけ少ない撮像回数でできるだけ高精度な3Dデータを生成することが求められる。

　例えば、3Dモデリングに必要な撮像画像が得られない場合、3Dデータの精度が低減するおそれがあった。逆に、不足しないように過剰に撮像画像を得ようとすると、撮像回数が不要に増大し、ユーザの作業量が増大するおそれがあった。また、その場合、不要な撮像画像を用いて3Dモデリング処理が行われることになるため、その処理量が不要に増大するおそれがあった。

　つまり、より少ない作業量および処理量でより高精度な3Dデータを得るためには、より適切な位置および姿勢で3Dオブジェクトを撮像する必要があった。しかしながら、従来の3Dモデリングの各手法では、撮影者がどの位置からどの姿勢で撮像することが適切であるかを把握することは困難であった。

　例えば、フォトグラメトリの場合、3Dモデリング処理に時間を要するため、撮影者が撮影時に即時的に3Dモデリング結果を確認することは困難である。そのため、撮影者が、撮影時に、どの位置からどの姿勢で撮像することが適切であるかを把握することが困難であった。その結果、例えば、適切な位置および姿勢での撮影画像が不足し、フォトグラメトリにより得られる3Dデータの精度が低減するおそれがあった。また、適切な位置および姿勢での撮像画像が不足しないように無計画にあらゆる位置および姿勢で過剰に撮像を行うようにすると、ユーザの作業量が増大するだけでなく、不要に撮像画像が増大し、3Dモデリング処理の負荷（処理量や処理時間等）が不要に増大するおそれがあった。

　＜２．撮像制御＞
　　＜スコアリング結果に基づく撮像制御＞
　そこで、3Dモデリングを２回行うようにし、１回目の3Dモデリング結果を用いて２回目の3Dモデリングのための撮像を制御するようにする。

　例えば、３次元形状を有する3Dオブジェクトを撮像する第２の撮像と、その第２の撮像により得られた第２の撮像画像を用いてその3Dオブジェクトの３次元形状を表現する第２の3Dデータ（第２の３次元形状情報）を生成する第２の3Dモデリング処理とが行われるとする（図４の第２の3Dデータ生成処理１０４）。その際、この第２の3Dモデリング処理のための第２の撮像をより適切な位置および姿勢で行うことができるように、第２の撮像を制御する（図４の第２の3Dモデリング用撮像制御処理１０３）。このような制御を実現するために、図４の第１の3Dデータ生成処理１０１とスコアリング処理１０２とを実行する。

　第１の3Dデータ生成処理１０１は、3Dオブジェクトの３次元形状を表現する第１の3Dデータ（第１の３次元形状情報）を生成する処理である。つまり、第１の3Dデータ生成処理１０１においては、3Dオブジェクトを撮像する第１の撮像と、その第１の撮像により得られた第１の撮像画像を用いて第１の3Dデータを生成する第１の3Dモデリング処理とが行われる。

　スコアリング処理１０２は、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の3Dデータの精度を評価（スコアリング）する処理である。このスコアリングは、第１の3Dモデリング処理により生成された第１の3Dデータに基づいて行われる。第２の3Dモデリング用撮像制御処理１０３においては、このスコアリング結果に基づいて、第２の撮像が制御される。

　つまり、第１の撮像により得られた第１の撮像画像に基づいて生成された第１の3Dデータに基づいて、現時点までの第２の撮像により得られた第２の撮像画像に基づいて生成可能な第２の3Dデータの精度を評価する（スコアリングを行う）。このようにすることにより、より容易にスコアリング結果を生成することができる。また、そのスコアリング結果に基づいて、第２の撮像を制御する。このようにすることにより、より適切な位置および姿勢で行われるように第２の撮像を制御することができる。つまり、より適切な位置および姿勢で撮像された第２の撮像画像を用いて第２の3Dモデリング処理を実行することができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　なお、本明細書において、特に言及しない限り、撮像画像はイメージセンサ等において得られる画像全般を指すものとする。例えば撮像装置等では、一般的に、下記のような画像が得られる。例えば、シャッタボタン等が操作されたタイミングにおいてイメージセンサ等により静止画像が得られ、撮像結果として記憶媒体等に保存される。また、シャッタボタン等が操作されたタイミングからイメージセンサ等により動画像の取得が開始され、その動画像が撮像結果として記憶媒体等に保存される。また、シャッタボタン等が操作される前においてイメージセンサ等により画像（取り込み画像と称される場合もある）が取得され、撮像結果として記憶媒体に記憶されず、モニタ等での表示等に利用される。本明細書において、撮像画像は、これらの画像を示す。つまり、撮像画像は、静止画像であってもよいし、動画像であってもよい。また、撮像画像は、撮像結果として記憶媒体等に保存されてもよいし、保存されなくてもよい。また、撮像画像は、モニタ等に表示されてもよいし、表示されなくてもよい。また、撮像画像は、シャッタボタン等が操作される前に得られてもよいし、操作されたタイミングで得られてもよいし、操作された後に得られてもよい。また、撮像画像は、イメージセンサ等において得られたデータそのもの（所謂RAWデータ）であってもよい。また、撮像画像は、色分離処理や色変換処理が行われた画像であってもよい。また、撮像画像は、欠陥補正、ノイズリダクション、AWB（Automatic White Balance）、またはガンマ補正等の信号処理が施された画像であってもよい。さらに、その他の画像処理が施されたものであってもよい。

　　＜第１の撮像＞
　本明細書において、第１の撮像を行う撮像部（イメージセンサ）を第１の撮像部とも称する。また、第２の撮像を行う撮像部（イメージセンサ）を第２の撮像部とも称する。

　上述したように、第１の3Dデータ生成処理１０１において第１の撮像が行われる。すなわち、第１の撮像部により第１の撮像画像が生成される。その際、第１の撮像部から第１の撮像画像に含まれる被写体（3Dオブジェクト）までの距離（深度）がデプスセンサにより検出されてもよい。このデプスセンサによる深度の検出方法はどのような方法であってもよい。また、デプスセンサは、第１の撮像部と一体化されていてもよいし、第１の撮像部と異なる位置に設けられた第１の撮像部と異なるセンサであってもよい。なお、以下において、特に言及しない限り、この深度は、第１の撮像画像に対して適切にキャリブレーションされているものとする。また、第１の撮像が行われる際に、第１の撮像部の慣性情報（角速度および加速度）が慣性情報センサにより検出されてもよい。この慣性情報センサによる慣性情報の検出方法はどのような方法であってもよい。また、慣性情報センサは、第１の撮像部と一体化されていてもよいし、第１の撮像部と異なる位置に設けられた第１の撮像部と異なるセンサであってもよい。

　生成された第１の撮像画像は、第１の3Dデータ生成処理に利用される。また、深度や慣性情報が生成される場合、それらも第１の3Dデータ生成処理に利用される。

　なお、第１の撮像部（イメージセンサ）、デプスセンサ、および慣性情報センサの数は、それぞれ、いくつであってもよく、単数であってもよいし、複数であってもよい。つまり、第１の撮像部、デプスセンサ、および慣性情報センサの数は、全て同一であってもよいし、これらの内２つが同一であってもよいし、互いに異なっていてもよい。

　　＜第１の3Dモデリング処理＞
　上述したように、第１の3Dデータ生成処理１０１において、第１の3Dモデリング処理が行われる。第１の3Dモデリング処理においては、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の3Dデータ（第１の３次元形状情報）が生成される。

　この第１の3Dデータが、第２の3Dデータ生成処理１０４により生成される第２の3Dデータ（第２の３次元形状情報）よりも情報量が少なく、かつ、低精度であってもよい。

　このようにすることにより、スコアリング処理１０２や第２の3Dモデリング用撮像制御処理１０３の負荷の増大を抑制することができる。つまり、第１の3Dデータがより簡易化（より低情報量化およびより低精度化）されることにより、その第１の3Dデータを用いて行われるスコアリングや撮像制御の負荷の増大を抑制することができる。また、一般的には、第１の3Dデータの生成（第１の3Dモデリング処理）の負荷の増大も抑制することができる。つまり、より少ない負荷で第２の撮像を制御することができる。

　また、この第１の3Dモデリング処理の手法はどのような手法であってもよい。例えば、第１の3Dモデリング処理において、第１の撮像画像の画角に対応する姿勢情報が導出され、その姿勢情報と、その第１の撮像画像と、その第１の撮像画像の被写体（3Dオブジェクト）の深度とに基づいて第１の3Dデータが生成されてもよい。例えば、それらの情報に基づいてTSDFの更新とMCが行われることにより第１の3Dデータが生成されてもよい。

　なお、この姿勢情報は、第１の撮像部の３次元空間における位置および姿勢を示す情報である。この姿勢情報の導出方法はどのような方法であってもよい。例えば、その第１の撮像部の慣性情報（加速度および角速度）に基づいて姿勢情報が導出されてもよい。例えば、SLAMが適用されてもよい。

　つまり、第１の3Dモデリング処理として、上述したリアルタイム3Dモデリングが適用されてもよい。このようにすることにより、第１の3Dモデリング処理を即時的（リアルタイム）に行うことができ、第１の3Dデータを即時的（リアルタイム）に得ることができる。したがって、第２の3Dモデリング用撮像制御処理を即時的（リアルタイム）に行うことができる。つまり、3Dモデリングをより容易に行うことができる。なお、第１の撮像画像、第１の撮像部の慣性情報、および深度を入力とするニューラルネットワークを利用して第１の撮像部の姿勢情報や第１の3Dデータが生成されてもよい。

　また、第１の3Dデータは、3Dオブジェクトの３次元形状を表現するものであればどのようなものであってもよく、例えば、ポイントクラウドであってもよいし、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含むものであってもよい。この第１の3Dデータは、スコアリング処理１０２へ供給される。

　　＜スコアリング処理＞
　スコアリング処理１０２においては、上述したように、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の3Dデータの精度が評価される。このスコアリングは、第１の3Dモデリング処理により生成された第１の3Dデータと、これまでに行われた前記第２の撮像の位置および姿勢とに基づいて行われる。つまり、第１の3Dデータを第２の3Dモデリング処理においてモデリングされる3Dオブジェクトに見立て、その第１の3Dデータの局所毎にスコアが算出される。例えば、第１の3Dデータが、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含む場合、そのメッシュのポリゴン毎にスコアリング結果が生成される。つまり、第１の3Dデータの、より高精度な第２の3Dデータが得られる部分が、より高く評価される（より高スコアに設定される）。

　例えば、図４の第１の3Dデータ生成処理１０１により、図５に示される第１の3Dデータ１２０が生成されるとする。そして、これまでに、その第１の3Dデータ１２０に対応する3Dオブジェクトに対してカメラ１２１－１乃至カメラ１２１－３の位置および姿勢で第２の撮像が行われたものとする。その場合、スコアリング処理１０２により、第１の3Dデータ１２０の図中上側が比較的高スコアに評価され、第１の3Dデータ１２０の図中下側（グレー部分）が比較的低スコアに評価される。スコアリングの手法の例については後述する。

　なお、図５においては、説明の便宜上、スコアリング結果として高スコアと低スコアの２種類のみが示されているが、スコアの種類数（クラスタリングの分類数）はいくつであってもよい。例えば、３段階（例えば、低スコア、中スコア、高スコア）に分類されてもよいし、１０段階(例えば０点乃至９点)に分類されてもよいし、１００段階（例えば０点乃至９９点）に分類されてもよいし、これら以外の段階数に分類されてもよい。

　スコアリング処理１０２により生成されたスコアリング結果は、第２の3Dモデリング用撮像制御処理１０３へ供給される。

　　＜第２の3Dモデリング用撮像制御処理＞
　第２の3Dモデリング用撮像制御処理１０３においては、第２の撮像部の位置および姿勢と、スコアリング処理１０２により得られるスコアリング結果とに基づいて、第２の撮像が制御される。例えば、スコアリング結果がより良くなるような位置および姿勢で第２の撮像が行われるように制御される。

　例えば、スコアリング処理１０２により図５に示されるようなスコアリング結果が得られるとする。このスコアリング結果から、第１の3Dデータ１２０に対応する3Dオブジェクトの図中下側（例えば、グレー部分）の撮像が不足していることが明らかである。

　そこで、第２の3Dモデリング用撮像制御処理１０３においては、その撮像が不足しているグレー部分の撮像画像が得られるように、3Dオブジェクトの図中下側から撮像するように第２の撮像が制御される。例えば、カメラ１２１－４の位置および姿勢が第２の撮像を行う位置および姿勢としてより適切であると判定され、そのカメラ１２１－４の位置および姿勢で撮像が行われるように第２の撮像が制御される。

　このようにすることにより、より適切な位置および姿勢で撮像された第２の撮像画像を生成することができる。換言するに、より適切な位置および姿勢で撮像された第２の撮像画像を用いて第２の3Dモデリング処理が実行されるようにすることができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　このような第２の撮像を行うべき位置および姿勢を求める方法はどのような方法であってもよい。例えば、第２の3Dモデリング用撮像制御処理１０３において、スコアリング結果に基づいて、第２の撮像が不足している部分（グレー部分）のスコアを向上させることが可能な位置および姿勢（の範囲）が特定されるようにしてもよい。また、第２の撮像部の現在の姿勢情報（位置および姿勢）を撮像視点情報としてスコアリング処理１０２へ提供し、仮に現在の位置および姿勢で得られる第２の撮像画像を加えた場合のスコアリング結果を取得し、そのスコアがその第２の撮像画像を加える前のスコアよりも所定の閾値以上高くなる場合に、現在の位置および姿勢が第２の撮像を行うべき位置および姿勢であると判定してもよい。

　なお、第１の撮像部と第２の撮像部との間で位置および姿勢の関係が既知であるならば、第２の撮像部の姿勢情報の代わりに、第１の撮像部の姿勢情報を撮像視点情報としてスコアリング処理１０２へ提供してもよい。その場合、スコアリング処理１０２において、第１の撮像部の姿勢情報を利用して第２の撮像部の姿勢情報が導出され、その第２の撮像部の姿勢情報を利用してスコアリング結果が生成されてもよい。また、第１の撮像部の姿勢情報を入力パラメータに含むニューラルネットワークを利用してスコアリング結果が生成されてもよい。

　また、第２の3Dモデリング用撮像制御処理１０３において、これまでに行われた第２の撮像の撮像範囲とのオーバーラップ率に基づいて、第２の撮像を行うべき位置および姿勢であるか否かが判定されてもよい。オーバーラップ率とは、撮像範囲が重複する領域（オーバーラップ領域）の度合い（割合）を示す。つまり、これから行う第２の撮像の撮像範囲が、これまでに得られた第２の撮像画像において映り込む領域とどの程度オーバーラップするかによって、その第２の撮像の位置および姿勢がより適切な位置および姿勢であるか否かが判定されてもよい。

　例えば、第２の3Dモデリング処理として、フォトグラメトリのように複数の第２の撮像画像間の対応点に基づいて3Dモデリングを行うような手法が適用される場合、その対応点を求めるためには、複数の第２の撮像画像の撮像範囲の少なくとも一部が重複している（オーバーラップ領域が存在する）必要がある。そこで、これまでに得られた第２の撮像画像に対して、第２の3Dモデリング処理が行い易い（より正確な3Dモデリング処理を行うことができる）オーバーラップ率となる第２の撮像画像が得られる位置および姿勢を、より適切な位置および姿勢（第２の撮像を行うべき位置および姿勢）であると判定してもよい。

　なお、第２の3Dモデリング処理が行い易い（より正確な3Dモデリング処理）を行うことができるオーバーラップ率がどのような値であるかは、3Dオブジェクトの３次元形状等にも依存する。例えば、所謂ドローンからの撮影のような場合、図６の左に示されるように被写体を平面１３０とみなすことができる。例えば、カメラ１３１－１から平面１３０を撮像した場合の撮像範囲は両矢印１３２－１で示される範囲となる。同様に、カメラ１３１－２から平面１３０を撮像した場合の撮像範囲は両矢印１３２－２で示される範囲となる。したがって、これらの撮像画像のオーバーラップ領域は、両矢印１３３で示される範囲となる。このような場合、撮像画像同士のオーバーラップの仕方が単純であるので、所定の割合以上のオーバーラップ率が得られれば、より正確な3Dモデリング処理を行うことができる。

　しかしながら第２の撮像の場合、被写体が3Dオブジェクト（第１の3Dデータ１３５）であり、その全容を撮像するため、オーバーラップの仕方が、図６の右の例の第２の撮像画像１３６－１および第２の撮像画像１３６－２のように、立体的となる。そのため、どの程度のオーバーラップ率があれば十分に正確な3Dモデリング処理を行うことができるかは、3Dオブジェクトの３次元形状等に依存する。したがって、第２の撮像を行うべき位置および姿勢を求める際に、これまでに得られた第２の撮像画像に対するオーバーラップ率を考慮する場合、3Dオブジェクトの３次元形状（第１の3Dデータ）等も考慮することが望ましい（第２の撮像を行うべき位置および姿勢をより正確に求めることができる）。

　また、第２の撮像を行うべき位置および姿勢を求める際に、その撮像位置の、被写体（3Dオブジェクト）からの距離が制御されてもよい。つまり、3Dオブジェクトのどの部分をどの角度から撮像するかだけでなく、その部分をどの距離から撮像するかも制御されてもよい。

　図７の左に示される例のように、点線１４２のように3Dオブジェクト１４１から遠く離れた位置（図中、黒３角で示される位置）から撮像すると、少ない撮像回数で3Dオブジェクト１４１の全体を撮像することができる。ただし、3Dオブジェクト１４１の３次元形状が複雑な部分（例えば、斜線部分１４１Ａ等）を撮像できないことが起こり得る。そのため、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）が低減する可能性があった。

　これに対して、図７の右に示される例のように、点線１４３のように3Dオブジェクト１４１から近い位置（図中、黒３角で示される位置）から撮像すると、3Dオブジェクト１４１の全体を撮像するために必要な撮像回数が図７の左の例に比べて増大する。ただし、3Dオブジェクト１４１の３次元形状が複雑な部分（例えば、斜線部分１４１Ａ等）を、図７の左の例に比べて撮像することができる。つまり、図７の左の例よりも確実に、3Dオブジェクト１４１の全体を撮像することができる。そのため、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）の低減を抑制することができる。

　つまり、第２の撮像の位置として、3Dオブジェクトからの適切な距離は、その3Dオブジェクトの３次元形状に依存する。そこで、第２の3Dモデリング用撮像制御処理１０３において、第２の撮像の位置の3Dオブジェクト（被写体）からの距離が、3Dオブジェクトの３次元形状（の複雑さ）に応じて制御されるようにしてもよい。このようにすることにより、上述のように、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）の低減を抑制しながら、第２の撮像の撮像回数の不要な増大を抑制することができる。つまり、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　なお、3Dオブジェクトの３次元形状の複雑度の導出方法はどのような方法であってもよい。例えば、第１の3Dデータに基づいてこの複雑度が導出されてもよい。ただし、その場合、例えば第１の3Dデータが２次元画像として処理され、そのパターン等から3Dオブジェクトの３次元形状の複雑度が導出されてもよい。このようにすることにより、3Dオブジェクトの３次元形状の複雑度の導出に関する処理負荷の増大を抑制することができる。

　また、検波枠を設け、その検波枠内について、3Dオブジェクトの３次元形状の複雑度が導出されてもよい。この検波枠はどのような形状であってもよいし、どのような大きさであってもよい。例えば、この検波枠内において、第２の撮像の撮像面に対して第１の3Dデータのポリゴンがいくつ正対しているかを求め、その検波枠内におけるその法線方向のばらつき度合いを数値化し、そのばらつき度合いに基づいてその検波枠内についての3Dオブジェクトの３次元形状の複雑度を導出してもよい。一般的に、ばらつきが大きいほど複雑な形状であり、同じ方向を向いている場合は平面的な形状に近いとみなすことができる。また、検波枠内における各ポリゴンの法線方向の平均を撮像面への正対度合いの代表値とし、その代表値に基づいて3Dオブジェクトの３次元形状の複雑度を導出してもよい。

　また、Marching Cubes法において、平面を形成しやすい頂点配置のケースが多く検波枠内に存在する場合、3Dオブジェクトの３次元形状の複雑度が低いと判定してもよい。

　つまり、3Dオブジェクトの３次元形状の複雑度は、ある領域の被写体の概形からどれくらいの方向・頻度・距離での撮像が必要になるのかを推定するための材料になる定量値であれば、どのようなパラメータ（に基づく値）であってもよい。また、3Dオブジェクトの３次元形状の複雑度に基づく第２の撮像の3Dオブジェクトからの距離の制御方法は、どのような方法であってもよい。例えば、この3Dオブジェクトの３次元形状が複雑なほど、3Dオブジェクトから近い位置から第２の撮像を行うように制御されてもよい。また、この3Dオブジェクトの３次元形状が単純なほど、3Dオブジェクトから遠い位置から第２の撮像を行うように制御されてもよい。

　第２の3Dモデリング用撮像制御処理１０３においては、上述したように第２の撮像を行うべき位置および姿勢（より適切な位置および姿勢）が求められ、その位置および姿勢において第２の撮像が行われるように制御する制御情報（撮像制御情報）が生成される。そして、その撮像制御情報が第２の3Dデータ生成処理１０４へ供給される。例えば、ユーザ等が第２の撮像部を移動させ、その第２の撮像部の位置および姿勢が、求められた「第２の撮像を行うべき位置および姿勢」に一致すると、第２の撮像を指示する撮像制御情報が生成され、第２の3Dデータ生成処理１０４へ供給される（すなわち、「第２の撮像を行うべき位置および姿勢」で第２の撮像が行われる）ようにしてもよい。

　　＜第２の撮像＞
　第２の撮像部は、第２の3Dデータ生成処理１０４において、第２の3Dモデリング用撮像制御処理１０３の制御に従って第２の撮像を行い、第２の撮像画像を生成する。例えば、第２の撮像部は、第２の3Dモデリング用撮像制御処理１０３において生成された撮像制御情報に基づいて第２の撮像を行ってもよい。例えば、第２の撮像部は、撮像制御情報により撮像が指示された場合（撮像が指示されたタイミングで）、第２の撮像を行ってもよい。また、第２の撮像部の位置および姿勢を制御する制御部が、第２の撮像部を、その撮像制御情報により指定される位置に移動させ、その撮像制御情報により指定される姿勢にし、第２の撮像部が、その位置および姿勢で第２の撮像を行ってもよい。

　第２の撮像部の数は、いくつであってもよく、単数であってもよいし、複数であってもよい。また、第１の撮像部および第２の撮像部は、共通の撮像部（同一の撮像部）であってもよいし、互いに異なる位置に設けられた互いに異なる撮像部であってもよい。

　第２の撮像部の仕様（例えば画素数等）は、第１の撮像部の仕様と同一であってもよいし、異なっていてもよい。例えば、第２の撮像画像が第１の撮像画像よりも高画質であってもよい。また、第２の撮像画像が第１の撮像画像よりも高解像度であってもよい。また、第２の撮像画像が第１の撮像画像よりも高ダイナミックレンジであってもよい。

　　＜第２の3Dモデリング処理＞
　また、第２の3Dデータ生成処理１０４において実行される第２の3Dモデリング処理の手法はどのような手法であってもよい。例えば、第２の3Dモデリング処理の手法が、第１の3Dモデリング処理と同一であってもよいし、異なっていてもよい。

　例えば、第２の3Dモデリング処理として、上述したフォトグラメトリが適用されてもよい。つまり、第２の3Dモデリング処理において、SfMおよびMVSが適用され、複数の第２の撮像画像からポイントクラウドが生成されてもよい。さらに、そのポイントクラウドに対してメッシュ化とテクスチャリングが後処理として行われることにより、第２の3Dデータが生成されてもよい。つまり、第２の3Dデータは、3Dオブジェクトの３次元形状を表現するものであればどのようなものであってもよく、例えば、ポイントクラウドであってもよいし、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含むものであってもよい。また、第２の3Dモデリング処理として、上述したNeural Renderingが適用されてもよい。

　例えば、第２の撮像画像に加え、第２の撮像を行う第２の撮像部の姿勢情報（これまでに得られた第２の撮像画像の画角に対応する姿勢情報）を利用して第２の3Dデータが生成されてもよい。この姿勢情報は、第２の撮像部の３次元空間における位置および姿勢を示す情報である。

　また、第１の撮像を行う第１の撮像部と第２の撮像部との間で位置および姿勢の関係が既知であるならば、第１の撮像部の姿勢情報（３次元空間における位置および姿勢）を利用して第２の3Dデータが生成されてもよい。つまり、第１の3Dモデリング処理において導出される姿勢情報を利用して第２の3Dデータが生成されてもよい。例えば、第１の撮像部の姿勢情報を利用して第２の撮像部の姿勢情報が導出され、その第２の撮像部の姿勢情報を利用して第２の3Dデータが生成されてもよい。また、第１の撮像部の姿勢情報や第２の撮像画像を入力とするニューラルネットワークを利用して第２の3Dデータが生成されてもよい。

　さらに、第２の3Dデータが符号化されてもよい。この符号化の方法はどのような方法であってもよい。

　　＜手動撮像＞
　また、図４に示されるように、第２の3Dデータ生成処理１０４において、撮像制御情報に基づかずに（例えば手動により）第２の撮像が行われてもよい。本明細書においてこのような撮像方法を手動撮像とも称する。その手動撮像が行われた場合、その撮像タイミングを示す撮像タイミング情報が第２の3Dデータ生成処理１０４（の第２の撮像）において生成され、第２の3Dモデリング用撮像制御処理１０３へ供給される。そして、第２の3Dモデリング用撮像制御処理１０３において、その撮像タイミング情報に基づいて、その撮像タイミングにおける第２の撮像部の姿勢情報が求められ、その撮像タイミングにおける第２の撮像部の姿勢情報が、撮像視点情報としてスコアリング処理１０２へ供給される。そして、スコアリング処理１０２において、その撮像視点情報に基づいてスコアが算出される。このように、手動撮像により得られた第２の撮像画像（の画角に対応する第２の撮像部の姿勢情報）がスコアリング処理１０２（により導出されるスコアリング結果）に反映されてもよい。

　　＜カメラ情報＞
　また、図４に示されるように、第２の3Dデータ生成処理１０４（の第２の撮像）において、第２の撮像部に関するカメラ情報が生成され、スコアリング処理１０２へ供給されてもよい。そして、スコアリング処理１０２において、このカメラ情報に基づいてスコアリングが行われ、スコアリング結果が生成されてもよい。このカメラ情報はどのような情報を含んでもよい。例えば、カメラ情報が、撮像部の内部パラメータを含んでもよい。またカメラ情報が、撮像部の外部パラメータを含んでもよい。またカメラ情報が、撮像画像を含んでもよい。またカメラ情報が、第２の撮像画像の画角情報（焦点距離情報）を含んでもよい。またカメラ情報が、歪み補正情報を含んでもよい。またカメラ情報が、シェーディング補正情報を含んでもよい。またカメラ情報が、ブリージング補正情報を含んでもよい。またカメラ情報が、フォーカス位置情報を含んでもよい。またカメラ情報が、像面位相差情報を含んでもよい。つまり、これらの情報がスコアリング（生成可能な第２の３次元形状情報の精度の評価）に用いられてもよい。

　　＜リアルタイムな処理＞
　なお、図４の第１の3Dデータ生成処理１０１（第１の撮像および第１の3Dモデリング処理）、スコアリング処理１０２、および第２の3Dモデリング用撮像制御処理１０３は、互いに並行して実行されてもよい。

　例えば、第１の3Dデータ生成処理１０１において、被写体である3Dオブジェクトの第１の撮像が行われた部分の第１の3Dデータが順次生成されてもよい。例えば、第１の3Dモデリング処理としてリアルタイム3Dモデリングを適用することにより、撮像画像と深度情報等に基づいて即時的（リアルタイム）に3Dデータを生成することができる。つまり、この場合、第１の撮像を行いながら（第１の撮像画像を得ながら）、第１の3Dモデリングを行い、第１の3Dデータを生成することができる。例えば、図２を参照して説明したように、被写体である3Dオブジェクトの周辺においてカメラを移動させながらその3Dオブジェクトの各部分の撮像が行われるが、その3Dオブジェクト全体の撮像画像が得られる前に、得られた撮像画像や深度に基づいて3Dモデリングを行うことができる。つまり、撮像が行われた部分の3Dデータを順次生成することができる。

　また、スコアリング処理１０２において、その3Dオブジェクトの一部に対応する第１の3Dデータに対するスコアリング（これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度の評価）が行われてもよい。つまり、第１の3Dモデリング処理により3Dオブジェクトの一部に対応する第１の3Dデータが生成される度に（3Dオブジェクト全体の第１の3Dデータが生成される前に）、その3Dオブジェクトの、第１の3Dデータが生成された部分についてのスコアリング（生成可能な第２の3Dデータの精度の評価）が順次行われるようにしてもよい。このようにすることにより、第１の3Dデータ生成処理１０１が終了する前に（3Dオブジェクト全体の第１の3Dデータが生成される前に）、スコアリング処理１０２を開始することができる。つまり、第１の3Dデータ生成処理１０１とスコアリング処理１０２を並行して実行することができる。

　また、第２の3Dモデリング用撮像制御処理１０３において、スコアリング処理１０２によりスコアリング結果が得られる度に（3Dオブジェクト全体のスコアリング結果が得られる前に）、その得られたスコアリング結果（3Dオブジェクトの一部に対応する第１の3Dデータに対するスコアリング結果）に基づいて、第２の撮像が制御されてもよい。このようにすることにより、スコアリング処理１０２が終了する前に（3Dオブジェクト全体のスコアリング結果が得られる前に）、第２の3Dモデリング用撮像制御処理１０３を開始することができる。つまり、スコアリング処理１０２と第２の3Dモデリング用撮像制御処理１０３を並行して実行することができる。

　以上のような各方法を組み合わせることにより、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像制御処理１０３を、互いに並行して実行することができる。

　例えば、図８において、時間軸が矢印で示されるように図中左から右に向かうとする。第１の3Dデータ生成処理１０１において第１の撮像および第１の3Dモデリング処理を並行して実行することにより、第１の3Dデータ１５１－１、第１の3Dデータ１５１－２、第１の3Dデータ１５１－３のように、第１の撮像が行われた部分の第１の3Dデータを順次生成することができる。また、第１の3Dデータ生成処理（第１の3Dモデリング処理）およびスコアリング処理１０２を並行して実行することにより、スコアリング結果１５２－１、スコアリング結果１５２－２、スコアリング結果１５２－３のように、第１の3Dデータが生成された部分についてのスコアリング結果を順次導出することができる。さらに、スコアリング処理１０２と第２の3Dモデリング用撮像制御処理１０３とを並行して実行することにより、各タイミングにおいて、それまでに得られたスコアリング結果（スコアリング結果１５２－１、スコアリング結果１５２－２、スコアリング結果１５２－３）に基づいて第２の撮像を制御することができる。

　つまり、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像制御処理１０３を、互いに並行して実行することにより、第１の撮像を行いながら、第２の撮像を制御することができる。すなわち、第１の撮像と第２の撮像を並行して（即時的に）行うことができる。

　　＜スコアリング＞
　このスコアリングの方法について説明する。フォトグラメトリがうまくいくための条件として、例えば、SfMがうまくいくこと、MVSがうまくいくこと、テクスチャリング（テクスチャのマッピング）がうまくいくこと等がある。SfMがうまくいく条件として、例えば、ベースラインが確保できること、特徴点がマッチングできること等がある。また、MVSがうまくいく条件として、ベースラインが確保できること等がある。テクスチャリングが旨く行く条件として、例えば、撮像画像において高精細なテクスチャが得られること、テクスチャを貼る面に対して、できるだけ正面から撮影されていること等がある。ベースラインとは、撮像視点位置（撮像時のカメラの位置）同士の間の距離を示す。

　　＜ポリゴンのスコアリング＞
　あるポリゴン面がSfMやMVSで復元できるかの条件としては、例えば、可視最低条件（ポリゴンが撮像位置から見えているか否か）と、精度の好条件（より精度が向上する条件）と、マッチング（対応点の検出）の好条件（マッチングがより容易になる条件）とがある。

　可視最低条件としては、例えば、視点（撮像位置）から見て視野内（撮像の画角内）に対象ポリゴンの重心が存在すること、対象ポリゴンの法線と視線（視線から対象ポリゴンの重心に向かうベクトル）の内積が少なくとも正であり、かつ、視線を遮る他のポリゴンが存在しないこと、および、対象ポリゴンが見える（可視の）視線が２つ以上存在すること等がある。

　例えば、図９の場合、ある視点から対象ポリゴン１６０の重心に向かう視線１６２が存在するので、対象ポリゴン１６０がその視野内に位置している。また、その対象ポリゴン１６０の法線１６１と視線１６２との内積が正である。また、視線１６２は、他のポリゴンに遮られることなく対象ポリゴン１６０に到達しており、「対象ポリゴン１６０が見える視線」である。したがって、視線１６２は、可視最低条件を満たしている。

　これに対して視線１６３は、ポリゴン１６４に遮られているため、「対象ポリゴン１６０が見える視線」ではない。

　また、精度の好条件としては、例えば、ベースライン（Baseline）が十分に長いこと、被写体までの距離に対するベースラインの長さの比率（ベースラインの長さ／被写体までの距離）が十分に大きいこと、並びに、可視の視点が十分に多く、それらが互いになす角の分散が大きいこと等がある。

　例えば、図１０の場合、対象ポリゴン１７０が見える視点１７１および視点１７２の間のベースライン１７３が十分に長いこと（視点１７１および視点１７２が十分に離れていること）や、被写体までの距離１７４に対するベースライン１７３の長さの比率が十分に大きいこと（「ベースラインの長さ／被写体までの距離」の値が十分に大きいこと）等が、より精度が向上する条件となる。

　また、図１１の左の例の場合、対象ポリゴン１８０が見える視点は、視点１８１および視点１８２の２点である。これに対して、図１１の右の例の場合、対象ポリゴン１８０が見える視点は、視点１８１乃至視点１８６の６点である。つまり、右側の例の方が左側の例よりも可視の視点が多く互いになす角の分散が大きい。可視点が多いと複数の別の情報からよりロバストに三角測量でき、精度の向上に期待できる。したがって、右側の例の方が左側の例よりも、より精度が向上する条件を満たしている。

　また、マッチングの好条件としては、例えば、対象ポリゴンの法線と、視点から対象ポリゴンの重心に向かう視線とのなす角が十分に小さいこと、対になる視点と被写体までの距離の比が十分に小さいこと、マッチングに可能なテクスチャが存在すること等がある。

　図１２の左側の例の場合、対象ポリゴン１９０の法線１９１と視点１９２とがなす角は、法線１９１と視点１９３とがなす角よりも小さい。したがって、視点１９２の方が視点１９３よりも対象ポリゴン１９０の面の特徴点を正しく検出しやすい。また、図１２の右側の例の場合、視点１９４から被写体（対象ポリゴン１９０）までの距離は、視点１９５から被写体（対象ポリゴン１９０）までの距離と比べて顕著に遠い。つまり、視点１９４と視点１９５とでは、被写体までの距離の比が大きい。このような場合、ベースラインが長くても両視点からの対象ポリゴンの１９０面の特徴点の見え方が大きく異なるのでマッチングの難易度が増大してしまう可能性がある。換言するに、図１２の左側の例の視点１９２と視点１９３のように被写体までの距離の比が小さい視点同士の方が、マッチングが容易である。

　　＜テクスチャのスコアリング＞
　あるポリゴン面がテクスチャリングに十分な視点が存在するかの条件としては、例えば、最低条件（見えているか否か）と、テクスチャリングの好条件（テクスチャリングがよりきれいにできる条件）がある。

　最低条件としては、例えば、上述の可視最低条件を満たしている視点が存在すること等がある。

　また、テクスチャリングの好条件としては、例えば、対象ポリゴンの法線と、視点から対象ポリゴンの重心に向かう視線とのなす角が小さいことや、視点からの被写体までの距離が一定以下で十分な解像度を得られること等がある。

　なお、上述した各条件は一例である。スコアリングにおいて、どのような条件が適用されてもよい。またその内容はどのようなものであってもよい。例えば、上述した条件が省略されてもよいし、上述した条件以外の条件が追加されてもよい。

　　＜第２の撮像画像のスコアリング＞
　第２の撮像により得られる第２の撮像画像のスコアリングが行われてもよい。例えば、カメラ情報に基づいて第２の撮像画像のスコアリングが行われてもよい。例えば、第２の撮像画像について、所望の位置にピントがあっているか否かが評価されてもよい。また、手振れしているか否かが評価されてもよい。また、露出が適切であるか否かが評価されてもよい。また、特徴点が取りやすいか否かが評価されてもよい。

　　＜スコアリングの演算例＞
　例えば、図１３に示されるように、対象撮像画像２０１と対象ポリゴン２０２との距離をｄとする。また、被写体までの理想距離をd_optとする。また、c_dを所定の係数とする。その場合のスコアs_dを以下の式（１）のように導出してもよい。

　・・・（１）

　また、対象ポリゴン２０２の中心をc_pとする。対象撮像画像２０１から中心c_pまでの視線をv_pとする。また対象ポリゴン２０２の法線をn_pとする。そして、視線v_pと法線n_pがなす角をαとする。その場合のなす角αは以下の式（２）のように導出できる。そして、そのなす角αに基づくスコアs_αを以下の式（３）のように導出してもよい。なお、c_αは所定の係数とする。

　・・・（２）

　・・・（３）

　カメラの光軸（対象撮像画像２０１の中心を始点とする対象撮像画像の法線ベクトル）をv_cとする。また、この光軸v_cと視線v_pとのなす角をβとする。その場合のなす角βは以下の式（４）のように導出できる。そして、そのなす角βに基づくスコアs_βを以下の式（５）のように導出してもよい。なお、c_βは所定の係数とする。

　・・・（４）

　・・・（５）

　以上のように導出されたスコアs_d、s_α、s_βを用いて、合計スコアs_totalを以下の式（６）のように導出してもよい。

　・・・（６）

　そして、以上のように導出された各視点の合計スコアの内、上位２視点の合計スコアの重み付き加算値を最終スコアとしてもよい。

　なお、この演算方法は一例である。スコアリング処理１０２における演算方法はどのようなものであってもよく、この例に限定されない。

　　＜処理を実行する構成の例＞
　上述した図４の各処理は、どのような装置により実行されてもよい。例えば、情報処理装置において、上述した第１の3Dデータ生成処理１０１の第１の3Dモデリング処理と、スコアリング処理１０２と、第２の3Dモデリング用撮像制御処理１０３とが実行されてもよい。

　つまり、情報処理装置が、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御する撮像制御部とを備えてもよい。本項において、この情報処理装置のことを第１の情報処理装置とも称する。

　また、第１の情報処理装置が実行する情報処理方法において、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御してもよい。

　このようにすることにより、より適切な位置および姿勢で3Dオブジェクトを撮像し（第２の撮像を行い）、得られた第２の撮像画像を用いて第２の3Dモデリング処理を実行することができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精細な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　また、その第１の3Dモデリング処理部が、第１の撮像画像と第１の撮像部の加速度および角速度に基づいて、その第１の撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、その姿勢情報と3Dオブジェクトの深度とに基づいて、その3Dオブジェクトの第１の３次元形状情報を生成する３次元形状生成部とを備えてもよい。

　また、第１の情報処理装置において、さらに、上述した第１の3Dデータ生成処理１０１の第１の撮像が行われてもよい。例えば、第１の情報処理装置が、さらに、第１の撮像部を備えてもよい。また、その第１の撮像部を備える第１の情報処理装置が、深度を検出する深度検出部を備えてもよいし、第１の撮像部の加速度および角速度を検出する慣性計測部を備えてもよいし、その両方を備えてもよい。

　また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の撮像が行われてもよい。例えば、第１の情報処理装置が、第２の撮像部をさらに備えてもよい。

　なお、この第２の撮像により生成された第２の撮像画像は符号化されてもよい。例えば、第２の撮像部を備える第１の情報処理装置が、その第２の撮像部により生成された第２の撮像画像を符号化する符号化部を備えてもよい。この符号化された第２の撮像画像は、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の3Dモデリング処理が行われてもよい。例えば、第２の撮像部を備える第１の情報処理装置が、その第２の撮像部により生成された第２の撮像画像に基づいて、第２の３次元形状情報を生成する第２の3Dモデリング処理部をさらに備えてもよい。例えば、その第２の3Dモデリング処理部が、複数の第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、その対応点の３次元位置に基づいて３次元点を追加する３次元点追加部とを備えてもよい。第２の3Dモデリング処理において、さらに、メッシュ化とテクスチャリングが後処理として行われてもよい。例えば、第２の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　なお、この第２の3Dモデリング処理により生成された第２の3Dデータは符号化されてもよい。例えば、第２の撮像部と第２の3Dモデリング処理部を備える第１の情報処理装置が、その第２の3Dモデリング処理部により生成された第２の３次元形状情報を符号化する符号化部をさらに備えてもよい。この符号化された第２の３次元形状情報（第２の3Dデータ）は、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　なお、上述した第２の3Dデータ生成処理１０４の第２の撮像は、第１の情報処理装置と異なる第２の情報処理装置において行われてもよい。例えば、第１の情報処理装置が、第２の撮像部を備える第２の情報処理装置（撮像装置）と通信する通信部を備え、撮像制御部が第２の撮像を制御する撮像制御情報を生成し、その通信部がその撮像制御情報を第２の情報処理装置へ供給してもよい。

　また、その場合、第１の情報処理装置は、第２の情報処理装置において生成された第２の撮像画像を取得してもよい。例えば、通信部を備える第１の情報処理装置が、第２の情報処理装置から供給される第２の撮像画像を取得してもよい。この第２の撮像画像は符号化されてもよい。例えば、通信部を備える第１の情報処理装置が、その通信部により取得された第２の撮像画像を符号化する符号化部を備えてもよい。この符号化された第２の撮像画像は、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　また、第２の情報処理装置から供給される第２の撮像画像が符号化されていてもよい。つまり、通信部が、第２の撮像画像の符号化データを取得してもよい。そして、その符号化データが通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。また、第１の情報処理装置が、通信部により取得された符号化データを復号し、第２の撮像画像を生成（復元）してもよい。例えば、通信部を備える第１の情報処理装置が、その通信部により取得された第２の撮像画像の符号化データを復号する復号部を備えてもよい。

　このように第２の情報処理装置において第２の撮像が行われる場合も、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の3Dモデリング処理が行われてもよい。例えば、通信部を備える第１の情報処理装置が、その通信部により取得された第２の撮像画像に基づいて、第２の３次元形状情報を生成する第２の3Dモデリング処理部をさらに備えてもよい。例えば、その第２の3Dモデリング処理部が、複数の第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、その対応点の３次元位置に基づいて３次元点を追加する３次元点追加部とを備えてもよい。第２の3Dモデリング処理において、さらに、メッシュ化とテクスチャリングが後処理として行われてもよい。例えば、第２の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　なお、この第２の3Dモデリング処理により生成された第２の3Dデータは、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。また、この第２の3Dデータが符号化されてもよい。例えば、通信部と第２の3Dモデリング処理部を備える第１の情報処理装置が、その第２の3Dモデリング処理部により生成された第２の３次元形状情報を符号化する符号化部をさらに備えてもよい。そして、生成された第２の３次元形状情報（第２の3Dデータ）の符号化データが、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　ところで、上述したように第２の撮像は手動撮像により行うことができる。その場合、その手動撮像により得られた第２の撮像画像が第２の3Dモデリング処理に利用できるものとしてもよい。スコアリング処理１０２においては、上述したように、これまでに得られた第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度が評価される。その際、その第２の撮像画像の中に、手動撮像により得られた第２の撮像画像が含まれうるようにしてもよい。つまり、手動撮像の姿勢情報がスコアリング処理１０２に反映されてもよい。例えば、第１の情報処理装置のスコアリング処理部が、撮像制御情報に基づかない第２の撮像のタイミングを示す撮像タイミング情報により示される第２の撮像のタイミングに対応する第２の情報処理装置の位置および姿勢に基づいてスコアリング結果を生成してもよい。例えば、撮像制御部がその撮像タイミング情報に基づいてその撮像タイミングにおける第２の撮像部の姿勢情報を求め、スコアリング処理部がその姿勢情報に基づいてスコアを算出してもよい。このようにすることにより、手動撮像の姿勢情報がスコアリング結果に反映される。

　なお、この場合、第２の撮像（手動撮像）は、第１の情報処理装置において行われてもよいし、第２の情報処理装置において行われてもよい。第１の情報処理装置が第２の撮像部を備える場合、例えば、その第２の撮像部が、手動撮像を行うとそのタイミングを示す撮像タイミング情報を生成し、撮像制御部へ供給してもよい。また、第１の情報処理装置が通信部を備える場合、例えば、その通信部が、第２の情報処理装置から供給される撮像タイミング情報を取得し、撮像制御部へ供給してもよい。

　このようにすることにより、撮像タイミング情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　ところで、第１の情報処理装置において、上述したように、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。例えば、第１の情報処理装置のスコアリング処理部が、そのカメラ情報に基づいてスコアリング結果を生成してもよい。この場合、第２の撮像は、第１の情報処理装置において行われてもよいし、第２の情報処理装置において行われてもよい。第１の情報処理装置が第２の撮像部を備える場合、例えば、その第２の撮像部がカメラ情報を生成し、スコアリング処理部へ供給してもよい。また、第１の情報処理装置が通信部を備える場合、例えば、その通信部が第２の情報処理装置から供給されるカメラ情報を取得し、スコアリング処理部へ供給してもよい。

　このようにすることにより、カメラ情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　ところで、第２の情報処理装置は、上述した第２の3Dデータ生成処理１０４の第２の撮像を行ってもよい。例えば、第２の情報処理装置が、第２の撮像部と、第１の情報処理装置と通信する通信部とを備え、通信部が第１の情報処理装置から供給される撮像制御情報を取得し、第２の撮像部がその撮像制御情報に基づいて3Dオブジェクトを撮像し、第２の撮像画像を生成してもよい。この撮像制御情報は、第１の3Dデータに基づいて導出されたスコアリング結果に基づいて生成される、第２の撮像を制御する情報である。

　また、第２の情報処理装置が実行する情報処理方法において、第１の情報処理装置から供給される撮像制御情報を取得し、その撮像制御情報に基づいて第２の撮像を行い、第２の3Dデータを生成するための第２の撮像画像を生成してもよい。

　生成された第２の撮像画像は、第１の情報処理装置へ供給されてもよい。例えば、通信部が、第２の撮像部により生成された第２の撮像画像を第１の情報処理装置へ供給してもよい。この第２の撮像画像は、3Dオブジェクトの３次元形状を表現する３次元形状情報を生成するための撮像画像である。また、第２の撮像画像は、符号化されてもよい。例えば、第２の情報処理装置が、第２の撮像部により生成された第２の撮像画像を符号化する符号化部を備えてもよい。そして、通信部が、その符号化部により生成された第２の撮像画像の符号化データを第１の情報処理装置へ供給してもよい。なお、第２の撮像画像（または、第２の撮像画像の符号化データ）は、第１の情報処理装置以外の情報処理装置へ供給されてもよい。例えば、通信部が、第２の撮像画像（または、第２の撮像画像の符号化データ）を他の情報処理装置へ供給してもよい。また、この第２の撮像画像（または、第２の撮像画像の符号化データ）は、記憶媒体に記憶されてもよい。例えば、第２の情報処理装置が、符号化部により生成された第２の撮像画像の符号化データを記憶する記憶部を備えてもよい。

　また、第２の情報処理装置が、上述した第２の3Dモデリング処理を行ってもよい。つまり、第２の情報処理装置において、第２の撮像により生成された第２の撮像画像を用いて第２の3Dモデリング処理が行われ、第２の3Dデータが生成されてもよい。例えば、第２の情報処理装置が、第２の撮像部により生成された第２の撮像画像に基づいて、3Dオブジェクトの３次元形状を表現する第２の３次元形状情報（第２の3Dデータ）を生成する第２の3Dモデリング処理部をさらに備えてもよい。例えば、その第２の3Dモデリング処理部が、複数の第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、その対応点の３次元位置に基づいて３次元点を追加する３次元点追加部とを備えてもよい。第２の3Dモデリング処理において、さらに、メッシュ化とテクスチャリングが後処理として行われてもよい。例えば、第２の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　なお、この第２の3Dモデリング処理により生成された第２の3Dデータは、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。また、この第２の3Dデータが符号化されてもよい。例えば、第２の3Dモデリング処理部を備える第２の情報処理装置が、その第２の3Dモデリング処理部により生成された第２の３次元形状情報を符号化する符号化部をさらに備えてもよい。そして、生成された第２の３次元形状情報（第２の3Dデータ）の符号化データが、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　ところで、上述したように第２の撮像は手動撮像により行うことができる。その場合、その手動撮像により得られた第２の撮像画像が第２の3Dモデリング処理に利用できるものとしてもよい。スコアリング処理１０２においては、上述したように、これまでに得られた第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度が評価される。その際、その第２の撮像画像の中に、手動撮像により得られた第２の撮像画像が含まれうるようにしてもよい。つまり、手動撮像の姿勢情報がスコアリング処理１０２に反映されてもよい。

　その場合、第２の情報処理装置において手動撮像のタイミングを示す撮像タイミング情報が生成され、第１の情報処理装置へ供給されるようにしてもよい。例えば、第２の情報処理装置の第２の撮像部が、手動撮像を行うとそのタイミングを示す撮像タイミング情報を生成し、通信部がその撮像タイミング情報を第１の情報処理装置へ供給してもよい。

　このようにすることにより、撮像タイミング情報に基づいて、より適切な位置および姿勢で3Dオブジェクトを撮像することができる（第２の撮像を行うことができる）。

　ところで、上述したように、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。例えば、第２の情報処理装置の第２の撮像部がカメラ情報を生成し、通信部がそのカメラ情報を第１の情報処理装置へ供給してもよい。また、この場合、通信部は、そのカメラ情報に基づいて生成された撮像制御情報を取得し、第２の撮像部は、その撮像制御情報に基づいて第２の撮像を行ってもよい。また、第２の情報処理装置が実行する情報処理方法において、第２の撮像部に関するカメラ情報を生成し、そのカメラ情報を第１の情報処理装置へ供給してもよい。また、そのカメラ情報に基づいて生成された撮像制御情報を取得し、その撮像制御情報に基づいて第２の撮像を行ってもよい。

　このようにすることにより、カメラ情報に基づいて、より適切な位置および姿勢で3Dオブジェクトを撮像することができる（第２の撮像を行うことができる）。

　＜３．撮像案内出力＞
　　＜第２の3Dモデリング用撮像案内出力処理＞
　また、２回目の3Dモデリングのための撮像を制御する代わりに、２回目の3Dモデリングのための撮像を補助するための案内情報を出力してもよい。例えば、図４において、第１の3Dデータ生成処理１０１およびスコアリング処理１０２を実行し、さらに、第２の3Dモデリング用撮像案内出力処理１０５を実行してもよい。この場合も、第１の3Dデータ生成処理１０１およびスコアリング処理１０２は、＜２．撮像制御＞において上述した場合と同様に実行される。ただし、スコアリング処理１０２は、スコアリング結果を第２の3Dモデリング用撮像案内出力処理１０５へ供給する。

　第２の3Dモデリング用撮像案内出力処理１０５においては、スコアリング処理１０２により得られるスコアリング結果に基づいて第２の撮像のための案内情報が生成され、その案内情報の出力が制御され、出力デバイスから出力される。

　ユーザ等はこのような案内情報を参考にして手動で第２の撮像を行う。つまり、この場合、第２の撮像は手動撮像（撮像制御情報に基づかない撮像）である。このように第２の撮像が行われることにより、より適切な位置および姿勢で撮像された第２の撮像画像が生成され得る。そして、その第２の撮像画像を用いて第２の3Dデータ生成処理１０４（第２の撮像および第２の3Dモデリング処理）が実行され、目的の第２の3Dデータが生成される。換言するに、より適切な位置および姿勢で撮像された第２の撮像画像を用いて第２の3Dモデリング処理が実行されるようにすることができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　　＜案内情報の生成＞
　この案内情報を生成するために、第２の3Dモデリング用撮像案内出力処理１０５においては、スコアリング結果に基づいて第２の撮像を行うべき位置および姿勢（第２の撮像を行う位置および姿勢としてより適切な位置および姿勢）が求められる。この第２の撮像を行うべき位置および姿勢を求める方法はどのような方法であってもよい。例えば、上述した第２の3Dモデリング用撮像制御処理１０３の場合と同様の方法であってもよい。例えば、スコアリング結果に基づいて、第２の撮像が不足している部分（グレー部分）のスコアを向上させることが可能な位置および姿勢（の範囲）が特定されるようにしてもよい。

　また、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像部の現在の姿勢情報（位置および姿勢）によるスコアリング結果の変動に基づいて、現在の位置および姿勢が第２の撮像を行うべき位置および姿勢であるか否かが判定されてもよい。例えば、第２の撮像部が現在の位置および姿勢で第２の撮像を行った場合に得られる第２の撮像画像（の姿勢情報）をスコアリングに反映させた結果、そのスコアがその第２の撮像画像を加える前のスコアよりも所定の閾値以上高くなる場合に、現在の位置および姿勢が第２の撮像を行うべき位置および姿勢であると判定されてもよい。つまり、この場合、スコアリング処理１０２においては、第２の撮像部が現在の位置および姿勢で行う第２の撮像が「これまでに行われた第２の撮像」に含まれる場合と含まれない場合とで、それぞれスコアリング結果が導出され、互いに比較される。したがって、この場合、スコアリング処理１０２においては、第２の撮像部の現在の姿勢情報（撮像視点情報）に基づいてスコアリングが行われる。

　この撮像視点情報は、第２の3Dモデリング用撮像案内出力処理１０５により供給されてもよい。上述したように、この場合、第２の3Dモデリング用撮像案内出力処理１０５が実行され、第２の撮像は、手動により行われる。そのため、＜２．撮像制御＞において上述した場合と同様に、その撮像タイミングを示す撮像タイミング情報が第２の3Dデータ生成処理１０４（の第２の撮像）において生成され、第２の3Dモデリング用撮像案内出力処理１０５へ供給されてもよい。そして、第２の3Dモデリング用撮像案内出力処理１０５において、その撮像タイミング情報に基づいて、その撮像タイミングにおける第２の撮像部の姿勢情報が求められ、その撮像タイミングにおける第２の撮像部の姿勢情報が、撮像視点情報としてスコアリング処理１０２へ供給されてもよい。

　また、第１の撮像部と第２の撮像部との間で位置および姿勢の関係が既知であるならば、第２の撮像部の姿勢情報の代わりに、第１の撮像部の姿勢情報が撮像視点情報としてスコアリング処理１０２へ供給されてもよい。

　また、第２の3Dモデリング用撮像案内出力処理１０５において、これまでに行われた第２の撮像の撮像範囲とのオーバーラップ率に基づいて、第２の撮像を行うべき位置および姿勢であるか否かが判定されてもよい。

　なお、図６を参照して上述したように、第２の3Dモデリング処理が行い易い（より正確な3Dモデリング処理）を行うことができるオーバーラップ率がどのような値であるかは、3Dオブジェクトの３次元形状等にも依存する。したがって、第２の撮像を行うべき位置および姿勢を求める際に、これまでに得られた第２の撮像画像に対するオーバーラップ率を考慮する場合、3Dオブジェクトの３次元形状（第１の3Dデータ）等も考慮することが望ましい（第２の撮像を行うべき位置および姿勢をより正確に求めることができる）。

　また、図７を参照して上述したように、第２の撮像を行うべき位置および姿勢を求める際に、その撮像位置の、被写体（3Dオブジェクト）からの距離が制御されてもよい。その際、その距離が、3Dオブジェクトの３次元形状（の複雑さ）に応じて制御されるようにしてもよい。このようにすることにより、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）の低減を抑制しながら、第２の撮像の撮像回数の不要な増大を抑制することができる。つまり、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　そして、第２の3Dモデリング用撮像案内出力処理１０５においては、以上のように求められた第２の撮像を行うべき位置および姿勢に基づいて、案内情報が生成される。この案内情報は、どのような種類の情報であってもよく、例えば、画像情報が含まれていてもよいし、音声情報が含まれていてもよい。

　また、この案内情報の出力は、例えば第２の撮像を行うユーザ等に対して案内情報の内容を提示するように行われる。出力デバイスはどのようなものであってもよく、例えば、画像情報を表示するモニタが含まれていてもよいし、音声情報を出力するスピーカが含まれていてもよい。

　　＜案内情報＞
　次に、案内情報の内容について説明する。この案内情報の内容は、どのようなものであってもよい。例えば、第２の撮像としてより適切な位置および姿勢をユーザに示す情報がこの案内情報に含まれていてもよい。

　例えば、図４の第１の3Dデータ生成処理１０１により、図５に示される第１の3Dデータ１２０が生成されるとする。そして、これまでに、その第１の3Dデータ１２０に対応する3Dオブジェクトに対してカメラ１２１－１乃至カメラ１２１－３の位置および姿勢で第２の撮像が行われたものとする。その場合、スコアリング処理１０２により、第１の3Dデータ１２０の図中上側が比較的高スコアに評価され、第１の3Dデータ１２０の図中下側（グレー部分）が比較的低スコアに評価される。このスコアリング結果から、第１の3Dデータ１２０に対応する3Dオブジェクトの図中下側（例えば、グレー部分）の撮像が不足していることが明らかである。

　そこで、第２の3Dモデリング用撮像案内出力処理１０５においては、その撮像が不足しているグレー部分の撮像画像が得られるように第２の撮像を案内する案内情報が生成され、出力される。つまり、この案内情報においては、3Dオブジェクトの図中下側から撮像するように第２の撮像が案内される。例えば、カメラ１２１－４の位置および姿勢が第２の撮像を行う位置および姿勢としてより適切であると判定され、ユーザ等に対してその旨が通知される。

　このようにすることにより、ユーザは、その案内情報に従って第２の撮像を行うことにより、より適切な位置および姿勢で3Dオブジェクトを撮像することができる。つまり、その撮像画像を用いて3Dモデリング（第２の3Dデータ生成処理１０４）を実行することができる。したがって、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　　＜スコアリング結果の表示＞
　なお、案内情報にスコアリング結果を示す情報が含まれていてもよい。つまり、第２の3Dモデリング用撮像案内出力処理１０５において、スコアリング結果を示す情報を含む案内情報が生成され、そのスコアリング結果を示す画像が案内情報としてモニタに表示されてもよい。また、第２の撮像部の現在の画角内についてのスコアリング結果を示す情報が案内情報に含まれてもよい。つまり、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像部の現在の位置および姿勢に基づいてその第２の撮像部の画角内についてのスコアリング結果を示す情報を含む案内情報が生成され、そのスコアリング結果を示す画像が案内情報としてモニタに表示されてもよい。

　例えば、図１４に示されるように、第２の撮像部がカメラ２１１の位置にあり、スコアリングされた第１の3Dデータ２１０に対して、点線枠２１２内を撮像する姿勢であるとする。その場合、第２の3Dモデリング用撮像案内出力処理１０５において、画像２１３のように、第２の撮像部の現在の画角（撮像範囲）内についてのスコアリング結果を示す画像、すなわち、第１の3Dデータ２１０の、点線枠２１２内の部分を示す画像が、案内情報としてモニタに表示されてもよい。このようにすることにより、第２の撮像部の現在の位置および姿勢に応じた状態でスコアリング結果を表示させることができる。そのため、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。

　また、この案内情報（第２の撮像部の現在の画角内についてのスコアリング結果を示す画像）は、第２の撮像部により生成される撮像画像に重畳して表示されてもよい。例えば図１４に示される画像２１３（第２の撮像部の現在の画角内についてのスコアリング結果を示す画像）が、現在の画角の第２の撮像部により生成される撮像画像に重畳して表示されてもよい。このようにすることにより、画角が互いに同一の撮像画像および案内情報（スコアリング結果を示す画像）を重畳してモニタに表示させることができる。このような表示に基づいて、ユーザは、実空間の3Dオブジェクトとスコアリング結果とをより容易に対応させることができる。したがって、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。さらに、3Dオブジェクト全体のスコアリング結果を示す俯瞰画像が表示されてもよい。このような俯瞰画像の表示により、ユーザは、3Dオブジェクトの現在表示されている撮像画像に含まれる部分が、3Dオブジェクト全体のどの部分であるかをより容易に把握することができる。

　　＜オーバーラップ領域の表示＞
　また、複数の第２の撮像画像間でその撮像範囲がオーバーラップするオーバーラップ領域を示す情報が案内情報に含まれてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、複数の第２の撮像間でその撮像範囲がオーバーラップするオーバーラップ領域を示す情報を含む案内情報が生成され、そのオーバーラップ領域を示す画像が案内情報として表示されてもよい。例えば、図１５の左において、第２の撮像部がカメラ２２１－１の位置および姿勢である場合、その撮像範囲が撮像範囲２２２－１となるとする。また、第２の撮像部がカメラ２２１－２の位置および姿勢である場合、その撮像範囲が撮像範囲２２２－２であるとする。この場合、撮像範囲２２２－１および撮像範囲２２２－２は、その一部が互いに重畳（オーバーラップ）している。このように複数の第２の撮像画像の間でその撮像範囲がオーバーラップする領域が存在することにより、両画像間の対応点の検出が可能になる。つまり、複数の第２の撮像画像の間で適切なオーバーラップ領域が存在することにより、第２の3Dモデリング処理において、高精度な第２の3Dデータを生成することができる（第２の3Dデータの精度の低減を抑制することができる）。

　そのため、複数の第２の撮像画像の間で適切なオーバーラップ領域が存在するように、第２の撮像画像を生成する（第２の撮像を行う）ことが望ましい。上述したように、案内情報として、このようなオーバーラップ領域を示す画像がモニタに表示されることにより、第２の撮像部を操作するユーザ等は、その案内情報に基づいて、オーバーラップ領域を考慮しながら第２の撮像の位置および姿勢を決定することができる。つまり、そのユーザ等は、より容易に、複数の第２の撮像画像の間で適切なオーバーラップ領域が存在するような位置および姿勢で第２の撮像を行うことができる。すなわち、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　なお、このオーバーラップ領域を示す画像は、オーバーラップ領域をどのように示してもよい。例えば、色、濃度、模様、図柄、文字、記号、図形等によりオーバーラップ領域が示されてもよい。例えば、オーバーラップ領域が、他の領域に対して強調表示（他の領域よりも主観的に目立つ表現に）されてもよい。

　また、このオーバーラップ領域は、第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域であってもよい。つまり、これまでに得られた第２の撮像画像とこれから生成する第２の撮像画像とのオーバーラップ領域を示す画像が案内情報として表示されてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像部の現在の位置および姿勢に基づいて、その第２の撮像部の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す情報を含む案内情報が生成され、そのオーバーラップ領域を示す画像が案内情報としてモニタに表示されてもよい。例えば、図１５において、第２の撮像部がカメラ２２１－２の位置にあり、撮像範囲２２２－２を撮像する姿勢であるとする。この場合、その撮像範囲２２２－２内のオーバーラップ領域２２４を示す画像２２３が生成され、案内情報として表示されてもよい。

　このようにすることにより、第２の撮像部の現在の位置および姿勢に応じた状態でオーバーラップ領域を表示させることができる。そのため、第２の撮像部を操作するユーザ等は、この案内情報に基づいて、現在の位置および姿勢で第２の撮像を行うことにより得られる第２の撮像画像の撮像範囲に対して、これまでに得られた第２の撮像画像の撮像範囲がどのようにオーバーラップするかを、より容易に把握することができる。つまり、そのユーザ等は、より容易に、これまでに得られた第２の撮像画像の撮像範囲に対して適切にオーバーラップするように第２の撮像を行うことができる。すなわち、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　また、この案内情報（第２の撮像画像間でその撮像範囲がオーバーラップするオーバーラップ領域、または、第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す画像）は、第２の撮像部により生成される撮像画像に重畳して表示されてもよい。例えば、図１５に示される画像２２３（第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す画像）が、現在の画角の第２の撮像部により生成される撮像画像に重畳して表示されてもよい。

　このようにすることにより、画角が互いに同一の撮像画像および案内情報（第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す画像）を重畳してモニタに表示させることができる。このような表示に基づいて、ユーザは、実空間の3Dオブジェクトとオーバーラップ領域とをより容易に対応させることができる。したがって、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。

　なお、さらに、その画角内に占めるオーバーラップ領域の割合を示すオーバーラップ率を示す画像が表示されてもよい。このオーバーラップ率は、例えば数値で表現されてもよいし、例えば色、濃度、または模様等で表現されてもよい。このような表示により、ユーザは、どの程度オーバーラップしているかをより直感的に把握することができる。

　　＜撮像補助画像の表示＞
　また、第２の撮像を補助するための撮像補助画像が案内情報に含まれてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像を補助するための撮像補助画像を含む案内情報が生成され、その撮像補助画像が案内情報として表示されてもよい。この撮像補助画像の内容はどのようなものであってもよい。

　例えば、推奨する第２の撮像の位置および姿勢である推奨撮像位置姿勢を示す推奨撮像位置姿勢案内が撮像補助画像に含まれてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、推奨する第２の撮像の位置および姿勢である推奨撮像位置姿勢がスコアリング結果に基づいて導出され、案内情報（撮像補助画像）として、その推奨撮像位置姿勢を示す推奨撮像位置姿勢案内が表示されてもよい。

　例えば、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢と同一である場合、その旨を示す画像が推奨撮像位置姿勢案内として表示されてもよい。つまり、例えばユーザ等が第２の撮像部を移動させることにより、その現在の位置および姿勢が推奨撮像位置姿勢に一致した場合、その旨がユーザ等に通知されてもよい。この通知の方法はどのような方法であってもよい。例えば、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢に一致した際に、白画像等、それまで全く異なる画像が表示されてもよい。また、このような画像の代わりに、文字、絵柄、記号等により第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢であることが示されてもよい。第２の撮像部を操作するユーザ等は、そのような表示（推奨撮像位置姿勢案内）に基づいて、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢であることを容易に把握することができる。これにより、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　また、第２の撮像部を基準とする推奨撮像位置姿勢の相対位置および相対姿勢を示す画像が推奨撮像位置姿勢案内として表示されてもよい。つまり、第２の撮像部の現在の位置および姿勢に対して、推奨撮像位置姿勢がどの方向であるかや、どの程度離れているか等が、例えば文字、絵柄、記号等により示されてもよい。このような表示に基づいて、第２の撮像部を操作するユーザ等は、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢でなくても、より容易に、その推奨撮像位置姿勢に近づけるように第２の撮像部を移動させることができる。これにより、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　なお、この推奨撮像位置姿勢案内は、第２の撮像部により生成される撮像画像に重畳して表示されてもよい。このような表示により、ユーザは、実空間の3Dオブジェクトと推奨撮像位置姿勢案内とをより容易に対応させることができる。したがって、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。

　　＜被写体の複雑度に基づく撮像案内＞
　図７を参照して上述したように、第２の撮像の位置として、3Dオブジェクトからの適切な距離は、その3Dオブジェクトの３次元形状に依存する。そこで、第２の3Dモデリング用撮像案内出力処理１０５において導出される第２の撮像の推奨撮像位置姿勢に、3Dオブジェクト（被写体）からの距離が含まれるようにしてもよい。そして、第２の3Dモデリング用撮像案内出力処理１０５において第２の撮像の推奨撮像位置姿勢を導出する際に、その3Dオブジェクトからの距離が、3Dオブジェクトの３次元形状の複雑度に応じて導出されてもよい。

　この3Dオブジェクトの３次元形状の複雑度の導出方法はどのような方法であってもよく、例えば、＜２．撮像制御＞において上述した方法であってもよい。また、3Dオブジェクトの３次元形状の複雑度に基づく3Dオブジェクトからの距離（推奨撮像位置姿勢）の導出方法は、どのような方法であってもよい。例えば、この3Dオブジェクトの３次元形状が複雑なほど、3Dオブジェクトから近い位置が推奨撮像位置姿勢として設定されてもよい。また、この3Dオブジェクトの３次元形状が単純なほど、3Dオブジェクトから遠い位置が推奨撮像位置姿勢として設定されてもよい。

　また、モニタに表示される案内情報において、図１６に示されるように検波枠も表示されるようにしてもよい。図１６において、表示画像２３０は、第２の3Dモデリング用撮像案内出力処理１０５によりモニタに表示される案内情報である。この表示画像２３０には、スコアリングされた第１の3Dデータ２３１と、検波枠２３２が表示されている。このように検波枠２３２を表示することにより、ユーザが被写体の注目部分に対し、3Dオブジェクトの３次元形状の複雑度に応じて、第２の撮像部を3Dオブジェクト（被写体）に近づけたり、3Dオブジェクトから離したりする操作をしやすくすることができる。もちろん、検波枠が表示されないようにしてもよい。

　例えば、モニタに第２の撮像部により生成される撮像画像が表示され、さらに、その撮像画像に重畳して、案内情報として、検波枠と、3Dオブジェクト（被写体）に対応する第１の3Dデータが表示され、その第１の3Dデータ（3Dオブジェクト）において撮像すべき部分が示されてもよい。そして、ユーザが、その表示において第１の3Dデータの撮像すべき部分を検波枠に合わせるように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのに適切な位置および姿勢となるようにしてもよい。

　例えば、図１７乃至図１９のように、モニタに表示画像２４０が表示されており、その表示画像２４０において、検波枠２４１と、第１の3Dデータに基づいて導出された3Dオブジェクトの撮像すべき部分２４２とが表示されるようにしてもよい。そして、この表示画像２４０において撮像すべき部分２４２が検波枠２４１に近づく（理想的には一致する）ように、ユーザが第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となるようにしてもよい。

　例えば、図１７の左の場合、撮像すべき部分２４２が検波枠２４１に比べて小さく表示されている。その場合、ユーザは、この撮像すべき部分２４２がより大きく表示されるように第２の撮像部を3Dオブジェクトに近づける等して、図１７の右に示されるように、この撮像すべき部分２４２の表示を検波枠２４１に一致（または近似）させる。このように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となる。

　また、図１８の左の例の場合、撮像方向と撮像すべき部分２４２の法線方向がずれている（撮像すべき部分２４２と検波枠２４１（撮像面）とが正対していない）。その場合、ユーザは、第２の撮像部の向き（つまり撮像方向）を変更する等して、図１８の右に示されるように、この撮像すべき部分２４２を検波枠２４１に正対させる（より正対するようにする）。このように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となる。

　また、図１９の左の例の場合、撮像すべき部分２４２の高さが検波枠２４１と異なっている。その場合、ユーザは、第２の撮像部と3Dオブジェクトの距離を変更する等して、図１９の右に示されるように、この撮像すべき部分２４２の高さを検波枠２４１の高さに一致（または近似）させる。このように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となる。

　また、図２０の例のように、案内表示として、第２の撮像部の推奨される移動方向（推奨撮像位置姿勢に近づく移動方向）を示す矢印が表示されてもよい。例えば、図２０の左の場合、モニタに案内表示を表示する表示画像２５０が表示されており、その表示画像２５０において、案内表示として、矢印２５１が表示されている。矢印２５１は、図中奥行き側（前方）に向く矢印であり、第２の撮像部を前方に移動させる（3Dオブジェクト（被写体）に近づける）ように案内している。また、図２０の右の例の場合、モニタに表示される表示画像２５０において、案内表示として、矢印２５２が表示されている。矢印２５２は、図中手前側（後方）に向く矢印であり、第２の撮像部を後方に移動させる（3Dオブジェクト（被写体）から遠ざける）ように案内している。ユーザがこれらの矢印に従って第２の撮像部を移動させることにより、第２の撮像部を推奨撮像位置姿勢により近づかせることができる。

　また、図２１の例のように、第２の撮像部の現在位置と推奨撮像位置姿勢との深さ方向の位置関係を示すインジケータが表示されてもよい。例えば、図２１の左の場合、モニタに案内表示を表示する表示画像２６０が表示されており、その表示画像２６０において、案内表示として、インジケータ２６１が表示されている。インジケータ２６１は、第２の撮像部の現在位置と推奨撮像位置姿勢との深さ方向の位置関係を示している。図２１の左の例の場合、インジケータ２６１は、第２の撮像部の現在位置に対して推奨撮像位置姿勢の位置がずれている（前方にある）ことが示されており、第２の撮像部を前方に移動させる（3Dオブジェクト（被写体）に近づける）ように案内している。また、図２１の右の例の場合、インジケータ２６１は、第２の撮像部の現在位置と推奨撮像位置姿勢の位置が略一致している（近似している）ことが示されている。つまり、この場合、インジケータ２６１は、第２の撮像部を略移動させなくてよいと案内している。ユーザがこのインジケータ２６１に従って第２の撮像部を移動させることにより、第２の撮像部を推奨撮像位置姿勢により近づかせることができる。

　なお、インジケータ２６１は、どのようなデザインであってもよく、図２１の例に限定されない。例えば、図２２に示されるようなデザインであってもよい。この例の場合、第２の撮像部の現在位置と推奨撮像位置姿勢との深さ方向の位置関係によって、図中上側に示されるように、表示が変化する。

　また、図２３の例のように、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部の距離と正対度合い（向きの関係）が案内情報として表示されてもよい。例えば、図２３の場合、モニタに案内表示を表示する表示画像２７０が表示されており、その表示画像２７０において、スコアリングされた第１の3Dデータ２７１が表示されている。また、その表示画像２７０には、案内表示として、第２の撮像部の光軸（第２の撮像部の画素領域の中心）と第１の3Dデータ（3Dオブジェクト）２７１の撮像すべき部分の中心を結ぶ線（またはそれに準ずる線）２７２が表示されている。さらに、その表示画像２７０には、案内表示として、第１の3Dデータ（3Dオブジェクト）２７１の撮像すべき部分の中心領域での被写体表面の向きを示す矢印２７３が表示されている。

　表示画像２７０においては、この線２７２および矢印２７３により、第２の撮像部の現在位置と推奨撮像位置姿勢の位置関係や、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部の距離と正対度合い（向きの関係）が示されている。

　例えば、図２４の上段の左側に示されるように、線２７２と矢印２７３の向きが互いに異なる場合、その差（角度）の分、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分の面（その法線方向）が、撮像面（第２の撮像部の向き）に対してずれている（正対していない）ことが示される。

　これに対して、図２４の上段の中央に示されるように、線２７２と矢印２７３の向きが互いに一致する場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分の面（その法線方向）が、撮像面（第２の撮像部の向き）と正対していることが示される。

　また、図２４の上段の右側に示されるように、線２７２と矢印２７３とが離れている場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が、第２の撮像にとって適切な距離よりも遠いことが示されている。つまり、この場合、第２の撮像部を第１の3Dデータ（3Dオブジェクト）に近づけるように移動させることが案内されている。

　また、図２４の下段の左側に示されるように、線２７２が矢印２７３に対して短い場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が、第２の撮像にとって適切な距離よりも近いことが示されている。つまり、この場合、第２の撮像部を第１の3Dデータ（3Dオブジェクト）から遠ざけるように移動させることが案内されている。

　また、図２４の下段の中央に示されるように、線２７２と矢印２７３の接続部に円２７４が表示される場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が、第２の撮像にとって適切な距離に近似することが示されている。つまり、この場合、第２の撮像部を深さ方向に移動させないことが案内されている。

　また、図２４の下段の右側に示されるように、線２７２と矢印２７３の接続部に円２７４が表示され、かつ、線２７２と矢印２７３の向きが互いに一致する場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が第２の撮像にとって適切な距離に近似し、かつ、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分の面（その法線方向）が、撮像面（第２の撮像部の向き）と正対していることが示される。つまり、この場合、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢に一致または近似していることが案内されている。

　ユーザは、このような案内情報に従って第２の撮像部を移動させることにより、より容易に、第２の撮像部を推奨撮像位置姿勢により近づかせることができる。

　なお、SLAM等によって第２の撮像部（第１の撮像部）の姿勢情報が導出されているので、第２の撮像部と被写体までの距離は容易に導出することができる。したがって、上述した表示例は、リアルタイム（即時的に）に更新することができる。

　　＜リアルタイムな処理＞
　なお、図４の第１の3Dデータ生成処理１０１（第１の撮像および第１の3Dモデリング処理）、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５は、互いに並行して実行されてもよい。＜２．撮像制御＞において上述したように、第１の3Dモデリング処理により、3Dオブジェクトの第１の撮像が行われた部分の3Dデータを順次生成することができる。また、第１の3Dデータ生成処理１０１とスコアリング処理１０２を並行して実行することができる。

　また、第２の3Dモデリング用撮像案内出力処理１０５において、スコアリング処理１０２によりスコアリング結果が得られる度に（3Dオブジェクト全体のスコアリング結果が得られる前に）、その得られたスコアリング結果（3Dオブジェクトの一部に対応する第１の3Dデータに対するスコアリング結果）に基づいて、第２の撮像のための案内情報が生成され、出力されてもよい。このようにすることにより、スコアリング処理１０２が終了する前に（3Dオブジェクト全体のスコアリング結果が得られる前に）、第２の3Dモデリング用撮像案内出力処理１０５を開始することができる。つまり、スコアリング処理１０２と第２の3Dモデリング用撮像案内出力処理１０５を並行して実行することができる。

　以上のような各方法を組み合わせることにより、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５を、互いに並行して実行することができる。

　例えば、図２５に示されるように、モニタに表示画像２８０が表示され、その表示画像２８０において、第２の撮像部の撮像画像が表示されるとする。その撮像画像においては被写体として3Dオブジェクト２８１が写されている。上述したように、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５が、互いに並行して実行されることにより、3Dオブジェクト２８１全体について第１の3Dデータとそのスコアリングが終了する前に、表示画像２８０において案内情報が表示され得る。図２５の表示画像２８０において、斜線模様の表示２８２は、3Dオブジェクト２８１の第１の3Dデータが生成済みの部分を示している。また、グレー地の表示２８３は、スコアリングの結果、第２の撮像画像が不足している部分を示している。第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５を、互いに並行して実行することにより、このように、第１の撮像を行いながら、撮像案内を表示することができる。したがって、ユーザは、第１の撮像と並行して（即時的に）第２の撮像を行うことができる。

　　＜カメラ情報＞
　なお、この第２の3Dモデリング用撮像案内出力処理１０５が実行される場合も、＜２．撮像制御＞において上述した場合と同様に、第２の3Dデータ生成処理１０４（の第２の撮像）において、第２の撮像部に関するカメラ情報が生成され、スコアリング処理１０２へ供給されてもよい。そして、スコアリング処理１０２において、このカメラ情報に基づいてスコアリングが行われ、スコアリング結果が生成されてもよい。＜２．撮像制御＞において上述した場合と同様に、このカメラ情報はどのような情報を含んでもよい。

　　＜処理を実行する構成の例＞
　上述した図４の各処理は、どのような装置により実行されてもよい。例えば、情報処理装置において、上述した第１の3Dデータ生成処理１０１の第１の3Dモデリング処理と、スコアリング処理１０２と、第２の3Dモデリング用撮像案内出力処理１０５とが実行されてもよい。

　つまり、情報処理装置が、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像のための案内情報を生成し、案内情報の出力を制御する案内情報出力制御部とを備えてもよい。本項において、この情報処理装置のことを第１の情報処理装置とも称する。

　また、第１の情報処理装置が実行する情報処理方法において、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像のための案内情報を生成し、その案内情報の出力を制御してもよい。

　このようにすることにより、ユーザは、その案内情報に従って第２の撮像を行うことにより、より適切な位置および姿勢で3Dオブジェクトを撮像することができる。つまり、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、3Dモデリングの負荷の増大を抑制しながら、より高精細な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　なお、この案内情報出力制御部が、案内情報として、スコアリング結果を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部の位置および姿勢に基づいて、第２の撮像部の画角内についてのスコアリング結果を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部により生成される撮像画像をその第２の撮像部の画角内についてのスコアリング結果を示す画像に重畳して表示させてもよい。また、この案内情報出力制御部が、さらに、3Dオブジェクト全体のスコアリング結果を示す俯瞰画像を表示させてもよい。

　また、この案内情報出力制御部が、案内情報として、複数の第２の撮像画像の間で撮像範囲がオーバーラップするオーバーラップ領域を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部の位置および姿勢に基づいて、第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲との間のオーバーラップ領域を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部により生成される撮像画像をその画像に重畳して表示させてもよい。また、この案内情報出力制御部が、さらに、第２の撮像部の現在の画角内に占めるオーバーラップ領域の割合を示すオーバーラップ率を示す画像を表示させてもよい。

　また、この案内情報出力制御部が、案内情報として、第２の撮像を補助するための撮像補助画像を生成し、その撮像補助画像を表示させてもよい。また、この案内情報出力制御部が、スコアリング結果に基づいて、推奨する第２の撮像の位置および姿勢である推奨撮像位置姿勢を導出し、案内情報として、その推奨撮像位置姿勢を示す推奨撮像位置姿勢案内を表示させてもよい。また、この案内情報出力制御部が、その推奨撮像位置姿勢案内として、第２の撮像部の位置および姿勢が推奨撮像位置姿勢と同一である場合、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢であることを示す画像を表示させてもよい。また、この案内情報出力制御部が、その推奨撮像位置姿勢案内として、第２の撮像部を基準とする推奨撮像位置姿勢の相対位置および相対姿勢を示す画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像を行う撮像部により生成される撮像画像を推奨撮像位置姿勢案内に重畳して表示させてもよい。

　ところで、上述の第１の情報処理装置において、第１の３次元形状情報は、第２の３次元形状情報よりも情報量が少なく、かつ、低精細であってもよい。また、その第１の情報処理装置の第１の3Dモデリング処理部が、第１の撮像画像と第１の撮像部の加速度および角速度に基づいて、第１の撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、その姿勢情報と3Dオブジェクトの深度とに基づいて、第１の３次元形状情報を生成する３次元形状生成部とを備えてもよい。なお、この場合の第１の３次元形状情報は、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　また、上述の第１の情報処理装置において、スコアリング処理部が、第１の３次元形状情報、並びに、これまでに行われた第２の撮像の位置および姿勢に基づいて、第１の３次元形状情報の局所毎にスコアリング結果を生成してもよい。また、第１の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含み、スコアリング処理部が、メッシュのポリゴン毎にスコアリング結果を生成してもよい。

　また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の撮像が行われてもよい。その場合の第１の情報処理装置の構成は、＜２．撮像制御＞において上述した場合と同様である。また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の3Dモデリング処理が行われてもよい。その場合の第１の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　なお、上述したように第２の撮像は手動撮像で行われる。そのため、第１の情報処理装置のスコアリング処理部が、第２の撮像のタイミングを示す撮像タイミング情報により示される第２の撮像のタイミングに対応する第２の情報処理装置の位置および姿勢に基づいてスコアリング結果を生成してもよい。例えば、案内情報出力制御部がその撮像タイミング情報に基づいてその撮像タイミングにおける第２の撮像部の姿勢情報を求め、スコアリング処理部がその姿勢情報に基づいてスコアを算出してもよい。このようにすることにより、手動撮像の姿勢情報がスコアリング結果に反映される。この場合の第１の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。ただし、第２の撮像部において生成された撮像タイミング情報、または、通信部により取得された撮像タイミング情報は、案内情報出力制御部へ供給される。このようにすることにより、撮像タイミング情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　また、第１の情報処理装置において、上述したように、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。例えば、第１の情報処理装置のスコアリング処理部が、そのカメラ情報に基づいてスコアリング結果を生成してもよい。この場合の第１の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。このようにすることにより、カメラ情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　ところで、第１の情報処理装置が第２の3Dモデリング用撮像案内出力処理１０５を実行する場合も、第２の情報処理装置が、上述した第２の3Dデータ生成処理１０４の第２の撮像を行ってもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。そして、第２の情報処理装置が、上述した第２の3Dモデリング処理をさらに行ってもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　また、第２の情報処理装置において手動撮像のタイミングを示す撮像タイミング情報が生成され、第１の情報処理装置へ供給されるようにしてもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　また、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　＜４．組み合わせ＞
　　＜撮像制御と案内情報出力の組み合わせ＞
　なお、図４において、第２の3Dモデリング用撮像制御処理１０３と第２の3Dモデリング用撮像案内出力処理１０５の両方が実行されてもよい。撮像制御と案内情報の出力の両方を行うことにより、ユーザは、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　例えば、＜２．撮像制御＞において上述した第１の情報処理装置が、スコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像のための案内情報を生成する案内情報出力制御部をさらに備えてもよい。この場合、案内情報出力制御部は、＜３．撮像案内出力＞において上述した場合と同様の処理を行う。

　また、＜３．撮像案内出力＞において上述した第１の情報処理装置が、スコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御する撮像制御部をさらに備えてもよい。この場合、撮像制御部は、＜２．撮像制御＞において上述した場合と同様の処理を行う。

　＜５．フィードバック処理＞
　　＜3Dモデリングのための撮像作業＞
　ところで、上述のように、撮像画像に基づいて3Dモデリングを行う場合、より高精細な3Dデータを得るためには3Dモデリングへの貢献度が高い撮像画像が求められる。無計画に撮像作業を行うと、3Dモデリングへの貢献度が低い無駄な撮像を繰り返し、作業の負荷が不要に増大してしまうおそれがあった。撮像作業の負荷を低減させるためには、3Dモデリングへの貢献度がより高い撮像画像をより効率よく得ることが求められた。

　そこで、上述した例においては、撮像と3Dモデリングを複数回行うようにし、１回目の3Dモデリングにより得られた3Dデータに基づいて、２回目の3Dモデリングのための撮像を制御したり、案内を行ったりした。つまり、簡易な3Dモデルに基づいて高品位な3Dモデリングを行うためのナビゲーション（撮像制御や撮像案内等）が行われた。

　しかしながら、より高精細な3Dデータを得るための3Dモデリングは一般的に負荷が大きく処理時間が長い。例えばフォトグラメトリ処理は、図３に示されるように、リアルタイムモデリング処理に比べて高精度な3Dデータを得られるが、処理時間は長い。そのため、上述のようなナビゲーションを適用する場合であっても、ユーザが撮像作業中に3Dモデリングの結果を確認することは困難であった。

　したがって、このような場合の作業は、一般的に、図２６のフロー３０１のような流れで行われた。つまりこの場合、ユーザは、撮像作業終了後、自宅やオフィス等に移動し、据え置きの高スペックなコンピュータを用いて3Dモデルの合成や編集を行う。もし、撮像漏れが生じた場合（例えば、有効な撮像画像が不足し、高精度な3Dモデルが得られない箇所が存在するような場合）、ユーザは現場に戻って撮像作業を再開しなければならず、煩雑な作業が必要であった。

　　＜フィードバック処理＞
　そこで、図４に示されるように、3Dモデリング結果をフィードバックするためのフィードバック処理１０６を実行する。この処理を行うことで撮像作業中に3Dモデリング結果（3Dモデル）をナビゲーション等に利用することができ、ユーザは3Dモデリングのための撮像をより容易に行うことができる。

　　＜フィードバックのための3Dモデリング＞
　このフィードバック処理１０６として、例えば、最終的な3Dモデリング（フロー３０１の3Dモデル合成等）とは別に、フィードバックするための3Dモデリングを行ってもよい。つまり、図２６のフロー３０２に示されるように、撮像作業と並行して3Dモデリング（3Dモデル合成）を行うようにしてもよい。当然、撮像作業中であるので、全ての撮像画像が得られた状態ではない。3Dモデル全体を構築するために必要な撮像画像が十分に得られていなくても、その時点までに得られた撮像画像を用いて、逐次的に3Dモデリングを行うようにする。このようにすることにより、撮像作業中に3Dモデリング結果（3Dモデル）が得られるので、その3Dモデルを撮像作業のナビゲーション等に利用することができる。したがって、ユーザは3Dモデリングのための撮像をより容易に行うことができる。

　つまり、この3Dモデリングは、撮像作業中に複数回行われ得る。撮像作業が進み、撮像画像の数が増大するにしたがって、より広範囲の3Dモデルが得られたり、より高精細な3Dモデルが得られたりする。例えば、図２７に示されるように、１回目の処理では四角３１１内に示される範囲しか得られなかった3Dモデル３２１が、２回目、３回目、４回目と処理が繰り返される度に、利用する撮像画像の数が増大し、四角３１２、四角３１３、四角３１４内にそれぞれ示されるように、より大きな3Dモデル３２１が生成される。このような3Dモデリングをインクリメント処理とも称する。

　例えば、四角３１１内に示される3Dモデル３２１が表示されることにより、ユーザは、この表示された部分の3Dモデリング結果を確認することができる。例えば、ユーザは、この部分について、撮像漏れが生じているか等を確認することができる。つまり、不完全な3Dモデルがフィードバックされることになるが、不完全であっても3Dモデルを利用することはできる。このように、インクリメント処理により得られた3Dモデル３２１を逐次的にフィードバックすることにより、ユーザは、3Dモデルが完成するよりも前に、3Dモデリング結果を確認することができる。したがって、典型的には、ユーザは、撮像作業を終了する前に撮像作業を行っている現場でこの、3Dモデリング結果を（逐次的に）確認することができる。そのため、ユーザは、フロー３０１のように、撮像作業中に3Dモデリング結果を全く参照できない場合（つまり、自宅やオフィスに戻ってから3Dモデリング結果を確認する場合）よりも、3Dモデリングのための撮像をより容易に行うことができる。

　この3Dモデリングの方法は、最終的な3Dモデリング（フロー３０１の3Dモデル合成等）と同一であってもよい。例えば、フォトグラメトリ処理が適用されてもよい。最終的な3Dモデリングと同様の手法を適用することにより、最終的な3Dモデリングの処理結果とほぼ同様の3Dモデルをフィードバックすることができる。なお、最終的な3Dモデリングの場合と完全に同一の処理を行ってもよいし、処理時間短縮のために一部の処理を省略したり、簡易化したりしてもよい。

　また、この3Dモデリングに用いられる撮像画像のサイズやフォーマット等はどのようなものであってもよい。例えば、サイズやフォーマット等が最終的な3Dモデリングに用いられる撮像画像と同一であってもよいし、互いに異なっていてもよい。

　例えば、最終的な3Dモデリングに用いられる撮像画像の画サイズを縮小した縮小画像がこのフィードバック用の3Dモデリングに用いられてもよい。また、最終的な3Dモデリングには非圧縮の撮像画像（例えばRAWデータやYUVデータ等）が用いられ、フィードバック用の3Dモデリングには圧縮された撮像画像（例えばJPEG（Joint Photographic Experts Group）データ等）が用いられてもよい。また、フィードバック用の3Dモデリングに圧縮された縮小画像が用いられてもよい。

　なお、この3Dモデリングは、どの装置が行ってもよい。例えば、カメラやスマートフォン等の端末装置からサーバに撮像画像を提供し、サーバがこの3Dモデリングを実行し、得られた3Dモデルを端末装置に返してもよい。また、カメラやスマートフォン等の端末装置において、この3Dモデリングが行われてもよい。

　　＜座標系の対応＞
　ところで、上述のように3Dモデリング結果を利用して撮像のナビゲーションを行う場合、複数回3Dモデリングが行われることになる。つまり、フィードバック用の3Dモデリング（例えばフォトグラメトリ処理）とは別に、端末装置等においてナビゲーション用の１回目の3Dモデリング（例えばリアルタイム3Dモデリング）が行われる。これらの3Dモデリングは互いに独立に行われる。つまり、これらの3Dモデリングにより互いに独立した座標系の3Dモデルが得られる。換言するに、フィードバック用の3Dモデリング（2回目の3Dモデリング）により得られる3Dモデルは、１回目の3Dモデリングや端末装置の姿勢情報（撮像部）とは独立した座標系で生成される。したがって、フィードバック用の3Dモデリングにより得られる3Dモデルは、１回目の3Dモデリングにより生成される3Dモデルや端末装置との位置関係が不明であった。そのため、フィードバック用の3Dモデリングにより得られる3Dモデルをナビゲーションに利用するためには、１回目の3Dモデリングにより生成される3Dモデルや端末装置との対応をユーザが感覚で構築しなければならず、煩雑な作業が必要なだけでなく、不正確な対応関係を構築し、ナビゲーションの精度が低減するおそれがあった。

　そこで、１回目の3Dモデリングと、フィードバック用の3Dモデリングとの間で座標系の対応関係を構築するようにする。

　例えば、情報処理装置が、第１の3Dモデリング処理を行う第１の3Dモデリング処理部と、その第１の3Dモデリング処理を制御し、その第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させる座標制御部とを備えるようにしてもよい。また、情報処理方法において、第１の3Dモデリング処理を行い、その第１の3Dモデリング処理を制御し、その第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させてもよい。

　また、情報処理装置が、第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行う第２の3Dモデリング処理部と、その第２の3Dモデリング処理を制御し、その第２の3Dモデリング処理の座標系を第１の3Dモデリング処理の座標系と対応させる座標制御部とを備えてもよい。また、情報処理方法において、第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行い、その第２の3Dモデリング処理を制御し、その第２の3Dモデリング処理の座標系を第１の3Dモデリング処理の座標系と対応させてもよい。

　なお、第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成してもよい。また、第１の撮像画像は、第１の撮像部が3Dオブジェクトを撮像する第１の撮像により生成されてもよい。また、第２の3Dモデリング処理は、第２の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成してもよい。また、第２の撮像画像は、第２の撮像部がその第１の３次元形状情報に基づいて3Dオブジェクトを撮像する第２の撮像により生成されてもよい。

　なお、ここで、第１の3Dモデリング処理は、撮像のナビゲーションに利用される3Dモデルを生成するための3Dモデリング処理である。また、第２の3Dモデリング処理は、上述した最終的な3Dモデリングのことを含むとともに、フィードバック用の3Dモデリングのことも含むものとする。

　このようにすることにより、フィードバック用の3Dモデリングにより得られる3Dモデルと、１回目の3Dモデリングにより生成される3Dモデルや端末装置との位置関係が明らかになる。したがって、フィードバック用の3Dモデリングにより得られる3Dモデルをより容易にナビゲーションに利用することができる。また、その場合、ナビゲーションの精度の低減を抑制することができる。

　例えば、座標制御部が、第１の3Dモデリング処理部が第１の3Dモデリング処理を開始する際に座標系を対応させてもよい。同様に、座標制御部が、第２の3Dモデリング処理部が第２の3Dモデリング処理を開始する際に座標系を対応させてもよい。座標系の対応を取るタイミングはどのようなタイミングで合ってもよい。また、対応を取る回数も任意である。例えば、3Dモデリング開始時だけでなく、3Dモデリング中にも行われてもよい。

　なお、この座標系の対応付けにおいては、第１の3Dモデリング処理の座標系と、第２の3Dモデリング処理の座標系との間で座標が変換可能となるようにすればよい。つまり、第１の3Dモデリング処理と第２の3Dモデリング処理において、互いに同一の座標系が適用されてもよいし、両座標系の対応関係が明らかであれば互いに異なる座標系が適用されてもよい。

　　＜表示制御＞
　このようなフィードバック用の3Dモデリングの利用について説明する。例えば、フィードバック用の3Dモデリングにおいて得られる3Dモデルを、最終的な3Dモデリングの結果を疑似的に示す情報として、表示部に表示させてもよい。

　例えば、上述した情報処理装置が、第２の3Dモデリング処理により生成される、第１の３次元形状情報と対応する座標系の第２の３次元形状情報を表示部に表示させる表示制御部をさらに備えてもよい。

　このようにすることにより、ユーザが、表示部に表示されたこのフィードバック用の3Dモデリングにおいて得られる3Dモデルの画像を見ることで、最終的な3Dモデリングの結果を疑似的に確認することができる。したがって、ユーザは、例えば撮像漏れや撮像の失敗等を撮像作業中に発見することができ、容易に撮り直しや追加撮像等を行うことができる。

　例えば、表示制御部は、第２の３次元形状情報を、任意の視点で表示させてもよい。例えば図２８の上側に示されるように、端末装置３３１の表示部３３２にフィードバック用の3Dモデリングにおいて得られる3Dモデル３２１を表示し、ユーザが操作することにより、その3Dモデル３２１を矢印のように回転させたり、平行移動させたり、拡大したり、縮小したりできるようにしてもよい。

　また、表示制御部は、第２の３次元形状情報を、第１の撮像部の現在の位置および姿勢に対応する視点で表示させてもよい。例えば図２８の下側に示されるように、3Dモデル３２１の視点が、端末装置３３１（が有する第１の撮像部（第２の撮像部でもよい））の現在の位置および姿勢に連動するようにしてもよい、つまり、この場合、ユーザが端末装置３３１を移動させたり向きを変えたりすると、表示されている3Dモデル３２１の位置や姿勢もそれに連動して変化する。上述のように3Dモデル３２１の座標系を１回目の3Dモデリングにより生成される3Dモデルや端末装置の座標系に対応させることにより、容易にこのような表示が可能となる。

　また、表示制御部は、表示部の表示領域を分割し、第１の撮像部の現在の位置および姿勢に対応する視点の第２の３次元形状情報と、任意の視点の第２の３次元形状情報とを、互いに異なる表示領域に表示させてもよい。例えば図２９においては、表示部３３２の表示領域が分割され、表示領域３３３および表示領域３３４が形成されている。そして、表示領域３３３には、図２８の上の例のように3Dモデル３２１が任意の視点で表示されている。また、表示領域３３４には、図２８の下の例のように3Dモデル３２１が第１の撮像部の現在の位置および姿勢に対応する視点で表示されている。このように複数の視点の3Dモデル３２１を並べて表示してもよい。

　また、表示制御部は、さらに、第１の３次元形状情報を第２の３次元形状情報に重畳させて表示させてもよい。例えば図３０においては、3Dモデル３２１に、１回目の3Dモデリングにより生成される3Dモデル３４１が重畳されて表示されている。このようにすることにより、ユーザは、3Dモデル３２１だけでなく3Dモデル３４１を確認することができる。例えば、ユーザは、生成された3Dモデル３４１の内、どの部分の3Dモデル３２１が生成されているかを容易に確認することができる。上述のように3Dモデル３２１の座標系を１回目の3Dモデリングにより生成される3Dモデルや端末装置の座標系に対応させることにより、容易にこのような表示が可能となる。

　また、表示制御部は、表示部の表示領域を分割し、第１の３次元形状情報および第２の３次元形状情報を、互いに異なる表示領域に表示させてもよい。例えば図３１においては、表示領域３３３に3Dモデル３４１が表示され、表示領域３３４に3Dモデル３２１が表示されている。このように3Dモデル３２１と3Dモデル３４１とを重畳させずに並べて表示してもよい。なお、各モデルの視点は、任意の視点であってもよいし、第１の撮像部の現在の位置および姿勢に対応する視点であってもよい。

　また、表示制御部は、第１の３次元形状情報および第２の３次元形状情報を、互いに同一の視点で表示させてもよい。つまり、図３１のように表示される3Dモデル３２１および3Dモデル３４１が互いに同一の視点で表示されてもよい。上述のように3Dモデル３２１の座標系を１回目の3Dモデリングにより生成される3Dモデルや端末装置の座標系に対応させることにより、容易にこのような表示が可能となる。

　表示制御部は、さらに、これまでに得られた第２の撮像画像の視点を示す画像を第２の３次元形状情報に重畳させて表示させてもよい。例えば図３２に示されるように、これまでに得られた第２の撮像画像の視点を示す画像３５１が表示されてもよい。上述のように3Dモデル３２１の座標系を１回目の3Dモデリングにより生成される3Dモデルや端末装置の座標系に対応させることにより、容易にこのような表示が可能となる。

　また、その際、表示制御部は、さらに、その第２の撮像画像の視点に対応する第２の撮像画像を第２の３次元形状情報に重畳させて表示させてもよい。例えば図３２の上側に示されるように、画像３５１（視点）に対応する第２の撮像画像３５２（その視点において撮像された撮像画像）が表示されてもよい。

　また、表示制御部は、さらに、その第２の撮像画像の視点からの撮像範囲を示す画像を第２の３次元形状情報に重畳させて表示させてもよい。例えば図３２の下側に示されるように、画像３５１（視点）に対応する撮像範囲３５３が（例えば色を変える等して）示されてもよい。

　また、表示制御部は、さらに、第２の３次元形状情報に基づいて導出されるスコアを第２の３次元形状情報に重畳させて表示させてもよい。このスコアは、これまでに生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度の評価値である。なお、このスコアの重畳表示は、上述した各表示例のいずれに適用してもよい。

　なお、第１の撮像部や第２の撮像部により得られる撮像画像が、3Dモデル３２１等に重畳して表示されてもよい。

　また、例えば、フィードバック用の3Dモデリングにおいて得られる3Dモデル３２１の欠損等にマークを付けると、１回目の3Dモデリングにより生成される3Dモデル３４１にもマークがつくようにしてもよい。このようにすることにより、撮像作業において、ユーザは、撮像制御や撮像案内にも利用される3Dモデル３４１を参照して（3Dモデル３２１を参照せずに）、その欠損位置を把握することができる。

　このような表示制御は、どこで行われてもよい。例えば、表示部３３２を有する端末装置３３１において行われてもよい。つまり、上述した情報処理装置が、表示制御部の制御により第２の３次元形状情報が表示される表示部を備えてもよい。

　　＜座標補正＞
　リアルタイム3Dモデリングの場合、例えば図３３に示されるように矢印３６１のように移動しながら撮像が行われると、各撮像画像に基づいて特徴点が抽出され、その特徴点に基づいてマッチングが行われてランドマーク点３６２が特定され、そのランドマーク点や姿勢情報等に基づいて撮像画像の視点の位置や姿勢が特定される。キーフレーム３６３は、撮像画像の内、SLAMにおいてランドマーク点の生成に関与するフレームである。このキーフレーム３６３に基づいて3Dモデルが構築され、フォトグラメトリ用の撮像の視点３６４が設定される。

　フォトグラメトリにおいては、図３４に示されるように、撮像画像に基づいてSfMによりランドマーク点３７１および撮像画像の視点３７２の位置および姿勢が導出される。

　各処理において導出される視点の位置および姿勢の精度が互いに同一であれば、視点３６４および視点３７２は互いに一致する。しかしながら、実際には、SfMの方がSLAMよりも高精度である。そのため、図３５に示されるように、視点３６４および視点３７２が互いにずれる場合がある。このような位置や姿勢のずれが生じると、ナビゲーションの精度が低減するおそれがある。

　そこで、座標制御部が、第２の3Dモデリング処理により得られる第２の撮像画像の視点の位置および姿勢を用いて、第１の撮像画像の視点の位置および姿勢を補正してもよい。図３５の例の場合、視点３７２の位置および姿勢を用いて、キーフレーム３６３の位置および姿勢を補正し、キーフレーム３６３’を導出してもよい。このようにすることにより、第１の３次元形状情報（第１の3Dデータ）が補正される。また、その第１の3Dデータを用いて導出されるスコアリング結果が補正される。このように、第１の3Dデータやスコアリング結果が補正されるので、撮像制御や撮像案内等の処理の精度の低減を抑制することができる。つまり、ナビゲーションの精度の低減を抑制することができる。

　　＜撮像作業の再開＞
　例えば、図３６に示されるフロー３８１のように、ユーザが撮像作業を中断し、しばらくしてから撮像作業を再開するケースが考えられる。このような場合、従来のような方法では、中断前の3Dモデリングと再開後の3Dモデリングは互いに独立に行われ、座標系が互いに独立する。つまり、ユーザが撮像作業を中断することにより、第１の3Dモデリングがいったん終了すると、中断前の座標系を引き継ぐことができない。そのため、再開後の姿勢情報の精度（つまりナビゲーションの精度）が低減するおそれがあった。

　上述したように、座標制御部が、第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させることにより、図３６に示されるフロー３８２のように第２の3Dモデリング（フィードバック用の3Dモデリング）を介して、中断前と再開後で座標系を共有することができる。つまり、作業再開後も座標系を引き継ぐことができる。したがって、再開後の姿勢情報の精度（つまりナビゲーションの精度）の低減を抑制することができる。

　　＜複数ユーザによる共同作業＞
　また、例えば、図３７に示されるフロー３９１のように、複数のユーザ（例えばユーザAとユーザB）が共同で撮像作業を行うケースが考えられる。例えば、複数ユーザが大きな１つの3Dオブジェクトの3Dモデルを生成するケースが考えられる。このような場合に、従来の方法では、各ユーザの3Dモデリングは、互いに独立の座標系で行われることになる。そのため、各ユーザが生成した3Dモデルを統合する煩雑な作業が必要であった。

　上述したように、座標制御部が、第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させることにより、図３７に示されるフロー３９２のように第２の3Dモデリング（フィードバック用の3Dモデリング）を介して、複数のユーザが座標系を共有することができる。したがって、各ユーザが生成した3Dモデルを容易に統合することができる。例えば、互いに同一の地点の3Dモデルを生成すれば、その地点を基に3Dモデルを統合することができる。そのため、例えば、撮像開始地点や撮像終了地点を共通にしたり、各自が共通のチェックポイントを通るように撮像作業を行うようにしたりすることにより、複数ユーザによる共同作業を容易に実現することができる。例えば、図３８に示されるように、3Dモデル３２１の点線４０１で囲まれる部分をユーザAが撮像作業を行って生成し、3Dモデル３２１の点線４０２で囲まれる部分をユーザBが撮像作業を行って生成することができる。したがって、例えば巨大な3Dオブジェクトでも、より短時間でその3Dモデルを生成することができる。

　　＜フィードバック用の3Dモデル＞
　なお、フィードバック用の3Dモデルは、他の装置から供給されてもよいし、フィードバック用の3Dモデリングを行って生成してもよい。つまり、上述した情報処理装置が、第２の3Dモデリング処理を行う第２の3Dモデリング処理部をさらに備えてもよい。また、上述した情報処理装置が、その第２の3Dモデリング処理に適用される第２の撮像画像を生成する第２の撮像部をさらに備えてもよい。

　＜６．第１の実施の形態＞
　　＜撮像装置＞
　図３９は、本技術を適用した情報処理装置の一態様である撮像装置の構成の一例を示すブロック図である。図３９に示される撮像装置１３００は、3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリングを行う装置である。なお、図３９においては、処理部やデータの流れ等の主なものを示しており、図３９に示されるものが全てとは限らない。つまり、撮像装置１３００が、図３９においてブロックとして示されていない装置や処理部を有してもよい。また、図３９において矢印等として示されていないデータの流れや処理が存在してもよい。

　図３９に示されるように、撮像装置１３００は、第１の3Dデータ生成部１３０１、スコアリング処理部１３０２、撮像制御部１３０３、第２の3Dデータ生成部１３０４、符号化部１３０５、記憶部１３０６、通信部１３０７、撮像案内出力制御部１３０８、および出力部１３０９を有する。また、第１の3Dデータ生成部１３０１は、デプスセンサ１３１１、撮像部１３１２、IMU（Inertial Measurement Unit）１３１３、およびリアルタイム3Dモデリング処理部１３１４を有する。また、リアルタイム3Dモデリング処理部１３１４は、SLAM（Simultaneous Localization and Mapping）１３２１、TSDF（Truncated Signed Distance Function）更新部１３２２、およびメッシュ生成部１３２３を有する。また、第２の3Dデータ生成部１３０４は、操作部１３３１、撮像部１３３２、画像処理部１３３３、およびフォトグラメトリ処理部１３３４を有する。また、フォトグラメトリ処理部１３３４は、SfM（Structure From Motion）１３４１およびMVS（Multi View Stereo）１３４２を有する。

　第１の3Dデータ生成部１３０１は、第１の3Dデータの生成に関する処理を行う。例えば、第１の3Dデータ生成部１３０１は、図４の第１の3Dデータ生成処理１０１を実行する。デプスセンサ１３１１は、Lidarセンサ（dToFモジュール）等を有し、被写体までの深度を検出し、TSDF更新部１３２２へ供給する。撮像部１３１２は、イメージセンサを有し、被写体を撮像して撮像画像を生成する。撮像部１３１２は、図４の第１の3Dデータ生成処理１０１の第１の撮像（つまり、第１の3Dモデリング（リアルタイム3Dモデリング）のための撮像）を行う。撮像部１３１２は、生成した撮像画像をSLAM１３２１へ供給する。IMU１３１３は、撮像装置の慣性情報（加速度および角速度）を検出し、SLAM１３２１へ供給する。

　リアルタイム3Dモデリング処理部１３１４は、リアルタイム3Dモデリングに関する処理を行う。例えば、リアルタイム3Dモデリング処理部１３１４は、図４の第１の3Dデータ生成処理１０１の第１の3Dモデリング処理（リアルタイム3Dモデリング）を実行する。つまり、リアルタイム3Dモデリング処理部１３１４は、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する。

　SLAM１３２１は、供給された第１の撮像画像と慣性情報とに基づいて自己位置推定を行い、撮像装置１３００の位置および姿勢を示す姿勢情報を生成する。SLAM１３２１は、生成した姿勢情報をTSDF更新部１３２２、撮像制御部１３０３、および撮像案内出力制御部１３０８へ供給する。TSDF更新部１３２２は、その姿勢情報と深度に基づいてTSDFを更新し、更新されたTSDFをメッシュ生成部１３２３へ供給する。メッシュ生成部１３２３は、その更新されたTSDFを用いてメッシュ（やテクスチャ）を生成する。メッシュ生成部１３２３は、そのメッシュおよびテクスチャを第１の3Dデータ（第１の３次元形状情報）としてスコアリング処理部１３０２へ供給する。

　スコアリング処理部１３０２は、スコアリングに関する処理を行う。例えば、スコアリング処理部１３０２は、供給された第１の3Dデータと、撮像制御部１３０３から供給される撮像視点情報（第２の撮像が行われた位置および姿勢を示す情報）とに基づいて、図４のスコアリング処理１０２を行う。つまり、スコアリング処理部１３０２は、第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成する。例えば、スコアリング処理部１３０２は、第１の３次元形状情報、並びに、これまでに行われた第２の撮像の位置および姿勢に基づいて、第１の３次元形状情報の局所毎にスコアリング結果を生成してもよい。例えば、スコアリング処理部１３０２は、メッシュのポリゴン毎にスコアリング結果を生成してもよい。スコアリング処理部１３０２は、そのスコアリング結果を撮像制御部１３０３および撮像案内出力制御部１３０８へ供給する。

　なお、スコアリング処理部１３０２は、撮像部１３３２に関するカメラ情報を取得し、そのカメラ情報に基づいてスコアリング結果を生成してもよい。また、スコアリング処理部１３０２は、撮像部１３３２による撮像制御情報に基づかない第２の撮像のタイミングに対応する撮像装置１３００の位置および姿勢に基づいてスコアリング結果を生成してもよい。

　撮像制御部１３０３は、第２の撮像の制御に関する処理を行う。例えば、撮像制御部１３０３は、図４の第２の3Dモデリング用撮像制御処理１０３を実行する。つまり、撮像制御部１３０３は、供給されたスコアリング結果および姿勢情報に基づいて、第２の撮像を制御する撮像制御情報を生成し、撮像部１３３２へ供給する。この撮像制御情報は、例えば、撮像部１３３２に対して第２の撮像を実行させる（第２の撮像画像を生成させる）制御情報である。つまり、撮像制御部１３０３は、スコアリング結果に基づいて第２の撮像として適切な位置および姿勢を求め、撮像部１３３２に対してその位置および姿勢で第２の撮像を実行させる。また、撮像制御部１３０３は、その実行させた第２の撮像の位置および姿勢を示す撮像視点情報をスコアリング処理部１３０２へ供給する。

　また、撮像制御部１３０３は、撮像部１３３２による撮像制御情報に基づかない第２の撮像のタイミングを示す撮像タイミング情報を取得し、その撮像タイミングに対応する撮像装置１３００の姿勢情報を撮像視点情報としてスコアリング処理部１３０２へ供給してもよい。

　第２の3Dデータ生成部１３０４は、第２の3Dデータの生成に関する処理を行う。例えば、第２の3Dデータ生成部１３０４は、図４の第２の3Dデータ生成処理１０４を実行する。操作部１３３１は、ユーザ等による撮像部１３３２への指示を受け付け、撮像部１３３２へその指示を供給する。

　撮像部１３３２は、イメージセンサを有し、被写体を撮像して撮像画像を生成する。撮像部１３３２は、図４の第２の3Dデータ生成処理１０４の第２の撮像（つまり、第２の3Dモデリング（フォトグラメトリ）のための撮像）を行う。撮像部１３３２は、生成した撮像画像を画像処理部１３３３へ供給する。

　撮像部１３３２は、例えば、撮像制御部１３０３の制御に従って（撮像制御部１３０３から供給される撮像制御情報に基づいて）第２の撮像を行い、第２の撮像画像を生成してもよい。また、撮像部１３３２は、操作部１３３１から供給される指示に従って第２の撮像を行い、第２の撮像画像を生成してもよい。また、撮像部１３３２は、カメラ情報（撮像部１３３２の内部パラメータ、外部パラメータ、画角情報等）をスコアリング処理部１３０２へ供給してもよい。また、撮像部１３３２は、撮像制御情報に基づかない第２の撮像のタイミングを示す撮像タイミング情報を、撮像制御部１３０３および撮像案内出力制御部１３０８へ供給してもよい。

　画像処理部１３３３は、撮像部１３３２において生成された撮像画像（第２の撮像画像）に対して所定の画像処理を施す。この画像処理の内容は任意である。画像処理部１３３３は、その撮像画像をSfM１３４１へ供給する。また、画像処理部１３３３は、その撮像画像を符号化部１３０５および撮像案内出力制御部１３０８へ供給してもよい。

　フォトグラメトリ処理部１３３４は、第２の撮像画像に対するフォトグラメトリに関する処理を行う。例えば、フォトグラメトリ処理部１３３４は、図４の第２の3Dデータ生成処理１０４の第２の3Dモデリング処理を実行する。つまり、フォトグラメトリ処理部１３３４は、撮像部１３３２により生成された第２の撮像画像に基づいて、第２の３次元形状情報を生成する。

　SfM１３４１は、例えば、第２の撮像画像間で対応点を探索し、エピポーラ拘束によりカメラの位置および姿勢を導出し、そのカメラ位置および姿勢に基づく三角測量により各対応点の３次元空間における位置を特定し、その特定した３次元点群の全体をバンドル調整により最適化し、MVS１３４２へ供給する。MVS１３４２は、例えば、その３次元点群を用いて、さらに、密な対応点探索を行い、３次元点を追加し、さらに後処理としてメッシュ化やテクスチャリングを行い、第２の3Dデータを生成する。MVS１３４２は、生成した第２の3Dデータを符号化部１３０５へ供給する。

　符号化部１３０５は、供給された第２の3Dデータを符号化し、その符号化データを記憶部１３０６および通信部１３０７へ供給する。また、符号化部１３０５は、供給された第２の撮像画像を符号化し、その符号化データを記憶部１３０６および通信部１３０７へ供給してもよい。

　記憶部１３０６は、供給された符号化データを記憶する。通信部１３０７は、供給された符号化データを他の情報処理装置（例えばサーバ等）に送信する。

　撮像案内出力制御部１３０８は、第２の撮像のための案内に関する処理を行う。例えば、撮像案内出力制御部１３０８は、図４の第２の3Dモデリング用撮像案内出力処理１０５を実行する。つまり、撮像案内出力制御部１３０８は、第２の撮像のための案内情報を生成し、その案内情報の出力を制御する。例えば、撮像案内出力制御部１３０８は、供給されたスコアリング結果と撮像装置１３００の姿勢情報とに基づいて、上述した案内情報を生成する。また、撮像案内出力制御部１３０８は、供給された撮像タイミング情報に基づいて案内情報を生成してもよい。撮像案内出力制御部１３０８は、生成した案内情報を出力部１３０９へ供給し、例えば画像や音声等として出力させる。また、撮像案内出力制御部１３０８は、供給された撮像画像をその案内情報（画像）に重畳し、表示させてもよい。

　出力部１３０９は、撮像案内出力制御部１３０８の制御に従って案内情報を画像や音声等として出力する。

　このような構成を有することにより、撮像装置１３００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置１３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、撮像装置１３００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、撮像装置１３００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置１３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　この撮像装置１３００により実行される3Dモデリング処理の流れの例を図４０のフローチャートを参照して説明する。

　3Dモデリング処理が開始されると、ステップＳ３０１において、デプスセンサ１３１１、撮像部１３１２、およびIMU１３１３は、深度、撮像画像、慣性情報を取得する。

　ステップＳ３０２において、リアルタイム3Dモデリング処理部１３１４は、リアルタイム3Dモデリング処理を実行し、第１の3Dデータを生成する。

　ステップＳ３０３において、スコアリング処理部１３０２は、これまでに行われた第２の撮像に基づいて第１の3Dデータをスコアリングする。

　ステップＳ３０４において、撮像案内出力制御部１３０８は、スコアリング結果や姿勢情報等に基づいて第２の撮像のための撮像案内（案内情報）を生成する。出力部１３０９は、その撮像案内（案内情報）を出力する。

　ステップＳ３０５において、撮像制御部１３０３は、スコアリング結果や姿勢情報等に基づいてフォトグラメトリ用撮像（第２の撮像）を制御する。

　ステップＳ３０６において、撮像部１３３２は、その制御に従って撮像する（第２の撮像を行う）。

　ステップＳ３０７において、撮像制御部１３０３および撮像案内出力制御部１３０８は、撮像部１３３２からカメラ情報を取得する。また、スコアリング処理部１３０２は、撮像部１３３２から撮像タイミング情報を取得する。

　ステップＳ３０８において、撮像制御部１３０３は、フォトグラメトリ用撮像（第２の撮像）を終了するか否かを判定する。フォトグラメトリ用撮像を終了しないと判定された場合、処理はステップＳ３０３に戻る。また、ステップＳ３０８においてフォトグラメトリ用撮像を終了すると判定された場合、処理はステップＳ３０９へ進む。

　ステップＳ３０９において、フォトグラメトリ処理部１３３４は、フォトグラメトリ処理を実行し、第２の3Dデータを生成する。

　ステップＳ３１０において、符号化部１３０５は、その第２の3Dデータを符号化する。

　ステップＳ３１１において、記憶部１３０６は、その符号化データを記憶する。また、通信部１３０７は、その符号化データを他の装置（例えばサーバ等）へ送信する。

　ステップＳ３１１の処理が終了すると、3Dモデリング処理が終了する。

　　＜リアルタイム3Dモデリング処理の流れ＞
　図４０のステップＳ３０２において実行されるリアルタイム3Dモデリング処理の流れの例を、図４１のフローチャートを参照して説明する。

　リアルタイム3Dモデリング処理が開始されると、SLAM１３２１は、ステップＳ３３１において、撮像画像および慣性情報に基づいて撮像装置１３００の３次元姿勢を示す姿勢情報を導出する。

　ステップＳ３３２において、TSDF更新部１３２２は、撮像画像、姿勢情報、深度に基づいてTSDFを更新する。

　ステップＳ３３３において、メッシュ生成部１３２３は、その更新されたTSDFに基づいて第１の3Dデータを生成する。

　ステップＳ３３３の処理が終了すると、リアルタイム3Dモデリング処理が終了し、処理は図４０に戻る。

　　＜フォトグラメトリ処理の流れ＞
　図４０のステップＳ３０９において実行されるフォトグラメトリ処理の流れの例を、図４２のフローチャートを参照して説明する。

　フォトグラメトリ処理が開始されると、SfM１３４１は、ステップＳ３５１において、撮像画像間で対応点を検出する。

　ステップＳ３５２において、SfM１３４１は、エピポーラ拘束によりカメラの３次元姿勢を導出する。

　ステップＳ３５３において、SfM１３４１は、三角測量を用いて３次元点を導出する。

　ステップＳ３５４において、SfM１３４１は、バンドル調整により全体を最適化する。

　ステップＳ３５５において、MVS１３４２は、密な対応点探索により３次元点を導出し、第２の3Dデータを生成する。

　ステップＳ３５５の処理が終了すると、フォトグラメトリ処理が終了し、処理は図４０に戻る。

　以上のように各処理を実行することにより、撮像装置１３００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置１３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、撮像装置１３００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、撮像装置１３００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置１３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　＜７．第２の実施の形態＞
　　＜情報処理システム１＞
　本技術は、上述の例に限定されず、任意の構成に適用し得る。例えば、3Dモデリングを行う情報処理システムに適用してもよい。

　例えば、情報処理装置と撮像装置を備える情報処理システムにおいて、情報処理装置が、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、撮像装置の位置および姿勢並びにスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御する撮像制御情報を生成する撮像制御部と、その撮像制御情報を撮像装置へ供給する第１の通信部とを備えてもよい。また、撮像装置が、その情報処理装置から供給される撮像制御情報を取得する第２の通信部と、その撮像制御情報に基づいて3Dオブジェクトを撮像し、第２の撮像画像を生成する撮像部とを備えてもよい。

　図４３は、本技術を適用した情報処理システムの一態様の構成例を示す図である。図４３に示される情報処理システム１４００は、3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリングを行うシステムである。図４３に示されるように、情報処理システム１４００は、撮像通信装置１４０１、撮像装置１４０２、およびサーバ１４０３を有する。撮像通信装置１４０１およびサーバ１４０３は、ネットワーク１４０４を介して通信可能に接続される。ネットワーク１４０４は、例えば、インターネット、LAN（Local Area Network）、無線LAN等の、任意の通信媒体により構成される通信路である。

　撮像通信装置１４０１は、例えばスマートフォン等のような、ネットワーク１４０４を介して任意の装置と通信を行うことができる通信機能と撮像機能とを有する情報処理装置である。撮像装置１４０２は、例えばデジタルカメラのような、撮像機能を有する情報処理装置である。撮像装置１４０２は、撮像通信装置１４０１とのみ通信することができる。撮像通信装置１４０１および撮像装置１４０２は、互いに固定的に接続され、端末装置１４１０としてユーザに使用される。サーバ１４０３は、その端末装置１４１０（撮像装置１４０２）において生成される第２の撮像画像を取得し、その第２の撮像画像を用いて第２の3Dモデリング（フォトグラメトリ処理）を行い、第２の3Dデータを生成し、記憶（管理）する。

　図４４は、撮像通信装置１４０１の主な構成例を示すブロック図である。なお、図４４においては、処理部やデータの流れ等の主なものを示しており、図４４に示されるものが全てとは限らない。つまり、撮像通信装置１４０１が、図４４においてブロックとして示されていない装置や処理部を有してもよい。また、図４４において矢印等として示されていないデータの流れや処理が存在してもよい。

　図４４に示されるように、撮像通信装置１４０１は、撮像装置１３００（図３９）の構成の、第２の3Dデータ生成部１３０４の代わりに通信部１４２１を有する。つまり、それ以外の構成は、撮像装置１３００と同様である。

　通信部１４２１は、撮像装置１４０２と通信可能に接続され、撮像装置１４０２と通信を行い、情報を授受する。例えば、通信部１４２１は、撮像制御部１３０３から供給される撮像制御情報を撮像装置１４０２へ供給してもよい。また、通信部１４２１は、撮像装置１４０２により生成された第２の撮像画像を取得し、符号化部１３０５および撮像案内出力制御部１３０８へ供給してもよい。また、通信部１４２１は、撮像装置１４０２から供給されるカメラ情報を取得し、スコアリング処理部１３０２へ供給してもよい。このカメラ情報は、撮像装置１４０２（の撮像部１３３２）の内部パラメータ、外部パラメータ、および画角情報等を含んでもよい。また、通信部１４２１は、撮像装置１４０２から供給される撮像タイミング情報を取得し、撮像制御部１３０３および撮像案内出力制御部１３０８へ供給してもよい。この撮像タイミング情報は、撮像装置１４０２（の撮像部１３３２）が撮像制御情報に基づかずに行った撮像のタイミングを示す。

　なお、通信部１３０７は、ネットワーク１４０４を介してサーバ１４０３と通信可能に接続されており、サーバ１４０３と通信を行い、情報を授受する。例えば、符号化部１３０５は、通信部１４２１から供給される第２の撮像画像を符号化し、その符号化データを記憶部１３０６および通信部１３０７へ供給する。記憶部１３０６は、その第２の撮像画像の符号化データを記憶する。通信部１３０７は、その第２の撮像画像の符号化データを、ネットワーク１４０４を介してサーバ１４０３へ供給する。

　図４５は、撮像装置１４０２の主な構成例を示すブロック図である。なお、図４５においては、処理部やデータの流れ等の主なものを示しており、図３７に示されるものが全てとは限らない。つまり、撮像装置１４０２が、図４５においてブロックとして示されていない装置や処理部を有してもよい。また、図４５において矢印等として示されていないデータの流れや処理が存在してもよい。

　図４５に示されるように、撮像装置１４０２は、操作部１３３１、撮像部１３３２、画像処理部１３３３、通信部１４３１、符号化部１４３２、および記憶部１４３３を有する。操作部１３３１、撮像部１３３２、および画像処理部１３３３は、図３９の撮像装置１３００の場合と同様の処理を行う。

　通信部１４３１は、撮像通信装置１４０１と通信可能に接続され、撮像通信装置１４０１と通信を行い、情報を授受する。例えば、通信部１４３１は、撮像通信装置１４０１から供給される撮像制御情報を取得し、撮像部１３３２へ供給してもよい。また、通信部１４３１は、撮像部１３３２から供給されるカメラ情報を取得し、撮像通信装置１４０１へ供給してもよい。このカメラ情報は、撮像部１３３２の内部パラメータ、外部パラメータ、および画角情報等を含んでもよい。また、通信部１４３１は、撮像部１３３２から供給される撮像タイミング情報を取得し、撮像通信装置１４０１へ供給してもよい。この撮像タイミング情報は、撮像部１３３２が撮像制御情報に基づかずに行った撮像のタイミングを示す。また、通信部１４３１は、画像処理部１３３３から供給される第２の撮像画像を取得し、撮像通信装置１４０１へ供給してもよい。

　符号化部１４３２は、画像処理部１３３３から供給される第２の撮像画像を符号化し、その符号化データを記憶部１４３３へ供給する。記憶部１４３３は、その符号化データを記憶する。

　図４６は、サーバ１４０３の主な構成例を示すブロック図である。なお、図４６においては、処理部やデータの流れ等の主なものを示しており、図４６に示されるものが全てとは限らない。つまり、サーバ１４０３が、図４６においてブロックとして示されていない装置や処理部を有してもよい。また、図４６において矢印等として示されていないデータの流れや処理が存在してもよい。

　図４６に示されるように、サーバ１４０３は、通信部１４４１、復号部１４４２、フォトグラメトリ処理部１３３４、符号化部１４４４、および記憶部１４４５を有する。フォトグラメトリ処理部１３３４は、図３９の撮像装置１３００の場合と同様の構成を有し、同様の処理を行う。

　通信部１４４１は、ネットワーク１４０４を介して撮像通信装置１４０１と通信可能に接続され、撮像通信装置１４０１等の他の装置と通信を行い、情報を授受する。例えば、通信部１４４１は、撮像通信装置１４０１から供給される第２の撮像画像の符号化データを取得し、復号部１４４２へ供給する。また、通信部１４４１は、符号化部１４４４から供給される第２の3Dデータの符号化データを、ネットワーク１４０４を介して他の装置（例えば、撮像通信装置１４０１）へ供給してもよい。

　復号部１４４２は、通信部１４４１から供給された第２の撮像画像の符号化データを復号し、第２の撮像画像を生成（復元）する。復号部１４４２は、その第２の撮像画像をフォトグラメトリ処理部１３３４（SfM１３４１）へ供給する。フォトグラメトリ処理部１３３４は、その第２の撮像画像を用いて第２の3Dモデリング（フォトグラメトリ処理）を実行し、第２の3Dデータを生成する。フォトグラメトリ処理部１３３４（MVS１３４２）は、生成した第２の3Dデータを符号化部１４４４へ供給する。

　符号化部１４４４は、供給された第２の3Dデータを符号化し、その符号化データを記憶部１４４５へ供給する。また、符号化部１４４４は、その第２の3Dデータの符号化データを通信部１４４１へ供給してもよい。記憶部１４４５は、供給された第２の3Dデータの符号化データを記憶する。

　各装置がこのような構成を有することにより、情報処理システム１４００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム１４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム１４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　この情報処理システム１４００により実行される3Dモデリング処理の流れの例を図４７および図４８のフローチャートを参照して説明する。

　3Dモデリング処理が開始されると、図４７のステップＳ４０１において、撮像通信装置１４０１のデプスセンサ１３１１、撮像部１３１２、およびIMU１３１３は、深度、撮像画像、慣性情報を取得する。

　ステップＳ４０２において、撮像通信装置１４０１のリアルタイム3Dモデリング処理部１３１４は、リアルタイム3Dモデリング処理を実行し、第１の3Dデータを生成する。このリアルタイム3Dモデリング処理は、図４１の例と同様に実行される。

　ステップＳ４０３において、撮像通信装置１４０１のスコアリング処理部１３０２は、これまでに行われた第２の撮像に基づいて第１の3Dデータをスコアリングする。

　ステップＳ４０４において、撮像通信装置１４０１の撮像案内出力制御部１３０８は、スコアリング結果や姿勢情報等に基づいて第２の撮像のための撮像案内（案内情報）を生成する。出力部１３０９は、その撮像案内（案内情報）を出力する。

　ステップＳ４０５において、撮像通信装置１４０１の撮像制御部１３０３は、スコアリング結果や姿勢情報等に基づいてフォトグラメトリ用撮像（第２の撮像）を制御する撮像制御情報を生成する。通信部１４２１は、その撮像制御情報を撮像装置１４０２へ供給する。撮像装置１４０２の通信部１４３１は、ステップＳ４１１においてその撮像制御情報を取得する。

　ステップＳ４１２において、撮像装置１４０２の撮像部１３３２は、その制御に従って撮像し（第２の撮像を行い）、第２の撮像画像を生成する。画像処理部１３３３は、その第２の撮像画像に対して所定の画像処理を行う。

　ステップＳ４１３において、撮像装置１４０２の通信部１４３１は、その第２の撮像画像を撮像通信装置１４０１へ供給する。撮像通信装置１４０１の通信部１４２１は、ステップＳ４０６においてその第２の撮像画像を取得する。

　また、ステップＳ４１４において、撮像装置１４０２の通信部１４３１は、撮像部１３３２のカメラ情報や撮像タイミング情報を撮像通信装置１４０１へ供給する。撮像通信装置１４０１の通信部１４２１は、ステップＳ４０７においてそのカメラ情報や撮像タイミング情報を取得する。

　図４８のステップＳ４４１において、撮像装置１４０２の符号化部１４３２は、第２の撮像画像を符号化する。記憶部１４３３は、その第２の撮像画像の符号化データを記憶する。

　ステップＳ４３１において、撮像通信装置１４０１の符号化部１３０５は、第２の撮像画像を符号化する。通信部１３０７は、第２の撮像画像の符号化データをサーバ１４０３へ供給する。サーバ１４０３の通信部１４４１は、ステップＳ４５１においてその第２の撮像画像の符号化データを取得する。復号部１４４２は、その符号化データを復号し、第２の撮像画像を生成（復元）する。

　ステップＳ４５２において、サーバ１４０３のフォトグラメトリ処理部１３３４は、フォトグラメトリ処理を実行し、第２の3Dデータを生成する。このフォトグラメトリ処理は、図４２の例と同様に実行される。

　ステップＳ４５３において、サーバ１４０３の符号化部１４４４は、その第２の3Dデータを符号化する。

　ステップＳ４５４において、サーバ１４０３の記憶部１４４５は、その符号化データを記憶する。また、通信部１４４１は、その符号化データを他の装置（例えば撮像通信装置１４０１等）へ送信する。

　また、ステップＳ４３２において、撮像通信装置１４０１の撮像制御部１３０３は、フォトグラメトリ用撮像（第２の撮像）を終了するか否かを判定する。フォトグラメトリ用撮像を終了しないと判定された場合、処理は図４７のステップＳ４０３に戻る。また、図４８のステップＳ４３２においてフォトグラメトリ用撮像を終了すると判定された場合、3Dモデリング処理が終了する。

　このように各処理を実行することにより、情報処理システム１４００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム１４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム１４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜情報処理システム２＞
　なお、情報処理システム１４００において、スコアリング処理をサーバ１４０３で行ってもよい。

　その場合の撮像通信装置１４０１の主な構成例を図４９に示す。なお、図４９においては、処理部やデータの流れ等の主なものを示しており、図４９に示されるものが全てとは限らない。つまり、撮像通信装置１４０１が、図４９においてブロックとして示されていない装置や処理部を有してもよい。また、図４９において矢印等として示されていないデータの流れや処理が存在してもよい。

　図４９に示されるように、この場合の撮像通信装置１４０１は、図４４の構成からスコアリング処理部１３０２が省略されている。この場合、通信部１３０７は、撮像制御部１３０３から供給される撮像視点情報をサーバ１４０３へ供給する。

　また、この場合、リアルタイム3Dモデリング処理部１３１４（メッシュ生成部１３２３）は、生成した第１の3Dデータを符号化部１３０５へ供給する。符号化部１３０５は、その第１の3Dデータを符号化し、その符号化データを通信部１３０７へ供給する。通信部１３０７は、符号化部１３０５から供給される第１の3Dデータの符号化データをサーバ１４０３へ供給する。

　また、通信部１３０７は、サーバ１４０３（のスコアリング処理部１３０２）により導出されたスコアリング結果を取得し、撮像制御部１３０３および撮像案内出力制御部１３０８へ供給する。

　また、通信部１３０７は、図４５の場合と同様に、符号化部１３０５から供給される第２の撮像画像の符号化データをサーバ１４０３へ供給する。

　また、この場合、通信部１４２１は、撮像装置１４０２から供給される（撮像部１３３２の）カメラ情報を取得し、符号化部１３０５へ供給する。符号化部１３０５は、そのカメラ情報を符号化し、通信部１３０７へ供給する。通信部１３０７は、そのカメラ情報の符号化データをサーバ１４０３へ供給する。

　図５０は、この場合のサーバ１４０３の主な構成例を示すブロック図である。なお、図５０においては、処理部やデータの流れ等の主なものを示しており、図５０に示されるものが全てとは限らない。つまり、サーバ１４０３が、図５０においてブロックとして示されていない装置や処理部を有してもよい。また、図５０において矢印等として示されていないデータの流れや処理が存在してもよい。

　図５０に示されるように、この場合、サーバ１４０３は、図４６の構成に加え、スコアリング処理部１３０２を有する。この場合、通信部１４４１は、撮像通信装置１４０１から供給される第１の3Dデータの符号化データを取得し、復号部１４４２へ供給する。復号部１４４２は、その符号化データを復号し、第１の3Dデータを生成（復元）する。復号部１４４２は、その第１の3Dデータをスコアリング処理部１３０２へ供給する。

　また、通信部１４４１は、撮像通信装置１４０１から供給される撮像視点情報を取得し、復号部１４４２へ供給する。復号部１４４２は、その撮像制御情報をスコアリング処理部１３０２へ供給する。

　また、通信部１４４１は、撮像通信装置１４０１から供給されるカメラ情報の符号化データを取得し、復号部１４４２へ供給する。復号部１４４２は、その符号化データを復号し、カメラ情報を生成（復元）する。復号部１４４２は、そのカメラ情報をスコアリング処理部１３０２へ供給する。

　また、通信部１４４１は、図４６の場合と同様に、撮像通信装置１４０１から供給される第２の撮像画像の符号化データを取得し、復号部１４４２へ供給する。復号部１４４２は、その符号化データを復号し、第２の撮像画像を生成（復元）する。復号部１４４２は、その第２の撮像画像をフォトグラメトリ処理部１３３４へ供給する。

　この場合も、スコアリング処理部１３０２は、供給された第１の3Dデータや撮像視点情報に基づいて図４のスコアリング処理１０２を行い、スコアリング結果を導出する。また、スコアリング処理部１３０２は、カメラ情報に基づいてそのスコアリング処理１０２を行ってもよい。スコアリング処理部１３０２は、そのスコアリング結果を符号化部１４４４へ供給する。符号化部１４４４は、そのスコアリング結果を通信部１４４１へ供給する。通信部１４４１は、そのスコアリング結果を撮像通信装置１４０１へ供給する。

　その他の処理は、図４６の場合と同様である。

　各装置がこのような構成を有することにより、情報処理システム１４００は、この場合も、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム１４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム１４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　この場合の情報処理システム１４００により実行される3Dモデリング処理の流れの例を図５１および図５２のフローチャートを参照して説明する。

　3Dモデリング処理が開始されると、図５１のステップＳ５０１において、撮像通信装置１４０１のデプスセンサ１３１１、撮像部１３１２、およびIMU１３１３は、深度、撮像画像、慣性情報を取得する。

　ステップＳ５０２において、撮像通信装置１４０１のリアルタイム3Dモデリング処理部１３１４は、リアルタイム3Dモデリング処理を実行し、第１の3Dデータを生成する。このリアルタイム3Dモデリング処理は、図４１の例と同様に実行される。

　ステップＳ５０３において、撮像通信装置１４０１の通信部１３０７は、生成された第１の3Dデータをサーバ１４０３へ供給する。サーバ１４０３の通信部１４４１は、ステップＳ５２１においてその第１の3Dデータを取得する。

　ステップＳ５２２において、サーバ１４０３のスコアリング処理部１３０２は、これまでに行われた第２の撮像に基づいて第１の3Dデータをスコアリングする。

　ステップＳ５２３において、サーバ１４０３の通信部１４４１は、そのスコアリング結果を撮像通信装置１４０１へ供給する。撮像通信装置１４０１の通信部１３０７は、ステップＳ５０４においてそのスコアリング結果を取得する。

　ステップＳ５０５において、撮像通信装置１４０１の撮像案内出力制御部１３０８は、スコアリング結果や姿勢情報等に基づいて第２の撮像のための撮像案内（案内情報）を生成する。出力部１３０９は、その撮像案内（案内情報）を出力する。

　ステップＳ５０６において、撮像通信装置１４０１の撮像制御部１３０３は、スコアリング結果や姿勢情報等に基づいてフォトグラメトリ用撮像（第２の撮像）を制御する撮像制御情報を生成する。通信部１４２１は、その撮像制御情報を撮像装置１４０２へ供給する。撮像装置１４０２の通信部１４３１は、ステップＳ５１１においてその撮像制御情報を取得する。

　また、撮像通信装置１４０１の通信部１３０７は、ステップＳ５０７において、撮像視点情報をサーバ１４０３へ供給する。サーバ１４０３の通信部１４４１は、ステップＳ５２４においてその撮像視点情報を取得する。

　図５２のステップＳ５４１において、撮像装置１４０２の撮像部１３３２は、撮像制御情報に従って撮像し（第２の撮像を行い）、第２の撮像画像を生成する。画像処理部１３３３は、その第２の撮像画像に対して所定の画像処理を行う。

　ステップＳ５４２において、撮像装置１４０２の通信部１４３１は、その第２の撮像画像を撮像通信装置１４０１へ供給する。撮像通信装置１４０１の通信部１４２１は、ステップＳ５３１においてその第２の撮像画像を取得する。

　また、ステップＳ５４３において、撮像装置１４０２の通信部１４３１は、撮像部１３３２のカメラ情報や撮像タイミング情報を撮像通信装置１４０１へ供給する。撮像通信装置１４０１の通信部１４２１は、ステップＳ５３２においてそのカメラ情報や撮像タイミング情報を取得する。

　ステップＳ５４４において、撮像装置１４０２の符号化部１４３２は、第２の撮像画像を符号化する。記憶部１４３３は、その第２の撮像画像の符号化データを記憶する。

　ステップＳ５３３において、撮像通信装置１４０１の符号化部１３０５は、第２の撮像画像を符号化する。通信部１３０７は、第２の撮像画像の符号化データをサーバ１４０３へ供給する。サーバ１４０３の通信部１４４１は、ステップＳ５５１においてその第２の撮像画像の符号化データを取得する。復号部１４４２は、その符号化データを復号し、第２の撮像画像を生成（復元）する。

　ステップＳ５５２において、サーバ１４０３のフォトグラメトリ処理部１３３４は、フォトグラメトリ処理を実行し、第２の3Dデータを生成する。このフォトグラメトリ処理は、図４２の例と同様に実行される。

　ステップＳ５５３において、サーバ１４０３の符号化部１４４４は、その第２の3Dデータを符号化する。

　ステップＳ５５４において、サーバ１４０３の記憶部１４４５は、その符号化データを記憶する。また、通信部１４４１は、その符号化データを他の装置（例えば撮像通信装置１４０１等）へ送信する。

　また、ステップＳ５３４において、撮像通信装置１４０１の撮像制御部１３０３は、フォトグラメトリ用撮像（第２の撮像）を終了するか否かを判定する。フォトグラメトリ用撮像を終了しないと判定された場合、処理は図５１のステップＳ５２２に戻る。また、図５２のステップＳ５３４においてフォトグラメトリ用撮像を終了すると判定された場合、3Dモデリング処理が終了する。

　このように各処理を実行することにより、情報処理システム１４００は、この場合も、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム１４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム１４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム１４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　＜８．第３の実施の形態＞
　　＜フィードバック処理の適用＞
　＜５．フィードバック処理＞において上述した本技術は、任意の情報処理装置に適用することができる。例えば、その本技術は、第１の実施の形態および第２の実施の形態において説明したいずれかのシステムや装置に適用することができる。また、本技術は、上述した以外の装置やシステムにも適用し得る。

　　＜情報処理システム＞
　例えば、＜５．フィードバック処理＞において上述した本技術は、図５３の情報処理システム１６００に適用されてもよい。以下においては、その場合について説明する。

　図５３に示される情報処理システム１６００は、撮像通信装置１６０１、サーバ１６０２、および情報処理装置１６０３を有する。撮像通信装置１６０１、サーバ１６０２、および情報処理装置１６０３は、ネットワーク１４０４を介して通信可能に接続される。

　撮像通信装置１６０１は、例えばスマートフォン等のような、ネットワーク１４０４を介して任意の装置と通信を行うことができる通信機能と撮像機能とを有する情報処理装置である。撮像通信装置１６０１は、例えば図４のフィードバック処理１０６を実行することができる。例えば、撮像通信装置１６０１は、そのフィードバック処理１０６として、フィードバック用の3Dモデリング等で生成された第２の3Dデータを表示する等の撮像補助、座標系の対応を取る等の座標設定等の処理を行うことができる。また、撮像通信装置１６０１は、上述した第１の撮像、第１の3Dモデリング、スコアリング、撮像制御、撮像案内、および第２の撮像等の処理を行うことができる。

　サーバ１６０２は、例えば図４のフィードバック処理１０６を実行することができる。例えば、サーバ１６０２は、そのフィードバック処理１０６として、フィードバック用の3Dモデリング（第２の3Dモデリング）等の処理を実行することができる。つまり、サーバ１６０２は、例えば、撮像通信装置１６０１から第２の撮像画像を取得し、その第２の撮像画像を用いて第２の3Dモデリングを行い、その結果として第２の3Dデータ等を撮像通信装置１６０１へ供給することができる。

　また、撮像通信装置１６０１およびサーバ１６０２は、座標設定情報を授受し、互いが行う3Dモデリングの座標系を対応付けることができる。

　情報処理装置１６０３は、最終的な3Dモデリング（第２の3Dモデリング）を行う。情報処理装置１６０３は、その3Dモデリングに用いる撮像画像（第２の撮像画像）をサーバ１６０２から取得してもよいし、撮像通信装置１６０１から取得してもよい。

　　＜撮像通信装置＞
　図５４は、その撮像通信装置１６０１の主な構成例を示すブロック図である。なお、図５４においては、処理部やデータの流れ等の主なものを示しており、図５４に示されるものが全てとは限らない。つまり、撮像通信装置１６０１が、図５４においてブロックとして示されていない装置や処理部を有してもよい。また、図５４において矢印等として示されていないデータの流れや処理が存在してもよい。

　図５４に示されるように、撮像通信装置１６０１は、撮像通信装置１４０１（図４４）と基本的に同様の構成を有する。撮像通信装置１６０１は、さらに、表示制御部１６１１および座標設定部１６１２を有する。

　表示制御部１６１１は、図４のフィードバック処理１０６の内、＜５．フィードバック処理＞の＜表示制御＞において説明した各処理を実行する。つまり、表示制御部１６１１は、＜５．フィードバック処理＞において上述したような方法を適用して、サーバ１６０２から供給される第２の3Dデータを出力部１３０９の表示部に表示させる。その際、表示制御部１６１１は、SLAM１３２１から姿勢情報を取得し、第２の3Dデータの表示制御に利用してもよい。例えば、表示制御部１６１１は、第２の3Dデータを撮像部１３１２の現在の位置および姿勢に対応する視点で表示させるために、その姿勢情報を利用してもよい。また、表示制御部１６１１は、メッシュ生成部１３２３から第１の3Dデータを取得し、第２の3Dデータ等とともに出力部１３０９の表示部に表示させてもよい。

　座標設定部１６１２は、図４のフィードバック処理１０６の内、＜５．フィードバック処理＞の＜座標系の対応＞や＜座標補正＞において説明した各処理を実行する。つまり、座標設定部１６１２は、サーバ１６０２と座標設定情報を授受し、その情報に基づいてSLAM１３２１を制御してもよい。例えば、座標設定部１６１２は、SLAM１３２１の座標系を、サーバ１６０２が行う第２の3Dモデリングの座標系と対応付けてもよい。また、座標設定部１６１２は、SLAM１３２１を制御し、第２の3Dモデリング処理により得られる第２の撮像画像の視点の位置および姿勢を用いて、第１の撮像画像の視点の位置および姿勢を補正してもよい。

　　＜サーバ＞
　図５５は、サーバ１６０２の主な構成例を示すブロック図である。図５５に示されるように、サーバ１６０２は、例えば、通信部１６２１、記憶部１６２２、およびフォトグラメトリ処理部１６２３を有する。通信部１６２１は、撮像通信装置１６０１や情報処理装置１６０３等と通信を行い、情報を授受する。記憶部１６２２は、第２の撮像画像や第２の3Dデータ等、各種情報を記憶する。フォトグラメトリ処理部１６２３は、SfM１３４１およびMVS１３４２を有する。つまり、フォトグラメトリ処理部１６２３は、フォトグラメトリ処理部１３３４と同様のフォトグラメトリ処理を行う。

　また、フォトグラメトリ処理部１６２３は、座標設定部１６３１およびメッシュ生成部１６３２を有する。座標設定部１６３１は、図４のフィードバック処理１０６の内、＜５．フィードバック処理＞の＜座標系の対応＞において説明した各処理を実行する。つまり、座標設定部１６３１は、撮像通信装置１６０１と座標設定情報を授受し、その情報に基づいてSfM１３４１を制御してもよい。例えば、座標設定部１６３１は、SfM１３４１の座標系を、撮像通信装置１６０１が行う第１の3Dモデリングの座標系と対応付けてもよい。メッシュ生成部１６３２は、MVS１３４２から供給されるポイントクラウドを用いてメッシュを生成する。

　　＜情報処理装置＞
　図５６は、情報処理装置１６０３の主な構成例を示すブロック図である。図５６に示されるように、情報処理装置１６０３は、通信部１６４１、フォトグラメトリ処理部１３３４、表示制御部１６４３、および表示部１６４４を有する。

　通信部１６４１は、撮像通信装置１６０１またはサーバ１６０２から第２の撮像画像を取得する。フォトグラメトリ処理部１３３４は、その第２の撮像画像を用いてフォトグラメトリ処理（最終的な3Dモデリング）を行い、第２の3Dデータを生成する。表示制御部１６４３は、その第２の3Dデータの表示画像を生成し、表示部１６４４へ供給し、表示させる。

　情報処理システム１６００の各装置は、上述のような構成を有することにより、フィードバック用の3Dモデリングにより得られる3Dモデルをより容易にナビゲーションに利用することができる。また、その場合、ナビゲーションの精度の低減を抑制することができる。したがって、3Dモデリングのための撮像をより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　撮像通信装置１６０１により実行される3Dモデリング処理の流れの例を図５７のフローチャートを参照して説明する。

　座標設定部１６１２は、ステップＳ１６０１において座標設定情報を授受し、3Dモデリングの座標系を設定する。つまり、座標設定部１６１２は、第１の3Dモデリング処理を制御し、その第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させる。

　ステップＳ１６０２乃至ステップＳ１６０７の各処理は、図４０の処理と同様に実行される。ステップＳ１６０８において、通信部１３０７は、生成した撮像画像（第２の撮像画像）をサーバ１６０２へ送信する。

　ステップＳ１６０９において、3Dモデリング処理を終了するか否かが判定され、終了しない場合、ステップＳ１６０２に戻る。終了すると判定された場合、3Dモデリング処理が終了する。

　　＜インクリメントモデリング処理の流れ＞
　次に、図５８のフローチャートを参照して、サーバ１６０２において実行されるインクリメント3Dモデリング処理の流れの例を説明する。

　ステップＳ１６３１において、座標設定部１６３１は、座標設定情報を授受し、3Dモデリングの座標系を設定する。つまり、座標設定部１６３１は、第２の3Dモデリング処理を制御し、その第２の3Dモデリング処理の座標系を第１の3Dモデリング処理の座標系と対応させる。

　ステップＳ１６３２において、通信部１６２１は、撮像画像（第２の撮像画像）を取得する。ステップＳ１６３３において、記憶部１６２２は、その撮像画像を記憶する。

　ステップＳ１６３４において、フォトグラメトリを行うかが判定され、行うと判定された場合、ステップＳ１６３５乃至ステップＳ１６３８の各処理が実行される。行わないと判定された場合、これらの処理が省略される。

　ステップＳ１６３５において、座標設定部１６３１これまでの撮像画像の視点の位置および姿勢を補正する。ステップＳ１６３６において、フォトグラメトリ処理部１６２３は、これまでの撮像画像を用いてフォトグラメトリを行う。ステップＳ１６３７において記憶部１６２２は、生成された第２の3Dデータを記憶する。ステップＳ１６３８において通信部１６２１は、所定のタイミングにおいてその第２の3Dデータを撮像通信装置１６０１等に送信する。

　ステップＳ１６３９においてインクリメント3Dモデリング処理を終了するか否かが判定される。終了しない場合、処理はステップＳ１６３２に戻る。終了すると判定された場合、インクリメント3Dモデリング処理が終了する。

　　＜表示制御処理の流れ＞
　図５９のフローチャートを参照して、撮像通信装置１６０１により実行される表示制御処理の流れの例を説明する。

　ステップＳ１６５１において、通信部１３０７は、サーバ１６０２から供給される第２の3Dデータを取得する。表示制御部１６１１は、ステップＳ１６５２においてユーザ等の指示に従って第２の3Dデータの表示画像を生成し、ステップＳ１６５３においてその表示画像を出力部１３０９に表示させる。

　ステップＳ１６５４において、表示制御処理を終了するか否かが判定され、終了しないと判定された場合、処理はステップＳ１６５２へ戻る。終了すると判定された場合、表示制御処理が終了する。

　　＜座標補正処理の流れ＞
　図６０のフローチャートを参照して、撮像通信装置１６０１により実行される座標補正処理の流れの例を説明する。

　ステップＳ１６７１において、通信部１３０７は、サーバ１６０２から供給される第２の3Dデータや座標設定情報を取得する。

　座標設定部１６１２は、SLAM１３２１を制御し、ステップＳ１６７２において姿勢情報を補正し、ステップＳ１６７３において第１の撮像画像の視点の位置および姿勢を補正し、ステップＳ１６７４においてその視点に基づいて第１の3Dデータを補正する。

　ステップＳ１６７５において、スコアリング処理部１３０２は、その第１の3Dデータを用いてスコアリング結果を補正する。ステップＳ１６７５の処理が終了すると座標補正処理が終了する。

　以上のように各処理を実行することにより、フィードバック用の3Dモデリングにより得られる3Dモデルをより容易にナビゲーションに利用することができる。また、その場合、ナビゲーションの精度の低減を抑制することができる。したがって、3Dモデリングのための撮像をより容易に行うことができる。

　　＜撮像通信装置＞
　なお、フィードバック用の3Dモデリング（第２の3Dモデリング）は、撮像通信装置１６０１において行われてもよい。その場合、撮像通信装置１６０１は、図６１に示されるように、図５４の構成だけでなく、図５５のサーバ１６０２の構成も有するようにすればよい。つまり、この場合、撮像通信装置１６０１は、図５４に示される構成に加え、フォトグラメトリ処理部１６２３を有する。このフォトグラメトリ処理部１６２３は、図５５を参照して説明した場合と同様の処理を行う。つまり、この場合、撮像通信装置１６０１は、＜５．フィードバック処理＞において上述した各処理を実行し得る。したがって、撮像通信装置１６０１は、フィードバック用の3Dモデリングにより得られる3Dモデルをより容易にナビゲーションに利用することができる。また、その場合、撮像通信装置１６０１は、ナビゲーションの精度の低減を抑制することができる。したがって、撮像通信装置１６０１は、3Dモデリングのための撮像をより容易に行うことができる。

　＜９．付記＞
　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図６２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図６２に示されるコンピュータ１９００において、CPU（Central Processing Unit）１９０１、ROM（Read Only Memory）１９０２、RAM（Random Access Memory）１９０３は、バス１９０４を介して相互に接続されている。

　バス１９０４にはまた、入出力インタフェース１９１０も接続されている。入出力インタフェース１９１０には、入力部１９１１、出力部１９１２、記憶部１９１３、通信部１９１４、およびドライブ１９１５が接続されている。

　入力部１９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部１９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部１９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部１９１４は、例えば、ネットワークインタフェースよりなる。ドライブ１９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体１９２１を駆動する。

　以上のように構成されるコンピュータでは、CPU１９０１が、例えば、記憶部１９１３に記憶されているプログラムを、入出力インタフェース１９１０およびバス１９０４を介してRAM１９０３にロードして実行する。これにより、上述した一連の処理が行われる。RAM１９０３には、CPU１９０１が各種の処理を実行する上において必要なデータ等が適宜記憶されてもよい。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体１９２１に記録されて適用されてもよい。その場合、プログラムは、ドライブ１９１５に装着されたリムーバブル記録媒体１９２１から読み出され、入出力インタフェース１９１０を介して記憶部１９１３にインストールされてもよい。

　また、このプログラムは、例えば、ローカルエリアネットワーク、インターネット、デジタル衛星放送等といった、有線または無線の任意の伝送媒体を介して提供されてもよい。その場合、プログラムは、通信部１９１４により受信され、入出力インタフェース１９１０を介して記憶部１９１３にインストールされてもよい。

　その他、このプログラムは、予め、ROM１９０２若しくは記憶部１９１３またはその両方にインストールされてもよい。

　　＜本技術の適用対象＞
　本技術は、任意の構成に適用することができる。例えば、本技術は、様々な電子機器に適用され得る。

　また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

　また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　　＜その他＞
　なお、本明細書において、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、あるデータに関連付けられた情報は、そのデータとは別の伝送路上で伝送されるようにしてもよい。また、例えば、あるデータに関連付けられた情報は、そのデータとは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、動的な3Dデータとその動的な3Dデータに対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　第１の3Dモデリング処理を行う第１の3Dモデリング処理部と、
　前記第１の3Dモデリング処理を制御し、前記第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させる座標制御部と
　を備え、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する処理であり、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成する処理であり、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理装置。
　（２）　前記座標制御部は、前記第１の3Dモデリング処理部が前記第１の3Dモデリング処理を開始する際に前記座標系を対応させる
　（１）に記載の情報処理装置。
　（３）　前記座標制御部は、前記第２の3Dモデリング処理により得られる前記第２の撮像画像の視点の位置および姿勢を用いて、前記第１の撮像画像の視点の位置および姿勢を補正する
　（１）または（２）に記載の情報処理装置。
　（４）　前記第２の3Dモデリング処理により生成される、前記第１の３次元形状情報と対応する座標系の前記第２の３次元形状情報を表示部に表示させる表示制御部をさらに備える
　（１）乃至（３）のいずれかに記載の情報処理装置。
　（５）　前記表示制御部は、前記第２の３次元形状情報を、前記第１の撮像部の現在の位置および姿勢に対応する視点で表示させる
　（４）に記載の情報処理装置。
　（６）　前記表示制御部は、前記第２の３次元形状情報を、任意の視点で表示させる
　（４）または（５）に記載の情報処理装置。
　（７）　前記表示制御部は、前記表示部の表示領域を分割し、前記第１の撮像部の現在の位置および姿勢に対応する視点の前記第２の３次元形状情報と、任意の視点の前記第２の３次元形状情報とを、互いに異なる表示領域に表示させる
　（４）乃至（６）のいずれかに記載の情報処理装置。
　（８）　前記表示制御部は、さらに、前記第１の３次元形状情報を前記第２の３次元形状情報に重畳させて表示させる
　（４）乃至（７）のいずれかに記載の情報処理装置。
　（９）　前記表示制御部は、前記表示部の表示領域を分割し、前記第１の３次元形状情報および前記第２の３次元形状情報を、互いに異なる表示領域に表示させる
　（４）乃至（７）のいずれかに記載の情報処理装置。
　（１０）　前記表示制御部は、前記第１の３次元形状情報および前記第２の３次元形状情報を、互いに同一の視点で表示させる
　（９）に記載の情報処理装置。
　（１１）　前記表示制御部は、さらに、これまでに得られた前記第２の撮像画像の視点を示す画像を前記第２の３次元形状情報に重畳させて表示させる
　（４）乃至（１０）のいずれかに記載の情報処理装置。
　（１２）　前記表示制御部は、さらに、前記視点に対応する前記第２の撮像画像を前記第２の３次元形状情報に重畳させて表示させる
　（１１）に記載の情報処理装置。
　（１３）　前記表示制御部は、さらに、前記視点からの撮像範囲を示す画像を前記第２の３次元形状情報に重畳させて表示させる
　（１１）または（１２）に記載の情報処理装置。
　（１４）　前記表示制御部は、さらに、前記第２の３次元形状情報に基づいて導出されるスコアを前記第２の３次元形状情報に重畳させて表示させ、
　前記スコアは、これまでに生成された前記第２の撮像画像を用いて生成可能な前記第２の３次元形状情報の精度の評価値である
　（４）乃至（１３）のいずれかに記載の情報処理装置。
　（１５）　前記表示部をさらに備える
　（４）乃至（１４）のいずれかに記載の情報処理装置。
　（１６）　前記第２の3Dモデリング処理を行う第２の3Dモデリング処理部をさらに備える
　（１）乃至（１５）のいずれかに記載の情報処理装置。
　（１７）　前記第２の撮像部をさらに備える
　（１）乃至（１６）のいずれかに記載の情報処理装置。
　（１８）　第１の3Dモデリング処理を行い、
　前記第１の3Dモデリング処理を制御し、前記第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させ、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成し、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理方法。

　（１９）　第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行う第２の3Dモデリング処理部と、
　前記第２の3Dモデリング処理を制御し、前記第２の3Dモデリング処理の座標系を前記第１の3Dモデリング処理の座標系と対応させる座標制御部と
　を備え、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する処理であり、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成する処理であり、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理装置。
　（２０）　第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行い、
　前記第２の3Dモデリング処理を制御し、前記第２の3Dモデリング処理の座標系を前記第１の3Dモデリング処理の座標系と対応させ、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成し、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理方法。

　１０１　第１の3Dデータ生成処理，　１０２　スコアリング処理，　１０３　第２の3Dモデリング用撮像制御処理，　１０４　第２の3Dデータ生成処理，　１０５　第２の3Dモデリング用撮像案内出力処理，　１０６　フィードバック処理，　１３００　撮像装置，　１３０１　第１の3Dデータ生成部，　１３０２　スコアリング処理部，　１３０３　撮像制御部，　１３０４　第２の3Dデータ生成部，　１３０５　符号化部，　１３０６　記憶部，　１３０７　通信部，　１３０８　撮像案内出力制御部，　１３０９　出力部，　１３１１　デプスセンサ，　１３１２　撮像部，　１３１３　IMU，　１３１４　リアルタイム3Dモデリング処理部，　１３２１　SLAM，　１３２２　TSDF更新部，　１３２３　メッシュ生成部，　１３３１　操作部，　１３３２　撮像部，　１３３３　画像処理部，　１３３４　フォトグラメトリ処理部，　１３４１　SfM，　１３４２　MVS，　１４００　情報処理システム，　１４０１　撮像装置，　１４０２　撮像通信装置，　１４０３　サーバ，　１４０４　ネットワーク，　１４１０　端末装置，　１４２１　通信部，　１４３１　通信部，　１４３２　符号化部，　１４３３　記憶部，　１４４１　通信部，　１４４２　復号部，　１４４４　符号化部，　１４４５　記憶部，　１６００　情報処理システム，　１６０１　撮像通信装置，　１６０２　サーバ，　１６０３　情報処理装置，　１６１１　表示制御部，　１６１２　座標設定部，　１６２１　通信部，　１６２２　記憶部，　１６２３　フォトグラメトリ処理部，　１６３１　座標設定部，　１６３２　メッシュ生成部，　１６４１　通信部，　１６４３　表示制御部，　１６４４　表示部，　１９００　コンピュータ

Claims

　第１の3Dモデリング処理を行う第１の3Dモデリング処理部と、
　前記第１の3Dモデリング処理を制御し、前記第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させる座標制御部と
　を備え、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する処理であり、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成する処理であり、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理装置。
　前記座標制御部は、前記第１の3Dモデリング処理部が前記第１の3Dモデリング処理を開始する際に前記座標系を対応させる
　請求項１に記載の情報処理装置。
　前記座標制御部は、前記第２の3Dモデリング処理により得られる前記第２の撮像画像の視点の位置および姿勢を用いて、前記第１の撮像画像の視点の位置および姿勢を補正する　請求項１に記載の情報処理装置。
　前記第２の3Dモデリング処理により生成される、前記第１の３次元形状情報と対応する座標系の前記第２の３次元形状情報を表示部に表示させる表示制御部をさらに備える
　請求項１に記載の情報処理装置。
　前記表示制御部は、前記第２の３次元形状情報を、前記第１の撮像部の現在の位置および姿勢に対応する視点で表示させる
　請求項４に記載の情報処理装置。
　前記表示制御部は、前記第２の３次元形状情報を、任意の視点で表示させる
　請求項４に記載の情報処理装置。
　前記表示制御部は、前記表示部の表示領域を分割し、前記第１の撮像部の現在の位置および姿勢に対応する視点の前記第２の３次元形状情報と、任意の視点の前記第２の３次元形状情報とを、互いに異なる表示領域に表示させる
　請求項４に記載の情報処理装置。
　前記表示制御部は、さらに、前記第１の３次元形状情報を前記第２の３次元形状情報に重畳させて表示させる
　請求項４に記載の情報処理装置。
　前記表示制御部は、前記表示部の表示領域を分割し、前記第１の３次元形状情報および前記第２の３次元形状情報を、互いに異なる表示領域に表示させる
　請求項４に記載の情報処理装置。
　前記表示制御部は、前記第１の３次元形状情報および前記第２の３次元形状情報を、互いに同一の視点で表示させる
　請求項９に記載の情報処理装置。
　前記表示制御部は、さらに、これまでに得られた前記第２の撮像画像の視点を示す画像を前記第２の３次元形状情報に重畳させて表示させる
　請求項４に記載の情報処理装置。
　前記表示制御部は、さらに、前記視点に対応する前記第２の撮像画像を前記第２の３次元形状情報に重畳させて表示させる
　請求項１１に記載の情報処理装置。
　前記表示制御部は、さらに、前記視点からの撮像範囲を示す画像を前記第２の３次元形状情報に重畳させて表示させる
　請求項１１に記載の情報処理装置。
　前記表示制御部は、さらに、前記第２の３次元形状情報に基づいて導出されるスコアを前記第２の３次元形状情報に重畳させて表示させ、
　前記スコアは、これまでに生成された前記第２の撮像画像を用いて生成可能な前記第２の３次元形状情報の精度の評価値である
　請求項４に記載の情報処理装置。
　前記表示部をさらに備える
　請求項４に記載の情報処理装置。
　前記第２の3Dモデリング処理を行う第２の3Dモデリング処理部をさらに備える
　請求項１に記載の情報処理装置。
　前記第２の撮像部をさらに備える
　請求項１に記載の情報処理装置。
　第１の3Dモデリング処理を行い、
　前記第１の3Dモデリング処理を制御し、前記第１の3Dモデリング処理の座標系を第２の3Dモデリング処理の座標系と対応させ、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成し、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理方法。
　第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行う第２の3Dモデリング処理部と、
　前記第２の3Dモデリング処理を制御し、前記第２の3Dモデリング処理の座標系を前記第１の3Dモデリング処理の座標系と対応させる座標制御部と
　を備え、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する処理であり、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成する処理であり、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理装置。
　第１の3Dモデリング処理とは異なる第２の3Dモデリング処理を行い、
　前記第２の3Dモデリング処理を制御し、前記第２の3Dモデリング処理の座標系を前記第１の3Dモデリング処理の座標系と対応させ、
　前記第１の3Dモデリング処理は、第１の撮像画像に基づいて3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の撮像画像は、第１の撮像部が前記3Dオブジェクトを撮像する第１の撮像により生成され、
　前記第２の3Dモデリング処理は、第２の撮像画像に基づいて前記3Dオブジェクトの３次元形状を表現する第２の３次元形状情報を生成し、
　前記第２の撮像画像は、第２の撮像部が前記第１の３次元形状情報に基づいて前記3Dオブジェクトを撮像する第２の撮像により生成される
　情報処理方法。