WO2024080121A1

WO2024080121A1 - 情報処理装置および方法

Info

Publication number: WO2024080121A1
Application number: PCT/JP2023/034723
Authority: WO
Inventors: 慧佑宇山
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2022-10-14
Filing date: 2023-09-25
Publication date: 2024-04-18
Anticipated expiration: 2025-04-14
Also published as: EP4604061A4; US20260104255A1; EP4604061A1; JPWO2024080121A1

Abstract

本開示は、3Dモデリングをより容易に行うことができるようにする情報処理装置および方法に関する。 3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて第１の３次元形状情報を生成し、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、そのスコアリング結果に基づいて、第２の撮像を制御するか、または、第２の撮像のための案内情報を生成し、その案内情報の出力を制御する。本開示は、例えば、情報処理装置、撮像装置、撮像通信装置、電子機器、情報処理方法、プログラム、または情報処理システム等に適用することができる。

Description

情報処理装置および方法

　本開示は、情報処理装置および方法に関し、特に、3Dモデリングをより容易に行うことができるようにした情報処理装置および方法に関する。

　従来、３次元形状を有する3Dオブジェクトの3Dモデリングの手法として、その3Dオブジェクトを多方向から撮像し、得られた複数の撮像画像に基づいて3Dデータを生成するフォトグラメトリと称する手法があった（例えば、特許文献１参照）。また、撮像画像、姿勢情報、深度等の情報に基づいて即時的（リアルタイム）に3Dデータを生成するリアルタイム3Dモデリングと称する手法があった。さらに、近年、撮影画像の姿勢と撮影画像とに基づいてNeural Fieldsを構成し、任意視点での画像や3次元モデルを生成する、Neural Renderingと総称される手法（例えば、NeRF（Neural Radiance Fields）等）が提案された。

特開２０１８－６３６９３号公報

　これらの手法のように、3Dオブジェクトを撮像した撮像画像に基づいて3Dモデリングを行う場合、作業量や処理量低減のためには、できるだけ少ない撮像回数でできるだけ高精度な3Dデータを生成することが望ましい。そのためには、より適切な位置および姿勢で3Dオブジェクトを撮像することが求められる。しかしながら、撮影者がどの位置からどの姿勢で撮像することが適切であるかを把握することは困難であった。

　本開示は、このような状況に鑑みてなされたものであり、3Dモデリングをより容易に行うことができるようにするものである。

　本技術の一側面の情報処理装置は、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成し、前記案内情報の出力を制御する案内情報出力制御部とを備える情報処理装置である。

　本技術の一側面の情報処理方法は、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成し、前記案内情報の出力を制御する情報処理方法である。

　本技術の一側面の情報処理装置および方法においては、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報が生成され、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度が評価され、スコアリング結果が生成され、そのスコアリング結果に基づいて、その3Dオブジェクトを撮像する第２の撮像のための案内情報が生成され、その案内情報の出力が制御される。

フォトグラメトリの概要を説明するための図である。リアルタイム3Dモデリングの概要を説明するための図である。フォトグラメトリとリアルタイム3Dモデリングを比較する図である。 3Dモデリング用の撮像を補助する方法の例を示す図である。撮像制御および撮像案内の様子の例を示す図である。オーバーラップの例を示す図である。被写体からの距離に応じた撮像の様子の例を示す図である。並行した処理の様子の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング処理の例を示す図である。スコアリング結果の出力の例を示す図である。オーバーラップ情報の出力の例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。案内情報の表示例を示す図である。撮像装置の主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。リアルタイム3Dモデリング処理の流れの例を説明するフローチャートである。フォトグラメトリ処理の流れの例を説明するフローチャートである。情報処理システムの主な構成例を示す図である。撮像通信装置の主な構成例を示すブロック図である。撮像装置の主な構成例を示すブロック図である。サーバの主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。 3Dモデリング処理の流れの例を説明する、図３４に続くフローチャートである。撮像通信装置の主な構成例を示すブロック図である。サーバの主な構成例を示すブロック図である。 3Dモデリング処理の流れの例を説明するフローチャートである。 3Dモデリング処理の流れの例を説明する、図３８に続くフローチャートである。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．3Dモデリング
　２．撮像制御
　３．撮像案内出力
　４．組み合わせ
　５．第１の実施の形態（撮像装置）
　６．第２の実施の形態（情報処理システム）
　７．付記

　＜１．3Dモデリング＞
　　＜フォトグラメトリ＞
　従来、３次元形状を有するオブジェクト（本明細書において、3Dオブジェクトとも称する）について、その３次元形状のモデルを生成（再構成）する手法として、その3Dオブジェクトを多方向から撮像し、得られた複数の撮像画像に基づいて3Dデータを生成するフォトグラメトリと称する手法があった。なお、本明細書において、3Dオブジェクトの３次元形状のモデルを生成することを3Dモデリングとも称する。

　フォトグラメトリは、様々な視点で撮影された複数枚の画像から、三角測量の原理を使って、３次元の非常に高精度なモデルを再構成する手法である。なお、本明細書において3Dデータ（3Dモデル）についての「精度」とは、対象となる3Dオブジェクトの３次元形状の再現性（正確さや精細度等）だけでなく、その3Dモデルの表面に適用されるテクスチャの再現性（正確さや精細度等）も含み得るものとする。例えば、図１に示されるカメラ１１－１乃至カメラ１１－５のように、3Dオブジェクト１０を複数の視点から撮像し、複数の撮像画像を得る。そしてそれらの撮像画像等を用いてSfM（Structure from Motion）と称する処理とMVS（Multi view Stereo）と称する処理を行い、さらに、メッシュ化とテクスチャリングを後処理として行って、3Dデータ１５を生成する。

　SfMでは、例えば、撮像画像間で対応点を探索し、エピポーラ拘束によりカメラの位置および姿勢を導出し、そのカメラ位置および姿勢に基づく三角測量により各対応点の３次元空間における位置を特定する。本明細書において、この３次元空間上の点を３次元点とも称する。つまり、各対応点に対応する３次元点を特定する。そして、以上のように特定した３次元点群の全体をバンドル調整により最適化する。

　MVSでは、例えば、以上のように導出された３次元点群を用いて、さらに、密な対応点探索を行い、３次元点を追加する。

　以上のように、フォトグラメトリでは、バンドル調整という誤差を最小にする全体最適化計算が行われるため、非常に高精度な結果を得ることができるが、計算負荷が大きい。また、物理的な計測ではなく、幾何学的な計算に基づくため、原理的にはより高解像度の画像を用いる程、より高精度なモデルを復元することができる。

　　＜リアルタイム3Dモデリング＞
　このようなフォトグラメトリとは異なる3Dモデリングの手法として、撮像画像、姿勢情報、深度等の情報に基づいて即時的（リアルタイム）に3Dデータを生成するリアルタイム3Dモデリングと称する手法があった。この手法の場合、例えば図２に示されるように、カメラ２１を、3Dオブジェクト１０の周辺を点線２２のように移動させながら3Dオブジェクト１０を撮像する。カメラ２１は、イメージセンサだけでなくLidar（Light Detection And Ranging）スキャナ(dToF（Direct Time of Flight）モジュール)を備えており、撮像画像を得るとともに深度（被写体までの距離）を検出する。

　近年、科学技術の発展に伴いdToFモジュールの小型化および高機能化が進み、屋内外問わず、比較的長距離（例えば５ｍ程度）の深度も正確に測定することができる。これにより、コンシューマレベルでリアルタイムのモデリング・キャプチャリングの体験が手軽に可能になった。

　さらに、カメラ２１は慣性センサを備えており、カメラ２１の加速度や角速度（本明細書において、慣性情報とも称する）を検出する。

　リアルタイム3Dモデリングでは、SLAM（Simultaneous Localization and Mapping）と称する処理を行ってカメラ２１の位置および姿勢示す姿勢情報を生成する。また、その姿勢情報と深度を用いてTSDF（Truncated Signed Distance Function）を更新し、MC（Marching Cubes）と称する処理により3Dデータ２５（メッシュおよびテクスチャ）を生成する。

　SLAMでは、例えば、撮像画像と慣性情報に基づいてカメラの位置および姿勢が推定される（自己位置推定）。TSDFの更新では、深度とボクセル（voxel）との対応付けが行われ、ボリューム（Volume）が検出される。MCでは、隣接ボクセルを用いた等値面の計算が行われる。SLAMのリアルタイムの姿勢情報があれば、深度（光線がどこまで届いたか）を複数フレーム重ね合わせることで、（点群を介さずに）ボクセルのボリュームを検出することができる。ボクセル表現にすることで、影になる、撮影しなくてはいけない視点（不足視点）を推定することができる。これにより3Dオブジェクトの穴あき構造や突起構造を検出することができる。

　　＜Neural Rendering＞
　さらに、近年、撮影画像の姿勢と撮影画像とに基づいてNeural Fieldsを構成し、任意視点での画像や3次元モデルを生成する、Neural Renderingと総称される手法（例えば、NeRF（Neural Radiance Fields）等）が提案された。

　　＜比較＞
　このような3Dモデリングの各手法は、その特徴が互いに異なり、いずれかの手法が全てにおいて優れているということはない。図３は、フォトグラメトリとリアルタイム3Dモデリングの特徴を比較したものである。図３に示されるように、手法を比較すると、フォトグラメトリではSfM（自己位置推定を含む）とMVSが用いられるのに対し、リアルタイム3Dモデリングでは自己位置推定（SLAM）とTSDFが用いられる。また、使用されるデータを比較すると、フォトグラメトリの場合は画像データのみが用いられるのに対し、リアルタイム3Dモデリングの場合は画像データに加えて深度と姿勢データが用いられる。また、処理時間を比較すると、フォトグラメトリの場合は数分乃至数十時間の長時間を必要とするが、リアルタイム3Dモデリングの場合は30fps（frame/sec）のように略即時的な（リアルタイムの）処理が可能である。

　また、必要な演算能力を比較すると、フォトグラメトリの場合はハイエンドCPU（Central Processing Unit）およびGPU（Graphics Processing Unit）レベルの演算能力が必要であり、リアルタイム3Dモデリングの場合はモバイルAP（Application Processor）レベルの演算能力が必要である。また、生成されるモデルの精細さを比較すると、フォトグラメトリの場合は撮像画像の解像度、数、撮り方等によるが比較的高精細であり、リアルタイム3Dモデリングの場合は深度や自己位置推定精度等によるが比較的低精細である。

　また、生成される３次元データの内部表現は、フォトグラメトリの場合点群ベースであるのに対し、リアルタイム3Dモデリングの場合ボクセルベースである。また、被写体サイズや分解能の制約はフォトグラメトリの場合無いが、リアルタイム3Dモデリングの場合センサに依存する。また、モデルの絶対精度を比較すると、フォトグラメトリの場合はバンドル調整により最適化されるので比較的高く、リアルタイム3Dモデリングの場合はセンサや自己位置推定精度によるが比較的低い。また、スケールを比較すると、フォトグラメトリの場合、不定である（大きさは分からない）が、リアルタイム3Dモデリングの場合、一意である（絶対的な大きさが分かる）。

　フォトグラメトリとリアルタイム3Dモデリングでは、例えばこのような特徴の違いが存在する。つまり、リアルタイム3Dモデリングを適用する方が、フォトグラメトリやNeural Renderingを適用する場合よりも、3Dモデリングの作業量や処理量を低減させることができる。ただし、フォトグラメトリやNeural Renderingを適用する方が、リアルタイム3Dモデリングを適用する場合よりも高精度な3Dデータを生成することができる。

　　＜3Dモデリングの容易化＞
　例えば、より高精度な3Dデータが得られるようにするためには、上述のように、フォトグラメトリやNeural Renderingを適用すればよい。しかしながら、その場合も、3Dモデリングの作業量や処理量は少ないほど望ましい。3Dモデリングの作業量や処理量を低減させるためには、できるだけ少ない撮像回数でできるだけ高精度な3Dデータを生成することが求められる。

　例えば、3Dモデリングに必要な撮像画像が得られない場合、3Dデータの精度が低減するおそれがあった。逆に、不足しないように過剰に撮像画像を得ようとすると、撮像回数が不要に増大し、ユーザの作業量が増大するおそれがあった。また、その場合、不要な撮像画像を用いて3Dモデリング処理が行われることになるため、その処理量が不要に増大するおそれがあった。

　つまり、より少ない作業量および処理量でより高精度な3Dデータを得るためには、より適切な位置および姿勢で3Dオブジェクトを撮像する必要があった。しかしながら、従来の3Dモデリングの各手法では、撮影者がどの位置からどの姿勢で撮像することが適切であるかを把握することは困難であった。

　例えば、フォトグラメトリの場合、3Dモデリング処理に時間を要するため、撮影者が撮影時に即時的に3Dモデリング結果を確認することは困難である。そのため、撮影者が、撮影時に、どの位置からどの姿勢で撮像することが適切であるかを把握することが困難であった。その結果、例えば、適切な位置および姿勢での撮影画像が不足し、フォトグラメトリにより得られる3Dデータの精度が低減するおそれがあった。また、適切な位置および姿勢での撮像画像が不足しないように無計画にあらゆる位置および姿勢で過剰に撮像を行うようにすると、ユーザの作業量が増大するだけでなく、不要に撮像画像が増大し、3Dモデリング処理の負荷（処理量や処理時間等）が不要に増大するおそれがあった。

　＜２．撮像制御＞
　　＜スコアリング結果に基づく撮像制御＞
　そこで、3Dモデリングを２回行うようにし、１回目の3Dモデリング結果を用いて２回目の3Dモデリングのための撮像を制御するようにする。

　例えば、３次元形状を有する3Dオブジェクトを撮像する第２の撮像と、その第２の撮像により得られた第２の撮像画像を用いてその3Dオブジェクトの３次元形状を表現する第２の3Dデータ（第２の３次元形状情報）を生成する第２の3Dモデリング処理とが行われるとする（図４の第２の3Dデータ生成処理１０４）。その際、この第２の3Dモデリング処理のための第２の撮像をより適切な位置および姿勢で行うことができるように、第２の撮像を制御する（図４の第２の3Dモデリング用撮像制御処理１０３）。このような制御を実現するために、図４の第１の3Dデータ生成処理１０１とスコアリング処理１０２とを実行する。

　第１の3Dデータ生成処理１０１は、3Dオブジェクトの３次元形状を表現する第１の3Dデータ（第１の３次元形状情報）を生成する処理である。つまり、第１の3Dデータ生成処理１０１においては、3Dオブジェクトを撮像する第１の撮像と、その第１の撮像により得られた第１の撮像画像を用いて第１の3Dデータを生成する第１の3Dモデリング処理とが行われる。

　スコアリング処理１０２は、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の3Dデータの精度を評価（スコアリング）する処理である。このスコアリングは、第１の3Dモデリング処理により生成された第１の3Dデータに基づいて行われる。第２の3Dモデリング用撮像制御処理１０３においては、このスコアリング結果に基づいて、第２の撮像が制御される。

　つまり、第１の撮像により得られた第１の撮像画像に基づいて生成された第１の3Dデータに基づいて、現時点までの第２の撮像により得られた第２の撮像画像に基づいて生成可能な第２の3Dデータの精度を評価する（スコアリングを行う）。このようにすることにより、より容易にスコアリング結果を生成することができる。また、そのスコアリング結果に基づいて、第２の撮像を制御する。このようにすることにより、より適切な位置および姿勢で行われるように第２の撮像を制御することができる。つまり、より適切な位置および姿勢で撮像された第２の撮像画像を用いて第２の3Dモデリング処理を実行することができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　なお、本明細書において、特に言及しない限り、撮像画像はイメージセンサ等において得られる画像全般を指すものとする。例えば撮像装置等では、一般的に、下記のような画像が得られる。例えば、シャッタボタン等が操作されたタイミングにおいてイメージセンサ等により静止画像が得られ、撮像結果として記憶媒体等に保存される。また、シャッタボタン等が操作されたタイミングからイメージセンサ等により動画像の取得が開始され、その動画像が撮像結果として記憶媒体等に保存される。また、シャッタボタン等が操作される前においてイメージセンサ等により画像（取り込み画像と称される場合もある）が取得され、撮像結果として記憶媒体に記憶されず、モニタ等での表示等に利用される。本明細書において、撮像画像は、これらの画像を示す。つまり、撮像画像は、静止画像であってもよいし、動画像であってもよい。また、撮像画像は、撮像結果として記憶媒体等に保存されてもよいし、保存されなくてもよい。また、撮像画像は、モニタ等に表示されてもよいし、表示されなくてもよい。また、撮像画像は、シャッタボタン等が操作される前に得られてもよいし、操作されたタイミングで得られてもよいし、操作された後に得られてもよい。また、撮像画像は、イメージセンサ等において得られたデータそのもの（所謂RAWデータ）であってもよい。また、撮像画像は、色分離処理や色変換処理が行われた画像であってもよい。また、撮像画像は、欠陥補正、ノイズリダクション、AWB（Automatic White Balance）、またはガンマ補正等の信号処理が施された画像であってもよい。さらに、その他の画像処理が施されたものであってもよい。

　　＜第１の撮像＞
　本明細書において、第１の撮像を行う撮像部（イメージセンサ）を第１の撮像部とも称する。また、第２の撮像を行う撮像部（イメージセンサ）を第２の撮像部とも称する。

　上述したように、第１の3Dデータ生成処理１０１において第１の撮像が行われる。すなわち、第１の撮像部により第１の撮像画像が生成される。その際、第１の撮像部から第１の撮像画像に含まれる被写体（3Dオブジェクト）までの距離（深度）がデプスセンサにより検出されてもよい。このデプスセンサによる深度の検出方法はどのような方法であってもよい。また、デプスセンサは、第１の撮像部と一体化されていてもよいし、第１の撮像部と異なる位置に設けられた第１の撮像部と異なるセンサであってもよい。なお、以下において、特に言及しない限り、この深度は、第１の撮像画像に対して適切にキャリブレーションされているものとする。また、第１の撮像が行われる際に、第１の撮像部の慣性情報（角速度および加速度）が慣性情報センサにより検出されてもよい。この慣性情報センサによる慣性情報の検出方法はどのような方法であってもよい。また、慣性情報センサは、第１の撮像部と一体化されていてもよいし、第１の撮像部と異なる位置に設けられた第１の撮像部と異なるセンサであってもよい。

　生成された第１の撮像画像は、第１の3Dデータ生成処理に利用される。また、深度や慣性情報が生成される場合、それらも第１の3Dデータ生成処理に利用される。

　なお、第１の撮像部（イメージセンサ）、デプスセンサ、および慣性情報センサの数は、それぞれ、いくつであってもよく、単数であってもよいし、複数であってもよい。つまり、第１の撮像部、デプスセンサ、および慣性情報センサの数は、全て同一であってもよいし、これらの内２つが同一であってもよいし、互いに異なっていてもよい。

　　＜第１の3Dモデリング処理＞
　上述したように、第１の3Dデータ生成処理１０１において、第１の3Dモデリング処理が行われる。第１の3Dモデリング処理においては、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の3Dデータ（第１の３次元形状情報）が生成される。

　この第１の3Dデータが、第２の3Dデータ生成処理１０４により生成される第２の3Dデータ（第２の３次元形状情報）よりも情報量が少なく、かつ、低精度であってもよい。

　このようにすることにより、スコアリング処理１０２や第２の3Dモデリング用撮像制御処理１０３の負荷の増大を抑制することができる。つまり、第１の3Dデータがより簡易化（より低情報量化およびより低精度化）されることにより、その第１の3Dデータを用いて行われるスコアリングや撮像制御の負荷の増大を抑制することができる。また、一般的には、第１の3Dデータの生成（第１の3Dモデリング処理）の負荷の増大も抑制することができる。つまり、より少ない負荷で第２の撮像を制御することができる。

　また、この第１の3Dモデリング処理の手法はどのような手法であってもよい。例えば、第１の3Dモデリング処理において、第１の撮像画像の画角に対応する姿勢情報が導出され、その姿勢情報と、その第１の撮像画像と、その第１の撮像画像の被写体（3Dオブジェクト）の深度とに基づいて第１の3Dデータが生成されてもよい。例えば、それらの情報に基づいてTSDFの更新とMCが行われることにより第１の3Dデータが生成されてもよい。

　なお、この姿勢情報は、第１の撮像部の３次元空間における位置および姿勢を示す情報である。この姿勢情報の導出方法はどのような方法であってもよい。例えば、その第１の撮像部の慣性情報（加速度および角速度）に基づいて姿勢情報が導出されてもよい。例えば、SLAMが適用されてもよい。

　つまり、第１の3Dモデリング処理として、上述したリアルタイム3Dモデリングが適用されてもよい。このようにすることにより、第１の3Dモデリング処理を即時的（リアルタイム）に行うことができ、第１の3Dデータを即時的（リアルタイム）に得ることができる。したがって、第２の3Dモデリング用撮像制御処理を即時的（リアルタイム）に行うことができる。つまり、3Dモデリングをより容易に行うことができる。なお、第１の撮像画像、第１の撮像部の慣性情報、および深度を入力とするニューラルネットワークを利用して第１の撮像部の姿勢情報や第１の3Dデータが生成されてもよい。

　また、第１の3Dデータは、3Dオブジェクトの３次元形状を表現するものであればどのようなものであってもよく、例えば、ポイントクラウドであってもよいし、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含むものであってもよい。この第１の3Dデータは、スコアリング処理１０２へ供給される。

　　＜スコアリング処理＞
　スコアリング処理１０２においては、上述したように、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の3Dデータの精度が評価される。このスコアリングは、第１の3Dモデリング処理により生成された第１の3Dデータと、これまでに行われた前記第２の撮像の位置および姿勢とに基づいて行われる。つまり、第１の3Dデータを第２の3Dモデリング処理においてモデリングされる3Dオブジェクトに見立て、その第１の3Dデータの局所毎にスコアが算出される。例えば、第１の3Dデータが、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含む場合、そのメッシュのポリゴン毎にスコアリング結果が生成される。つまり、第１の3Dデータの、より高精度な第２の3Dデータが得られる部分が、より高く評価される（より高スコアに設定される）。

　例えば、図４の第１の3Dデータ生成処理１０１により、図５に示される第１の3Dデータ１２０が生成されるとする。そして、これまでに、その第１の3Dデータ１２０に対応する3Dオブジェクトに対してカメラ１２１－１乃至カメラ１２１－３の位置および姿勢で第２の撮像が行われたものとする。その場合、スコアリング処理１０２により、第１の3Dデータ１２０の図中上側が比較的高スコアに評価され、第１の3Dデータ１２０の図中下側（グレー部分）が比較的低スコアに評価される。スコアリングの手法の例については後述する。

　なお、図５においては、説明の便宜上、スコアリング結果として高スコアと低スコアの２種類のみが示されているが、スコアの種類数（クラスタリングの分類数）はいくつであってもよい。例えば、３段階（例えば、低スコア、中スコア、高スコア）に分類されてもよいし、１０段階(例えば０点乃至９点)に分類されてもよいし、１００段階（例えば０点乃至９９点）に分類されてもよいし、これら以外の段階数に分類されてもよい。

　スコアリング処理１０２により生成されたスコアリング結果は、第２の3Dモデリング用撮像制御処理１０３へ供給される。

　　＜第２の3Dモデリング用撮像制御処理＞
　第２の3Dモデリング用撮像制御処理１０３においては、第２の撮像部の位置および姿勢と、スコアリング処理１０２により得られるスコアリング結果とに基づいて、第２の撮像が制御される。例えば、スコアリング結果がより良くなるような位置および姿勢で第２の撮像が行われるように制御される。

　例えば、スコアリング処理１０２により図５に示されるようなスコアリング結果が得られるとする。このスコアリング結果から、第１の3Dデータ１２０に対応する3Dオブジェクトの図中下側（例えば、グレー部分）の撮像が不足していることが明らかである。

　そこで、第２の3Dモデリング用撮像制御処理１０３においては、その撮像が不足しているグレー部分の撮像画像が得られるように、3Dオブジェクトの図中下側から撮像するように第２の撮像が制御される。例えば、カメラ１２１－４の位置および姿勢が第２の撮像を行う位置および姿勢としてより適切であると判定され、そのカメラ１２１－４の位置および姿勢で撮像が行われるように第２の撮像が制御される。

　このようにすることにより、より適切な位置および姿勢で撮像された第２の撮像画像を生成することができる。換言するに、より適切な位置および姿勢で撮像された第２の撮像画像を用いて第２の3Dモデリング処理が実行されるようにすることができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　このような第２の撮像を行うべき位置および姿勢を求める方法はどのような方法であってもよい。例えば、第２の3Dモデリング用撮像制御処理１０３において、スコアリング結果に基づいて、第２の撮像が不足している部分（グレー部分）のスコアを向上させることが可能な位置および姿勢（の範囲）が特定されるようにしてもよい。また、第２の撮像部の現在の姿勢情報（位置および姿勢）を撮像視点情報としてスコアリング処理１０２へ提供し、仮に現在の位置および姿勢で得られる第２の撮像画像を加えた場合のスコアリング結果を取得し、そのスコアがその第２の撮像画像を加える前のスコアよりも所定の閾値以上高くなる場合に、現在の位置および姿勢が第２の撮像を行うべき位置および姿勢であると判定してもよい。

　なお、第１の撮像部と第２の撮像部との間で位置および姿勢の関係が既知であるならば、第２の撮像部の姿勢情報の代わりに、第１の撮像部の姿勢情報を撮像視点情報としてスコアリング処理１０２へ提供してもよい。その場合、スコアリング処理１０２において、第１の撮像部の姿勢情報を利用して第２の撮像部の姿勢情報が導出され、その第２の撮像部の姿勢情報を利用してスコアリング結果が生成されてもよい。また、第１の撮像部の姿勢情報を入力パラメータに含むニューラルネットワークを利用してスコアリング結果が生成されてもよい。

　また、第２の3Dモデリング用撮像制御処理１０３において、これまでに行われた第２の撮像の撮像範囲とのオーバーラップ率に基づいて、第２の撮像を行うべき位置および姿勢であるか否かが判定されてもよい。オーバーラップ率とは、撮像範囲が重複する領域（オーバーラップ領域）の度合い（割合）を示す。つまり、これから行う第２の撮像の撮像範囲が、これまでに得られた第２の撮像画像において映り込む領域とどの程度オーバーラップするかによって、その第２の撮像の位置および姿勢がより適切な位置および姿勢であるか否かが判定されてもよい。

　例えば、第２の3Dモデリング処理として、フォトグラメトリのように複数の第２の撮像画像間の対応点に基づいて3Dモデリングを行うような手法が適用される場合、その対応点を求めるためには、複数の第２の撮像画像の撮像範囲の少なくとも一部が重複している（オーバーラップ領域が存在する）必要がある。そこで、これまでに得られた第２の撮像画像に対して、第２の3Dモデリング処理が行い易い（より正確な3Dモデリング処理を行うことができる）オーバーラップ率となる第２の撮像画像が得られる位置および姿勢を、より適切な位置および姿勢（第２の撮像を行うべき位置および姿勢）であると判定してもよい。

　なお、第２の3Dモデリング処理が行い易い（より正確な3Dモデリング処理）を行うことができるオーバーラップ率がどのような値であるかは、3Dオブジェクトの３次元形状等にも依存する。例えば、所謂ドローンからの撮影のような場合、図６の左に示されるように被写体を平面１３０とみなすことができる。例えば、カメラ１３１－１から平面１３０を撮像した場合の撮像範囲は両矢印１３２－１で示される範囲となる。同様に、カメラ１３１－２から平面１３０を撮像した場合の撮像範囲は両矢印１３２－２で示される範囲となる。したがって、これらの撮像画像のオーバーラップ領域は、両矢印１３３で示される範囲となる。このような場合、撮像画像同士のオーバーラップの仕方が単純であるので、所定の割合以上のオーバーラップ率が得られれば、より正確な3Dモデリング処理を行うことができる。

　しかしながら第２の撮像の場合、被写体が3Dオブジェクト（第１の3Dデータ１３５）であり、その全容を撮像するため、オーバーラップの仕方が、図６の右の例の第２の撮像画像１３６－１および第２の撮像画像１３６－２のように、立体的となる。そのため、どの程度のオーバーラップ率があれば十分に正確な3Dモデリング処理を行うことができるかは、3Dオブジェクトの３次元形状等に依存する。したがって、第２の撮像を行うべき位置および姿勢を求める際に、これまでに得られた第２の撮像画像に対するオーバーラップ率を考慮する場合、3Dオブジェクトの３次元形状（第１の3Dデータ）等も考慮することが望ましい（第２の撮像を行うべき位置および姿勢をより正確に求めることができる）。

　また、第２の撮像を行うべき位置および姿勢を求める際に、その撮像位置の、被写体（3Dオブジェクト）からの距離が制御されてもよい。つまり、3Dオブジェクトのどの部分をどの角度から撮像するかだけでなく、その部分をどの距離から撮像するかも制御されてもよい。

　図７の左に示される例のように、点線１４２のように3Dオブジェクト１４１から遠く離れた位置（図中、黒３角で示される位置）から撮像すると、少ない撮像回数で3Dオブジェクト１４１の全体を撮像することができる。ただし、3Dオブジェクト１４１の３次元形状が複雑な部分（例えば、斜線部分１４１Ａ等）を撮像できないことが起こり得る。そのため、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）が低減する可能性があった。

　これに対して、図７の右に示される例のように、点線１４３のように3Dオブジェクト１４１から近い位置（図中、黒３角で示される位置）から撮像すると、3Dオブジェクト１４１の全体を撮像するために必要な撮像回数が図７の左の例に比べて増大する。ただし、3Dオブジェクト１４１の３次元形状が複雑な部分（例えば、斜線部分１４１Ａ等）を、図７の左の例に比べて撮像することができる。つまり、図７の左の例よりも確実に、3Dオブジェクト１４１の全体を撮像することができる。そのため、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）の低減を抑制することができる。

　つまり、第２の撮像の位置として、3Dオブジェクトからの適切な距離は、その3Dオブジェクトの３次元形状に依存する。そこで、第２の3Dモデリング用撮像制御処理１０３において、第２の撮像の位置の3Dオブジェクト（被写体）からの距離が、3Dオブジェクトの３次元形状（の複雑さ）に応じて制御されるようにしてもよい。このようにすることにより、上述のように、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）の低減を抑制しながら、第２の撮像の撮像回数の不要な増大を抑制することができる。つまり、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　なお、3Dオブジェクトの３次元形状の複雑度の導出方法はどのような方法であってもよい。例えば、第１の3Dデータに基づいてこの複雑度が導出されてもよい。ただし、その場合、例えば第１の3Dデータが２次元画像として処理され、そのパターン等から3Dオブジェクトの３次元形状の複雑度が導出されてもよい。このようにすることにより、3Dオブジェクトの３次元形状の複雑度の導出に関する処理負荷の増大を抑制することができる。

　また、検波枠を設け、その検波枠内について、3Dオブジェクトの３次元形状の複雑度が導出されてもよい。この検波枠はどのような形状であってもよいし、どのような大きさであってもよい。例えば、この検波枠内において、第２の撮像の撮像面に対して第１の3Dデータのポリゴンがいくつ正対しているかを求め、その検波枠内におけるその法線方向のばらつき度合いを数値化し、そのばらつき度合いに基づいてその検波枠内についての3Dオブジェクトの３次元形状の複雑度を導出してもよい。一般的に、ばらつきが大きいほど複雑な形状であり、同じ方向を向いている場合は平面的な形状に近いとみなすことができる。また、検波枠内における各ポリゴンの法線方向の平均を撮像面への正対度合いの代表値とし、その代表値に基づいて3Dオブジェクトの３次元形状の複雑度を導出してもよい。

　また、Marching Cubes法において、平面を形成しやすい頂点配置のケースが多く検波枠内に存在する場合、3Dオブジェクトの３次元形状の複雑度が低いと判定してもよい。

　つまり、3Dオブジェクトの３次元形状の複雑度は、ある領域の被写体の概形からどれくらいの方向・頻度・距離での撮像が必要になるのかを推定するための材料になる定量値であれば、どのようなパラメータ（に基づく値）であってもよい。また、3Dオブジェクトの３次元形状の複雑度に基づく第２の撮像の3Dオブジェクトからの距離の制御方法は、どのような方法であってもよい。例えば、この3Dオブジェクトの３次元形状が複雑なほど、3Dオブジェクトから近い位置から第２の撮像を行うように制御されてもよい。また、この3Dオブジェクトの３次元形状が単純なほど、3Dオブジェクトから遠い位置から第２の撮像を行うように制御されてもよい。

　第２の3Dモデリング用撮像制御処理１０３においては、上述したように第２の撮像を行うべき位置および姿勢（より適切な位置および姿勢）が求められ、その位置および姿勢において第２の撮像が行われるように制御する制御情報（撮像制御情報）が生成される。そして、その撮像制御情報が第２の3Dデータ生成処理１０４へ供給される。例えば、ユーザ等が第２の撮像部を移動させ、その第２の撮像部の位置および姿勢が、求められた「第２の撮像を行うべき位置および姿勢」に一致すると、第２の撮像を指示する撮像制御情報が生成され、第２の3Dデータ生成処理１０４へ供給される（すなわち、「第２の撮像を行うべき位置および姿勢」で第２の撮像が行われる）ようにしてもよい。

　　＜第２の撮像＞
　第２の撮像部は、第２の3Dデータ生成処理１０４において、第２の3Dモデリング用撮像制御処理１０３の制御に従って第２の撮像を行い、第２の撮像画像を生成する。例えば、第２の撮像部は、第２の3Dモデリング用撮像制御処理１０３において生成された撮像制御情報に基づいて第２の撮像を行ってもよい。例えば、第２の撮像部は、撮像制御情報により撮像が指示された場合（撮像が指示されたタイミングで）、第２の撮像を行ってもよい。また、第２の撮像部の位置および姿勢を制御する制御部が、第２の撮像部を、その撮像制御情報により指定される位置に移動させ、その撮像制御情報により指定される姿勢にし、第２の撮像部が、その位置および姿勢で第２の撮像を行ってもよい。

　第２の撮像部の数は、いくつであってもよく、単数であってもよいし、複数であってもよい。また、第１の撮像部および第２の撮像部は、共通の撮像部（同一の撮像部）であってもよいし、互いに異なる位置に設けられた互いに異なる撮像部であってもよい。

　第２の撮像部の仕様（例えば画素数等）は、第１の撮像部の仕様と同一であってもよいし、異なっていてもよい。例えば、第２の撮像画像が第１の撮像画像よりも高画質であってもよい。また、第２の撮像画像が第１の撮像画像よりも高解像度であってもよい。また、第２の撮像画像が第１の撮像画像よりも高ダイナミックレンジであってもよい。

　　＜第２の3Dモデリング処理＞
　また、第２の3Dデータ生成処理１０４において実行される第２の3Dモデリング処理の手法はどのような手法であってもよい。例えば、第２の3Dモデリング処理の手法が、第１の3Dモデリング処理と同一であってもよいし、異なっていてもよい。

　例えば、第２の3Dモデリング処理として、上述したフォトグラメトリが適用されてもよい。つまり、第２の3Dモデリング処理において、SfMおよびMVSが適用され、複数の第２の撮像画像からポイントクラウドが生成されてもよい。さらに、そのポイントクラウドに対してメッシュ化とテクスチャリングが後処理として行われることにより、第２の3Dデータが生成されてもよい。つまり、第２の3Dデータは、3Dオブジェクトの３次元形状を表現するものであればどのようなものであってもよく、例えば、ポイントクラウドであってもよいし、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含むものであってもよい。また、第２の3Dモデリング処理として、上述したNeural Renderingが適用されてもよい。

　例えば、第２の撮像画像に加え、第２の撮像を行う第２の撮像部の姿勢情報（これまでに得られた第２の撮像画像の画角に対応する姿勢情報）を利用して第２の3Dデータが生成されてもよい。この姿勢情報は、第２の撮像部の３次元空間における位置および姿勢を示す情報である。

　また、第１の撮像を行う第１の撮像部と第２の撮像部との間で位置および姿勢の関係が既知であるならば、第１の撮像部の姿勢情報（３次元空間における位置および姿勢）を利用して第２の3Dデータが生成されてもよい。つまり、第１の3Dモデリング処理において導出される姿勢情報を利用して第２の3Dデータが生成されてもよい。例えば、第１の撮像部の姿勢情報を利用して第２の撮像部の姿勢情報が導出され、その第２の撮像部の姿勢情報を利用して第２の3Dデータが生成されてもよい。また、第１の撮像部の姿勢情報や第２の撮像画像を入力とするニューラルネットワークを利用して第２の3Dデータが生成されてもよい。

　さらに、第２の3Dデータが符号化されてもよい。この符号化の方法はどのような方法であってもよい。

　　＜手動撮像＞
　また、図４に示されるように、第２の3Dデータ生成処理１０４において、撮像制御情報に基づかずに（例えば手動により）第２の撮像が行われてもよい。本明細書においてこのような撮像方法を手動撮像とも称する。その手動撮像が行われた場合、その撮像タイミングを示す撮像タイミング情報が第２の3Dデータ生成処理１０４（の第２の撮像）において生成され、第２の3Dモデリング用撮像制御処理１０３へ供給される。そして、第２の3Dモデリング用撮像制御処理１０３において、その撮像タイミング情報に基づいて、その撮像タイミングにおける第２の撮像部の姿勢情報が求められ、その撮像タイミングにおける第２の撮像部の姿勢情報が、撮像視点情報としてスコアリング処理１０２へ供給される。そして、スコアリング処理１０２において、その撮像視点情報に基づいてスコアが算出される。このように、手動撮像により得られた第２の撮像画像（の画角に対応する第２の撮像部の姿勢情報）がスコアリング処理１０２（により導出されるスコアリング結果）に反映されてもよい。

　　＜カメラ情報＞
　また、図４に示されるように、第２の3Dデータ生成処理１０４（の第２の撮像）において、第２の撮像部に関するカメラ情報が生成され、スコアリング処理１０２へ供給されてもよい。そして、スコアリング処理１０２において、このカメラ情報に基づいてスコアリングが行われ、スコアリング結果が生成されてもよい。このカメラ情報はどのような情報を含んでもよい。例えば、カメラ情報が、撮像部の内部パラメータを含んでもよい。またカメラ情報が、撮像部の外部パラメータを含んでもよい。またカメラ情報が、撮像画像を含んでもよい。またカメラ情報が、第２の撮像画像の画角情報（焦点距離情報）を含んでもよい。またカメラ情報が、歪み補正情報を含んでもよい。またカメラ情報が、シェーディング補正情報を含んでもよい。またカメラ情報が、ブリージング補正情報を含んでもよい。またカメラ情報が、フォーカス位置情報を含んでもよい。またカメラ情報が、像面位相差情報を含んでもよい。つまり、これらの情報がスコアリング（生成可能な第２の３次元形状情報の精度の評価）に用いられてもよい。

　　＜リアルタイムな処理＞
　なお、図４の第１の3Dデータ生成処理１０１（第１の撮像および第１の3Dモデリング処理）、スコアリング処理１０２、および第２の3Dモデリング用撮像制御処理１０３は、互いに並行して実行されてもよい。

　例えば、第１の3Dデータ生成処理１０１において、被写体である3Dオブジェクトの第１の撮像が行われた部分の第１の3Dデータが順次生成されてもよい。例えば、第１の3Dモデリング処理としてリアルタイム3Dモデリングを適用することにより、撮像画像と深度情報等に基づいて即時的（リアルタイム）に3Dデータを生成することができる。つまり、この場合、第１の撮像を行いながら（第１の撮像画像を得ながら）、第１の3Dモデリングを行い、第１の3Dデータを生成することができる。例えば、図２を参照して説明したように、被写体である3Dオブジェクトの周辺においてカメラを移動させながらその3Dオブジェクトの各部分の撮像が行われるが、その3Dオブジェクト全体の撮像画像が得られる前に、得られた撮像画像や深度に基づいて3Dモデリングを行うことができる。つまり、撮像が行われた部分の3Dデータを順次生成することができる。

　また、スコアリング処理１０２において、その3Dオブジェクトの一部に対応する第１の3Dデータに対するスコアリング（これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度の評価）が行われてもよい。つまり、第１の3Dモデリング処理により3Dオブジェクトの一部に対応する第１の3Dデータが生成される度に（3Dオブジェクト全体の第１の3Dデータが生成される前に）、その3Dオブジェクトの、第１の3Dデータが生成された部分についてのスコアリング（生成可能な第２の3Dデータの精度の評価）が順次行われるようにしてもよい。このようにすることにより、第１の3Dデータ生成処理１０１が終了する前に（3Dオブジェクト全体の第１の3Dデータが生成される前に）、スコアリング処理１０２を開始することができる。つまり、第１の3Dデータ生成処理１０１とスコアリング処理１０２を並行して実行することができる。

　また、第２の3Dモデリング用撮像制御処理１０３において、スコアリング処理１０２によりスコアリング結果が得られる度に（3Dオブジェクト全体のスコアリング結果が得られる前に）、その得られたスコアリング結果（3Dオブジェクトの一部に対応する第１の3Dデータに対するスコアリング結果）に基づいて、第２の撮像が制御されてもよい。このようにすることにより、スコアリング処理１０２が終了する前に（3Dオブジェクト全体のスコアリング結果が得られる前に）、第２の3Dモデリング用撮像制御処理１０３を開始することができる。つまり、スコアリング処理１０２と第２の3Dモデリング用撮像制御処理１０３を並行して実行することができる。

　以上のような各方法を組み合わせることにより、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像制御処理１０３を、互いに並行して実行することができる。

　例えば、図８において、時間軸が矢印で示されるように図中左から右に向かうとする。第１の3Dデータ生成処理１０１において第１の撮像および第１の3Dモデリング処理を並行して実行することにより、第１の3Dデータ１５１－１、第１の3Dデータ１５１－２、第１の3Dデータ１５１－３のように、第１の撮像が行われた部分の第１の3Dデータを順次生成することができる。また、第１の3Dデータ生成処理（第１の3Dモデリング処理）およびスコアリング処理１０２を並行して実行することにより、スコアリング結果１５２－１、スコアリング結果１５２－２、スコアリング結果１５２－３のように、第１の3Dデータが生成された部分についてのスコアリング結果を順次導出することができる。さらに、スコアリング処理１０２と第２の3Dモデリング用撮像制御処理１０３とを並行して実行することにより、各タイミングにおいて、それまでに得られたスコアリング結果（スコアリング結果１５２－１、スコアリング結果１５２－２、スコアリング結果１５２－３）に基づいて第２の撮像を制御することができる。

　つまり、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像制御処理１０３を、互いに並行して実行することにより、第１の撮像を行いながら、第２の撮像を制御することができる。すなわち、第１の撮像と第２の撮像を並行して（即時的に）行うことができる。

　　＜スコアリング＞
　このスコアリングの方法について説明する。フォトグラメトリがうまくいくための条件として、例えば、SfMがうまくいくこと、MVSがうまくいくこと、テクスチャリング（テクスチャのマッピング）がうまくいくこと等がある。SfMがうまくいく条件として、例えば、ベースラインが確保できること、特徴点がマッチングできること等がある。また、MVSがうまくいく条件として、ベースラインが確保できること等がある。テクスチャリングが旨く行く条件として、例えば、撮像画像において高精細なテクスチャが得られること、テクスチャを貼る面に対して、できるだけ正面から撮影されていること等がある。ベースラインとは、撮像視点位置（撮像時のカメラの位置）同士の間の距離を示す。

　　＜ポリゴンのスコアリング＞
　あるポリゴン面がSfMやMVSで復元できるかの条件としては、例えば、可視最低条件（ポリゴンが撮像位置から見えているか否か）と、精度の好条件（より精度が向上する条件）と、マッチング（対応点の検出）の好条件（マッチングがより容易になる条件）とがある。

　可視最低条件としては、例えば、視点（撮像位置）から見て視野内（撮像の画角内）に対象ポリゴンの重心が存在すること、対象ポリゴンの法線と視線（視線から対象ポリゴンの重心に向かうベクトル）の内積が少なくとも正であり、かつ、視線を遮る他のポリゴンが存在しないこと、および、対象ポリゴンが見える（可視の）視線が２つ以上存在すること等がある。

　例えば、図９の場合、ある視点から対象ポリゴン１６０の重心に向かう視線１６２が存在するので、対象ポリゴン１６０がその視野内に位置している。また、その対象ポリゴン１６０の法線１６１と視線１６２との内積が正である。また、視線１６２は、他のポリゴンに遮られることなく対象ポリゴン１６０に到達しており、「対象ポリゴン１６０が見える視線」である。したがって、視線１６２は、可視最低条件を満たしている。

　これに対して視線１６３は、ポリゴン１６４に遮られているため、「対象ポリゴン１６０が見える視線」ではない。

　また、精度の好条件としては、例えば、ベースライン（Baseline）が十分に長いこと、被写体までの距離に対するベースラインの長さの比率（ベースラインの長さ／被写体までの距離）が十分に大きいこと、並びに、可視の視点が十分に多く、それらが互いになす角の分散が大きいこと等がある。

　例えば、図１０の場合、対象ポリゴン１７０が見える視点１７１および視点１７２の間のベースライン１７３が十分に長いこと（視点１７１および視点１７２が十分に離れていること）や、被写体までの距離１７４に対するベースライン１７３の長さの比率が十分に大きいこと（「ベースラインの長さ／被写体までの距離」の値が十分に大きいこと）等が、より精度が向上する条件となる。

　また、図１１の左の例の場合、対象ポリゴン１８０が見える視点は、視点１８１および視点１８２の２点である。これに対して、図１１の右の例の場合、対象ポリゴン１８０が見える視点は、視点１８１乃至視点１８６の６点である。つまり、右側の例の方が左側の例よりも可視の視点が多く互いになす角の分散が大きい。可視点が多いと複数の別の情報からよりロバストに三角測量でき、精度の向上に期待できる。したがって、右側の例の方が左側の例よりも、より精度が向上する条件を満たしている。

　また、マッチングの好条件としては、例えば、対象ポリゴンの法線と、視点から対象ポリゴンの重心に向かう視線とのなす角が十分に小さいこと、対になる視点と被写体までの距離の比が十分に小さいこと、マッチングに可能なテクスチャが存在すること等がある。

　図１２の左側の例の場合、対象ポリゴン１９０の法線１９１と視点１９２とがなす角は、法線１９１と視点１９３とがなす角よりも小さい。したがって、視点１９２の方が視点１９３よりも対象ポリゴン１９０の面の特徴点を正しく検出しやすい。また、図１２の右側の例の場合、視点１９４から被写体（対象ポリゴン１９０）までの距離は、視点１９５から被写体（対象ポリゴン１９０）までの距離と比べて顕著に遠い。つまり、視点１９４と視点１９５とでは、被写体までの距離の比が大きい。このような場合、ベースラインが長くても両視点からの対象ポリゴンの１９０面の特徴点の見え方が大きく異なるのでマッチングの難易度が増大してしまう可能性がある。換言するに、図１２の左側の例の視点１９２と視点１９３のように被写体までの距離の比が小さい視点同士の方が、マッチングが容易である。

　　＜テクスチャのスコアリング＞
　あるポリゴン面がテクスチャリングに十分な視点が存在するかの条件としては、例えば、最低条件（見えているか否か）と、テクスチャリングの好条件（テクスチャリングがよりきれいにできる条件）がある。

　最低条件としては、例えば、上述の可視最低条件を満たしている視点が存在すること等がある。

　また、テクスチャリングの好条件としては、例えば、対象ポリゴンの法線と、視点から対象ポリゴンの重心に向かう視線とのなす角が小さいことや、視点からの被写体までの距離が一定以下で十分な解像度を得られること等がある。

　なお、上述した各条件は一例である。スコアリングにおいて、どのような条件が適用されてもよい。またその内容はどのようなものであってもよい。例えば、上述した条件が省略されてもよいし、上述した条件以外の条件が追加されてもよい。

　　＜第２の撮像画像のスコアリング＞
　第２の撮像により得られる第２の撮像画像のスコアリングが行われてもよい。例えば、カメラ情報に基づいて第２の撮像画像のスコアリングが行われてもよい。例えば、第２の撮像画像について、所望の位置にピントがあっているか否かが評価されてもよい。また、手振れしているか否かが評価されてもよい。また、露出が適切であるか否かが評価されてもよい。また、特徴点が取りやすいか否かが評価されてもよい。

　　＜スコアリングの演算例＞
　例えば、図１３に示されるように、対象撮像画像２０１と対象ポリゴン２０２との距離をｄとする。また、被写体までの理想距離をd_optとする。また、c_dを所定の係数とする。その場合のスコアs_dを以下の式（１）のように導出してもよい。

　・・・（１）

　また、対象ポリゴン２０２の中心をc_pとする。対象撮像画像２０１から中心c_pまでの視線をv_pとする。また対象ポリゴン２０２の法線をn_pとする。そして、視線v_pと法線n_pがなす角をαとする。その場合のなす角αは以下の式（２）のように導出できる。そして、そのなす角αに基づくスコアs_αを以下の式（３）のように導出してもよい。なお、c_αは所定の係数とする。

　・・・（２）

　・・・（３）

　カメラの光軸（対象撮像画像２０１の中心を始点とする対象撮像画像の法線ベクトル）をv_cとする。また、この光軸v_cと視線v_pとのなす角をβとする。その場合のなす角βは以下の式（４）のように導出できる。そして、そのなす角βに基づくスコアs_βを以下の式（５）のように導出してもよい。なお、c_βは所定の係数とする。

　・・・（４）

　・・・（５）

　以上のように導出されたスコアs_d、s_α、s_βを用いて、合計スコアs_totalを以下の式（６）のように導出してもよい。

　・・・（６）

　そして、以上のように導出された各視点の合計スコアの内、上位２視点の合計スコアの重み付き加算値を最終スコアとしてもよい。

　なお、この演算方法は一例である。スコアリング処理１０２における演算方法はどのようなものであってもよく、この例に限定されない。

　　＜処理を実行する構成の例＞
　上述した図４の各処理は、どのような装置により実行されてもよい。例えば、情報処理装置において、上述した第１の3Dデータ生成処理１０１の第１の3Dモデリング処理と、スコアリング処理１０２と、第２の3Dモデリング用撮像制御処理１０３とが実行されてもよい。

　つまり、情報処理装置が、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御する撮像制御部とを備えてもよい。本項において、この情報処理装置のことを第１の情報処理装置とも称する。

　また、第１の情報処理装置が実行する情報処理方法において、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御してもよい。

　このようにすることにより、より適切な位置および姿勢で3Dオブジェクトを撮像し（第２の撮像を行い）、得られた第２の撮像画像を用いて第２の3Dモデリング処理を実行することができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精細な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　また、その第１の3Dモデリング処理部が、第１の撮像画像と第１の撮像部の加速度および角速度に基づいて、その第１の撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、その姿勢情報と3Dオブジェクトの深度とに基づいて、その3Dオブジェクトの第１の３次元形状情報を生成する３次元形状生成部とを備えてもよい。

　また、第１の情報処理装置において、さらに、上述した第１の3Dデータ生成処理１０１の第１の撮像が行われてもよい。例えば、第１の情報処理装置が、さらに、第１の撮像部を備えてもよい。また、その第１の撮像部を備える第１の情報処理装置が、深度を検出する深度検出部を備えてもよいし、第１の撮像部の加速度および角速度を検出する慣性計測部を備えてもよいし、その両方を備えてもよい。

　また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の撮像が行われてもよい。例えば、第１の情報処理装置が、第２の撮像部をさらに備えてもよい。

　なお、この第２の撮像により生成された第２の撮像画像は符号化されてもよい。例えば、第２の撮像部を備える第１の情報処理装置が、その第２の撮像部により生成された第２の撮像画像を符号化する符号化部を備えてもよい。この符号化された第２の撮像画像は、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の3Dモデリング処理が行われてもよい。例えば、第２の撮像部を備える第１の情報処理装置が、その第２の撮像部により生成された第２の撮像画像に基づいて、第２の３次元形状情報を生成する第２の3Dモデリング処理部をさらに備えてもよい。例えば、その第２の3Dモデリング処理部が、複数の第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、その対応点の３次元位置に基づいて３次元点を追加する３次元点追加部とを備えてもよい。第２の3Dモデリング処理において、さらに、メッシュ化とテクスチャリングが後処理として行われてもよい。例えば、第２の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　なお、この第２の3Dモデリング処理により生成された第２の3Dデータは符号化されてもよい。例えば、第２の撮像部と第２の3Dモデリング処理部を備える第１の情報処理装置が、その第２の3Dモデリング処理部により生成された第２の３次元形状情報を符号化する符号化部をさらに備えてもよい。この符号化された第２の３次元形状情報（第２の3Dデータ）は、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　なお、上述した第２の3Dデータ生成処理１０４の第２の撮像は、第１の情報処理装置と異なる第２の情報処理装置において行われてもよい。例えば、第１の情報処理装置が、第２の撮像部を備える第２の情報処理装置（撮像装置）と通信する通信部を備え、撮像制御部が第２の撮像を制御する撮像制御情報を生成し、その通信部がその撮像制御情報を第２の情報処理装置へ供給してもよい。

　また、その場合、第１の情報処理装置は、第２の情報処理装置において生成された第２の撮像画像を取得してもよい。例えば、通信部を備える第１の情報処理装置が、第２の情報処理装置から供給される第２の撮像画像を取得してもよい。この第２の撮像画像は符号化されてもよい。例えば、通信部を備える第１の情報処理装置が、その通信部により取得された第２の撮像画像を符号化する符号化部を備えてもよい。この符号化された第２の撮像画像は、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　また、第２の情報処理装置から供給される第２の撮像画像が符号化されていてもよい。つまり、通信部が、第２の撮像画像の符号化データを取得してもよい。そして、その符号化データが通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。また、第１の情報処理装置が、通信部により取得された符号化データを復号し、第２の撮像画像を生成（復元）してもよい。例えば、通信部を備える第１の情報処理装置が、その通信部により取得された第２の撮像画像の符号化データを復号する復号部を備えてもよい。

　このように第２の情報処理装置において第２の撮像が行われる場合も、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の3Dモデリング処理が行われてもよい。例えば、通信部を備える第１の情報処理装置が、その通信部により取得された第２の撮像画像に基づいて、第２の３次元形状情報を生成する第２の3Dモデリング処理部をさらに備えてもよい。例えば、その第２の3Dモデリング処理部が、複数の第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、その対応点の３次元位置に基づいて３次元点を追加する３次元点追加部とを備えてもよい。第２の3Dモデリング処理において、さらに、メッシュ化とテクスチャリングが後処理として行われてもよい。例えば、第２の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　なお、この第２の3Dモデリング処理により生成された第２の3Dデータは、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。また、この第２の3Dデータが符号化されてもよい。例えば、通信部と第２の3Dモデリング処理部を備える第１の情報処理装置が、その第２の3Dモデリング処理部により生成された第２の３次元形状情報を符号化する符号化部をさらに備えてもよい。そして、生成された第２の３次元形状情報（第２の3Dデータ）の符号化データが、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　ところで、上述したように第２の撮像は手動撮像により行うことができる。その場合、その手動撮像により得られた第２の撮像画像が第２の3Dモデリング処理に利用できるものとしてもよい。スコアリング処理１０２においては、上述したように、これまでに得られた第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度が評価される。その際、その第２の撮像画像の中に、手動撮像により得られた第２の撮像画像が含まれうるようにしてもよい。つまり、手動撮像の姿勢情報がスコアリング処理１０２に反映されてもよい。例えば、第１の情報処理装置のスコアリング処理部が、撮像制御情報に基づかない第２の撮像のタイミングを示す撮像タイミング情報により示される第２の撮像のタイミングに対応する第２の情報処理装置の位置および姿勢に基づいてスコアリング結果を生成してもよい。例えば、撮像制御部がその撮像タイミング情報に基づいてその撮像タイミングにおける第２の撮像部の姿勢情報を求め、スコアリング処理部がその姿勢情報に基づいてスコアを算出してもよい。このようにすることにより、手動撮像の姿勢情報がスコアリング結果に反映される。

　なお、この場合、第２の撮像（手動撮像）は、第１の情報処理装置において行われてもよいし、第２の情報処理装置において行われてもよい。第１の情報処理装置が第２の撮像部を備える場合、例えば、その第２の撮像部が、手動撮像を行うとそのタイミングを示す撮像タイミング情報を生成し、撮像制御部へ供給してもよい。また、第１の情報処理装置が通信部を備える場合、例えば、その通信部が、第２の情報処理装置から供給される撮像タイミング情報を取得し、撮像制御部へ供給してもよい。

　このようにすることにより、撮像タイミング情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　ところで、第１の情報処理装置において、上述したように、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。例えば、第１の情報処理装置のスコアリング処理部が、そのカメラ情報に基づいてスコアリング結果を生成してもよい。この場合、第２の撮像は、第１の情報処理装置において行われてもよいし、第２の情報処理装置において行われてもよい。第１の情報処理装置が第２の撮像部を備える場合、例えば、その第２の撮像部がカメラ情報を生成し、スコアリング処理部へ供給してもよい。また、第１の情報処理装置が通信部を備える場合、例えば、その通信部が第２の情報処理装置から供給されるカメラ情報を取得し、スコアリング処理部へ供給してもよい。

　このようにすることにより、カメラ情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　ところで、第２の情報処理装置は、上述した第２の3Dデータ生成処理１０４の第２の撮像を行ってもよい。例えば、第２の情報処理装置が、第２の撮像部と、第１の情報処理装置と通信する通信部とを備え、通信部が第１の情報処理装置から供給される撮像制御情報を取得し、第２の撮像部がその撮像制御情報に基づいて3Dオブジェクトを撮像し、第２の撮像画像を生成してもよい。この撮像制御情報は、第１の3Dデータに基づいて導出されたスコアリング結果に基づいて生成される、第２の撮像を制御する情報である。

　また、第２の情報処理装置が実行する情報処理方法において、第１の情報処理装置から供給される撮像制御情報を取得し、その撮像制御情報に基づいて第２の撮像を行い、第２の3Dデータを生成するための第２の撮像画像を生成してもよい。

　生成された第２の撮像画像は、第１の情報処理装置へ供給されてもよい。例えば、通信部が、第２の撮像部により生成された第２の撮像画像を第１の情報処理装置へ供給してもよい。この第２の撮像画像は、3Dオブジェクトの３次元形状を表現する３次元形状情報を生成するための撮像画像である。また、第２の撮像画像は、符号化されてもよい。例えば、第２の情報処理装置が、第２の撮像部により生成された第２の撮像画像を符号化する符号化部を備えてもよい。そして、通信部が、その符号化部により生成された第２の撮像画像の符号化データを第１の情報処理装置へ供給してもよい。なお、第２の撮像画像（または、第２の撮像画像の符号化データ）は、第１の情報処理装置以外の情報処理装置へ供給されてもよい。例えば、通信部が、第２の撮像画像（または、第２の撮像画像の符号化データ）を他の情報処理装置へ供給してもよい。また、この第２の撮像画像（または、第２の撮像画像の符号化データ）は、記憶媒体に記憶されてもよい。例えば、第２の情報処理装置が、符号化部により生成された第２の撮像画像の符号化データを記憶する記憶部を備えてもよい。

　また、第２の情報処理装置が、上述した第２の3Dモデリング処理を行ってもよい。つまり、第２の情報処理装置において、第２の撮像により生成された第２の撮像画像を用いて第２の3Dモデリング処理が行われ、第２の3Dデータが生成されてもよい。例えば、第２の情報処理装置が、第２の撮像部により生成された第２の撮像画像に基づいて、3Dオブジェクトの３次元形状を表現する第２の３次元形状情報（第２の3Dデータ）を生成する第２の3Dモデリング処理部をさらに備えてもよい。例えば、その第２の3Dモデリング処理部が、複数の第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、その対応点の３次元位置に基づいて３次元点を追加する３次元点追加部とを備えてもよい。第２の3Dモデリング処理において、さらに、メッシュ化とテクスチャリングが後処理として行われてもよい。例えば、第２の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　なお、この第２の3Dモデリング処理により生成された第２の3Dデータは、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。また、この第２の3Dデータが符号化されてもよい。例えば、第２の3Dモデリング処理部を備える第２の情報処理装置が、その第２の3Dモデリング処理部により生成された第２の３次元形状情報を符号化する符号化部をさらに備えてもよい。そして、生成された第２の３次元形状情報（第２の3Dデータ）の符号化データが、通信により他の情報処理装置に供給されてもよいし、記憶媒体に記憶されてもよい。

　ところで、上述したように第２の撮像は手動撮像により行うことができる。その場合、その手動撮像により得られた第２の撮像画像が第２の3Dモデリング処理に利用できるものとしてもよい。スコアリング処理１０２においては、上述したように、これまでに得られた第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度が評価される。その際、その第２の撮像画像の中に、手動撮像により得られた第２の撮像画像が含まれうるようにしてもよい。つまり、手動撮像の姿勢情報がスコアリング処理１０２に反映されてもよい。

　その場合、第２の情報処理装置において手動撮像のタイミングを示す撮像タイミング情報が生成され、第１の情報処理装置へ供給されるようにしてもよい。例えば、第２の情報処理装置の第２の撮像部が、手動撮像を行うとそのタイミングを示す撮像タイミング情報を生成し、通信部がその撮像タイミング情報を第１の情報処理装置へ供給してもよい。

　このようにすることにより、撮像タイミング情報に基づいて、より適切な位置および姿勢で3Dオブジェクトを撮像することができる（第２の撮像を行うことができる）。

　ところで、上述したように、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。例えば、第２の情報処理装置の第２の撮像部がカメラ情報を生成し、通信部がそのカメラ情報を第１の情報処理装置へ供給してもよい。また、この場合、通信部は、そのカメラ情報に基づいて生成された撮像制御情報を取得し、第２の撮像部は、その撮像制御情報に基づいて第２の撮像を行ってもよい。また、第２の情報処理装置が実行する情報処理方法において、第２の撮像部に関するカメラ情報を生成し、そのカメラ情報を第１の情報処理装置へ供給してもよい。また、そのカメラ情報に基づいて生成された撮像制御情報を取得し、その撮像制御情報に基づいて第２の撮像を行ってもよい。

　このようにすることにより、カメラ情報に基づいて、より適切な位置および姿勢で3Dオブジェクトを撮像することができる（第２の撮像を行うことができる）。

　＜３．撮像案内出力＞
　　＜第２の3Dモデリング用撮像案内出力処理＞
　また、２回目の3Dモデリングのための撮像を制御する代わりに、２回目の3Dモデリングのための撮像を補助するための案内情報を出力してもよい。例えば、図４において、第１の3Dデータ生成処理１０１およびスコアリング処理１０２を実行し、さらに、第２の3Dモデリング用撮像案内出力処理１０５を実行してもよい。この場合も、第１の3Dデータ生成処理１０１およびスコアリング処理１０２は、＜２．撮像制御＞において上述した場合と同様に実行される。ただし、スコアリング処理１０２は、スコアリング結果を第２の3Dモデリング用撮像案内出力処理１０５へ供給する。

　第２の3Dモデリング用撮像案内出力処理１０５においては、スコアリング処理１０２により得られるスコアリング結果に基づいて第２の撮像のための案内情報が生成され、その案内情報の出力が制御され、出力デバイスから出力される。

　ユーザ等はこのような案内情報を参考にして手動で第２の撮像を行う。つまり、この場合、第２の撮像は手動撮像（撮像制御情報に基づかない撮像）である。このように第２の撮像が行われることにより、より適切な位置および姿勢で撮像された第２の撮像画像が生成され得る。そして、その第２の撮像画像を用いて第２の3Dデータ生成処理１０４（第２の撮像および第２の3Dモデリング処理）が実行され、目的の第２の3Dデータが生成される。換言するに、より適切な位置および姿勢で撮像された第２の撮像画像を用いて第２の3Dモデリング処理が実行されるようにすることができる。したがって、3Dモデリングの負荷（作業量や処理量）の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　　＜案内情報の生成＞
　この案内情報を生成するために、第２の3Dモデリング用撮像案内出力処理１０５においては、スコアリング結果に基づいて第２の撮像を行うべき位置および姿勢（第２の撮像を行う位置および姿勢としてより適切な位置および姿勢）が求められる。この第２の撮像を行うべき位置および姿勢を求める方法はどのような方法であってもよい。例えば、上述した第２の3Dモデリング用撮像制御処理１０３の場合と同様の方法であってもよい。例えば、スコアリング結果に基づいて、第２の撮像が不足している部分（グレー部分）のスコアを向上させることが可能な位置および姿勢（の範囲）が特定されるようにしてもよい。

　また、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像部の現在の姿勢情報（位置および姿勢）によるスコアリング結果の変動に基づいて、現在の位置および姿勢が第２の撮像を行うべき位置および姿勢であるか否かが判定されてもよい。例えば、第２の撮像部が現在の位置および姿勢で第２の撮像を行った場合に得られる第２の撮像画像（の姿勢情報）をスコアリングに反映させた結果、そのスコアがその第２の撮像画像を加える前のスコアよりも所定の閾値以上高くなる場合に、現在の位置および姿勢が第２の撮像を行うべき位置および姿勢であると判定されてもよい。つまり、この場合、スコアリング処理１０２においては、第２の撮像部が現在の位置および姿勢で行う第２の撮像が「これまでに行われた第２の撮像」に含まれる場合と含まれない場合とで、それぞれスコアリング結果が導出され、互いに比較される。したがって、この場合、スコアリング処理１０２においては、第２の撮像部の現在の姿勢情報（撮像視点情報）に基づいてスコアリングが行われる。

　この撮像視点情報は、第２の3Dモデリング用撮像案内出力処理１０５により供給されてもよい。上述したように、この場合、第２の3Dモデリング用撮像案内出力処理１０５が実行され、第２の撮像は、手動により行われる。そのため、＜２．撮像制御＞において上述した場合と同様に、その撮像タイミングを示す撮像タイミング情報が第２の3Dデータ生成処理１０４（の第２の撮像）において生成され、第２の3Dモデリング用撮像案内出力処理１０５へ供給されてもよい。そして、第２の3Dモデリング用撮像案内出力処理１０５において、その撮像タイミング情報に基づいて、その撮像タイミングにおける第２の撮像部の姿勢情報が求められ、その撮像タイミングにおける第２の撮像部の姿勢情報が、撮像視点情報としてスコアリング処理１０２へ供給されてもよい。

　また、第１の撮像部と第２の撮像部との間で位置および姿勢の関係が既知であるならば、第２の撮像部の姿勢情報の代わりに、第１の撮像部の姿勢情報が撮像視点情報としてスコアリング処理１０２へ供給されてもよい。

　また、第２の3Dモデリング用撮像案内出力処理１０５において、これまでに行われた第２の撮像の撮像範囲とのオーバーラップ率に基づいて、第２の撮像を行うべき位置および姿勢であるか否かが判定されてもよい。

　なお、図６を参照して上述したように、第２の3Dモデリング処理が行い易い（より正確な3Dモデリング処理）を行うことができるオーバーラップ率がどのような値であるかは、3Dオブジェクトの３次元形状等にも依存する。したがって、第２の撮像を行うべき位置および姿勢を求める際に、これまでに得られた第２の撮像画像に対するオーバーラップ率を考慮する場合、3Dオブジェクトの３次元形状（第１の3Dデータ）等も考慮することが望ましい（第２の撮像を行うべき位置および姿勢をより正確に求めることができる）。

　また、図７を参照して上述したように、第２の撮像を行うべき位置および姿勢を求める際に、その撮像位置の、被写体（3Dオブジェクト）からの距離が制御されてもよい。その際、その距離が、3Dオブジェクトの３次元形状（の複雑さ）に応じて制御されるようにしてもよい。このようにすることにより、第２の3Dモデリング処理の正確性（第２の3Dデータの精度）の低減を抑制しながら、第２の撮像の撮像回数の不要な増大を抑制することができる。つまり、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　そして、第２の3Dモデリング用撮像案内出力処理１０５においては、以上のように求められた第２の撮像を行うべき位置および姿勢に基づいて、案内情報が生成される。この案内情報は、どのような種類の情報であってもよく、例えば、画像情報が含まれていてもよいし、音声情報が含まれていてもよい。

　また、この案内情報の出力は、例えば第２の撮像を行うユーザ等に対して案内情報の内容を提示するように行われる。出力デバイスはどのようなものであってもよく、例えば、画像情報を表示するモニタが含まれていてもよいし、音声情報を出力するスピーカが含まれていてもよい。

　　＜案内情報＞
　次に、案内情報の内容について説明する。この案内情報の内容は、どのようなものであってもよい。例えば、第２の撮像としてより適切な位置および姿勢をユーザに示す情報がこの案内情報に含まれていてもよい。

　例えば、図４の第１の3Dデータ生成処理１０１により、図５に示される第１の3Dデータ１２０が生成されるとする。そして、これまでに、その第１の3Dデータ１２０に対応する3Dオブジェクトに対してカメラ１２１－１乃至カメラ１２１－３の位置および姿勢で第２の撮像が行われたものとする。その場合、スコアリング処理１０２により、第１の3Dデータ１２０の図中上側が比較的高スコアに評価され、第１の3Dデータ１２０の図中下側（グレー部分）が比較的低スコアに評価される。このスコアリング結果から、第１の3Dデータ１２０に対応する3Dオブジェクトの図中下側（例えば、グレー部分）の撮像が不足していることが明らかである。

　そこで、第２の3Dモデリング用撮像案内出力処理１０５においては、その撮像が不足しているグレー部分の撮像画像が得られるように第２の撮像を案内する案内情報が生成され、出力される。つまり、この案内情報においては、3Dオブジェクトの図中下側から撮像するように第２の撮像が案内される。例えば、カメラ１２１－４の位置および姿勢が第２の撮像を行う位置および姿勢としてより適切であると判定され、ユーザ等に対してその旨が通知される。

　このようにすることにより、ユーザは、その案内情報に従って第２の撮像を行うことにより、より適切な位置および姿勢で3Dオブジェクトを撮像することができる。つまり、その撮像画像を用いて3Dモデリング（第２の3Dデータ生成処理１０４）を実行することができる。したがって、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　　＜スコアリング結果の表示＞
　なお、案内情報にスコアリング結果を示す情報が含まれていてもよい。つまり、第２の3Dモデリング用撮像案内出力処理１０５において、スコアリング結果を示す情報を含む案内情報が生成され、そのスコアリング結果を示す画像が案内情報としてモニタに表示されてもよい。また、第２の撮像部の現在の画角内についてのスコアリング結果を示す情報が案内情報に含まれてもよい。つまり、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像部の現在の位置および姿勢に基づいてその第２の撮像部の画角内についてのスコアリング結果を示す情報を含む案内情報が生成され、そのスコアリング結果を示す画像が案内情報としてモニタに表示されてもよい。

　例えば、図１４に示されるように、第２の撮像部がカメラ２１１の位置にあり、スコアリングされた第１の3Dデータ２１０に対して、点線枠２１２内を撮像する姿勢であるとする。その場合、第２の3Dモデリング用撮像案内出力処理１０５において、画像２１３のように、第２の撮像部の現在の画角（撮像範囲）内についてのスコアリング結果を示す画像、すなわち、第１の3Dデータ２１０の、点線枠２１２内の部分を示す画像が、案内情報としてモニタに表示されてもよい。このようにすることにより、第２の撮像部の現在の位置および姿勢に応じた状態でスコアリング結果を表示させることができる。そのため、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。

　また、この案内情報（第２の撮像部の現在の画角内についてのスコアリング結果を示す画像）は、第２の撮像部により生成される撮像画像に重畳して表示されてもよい。例えば図１４に示される画像２１３（第２の撮像部の現在の画角内についてのスコアリング結果を示す画像）が、現在の画角の第２の撮像部により生成される撮像画像に重畳して表示されてもよい。このようにすることにより、画角が互いに同一の撮像画像および案内情報（スコアリング結果を示す画像）を重畳してモニタに表示させることができる。このような表示に基づいて、ユーザは、実空間の3Dオブジェクトとスコアリング結果とをより容易に対応させることができる。したがって、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。さらに、3Dオブジェクト全体のスコアリング結果を示す俯瞰画像が表示されてもよい。このような俯瞰画像の表示により、ユーザは、3Dオブジェクトの現在表示されている撮像画像に含まれる部分が、3Dオブジェクト全体のどの部分であるかをより容易に把握することができる。

　　＜オーバーラップ領域の表示＞
　また、複数の第２の撮像画像間でその撮像範囲がオーバーラップするオーバーラップ領域を示す情報が案内情報に含まれてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、複数の第２の撮像間でその撮像範囲がオーバーラップするオーバーラップ領域を示す情報を含む案内情報が生成され、そのオーバーラップ領域を示す画像が案内情報として表示されてもよい。例えば、図１５の左において、第２の撮像部がカメラ２２１－１の位置および姿勢である場合、その撮像範囲が撮像範囲２２２－１となるとする。また、第２の撮像部がカメラ２２１－２の位置および姿勢である場合、その撮像範囲が撮像範囲２２２－２であるとする。この場合、撮像範囲２２２－１および撮像範囲２２２－２は、その一部が互いに重畳（オーバーラップ）している。このように複数の第２の撮像画像の間でその撮像範囲がオーバーラップする領域が存在することにより、両画像間の対応点の検出が可能になる。つまり、複数の第２の撮像画像の間で適切なオーバーラップ領域が存在することにより、第２の3Dモデリング処理において、高精度な第２の3Dデータを生成することができる（第２の3Dデータの精度の低減を抑制することができる）。

　そのため、複数の第２の撮像画像の間で適切なオーバーラップ領域が存在するように、第２の撮像画像を生成する（第２の撮像を行う）ことが望ましい。上述したように、案内情報として、このようなオーバーラップ領域を示す画像がモニタに表示されることにより、第２の撮像部を操作するユーザ等は、その案内情報に基づいて、オーバーラップ領域を考慮しながら第２の撮像の位置および姿勢を決定することができる。つまり、そのユーザ等は、より容易に、複数の第２の撮像画像の間で適切なオーバーラップ領域が存在するような位置および姿勢で第２の撮像を行うことができる。すなわち、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　なお、このオーバーラップ領域を示す画像は、オーバーラップ領域をどのように示してもよい。例えば、色、濃度、模様、図柄、文字、記号、図形等によりオーバーラップ領域が示されてもよい。例えば、オーバーラップ領域が、他の領域に対して強調表示（他の領域よりも主観的に目立つ表現に）されてもよい。

　また、このオーバーラップ領域は、第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域であってもよい。つまり、これまでに得られた第２の撮像画像とこれから生成する第２の撮像画像とのオーバーラップ領域を示す画像が案内情報として表示されてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像部の現在の位置および姿勢に基づいて、その第２の撮像部の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す情報を含む案内情報が生成され、そのオーバーラップ領域を示す画像が案内情報としてモニタに表示されてもよい。例えば、図１５において、第２の撮像部がカメラ２２１－２の位置にあり、撮像範囲２２２－２を撮像する姿勢であるとする。この場合、その撮像範囲２２２－２内のオーバーラップ領域２２４を示す画像２２３が生成され、案内情報として表示されてもよい。

　このようにすることにより、第２の撮像部の現在の位置および姿勢に応じた状態でオーバーラップ領域を表示させることができる。そのため、第２の撮像部を操作するユーザ等は、この案内情報に基づいて、現在の位置および姿勢で第２の撮像を行うことにより得られる第２の撮像画像の撮像範囲に対して、これまでに得られた第２の撮像画像の撮像範囲がどのようにオーバーラップするかを、より容易に把握することができる。つまり、そのユーザ等は、より容易に、これまでに得られた第２の撮像画像の撮像範囲に対して適切にオーバーラップするように第２の撮像を行うことができる。すなわち、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　また、この案内情報（第２の撮像画像間でその撮像範囲がオーバーラップするオーバーラップ領域、または、第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す画像）は、第２の撮像部により生成される撮像画像に重畳して表示されてもよい。例えば、図１５に示される画像２２３（第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す画像）が、現在の画角の第２の撮像部により生成される撮像画像に重畳して表示されてもよい。

　このようにすることにより、画角が互いに同一の撮像画像および案内情報（第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲とのオーバーラップ領域を示す画像）を重畳してモニタに表示させることができる。このような表示に基づいて、ユーザは、実空間の3Dオブジェクトとオーバーラップ領域とをより容易に対応させることができる。したがって、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。

　なお、さらに、その画角内に占めるオーバーラップ領域の割合を示すオーバーラップ率を示す画像が表示されてもよい。このオーバーラップ率は、例えば数値で表現されてもよいし、例えば色、濃度、または模様等で表現されてもよい。このような表示により、ユーザは、どの程度オーバーラップしているかをより直感的に把握することができる。

　　＜撮像補助画像の表示＞
　また、第２の撮像を補助するための撮像補助画像が案内情報に含まれてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、第２の撮像を補助するための撮像補助画像を含む案内情報が生成され、その撮像補助画像が案内情報として表示されてもよい。この撮像補助画像の内容はどのようなものであってもよい。

　例えば、推奨する第２の撮像の位置および姿勢である推奨撮像位置姿勢を示す推奨撮像位置姿勢案内が撮像補助画像に含まれてもよい。例えば、第２の3Dモデリング用撮像案内出力処理１０５において、推奨する第２の撮像の位置および姿勢である推奨撮像位置姿勢がスコアリング結果に基づいて導出され、案内情報（撮像補助画像）として、その推奨撮像位置姿勢を示す推奨撮像位置姿勢案内が表示されてもよい。

　例えば、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢と同一である場合、その旨を示す画像が推奨撮像位置姿勢案内として表示されてもよい。つまり、例えばユーザ等が第２の撮像部を移動させることにより、その現在の位置および姿勢が推奨撮像位置姿勢に一致した場合、その旨がユーザ等に通知されてもよい。この通知の方法はどのような方法であってもよい。例えば、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢に一致した際に、白画像等、それまで全く異なる画像が表示されてもよい。また、このような画像の代わりに、文字、絵柄、記号等により第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢であることが示されてもよい。第２の撮像部を操作するユーザ等は、そのような表示（推奨撮像位置姿勢案内）に基づいて、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢であることを容易に把握することができる。これにより、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　また、第２の撮像部を基準とする推奨撮像位置姿勢の相対位置および相対姿勢を示す画像が推奨撮像位置姿勢案内として表示されてもよい。つまり、第２の撮像部の現在の位置および姿勢に対して、推奨撮像位置姿勢がどの方向であるかや、どの程度離れているか等が、例えば文字、絵柄、記号等により示されてもよい。このような表示に基づいて、第２の撮像部を操作するユーザ等は、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢でなくても、より容易に、その推奨撮像位置姿勢に近づけるように第２の撮像部を移動させることができる。これにより、そのユーザ等は、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　なお、この推奨撮像位置姿勢案内は、第２の撮像部により生成される撮像画像に重畳して表示されてもよい。このような表示により、ユーザは、実空間の3Dオブジェクトと推奨撮像位置姿勢案内とをより容易に対応させることができる。したがって、ユーザは、第２の撮像に適切な位置および姿勢をより容易に把握することができる。

　　＜被写体の複雑度に基づく撮像案内＞
　図７を参照して上述したように、第２の撮像の位置として、3Dオブジェクトからの適切な距離は、その3Dオブジェクトの３次元形状に依存する。そこで、第２の3Dモデリング用撮像案内出力処理１０５において導出される第２の撮像の推奨撮像位置姿勢に、3Dオブジェクト（被写体）からの距離が含まれるようにしてもよい。そして、第２の3Dモデリング用撮像案内出力処理１０５において第２の撮像の推奨撮像位置姿勢を導出する際に、その3Dオブジェクトからの距離が、3Dオブジェクトの３次元形状の複雑度に応じて導出されてもよい。

　この3Dオブジェクトの３次元形状の複雑度の導出方法はどのような方法であってもよく、例えば、＜２．撮像制御＞において上述した方法であってもよい。また、3Dオブジェクトの３次元形状の複雑度に基づく3Dオブジェクトからの距離（推奨撮像位置姿勢）の導出方法は、どのような方法であってもよい。例えば、この3Dオブジェクトの３次元形状が複雑なほど、3Dオブジェクトから近い位置が推奨撮像位置姿勢として設定されてもよい。また、この3Dオブジェクトの３次元形状が単純なほど、3Dオブジェクトから遠い位置が推奨撮像位置姿勢として設定されてもよい。

　また、モニタに表示される案内情報において、図１６に示されるように検波枠も表示されるようにしてもよい。図１６において、表示画像２３０は、第２の3Dモデリング用撮像案内出力処理１０５によりモニタに表示される案内情報である。この表示画像２３０には、スコアリングされた第１の3Dデータ２３１と、検波枠２３２が表示されている。このように検波枠２３２を表示することにより、ユーザが被写体の注目部分に対し、3Dオブジェクトの３次元形状の複雑度に応じて、第２の撮像部を3Dオブジェクト（被写体）に近づけたり、3Dオブジェクトから離したりする操作をしやすくすることができる。もちろん、検波枠が表示されないようにしてもよい。

　例えば、モニタに第２の撮像部により生成される撮像画像が表示され、さらに、その撮像画像に重畳して、案内情報として、検波枠と、3Dオブジェクト（被写体）に対応する第１の3Dデータが表示され、その第１の3Dデータ（3Dオブジェクト）において撮像すべき部分が示されてもよい。そして、ユーザが、その表示において第１の3Dデータの撮像すべき部分を検波枠に合わせるように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのに適切な位置および姿勢となるようにしてもよい。

　例えば、図１７乃至図１９のように、モニタに表示画像２４０が表示されており、その表示画像２４０において、検波枠２４１と、第１の3Dデータに基づいて導出された3Dオブジェクトの撮像すべき部分２４２とが表示されるようにしてもよい。そして、この表示画像２４０において撮像すべき部分２４２が検波枠２４１に近づく（理想的には一致する）ように、ユーザが第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となるようにしてもよい。

　例えば、図１７の左の場合、撮像すべき部分２４２が検波枠２４１に比べて小さく表示されている。その場合、ユーザは、この撮像すべき部分２４２がより大きく表示されるように第２の撮像部を3Dオブジェクトに近づける等して、図１７の右に示されるように、この撮像すべき部分２４２の表示を検波枠２４１に一致（または近似）させる。このように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となる。

　また、図１８の左の例の場合、撮像方向と撮像すべき部分２４２の法線方向がずれている（撮像すべき部分２４２と検波枠２４１（撮像面）とが正対していない）。その場合、ユーザは、第２の撮像部の向き（つまり撮像方向）を変更する等して、図１８の右に示されるように、この撮像すべき部分２４２を検波枠２４１に正対させる（より正対するようにする）。このように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となる。

　また、図１９の左の例の場合、撮像すべき部分２４２の高さが検波枠２４１と異なっている。その場合、ユーザは、第２の撮像部と3Dオブジェクトの距離を変更する等して、図１９の右に示されるように、この撮像すべき部分２４２の高さを検波枠２４１の高さに一致（または近似）させる。このように第２の撮像部を移動させることにより、第２の撮像部が、第２の撮像を行うのにより適切な位置および姿勢となる。

　また、図２０の例のように、案内表示として、第２の撮像部の推奨される移動方向（推奨撮像位置姿勢に近づく移動方向）を示す矢印が表示されてもよい。例えば、図２０の左の場合、モニタに案内表示を表示する表示画像２５０が表示されており、その表示画像２５０において、案内表示として、矢印２５１が表示されている。矢印２５１は、図中奥行き側（前方）に向く矢印であり、第２の撮像部を前方に移動させる（3Dオブジェクト（被写体）に近づける）ように案内している。また、図２０の右の例の場合、モニタに表示される表示画像２５０において、案内表示として、矢印２５２が表示されている。矢印２５２は、図中手前側（後方）に向く矢印であり、第２の撮像部を後方に移動させる（3Dオブジェクト（被写体）から遠ざける）ように案内している。ユーザがこれらの矢印に従って第２の撮像部を移動させることにより、第２の撮像部を推奨撮像位置姿勢により近づかせることができる。

　また、図２１の例のように、第２の撮像部の現在位置と推奨撮像位置姿勢との深さ方向の位置関係を示すインジケータが表示されてもよい。例えば、図２１の左の場合、モニタに案内表示を表示する表示画像２６０が表示されており、その表示画像２６０において、案内表示として、インジケータ２６１が表示されている。インジケータ２６１は、第２の撮像部の現在位置と推奨撮像位置姿勢との深さ方向の位置関係を示している。図２１の左の例の場合、インジケータ２６１は、第２の撮像部の現在位置に対して推奨撮像位置姿勢の位置がずれている（前方にある）ことが示されており、第２の撮像部を前方に移動させる（3Dオブジェクト（被写体）に近づける）ように案内している。また、図２１の右の例の場合、インジケータ２６１は、第２の撮像部の現在位置と推奨撮像位置姿勢の位置が略一致している（近似している）ことが示されている。つまり、この場合、インジケータ２６１は、第２の撮像部を略移動させなくてよいと案内している。ユーザがこのインジケータ２６１に従って第２の撮像部を移動させることにより、第２の撮像部を推奨撮像位置姿勢により近づかせることができる。

　なお、インジケータ２６１は、どのようなデザインであってもよく、図２１の例に限定されない。例えば、図２２に示されるようなデザインであってもよい。この例の場合、第２の撮像部の現在位置と推奨撮像位置姿勢との深さ方向の位置関係によって、図中上側に示されるように、表示が変化する。

　また、図２３の例のように、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部の距離と正対度合い（向きの関係）が案内情報として表示されてもよい。例えば、図２３の場合、モニタに案内表示を表示する表示画像２７０が表示されており、その表示画像２７０において、スコアリングされた第１の3Dデータ２７１が表示されている。また、その表示画像２７０には、案内表示として、第２の撮像部の光軸（第２の撮像部の画素領域の中心）と第１の3Dデータ（3Dオブジェクト）２７１の撮像すべき部分の中心を結ぶ線（またはそれに準ずる線）２７２が表示されている。さらに、その表示画像２７０には、案内表示として、第１の3Dデータ（3Dオブジェクト）２７１の撮像すべき部分の中心領域での被写体表面の向きを示す矢印２７３が表示されている。

　表示画像２７０においては、この線２７２および矢印２７３により、第２の撮像部の現在位置と推奨撮像位置姿勢の位置関係や、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部の距離と正対度合い（向きの関係）が示されている。

　例えば、図２４の上段の左側に示されるように、線２７２と矢印２７３の向きが互いに異なる場合、その差（角度）の分、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分の面（その法線方向）が、撮像面（第２の撮像部の向き）に対してずれている（正対していない）ことが示される。

　これに対して、図２４の上段の中央に示されるように、線２７２と矢印２７３の向きが互いに一致する場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分の面（その法線方向）が、撮像面（第２の撮像部の向き）と正対していることが示される。

　また、図２４の上段の右側に示されるように、線２７２と矢印２７３とが離れている場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が、第２の撮像にとって適切な距離よりも遠いことが示されている。つまり、この場合、第２の撮像部を第１の3Dデータ（3Dオブジェクト）に近づけるように移動させることが案内されている。

　また、図２４の下段の左側に示されるように、線２７２が矢印２７３に対して短い場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が、第２の撮像にとって適切な距離よりも近いことが示されている。つまり、この場合、第２の撮像部を第１の3Dデータ（3Dオブジェクト）から遠ざけるように移動させることが案内されている。

　また、図２４の下段の中央に示されるように、線２７２と矢印２７３の接続部に円２７４が表示される場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が、第２の撮像にとって適切な距離に近似することが示されている。つまり、この場合、第２の撮像部を深さ方向に移動させないことが案内されている。

　また、図２４の下段の右側に示されるように、線２７２と矢印２７３の接続部に円２７４が表示され、かつ、線２７２と矢印２７３の向きが互いに一致する場合、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分と第２の撮像部との距離が第２の撮像にとって適切な距離に近似し、かつ、第１の3Dデータ（3Dオブジェクト）の撮像すべき部分の面（その法線方向）が、撮像面（第２の撮像部の向き）と正対していることが示される。つまり、この場合、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢に一致または近似していることが案内されている。

　ユーザは、このような案内情報に従って第２の撮像部を移動させることにより、より容易に、第２の撮像部を推奨撮像位置姿勢により近づかせることができる。

　なお、SLAM等によって第２の撮像部（第１の撮像部）の姿勢情報が導出されているので、第２の撮像部と被写体までの距離は容易に導出することができる。したがって、上述した表示例は、リアルタイム（即時的に）に更新することができる。

　　＜リアルタイムな処理＞
　なお、図４の第１の3Dデータ生成処理１０１（第１の撮像および第１の3Dモデリング処理）、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５は、互いに並行して実行されてもよい。＜２．撮像制御＞において上述したように、第１の3Dモデリング処理により、3Dオブジェクトの第１の撮像が行われた部分の3Dデータを順次生成することができる。また、第１の3Dデータ生成処理１０１とスコアリング処理１０２を並行して実行することができる。

　また、第２の3Dモデリング用撮像案内出力処理１０５において、スコアリング処理１０２によりスコアリング結果が得られる度に（3Dオブジェクト全体のスコアリング結果が得られる前に）、その得られたスコアリング結果（3Dオブジェクトの一部に対応する第１の3Dデータに対するスコアリング結果）に基づいて、第２の撮像のための案内情報が生成され、出力されてもよい。このようにすることにより、スコアリング処理１０２が終了する前に（3Dオブジェクト全体のスコアリング結果が得られる前に）、第２の3Dモデリング用撮像案内出力処理１０５を開始することができる。つまり、スコアリング処理１０２と第２の3Dモデリング用撮像案内出力処理１０５を並行して実行することができる。

　以上のような各方法を組み合わせることにより、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５を、互いに並行して実行することができる。

　例えば、図２５に示されるように、モニタに表示画像２８０が表示され、その表示画像２８０において、第２の撮像部の撮像画像が表示されるとする。その撮像画像においては被写体として3Dオブジェクト２８１が写されている。上述したように、第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５が、互いに並行して実行されることにより、3Dオブジェクト２８１全体について第１の3Dデータとそのスコアリングが終了する前に、表示画像２８０において案内情報が表示され得る。図２５の表示画像２８０において、斜線模様の表示２８２は、3Dオブジェクト２８１の第１の3Dデータが生成済みの部分を示している。また、グレー地の表示２８３は、スコアリングの結果、第２の撮像画像が不足している部分を示している。第１の3Dデータ生成処理１０１、スコアリング処理１０２、および第２の3Dモデリング用撮像案内出力処理１０５を、互いに並行して実行することにより、このように、第１の撮像を行いながら、撮像案内を表示することができる。したがって、ユーザは、第１の撮像と並行して（即時的に）第２の撮像を行うことができる。

　　＜カメラ情報＞
　なお、この第２の3Dモデリング用撮像案内出力処理１０５が実行される場合も、＜２．撮像制御＞において上述した場合と同様に、第２の3Dデータ生成処理１０４（の第２の撮像）において、第２の撮像部に関するカメラ情報が生成され、スコアリング処理１０２へ供給されてもよい。そして、スコアリング処理１０２において、このカメラ情報に基づいてスコアリングが行われ、スコアリング結果が生成されてもよい。＜２．撮像制御＞において上述した場合と同様に、このカメラ情報はどのような情報を含んでもよい。

　　＜処理を実行する構成の例＞
　上述した図４の各処理は、どのような装置により実行されてもよい。例えば、情報処理装置において、上述した第１の3Dデータ生成処理１０１の第１の3Dモデリング処理と、スコアリング処理１０２と、第２の3Dモデリング用撮像案内出力処理１０５とが実行されてもよい。

　つまり、情報処理装置が、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像のための案内情報を生成し、案内情報の出力を制御する案内情報出力制御部とを備えてもよい。本項において、この情報処理装置のことを第１の情報処理装置とも称する。

　また、第１の情報処理装置が実行する情報処理方法において、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、そのスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像のための案内情報を生成し、その案内情報の出力を制御してもよい。

　このようにすることにより、ユーザは、その案内情報に従って第２の撮像を行うことにより、より適切な位置および姿勢で3Dオブジェクトを撮像することができる。つまり、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、3Dモデリングの負荷の増大を抑制しながら、より高精細な3Dデータを生成することができる。つまり、3Dモデリングをより容易に行うことができる。

　なお、この案内情報出力制御部が、案内情報として、スコアリング結果を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部の位置および姿勢に基づいて、第２の撮像部の画角内についてのスコアリング結果を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部により生成される撮像画像をその第２の撮像部の画角内についてのスコアリング結果を示す画像に重畳して表示させてもよい。また、この案内情報出力制御部が、さらに、3Dオブジェクト全体のスコアリング結果を示す俯瞰画像を表示させてもよい。

　また、この案内情報出力制御部が、案内情報として、複数の第２の撮像画像の間で撮像範囲がオーバーラップするオーバーラップ領域を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部の位置および姿勢に基づいて、第２の撮像部の現在の画角とこれまでに得られた第２の撮像画像の撮像範囲との間のオーバーラップ領域を示す画像を生成し、その画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像部により生成される撮像画像をその画像に重畳して表示させてもよい。また、この案内情報出力制御部が、さらに、第２の撮像部の現在の画角内に占めるオーバーラップ領域の割合を示すオーバーラップ率を示す画像を表示させてもよい。

　また、この案内情報出力制御部が、案内情報として、第２の撮像を補助するための撮像補助画像を生成し、その撮像補助画像を表示させてもよい。また、この案内情報出力制御部が、スコアリング結果に基づいて、推奨する第２の撮像の位置および姿勢である推奨撮像位置姿勢を導出し、案内情報として、その推奨撮像位置姿勢を示す推奨撮像位置姿勢案内を表示させてもよい。また、この案内情報出力制御部が、その推奨撮像位置姿勢案内として、第２の撮像部の位置および姿勢が推奨撮像位置姿勢と同一である場合、第２の撮像部の現在の位置および姿勢が推奨撮像位置姿勢であることを示す画像を表示させてもよい。また、この案内情報出力制御部が、その推奨撮像位置姿勢案内として、第２の撮像部を基準とする推奨撮像位置姿勢の相対位置および相対姿勢を示す画像を表示させてもよい。また、この案内情報出力制御部が、第２の撮像を行う撮像部により生成される撮像画像を推奨撮像位置姿勢案内に重畳して表示させてもよい。

　ところで、上述の第１の情報処理装置において、第１の３次元形状情報は、第２の３次元形状情報よりも情報量が少なく、かつ、低精細であってもよい。また、その第１の情報処理装置の第１の3Dモデリング処理部が、第１の撮像画像と第１の撮像部の加速度および角速度に基づいて、第１の撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、その姿勢情報と3Dオブジェクトの深度とに基づいて、第１の３次元形状情報を生成する３次元形状生成部とを備えてもよい。なお、この場合の第１の３次元形状情報は、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含んでもよい。

　また、上述の第１の情報処理装置において、スコアリング処理部が、第１の３次元形状情報、並びに、これまでに行われた第２の撮像の位置および姿勢に基づいて、第１の３次元形状情報の局所毎にスコアリング結果を生成してもよい。また、第１の３次元形状情報が、頂点と接続により3Dオブジェクトの３次元形状を示すメッシュと、そのメッシュの表面に適用されるテクスチャとを含み、スコアリング処理部が、メッシュのポリゴン毎にスコアリング結果を生成してもよい。

　また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の撮像が行われてもよい。その場合の第１の情報処理装置の構成は、＜２．撮像制御＞において上述した場合と同様である。また、第１の情報処理装置において、さらに、上述した第２の3Dデータ生成処理１０４の第２の3Dモデリング処理が行われてもよい。その場合の第１の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　なお、上述したように第２の撮像は手動撮像で行われる。そのため、第１の情報処理装置のスコアリング処理部が、第２の撮像のタイミングを示す撮像タイミング情報により示される第２の撮像のタイミングに対応する第２の情報処理装置の位置および姿勢に基づいてスコアリング結果を生成してもよい。例えば、案内情報出力制御部がその撮像タイミング情報に基づいてその撮像タイミングにおける第２の撮像部の姿勢情報を求め、スコアリング処理部がその姿勢情報に基づいてスコアを算出してもよい。このようにすることにより、手動撮像の姿勢情報がスコアリング結果に反映される。この場合の第１の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。ただし、第２の撮像部において生成された撮像タイミング情報、または、通信部により取得された撮像タイミング情報は、案内情報出力制御部へ供給される。このようにすることにより、撮像タイミング情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　また、第１の情報処理装置において、上述したように、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。例えば、第１の情報処理装置のスコアリング処理部が、そのカメラ情報に基づいてスコアリング結果を生成してもよい。この場合の第１の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。このようにすることにより、カメラ情報に基づいて、より適切な位置および姿勢で第２の撮像が行われるように制御することができる。

　ところで、第１の情報処理装置が第２の3Dモデリング用撮像案内出力処理１０５を実行する場合も、第２の情報処理装置が、上述した第２の3Dデータ生成処理１０４の第２の撮像を行ってもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。そして、第２の情報処理装置が、上述した第２の3Dモデリング処理をさらに行ってもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　また、第２の情報処理装置において手動撮像のタイミングを示す撮像タイミング情報が生成され、第１の情報処理装置へ供給されるようにしてもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　また、第２の撮像部に関するカメラ情報がスコアリング処理１０２に反映されてもよい。その場合の第２の情報処理装置の構成も、＜２．撮像制御＞において上述した場合と同様である。

　＜４．組み合わせ＞
　　＜撮像制御と案内情報出力の組み合わせ＞
　なお、図４において、第２の3Dモデリング用撮像制御処理１０３と第２の3Dモデリング用撮像案内出力処理１０５の両方が実行されてもよい。撮像制御と案内情報の出力の両方を行うことにより、ユーザは、より容易に、適切な位置および姿勢で第２の撮像を行うことができる。

　例えば、＜２．撮像制御＞において上述した第１の情報処理装置が、スコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像のための案内情報を生成する案内情報出力制御部をさらに備えてもよい。この場合、案内情報出力制御部は、＜３．撮像案内出力＞において上述した場合と同様の処理を行う。

　また、＜３．撮像案内出力＞において上述した第１の情報処理装置が、スコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御する撮像制御部をさらに備えてもよい。この場合、撮像制御部は、＜２．撮像制御＞において上述した場合と同様の処理を行う。

　＜５．第１の実施の形態＞
　　＜撮像装置＞
　図２６は、本技術を適用した情報処理装置の一態様である撮像装置の構成の一例を示すブロック図である。図２６に示される撮像装置３００は、3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリングを行う装置である。なお、図２６においては、処理部やデータの流れ等の主なものを示しており、図２６に示されるものが全てとは限らない。つまり、撮像装置３００が、図２６においてブロックとして示されていない装置や処理部を有してもよい。また、図２６において矢印等として示されていないデータの流れや処理が存在してもよい。

　図２６に示されるように、撮像装置３００は、第１の3Dデータ生成部３０１、スコアリング処理部３０２、撮像制御部３０３、第２の3Dデータ生成部３０４、符号化部３０５、記憶部３０６、通信部３０７、撮像案内出力制御部３０８、および出力部３０９を有する。また、第１の3Dデータ生成部３０１は、デプスセンサ３１１、撮像部３１２、IMU（Inertial Measurement Unit）３１３、およびリアルタイム3Dモデリング処理部３１４を有する。また、リアルタイム3Dモデリング処理部３１４は、SLAM（Simultaneous Localization and Mapping）３２１、TSDF（Truncated Signed Distance Function）更新部３２２、およびメッシュ生成部３２３を有する。また、第２の3Dデータ生成部３０４は、操作部３３１、撮像部３３２、画像処理部３３３、およびフォトグラメトリ処理部３３４を有する。また、フォトグラメトリ処理部３３４は、SfM（Structure From Motion）３４１およびMVS（Multi View Stereo）３４２を有する。

　第１の3Dデータ生成部３０１は、第１の3Dデータの生成に関する処理を行う。例えば、第１の3Dデータ生成部３０１は、図４の第１の3Dデータ生成処理１０１を実行する。デプスセンサ３１１は、Lidarセンサ（dToFモジュール）等を有し、被写体までの深度を検出し、TSDF更新部３２２へ供給する。撮像部３１２は、イメージセンサを有し、被写体を撮像して撮像画像を生成する。撮像部３１２は、図４の第１の3Dデータ生成処理１０１の第１の撮像（つまり、第１の3Dモデリング（リアルタイム3Dモデリング）のための撮像）を行う。撮像部３１２は、生成した撮像画像をSLAM３２１へ供給する。IMU３１３は、撮像装置の慣性情報（加速度および角速度）を検出し、SLAM３２１へ供給する。

　リアルタイム3Dモデリング処理部３１４は、リアルタイム3Dモデリングに関する処理を行う。例えば、リアルタイム3Dモデリング処理部３１４は、図４の第１の3Dデータ生成処理１０１の第１の3Dモデリング処理（リアルタイム3Dモデリング）を実行する。つまり、リアルタイム3Dモデリング処理部３１４は、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する。

　SLAM３２１は、供給された第１の撮像画像と慣性情報とに基づいて自己位置推定を行い、撮像装置３００の位置および姿勢を示す姿勢情報を生成する。SLAM３２１は、生成した姿勢情報をTSDF更新部３２２、撮像制御部３０３、および撮像案内出力制御部３０８へ供給する。TSDF更新部３２２は、その姿勢情報と深度に基づいてTSDFを更新し、更新されたTSDFをメッシュ生成部３２３へ供給する。メッシュ生成部３２３は、その更新されたTSDFを用いてメッシュ（やテクスチャ）を生成する。メッシュ生成部３２３は、そのメッシュおよびテクスチャを第１の3Dデータ（第１の３次元形状情報）としてスコアリング処理部３０２へ供給する。

　スコアリング処理部３０２は、スコアリングに関する処理を行う。例えば、スコアリング処理部３０２は、供給された第１の3Dデータと、撮像制御部３０３から供給される撮像視点情報（第２の撮像が行われた位置および姿勢を示す情報）とに基づいて、図４のスコアリング処理１０２を行う。つまり、スコアリング処理部３０２は、第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成する。例えば、スコアリング処理部３０２は、第１の３次元形状情報、並びに、これまでに行われた第２の撮像の位置および姿勢に基づいて、第１の３次元形状情報の局所毎にスコアリング結果を生成してもよい。例えば、スコアリング処理部３０２は、メッシュのポリゴン毎にスコアリング結果を生成してもよい。スコアリング処理部３０２は、そのスコアリング結果を撮像制御部３０３および撮像案内出力制御部３０８へ供給する。

　なお、スコアリング処理部３０２は、撮像部３３２に関するカメラ情報を取得し、そのカメラ情報に基づいてスコアリング結果を生成してもよい。また、スコアリング処理部３０２は、撮像部３３２による撮像制御情報に基づかない第２の撮像のタイミングに対応する撮像装置３００の位置および姿勢に基づいてスコアリング結果を生成してもよい。

　撮像制御部３０３は、第２の撮像の制御に関する処理を行う。例えば、撮像制御部３０３は、図４の第２の3Dモデリング用撮像制御処理１０３を実行する。つまり、撮像制御部３０３は、供給されたスコアリング結果および姿勢情報に基づいて、第２の撮像を制御する撮像制御情報を生成し、撮像部３３２へ供給する。この撮像制御情報は、例えば、撮像部３３２に対して第２の撮像を実行させる（第２の撮像画像を生成させる）制御情報である。つまり、撮像制御部３０３は、スコアリング結果に基づいて第２の撮像として適切な位置および姿勢を求め、撮像部３３２に対してその位置および姿勢で第２の撮像を実行させる。また、撮像制御部３０３は、その実行させた第２の撮像の位置および姿勢を示す撮像視点情報をスコアリング処理部３０２へ供給する。

　また、撮像制御部３０３は、撮像部３３２による撮像制御情報に基づかない第２の撮像のタイミングを示す撮像タイミング情報を取得し、その撮像タイミングに対応する撮像装置３００の姿勢情報を撮像視点情報としてスコアリング処理部３０２へ供給してもよい。

　第２の3Dデータ生成部３０４は、第２の3Dデータの生成に関する処理を行う。例えば、第２の3Dデータ生成部３０４は、図４の第２の3Dデータ生成処理１０４を実行する。操作部３３１は、ユーザ等による撮像部３３２への指示を受け付け、撮像部３３２へその指示を供給する。

　撮像部３３２は、イメージセンサを有し、被写体を撮像して撮像画像を生成する。撮像部３３２は、図４の第２の3Dデータ生成処理１０４の第２の撮像（つまり、第２の3Dモデリング（フォトグラメトリ）のための撮像）を行う。撮像部３３２は、生成した撮像画像を画像処理部３３３へ供給する。

　撮像部３３２は、例えば、撮像制御部３０３の制御に従って（撮像制御部３０３から供給される撮像制御情報に基づいて）第２の撮像を行い、第２の撮像画像を生成してもよい。また、撮像部３３２は、操作部３３１から供給される指示に従って第２の撮像を行い、第２の撮像画像を生成してもよい。また、撮像部３３２は、カメラ情報（撮像部３３２の内部パラメータ、外部パラメータ、画角情報等）をスコアリング処理部３０２へ供給してもよい。また、撮像部３３２は、撮像制御情報に基づかない第２の撮像のタイミングを示す撮像タイミング情報を、撮像制御部３０３および撮像案内出力制御部３０８へ供給してもよい。

　画像処理部３３３は、撮像部３３２において生成された撮像画像（第２の撮像画像）に対して所定の画像処理を施す。この画像処理の内容は任意である。画像処理部３３３は、その撮像画像をSfM３４１へ供給する。また、画像処理部３３３は、その撮像画像を符号化部３０５および撮像案内出力制御部３０８へ供給してもよい。

　フォトグラメトリ処理部３３４は、第２の撮像画像に対するフォトグラメトリに関する処理を行う。例えば、フォトグラメトリ処理部３３４は、図４の第２の3Dデータ生成処理１０４の第２の3Dモデリング処理を実行する。つまり、フォトグラメトリ処理部３３４は、撮像部３３２により生成された第２の撮像画像に基づいて、第２の３次元形状情報を生成する。

　SfM３４１は、例えば、第２の撮像画像間で対応点を探索し、エピポーラ拘束によりカメラの位置および姿勢を導出し、そのカメラ位置および姿勢に基づく三角測量により各対応点の３次元空間における位置を特定し、その特定した３次元点群の全体をバンドル調整により最適化し、MVS３４２へ供給する。MVS３４２は、例えば、その３次元点群を用いて、さらに、密な対応点探索を行い、３次元点を追加し、さらに後処理としてメッシュ化やテクスチャリングを行い、第２の3Dデータを生成する。MVS３４２は、生成した第２の3Dデータを符号化部３０５へ供給する。

　符号化部３０５は、供給された第２の3Dデータを符号化し、その符号化データを記憶部３０６および通信部３０７へ供給する。また、符号化部３０５は、供給された第２の撮像画像を符号化し、その符号化データを記憶部３０６および通信部３０７へ供給してもよい。

　記憶部３０６は、供給された符号化データを記憶する。通信部３０７は、供給された符号化データを他の情報処理装置（例えばサーバ等）に送信する。

　撮像案内出力制御部３０８は、第２の撮像のための案内に関する処理を行う。例えば、撮像案内出力制御部３０８は、図４の第２の3Dモデリング用撮像案内出力処理１０５を実行する。つまり、撮像案内出力制御部３０８は、第２の撮像のための案内情報を生成し、その案内情報の出力を制御する。例えば、撮像案内出力制御部３０８は、供給されたスコアリング結果と撮像装置３００の姿勢情報とに基づいて、上述した案内情報を生成する。また、撮像案内出力制御部３０８は、供給された撮像タイミング情報に基づいて案内情報を生成してもよい。撮像案内出力制御部３０８は、生成した案内情報を出力部３０９へ供給し、例えば画像や音声等として出力させる。また、撮像案内出力制御部３０８は、供給された撮像画像をその案内情報（画像）に重畳し、表示させてもよい。

　出力部３０９は、撮像案内出力制御部３０８の制御に従って案内情報を画像や音声等として出力する。

　このような構成を有することにより、撮像装置３００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、撮像装置３００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、撮像装置３００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　この撮像装置３００により実行される3Dモデリング処理の流れの例を図２７のフローチャートを参照して説明する。

　3Dモデリング処理が開始されると、ステップＳ３０１において、デプスセンサ３１１、撮像部３１２、およびIMU３１３は、深度、撮像画像、慣性情報を取得する。

　ステップＳ３０２において、リアルタイム3Dモデリング処理部３１４は、リアルタイム3Dモデリング処理を実行し、第１の3Dデータを生成する。

　ステップＳ３０３において、スコアリング処理部３０２は、これまでに行われた第２の撮像に基づいて第１の3Dデータをスコアリングする。

　ステップＳ３０４において、撮像案内出力制御部３０８は、スコアリング結果や姿勢情報等に基づいて第２の撮像のための撮像案内（案内情報）を生成する。出力部３０９は、その撮像案内（案内情報）を出力する。

　ステップＳ３０５において、撮像制御部３０３は、スコアリング結果や姿勢情報等に基づいてフォトグラメトリ用撮像（第２の撮像）を制御する。

　ステップＳ３０６において、撮像部３３２は、その制御に従って撮像する（第２の撮像を行う）。

　ステップＳ３０７において、撮像制御部３０３および撮像案内出力制御部３０８は、撮像部３３２からカメラ情報を取得する。また、スコアリング処理部３０２は、撮像部３３２から撮像タイミング情報を取得する。

　ステップＳ３０８において、撮像制御部３０３は、フォトグラメトリ用撮像（第２の撮像）を終了するか否かを判定する。フォトグラメトリ用撮像を終了しないと判定された場合、処理はステップＳ３０３に戻る。また、ステップＳ３０８においてフォトグラメトリ用撮像を終了すると判定された場合、処理はステップＳ３０９へ進む。

　ステップＳ３０９において、フォトグラメトリ処理部３３４は、フォトグラメトリ処理を実行し、第２の3Dデータを生成する。

　ステップＳ３１０において、符号化部３０５は、その第２の3Dデータを符号化する。

　ステップＳ３１１において、記憶部３０６は、その符号化データを記憶する。また、通信部３０７は、その符号化データを他の装置（例えばサーバ等）へ送信する。

　ステップＳ３１１の処理が終了すると、3Dモデリング処理が終了する。

　　＜リアルタイム3Dモデリング処理の流れ＞
　図２７のステップＳ３０２において実行されるリアルタイム3Dモデリング処理の流れの例を、図２８のフローチャートを参照して説明する。

　リアルタイム3Dモデリング処理が開始されると、SLAM３２１は、ステップＳ３３１において、撮像画像および慣性情報に基づいて撮像装置３００の３次元姿勢を示す姿勢情報を導出する。

　ステップＳ３３２において、TSDF更新部３２２は、撮像画像、姿勢情報、深度に基づいてTSDFを更新する。

　ステップＳ３３３において、メッシュ生成部３２３は、その更新されたTSDFに基づいて第１の3Dデータを生成する。

　ステップＳ３３３の処理が終了すると、リアルタイム3Dモデリング処理が終了し、処理は図２７に戻る。

　　＜フォトグラメトリ処理の流れ＞
　図２７のステップＳ３０９において実行されるフォトグラメトリ処理の流れの例を、図２９のフローチャートを参照して説明する。

　フォトグラメトリ処理が開始されると、SfM３４１は、ステップＳ３５１において、撮像画像間で対応点を検出する。

　ステップＳ３５２において、SfM３４１は、エピポーラ拘束によりカメラの３次元姿勢を導出する。

　ステップＳ３５３において、SfM３４１は、三角測量を用いて３次元点を導出する。

　ステップＳ３５４において、SfM３４１は、バンドル調整により全体を最適化する。

　ステップＳ３５５において、MVS３４２は、密な対応点探索により３次元点を導出し、第２の3Dデータを生成する。

　ステップＳ３５５の処理が終了すると、フォトグラメトリ処理が終了し、処理は図２７に戻る。

　以上のように各処理を実行することにより、撮像装置３００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、撮像装置３００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、撮像装置３００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、撮像装置３００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　＜６．第２の実施の形態＞
　　＜情報処理システム１＞
　本技術は、上述の例に限定されず、任意の構成に適用し得る。例えば、3Dモデリングを行う情報処理システムに適用してもよい。

　例えば、情報処理装置と撮像装置を備える情報処理システムにおいて、情報処理装置が、3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、その3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、その第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、撮像装置の位置および姿勢並びにスコアリング結果に基づいて、3Dオブジェクトを撮像する第２の撮像を制御する撮像制御情報を生成する撮像制御部と、その撮像制御情報を撮像装置へ供給する第１の通信部とを備えてもよい。また、撮像装置が、その情報処理装置から供給される撮像制御情報を取得する第２の通信部と、その撮像制御情報に基づいて3Dオブジェクトを撮像し、第２の撮像画像を生成する撮像部とを備えてもよい。

　図３０は、本技術を適用した情報処理システムの一態様の構成例を示す図である。図３０に示される情報処理システム４００は、3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリングを行うシステムである。図３０に示されるように、情報処理システム４００は、撮像通信装置４０１、撮像装置４０２、およびサーバ４０３を有する。撮像通信装置４０１およびサーバ４０３は、ネットワーク４０４を介して通信可能に接続される。ネットワーク４０４は、例えば、インターネット、LAN（Local Area Network）、無線LAN等の、任意の通信媒体により構成される通信路である。

　撮像通信装置４０１は、例えばスマートフォン等のような、ネットワーク４０４を介して任意の装置と通信を行うことができる通信機能と撮像機能とを有する情報処理装置である。撮像装置４０２は、例えばデジタルカメラのような、撮像機能を有する情報処理装置である。撮像装置４０２は、撮像通信装置４０１とのみ通信することができる。撮像通信装置４０１および撮像装置４０２は、互いに固定的に接続され、端末装置４１０としてユーザに使用される。サーバ４０３は、その端末装置４１０（撮像装置４０２）において生成される第２の撮像画像を取得し、その第２の撮像画像を用いて第２の3Dモデリング（フォトグラメトリ処理）を行い、第２の3Dデータを生成し、記憶（管理）する。

　図３１は、撮像通信装置４０１の主な構成例を示すブロック図である。なお、図３１においては、処理部やデータの流れ等の主なものを示しており、図３１に示されるものが全てとは限らない。つまり、撮像通信装置４０１が、図３１においてブロックとして示されていない装置や処理部を有してもよい。また、図３１において矢印等として示されていないデータの流れや処理が存在してもよい。

　図３１に示されるように、撮像通信装置４０１は、撮像装置３００（図２６）の構成の、第２の3Dデータ生成部３０４の代わりに通信部４２１を有する。つまり、それ以外の構成は、撮像装置３００と同様である。

　通信部４２１は、撮像装置４０２と通信可能に接続され、撮像装置４０２と通信を行い、情報を授受する。例えば、通信部４２１は、撮像制御部３０３から供給される撮像制御情報を撮像装置４０２へ供給してもよい。また、通信部４２１は、撮像装置４０２により生成された第２の撮像画像を取得し、符号化部３０５および撮像案内出力制御部３０８へ供給してもよい。また、通信部４２１は、撮像装置４０２から供給されるカメラ情報を取得し、スコアリング処理部３０２へ供給してもよい。このカメラ情報は、撮像装置４０２（の撮像部３３２）の内部パラメータ、外部パラメータ、および画角情報等を含んでもよい。また、通信部４２１は、撮像装置４０２から供給される撮像タイミング情報を取得し、撮像制御部３０３および撮像案内出力制御部３０８へ供給してもよい。この撮像タイミング情報は、撮像装置４０２（の撮像部３３２）が撮像制御情報に基づかずに行った撮像のタイミングを示す。

　なお、通信部３０７は、ネットワーク４０４を介してサーバ４０３と通信可能に接続されており、サーバ４０３と通信を行い、情報を授受する。例えば、符号化部３０５は、通信部４２１から供給される第２の撮像画像を符号化し、その符号化データを記憶部３０６および通信部３０７へ供給する。記憶部３０６は、その第２の撮像画像の符号化データを記憶する。通信部３０７は、その第２の撮像画像の符号化データを、ネットワーク４０４を介してサーバ４０３へ供給する。

　図３２は、撮像装置４０２の主な構成例を示すブロック図である。なお、図３２においては、処理部やデータの流れ等の主なものを示しており、図３２に示されるものが全てとは限らない。つまり、撮像装置４０２が、図３２においてブロックとして示されていない装置や処理部を有してもよい。また、図３２において矢印等として示されていないデータの流れや処理が存在してもよい。

　図３２に示されるように、撮像装置４０２は、操作部３３１、撮像部３３２、画像処理部３３３、通信部４３１、符号化部４３２、および記憶部４３３を有する。操作部３３１、撮像部３３２、および画像処理部３３３は、図２６の撮像装置３００の場合と同様の処理を行う。

　通信部４３１は、撮像通信装置４０１と通信可能に接続され、撮像通信装置４０１と通信を行い、情報を授受する。例えば、通信部４３１は、撮像通信装置４０１から供給される撮像制御情報を取得し、撮像部３３２へ供給してもよい。また、通信部４３１は、撮像部３３２から供給されるカメラ情報を取得し、撮像通信装置４０１へ供給してもよい。このカメラ情報は、撮像部３３２の内部パラメータ、外部パラメータ、および画角情報等を含んでもよい。また、通信部４３１は、撮像部３３２から供給される撮像タイミング情報を取得し、撮像通信装置４０１へ供給してもよい。この撮像タイミング情報は、撮像部３３２が撮像制御情報に基づかずに行った撮像のタイミングを示す。また、通信部４３１は、画像処理部３３３から供給される第２の撮像画像を取得し、撮像通信装置４０１へ供給してもよい。

　符号化部４３２は、画像処理部３３３から供給される第２の撮像画像を符号化し、その符号化データを記憶部４３３へ供給する。記憶部４３３は、その符号化データを記憶する。

　図３３は、サーバ４０３の主な構成例を示すブロック図である。なお、図３３においては、処理部やデータの流れ等の主なものを示しており、図３３に示されるものが全てとは限らない。つまり、サーバ４０３が、図３３においてブロックとして示されていない装置や処理部を有してもよい。また、図３３において矢印等として示されていないデータの流れや処理が存在してもよい。

　図３３に示されるように、サーバ４０３は、通信部４４１、復号部４４２、フォトグラメトリ処理部３３４、符号化部４４４、および記憶部４４５を有する。フォトグラメトリ処理部３３４は、図２６の撮像装置３００の場合と同様の構成を有し、同様の処理を行う。

　通信部４４１は、ネットワーク４０４を介して撮像通信装置４０１と通信可能に接続され、撮像通信装置４０１等の他の装置と通信を行い、情報を授受する。例えば、通信部４４１は、撮像通信装置４０１から供給される第２の撮像画像の符号化データを取得し、復号部４４２へ供給する。また、通信部４４１は、符号化部４４４から供給される第２の3Dデータの符号化データを、ネットワーク４０４を介して他の装置（例えば、撮像通信装置４０１）へ供給してもよい。

　復号部４４２は、通信部４４１から供給された第２の撮像画像の符号化データを復号し、第２の撮像画像を生成（復元）する。復号部４４２は、その第２の撮像画像をフォトグラメトリ処理部３３４（SfM３４１）へ供給する。フォトグラメトリ処理部３３４は、その第２の撮像画像を用いて第２の3Dモデリング（フォトグラメトリ処理）を実行し、第２の3Dデータを生成する。フォトグラメトリ処理部３３４（MVS３４２）は、生成した第２の3Dデータを符号化部４４４へ供給する。

　符号化部４４４は、供給された第２の3Dデータを符号化し、その符号化データを記憶部４４５へ供給する。また、符号化部４４４は、その第２の3Dデータの符号化データを通信部４４１へ供給してもよい。記憶部４４５は、供給された第２の3Dデータの符号化データを記憶する。

　各装置がこのような構成を有することにより、情報処理システム４００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　この情報処理システム４００により実行される3Dモデリング処理の流れの例を図３４および図３５のフローチャートを参照して説明する。

　3Dモデリング処理が開始されると、図３４のステップＳ４０１において、撮像通信装置４０１のデプスセンサ３１１、撮像部３１２、およびIMU３１３は、深度、撮像画像、慣性情報を取得する。

　ステップＳ４０２において、撮像通信装置４０１のリアルタイム3Dモデリング処理部３１４は、リアルタイム3Dモデリング処理を実行し、第１の3Dデータを生成する。このリアルタイム3Dモデリング処理は、図２８の例と同様に実行される。

　ステップＳ４０３において、撮像通信装置４０１のスコアリング処理部３０２は、これまでに行われた第２の撮像に基づいて第１の3Dデータをスコアリングする。

　ステップＳ４０４において、撮像通信装置４０１の撮像案内出力制御部３０８は、スコアリング結果や姿勢情報等に基づいて第２の撮像のための撮像案内（案内情報）を生成する。出力部３０９は、その撮像案内（案内情報）を出力する。

　ステップＳ４０５において、撮像通信装置４０１の撮像制御部３０３は、スコアリング結果や姿勢情報等に基づいてフォトグラメトリ用撮像（第２の撮像）を制御する撮像制御情報を生成する。通信部４２１は、その撮像制御情報を撮像装置４０２へ供給する。撮像装置４０２の通信部４３１は、ステップＳ４１１においてその撮像制御情報を取得する。

　ステップＳ４１２において、撮像装置４０２の撮像部３３２は、その制御に従って撮像し（第２の撮像を行い）、第２の撮像画像を生成する。画像処理部３３３は、その第２の撮像画像に対して所定の画像処理を行う。

　ステップＳ４１３において、撮像装置４０２の通信部４３１は、その第２の撮像画像を撮像通信装置４０１へ供給する。撮像通信装置４０１の通信部４２１は、ステップＳ４０６においてその第２の撮像画像を取得する。

　また、ステップＳ４１４において、撮像装置４０２の通信部４３１は、撮像部３３２のカメラ情報や撮像タイミング情報を撮像通信装置４０１へ供給する。撮像通信装置４０１の通信部４２１は、ステップＳ４０７においてそのカメラ情報や撮像タイミング情報を取得する。

　図３５のステップＳ４４１において、撮像装置４０２の符号化部４３２は、第２の撮像画像を符号化する。記憶部４３３は、その第２の撮像画像の符号化データを記憶する。

　ステップＳ４３１において、撮像通信装置４０１の符号化部３０５は、第２の撮像画像を符号化する。通信部３０７は、第２の撮像画像の符号化データをサーバ４０３へ供給する。サーバ４０３の通信部４４１は、ステップＳ４５１においてその第２の撮像画像の符号化データを取得する。復号部４４２は、その符号化データを復号し、第２の撮像画像を生成（復元）する。

　ステップＳ４５２において、サーバ４０３のフォトグラメトリ処理部３３４は、フォトグラメトリ処理を実行し、第２の3Dデータを生成する。このフォトグラメトリ処理は、図２９の例と同様に実行される。

　ステップＳ４５３において、サーバ４０３の符号化部４４４は、その第２の3Dデータを符号化する。

　ステップＳ４５４において、サーバ４０３の記憶部４４５は、その符号化データを記憶する。また、通信部４４１は、その符号化データを他の装置（例えば撮像通信装置４０１等）へ送信する。

　また、ステップＳ４３２において、撮像通信装置４０１の撮像制御部３０３は、フォトグラメトリ用撮像（第２の撮像）を終了するか否かを判定する。フォトグラメトリ用撮像を終了しないと判定された場合、処理は図３４のステップＳ４０３に戻る。また、図３５のステップＳ４３２においてフォトグラメトリ用撮像を終了すると判定された場合、3Dモデリング処理が終了する。

　このように各処理を実行することにより、情報処理システム４００は、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜情報処理システム２＞
　なお、情報処理システム４００において、スコアリング処理をサーバ４０３で行ってもよい。

　その場合の撮像通信装置４０１の主な構成例を図３６に示す。なお、図３６においては、処理部やデータの流れ等の主なものを示しており、図３６に示されるものが全てとは限らない。つまり、撮像通信装置４０１が、図３６においてブロックとして示されていない装置や処理部を有してもよい。また、図３６において矢印等として示されていないデータの流れや処理が存在してもよい。

　図３６に示されるように、この場合の撮像通信装置４０１は、図３１の構成からスコアリング処理部３０２が省略されている。この場合、通信部３０７は、撮像制御部３０３から供給される撮像視点情報をサーバ４０３へ供給する。

　また、この場合、リアルタイム3Dモデリング処理部３１４（メッシュ生成部３２３）は、生成した第１の3Dデータを符号化部３０５へ供給する。符号化部３０５は、その第１の3Dデータを符号化し、その符号化データを通信部３０７へ供給する。通信部３０７は、符号化部３０５から供給される第１の3Dデータの符号化データをサーバ４０３へ供給する。

　また、通信部３０７は、サーバ４０３（のスコアリング処理部３０２）により導出されたスコアリング結果を取得し、撮像制御部３０３および撮像案内出力制御部３０８へ供給する。

　また、通信部３０７は、図３２の場合と同様に、符号化部３０５から供給される第２の撮像画像の符号化データをサーバ４０３へ供給する。

　また、この場合、通信部４２１は、撮像装置４０２から供給される（撮像部３３２の）カメラ情報を取得し、符号化部３０５へ供給する。符号化部３０５は、そのカメラ情報を符号化し、通信部３０７へ供給する。通信部３０７は、そのカメラ情報の符号化データをサーバ４０３へ供給する。

　図３７は、この場合のサーバ４０３の主な構成例を示すブロック図である。なお、図３７においては、処理部やデータの流れ等の主なものを示しており、図３７に示されるものが全てとは限らない。つまり、サーバ４０３が、図３７においてブロックとして示されていない装置や処理部を有してもよい。また、図３７において矢印等として示されていないデータの流れや処理が存在してもよい。

　図３７に示されるように、この場合、サーバ４０３は、図３３の構成に加え、スコアリング処理部３０２を有する。この場合、通信部４４１は、撮像通信装置４０１から供給される第１の3Dデータの符号化データを取得し、復号部４４２へ供給する。復号部４４２は、その符号化データを復号し、第１の3Dデータを生成（復元）する。復号部４４２は、その第１の3Dデータをスコアリング処理部３０２へ供給する。

　また、通信部４４１は、撮像通信装置４０１から供給される撮像視点情報を取得し、復号部４４２へ供給する。復号部４４２は、その撮像制御情報をスコアリング処理部３０２へ供給する。

　また、通信部４４１は、撮像通信装置４０１から供給されるカメラ情報の符号化データを取得し、復号部４４２へ供給する。復号部４４２は、その符号化データを復号し、カメラ情報を生成（復元）する。復号部４４２は、そのカメラ情報をスコアリング処理部３０２へ供給する。

　また、通信部４４１は、図３３の場合と同様に、撮像通信装置４０１から供給される第２の撮像画像の符号化データを取得し、復号部４４２へ供給する。復号部４４２は、その符号化データを復号し、第２の撮像画像を生成（復元）する。復号部４４２は、その第２の撮像画像をフォトグラメトリ処理部３３４へ供給する。

　この場合も、スコアリング処理部３０２は、供給された第１の3Dデータや撮像視点情報に基づいて図４のスコアリング処理１０２を行い、スコアリング結果を導出する。また、スコアリング処理部３０２は、カメラ情報に基づいてそのスコアリング処理１０２を行ってもよい。スコアリング処理部３０２は、そのスコアリング結果を符号化部４４４へ供給する。符号化部４４４は、そのスコアリング結果を通信部４４１へ供給する。通信部４４１は、そのスコアリング結果を撮像通信装置４０１へ供給する。

　その他の処理は、図３３の場合と同様である。

　各装置がこのような構成を有することにより、情報処理システム４００は、この場合も、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　　＜3Dモデリング処理の流れ＞
　この場合の情報処理システム４００により実行される3Dモデリング処理の流れの例を図３８および図３９のフローチャートを参照して説明する。

　3Dモデリング処理が開始されると、図３８のステップＳ５０１において、撮像通信装置４０１のデプスセンサ３１１、撮像部３１２、およびIMU３１３は、深度、撮像画像、慣性情報を取得する。

　ステップＳ５０２において、撮像通信装置４０１のリアルタイム3Dモデリング処理部３１４は、リアルタイム3Dモデリング処理を実行し、第１の3Dデータを生成する。このリアルタイム3Dモデリング処理は、図２８の例と同様に実行される。

　ステップＳ５０３において、撮像通信装置４０１の通信部３０７は、生成された第１の3Dデータをサーバ４０３へ供給する。サーバ４０３の通信部４４１は、ステップＳ５２１においてその第１の3Dデータを取得する。

　ステップＳ５２２において、サーバ４０３のスコアリング処理部３０２は、これまでに行われた第２の撮像に基づいて第１の3Dデータをスコアリングする。

　ステップＳ５２３において、サーバ４０３の通信部４４１は、そのスコアリング結果を撮像通信装置４０１へ供給する。撮像通信装置４０１の通信部３０７は、ステップＳ５０４においてそのスコアリング結果を取得する。

　ステップＳ５０５において、撮像通信装置４０１の撮像案内出力制御部３０８は、スコアリング結果や姿勢情報等に基づいて第２の撮像のための撮像案内（案内情報）を生成する。出力部３０９は、その撮像案内（案内情報）を出力する。

　ステップＳ５０６において、撮像通信装置４０１の撮像制御部３０３は、スコアリング結果や姿勢情報等に基づいてフォトグラメトリ用撮像（第２の撮像）を制御する撮像制御情報を生成する。通信部４２１は、その撮像制御情報を撮像装置４０２へ供給する。撮像装置４０２の通信部４３１は、ステップＳ５１１においてその撮像制御情報を取得する。

　また、撮像通信装置４０１の通信部３０７は、ステップＳ５０７において、撮像視点情報をサーバ４０３へ供給する。サーバ４０３の通信部４４１は、ステップＳ５２４においてその撮像視点情報を取得する。

　図３９のステップＳ５４１において、撮像装置４０２の撮像部３３２は、撮像制御情報に従って撮像し（第２の撮像を行い）、第２の撮像画像を生成する。画像処理部３３３は、その第２の撮像画像に対して所定の画像処理を行う。

　ステップＳ５４２において、撮像装置４０２の通信部４３１は、その第２の撮像画像を撮像通信装置４０１へ供給する。撮像通信装置４０１の通信部４２１は、ステップＳ５３１においてその第２の撮像画像を取得する。

　また、ステップＳ５４３において、撮像装置４０２の通信部４３１は、撮像部３３２のカメラ情報や撮像タイミング情報を撮像通信装置４０１へ供給する。撮像通信装置４０１の通信部４２１は、ステップＳ５３２においてそのカメラ情報や撮像タイミング情報を取得する。

　ステップＳ５４４において、撮像装置４０２の符号化部４３２は、第２の撮像画像を符号化する。記憶部４３３は、その第２の撮像画像の符号化データを記憶する。

　ステップＳ５３３において、撮像通信装置４０１の符号化部３０５は、第２の撮像画像を符号化する。通信部３０７は、第２の撮像画像の符号化データをサーバ４０３へ供給する。サーバ４０３の通信部４４１は、ステップＳ５５１においてその第２の撮像画像の符号化データを取得する。復号部４４２は、その符号化データを復号し、第２の撮像画像を生成（復元）する。

　ステップＳ５５２において、サーバ４０３のフォトグラメトリ処理部３３４は、フォトグラメトリ処理を実行し、第２の3Dデータを生成する。このフォトグラメトリ処理は、図２９の例と同様に実行される。

　ステップＳ５５３において、サーバ４０３の符号化部４４４は、その第２の3Dデータを符号化する。

　ステップＳ５５４において、サーバ４０３の記憶部４４５は、その符号化データを記憶する。また、通信部４４１は、その符号化データを他の装置（例えば撮像通信装置４０１等）へ送信する。

　また、ステップＳ５３４において、撮像通信装置４０１の撮像制御部３０３は、フォトグラメトリ用撮像（第２の撮像）を終了するか否かを判定する。フォトグラメトリ用撮像を終了しないと判定された場合、処理は図３８のステップＳ５２２に戻る。また、図３９のステップＳ５３４においてフォトグラメトリ用撮像を終了すると判定された場合、3Dモデリング処理が終了する。

　このように各処理を実行することにより、情報処理システム４００は、この場合も、より適切な位置および姿勢で3Dオブジェクトを撮像し、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。また、情報処理システム４００は、ユーザがより適切な位置および姿勢で第２の撮像を行うことができるように案内情報を出力することができる。つまり、情報処理システム４００は、その撮像画像を用いて3Dモデリング（第２の3Dモデリング処理）を実行することができる。したがって、情報処理システム４００は、3Dモデリングの負荷の増大を抑制しながら、より高精度な3Dデータを生成することができる。つまり、ユーザは、3Dモデリングをより容易に行うことができる。

　＜７．付記＞
　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図４０は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図４０に示されるコンピュータ９００において、CPU（Central Processing Unit）９０１、ROM（Read Only Memory）９０２、RAM（Random Access Memory）９０３は、バス９０４を介して相互に接続されている。

　バス９０４にはまた、入出力インタフェース９１０も接続されている。入出力インタフェース９１０には、入力部９１１、出力部９１２、記憶部９１３、通信部９１４、およびドライブ９１５が接続されている。

　入力部９１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部９１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部９１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部９１４は、例えば、ネットワークインタフェースよりなる。ドライブ９１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９２１を駆動する。

　以上のように構成されるコンピュータでは、CPU９０１が、例えば、記憶部９１３に記憶されているプログラムを、入出力インタフェース９１０およびバス９０４を介してRAM９０３にロードして実行する。これにより、上述した一連の処理が行われる。RAM９０３には、CPU９０１が各種の処理を実行する上において必要なデータ等が適宜記憶されてもよい。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体９２１に記録されて適用されてもよい。その場合、プログラムは、ドライブ９１５に装着されたリムーバブル記録媒体９２１から読み出され、入出力インタフェース９１０を介して記憶部９１３にインストールされてもよい。

　また、このプログラムは、例えば、ローカルエリアネットワーク、インターネット、デジタル衛星放送等といった、有線または無線の任意の伝送媒体を介して提供されてもよい。その場合、プログラムは、通信部９１４により受信され、入出力インタフェース９１０を介して記憶部９１３にインストールされてもよい。

　その他、このプログラムは、予め、ROM９０２若しくは記憶部９１３またはその両方にインストールされてもよい。

　　＜本技術の適用対象＞
　本技術は、任意の構成に適用することができる。例えば、本技術は、様々な電子機器に適用され得る。

　また、例えば、本技術は、システムLSI（Large Scale Integration）等としてのプロセッサ（例えばビデオプロセッサ）、複数のプロセッサ等を用いるモジュール（例えばビデオモジュール）、複数のモジュール等を用いるユニット（例えばビデオユニット）、または、ユニットにさらにその他の機能を付加したセット（例えばビデオセット）等、装置の一部の構成として実施することもできる。

　また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV（Audio Visual）機器、携帯型情報処理端末、IoT（Internet of Things）デバイス等の任意の端末に対して、画像（動画像）に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　　＜その他＞
　なお、本明細書において、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、あるデータに関連付けられた情報は、そのデータとは別の伝送路上で伝送されるようにしてもよい。また、例えば、あるデータに関連付けられた情報は、そのデータとは別の記録媒体（または同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、動的な3Dデータとその動的な3Dデータに対応する情報とが、複数フレーム、１フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、１つのフローチャートの各ステップを、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、１つのステップに複数の処理が含まれる場合、その複数の処理を、１つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、
　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、
　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像を制御する撮像制御部と
　を備える情報処理装置。
　（２）　前記第１の３次元形状情報は、前記第２の３次元形状情報よりも情報量が少なく、かつ、低精度である
　（１）に記載の情報処理装置。
　（３）　前記第１の3Dモデリング処理部は、
　　前記第１の撮像画像と前記第１の撮像を行う撮像部の加速度および角速度に基づいて、前記撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、
　　前記姿勢情報と前記3Dオブジェクトの深度とに基づいて、前記第１の３次元形状情報を生成する３次元形状生成部と
　を備える（１）または（２）に記載の情報処理装置。
　（４）　前記第１の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含む
　（３）に記載の情報処理装置。
　（５）　前記深度を検出する深度検出部と、
　前記撮像部と、
　前記加速度および前記角速度を検出する慣性計測部と
　をさらに備える（３）または（４）に記載の情報処理装置。
　（６）　前記スコアリング処理部は、前記第１の３次元形状情報、並びに、これまでに行われた前記第２の撮像の位置および姿勢に基づいて、前記第１の３次元形状情報の局所毎に前記スコアリング結果を生成する
　（１）乃至（５）のいずれかに記載の情報処理装置。
　（７）　前記第１の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含み、
　前記スコアリング処理部は、前記メッシュのポリゴン毎に前記スコアリング結果を生成する
　（６）に記載の情報処理装置。
　（８）　前記撮像制御部は、前記第２の撮像を行う撮像部の位置および姿勢並びに前記スコアリング結果に基づいて、前記第２の撮像を制御する
　（１）乃至（７）のいずれかに記載の情報処理装置。
　（９）　前記撮像部を備える撮像装置と通信する通信部をさらに備え、
　前記撮像制御部は、前記第２の撮像を制御する撮像制御情報を生成し、
　前記通信部は、前記撮像制御情報を前記撮像装置へ供給する
　（８）に記載の情報処理装置。
　（１０）　前記通信部は、前記撮像装置から供給される、前記撮像制御情報に基づかない前記第２の撮像のタイミングを示す撮像タイミング情報を取得し、
　前記スコアリング処理部は、前記撮像タイミング情報により示される前記第２の撮像のタイミングに対応する前記撮像装置の位置および姿勢に基づいて前記スコアリング結果を生成する
　（９）に記載の情報処理装置。
　（１１）　前記通信部は、前記撮像装置から供給される、前記撮像部に関するカメラ情報を取得し、
　前記スコアリング処理部は、前記カメラ情報に基づいて前記スコアリング結果を生成する
　（９）または（１０）に記載の情報処理装置。
　（１２）　前記カメラ情報は、前記撮像部の内部パラメータおよび外部パラメータ、並びに、前記第２の撮像画像の画角情報を含む
　（１１）に記載の情報処理装置。
　（１３）　前記第２の撮像画像を符号化して符号化データを生成する符号化部をさらに備え、
　前記通信部は、前記撮像装置から供給される前記第２の撮像画像を取得し、前記符号化部により生成された前記第２の撮像画像の符号化データを他の情報処理装置へ供給する
　（９）乃至（１２）のいずれかに記載の情報処理装置。
　（１４）　前記撮像部をさらに備える
　（８）乃至（１３）のいずれかに記載の情報処理装置。
　（１５）　前記撮像部により生成された前記第２の撮像画像に基づいて、前記第２の３次元形状情報を生成する第２の3Dモデリング処理部をさらに備える
　（１４）に記載の情報処理装置。
　（１６）　前記第２の3Dモデリング処理部は、
　　複数の前記第２の撮像画像の間の対応点の３次元位置を導出する対応点位置導出部と、
　　前記対応点の３次元位置に基づいて３次元点を追加する３次元点追加部と
　を備える（１５）に記載の情報処理装置。
　（１７）　前記第２の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含む
　（１５）または（１６）に記載の情報処理装置。
　（１８）　前記第２の３次元形状情報を符号化する符号化部をさらに備える
　（１５）乃至（１７）のいずれかに記載の情報処理装置。
　（１９）　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成する案内情報出力制御部をさらに備える
　（１）乃至（１８）のいずれかに記載の情報処理装置。
　（２０）　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、
　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像を制御する
　情報処理方法。

　（２１）　3Dオブジェクトを撮像する撮像部と、
　他の情報処理装置と通信する通信部と
　を備え、
　前記通信部は、前記撮像部に関するカメラ情報を前記他の情報処理装置へ供給し、前記他の情報処理装置により前記カメラ情報に基づいて生成された撮像制御情報を取得し、
　前記撮像部は、前記撮像制御情報に基づいて前記3Dオブジェクトを撮像し、前記3Dオブジェクトの３次元形状を表現する３次元形状情報を生成するための撮像画像を生成する
　情報処理装置。
　（２２）　前記カメラ情報は、前記撮像部の内部パラメータおよび外部パラメータ、並びに、前記撮像画像の画角情報を含む
　（２１）に記載の情報処理装置。
　（２３）　前記撮像部は、前記撮像制御情報に基づかずに前記3Dオブジェクトを撮像し、
　前記通信部は、前記撮像制御情報に基づかずに行った撮像のタイミングを示す撮像タイミング情報を前記他の情報処理装置へ供給する
　（２１）に記載の情報処理装置。
　（２４）　前記通信部は、前記撮像画像を前記他の情報処理装置へ供給する
　（２１）または（２２）に記載の情報処理装置。
　（２５）　前記撮像画像を符号化し、符号化データを生成する符号化部と、
　前記撮像画像の符号化データを記憶する記憶部と
　をさらに備える（２１）乃至（２４）のいずれかに記載の情報処理装置。
　（２６）　3Dオブジェクトを撮像する撮像部に関するカメラ情報を他の情報処理装置へ供給し、前記他の情報処理装置により前記カメラ情報に基づいて生成された撮像制御情報を取得し、
　前記撮像制御情報に基づいて前記3Dオブジェクトを撮像し、前記3Dオブジェクトの３次元形状を表現する３次元形状情報を生成するための撮像画像を生成する
　情報処理方法。

　（３１）　情報処理装置と撮像装置を備える情報処理システムであって、
　前記情報処理装置が、
　　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、
　　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、
　　前記撮像装置の位置および姿勢並びに前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像を制御する撮像制御情報を生成する撮像制御部と、
　　前記撮像制御情報を前記撮像装置へ供給する第１の通信部と
　を備え、
　前記撮像装置が、
　前記情報処理装置から供給される前記撮像制御情報を取得する第２の通信部と、
　前記撮像制御情報に基づいて前記3Dオブジェクトを撮像し、前記第２の撮像画像を生成する撮像部と
　を備える情報処理システム。

　（４１）　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、
　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、
　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成し、前記案内情報の出力を制御する案内情報出力制御部と
　を備える情報処理装置。
　（４２）　前記案内情報出力制御部は、前記案内情報として、前記スコアリング結果を示す画像を生成し、前記画像を表示させる
　（４１）に記載の情報処理装置。
　（４３）　前記案内情報出力制御部は、前記第２の撮像を行う撮像部の位置および姿勢に基づいて、前記撮像部の画角内についての前記スコアリング結果を示す前記画像を生成し、前記画像を表示させる
　（４２）に記載の情報処理装置。
　（４４）　前記案内情報出力制御部は、前記撮像部により生成される撮像画像を前記画像に重畳して表示させる
　（４３）に記載の情報処理装置。
　（４５）　前記案内情報出力制御部は、さらに、前記3Dオブジェクト全体の前記スコアリング結果を示す俯瞰画像を表示させる
　（４４）に記載の情報処理装置。
　（４６）　前記案内情報出力制御部は、前記案内情報として、複数の前記第２の撮像画像の間で撮像範囲がオーバーラップするオーバーラップ領域を示す画像を生成し、前記画像を表示させる
　（４１）乃至（４５）のいずれかに記載の情報処理装置。
　（４７）　前記案内情報出力制御部は、前記第２の撮像を行う撮像部の位置および姿勢に基づいて、前記撮像部の現在の画角とこれまでに得られた前記第２の撮像画像の撮像範囲との間の前記オーバーラップ領域を示す前記画像を生成し、前記画像を表示させる
　（４６）に記載の情報処理装置。
　（４８）　前記案内情報出力制御部は、前記撮像部により生成される撮像画像を前記画像に重畳して表示させる
　（４７）に記載の情報処理装置。
　（４９）　前記案内情報出力制御部は、さらに、前記画角内に占める前記オーバーラップ領域の割合を示すオーバーラップ率を示す画像を表示させる
　（４８）に記載の情報処理装置。
　（５０）　前記案内情報出力制御部は、前記案内情報として、前記第２の撮像を補助するための撮像補助画像を生成し、前記撮像補助画像を表示させる
　（４１）乃至（４９）のいずれかに記載の情報処理装置。
　（５１）　前記案内情報出力制御部は、前記スコアリング結果に基づいて、推奨する前記第２の撮像の位置および姿勢である推奨撮像位置姿勢を導出し、前記案内情報として、前記推奨撮像位置姿勢を示す推奨撮像位置姿勢案内を表示させる
　（５０）に記載の情報処理装置。
　（５２）　前記案内情報出力制御部は、前記推奨撮像位置姿勢案内として、前記第２の撮像を行う撮像部の位置および姿勢が前記推奨撮像位置姿勢と同一である場合、前記撮像部の現在の位置および姿勢が前記推奨撮像位置姿勢であることを示す画像を表示させる
　（５１）に記載の情報処理装置。
　（５３）　前記案内情報出力制御部は、前記推奨撮像位置姿勢案内として、前記第２の撮像を行う撮像部を基準とする前記推奨撮像位置姿勢の相対位置および相対姿勢を示す画像を表示させる
　（５１）または（５２）に記載の情報処理装置。
　（５４）　前記案内情報出力制御部は、前記第２の撮像を行う撮像部により生成される撮像画像を前記推奨撮像位置姿勢案内に重畳して表示させる
　（５１）乃至（５３）のいずれかに記載の情報処理装置。
　（５５）　前記第１の３次元形状情報は、前記第２の３次元形状情報よりも情報量が少なく、かつ、低精度である
　（４１）乃至（５４）のいずれかに記載の情報処理装置。
　（５６）　前記第１の3Dモデリング処理部は、
　　前記第１の撮像画像と前記第１の撮像を行う撮像部の加速度および角速度に基づいて、前記撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、
　　前記姿勢情報と前記3Dオブジェクトの深度とに基づいて、前記第１の３次元形状情報を生成する３次元形状生成部と
　を備える（４１）乃至（５５）のいずれかに記載の情報処理装置。
　（５７）　前記第１の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含む
　（５６）に記載の情報処理装置。
　（５８）　前記スコアリング処理部は、前記第１の３次元形状情報、並びに、これまでに行われた前記第２の撮像の位置および姿勢に基づいて、前記第１の３次元形状情報の局所毎に前記スコアリング結果を生成する
　（４１）乃至（５７）のいずれかに記載の情報処理装置。
　（５９）　前記第１の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含み、
　前記スコアリング処理部は、前記メッシュのポリゴン毎に前記スコアリング結果を生成する
　（５８）に記載の情報処理装置。
　（６０）　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、
　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成し、前記案内情報の出力を制御する
　情報処理方法。

　１０１　第１の3Dデータ生成処理，　１０２　スコアリング処理，　１０３　第２の3Dモデリング用撮像制御処理，　１０４　第２の3Dデータ生成処理，　１０５　第２の3Dモデリング用撮像案内出力処理，　３００　撮像装置，　３０１　第１の3Dデータ生成部，　３０２　スコアリング処理部，　３０３　撮像制御部，　３０４　第２の3Dデータ生成部，　３０５　符号化部，　３０６　記憶部，　３０７　通信部，　３０８　撮像案内出力制御部，　３０９　出力部，　３１１　デプスセンサ，　３１２　撮像部，　３１３　IMU，　３１４　リアルタイム3Dモデリング処理部，　３２１　SLAM，　３２２　TSDF更新部，　３２３　メッシュ生成部，　３３１　操作部，　３３２　撮像部，　３３３　画像処理部，　３３４　フォトグラメトリ処理部，　３４１　SfM，　３４２　MVS，　４００　情報処理システム，　４０１　撮像装置，　４０２　撮像通信装置，　４０３　サーバ，　４０４　ネットワーク，　４１０　端末装置，　４２１　通信部，　４３１　通信部，　４３２　符号化部，　４３３　記憶部，　４４１　通信部，　４４２　復号部，　４４４　符号化部，　４４５　記憶部，　９００　コンピュータ

Claims

　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成する第１の3Dモデリング処理部と、
　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成するスコアリング処理部と、
　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成し、前記案内情報の出力を制御する案内情報出力制御部と
　を備える情報処理装置。
　前記案内情報出力制御部は、前記案内情報として、前記スコアリング結果を示す画像を生成し、前記画像を表示させる
　請求項１に記載の情報処理装置。
　前記案内情報出力制御部は、前記第２の撮像を行う撮像部の位置および姿勢に基づいて、前記撮像部の画角内についての前記スコアリング結果を示す前記画像を生成し、前記画像を表示させる
　請求項２に記載の情報処理装置。
　前記案内情報出力制御部は、前記撮像部により生成される撮像画像を前記画像に重畳して表示させる
　請求項３に記載の情報処理装置。
　前記案内情報出力制御部は、さらに、前記3Dオブジェクト全体の前記スコアリング結果を示す俯瞰画像を表示させる
　請求項４に記載の情報処理装置。
　前記案内情報出力制御部は、前記案内情報として、複数の前記第２の撮像画像の間で撮像範囲がオーバーラップするオーバーラップ領域を示す画像を生成し、前記画像を表示させる
　請求項１に記載の情報処理装置。
　前記案内情報出力制御部は、前記第２の撮像を行う撮像部の位置および姿勢に基づいて、前記撮像部の現在の画角とこれまで得られた前記第２の撮像画像の撮像範囲との間の前記オーバーラップ領域を示す前記画像を生成し、前記画像を表示させる
　請求項６に記載の情報処理装置。
　前記案内情報出力制御部は、前記撮像部により生成される撮像画像を前記画像に重畳して表示させる
　請求項７に記載の情報処理装置。
　前記案内情報出力制御部は、さらに、前記画角内に占める前記オーバーラップ領域の割合を示すオーバーラップ率を示す画像を表示させる
　請求項８に記載の情報処理装置。
　前記案内情報出力制御部は、前記案内情報として、前記第２の撮像を補助するための撮像補助画像を生成し、前記撮像補助画像を表示させる
　請求項１に記載の情報処理装置。
　前記案内情報出力制御部は、前記スコアリング結果に基づいて、推奨する前記第２の撮像の位置および姿勢である推奨撮像位置姿勢を導出し、前記案内情報として、前記推奨撮像位置姿勢を示す推奨撮像位置姿勢案内を表示させる
　請求項１０に記載の情報処理装置。
　前記案内情報出力制御部は、前記推奨撮像位置姿勢案内として、前記第２の撮像を行う撮像部の位置および姿勢が前記推奨撮像位置姿勢と同一である場合、前記撮像部の現在の位置および姿勢が前記推奨撮像位置姿勢であることを示す画像を表示させる
　請求項１１に記載の情報処理装置。
　前記案内情報出力制御部は、前記推奨撮像位置姿勢案内として、前記第２の撮像を行う撮像部を基準とする前記推奨撮像位置姿勢の相対位置および相対姿勢を示す画像を表示させる
　請求項１１に記載の情報処理装置。
　前記案内情報出力制御部は、前記第２の撮像を行う撮像部により生成される撮像画像を前記推奨撮像位置姿勢案内に重畳して表示させる
　請求項１１に記載の情報処理装置。
　前記第１の３次元形状情報は、前記第２の３次元形状情報よりも情報量が少なく、かつ、低精度である
　請求項１に記載の情報処理装置。
　前記第１の3Dモデリング処理部は、
　　前記第１の撮像画像と前記第１の撮像を行う撮像部の加速度および角速度に基づいて、前記撮像部の位置および姿勢を示す姿勢情報を生成する姿勢情報生成部と、
　　前記姿勢情報と前記3Dオブジェクトの深度とに基づいて、前記第１の３次元形状情報を生成する３次元形状生成部と
　を備える請求項１に記載の情報処理装置。
　前記第１の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含む
　請求項１６に記載の情報処理装置。
　前記スコアリング処理部は、前記第１の３次元形状情報、並びに、これまでに行われた前記第２の撮像の位置および姿勢に基づいて、前記第１の３次元形状情報の局所毎に前記スコアリング結果を生成する
　請求項１に記載の情報処理装置。
　前記第１の３次元形状情報は、頂点と接続により前記3Dオブジェクトの３次元形状を示すメッシュと、前記メッシュの表面に適用されるテクスチャとを含み、
　前記スコアリング処理部は、前記メッシュのポリゴン毎に前記スコアリング結果を生成する
　請求項１８に記載の情報処理装置。
　3Dオブジェクトを撮像した第１の撮像により生成された第１の撮像画像に基づいて、前記3Dオブジェクトの３次元形状を表現する第１の３次元形状情報を生成し、
　前記第１の３次元形状情報を用いて、これまでに行われた第２の撮像により生成された第２の撮像画像を用いて生成可能な第２の３次元形状情報の精度を評価し、スコアリング結果を生成し、
　前記スコアリング結果に基づいて、前記3Dオブジェクトを撮像する前記第２の撮像のための案内情報を生成し、前記案内情報の出力を制御する
　情報処理方法。