JP7836005B2 - 学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラム - Google Patents
学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラムInfo
- Publication number
- JP7836005B2 JP7836005B2 JP2024569919A JP2024569919A JP7836005B2 JP 7836005 B2 JP7836005 B2 JP 7836005B2 JP 2024569919 A JP2024569919 A JP 2024569919A JP 2024569919 A JP2024569919 A JP 2024569919A JP 7836005 B2 JP7836005 B2 JP 7836005B2
- Authority
- JP
- Japan
- Prior art keywords
- panoramic image
- model
- image
- processed
- internal space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
学習装置100は、構造物の内部空間を撮影したパノラマ画像から内部空間を三次元再構成するための推定モデルを学習する。図1に示すように学習装置100は、教師モデル用画像入力部11と、形状情報入力部12と、教師モデル推定部13と、生徒モデル用画像入力部14と、生徒モデル推定部15と、生徒モデル学習部16とを備える。学習装置100は、クラウドコンピューティングシステム又はその他のコンピューティングシステムに属するサーバなどのコンピュータである。
文献1:Yu, Z., et al. Multi-modal Factorized Bilinear Pooling with Co-attention Learning for Visual Question Answering, ICCV, 2017.
文献2:Yu, Z., et al. Deep Modular Co-Attention Networks for Visual Question Answering, CVPR, 2019.
文献3:Ben-younes, H., et al. MUTAN: Multimodal Tucker Fusion for Visual Question Answering, ICCV, 2017.
文献4:Ashish, V., et al. Attention Is All You Need, CL, 2017.
三次元再構成装置300は、構造物の内部空間を撮影したパノラマ画像D1から内部空間を三次元再構成する。三次元再構成装置300は、クラウドコンピューティングシステム又はその他のコンピューティングシステムに属するサーバなどのコンピュータである。
ここで、本実施形態に係る学習装置100の動作について、図5を参照して説明する。図5は、本実施形態に係る学習装置100の動作の一例を示すフローチャートである。図5を参照して説明する学習装置100の動作は、本実施形態に係る、構造物の内部空間を撮影したパノラマ画像D1から内部空間を三次元再構成するための推定モデルを学習する学習装置100が実行する方法の一例に相当する。
ここで、本実施形態に係る三次元再構成装置300の動作について、図6を参照して説明する。図6は、本実施形態に係る三次元再構成装置300の動作の一例を示すフローチャートである。図6を参照して説明する三次元再構成装置300の動作は、本実施形態に係る、構造物の内部空間を撮影したパノラマ画像D1から内部空間を三次元再構成するための三次元再構成装置300が実行する方法の一例に相当する。
上述した学習装置100及び三次元再構成装置300は、コンピュータによって実現することができる。また、学習装置100及び三次元再構成装置300としてそれぞれ機能させるためのプログラムが提供されてもよい。また、該プログラムは、記憶媒体に記憶されてもよいし、ネットワークを通して提供されてもよい。図7は、学習装置100として機能するコンピュータ401の概略構成を示すブロック図である。三次元再構成装置300として機能するコンピュータも同様である。ここで、コンピュータ401は、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
[付記項1]
構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成するための推定モデルを学習する学習装置であって、
コントローラを備え、前記コントローラは、
前記パノラマ画像と、前記内部空間の形状を示す形状情報とが入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する教師モデルを用いて、前記パノラマ画像から抽出された画像特徴量と、前記形状情報から抽出された形状特徴量とが入力されると前記処理済み特徴量を出力し、
前記パノラマ画像が入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する生徒モデルを用いて、前記パノラマ画像から抽出された画像特徴量が入力されると前記処理済み特徴量を出力し、
前記教師モデルを用いて出力された処理済み特徴量の分布と、前記生徒モデルを用いて出力された処理済み特徴量の分布との差分を示す損失を算出し、前記損失が検証用データで最小値をとるように生徒モデルを前記推定モデルとして学習する、学習装置。
[付記項2]
構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成する三次元再構成装置であって、
前記パノラマ画像の入力を受け付ける入力インターフェースと、コントローラとを備え、
前記コントローラは、
付記項1に記載の学習装置によって学習された推定モデルに、前記パノラマ画像を入力し、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力させ、
前記特徴量ベクトルに基づいて、前記隅角部を構成する点の三次元座標を計算し、
前記三次元座標に基づいて前記内部空間を三次元再構成する、三次元再構成装置。
[付記項3]
構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成するための推定モデルを学習する学習装置が実行する学習方法であって、
前記パノラマ画像と、前記内部空間の形状を示す形状情報とが入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する教師モデルを用いて、前記パノラマ画像から抽出された画像特徴量と、前記形状情報から抽出された形状特徴量とが入力されると前記処理済み特徴量を出力し、
前記パノラマ画像が入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する生徒モデルを用いて、前記パノラマ画像から抽出された画像特徴量が入力されると前記処理済み特徴量を出力し、
前記教師モデルを用いて出力された処理済み特徴量の分布と、前記生徒モデルを用いて出力された処理済み特徴量の分布との差分を示す損失を算出し、前記損失が検証用データで最小値をとるように生徒モデルを前記推定モデルとして学習する、学習方法。
[付記項4]
構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成する三次元再構成装置が実行する三次元再構成方法であって、
前記パノラマ画像の入力を受け付け、
付記項3に記載の学習方法によって学習された推定モデルに、前記パノラマ画像を入力し、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力させ、
前記特徴量ベクトルに基づいて、前記隅角部を構成する点の三次元座標を計算し、
前記三次元座標に基づいて前記内部空間を三次元再構成する、三次元再構成方法。
[付記項5]
コンピュータを、付記項1に記載の学習装置として動作させるためのプログラムを記憶した非一時的なコンピュータ読取り可能な媒体。
[付記項6]
コンピュータを、付記項2に記載の三次元再構成装置として動作させるためのプログラムを記憶した非一時的なコンピュータ読取り可能な媒体。
12 形状情報入力部
13 教師モデル推定部
14 生徒モデル用画像入力部
15 生徒モデル推定部
16 生徒モデル学習部
31 生徒モデル記憶部
32 画像入力部
33 推定部
34 三次元座標計算部
35 後処理部
100 学習装置
131 教師モデル用画像特徴量抽出器
132 形状特徴量抽出器
133 教師モデル用特徴量処理器
134 教師モデル用特徴量復号器
151 生徒モデル用画像特徴量抽出器
152 生徒モデル用特徴量処理器
153 生徒モデル用特徴量復号器
300 三次元再構成装置
401 コンピュータ
410 プロセッサ
420 ROM
430 RAM
440 ストレージ
450 入力部
460 出力部
470 通信インターフェース
480 バス
Claims (6)
- 構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成するための推定モデルを学習する学習装置であって、
前記パノラマ画像と、前記内部空間の形状を示す形状情報とが入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する教師モデルを用いて、前記パノラマ画像から抽出された画像特徴量と、前記形状情報から抽出された形状特徴量とが入力されると前記処理済み特徴量を出力する教師モデル推定部と、
前記パノラマ画像が入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する生徒モデルを用いて、前記パノラマ画像から抽出された画像特徴量が入力されると前記処理済み特徴量を出力する生徒モデル推定部と、
前記教師モデルを用いて出力された処理済み特徴量の分布と、前記生徒モデルを用いて出力された処理済み特徴量の分布との差分を示す損失を算出し、前記損失が検証用データで最小値をとるように生徒モデルを前記推定モデルとして学習する生徒モデル学習部と、
を備える学習装置。 - 構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成する三次元再構成装置であって、
前記パノラマ画像の入力を受け付ける画像入力部と、
請求項1に記載の学習装置によって学習された推定モデルに、前記パノラマ画像を入力し、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力させる推定部と、
前記特徴量ベクトルに基づいて、前記隅角部を構成する点の三次元座標を計算する三次元座標計算部と、
前記三次元座標に基づいて前記内部空間を三次元再構成する後処理部と、
を備える、三次元再構成装置。 - 構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成するための推定モデルを学習する学習装置が実行する学習方法であって、
前記パノラマ画像と、前記内部空間の形状を示す形状情報とが入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する教師モデルを用いて、前記パノラマ画像から抽出された画像特徴量と、前記形状情報から抽出された形状特徴量とが入力されると前記処理済み特徴量を出力するステップと、
前記パノラマ画像が入力されると前記内部空間を画定する面の相関に関する特徴を示す処理済み特徴量を出力し、該処理済み特徴量を復号して、前記パノラマ画像における、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力する生徒モデルを用いて、前記パノラマ画像から抽出された画像特徴量が入力されると前記処理済み特徴量を出力するステップと、
前記教師モデルを用いて出力された処理済み特徴量の分布と、前記生徒モデルを用いて出力された処理済み特徴量の分布との差分を示す損失を算出し、前記損失が検証用データで最小値をとるように生徒モデルを前記推定モデルとして学習するステップと、
を含む学習方法。 - 構造物の内部空間を撮影したパノラマ画像から前記内部空間を三次元再構成する三次元再構成装置が実行する三次元再構成方法であって、
前記パノラマ画像の入力を受け付けるステップと、
請求項3に記載の学習方法によって学習された推定モデルに、前記パノラマ画像を入力し、前記内部空間を画定する面の隅角部の位置を示す特徴量ベクトルを出力させるステップと、
前記特徴量ベクトルに基づいて、前記隅角部を構成する点の三次元座標を計算するステップと、
前記三次元座標に基づいて前記内部空間を三次元再構成するステップと、
を含む、三次元再構成方法。 - コンピュータを、請求項1に記載の学習装置として動作させるためのプログラム。
- コンピュータを、請求項2に記載の三次元再構成装置として動作させるためのプログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2023/000479 WO2024150339A1 (ja) | 2023-01-11 | 2023-01-11 | 学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2024150339A1 JPWO2024150339A1 (ja) | 2024-07-18 |
| JP7836005B2 true JP7836005B2 (ja) | 2026-03-26 |
Family
ID=91896539
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024569919A Active JP7836005B2 (ja) | 2023-01-11 | 2023-01-11 | 学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7836005B2 (ja) |
| WO (1) | WO2024150339A1 (ja) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111080804A (zh) | 2019-10-23 | 2020-04-28 | 贝壳技术有限公司 | 三维图像生成方法及装置 |
| CN112712052A (zh) | 2021-01-13 | 2021-04-27 | 安徽水天信息科技有限公司 | 一种机场全景视频中微弱目标的检测识别方法 |
-
2023
- 2023-01-11 WO PCT/JP2023/000479 patent/WO2024150339A1/ja not_active Ceased
- 2023-01-11 JP JP2024569919A patent/JP7836005B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111080804A (zh) | 2019-10-23 | 2020-04-28 | 贝壳技术有限公司 | 三维图像生成方法及装置 |
| CN112712052A (zh) | 2021-01-13 | 2021-04-27 | 安徽水天信息科技有限公司 | 一种机场全景视频中微弱目标的检测识别方法 |
Non-Patent Citations (1)
| Title |
|---|
| Zhang Cheng et al.,"DeepPanoContext: Panoramic 3D Scene Understanding with Holistic Scene Context Graph and Relation-based Optimization",2021 IEEE/CVF International Conference on Computer Vision (ICCV)[online],IEEE,2021年,p.12612-12621,[検索日 2025.12.4], インターネット:<URL:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9710102>,DOI: 10.1109/ICCV48922.2021.01240 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2024150339A1 (ja) | 2024-07-18 |
| WO2024150339A1 (ja) | 2024-07-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112819947B (zh) | 三维人脸的重建方法、装置、电子设备以及存储介质 | |
| US11651533B2 (en) | Method and apparatus for generating a floor plan | |
| EP3454302B1 (en) | Approximating mesh deformation for character rigs | |
| US8169438B1 (en) | Temporally coherent hair deformation | |
| CN111161336B (zh) | 三维重建方法、三维重建装置和计算机可读存储介质 | |
| JP6863596B2 (ja) | データ処理装置及びデータ処理方法 | |
| JP7518196B2 (ja) | 3dジオメトリを構築するための方法、装置及びプログラム | |
| US20120306874A1 (en) | Method and system for single view image 3 d face synthesis | |
| WO2017092251A1 (zh) | 实时虚拟场景中圆柱碰撞体与凸体碰撞探测的方法、终端和存储介质 | |
| CN109754464B (zh) | 用于生成信息的方法和装置 | |
| US20250356586A1 (en) | Multimodal conditional 3d shape geometry generation | |
| CN111161138A (zh) | 用于二维全景图像的目标检测方法、装置、设备、介质 | |
| CN111091117B (zh) | 用于二维全景图像的目标检测方法、装置、设备、介质 | |
| US11741678B2 (en) | Virtual object construction method, apparatus and storage medium | |
| JP7836005B2 (ja) | 学習装置、三次元再構成装置、学習方法、三次元再構成方法、及びプログラム | |
| JP7573385B2 (ja) | 設計支援装置 | |
| CN114972587A (zh) | 表情驱动方法、装置、电子设备及可读存储介质 | |
| CN113344770A (zh) | 虚拟模型及其构建方法、交互方法以及电子设备 | |
| JP6967150B2 (ja) | 学習装置、画像生成装置、学習方法、画像生成方法及びプログラム | |
| CN112381929A (zh) | 一种三维电力设备模型建模方法 | |
| JP7626958B2 (ja) | 3次元再構成装置、3次元再構成方法、及びプログラム | |
| CN115775300B (zh) | 人体模型的重建方法、人体重建模型的训练方法及装置 | |
| CN112785494B (zh) | 一种三维模型构建方法、装置、电子设备和存储介质 | |
| CN112464696A (zh) | 图像处理方法、装置、设备及存储介质 | |
| KR102568699B1 (ko) | 360도 파노라마 실내 영상으로부터 생성된 포인트 클라우드의 바닥면을 고려한 후처리 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250325 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20251216 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20260121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260210 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260223 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7836005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |