JP7767111B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラムInfo
- Publication number
- JP7767111B2 JP7767111B2 JP2021177459A JP2021177459A JP7767111B2 JP 7767111 B2 JP7767111 B2 JP 7767111B2 JP 2021177459 A JP2021177459 A JP 2021177459A JP 2021177459 A JP2021177459 A JP 2021177459A JP 7767111 B2 JP7767111 B2 JP 7767111B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- ray
- camera
- image processing
- depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Processing (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
まず、図1を参照して、本発明の第1の実施形態におけるパーソナルコンピュータ(画像処理装置)について説明する。図1は、パーソナルコンピュータ(画像処理装置)100のブロック図である。なお本実施形態は、画像処理装置の例としてパーソナルコンピュータを説明するが、これに限定されるものではなく、パーソナルコンピュータ以外の画像処理装置にも適用可能である。
式(1)において、FΘはマルチ・レイヤー・パーセプトロンからなるニューラルネットワークであり、サンプリングされる光線上の点の三次元座標x、光線方向ベクトルdを入力とする。FΘは各サンプリング点に対して、RGBの色cと密度σを出力する。光線rに対するボリュームレンダリングはCvr(r)=ΣTi(1-exp(-σi・δi))ci,i=1~Nで表される。ここで、Nはサンプリング数、iはサンプリング点毎のインデックス番号、ciおよびσiはインデックスiに対応する色および密度、δi=t(i+1)-t(i)、t(i)はインデックスiに対応するカメラ主点から光線上のサンプリング点までの距離である。また、Ti=exp(-Σσj・δj)、j=1~i-1であり、これによりオクルージョンで遮蔽されたオブジェクト色の影響を除外している。
次に、本発明の第2の実施形態における画像処理装置について説明する。本実施形態において、取得手段は、更に周辺空間(背景被写体を含む空間)の周辺教師画像を取得し、学習パラメータ算出手段は、教師画像と周辺教師画像とを用いることで機械学習を行い、学習パラメータを算出する。なお、本実施形態における画像処理装置の構成は、図1を参照して第1の実施形態にて説明したパーソナルコンピュータ100の構成と同様である。また、図1の制御部101が実行する図2に示される3Dモデル学習の動作および図5の自由視点画像レンダリングの動作を説明するためのフローチャートも第1の実施形態と同様である。
次に、本発明の第3の実施形態における画像処理装置について説明する。図14は、パーソナルコンピュータ(画像処理装置)1400のブロック図である。本実施形態のパーソナルコンピュータ1400は、ニューラルネットワーク部1401を有する点で、第1の実施形態にて説明したニューラルネットワーク部107を有するパーソナルコンピュータ100と異なる。なお、パーソナルコンピュータ1400の他の構成は、パーソナルコンピュータ100と同様であるため、それらの説明は省略する。
式(2)において、FΘはマルチ・レイヤー・パーセプトロンからなるニューラルネットワークであり、サンプリングされる光線上の点の三次元座標x、光線方向ベクトルdに加え、時刻tのフレームにおける潜在コードztを入力とする。FΘは各サンプリング点に対して、RGBの色cと密度σを出力する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
105 撮影カメラ位置姿勢推定部(取得手段)
106 光線算出部(光線算出手段)
107 ニューラルネットワーク部(学習パラメータ算出手段、レンダリング手段)
108 自由カメラ位置姿勢取得部(取得手段)
Claims (20)
- 教師画像と、前記教師画像に対応するカメラの位置を取得する取得手段と、
前記カメラの前記位置を用いて前記教師画像の各画素に対応する光線を算出する光線算出手段と、
前記光線における点をサンプリングして前記教師画像を用いることで機械学習を行い、学習パラメータを算出する学習パラメータ算出手段とを有し、
前記教師画像の被写界深度の範囲内における前記光線のサンプリング密度は、前記被写界深度の範囲外の前記サンプリング密度よりも高いことを特徴とする画像処理装置。 - カメラの位置を取得する取得手段と、
前記カメラの前記位置を用いて前記カメラの各画素に対応する光線を算出する光線算出手段と、
学習パラメータ算出手段により前記光線における点をサンプリングして事前学習された学習パラメータを用いて、機械学習により前記カメラの画像をレンダリングするレンダリング手段とを有し、
前記事前学習で用いられた教師画像の被写界深度の範囲内における前記光線のサンプリング密度は、前記被写界深度の範囲外の前記サンプリング密度よりも高いことを特徴とする画像処理装置。 - 前記取得手段は、更に前記教師画像に対応する距離分布情報を取得し、
前記光線算出手段は、前記距離分布情報に基づいて、前記光線が前記教師画像の前記被写界深度の範囲内にあるか否かを判定することを特徴とする請求項1または2に記載の画像処理装置。 - 前記距離分布情報に基づいて、被写体表面が被写体合焦距離よりも手前にあるか奥にあるかが判定され、
前記被写体表面が前記被写体合焦距離よりも手前にあるか奥にあるかに関する判定結果に基づいて、前記サンプリング密度が変化することを特徴とする請求項3に記載の画像処理装置。 - 前記距離分布情報に基づいて、被写体表面までの距離が決定され、
前記被写体表面までの前記距離を基準として、前記サンプリング密度が決定されることを特徴とする請求項3または4に記載の画像処理装置。 - 前記距離分布情報は、前記教師画像よりも解像度が低いことを特徴とする請求項3乃至5のいずれか一項に記載の画像処理装置。
- 前記光線算出手段は、前記距離分布情報に基づいて被写体輪郭領域を特定し、前記被写体輪郭領域に対して、光線を選択しやすくし、サンプリング範囲を広範囲に設定することを特徴とする請求項3乃至6のいずれか一項に記載の画像処理装置。
- 前記光線算出手段は、前記距離分布情報に基づいて信頼性が低いと判定した領域に対して、全ての光線を選択し、サンプリング範囲を広範囲に設定することを特徴とする請求項3乃至7のいずれか一項に記載の画像処理装置。
- 前記取得手段は、前記カメラの光学系の歪曲成分に基づいて、前記教師画像および前記距離分布情報に対する処理を行うことを特徴とする請求項3乃至8のいずれか一項に記載の画像処理装置。
- 前記距離分布情報は、視差を表すシフト量に基づくマップ、デフォーカス量に基づくマップ、または距離に基づくマップの少なくとも一つを含むことを特徴とする請求項3乃至9のいずれか一項に記載の画像処理装置。
- 前記取得手段は、更に周辺空間の周辺教師画像を取得し、
前記学習パラメータ算出手段は、前記教師画像と前記周辺教師画像とを用いることで前記機械学習を行い、前記学習パラメータを算出することを特徴とする請求項1乃至10のいずれか一項に記載の画像処理装置。 - 前記周辺教師画像は、少なくともフォーカス位置、焦点距離、または絞り値のうち少なくとも一つにおいて、前記教師画像と異なる画像であることを特徴とする請求項11に記載の画像処理装置。
- 前記学習パラメータ算出手段は、前記教師画像と前記周辺教師画像とで異なる機械学習モデルを学習することを特徴とする請求項11または12に記載の画像処理装置。
- 前記教師画像は、所定のフレームレートで取得された動画であり、
前記学習パラメータ算出手段は、
前記動画のフレームごとに該フレームの特徴を示すコード特徴量を算出し、
前記動画のフレームごとに前記コード特徴量と前記教師画像とを用いることで機械学習を行い、前記学習パラメータを算出することを特徴とする請求項1乃至13のいずれか一項に記載の画像処理装置。 - 前記取得手段は、前記教師画像において時間的に変化する領域を取得し、
前記光線算出手段は、前記取得手段により取得された前記領域の光線を重点的に選択して、対応する光線を出力することを特徴とする請求項14に記載の画像処理装置。 - 前記教師画像は、フォーカス位置、焦点距離、または絞り値のうち少なくとも一つが異なるフレームを含むように取得された動画であることを特徴とする請求項14または15に記載の画像処理装置。
- 前記被写界深度を決定するための許容錯乱円径は、前記学習パラメータを用いたレンダリングの際の解像度に基づいて決定されることを特徴とする請求項1乃至16のいずれか一項に記載の画像処理装置。
- 教師画像と、前記教師画像に対応するカメラの位置を取得するステップと、
前記カメラの前記位置を用いて前記教師画像の各画素に対応する光線を算出するステップと、
前記光線における点をサンプリングして前記教師画像を用いることで機械学習を行い、学習パラメータを算出するステップとを有し、
前記教師画像の被写界深度の範囲内における前記光線のサンプリング密度は、前記被写界深度の範囲外の前記サンプリング密度よりも高いことを特徴とする画像処理方法。 - カメラの位置を取得するステップと、
前記カメラの前記位置を用いて前記カメラの各画素に対応する光線を算出するステップと、
学習パラメータ算出手段により前記光線における点をサンプリングして事前学習された学習パラメータを用いて、機械学習により前記カメラの画像をレンダリングするステップとを有し、
前記事前学習で用いられた教師画像の被写界深度の範囲内における前記光線のサンプリング密度は、前記被写界深度の範囲外の前記サンプリング密度よりも高いことを特徴とする画像処理方法。 - 請求項18または19に記載の画像処理方法をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021177459A JP7767111B2 (ja) | 2021-10-29 | 2021-10-29 | 画像処理装置、画像処理方法およびプログラム |
| JP2025182122A JP2026012300A (ja) | 2021-10-29 | 2025-10-28 | 画像処理装置、画像処理方法およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021177459A JP7767111B2 (ja) | 2021-10-29 | 2021-10-29 | 画像処理装置、画像処理方法およびプログラム |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2025182122A Division JP2026012300A (ja) | 2021-10-29 | 2025-10-28 | 画像処理装置、画像処理方法およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023066705A JP2023066705A (ja) | 2023-05-16 |
| JP7767111B2 true JP7767111B2 (ja) | 2025-11-11 |
Family
ID=86325919
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021177459A Active JP7767111B2 (ja) | 2021-10-29 | 2021-10-29 | 画像処理装置、画像処理方法およびプログラム |
| JP2025182122A Pending JP2026012300A (ja) | 2021-10-29 | 2025-10-28 | 画像処理装置、画像処理方法およびプログラム |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2025182122A Pending JP2026012300A (ja) | 2021-10-29 | 2025-10-28 | 画像処理装置、画像処理方法およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (2) | JP7767111B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024257645A1 (ja) * | 2023-06-13 | 2024-12-19 | 株式会社Preferred Networks | サーバ装置 |
| WO2025074795A1 (ja) * | 2023-10-03 | 2025-04-10 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、および、コンピュータ読み取り可能な非一時的記憶媒体 |
| JP2025135192A (ja) | 2024-03-05 | 2025-09-18 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020095717A (ja) | 2018-12-11 | 2020-06-18 | キヤノン株式会社 | 自由視点映像用画像データのキャプチャ方法、キャプチャシステム及びキャプチャ装置 |
| JP2021501946A (ja) | 2017-11-03 | 2021-01-21 | グーグル エルエルシーGoogle LLC | 単視点深度予測のための絞りの監視 |
-
2021
- 2021-10-29 JP JP2021177459A patent/JP7767111B2/ja active Active
-
2025
- 2025-10-28 JP JP2025182122A patent/JP2026012300A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021501946A (ja) | 2017-11-03 | 2021-01-21 | グーグル エルエルシーGoogle LLC | 単視点深度予測のための絞りの監視 |
| JP2020095717A (ja) | 2018-12-11 | 2020-06-18 | キヤノン株式会社 | 自由視点映像用画像データのキャプチャ方法、キャプチャシステム及びキャプチャ装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2026012300A (ja) | 2026-01-23 |
| JP2023066705A (ja) | 2023-05-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101643607B1 (ko) | 영상 데이터 생성 방법 및 장치 | |
| US9412151B2 (en) | Image processing apparatus and image processing method | |
| US7961970B1 (en) | Method and apparatus for using a virtual camera to dynamically refocus a digital image | |
| JP2026012300A (ja) | 画像処理装置、画像処理方法およびプログラム | |
| US8305485B2 (en) | Digital camera with coded aperture rangefinder | |
| JP6570327B2 (ja) | 制御装置、撮像装置、制御方法、プログラム、および、記憶媒体 | |
| US20190141247A1 (en) | Threshold determination in a ransac algorithm | |
| JP2013531268A (ja) | 符号化開口を使用した距離の測定 | |
| Takeda et al. | Fusing depth from defocus and stereo with coded apertures | |
| KR20220014678A (ko) | 영상의 깊이를 추정하는 방법 및 장치 | |
| KR20210089737A (ko) | 이미지 깊이 추정 방법 및 장치, 전자 기기, 저장 매체 | |
| CN112333379A (zh) | 图像对焦方法、装置及图像采集设备 | |
| JP7378219B2 (ja) | 撮像装置、画像処理装置、制御方法、及びプログラム | |
| US11967096B2 (en) | Methods and apparatuses of depth estimation from focus information | |
| Myles et al. | Recovering affine motion and defocus blur simultaneously | |
| Hach et al. | Cinematic bokeh rendering for real scenes | |
| Shen et al. | Dof-gaussian: Controllable depth-of-field for 3d gaussian splatting | |
| CN117058183A (zh) | 一种基于双摄像头的图像处理方法、装置、电子设备及存储介质 | |
| CN115205112B (zh) | 一种真实复杂场景图像超分辨率的模型训练方法及装置 | |
| JP6702755B2 (ja) | 画像処理装置、撮像装置、画像処理方法、プログラム | |
| CN112215879B (zh) | 一种光场极平面图像的深度提取方法 | |
| Liang et al. | The" Vertigo Effect" on Your Smartphone: Dolly Zoom via Single Shot View Synthesis | |
| JP6297965B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
| Chen et al. | Variable aperture bokeh rendering via customized focal plane guidance | |
| CN117528236B (zh) | 虚拟摄像机的调整方法和装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20241025 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250619 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250624 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250818 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250930 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251029 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7767111 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |