JP2025002994A - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP2025002994A
JP2025002994A JP2023103415A JP2023103415A JP2025002994A JP 2025002994 A JP2025002994 A JP 2025002994A JP 2023103415 A JP2023103415 A JP 2023103415A JP 2023103415 A JP2023103415 A JP 2023103415A JP 2025002994 A JP2025002994 A JP 2025002994A
Authority
JP
Japan
Prior art keywords
subject
interest
virtual viewpoint
unit
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2023103415A
Other languages
English (en)
Other versions
JP7661405B2 (ja
Inventor
和文 小沼
Kazufumi Konuma
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2023103415A priority Critical patent/JP7661405B2/ja
Priority to US18/749,402 priority patent/US20240428455A1/en
Publication of JP2025002994A publication Critical patent/JP2025002994A/ja
Priority to JP2025061295A priority patent/JP2025096363A/ja
Application granted granted Critical
Publication of JP7661405B2 publication Critical patent/JP7661405B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20101Interactive definition of point of interest, landmark or seed
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30221Sports video; Sports image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 シーンに適した仮想視点を設定できるようにする。【解決手段】 情報処理装置は、複数の撮像装置により撮像される撮像領域に含まれる被写体の位置を示す位置情報を取得する取得手段と、前記被写体の移動方向に基づいて、複数の関心位置のうち1つの関心位置を特定する特定手段と、前記特定手段により特定された前記関心位置と前記被写体の位置とに基づいて、前記被写体に関連する仮想視点画像に対応する仮想視点の位置と、前記仮想視点からの視線方向を決定する決定手段とを有する。【選択図】 図1

Description

本開示は、仮想視点画像を生成する画像処理装置に関する。
複数のカメラを異なる位置に設置して同期撮影し、撮影により得られた複数の画像を用いて、ユーザ操作に基づく任意の仮想カメラ(仮想視点)からの画像(仮想視点画像)を生成する技術が注目されている。このような技術によれば、例えば、サッカーやバスケットボールのハイライトシーンを様々な角度から視聴することが可能となり、通常の画像と比較してユーザに高い臨場感を与えることができる。
仮想視点の操作を容易にするため、特許文献1では、注目する第一被写体の位置情報と、合わせて仮想視点画像に収めたい第二の被写体の位置情報に基づき仮想視点の位置及び向きを決定する手法が記載されている。
特開2022-171436号公報
しかしながら、複雑な動きを行う被写体の仮想視点画像を生成する場合、シーンに適した仮想視点を決定できなかった。例えば、バスケットボールにおいて、ある選手に着目した仮想視点画像を生成したい場合、頻繁に攻守が切り替わるため、シーンの変化に伴い適切な仮想視点の位置が変化し、シーンに適した仮想視点の位置および仮想視点からの視線方向を設定できなかった。
本開示は、シーンに適した仮想視点を設定できるようにすることを目的とする。
本開示による情報処理装置は、以下の構成を有する。すなわち、複数の撮像装置により撮像される撮像領域に含まれる被写体の位置を示す位置情報を取得する取得手段と、前記被写体の移動方向に基づいて、複数の関心位置のうち1つの関心位置を特定する特定手段と、前記特定手段により特定された前記関心位置と前記被写体の位置とに基づいて、前記被写体に関連する仮想視点画像に対応する仮想視点の位置と前記仮想視点からの視線方向を決定する決定手段とを有する。
本開示によれば、シーンに適した仮想視点を設定できる。
実施形態1における画像処理システムの構成の一例を示すブロック図である。 実施形態1における被写体位置の追跡処理を説明するための図である。 実施形態1における被写体位置に識別子を付与する処理を説明するための図である。 実施形態1における被写体の代表位置の一例を示す図である。 実施形態1における追跡部106が被写体の位置を追跡する処理を示すフローチャートである。 実施形態1における関心対象決定部110が関心対象を決定する処理を示すフローチャート。 実施形態1における各被写体の速度ベクトルと平均速度ベクトルの一例を示す図である。 実施形態1における視点生成部109が生成する仮想視点の位置の一例である。 実施形態2における関心対象決定部110が関心対象を決定する処理を示すフローチャート。 実施形態2における関心対象と判定領域の一例を示す図である。 実施形態2における被写体と関心対象と仮想視点の動きの一例を示す図である。 情報処理装置3のハードウェア構成例を示すブロック図である。
<実施形態1>
(画像処理装置のシステム構成と動作)
画像処理システムは、複数の撮像装置による撮像に基づく複数の画像と、指定された仮想視点とに基づいて、指定された仮想視点からの光景を表す仮想視点画像を生成するシステムである。本実施形態における仮想視点画像は、自由視点映像とも呼ばれるものであるが、ユーザが自由に(任意に)指定した視点に対応する画像に限定されず、例えば複数の候補からユーザが選択した視点に対応する画像なども仮想視点画像に含まれる。また、本実施形態では仮想視点画像が動画である場合を中心に説明するが、仮想視点画像は静止画であってもよい。
仮想視点画像の生成に用いられる視点情報は、仮想視点の位置及び向き(視線方向)を示す情報である。具体的には、視点情報は、仮想視点の三次元位置を表すパラメータと、パン、チルト、及びロール方向における仮想視点の向きを表すパラメータとを含む、パラメータセットである。なお、視点情報の内容は上記に限定されない。例えば、視点情報としてのパラメータセットには、仮想視点の視野の大きさ(画角)を表すパラメータが含まれてもよい。また、視点情報は複数のパラメータセットを有していてもよい。例えば、視点情報が、仮想視点画像の動画を構成する複数のフレームにそれぞれ対応する複数のパラメータセットを有し、連続する複数の時点それぞれにおける仮想視点の位置及び向きを示す情報であってもよい。
画像処理システムは、撮像領域を複数の方向から撮像する複数の撮像装置を有する。撮像領域は、例えばサッカーや空手などの競技が行われる競技場、もしくはコンサートや演劇が行われる舞台などである。複数の撮像装置は、このような撮像領域を取り囲むようにそれぞれ異なる位置に設置され、同期して撮像を行う。なお、複数の撮像装置は撮像領域の全周にわたって設置されていなくてもよく、設置場所の制限等によっては撮像領域の周囲の一部にのみ設置されていてもよい。また、撮像装置の数は図に示す例に限定されず、例えば撮像領域をサッカーの競技場とする場合には、競技場の周囲に30台程度の撮像装置が設置されてもよい。また、望遠カメラと広角カメラなど機能が異なる撮像装置が設置されていてもよい。
なお、本実施形態における複数の撮像装置は、それぞれが独立した筐体を有し単一の視点で撮像可能なカメラであるものとする。ただしこれに限らず、2以上の撮像装置が同一の筐体内に構成されていてもよい。例えば、複数のレンズ群と複数のセンサを備えており複数視点から撮像可能な単体のカメラが、複数の撮像装置として設置されていてもよい。
図1は、実施形態1における画像処理システムの構成を示すブロック図である。画像処理システムは例えば撮像部101、同期部102、三次元形状推定部103、形状抽出部104、識別設定部105、追跡部106、被写体位置算出部107、記憶部108、視点生成部109、関心対象決定部110、時刻指示部111を有する。さらに、画像処理システムは、画像生成部112および表示部113を有する。なお、本実施形態では、形状抽出部104、識別設定部105、追跡部106、被写体位置算出部107をまとめて被写体位置検出部114と呼称する。また、画像処理システムは、1つの画像処理装置によって構成されてもよいし、複数の画像処理装置によって構成されるシステムでもよい。例えば、視点生成部109、関心対象決定部110、時刻指示部111、被写体位置検出部114を画像処理装置と異なる1つの情報処理装置が有していてもよいし、記憶部108が専用のサーバ装置により構成されていてもよい。以下の説明では、画像処理システムは、1つの画像処理装置であるとして説明する。
撮像部101は、同期部102による同期信号に基づいて互いに同期して撮像を行う。そして撮像部101は撮影した撮像画像を三次元形状推定部103に出力する。なお、撮像部101は、被写体を複数の方向から撮影するために被写体を含む撮影領域を囲むように設置される。
同期部102は、複数の撮像部101に同期信号を出力する。
三次元形状推定部103は、入力された複数視点からの撮像画像を用いて、被写体のシルエット画像を生成する。さらに、視体積交差法などを用いて被写体の3Dモデル(3Dモデル)を生成する。また三次元形状推定部103は生成した被写体の3Dモデルおよび撮像画像を記憶部108と形状抽出部104に出力する。ここで、被写体は3Dモデルの生成対象となる物体のことであり、人物や人物が扱う物品などを含む。
形状抽出部104は、三次元形状推定部103から取得した被写体の3Dモデルの一部を抽出する。被写体の3Dモデルの一部を抽出することにより、複数の被写体の3Dモデルが存在する場合に、被写体同士の接触や隣接によってそれぞれの被写体の識別ができなくなる可能性を低減することができる。さらに、形状抽出部104は、抽出した被写体の3Dモデルを1方向から投影した二次元画像を生成する。本実施形態では、床面に対して垂直な方向から投影した二次元画像を生成する。そして、生成した二次元画像から被写体の3Dモデルの抽出情報を抽出し、追跡部106および識別設定部105に送信する。
識別設定部105は、形状抽出部104から取得した抽出情報に対し識別子を付与する。各抽出形状に付与した識別子を追跡部106に送信する。
追跡部106は、識別設定部105から識別子を入力されたことに応じて、初期状態として各抽出形状に当該識別子を付与する。以後、追跡部106は、この識別子が付与された抽出形状の追跡を行う。追跡した各抽出形状と識別子を被写体位置算出部107に送信する。
被写体位置算出部107は、追跡部106から取得する各抽出形状と識別子を用いて、各被写体の代表位置(被写体の位置)を算出する。算出した被写体の代表位置は、記憶部108に送信される。
記憶部108は、仮想視点画像の生成に用いられるデータ(仮想視点素材データ)として以下のデータ群を保存し、記憶する。本実施形態において仮想視点画像の生成に用いられるデータは、具体的には、三次元形状推定部103から入力された被写体の3Dモデルおよび撮像画像である。また、仮想視点画像の生成に用いられるデータは、各撮像部の位置姿勢及び光学特性などのカメラパラメータ、および、被写体位置検出部114で取得した被写体位置情報を含む。なお、仮想視点画像の背景の生成に用いられるデータとして、あらかじめ背景の3Dモデルと背景テクスチャ画像が記憶部108に保存(記憶)されているものとする。さらに、記憶部108に記憶される3Dモデルは、それぞれ種類が対応付けられ記憶される。ここで種類とは、撮像対象ごとに設定され、例えば、バスケットボールの場合、選手やボール、審判員などである。なお、各3Dモデルの種類は、ユーザによって指定されてもよいし、予め設定した条件に応じて自動的に設定されてもよい。また、記憶部108は、後述する関心対象候補を記憶する。関心対象候補は、背景モデルであってもよいし、三次元空間上の特定の三次元座標(関心位置)であってもよい。関心対象候補は、予めユーザによって設定されているものとして以降では説明するが、装置が自動で設定してもよい。装置が自動で設定する関心対象候補は、例えば、複数の撮像地による撮像領域の中心位置やその中心位置にある被写体であってもよいし、撮像領域とその他の領域との境界領域の位置やその位置にある被写体であってもよい。本実施形態では、関心対象候補は背景モデルであるものとして説明する。背景モデルは、例えばバスケットボールのゴールやサッカーのゴール、陸上競技のゴールラインである。
視点生成部109は、被写体位置検出部114が検出した被写体位置情報と、関心対象決定部110が出力する関心対象の位置情報に基づき仮想視点を生成する。具体的には、図8に示すように、視点生成部109は、ユーザが指定した被写体の位置を中心に、その被写体と関心対象である背景モデルの重心位置を結ぶ直線から所定の回転角度θで回転させた方向で、被写体から所定距離離れた位置に仮想視点の位置を設定する。そして、視点生成部109は、被写体と背景モデルとが、この仮想視点(仮想カメラ)の視野に含まれるように、仮想視点からの視線方向や画角を設定する。そして、視点生成部109は、それらの仮想視点の位置や仮想視点からの視線方向や仮想視点の画角などのパラメータを示す仮想視点情報を生成し、仮想視点情報を画像生成部112に出力する。なお、仮想カメラの位置は、ユーザが指定した被写体の位置と関心対象である背景モデルの重心位置を結ぶ直線上に設定されてもよい。また、回転角度θは、ユーザが設定してもよい。また視点生成部109は図示しないジョイスティックや操作ボタンなどの物理的なユーザインターフェースである視点操作部と、仮想視点画像を表示するための表示部を備える。視点操作部により仮想視点画像に含む被写体と仮想視点との距離や、仮想視点からの向きおよび、仮想視点の高さなど、仮想視点情報を生成のためのパラメータを設定できる。このパラメータの変更に応じて、後述の画像生成部112によって随時仮想視点画像が更新され、表示部に表示される。この表示部は後述の表示部113を共用してもよいし、別途表示装置を備える形としてもよい。視点生成部109が出力する仮想視点情報とは、仮想視点の位置および向きなどのカメラの外部パラメータに相当する情報、焦点距離や画角といったカメラの内部パラメータに相当する情報、および再生する撮影時刻を指定する時刻情報を含む。
関心対象決定部110は、後述する関心対象決定処理に基づき、あらかじめ設定された複数の関心対象候補の中から一つを関心対象と決定し、視点生成部109へ出力する。
時刻指示部111は後述の画像生成部112で生成したい仮想視点画像の時刻を指示するための時刻情報を生成し、視点生成部109および関心対象決定部110に出力する。時刻指示部111は図示しない複数のボタンやジョグダイヤルなどの物理的なユーザインターフェースまたは、GUIの少なくともいずれか一つのユーザインターフェースを備え、ユーザ操作により映像を生成する時刻を変更することが可能である。
画像生成部112は、入力された仮想視点情報に含まれる時刻情報に基づき、記憶部108から当該撮影時刻の素材データを取得する。画像生成部112は取得した素材データのうち被写体の3Dモデルおよび撮像画像を用いて、設定された仮想視点における仮想視点画像を生成し表示部113に出力する。
表示部113は、画像生成部112から入力された映像を表示する表示手段である。表示部113は、ディスプレイまたは、ヘッドマウントディスプレイ(HMD)などで構成される。
(被写体位置の追跡方法)
次に本実施形態における被写体の三次元位置の追跡方法に関して説明する。
まず、三次元形状推定部103が、被写体の3Dモデルを生成し、生成された3Dモデルを記憶部108に出力するとともに、生成された3Dモデルを形状抽出部104に出力する。
図2は、実施形態1における被写体位置の追跡処理を説明するための図である。形状抽出部104は、図2(a)に示すような被写体の3Dモデルのうち、図2(b)に示すように被写体の3Dモデルの下部を切り出す。本実施形態においては被写体の3Dモデルの外接直方体の底面から所定の高さ(例えば50cmに相当する高さ)までを切り出すものとする。例えば図2(c)に示すように、被写体の一人が立っており、被写体の一人が跳躍などして撮影領域の床面から離れている場合には、被写体の3Dモデルは図2(d)の示す範囲のように3Dモデルが切り出される。すなわち、どちらの被写体の3Dモデルも、足元に相当する部分から所定の高さまでの3Dモデルが切り出される。なお、3Dモデルから切り出す領域は3Dモデルの下部に限定されない。例えば、被写体の3Dモデルの中部(例えば、3Dモデルの外接直方体の底面から50cmから100cmの領域)を切り出してもよい。
次に図2(e)に示すように、形状抽出部104は、切り出した3Dモデルを床面に投影して二次元画像を生成する。本実施形態では、投影された画像は、切り出した3Dモデルの部分を白、それ以外の部分を黒とする二値画像とする。形状抽出部104は、この二次元画像を独立した領域ごとに分割しそれらの図2(e)に示す外接矩形201~204を求める。形状抽出部104は、この外接矩形の頂点情報を抽出された3Dモデルの抽出形状として出力する。具体的には、形状抽出部104は、外接矩形の頂点情報を、撮影領域の三次元空間と同じ座標系および単位に変換したうえで出力する。また、形状抽出部104で独立した形状の判定には、投影された二次元画像に対して例えば連続成分分析などの手法が用いられる。このような手法を用いることで、形状抽出部104は、3Dモデルを一つ一つの領域に分割することができる。
図3は、実施形態1における被写体位置に識別子を付与する処理を説明するための図である。識別設定部105は、形状抽出部104が出力した抽出形状に対して識別子を付与する。具体的には、識別設定部105は、各抽出形状間の距離の計算を行い、抽出形状間の距離に応じて識別子を付与する。例えば、図3(a)に示すように、識別設定部105は、抽出形状間の距離が所定の距離未満(実線矢印)の抽出形状には同一の識別子を割り当て、抽出形状間の距離が所定の距離以上(破線矢印)のものには異なる識別子を割り当てる。判定の基準として用いられる所定の距離の閾値は被写体が立った状態の足の開き幅に相当するような距離が望ましい。本実施形態では、所定の距離の閾値は50cmとして設定されるものとして説明する。
識別設定部105は、割り当てた識別子を、識別設定部105に備えられた表示部上に図3(b)に示すようなグラフィカルユーザインターフェース(GUI)によって表示する。ユーザは、このGUIを見ながら画像処理システムを操作する。具体的には、識別設定部105は、GUI上で現在の識別子の割り当て(初期状態の識別子の割り当て)を、文字および色分けの少なくとも一方で区別して表示する。図3(b)では、識別設定部105は、識別子ごとに文字および色分けの両方を行って表示している。ユーザはGUIを確認し、初期状態として所望の識別子の割り当てになっているか否かを確認する。所望の識別子の割り当てとなっていない場合は、ユーザは被写体に対して立ち位置の変更や足を閉じてもらうなどの指示をし、所望の割り当てとなるまで繰り返す。または、ユーザはGUIを介して画像処理システムを操作し、所望の識別子の割り当てとなるように変更指示を行う。所望の識別子の割り当てである場合、ユーザは、例えば図3(b)に示すようなグラフィカルユーザインターフェース上の決定ボタン(初期識別子決定ボタン)を押下する。この操作に応じて、識別設定部105は、初期状態の識別子を決定する。さらに、初期状態の識別子に対し、各被写体の種類を設定してもよい。この種類は撮像対象(例えば、野球やライブなど)ごとに設定されることを想定しており、本実施形態では、バスケットボールを想定し、各被写体に選手または審判員、ボールの何れかの種類を設定する。この種類はユーザ入力により設定されることを想定しているが、これに限定されない。例えば、初期状態において、所定の距離内に他の抽出形状が存在しない抽出形状に対応する被写体はボールと設定するような条件を予め設定し、識別子の決定と同時に種類が設定されてもよい。そして、識別設定部105は、各抽出形状に対して決定した識別子と種類を示す情報を追跡部106に出力する。
追跡部106は、識別設定部105から識別子を入力されたことに応じて、初期状態として各抽出形状に当該識別子を付与する。以後、追跡部106は、この識別子が付与された抽出形状の追跡を行う。なお、追跡中に抽出形状に付与される識別子は、識別設定部105によって決定された識別子ではなく、追跡部106による各抽出形状の位置の追跡結果に基づき決定された識別子が用いられる。抽出形状の追跡では、追跡部106は、当該抽出形状の撮影時刻に対してひとつ前の時刻における各抽出形状の位置、各抽出形状の識別子、および後述する被写体位置算出部から入力される被写体位置の情報に基づき、抽出形状の追跡を行う。なお、追跡部106による追跡の具体的な処理に関しては後述する。追跡部106は、追跡の結果に基づき当該時刻における、各抽出形状に対して識別子を付与し、各抽出形状を被写体位置算出部107に出力する。
図4は、実施形態1における被写体の代表位置を示す図である。被写体位置算出部107は、追跡部106より取得した識別子の付与された各抽出形状に対して、代表位置を求める。例えば、図4に示すように、被写体位置算出部107は、代表位置401、代表位置402のように、同一識別子が付与された抽出形状群ごとに、各抽出形状群を示す位置を求める。本実施形態では、代表位置は抽出形状群の中心位置とする。
ただし、この代表位置は形状推定誤差や形状抽出部104で形状を切り出した際の境界部分の揺らぎの影響を受けるため、被写体が静止していても各時刻で位置が揺らぐことがある。そのため、本実施形態では、被写体位置算出部107は、各時刻の中心位置情報に対して時間方向にローパスフィルタや移動平均などの処理を行い、高周波成分を抑制した位置情報を生成する。そして、被写体位置算出部107は、被写体の位置として識別子とともに代表位置の位置情報を追跡部106に出力する。また、被写体位置算出部107は、被写体の撮影された時刻の情報を代表位置の位置情報に付与した情報を、被写体の位置情報(被写体位置情報)として記憶部108に記録(記憶)する。
(追跡部106による追跡処理)
図5は、実施形態1における追跡部106が被写体の位置を追跡する処理を示すフローチャートである。
ステップS501では、追跡部106は、識別設定部105からの入力を受け各抽出形状の識別子および種類を取得する。
ステップS502では、追跡部106は、次に形状抽出部104から入力される抽出形状を取得する。
ステップS503では、追跡部106は、取得した各抽出形状に対して識別設定部105から取得した各識別子および種類を付与し、識別子および種類を付与した各抽出形状を、被写体位置算出部107に出力する。
ステップS504では、被写体位置算出部107は、同一識別子がつけられた抽出形状群から被写体位置を求め、被写体位置を追跡部106に出力する。
以上のステップS501~S504までの処理が初期化処理に相当する。
以降のステップS505~S509の処理は毎時刻の処理であり撮像部101が被写体を撮像している間は繰り返し実行される。撮像部101による被写体の撮像処理が終了した場合、ステップS509の処理が完了したことに応じて、本フローチャートの処理が終了される。
ステップS505では、追跡部106は、形状抽出部104から入力される抽出形状と、被写体位置算出部107が算出したひとつ前の時刻(前時刻)の被写体位置を取得する。ひとつ前の時刻は例えば、現在処理されている抽出形状の1フレーム前に生成された抽出形状の撮影時刻である。ここで、対比のために現在の時刻のことを現時刻とも記載する。ここで現在の時刻とは、現在処理されている抽出形状が生成されるために使われた画像の撮影時刻のことである。
ステップS506では、追跡部106は、前時刻における被写体位置と現時刻の各抽出形状の代表位置とが重なっている場合、抽出形状に対し、その代表位置と重なっている被写体位置に付与された識別子を付与する。ここで、ステップS506において、追跡部106は、一つの抽出形状の代表位置が複数の被写体位置と重なっている場合、当該抽出形状に対し、現時刻では「判定不能」を示す識別子を付与する。これは、例えば、2人の被写体が近接している状態のように、異なる識別子が付与された複数の抽出形状が現時刻で重畳している可能性があるため、本ステップの処理では「判定不能」を示す識別子を付与する。「判定不能」を示す識別子を含む識別子が付与された抽出形状は、後述のS509の処理が実行される。
ステップS507では、追跡部106は、まだ識別子が付与されていない抽出形状の代表位置が、前時刻の抽出形状と重なっている場合、前時刻の抽出形状に付与されている識別子を当該の現時刻の抽出形状に対して付与する。
ステップS508では、追跡部106は、まだ識別子が付与されていない抽出形状から所定の範囲内に、現時刻ですでに識別子が付与された他の抽出形状がある場合、当該の他の抽出形状に付与された識別子を、付与する。所定の範囲内は、被写体が立った状態の足の開き幅に相当する範囲が望ましい。例えば、所定の範囲は、抽出形状の中心から半径50cmの範囲である。ここで、ある抽出形状から所定の範囲内に識別子が付与された他の抽出形状が複数ある場合、追跡部106は、その他の抽出形状のうち最も近傍にある抽出形状の識別子を当該抽出形状に付与する。ステップS508までの処理を終えた段階で識別子を付与されていない抽出形状については、追跡部106は、当該の抽出形状を追跡対象外と判定する。この場合、追跡部106は、追跡対象外と判定された抽出形状は、被写体位置算出部107へ出力しない。
ステップS509では、追跡部106は、ステップS506からステップS508の処理で識別子が付与された抽出形状、およびそれに付与された識別子を被写体位置算出部107に出力する。
ステップS510では、不図示の制御部によって、撮像部101による被写体の撮像処理が終了されたか否かが判定される。撮像部101による被写体の撮像処理が終了されていないと判定された場合、ステップS508の処理が実行される。撮像部101による被写体の撮像処理が終了されたと判定された場合、本フローチャートの処理は終了される。
なお、ステップS506からステップS508の処理に関しては各処理において、抽出形状ごとに対して処理が行われる。ステップS506からステップS509の処理を繰り返すことで、識別設定部105で設定された識別子が各時刻の抽出形状と紐づけられる。この識別子を用いて、被写体位置算出部107は被写体ごとに区別して被写体位置を求めることができる。
また、追跡部106において識別子として、「判定不能」の識別子が抽出形状に付与された場合、ある時刻において、初期設定で定められた識別子のうち、一部の識別子が付与されない可能性がある。このような場合、被写体位置算出部107において、抽出形状に付与されていない識別子と同一の識別子である被写体位置情報は更新しない。これにより、複数の被写体が近づくなどにより抽出形状が重畳した場合でも、複数の被写体位置情報が同一の位置にならない。この場合、複数の被写体位置は、前時刻までのそれぞれの位置が維持される。その後、被写体同士が離れることにより、重畳した複数の抽出形状が再度分離した場合、それぞれの抽出形状に対して、もっとも最近の被写体位置に基づき識別子が割り当てされる。すなわち、複数の抽出形状の重畳が解消されたことに応じて、それぞれの被写体位置情報の更新が再開される。
以上の処理により、画像処理システムは、複数の被写体が撮影領域にいる場合でも、個々の被写体を追跡することや個々の被写体の位置情報を取得することができる。さらには、以上の処理により、画像処理システムは、被写体が近づいたり離れたりするなどして、生成された3Dモデルモデルに重畳や分離が発生する場合においても、個々の被写体を追跡することができる。
(関心対象決定処理)
図6は、実施形態1における関心対象決定部110が関心対象を決定する処理を示すフローチャートである。また、本実施形態では、バスケットボールの仮想視点画像の生成の際に関心対象を決定する例を説明する。このとき関心対象候補は両チームのバスケットゴールとし、予め記憶部108から関心対象候補の位置情報を取得しているものとする。なお、本処理は毎フレーム実施される。
図7は、本実施形態における各被写体の速度ベクトルと平均速度ベクトルを示す図である。図7(a)に示すように座標軸x、yを定め、コート中央を原点(0,0)とし、x軸上にバスケットゴールがあるものとする。
ステップS601では、関心対象決定部110は、被写体位置検出部114が検出し記憶部108に記録した被写体位置情報から、時刻指示部111より指示された時刻に基づいて被写体位置情報を取得する。このとき、指定された時刻の被写体位置情報のみではなく、その時刻の前後数フレーム~数十フレームの被写体位置情報を取得する。以降のS602からS605までは、各被写体について処理を行う。
ステップS602では、ある被写体が演算対象の被写体か否か判定する。具体的には、位置情報に含まれる被写体を識別するための識別子に対応する種類と、演算対象情報が合致するかに基づき、以後の処理を行うか否かの判定を行う。演算対象情報とは関心対象決定処理の演算対象を指定する情報であり、被写体の識別子に対応する種類を指定する情報となっている。例えば識別子に対応する種類が選手である被写体を演算対象とするといった演算対象情報を生成し、あらかじめ記憶部108ないしは、関心対象決定部110に記録しておく。その場合、種類が審判員およびボールとなっている被写体を演算対象から外すことで関心対象決定処理からは除外することができる。
ステップS603では、演算対象と判定された被写体の位置情報のフィルタ処理を行う。具体的にはS601で取得した複数フレーム分の位置情報を平均化した位置情報を算出する。これにより被写体位置検出部114の検出誤差によるブレを低減することができる。
ステップS604では、演算対象の被写体の時刻より過去の時刻、例えば1秒前の時刻およびその前後数フレーム~数十フレーム(所定の時間)の被写体位置情報を取得しその平均値を算出する。
ステップS605では、当該時刻の平均化処理後の位置情報から、過去の時刻の平均化後の位置情報を引いたうえで、当該時刻と過去の時刻の時間差、ここでは1秒間でその位置情報の差分を割ることで、当該時刻の単位時間の位置偏差(位置変化)を求める。この単位時間の位置偏差の大きさは移動速度であり、2次元平面上のベクトルの向きは被写体の移動方向となる。上記S602~S605の処理を各被写体に対して行う。全被写体に対して処理が完了した場合、S606に進む。
ステップS606では、得られた全演算対象の被写体の速度ベクトルの平均速度ベクトルを算出する。図7(b)には、算出された全演算対象の被写体の平均速度ベクトルを示している。本実施形態では、この平均速度ベクトルに含まれるゴール方向の成分を求める。具体的には、ゴールの方向はx軸の正負の方向なので、平均速度ベクトルを(1,0)のベクトルに正射影して得られたベクトルの向きと大きさを求める。
ステップS607では、S606で算出した平均速度ベクトルが関心対象決定条件を満たすか否か判定する。関心対象決定条件は、撮像対象ごとに異なることを想定している。本実施形態では、平均速度ベクトルをゴール方向に射影して得られたベクトルが関心対象決定条件を満たすか否か判定する。なお、関心対象が決まっていない初期状態の場合、関心対象決定条件を満たすか否かを寄らず、S608に進む。本実施形態では、関心対象決定条件は、平均速度ベクトルをゴール方向に射影して得られたベクトルの向きが現在の関心対象を向いているか、およびベクトルの大きさが所定の大きさより大きいか否かとする。現在の関心対象が決定されている場合、正射影したベクトルの向きと大きさに基づき関心対象変更の判定を行う。正射影したベクトルが正方向を向いており、所定の大きさ以上であり、なおかつ現在の関心対象がx軸正側ゴール71ではない場合、S608に進む。また、ベクトルが負方向を向いており、所定の大きさ以上であり、なおかつ現在注目しているゴールがx軸負側ゴール72ではない場合、S608に進む。双方いずれの条件にも当てはまらない場合は現在の関心対象のまま変更を行わずに、現在のフレームにおける関心対象を決定する処理を終了する。
ステップS608では、複数の関心対象候補のうち、平均速度ベクトルに基づいて1つの関心対象を決定する。なお、関心対象が決まっていない初期状態の場合、平均速度ベクトルの向きに直線を伸ばし、その直線に最も近い関心対象を特定する。また、その直線に最も近い関心対象が複数存在する場合、注目対象の被写体の位置に最も近い関心対象を特定する。あるいは、予めユーザ操作により関心対象の初期値が設定されていてもよい。本実施形態では、正射影したベクトルの向きと大きさに基づき関心対象変更の判定を行う。正射影したベクトルが正方向を向いており、所定の大きさ以上であり、なおかつ現在の関心対象がx軸正側ゴール71ではない場合、ゴール71を関心対象として決定(特定)する。また、ベクトルが負方向を向いており、所定の大きさ以上であり、なおかつ現在注目しているゴールがx軸負側ゴール72ではない場合、ゴール72を関心対象として決定する。
このようなS601~S608の処理を毎フレーム行うことで、全被写体の動きを検出して関心対象を決定する。関心対象決定部110はこの決定した、関心対象の情報を視点生成部109に出力する。
視点生成部109は前述のとおり、被写体と関心対象を結ぶ直線上から所定角度回転させた方向に、仮想視点を配置する。関心対象がゴール71からゴール72に切り替わった際には、即座に視点が切り替わるのではなく、現在角度と切り替わり後の角度を求めたうえで、所定時間かけてこの角度差分回転し仮想視点を補完する。これにより、関心対象の切り替わりの際に視聴者が現在注目している関心対象が切り替わったことを正しく認識できるようにする。
このように本開示により、バスケットボールなどスポーツにおいて、全被写体の動きから攻守の切り替わりを検出することができ、それに合わせて視点生成部109が攻撃側のゴールをとらえるような仮想視点を自動で生成することが可能となる。これにより、ユーザが指定した被写体を追従し、仮想視点画像に含みつつ、シーンに適した仮想視点画像が制作可能となる。
なお、本実施形態ではS606で平均速度ベクトルのゴール方向成分を算出したが、どの方向成分を算出するかは撮像対象や関心対象候補によって異なるものとする。例えば、陸上の100m走を撮像対象とする場合、スタートからゴールまでの直線をx軸方向とする。このように平均速度ベクトルをどの方向成分に算出するかは、撮像対象や関心対象によって異なる。そのため、例えば、複数の関心対象候補の組み合わせが決まっている場合、その組み合わせに対し、所定の成分方向を予め設けて記憶しておいてもよい。
なお、本実施形態ではS606で平均速度ベクトルのゴール方向の成分を算出したが、これに限定されない。平均速度ベクトルの向きから関心対象を特定してもよい。具体的には、平均速度ベクトルの向きに直線を設け、直線に最も近い関心対象を特定する。なお、直線に最も近い関心対象候補が複数存在する可能性も存在する。その場合、さらに注目する被写体の位置に最も近い関心対象を特定する。これにより、複数の関心対象候補から1つの関心対象を特定することができる。
(実施形態1のその他の形態)
本実施形態において被写体位置検出部114として、形状推定結果に基づいた被写体位置検出手段の説明を行ったが、本開示はこの被写体の位置を検出する方法に限定するものではない。例えば選手にGPSなどの位置センサを取り付けたうえで、そのセンサ値を取得する構成でも良いし、そのほかにも複数の撮像手段より得られる画像から画像認識技術を用いて被写体位置を検出する構成としてもよい。
また、本実施形態においては仮想視点画像生成時に関心対象決定部110が毎フレーム、速度および移動方向を計算する構成としたが必ずしもこれに限定するものではない。例えば、被写体位置検出部114で位置を検出するとともに、各被写体の速度ベクトル算出を行い、記憶部108に記録する構成としてもよい。この場合、関心対象決定部110は各被写体の速度ベクトルを記憶部108から取得し、関心対象の決定を行ってもよい。
本実施形態においては、位置情報のフィルタ処理として、平均化処理を行うとしたがこれに限定するものではない。例えば、IIRフィルタやFIRフィルタなどのローパスフィルタを用いてもよい。ただし、都度速度などを計算する構成の場合、ローパスフィルタを用いると、仮想視点画像を再生する時刻を不連続に変更した場合に値が正しくなくなるので、そのような構成の場合、前述したように近傍の時刻の情報を取得したうえで平均化することが望ましい。
本実施形態では、例としてバスケットボールを例としたが、サッカーやラグビーなどの競技に適用してもよい、例えばサッカーの場合バスケットボールに比べて試合の展開が遅く選手全体が比較的停止した時間が長い場合がある。そうした場合には、被写体(選手)がフィールドのどちら側に多くいるかを判定し、その判定結果と被写体の速度ベクトルとを複合的に判断して関心対象を決定してもよい。
<実施形態2>
実施形態1では、選手である全被写体の平均速度ベクトルから関心対象を決定した。しかしながら、選手1人の動きに基づいて、関心対象を決定してもよい。例えば、野球の走者を追従するような仮想視点画像を生成する場合、走者の動きに着目して関心対象を決定してもよい。本実施形態では、撮像対象を野球とした例を説明する。本実施形態では、ブロック図は図1と同様であり、特に説明がない構成要素は実施形態1と同様であるため説明を省略する。
図9は、実施形態2における関心対象決定部110が関心対象を決定する処理を示すフローチャートである。なお、本処理は毎フレーム実施される。
図10は、実施形態2における関心対象候補と判定領域(所定の領域)の一例を示す図である。本実施形態では、野球のホームベース1005および一塁1006、二塁1007、三塁1008の各ベースを関心対象候補とする。
ステップS901では、関心対象決定部110は、図示しないユーザインターフェースに対するユーザ操作により、第一の判定領域1001と第二の判定領域1002、第三の判定領域1003、第四の判定領域1004が設定される。このとき、各判定領域と結び付ける関心対象候補が設定される。具体的には、第一の判定領域1001には、ホームベース1005と一塁1006が結び付けられる。他も同様に、第二の判定領域1002には一塁1006と二塁1007が、第三の判定領域1003には二塁1007と三塁1008が、第四の判定領域1004には三塁1008とホームベース1005がそれぞれ結び付けられる。また、関心対象決定部110は判定領域に結びつけられた関心対象候補の位置情報を取得し、二つ関心対象候補を結ぶ方向ベクトルを求める。例えば第二の判定領域1002の場合、一塁1006から二塁1007を結ぶ単位方向ベクトルを求める。このとき単位方向ベクトルは二塁方向を示すベクトルとなる。なお、これら判定領域と関心対象候補の位置情報は条件情報として管理され、関心対象部110に記憶されていてもよいし、記憶部108に記憶されていてもよい。なお、S901は、毎フレーム実施せずに、関心対象を決定する最初のフレームのみ実施する。なお、これに限定されず、ユーザの任意のタイミングによりS901が実施されてもよい。
ステップS902では、関心対象決定部110は、被写体位置検出部114が検出し記憶部108に記録した被写体位置情報から、時刻指示部111より指示された時刻に基づいた被写体位置情報を取得する。
ステップS903では、実施形態1同様に、当該被写体の速度ベクトルを求める。このとき実施形態1同様に、取得した被写体の位置情報に対してはフィルタ処理を行うものとする。
ステップS904では、関心対象決定部110は、当該被写体があらかじめ設定された4つの判定領域のいずれの領域内に存在しているか判定する。本実施形態では、第二の判定領域1002内に当該被写体がいる場合として説明を行う。次に第二の判定領域1002に対応づいた複数の関心対象候補を特定する。本実施形態では、一塁1006と二塁1007が関心対象候補となる。
ステップS905では、S903にて算出した速度ベクトルが関心対象決定条件を満たすか否かを判定する。なお、実施形態1と同様に関心対象が決まっていない初期状態の場合、関心対象決定条件を満たすか否かに寄らず、S906に進む。関心対象決定部110は、被写体の速度ベクトルを判定領域に結びつけられた単位方向ベクトルに正射影して得られたベクトルの向きと大きさを求める。本実施形態では、関心対象決定条件は、正射影して得られたベクトルの大きさが所定の大きさより大きいか否かとする。正射影して得られたベクトルの大きさが所定の大きさより大きい場合、S906に進み、正射影して得られたベクトルの大きさが所定の大きさ以下の場合、処理を終了する。
ステップS906では、S904で特定した複数の関心対象候補のうち、平均速度ベクトルに基づいて1つの関心対象を決定する。なお、関心対象が決まっていない初期状態の場合の処理は、実施形態1と同様とする。正射影して得られたベクトルの大きさが所定よりも大きく、正射影して得られたベクトルの向きが前述の単位方向ベクトルと同じ二塁方向の場合は、二塁1007を関心対象と決定する。また、正射影して得られたベクトルの向きが単位方向ベクトルと逆向きの場合は、一塁1006を関心対象と決定する。このS902~S906の処理を毎フレーム行うことで、選手の動きに追従しつつも適切な関心対象に注目した仮想視点が生成できる。
図11は、実施形態2における被写体と関心対象と仮想視点の動きを示す図である。具体的に選手(走者)の動きと関心対象の切り替えに関して図11を用いて説明する。ここでは走者1101が図11(a)に示すように一塁1006付近にいる状態として説明する。走者1101が一塁1006付近にいる際には、そこに至るまでに、第一の判定領域1001を通過してきているため、現在注目している関心対象は一塁1006となっている。このとき、走者1101はリードを行い第二の判定領域1002に侵入するが、低速での移動のため関心対象は一塁1006のままとなる。このときの視点生成部109が生成する仮想視点は、図11(a)で示すような走者1101の斜め後方から走者1101と一塁1006を映す仮想視点1102となる。次に走者1101が進塁しようとして走りだし、速度が所定の速度以上になると、注目する関心対象が二塁1007に切り替わる。これにより走者1101に追従している仮想視点1102が図11(b)の破線の矢印1103のように走者1101の周りを回転し、走者1101に追従しつつも走者1101の肩越しに二塁1007が映る仮想視点1102へ自動的に遷移する。また例えば、進塁の途中で走者1101が一塁1006に戻ろうとした場合、注目する関心対象は一塁1006に切り替わり、走者1101と一塁1006を含む仮想視点1102へ遷移する。次に、進塁が成功しさらにそのまま三塁1008への進塁しようとした場合、走者1101は第三の判定領域1003内に入る。これにより第三の判定領域1003に結び付けられている、二塁1007と三塁1008で定義される単位方向ベクトルに基づき移動方向と速度の判定が行われる。その結果、第三の判定領域1003に入った時点で注目する関心対象が三塁1008となり、図11(c)に示すように仮想視点1102が走者1101と三塁1008を含むような位置へ移動する。
このように本開示を適用することにより、複数の関心対象候補のうち、選手の位置および速度情報に基づいて適切な関心対象を特定することができるようになり、特定した関心対象を基に視点生成部109が適切な仮想視点を生成可能となる。これにより仮想視点を操作するオペレータがいなくてもシチュエーションに合わせた適切なカメラワークを作成することが可能となる。
(実施形態2のその他の形態)
実施形態1同様に被写体位置検出部114はGPSや画像認識など別の位置検出手法を用いるものであってもよい。
本実施形態では視点生成部109が生成する仮想視点は、被写体を背後から追従する仮想視点として説明したがこれに限定するものではない。注目している被写体と、注目すべき関心対象の情報を用いて仮想視点を生成する物であればどのようなものであってもよい。例えば、関心対象となっているベース付近に仮想視点を配置し、追跡対象の被写体を待ち受けて画角に収まるようにカメラワークを作成する視点生成部109であってもよい。この場合、関心対象の切り替わりに伴い、追跡対象の被写体を正面から捉えながら仮想視点の配置が関心対象となるベース付近に遷移するのが望ましい。
本実施形態では、視点生成部109により自動的に仮想視点が生成され、オペレータは不要であるとしたが必ずしもこれに限定するものではない。例えば視点生成部109で生成する仮想視点の選手との距離や配置する高さ、画角といったものをオペレータが図示しないユーザインターフェースによって操作できる構成としてもよい。こうすることで被写体と関心対象を画角に収めるのは視点生成部109が担うが、画角などの構図に関してはオペレータがコントロールできる構成とすることができるのでより望ましい。
本実施形態では野球に適用したが、ソフトボールやそのほかにも選手のいる位置により、仮想視点に含めたい仮想視点が切り替わるようなスポーツ競技に適用してもよい。
本実施形態では、関心対象候補を背景モデルとし、ユーザが指定した被写体の位置と関心対象の重心位置とにより仮想視点の位置及び向きを決定したが、これに限定されない。例えば、関心対象候補の背景モデルに対し、重心位置と異なる三次元位置が対応付けられていてもよい。その場合、ユーザが指定した被写体の位置と関心対象に対応する三次元位置とに基づいて仮想視点の位置及び向きを決定する。このような処理は、バスケットボールのゴールなど、背景モデルの重心位置と異なる位置にゴールネットがある場合に、シーンに適した仮想視点を容易に設定できるようになる。なお、背景モデルに対応する三次元位置は被写体の重心位置と同じ高さに設定してもよい。例えば、関心対象が野球のベースの場合、床面に存在することになり、床面を向いた仮想視点に対応する仮想視点画像を生成してしまう虞がある。そのため、背景モデルに対応する三次元位置の高さを調整することにより、シーンに適した仮想視点を容易に設定できるようにする。
(その他の構成)
図1に示した各処理部はハードウェアで構成しているものとして上記実施形態では説明した。しかし、これらの図に示した各処理部で行う処理をコンピュータプログラムで構成しても良い。
図12は、上記各実施形態に係る間接位置推定装置に適用可能なコンピュータのハードウェアの構成例を示すブロック図である。
CPU1201は、RAM1202やROM1203に格納されているコンピュータプログラムやデータを用いてコンピュータ全体の制御を行うと共に、上記各実施形態に係る間接位置推定装置が行うものとして上述した各処理を実行する。即ち、CPU1201は、図1に示した各処理部として機能することになる。
RAM1202は、外部記憶装置1206からロードされたコンピュータプログラムやデータ、I/F(インターフェース)1207を介して外部から取得したデータなどを一時的に記憶するためのエリアを有する。更に、RAM1202は、CPU1201が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1202は、例えば、フレームメモリとして割り当てたり、その他の各種のエリアを適宜提供したりすることができる。
ROM1203には、本コンピュータの設定データや、ブートプログラムなどが格納されている。操作部1204は、キーボードやマウスなどにより構成されており、本コンピュータのユーザが操作することで、各種の指示をCPU1201に対して入力することができる。出力部1205は、CPU1201による処理結果を表示する。また出力部1205は例えば液晶ディスプレイで構成される。たとえば視点生成部109は操作部1204で、表示部113は出力部1205で構成される。
外部記憶装置1206は、ハードディスクドライブ装置に代表される、大容量情報記憶装置である。外部記憶装置1206には、OS(オペレーティングシステム)や、図1に示した各部の機能をCPU1201に実現させるためのコンピュータプログラムが保存されている。更には、外部記憶装置1206には、処理対象としての各画像データが保存されていても良い。
外部記憶装置1206に保存されているコンピュータプログラムやデータは、CPU1201による制御に従って適宜、RAM1202にロードされ、CPU1201による処理対象となる。I/F1207には、LANやインターネット等のネットワーク、投影装置や表示装置などの他の機器を接続することができ、本コンピュータはこのI/F1207を介して様々な情報を取得したり、送出したりすることができる。実施形態1においては、撮像部101がこれに接続され、撮像された画像を入力したり、それぞれを制御したりする。1208は上述の各部を繋ぐバスである。
上述の構成からなる作動は前述の実施形態で説明した作動をCPU1201が中心となってその制御を行う。
尚、本実施形態における制御の一部または全部を上述した実施形態の機能を実現するコンピュータプログラムをネットワーク又は各種記憶媒体を介して画像処理システム等に供給するようにしてもよい。そしてその画像処理システム等におけるコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行するようにしてもよい。その場合、そのプログラム、および該プログラムを記憶した記憶媒体は本開示を構成することとなる。
なお、本実施形態の開示は、以下の構成、方法およびプログラムを含む。
(構成1)複数の撮像装置により撮像される撮像領域に含まれる被写体の位置を示す位置情報を取得する取得手段と、
前記被写体の移動方向に基づいて、複数の関心位置のうち1つの関心位置を特定する特定手段と、
前記特定手段により特定された前記関心位置と前記被写体の位置とに基づいて、前記被写体に関連する仮想視点画像に対応する仮想視点の位置と、前記仮想視点からの視線方向を決定する決定手段と
を有することを特徴とする情報処理装置。
(構成2)前記位置情報は、複数の被写体の位置を示し、
前記特定手段は、前記複数の被写体の移動方向に基づいて、前記複数の関心位置のうち1つの関心位置を特定することを特徴とする構成1に記載の情報処理装置。
(構成3)前記特定手段は、前記複数の被写体の移動方向および移動速度に基づいて、前記複数の関心位置のうち1つの関心位置を特定することを特徴とする構成2に記載の情報処理装置。
(構成4)前記複数の被写体は、第1種類と第2種類とを含む複数の種類に分類され、
前記特定手段は、前記第1種類に対応する前記複数の被写体の移動方向に基づいて、前記複数の関心位置のうち1つの関心位置を特定することを特徴とする構成2に記載の情報処理装置。
(構成5)前記複数の撮像装置は、競技を撮像し、
前記第1種類は、選手であり、
前記第2種類は、審判員であることを特徴とする構成4に記載の情報処理装置。
(構成6)前記取得手段は、三次元空間上の所定の領域と対応した前記複数の関心位置を示す条件情報を取得し、
前記特定手段は、前記条件情報が示す前記所定の領域内に前記被写体が位置する場合、前記所定の領域と対応した前記複数の関心位置から1つの関心位置を特定することを特徴とする構成1に記載の情報処理装置。
(構成7)前記被写体の移動方向は、所定の時間における前記被写体の位置変化に基づいて特定されることを特徴とする構成1に記載の情報処理装置。
(構成8)前記関心位置は、ユーザ操作に基づいて設定されることを特徴とする構成1に記載の情報処理装置。
(構成9)前記関心位置は、背景モデルに対応づいていることを特徴とする構成1に記載の情報処理装置。
(構成10)前記背景モデルは、静止物体であることを特徴とする構成9に記載の情報処理装置。
(構成11)前記背景モデルは、バスケットボールのゴールであることを特定する構成10に記載の情報処理装置。
(構成12)前記決定手段は、前記被写体の位置から前記関心位置に伸ばした半直線に基づいて、前記仮想視点の位置および前記仮想視点からの視線方向を決定することを特徴とする構成1に記載の情報処理装置。
(構成13)前記決定手段は、前記被写体の位置から前記関心位置に伸ばした半直線と、前記仮想視点からの視線方向とが成す角度が所定の角度になるように、前記仮想視点の位置および前記仮想視点からの視線方向を決定することを特徴とする構成12に記載の情報処理装置。
(構成14)前記決定手段は、前記仮想視点画像に前記被写体と前記関心位置とを含むように、前記仮想視点の位置および前記仮想視点からの視線方向を決定することを特徴とする構成1に記載の情報処理装置。
(方法)複数の撮像装置により撮像される撮像領域に含まれる被写体の位置を示す位置情報を取得する取得工程と、
前記被写体の移動方向に基づいて、複数の関心位置のうち1つの関心位置を特定する特定工程と、
前記特定工程により特定された前記関心位置と前記被写体の位置とに基づいて、前記被写体を含む仮想視点画像に対応する仮想視点の位置と、前記仮想視点からの視線方向とを決定する決定工程と
を有することを特徴とする情報処理方法。
(プログラム)コンピュータを、構成1から構成14のうちいずれか1項に記載の情報処理装置として機能させるためのプログラム。
104 形状抽出部
105 識別設定部
106 追跡部
107 被写体位置算出部
109 視点生成部
110 関心対象決定部
111 時刻指示部

Claims (16)

  1. 複数の撮像装置により撮像される撮像領域に含まれる被写体の位置を示す位置情報を取得する取得手段と、
    前記被写体の移動方向に基づいて、複数の関心位置のうち1つの関心位置を特定する特定手段と、
    前記特定手段により特定された前記関心位置と前記被写体の位置とに基づいて、前記被写体に関連する仮想視点画像に対応する仮想視点の位置と、前記仮想視点からの視線方向を決定する決定手段と
    を有することを特徴とする情報処理装置。
  2. 前記位置情報は、複数の被写体の位置を示し、
    前記特定手段は、前記複数の被写体の移動方向に基づいて、前記複数の関心位置のうち1つの関心位置を特定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記特定手段は、前記複数の被写体の移動方向および移動速度に基づいて、前記複数の関心位置のうち1つの関心位置を特定することを特徴とする請求項2に記載の情報処理装置。
  4. 前記複数の被写体は、第1種類と第2種類とを含む複数の種類に分類され、
    前記特定手段は、前記第1種類に対応する前記複数の被写体の移動方向に基づいて、前記複数の関心位置のうち1つの関心位置を特定することを特徴とする請求項2に記載の情報処理装置。
  5. 前記複数の撮像装置は、競技を撮像し、
    前記第1種類は、選手であり、
    前記第2種類は、審判員であることを特徴とする請求項4に記載の情報処理装置。
  6. 前記取得手段は、三次元空間上の所定の領域と対応した前記複数の関心位置を示す条件情報を取得し、
    前記特定手段は、前記条件情報が示す前記所定の領域内に前記被写体が位置する場合、前記所定の領域と対応した前記複数の関心位置から1つの関心位置を特定することを特徴とする請求項1に記載の情報処理装置。
  7. 前記被写体の移動方向は、所定の時間における前記被写体の位置変化に基づいて特定されることを特徴とする請求項1に記載の情報処理装置。
  8. 前記関心位置は、ユーザ操作に基づいて設定されることを特徴とする請求項1に記載の情報処理装置。
  9. 前記関心位置は、背景モデルに対応づいていることを特徴とする請求項1に記載の情報処理装置。
  10. 前記背景モデルは、静止物体であることを特徴とする請求項9に記載の情報処理装置。
  11. 前記背景モデルは、バスケットボールのゴールであることを特定する請求項10に記載の情報処理装置。
  12. 前記決定手段は、前記被写体の位置から前記関心位置に伸ばした半直線に基づいて、前記仮想視点の位置および前記仮想視点からの視線方向を決定することを特徴とする請求項1に記載の情報処理装置。
  13. 前記決定手段は、前記被写体の位置から前記関心位置に伸ばした半直線と、前記仮想視点からの視線方向とが成す角度が所定の角度になるように、前記仮想視点の位置および前記仮想視点からの視線方向を決定することを特徴とする請求項12に記載の情報処理装置。
  14. 前記決定手段は、前記仮想視点画像に前記被写体と前記関心位置とを含むように、前記仮想視点の位置および前記仮想視点からの視線方向を決定することを特徴とする請求項1に記載の情報処理装置。
  15. 複数の撮像装置により撮像される撮像領域に含まれる被写体の位置を示す位置情報を取得する取得工程と、
    前記被写体の移動方向に基づいて、複数の関心位置のうち1つの関心位置を特定する特定工程と、
    前記特定工程により特定された前記関心位置と前記被写体の位置とに基づいて、前記被写体を含む仮想視点画像に対応する仮想視点の位置と、前記仮想視点からの視線方向とを決定する決定工程と
    を有することを特徴とする情報処理方法。
  16. コンピュータを、請求項1から請求項14のうちいずれか1項に記載の情報処理装置として機能させるためのプログラム。
JP2023103415A 2023-06-23 2023-06-23 画像処理装置、画像処理方法、およびプログラム Active JP7661405B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2023103415A JP7661405B2 (ja) 2023-06-23 2023-06-23 画像処理装置、画像処理方法、およびプログラム
US18/749,402 US20240428455A1 (en) 2023-06-23 2024-06-20 Image processing apparatus, image processing method, and storage medium
JP2025061295A JP2025096363A (ja) 2023-06-23 2025-04-02 画像処理装置、画像処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023103415A JP7661405B2 (ja) 2023-06-23 2023-06-23 画像処理装置、画像処理方法、およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2025061295A Division JP2025096363A (ja) 2023-06-23 2025-04-02 画像処理装置、画像処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2025002994A true JP2025002994A (ja) 2025-01-09
JP7661405B2 JP7661405B2 (ja) 2025-04-14

Family

ID=93929012

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023103415A Active JP7661405B2 (ja) 2023-06-23 2023-06-23 画像処理装置、画像処理方法、およびプログラム
JP2025061295A Pending JP2025096363A (ja) 2023-06-23 2025-04-02 画像処理装置、画像処理方法、およびプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2025061295A Pending JP2025096363A (ja) 2023-06-23 2025-04-02 画像処理装置、画像処理方法、およびプログラム

Country Status (2)

Country Link
US (1) US20240428455A1 (ja)
JP (2) JP7661405B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12519924B2 (en) * 2022-08-31 2026-01-06 Snap Inc. Multi-perspective augmented reality experience
EP4443273A1 (en) * 2023-03-31 2024-10-09 Canon Kabushiki Kaisha Display control apparatus, display control method, and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017012397A (ja) * 2015-06-30 2017-01-19 株式会社セガゲームス プログラム
JP2019004229A (ja) * 2017-06-12 2019-01-10 キヤノン株式会社 情報処理装置及び画像生成装置及びそれら制御方法、並びにプログラム及び画像処理システム
JP2022060513A (ja) * 2017-08-30 2022-04-14 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、情報処理システム及びプログラム
JP2022171436A (ja) * 2021-04-30 2022-11-11 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2023079950A (ja) * 2021-11-29 2023-06-08 キヤノン株式会社 情報処理装置、情報処理システム、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017012397A (ja) * 2015-06-30 2017-01-19 株式会社セガゲームス プログラム
JP2019004229A (ja) * 2017-06-12 2019-01-10 キヤノン株式会社 情報処理装置及び画像生成装置及びそれら制御方法、並びにプログラム及び画像処理システム
JP2022060513A (ja) * 2017-08-30 2022-04-14 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、情報処理システム及びプログラム
JP2022171436A (ja) * 2021-04-30 2022-11-11 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2023079950A (ja) * 2021-11-29 2023-06-08 キヤノン株式会社 情報処理装置、情報処理システム、及びプログラム

Also Published As

Publication number Publication date
JP7661405B2 (ja) 2025-04-14
JP2025096363A (ja) 2025-06-26
US20240428455A1 (en) 2024-12-26

Similar Documents

Publication Publication Date Title
US10771760B2 (en) Information processing device, control method of information processing device, and storage medium
JP6894962B2 (ja) 自由視点映像用画像データのキャプチャ方法及び装置、プログラム
JP6674247B2 (ja) 情報処理装置、情報処理方法、およびコンピュータプログラム
JP5806215B2 (ja) 複数のカメラの相対制御のための方法及び装置
US8805007B2 (en) Integrated background and foreground tracking
JP2025096363A (ja) 画像処理装置、画像処理方法、およびプログラム
JP7725686B2 (ja) 画像処理装置、画像処理方法、およびプログラム
KR102475994B1 (ko) 정보 처리장치, 정보 처리방법 및 기억매체
CN112544070A (zh) 视频的处理方法和装置
GB2467932A (en) Image processing device and method
Pidaparthy et al. Keep your eye on the puck: Automatic hockey videography
US20250004547A1 (en) Image processing apparatus, image processing method, and storage medium
US11468258B2 (en) Information processing apparatus, information processing method, and storage medium
US20240070971A1 (en) Sports Metaverse
JP7700059B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN113971693A (zh) 直播画面生成方法、系统、装置及电子设备
JP2025017566A (ja) 情報処理装置、情報処理方法、およびプログラム
US20260011180A1 (en) Image processing apparatus, image processing method, and storage medium
US20240420412A1 (en) Image processing apparatus, control method, and storage medium
US20260030835A1 (en) Information processing system, information processing method, and medium
JP2021051374A (ja) 形状データ生成装置、形状データ生成方法、及び、プログラム
US20250022209A1 (en) Image production system, image production method, and program
EP4443392A1 (en) Image production system, image production method, and program
JP7558652B2 (ja) 配置決定装置、配置決定方法、及びプログラム
CN118451722A (zh) 信息处理设备、图像处理方法和程序

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20231213

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250402

R150 Certificate of patent or registration of utility model

Ref document number: 7661405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150