JP7794014B2 - 設定プログラム、設定方法および設定装置 - Google Patents

設定プログラム、設定方法および設定装置

Info

Publication number
JP7794014B2
JP7794014B2 JP2022023946A JP2022023946A JP7794014B2 JP 7794014 B2 JP7794014 B2 JP 7794014B2 JP 2022023946 A JP2022023946 A JP 2022023946A JP 2022023946 A JP2022023946 A JP 2022023946A JP 7794014 B2 JP7794014 B2 JP 7794014B2
Authority
JP
Japan
Prior art keywords
store
camera
information
setting
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022023946A
Other languages
English (en)
Other versions
JP2023120848A (ja
Inventor
翔 岩▲崎▼
大輔 内田
源太 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2022023946A priority Critical patent/JP7794014B2/ja
Priority to EP22204087.5A priority patent/EP4231251A1/en
Priority to US17/978,980 priority patent/US12051246B2/en
Publication of JP2023120848A publication Critical patent/JP2023120848A/ja
Application granted granted Critical
Publication of JP7794014B2 publication Critical patent/JP7794014B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three-dimensional [3D] modelling for computer graphics
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • G06T2207/20044Skeletonization; Medial axis transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Graphics (AREA)
  • Medical Informatics (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Description

本発明は、設定プログラム等に関する。
近年、店舗において、顧客による、商品棚(棚)からの商品の出し入れを認識する技術が着目されている。かかる技術を用いることで、無人レジを導入できたり、万引き検知等を行ったりすることができる。商品の出し入れを認識する技術には、カメラと画像認識技術とを利用する方式、各商品にRFID(Radio Frequency Identification)を付与する方式、棚毎に重量センサを設置する方式等がある。
各商品にRFIDを付与する方式、棚毎に重量センサを設置する方式と比較して、カメラと画像認識技術とを利用する方式では、導入が容易であるという利点がある。また、カメラと画像認識技術とを利用する方式では、既存の監視カメラを用いることで、追加コストを抑えることができ、需要が高い。
ここで、カメラと画像認識技術とを用いて、商品の出し入れを認識する従来技術の一例について説明する。図14は、従来技術を説明するための図である。従来技術は、棚5の上部に設置されたカメラ6を用いる。左側の棚5は、棚5を前方から示したものであり、右側の棚5は、棚5を上方から示したものである。従来技術は、事前に棚5に検出ライン5aを設定しておく。
従来技術では、カメラ6の映像を解析して人物の手を検出し、人物の手が検出ライン5aを通過する際に、手の周辺領域の画像を用いて、商品の出し入れを認識する。
特開2021-107989号公報
しかしながら、上述した従来技術では、商品の出し入れを誤検出するという問題がある。
たとえば、監視カメラを使用する場合、カメラと棚との位置関係が、カメラと棚との組み合わせ毎に異なるため、従来技術のように、一律に事前定義した検出ラインを用いることが難しい。
特に、撮影条件によっては、同じ棚であっても人物の位置によって適した検出ラインが異なる。図15は、適した検出ラインの一例を示す図である。たとえば、人物C1の位置に対する適した検出ラインは、棚7の検出ライン7aとなる。人物C2の位置に対する適した検出ラインは、棚7の検出ライン7bとなる。人物は棚7の前を移動するため、従来技術のように、事前に設定した検出ラインを用いると、商品の出し入れの誤検出が発生する。
1つの側面では、本発明は、商品の出し入れを検出することができる設定プログラム、検出プログラム、設定方法および設定装置を提供することを目的とする。
第1の案では、コンピュータに次の処理を実行させる。コンピュータは、商品が収容される収容部を有する店内に設定されたカメラの映像を取得する。コンピュータは、取得したカメラの映像を機械学習モデルに入力することで、映像の構成要素毎のカメラからの距離を示す深度を特定する。コンピュータは、特定した映像の構成要素毎のカメラからの距離を示す深度から構成される3次元の店内のモデルを生成する。コンピュータは、カメラの映像から、店内を移動する人物の骨格情報を生成する。コンピュータは、生成された骨格情報の遷移に基づいて、生成された3次元の店内のモデルの中に、店内の通路の範囲および方向を設定する。コンピュータは、店内の通路の範囲および方向に基づいて、人物が商品に手を伸ばしたことを検出するための検出ラインを収容部に設定する。
商品の出し入れを検出できる。
図1は、本実施例に係るシステムを示す図である。 図2は、本実施例に係る情報処理装置の処理を説明するための図(1)である。 図3は、本実施例に係る情報処理装置の処理を説明するための図(2)である。 図4は、本実施例に係る情報処理装置の処理を補足するための図である。 図5は、従来技術が誤検出する一例を説明するための図である。 図6は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。 図7は、移動軌跡テーブルのデータ構造の一例を示す図である。 図8は、骨格情報の例を示す図である。 図9は、商品を取り出す行動を検知する処理を説明するための図である。 図10は、判定部のその他の処理を説明するための図である。 図11は、情報処理装置が実行する事前設定処理を示すフローチャートである。 図12は、情報処理装置が実行する検出処理を示すフローチャートである。 図13は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。 図14は、従来技術を説明するための図である。 図15は、適した検出ラインの一例を示す図である。
以下に、本願の開示する設定プログラム、検出プログラム、設定方法および設定装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、本実施例に係るシステムを示す図である。図1に示すように、このシステムは、カメラ10a,10b,10cと、情報処理装置100とを有する。情報処理装置100は設定装置、検出装置の一例である。カメラ10a~10cと、情報処理装置100とは、ネットワーク15を介して相互に接続される。
カメラ10a~10cは、商品が収容される棚等の収容部を有する店内に設置されたカメラである。カメラ10a~10cは、店内に設置された棚を含む映像を撮影し、撮影した映像の情報を、情報処理装置100に送信する。以下の説明では、映像の情報を「映像情報」と表記する。映像情報には、時系列の画像(静止画像)が含まれる。カメラ10a~10cをまとめて「カメラ10」と表記する。
情報処理装置100は、カメラ10から受信する映像情報を基にして、棚に収容された商品の出し入れを検出するための検出ラインを設定する。また、情報処理装置100は、設定した検出ラインを用いて、ユーザによる商品の出し入れを検出する。
図2、図3は、本実施例に係る情報処理装置の処理を説明するための図である。まず、図2について説明する。情報処理装置100は、カメラ10から受信した映像情報Im1を、単眼デプス推定を実行する訓練済みの学習モデルに入力することで、深度画像Im2を生成する。深度画像Im2は、複数の画素を有し、各画素には、距離情報が設定される。深度画像Im2の各画素は、映像情報(画像)Im1の同一座標の各画素に対応する。深度画像Im2の各画素に設定される距離情報は、映像情報Im1の画素に対応する店内の領域と、カメラ10との距離を示す。
情報処理装置100が、深度画像Im2を生成する場合、映像情報Im1には、ユーザが含まれていないものとする。すなわち、情報処理装置100は、ユーザが含まれていない時間帯に、カメラ10に撮影された映像情報Im1を用いて、深度画像Im2を生成する。
情報処理装置100は、映像情報Im1を基にして、店内を移動するユーザの骨格情報を生成し、生成した骨格情報の足部分の遷移に基づいて、移動軌跡を特定する。情報処理装置100が、移動軌跡を特定する場合、映像情報Im1には、ユーザが含まれているものとする。すなわち、情報処理装置100は、ユーザが含まれている時間帯に、カメラ10に撮影された映像情報Im1を用いて、ユーザの移動軌跡を特定する。
図2に示す例では、情報処理装置100は、移動軌跡tr1,tr2,tr3,tr4を特定した例を示す。情報処理装置100は、移動軌跡tr1,tr2,tr3,tr4を基にして、通路領域f1と、通路方向d1とを特定する。たとえば、情報処理装置100は、移動軌跡tr1~4の移動範囲を、通路領域f1とする。情報処理装置100は、移動軌跡tr1~4の変位ベクトルの平均ベクトルを、通路方向d1とする。
情報処理装置100は、深度画像Im2と、通路領域f1と、進路方向d1とを基にして、3次元空間の店内3Dモデルを生成する。たとえば、情報処理装置100は、深度画像Im2の距離情報、通路領域f1の座標、進路方向d1の座標を、店内3Dモデル上の3次元座標に変換して、合成する。
図3の説明に移行する。たとえば、図3に示すように、店内3DモデルM1には、棚8a,8bと、通路領域f1と、通路方向d1が設定される。情報処理装置100は、ユーザC3が含まれる映像情報Im3を基にして、ユーザC3の骨格情報を推定し、ユーザC3の足元の位置p1を特定する。
情報処理装置100は、位置p1を店内3DモデルM1上の位置p1´に変換する。情報処理装置100は、位置p1´と、通路方向d1とを基にして、店内3DモデルM1上に、面H1を設定する。面H1の下端の線分l1は、位置p1´を通り、通路方向d1に対して垂直となる。
情報処理装置100は、商品の棚8a,8bが、通路方向d1に垂直に向く形で設置されることを利用し、線分l1と棚8aとが接触する点a1と、棚8aの上端b1とを結ぶ検出ラインL10aを設定する。情報処理装置100は、線分l1と棚8bとが接触する点a2と、棚8bの上端b2とを結ぶ検出ラインL10bを設定する。情報処理装置100は、ユーザC1が移動し、位置p1が変わる度に、上記処理を実行し、検出ラインL10a,L10bを再設定する。たとえば、情報処理装置100は、代表的な複数の位置毎に検出ラインを事前に算出しておき、位置p1に対して、位置p1に近接する代表的な位置を求めて、位置p1に対応する検出ラインを採用する。もしくは、情報処理装置100は、位置p1に近接する代表的な位置(複数)の検出ラインを、位置p1と代表的な位置との距離に応じて統合することで検出ラインを設定する。
情報処理装置100は、ユーザC3が棚8a(8b)から商品を取る際に、棚8a(8b)と正対することを利用し、検出ラインL10a,L10bを用いて、ユーザC3による商品の出し入れを検出する。
図4は、本実施例に係る情報処理装置の処理を補足するための図である。図4では、図3に示した店内3DモデルM1を上から見た場合を示す。図4に示すように、商品の棚8aは、通路方向d1に垂直に向く形で設置される。たとえば、ユーザは、位置p1´に立ち、棚8aから商品を取り出す場合には、棚8aと正対する。すなわち、図3で示した線分l1は、通路方向d1に対して垂直となる。
上記のように、情報処理装置100は、カメラ10の映像情報から求めた深度画像とユーザの移動軌跡とを基にして店内3DモデルM1を生成し、床面のユーザの立ち位置毎に棚の検出ラインを設定し、検出に利用する。このように、ユーザの立ち位置毎に検出ラインを設定することで、従来技術のように、予め検出ラインを設定する場合と比較して、商品の出し入れを精度よく検出することができる。
図5は、従来技術が誤検出する一例を説明するための図である。図5の画像Im4-1には、棚9A,9Bが含まれ、検出ラインL9A,L9Bが事前に設定される。検出ラインL9Aは、棚9Aに収容された商品の出し入れを検出する場合に用いられる。検出ラインL9Bは、棚9Bに収容された商品の出し入れを検出する場合に用いられる。検出ラインL9A,L9Bは、本実施例の情報処理装置100のように、ユーザの位置に応じて検出ラインL9A,L9Bを設定するものでない。このため、ユーザC4が棚9Aの手前を移動し、棚9Aに収容された商品の出し入れを行わない場合でも、ユーザC4の手が検出ラインL9Aを越えてしまい、誤検出の原因となり得る。
図5の画像Im4-2には、棚9Cが含まれ、たとえば、棚の輪郭が、検出ラインL9Cとして事前に設定されている。検出ラインL9Cは、棚9Cに収容された商品の出し入れを検出する場合に用いられる。この検出ラインL9Cも、本実施例の情報処理装置100のように、ユーザの位置に応じて検出ラインL9Cを設定するものでない。このため、ユーザC5が棚9Cの手前を移動し、棚9Cに収容された商品の出し入れを行わない場合でも、ユーザC5の手が検出ラインL9Cを越えてしまい、誤検出の原因となり得る。
次に、本実施例に係る情報処理装置100の構成例について説明する。図6は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図6に示すように、この情報処理装置100は、通信部110と、入力部120と、表示部130と、記憶部140と、制御部150とを有する。
通信部110は、ネットワーク15を介して、カメラ10との間で情報の送受信を行う。通信部110は、カメラ10から映像情報を受信する。たとえば、通信部110は、NIC(Network Interface Card)等によって実現される。
入力部120は、キーボードやマウス等の入力デバイスを用いて実現され、管理者等による入力操作に対応して、制御部150に対して各種の情報を入力する。
表示部130は、液晶ディスプレイなどの表示装置等によって実現される。たとえば、表示部130は、制御部150の処理結果を表示してもよい。
記憶部140は、映像バッファ141、深度画像情報142、移動軌跡テーブル143、店内3DモデルM1を有する。記憶部140は、たとえば、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
映像バッファ141は、カメラ10から送信される映像情報を保持するバッファである。たとえば、映像バッファ141には、図2で説明した映像情報Im1、図3で説明した映像情報Im3等を保持する。
深度画像情報142は、複数の画素を有し、画素毎に、距離情報が設定される。映像(画像)の複数の画素は、複数の構成要素に対応する。距離情報は、映像情報の画素に対応する店内の領域と、カメラ10との距離を示す。深度画像情報142は、図2で説明した深度画像Im2等に対応する。
移動軌跡テーブル143は、ユーザの移動軌跡の情報を保持するテーブルである。図7は、移動軌跡テーブルのデータ構造の一例を示す図である。図7に示すように、この移動軌跡テーブル143は、ユーザID(Identification)と、移動軌跡とを対応付ける。ユーザIDは、カメラ10の映像情報から特定されるユーザを識別する情報である。移動軌跡は、映像情報から特定されたユーザの移動軌跡を示し、所定時間間隔毎の位置情報が設定される。
店内3DモデルM1は、図3で説明した3次元の店内のモデルである。たとえば、店内3DモデルM1には、棚8a,8bの各隅の3次元座標、通路領域f1の各隅の3次元座標、通路方向d1を示す始点と終点の3次元座標等が定義される。
図6の説明に戻る。制御部150は、受信部151、深度特定部152、姿勢推定部153、移動軌跡算出部154、通路推定部155、検出ライン設定部156、判定部157を有する。制御部150は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)により実現される。また、制御部150は、たとえば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実行されてもよい。
受信部151は、カメラ10から映像情報を受信する。受信部151は、受信した映像情報を、映像バッファ141に格納する。
深度特定部152は、店内にユーザがいない時間帯にカメラ10から受信した映像情報を、単眼デプス推定を実行する訓練済みの第1学習モデルに入力することで、深度画像情報142を生成する。たとえば、かかる学習モデルは、映像情報を入力とし、映像情報の各画素の距離情報を正解ラベルとする教師データを基にして、訓練される。深度特定部152は、深度画像情報142を記憶部140に格納する。
姿勢推定部153は、店内にユーザがいる時間帯にカメラ10から受信した映像情報を、ユーザの骨格情報を推定する訓練済みの第2学習モデルに入力することで、ユーザの骨格情報を推定する。たとえば、姿勢推定部153は、映像情報に含まれる時系列の画像を順に、第2学習モデルに入力し、各画像の骨格情報を順に推定する。姿勢推定部153は、時系列の骨格情報を、移動軌跡算出部154に出力する。
なお、ユーザが商品に手を伸ばしたか否かを検知する認識時において、姿勢推定部153は、時系列の骨格情報を、検出ライン設定部156、判定部157に出力する。
たとえば、第2学習モデルは、ユーザの領域を含む画像を入力とし、骨格情報を出力とする訓練済みの機械学習モデルである。たとえば、第2学習モデルは、DeepPoseやOpenPoseなどの既存アルゴリズムを用いて構築される。図8は、骨格情報の例を示す図である。骨格情報は、公知の骨格モデルで特定される各関節をナンバリングした、18個(0番から17番)の定義情報を用いることができる。例えば、右肩関節(SHOULDER_RIGHT)には7番が付与され、左肘関節(ELBOW_LEFT)には5番が付与され、左膝関節(KNEE_LEFT)には11番が付与され、右股関節(HIP_RIGHT)には14番が付与される。したがって、図8に示した18個の骨格の座標情報が、画像データから取得可能であり、例えば、7番の右肩関節の位置として「X座標=X7、Y座標=Y7」が取得される。なお、X軸が画像の水平方向、Y軸が画像の垂直方向と定義することができる。
移動軌跡算出部154は、姿勢推定部153から取得する時系列の骨格情報の遷移を基にして、ユーザの移動軌跡を算出する。移動軌跡算出部154は、移動軌跡にユーザIDを割り当て、ユーザIDと、ユーザの移動軌跡の情報とを対応付けて、移動軌跡テーブル143に格納する。たとえば、移動軌跡算出部154は、時系列の骨格情報の足の位置を特定し、時系列の足の位置(たとえば、2次元の座標)の遷移を、移動軌跡として算出する。骨格情報の足の位置は、図8で説明した骨格情報の17番(FOOT_RIGHT)の座標、または、13番(FOOT_LEFT)の座標、あるいは、17番と13番との平均値等とする。
なお、移動軌跡算出部154は、足の位置が観測されない場合には、観測された残りの骨格情報の各関節から、足の位置を推定し、足の位置として用いてもよい。
通路推定部155は、移動軌跡テーブル143に格納された各移動軌跡の情報を基にして、通路領域と、通路方向を推定する。通路推定部155は、推定した通路領域と、通路方向の情報を、検出ライン設定部156に出力する。
通路推定部155が通路領域を推定する処理の一例について説明する。通路推定部155は、各移動軌跡の足の位置をそれぞれ内包する多角形を算出し、算出した多角形を、通路領域として推定する。たとえば、通路推定部155によって推定される通路領域の情報は、図2に示した通路領域f1に対応する。
通路推定部155が通路方向を推定する処理の一例について説明する。各移動軌跡の足の変位ベクトルの平均ベクトルを、通路方向として推定する。たとえば、通路推定部155によって推定される通路方向の情報は、図2に示した通路方向d1に対応する。
検出ライン設定部156は、ユーザが商品に手を伸ばしたことを検出するための検出ラインを棚に設定する。たとえば、検出ライン設定部156は、店内3DモデルM1を生成する処理を行った後に、検出ラインを設定する処理を行う。
検出ライン設定部156が店内3DモデルM1を生成する処理の一例について説明する。検出ライン設定部156は、深度画像情報142と、通路領域f1と、進路方向d1とを基にして、3次元空間の店内3DモデルM1を生成する。
たとえば、検出ライン設定部156は、深度画像情報142の距離情報と、第1定義テーブルとを基にして、深度画像情報142の距離情報を、店内3DモデルM1上の3次元座標に変換する。第1定義テーブルは、距離情報と、店内3DモデルM1上の3次元座標との関係を定義したテーブルである。
検出ライン設定部156は、通路領域f1の座標および進路方向d1の座標と、第2定義テーブルとを基にして、通路領域f1の座標、進路方向d1の座標を、店内3DモデルM1上の3次元座標に変換する。第2定義テーブルは、通路領域f1の座標および進路方向d1の座標と、店内3DモデルM1上の3次元座標との関係を定義したテーブルである。
たとえば、検出ライン設定部156は、深度画像情報142の距離情報から求められた店内3DモデルM1上の物体のうち、通路領域f1以外の領域の物体を、棚として特定する。図3で説明した例では、検出ライン設定部156は、店内3DモデルM1において、通路領域f1以外の物体を、棚8a,8bとして特定される。
続いて、検出ライン設定部156が、検出ラインを設定する処理の一例について説明する。たとえば、ユーザが商品に手を伸ばしたか否かを検知する認識時において、検出ライン設定部156は、姿勢推定部153から、骨格情報を取得し、ユーザの足の位置(3次元座標)を算出する。たとえば、検出ライン設定部156が算出した足の位置を、図3に示した位置p1´とする。検出ライン設定部156は、面H1の下端の線分l1が位置p1´を通り、通路方向d1に対して垂直となるように、面H1を店内3DモデルM1に配置する。たとえば、姿勢推定部153が推定する骨格情報の各関節座標は2次元の座標であり、検出ライン設定部156は、2次元座標を3次元座標に変換する変換テーブル等を用いて、3次元の座標を算出する。
検出ライン設定部156は、商品の棚8a,8bが、線分l1と棚8aとが接触する点a1と、棚8aの上端b1とを結ぶ検出ラインL10aを設定する。検出ライン設定部156は、線分l1と棚8bとが接触する点a2と、棚8bの上端b2とを結ぶ検出ラインL10bを設定する。検出ライン設定部156は、設定した検出ラインL10a,L10bの情報を、判定部157に出力する。
検出ライン設定部156は、ユーザが移動し、位置p1´が変わる度に、上記処理を実行し、検出ラインL10a,L10bを再設定し、再設定した検出ラインL10a,L10bの情報を、判定部157に出力する。
判定部157は、検出ライン設定部156から取得する検出ラインを基にして、ユーザが商品に手を伸ばしたことを検出し、商品を棚から取り出したか否かを判定する。以下において、判定部157の処理の一例について説明する。
判定部157は、姿勢推定部153から、骨格情報を取得し、ユーザの手の位置(2次元座標)を算出する。たとえば、判定部157は、ユーザの手の位置として、図8で説明した骨格情報の6番(WRIST_RIGHT)の座標、または、9番(WRIST_LEFT)の座標を算出する。以下の説明では、6番(WRIST_RIGHT)の座標を右手の位置と表記する。9番(WRIST_LEFT)の座標を左手の位置と表記する。
判定部157の処理を、検出ラインL10aを用いて説明する。判定部157は、検出ラインL10aの位置と、右手の位置、左手の位置とを比較して、右手、左手のうち、検出ラインL10aの位置に近い方の手を、着目する手とする。ここでは、右手を着目する手として説明を行う。
判定部157は、検出ラインL10aの位置と、右手の位置とを距離を算出し、距離が閾値未満となった場合に、ユーザが棚の商品に手を伸ばしたと判定する。判定部157は、ユーザが棚の商品に手を伸ばしたと判定した場合、以下の処理を行って、ユーザによる商品を取り出す行動を検知する。
図9は、商品を取り出す行動を検知する処理を説明するための図である。判定部157は、検出ラインL10aの近くに設定される領域25の画像(映像情報)を映像バッファ141から取得する。上記のように、検出ラインL10aの位置は、ユーザC1の位置に応じて変化するため、領域25の位置は、検出ラインL10aの位置に応じて、動的に変化するものとする。
たとえば、ユーザC1が手を棚20aに伸ばす際の領域25の画像を、画像25aとする。ユーザC1が手を棚20aから戻す際の領域25の画像を画像25bとする。判定部157は、識別モデル26を用いて、ユーザC1の手に商品が存在するか否かを判定する。識別モデル26は、ユーザの手に商品が存在するか否かを識別するモデルであり、HOID(Human Object Interaction Detection)等に基づく学習モデルであってもよい。
判定部157は、画像25aを識別モデル26に入力して「商品なし」と識別され、かつ、画像25bを識別モデル26に入力して「商品あり」と識別された場合に、ユーザC1が商品を取り出す行動を行ったことを検知する。
一方、判定部157は、画像25aを識別モデル26に入力して「商品あり」と識別され、かつ、画像25bを識別モデル26に入力して「商品なし」と識別された場合に、ユーザC1が商品を戻す行動を行ったことを検知する。
ここで、カメラ10の映像情報(画像)を用いる場合、ユーザの背景が棚となり、背景内にユーザの保持する商品と同一の商品が写りこむ場合があり、ユーザが商品を持っているか否かの判定精度が低下する。判定部157は、ユーザCが映り込む前の時間帯の画像(背景画像)と現在の画像とを比較することで、画像認識の精度を向上させてもよい。
図10は、判定部のその他の処理を説明するための図である。図10に示すように、判定部157は、映像バッファ141から入力画像Im5-1(映像情報)を取り出して、画像処理を行う場合、入力画像Im5-1から、事前に準備した背景画像Im5-2を減算することで、前景マスクIm5-3を生成する。判定部157は、入力画像Im5-1と、前景マスクIm5-3とを比較して、マスクA1の領域以外を抽出した画像Im5-4を生成する。画像Im5-4には、背景の画像が含まれていないため、図9で説明した検知する処理を実行する際の精度を向上することができる。
次に、本実施例に係る情報処理装置100の処理手順の一例について説明する。図11は、情報処理装置が実行する事前設定処理を示すフローチャートである。図11に示すように、情報処理装置100の受信部151は、カメラ10から映像情報を受信し、映像バッファ141に格納する(ステップS101)。
情報処理装置100の深度特定部152は、映像情報を第1学習モデルに入力し、深度画像情報142を生成する(ステップS102)。情報処理装置100の姿勢推定部153は、映像情報を第2学習モデルに入力し、骨格情報を生成する(ステップS103)。
情報処理装置100の移動軌跡算出部154は、時系列の骨格情報を基にして、移動軌跡の情報を生成し、移動軌跡テーブル143に格納する(ステップS104)。情報処理装置100の通路推定部155は、移動軌跡テーブル143に格納された移動軌跡の情報を基にして、通路領域および通路方向を推定する(ステップS105)。
情報処理装置100の検出ライン設定部156は、深度画像情報142と、通路領域と、通路方向とを基にして、店内3DモデルM1を生成する(ステップS106)。
図12は、情報処理装置が実行する検出処理を示すフローチャートである。図12に示すように、情報処理装置100の受信部151は、カメラ10から映像情報を受信し、映像バッファ141に格納する(ステップS201)。
情報処理装置100の姿勢推定部153は、映像情報を第2学習モデルに入力し、骨格情報を生成する(ステップS202)。情報処理装置100の検出ライン設定部156は、骨格情報を基にして、足の位置を算出する(ステップS203)。検出ライン設定部156は、店内3DモデルM1と足の位置とを基にして、検出ラインを設定する(ステップS204)。
情報処理装置100の判定部157は、骨格情報を基にして、手の位置を算出する(ステップS205)。判定部157は、検出ラインの位置と手の位置との距離を算出する(ステップS206)。判定部157は、距離が閾値未満である場合には(ステップS207,Yes)、棚の商品に手を伸ばしたと判定し、商品を取り出す行動を検出する(ステップS208)。
一方、判定部157は、距離が閾値未満でない場合には(ステップS207,No)、処理を終了する。
次に、本実施例に係る情報処理装置100の効果について説明する。情報処理装置100は、カメラ10の映像情報から求めた深度画像情報142とユーザの移動軌跡とを基にして店内3DモデルM1を生成し、床面のユーザの立ち位置毎に棚の検出ラインを設定し、検出に利用する。このように、ユーザの立ち位置毎に検出ラインを設定することで、従来技術のように、予め検出ラインを設定する場合と比較して、商品の出し入れを精度よく検出することができる。
情報処理装置100は、ユーザの時系列の骨格情報を基にして、ユーザの足の位置の遷移を特定し、特定した足の位置の遷移を内包する多角形を、通路領域として特定する。これによって、店内3DモデルM1の通路領域および、棚の3次元位置を特定することができる。
情報処理装置100は、ユーザの時系列の骨格情報を基にして、ユーザの足の位置の遷移を特定し、特定した足の位置の遷移に基づく変位方向ベクトルを基にして、通路方向を特定する。特定した通路方向と直角に交わる面を店内3DモデルM1に配置することで、検出ラインを精度よく設定できる。
情報処理装置100は、ユーザの立ち位置毎に検出ラインを設定し、ユーザの骨格情報を基にして、ユーザの手に対応する部位を特定し、検出ラインと手の部位との位置関係に基づいて、棚に収容された商品に対して、ユーザが商品に手を伸ばしたことを検出する。これによって、ユーザによる商品を棚から取り出す行動を検知することができる。
また、情報処理装置100によれば、店内3DモデルM1を事前に設定し、ユーザの足の位置のみを特定することで、検出ラインを設定でき、情報処理装置100の処理負荷を軽減できる。また、高解像度のカメラを用いなくても、ユーザによる商品を棚から取り出す行動を検知することができる。
次に、上記実施例に示した情報処理装置100と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図13は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
図13に示すように、コンピュータ300は、各種演算処理を実行するCPU301と、ユーザからのデータの入力を受け付ける入力装置302と、ディスプレイ303とを有する。また、コンピュータ300は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置304と、インタフェース装置305とを有する。また、コンピュータ300は、各種情報を一時記憶するRAM306と、ハードディスク装置307とを有する。そして、各装置301~307は、バス308に接続される。
ハードディスク装置307は、受信プログラム307a、深度特定プログラム307b、姿勢推定プログラム307c、移動軌跡算出プログラム307d、通路推定プログラム307eを有する。ハードディスク装置307は、検出ライン設定プログラム307f、判定プログラム307gを有する。また、CPU301は、各プログラム307a~307gを読み出してRAM306に展開する。
受信プログラム307aは、受信プロセス306aとして機能する。深度特定プログラム307bは、深度特定プロセス306bとして機能する。姿勢推定プログラム307cは、姿勢推定プロセス306cとして機能する。移動軌跡算出プログラム307dは、移動軌跡算出プロセス306dとして機能する。通路推定プログラム307eは、通路推定プロセス306eとして機能する。検出ライン設定プログラム307fは、検出ライン設定プロセス306fとして機能する。判定プログラム307gは、判定プロセス306gとして機能する。
受信プロセス306aの処理は、受信部151の処理に対応する。深度特定プロセス306bの処理は、深度特定部152の処理に対応する。姿勢推定プロセス306cの処理は、姿勢推定部153の処理に対応する。移動軌跡算出プロセス306dの処理は、移動軌跡算出部154の処理に対応する。通路推定プロセス306eの処理は、通路推定部155の処理に対応する。検出ライン設定プロセス306fの処理は、検出ライン設定部156の処理に対応する。判定プロセス306gの処理は、判定部157の処理に対応する。
なお、各プログラム307a~307gについては、必ずしも最初からハードディスク装置307に記憶させておかなくても良い。例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD-ROM、DVD、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ300が各プログラム307a~307gを読み出して実行するようにしてもよい。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)商品が収容される収容部を有する店内に設定されたカメラの映像を取得し、
取得した前記カメラの映像を機械学習モデルに入力することで、前記映像の構成要素毎の前記カメラからの距離を示す深度を特定し、
特定した前記映像の構成要素毎の前記カメラからの距離を示す深度から構成される3次元の店内のモデルを生成し、
前記カメラの映像から、前記店内を移動する人物の骨格情報を生成し、
生成された前記骨格情報の遷移に基づいて、生成された前記3次元の店内のモデルの中に、前記店内の通路の範囲および方向を設定し、
前記店内の通路の範囲および方向に基づいて、人物が前記商品に手を伸ばしたことを検出するための検出ラインを前記収容部に設定する
処理をコンピュータに実行させることを特徴とする設定プログラム。
(付記2)前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、特定した前記足の位置の遷移を内包する多角形を、前記通路の範囲として設定することを特徴とする付記1に記載の設定プログラム。
(付記3)前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、前記足の位置の遷移に基づく変位方向ベクトルを基にして、前記方向を設定することを特徴とする付記1または2に記載の設定プログラム。
(付記4)店内に設定されたカメラの映像の構成要素毎にカメラからの距離を示す深度から構成される3次元の店内のモデルの中に、前記店内の通路の範囲および方向に基づいて、人物が商品に手を伸ばしたことを検出するための検出ラインを、前記店内に配置された収容部に設定した設定情報を特定し、
前記店内を撮影した映像から生成された人物の骨格情報に基づいて、前記人物の手に対応する部位を特定し、
特定した前記人物の手に対応する部位と、前記設定情報に含まれる検出ラインとの位置関係に基づいて、前記収容部に収容された商品に対して、前記人物が商品に手を伸ばしたことを検出する
処理をコンピュータに実行させることを特徴とする検出プログラム。
(付記5)商品が収容される収容部を有する店内に設定されたカメラの映像を取得し、
取得した前記カメラの映像を機械学習モデルに入力することで、前記映像の構成要素毎の前記カメラからの距離を示す深度を特定し、
特定した前記映像の構成要素毎の前記カメラからの距離を示す深度から構成される3次元の店内のモデルを生成し、
前記カメラの映像から、前記店内を移動する人物の骨格情報を生成し、
生成された前記骨格情報の遷移に基づいて、生成された前記3次元の店内のモデルの中に、前記店内の通路の範囲および方向を設定し、
前記店内の通路の範囲および方向に基づいて、人物が前記商品に手を伸ばしたことを検出するための検出ラインを前記収容部に設定する
処理をコンピュータが実行することを特徴とする設定方法。
(付記6)前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、特定した前記足の位置の遷移を内包する多角形を、前記通路の範囲として設定することを特徴とする付記5に記載の設定方法。
(付記7)前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、前記足の位置の遷移に基づく変位方向ベクトルを基にして、前記方向を設定することを特徴とする付記5または6に記載の設定方法。
(付記8)店内に設定されたカメラの映像の構成要素毎にカメラからの距離を示す深度から構成される3次元の店内のモデルの中に、前記店内の通路の範囲および方向に基づいて、人物が商品に手を伸ばしたことを検出するための検出ラインを、前記店内に配置された収容部に設定した設定情報を特定し、
前記店内を撮影した映像から生成された人物の骨格情報に基づいて、前記人物の手に対応する部位を特定し、
特定した前記人物の手に対応する部位と、前記設定情報に含まれる検出ラインとの位置関係に基づいて、前記収容部に収容された商品に対して、前記人物が商品に手を伸ばしたことを検出する
処理をコンピュータが実行することを特徴とする検出方法。
(付記9)商品が収容される収容部を有する店内に設定されたカメラの映像を取得し、
取得した前記カメラの映像を機械学習モデルに入力することで、前記映像の構成要素毎の前記カメラからの距離を示す深度を特定し、
特定した前記映像の構成要素毎の前記カメラからの距離を示す深度から構成される3次元の店内のモデルを生成し、
前記カメラの映像から、前記店内を移動する人物の骨格情報を生成し、
生成された前記骨格情報の遷移に基づいて、生成された前記3次元の店内のモデルの中に、前記店内の通路の範囲および方向を設定し、
前記店内の通路の範囲および方向に基づいて、人物が前記商品に手を伸ばしたことを検出するための検出ラインを前記収容部に設定する
処理を実行する制御部を有する設定装置。
(付記10)前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、特定した前記足の位置の遷移を内包する多角形を、前記通路の範囲として設定することを特徴とする付記9に記載の設定装置。
(付記11)前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、前記足の位置の遷移に基づく変位方向ベクトルを基にして、前記方向を設定することを特徴とする付記9または10に記載の設定装置。
(付記12)店内に設定されたカメラの映像の構成要素毎にカメラからの距離を示す深度から構成される3次元の店内のモデルの中に、前記店内の通路の範囲および方向に基づいて、人物が商品に手を伸ばしたことを検出するための検出ラインを、前記店内に配置された収容部に設定した設定情報を特定し、
前記店内を撮影した映像から生成された人物の骨格情報に基づいて、前記人物の手に対応する部位を特定し、
特定した前記人物の手に対応する部位と、前記設定情報に含まれる検出ラインとの位置関係に基づいて、前記収容部に収容された商品に対して、前記人物が商品に手を伸ばしたことを検出する
処理を実行する制御部を有する検出装置。
100 情報処理装置
110 通信部
120 入力部
130 表示部
140 記憶部
141 映像バッファ
142 深度画像情報
143 移動軌跡テーブル
150 制御部
151 受信部
152 深度特定部
153 姿勢推定部
154 移動軌跡算出部
155 通路推定部
156 検出ライン設定部
157 判定部

Claims (5)

  1. 商品が収容される収容部を有する店内に設定されたカメラの映像を取得し、
    取得した前記カメラの映像を機械学習モデルに入力することで、前記映像の構成要素毎の前記カメラからの距離を示す深度を特定し、
    特定した前記映像の構成要素毎の前記カメラからの距離を示す深度から構成される3次元の店内のモデルを生成し、
    前記カメラの映像から、前記店内を移動する人物の骨格情報を生成し、
    生成された前記骨格情報の遷移に基づいて、生成された前記3次元の店内のモデルの中に、前記店内の通路の範囲および方向を設定し、
    前記店内の通路の範囲および方向に基づいて、人物が前記商品に手を伸ばしたことを検出するための検出ラインを前記収容部に設定する
    処理をコンピュータに実行させることを特徴とする設定プログラム。
  2. 前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、特定した前記足の位置の遷移を内包する多角形を、前記通路の範囲として設定することを特徴とする請求項1に記載の設定プログラム。
  3. 前記店内の通路の範囲および方向を設定する処理は、前記人物の骨格情報に含まれる足の位置の遷移を特定し、前記足の位置の遷移に基づく変位方向ベクトルを基にして、前記方向を設定することを特徴とする請求項1または2に記載の設定プログラム。
  4. 商品が収容される収容部を有する店内に設定されたカメラの映像を取得し、
    取得した前記カメラの映像を機械学習モデルに入力することで、前記映像の構成要素毎の前記カメラからの距離を示す深度を特定し、
    特定した前記映像の構成要素毎の前記カメラからの距離を示す深度から構成される3次元の店内のモデルを生成し、
    前記カメラの映像から、前記店内を移動する人物の骨格情報を生成し、
    生成された前記骨格情報の遷移に基づいて、生成された前記3次元の店内のモデルの中に、前記店内の通路の範囲および方向を設定し、
    前記店内の通路の範囲および方向に基づいて、人物が前記商品に手を伸ばしたことを検出するための検出ラインを前記収容部に設定する
    処理をコンピュータが実行することを特徴とする設定方法。
  5. 商品が収容される収容部を有する店内に設定されたカメラの映像を取得し、
    取得した前記カメラの映像を機械学習モデルに入力することで、前記映像の構成要素毎の前記カメラからの距離を示す深度を特定し、
    特定した前記映像の構成要素毎の前記カメラからの距離を示す深度から構成される3次元の店内のモデルを生成し、
    前記カメラの映像から、前記店内を移動する人物の骨格情報を生成し、
    生成された前記骨格情報の遷移に基づいて、生成された前記3次元の店内のモデルの中に、前記店内の通路の範囲および方向を設定し、
    前記店内の通路の範囲および方向に基づいて、人物が前記商品に手を伸ばしたことを検出するための検出ラインを前記収容部に設定する
    処理を実行する制御部を有する設定装置。
JP2022023946A 2022-02-18 2022-02-18 設定プログラム、設定方法および設定装置 Active JP7794014B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022023946A JP7794014B2 (ja) 2022-02-18 2022-02-18 設定プログラム、設定方法および設定装置
EP22204087.5A EP4231251A1 (en) 2022-02-18 2022-10-27 Setting program, detection program, setting method, detection method, setting apparatus, and detection appratus
US17/978,980 US12051246B2 (en) 2022-02-18 2022-11-02 Non-transitory computer readable recording medium, setting method, detection method, setting apparatus, and detection apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022023946A JP7794014B2 (ja) 2022-02-18 2022-02-18 設定プログラム、設定方法および設定装置

Publications (2)

Publication Number Publication Date
JP2023120848A JP2023120848A (ja) 2023-08-30
JP7794014B2 true JP7794014B2 (ja) 2026-01-06

Family

ID=84044046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022023946A Active JP7794014B2 (ja) 2022-02-18 2022-02-18 設定プログラム、設定方法および設定装置

Country Status (3)

Country Link
US (1) US12051246B2 (ja)
EP (1) EP4231251A1 (ja)
JP (1) JP7794014B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12198377B1 (en) * 2023-07-11 2025-01-14 Tomahawk Robotics, Inc. Point of interest tracking and estimation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173903A (ja) 2011-02-21 2012-09-10 Jvc Kenwood Corp 棚監視装置
JP2017157216A (ja) 2016-02-29 2017-09-07 サインポスト株式会社 情報処理システム
WO2019220589A1 (ja) 2018-05-17 2019-11-21 三菱電機株式会社 映像解析装置、映像解析方法、及びプログラム
JP2019211905A (ja) 2018-06-01 2019-12-12 日本電気株式会社 動線分析装置、動線分析方法、および動線分析システム
JP2020053019A (ja) 2018-07-16 2020-04-02 アクセル ロボティクス コーポレーションAccel Robotics Corp. 自律店舗追跡システム
JP2021514512A (ja) 2018-02-20 2021-06-10 アップリフト ラブズ インコーポレイテッド 動作の識別および動作情報を用いた規範的な分析の生成

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373322B1 (en) * 2018-07-16 2019-08-06 Accel Robotics Corporation Autonomous store system that analyzes camera images to track people and their interactions with items
US10282852B1 (en) * 2018-07-16 2019-05-07 Accel Robotics Corporation Autonomous store tracking system
CN109871804A (zh) * 2019-02-19 2019-06-11 上海宝尊电子商务有限公司 一种店铺人流识别分析的方法和系统
JP2021107989A (ja) 2019-12-27 2021-07-29 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173903A (ja) 2011-02-21 2012-09-10 Jvc Kenwood Corp 棚監視装置
JP2017157216A (ja) 2016-02-29 2017-09-07 サインポスト株式会社 情報処理システム
JP2021514512A (ja) 2018-02-20 2021-06-10 アップリフト ラブズ インコーポレイテッド 動作の識別および動作情報を用いた規範的な分析の生成
WO2019220589A1 (ja) 2018-05-17 2019-11-21 三菱電機株式会社 映像解析装置、映像解析方法、及びプログラム
JP2019211905A (ja) 2018-06-01 2019-12-12 日本電気株式会社 動線分析装置、動線分析方法、および動線分析システム
JP2020053019A (ja) 2018-07-16 2020-04-02 アクセル ロボティクス コーポレーションAccel Robotics Corp. 自律店舗追跡システム

Also Published As

Publication number Publication date
EP4231251A1 (en) 2023-08-23
JP2023120848A (ja) 2023-08-30
US20230267744A1 (en) 2023-08-24
US12051246B2 (en) 2024-07-30

Similar Documents

Publication Publication Date Title
US9330470B2 (en) Method and system for modeling subjects from a depth map
US20150253864A1 (en) Image Processor Comprising Gesture Recognition System with Finger Detection and Tracking Functionality
JP7162079B2 (ja) 頭部のジェスチャーを介してディスプレイ装置を遠隔制御する方法、システムおよびコンピュータプログラムを記録する記録媒体
JP6474126B2 (ja) オブジェクト追跡方法、装置およびプログラム
CN104850219A (zh) 估计附着物体的人体姿势的设备和方法
JP6103765B2 (ja) 行動認識装置、方法及びプログラム並びに認識器構築装置
CN107341829A (zh) 虚拟现实交互部件的定位方法和装置
KR20200076267A (ko) 골격의 길이 정보를 이용한 제스쳐 인식 방법 및 처리 시스템
CN117726648A (zh) 待跟踪的目标对象确定方法、系统及机器人
JP7794014B2 (ja) 設定プログラム、設定方法および設定装置
CN113836991A (zh) 动作识别系统、动作识别方法及存储介质
CN110910426A (zh) 动作过程和动作趋势识别方法、存储介质和电子装置
Sundaresan et al. Multi-camera tracking of articulated human motion using motion and shape cues
CN110377187A (zh) 估计被遮挡指尖的方法和装置、姿势识别系统及存储介质
EP4485369A1 (en) Information processing program, information processing method, and information processing apparatus
JP6877072B1 (ja) 領域抽出装置、領域抽出方法、及び領域抽出プログラム
JP2012221164A (ja) 動きベクトル検出装置、動きベクトル検出方法及び動きベクトル検出プログラム
KR20180051235A (ko) 사용자의 지시 위치 추정 장치 및 방법
JP2024063801A (ja) 行動識別装置、行動識別装置の制御方法、プログラム、及び記憶媒体
KR101844367B1 (ko) 부분 포즈 추정에 의하여 개략적인 전체 초기설정을 사용하는 머리 포즈 추정 방법 및 장치
Tanaka Detecting collision-free paths by observing walking people
EP4345582B1 (en) Object detection and anchor position and orientation resolution for augmented reality (ar) applications
Takahashi et al. Remarks on a real‐time, noncontact, nonwear, 3D human body posture estimation method
JPH08263629A (ja) 物体の形状・姿勢検出装置
Egashira et al. Vision-based motion capture of interacting multiple people

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20241010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251201

R150 Certificate of patent or registration of utility model

Ref document number: 7794014

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150