JP7820933B2 - 情報処理装置、方法及びプログラム - Google Patents
情報処理装置、方法及びプログラムInfo
- Publication number
- JP7820933B2 JP7820933B2 JP2021165650A JP2021165650A JP7820933B2 JP 7820933 B2 JP7820933 B2 JP 7820933B2 JP 2021165650 A JP2021165650 A JP 2021165650A JP 2021165650 A JP2021165650 A JP 2021165650A JP 7820933 B2 JP7820933 B2 JP 7820933B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- tracking target
- error
- image
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/248—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Description
第1実施形態は、参照画像と探索画像のそれぞれから抽出される追尾対象の特徴を相互相関し、探索画像内の追尾対象の位置の推定誤差(第1誤差)を求める。また、第1実施形態は、特徴抽出NNを用いて抽出した、追尾対象同士の特徴間の距離に対する、追尾対象と類似物それぞれの特徴間の距離に対する相対的な大きさ(第2誤差)を求める。第1実施形態では、第1誤差と第2誤差とに基づいて、特徴抽出NNのパラメータの更新を同時に行い、探索画像内の追尾対象の特徴を識別的にする。これにより、第1実施形態は、追尾対象と類似物それぞれの特徴間の類似度を下げることができ、探索画像内の追尾対象の検出精度を向上させることができる。なお、追尾対象と類似物は人物であるが、これに限定されず、例えば、動物、車両等であってもよい。
図6は、第1実施形態に係る、ニューラルネットワークの学習処理のフローチャートである。以下、図1~図5を参照しつつ処理について説明する。
第2実施形態では、特徴取得部207は、図6のS610において尤度マップ503内の類似物の領域の個数に応じて、尤度の閾値を変動させる。例えば、特徴取得部207が、尤度マップ503においてk個以上の類似物の領域を取得する場合に、尤度マップ503内の尤度の閾値を変動させる。S608で追尾結果算出部205が出力した尤度マップ503において、尤度が閾値以上である類似物の領域がm個あるとする。類似物の領域の個数がk>mである場合、次のイテレーションで特徴取得部207が取得する類似物の領域の個数はk個よりも少なくなる。そこで、特徴取得部207は、次のイテレーションにおいて用いる尤度マップ503内の尤度の閾値をa倍(0≦a<1)する。これにより、特徴取得部207は、尤度マップ503内の類似物の領域の個数を増やすことができる。あるいは、特徴取得部207は、同一イテレーション内でk個以上の類似物の領域を取得できるよう、尤度マップ503内の尤度の閾値を下げることで、類似物の領域の取得をやり直してもよい。なお、尤度マップ503内の類似物の領域を増加させる方法は、これに限定されることはない。
第3実施形態では、図6のS604において学習データ取得部202は、例えば、記憶部104等のデータベースから、追尾対象と同じカテゴリーの類似物が映る画像を取得する。第二の誤差算出部208は、上記の画像を用いて第二の誤差を算出する。まず、学習データ取得部202による類似物が映る画像の取得について説明する。予めデータベースに用意される各画像は、画像内に映る物体の位置及びサイズ(高さ、幅)の正解データ(GT)と、物体のカテゴリー(例えば、人物、動物、車両)の情報を有する。S604で学習データ取得部202は、追尾対象と同じカテゴリーの類似物の画像と、その画像内に存在する類似物の位置とサイズのGTの組を1組以上取得する。ここで、学習データ取得部202は、第1実施形態と同様に、S604で取得する追尾対象の探索範囲画像及び探索画像のGTを取得する。
第4実施形態では、図6のS612においてパラメータ更新部209が、損失の重みづけ係数λ1、λ2を適応的に変動させる。パラメータ更新部209は、重みづけ係数λ1、λ2を勾配法によりニューラルネットワークのパラメータ(NN)とともに更新する。まず、損失Lossは、数7のように定義される。
パラメータ更新部209は、損失の大きさに応じて、学習の途中で第1の誤差によるパラメータ更新と、第2の誤差によるパラメータ更新とを切り替える。まず、パラメータ更新部209は、第1の誤差のみで特徴抽出NN302、特徴抽出NN305及びNN309の学習を行う。その後、パラメータ更新部209は、損失が下がらなくなったタイミングで、第2の誤差のみにより特徴抽出NN302、特徴抽出NN305及びNN309の学習に切り替える。パラメータ更新部209は、第1の誤差のみで特徴抽出NN302、特徴抽出NN305及びNN309の学習を行うために、図6のS612において損失中の重みづけ係数λ2を0とする。また、パラメータ更新部209は、第2の誤差のみで特徴抽出NN302、特徴抽出NN305及びNN309の学習を行うために、図6のS612において損失中の重みづけ係数λ1を0とする。また、パラメータ更新部209は、第2の誤差による特徴抽出NN302、特徴抽出NN305及びNN309の学習で、損失が下がらなくなったタイミングで、第1の誤差によりこれらのNNの学習を行っても良い。
第5実施形態では、上記の距離学習をオンライン追尾手法によるNNの学習に応用する例を説明する。ここで、オンライン追尾とは、NNの推論時に、追尾対象と類似物とが映っている参照画像を用いて、学習済みの物体検出NNをファインチューニングする追尾手法のことをいう。ファインチューニングとは、学習済みモデルの一部もしくは全ての層の重みを微調整する手法のことをいう。第5実施形態では、勾配法を用いて物体検出NNを更新して追尾対象の情報を取り込むことで、新規の画像から追尾対象を検出できるようになる。オンライン追尾手法とSiam手法との違いは2点ある。
図9~10を用いて、NNのオンライン追尾により時系列画像から追尾対象を検出する推論処理の流れを説明する。ここで、オンライン追尾に用いるNNは、前述のように、追尾対象407を追尾するように適合したパラメータの更新を行う事前学習を行っているものとする。図10は、オンライン追尾手法における推論処理のフローチャートである。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (19)
- 追尾対象が映る参照画像と、探索画像と、前記探索画像内の前記追尾対象の位置を示す正解データと、を取得する取得手段と、
画像の各位置の特徴を抽出する抽出手段と、
前記抽出手段が抽出した画像の各位置の特徴に基づいて、画像内で前記追尾対象が存在する位置を推定する推定手段と、
前記推定手段により推定された前記探索画像内の前記追尾対象の位置と、前記正解データが示す前記探索画像内の前記追尾対象の位置と、の第1誤差を算出する第1誤差算出手段と、
前記抽出手段が前記参照画像から抽出した前記追尾対象の特徴である第1特徴と、前記抽出手段が前記探索画像から抽出した、前記正解データが示す位置にある前記追尾対象の特徴である第2特徴と、前記抽出手段が少なくとも前記探索画像から抽出した前記追尾対象に類似する類似物の特徴である第3特徴と、を取得する特徴取得手段と、
特徴空間における前記第1特徴と前記第2特徴との距離の、前記第1特徴又は前記第2特徴と前記第3特徴との距離に対する相対的な大きさを、第2誤差として算出する第2誤差算出手段と、
前記第1誤差と前記第2誤差とに基づいて、前記抽出手段が前記特徴の抽出に用いるパラメータを更新する更新手段と、
を備えることを特徴とする情報処理装置。 - 前記推定手段は、前記探索画像内の各位置について前記追尾対象が存在する尤度を推定する、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記特徴取得手段は、前記探索画像から抽出した、前記追尾対象が存在する尤度が閾値を超え、かつ、前記正解データが示す前記探索画像内の前記追尾対象の位置に該当しない位置における特徴を、前記追尾対象に類似する類似物の前記第3特徴として取得する、
ことを特徴とする請求項1又は2に記載の情報処理装置。 - 前記更新手段が前記パラメータを繰り返し更新する間に、前記特徴取得手段は尤度の前記閾値を変動させる、
ことを特徴とする請求項3に記載の情報処理装置。 - 前記特徴取得手段は、予め用意された前記類似物が映る画像から前記抽出手段が抽出した前記第3特徴を取得する、
ことを特徴とする請求項1又は2のいずれか一項に記載の情報処理装置。 - 前記抽出手段は、ニューラルネットワークを用いて前記画像の各位置の特徴を抽出し、
前記推定手段は、ニューラルネットワークを用いて前記探索画像内で前記追尾対象が存在する位置を推定する、
ことを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。 - 前記更新手段は、前記第1誤差と前記第2誤差とに基づいて、前記推定手段が前記探索画像内で前記追尾対象が存在する位置の推定に用いるパラメータを更新する、
ことを特徴とする請求項1から6のいずれか一項に記載の情報処理装置。 - 第2誤差算出手段は、トリプレットロスを用いて、前記第2誤差を算出する、
ことを特徴とする請求項1から7のいずれか一項に記載の情報処理装置。 - 前記類似物は、前記追尾対象と同じ物体のカテゴリーに属する、
ことを特徴とする請求項1から8のいずれか一項に記載の情報処理装置。 - 前記更新手段は、前記第1誤差と前記第2誤差との双方に基づいて算出された損失に応じて前記パラメータを更新する、
ことを特徴とする請求項1から9のいずれか一項に記載の情報処理装置。 - 前記更新手段は、前記第1誤差と前記第2誤差のそれぞれの重み付けを変更しながら、前記第1誤差と前記第2誤差とを重み付けして合成することにより算出された損失に応じて前記パラメータを更新する、
ことを特徴とする請求項1から10のいずれか一項に記載の情報処理装置。 - 前記推定手段は、前記抽出手段が前記参照画像から抽出した前記追尾対象の特徴である前記第1特徴と、前記抽出手段が抽出した前記探索画像の各位置の特徴とに基づいて、前記探索画像内で前記追尾対象が存在する位置を推定する、
ことを特徴とする請求項1から11のいずれか一項に記載の情報処理装置。 - 前記推定手段は、前記抽出手段が前記参照画像から抽出した前記追尾対象の特徴である前記第1特徴と、前記抽出手段が抽出した前記探索画像の各位置の特徴と、の相互相関に基づいて、前記探索画像内で前記追尾対象が存在する位置を推定する、
ことを特徴とする請求項12に記載の情報処理装置。 - 前記探索画像内の前記追尾対象の指定を受け付ける受付手段を更に備える、
ことを特徴とする請求項1から13のいずれか一項に記載の情報処理装置。 - 前記推定手段は、前記抽出手段が抽出した前記探索画像の各位置の特徴に基づいて、前記探索画像内で前記追尾対象のサイズを更に推定する、
ことを特徴とする請求項1から14のいずれか一項に記載の情報処理装置。 - 前記更新手段は、前記第1誤差と前記第2誤差との和が小さくなるように前記パラメータを更新することを特徴とする請求項1から請求項15のいずれか一項に記載の情報処理装置。
- 前記第2誤差算出手段は、特徴空間における前記追尾対象の特徴と前記類似物の特徴との距離が前記追尾対象同士の特徴間の距離よりも大きくなるよう前記第2誤差を算出することを特徴とする請求項1から請求項16のいずれか一項に記載の情報処理装置。
- 少なくとも一つのコンピュータによって実装され、
取得部が、追尾対象が映る参照画像と、探索画像と、前記探索画像内の前記追尾対象の位置を示す正解データと、を取得する取得工程と、
特徴抽出部が、画像の各位置の特徴を抽出する抽出工程と、
推定部が、抽出した画像の各位置の特徴に基づいて、画像内で前記追尾対象が存在する位置を推定する推定工程と、
第1の誤差算出部が、推定された前記探索画像内の前記追尾対象の位置と、前記正解データが示す前記探索画像内の前記追尾対象の位置と、の第1誤差を算出する第1誤差算出工程と、
特徴取得部が、前記参照画像から抽出した前記追尾対象の特徴である第1特徴と、前記探索画像から抽出した、前記正解データが示す位置にある前記追尾対象の特徴である第2特徴と、少なくとも前記探索画像から抽出した前記追尾対象に類似する類似物の特徴である第3特徴と、を取得する特徴取得工程と、
第2の誤差算出部が、特徴空間における前記第1特徴と前記第2特徴との距離の、前記第1特徴又は前記第2特徴と前記第3特徴との距離に対する相対的な大きさを、第2誤差として算出する第2誤差算出工程と、
更新部が、前記第1誤差と前記第2誤差とに基づいて、前記特徴の抽出に用いるパラメータを更新する更新工程と、
を備えることを特徴とする方法。 - コンピュータを、請求項1から17のいずれか一項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021165650A JP7820933B2 (ja) | 2021-10-07 | 2021-10-07 | 情報処理装置、方法及びプログラム |
| US17/955,648 US20230111393A1 (en) | 2021-10-07 | 2022-09-29 | Information processing apparatus and method, and non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021165650A JP7820933B2 (ja) | 2021-10-07 | 2021-10-07 | 情報処理装置、方法及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023056349A JP2023056349A (ja) | 2023-04-19 |
| JP7820933B2 true JP7820933B2 (ja) | 2026-02-26 |
Family
ID=85798773
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021165650A Active JP7820933B2 (ja) | 2021-10-07 | 2021-10-07 | 情報処理装置、方法及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20230111393A1 (ja) |
| JP (1) | JP7820933B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2024081404A (ja) | 2022-12-06 | 2024-06-18 | キヤノン株式会社 | 情報処理装置およびその制御方法 |
| JP7840911B2 (ja) * | 2023-07-24 | 2026-04-06 | 株式会社東芝 | 情報処理装置、方法およびプログラム |
| CN119622388B (zh) * | 2025-02-12 | 2025-06-06 | 中国电子科技集团有限公司电子科学研究院 | 一种基于深度度量的机载多模态协同目标检测方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017156886A (ja) | 2016-02-29 | 2017-09-07 | Kddi株式会社 | 画像間類似度を考慮して物体を追跡する装置、プログラム及び方法 |
| CN110147836A (zh) | 2019-05-13 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 模型训练方法、装置、终端及存储介质 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140063237A1 (en) * | 2012-09-03 | 2014-03-06 | Transportation Security Enterprises, Inc.(TSE), a Delaware corporation | System and method for anonymous object identifier generation and usage for tracking |
| JP6295122B2 (ja) * | 2014-03-27 | 2018-03-14 | 株式会社メガチップス | 状態推定装置、プログラムおよび集積回路 |
| JP2017041022A (ja) * | 2015-08-18 | 2017-02-23 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
| US20210133474A1 (en) * | 2018-05-18 | 2021-05-06 | Nec Corporation | Image processing apparatus, system, method, and non-transitory computer readable medium storing program |
| US11348339B2 (en) * | 2019-08-13 | 2022-05-31 | Uatc, Llc | Association and tracking for autonomous devices |
| CN112767450A (zh) * | 2021-01-25 | 2021-05-07 | 开放智能机器(上海)有限公司 | 一种基于多损失学习的相关滤波目标跟踪方法及系统 |
-
2021
- 2021-10-07 JP JP2021165650A patent/JP7820933B2/ja active Active
-
2022
- 2022-09-29 US US17/955,648 patent/US20230111393A1/en not_active Abandoned
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017156886A (ja) | 2016-02-29 | 2017-09-07 | Kddi株式会社 | 画像間類似度を考慮して物体を追跡する装置、プログラム及び方法 |
| CN110147836A (zh) | 2019-05-13 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 模型训练方法、装置、终端及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023056349A (ja) | 2023-04-19 |
| US20230111393A1 (en) | 2023-04-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7681762B2 (ja) | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 | |
| CN111914878B (zh) | 特征点跟踪训练及跟踪方法、装置、电子设备及存储介质 | |
| JP7820933B2 (ja) | 情報処理装置、方法及びプログラム | |
| JP7131994B2 (ja) | 自己位置推定装置、自己位置推定方法、自己位置推定プログラム、学習装置、学習方法及び学習プログラム | |
| Xu et al. | A scene-adaptive descriptor for visual SLAM-based locating applications in built environments | |
| CN114565655B (zh) | 一种基于金字塔分割注意力的深度估计方法及装置 | |
| CN112580438B (zh) | 一种三维场景下的点云识别方法 | |
| CN115482252B (zh) | 基于运动约束的slam闭环检测和位姿图优化方法 | |
| CN116210030A (zh) | 基于半监督关键点的模型 | |
| CN109697236A (zh) | 一种多媒体数据匹配信息处理方法 | |
| CN113592015B (zh) | 定位以及训练特征匹配网络的方法和装置 | |
| CN116844185B (zh) | 基于质量分数的多人姿态识别方法 | |
| CN119149856B (zh) | 一种用于复杂背景下的无人机检测跟踪方法及装置 | |
| CN118786440A (zh) | 使用自监督学习训练对象发现神经网络和特征表示神经网络 | |
| CN117115474A (zh) | 一种基于多阶段特征提取的端到端单目标跟踪方法 | |
| WO2022177666A1 (en) | Personalized local image features using bilevel optimization | |
| CN114972437B (zh) | 一种基于响应峰值的多特征融合目标跟踪定位方法 | |
| CN121147271A (zh) | 一种面向部分重叠点云配准的改进utopic方法 | |
| US12547897B2 (en) | Position determination by means of neural networks | |
| CN113658218A (zh) | 一种双模板密集孪生网络跟踪方法、装置及存储介质 | |
| CN111815677A (zh) | 目标追踪方法、装置、终端设备和可读存储介质 | |
| CN119407789A (zh) | 一种机械臂抓取目标检测方法和系统 | |
| CN121532805A (zh) | 基于演示样例执行图像处理任务 | |
| De Giacomo et al. | Guided sonar-to-satellite translation | |
| JP2013073333A (ja) | 画像マッチング装置及び画像マッチングプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240927 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250901 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251031 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260116 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260213 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7820933 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |