JP7619103B2 - 情報処理装置、情報処理システム、情報処理方法、及び、プログラム - Google Patents
情報処理装置、情報処理システム、情報処理方法、及び、プログラム Download PDFInfo
- Publication number
- JP7619103B2 JP7619103B2 JP2021042139A JP2021042139A JP7619103B2 JP 7619103 B2 JP7619103 B2 JP 7619103B2 JP 2021042139 A JP2021042139 A JP 2021042139A JP 2021042139 A JP2021042139 A JP 2021042139A JP 7619103 B2 JP7619103 B2 JP 7619103B2
- Authority
- JP
- Japan
- Prior art keywords
- inference
- data
- target object
- unit
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Description
一次推論として、少なくとも一部のデータが第1の対象物体を含む推論対象データを、第1の学習済モデルに適用して、第1の対象物体を推論する一次推論手段と、
一次推論において推論された第1の対象物体を用いて、推論対象データより数量が少ないデータである集約データを生成し、推論対象データにおける第1の対象物体の位置と、集約データにおける第1の対象物体の位置との対応関係を生成するデータ集約手段と、
二次推論として、集約データを第2の学習済モデルに適用して第1の対象物体を推論する二次推論手段と、
二次推論の結果における第1の対象物体と、対応関係とを用いて、推論対象データにおける第1の対象物体を推論する物体推論手段と
を含む。
上記の情報処理装置と、
情報処理装置に推論対象データを出力するデータ取得装置と、
情報処理装置から推論の結果を取得し、取得した推論の結果を表示する表示装置と
を含む。
一次推論として、少なくとも一部のデータが第1の対象物体を含む推論対象データを、第1の学習済モデルに適用して、第1の対象物体を推論し、
一次推論において推論された第1の対象物体を用いて、推論対象データより数量が少ないデータである集約データを生成し、推論対象データにおける第1の対象物体の位置と、集約データにおける第1の対象物体の位置との対応関係を生成し、
二次推論として、集約データを第2の学習済モデルに適用して第1の対象物体を推論し、
二次推論の結果における第1の対象物体と、対応関係とを用いて、推論対象データにおける第1の対象物体を推論する。
情報処理装置が上記の情報処理方法を実行し、
データ取得装置が、情報処理装置に推論対象データを出力し、
表示装置が、情報処理装置から推論の結果を取得し、取得した推論の結果を表示する。
一次推論として、少なくとも一部のデータが第1の対象物体を含む推論対象データを、第1の学習済モデルに適用して、第1の対象物体を推論する処理と、
一次推論において推論された第1の対象物体を用いて、推論対象データより数量が少ないデータである集約データを生成する処理と、推論対象データにおける第1の対象物体の位置と、集約データにおける第1の対象物体の位置との対応関係を生成する処理と、
二次推論として、集約データを第2の学習済モデルに適用して第1の対象物体を推論する処理と、
二次推論の結果における第1の対象物体と、対応関係とを用いて、推論対象データにおける第1の対象物体を推論する処理と
をコンピュータに実行させる。
(1)推論対象のデータ:カメラなどが撮影した画像(静止画又は動画)、
(2)推論のタスク:画像における対象物体を推論する物体検出タスク、
(3)推論の結果:「BB、クラス、及び、confidence」の組、
(4)対象物体:車両のライセンスプレート(License Plate:LP)。
[構成の説明]
図面を用いて、第1の実施形態の構成について説明する。図1は、第1の実施形態にかかる情報処理装置1の構成の一例を示すブロック図である。情報処理装置1は、物体推論部10と、一次推論部20と、データ集約部30と、二次推論部40と、データ保存部50と、データ生成部60と、モデル生成部70と、モデル保存部80と、データ取得部90とを含む。
データ取得部90は、所定の装置から、推論の対象となる物体(以下、「対象物体」と呼ぶ)含むデータ(以下、「推論対象データ」と呼ぶ)を取得する。推論対象データは、少なくとも一部のデータが対象物体を含めばよい。つまり、少なくとも一部の推論対象データは、対象物体を含まなくてもよい。データ取得部90が推論対象データを取得する装置は、任意である。例えば、データ取得部90は、推論対象データとして、監視カメラから画像を取得してもよい。
一次推論部20は、推論対象データにおける対象物体(例えば、LP)を推論する。以下、一次推論部20における推論を「一次推論」と呼ぶ。一次推論部20は、一次推論の対象として、対象物体(例えば、LP)に加え、対象物体と所定の位置関係にある物体(例えば、LPの周辺物体)を推論してもよい。以下、対象物体と所定の位置関係にある物体を「サブ対象物体」と呼ぶ。以下の説明では、一次推論部20は、対象物体とサブ対象物体とを推論する。ただし、これは、一次推論部20の動作を限定するものではない。一次推論部20は、サブ対象物体を推論しなくてもよい。また、以下の説明では、情報処理装置1における推論の対象物体を「第1の対象物体」と呼び、サブ対象物体を「第2の対象物体」と呼ぶ場合もある。
データ集約部30は、一次推論の結果に含まれる対象物体を用いて、以下で説明する処理を実行する。ただし、一次推論部20が対象物体に加えサブ対象物体を推論する場合、データ集約部30は、対象物体に加え、サブ対象物体を用いてもよい。以下の説明では、データ集約部30は、対象物体及びサブ対象物体を用いる。ただし、データ集約部30は、サブ対象物体を用いなくてもよい。この場合、データ集約部30は、以下の説明におけるサブ対象物体に関連する動作を省略すればよい。
データ集約部30は、集約データの生成前において、以下で説明する後処理を実行する。例えば、データ集約部30は、対象物体とサブ対象物体との位置関係と、一次推論の結果とを用いて、一次推論の結果の中から不要なサブ対象物体の領域(例えば、BB)を破棄する。例えば、データ集約部30は、一次推論の結果に含まれるサブ対象物体において、そのサブ対象物体と所定の位置関係にある対象物体が一次推論の結果に含まれるサブ対象物体を破棄する。あるいは、データ集約部30は、一次推論の結果として推論された対象物体(例えば、LP)に対応するサブ対象物体(例えば、車前後面)のBBを破棄してもよい。言い換えると、データ集約部30は、一次推論の結果に含まれるサブ対象物体において、所定の位置関係にある対象物体が一次推論の結果に含まれないサブ対象物体を集約の対象として用いる。「サブ対象物体が対象物体を含む位置関係」及び「BB」を用いて、この動作を用いる理由を説明する。
データ集約部30は、後処理後の一次推論の結果における対象物体及びサブ対象物体の領域(例えば、対象物体のBBを含む領域及びサブ対象物体のBBを含む領域)を集めた集約データを生成する。詳細には、データ集約部30は、推論対象データにおける後処理後の一次推論の結果における対象物体の領域及びサブ対象物体の領域を抽出(又は複製)し、抽出(又は複製)した領域を集めた集約データを生成する。
二次推論部40は、データ集約部30が生成した集約データにおける対象物体を推論する。以下、二次推論部40にける推論を「二次推論」と呼ぶ。二次推論部40は、二次推論において、機械学習を用いる。詳細には、二次推論部40は、モデル保存部80に保存されている学習済モデルを用いて、集約データにおける対象物体を推論する。以下、二次推論部40が用いる学習済モデルを「二次推論用学習済モデル」又は「第2の学習済モデル」と呼ぶ。例えば、二次推論部40は、二次推論用学習済モデルを用いて、二次推論の結果として、集約データに含まれる対象物体の「BB、クラス、及び、confidence」の組を推論する。
データ生成部60は、所定のデータセット(以下、「オリジナル学習用データセット」又は「第1のデータセット」と呼ぶ)を用いて、機械学習に用いる学習用データセットを生成する。オリジナル学習用データセットに含まれるデータは、機械学習の手法に対応したデータであれば任意である。例えば、オリジナル学習用データセットは、対象物体に関する正解データを含む画像群である。なお、オリジナル学習用データセットの取得元は、任意である。例えば、オペレータが、予め、データ保存部50にオリジナル学習用データセットを保存してもよい。あるいは、データ生成部60が、学習用データセットの生成において、図示しない装置からオリジナル学習用データセットを取得してもよい。
データ保存部50は、一次推論学習用データセット及び二次推論学習用データセットを保存する。さらに、データ保存部50は、オリジナル学習用データセットを保存してもよい。オリジナル学習用データセットの取得元は、任意である。例えば、オペレータが、予め、データ保存部50に、オリジナル学習用データセットを保存してもよい。
モデル生成部70は、所定のモデルに対して、データ保存部50に保存されている一次推論学習用データセットを用いた機械学習を実行して、一次推論部20が用いる一次推論用学習済モデル(第1の学習済モデル)を生成する。さらに、モデル生成部70は、所定のモデルに対して、データ保存部50に保存されている二次推論学習用データセットを用いた機械学習を実行して、二次推論部40が用いる二次推論用学習済モデル(第2の学習済モデル)を生成する。なお、学習済モデルの生成に用いられるモデルの取得元は、任意である。例えば、オペレータが、予め、モデル保存部80にモデルを保存してもよい。あるいは、モデル生成部70が、学習済モデルの生成において、図示しない装置から学習済モデルの生成に用いるモデルを取得してもよい。
モデル保存部80は、一次推論用学習済モデル及び二次推論用学習済モデルを保存する。モデル保存部80は、モデル生成部70が学習済モデルの生成に用いるモデルを保存してもよい。例えば、オペレータが、予め、モデル保存部80に、学習済モデルの生成に用いるモデルを保存してもよい。
物体推論部10は、二次推論部40における二次推論の結果(集約データにおける対象物体)と、データ集約部30が集約データの生成において生成した集約対応関係とを用いて、推論対象データにおける対象物体を推論する。例えば、集約対応関係としてBBの座標変換が保存されている場合、物体推論部10は、BBの推論位置として、その座標変換の逆変換を、二次推論の結果として推論されたBBの座標に適用して、推論対象データにおける対象物体のBBの位置を算出する。例えば、二次推論の結果として得られたBBの矩形が、集約データにおける矩形(一次推論の結果として得られたBBに基づいて生成された矩形)からはみ出している場合、物体推論部10は、そのBBを破棄してもよい。あるいは、例えば、二次推論の結果として得られたBBの矩形と集約データ上での矩形との積集合部分の面積を、二次推論の結果として得られたBBの矩形の面積で除した値(商)が、所定の閾値未満の場合、物体推論部10は、そのBBを破棄してもよい。なお、上記の商が所定の閾値以上の場合、物体推論部10は、そのBBの矩形を上記の積集合部分に修正してもよい。
(A)学習済モデルの生成の動作
図2は、第1の実施形態にかかる情報処理装置1における学習済モデルの生成の動作の一例を示すフロー図である。情報処理装置1は、所定の条件を契機に、学習済モデルの生成を開始する。例えば、情報処理装置1は、オペレータからの指示を契機に、学習済モデルの生成を開始する。この場合、動作の開始において、情報処理装置1は、オペレータから学習済モデルの生成に必要なパラメタを取得してもよい。
図3は、第1の実施形態にかかる情報処理装置1における対象物体の推論の動作の一例を示すフロー図である。なお、推論の動作の開始前には、モデル保存部80は、学習済モデルを保存している。ただし、モデル保存部80が学習済モデルを保存していない場合、情報処理装置1は、「(A)学習済モデルの生成」の動作を実行して学習済モデルを生成してから、推論の動作を開始してもよい。
(a)一次推論において推論したBBの数が所定の数に達した場合、
(b)一次推論において推論したBBのサイズの合計が所定の値に達した場合、
(c)集約データの数を推論し、推論した集約データの数が所定の値に達した場合、
(d)情報処理装置1が取得してから所定の時間が経過した推論対象データ。
ただし、一次推論部20は、取得済みの全ての推論対象データに対して、一次推論を実行してもよい。推論対象データ群に対して一次推論を実行する場合、一次推論部20は、推論対象データ群に含まれる少なくとも一部の推論対象データに対する一次推論を並列処理してもよく、全ての一次推論を逐次処理してもよく、並列処理と逐次処理とを組み合わせてもよい。
第1の実施形態にかかる情報処理装置1は、対象物体の推論のスループットを向上させる効果を奏することができる。その理由は、次のとおりである。
(1)推論対象データは、画像である。
(2)関連推論の性能(例えば、処理速度及び精度)及び規模は、二次推論部40における二次推論の性能及び規模と同じである。なお、関連推論及び二次推論が一枚の画像の推論に必要な時間は、単位時間(以下、単位時間は「1」とする)である。
(3)一次推論部20における一次推論が一枚の画像の推論に必要な時間は、関連推論及び二次推論の10分の1(0.1)である。
(4)データ集約部30は、平均的に、3枚の推論対象の画像から1枚の集約した画像を生成する(推論対象の画像の数と、集約結果の画像の数との比は、3:1である)。
(5)画像の総数は、Nである。
(6)推論以外の処理は、推論に対して処理時間が小さいため、無視する。
ここまでの説明では、一次推論部20及び二次推論部40が一つの場合の例を用いて説明した。しかし、情報処理装置1の構成は、これに限定されない。例えば、情報処理装置1は、複数の一次推論部20を含んでもよい。この場合、複数の一次推論部20は、それぞれ、異なるパラメタ(例えば、学習済みモデル、データのサイズ、又は、認識対象クラス)を用いて推論してもよい。さらに、複数の一次推論部20の全てが、同じ推論対象データを用いて推論してもよい。あるいは、少なくとも一部の一次推論部20が、他の一次推論部20とは異なる推論対象データを用いて推論してもよい。
(1)BBのサイズ又はアスペクト比、
(2)BBのクラス、
(3)BBのconfidence、
(4)BBの一次推論の結果における位置、
(5)BBが対象物体のBBの場合、対応するサブ対象物体が検出されたか否か。
上記の説明では、物体推論部10と、一次推論部20と、データ集約部30と、二次推論部40と、データ保存部50と、データ生成部60と、モデル生成部70と、モデル保存部80と、データ取得部90とが一つの装置に含まれる例を用いて説明した。しかし、第1の実施形態は、これに限定されない。例えば、情報処理装置1は、各構成に相当する機能を備えた装置を、所定のネットワークを介して接続して、構成されてもよい。例えば、情報処理装置1は、クラウドコンピューティングを用いて実現されてもよい。あるいは、情報処理装置1の各構成部は、ハードウェア回路で構成されてもよい。あるいは、情報処理装置1において、複数の構成部が、1つのハードウェアで構成されてもよい。
図10は、情報処理装置1を含む情報処理システム400の構成の一例を示すブロック図である。情報処理システム400は、情報処理装置1と、データ取得装置200と、表示装置300とを含む。情報処理システム400は、それぞれの装置として、複数の装置を含んでもよい。例えば、情報処理システム400は、複数のデータ取得装置200を含んでもよい。なお、情報処理システム400は、図示しない装置を含んでもよい。例えば、情報処理システム400は、情報処理装置1の推論結果を用いて、対象物体に関連する所定の情報を認識する装置(例えば、OCR装置)を含んでもよい。
一次推論及び二次推論の負荷は、推論に用いる学習済モデルごとに異なる。例えば、推論の精度が高い学習済モデルは、一般的に負荷が高い。しかし、負荷が高い学習済モデルを用いる場合、スループットは低下する。あるいは、データ集約の負荷は、データ集約における後処理と集約の処理とに対応して異なる。あるいは、データ集約において用いられる集約データの生成方法(例えば、領域のまとめ方)及び集約データの形式(例えば、サイズ、及び画像間の隙間)は、推論精度に影響する。
図11は、第2の実施形態にかかる情報処理装置1Bの構成の一例を示すブロック図である。情報処理装置1Bは、物体推論部10と、一次推論部20Bと、データ集約部30Bと、二次推論部40Bと、データ保存部50Bと、データ生成部60Bと、モデル生成部70Bと、モデル保存部80Bと、データ取得部90とを含む。情報処理装置1Bは、第1の実施形態と同様に、図9に示したようなコンピュータ装置を用いて構成されてもよい。
(1)学習に用いる学習用データセット、
(2)モデルのネットワーク構造、
(3)モデルのハイパーパラメタ、
(4)モデルに含まれる重み精度、
(5)モデルにおけるバッチサイズ、
(6)対象物体に対するサブ対象物体の位置関係、
(7)対象物体に対するサブ対象物体の数。
(1)情報処理装置1Bを構成する演算に関連するハードウェアリソース、
(1-1)CPU及びALU(GPU、FPGA、又は、ASIC)の少なくとも一つの使用率又は稼働率、
(1-2)情報処理装置1Bにおける構成の少なくとも一つにおける処理のためのデータキューの長さ、又は、処理待ち時間、
(1-3)情報処理装置1Bに含まれるセンサ(図示せず)の測定値(例えば、温度、又は、消費電力)、
(2)推論対象データのサイズ、
(3)一次推論部20Bにおける一次推論の結果(例えば、後処理の対象となるBBの数又は、面積)、
(4)データ集約部30Bにおける後処理の結果(例えば、後処理後のBBの数又は面積)、
(5)データ集約部30Bにおける集約の結果(例えば、集約データのサイズ)、
(6)推論対象データのサイズと、集約データのサイズとの比、
(7)二次推論部40Bにおける二次推論の結果(例えば、二次推論に含まれるBBの数又は面積)、
(8)一次推論及び二次推論の少なくとも一方の処理時間(処理時間は、実測された時間でもよく、予め設定された推論対象データのサイズと処理時間との関係を用いて算出された時間でもよい)。
(1)推論に使用する学習済モデルの変更:
負荷が低い学習済モデルを用いる場合、一次推論部20B及び二次推論部40Bのスループットは向上する。ただし、推論精度は、低くなる。負荷が高いが精度が高い学習済モデルを用いる場合、一次推論部20B及び二次推論部40Bのスループットは、低下する。ただし、推論精度は、高くなる。
(2)まとめて一次推論を実行する所定の数量の変更:
まとめて一次推論を実行する所定の数量を減らす場合、情報処理装置1は、推論対象データに対する最終的な推論結果を得るまでの時間(レイテンシ)を短くすることができる。
(1)データ集約におけるパラメタ(例えば、BBのフィルタリング又はBB調整における閾値又はBBの修正量)の変更:
フィルタリング対象が少なくなるように(フィルタリング後のデータの数量が少なくなるように)フィルタリングの閾値を変更する場合、データ集約部30Bのスループットは、向上する。ただし、二次推論部40Bにおける推論精度は、低下する。フィルタリング対象が多くなるように(フィルタリング後のデータの数量が多くなるように)フィルタリングの閾値を変更する場合、データ集約部30Bのスループットは、低下する。ただし、二次推論部40Bにおける推論精度は、向上する。
(2)集約データにおいて複製するデータの間に設ける隙間の変更:
隙間を狭くする場合、データ集約部30Bのスループットは、向上する。ただし、二次推論部40Bにおける推論精度は、低下する。隙間を広くする場合、データ集約部30Bのスループットは、低下する。ただし、二次推論部40Bにおける推論精度は、向上する。
(3)領域のまとめ方:
(3-1)重複している領域及び近接する領域をまとめるか否かの変更:
領域をまとめない場合、データ集約部30Bのスループットは、向上する。ただし、二次推論部40Bにおける推論精度は、低下する。領域をまとめる場合、データ集約部30Bのスループットは、低下する。ただし、二次推論部40Bにおける推論精度は、向上する。
(3-2)近接と判定する距離の変更:
近接と判定する距離を短くする場合、データ集約部30Bのスループットは、向上する。ただし、二次推論部40Bにおける推論精度は、低下する。近接と判定する距離を長くする場合、データ集約部30Bのスループットは、低下する。ただし、二次推論部40Bにおける推論精度は、向上する。
(4)集約データのサイズの変更:
集約データのサイズを小さくする場合、データ集約部30Bのスループットは、向上する。ただし、二次推論部40Bにおける推論精度は、低下する。集約データのサイズを大きくする場合、データ集約部30Bのスループットは、低下する。ただし、二次推論部40Bにおける推論精度は、向上する。
(1)サブ対象物体の利用の変更:
情報処理装置1Bは、負荷に応じて、サブ対象物体を使用するか否かを切り替えてもよい。サブ対象物体を使用しない場合、情報処理装置1Bのスループットは、向上する。ただし、最終的な推論精度は、低下する。サブ対象物体を使用する場合、情報処理装置1Bのスループットは、低下する。ただし、最終的な推論精度は、向上する。
(2)一次推論の有無:
情報処理装置1Bは、負荷に応じて、一次推論(一次推論部20B)を使用するか否かを切り替えてもよい。集約データの数量が多い状況で、一次推論を使用しない場合、情報処理装置1Bのスループットは、向上する。集約データの数量が多い状況で、一次推論を使用する場合、情報処理装置1Bのスループットは、低下する。このように、推論パラメタに含まれる一次推論の切り替えは、一次推論の実行の有無を含む。なお、一次推論を使用しない場合におけるその他の構成要素の動作は、任意である。例えば、一次推論を使用しない場合、データ集約部30Bは、推論対象データを用いて集約データを生成してもよい。あるいは、一次推論を使用しない場合、二次推論部40Bは、二次推論として、推論対象データにおける対象物体を推論してもよい。
次に、図面を用いて、第2の実施形態にかかる情報処理装置1Bの動作を説明する。以下の説明では、負荷の一例として、データ集約部30Bが単位時間当たりに生成する集約データの数量の平均値(以下、「集約データ生成速度」と呼ぶ)を用いる。また、変更する推論パラメタとして、一次推論部20Bが用いる学習済モデル(一次推論用学習済モデル)を用いる。情報処理装置1Bは、負荷が低い状況において、より高い推論精度を得られるように動作する。具体的には、集約データ生成速度が閾値以下の場合(負荷が低い場合)、一次推論部20Bは、一次推論に、高精度の学習済モデル(つまり、負荷が高い学習済モデル)を使用する。反対に、集約データ生成速度が閾値を超えている場合(負荷が高い場合)、一次推論部20Bは、一次推論に、負荷が低い学習済モデル(つまり、低精度の学習済モデル)を使用する。
第2の実施形態にかかる情報処理装置1Bは、第1の実施形態の効果に加え、さらにスループットを向上することができる。あるいは、第2の実施形態にかかる情報処理装置1Bは、第1の実施形態の効果に加え、推論の精度を向上することができる。その理由は、次の通りである。
情報処理装置1及び1Bは、図示しない他の装置から一次推論用学習済モデル及び二次推論用学習済モデルを取得してもよい。あるいは、情報処理装置1及び1Bは、所定の記憶装置に保存された推論対象データを用いてもよい。
1B 情報処理装置
1C 情報処理装置
10 物体推論部
20 一次推論部
20B 一次推論部
30 データ集約部
30B データ集約部
40 二次推論部
40B 二次推論部
50 データ保存部
50B データ保存部
60 データ生成部
60B データ生成部
70 モデル生成部
70B モデル生成部
80 モデル保存部
80B モデル保存部
90 データ取得部
200 データ取得装置
300 表示装置
400 情報処理システム
610 CPU
611 ALU
620 ROM
630 RAM
640 記憶装置
650 NIC
690 記憶媒体
Claims (10)
- 一次推論として、少なくとも一部のデータが第1の対象物体を含む推論対象データを、第1の学習済モデルに適用して、前記第1の対象物体を推論する一次推論手段と、
前記一次推論において推論された前記第1の対象物体を用いて、前記推論対象データより数量が少ないデータである集約データを生成し、前記推論対象データにおける前記第1の対象物体の位置と、前記集約データにおける前記第1の対象物体の位置との対応関係を生成するデータ集約手段と、
二次推論として、前記集約データを第2の学習済モデルに適用して前記第1の対象物体を推論する二次推論手段と、
前記二次推論の結果における前記第1の対象物体と、前記対応関係とを用いて、前記推論対象データにおける前記第1の対象物体を推論する物体推論手段と
を含む情報処理装置。 - 前記一次推論手段が、前記第1の対象物体に対して所定の位置関係にある第2の対象物体を推論し、
前記データ集約手段が、前記第1の対象物体と、前記第2の対象物体とを用いて、前記集約データと、前記対応関係とを生成する
請求項1に記載の情報処理装置。 - 前記データ集約手段が、前記一次推論の結果に含まれる前記第2の対象物体において、前記位置関係にある前記第1の対象物体が前記一次推論の結果に含まれない前記第2の対象物体を用いる
請求項2に記載の情報処理装置。 - 前記データ集約手段が、前記集約データの生成前に、前記一次推論の結果に含まれる前記第1の対象物体の少なくとも一部に対して所定の処理を実行する
請求項1ないし3のいずれか1項に記載の情報処理装置。 - 第1のデータセットを用いて、前記第1の学習済モデルの学習に用いられる第1の学習用データセットを生成し、前記第1のデータセット及び前記第1の学習用データセットの少なくとも一方を用いて前記第2の学習済モデルの学習に用いる第2の学習用データセットを生成するデータ生成手段と、
前記第1の学習用データセットを用いて前記第1の学習済モデルを生成し、前記第2の学習用データセットを用いて前記第2の学習済モデルを生成するモデル生成手段と
を含む請求項1ないし4のいずれか1項に記載の情報処理装置。 - 情報処理装置における所定の負荷又はスループットに基づいて、前記一次推論、前記二次推論、及び、データ集約の少なくとも一つを切り替える
請求項1ないし5のいずれか1項に記載の情報処理装置。 - 請求項1ないし6のいずれか1項に記載の情報処理装置と、
前記情報処理装置に前記推論対象データを出力するデータ取得装置と、
前記情報処理装置から推論の結果を取得し、取得した推論の結果を表示する表示装置と
を含む情報処理システム。 - 一次推論として、少なくとも一部のデータが第1の対象物体を含む推論対象データを、第1の学習済モデルに適用して、前記第1の対象物体を推論し、
前記一次推論において推論された前記第1の対象物体を用いて、前記推論対象データより数量が少ないデータである集約データを生成し、前記推論対象データにおける前記第1の対象物体の位置と、前記集約データにおける前記第1の対象物体の位置との対応関係を生成し、
二次推論として、前記集約データを第2の学習済モデルに適用して前記第1の対象物体を推論し、
前記二次推論の結果における前記第1の対象物体と、前記対応関係とを用いて、前記推論対象データにおける前記第1の対象物体を推論する
情報処理方法。 - 情報処理装置が請求項8に記載の情報処理方法を実行し、
データ取得装置が、前記情報処理装置に前記推論対象データを出力し、
表示装置が、前記情報処理装置から推論の結果を取得し、取得した推論の結果を表示する
情報処理方法。 - 一次推論として、少なくとも一部のデータが第1の対象物体を含む推論対象データを、第1の学習済モデルに適用して、前記第1の対象物体を推論する処理と、
前記一次推論において推論された前記第1の対象物体を用いて、前記推論対象データより数量が少ないデータである集約データを生成する処理と、前記推論対象データにおける前記第1の対象物体の位置と、前記集約データにおける前記第1の対象物体の位置との対応関係を生成する処理と、
二次推論として、前記集約データを第2の学習済モデルに適用して前記第1の対象物体を推論する処理と、
前記二次推論の結果における前記第1の対象物体と、前記対応関係とを用いて、前記推論対象データにおける前記第1の対象物体を推論する処理と
をコンピュータに実行させるプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021042139A JP7619103B2 (ja) | 2021-03-16 | 2021-03-16 | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム |
| US17/689,043 US20220300839A1 (en) | 2021-03-16 | 2022-03-08 | Information processing device, information processing method, and recording medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021042139A JP7619103B2 (ja) | 2021-03-16 | 2021-03-16 | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022142119A JP2022142119A (ja) | 2022-09-30 |
| JP7619103B2 true JP7619103B2 (ja) | 2025-01-22 |
Family
ID=83283731
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021042139A Active JP7619103B2 (ja) | 2021-03-16 | 2021-03-16 | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20220300839A1 (ja) |
| JP (1) | JP7619103B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7476976B2 (ja) * | 2020-10-30 | 2024-05-01 | 日本電信電話株式会社 | 推論装置、推論方法、及び推論プログラム |
| JP7552903B2 (ja) * | 2021-06-24 | 2024-09-18 | 日本電信電話株式会社 | 処理方法、処理システム及び処理プログラム |
| WO2025069227A1 (ja) * | 2023-09-26 | 2025-04-03 | 富士通株式会社 | 物体検知プログラム、複製検証プログラム、複製検証方法、及び情報処理装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019021001A (ja) | 2017-07-14 | 2019-02-07 | オムロン株式会社 | 物体検出装置、物体検出方法、およびプログラム |
| JP2021510225A (ja) | 2018-01-11 | 2021-04-15 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ビデオチューブを使用した行動認識方法 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017139927A1 (en) * | 2016-02-17 | 2017-08-24 | Intel Corporation | Region proposal for image regions that include objects of interest using feature maps from multiple layers of a convolutional neural network model |
| US11475351B2 (en) * | 2017-11-15 | 2022-10-18 | Uatc, Llc | Systems and methods for object detection, tracking, and motion prediction |
| US11301705B2 (en) * | 2020-02-27 | 2022-04-12 | Western Digital Technologies, Inc. | Object detection using multiple neural network configurations |
-
2021
- 2021-03-16 JP JP2021042139A patent/JP7619103B2/ja active Active
-
2022
- 2022-03-08 US US17/689,043 patent/US20220300839A1/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019021001A (ja) | 2017-07-14 | 2019-02-07 | オムロン株式会社 | 物体検出装置、物体検出方法、およびプログラム |
| JP2021510225A (ja) | 2018-01-11 | 2021-04-15 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ビデオチューブを使用した行動認識方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022142119A (ja) | 2022-09-30 |
| US20220300839A1 (en) | 2022-09-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20230089380A1 (en) | Neural network construction method and apparatus | |
| JP7619103B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム | |
| EP3333768B1 (en) | Method and apparatus for detecting target | |
| US12573169B2 (en) | Common view region identification and scale alignment for feature matching in image pairs | |
| US10963676B2 (en) | Image processing method and apparatus | |
| CN108492287A (zh) | 一种视频抖动检测方法、终端设备及存储介质 | |
| JP6443050B2 (ja) | 画像処理装置、及び、画像処理方法 | |
| CN107784281B (zh) | 人脸检测方法、装置、设备及计算机可读介质 | |
| CN106778635A (zh) | 一种基于视觉显著性的人体区域检测方法 | |
| JP7032871B2 (ja) | 画像処理装置及び画像処理方法、プログラム、記憶媒体 | |
| JP7400982B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
| JP7505598B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム | |
| JP7643579B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、及び、プログラム | |
| CN113971671B (zh) | 实例分割方法、装置、电子设备及存储介质 | |
| TWI864769B (zh) | 基於人像模式的視訊降噪方法及視訊降噪系統 | |
| JPWO2018179119A1 (ja) | 映像解析装置、映像解析方法およびプログラム | |
| Lai et al. | Weighted entropy-based measure for image segmentation | |
| US10861174B2 (en) | Selective 3D registration | |
| Hong et al. | Single image deblurring based on auxiliary Sobel loss function | |
| CN115100585B (zh) | 目标检测方法、电子设备和计算机可读存储介质 | |
| JP2025079452A (ja) | 画像処理装置、方法、及びプログラム | |
| Xiao et al. | Mixed self-attention–enhanced generative adversarial network for spatially variant blurred image restoration | |
| JP6305942B2 (ja) | 画像質感操作方法、画像質感操作装置、およびプログラム | |
| Kok et al. | A constraints based approach using ranking-gradient-similarity multi-block matching algorithm for computer vision | |
| JP2012226403A (ja) | 画像領域追跡装置、画像領域追跡方法、および、コンピュータ・プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20211022 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240215 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241114 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241210 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241223 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7619103 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |