JP2015111419A - カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム - Google Patents
カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム Download PDFInfo
- Publication number
- JP2015111419A JP2015111419A JP2014233050A JP2014233050A JP2015111419A JP 2015111419 A JP2015111419 A JP 2015111419A JP 2014233050 A JP2014233050 A JP 2014233050A JP 2014233050 A JP2014233050 A JP 2014233050A JP 2015111419 A JP2015111419 A JP 2015111419A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- features
- general
- discriminative
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】カスケード式のオーバ・コンプリート・ディクショナリ(すなわち、基底の集合)を用いた画像の再構成技法であって、異なる再構成レベルでの各ディクショナリは、一般的な特徴又は識別的な特徴のいずれかを獲得する目的で、学習させられ最適化される。カスケード式のディクショナリを通してスパースな表示を見つけることにより、画像が再構成され認識される。
【選択図】図3A
Description
ここに説明される技法は、信号処理に関し、より詳細には、認識する必要がある対象に関連するパターンの処理に関する。
パターンの基底の集合としてのオーバ・コンプリート・ディクショナリが、画像を表示および再構成するために、パターン認識システム100において利用されることができる。本開示のある特定の実施形態において、ディクショナリは、異なる画像再構成レベルで適用されることができる。特定のレベルでの各ディクショナリは、一般的な特徴または識別的な特徴のいずれかを獲得する目的で、学習させられ最適化されることができる。異なる再構成レベルのためのカスケード式のディクショナリを通してスパースな表示を見つけることにより、画像は、再構成され認識されることができる。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
信号処理のための方法であって、
1つ以上の対象に関連する1つ以上の信号を得ることと、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出することと、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除くことと、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得ることと
を備える方法。
[C2]
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識すること
をさらに備える、C1に記載の方法。
[C3]
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングすること、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
をさらに備える、C1に記載の方法。
[C4]
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングすること、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
をさらに備える、C1に記載の方法。
[C5]
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングすること、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
をさらに備える、C1に記載の方法。
[C6]
信号処理のための方法であって、
複数の対象のうちのある対象に関連する画像を得ることと、
前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成することと、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成することと、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
を備える方法。
[C7]
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて、再構成することと、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用することと
をさらに備える、C6に記載の方法。
[C8]
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出すること
をさらに備える、C6に記載の方法。
[C9]
前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、C6に記載の方法。
[C10]
信号処理のための装置であって、
1つ以上の対象に関連する1つ以上の信号を得る手段と、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出する手段と、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除く手段と、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る手段と
を備える装置。
[C11]
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識する手段
をさらに備える、C10に記載の装置。
[C12]
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする手段、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
をさらに備える、C10に記載の装置。
[C13]
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする手段、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
をさらに備える、C10に記載の装置。
[C14]
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングする手段、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
をさらに備える、C10に記載の装置。
[C15]
信号処理のための装置であって、
複数の対象のうちのある対象に関連する画像を得る手段と、
前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成する手段と、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成する手段と、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
を備える装置。
[C16]
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて、再構成する手段と、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用する手段と
をさらに備える、C15に記載の装置。
[C17]
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出する手段
をさらに備える、C15に記載の装置。
[C18]
前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、C15に記載の装置。
[C19]
信号処理のための装置であって、
信号に基づいて対象の1つ以上の一般的な特徴を抽出し、各対象のための1つ以上の更新されたパターンを得るために前記信号から前記一般的な特徴を取り除き、前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得るように構成された、少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに結合されたメモリと
を備える装置。
[C20]
前記少なくとも1つのプロセッサはさらに、
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識する
ように構成される、C19に記載の装置。
[C21]
前記少なくとも1つのプロセッサはさらに、
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
ように構成される、C19に記載の装置。
[C22]
前記少なくとも1つのプロセッサはさらに、
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
ように構成される、C19に記載の装置。
[C23]
前記少なくとも1つのプロセッサはさらに、
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングする、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
ように構成される、C19に記載の装置。
[C24]
信号処理のための装置であって、
複数の対象のうちのある対象に関連する画像を得て、前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて前記画像の1つ以上の一般的な特徴を再構成し、前記再構成された一般的な特徴を使用して識別的なディクショナリに基づいて前記対象を認識するために前記画像を再構成する、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、ように構成された少なくとも1つのプロセッサと
前記少なくとも1つのプロセッサに結合されたメモリと
を備える装置。
[C25]
前記少なくとも1つのプロセッサはさらに、
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて再構成し、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用する
ように構成される、C24に記載の装置。
[C26]
前記少なくとも1つのプロセッサはさらに、
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出する
ように構成される、C24に記載の装置。
[C27]
前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、C24に記載の装置。
[C28]
命令が記憶されたコンピュータ読取可能な記憶媒体を備える、信号処理のためのコンピュータ・プログラム製品であって、前記命令は、
1つ以上の対象に関連する1つ以上の信号を得て、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出し、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除き、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る
ためにプロセッサによって実行可能である、コンピュータ・プログラム製品。
[C29]
命令が記憶されたコンピュータ読取可能な記憶媒体を備える、信号処理のためのコンピュータ・プログラム製品であって、前記命令は、
複数の対象のうちのある対象に関連する画像を得て、
前記対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成し、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成する、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
ためにプロセッサによって実行可能である、コンピュータ・プログラム製品。
Claims (29)
- 信号処理のための方法であって、
1つ以上の対象に関連する1つ以上の信号を得ることと、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出することと、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除くことと、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得ることと
を備える方法。 - 前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識すること
をさらに備える、請求項1に記載の方法。 - 前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングすること、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
をさらに備える、請求項1に記載の方法。 - 前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングすること、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
をさらに備える、請求項1に記載の方法。 - 複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングすること、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
をさらに備える、請求項1に記載の方法。 - 信号処理のための方法であって、
複数の対象のうちのある対象に関連する画像を得ることと、
前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成することと、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成することと、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
を備える方法。 - 前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて、再構成することと、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用することと
をさらに備える、請求項6に記載の方法。 - 前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出すること
をさらに備える、請求項6に記載の方法。 - 前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、請求項6に記載の方法。
- 信号処理のための装置であって、
1つ以上の対象に関連する1つ以上の信号を得る手段と、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出する手段と、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除く手段と、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る手段と
を備える装置。 - 前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識する手段
をさらに備える、請求項10に記載の装置。 - 前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする手段、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
をさらに備える、請求項10に記載の装置。 - 前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする手段、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
をさらに備える、請求項10に記載の装置。 - 複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングする手段、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
をさらに備える、請求項10に記載の装置。 - 信号処理のための装置であって、
複数の対象のうちのある対象に関連する画像を得る手段と、
前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成する手段と、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成する手段と、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
を備える装置。 - 前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて、再構成する手段と、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用する手段と
をさらに備える、請求項15に記載の装置。 - 前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出する手段
をさらに備える、請求項15に記載の装置。 - 前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、請求項15に記載の装置。
- 信号処理のための装置であって、
信号に基づいて対象の1つ以上の一般的な特徴を抽出し、各対象のための1つ以上の更新されたパターンを得るために前記信号から前記一般的な特徴を取り除き、前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得るように構成された、少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに結合されたメモリと
を備える装置。 - 前記少なくとも1つのプロセッサはさらに、
前記対象のすべてのための前記識別的な特徴のセットに基づいて、前記対象を認識する
ように構成される、請求項19に記載の装置。 - 前記少なくとも1つのプロセッサはさらに、
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする、ここにおいて、前記ディクショナリは、前記認識の初期の段階で適用される、
ように構成される、請求項19に記載の装置。 - 前記少なくとも1つのプロセッサはさらに、
前記対象を認識するために使用されるディクショナリを前記一般的な特徴に基づいてトレーニングする、ここにおいて、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で適用される、
ように構成される、請求項19に記載の装置。 - 前記少なくとも1つのプロセッサはさらに、
複数のサブ・ディクショナリを備えるディクショナリを前記識別的な特徴のセットに基づいてトレーニングする、ここにおいて、各サブ・ディクショナリは、前記識別的な特徴のセットのうちの1つを備え、前記ディクショナリは、前記認識の複数の段階のうちの定義された段階で前記対象の認識のために使用される、
ように構成される、請求項19に記載の装置。 - 信号処理のための装置であって、
複数の対象のうちのある対象に関連する画像を得て、前記複数の対象の一般的な情報を備える一般的なディクショナリに基づいて前記画像の1つ以上の一般的な特徴を再構成し、前記再構成された一般的な特徴を使用して識別的なディクショナリに基づいて前記対象を認識するために前記画像を再構成する、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、ように構成された少なくとも1つのプロセッサと
前記少なくとも1つのプロセッサに結合されたメモリと
を備える装置。 - 前記少なくとも1つのプロセッサはさらに、
前記再構成された一般的な特徴を有する画像を使用して、1つ以上の他の特徴を、別のディクショナリに基づいて再構成し、ここにおいて、前記ディクショナリは、前記一般的なディクショナリよりも識別的な情報と、前記識別的なディクショナリよりも識別的でない情報とを備える、
前記識別的なディクショナリに基づいた前記画像の再構成のために、前記再構成された他の特徴を使用する
ように構成される、請求項24に記載の装置。 - 前記少なくとも1つのプロセッサはさらに、
前記識別的なディクショナリを適用する前に、前記画像から、前記再構成された一般的な特徴を抽出する
ように構成される、請求項24に記載の装置。 - 前記一般的なディクショナリは、前記対象に関連づけられた画像の統計を獲得する、請求項24に記載の装置。
- 命令が記憶されたコンピュータ読取可能な記憶媒体を備える、信号処理のためのコンピュータ・プログラム製品であって、前記命令は、
1つ以上の対象に関連する1つ以上の信号を得て、
前記信号に基づいて前記対象の1つ以上の一般的な特徴を抽出し、
各対象のための1つ以上の更新されたパターンを得るために、前記信号から前記一般的な特徴を取り除き、
前記更新されたパターンに基づいて各対象のための識別的な特徴のセットを得る
ためにプロセッサによって実行可能である、コンピュータ・プログラム製品。 - 命令が記憶されたコンピュータ読取可能な記憶媒体を備える、信号処理のためのコンピュータ・プログラム製品であって、前記命令は、
複数の対象のうちのある対象に関連する画像を得て、
前記対象の一般的な情報を備える一般的なディクショナリに基づいて、前記画像の1つ以上の一般的な特徴を再構成し、
前記再構成された一般的な特徴を使用して、識別的なディクショナリに基づいて前記対象を認識するために、前記画像を再構成する、ここにおいて、前記識別的なディクショナリは、識別的な特徴の1つ以上のセットであって、各セットが前記複数の対象のうちの異なる対象に関連づけられる、識別的な特徴の1つ以上のセットを備える、
ためにプロセッサによって実行可能である、コンピュータ・プログラム製品。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US30040810P | 2010-02-01 | 2010-02-01 | |
| US61/300,408 | 2010-02-01 | ||
| US13/018,409 | 2011-01-31 | ||
| US13/018,409 US9269024B2 (en) | 2010-02-01 | 2011-01-31 | Image recognition system based on cascaded over-complete dictionaries |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012552030A Division JP2013519163A (ja) | 2010-02-01 | 2011-02-01 | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015111419A true JP2015111419A (ja) | 2015-06-18 |
| JP5955925B2 JP5955925B2 (ja) | 2016-07-20 |
Family
ID=44341710
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012552030A Withdrawn JP2013519163A (ja) | 2010-02-01 | 2011-02-01 | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム |
| JP2014021510A Expired - Fee Related JP5859584B2 (ja) | 2010-02-01 | 2014-02-06 | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム |
| JP2014233050A Expired - Fee Related JP5955925B2 (ja) | 2010-02-01 | 2014-11-17 | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012552030A Withdrawn JP2013519163A (ja) | 2010-02-01 | 2011-02-01 | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム |
| JP2014021510A Expired - Fee Related JP5859584B2 (ja) | 2010-02-01 | 2014-02-06 | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US9269024B2 (ja) |
| EP (1) | EP2531956B1 (ja) |
| JP (3) | JP2013519163A (ja) |
| KR (2) | KR101542294B1 (ja) |
| CN (1) | CN102741861B (ja) |
| WO (1) | WO2011094737A1 (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9092692B2 (en) | 2012-09-13 | 2015-07-28 | Los Alamos National Security, Llc | Object detection approach using generative sparse, hierarchical networks with top-down and lateral connections for combining texture/color detection and shape/contour detection |
| US9152881B2 (en) * | 2012-09-13 | 2015-10-06 | Los Alamos National Security, Llc | Image fusion using sparse overcomplete feature dictionaries |
| US9152888B2 (en) | 2012-09-13 | 2015-10-06 | Los Alamos National Security, Llc | System and method for automated object detection in an image |
| US9098749B2 (en) * | 2013-03-14 | 2015-08-04 | Xerox Corporation | Dictionary design for computationally efficient video anomaly detection via sparse reconstruction techniques |
| CN105243401A (zh) * | 2015-11-10 | 2016-01-13 | 中国矿业大学(北京) | 基于煤岩结构元学习的煤岩识别方法 |
| CN105844635B (zh) * | 2016-03-21 | 2018-10-12 | 北京工业大学 | 一种基于结构字典的稀疏表示深度图像重建方法 |
| TWI635752B (zh) | 2017-08-31 | 2018-09-11 | Yuan Ze University | 具有功率約束的影像增強方法、影像處理裝置及顯示系統 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58189700A (ja) * | 1982-04-28 | 1983-11-05 | 株式会社東芝 | 個人照合装置 |
| JP2005534378A (ja) * | 2002-07-29 | 2005-11-17 | シー−シグニチャー・リミテッド | 電子生体測定同一性認識のための方法及び装置 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW347503B (en) * | 1995-11-15 | 1998-12-11 | Hitachi Ltd | Character recognition translation system and voice recognition translation system |
| GB9802233D0 (en) | 1998-02-03 | 1998-04-01 | Nds Ltd | Digital signal processing |
| US6415256B1 (en) * | 1998-12-21 | 2002-07-02 | Richard Joseph Ditzik | Integrated handwriting and speed recognition systems |
| US20050175235A1 (en) * | 2004-02-05 | 2005-08-11 | Trw Automotive U.S. Llc | Method and apparatus for selectively extracting training data for a pattern recognition classifier using grid generation |
| EP2054852B1 (en) * | 2006-08-21 | 2010-06-23 | STI Medical Systems, LLC | Computer aided analysis using video from endoscopes |
| US20090010500A1 (en) | 2007-06-05 | 2009-01-08 | Umasankar Kandaswamy | Face Recognition Methods and Systems |
| US9123095B2 (en) * | 2008-09-29 | 2015-09-01 | Koninklijke Philips N.V. | Method for increasing the robustness of computer-aided diagnosis to image processing uncertainties |
-
2011
- 2011-01-31 US US13/018,409 patent/US9269024B2/en not_active Expired - Fee Related
- 2011-02-01 CN CN201180007840.5A patent/CN102741861B/zh not_active Expired - Fee Related
- 2011-02-01 JP JP2012552030A patent/JP2013519163A/ja not_active Withdrawn
- 2011-02-01 KR KR1020127022974A patent/KR101542294B1/ko not_active Expired - Fee Related
- 2011-02-01 EP EP11705734.9A patent/EP2531956B1/en not_active Not-in-force
- 2011-02-01 KR KR1020147001926A patent/KR101549798B1/ko not_active Expired - Fee Related
- 2011-02-01 WO PCT/US2011/023326 patent/WO2011094737A1/en not_active Ceased
-
2014
- 2014-02-06 JP JP2014021510A patent/JP5859584B2/ja not_active Expired - Fee Related
- 2014-11-17 JP JP2014233050A patent/JP5955925B2/ja not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58189700A (ja) * | 1982-04-28 | 1983-11-05 | 株式会社東芝 | 個人照合装置 |
| JP2005534378A (ja) * | 2002-07-29 | 2005-11-17 | シー−シグニチャー・リミテッド | 電子生体測定同一性認識のための方法及び装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2531956B1 (en) | 2018-11-28 |
| US20110188757A1 (en) | 2011-08-04 |
| US9269024B2 (en) | 2016-02-23 |
| CN102741861A (zh) | 2012-10-17 |
| JP5859584B2 (ja) | 2016-02-10 |
| WO2011094737A1 (en) | 2011-08-04 |
| EP2531956A1 (en) | 2012-12-12 |
| JP5955925B2 (ja) | 2016-07-20 |
| KR101542294B1 (ko) | 2015-08-06 |
| CN102741861B (zh) | 2016-06-15 |
| KR20140017022A (ko) | 2014-02-10 |
| JP2013519163A (ja) | 2013-05-23 |
| KR101549798B1 (ko) | 2015-09-02 |
| JP2014123391A (ja) | 2014-07-03 |
| KR20120123520A (ko) | 2012-11-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5955925B2 (ja) | カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム | |
| US9691164B2 (en) | System and method for symbol-space based compression of patterns | |
| US9256668B2 (en) | System and method of detecting common patterns within unstructured data elements retrieved from big data sources | |
| JP5591934B2 (ja) | オクルージョン耐性のある顔認識のための方法およびシステム | |
| CN107507620A (zh) | 一种语音播报声音设置方法、装置、移动终端及存储介质 | |
| WO2022213717A1 (zh) | 模型训练方法、行人再识别方法、装置和电子设备 | |
| CN106921749A (zh) | 用于推送信息的方法和装置 | |
| CN104142831B (zh) | 应用程序搜索方法及装置 | |
| AU2022343080A1 (en) | Methods and systems for detecting content within media streams | |
| CN114882890A (zh) | 深度学习模型的训练方法、声纹识别方法、装置和设备 | |
| JP2022086961A (ja) | 話者埋め込みに基づく音声活動検出を利用した話者ダイアライゼーション方法、システム、およびコンピュータプログラム | |
| Tan et al. | Spectrogram analysis via self-attention for realizing cross-model visual-audio generation | |
| CN113808619B (zh) | 一种语音情绪识别方法、装置及电子设备 | |
| CN103354091A (zh) | 基于频域变换的音频特征提取方法及装置 | |
| CN120692449B (zh) | 一种光谱相机的交互方法、装置、电子设备及存储介质 | |
| CN115146105B (zh) | 一种歌曲识别方法、装置、电子设备及存储介质 | |
| Chakrabarty et al. | Soundscapes in Spectrograms: Pioneering Multilabel Classification for South Asian Sounds | |
| Chaitra et al. | Unveiling Voices: Deep Learning Based Noise Dissipation with Real-Time Multi-speech Separation and Speaker Recognition | |
| US20210397649A1 (en) | Recognition apparatus, recognition method, and computer-readable recording medium | |
| CN119360877A (zh) | 多模态语音处理方法、设备、介质和计算机程序产品 | |
| CN117131415A (zh) | 一种基于噪声事件检测模型的检测方法、装置及存储介质 | |
| CN116564343A (zh) | 钢琴音频数据处理方法和装置、电子设备、存储介质 | |
| Połap et al. | Extraction and Analysis of Voice Samples Based on Short Audio Files |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151008 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151020 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151218 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160615 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5955925 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |