JP5249969B2 - 知識ベースの選択的な視覚分析のための人工視覚システムおよび方法 - Google Patents
知識ベースの選択的な視覚分析のための人工視覚システムおよび方法 Download PDFInfo
- Publication number
- JP5249969B2 JP5249969B2 JP2010030845A JP2010030845A JP5249969B2 JP 5249969 B2 JP5249969 B2 JP 5249969B2 JP 2010030845 A JP2010030845 A JP 2010030845A JP 2010030845 A JP2010030845 A JP 2010030845A JP 5249969 B2 JP5249969 B2 JP 5249969B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- information
- visual
- nodes
- dependency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/422—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
- G06V10/426—Graphical representations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
−従属性情報は、感覚事象を表現するノード間のリンクとして明示的に格納される、
−従属性情報は、既に編集された感覚情報の現在の状態と共に用いられる、
−従属性リンクは、異なるタイプであることができ、これにより、処理順序および情報フローの異なる評価を可能にする、
−感覚事象を表現する各ノードは、その結果の有効性を追跡し、この有効性を判断することができる。
−先行する視覚事象の結果を表現するノードの従属性リンクを得ること。
−従属性リンクが接続する各先行ノードについて、
−先行ノードのデータが有効かどうかをチェックすること。これが有効なら、次の従属性に続けること。
−その後続ノードの場合と同じやり方で先行ノードの従属性を解消すること。
−先行ノードのデータを取得すること。
−先行ノードからのデータを用いて、ノード自体の感覚プロセスを、実行すること。
−実行の結果の有効性を評価すること。
−解決された従属性にマークを付け、後続ノードに戻ること。
−ノードの結果が無効ならば、視覚サブタスクを再び呼び出す時を、高レベル上で決定すること。
−対象物の特性間の機能的な従属性を、対象物の特性構造および世界知識と共に(これは、短期および長期の両方である)、整合性良くモデリングすることができるグラフ構造を使用する。
−グラフ構造を使用して、システムには、所定の計測のコストを見積もるための手段が備えられる。或る特性を計測するためのグラフのサイズ(大きさ)を、コスト関数として使用することができる。
−ここに提案する解析アルゴリズムを使用して、該システムによって既に取得されている知識を、簡単で効率的なやり方で再使用することができる。これは、計算時間を低減し、システムの動作を速めることにつながる。
−ここに提案する解析アルゴリズムを使用して、視覚システムを設計する複雑性は、直接的な従属性のみをモデリングすることにより、顕著に低減される。
記憶構造 (Memory Structure)
この進歩的なシステムでは、参考文献(7)で提案されている、関係意味記憶(リレーショナル・セマンティック・メモリ(relational semantic memory))を、短期記憶(short-term memory)および長期記憶(long-term memory)において情報を表現するのに用いる。
Ballanceらが、彼らの論文で、スイッチも制御従属性も、要求により駆動される解釈には必要とされないと述べているけれども(第261頁の8)、我々は、視覚システムの関心のあるケースをカバーするため、従属性リンクのパターンについていくつかの修正子を必要とする。これらの関心のあるケースは、以下の通りである。
ここで、各ノードは、ノードデータの有効性をマーク付けする状態を有する。これは、ノード情報が更新される必要があるかどうかを判断するために用いられる。すなわち、このノードに結びつけられた視覚ルーチンを実行する必要があるか否かが判断される。基本的に2つの状態があり、データが、有効(valid)であるか、もしくは無効(invalid)であるか、である。最初に、すべてのノードは、無効データを含む。更新後、すなわち視覚ルーチンから情報を受け取った後、ノードのデータは有効となる。ノード状態の“無効”への遷移は、時間により、もしくは何らかの他の基準により決定されることができる。有効データを備えるノードに遭遇したときに動作の数を動的に減らすのに、ノード状態をどのように使用するかについては、後述される。
異なるリンクタイプ、動作、修正子およびノード状態を説明したので、ここで、該システムで使用される実際のプロトタイプ的な記憶(メモリ)パターンを示す。
上記では、該システムが、世界およびその内部の機能的な従属性の両方についての知識を表現する手法が示された。ここでは、該システムの周辺についての感覚情報の要求駆動による取得を実現するために該知識がどのように使用されるかを示す。図4の底部には、直接的な従属性のみが定義されている。対象物の3次元位置(world location:世界位置)のような、対象物の特性を更新するためには、そのノードの従属性を解決する(resolve)のが必要とされる。図5における、該世界位置について該解決された従属性のグラフは、必要なステップを表している。
世界位置(図のWorldLocation)を受け取るというこの例において(図5のステップを参照)、これは、網膜像の位置(図のRetinalLocation)の計測(受信)(図の1)および対象物の距離(Distance)の計測(受信)を必要とする。なお、該対象物の3次元位置は、奥行き推定(depth estimation)アルゴリズムによって計算されることができる。
1)循環型従属性を検出する、
2)従属性ループに至る現在のリンクが選択的ならば、これを切断し、循環型従属性を含む枝全体を取り除く、
3)そうでなければ、ルート(根)ノードに既に辿りついたかどうかを確認する。その場合、従属性を解決することはできず、よってエラーが返される。まだルートにたどりつていなければ、従属性経路を1ステップだけ戻り、上記のステップ2)を続ける。
機能的従属性を柔軟にモデリングすることへのこのアプローチの最大の利点のうちの一つは、システムが有する知識を再使用することができるという事実である。そのため、ノード状態が、上記のように取り入れられた。該ノード状態は、ノードが更新を必要としているかどうか、すなわち、ノードが、従属性グラフにおいてその親によって必要とされる動作を実行することを必要としているかどうか、あるいは、ノードが、すでに有効なデータを保持しているかどうかを、グラフ解析アルゴリズムに知らせる。ノードが既に有効なデータを有していれば、システムは、該ノードより下の従属性サブツリー(sub-tree)全体を実行する必要が無い。ここで、網膜像位置(該データは、なお有効である)が既に計測されており、対象物の世界位置を更新することが、現在所望されているとする。これにより、図7に示されるような縮小したグラフとすることができる。このグラフを、図5のオリジナルのものと比較すると、結果としてグラフが小さくなっているのがわかる。これは、従属性グラフの構造が、システムの知識によって決定されることを意味する。これは、固定したグラフについてのみ作用する参考文献(4)、(8)、(6)のような、以前に提案された方法に対する主要な相違点である。
認知視覚システムのロバスト性は、冗長性によってしばしば向上させることができるので、或る対象物の特性を計測する代替の方法が存在することが、該システムにおいて望ましい。これは、特性を判断するための様々なアルゴリズムが、データ、結果を計算する方法、該システムの持つ速度、精度および脆弱性等について行う想定に、違いがあるかもしれないからである。したがって、そのような代替の経路を扱うような方法が加えられる必要がある。図8に示される例では、3つの異なるセグメント化アルゴリズムがあり、顕著性(saliency)マップを用いたシンプルなサイズ(大きさ)推定(詳細は文献(9)を参照)、領域拡張法(Region-Growing method,文献(10)を参照)、およびレベルセット法(Level-Set method, 文献(11)を参照)である。代替経路をモデリングするため、論理ORモードが、上記のように取り入れられた。図8に見られるように、“対象物マスク(Object Mask)”ノードがマーク付けされ、これは、“ORノード”を示す。ORノードは、グラフパーサ(解析部)によって、“これらの従属性のうちの1つのみが必要とされる”と解釈される。対象物マスクを計算するため、これらのルーチンのうちの1つが、開始される必要がある。しかしながら、異なる複数のアルゴリズムが見つかることとなり、これらのアルゴリズムは、速度、初期的な要件、および精度が異なるものと見ることができる。網膜像の大きさ(Retinal Size)の推定は、非常に速く、初期値として対象物位置のみを必要とし、それほど精度が高くはない。領域拡張法は速く(しかし、網膜像の大きさの推定よりは遅い)、初期値として対象物位置のみを必要とし、少なくとも同種の構造化された対象物についての精度は良い。他方、レベルセット法は、他の2つのアルゴリズムに比べて比較的遅く、開始するのに初期セグメント化を必要とするが、構造化された対象物についても非常に精度が高い。上記述べた特性のうちの1つの結論は、対象物マスクを初期的に推定するのにはレベルセット法を用いることはできない、ということである。なぜならば、該レベルセット法は、実行するのに初期マスクを必要とするからである。さらに、該システムは、必要に応じた精度を持ち、なるべく速いアルゴリズムを選択することができる。したがって、必要とされるのは、現在のシステムの状態(たとえば、必要とされる精度および使用可能な時間)および該システムの知識(たとえば、初期の対象物マスク)に依存した決定である。最も簡単な実現形態では、パーサ(解析部)が、従属性のうちの1つが解決されるまで、従属性を解決しようとの試みを継続的に行うことである(ノードは、その初期状態が満たされなければ、その実行を拒否できる)。
(a)ノードの実行する能力をチェックする。
(1)有効なデータについて、現在のノードをチェックする。該ノードが既に有効なデータを持っていれば、動作をスキップして、「成功」を返す。
(2)既にセットされた訪問済みフラグによって示される、循環型従属性をチェックする。循環型従属性を検出したならば、対応するエラーを、該ノードの親に渡す。
(3)該現在のノードについて、訪問済みフラグをセットする。
(b)従属性の更新
(1)現在のノードについての全ての従属性についてのリストを取得する。
(2)各従属性(子ノード)について、以下を行う:
(2.1)子ノードに対し”UpdateNodeValue”を呼び出す、
(2.2)循環型従属性のエラーについての該呼び出しの戻りコードをチェックする。そのようなエラーを受け取り、かつ該子ノードについて強制的従属性を持つ場合には、該エラーを、さらにその親に伝える。選択的従属性に対するエラーについては、該リストの次の従属性を処理することを続ける。
(2.3)論理ORノードであるならば、少なくとも1つの従属性が満たされるので、該ループを去って(c)を続ける。
(c)現在のノード動作の実行
(1)親によって要求される、現在のノードの送信または受信動作を実行し、選択的に、センサデータを局所的に格納する。
(2)データの有効性フラグをセットする。
(3)訪問済みフラグを取り除く。
上記のアルゴリズムおよび図4に示される構造的な定義を用いることによって、概念証明型(proof-of-concept)のシステムが実現される。該システムの記憶内容は、図9に見ることができる。図9の“プロトタイプ(prototypes)”セクションにおいて、対象物の構造のみが定義される。すなわち、どの特性が対象物を構成し、該特性がどのように関連しているかが定義される。概念証明型のシステムにおいては、”hasProperty“リンク(黒)のみが用いられる。”Sensory Interface(感覚インターフェース)“セクションにおいて、該対象物構造は引き継がれ、さらに、従属性定義および視覚ルーチンに対する結合が加えられる。従属性構造は、図4に示すような直接的従属性の定義から生じたものである。
上記に提示されたシステムは、機能的な従属性についての知識および世界についての知識の両方を整合性あるやり方で表現するのに、グラフ構造を用いている。このシステムにおける関係意味記憶(リレーショナル・セマンティック・メモリ)が、ノード間の任意の数のリンクパターンを表現することができるという事実は、さらに、視覚ルーチンを、そのノードに結合することができる。従属性リンクのモデリングが記述され、該リンクパターンについてのいくつかの修正子が取り入れられ、これにより、視覚システムについての重要なケースをカバーすることが可能となる。選択的および強制的な情報、情報フローの方向をモデリングする異なるノード動作、および代替経路のケースが、説明される。従属性リンク構造に基づく解析アルゴリズムが設計され、これは、所定の環境下における循環型従属性を検出して“解決”することができる。これとは別に、該解析アルゴリズムはまた、以前に取得した感覚情報を効率的に再使用して、該システムの全機能を維持しつつ、計算負荷を低減することができる。この実験は、このフレームワークにより、オンデマンドで(要求に応じて)データを取得し、その処理チェーン(鎖)を柔軟に適応させることのできるシステムを構築するのを可能にする、ということを示している。
本発明は、さらに、視覚的入力を選択的に分析する視覚ルーチンの、アクティブで半順序(semi-sequential)な補充(recruitment)および調整(modulation)によって、視覚サブタスクの解決を含む内部タスクによって駆動されるコンピュータ・ビジョン・システムを提供する。この補充および調整は、実行時に動的に起こり、視覚的なアイテム(項目)およびプロセスについての長期知識だけでなく、視覚分析の直前のステップ中に編集された視覚シーン、そのアイテムおよびその特性について現在利用可能な短期情報にも基づいている。長期記憶および短期記憶は、前述したように構成されることができる。
1)概念記憶(conceptual memory)(長期および短期の両方)、
2)視覚プロセスの記憶(メモリ)、
3)視覚ルーチン、概念記憶、および視覚プロセスの記憶の間を調停する制御モジュール。
a.視覚的に知覚可能な対象物のような感覚事象の記憶を、機能的な関係を表す直接リンクによって他のノードに接続される、計測可能な感覚パラメータを備えたノードエンティティとして表現するステップと、
b.現在の視覚的な感覚コンテキストの記憶を、感覚事象の接続されたグラフで表現するステップと、
c.空間サブグラフおよび該サブグラフのノードとリンクに結びつけられたローカルプロセスにおいて、上記Iaの感覚パラメータにアクセスして計測する方法に関する視覚サブタスク情報の記憶を表現するステップと、
d.ステップIa〜Icにおいて取り入れられた記憶からの情報を用いることによって、実行時に処理リソースを動的に割り振って情報フローを編成するステップと、
e.上記のリソース割り振りおよび情報フローを、ステップIa〜cからのグラフ構造に従って最適化するステップと、
f.グラフの対応するノードおよびリンクのエンティティにおいて、感覚計測から取得した推定値を記憶し、これにより、IaおよびIbからの情報を更新するステップと、
g.たとえばさらなる視覚対象物についての情報、および一般的にはIa、Ibからの一般的な感覚コンテキストにおける追加および修正についての情報を表す新しいグラフ構造を漸進的に(incrementally)適応して作成するステップと、
h.ステップIdに戻り、知覚された世界および自身の感覚プロセスについての知識の表現を改良するために、ステップIa〜Icから、自身の処理リソースを柔軟に適応すると共に、記憶を改善(リファイン)するシステムで、ステップId〜Ihを繰り返すステップと、を含む。
a.従属性情報は、感覚事象を表現するノード間のリンクとして明示的に格納される(たとえば、ノードAの結果は、ノードBの結果に従属し、よって、ノードBは、ノードAよりも前に処理されなければならない)。
b.従属性情報は、既に編集された感覚情報の現在の状態と共に用いられ、視覚分析中に視覚サブタスクの処理順序を動的に決定する。
c.従属性リンクは、異なるタイプであることができ、これにより、処理順序および情報フローの異なる評価を可能にする。使用されるタイプは、たとえば、強制的(“mandatory”)、選択的(“optional”)、および多数のうちの1つ(“one-of-many”)、である。第1のケースでは、厳密な順序が、2つの接続ノード間に課され、これにより、1つのノードの処理は、従属ノードの有効な結果を必要とする。第2のケースでは、処理ノードは、従属ノードが有効な情報を使用できるならば、該従属ノードの結果を使用することができ、そうでなければ、それを無視することができる。最後のケースでは、従属性は、いくつかの従属ノードのうちの1つが有効な結果を達成し次第、解決される。
d.感覚事象を表現する各ノードは、その結果の有効性を追跡する。この有効性は、たとえば、計測の信頼性、取得したデータの品質、最後に計測してからの経過時間、によって判断されることができる。
a.先行する視覚事象の結果を表現するノードの従属性リンクを得ること。
b.従属性リンクが接続する各先行ノードについて、
i.先行ノードのデータが有効かどうかを、ステップIVdに従ってチェックすること。これが有効なら、ステップVbの次の従属性へ続ける。
ii.ステップVaで開始し、その後続ノードの場合と同じやり方で先行ノードの従属性を解決すること。
c.先行ノードのデータを取得すること。
d.ノード自身の感覚プロセスを、先行ノードからのデータを用いて実行すること。
e.実行の結果の有効性を評価すること。
f.解決された従属性にマークを付け、後続ノードに戻ること。
g.ノードの結果が無効ならば(これは、その先行ノードが既に無効なデータを含むか、もしくは、データの品質が所定の基準を下回ったかを示す)、視覚サブタスクを再び呼び出す時を、高レベル上で決定すること。
[1] Julian Eggert, Sven Rebhan, and Edgar K¨orner. First steps towards an intentional vision system. In Proceedings of the 5th International Conference on Computer Vision Systems (ICVS), 2007.
[2] Jack B. Dennis. First version of a data flow procedure language. In Proceedings of the Colloque sur la Programmation, volume 19 of Lecture Notes in Computer Science, pages 362-376, London, UK, 1974. Springer-Verlag.
[3] Jack B. Dennis. Data flow supercomputers. Computer, 13(11):48-56, November 1980.
[4] Jeanne Ferrante, Karl J. Ottenstein, and Joe D. Warren. The program dependence graph and its use in optimization. ACM Transactions on Programming Language and Systems, 9(3):319-349, July 1987.
[5] Robert Cartwright and Matthias Felleisen. The semantics of program dependence. In Proceedings of the ACM SIGPLAN 89 Conference on Programming Language Design and Implementation, pages 13-27, 1989.
[6] Per Andersson. Modelling and implementation of a vision system for embedded systems, 2003.
[7] Florian Rohrbein, Julian Eggert, and Edgar K¨oerner. Prototypical relations for cortex-inspired semantic representations. In Proceedings of the 8th International Conference on Cognitive Modeling (ICCM), pages 307-312. Psychology Press, Taylor & Francis Group, 2007.
[8] Robert A. Ballance, Arthur B. Maccabe, and Karl J. Ottenstein. The program dependence web: A representation supporting control-, data-, and demand-driven interpretation of imperative languages. In Proceedings of the ACM SIGPLAN 90 Conference on Programming Language Design and Implementation, volume 25, pages 257-271, New York, NY, USA, 1990. ACM.
[9] Sven Rebhan, Florian Rohrbein, Julian Eggert, and Edgar Koerner. Attention modulation using short- and long-term knowledge. In A. Gasteratos, M. Vincze, and J.K. Tsotsos, editors, Proceeding of the 6th International Conference on Computer Vision Systems (ICVS), LNCS 5008, pages 151-160. Springer Verlag, 2008.
[10] Milan Sonka, Vaclav Hlavac, and Roger Boyle. Image Processing, Analysis, and Machine Vision. Thomson-Engineering, 2 edition, 1998.
[11] Daniel Weiler and Julian Eggert. Multi-dimensional histogram-based image segmentation. In Proceedings of the 14th International Conference on Neural Information Processing (ICONIP), pages 963-972, 2007.
[12] Clouard R., Elmoataz A., Porquet C. & Revenu M.: Borg: A Knowledge-Based System for Automatic Generation of Image Processing Programs. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1999. Vol. 21 (2).
[13] Shekhar C., Moisan S., Vincent R., Burlina P. & Chellappa R.: Knowledge-based control of vision systems. Image and Vision Computing. 1999. Vol. 17.
[14] Sridharan M., Wyatt J. & Dearden R.: HiPPo: Hierarchical POMDPs for Planning Information Processing and Sensing Actions on a Robot. In Proceedings of the International Conference on Automated Planning and Scheduling. 2008.
[15] Sridharan M., Dearden R. & Wyatt J.: E-HiPPo: Extensions to Hierarchical POMDP-based Visual Planning on a Robot. In the 27th PlanSIG Workshop. 2008.
Claims (24)
- 視覚センサが検出した世界、物体及び当該物体の特性、当該世界における感覚事象、現在の視覚タスク、感覚コンテキスト、および知覚装置についての蓄積された知識を使用して、コンピュータビジョンシステムの情報処理を適応化および最適化する方法であって、
前記コンピュータビジョンシステムは関係記憶を有し、当該関係記憶は、ノードと当該ノード間の関係を示すリンクとを含むグラフにより表わされた情報を含み、前記ノードは、物体の一般的特性である物体特性、及び当該物体特性の情報取得に用いる視覚サブタスクの情報を表わし、前記リンクは前記ノード間の従属関係の情報を含み、前記物体特性を表わすノードには当該ノードの処理である当該物体特性の情報取得の方法を表わすルーチンが関連付けられ、前記視覚サブタスクを表わすノードには当該ノードの処理である当該視覚サブタスクの実行方法を表わすルーチンが関連付けられており、
前記コンピューティングシステムは、さらに、各ノードについて、当該ノードの処理の結果を表わすノード情報と、当該ノード情報の有効性すなわち更新の必要有無を表わすノード状態と、を記憶しており、
前記方法は、
a)対象物の物体特性を表すノードであって、所与の視覚タスクを実行するため当該物体特性の情報の取得を必要とするノードを特定するステップと、
b)前記関係記憶に基づいて、前記特定された各ノードについて、当該特定されたノードと当該ノードの処理に必要な他のノードとを含むグラフを生成するステップであって、当該グラフは前記特定されたノードを初期ノードとして含み、前記初期ノードと前記他のノードとが、ノード間の従属性を表わすリンクにより接続されている、ステップと、
c)ステップbにおいて生成された前記グラフが表す情報フローに従い、物体特性の情報を得るためのルーチンを構成するステップと、
d)ステップcにおいて構成されたルーチンを実行し、前記特定されたノードが表す物体特性の情報を取得して、前記所与の視覚タスクを実行するステップと、
を有し、
前記ステップbは、
b1)前記特定されたノードを初期ノードとし、当該初期ノードに対し、当該初期ノードの処理に直接的な影響を与える他のノードを、前記関係記憶に記憶されている当該初期ノードに対する従属関係を表わすリンクを用いて付加して、前記グラフを生成するステップと、
b2)前記付加したノードから、処理に用いるべき前記ノード情報を与えるノードを選択するステップと、
b3)前記選択したノードから、ノード情報の更新が必要なノードを識別するステップと、
b4)前記識別された更新が必要な各ノードに対し、当該ノードの処理に直接的な影響を与える他のノードを、前記関係記憶に記憶されているノード間の従属関係を表わすリンクを用いて付加するステップと、
b5)ステップb2において付加すべきノードがなくなるか、又はステップb3においてノード情報の更新が必要なノードがなくなるまで、ステップb2〜b4を繰り返すステップと、
を有し、
前記グラフが表す前記情報フローは、前記グラフ内の前記リンクが表す従属関係に従って前記初期ノードに向かう、当該グラフ内の前記選択された各ノードからのノード情報の流れであって、
前記特定されたノードが表す物体特性の情報を得るための前記ルーチンは、前記ノード情報の更新を要しないノードの当該ノード情報へのアクセス、及び又は前記ノード情報の更新を要するノードに関連付けられたルーチンの実行を、前記情報フローに従う順序で行うように構成される、
方法 - 前記世界は、音響センサ、触覚センサ、および/またはソフトウェアないしハードウェアインターフェースを介して受信された情報により検知される、請求項1に記載の方法。
- 前記方法は、さらに、記憶パラメータ、システムパラメータ、事象パラメータ、グラフパラメータ、および/またはセンサパラメータを適応させる、請求項1または2に記載の方法。
- 前記感覚事象の記憶が表現される、請求項1乃至3のいずれか1項に記載の方法。
- 現在の視覚的な感覚コンテキストの記憶は、前記感覚事象の接続グラフで表現される、請求項1乃至4のいずれか1項に記載の方法。
- 前記コンピュータビジョンシステムは、前記ステップb2において、リソース競合が回避されるように前記ノードを選択することにより、当該コンピュータビジョンシステムが備える処理リソースを柔軟に適応させる、請求項1乃至5のいずれか1項に記載の方法。
- 前記コンピュータビジョンシステムは、前記ステップbにより生成された前記グラフが示すノード間の従属関係に基づいて前記関係記憶を改善する、請求項1乃至6のいずれか1項に記載の方法。
- 前記コンピュータビジョンシステムは、前記各視覚サブタスクについての、必要な視覚パラメータにアクセスする方法及び当該パラメータを計測する方法についての情報を含む視覚サブタスク情報を記憶し、
前記最適化は、前記ステップb2において、前記視覚サブタスク情報に加えて所与のタスク要件にも基づいて、前記ノードを選択することにより行われる、請求項1乃至7のいずれか1項に記載の方法。 - 前記最適化は、前記ステップb2において、タスク固有のゲインおよび/またはコスト要件に基づいて、前記ノードを選択することにより行われる、請求項1乃至8のいずれか1項に記載の方法。
- 前記最適化は、前記ステップb2において、期待される情報フローおよび現在の情報フローに関連する不確実性情報に基づいて、および/または、確率的手法を用いて、前記ノードを選択することにより行われる、請求項1乃至9のいずれか1項に記載の方法。
- 前記視覚サブタスク情報は、前記視覚サブタスクの実行中に収集された実行時の統計に基づいて漸進的に調節され、前記実行時の統計は、経過時間及び又は処理結果の精度を含むものである、請求項1乃至10のいずれか1項に記載の方法。
- 前記リンクは、複数の従属関係タイプのうちの一の従属関係タイプを示すものとすることができ、複数の前記従属関係タイプが用いられることにより、前記情報フロー、及び、前記特定されたノードが表す物体特性についての情報取得のための前記ルーチンにおける前記アクセス及び又は前記実行の順序を、様々に変化させることを可能とし、
前記各ノードは、当該ノードの処理の結果の有効性を監視して、当該ノードについて保存された前記ノード状態を更新する、
請求項1乃至11のいずれか1項に記載の方法。 - 前記リンクは、有向リンクであり、当該有向リンクの始点に接続された前記ノードの処理結果が、当該有向リンクの終点に接続された前記ノードの処理結果により、直接的に影響されることを示すものである、請求項1ないし12のいずれか一項に記載の方法。
- 前記リンクが表す前記従属関係タイプの一つは、接続された2つのノードの処理に厳密な順序を課すものであって、一のノードの処理に他のノードの有効な結果を必要とすることを表わしている、請求項1乃至13のいずれか1項に記載の方法。
- 前記リンクが表す前記従属関係タイプの一つは、接続された一のノードの処理が他のノードの処理結果を改善し得るものの、当該接続された一のノードの処理の実行は必ずしも必要となれないという、“選択的”な従属関係を示すものである、
請求項1乃至14のいずれか1項に記載の方法。 - 前記リンクが表す前記従属関係タイプの一つは、一の共通するノードが複数の他のノードと接続されており、当該他のノードの少なくとも一つが有効な処理結果を持ったときに前記共通するノードの処理の実行が可能となることを表わすものである、
請求項1乃至15のいずれか1項に記載の方法。 - 前記ノード状態により表わされる前記ノード情報の有効性は、前記ノードの処理の、計測の信頼性、取得されたデータの品質、または最後に計測してからの経過時間、によって決定される、請求項1乃至16のいずれか1項に記載の方法。
- 前記コンピュータビジョンシステムは、前記各ノードについて、マークされたか否かの情報を記憶し、
前記ステップb2は、さらに、
b21)前記選択されたノードの中に、既にマークが付された第2のノードが含まれていれば、
前記リンクが表す従属関係に従い、当該マークが付されたノードに代えて、当該ノードと同時にグラフに追加された他のノードの中から、当該マークが付されたノードの代替となるノードを特定し、当該代替となるノードを選択するか、又は、
当該マークが付されたノードから前記初期ノードの方向へ前記リンクに沿って上流にあるノードの中から、同時に追加された代替となるノードを持つものを特定し、前記マークが付されたノードに代えて当該特定したノードの代替のノードを選択して、当該特定したノードと当該特定したノードより下流にある全てのノードとを削除する、ステップと、
b22)前記選択された各ノードにマークを付すステップと、
を有する、
請求項1ないし17のいずれか一項に記載の方法。 - 前記ノード状態が表すノード情報の有効性は、さらに、前記リンクに沿って下流にあるノードのノード情報の有効性により定まり、前記ノード情報は、前記下流にある少なくとも一つのノードのノード情報が無効のとき、無効と決定される、請求項18に記載の方法。
- 前記ステップb5の処理と、前記選択されたノードのノード情報へのアクセスとが、非同期に又は並行して実行される、請求項1乃至19のいずれか1項に記載の方法。
- 前記ステップb5の処理と、前記選択されたノードに関連付けられたルーチンの実行とが、並行して実施される、請求項1乃至20のいずれか1項に記載の方法。
- 請求項1乃至21のいずれか1項に記載の方法を、コンピューティング・ユニットに実行させる、コンピュータプログラム。
- 請求項1乃至21のいずれか1項に記載の方法を用いるコンピュータビジョンシステムであって、ロボット又は車両を含む、可動のプラットホームに接続されており、データが与えられたことに応じて実行される所与の視覚計算と、リソースに関し最適化された視覚演算とを用いるものであって、所定のタスクに関連する視覚的側面に選択的に集中して処理を行う、コンピュータビジョンシステム。
- 請求項23に記載のコンピュータビジョンシステムを備える、車両またはロボット。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP09153896 | 2009-02-27 | ||
| EP09153896.7 | 2009-02-27 | ||
| EP10151739.9 | 2010-01-27 | ||
| EP10151739A EP2224371A1 (en) | 2009-02-27 | 2010-01-27 | Artificial vision system and method for knowledge-based selective visual analysis |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2010262625A JP2010262625A (ja) | 2010-11-18 |
| JP2010262625A5 JP2010262625A5 (ja) | 2013-05-09 |
| JP5249969B2 true JP5249969B2 (ja) | 2013-07-31 |
Family
ID=42102201
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010030845A Active JP5249969B2 (ja) | 2009-02-27 | 2010-02-16 | 知識ベースの選択的な視覚分析のための人工視覚システムおよび方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US8433661B2 (ja) |
| EP (1) | EP2224371A1 (ja) |
| JP (1) | JP5249969B2 (ja) |
Families Citing this family (37)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9262719B2 (en) | 2011-03-22 | 2016-02-16 | Patrick Soon-Shiong | Reasoning engines |
| US9710768B2 (en) | 2011-09-23 | 2017-07-18 | Elwha Llc | Acquiring and transmitting event related tasks and subtasks to interface devices |
| US20130081050A1 (en) * | 2011-09-23 | 2013-03-28 | Elwha LLC, a limited liability company of the State of Delaware | Acquiring and transmitting tasks and subtasks to interface devices |
| CN102857363B (zh) * | 2012-05-04 | 2016-04-20 | 运软网络科技(上海)有限公司 | 一种虚拟网络的自主管理系统和方法 |
| JP5668090B2 (ja) | 2013-01-09 | 2015-02-12 | キヤノン株式会社 | 医療診断支援装置及び医療診断支援方法 |
| US10713261B2 (en) | 2013-03-13 | 2020-07-14 | Google Llc | Generating insightful connections between graph entities |
| US10115248B2 (en) * | 2013-03-14 | 2018-10-30 | Ebay Inc. | Systems and methods to fit an image of an inventory part |
| US9235653B2 (en) * | 2013-06-26 | 2016-01-12 | Google Inc. | Discovering entity actions for an entity graph |
| BR112019016268B1 (pt) * | 2017-02-10 | 2023-11-14 | Nissan North America, Inc. | Método para uso no atravessamento de uma rede de transporte de veículo e veículo autônomo |
| US11586960B2 (en) | 2017-05-09 | 2023-02-21 | Visa International Service Association | Autonomous learning platform for novel feature discovery |
| US11316865B2 (en) | 2017-08-10 | 2022-04-26 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
| US11114186B2 (en) | 2017-08-10 | 2021-09-07 | Nuance Communications, Inc. | Automated clinical documentation system and method |
| WO2019089015A1 (en) | 2017-10-31 | 2019-05-09 | Nissan North America, Inc. | Autonomous vehicle operation with explicit occlusion reasoning |
| WO2020204871A1 (en) | 2017-12-22 | 2020-10-08 | Nissan North America, Inc. | Shared autonomous vehicle operational management |
| US11250382B2 (en) | 2018-03-05 | 2022-02-15 | Nuance Communications, Inc. | Automated clinical documentation system and method |
| US20190272902A1 (en) | 2018-03-05 | 2019-09-05 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
| EP3762921A4 (en) | 2018-03-05 | 2022-05-04 | Nuance Communications, Inc. | AUTOMATED CLINICAL DOCUMENTATION SYSTEM AND PROCESS |
| US11216480B2 (en) | 2019-06-14 | 2022-01-04 | Nuance Communications, Inc. | System and method for querying data points from graph data structures |
| US11043207B2 (en) | 2019-06-14 | 2021-06-22 | Nuance Communications, Inc. | System and method for array data simulation and customized acoustic modeling for ambient ASR |
| US11227679B2 (en) | 2019-06-14 | 2022-01-18 | Nuance Communications, Inc. | Ambient clinical intelligence system and method |
| US11531807B2 (en) | 2019-06-28 | 2022-12-20 | Nuance Communications, Inc. | System and method for customized text macros |
| US11670408B2 (en) | 2019-09-30 | 2023-06-06 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
| US11899454B2 (en) | 2019-11-26 | 2024-02-13 | Nissan North America, Inc. | Objective-based reasoning in autonomous vehicle decision-making |
| US11635758B2 (en) | 2019-11-26 | 2023-04-25 | Nissan North America, Inc. | Risk aware executor with action set recommendations |
| US11613269B2 (en) | 2019-12-23 | 2023-03-28 | Nissan North America, Inc. | Learning safety and human-centered constraints in autonomous vehicles |
| US11300957B2 (en) | 2019-12-26 | 2022-04-12 | Nissan North America, Inc. | Multiple objective explanation and control interface design |
| US11577746B2 (en) | 2020-01-31 | 2023-02-14 | Nissan North America, Inc. | Explainability of autonomous vehicle decision making |
| US11714971B2 (en) | 2020-01-31 | 2023-08-01 | Nissan North America, Inc. | Explainability of autonomous vehicle decision making |
| US11782438B2 (en) | 2020-03-17 | 2023-10-10 | Nissan North America, Inc. | Apparatus and method for post-processing a decision-making model of an autonomous vehicle using multivariate data |
| US12007784B2 (en) | 2020-03-26 | 2024-06-11 | Here Global B.V. | Method and apparatus for self localization |
| WO2021222456A1 (en) * | 2020-04-28 | 2021-11-04 | Leela AI, Inc. | Natural language system and methods |
| CN112040002B (zh) * | 2020-09-07 | 2023-04-18 | 广东电网有限责任公司电力调度控制中心 | 一种基于配电云平台的数据融合方法、装置及设备 |
| US11222103B1 (en) | 2020-10-29 | 2022-01-11 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
| WO2022212916A1 (en) * | 2021-04-01 | 2022-10-06 | Giant.Ai, Inc. | Hybrid computing architectures with specialized processors to encode/decode latent representations for controlling dynamic mechanical systems |
| EP4483338A4 (en) | 2022-02-24 | 2025-11-19 | Leela Ai Inc | METHODS AND SYSTEMS FOR TRAINING AND EXECUTING IMPROVED LEARNING SYSTEMS FOR IDENTIFYING COMPONENTS IN TIME-BASED DATA STREAMS |
| US11803478B1 (en) * | 2022-10-19 | 2023-10-31 | Inductive Automation, LLC | Controlled activation of interdependent bindings |
| CN120493082B (zh) * | 2025-07-21 | 2025-09-12 | 深圳适创腾扬科技有限公司 | 一种结合压铸流程优先级的压铸参数调优方法及相关装置 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08145738A (ja) * | 1994-11-18 | 1996-06-07 | Fujitsu Ltd | 能動的認識装置 |
| US7680748B2 (en) * | 2006-02-02 | 2010-03-16 | Honda Motor Co., Ltd. | Creating a model tree using group tokens for identifying objects in an image |
| US20100083109A1 (en) * | 2008-09-29 | 2010-04-01 | Smart Technologies Ulc | Method for handling interactions with multiple users of an interactive input system, and interactive input system executing the method |
-
2010
- 2010-01-27 EP EP10151739A patent/EP2224371A1/en not_active Withdrawn
- 2010-02-16 JP JP2010030845A patent/JP5249969B2/ja active Active
- 2010-02-24 US US12/711,292 patent/US8433661B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US20100223216A1 (en) | 2010-09-02 |
| JP2010262625A (ja) | 2010-11-18 |
| EP2224371A1 (en) | 2010-09-01 |
| US8433661B2 (en) | 2013-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5249969B2 (ja) | 知識ベースの選択的な視覚分析のための人工視覚システムおよび方法 | |
| US11663474B1 (en) | Artificially intelligent systems, devices, and methods for learning and/or using a device's circumstances for autonomous device operation | |
| CN113934205B (zh) | 用于控制引导机器人的方法、装置、设备以及存储介质 | |
| Chen et al. | Semantic visual simultaneous localization and mapping: A survey | |
| CN120543954B (zh) | 基于视觉强化学习的模型训练方法、装置、设备及介质 | |
| Andriamahefa | Integer Occupancy Grids: a probabilistic multi-sensor fusion framework for embedded perception | |
| Boroukhian et al. | Integrating 3D object detection with ontologies for accurate digital twin creation in manufacturing systems | |
| CN120471182B (zh) | 一种空间智能推理方法及系统 | |
| CN121007545A (zh) | 一种基于时空注意力与异步元变分策略的移动机器人视觉导航方法 | |
| Latif et al. | SLAM algorithm: Overview and evaluation in a heterogeneous system | |
| US20250242491A1 (en) | Method for generating a behaviour tree for controlling a robot device | |
| Seib et al. | Team homer@ unikoblenz—approaches and contributions to the robocup@ home competition | |
| Martínez et al. | 3D object recognition for anthropomorphic robots performing tracking tasks | |
| Fickenscher et al. | DSL-based acceleration of automotive environment perception and mapping algorithms for embedded CPUs, GPUs, and FPGAs | |
| Iegawa et al. | Loop closure detection in visual slam based on convolutional neural network | |
| Vincze et al. | Learn, detect, and grasp objects in real-world settings | |
| Rodríguez-Martínez et al. | Efficient Learning-Based Robotic Navigation Using Feature-Based RGB-D Pose Estimation and Topological Maps | |
| US12620109B2 (en) | Learning reliable keypoints in situ with introspective self-supervision | |
| Horng et al. | Building an Adaptive Machine Learning Object-Positioning System in a Monocular Vision Environment | |
| CN119635629B (zh) | 机器人控制方法、装置、电子设备及存储介质 | |
| KR102847997B1 (ko) | 자율주행을 위한 3차원 객체 검출 방법 및 시스템 | |
| US20240257374A1 (en) | Learning reliable keypoints in situ with introspective self-supervision | |
| Angeletti | Standardized annotated dataset generation from raw data collected by lidar sensor | |
| Vitali et al. | Dynamic Network selection for the Object Detection task: why it matters and what we (didn’t) achieve. | |
| Melvin et al. | LiDAR Enhanced Monte Carlo Localization for Greenhouse Robot Using Deep Learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120717 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121015 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121017 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121018 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130315 |
|
| A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20130315 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130403 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130412 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5249969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |