JP7708973B2 - 機械学習システムの出力データの不確実性を定量化する方法およびシステムならびに機械学習システムを訓練する方法 - Google Patents

機械学習システムの出力データの不確実性を定量化する方法およびシステムならびに機械学習システムを訓練する方法

Info

Publication number
JP7708973B2
JP7708973B2 JP2024525881A JP2024525881A JP7708973B2 JP 7708973 B2 JP7708973 B2 JP 7708973B2 JP 2024525881 A JP2024525881 A JP 2024525881A JP 2024525881 A JP2024525881 A JP 2024525881A JP 7708973 B2 JP7708973 B2 JP 7708973B2
Authority
JP
Japan
Prior art keywords
data
training
machine learning
learning system
uncertainty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024525881A
Other languages
English (en)
Other versions
JP2024542050A (ja
Inventor
シュタウデンマイアー・アルミン
ナッケン・カール・マティアス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aumovio Autonomous Mobility Germany GmbH
Original Assignee
Aumovio Autonomous Mobility Germany GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aumovio Autonomous Mobility Germany GmbH filed Critical Aumovio Autonomous Mobility Germany GmbH
Publication of JP2024542050A publication Critical patent/JP2024542050A/ja
Application granted granted Critical
Publication of JP7708973B2 publication Critical patent/JP7708973B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、機械学習に関する。特に、本発明は、不確実性を定量化する機械学習システムを訓練する方法、機械学習システムの出力データの不確実性を定量化する方法、機械学習システムの出力データの不確実性を定量化するシステムおよび出力データの不確実性を定量化するシステムを備える車両に関する。
多くの分野において、機械学習は高い価値を有するツールになっている。また、ここでは、機械学習システムの出力の不確実性の信頼性高い推定に一段と依存している。
このように、例えば、自動運転において、分類出力における不確実性の信頼性高い推定は、安全性に関連する側面である。この場合、システムにとって不確かであるような状況が検出され、制御が運転者に委譲されるか減速が行われることにより、事故を回避することができる。
特に、畳み込みニューラルネットワークにおいて、不確実性の推定が困難な課題であるのは、この場合、分類誤りは畳み込みニューラルネットワークの非線形性に起因して実際の不確実性と相関性を有さないためである。また、例えば、非線形の活性化関数を有するさらなる層の追加により、またはノミネーション手法により、畳み込みニューラルネットワークが複雑になるほど、この影響は強まる。
公知の不確実性を計算する方法は、モンテカルロドロップアウト法とアンサンブル法である。両方法は、入力信号について複数の結果を生成する、統計的分類結果散布モデリングの原理に基づいている。これら結果が互いに異なるほど、不確実性は大きくなる。このために、モンテカルロドロップアウト法の場合にはランダムにネットワークの重みが切り替えられる一方、アンサンブル法の場合にはアンサンブルのメンバ毎に出力が生成される。この場合、代表統計には多数の結果が必要とされる。このために必要とされる高度な計算複雑性のため、これらの方法は、一般に、リアルタイムシステムでの実装に適していない。さらに、アンサンブル法には大きいメモリコストが必要とされる。
B. Lakshminarayanan, A. Pritzel, C. Blundell, "Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles" (arXiv:1612.01474, 2017) C. Guo, G. Pleiss, Y. Sun, K. Weinberger, "On Calibration of Modern Neural Networks" (arXiv:1706.04599, 2017)
従って、本発明の課題は、適度な計算コストで機械学習システムの出力データの不確実性を定量化する方法を提供することである。本課題は独立請求項の主題により解決される。本発明の発展形態は従属請求項および以下の説明から明らかになる。
本発明の1つの態様は、出力データの不確実性を定量化する機械学習システムを訓練する方法に関する。この場合、訓練入力データと訓練目標値とを含む訓練データが供給される。ここで、訓練目標値は、各々の訓練入力データに割り当てられる。この場合、訓練目標値は、例えば、手動で個々の訓練入力データについて作成されたものであり、例えば、訓練入力データの分類を表す。
訓練データを用いて、機械学習システムは訓練され、言い換えれば、機械学習システムが、訓練入力データの入力の際に、訓練目標値に類似する出力データを生成するように、機械学習システムのパラメータは調整される。パラメータは、例えば、ニューラルネットワークの場合、個々の入力値とニューロンとの間の重みを含む。ここで、機械学習システムの訓練は、多数の学習法が周知となっている教師あり学習方法を用いて行われる。このようにして、例えば、ニューラルネットワークを訓練するために、誤差逆伝播法を用いることができる。この場合、訓練の間に、出力データと訓練目標値との間の誤差が可能な限り小さくなるように、機械学習システムのパラメータは調整される。ここで、出力データと訓練目標値との間の誤差は、例えば、出力データと訓練目標値との間の距離および出力データについてその対応するメトリックを介して決定される。なお、ここでは、過学習が回避されるが、これは、例えば、テスト入力データから生成された出力データとそれに対応するテスト目標値との間の誤差を考慮に入れることにより達成される。その際、テスト目標値はテスト入力データに割り当てられ、テスト入力データおよびテスト目標値は機械学習システムのパラメータの調整には用いられない。
また、訓練データを用いて、機械学習システムが再構築データを生成するように、機械学習システムのパラメータは調整される。ここで、再構築データは訓練データの既知度の尺度を表す。訓練された学習システムを用いて処理すべき入力データについて訓練データが既知である場合、機械学習システムの出力データの不確実性は小さい。その一方、訓練された学習システムを用いて処理すべき入力データについて訓練データがほぼ未知であるか全く未知である場合、機械学習システムの出力データの不確実性は大きい。つまり、再構築データを介して、機械学習システムの出力データの不確実性を定量化することができる。その際、計算コストは適度であり、再構築データを計算するための追加の計算コストは、最大でも、例えば、出力データを計算するための計算コストと一致するに過ぎない。また、再構築データの計算は、既に利用可能となっている訓練データに基づいて行われることから、ここでは、さらなる入力は必要とされない。
ここで、再構築データは、出力データを生成する機械学習システムのさらなる出力として生成されてよい。代替的に、機械学習システムは2つのサブシステムを備えてよく、第1サブシステムは出力データを生成し、第2サブシステムは再構築データを生成する。機械学習システムの2つのサブシステムにより出力データと再構築データが生成される場合、両サブシステムの訓練が同一の訓練データに基づいていることが重要であるのは、このことによってのみ、再構築データは、出力データの生成に用いられた同じ訓練データの既知度の尺度を表すからである。
いくつかの実施形態において、再構築データは訓練入力データに類似する。つまり、再構築データと訓練入力データとの間の誤差が可能な限り小さくなるように、機械学習システムのパラメータは調整される。言い換えれば、再構築データを介して入力データは再構築される。
いくつかの実施形態において、再構築データは訓練目標値に類似し、再構築データと訓練目標値との間の差分は出力データと訓練目標値との間の差分よりも小さい。つまり、再構築データと訓練目標値との間の誤差が出力データと訓練目標値との間の誤差よりも小さくなるように、機械学習システムのパラメータは調整される。過学習を回避しながら、出力データと訓練目標値との間の誤差が可能な限り小さいように、機械学習システムのパラメータは既に調整されているため、このことは、再構築データを生成するために機械学習システムの過学習が行われることを意味する。
いくつかの実施形態において、再構築データを生成するために、訓練入力データが入力として用いられる。このことは、再構築データが出力データを生成する機械学習システムのさらなる出力として生成される場合にも、再構築データが機械学習システムの第2サブシステムにより生成される場合にも、可能である。代替的または追加的に、出力データは再構築データを生成するための入力として用いられてよい。このためには、まず、出力データが利用可能である必要があるため、このことは、再構築データが機械学習システムの第2サブシステムにより生成される場合にのみ可能である。従って、この場合、機械学習システムの第1サブシステムの出力は、機械学習システムの第2サブシステムのための入力として用いられる。
いくつかの実施形態において、機械学習システムはニューラルネットワークである。ここで、ニューラルネットワークが上記方法に特に好適であるのは、ニューラルネットワークは簡単に調整することが可能だからである。ここで、ニューラルネットワークは、特に、畳み込みニューラルネットワークである。この場合、畳み込みニューラルネットワークの非線形性は、上記方法のユーザビリティに関して問題とはならない。
その一方、上記方法は、他の機械学習システム、例えば、決定木学習、サポートベクタマシン、回帰分析またはベイジアンネットワークを用いて適用されてもよい。また、上記方法をマルチタスク分類システムにおいて適用することができる。この場合、マルチタスク分類システムは、例えば、エンコーダと多数のデコーダとを備える。ここで、各デコーダに関して、再構築データが生成され、それに応じて機械学習システムのパラメータが調整される。また、機械学習システムを複数のサブシステムに分割することができる。この場合、各サブシステムは本開示の機械学習システムの機能性を有している一方、サブシステムは、例えば、機械学習システムのタイプまたは訓練データの選択の点において、互いに異なる。その場合、サブシステムを用いて生成された出力データを組み合わせることができ、これにより、改善された出力を得ることができる。
いくつかの実施形態において、入力データは、センサデータ、特に、画像データ、レーダデータおよび/またはライダデータを含む。画像データの場合の例として、再構築データは、再構築データが訓練入力データに類似する場合には、原画像の再構築を表す。この場合、原画像を精確に再構築することができるほど、この画像に関する訓練データは既知になり、出力データの不確実性は小さくなる。
ここで、入力データは車両のセンサデータであってよい。この場合、出力データは、例えば、センサデータに記録された物体の分類である。このようにして、上記方法は、自動運転システム用に出力データの不確実性を定量化するために適用することができる。
本発明のさらなる態様は、機械学習システムの出力データの不確実性を定量化する方法であって、機械学習システムが上記機械学習システムを訓練する方法により訓練されたものである、方法に関する。
従って、機械学習システムは、例えば、決定木学習システム、サポートベクタマシン、回帰分析に基づく学習システム、ベイジアンネットワーク、ニューラルネットワークまたは畳み込みニューラルネットワークであってよい。また、機械学習システムは、マルチタスク分類システムであってよい。また、機械学習システムは、2つのサブシステムを含んでよい。
機械学習システムにより、入力データから出力データが生成される。ここで、入力データは、例えば、センサデータ、特に、画像データ、レーダデータおよび/またはライダデータであってよく、例えば、車両により取得されてよい。出力データは、入力データの分類、従って、例えば、センサデータに記録された物体の分類であってよい。
また、機械学習システムにより、再構築データが生成される。ここで、再構築データと再構築データに対応するデータから、メトリックを用いて、差分値が生成される。この場合、この差分値は、入力データに関する訓練データの既知度の尺度である。従って、差分値は、出力データの不確実性を定量化し、出力データに割り当てられる。
従って、不確実性の定量化は、訓練された機械学習システムを用いることにより達成され、このため、計算コストは、最大でも、例えば、出力データを計算するための計算コストと一致するに過ぎない。
ここで用いられるメトリックは、再構築データと再構築データに対応するデータがどのようなデータであるかに依存する。そのようなメトリックの例は、距離メトリックまたは類似度尺度、例えば、平均二乗誤差、平均絶対誤差、構造的類似度指標または二値交差エントロピである。
また、不確実性推定の品質を決定することができる。このための公知の手法は、例えば、非特許文献1または非特許文献2に認められる。
いくつかの実施形態において、再構築データに対応するデータは、入力データである。この場合、機械学習システムは、訓練の際に取得した再構築データが訓練入力データに類似するように、訓練されている。従って、メトリックを用いて再構築データと入力データから差分値が生成される。入力データに類似していた訓練入力データが存在していた場合、再構築データも入力データに類似することになり、従って、差分値は小さくなる。この場合、訓練入力データに類似していた入力データが存在していたため、再構築データも誤差が小さいことが予測されることから、良好な出力データによる小さい差分値となり、従って、小さい不確実性が出力データにおいて得られる。その一方、入力データに類似していた訓練入力データが存在していなかった場合、再構築データと入力データとの間には大きい差分が存在することから、差分値は大きい。これは、大きい不確実性に対応しており、入力データが訓練入力データの何れにも対応していないことに起因している。
いくつかの実施形態において、再構築データに対応するデータは、入力データから生成された出力データである。この場合、機械学習システムは、訓練の際に取得した再構築データが訓練目標値に類似するように、訓練されているものであり、再構築データと訓練目標値との間の差分は訓練入力データから生成された出力データと訓練目標値との間の差分よりも小さいものであった。メトリックを用いて算出された、再構築データと出力データとの間の差分が小さい場合、このことは、入力データに類似していた訓練入力データが存在していたことを示しているため、出力データの不確実性も小さい。その一方、メトリックを用いて算出された、再構築データと出力データとの間の差分が大きい場合、このことは、入力データに類似していた訓練入力データが存在していなかったことを示しており、そのため、これに対応して、出力データの不確実性は大きい。
メトリックを用いて算出された、再構築データと出力データとの間の差分が小さい場合、再構築データは、機械学習システムの出力を改善するために用いることができる。このために、例えば、出力データの代わりに、機械学習システムの訓練に基づいて出力データよりもさらに精確な結果を表すことができる再構築データが出力されてよい。代替的に、例えば、出力データの代わりに、同様に、出力データよりもさらに精確な結果を表すことができる出力データと再構築データの平均値が出力されてよい。
いくつかの実施形態において、再構築データを生成するために、入力データが用いられる。代替的または追加的に、再構築データを生成するために、入力データから生成された出力データが用いられる。ここで、再構築データを生成するためにどのデータが用いられるかは、機械学習システムの訓練の際に再構築データを生成するためにどのデータが用いられたかに基づく。
いくつかの実施形態において、メトリックは、再構築データおよび再構築データに対応するデータの一部のみに適用される。このようにして、例えば、メトリックは、例えば、バウンディングボックスを用いて限定され、特に、検出された物体を含む、画像の一部のみに適用されてよい。この場合、不確実性は、この物体の分類において別途分析される。さらなる一例として、メトリックは、例えば、小さい詳細点がどちらかと言えば重要ではないとしてみなされるべき場合には、低い解像度を有する画像全体に対して適用されてもよい。
いくつかの実施形態において、不確実性が所定値を超過している出力データに関して、不確実性警告が発せられる。この不確実性警告は、出力データを用いているシステムにより、これに対応して考慮されてよい。このようにして、例えば、機械学習システムを用いてセンサデータに基づいて検出された物体が決定的に重要である自動運転の際に、機械学習システムの出力データの不確実性が上昇した場合、これに対応する安全対策措置が開始されてよく、例えば、減速または運転者への車両制御の移譲が導入されてよい。
いくつかの実施形態において、不確実性が所定値を超過している出力データに関して、機械学習システムをさらに訓練するための入力データが保存される。その次に、このようにして保存された入力データに関して、例えば、ユーザによる分類により、これに対応する目標値が生成される。この場合、入力データおよび目標値からなるこれら新規ペアは、機械学習システムの訓練の際に用いられるため、機械学習システムは、新規入力データに類似する入力データからも、信頼性高い出力データを生成することができる。
本発明のさらなる態様は、機械学習システムの出力データの不確実性を定量化するシステムに関する。このシステムは、入力ユニットと計算ユニットと出力ユニットとを備える。ここで、入力ユニットは、入力データを受信するように構成されており、例えば、センサとのインタフェースとして構成されている。計算ユニットは、上記の機械学習システムの出力データの不確実性を定量化する方法を実行するように構成されている。ここでは、機械学習システムは、上記の機械学習システムを訓練する方法を用いて既に訓練されている。従って、計算ユニットは、入力データから出力データを生成し、再構築データを生成する。さらに、再構築データおよび再構築データに対応するデータから、計算ユニットは、出力データの不確実性を定量化する差分値を生成する。出力ユニットは、計算ユニットにより生成された出力データ、出力データの不確実性および/またはこの不確実性に基づく不確実性警告を出力するように構成されている。出力ユニットは、例えば、出力データをさらに処理するシステムとのインタフェースである。
本発明のさらなる態様は、上記の出力データの不確実性を定量化するシステムを備える車両に関する。機械学習システムにより生成された出力データにおいて不確実性の上昇が検出されると、これに対応する措置が取られてよく、自動運転の場合には、例えば、減速または運転者への車両制御の移譲が行われ、安全性が著しく向上することになる。
図面に記載されている実施形態に基づいて本発明をさらに詳細に説明する。これらの実施形態は例示に過ぎず、限定として理解されるべきではない。
図1aは、機械学習システムを訓練する方法の実施形態例のフロー図である。 図1bは、出力データの不確実性を定量化する図1aの実施形態例に好適な方法のフロー図である。 図2aは、機械学習システムを訓練する方法のさらなる実施形態例のフロー図である。 図2bは、出力データの不確実性を定量化する図2aの実施形態例に好適な方法のフロー図である。 図3aは、機械学習システムを訓練する方法のさらなる実施形態例のフロー図である。 図3bは、出力データの不確実性を定量化する図3aの実施形態例に好適な方法のフロー図である。 図4aは、機械学習システムを訓練する方法のさらなる実施形態例のフロー図である。 図4bは、出力データの不確実性を定量化する図4aの実施形態例に好適な方法のフロー図である。 図5aは、機械学習システムを訓練する方法のさらなる実施形態例のフロー図である。 図5bは、出力データの不確実性を定量化する図5aの実施形態例に好適な方法のフロー図である。 図6は、出力データの不確実性を定量化するシステムを備える車両の実施形態例の概略図である。
図1aは、機械学習システム1を訓練する方法の実施形態例のフロー図を示し、図1bは、出力データY’の不確実性Uを定量化する図1aの実施形態例に好適な方法のフロー図を示す。
機械学習システム1、例えば、決定木学習システム、サポートベクタマシン、回帰分析に基づく学習システム、ベイジアンネットワーク、ニューラルネットワークまたは畳み込みニューラルネットワークを訓練するために、訓練入力データXと訓練目標値Yが供給される。機械学習システム1を用いて、訓練入力データXから、出力データY’、および訓練入力データXに類似する再構築データX’が生成される。訓練の目的は、過学習を生じさせることなく出力データY’が訓練目標値Yに可能な限り類似すること、そして再構築データX’が訓練入力データに可能な限り類似することである。このために、生成された出力データY’と再構築データX’そして訓練目標値Yと訓練入力データXから、誤差関数2を用いて、出力データY’と訓練目標値Yとの間そして再構築データX’と訓練入力データXとの間に依然として存在する差分を算出する。この差分を、誤差逆伝播法3を用いて、機械学習システム1のパラメータを調整するために用いる。所定の一貫性が達成されるまで、または過学習の兆候が現れるまで、これを繰り返す。
このようにして訓練された機械学習システム1を用いて、その次に、図1bに示されるように、入力データXから出力データY’および再構築データX’が生成される。そして、再構築データX’と入力データXとの差分はメトリック4を用いて決定される。このようにして決定された差分値は出力データY’の不確実性Uを定量化する。
一例として、入力データXは、画像の画像データであってよく、出力データY’は、画像に表されている物体に対応する分類データであってよい。機械学習システム1を用いて、原画像Xに類似する再構築画像X’を生成することができる場合、このことは、機械学習システム1の訓練の際に既に類似の入力データXが利用可能であったことを示しているため、出力データY’の不確実性Uは小さい。その一方、再構築画像X’が原画像Xとは大きく異なる場合、このことは、機械学習システム1を訓練するために類似の入力データXが用いられなかったことを示しているため、出力データY’の不確実性Uは大きい。
図2aおよび2bに示されている、機械学習システム1を訓練する、または出力データY’の不確実性Uを定量化する方法は、図1aおよび1bに示されている方法とは、出力データY’および再構築データX’の生成が、共通の機械学習システム1によってではなく、機械学習システム1の第1サブシステム1.1または第2サブシステム1.2により行われるという点で異なる。その結果、第2サブシステム1.2の訓練は、例えば、第1サブシステム1.1の訓練の後に行われてもよく、その際、同一の訓練入力データXを用いる必要があることには注意しなければならない。それ以外の点については、これらの方法は、図1aおよび1bの方法と一致する。当然のことながら、誤差関数2および誤差逆伝播法3は機械学習システム1の各々のサブシステム1.1または1.2に対して調整されている。
その一方、図3aおよび3bに示されている、機械学習システム1を訓練する、または出力データY’の不確実性Uを定量化する方法において、機械学習システム1は、2つのサブシステム1.1および1.2を備える。サブシステム1.1は、入力データXから出力データY’を生成し、サブシステム1.2の上流で訓練される。明瞭性の観点から、サブシステム1.1の訓練の図示をここでは省略している。サブシステム1.2はサブシステム1.1により生成された出力データY’を入力として取得し、これに基づいて、訓練目標値Yに類似する再構築データY”を生成する。ここで、サブシステム1.2を訓練するために、生成された再構築データY”は訓練目標値Yと比較され、サブシステム1.2のパラメータは、再構築データY”が訓練目標値Yに可能な限り類似するように、誤差逆伝播法3を用いて調整される。
その次に、出力データY’の不確実性Uを定量化するために、出力データY’と再構築データY”との間の差分がメトリック4を用いて決定される。ここで、出力データY’と再構築データY”との間の高い類似度は、入力データXに類似する訓練入力データXが存在していたことを示しているため、出力データY’の不確実性Uは小さいと考えられる。その一方、出力データY’と再構築データY”との間の大きい差分は、入力データXに類似する訓練入力データXが存在していなかったことを示しているため、出力データY’の不確実性Uは大きいとして定量化される。
図4aおよび4bに示されている、機械学習システム1を訓練する、または出力データY’の不確実性Uを定量化する方法は、図3aおよび3bに示されている方法とは、第2サブシステム1.2が、第1サブシステム1.1の出力データY’に加えて、訓練入力データXまたは入力データXも入力として用いるという点で異なる。これにより、出力データY’の不確実性Uの決定がさらに改善される。
最後に、図5aおよび5bに示されている、機械学習システム1を訓練する、または出力データY’の不確実性Uを定量化する方法は、図3aおよび3bまたは図4aおよび4bに示されている方法とは、第2サブシステム1.2が、入力データXに対応する再構築データX’を生成するのであって、出力データY’に対応する再構築データY”を生成するのではないという点で異なる。ここでは、第2サブシステム1.2に関して、入力データとして訓練入力データXまたは入力データXを用いることは任意であるため、点線で示されている。
図6は、出力データY’の不確実性Uを定量化するシステム6を備える車両5の実施形態例を示す。ここで、システム6は、入力ユニット7と計算ユニット8と出力ユニット9とを備える。この場合、入力ユニット7は、車両5のセンサ10、例えば、画像センサ、レーダセンサまたはライダセンサによる入力データXを受信する。その次に、受信した入力データXは、出力データY’の不確実性Uを定量化する方法を実行する計算装置8に転送される。そして、このようにして生成された出力データY’および不確実性Uは、出力ユニット9を介して、車両5のさらなるシステム11、例えば、自動運転用のシステム11に転送される。出力データY’と共に、不確実性警告も送信されてよく、不確実性警告は、不確実性Uが所定値を超過している場合に発せられる。
不確実性Uが大き過ぎる場合または不確実性警告が発せられた場合には、例えば、自動運転用のシステム11は、車両5を減速させてよく、または車両制御を運転者に移譲してよい。
なお、本願は、特許請求の範囲に記載の発明に関するものであるが、他の観点として以下も含む。
1.
出力データ(Y’)の不確実性(U)を定量化する機械学習システム(1)を訓練する方法であって、訓練入力データ(X)と訓練目標値(Y)とを含む訓練データ(X,Y)が供給され、前記訓練データ(X,Y)を用いて、前記機械学習システム(1)が、
前記訓練入力データ(X)の入力の際に、前記訓練目標値(Y)に類似する出力データ(Y’)を生成し、
訓練データ(X,Y)の既知度の尺度を表す再構築データ(X’;Y”)を生成するように、前記機械学習システム(1)のパラメータは調整される、方法。
2.
前記再構築データ(X’)は、前記訓練入力データ(X)に類似する、上記1に記載の方法。
3.
前記再構築データ(Y”)は、前記訓練目標値(Y)に類似し、前記再構築データ(Y”)と前記訓練目標値(Y)との間の差分は、前記出力データ(Y’)と前記訓練目標値(Y)との間の差分よりも小さい、上記1に記載の方法。
4.
前記再構築データ(X’;Y”)を生成するために、前記訓練入力データ(X)および/または前記出力データ(Y’)が入力として用いられる、上記1~3の何れか1つに記載の方法。
5.
前記機械学習システム(1)はニューラルネットワーク、特に、畳み込みニューラルネットワークである、上記1~4の何れか1つに記載の方法。
6.
前記入力データ(X)は、特に、車両の、センサデータ、特に、画像データ、レーダデータおよび/またはライダデータを含む、上記1~5の何れか1つに記載の方法。
7.
機械学習システム(1)の出力データ(Y’)の不確実性(U)を定量化する方法であって、前記機械学習システム(1)が上記1~6の何れか1つに記載の機械学習システム(1)を訓練する方法により訓練されたものである、方法において、
前記機械学習システム(1)により、入力データ(X)から出力データ(Y’)が生成され、
前記機械学習システム(1)により、再構築データ(X’;Y”)が生成され、
メトリック(4)と前記再構築データ(X’;Y”)と前記再構築データ(X’;Y”)に対応するデータ(X;Y’)とを用いて、差分値が生成され、前記差分値は、前記入力データ(X)に関する訓練データ(X,Y)の既知度の尺度であり、前記出力データ(Y’)の不確実性(U)を定量化し、前記出力データ(Y’)に割り当てられる、方法。
8.
前記再構築データ(X’)に対応する前記データは、前記入力データ(X)である、上記7に記載の方法。
9.
前記再構築データ(X’)に対応する前記データは、前記入力データ(X)から生成された前記出力データ(Y’)である、上記7に記載の方法。
10.
前記再構築データ(X’;Y”)を生成するために、前記入力データ(X)および/または前記入力データ(X)から生成された前記出力データ(Y’)が用いられる、上記7~9の何れか1つに記載の方法。
11.
前記メトリック(4)は、前記再構築データ(X’;Y”)および前記再構築データ(X’;Y”)に対応する前記データ(X;Y’)Vの一部のみに適用される、上記7~10の何れか1つに記載の方法。
12.
不確実性(U)が所定値を超過している出力データ(Y’)に関して、不確実性警告が発せられる、上記7~11の何れか1つに記載の方法。
13.
不確実性(U)が所定値を超過している出力データ(Y’)に関して、前記機械学習システム(1)をさらに訓練するための前記入力データ(X)が保存される、上記7~12の何れか1つに記載の方法。
14.
機械学習システム(1)の出力データ(Y’)の不確実性(U)を定量化するシステムであって、
入力データ(X)を受信する入力ユニット(7)と、
上記7~13の何れか1つに記載の方法を実行するように構成されている計算ユニット(8)と、
前記計算ユニット(8)により生成された前記出力データ(Y’)、前記出力データ(Y’)の不確実性(U)および/または不確実性警告を出力する出力ユニット(9)とを備える、システム。
15.
上記14に記載の出力データ(Y’)の不確実性(U)を定量化するシステム(6)を備える車両。

Claims (14)

  1. 計算ユニット(8)を用いて、出力データ(Y’)の不確実性(U)を定量化する機械学習システム(1)を訓練する方法であって、訓練入力データ(X)と訓練目標値(Y)とを含む訓練データ(X,Y)が供給され、前記訓練データ(X,Y)を用いて、前記機械学習システム(1)が、
    前記訓練入力データ(X)の入力の際に、前記訓練目標値(Y)に類似する出力データ(Y’)を生成し、
    訓練データ(X,Y)の既知度の尺度を表す再構築データ(X’;Y”)を生成
    前記再構築データ(Y”)は、前記訓練目標値(Y)に類似し、前記再構築データ(Y”)と前記訓練目標値(Y)との間の差分は、前記出力データ(Y’)と前記訓練目標値(Y)との間の差分よりも小さいように、前記機械学習システム(1)のパラメータは調整される、方法。
  2. 前記再構築データ(X’)は、前記訓練入力データ(X)に類似する、請求項1に記載の方法。
  3. 前記再構築データ(X’;Y”)を生成するために、前記訓練入力データ(X)および/または前記出力データ(Y’)が入力として用いられる、請求項1に記載の方法。
  4. 前記機械学習システム(1)はニューラルネットワーク、特に、畳み込みニューラルネットワークである、請求項1に記載の方法。
  5. 訓練された機械学習システム(1)に用いられる入力データ(X)は、特に、車両の、センサデータ、特に、画像データ、レーダデータおよび/またはライダデータを含む、請求項1に記載の方法。
  6. 機械学習システム(1)の出力データ(Y’)の不確実性(U)を定量化する方法であって、前記機械学習システム(1)が請求項1に記載の機械学習システム(1)を訓練する方法により訓練されたものである、方法において、
    前記機械学習システム(1)により、入力データ(X)から出力データ(Y’)が生成され、
    前記機械学習システム(1)により、再構築データ(X’;Y”)が生成され、
    メトリック(4)と前記再構築データ(X’;Y”)と前記再構築データ(X’;Y”)に対応するデータ(X;Y’)とを用いて、差分値が生成され、前記差分値は、前記入力データ(X)に関する訓練データ(X,Y)の既知度の尺度であり、前記出力データ(Y’)の不確実性(U)を定量化し、前記出力データ(Y’)に割り当てられる、方法。
  7. 前記再構築データ(X’)に対応する前記データは、前記入力データ(X)である、請求項に記載の方法。
  8. 前記再構築データ(Y”)に対応する前記データは、前記入力データ(X)から生成された前記出力データ(Y’)である、請求項に記載の方法。
  9. 前記再構築データ(X’;Y”)を生成するために、前記入力データ(X)および/または前記入力データ(X)から生成された前記出力データ(Y’)が用いられる、請求項に記載の方法。
  10. 前記メトリック(4)は、前記再構築データ(X’;Y”)および前記再構築データ(X’;Y”)に対応する前記データ(X;Y’)Vの一部のみに適用される、請求項に記載の方法。
  11. 不確実性(U)が所定値を超過している出力データ(Y’)に関して、不確実性警告が発せられる、請求項に記載の方法。
  12. 不確実性(U)が所定値を超過している出力データ(Y’)に関して、前記機械学習システム(1)をさらに訓練するための前記入力データ(X)が保存される、請求項に記載の方法。
  13. 機械学習システム(1)の出力データ(Y’)の不確実性(U)を定量化するシステムであって、
    入力データ(X)を受信する入力ユニット(7)と、
    請求項12の何れか1項に記載の方法を実行するように構成されている計算ユニット(8)と、
    前記計算ユニット(8)により生成された前記出力データ(Y’)、前記出力データ(Y’)の不確実性(U)および/または不確実性警告を出力する出力ユニット(9)とを備える、システム。
  14. 請求項13に記載の出力データ(Y’)の不確実性(U)を定量化するシステム(6)を備える車両。
JP2024525881A 2021-11-29 2022-11-24 機械学習システムの出力データの不確実性を定量化する方法およびシステムならびに機械学習システムを訓練する方法 Active JP7708973B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102021213392.4 2021-11-29
DE102021213392.4A DE102021213392A1 (de) 2021-11-29 2021-11-29 Verfahren und System zur Quantifizierung von Unsicherheiten von Ausgabedaten eines maschinellen Lernsystems sowie Verfahren zum Trainieren eines maschinellen Lernsystems
PCT/DE2022/200275 WO2023093953A1 (de) 2021-11-29 2022-11-24 Verfahren und system zur quantifizierung von unsicherheiten von ausgabedaten eines maschinellen lernsystems sowie verfahren zum trainieren eines maschinellen lernsystems

Publications (2)

Publication Number Publication Date
JP2024542050A JP2024542050A (ja) 2024-11-13
JP7708973B2 true JP7708973B2 (ja) 2025-07-15

Family

ID=84767043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024525881A Active JP7708973B2 (ja) 2021-11-29 2022-11-24 機械学習システムの出力データの不確実性を定量化する方法およびシステムならびに機械学習システムを訓練する方法

Country Status (6)

Country Link
US (1) US20260004119A1 (ja)
EP (1) EP4441664A1 (ja)
JP (1) JP7708973B2 (ja)
CN (1) CN118265987A (ja)
DE (1) DE102021213392A1 (ja)
WO (1) WO2023093953A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021214334B3 (de) * 2021-12-14 2023-06-07 Continental Autonomous Mobility Germany GmbH Fahrzeugdatensystem und Verfahren zur Ermittlung von relevanten bzw. übertragenswerten Fahrzeugdaten eines Umgebungserfassungssensors

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016132468A1 (ja) 2015-02-18 2016-08-25 株式会社日立製作所 データ評価方法および装置、故障診断方法および装置
JP2019139277A (ja) 2018-02-06 2019-08-22 オムロン株式会社 評価装置、動作制御装置、評価方法、及び評価プログラム
US20200250812A1 (en) 2019-01-31 2020-08-06 Siemens Healthcare Limited Method and system for image analysis
JP6972444B1 (ja) 2021-03-23 2021-11-24 三菱電機株式会社 信頼度判定装置および信頼度判定方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019209565A1 (de) 2019-06-28 2020-12-31 Robert Bosch Gmbh Verfahren und Vorrichtung zum Überprüfen der Robustheit eines künstlichen neuronalen Netzes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016132468A1 (ja) 2015-02-18 2016-08-25 株式会社日立製作所 データ評価方法および装置、故障診断方法および装置
JP2019139277A (ja) 2018-02-06 2019-08-22 オムロン株式会社 評価装置、動作制御装置、評価方法、及び評価プログラム
US20200250812A1 (en) 2019-01-31 2020-08-06 Siemens Healthcare Limited Method and system for image analysis
JP6972444B1 (ja) 2021-03-23 2021-11-24 三菱電機株式会社 信頼度判定装置および信頼度判定方法

Also Published As

Publication number Publication date
CN118265987A (zh) 2024-06-28
JP2024542050A (ja) 2024-11-13
US20260004119A1 (en) 2026-01-01
DE102021213392A1 (de) 2023-06-01
EP4441664A1 (de) 2024-10-09
WO2023093953A1 (de) 2023-06-01

Similar Documents

Publication Publication Date Title
Wang et al. Random expert distillation: Imitation learning via expert policy support estimation
CN112149821B (zh) 用于估计神经网络的全局不确定性的方法
KR102589303B1 (ko) 고정 소수점 타입의 뉴럴 네트워크를 생성하는 방법 및 장치
US10677686B2 (en) Method and apparatus for autonomous system performance and grading
JP4970408B2 (ja) 物体特性のロバストな推定を用いる適応型運転者支援システム
US20170326771A1 (en) Abrasion amount estimation device and abrasion amount estimation method for check valve of injection molding machine
CN112639834A (zh) 用于数据分析的计算机实现的方法、计算机程序产品以及系统
KR20180130925A (ko) 머신 러닝을 위한 학습 이미지를 자동 생성하는 인공 지능 장치 및 그의 제어 방법
Rhode Non-stationary Gaussian process regression applied in validation of vehicle dynamics models
Demetriou et al. Generation of driving scenario trajectories with generative adversarial networks
JP7708973B2 (ja) 機械学習システムの出力データの不確実性を定量化する方法およびシステムならびに機械学習システムを訓練する方法
CN111433689A (zh) 用于目标系统的控制系统的生成
JP2021021978A (ja) 情報処理装置及びプログラム
CN112613617A (zh) 基于回归模型的不确定性估计方法和装置
WO2024200170A1 (en) Apparatus, method, and computer program for processing visual event data
US11727273B2 (en) System improvement for deep neural networks
CN117744707A (zh) 用于训练变分自编码器的设备和方法
WO2021095680A1 (ja) 推定システム、推定装置および推定方法
EP3783538A1 (en) Analysing interactions between multiple physical objects
JPWO2021059349A5 (ja)
JPWO2021059348A5 (ja)
CN114202007A (zh) 用于为人工智能模块创建训练、验证和测试数据集的方法、计算机程序、存储介质、设备
CN118765399A (zh) 自动量化由经训练的回归模型提供的预测的不确定性
CN116956033A (zh) 异常检测方法和装置、模型训练方法和装置、存储介质
JP7572170B2 (ja) データ圧縮システム、及びデータ圧縮方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240501

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250703

R150 Certificate of patent or registration of utility model

Ref document number: 7708973

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150