JP2020177582A - 学習装置、学習方法、プログラムおよび認識装置 - Google Patents
学習装置、学習方法、プログラムおよび認識装置 Download PDFInfo
- Publication number
- JP2020177582A JP2020177582A JP2019081223A JP2019081223A JP2020177582A JP 2020177582 A JP2020177582 A JP 2020177582A JP 2019081223 A JP2019081223 A JP 2019081223A JP 2019081223 A JP2019081223 A JP 2019081223A JP 2020177582 A JP2020177582 A JP 2020177582A
- Authority
- JP
- Japan
- Prior art keywords
- inference
- input data
- neural network
- noise
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
Description
第1の実施形態は、ニューラルネットワークの推論(認識)の寄与度に基づいて、付加するノイズのパラメータを決定する。これにより、付加するノイズのパラメータが、学習の進捗および認識率に対して適応的に決定されるため、過学習をより安定して抑制できる。また、このように学習されたニューラルネットワークを用いれば、認識率を向上させることができる。
y1i=f(w、xi) ・・・(1)
si=g(w、xi) ・・・(2)
ni(u、v)=1 (si(u、v、c)<Tのとき) ・・・(3)
y2i=f(w、xi◎ni) ・・・(4)
L=−Σi(ti Tln(y2i)) ・・・(5)
上記実施形態では、通常は複数回実行される学習処理の各回で、入力画像に対するニューラルネットワークによる推論(第1推論、ステップS102)と、ノイズを付加した入力画像に対するニューラルネットワークによる推論(第2推論、ステップS103〜ステップS105)と、が実行される。すなわち、繰り返される学習処理の各回で、ニューラルネットワークによる推論が2回実行される。
上記のように、ノイズは、中間層データに付加されてもよい。本変形例では、中間層データにノイズを付加する方法について説明する。
ノイズは、上記(3)式のように算出されるノイズに限られるものではない。例えば、ノイズ算出部104は、ゼロの代わりに、要素(画素)ごとに、または、全要素一括でランダム値を算出してもよい。ノイズ算出部104は、ゼロの代わりに、周辺画素の画素値の平均値を算出してもよい。
ni◎xi+(1−ni)◎xi’ ・・・(6)
閾値Tは、固定値であってもよいし、変更される値であってもよい。例えば推論部102は、ノイズを付加する要素(画素)の個数が上限値以下となるように、閾値Tを変更してもよい。上限値は、例えば、入力画像の画素数(または、中間層データの要素数)に予め定められた割合を乗じた値として決定されてもよい。
上記実施形態では、ラベルtiのうち対象ラベルcに対応する注目度画像siに基づいてノイズが付加された。ラベルtiのうち対象ラベルc以外の非対象ラベルc’に対応する注目度画像siに基づいてノイズが付加されてもよい。例えば、ノイズ算出部104は、以下の(7)式により付加するノイズniを算出してもよい。T’は、非対象ラベルの注目度画像siに対して定められる閾値である。si(u、v、c’)は、水平方向の画素位置u、垂直方向の画素位置v、非対象ラベルc’に対応する注目度画像の画素値を表す。
ni(u、v)=1 (それ以外) ・・・(7)
ni(u、v)=1 (si(u、v、c’)≧T’のとき) ・・・(8)
ni(u、v)=1 (それ以外) ・・・(9)
第2の実施形態では、学習装置で学習したニューラルネットワークを用いて認識処理を実行する認識装置を備える情報処理システムについて説明する。
101 取得部
102 推論部
103 注目度画像算出部
104 ノイズ算出部
105 更新部
106−2 出力制御部
121 記憶部
200−2 認識装置
201 通信制御部
202 取得部
203 認識部
204 出力制御部
221 記憶部
300−2 ネットワーク
Claims (12)
- 入力データと、前記入力データによる推論の正解を示す対象ラベルと、を取得する取得部と、
前記入力データをニューラルネットワークに入力したときの推論結果に対する前記入力データに含まれる複数の要素の寄与度に基づいたノイズを、前記入力データ、および、前記ニューラルネットワークの中間層のデータの少なくとも一方に付加し、前記入力データに対する前記ニューラルネットワークによる推論を実行する推論部と、
前記ニューラルネットワークによる推論結果と、前記対象ラベルと、が一致するように前記ニューラルネットワークのパラメータを更新する更新部と、
を備える学習装置。 - 前記推論部は、前記対象ラベルと一致する推論結果に対する前記寄与度が閾値以上の要素に対して前記ノイズを付加する、
請求項1に記載の学習装置。 - 前記推論部は、前記ノイズを付加する要素の個数が上限値以下となるように、前記閾値を変更する、
請求項2に記載の学習装置。 - 前記推論部は、前記対象ラベルと一致しない推論結果に対する前記寄与度が閾値以上である要素に対して前記ノイズを付加する、
請求項1に記載の学習装置。 - 前記推論部は、前記対象ラベルと一致しない推論結果に対する前記寄与度が閾値より小さい要素に対して前記ノイズを付加する、
請求項1に記載の学習装置。 - 前記推論部は、前記対象ラベルと一致する推論結果に対する前記寄与度が第1閾値以上であり、かつ、前記対象ラベルと一致しない推論結果に対する前記寄与度が第2閾値以上である要素に対して前記ノイズを付加する、
請求項1に記載の学習装置。 - 前記推論部は、前記寄与度に基づく頻度で、前記ノイズを前記入力データおよび前記中間層のデータの少なくとも一方に付加する、
請求項1に記載の学習装置。 - 前記推論部は、
複数回実行される学習処理の各回で、前記入力データに対する前記ニューラルネットワークによる第1推論を実行し、前記第1推論の推論結果に対する前記入力データに含まれる複数の要素の寄与度に基づいたノイズを算出し、前記入力データ、および、前記中間層のデータの少なくとも一方に、算出したノイズを付加し、前記入力データに対する前記ニューラルネットワークによる第2推論を実行する、
請求項1に記載の学習装置。 - 前記推論部は、
複数回実行される学習処理の各回で、前記入力データおよび前記中間層のデータの少なくとも一方に前記ノイズを付加し、前記入力データに対する前記ニューラルネットワークによる推論を実行し、
複数回実行される学習処理のうちm回目(mは2以上の整数)の学習処理で付加する前記ノイズを、複数回実行される学習処理のうち(m−1)回目の学習処理での前記ニューラルネットワークによる推論の推論結果に対する前記入力データに含まれる複数の要素の寄与度に基づいて算出する、
請求項1に記載の学習装置。 - 入力データと、前記入力データによる推論の正解を示す対象ラベルと、を取得する取得ステップと、
前記入力データをニューラルネットワークに入力したときの推論結果に対する前記入力データに含まれる複数の要素の寄与度に基づいたノイズを、前記入力データ、および、前記ニューラルネットワークの中間層のデータの少なくとも一方に付加し、前記入力データに対する前記ニューラルネットワークによる推論を実行する推論ステップと、
前記ニューラルネットワークによる推論結果と、前記対象ラベルと、が一致するように前記ニューラルネットワークのパラメータを更新する更新ステップと、
を含む学習方法。 - コンピュータを、
入力データと、前記入力データによる推論の正解を示す対象ラベルと、を取得する取得部と、
前記入力データをニューラルネットワークに入力したときの推論結果に対する前記入力データに含まれる複数の要素の寄与度に基づいたノイズを、前記入力データ、および、前記ニューラルネットワークの中間層のデータの少なくとも一方に付加し、前記入力データに対する前記ニューラルネットワークによる推論を実行する推論部と、
前記ニューラルネットワークによる推論結果と、前記対象ラベルと、が一致するように前記ニューラルネットワークのパラメータを更新する更新部と、
として機能させるためのプログラム。 - 請求項1に記載の学習装置により学習された前記ニューラルネットワークを用いて、入力データの認識を実行する認識部と、
前記認識部による認識結果を出力する出力制御部と、
を備える認識装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019081223A JP7106486B2 (ja) | 2019-04-22 | 2019-04-22 | 学習装置、学習方法、プログラムおよび情報処理システム |
| US16/798,853 US11640530B2 (en) | 2019-04-22 | 2020-02-24 | Learning device, learning method, computer program product, and recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019081223A JP7106486B2 (ja) | 2019-04-22 | 2019-04-22 | 学習装置、学習方法、プログラムおよび情報処理システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020177582A true JP2020177582A (ja) | 2020-10-29 |
| JP7106486B2 JP7106486B2 (ja) | 2022-07-26 |
Family
ID=72832545
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019081223A Active JP7106486B2 (ja) | 2019-04-22 | 2019-04-22 | 学習装置、学習方法、プログラムおよび情報処理システム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US11640530B2 (ja) |
| JP (1) | JP7106486B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023166940A1 (ja) * | 2022-03-03 | 2023-09-07 | パナソニックIpマネジメント株式会社 | 注視領域モデル生成システム及び推論装置 |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7055769B2 (ja) * | 2019-04-23 | 2022-04-18 | 株式会社東芝 | データ生成装置、データ生成方法およびプログラム |
| DE112020007472T5 (de) * | 2020-07-28 | 2023-05-11 | Mitsubishi Electric Corporation | Lernnutzungssystem, nutzungsvorrichtung, lernvorrichtung, programm und lernnutzungsverfahren |
| US11200497B1 (en) * | 2021-03-16 | 2021-12-14 | Moffett Technologies Co., Limited | System and method for knowledge-preserving neural network pruning |
| CN115114845B (zh) * | 2022-05-24 | 2025-11-21 | 杭州百子尖科技股份有限公司 | 一种用于数字孪生系统的平推流反应器建模的方法和装置 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015095212A (ja) * | 2013-11-14 | 2015-05-18 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
| JP2016143354A (ja) * | 2015-02-04 | 2016-08-08 | エヌ・ティ・ティ・コムウェア株式会社 | 学習装置、学習方法、およびプログラム |
| WO2018167900A1 (ja) * | 2017-03-16 | 2018-09-20 | 日本電気株式会社 | ニューラルネットワーク学習装置、方法、およびプログラム |
| JP2018152000A (ja) * | 2017-03-15 | 2018-09-27 | 株式会社島津製作所 | 分析データ解析装置及び分析データ解析方法 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9406017B2 (en) | 2012-12-24 | 2016-08-02 | Google Inc. | System and method for addressing overfitting in a neural network |
| US10776692B2 (en) * | 2015-07-24 | 2020-09-15 | Deepmind Technologies Limited | Continuous control with deep reinforcement learning |
| JP7079445B2 (ja) * | 2018-09-25 | 2022-06-02 | 本田技研工業株式会社 | モデルパラメータ学習装置、制御装置及びモデルパラメータ学習方法 |
| JP7086878B2 (ja) | 2019-02-20 | 2022-06-20 | 株式会社東芝 | 学習装置、学習方法、プログラムおよび認識装置 |
-
2019
- 2019-04-22 JP JP2019081223A patent/JP7106486B2/ja active Active
-
2020
- 2020-02-24 US US16/798,853 patent/US11640530B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015095212A (ja) * | 2013-11-14 | 2015-05-18 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
| JP2016143354A (ja) * | 2015-02-04 | 2016-08-08 | エヌ・ティ・ティ・コムウェア株式会社 | 学習装置、学習方法、およびプログラム |
| JP2018152000A (ja) * | 2017-03-15 | 2018-09-27 | 株式会社島津製作所 | 分析データ解析装置及び分析データ解析方法 |
| WO2018167900A1 (ja) * | 2017-03-16 | 2018-09-20 | 日本電気株式会社 | ニューラルネットワーク学習装置、方法、およびプログラム |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023166940A1 (ja) * | 2022-03-03 | 2023-09-07 | パナソニックIpマネジメント株式会社 | 注視領域モデル生成システム及び推論装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7106486B2 (ja) | 2022-07-26 |
| US20200334529A1 (en) | 2020-10-22 |
| US11640530B2 (en) | 2023-05-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2020177582A (ja) | 学習装置、学習方法、プログラムおよび認識装置 | |
| US11508038B2 (en) | Image processing method, storage medium, image processing apparatus, learned model manufacturing method, and image processing system | |
| US11195055B2 (en) | Image processing method, image processing apparatus, storage medium, image processing system, and manufacturing method of learnt model | |
| EP3745309A1 (en) | Training a generative adversarial network | |
| JP7055769B2 (ja) | データ生成装置、データ生成方法およびプログラム | |
| JP2017211939A (ja) | 生成装置、生成方法、及び生成プログラム | |
| US20190303746A1 (en) | Multilayer neural network learning apparatus and method of controlling the same | |
| JP6158882B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
| JP2019197355A (ja) | クラスタリング装置、クラスタリング方法およびプログラム | |
| CN110895807B (zh) | 用于评估图像的系统、运行辅助方法和工作设备 | |
| JP7086878B2 (ja) | 学習装置、学習方法、プログラムおよび認識装置 | |
| US20250078448A1 (en) | Image processing method and apparatus, training method and apparatus of machine learning model, and storage medium | |
| US20210264235A1 (en) | Projecting Images To A Generative Model Based On Gradient-free Latent Vector Determination | |
| JP7395705B2 (ja) | 推定装置、推定方法及びプログラム | |
| JP2019164618A (ja) | 信号処理装置、信号処理方法およびプログラム | |
| CN119540518A (zh) | 图像和视频中的实时显著目标检测 | |
| US20250173843A1 (en) | Image processing method, image processing apparatus, image processing system, and memory medium | |
| CN115496673A (zh) | 图像处理方法、图像处理装置、图像处理系统、以及存储介质 | |
| US12586344B2 (en) | Generative model for multi-modality outputs from a single input | |
| US12592058B2 (en) | Data generating method, learning method, estimating method, data generating device, and program | |
| JP7054603B2 (ja) | 判定装置、判定方法、及び判定プログラム | |
| CN117893766B (zh) | 物体检测分割方案 | |
| JP2023075764A (ja) | 学習装置、学習方法及びプログラム | |
| JP2021174070A (ja) | 画像処理方法、学習済みモデルの製造方法、プログラム、および、画像処理装置 | |
| CN113191940B (zh) | 图像处理方法、装置、设备及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210311 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220224 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220308 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220414 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220614 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220713 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7106486 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |