JP7517093B2 - データ生成プログラム、データ生成方法および情報処理装置 - Google Patents
データ生成プログラム、データ生成方法および情報処理装置 Download PDFInfo
- Publication number
- JP7517093B2 JP7517093B2 JP2020186509A JP2020186509A JP7517093B2 JP 7517093 B2 JP7517093 B2 JP 7517093B2 JP 2020186509 A JP2020186509 A JP 2020186509A JP 2020186509 A JP2020186509 A JP 2020186509A JP 7517093 B2 JP7517093 B2 JP 7517093B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- loss
- model
- classification
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/17—Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施例1にかかる情報処理装置10を説明する図である。近年、機械学習により学習されたモデルに対して、判断根拠が知りたいという要望が存在する。モデルが間違える要因の一つには、訓練時と異なる性質のデータが入力されるドメインシフトが知られており、このドメインシフトによりモデルが劣化する。図1に示す情報処理装置10は、上記要望に応えるために、モデルが間違えたデータに対してその原因を示唆する情報を出力することで、モデルの精度劣化の原因を特定するコンピュータ装置の一例である。
図4は、実施例1にかかる情報処理装置10の機能構成を示す機能ブロック図である。図4に示すように、情報処理装置10は、通信部11、表示部12、記憶部13、制御部20を有する。
図12は、処理の流れを示すフローチャートである。ここでは、各モデルの訓練を実行した後に補間を実行する例を説明するが、これに限定されるものではなく、別々のフローで実行することもできる。
上述したように、情報処理装置10は、対象の分類モデル16がドメイン1のデータでは高精度だったが、ドメイン2のデータでは精度が低い場合に、原因を可視化し、分類モデル16の精度劣化の原因を特定することができる。この結果、情報処理装置10は、分類モデル16の性能劣化の原因の分析と対策に有用な情報をユーザに提示することができる。
図13を用いて、生成モデル17にGANを適用した例を説明する。図13は、生成モデル17として用いるGANの訓練を説明する図である。
可視化対象データを生成するスタイル変換器を使用することもできる。図14は、スタイル変換器の訓練を説明する図である。図14では、サイクルGANを利用してドメイン2からドメイン1へのスタイル変換器を訓練する。図14に示すように、スタイル変換器は、「エンコーダA、デコーダA」、「エンコーダB、デコーダB」、識別器を有する。
上記実施例で用いたデータ例、数値例、閾値、表示例、各モデルのNN層の数、特徴空間の次元数等は、あくまで一例であり、任意に変更することができる。また、訓練データとして画像データを用いた画像分類以外にも、音声や時系列データの分析などにも用いることができる。
上記実施例では、情報処理装置10が分類モデル16を生成する例を説明したが、これに限定されるものではなく、情報処理装置10の分類モデル訓練部21が他の装置で生成された分類モデル16を取得する構成を採用することもできる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。なお、分類モデル16は、識別モデルの一例であり、分類モデル訓練部21は、第1取得部の一例であり、データ選択部23と抽出部24は、第2取得部の一例である。補間部25と生成部26は、生成部の一例であり、表示制御部27は、出力部の一例である。
図16は、ハードウェア構成例を説明する図である。図16に示すように、情報処理装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図16に示した各部は、バス等で相互に接続される。
11 通信部
12 表示部
13 記憶部
14 第1データセット
15 第2データセット
16 分類モデル
17 生成モデル
20 制御部
21 分類モデル訓練部
22 生成モデル訓練部
23 データ選択部
24 抽出部
25 補間部
26 生成部
27 表示制御部
Claims (8)
- コンピュータに、
第1ドメインに対応する第1データセットと第2ドメインに対応する第2データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得し、
前記第1ドメインに対応する第1データを前記識別モデルに入力して第1の前記識別の損失を取得するとともに、前記第2ドメインに対応する第2データを前記識別モデルに入力して第2の前記識別の損失を取得し、
前記データ生成モデルを用いて、前記第2の識別の損失を前記第1の識別の損失に近づけたデータを生成し、
生成された前記データを出力する、
処理を実行させることを特徴とするデータ生成プログラム。 - 前記第1の識別の損失から前記第2の識別の損失の間の各損失を線形補間により補間する処理を前記コンピュータに実行させ、
前記生成する処理は、補間された前記各損失に対応する各データを、前記データ生成モデルを用いて生成し、
前記出力する処理は、前記第1データと、補間された前記各損失に対応する前記各データと、前記第2データとを出力することを特徴とする請求項1に記載のデータ生成プログラム。 - 前記データ生成モデルは、入力データから特徴量を生成し、前記特徴量から前記入力データに対応する再構成データを生成する自己符号化器であり、
前記取得する処理は、前記第1データに対応する前記第1の識別の損失を取得するとともに、前記第1データを前記データ生成モデルに入力して第1特徴量を取得し、前記第2データに対応する前記第2の識別の損失を取得するとともに、前記第2データを前記データ生成モデルに入力して第2特徴量を取得し、
前記補間する処理は、前記第1の識別の損失と前記第1特徴量の組から、前記第2の識別の損失と前記第2特徴量の組の間に該当する損失と特徴量の各組を、線形補間により補間し、
前記生成する処理は、補間された前記各組の各特徴量を前記データ生成モデルに入力して、前記データ生成モデルにより生成される各再構成データを取得し、
前記出力する処理は、前記第1データから前記第2データの間を前記各再構成データで補間する段階的な表示形式で出力することを特徴とする請求項2に記載のデータ生成プログラム。 - 前記識別モデルの訓練に用いられた前記第1データセットに含まれる各データと前記データを前記識別モデルに入力したときの各識別の損失とを用いた訓練、および、訓練後の前記識別モデルによる識別対象である前記第2データセットに含まれる各データと前記データを前記識別モデルに入力したときの各識別の損失とを用いた訓練により、前記データ生成モデルを生成する、
処理を前記コンピュータに実行させることを特徴とする請求項1から3のいずれか一つに記載のデータ生成プログラム。 - 前記第1データセットに含まれる各データのうち、前記識別モデルによる前記識別の損失が閾値未満であるデータを前記第1データとして選択し、
前記第2データセットに含まれる各データのうち、前記識別モデルによる前記識別の損失が閾値以上であるデータを前記第2データとして選択する、
処理を前記コンピュータに実行させることを特徴とする請求項1から4のいずれか一つに記載のデータ生成プログラム。 - 前記第1データセットに含まれる各データと、前記第2データセットに含まれる各データとを用いた訓練により、前記第2データセットに含まれるデータを前記第1データセットに属するデータに変換するスタイル変換器を生成し、
前記第2データセットに含まれる各データから前記第2データを選択し、
前記第2データを前記スタイル変換器に入力して前記第1データを生成する、
処理を前記コンピュータに実行させることを特徴とする請求項1から4のいずれか一つに記載のデータ生成プログラム。 - コンピュータが、
第1ドメインに対応する第1データセットと第2ドメインに対応する第2データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得し、
前記第1ドメインに対応する第1データを前記識別モデルに入力して第1の前記識別の損失を取得するとともに、前記第2ドメインに対応する第2データを前記識別モデルに入力して第2の前記識別の損失を取得し、
前記データ生成モデルを用いて、前記第2の識別の損失を前記第1の識別の損失に近づけたデータを生成し、
生成された前記データを出力する、
処理を実行することを特徴とするデータ生成方法。 - 第1ドメインに対応する第1データセットと第2ドメインに対応する第2データセットとを用いて訓練され、かつ、識別モデルによる識別の損失をパラメータに含むデータ生成モデルを取得する第1取得部と、
前記第1ドメインに対応する第1データを前記識別モデルに入力して第1の前記識別の損失を取得するとともに、前記第2ドメインに対応する第2データを前記識別モデルに入力して第2の前記識別の損失を取得する第2取得部と、
前記データ生成モデルを用いて、前記第2の識別の損失を前記第1の識別の損失に近づけたデータを生成する生成部と、
生成された前記データを出力する出力部、
を有することを特徴とする情報処理装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020186509A JP7517093B2 (ja) | 2020-11-09 | 2020-11-09 | データ生成プログラム、データ生成方法および情報処理装置 |
| EP21196278.2A EP3996001A1 (en) | 2020-11-09 | 2021-09-13 | Data generation program, data generation method, and information processing device |
| US17/473,509 US20220147764A1 (en) | 2020-11-09 | 2021-09-13 | Storage medium, data generation method, and information processing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020186509A JP7517093B2 (ja) | 2020-11-09 | 2020-11-09 | データ生成プログラム、データ生成方法および情報処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022076203A JP2022076203A (ja) | 2022-05-19 |
| JP7517093B2 true JP7517093B2 (ja) | 2024-07-17 |
Family
ID=77739005
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020186509A Active JP7517093B2 (ja) | 2020-11-09 | 2020-11-09 | データ生成プログラム、データ生成方法および情報処理装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20220147764A1 (ja) |
| EP (1) | EP3996001A1 (ja) |
| JP (1) | JP7517093B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPWO2024157332A1 (ja) * | 2023-01-23 | 2024-08-02 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019159823A (ja) | 2018-03-13 | 2019-09-19 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
| JP2020035103A (ja) | 2018-08-28 | 2020-03-05 | 富士通株式会社 | 学習プログラム、画像分類プログラム、学習方法、画像分類方法、学習装置および画像分類装置 |
| JP2020060838A (ja) | 2018-10-05 | 2020-04-16 | 株式会社デンソーアイティーラボラトリ | 学習方法および学習システム |
| WO2020080239A1 (ja) | 2018-10-19 | 2020-04-23 | ソニー株式会社 | 情報処理方法、情報処理装置及び情報処理プログラム |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160358099A1 (en) | 2015-06-04 | 2016-12-08 | The Boeing Company | Advanced analytical infrastructure for machine learning |
-
2020
- 2020-11-09 JP JP2020186509A patent/JP7517093B2/ja active Active
-
2021
- 2021-09-13 US US17/473,509 patent/US20220147764A1/en not_active Abandoned
- 2021-09-13 EP EP21196278.2A patent/EP3996001A1/en not_active Withdrawn
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019159823A (ja) | 2018-03-13 | 2019-09-19 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
| JP2020035103A (ja) | 2018-08-28 | 2020-03-05 | 富士通株式会社 | 学習プログラム、画像分類プログラム、学習方法、画像分類方法、学習装置および画像分類装置 |
| JP2020060838A (ja) | 2018-10-05 | 2020-04-16 | 株式会社デンソーアイティーラボラトリ | 学習方法および学習システム |
| WO2020080239A1 (ja) | 2018-10-19 | 2020-04-23 | ソニー株式会社 | 情報処理方法、情報処理装置及び情報処理プログラム |
Non-Patent Citations (1)
| Title |
|---|
| YANG, Fu-En et al.,"A Multi-Domain and Multi-Modal Representation Disentangler for Cross-Domain Image Manipulation and Classification",IEEE Transactions on Image Processing [online],Vol. 29,IEEE Xplore,2019年,p. 2795-2807,[2024年05月27日検索],インターネット<URL:https://ieeexplore.ieee.org/document/8902223>,DOI: 10.1109/TIP.2019.2952707 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022076203A (ja) | 2022-05-19 |
| EP3996001A1 (en) | 2022-05-11 |
| US20220147764A1 (en) | 2022-05-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP4116853A1 (en) | Computer-readable recording medium storing evaluation program, evaluation method, and information processing device | |
| JP7172612B2 (ja) | データ拡張プログラム、データ拡張方法およびデータ拡張装置 | |
| CN107103171A (zh) | 机器学习模型的建模方法及装置 | |
| KR102605692B1 (ko) | 탐지대상 이미지에서의 이상 부분 탐지 방법 및 시스템, 이의 복원 모델 학습 방법 | |
| JP2015087903A (ja) | 情報処理装置及び情報処理方法 | |
| JP7047498B2 (ja) | 学習プログラム、学習方法および学習装置 | |
| US20240135145A1 (en) | Generation of Realistic Data for Training Of Artificial Neural Networks | |
| KR20190125029A (ko) | 시계열 적대적인 신경망 기반의 텍스트-비디오 생성 방법 및 장치 | |
| JP2006172437A (ja) | データのストリームにおけるセグメント境界の位置の決定方法、データサブセットを近隣のデータサブセットと比較してセグメント境界を決定する方法、コンピュータによって実行可能な命令のプログラム、ならびにデータのストリームにおける境界及び非境界を識別するシステム又は装置 | |
| TW202029013A (zh) | 圖像辨識裝置及方法 | |
| CN114330109A (zh) | 无人驾驶场景下深度强化学习模型的可解释性方法及系统 | |
| CN117877521A (zh) | 基于数据增强的无监督机械声音异常识别方法及系统 | |
| JP2010102696A (ja) | 画像処理装置および係数学習装置。 | |
| JP7517093B2 (ja) | データ生成プログラム、データ生成方法および情報処理装置 | |
| JP5082512B2 (ja) | 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム | |
| CN117743687B (zh) | 一种序列推荐模型建模方法及装置 | |
| JP2022114332A (ja) | クラス判定システム、クラス判定方法及びクラス判定プログラム | |
| JP6954070B2 (ja) | 判別プログラム、判別方法および判別装置 | |
| Jonnalagedda et al. | SAGE: Sequential attribute generator for analyzing glioblastomas using limited dataset | |
| WO2020079815A1 (ja) | 学習プログラム、学習方法および学習装置 | |
| JP7452695B2 (ja) | 生成プログラム、生成方法および情報処理装置 | |
| US20220245395A1 (en) | Computer-readable recording medium storing determination program, determination method, and determination device | |
| JP7563056B2 (ja) | データ提示プログラム、データ提示方法および情報処理装置 | |
| JP2019219728A (ja) | 学習済みモデルを選定する方法、訓練データを生成する方法、学習済みモデルを生成する方法、コンピュータおよびプログラム | |
| EP4227865A1 (en) | Output control program, output control method, and information processing device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230707 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240527 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240604 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240617 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7517093 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |