JP7596228B2 - 学習データの選択方法及び計算機システム - Google Patents
学習データの選択方法及び計算機システム Download PDFInfo
- Publication number
- JP7596228B2 JP7596228B2 JP2021117000A JP2021117000A JP7596228B2 JP 7596228 B2 JP7596228 B2 JP 7596228B2 JP 2021117000 A JP2021117000 A JP 2021117000A JP 2021117000 A JP2021117000 A JP 2021117000A JP 7596228 B2 JP7596228 B2 JP 7596228B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- learning data
- data
- computer
- predictor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
- G06F18/2185—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor the supervisor being an automated module, e.g. intelligent oracle
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
101 端末
105 ネットワーク
110 データ受付部
111 結果出力部
120 学習条件設定部
121 学習部
122 予測器
123 学習履歴情報123
124 学習データデータベース
130 影響スコア算出部
131 学習データ選択部
132 影響度情報
133 影響スコア情報
140 テストデータデータベース
201 プロセッサ
202 主記憶装置
203 副記憶装置
204 ネットワークインタフェース
600 GUI
700 API
Claims (12)
- 計算機システムが実行する、予測器を生成するために用いる学習データの選択方法であって、
前記計算機システムは、
プロセッサ及び前記プロセッサに接続されるメモリを有する計算機を含み、
複数の学習データと、異なる学習条件の下で生成された、複数の予測器を管理するための情報と、を格納するデータベースと接続し、
前記学習データの選択方法は、
前記計算機が、複数の前記予測器の中からターゲット予測器を選択し、複数のテストデータの各々について、前記学習データが前記テストデータに対する前記ターゲット予測器の予測精度に与える影響の強さを表す影響度を算出する第1のステップと、
前記計算機が、前記予測器と、複数の前記テストデータの各々に対する、前記学習データの前記影響度と、を対応付けて記録する第2のステップと、
前記計算機が、複数の前記予測器の各々について、前記予測器と対応付けられる、前記学習データの複数の前記影響度に基づいて、前記学習データの影響スコアを算出する第3のステップと、
前記計算機が、複数の前記予測器の各々と、前記学習データの前記影響スコアとを対応付けて記録する第4のステップと、
前記計算機が、複数の前記学習データの各々の複数の前記影響スコアに基づいて、複数の前記学習データの中から使用する前記学習データを選択することによって学習データセットを生成する第5のステップと、
を含むことを特徴とする学習データの選択方法。 - 請求項1に記載の学習データの選択方法であって、
前記第5のステップは、
前記計算機が、複数の前記予測器の各々について、前記予測器と対応付けられる、複数の前記学習データの各々の前記影響スコアに基づいて、除外する前記学習データを選択する選択処理を実行するステップと、
前記計算機が、複数の前記予測器の各々についての前記選択処理の結果に基づいて、複数の前記学習データの中から使用する前記学習データを選択するステップと、
を含むことを特徴とする学習データの選択方法。 - 請求項2に記載の学習データの選択方法であって、
前記学習条件は、前記予測器を生成するために用いた複数の前記学習データ及び複数の前記学習データの入力順番を含むことを特徴とする学習データの選択方法。 - 請求項3に記載の学習データの選択方法であって、
前記学習条件は、前記予測器を生成するための学習処理のハイパーパラメータを含むことを特徴とする学習データの選択方法。 - 請求項4に記載の学習データの選択方法であって、
前記計算機が、異なる前記学習条件の下で前記予測器を生成する第6のステップを含み、
前記第6のステップは、
前記計算機が、前記データベースから所定の数の前記学習データを選択し、選択された複数の前記学習データの入力順番を決定することによってバッチを生成する第7のステップと、
前記計算機が、前記ハイパーパラメータを設定する第8のステップと、
前記計算機が、複数の前記バッチの中からターゲットバッチを選択し、設定された前記ハイパーパラメータ及び前記ターゲットバッチに含まれる複数の前記学習データを用いて前記学習処理を実行し、前記ターゲットバッチに含まれる複数の前記学習データ、決定された前記入力順番、設定された前記ハイパーパラメータ、及び生成された前記予測器を対応付けて前記情報に格納する第9のステップと、
前記計算機が、前記学習処理の結果に基づいて、学習を継続するか否かを判定する第10のステップと、
前記計算機が、学習を継続すると判定された場合、全ての前記バッチについて処理が完了したか否かを判定する第11のステップと、
前記計算機が、全ての前記バッチについて処理が完了していないと判定された場合、前記第9のステップ及び前記第10のステップを実行する第12のステップと、
を含むことを特徴とする学習データの選択方法。 - 請求項5に記載の学習データの選択方法であって、
前記計算機が、生成する前記予測器の数、前記バッチを構成する前記学習データの数、前記ハイパーパラメータを調整するための値を入力するインタフェースを提供するステップを含むことを特徴とする学習データの選択方法。 - プロセッサ及び前記プロセッサに接続されるメモリを有する計算機を備える計算機システムであって、
複数の学習データと、異なる学習条件の下で生成された、複数の予測器を管理するための情報と、を格納するデータベースと接続し、
前記計算機は、
複数の前記予測器の中からターゲット予測器を選択し、複数のテストデータの各々について、前記学習データが前記テストデータに対する前記ターゲット予測器の予測精度に与える影響の強さを表す影響度を算出する第1の処理と、
前記予測器と、複数の前記テストデータの各々に対する、前記学習データの前記影響度と、を対応付けて記録する第2の処理と、
複数の前記予測器の各々について、前記予測器と対応付けられる、前記学習データの複数の前記影響度に基づいて、前記学習データの影響スコアを算出する第3の処理と、
複数の前記予測器の各々と、前記学習データの前記影響スコアとを対応付けて記録する第4の処理と、
複数の前記学習データの各々の複数の前記影響スコアに基づいて、複数の前記学習データの中から使用する前記学習データを選択することによって学習データセットを生成する第5の処理と、
を実行することを特徴とする計算機システム。 - 請求項7に記載の計算機システムであって、
前記計算機は、前記第5の処理において、
複数の前記予測器の各々について、前記予測器と対応付けられる、複数の前記学習データの各々の前記影響スコアに基づいて、除外する前記学習データを選択する選択処理を実行し、
複数の前記予測器の各々についての前記選択処理の結果に基づいて、複数の前記学習データの中から使用する前記学習データを選択する、ことを特徴とする計算機システム。 - 請求項8に記載の計算機システムであって、
前記学習条件は、前記予測器を生成するために用いた複数の前記学習データ及び複数の前記学習データの入力順番を含むことを特徴とする計算機システム。 - 請求項9に記載の計算機システムであって、
前記学習条件は、前記予測器を生成するための学習処理のハイパーパラメータを含むことを特徴とする計算機システム。 - 請求項10に記載の計算機システムであって、
前記計算機は、異なる前記学習条件の下で前記予測器を生成する第6の処理を実行し、
前記計算機は、前記第6の処理において、
前記データベースから所定の数の前記学習データを選択し、選択された複数の前記学習データの入力順番を決定することによってバッチを生成する第7の処理と、
前記ハイパーパラメータを設定する第8の処理と、
複数の前記バッチの中からターゲットバッチを選択し、設定された前記ハイパーパラメータ及び前記ターゲットバッチに含まれる複数の前記学習データを用いて前記学習処理を実行し、前記ターゲットバッチに含まれる複数の前記学習データ、決定された前記入力順番、設定された前記ハイパーパラメータ、及び生成された前記予測器を対応付けて前記情報に格納する第9の処理と、
前記学習処理の結果に基づいて、学習を継続するか否かを判定する第10の処理と、
学習を継続すると判定された場合、全ての前記バッチについて処理が完了したか否かを判定する第11の処理と、
全ての前記バッチについて処理が完了していないと判定された場合、前記第9の処理及び前記第10の処理を実行する第12の処理と、
を実行することを特徴とする計算機システム。 - 請求項11に記載の計算機システムであって、
前記計算機は、生成する前記予測器の数、前記バッチを構成する前記学習データの数、前記ハイパーパラメータを調整するための値を入力するインタフェースを提供することを特徴とする計算機システム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021117000A JP7596228B2 (ja) | 2021-07-15 | 2021-07-15 | 学習データの選択方法及び計算機システム |
| US17/675,445 US12499179B2 (en) | 2021-07-15 | 2022-02-18 | Selection method of learning data and computer system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021117000A JP7596228B2 (ja) | 2021-07-15 | 2021-07-15 | 学習データの選択方法及び計算機システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023013082A JP2023013082A (ja) | 2023-01-26 |
| JP7596228B2 true JP7596228B2 (ja) | 2024-12-09 |
Family
ID=84891693
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021117000A Active JP7596228B2 (ja) | 2021-07-15 | 2021-07-15 | 学習データの選択方法及び計算機システム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12499179B2 (ja) |
| JP (1) | JP7596228B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020183705A1 (ja) * | 2019-03-14 | 2020-09-17 | 日本電気株式会社 | 生成方法、学習データ生成装置及びプログラム |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020030738A (ja) | 2018-08-24 | 2020-02-27 | 株式会社日立製作所 | 学習データの解析方法及び計算機システム |
| JP2021033544A (ja) | 2019-08-22 | 2021-03-01 | 株式会社日立製作所 | 学習データの精練方法及び計算機システム |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11501153B2 (en) * | 2017-12-28 | 2022-11-15 | Intel Corporation | Methods and apparatus for training a neural network |
| US12248888B2 (en) * | 2018-09-21 | 2025-03-11 | Cloudera, Inc. | Hyperparameter tuning using visual analytics in a data science platform |
| CN112740237B (zh) * | 2018-09-30 | 2025-08-22 | 华为技术有限公司 | 训练人工神经网络的方法和装置 |
| WO2020194500A1 (ja) | 2019-03-26 | 2020-10-01 | 日本電気株式会社 | 学習装置、学習方法、及び、記録媒体 |
-
2021
- 2021-07-15 JP JP2021117000A patent/JP7596228B2/ja active Active
-
2022
- 2022-02-18 US US17/675,445 patent/US12499179B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020030738A (ja) | 2018-08-24 | 2020-02-27 | 株式会社日立製作所 | 学習データの解析方法及び計算機システム |
| JP2021033544A (ja) | 2019-08-22 | 2021-03-01 | 株式会社日立製作所 | 学習データの精練方法及び計算機システム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023013082A (ja) | 2023-01-26 |
| US20230019364A1 (en) | 2023-01-19 |
| US12499179B2 (en) | 2025-12-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7097261B2 (ja) | 学習データの解析方法及び計算機システム | |
| JP7141371B2 (ja) | 学習データの精練方法及び計算機システム | |
| US9412077B2 (en) | Method and apparatus for classification | |
| JP7145059B2 (ja) | モデルの予測根拠提示システム及びモデルの予測根拠提示方法 | |
| CN111210046B (zh) | 优化装置及优化装置的控制方法 | |
| US10839314B2 (en) | Automated system for development and deployment of heterogeneous predictive models | |
| CN105320519A (zh) | 使用长历史记录的条件分支预测 | |
| US11380301B2 (en) | Learning apparatus, speech recognition rank estimating apparatus, methods thereof, and program | |
| US11443238B2 (en) | Computer system and presentation method of information | |
| CN110689110A (zh) | 处理交互事件的方法及装置 | |
| JP2021110974A (ja) | モデルを再利用する方法 | |
| JP7006616B2 (ja) | 予測モデル生成システム、方法およびプログラム | |
| JP7596228B2 (ja) | 学習データの選択方法及び計算機システム | |
| JPWO2014087590A1 (ja) | 最適化装置、最適化方法および最適化プログラム | |
| US11676050B2 (en) | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes | |
| CN114266615A (zh) | 推荐预排序精度提升方法、装置、设备及计算机存储介质 | |
| JP7050028B2 (ja) | 計算機システム及び機械学習の制御方法 | |
| US10331823B2 (en) | Method and system of fast nested-loop circuit verification for process and environmental variation and hierarchical circuits | |
| JP2024009471A (ja) | 計算機システム及びモデルの学習方法 | |
| JP7819776B2 (ja) | メタ学習方法、メタ学習装置及びプログラム | |
| US11335434B2 (en) | Feature selection for efficient epistasis modeling for phenotype prediction | |
| KR20220008140A (ko) | 가상 사용자 및 상품 증강을 이용한 콜드-스타트 문제 해결 방안 | |
| JP7841056B2 (ja) | オフライン優先度に基づく強化学習装置及び方法 | |
| Galinier et al. | Genetic algorithm to improve diversity in MDE | |
| Devika et al. | Automation of Genetic Diagnosis for Detecting Chromosome Structure |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240130 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241031 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241105 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241127 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7596228 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |