JP7710969B2 - 学習データのためのデータモデル構成方法、および学習データ生成装置 - Google Patents
学習データのためのデータモデル構成方法、および学習データ生成装置Info
- Publication number
- JP7710969B2 JP7710969B2 JP2021189669A JP2021189669A JP7710969B2 JP 7710969 B2 JP7710969 B2 JP 7710969B2 JP 2021189669 A JP2021189669 A JP 2021189669A JP 2021189669 A JP2021189669 A JP 2021189669A JP 7710969 B2 JP7710969 B2 JP 7710969B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- filter
- items
- variable
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (14)
- 機械学習用の学習データのためのデータモデルを構成する方法であって、
前記学習データの基となるデータベースのデータの区分を意味するデータ項目が、抽象度あるいは詳細度の階層構造を持つ場合に、
前記階層の少なくとも一つを指定するとともに、前記データ項目のどの部分を目的変数とし、どの部分を説明変数にするかを振り分ける、フィルタデータを予め準備し、
情報処理装置が、前記フィルタデータに基づいて前記データ項目に作用し、前記データ項目の抽象度あるいは詳細度の指定をデータ項目ごとに可能とするとともに、データ項目を目的変数と説明変数に振り分けるフィルタを用いて、
前記データベースから学習データに使用するデータ項目を抽出するために、目的変数とするデータ項目と説明変数とするデータ項目を定義したデータモデルを構成する、
学習データのためのデータモデル構成方法。 - 前記データ項目が分類と個別項目の階層構造を持つ場合に、
前記フィルタは、第1のフィルタ、第2のフィルタ、および第3のフィルタの機能を備え、
前記第1のフィルタが、各個別項目が目的変数か、説明変数か、不使用かを定め、
前記第2のフィルタが、各個別項目の抽象化を定め、
前記第3のフィルタが、各個別項目の抽象化を回避するかどうかを定める、
請求項1記載の学習データのためのデータモデル構成方法。 - 前記データ項目が分類と個別項目の階層構造を持つ場合に、
前記フィルタは、第1のフィルタ、第2のフィルタ、および第3のフィルタの機能を備え、
前記第1のフィルタが、各分類が目的変数か、説明変数か、不使用かを定め、
前記第2のフィルタが、各分類の詳細化を定め、
前記第3のフィルタが、各分類の詳細化を回避するかどうかを定める、
請求項1記載の学習データのためのデータモデル構成方法。 - 前記学習データの基となるデータベースを複数用い、各データベースのデータ項目が抽象度あるいは詳細度の階層構造を持つ場合に、
複数の前記データベースに前記フィルタをそれぞれ適用し、複数の前記データベースから学習データに使用するデータ項目を抽出して統合する統合フィルタとして機能させる、
請求項1記載の学習データのためのデータモデル構成方法。 - 複数の前記データベースに適用する前記フィルタは、それぞれ特性が異なる、
請求項4記載の学習データのためのデータモデル構成方法。 - 前記統合フィルタが複数の前記データベースそれぞれから抽出する、目的変数と説明変数の比率を算出する、
請求項5記載の学習データのためのデータモデル構成方法。 - 前記統合フィルタの候補を複数準備し、
それぞれの前記統合フィルタの候補が、各データベースから抽出する目的変数と説明変数の比率を算出し、
入力された値に最も近い目的変数と説明変数の比率を実現する統合フィルタを選択する、
請求項6記載の学習データのためのデータモデル構成方法。 - 機械学習用の学習データを生成する学習データ生成装置であって、学習データ生成部を備え、
前記学習データ生成部は、
前記学習データの基となるデータベースのデータの区分を意味するデータ項目が、抽象度あるいは詳細度の階層構造を持つ場合に、
前記階層の少なくとも一つを指定するとともに、前記データ項目のどの部分を目的変数とし、どの部分を説明変数にするかを振り分ける、フィルタデータを備え、
前記フィルタデータに基づいて前記データ項目に作用し、前記データ項目の抽象度あるいは詳細度の指定をデータ項目ごとに可能とするとともに、データ項目を目的変数と説明変数に振り分けるフィルタを用いて、目的変数とするデータ項目と説明変数とするデータ項目を定義したデータモデルを構成し、
前記データモデルを用いて、前記データベースから学習データに使用する目的変数または説明変数とするデータを抽出する、
学習データ生成装置。 - 前記学習データの基となるデータベースを複数用い、各データベースのデータ項目が抽象度あるいは詳細度の階層構造を持つ場合に、
複数の前記データベースに前記フィルタをそれぞれ適用し、複数の前記データベースそれぞれから学習データに使用するデータを抽出して統合する統合フィルタとして機能させる、
請求項8記載の学習データ生成装置。 - 複数の前記データベースに適用する前記フィルタは、それぞれ特性が異なる、
請求項9記載の学習データ生成装置。 - 前記フィルタは、さらにデータベースのデータ項目を不使用とするかどうかを定める、
請求項9記載の学習データ生成装置。 - 前記フィルタは、複数の前記データベースから抽出する目的変数および説明変数の少なくとも一つに対して論理演算を行うことにより、統合目的変数と統合説明変数を生成する機能を有する、
請求項9記載の学習データ生成装置。 - 前記学習データ生成部は、
複数の前記データベースそれぞれから抽出する目的変数と説明変数の比率を選択する機能を有する、
請求項9記載の学習データ生成装置。 - 前記学習データ生成部は、
複数種類の前記統合フィルタが、それぞれ各データベースから抽出する目的変数と説明変数の比率を算出し、
入力された値に最も近い目的変数と説明変数の比率を実現する統合フィルタを選択する、
請求項9記載の学習データ生成装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021189669A JP7710969B2 (ja) | 2021-11-22 | 2021-11-22 | 学習データのためのデータモデル構成方法、および学習データ生成装置 |
| US17/973,670 US12585997B2 (en) | 2021-11-22 | 2022-10-26 | Data model configuration method for learning data, learning data generation apparatus, and machine learning method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021189669A JP7710969B2 (ja) | 2021-11-22 | 2021-11-22 | 学習データのためのデータモデル構成方法、および学習データ生成装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2023076320A JP2023076320A (ja) | 2023-06-01 |
| JP2023076320A5 JP2023076320A5 (ja) | 2024-04-02 |
| JP7710969B2 true JP7710969B2 (ja) | 2025-07-22 |
Family
ID=86384019
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021189669A Active JP7710969B2 (ja) | 2021-11-22 | 2021-11-22 | 学習データのためのデータモデル構成方法、および学習データ生成装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12585997B2 (ja) |
| JP (1) | JP7710969B2 (ja) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008299382A (ja) | 2007-05-29 | 2008-12-11 | Fujitsu Ltd | データ分割プログラム、該プログラムを記録した記録媒体、データ分割装置、およびデータ分割方法 |
| WO2009025022A1 (ja) | 2007-08-20 | 2009-02-26 | Konica Minolta Medical & Graphic, Inc. | 情報処理システム、およびプログラム |
| WO2018180970A1 (ja) | 2017-03-30 | 2018-10-04 | 日本電気株式会社 | 情報処理システム、特徴量説明方法および特徴量説明プログラム |
| WO2020152804A1 (ja) | 2019-01-23 | 2020-07-30 | 日本電気株式会社 | 情報提供システム、方法およびプログラム |
| JP2020135068A (ja) | 2019-02-13 | 2020-08-31 | 株式会社キーエンス | データ分析装置 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4791285B2 (ja) * | 2006-08-04 | 2011-10-12 | 富士通株式会社 | ネットワーク装置およびフィルタリングプログラム |
| US20180247207A1 (en) * | 2017-02-24 | 2018-08-30 | Hitachi, Ltd. | Online hierarchical ensemble of learners for activity time prediction in open pit mining |
| JP7041093B2 (ja) | 2019-05-08 | 2022-03-23 | Kddi株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| US11836612B2 (en) * | 2019-06-18 | 2023-12-05 | Sap Se | Maintaining master data using hierarchical classification |
| JP2021015546A (ja) * | 2019-07-16 | 2021-02-12 | 株式会社日立製作所 | 情報処理システムおよび情報処理方法 |
| US20210374563A1 (en) * | 2020-05-29 | 2021-12-02 | Joni Jezewski | Solution Automation |
| US11741069B2 (en) * | 2020-08-24 | 2023-08-29 | Sap Se | Automated feature engineering for multidimensional data |
-
2021
- 2021-11-22 JP JP2021189669A patent/JP7710969B2/ja active Active
-
2022
- 2022-10-26 US US17/973,670 patent/US12585997B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008299382A (ja) | 2007-05-29 | 2008-12-11 | Fujitsu Ltd | データ分割プログラム、該プログラムを記録した記録媒体、データ分割装置、およびデータ分割方法 |
| WO2009025022A1 (ja) | 2007-08-20 | 2009-02-26 | Konica Minolta Medical & Graphic, Inc. | 情報処理システム、およびプログラム |
| WO2018180970A1 (ja) | 2017-03-30 | 2018-10-04 | 日本電気株式会社 | 情報処理システム、特徴量説明方法および特徴量説明プログラム |
| WO2020152804A1 (ja) | 2019-01-23 | 2020-07-30 | 日本電気株式会社 | 情報提供システム、方法およびプログラム |
| JP2020135068A (ja) | 2019-02-13 | 2020-08-31 | 株式会社キーエンス | データ分析装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023076320A (ja) | 2023-06-01 |
| US20230162086A1 (en) | 2023-05-25 |
| US12585997B2 (en) | 2026-03-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Tran et al. | Recommender systems in the healthcare domain: state-of-the-art and research issues | |
| Lange et al. | Toward an integrative psychometric model of emotions | |
| Shickel et al. | Deep EHR: a survey of recent advances in deep learning techniques for electronic health record (EHR) analysis | |
| Wood et al. | A review of long-term memory in natural and synthetic systems | |
| US12531158B2 (en) | Cross care matrix based care giving intelligence | |
| Afzal et al. | Personalization of wellness recommendations using contextual interpretation | |
| Davies | The return of social government: From ‘socialist calculation’to ‘social analytics’ | |
| Roads et al. | Obtaining psychological embeddings through joint kernel and metric learning | |
| JP7003880B2 (ja) | 予測装置、方法およびプログラム | |
| Kaushik et al. | Ensemble of multi-headed machine learning architectures for time-series forecasting of healthcare expenditures | |
| Kim et al. | A systematic approach for new service concept generation: Application of agent-based simulation | |
| CN113889209A (zh) | 一种健康管理服务产品的推荐系统、存储介质 | |
| Sahu et al. | Mental health prediction among students using machine learning techniques | |
| Sajid et al. | Next-generation diabetes diagnosis and personalized diet-activity management: A hybrid ensemble paradigm | |
| Mano et al. | An intelligent and generic approach for detecting human emotions: a case study with facial expressions: LY Mano et al. | |
| JP7710969B2 (ja) | 学習データのためのデータモデル構成方法、および学習データ生成装置 | |
| Uddin et al. | A user friendly anger and anxiety disorder prediction scheme using machine learning and a mobile application for mental healthcare | |
| Hussain et al. | Predicting mental health and nutritional status from social media profile using deep learning | |
| Larasati et al. | Development decision support system of choosing medicine using TOPSIS method (Case study: RSIA Tiara) | |
| Mulay et al. | Personalized diabetes analysis using correlation-based incremental clustering algorithm | |
| Frikha et al. | A recommendation system for personalized daily life services to promote frailty prevention | |
| Ko et al. | Exploring fathers' psychological well‐being using supervised machine learning random forest analysis | |
| Alarcón et al. | The role of digital twins in personalized sleep medicine | |
| Perera et al. | Deep Learning-Based Ensemble Model for Predicting the Lifestyle Status of a Person | |
| Shaheel | Diet Recommendation System Using Machine Learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240315 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240322 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250130 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250409 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250708 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250709 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7710969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |