JP7593473B2 - 互換性評価装置、互換性評価方法、及び、プログラム - Google Patents
互換性評価装置、互換性評価方法、及び、プログラム Download PDFInfo
- Publication number
- JP7593473B2 JP7593473B2 JP2023503257A JP2023503257A JP7593473B2 JP 7593473 B2 JP7593473 B2 JP 7593473B2 JP 2023503257 A JP2023503257 A JP 2023503257A JP 2023503257 A JP2023503257 A JP 2023503257A JP 7593473 B2 JP7593473 B2 JP 7593473B2
- Authority
- JP
- Japan
- Prior art keywords
- predictor
- output
- compatibility
- index
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Complex Calculations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
評価データに対する第1の予測器及び第2の予測器の出力を取得する取得手段と、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する指標決定手段と、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する演算手段と、を備える。
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する。
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する処理をコンピュータに実行させる。
<互換性評価指標>
(予測器の互換性)
新たなデータを用いてAIの更新(再学習)を行う場合、精度が向上するように更新を行うが、その際にAIの互換性が問題となる。互換性とは、更新前AIの正解/不正解と、更新後AIの正解/不正解との一致度合いを言う。
一般化後方互換性指標は、前述のBTCやBECなどの互換性指標を一般化した指標である。以下に、一般化後方互換性指標の例を説明する。
第1例は、最も基本的な一般化後方互換性指標の例である。予測器h及び入出力の組(X,Y)を、
・CC(Correct Compatibility)(h1,h2)は、全評価データのうち、予測器h1が正解を出力し、予測器h2が正解を出力する評価データが占める割合を示す。
・EC(Error Compatibility)(h1,h2)は、全評価データのうち、予測器h1が不正解を出力し、予測器h2が不正解を出力する評価データが占める割合を示す。
・IC1(Imcompatibility-1)(h1,h2)は、全評価データのうち、予測器h1が正解を出力し、予測器h2が不正解を出力する評価データが占める割合を示す。
・IC2(Imcompatibility-2)(h1,h2)は、全評価データのうち、予測器h1が不正解を出力し、予測器h2が正解を出力する評価データが占める割合を示す。
上記の第1例では、式(1)に示すように、4つの関係式CC、EC、IC1、IC2に対して係数(重み)を設定している。これに対し、第2例では予測器h1、h2が予測するクラスy毎に係数(重み)を設定する。第2例に係るGBCスコアは以下の式で与えられる。
第3例は、第1例や第2例のような線形分数式以外の互換性指標の例である。二値分類において、更新前の予測器のスコアランキングが更新後の予測器でも一致して欲しいタスクを考える。予測器が実数を「-1」と「+1」に割り当てるものとすると、以下のような互換性指標が得られる。
上記の第1例及び第2例では、予測器が分類タスクを実行するものとしているが、回帰タスクを実行する予測器に対してもGBCを適用することができる。その場合には、評価データに対して予測器が出力する予測値と、その評価データに対応する実績値との差が予め定めた閾値以下であれば予測値は正解であるとみなし、閾値より大きければ予測値は不正解であるとみなして、第1例又は第2例のGBCを適用すればよい。
[全体構成]
図2は、第1実施形態に係る互換性評価装置の全体構成を示すブロック図である。互換性評価装置100は、2つの予測器の互換性を評価し、互換性スコアを出力する。図示のように、2つの予測器h1、h2には同一の評価データが入力される。典型的な例では、予測器h1は現在運用中の予測器、即ち、更新前予測器であり、予測器h2は更新後予測器である。
図3は、互換性評価装置100のハードウェア構成を示すブロック図である。互換性評価装置100は、インタフェース101と、プロセッサ102と、メモリ103と、記録媒体104と、入力部105と、表示部106とを備える。
図4は、互換性評価装置100の機能構成を示すブロック図である。互換性評価装置100は、機能面では、評価用指標決定部110と、スコア演算部120とを備える。評価用指標決定部110には、指標番号が入力される。指標番号は、互換性の評価に使用する互換性指標を指定する番号である。指標番号は、例えば更新の対象となる予測器のタスクなどに基づいて決定される。評価用指標決定部110は、入力された指標番号に基づいて、式(1)や式(11)などに示す一般化後方互換性指標(GBC)を基にして、実際に評価に使用する互換性指標(以下、「評価用指標」とも呼ぶ。)を決定し、スコア演算部120へ出力する。
図5は、互換性評価装置100が実行する互換性評価処理のフローチャートである。この処理は、図3に示すプロセッサ102が予め用意されたプログラムを実行し、図4に示す各要素として動作することにより実現される。
GBCは、予測器の更新時にハイパーパラメータやシードが異なる複数の更新後予測器を生成した際に、それらの互換性を評価する指標として使用することができる。生成された複数の更新後予測器のうち、更新前予測器と互換性の高い予測器を選択することで、更新後のAIの挙動変化に伴う手続き変更などのコストを削減することができる。
上記の例では、GBCを更新時などにおける予測器の互換性評価に使用しているが、その代わりに、GBCを予測器の学習において利用することもできる。この場合、予測モデルの学習時に、通常の学習時に用いる誤差関数にGBCを正則化として加える。具体的には、既存の一般化二値分類指標と同様に、指示関数を損失関数(二乗損失やヒンジ損失)に置き換えることにより、GBCの上界を構成することができる。そして、構成した上界と通常の二値分類の誤差関数を合わせたものを最小化するように予測モデルを学習する。更新前の予測器と追加収集したデータを入力とし、GBCを正則化にすることで、対象タスクに適した後方互換性の高い新たな予測器を構築することができる。
次に、本開示の第2実施形態について説明する。図6は、第2実施形態に係る互換性評価装置70の機能構成を示すブロック図である。互換性評価装置70は、取得手段71と、指標決定手段72と、演算手段73とを備える。
評価データに対する第1の予測器及び第2の予測器の出力を取得する取得手段と、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する指標決定手段と、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する演算手段と、
を備える互換性評価装置。
前記一般化後方互換性指標は、重み付けされた複数の関係式の四則演算により表される付記1記載の互換性評価装置。
互換性指標の指定を受け取る指定手段を備え、
前記指標決定手段は、前記指定に基づいて前記複数の関係式の各々に対する重みを設定して、前記一般化後方互換性指標から評価用指標を決定し、
前記演算手段は、前記評価用指標を用いて前記スコアを算出する付記2に記載の互換性評価装置。
前記関係式は、
前記第1の予測器の出力と前記第2の予測器の出力が共に正解である割合を示す第1式と、
前記第1の予測器の出力と前記第2の予測器の出力が共に不正解である割合を示す第2式と、
前記第1の予測器の出力が不正解であり、前記第2の予測器の出力が正解である割合を示す第3式と、
前記第1の予測器の出力が正解であり、前記第2の予測器の出力が不正解である割合を示す第4式と、を含む付記1乃至3のいずれか一項に記載の互換性評価装置。
前記第1の予測器及び前記第2の予測器は回帰分析を行い、
前記演算手段は、前記第1の予測器及び前記第2の予測器の出力である予測値と、当該予測値に対応する実績値との差が所定の閾値以下である場合、当該出力は正解であるとみなし、前記差が前記閾値より大きい場合、当該出力は不正解であるとみなす付記4に記載の互換性評価装置。
前記関係式は、2つの評価データに対する前記第1の予測器の出力の大小関係、及び、前記2つの評価データに対する前記第2の予測器の出力の大小関係を示し、
前記演算手段は、前記第1の予測器の出力の大小関係と、前記第2の予測器の出力の大小関係とが一致する期待値を前記スコアとして算出する付記1に記載の互換性評価装置。
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する互換性評価方法。
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する処理をコンピュータに実行させるプログラムを記録した記録媒体。
101 インタフェース
102 プロセッサ
103 メモリ
104 記録媒体
105 入力部
106 表示部
110 評価用指標決定部
120 スコア演算部
Claims (8)
- 評価データに対する第1の予測器及び第2の予測器の出力を取得する取得手段と、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する指標決定手段と、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する演算手段と、
を備える互換性評価装置。 - 前記一般化後方互換性指標は、重み付けされた複数の関係式の四則演算により表される請求項1記載の互換性評価装置。
- 互換性指標の指定を受け取る指定手段を備え、
前記指標決定手段は、前記指定に基づいて前記複数の関係式の各々に対する重みを設定して、前記一般化後方互換性指標から評価用指標を決定し、
前記演算手段は、前記評価用指標を用いて前記スコアを算出する請求項2に記載の互換性評価装置。 - 前記関係式は、
前記第1の予測器の出力と前記第2の予測器の出力が共に正解である割合を示す第1式と、
前記第1の予測器の出力と前記第2の予測器の出力が共に不正解である割合を示す第2式と、
前記第1の予測器の出力が不正解であり、前記第2の予測器の出力が正解である割合を示す第3式と、
前記第1の予測器の出力が正解であり、前記第2の予測器の出力が不正解である割合を示す第4式と、を含む請求項1乃至3のいずれか一項に記載の互換性評価装置。 - 前記第1の予測器及び前記第2の予測器は回帰分析を行い、
前記演算手段は、前記第1の予測器及び前記第2の予測器の出力である予測値と、当該予測値に対応する実績値との差が所定の閾値以下である場合、当該出力は正解であるとみなし、前記差が前記閾値より大きい場合、当該出力は不正解であるとみなす請求項4に記載の互換性評価装置。 - 前記関係式は、2つの評価データに対する前記第1の予測器の出力の大小関係、及び、前記2つの評価データに対する前記第2の予測器の出力の大小関係を示し、
前記演算手段は、前記第1の予測器の出力の大小関係と、前記第2の予測器の出力の大小関係とが一致する期待値を前記スコアとして算出する請求項1に記載の互換性評価装置。 - コンピュータにより実行される互換性評価方法であって、
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する互換性評価方法。 - 評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/008149 WO2022185444A1 (ja) | 2021-03-03 | 2021-03-03 | 互換性評価装置、互換性評価方法、及び、記録媒体 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2022185444A1 JPWO2022185444A1 (ja) | 2022-09-09 |
| JPWO2022185444A5 JPWO2022185444A5 (ja) | 2023-11-10 |
| JP7593473B2 true JP7593473B2 (ja) | 2024-12-03 |
Family
ID=83155174
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023503257A Active JP7593473B2 (ja) | 2021-03-03 | 2021-03-03 | 互換性評価装置、互換性評価方法、及び、プログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20240152804A1 (ja) |
| JP (1) | JP7593473B2 (ja) |
| WO (1) | WO2022185444A1 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN120090502B (zh) * | 2025-03-24 | 2025-11-21 | 佛山市沃联电气有限公司 | 一种隔膜泵用无刷直流电机的控制方法、系统及装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8296257B1 (en) | 2009-04-08 | 2012-10-23 | Google Inc. | Comparing models |
| JP2020004178A (ja) | 2018-06-29 | 2020-01-09 | ルネサスエレクトロニクス株式会社 | 学習モデルの評価方法、学習方法、装置、及びプログラム |
-
2021
- 2021-03-03 JP JP2023503257A patent/JP7593473B2/ja active Active
- 2021-03-03 WO PCT/JP2021/008149 patent/WO2022185444A1/ja not_active Ceased
- 2021-03-03 US US18/279,493 patent/US20240152804A1/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8296257B1 (en) | 2009-04-08 | 2012-10-23 | Google Inc. | Comparing models |
| JP2020004178A (ja) | 2018-06-29 | 2020-01-09 | ルネサスエレクトロニクス株式会社 | 学習モデルの評価方法、学習方法、装置、及びプログラム |
Non-Patent Citations (1)
| Title |
|---|
| SRIVASTAVA, Megha et al.,An Empirical Analysis of Backward Compatibility in Machine Learning Systems,arXiv.org [online],米国,Cornell University,2020年08月11日,[検索日: 2021.04.23], pp.1-9,インターネット<URL:https://arxiv.org/pdf/2008.04572.pdf> |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2022185444A1 (ja) | 2022-09-09 |
| US20240152804A1 (en) | 2024-05-09 |
| JPWO2022185444A1 (ja) | 2022-09-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Molnar et al. | General pitfalls of model-agnostic interpretation methods for machine learning models | |
| Papadopoulos | Inductive conformal prediction: Theory and application to neural networks | |
| Hill et al. | Challenges with propensity score strategies in a high-dimensional setting and a potential alternative | |
| Pooley et al. | Bayesian model evidence as a practical alternative to deviance information criterion | |
| US20180285969A1 (en) | Predictive model training and selection for consumer evaluation | |
| Patil et al. | A proposed model for lifestyle disease prediction using support vector machine | |
| Shin et al. | Probability-enhanced sufficient dimension reduction for binary classification | |
| Acito | Logistic regression | |
| WO2020044425A1 (ja) | 学習装置、学習方法及び学習プログラム | |
| Sengupta | Towards finding a minimal set of features for predicting students’ performance using educational data mining | |
| US11373760B2 (en) | False detection rate control with null-hypothesis | |
| JP7593473B2 (ja) | 互換性評価装置、互換性評価方法、及び、プログラム | |
| KR102124425B1 (ko) | 시계열 데이터 예측 모델 평가 방법 및 장치 | |
| US20200082286A1 (en) | Time series data analysis apparatus, time series data analysis method and time series data analysis program | |
| JP2021174330A (ja) | 異種機械学習のアンサンブル学習による予測装置 | |
| JP2022190881A (ja) | 施策提示装置、施策提示方法、および施策提示プログラム | |
| JP7794290B2 (ja) | モデル分析装置、モデル分析方法、及び、プログラム | |
| JP2007133477A (ja) | 利用者の行動を支援するシステム | |
| Ekoniak et al. | Health-ml: A machine learning framework for equity-driven public health outcome prediction | |
| Van Der Laan | Explainability of artificial intelligence models: Technical foundations and legal principles | |
| Elseufy et al. | Harnessing machine learning and structural equation modelling to quantify the cost impact of rework in bridge projects | |
| JP2021157379A (ja) | 情報処理装置、重要ノード特定方法、及び重要ノード特定プログラム | |
| Mani et al. | An Explainable Machine Learning Framework for Prediction of Recurrent Lumbar Disc Herniation | |
| Olofsson | A machine learning ensemble approach to churn prediction: Developing and comparing local explanation models on top of a black-box classifier | |
| JP7671656B2 (ja) | 因果関係推論装置、因果関係推論方法、および因果関係推論プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230816 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230816 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241022 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241104 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7593473 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |












