JP7729467B2 - 学習装置 - Google Patents

学習装置

Info

Publication number
JP7729467B2
JP7729467B2 JP2024507472A JP2024507472A JP7729467B2 JP 7729467 B2 JP7729467 B2 JP 7729467B2 JP 2024507472 A JP2024507472 A JP 2024507472A JP 2024507472 A JP2024507472 A JP 2024507472A JP 7729467 B2 JP7729467 B2 JP 7729467B2
Authority
JP
Japan
Prior art keywords
learning
unit
learning device
data
appropriate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024507472A
Other languages
English (en)
Other versions
JPWO2023175977A5 (ja
JPWO2023175977A1 (ja
Inventor
バトニヤマ エンケタイワン
勇 寺西
邦大 伊東
諒 古川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2023175977A1 publication Critical patent/JPWO2023175977A1/ja
Publication of JPWO2023175977A5 publication Critical patent/JPWO2023175977A5/ja
Application granted granted Critical
Publication of JP7729467B2 publication Critical patent/JP7729467B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、学習装置、学習方法、記録媒体、推論装置に関する。
よりよい性能を得ることなどを目的として、各参加者において学習した学習器を組み合わせることがある。
例えば、非特許文献1には、各ステップにおいて参加者がそれぞれ決定木を作成し、作成した決定木を組み合わせることでよりよい性能のモデルを作成する勾配ブースティングフォーレスト(GBF:Gradient Boosting Forest)という技術が記載されている。
また、関連する文献として、例えば、特許文献1がある。特許文献1には、GBDT(Gradient Boosting Decision Tree)などについて記載されている。
特開2021-140296号公報
Feng Wang et al., Gradient Boosting Forest: a Two-Stage Ensemble Method Enabling Federated Learning of GBDTsICONIP 2021: Neural Information Processing pp75-86[令和4年3月8日検索],インターネット<https://link.springer.com/chapter/10.1007/978-3-030-92270-2_7>
非特許文献1に記載のような技術の場合、各参加者が学習した学習器を組み合わせる。そのため、最終的に作成される学習器は、例えば、各参加者が有する学習データに応じたものとなる。一方で、例えば、各参加者が持つ学習データに分布の偏りがある場合などにおいては、性能を高めつつ、かつ、より特定の個人に適した学習器を用意したい場合がある。しかしながら、非特許文献1に記載のように組み合わせるだけでは、上記のような場合に対応することは難しかった。
そこで、本発明の目的は、上述した課題を解決することが可能な学習装置、学習方法、記録媒体を提供することにある。
かかる目的を達成するため本開示の一形態である学習装置は、
他の学習装置から学習器を受信する受信部と、
受信部が受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する生成部と、
を有する
という構成をとる。
また、本開示の他の形態である学習方法は、
情報処理装置が、
他の学習装置から学習器を受信し、
受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する
という構成をとる。
また、本開示の他の形態である記録媒体は、
情報処理装置に、
他の学習装置から学習器を受信し、
受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する
処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体である。
また、本開示の他の形態である推論装置は、
特徴量の入力に対してラベルを推論する推論装置であって、
他の学習装置から受信した学習器と、自装置が有するデータを用いて自装置が有するデータに適した予測を行うように算出された結合係数と、を記憶する記憶装置と、
特徴量の入力に応じて、記憶装置が記憶する学習器と結合係数とを用いた推論を行う推論部と、
を有する
という構成をとる。
上述したような各構成によると、性能を高めつつ、かつ、より特定の個人に適した学習器を用意することができる。
本開示の概要を説明するための図である。 本開示の第1の実施形態における学習システムの構成例を示す図である。 学習装置の構成例を示すブロック図である。 学習データの一例を示す図である。 バリデーションデータの一例を示す図である。 アルゴリズムの一例を示す図である。 アルゴリズムの他の一例を示す図である。 学習装置の動作例を示すフローチャートである。 本開示の第2の実施形態における学習装置のハードウェア構成例を示す図である。 学習装置の構成例を示すブロック図である 推論装置の構成例を示すブロック図である。
[第1の実施形態]
本開示の第1の実施形態について、図1から図8までを参照して説明する。図1は、本開示の概要を説明するための図である。図2は、学習システム100の構成例を示す図である。図3は、学習装置300の構成例を示すブロック図である。図4は、学習データ情報341の一例を示す図である。図5は、バリデーションデータ情報342の一例を示す図である。図6、図7は、学習システム100で行われるアルゴリズムの一例を示す図である。図8は、学習装置300の動作例を示すフローチャートである。
本開示の第1の実施形態では、図1で示すように、学習システム100内の他の参加者から受信した学習器と、自装置で学習した学習器などとに基づいて、自装置が有する学習データやバリデーションデータなどのデータに対してより適切な予測を行うように結合学習器を生成する学習装置300を有する学習システム100について説明する。後述するように、本実施形態において説明する学習装置300は、学習システム100内の他の参加者から学習器である決定木を受信すると、受信した決定木に自装置が有する学習データを入力することで、新たな特徴量を算出する。そして、学習装置300は、学習データと算出した特徴量とに基づいて、自装置の新たな学習器である決定木を生成する。
また、学習装置300は、生成した決定木や他の参加者から受信した決定木と、予め記憶するバリデーションデータなどと、を用いて、各決定木に対応する結合係数を算出する。例えば、学習装置300は、決定木とバリデーションデータとに基づいて、自身のバリデーションデータに対する予測性能が最適になるように、決定木ごとの結合係数を算出する。その後、学習装置300は、算出した結合係数を用いて、他学習装置200から受信した決定木や生成した決定木と、過去の結合決定木と、を結合することで、新たな結合決定木を生成する。つまり、学習装置300は、結合係数を用いた結合を行うことで、適切化学習器である結合決定木を生成する。
例えば、図1で示すように、本実施形態において説明する学習システム100では、上記のような処理を繰り返すことができる。つまり、学習システム100は、他学習装置200が決定木を生成する、他学習装置200が生成した決定木を用いて学習装置300が決定木を生成する、結合係数を算出する、各決定木を結合する、という1連のステップを例えば予め定められた条件を満たすまで複数回繰り返すことができる。
なお、学習データには、例えば、性別、年齢、身長、体重、…、などの複数の特徴量と、病気か否かなどを示すラベルと、が含まれている。特徴量は、説明変数、または、属性などとも呼ばれうる。また、ラベルは、目的変数などとも呼ばれうる。特徴量やラベルの具体例は、上記例示した以外であってよい。また、バリデーションデータとは、学習器を評価する際などに用いることができる検証用のデータのことをいう。バリデーションデータには、学習データと同様に、複数の特徴量とラベルとが含まれている。また、決定木とは、入力データに対して、その特徴量の条件分岐によりラベルの説明性能が十分によくなるまで二分木で振り分ける作業を複数回行い、訓練するモデルのことをいう。決定木には、回帰タスクを扱う回帰木や、分類タスクを扱う分類木などが含まれる。
また、本実施形態においては、学習器として決定木を用いる場合について説明する。しかしながら、本発明の対象となる学習器は、決定木に限定されない。例えば、学習システム100内の各参加者は、学習器として、浅いニューラルネットやサポートベクターマシンなどを生成してもよい。学習システム100内の各参加者が学習器としてニューラルネットやサポートベクターマシンなどを生成する場合であっても、問題なく本発明を適用することができる。
図2は、学習システム100の全体的な構成例を示している。図2を参照すると、学習システム100は、1つまたは複数の他学習装置200と、学習装置300と、を有している。図2で示すように、他学習装置200と学習装置300とは、互いに通信可能なようネットワークなどを介して接続されている。
他学習装置200は、当該他学習装置200が有する訓練データに基づいた学習を行うことで、学習器である決定木を生成する情報処理装置である。また、他学習装置200は、生成した決定木を他の他学習装置200や学習装置300に対して送信することができる。
また、他学習装置200は、予め定められた所定係数などを用いて、他の他学習装置200や学習装置300などから受信した学習器である決定木を結合するよう構成してもよい。ここで、上記所定係数は、例えば、学習システム100内の他学習装置200や学習装置300などの各参加者が持つデータの数によって予め定めることができる。例えば、上記所定係数は、自装置が有する訓練データの数を、学習システム100内の他学習装置200や学習装置300が有する訓練データの数の和で割ることなどにより算出してもよい。
例えば、以上のように、他学習装置200は、自装置が有する訓練データに基づいて学習器である決定木を生成したり、生成した決定木を学習システム100内の他の情報処理装置などに送信したりする。また、他学習装置200は、学習システム100内の他の情報処理装置などから決定木を受信して、受信した決定木を予め定められた所定係数などを用いて結合することができる。例えば、他学習装置200は、非特許文献1に記載の方法などで、上記各処理を実現してよい。
学習装置300は、自装置が有する学習データやバリデーションデータなどのデータに対してより適切な予測を行うように結合学習器である結合決定木を生成する情報処理装置である。図3は、学習装置300の構成例を示している。図3を参照すると、学習装置300は、主な構成要素として、例えば、操作入力部310と、画面表示部320と、通信I/F部330と、記憶部340と、演算処理部350と、を有している。
なお、図3では、1台の情報処理装置を用いて学習装置300としての機能を実現する場合について例示している。しかしながら、学習装置300は、例えば、クラウド上に実現されるなど、複数台の情報処理装置を用いて実現されてもよい。また、学習装置300は、操作入力部310や画面表示部320を有さないなど上記例示した構成の一部を含まなくてもよいし、上記例示した以外の構成を有してもよい。
操作入力部310は、キーボード、マウスなどの操作入力装置からなる。操作入力部310は、学習装置300を操作する操作者の操作を検出して演算処理部350に出力する。
画面表示部320は、LCD(Liquid Crystal Display、液晶ディスプレイ)などの画面表示装置からなる。画面表示部320は、演算処理部350からの指示に応じて、記憶部340に格納されている各種情報などを画面表示することができる。
通信I/F部330は、データ通信回路などからなる。通信I/F部330は、通信回線を介して接続された外部装置との間でデータ通信を行う。
記憶部340は、ハードディスクやメモリなどの記憶装置である。記憶部340は、演算処理部350における各種処理に必要な処理情報やプログラム345を記憶する。プログラム345は、演算処理部350に読み込まれて実行されることにより各種処理部を実現する。プログラム345は、通信I/F部330などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部340に保存されている。記憶部340で記憶される主な情報としては、例えば、学習データ情報341、バリデーションデータ情報342、学習器情報343、係数情報344などがある。
学習データ情報341は、学習器である決定木を学習する際に用いる学習データを含んでいる。例えば、学習データ情報341は、通信I/F部330を介して外部装置から取得する、操作入力部310を用いて入力する、などの方法を用いて予め取得されており、記憶部340に格納されている。
図4は、学習データ情報341の一例を示している。図4を参照すると、学習データ情報341では、複数の特徴量と、ラベルと、が関連付けられている。例えば、図4で示す例では、特徴量(x、x、…、x)と、ラベルyと、が関連付けられている。図4で示すように、学習データ情報341には複数の学習データが含まれてよい。
バリデーションデータ情報342は、決定木の性能などを検証する際に用いるデータであるバリデーションデータを含んでいる。例えば、バリデーションデータ情報342は、通信I/F部330を介して外部装置から取得する、操作入力部310を用いて入力する、などの方法を用いて予め取得されており、記憶部340に格納されている。
図5は、バリデーションデータ情報342の一例を示している。図5を参照すると、バリデーションデータ情報342では、学習データ情報341と同様に、複数の特徴量と、ラベルと、が関連付けられている。例えば、図5で示す例では、特徴量(x11、x12、…、x1d)と、ラベルy10と、が関連付けられている。図5で示すように、バリデーションデータ情報342には複数のバリデーションデータが含まれてよい。
学習器情報343は、他学習装置200から受信した決定木や後述する結合部355が結合した結合決定木などを示す情報を含んでいる。例えば、学習器情報343では、決定木の送信元を示す識別情報などと決定木とが関連付けられている。学習器情報343には、ステップごとの、決定木や結合決定木が含まれてよい。例えば、学習器情報343は、後述する受信部351が他学習装置200から決定木を受信すること、結合部355が結合決定木を生成すること、などに応じて更新される。
係数情報344は、他学習装置200から受信した決定木や後述する学習部353が生成した決定木などの各決定木に対応する結合係数を含んでいる。例えば、係数情報344では、決定木の識別情報と結合係数とが関連付けられている。係数情報344には、ステップごと、決定木ごとの結合係数が含まれてよい。例えば、係数情報344は、後述する係数算出部354が結合係数を算出することなどに応じて更新される。
演算処理部350は、CPU(Central Processing Unit)などの演算装置とその周辺回路を有する。演算処理部350は、記憶部340からプログラム345を読み込んで実行することにより、上記ハードウェアとプログラム345とを協働させて各種処理部を実現する。演算処理部350で実現される主な処理部としては、例えば、受信部351、特徴量追加算出部352、学習部353、係数算出部354、結合部355、推論部356、出力部357などがある。
受信部351は、他学習装置200から学習器である決定木を受信する。例えば、受信部351は、各ステップにおいて、学習システム100に含まれる各他学習装置200から学習器を受信することができる。また、受信部351は、受信した決定木を学習器情報343として記憶部340に格納する。
なお、受信部351は、例えば、前ステップにおける決定木との間の差分を示す情報などを他学習装置200から受信してもよい。この場合、受信部351は、受信した差分を示す情報に基づいて対応する決定木を更新するよう構成してもよい。
特徴量追加算出部352は、受信部351が受信した決定木と、学習データ情報341に含まれる学習データと、に基づいて、追加の学習データを算出する。例えば、特徴量追加算出部352は、受信部351が受信した決定木に対して学習データ情報341に含まれる各学習データを入力することで、学習器から出力を得る。特徴量追加算出部352は、上記出力を、追加の特徴量として取得することができる。
例えば、学習データ情報341に特徴量x、ラベルyを含む(x、y)という学習データが含まれるとする(iは任意でよい)。また、他学習装置200からf()、f()、…という決定木を受信したとする。この場合、特徴量追加算出部352は、各決定木に特徴量xiを入力することで、f(x)、f(x)、…という追加の特徴量を算出する。その結果、後述する学習部353による学習対象となる学習データは、(x、f(x)、f(x)、…、y)となる。
例えば、特徴量追加算出部352は、上述したような処理を、決定木ごと、学習データごとに行うことができる。例えば、特徴量追加算出部352は、任意の方法で抽出した決定木ごとに、上記のような処理を行ってもよい。
学習部353は、特徴量追加算出部352が算出した特徴量と、学習データ情報341が示す学習データと、に基づく学習を行うことで、学習器である決定木を生成する。また、学習部353は、生成した決定木を学習器情報343として記憶部340に格納する。
例えば、上述したように、特徴量追加算出部352により追加の特徴量が算出されている。そこで、学習部353は、(x、f(x)、f(x)、…、y)などのように、追加の特徴量を含む学習データを用いて機械学習を行うことで、決定木を生成する。
なお、学習部353は、上述したように特徴量追加算出部352により算出された追加の特徴量をそのまま学習データに追加して機械学習を行ってもよいし、例えば、特徴量追加算出部352により算出された追加の特徴量を線形結合した結果などを学習データに追加して機械学習を行うよう構成してもよい。学習部353は、特徴量追加算出部352により算出された追加の特徴量と、追加の特徴量を線形結合した結果と、を共に学習データに追加して機械学習を行ってもよい。
係数算出部354は、バリデーションデータ情報342が示すバリデーションデータを用いて、結合係数を決定木ごとに算出する。例えば、係数算出部354は、バリデーションデータ情報342が示すバリデーションデータに対する予測性能が最適になるように、結合係数を算出する。係数算出部354は、受信部351が受信した決定木や学習部353が生成した決定木ごとに結合係数を算出することができる。また、係数算出部354は、算出した結合係数を係数情報344として記憶部340に格納する。
例えば、バリデーションデータ情報342に特徴量x1i 、ラベルy1iを含む(x1i ,y1i)というバリデーションデータが含まれるとする。また、他学習装置200や学習部353によりf11()、f12()、…という決定木を受信したり生成したりしたとする。この場合、まず、係数算出部354は、各決定木にバリデーションデータを入力することで出力を得る。例えば、係数算出部354は、バリデーションデータ(x1i ,y1i)を決定木f11()に入力することで出力uを得る。また、係数算出部354は、バリデーションデータ(x1i ,y1i)を決定木f12()に入力することで出力vを得る。そして、係数算出部354は、(u、v、y1i)を使うことで、決定木ごとの結合係数を算出する。例えば、係数算出部354は、線形回帰を行うことなどにより、結合係数を算出してよい。例えば、係数算出部354は、バリデーションデータ(x1i ,y1i)と出力uとを用いた線形回帰を行うことで決定木f11()に対応する結合係数を決定してよい。
具体的には、例えば、係数算出部354は、バリデーションデータ(x1i ,y1i)とu、vを用いて、数1に対する線形回帰を行うことで、各決定木に対応する係数aを決定することができる。
なお、係数算出部354は、バリデーションデータ全体を用いて結合係数を算出してもよいし、バリデーションデータのうちの一部を用いて結合係数を算出してもよい。例えば、モデルの構造や分岐条件などの学習部353が生成した決定木についてのモデル情報を参照すると、各バリデーションデータが落ちる葉ノードを特定することができる。そこで、係数算出部354は、例えば、葉ノードごとのバリデーションデータを用いて線形回帰を行うことなどにより、葉ノードごとに結合係数を算出してもよい。葉ノードごとに結合係数を算出する場合も、葉ノードごとに結合させることで、上述した場合と同様に結合決定木を生成することができる。なお、係数算出部354がバリデーションデータ全体を用いて結合係数を算出する場合、決定木全体に対する結合係数を算出している、ということもできる。
また、係数算出部354は、上記例示した以外の方法を用いて結合係数を算出してもよい。例えば、係数算出部354は、バリデーションデータの代わりに学習データ情報341が示す学習データを用いて結合係数を算出してもよい。ただし、過度な偏りを抑制する、という観点からすると、学習データを用いるよりもバリデーションデータを用いて結合係数を算出する方が望ましい。係数算出部354は、その他任意の方法で結合係数を算出してもよい。
結合部355は、係数算出部354が算出した結合係数を用いて、受信部351が受信した決定木や学習部353が生成した決定木と、学習器情報343に含まれる1ステップ前の結合決定木とを結合することで、新たな結合決定木を生成する。また、結合部355は新たに生成した結合決定木を学習器情報343として記憶部340に格納する。
例えば、結合部355は、下記数2を解くことにより結合係数を用いた結合を行う。
ここで、f(t-1)が1ステップ前の結合決定木を示しており、f(t)が新たに生成される結合決定木を示している。また、aが結合係数を示しており、fは受信部351が受信した決定木や学習部353が生成した決定木を示す。kは、例えば、学習システム100に含まれる他学習装置200や学習装置300の数に応じた値となる。
推論部356は、結合決定木を用いた推論を行う。例えば、推論部356は、最新の結合決定木を用いて推論を行うことができる。
なお、数3で示すように、最新の結合決定木ffinal()には、過去のステップで受信したり生成したりした決定木や結合係数などが含まれる。そのため、推論部356は、過去のステップで生成した決定木や結合係数なども用いて推論を行う、ということもできる。
なお、ft()は数4で示すように、tステップ目にモデルに追加される項であり、それぞれの参加者の作った決定木f()の線形和となる。
なお、数5は、tステップ目にk番目の参加者の作った決定木の係数を示す。
出力部357は、決定木や結合決定木の出力を行ったり、推論部356による推論結果の出力を行ったりする。
例えば、出力部357は、学習部353が生成した決定木や結合部355が生成した結合決定木などを、通信I/F部330を介して他学習装置200などの外部装置に対して送信することができる。出力部357は、学習部353や結合部355による処理の後など、任意のタイミングで出力を行ってよい。
また、出力部357は、推論部356による推論の結果を画面表示部320上に表示させたり、通信I/F部330を介して外部装置へと送信したりすることができる。
以上が、学習装置300の構成例である。なお、図6は、非特許文献1に記載されている、回帰タスクを扱う場合における学習システム100のアルゴリズム例を示している。図6で示す例では、他学習装置200や学習装置300などの参加者がK組学習システム100に含まれる場合について例示している。図6で例示するように、学習システム100では、各参加者が生成した決定木f()などを、結合係数aを用いて結合している。ここで、上述したように、結合係数aは、バリデーションデータに対する予測性能が最適になるように算出されている。そのため、結合係数aを用いた結合を行うことで、性能を高めつつ、かつ、バリデーションデータを有する学習装置300により適した形で結合決定木を生成することができる。
なお、図6で示す例では、回帰タスクを扱う場合における学習システム100のアルゴリズム例を例示しているが、回帰タスクの代わりに分類タスクを扱う場合であっても、回帰タスクの場合と同様に、結合係数aを用いた結合を行う。そのため、分類タスクを扱う場合であっても、回帰タスクの場合と同様に、結合係数aを用いた結合を行うことで、性能を高めつつ、かつ、バリデーションデータを有する学習装置300により適した形で結合決定木を生成することができる。例えば、非特許文献1には、図7で示すような分類タスクを扱う場合におけるアルゴリズム例が記載されている。図7を参照すると、分類タスクを扱う場合であっても、回帰タスクの場合と同様に、結合係数aを用いた結合を行っていることが分かる。
続いて、図8を参照して、学習装置300の動作例について説明する。図8は、学習装置300の動作例を示すフローチャートである。図8を参照すると、受信部351は、他学習装置200から学習器である決定木を受信する(ステップS101)。
特徴量追加算出部352は、受信部351が受信した決定木と、学習データ情報341に含まれる学習データと、に基づいて、追加の学習データを算出する(ステップS102)。例えば、特徴量追加算出部352は、受信部351が受信した決定木に対して学習データ情報341に含まれる各学習データを入力することで、学習器から出力を得る。特徴量追加算出部352は、上記出力を、追加の特徴量として取得することができる。
学習部353は、特徴量追加算出部352が算出した特徴量と、学習データ情報341が示す学習データと、に基づく学習を行うことで、学習器である決定木を生成する(ステップS103)。つまり、学習部353は、学習データ情報341が示す学習データに特徴量追加算出部352が算出した特徴量を加えて学習を行うことで、決定木を生成する。
係数算出部354は、バリデーションデータ情報342が示すバリデーションデータを用いて、結合係数を決定木ごとに算出する(ステップS104)。例えば、係数算出部354は、バリデーションデータ情報342が示すバリデーションデータに対する予測性能が最適になるように、結合係数を算出する。係数算出部354は、受信部351が受信した決定木や学習部353が生成した決定木ごとに結合係数を算出することができる。
結合部355は、係数算出部354が算出した結合係数を用いて、受信部351が受信した決定木や学習部353が生成した決定木と、学習器情報343に含まれる1ステップ前の結合決定木とを結合することで、新たな結合決定木を生成する(ステップS105)。
以上が、学習装置300の動作例である。
このように、学習装置300は、特徴量追加算出部352と学習部353とを有している。このような構成によると、学習部353は、特徴量追加算出部352が算出した特徴量を加えた学習データを用いた学習を行うことにより学習器である決定木を生成することができる。その結果、他学習装置200による学習の成果も取り込んだ形で決定木を生成することができる。これにより、性能を高めつつ、自装置が有するデータにより適した学習器である決定木を生成することができる。
また、学習装置300は、係数算出部354と結合部355とを有している。このような構成によると、結合部355は、係数算出部354が算出し結合係数を用いて、各決定木を算出することができる。上述したように、結合係数は、バリデーションデータに対する予測性能が最適になるように、結合係数を算出する。そのため、上記結合係数を用いて各決定木を結合することで、性能を高めつつ、バリデーションデータを有する学習装置300により適した学習器である決定木を生成することができる。
なお、本実施形態においては、学習装置300が特徴量追加算出部352と係数算出部354とをともに有する場合について例示した。しかしながら、学習装置300は、特徴量追加算出部352と係数算出部354とのうちのいずれか一つのみを有してもよい。
例えば、学習装置300が特徴量追加算出部352を有さない場合、学習部353は、学習データ情報341に含まれる学習データに基づく学習を行って決定木を生成する。このような場合であっても、上述したように、バリデーションデータに対する予測性能が最適になるように結合係数を算出するため、結合係数を用いて各決定木を結合することで、性能を高めつつ、バリデーションデータを有する学習装置300により適した学習器である決定木を生成することができる。
また、例えば、学習装置300が係数算出部354を有さない場合、結合部355は、他学習装置200による学習の成果も取り込んだ形で生成される決定木と、1ステップ前の結合決定木とを結合する。その結果、性能を高めつつ、自装置が有するデータにより適した学習器である決定木を生成することができる。なお、学習装置300が係数算出部354を有さない場合、結合部355は、結合係数を用いずに生成した決定木と1ステップ前の結合決定木とを結合してよい。
また、上述したように、本実施形態においては、学習器として決定木を用いる場合について説明した。しかしながら、本発明の対象となる学習器は、決定木に限定されない。例えば、学習器は、浅いニューラルネットやサポートベクターマシンなどであってもよい。もちろん、最終的に生成される学習器も、上記各学習器に応じたものであってよい。例えば、学習器として決定木を用いた場合、最終的に生成される結合決定木はGBDT(Gradient Boosting Decision Tree)モデルになる。また、学習器としてニューラルネットを用いた場合、最終的に生成されるモデルは勾配ブースティングニューラルネットとなる。
[第2の実施形態]
次に、本開示の第2の実施形態について、図9から図11までを参照して説明する。図9は、学習装置400のハードウェア構成例を示す図である。図10は、学習装置400の構成例を示すブロック図である。図11は、推論装置500の構成例を示すブロック図である。
本開示の第2の実施形態においては、他装置から学習器を受け取って、自身のデータに対して最適な予測を行うように学習器を結合する情報処理装置である学習装置400の構成例について説明する。図9は、学習装置400のハードウェア構成例を示している。図9を参照すると、学習装置400は、一例として、以下のようなハードウェア構成を有している。
・CPU(Central Processing Unit)401(演算装置)
・ROM(Read Only Memory)402(記憶装置)
・RAM(Random Access Memory)403(記憶装置)
・RAM403にロードされるプログラム群404
・プログラム群404を格納する記憶装置405
・情報処理装置外部の記録媒体410の読み書きを行うドライブ装置406
・情報処理装置外部の通信ネットワーク411と接続する通信インタフェース407
・データの入出力を行う入出力インタフェース408
・各構成要素を接続するバス409
また、学習装置400は、プログラム群404をCPU401が取得して当該CPU401が実行することで、図10に示す受信部421、生成部422としての機能を実現することができる。なお、プログラム群404は、例えば、予め記憶装置405やROM402に格納されており、必要に応じてCPU401がRAM403などにロードして実行する。また、プログラム群404は、通信ネットワーク411を介してCPU401に供給されてもよいし、予め記録媒体410に格納されており、ドライブ装置406が該プログラムを読み出してCPU401に供給してもよい。
なお、図9は、学習装置400のハードウェア構成例を示している。学習装置400のハードウェア構成は上述した場合に限定されない。例えば、学習装置400は、ドライブ装置406を有さないなど、上述した構成の一部から構成されてもよい。
受信部421は、他の学習装置から学習器を受信する。
生成部422は、受信部421が受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する。例えば、生成部422は、自装置が有するデータを用いて算出した結合係数を用いて受信部421が受信した学習器を結合することで、自装置が有するデータに適した予測を行うように適切化学習器を生成する。または、生成部422は、受信部が受信した学習器を用いて算出される追加の特徴量を追加した学習データを用いて学習器を生成することで、適切化学習器を生成する。例えば、生成部422は、上記例示した方法のいずれか、または、その組み合わせを行うことで、適切化学習器を生成することができる。
このように、学習装置400は、受信部421と生成部422とを有している。このような構成によると、生成部422は、受信部421が受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成することができる。その結果、性能を高めつつ、自装置が有するデータにより適した学習器を生成することができる。
なお、上述した学習装置400は、当該学習装置400などの情報処理装置に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、学習装置400などの情報処理装置に他の学習装置から学習器を受信し、受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する、処理を実現するためのプログラムである。
また、上述した学習装置400などの情報処理装置により実行される学習方法は、学習装置400などの情報処理装置が、他の学習装置から学習器を受信し、受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する、という方法である。
上述した構成を有する、プログラム、又は、プログラムを記録したコンピュータが読み取り可能な記録媒体、又は、学習方法、の発明であっても、上述した学習装置400と同様の作用・効果を奏するために、上述した本開示の目的を達成することができる。
また、上述した学習装置400などが生成した適切化学習器を用いた推論を行う推論装置500などであっても、同様に本開示の目的を達成することが出来る。例えば、推論装置500は、図11で示すように、他の学習装置から受信した学習器と、自装置が有するデータを用いて自装置が有するデータに適した予測を行うように算出された結合係数と、を記憶する記憶装置521と、特徴量の入力に応じて、記憶装置が記憶する学習器と結合係数とを用いた推論を行う推論部522と、を有する。なお、推論装置500のハードウェア構成は学習装置400と同様であってよい。
<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における学習装置などの概略を説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
他の学習装置から学習器を受信する受信部と、
前記受信部が受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する生成部と、
を有する
学習装置。
(付記2)
付記1に記載の学習装置であって、
自装置が有するデータを用いて、データに適した予測を行うように結合係数を算出する算出部を有し、
前記生成部は、前記算出部が算出した結合係数を用いて前記受信部が受信した学習器を結合することで、自装置が有するデータに適した予測を行うように前記適切化学習器を生成する
学習装置。
(付記3)
付記2に記載の学習装置であって、
前記算出部は、自装置が有するデータを学習器に入力した結果を用いた線形回帰を行うことで、データに適した予測を行うように結合係数を算出する
学習装置。
(付記4)
付記2または付記3に記載の学習装置であって、
前記算出部は、検証用のデータであるバリデーションデータを用いて前記結合係数を算出する
学習装置。
(付記5)
付記2から付記4までのうちのいずれか1項に記載の学習装置であって、
前記算出部は、学習器である決定木において各葉ノードに落ちるデータを特定して、葉ノードごとのデータを用いて前記結合係数を算出する
学習装置。
(付記6)
付記1から付記5までのうちのいずれか1項に記載の学習装置であって、
前記受信部が受信した学習器と、学習データと、を用いて追加の特徴量を算出する特徴量算出部と、
前記特徴量算出部が算出した特徴量を前記学習データに加えて学習することで学習器を生成する学習部と、
を有し、
前記生成部は、前記学習部が生成した学習器を用いて、前記適切化学習器を生成する
学習装置。
(付記7)
付記6に記載の学習装置であって、
自装置が有するデータを用いて前記受信部が受信した学習器に対応する結合係数を算出する算出部を有し、
前記生成部は、前記算出部が算出した結合係数を用いて前記受信部が受信した学習器と前記学習部が生成した学習器とを結合することで、前記適切化学習器を生成する
学習装置。
(付記8)
情報処理装置が、
他の学習装置から学習器を受信し、
受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する
学習方法。
(付記9)
情報処理装置に、
他の学習装置から学習器を受信し、
受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する
処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
(付記10)
特徴量の入力に対してラベルを推論する推論装置であって、
他の学習装置から受信した学習器と、自装置が有するデータを用いて自装置が有するデータに適した予測を行うように算出された結合係数と、を記憶する記憶装置と、
特徴量の入力に応じて、前記記憶装置が記憶する学習器と結合係数とを用いた推論を行う推論部と、
を有する
推論装置。
以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。
100 学習システム
200 他学習装置
300 学習装置
310 操作入力部
320 画面表示部
330 通信I/F部
340 記憶部
341 学習データ情報
342 バリデーションデータ情報
343 学習器情報
344 係数情報
345 プログラム
350 演算処理部
351 受信部
352 特徴量追加算出部
353 学習部
354 係数算出部
355 結合部
356 推論部
357 出力部
400 学習装置
401 CPU
402 ROM
403 RAM
404 プログラム群
405 記憶装置
406 ドライブ装置
407 通信インタフェース
408 入出力インタフェース
409 バス
410 記録媒体
411 通信ネットワーク
421 受信部
422 生成部
500 推論装置
521 記憶装置
522 推論部

Claims (8)

  1. 他の学習装置から学習器を受信する受信部と、
    前記受信部が受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する生成部と、
    自装置が有するデータを用いて、データに適した予測を行うように結合係数を算出する算出部と、
    を有し、
    前記生成部は、前記算出部が算出した結合係数を用いて前記受信部が受信した学習器を結合することで、自装置が有するデータに適した予測を行うように前記適切化学習器を生成し、
    前記算出部は、学習器である決定木において各葉ノードに落ちるデータを特定して、葉ノードごとのデータを用いて前記結合係数を算出する
    学習装置。
  2. 請求項に記載の学習装置であって、
    前記算出部は、自装置が有するデータを学習器に入力した結果を用いた線形回帰を行うことで、データに適した予測を行うように結合係数を算出する
    学習装置。
  3. 請求項1または請求項2に記載の学習装置であって、
    前記算出部は、検証用のデータであるバリデーションデータを用いて前記結合係数を算出する
    学習装置。
  4. 請求項1から請求項までのうちのいずれか1項に記載の学習装置であって、
    前記受信部が受信した学習器と、学習データと、を用いて追加の特徴量を算出する特徴量算出部と、
    前記特徴量算出部が算出した特徴量を前記学習データに加えて学習することで学習器を生成する学習部と、
    を有し、
    前記生成部は、前記学習部が生成した学習器を用いて、前記適切化学習器を生成する
    学習装置。
  5. 請求項に記載の学習装置であって、
    自装置が有するデータを用いて前記受信部が受信した学習器に対応する結合係数を算出する算出部を有し、
    前記生成部は、前記算出部が算出した結合係数を用いて前記受信部が受信した学習器と前記学習部が生成した学習器とを結合することで、前記適切化学習器を生成する
    学習装置。
  6. 情報処理装置が、
    他の学習装置から学習器を受信し、
    受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成し、
    適切化学習器を生成する際、自装置が有するデータを用いて、データに適した予測を行うように結合係数を算出し、算出した結合係数を用いて受信した学習器を結合することで、自装置が有するデータに適した予測を行うように前記適切化学習器を生成し、
    前記結合係数を算出する際は、学習器である決定木において各葉ノードに落ちるデータを特定して、葉ノードごとのデータを用いて前記結合係数を算出する
    学習方法。
  7. 情報処理装置に、
    他の学習装置から学習器を受信し、
    受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する
    処理を実現させ、
    適切化学習器を生成する際、自装置が有するデータを用いて、データに適した予測を行うように結合係数を算出し、算出した結合係数を用いて受信した学習器を結合することで、自装置が有するデータに適した予測を行うように前記適切化学習器を生成し、
    前記結合係数を算出する際は、学習器である決定木において各葉ノードに落ちるデータを特定して、葉ノードごとのデータを用いて前記結合係数を算出する
    プログラム。
  8. 他の学習装置から学習器を受信する受信部と、
    前記受信部が受信した学習器と、自装置が有するデータと、を用いて、自装置が有するデータに適した予測を行うように適切化学習器を生成する生成部と、
    前記受信部が受信した学習器と、学習データと、を用いて追加の特徴量を算出する特徴量算出部と、
    前記特徴量算出部が算出した特徴量を前記学習データに加えて学習することで学習器を生成する学習部と、
    を有し、
    前記生成部は、前記学習部が生成した学習器を用いて、前記適切化学習器を生成する
    学習装置。
JP2024507472A 2022-03-18 2022-03-18 学習装置 Active JP7729467B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/012882 WO2023175977A1 (ja) 2022-03-18 2022-03-18 学習装置

Publications (3)

Publication Number Publication Date
JPWO2023175977A1 JPWO2023175977A1 (ja) 2023-09-21
JPWO2023175977A5 JPWO2023175977A5 (ja) 2024-10-16
JP7729467B2 true JP7729467B2 (ja) 2025-08-26

Family

ID=88023077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024507472A Active JP7729467B2 (ja) 2022-03-18 2022-03-18 学習装置

Country Status (2)

Country Link
JP (1) JP7729467B2 (ja)
WO (1) WO2023175977A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020008919A1 (ja) 2018-07-04 2020-01-09 株式会社エイシング 機械学習装置及び方法
JP2021022079A (ja) 2019-07-25 2021-02-18 オムロン株式会社 推論装置、推論方法、及び推論プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020008919A1 (ja) 2018-07-04 2020-01-09 株式会社エイシング 機械学習装置及び方法
JP2021022079A (ja) 2019-07-25 2021-02-18 オムロン株式会社 推論装置、推論方法、及び推論プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
南賢太郎、外3名,差分プライベート弱学習器の統合,情報処理学会論文誌数理モデル化と応用(TOM),日本,情報処理学会,2015年07月24日,Vol.8 No.2,pp.31-43

Also Published As

Publication number Publication date
JPWO2023175977A1 (ja) 2023-09-21
WO2023175977A1 (ja) 2023-09-21

Similar Documents

Publication Publication Date Title
CN113011529B (zh) 文本分类模型的训练方法、装置、设备及可读存储介质
JP5943358B2 (ja) 学習装置、処理装置、予測システム、学習方法、処理方法、およびプログラム
JP5954547B2 (ja) 確率モデル推定装置、方法、およびプログラム
US20210125101A1 (en) Machine learning device and method
CN113614738A (zh) 使用蒸馏的具有个体目标类别的多个模型的统一
Zhang et al. Equipment health indicator learning using deep reinforcement learning
US20200257974A1 (en) Generation of expanded training data contributing to machine learning for relationship data
JP7271216B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US11556848B2 (en) Resolving conflicts between experts' intuition and data-driven artificial intelligence models
US11720788B2 (en) Calculation scheme decision system, calculation scheme decision device, calculation scheme decision method, and storage medium
US20200234120A1 (en) Generation of tensor data for learning based on a ranking relationship of labels
WO2020239506A1 (en) Method for determining a plurality of trained machine learning models
JP7196933B2 (ja) 学習装置および学習方法
JP2015114988A (ja) 処理装置、処理方法、およびプログラム
Janssens et al. Modeling and enacting enterprise decisions
JP7729467B2 (ja) 学習装置
JP2020035000A (ja) 機械学習システムおよびボルツマンマシンの計算方法
JP2019008499A (ja) 解探索処理装置
JP2015114987A (ja) 処理装置、処理方法、およびプログラム
JP7619475B2 (ja) モデル学習装置、方法およびプログラム
JPWO2018150445A1 (ja) モデル生成システム、モデル生成方法およびモデル生成プログラム
JP2013025349A (ja) 特徴選択装置、方法、及び、プログラム
Behal et al. Mcrage: synthetic healthcare data for fairness
JPWO2020090076A1 (ja) 回答統合装置、回答統合方法および回答統合プログラム
WO2024095397A1 (ja) 目標最適化装置、方法およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240802

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250728

R150 Certificate of patent or registration of utility model

Ref document number: 7729467

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150