WO2023276213A1

WO2023276213A1 - 情報処理装置、情報処理方法及び情報処理プログラム

Info

Publication number: WO2023276213A1
Application number: PCT/JP2022/002805
Authority: WO
Inventors: 直紀井手
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2021-06-30
Filing date: 2022-01-26
Publication date: 2023-01-05
Anticipated expiration: 2023-12-30
Also published as: EP4365781A4; JPWO2023276213A1; US20240127122A1; CN117546186A; EP4365781A1

Abstract

本開示に係る情報処理装置は、データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得する取得部と、前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する選択部と、を備える。

Description

情報処理装置、情報処理方法及び情報処理プログラム

　本開示は、情報処理装置、情報処理方法及び情報処理プログラムに関する。

　従来、深層学習では、予測モデル等のモデルの構造や学習方法の開拓による性能向上が行われていた。このような性能向上においては、開発者等のユーザの仕事は、独自のモデルの構造や学習方法を考案し、その性能を、例えば一般物体画像分類等のタスクと、例えばイメージネット等のデータセットとにより、ベンチマーク評価することが中心であった（例えば非特許文献１）。

　また、深層学習等の機械学習においては、実世界での活用へとフェーズが変遷している。このため、ユーザは、実現したい独自の予測機能等のタスクを考案し、これを実現するための独自のデータを収集することが必要となっている。

"Deep　Residual　Learning　for　Image　Recognition",　　Kaiming　He,　Xiangyu　Zhang,　Shaoqing　Ren,　Jian　Sun＜インターネット＞https://arxiv.org/abs/1512.03385　（令和３年６月２３日検索）

　しかしながら、ユーザ自身がタスクの実現のために、学習に用いるデータを選択することは難しいという課題がある。例えば、大量のデータが含まれるデータセットの中から、ユーザが自身のタスクを実現するモデルを学習するために適切なデータセット等のサンプルセットを選択することは困難である。そのため、データセットから適切なサンプルセットを選択することが望まれている。

　そこで、本開示では、データセットから適切なサンプルセットを選択することができる情報処理装置、情報処理方法及び情報処理プログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得する取得部と、前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する選択部と、を備える。

本開示の情報処理システムの構成例を示す図である。情報処理システムによる処理手順を示すフローチャートである。情報処理システムのブロック構成の一例を示す図である。ユーザインターフェースの一例を示す図である。情報処理システムのブロック構成の一部を示す図である。トンネル効果を模式的に示す図である。情報処理のメインプログラムの一例を示す図である。データ選択最適化の処理の手順を示すフローチャートである。データ選択最適化の処理プログラムの一例を示す図である。本開示の情報処理装置の構成例を示す図である。本開示の最適化マシンの構成例を示す図である。クラスのリストの一例を示す図である。ユーザが学習したいクラスの選択の一例を示す図である。ユーザからのデータの受付けの一例を示す図である。情報処理システムを適用した第５の実施例を示す図である。第５の実施例における処理の手順を示すフローチャートである。画像判定処理の流れを示す図である。情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本願にかかる情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　以下に示す項目順序に従って本開示を説明する。
　　１．概要
　　　１－１．背景（課題等）
　　　１－２．本開示の概要（処理・効果等）
　　２．第１の実施例
　　　２－１．情報処理システムの装置構成
　　　２－２．情報処理システムの全体処理フロー
　　　２－３．情報処理システムのブロック全体像
　　　　２－３－１．最適化マシン
　　　　２－３－２．ユーザインターフェース
　　　　　２－３－２－１．ユーザインターフェース部（データ入力部）
　　　　　２－３－２－２．ユーザインターフェース部（マシン選択部）
　　　　　２－３－２－３．ユーザインターフェース部（データ出力部）
　　　　２－３－３．情報処理装置（メインブロック）
　　３．第２の実施例
　　　３－１．量子アニーリングと組合せ最適化問題
　　　３－２．データセットからのサンプル抽出最適化
　　　３－３．リサンプリング最適化の量子アニーリング等への実装
　　４．第３の実施例
　　　４－１．回帰モデル
　　　４－２．二クラス分類モデル
　　　４－３．多クラス分類モデル
　　５．第４の実施例
　　　５－１．情報処理のメインプログラム例
　　　５－２．データ選択最適化の処理フロー例
　　　５－３．データ選択最適化の処理プログラム例
　　６．情報処理装置の構成
　　７．最適化マシンの構成
　　８．ユーザへの提示例
　　　８－１．クラスのリスト
　　　８－２．クラスの選択
　　　８－３．データの受付け
　　９．適用例
　　　９－１．第５の実施例（画像分類）
　　　９－２．第６の実施例（生体分子）
　　１０．その他の構成例等
　　　１０－１．その他の構成例
　　　１０－２．プログラムやパラメータ等の処理に用いる情報の生成方法
　　　１０－３．その他
　　１１．本開示に係る効果
　　１２．ハードウェア構成

［１．概要］
　本開示の詳細を説明する前に、本開示に係る技術的な背景の概要及び本開示の概要について説明する。なお、以下の技術的な説明の中で従来技術に関する詳細な説明は適宜省略する。

［１－１．背景（課題等）］
　まず、本開示に関連する課題について以下詳述する。深層学習等の機械学習においては、モデルの学習に用いるデータセットの収集は容易ではなく、データセットを収集するコストの軽減は課題の一つである。データセットを収集するコストの削減を、学習方法で解決しようとする試みはいくつか知られており、例えば以下の三つの学習方法が挙げられる。
・半教師学習：　ラベリングされてないデータをそのまま活用する学習方法
・能動学習：　ラベリングされてないデータをラベリングしながら学習する方法
・転移学習：　別のデータセットで学習済みのモデルを活用する学習方法

　上記の三つの学習方法のうち、前者二つ、すなわち半教師学習及び能動学習は、データセット収集（構築）の中でも、ラベリングのコストに対する対策である。ラベリングとは、データに情報を追加する作業で、通常人手でなされるためコストが高い。

　また、ラベリングには、科学実験に基づいた物理量の計測や、病理画像の診断等、高度な知識、作業がなければ実現が難しい処理も含まれる。たとえば、半導体のバンドギャップの計測や、有機・無機分子の光学特性、反応速度、平衡乖離度の計測情報の計測等も、これらをデータとして機械学習の予測モデルを学習するという観点からはラベリングとみなすことができる。

　また、能動学習は、データセットから一ないし複数のデータを適切に選んでラベリングし、これを予測モデル（以下単に「モデル」ともいう）の更新に用いる学習方法である。モデルに応じて、ラベリングするべきデータを効率よく選べば、全てのデータにラベリングする必要がなくなり、ラベリングのコスト削減につながる。

　一方、上記の三つの学習方法のうち、後者一つ、すなわち転移学習は、ラベリングのコスト削減よりも別のデータセットの情報の流用に主眼をおく技術である。転移学習では、ユーザは、システムから別のデータセットの情報を埋め込んだモデルをダウンロードして、このモデルのパラメータ（の一部）を手元のデータセットで更新する。

　また、転移学習では、システムから配布されるモデルは、一般にサイズ（フットプリント）が大きい傾向があるが、これは様々な情報に対応できるサイズにしたことが原因として挙げられる。しかし、転移先のユーザからすると、予測対象以外の情報処理のために時間とエネルギーを消費していることとなる。つまり、ユーザ側からするとモデルに対する情報の効率が悪い。

　また、データセットの情報がモデルパラメータに変換されているため、どのようなデータを学習しているのかわからない点も課題として挙げられる。昨今、人工知能活用の倫理性が問われており、より、公明な学習には、データそのものが供給される方が望ましい。

　以上を鑑みると、ユーザが持っている予測モデル等、ユーザが所望するモデルに応じて、データセットが有する情報を過不足なく集約したサブセットを効率よく探索して提供することが望まれている。

［１－２．本開示の概要（処理・効果等）］
　そこで、以下で詳細を説明する情報処理システム１（図１参照）は、例えばユーザからモデルが提示された場合、情報処理システム１がアクセスできるデータセットから、ユーザのモデルにとって最も効率よく情報をもたらすサブセットを提供する。

　例えば、情報処理システム１は、データセットの情報を学習したモデルを共通に配布する代わりに、ユーザの持っているモデルにカスタマイズされたモデルを更新するために最適な（サンプル）サブセットを選択し、選択したサブセットを提供する。情報処理システム１が提供する情報の一例としては、データセットやデータシミュレータからサンプルされたサブセットがある。なお、情報処理システム１は、必要に応じてそのサブセットで学習したモデル等の様々な情報を提供してもよいが、この点についての詳細は後述する。

　情報処理システム１が選択するサブセットは、ユーザが持っているモデルに対して、最もモデルの曖昧さを減らすデータセット、言い換えると、最も情報抽出の効率が大きくなるよう選択されたサブセットである。情報処理システム１によるサブセットの選択の最適化は、最適化処理の高精度化のため、量子アニーリングマシン、または二値二次形式組合せ最適化の高速化に特化した組合せ最適化アクセラレータ等の任意の組合せ最適化マシン（以下「最適化マシン」ともいう）を用いて実現される。

　情報処理システム１によれば、ユーザは、現時点での情報で生成したモデルの更新に使うデータを、既存のデータセット等から効率よく収集できる。このため、情報処理システム１によれば、開発期間と開発経費の削減と試行回数の増加の効果を得られる。

　情報処理システム１によれば、ユーザは、モデルの更新に最も寄与の大きいサブセットを取得できる。このため、情報処理システム１によれば、モデルは、予測したい情報だけに最適化され、機能の性能向上が実現される。

　また、情報処理システム１によれば、ユーザは、ユーザが持っているモデルの更新に最も寄与の大きいラベルなしデータのサブセットを得ることができる。このため、情報処理システム１によれば、知見が最も多いと予想される分析対象のデータから順にラベリング、あるいは、ラベリングに相当する分析作業を実現できる。

　また、情報処理システム１によれば、サブセットの最適化は、量子アニーリングマシン等の最適化マシンを用いて実現される。量子アニーリングは漸近的に大域最適解に到達することが理論的に知られているので、従来の組合せ最適化の実装アルゴリズムの代表例である貪欲法の近似よりも最適なサブセットを提供することができる。まず、以下では、情報処理システム１全体のシステム構成例等を第１の実施例として説明し、その後に各処理や適用例について説明する。

［２．第１の実施例］
［２－１．情報処理システムの装置構成］
　まず、図１に示す情報処理システム１の構成について説明する。図１は、本開示の情報処理システムの構成例を示す図である。図１に示すように、情報処理システム１は、最適化マシン１０と、端末装置２０と、データベース５０と、情報処理装置１００とが含まれる。例えば、情報処理システム１は、大量データを格納したデータベース５０、データセットからサブセットを生成するサーバである情報処理装置１００、ユーザが情報処理装置１００にリクエストを出し、サブセットを受け取るための端末装置２０、及び、情報処理装置１００がサブセットを生成するために利用する最適化マシン１０で構成される。

　情報処理装置１００と、最適化マシン１０と、端末装置２０と、データベース５０とは所定の通信網（ネットワークＮＴ）を介して、有線または無線により通信可能に接続される。なお、情報処理システム１には、複数の情報処理装置１００や、複数の最適化マシン１０や、複数の端末装置２０や、複数のデータベース５０が含まれてもよい。

　最適化マシン１０は、組合せ最適化問題を解くために用いられるコンピュータ（最適化計算専用マシン）である。例えば、最適化マシン１０は、最適なサブセットを作るときに用いる最適化処理のアクセラレータである。最適化マシン１０としては、量子アニーリングマシンを筆頭にイジングマシン等の組合せ最適化マシン（離散最適化専用マシン）等がある。なお、最適化マシン１０の具体例については後述する。

　端末装置２０は、ユーザに利用されるコンピュータである。端末装置２０は、情報処理装置１００にサブセットをリクエストし、情報処理装置１００からサブセットを受信する。例えば、このサブセットは、モデルの学習に利用されてもよく、実際にモデルを端末装置２０、または、端末装置２０の後段で学習する際に利用されてもよい。例えば、サブセットは、モデルのサイズを集約する際にリファレンスのセットとして利用される。なお、情報処理システム１では、サブセットで学習済みのパラメータを供給してもよい。

　端末装置２０からのサブセットの要求の態様は、モデル自体の入力（送信）であってもよい。また、ユーザが事前にモデルを作成する代わりに、情報処理システム１側から提示されるガイダンスに沿ってモデルを決めるようにしても良い。さらに、サブセットの仕様に関する要求として、例えば、端末装置２０は、サブセットのサイズ（データの数等）の指定を受け付けてもよい。ユーザによるサブセットのデータ数の指定を受け付けた場合、端末装置２０は、ユーザが指定したサブセットのデータ数を示す指定情報を情報処理装置１００に送信する。端末装置２０は、ユーザが収集したデータセットを情報処理装置１００に送信してもよい。

　端末装置２０は、ユーザから各種操作が入力される。端末装置２０は、ユーザによる入力を受け付ける。端末装置２０は、ユーザによる最適化マシン１０の選択を受け付ける。端末装置２０は、表示したコンテンツに対するユーザの操作を入力として受け付ける。なお、端末装置２０は、上述した処理を実現可能であれば、どのような装置であってもよい。例えば、端末装置２０は、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal　Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal　Digital　Assistant）等の装置であってもよい。

　データベース５０は、大規模データセットを記憶するデータベースである。データベース５０に記憶されるデータセットは、様々な用途に転移できるモデルを学習できる規模のデータセット（大規模データセット）である。

　情報処理装置１００は、データベース５０に記憶されたデータセットから、モデルの学習に用いるサブセットやシミュレータの出力等のサンプルセットを選択するサーバ装置（コンピュータ）である。情報処理装置１００は、データセットからのデータ供給やシミュレーション等のデータ供給方法を基に、サンプルセットを選択する。例えば、データ供給方法は、データセットからのデータ供給である。また、例えば、サンプルセットはデータセットのサブセットである。情報処理装置１００は、学習したいモデルに応じて決定される情報エントロピーと、モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とに基づいて、データセットから、モデルの学習に用いるサンプルセットを選択する。例えば、学習したいモデルは、学習パラメータ付きの予測モデルである。また、例えば、モデルのタスクとは、モデルの入力に対応するモデルの出力の種別である。また、例えば、情報エントロピーは、カルバックライブラー情報量、または、フィッシャー情報量を用いて算出される情報エントロピーであるが詳細は後述する。例えば、情報処理装置１００は、最適化マシン１０、端末装置２０、及びデータベース５０との間の通信により処理に必要な情報を受信し、受信した情報を用いてモデルの学習に用いるサブセットを選択する。例えば、情報処理装置１００は、端末装置２０のリクエストに応じて、データベース５０からサブセットを選択し、選択したサブセットを端末装置２０に送信する。

　なお、情報処理システム１におけるサブセットの選択においては、最適化マシン１０による最適化がなされる。情報処理システム１は、最適と判定されたサブセットを作る際に、端末装置２０からのデータセットをデータベース５０に記憶されたデータセット等の大規模データセットに追加してもよい。

［２－２．情報処理システムの全体処理フロー］
　次に、図２を用いて情報処理システムの全体処理フローを説明する。図２は、情報処理システムによる処理手順を示すフローチャートである。

　図２に示すように、まず、情報処理装置１００は、端末装置２０からデータセットの要求を受け付ける（ステップＳ１）。情報処理装置１００は、端末装置２０からデータセットの提供のリクエストを受けとる。例えば、リクエストは、モデルそのものが特定のフォーマットであってもよく、端末装置２０から情報処理装置１００に送信される。他には、リクエストとして、ユーザが扱いたいドメインを構成するカテゴリのクラス名等が、端末装置２０から情報処理装置１００に送信されてもよい。また、リクエストとして、ユーザが収集したデータセットそのものが、端末装置２０から情報処理装置１００に送信されてもよい。

　そして、情報処理装置１００は、最適化マシン１０に、データの最適な組合せ情報を要求する（ステップＳ２）。情報処理装置１００は、データベース５０に記憶されたデータセット等の大規模データからユーザのリクエストに対して最適なデータを選択するため、最適化マシン１０に必要な情報を送信する。この情報は、端末装置２０に提供するデータサイズの制約と、データの組合せが持つ情報量に関するものであるが、詳細は後述する。

　そして、情報処理装置１００は、最適化に応じて、端末装置２０へデータを提供する（ステップＳ３）。情報処理装置１００は、最適化マシン１０からの結果に基づいて、データベース５０に記憶されたデータセットのサブセットを生成し、端末装置２０へ生成したデータセットを提供する。

　そして、情報処理装置１００は、次の要求があるまで待機し（ステップＳ４）、次の要求があった場合、ステップＳ１に戻って処理を繰り返す。また、情報処理装置１００は、次の要求がなく所定の期間が経過した場合、処理を終了する。

［２－３．情報処理システムのブロック全体像］
　次に、図３を用いて情報処理システムのブロック全体像を説明する。図３は、情報処理システムのブロック構成の一例を示す図である。

　図３に示すように、情報処理システム１には、ユーザインターフェース部２１、２２、２３、メインブロックでありデータセット生成部として機能する情報処理装置１００、メインブロックに接続されるデータセットのストレージであるデータベース５０、さらに、最適化処理に特化した複数の最適化マシン１０で構成されている。

［２－３－１．最適化マシン］
　情報処理システム１には、最適化マシン１０ａ、最適化マシン１０ｂ、最適化マシン１０ｃ等の複数の最適化マシン１０が含まれる。なお、最適化マシン１０ａ、最適化マシン１０ｂ、最適化マシン１０ｃ等について、特に区別せずに説明する場合は、「最適化マシン１０」と記載する。なお、図３では、最適化マシン１０ａ、最適化マシン１０ｂ、最適化マシン１０ｃの３台の最適化マシン１０を示すが、情報処理システム１には、４台以上の最適化マシン１０が含まれてもよい。最適化マシン１０は、イジングモデルを用いるコンピュータ（計算機）である。最適化マシン１０は、イジングモデルを用いて、組合せ最適化問題を解くコンピュータ（組合せ最適化マシン）である。

　例えば、最適化マシン１０ａは、量子アニーリングを用いて問題を解く量子コンピュータ（量子計算機）である。最適化マシン１０ａは、量子アニーリング方式や量子アニーラにより実現することができる。例えば、最適化マシン１０ｂは、ＣＭＯＳ（Complementary　metal-oxide-semiconductor）等を用いた組合せ最適化アクセラレータである。例えば、最適化マシン１０ｃは、ＧＰＵ（Graphics　Processing　Unit）等のプロセッサやＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路を用いた組合せ最適化アクセラレータである。なお、最適化マシン１０は、上記の最適化マシン１０ａや最適化マシン１０ｂや最適化マシン１０ｃ等のハードウェア構成に限らず、どのようなハードウェア構成であってもよい。

［２－３－２．ユーザインターフェース］
　情報処理システム１には、データ入力部であるユーザインターフェース部２１、マシン選択部であるユーザインターフェース部２２、及びデータ提示部であるユーザインターフェース部２３が含まれる。なお、ユーザインターフェース部２２はオプションであり、ユーザによる最適化マシン１０の選択を受け付けない場合は、情報処理システム１に含まれてなくてもよい。

　例えば、ユーザインターフェース部２１、２２、２３は、端末装置２０により実現される。すなわち、端末装置２０は、ユーザインターフェース部２１、２２、２３に対応する機能を有し、ユーザによるデータ入力の受け付け、ユーザによる最適化マシン１０の選択の受け付け、及び提供された情報の提示等の各種の処理を行う。

［２－３－２－１．ユーザインターフェース部（データ入力部）］
　まず、データ入力部であるユーザインターフェース部２１に対応する機能について説明する。ユーザインターフェース部２１は、ユーザが欲しいデータセットの情報や、カスタマイズしてほしい対象となるモデル、実際にユーザが集めたデータセットを入力するためのインターフェースである。ユーザインターフェース部２１は、コマンドラインインターフェースでも、グラフィックインターフェースでもよい。

　例えば、最もシンプルな入力は、モデルだけの入力である。例えば、ユーザインターフェース部２１は、深層学習で学習するニューラルネットワークモデルを、フォーマットに従って生成したファイルで入力する。なお、より詳しい情報を獲得できるようにするため、以下の４つの情報等をユーザに要求してもよい。例えば、ユーザインターフェース部２１は、以下の４つの情報等の入力を受け付ける。

・タスク（実現したい機能）はなにか（回帰かクラス判別か分類か。クラス数は一つか複数か）
・データはラベリング済みを使うか自分でラベリングするか
・データのドメインはなにか（画像、音声、言語、項目データ・・・）
・ドメインやクラス名はシステムが保持している既存のクラスか未知のクラスか
　例えば、情報処理システム１においては、上記の４つの情報等のアンケートの答えに従って内部で処理が分岐していくものとする。

［２－３－２－２．ユーザインターフェース部（マシン選択部）］
　次に、マシン選択部であるユーザインターフェース部２２に対応する機能について説明する。ユーザインターフェース部２２は、データセットからデータのサンプリングする際の最適化を実現するときに、最適化方法としてどのような方法を使うかを選択するためのインターフェースである。組合せ最適化を高速に実現するための最適化計算特化型計算機にはすでに様々なマシン（最適化マシン１０）があり、クラウド等を介してユーザが利用することもできる。

　なお、最適化マシン１０の各々には、メリット・デメリットや得意・不得意等がある。例えば、ユーザインターフェース部２２は、グラフィカルユーザインターフェース（Graphical　User　Interface：ＧＵＩ）等を介して、図４に示すような各マシン（最適化マシン１０）の情報を含むコンテンツＣＴ１を提示してもよい。この場合、コンテンツＣＴ１を確認したユーザが目的に応じて、所望の最適化マシン１０を選択する。

　図４は、ユーザインターフェースの一例を示す図である。図４のコンテンツＣＴ１では、マシンＡ～Ｄの４つの最適化マシン１０が選択候補として提示される場合を示す。コンテンツＣＴ１には、マシンＡ～Ｄの４つの最適化マシン１０の各々について、サイズ、全結合の可否、精度、速度、通信、価格等の複数の項目についての評価を示す情報が含まれる。なお、図４に示す提示方法は一例に過ぎず、ユーザへの提示方法はユーザが所望の最適化マシン１０を選択可能であれば、どのような形態であってもよい。

　例えば、端末装置２０からの要求に応じて、情報処理装置１００は、コンテンツＣＴ１を生成し、生成したコンテンツＣＴ１を端末装置２０に送信する。そして、コンテンツＣＴ１を受信した端末装置２０は、コンテンツＣＴ１を表示する。端末装置２０を利用するユーザは、端末装置２０に表示されたコンテンツＣＴ１を確認し、マシンＡ～Ｄの４つの最適化マシン１０の各々のメリット・デメリット及び得意・不得意を比較した上で、利用する最適化マシン１０を選択する。ユーザによる最適化マシン１０の選択を受け付けた端末装置２０は、ユーザが選択した最適化マシン１０を示す情報を情報処理装置１００に送信する。ユーザが選択した最適化マシン１０を示す情報を受信した情報処理装置１００は、ユーザが選択した最適化マシン１０に対して処理を要求する。

［２－３－２－３．ユーザインターフェース部（データ出力部）］
　次に、データ出力部であるユーザインターフェース部２３に対応する機能について説明する。ユーザインターフェース部２３は、ユーザが実現したい機能に合わせて提供するデータセットのサブセットを提示するインターフェースである。ユーザインターフェース部２３は、コマンドラインインターフェースでも、グラフィックインターフェースでもよい。

　例えば、ユーザインターフェース部２３は、サブセット（データセット）を供給する。なお、ユーザインターフェース部２３は、サブセットに限らず、サブセットで学習したパラメータを供給してもよい。例えば、ユーザインターフェース部２３は、サブセットとともに、そのサブセットで学習したパラメータを供給してもよい。また、ユーザインターフェース部２３は、ユーザからの指定によって、サブセットではなく元のデータセットで学習したパラメータを提示してもよい。

　ユーザインターフェース部２３からの供給を受けたユーザは、得られたモデルのパラメータを直接利用することもできる。一方で、情報処理システム１では、学習に必要なデータセットが得られている。このように、学習に必要なデータセットが得られているので、情報処理システム１では、実現したい機能をより効率的に、また、高性能になるように設計、学習しなおすことができる。

［２－３－３．情報処理装置（メインブロック）］
　次に、メインブロックである情報処理装置１００等の情報処理システム１のコア部分について、図３及び図５を用いて説明する。図５は、情報処理システムのブロック構成の一部を示す図である。図５に示す情報処理システム１のコア部分には、データベース５０、データ読み取り部１３１ａ、ユーザデータ入力部１３１ｂ、最適化係数抽出部１３２、最適化マシン通信部１３３、データセット選択部１３４、及び出力部１３５が含まれる。

　図５中の各構成のうち、データベース５０以外は、情報処理装置１００の構成であり、図３中の点線内に示す構成に対応する。なお、図５において図３と同様の点については同様の符号を付す。なお、最適化係数抽出部１３２は、図３中に示す情報ゲイン計算部１３２ａ及びＱＵＢＯ係数算出部１３２ｂを一体として構成したものである。すなわち、最適化係数抽出部１３２は、情報ゲインに関する計算を行う情報ゲイン計算部１３２ａ、及びＱＵＢＯ（Quadratic　Unconstrained　Binary　Optimization：二次形式バイナリ最適化）の係数を算出するＱＵＢＯ係数算出部１３２ｂの両方の機能を有する構成要素である。

　以下、図５に示す各構成について説明する。データベース５０は、横断的な大量のデータ（大規模データ）が保存されているデータベースである。例えば、データベース５０は、イメージネット等の任意のデータセットが保存される。

　データ読み取り部１３１ａは、データベースを読み取る機能を有する。例えば、データ読み取り部１３１ａは、データベース５０からデータを取得する。データ読み取り部１３１ａは、ユーザからのリクエストにおいて何らかのクラスの指定があった場合には、そのクラスのデータを取得する。

　ユーザデータ入力部１３１ｂは、ユーザからのリクエストを受け取る機能を有するモジュールである。例えば、ユーザからのリクエストには以下の二通りの入力パターンがある。例えば、第一のパターンは、ユーザが学習したい予測モデルが入力されるパターンである。また、第二のパターンは、ユーザがすでに持っているデータが入力されるパターンである。

　最適化係数抽出部１３２は、大規模データベースのデータとユーザが入力したデータから後述する組合せ最適化の定式化に基づいた最適化の目的関数の係数情報を抽出する。最適化マシン通信部１３３は、最適化マシン１０に目的関数の係数情報を送信して、最適化処理後の変数を受信する。データセット選択部１３４は、最適化の結果に基づいて、サブセット（データセット）を選択する。出力部１３５は、選択の結果に基づいて、情報を出力する。なお、情報処理装置１００の各構成の詳細は後述する。

［３．第２の実施例］
　ここから、第２の実施例として、本開示の中心部分である量子アニーリングを使ったデータ抽出最適化の実現方法を説明する。以下では、本体のデータの組合せの最適化の説明に先立って、量子アニーリングと組合せ最適化について説明する。その後、データセットからのサンプル抽出の組合せ最適化の定式化を示す。最後に、サンプル抽出の組合せ最適化の組合せ最適化マシン上への実装方法を説明する。

［３－１．量子アニーリングと組合せ最適化問題］
　量子アニーリングは、イジングモデルのエネルギー基底状態を探索する方法の一つであり、組合せ最適化の高速化という用途に特化して用いられる量子計算の一種と考えられている。イジングモデルは、もともと強磁性体（磁石）の温度に対する相転移現象を説明するために、物理学者イジングにより提案された物理モデルである。以下の式（１）は、もとの磁石のモデルを一般化したイジングモデルのハミルトニアン（エネルギー関数）であり、このモデルをもとのイジングによるモデルと区別して、スピングラスモデルと呼ぶこともある。

　式（１）のσ_iは、スピンと呼ばれる物理量で-1か1をとる変数であり添え字は通し番号を表している。また、J_ijは、結合エネルギーと呼ばれる定数で、２つのスピンの間に働く相互作用の大きさを表し、添え字は二つのスピンの通し番号を表している。h_kは、局所磁場とよばれる定数で、スピンに働く局所磁場の大きさを表し、添え字は局所磁場が作用するスピンの番号である。

　物理学ではエネルギー関数の最小化する状態を基底状態といい、十分ゆっくりと遷移させた物理システムは、エネルギー最小状態、すなわち、基底状態に到達するとされている。組合せ最適化問題は、集合の形式で表される最適解を探索する問題である。組合せ最適化問題は、巡回セールスマン問題を筆頭に、厳密な最適解を求めるには組合せ爆発を起こす全探索が必要で計算困難な問題が多数あることが知られている。組合せ最適化のなかでも、以下の式（２）に示す形式の目的関数を有するＱＵＢＯと称される二次形式制約なしバイナリ最適化と、適切な変数変換の下で等価である。

　ここで、式（２）のb_iは0か1の二値のいずれかを取るバイナリ変数であり、Q_ijはＱＵＢＯの係数行列である。

　ＱＵＢＯは、定数項を除いてイジングモデルのエネルギー関数と等価な形式に変換できる。具体的には、b_iを、以下の式（３）のように、σ_iに置き換えることで確認できる。また、ＱＵＢＯ問題の係数行列J_ij、h_kは、以下の式（４）、（５）のように表現される。

　そこで、ＱＵＢＯを実現するアルゴリズムを考える代わりに、最適化はこの係数でイジングモデルの物理的な基底状態の実現に任せようという考えで考案されたのが量子アニーリングである。

　量子アニーリングでは、イジングモデルに量子揺らぎの項を加えた以下の式（６）のようなモデルを扱う。

　式（６）に示すモデルで最初は、量子揺らぎの項を支配的にして、すべての組合せの重ね合わせ状態を実現しておき、徐々にイジングモデルのハミルトニアンを支配的にしていく。この過程が断熱的であるという条件で、最終的には、スピンの組合せが基底状態、つまり、エネルギーを最小にする状態に到達する。そこであらかじめＱＵＢＯ問題の係数行列J_ij、h_kをイジングモデルのハミルトニアンに設定しておけばイジングモデルの最終的なスピンの組み合わせがバイナリ変数に対応する。このようにして、組合せ最適化の問題をイジングモデルに埋め込み、量子揺らぎの状態から断熱的にイジングモデルの基底状態に遷移させることでイジングスピンに組合せ最適化の解を実現させることを量子アニーリングと呼ぶ。

　例えば、式（６）では、t=0では重ね合わせの項が支配的であり、全組合せ（解の候補）を重ね合せた状態となる。そして、式（６）では、ステップ的に重ね合わせの項をゆるめて（例えばtを増加させて）、収束させ、最後に基底状態を実現する。その後、基底状態で、スピンを計測することでこれを最適解として利用するという手順である。なお、これらの手順は、量子アニーリングの従来技術を用いて実現されるため、詳細な説明は省略する。

　なお、量子アニーリングでは、図６に示すような量子揺らぎに伴う量子トンネル効果によって、スムーズにエネルギー障壁を通過することで比較的高速な最適化を実現しているとされる。図６は、トンネル効果を模式的に示す図である。

　しかし、量子アニーリングを実際のマシンで実現すると、量子状態を維持することは難しく、この効果は限定的であるともいわれる。

　そこで、組合せ最適化をイジングモデルに埋め込むという考え方は流用しつつ、エネルギー最小化を熱揺らぎによって行うシミュレーテッドアニーリングをトランジスタ回路等の非量子デバイスを使って高速化した専用ハードウェア（組合せ最適化アクセラレータ）も提案されている。

　上記のように、本開示では、量子コンピュータや組合せ最適化アクセラレータ等、イジングモデルをシミュレートする様々なハードウェアを総称して最適化マシンと呼ぶこととする。

　量子アニーリングマシン等の量子コンピュータを含めて、これらの最適化マシンを用いて組合せ最適化を実現する上で共通となるのは、元の組合せ最適化問題を、イジングモデルと等価にできる二次形式のバイナリ最適化問題に書き下すことである。

［３－２．データセットからのサンプル抽出最適化］
　ここから、データセットからのサンプル抽出最適化について説明するが、サンプル抽出最適化の説明に先立って最適化の基準となる情報量について説明する。ここでは、カルバックライブラー情報量とフィッシャー情報行列について簡単に説明する。

　カルバックライブラー情報量は、二つの確率分布に対して以下の式（７）で定義される量である。

　カルバックライブラー情報量は、二つの確率分布の不確かさ（エントロピー）の期待値であり、確率分布による予測をより確からしくするための情報の大きさと考えることができる。

　次に、パラメータの異なる予測分布p(x│w)、p(x│w')の間のカルバックライブラー情報量を考える。これは、カルバックライブラー情報量の定義から以下の式（８）のように書ける。

　式（８）に示す情報量は、次の式（９）のようにテイラー展開できる。

　ここで、J(w)は、次の式（１０）で表されるフィッシャー情報行列（期待フィッシャー情報行列）である。

　例えば、フィッシャー情報行列は、パラメータに対する情報量の変動感度のような概念である。また、フィッシャー情報行列は、次の式（１１）及び式（１２）のような関係が知られている。

　ここで、Xは、nサンプルからなるデータセット、w_XはXから推定した最尤パラメータである。例えば式（１２）に示す二番目の関係は、フィッシャー情報行列がパラメータの共分散行列（精度行列）の逆行列と比例関係にあることを示している。

　このことから、共分散行列を用いて算出される２つのパラメータの間のマハラノビス距離を小さくすることは、カルバックライブラー情報量による最適化と同等の意味合いであることがわかる。

　情報処理システム１における目的は、データセットDで学習されるパラメータw_Dを、最尤パラメータw_Sで最もよく近似するサブセットSを提供することといえる。ここからは、モデルは判別モデルとしての回帰モデルを扱うものとして、データの予測分布が次の式（１３）のように分解できる場合を考える。

　一方、サブセットの予測分布は、入力分布だけが変更され、以下の式（１４）のようになる。

　このとき、D、Sのwに対するフィッシャー情報行列は、それぞれ、次の式（１５）及び式（１６）で表される。

　モデルは回帰モデルを扱う場合には、例えば式（９）に示す前述の情報ゲインが次の式（１７）のように変更される。

　一方、サブセットSで求めた最尤パラメータw_Sの平均、分散・共分散は次の式（１８）及び式（１９）のように計算される。

　したがって、最尤パラメータの誤差による情報量ゲインの期待値は、次の式（２０）で与えられる。

　ここで、サブセットの最適化を、より厳密に、サブセットのサンプル一つあたりの情報量ゲインの期待値を考えるとすると、次の式（２１）に示すような目的関数の最小化の問題と捉えることができる。

　一方、データセットと、サブセットは、それぞれ以下の式（２２）及び式（２３）で表されるものとする。

　ここでは、入出力x,yがセットになっているデータセットで説明しているが、出力側がないデータ、つまり、ラベルなしデータであっても良い。

　バイナリ変数b_iを、x_iがSに含まれていれば1、そうでなければ0となる変数とする。すると、フィッシャー情報行列J_p(w)、J_q(w)は、以下の式（２４）及び式（２５）のように置き換えることができる。

　ただし、Mは、以下の式（２６）であり、Vは、式（２７）であるものとする。

　また、H_i(w)は、データがラベルありデータかラベルなしデータかのいずれであるかで異なる。例えばデータがラベルありデータの場合は、H_i(w)を以下の式（２８）のように定義する。

　また、例えばデータがラベルなしデータの場合は、以下の式（２９）のように定義する。

　サブセットの最適化の問題は、次の式（３０）に示すようなバイナリ変数による損失関数の最小化と置き換えられる。

　この損失関数の最小化、すなわち再サンプリングによる情報量の最大化を実現するバイナリ変数が見つかれば、バイナリ変数が1であるようなデータだけを再サンプリングすれば良い。この最適化のマイナーなバリエーションとして制約条件を追加する例が考えられる。

　制約条件の一例は、できるだけ効率よく再サンプリングするというものである。この場合は、以下の式（３１）のように再サンプリングする個数をペナルティ項として損失関数に追加する。

　ここで、係数γ₁は、再サンプリングの最適化と再サンプリングの効率のトレードオフを調整するパラメータである。係数γ₁の値が大きくなると、再サンプリングは効率的になるが、再サンプリングしたサブセットの最尤パラメータは元の最尤パラメータからずれた値になる。

　また、他の一例として考えられるのは、再サンプリングの個数に既定を設けるものである。この場合は、以下の式（３２）のように再サンプリングする個数と既定の個数の二乗誤差をペナルティ項として損失関数に追加する。

　係数γ₂は、再サンプリングの最適化と再サンプリングの個数制約のトレードオフを調整するパラメータがであるが、通常は個数制約を優先するため、この値は大きめに設定する。

　ここで、例えば式（３１）または式（３２）等の上述の目的関数は、w,bと二つの変数がある。サブセットを決める変数bについての最適化は必須である。これは量子アニーリングを始めとする最適化マシン１０等の特別なアクセラレータで求めるものとする。

　一方、wについては、最適化するかどうかは、ユースケースによって異なる。例えば、現行のモデルの中で最適なデータセットが必要なだけであれば、この値は固定しても良い。このような例として考えられるのは、例えば、遺伝子の分析において、特定の発現に対する新規のパターンを探索して、検証するのが目的の場合である。このような、場合、新規の遺伝子パターンの発現の分析の効率化が目的であるから、必ずしもモデルの更新は必要ではない。

　なお、例えばモデルも更新しながら最適なデータセットを得たい場合は、情報処理システム１は、次の手続きを交互に繰り返す。wはサブセットSから最尤推定したパラメータw_Sを用い、bはL(w_S,b)を最小化するパラメータを求める。以上を繰り返すと、情報処理システム１は、サブセットSを得られるのみならず、データセット全体で学習する場合よりも簡単に、パラメータwを得ることができる。

［３－３．リサンプリング最適化の量子アニーリング等への実装］
　次に、リサンプリング最適化の量子アニーリング等への実装について説明する。情報処理システム１においては、最適なサブセットのリサンプリングのために最小化したい目的関数は次の式（３３）のように与えられる。

　ただし、第二項C(b)は、制約を実現するためのペナルティ項で、例えば、以下の式（３４）及び式（３５）等である。

　ここで、量子アニーリングマシンといったイジングマシン等の最適化マシン１０で実装するには、この目的関数をbの二次形式、すなわち、ＱＵＢＯの形式にすることが必要である。しかし、第一項は、二次形式にはなっていない。そこで、パラメータ数次元の正方行列で表わされる補助変数Ξを用意して、次の式（３６）のような目的関数を考える。

　ここで、λの値が十分大きければ、以下の式（３７）に示すような制約が成り立つことになり、元の目的関数の最適化に帰着される。

　この制約と、サンプリングの最適化を同時に実現するため、b、Ξを同時に（交互）最適化する。なお、前述したように、wはユースケースに応じて最適化するが、必須ではない。補助変数Ξの最適化は、w、bを固定して次の式（３８）に示すような微分係数が0になるΞを求めれば良い。

　ただし、次の式（３９）のように置き換えをしている。

　この方程式の解は、H(b,w)の逆行列が存在するならば以下の式（４０）で表される。

　上述した点について、以下にアルゴリズムを記載する。ここで示すアルゴリズムは、情報処理システム１により実行され、例えば以下のような処理（１－１）～（１－４）を行うアルゴリズムとなっている。

（１－１）：パラメータwと変数Ξを一つ決める。
（１－２）：量子アニーリングマシン（ＱＰＵ：Quantum　Processing　Unit）等を用いて、wとΞを固定して、bをb^*で更新する。
（１－３）：通常の演算装置（ＣＰＵやＧＰＵ）を用いて、
　　　　　（ア）bからサブセットSを求め、
　　　　　（イ）サブセットSから最尤パラメータw_Sを求め、w=w_Sとする（省略可）。
　　　　　（ウ）bとw=w_Sを固定して、ΞをΞ^*で更新する。
（１－４）：（１－２）及び（１－３）を、所定の終了条件を満たすまで繰り返す。

　例えば、上述のアルゴリズムにおける初期値はランダムに決定してもよい。なお、初期値のとり方は、上記に限らず、様々なとり方が考えられる。

［４．第３の実施例］
　ここから、第３の実施例として、第２の実施例に対してさらなる近似及びモデルの限定を行い、よりシンプルに実装する例を説明する。

　まず、フィッシャー情報行列J_p(w)に関しては、前述したように次の式（４１）に示すような関係が成り立つ。

　ただし、l_w(x,y)は、以下の式（４２）である。

　このとき、最適化の目的関数は次の式（４３）のように変形できる。

　不等式は、J_q(w,b)が正定値行列（固有値が全て正の値を取る行列）であることと、相加平均（固有値の平均）と調和平均（固有値の逆数（逆行列の固有値）の平均の逆数）の不等式から求まる。式（４３）における不等号中の等号が成立するのは、J_q(w,b)の固有値がすべて1の場合である。また、式（４３）における不等式の右辺は、目的関数の上界なので、この上界を改めて目的関数とみなすと、以下の式（４４）に示すL_UB(w,b)が、目的関数となる。

　式（４３）における不等式により目的関数の最小値は、この上界の最小値よりは低いことが保証されている。そこで、以下では、この上界L_UB(w,b)に、いくつかの具体的なモデルを当てはめて、それぞれの実装方法を書き下す。具体的には、回帰モデル、二クラス分類モデル、及び多クラス（Kクラス）分類モデルでの実装方法を示す。

［４－１．回帰モデル］
　まず、回帰モデルの場合について説明する。回帰モデルでは、モデルとして、分散を1に規格化した次の式（４５）に示すような正規分布モデルを考える。

　なお、この例では、線形モデルになっているが、xを例えば、深層学習ニューラルネットの最終レイヤへの入力特徴量として、非線形モデルを扱うこともできる。このモデルでは、以下の式（４６）及び式（４７）に示すような関係が得られる。

　式（４６）及び式（４７）を用いると目的関数は次の式（４８）のようになる。

　ただし、パラメータa_ijは、以下の式（４９）のように定義している。

　量子アニーリング等の最適化マシン１０で最適化を実行するには、この目的関数がbの二次形式になっていればよい。この問題は次のようなペナルティ項を追加することで、以下の式（５０）に示すような二次形式に変形できる。ペナルティ項が０になるとき、式（４８）と一致することが容易に確認できる。

　もし、サブセットのサイズをMと指定したい場合には、次の式（５１）のようにしてもよい。

　この目的関数には、最適化したい変数がbのほかに連続変数ξもある。ただし、ξについては、二次式であるから通常の計算機を使った計算で容易に最適値が求まる。例えば、情報処理装置１００は、以下の式（５２）及び式（５３）を用いてξの最適値を求める。

　例えば、情報処理システム１は、ξを固定してbを量子アニーリング等の最適化マシン１０により最適化したら、今度はbを固定してξを通常の計算アルゴリズムで情報処理装置１００により更新し、これらの最適化を交互に繰り返す。

　上述した点について、以下にアルゴリズムを記載する。ここで示すアルゴリズムは、情報処理システム１により実行され、例えば以下のような処理（２－１）～（２－４）を行うアルゴリズムとなっている。
（２－１）：パラメータwと変数ξを一つ決める。
（２－２）：量子アニーリングマシン（ＱＰＵ）等を用いて、wとξを固定して、bをb^*で更新する。
（２－３）：通常の演算装置（ＣＰＵやＧＰＵ）を用いて、
　　　　　（ア）bからサブセットSを求め、
　　　　　（イ）サブセットSから最尤パラメータw_Sを求め、w=w_Sとする（ユースケースにより省略可）。
　　　　　（ウ）bとw=w_Sを固定して最適パラメータξ^*を求め、ξをξ^*で更新する。
（２－４）：（２－２）、（２－３）を、所定の終了条件を満たすまで繰り返す。

［４－２．二クラス分類モデル］
　次に、二クラス分類モデルの場合について説明する。例えば、以下の式（５４）を用いて、モデルとして、二クラス分類に用いられるロジスティック回帰を考える。

　ラベル無しデータセットの場合は次の式（５５）及び式（５６）が得られる。

　以上から次の式（５７）を得る。

　ここで、以下の式（５８）のように変数や係数を置き換える。

　すると、目的関数はバイナリ変数セットbを用いて以下の式（５９）のように書ける。

　式（５９）に示す目的関数は次の式（６０）に示すようにペナルティ項を追加することで、bの二次形式に変形できる。

　サブセットのサイズをMに指定するには、次の式（６１）のようにしてもよい。

　いずれの場合であっても、ξ_iが、次の式（６２）の条件を満たしていれば、元の問題と等価になる。

　回帰モデルと同様、ξは量子アニーリング等の最適化マシン１０では最適化されないため、通常の計算アルゴリズムを用いて情報処理装置１００により最適化する。なお、この二クラス分類の定式化では、係数a_ijの算出方法は異なるが、これらの係数を使った目的関数は、回帰モデルと全く同じなので、アルゴリズムの詳細な説明は省略する。

［４－３．多クラス分類モデル］
　次に、多クラス分類モデの場合について説明する。例えば、以下の式（６３）を用いて、モデルとして、Kクラス分類に用いられるソフトマックス関数を考える。

　ここで、s(x)を以下の式（６４）のK次元ベクトル、uをすべての成分が１のK次元ベクトル、e_kをk番目の成分のみが1で、他が0のK次元ベクトルとする。

　すると、以下の式（６５）及び式（６６）に示す関係が得られる。

　ここでは、式（６５）及び式（６６）中の上記の数（６７）に示す記号は直積を表している。式（６５）及び式（６６）を用いると目的関数は次の式（６８）のようになる。

　ただし、以下の式（６９）のように変数や係数を置き換えた。

　この問題は次の式（７０）のようなペナルティ項を追加することで、二次形式に変形できる。

　Mを指定したサイズにするには、次の式（７１）のようにしてもよい。

　この目的関数には、最適化したい変数がbのほかに連続変数ξもある。ξは量子アニーリング等の最適化マシン１０では最適化されないため、通常の計算アルゴリズムを用いて情報処理装置１００により最適化する。導出については、回帰モデルや二クラス分類の方法とほぼ同じなので、詳細な説明は省略する。

［５．第４の実施例］
　ここから、第４の実施例として、第２の実施例及び第３の実施例の計算過程を踏まえて、データ選択最適化の処理フローとそのプログラム例を説明する。

　まず、情報処理装置１００によるデータ選択最適化の処理フローは以下のような処理（３－１）～（３－４）となっている。
（３－１）：ユーザから学習したい予測モデルのファイルを受け取る。
（３－２）：システムがもつ大規模データセットをサーバ上で扱える状態にする。
（３－３）：もしユーザからのデータがあればそれもマージして使えるようにする。
（３－４）：マージされたデータセットから最適なサブセットをリサンプリングする。

［５－１．情報処理のメインプログラム例］
　上記処理（３－１）～（３－４）は、プログラムではメインプログラムに相当する。メインプログラムでは、まず、ユーザが学習したい機能を実現する関数モジュールを展開する。続いて、システムが保持するデータセットをユーザが指定する条件の下でメモリ上に展開する。また、ユーザからのデータセットがあれば、システムのデータセットとマージする。最後に、モデルとデータセットからデータセットの最適リサンプリングを行い、サブセットを生成する。

　例えば、メインプログラムは、図７に示すプログラムＰＧ１となる。図７は、情報処理のメインプログラム一例を示す図である。例えば、プログラムＰＧ１の１行目の関数「model　=　load_model()」は、学習したい機能の読み取りを行う関数である。例えば、プログラムＰＧ１の２行目の関数「dataset　=　load_dataset()」は、データセットの読み取りを行う関数である。

　例えば、プログラムＰＧ１の３行目の関数「userdata　=　load_userdata()」は、ユーザデータの読み取りを行う関数である。例えば、プログラムＰＧ１の４行目の処理「dataset　=　dataset　+　userdata」は、データセットとユーザデータのマージを行う処理である。例えば、プログラムＰＧ１の５行目の関数「subset　=　resample_optimal_subset(model,　dataset)」は、サブセットのリサンプリングを行う関数である。

　続いて、リサンプリング処理を行う関数における処理の一例の説明をする。
（４－１）：ランダムにバイナリ変数bを生成する。
（４－２）：バイナリ変数bを元にして、データセットDからサブセットSを生成する。
（４－３）：入力されたモジュールmとサブセットSを用いて、モジュールmに関する最尤パラメータw_Sの推定を行う。
（４－４）：バイナリ変数bとモジュールのパラメータwを固定して、問題をＱＵＢＯ形式にするための補助変数（まとめてXと記載する）を計算する。
（４－５）：パラメータwと補助変数Xを用いて、ＱＵＢＯの（二次の）係数行列qを算出する。
（４－６）：ＱＵＢＯの係数行列qを量子アニーリングマシン等の最適化マシン１０に送信し、最適化されたバイナリ変数bを受け取る。
（４－７）：（４－２）から（４－６）を所定の終了条件まで繰り返した後、サブセットSを出力する。
　なお、（４－１）におけるバイナリ変数bの初期値の設定についてはランダムに限られない。例えば、バイナリ変数bの初期値は、データ数の指定がある場合、その指定された数を満たした数のデータを選択するように設定されてもよい。

［５－２．データ選択最適化の処理フロー例］
　次に、図８を用いて、データ選択最適化の処理フローについて説明する。図８は、データ選択最適化の処理の手順を示すフローチャートである。図８は、情報処理システム１によるデータ選択最適化の処理のフローの例である。以下では、情報処理装置１００を処理主体とする場合を一例として示すが、処理主体は、情報処理装置１００に限らず、情報処理システム１に含まれるいずれの装置であってもよい。

　図８に示すように、情報処理装置１００は、ユーザデータとデータセットを入力する（ステップＳ１０１）。例えば、情報処理装置１００は、端末装置２０からユーザデータを取得し、データベース５０からデータセットを取得する。

　情報処理装置１００は、データ組合せに対する情報量の二次形式行列を取得する（ステップＳ１０２）。例えば、情報処理装置１００は、目的関数から情報量の二次形式行列を抽出する。

　情報処理装置１００は、係数行列を組合せ最適化マシンに送信する（ステップＳ１０３）。例えば、情報処理装置１００は、係数行列をイジングパラメータとして、ユーザにより選択された最適化マシン１０に送信する。

　情報処理装置１００は、組合せ最適化マシンから最適化解を受信する（ステップＳ１０４）。例えば、情報処理装置１００は、イジングパラメータを送信した最適化マシン１０から、最適化マシン１０が計算した解を最適化解として受信する。このように、情報処理システム１は、組合せ最適化マシンである最適化マシン１０により最適化された組合せを得る。

　情報処理装置１００は、所定の終了条件を満たすかどうかを判定する（ステップＳ１０５）。例えば、終了条件としては、処理回数が閾値に達すること等であってもよい。このように、図８に一例を示す繰り返しアルゴリズムでは、終了条件は、繰り返し数が一定以上に到達したこととする。なお、終了条件は、繰り返し数に関するものに限らず、例えばエネルギー関数の繰り返しステップによる更新幅が一定以下になること等の収束に関する条件であってもよい。なお、この繰り返しアルゴリズムは必ず、一ステップでエネルギーが減るとは限らないので、最小エネルギーを達成するたびに、そのときのパラメータ等を記憶する構成にしてもよい。この場合、情報処理装置１００は、終了条件を満たした時に最小エネルギーのパラメータとして記憶していたパラメータを、ユーザに提供してもよい。

　情報処理装置１００は、所定の終了条件を満していない場合（ステップＳ１０５：Ｎｏ）、ステップＳ１０２に戻って処理を繰り返す。このように、交互最適化であるため、情報処理装置１００は帰還処理が行う。

　情報処理装置１００は、所定の終了条件を満たす場合（ステップＳ１０５：Ｙｅｓ）、提供するデータを選択する（ステップＳ１０６）。例えば、情報処理装置１００は、所定の終了条件を満たす場合、データセットからサブセットを選択する。そして、情報処理装置１００は、選択したデータセットを出力する（ステップＳ１０７）。例えば、情報処理装置１００は、選択したサブセットをデータセットとして、ユーザに提供する。

［５－３．データ選択最適化の処理プログラム例］
　ここで、図９を用いて上述した処理に対応するプログラムの一例を説明する。図９は、データ選択最適化の処理プログラムの一例を示す図である。プログラムＰＧ２に示す関数「resample_optimal_subset(model,　dataset)」は、図７中の５行目に示すサブセットのリサンプリングの関数であり、subsetを出力する関数に対応する。例えば、図９に示すプログラムＰＧ２は、図８に示した処理をプログラム例として表したものである。図９に示すプログラムＰＧ２は、図８に示した処理と同様であるため、詳細な説明は省略する。

　例えば、プログラムＰＧ２の６行目の関数「ｗ　=　maximum_likelihood(model,　subset)」は、サブセットを用いて、モデルパラメータを更新する処理を行う関数である。例えば、プログラムＰＧ２の７行目の関数「hessians　=　calc_hessaians(w,　dataset)」は、モデルパラメータから情報量を計算する処理である。例えば、プログラムＰＧ２の８行目の関数「x　=　calc_additional_variables(hessians,　b)」は、二次形式になっていない式を二次形式にするための補助変数を用意する処理である。例えば、プログラムＰＧ２の９行目の関数「q　=　calc_qubo_coefficients(hessians,　x)」は、二次形式からイジング係数を抽出する関数である。例えば、プログラムＰＧ２の１０行目の関数「b_=　machine.get_optimul(q)」は、ＱＵＢＯの係数行列qを入力として、バイナリ変数bを出力する関数である。

　例えば、情報処理装置１００は、図７、図９に示すようなプログラム（関数）及び、各プログラムにより呼び出されるプログラム（関数）を関数情報記憶部１２２（図１０参照）に記憶し、各プログラムを用いて処理を実行する。

　上述したように、情報処理装置１００は、モデルのタスクに応じて決定される情報量に関する目的関数から、係数行列を最適化マシン１０へ送信するイジングパラメータとして抽出する。例えば、情報処理装置１００は、上述したプログラム等を利用して係数行列を抽出する。例えば、係数行列は、目的関数から抽出される最適化したい変数の一次以上の項に係る係数で構成される配列である。そして、情報処理装置１００は、抽出した係数行列を用いて、最適化マシン１０のスピン間結合定数や局所磁場に設定する。情報処理装置１００は、抽出した係数行列を最適化マシン１０に送信する。そして、最適化マシン１０は、アニーリング処理を行い、イジングモデルの基底スピンの組合せを算出し、情報処理装置１００に送信する。情報処理装置１００は、最適化マシン１０が算出したイジングモデルの基底スピンの組合せを、計算結果として受信し、受領した計算結果に基づいてデータセットからサブセットを選択する。

［６．情報処理装置の構成］
　次に、情報処理装置１００の構成について説明する。図１０は、本開示の情報処理装置の構成例を示す図である。

　図１０に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

　通信部１１０は、例えば、ＮＩＣ（Network　Interface　Card）等によって実現される。そして、通信部１１０は、所定のネットワーク（図示省略）と有線または無線で接続され、最適化マシン１０や端末装置２０やデータベース５０等との間で情報の送受信を行う。また、通信部１１０は、ユーザが利用するユーザ端末（図示省略）との間で情報の送受信を行ってもよい。

　記憶部１２０は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。第１の実施例に係る記憶部１２０は、図１０に示すように、データ記憶部１２１と、関数情報記憶部１２２とを有する。

　データ記憶部１２１は、端末装置２０やデータベース５０から受信したデータ等の各種データを記憶する。関数情報記憶部１２２は、各種のプログラム等の関数の情報を記憶する。例えば、関数情報記憶部１２２は、本開示に係る情報処理に用いる各種の関数（プログラム）の情報を記憶する。例えば、関数情報記憶部１２２は、プログラムＰＧ１、ＰＧ２等の関数プログラムを記憶する。また、関数情報記憶部１２２は、上述した式のうち処理に用いる関数の情報を記憶してもよい。なお、記憶部１２０は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

　制御部１３０は、例えば、ＣＰＵやＭＰＵ（Micro　Processing　Unit）等によって、情報処理装置１００内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム等）がＲＡＭ（Random　Access　Memory）等を作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ等の集積回路により実現される。

　図１０に示すように、制御部１３０は、取得部１３１と、最適化係数抽出部１３２と、最適化マシン通信部１３３と、データセット選択部１３４と、出力部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図１０に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　取得部１３１は、データ読み取り部１３１ａ及びユーザデータ入力部１３１ｂの機能を有する。取得部１３１は、各種情報を取得する。取得部１３１は、記憶部１２０に記憶された情報を取得する。取得部１３１は、データセットを取得する。

　取得部１３１は、学習するモデルに対応するタスクを取得する。例えば、取得部１３１は、ユーザが利用する端末装置２０からユーザが学習したいモデルを示す情報を取得する。取得部１３１は、ユーザが利用する端末装置２０からユーザが学習したいモデルのタスクを示す情報を取得する。例えば、取得部１３１は、記憶部１２０から学習するモデルに対応するタスクを取得する。取得部１３１は、ユーザが学習したいモデルの情報を取得する。例えば、取得部１３１は、各モデルにタスクが対応付けて記憶された記憶部１２０から、ユーザが学習したいモデルに対応するタスクを示す情報を取得する。

　取得部１３１は、モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報を取得する。例えば、取得部１３１は、モデルの学習に用いるデータ数に関する指定情報を取得する。例えば、取得部１３１は、ユーザが利用する端末装置２０からモデルの学習に用いるデータの数を指定する指定情報を取得する。例えば、取得部１３１は、サブセットとして選択するデータの数を指定する指定情報を、ユーザが利用する端末装置２０から取得する。

　例えば、取得部１３１は、ユーザがデータの数を指定しない場合、できる限り少ない数のデータを選択することを指定する指定情報を取得する。例えば、取得部１３１は、ユーザがデータの数を指定しない場合、所定の数（例えば初期設定数）を指定する指定情報を取得する。例えば、取得部１３１は、ユーザがデータの数を指定しない場合、記憶部１２０に記憶された所定の数（例えば初期設定数）を指定する指定情報を取得する。

　取得部１３１は、通信部１１０を介して各種情報を受信する。取得部１３１は、外部の情報処理装置から各種情報を受信する。取得部１３１は、端末装置２０やデータベース５０からデータを受信する。

　最適化係数抽出部１３２は、情報の抽出処理を行う抽出部である。最適化係数抽出部１３２は、目的関数から最適化マシン１０の入力に対応する係数行列を抽出する。最適化係数抽出部１３２は、係数行列を抽出する。最適化係数抽出部１３２は、目的関数からイジング係数に対応する係数行列を抽出する。最適化係数抽出部１３２は、タスクに応じた情報ゲインを示す目的関数から係数行列を抽出する。最適化係数抽出部１３２は、カルバックライブラー情報量に関する目的関数から係数行列を抽出する。最適化係数抽出部１３２は、イジングモデルのエネルギー関数として表現される目的関数から係数行列を抽出する。最適化係数抽出部１３２は、ＱＵＢＯ形式で表現される目的関数から係数行列を抽出する。例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルが回帰モデルであり、データの数の指定がない場合、式（５０）に示すような目的関数から係数行列を抽出する。また、最適化係数抽出部１３２は、ユーザが学習したいモデルが回帰モデルであり、データの数の指定がある場合、式（５１）に示すような目的関数から係数行列を抽出する。

　例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルが二クラス分類モデルであり、データの数の指定がない場合、式（６０）に示すような目的関数から係数行列を抽出する。また、最適化係数抽出部１３２は、ユーザが学習したいモデルが二クラス分類モデルであり、データの数の指定がある場合、式（６１）に示すような目的関数から係数行列を抽出する。例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルが多クラス分類モデルであり、データの数の指定がない場合、式（７０）に示すような目的関数から係数行列を抽出する。また、最適化係数抽出部１３２は、ユーザが学習したいモデルが多クラス分類モデルであり、データの数の指定がある場合、式（７１）に示すような目的関数から係数行列を抽出する。なお、最適化係数抽出部１３２は、ユーザが学習したいモデルに対応するパラメータを抽出してもよい。例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルから目的関数に設定するパラメータwを抽出する。例えば、最適化係数抽出部１３２は、記憶部１２０から学習するモデルに対応するパラメータを取得する。例えば、最適化係数抽出部１３２は、各モデルにパラメータが対応付けて記憶された記憶部１２０から、ユーザが学習したいモデルに対応するパラメータを示す情報を取得する。

　最適化係数抽出部１３２は、最適化マシン通信部１３３が最適化マシン１０から受信した計算結果を基にパラメータの最適化を行う。例えば、最適化係数抽出部１３２は、最適化マシン１０により最適化されるパラメータ以外のパラメータの最適化を行う。例えば、最適化係数抽出部１３２は、最適化マシン１０の計算結果を基にバイナリ変数b_iがを固定し、ξを通常の計算アルゴリズムで更新する。例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルが回帰モデルである場合、式（５２）及び式（５３）を用いてξの最適値を算出する。例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルが二クラス分類モデルである場合、式（６２）等を用いてξの最適値を算出する。例えば、最適化係数抽出部１３２は、ユーザが学習したいモデルが多クラス分類モデルである場合も同様にξの最適値を算出する。

　最適化マシン通信部１３３は、通信部１１０を介して最適化マシン１０と通信し、最適化マシン１０との間で情報を送受信する。最適化マシン通信部１３３は、最適化マシン１０に計算の実行を指示する。最適化マシン通信部１３３は、最適化マシン１０にイジングモデルのパラメータを送信する。最適化マシン通信部１３３は、最適化マシン１０にイジングモデルのパラメータを送信することにより、最適化マシン１０に計算の実行を指示する。最適化マシン通信部１３３は、組合せ最適化計算を行う最適化マシン１０に、最適化係数抽出部１３２により抽出された係数行列を送信する。

　最適化マシン通信部１３３は、最適化マシン１０から各種情報を受信する。最適化マシン通信部１３３は、最適化マシン１０の計算結果を最適化マシン１０から受信する。

　最適化マシン通信部１３３は、組合せ最適化計算を行う最適化マシン１０に目的関数に対応する係数行列を送信する。最適化マシン通信部１３３は、最適化マシン１０から組合せ最適化計算の計算結果を受信する。最適化マシン通信部１３３は、組合せ最適化計算後の変数を示す計算結果を最適化マシン１０から受信する。最適化マシン通信部１３３は、各々がデータに対応するバイナリ変数に関する計算結果を最適化マシン１０から受信する。

　最適化マシン通信部１３３は、量子コンピュータ、または組合せ最適化アクセラレータである最適化マシン１０に係数行列を送信する。最適化マシン通信部１３３は、複数の最適化マシン１０のうち、ユーザにより選択された最適化マシン１０に係数行列を送信する。

　データセット選択部１３４は、データセット等のサンプルセットの選択処理を行う選択部である。データセット選択部１３４は、タスクに応じて決定される情報量に関する目的関数と、指定情報を用いて決定される数とに基づいて、データセットから、モデルの学習に用いるサブセットを選択する。データセット選択部１３４は、モデルにもたらされる情報エントロピーを示す目的関数を最適化するように、サンプルセットを選択する。データセット選択部１３４は、タスクに応じた情報ゲインを示す目的関数に基づいて、サブセットを選択する。

　データセット選択部１３４は、カルバックライブラー情報量に関する目的関数に基づいて、サブセットを選択する。データセット選択部１３４は、イジングモデルのエネルギー関数として表現される目的関数に基づいて、サブセットを選択する。データセット選択部１３４は、ＱＵＢＯ形式で表現される目的関数に基づいて、サブセットを選択する。データセット選択部１３４は、最適化マシン１０から取得された最適化マシン１０の計算結果に基づいて、サブセットを選択する。

　例えば、データセット選択部１３４は、最適化マシン１０の計算結果に基づいて、そのデータに対応するバイナリ変数b_iが1であるデータをサブセットに追加するデータとして選択する。また、データセット選択部１３４は、最適化マシン１０の計算結果に基づいて、そのデータに対応するバイナリ変数b_iが0であるデータをサブセットに追加しない。このように、データセット選択部１３４は、最適化マシン１０の計算結果に基づくバイナリ変数b_iが値に応じて、バイナリ変数b_iが1であるデータからなるサブセットを生成する。

　出力部１３５は、情報の出力処理を行う。出力部１３５は、データセット選択部１３４により選択されたサンプルに関する情報を出力する。例えば、出力部１３５は、サブセットに関する情報を出力する。出力部１３５は、通信部１１０を介して各種情報を送信する。出力部１３５は、サンプルセットを送信する。出力部１３５は、サブセットをサンプルセットとしてユーザが利用する端末装置２０へ送信する。

　また、出力部１３５は、サブセット等のサンプルセットを用いて学習された学習済みモデルをユーザが利用する端末装置２０へ送信してもよい。この場合、情報処理装置１００は、モデルを学習する学習部を有してもよい。情報処理装置１００の学習部は、サブセットを用いて学習済みモデルを学習する。

　また、情報処理装置１００は、サブセットを用いて学習された学習済みモデルを、モデルを学習する学習処理を実行する外部装置（「学習装置」とする）から取得してもよい。この場合、情報処理装置１００は、サブセットを学習装置へ送信し、学習装置が学習処理により学習した学習済みモデルを学習装置から受信してもよい。そして、情報処理装置１００は、学習装置から受信した学習済みモデルを端末装置２０へ送信する。

　情報処理装置１００は、コンテンツＣＴ１等の各種コンテンツを生成するコンテンツ生成部を有してもよい。コンテンツ生成部は、端末装置２０に提供するコンテンツを生成する。コンテンツ生成部は、Ｊａｖａ（登録商標）等の種々の技術を適宜用いて、コンテンツを生成する。なお、コンテンツ生成部は、ＣＳＳやＪａｖａＳｃｒｉｐｔ（登録商標）やＨＴＭＬの形式に基づいて、コンテンツＣＴ１等を生成してもよい。また、例えば、コンテンツ生成部は、ＪＰＥＧ（Joint　Photographic　Experts　Group）やＧＩＦ（Graphics　Interchange　Format）やＰＮＧ（Portable　Network　Graphics）等様々な形式でコンテンツＣＴ１等を生成してもよい。

［７．最適化マシンの構成］
　次に、計算を実行する最適化マシン１０の構成について説明する。図１１は、最適化マシンの構成例を示す図である。図１１の例では、最適化マシン１０の一例として、量子コンピュータである最適化マシン１０ａの構成を説明する。

　図１１に示すように、最適化マシン１０ａは、通信部１１と、記憶部１２と、量子デバイス部１３と、制御部１４とを有する。なお、最適化マシン１０ａは、最適化マシン１０ａの管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

　通信部１１は、例えば、ＮＩＣや通信回路等によって実現される。通信部１１は、所定のネットワーク（インターネット等）と有線又は無線で接続され、ネットワークを介して、情報処理装置１００等の他の装置等との間で情報の送受信を行う。

　記憶部１２は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１２は、情報の表示に用いる各種情報を記憶する。

　量子デバイス部１３は、種々の量子計算を実行する。例えば、量子デバイス部１３は、量子処理ユニット（ＱＰＵ：Quantum　Processing　Unit）により実現される。量子デバイス部１３は、例えば、情報処理装置１００等の他の装置から受け付けたイジングモデルのパラメータに基づいて、そのイジングモデルの基底状態を実現する。言い換えれば、量子デバイス部１３は、イジングモデルが基底エネルギー状態となる最適スピン配置を実現する。すなわち、量子デバイス部１３は、最適化問題を最適化した状態を実現する。

　量子デバイス部１３は、例えば、複数の量子ビットから構成される。量子デバイス部１３は、予め絶対零度付近まで冷却される。量子デバイス部１３は、量子デバイス部１３にイジングモデルのパラメータが入力された後、内部でイジングモデルと横磁場モデル（量子ゆらぎモデル）の比率を時間発展させる。これにより、量子デバイス部１３上で、イジングモデルのパラメータに応じた最適なスピン配置が実現する。このように、量子デバイス部１３上でイジングモデルの最適なスピン配置が物理的に実現される。そして、量子デバイス部１３が測定されることにより、イジングモデルの最適なスピン配置を得ることができる。これにより、量子デバイス部１３は、離散最適化問題を最適化することができる。例えば、量子デバイス部１３は、二値二次形式の目的関数の最適化問題を最適化することができる。

　制御部１４は、例えば、ＣＰＵやＭＰＵ等によって、最適化マシン１０ａ内部に記憶されたプログラムがＲＡＭ等を作業領域として実行されることにより実現される。また、制御部１４は、コントローラであり、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現されてもよい。

　図１１に示すように、制御部１４は、取得部１４１と、計算部１４２と、送信部１４３とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１４の内部構成は、図１１に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　取得部１４１は、各種情報を受信する。取得部１４１は、外部の情報処理装置から各種情報を受信する。取得部１４１は、情報処理装置１００等の他の情報処理装置から各種情報を受信する。

　取得部１４１は、例えば量子デバイス部１３を用いた計算を行い、測定するための指示を情報処理装置１００等の他の情報処理装置から受け付ける。取得部１４１は、イジングモデルのパラメータを量子デバイス部１３による計算（測定）の指示として受け付ける。

　取得部１４１は、各種の情報を取得する。取得部１４１は、記憶部１２から情報を取得する。取得部１４１は、情報処理装置１００等の外部の情報処理装置から各種の情報を取得する。取得部１４１は、入力部により受け付けられた入力情報を取得する。取得部１４１は、例えば、外部の情報処理装置からイジングモデルのパラメータに関する情報を取得する。取得部１４１は、計算部１４２による量子デバイス部１３の測定結果（計算結果）を取得する。

　例えば、取得部１４１は、プログラムＰＧ２の関数「q　=　calc_qubo_coefficients(hessians,　x)」の処理結果であるＱＵＢＯの係数行列qを情報処理装置１００から受信する。

　計算部１４２は、各種計算を実行する。計算部１４２は、量子デバイス部１３を用いた計算を実行する。計算部１４２は、量子デバイス部１３を測定する。計算部１４２は、イジングモデルの最適スピン配置が実現された量子デバイス部１３を測定する。

　例えば、計算部１４２は、情報処理装置１００から取得部１４１が受信したイジングパラメータを用いて、計算を実行する。

　送信部１４３は、外部の情報処理装置へ各種情報を送信する。例えば、送信部１４３は、情報処理装置１００等の他の情報処理装置へ各種情報を送信する。送信部１４３は、記憶部１２に記憶された情報を送信する。

　送信部１４３は、情報処理装置１００等の他の情報処理装置からの情報に基づいて、各種情報を送信する。送信部１４３は、記憶部１２に記憶された情報に基づいて、各種情報を送信する。

　送信部１４３は、計算部１４２による量子デバイス部１３の測定結果を、計算の指示を行った装置に送信する。送信部１４３は、計算部１４２による量子デバイス部１３の測定結果を、パラメータの送信元に送信する。送信部１４３は、計算部１４２による量子デバイス部１３の測定結果を、計算の要求元に送信する。送信部１４３は、計算部１４２による量子デバイス部１３の測定結果を、情報処理装置１００等の他の情報処理装置に送信する。

　例えば、図１の例では、送信部１４３は、情報処理装置１００から受信したパラメータを用いて計算（測定）したイジングスピンの値を情報処理装置１００へ送信する。

［８．ユーザへの提示例］
　ここで、情報処理システム１において各種情報のユーザへの提示例について、以下説明する。例えば、情報処理装置１００は、端末装置２０からリクエストに応じて、様々な情報を端末装置２０へ提供する。

［８－１．クラスのリスト］
　例えば、情報処理装置１００が扱っているクラス、タスクのデータセットを端末装置２０が要求した場合、情報処理装置１００は、扱っているクラスのリストを開示してもよい。情報処理装置１００は、図１２に示すようなコンテンツＣＴ２を端末装置２０に提供してもよい。図１２は、クラスのリストの一例を示す図である。図１２に示すコンテンツＣＴ２は、「ねずみ」、「うし」、「とら」、「たつ」等の複数のクラスの各々のサンプル画像のリストを示す。

［８－２．クラスの選択］
　例えば、情報処理装置１００は、端末装置２０からユーザが学習したいクラスの選択を受け付けてもよい。情報処理装置１００は、図１３に示すようなコンテンツＣＴ３を端末装置２０に提供し、コンテンツＣＴ３を介してユーザのクラスの選択を受け付けてもよい。図１３は、ユーザが学習したいクラスの選択の一例を示す図である。図１３に示すコンテンツＣＴ３は、「ねずみ」に対応するクラスＣＬ１、「うし」に対応するクラスＣＬ２等に対するユーザの選択を受け付けるためのコンテンツである。情報処理装置１００は、ユーザが選択したクラスのどれかであるかを示す情報を端末装置２０から受信する。例えば、ユーザは、すべて既知のクラスならば、リクエストタイプを「すべて既知」としてもよい。

［８－３．データの受付け］
　なお、情報処理装置１００は、扱っていないクラス、タスクに適した（ネガティブ）データを端末装置２０に要求してもよい。情報処理装置１００は、端末装置２０が扱いたいクラス、タスクのデータを端末装置２０から受け付ける。情報処理装置１００は、図１４に示すようなコンテンツＣＴ４を端末装置２０に提供し、コンテンツＣＴ４を介してユーザからデータを受け付けてもよい。図１４は、ユーザからのデータの受付けの一例を示す図である。図１４に示すコンテンツＣＴ４は、クラス「ニッコウキスゲ」のデータを受け付ける場合の一例を示す。

　なお、情報処理装置１００は、クラスやデータセットと類似するクラスがないか確認し、似ているものがある場合は、ユーザに通知を行ってもよい。例えば、情報処理装置１００は、クラスに似ているものがある場合は、「このクラスではないですか」とのメッセージをユーザが利用する端末装置２０に送信してもよい。端末装置２０は、受信したメッセージを出力する。そして、情報処理装置１００は、クラスが新規であることが確認できたら、実際の最適学習データ選択処理に移ってもよい。

［９．適用例］
　上述した情報処理システム１は、例えば特定ドメインの種別分類等の種々の用途に利用されてもよい。この点について、以下いくつか例示を示す。なお、情報処理システム１を適用する対象は、以下に示す例に限られない。

［９－１．第５の実施例（画像分類）］
　ここから、情報処理システム１の適用例を示す第５の実施例として、動物の属に関する属内外の二クラス判別に情報処理システム１が適用された場合について説明する。なお、第５の実施例では、動物の属に関する属内外の二クラス判別の例であるが、前述のように、他クラス分類を用いた動物の種類のクラス分類であってもよい。さらに、動物ではなく、高山植物の画像分類であってもよい。データは必ずしも画像である必要はなく、音声によるものであってもよい。例えば、セミの鳴き声分類や野鳥の鳴き声による分類であってもよい。他に回帰問題の例としては、不動産の価格分類であってもよい。

　例えば、ドメインを横断して無作為に選んだ多数のクラスを大雑把に分類するより、特定ドメインで網羅的に選んだクラスを正確に分類したい場合がある。例えば、前者は、イメージネット分類等の機械学習業界向けであり、後者はビジネス、個人ユーザ向けの考え方である。また、ビジネスの例としては、例えば図鑑等のＷｅｂサービス等が挙げられる。また、個人ユーザ向けの例としては、例えば、野鳥の写真や音声を集めて、オリジナルの認識モジュールを作りたい一般ユーザ等が挙げられる。

　第５の実施例における目的は、動物分類図におけるマカク属の画像分類を行うマカク属画像分類器（以下単に「分類器」ともいう）の生成であるものとする。ただし、分類器にマカク属以外が入力されたらマカク属でないと正確に判定することも望まれているものとする。

　第５の実施例における前提条件としては、以下のような点があるものとする。
・入力されるのは、オナガザル科だけとする
・マカク属はどのクラスも、十分な数の画像を収集済み
・マカク属以外のオナガザル科のデータは全くない
・クライアント側で学習できるので、サーバからはデータセットだけ欲しい
・サーバ側には、動物界分類図の全クラスのデータが多数格納済み
・サーバ側には、汎用の画像特徴抽出器がある

　ここから、図１５を用いて、第５の実施例の実施構成の一例を説明する。図１５は、情報処理システムを適用した第５の実施例を示す図である。なお、上述した内容と同様の点については適宜説明を省略する。まず、図１５に示す各構成要素について説明する。

　動物系統データセット５０－１は、動物の画像データセットである。動物系統データセット５０－１は、上述したデータベース５０に対応する。例えば、動物系統データセット５０－１は、動物界の全クラスについて、各々１００枚の画像を用意した巨大データセットである。

　オナガザル科読み取り部１３１ａ－１は、オナガザル科のデータを取得する機能を有する。オナガザル科読み取り部１３１ａ－１は、上述したデータ読み取り部１３１ａに対応する。例えば、オナガザル科読み取り部１３１ａ－１は、オナガザル科の全クラスの全データを読み取るモジュールである。オナガザル科読み取り部１３１ａ－１は、動物系統データセット５０－１からオナガザル科のデータを取得する。例えば、オナガザル科読み取り部１３１ａ－１は、図１５中の第１対象群ＴＧ１に示すように、オナガザル属、ヒヒ属、マカク属、コロブス属、テングザル属、ラングール属等、オナガザル科に属する各属の画像データを取得する。

　マカク属画像入力部１３１ｂ－１は、マカク属のデータを取得する機能を有する。マカク属画像入力部１３１ｂ－１は、上述したユーザデータ入力部１３１ｂに対応する。例えば、マカク属画像入力部１３１ｂ－１は、クライアント（「ユーザ」ともいう）側が用意したマカク属全クラスについて、各々１００枚のデータセットを取得する。例えば、マカク属画像入力部１３１ｂ－１は、図１５中の第２対象群ＴＧ２に示すように、マカク属に属する複数のクラスの各々の画像データを取得する。

　データセットマージ部２３１は、オナガザル科画像（マカク属以外）と、入力されたマカク属画像をマージする機能を有する。データセットマージ部２３１は、オナガザル科読み取り部１３１ａ－１により取得された第１画像群と、マカク属画像入力部１３１ｂ－１により取得された第２画像群とをマージして、第３画像群を生成する。

　組合せ最適実行部２３２は、マージデータに基づいて組合せ最適化の処理を実行する機能を有する。組合せ最適実行部２３２は、最適化係数抽出部１３２及び最適化マシン通信部１３３に対応する。組合せ最適実行部２３２は、係数行列を抽出し、抽出した係数行列を最適化マシン１０へ送信し、最適化マシン１０から計算結果を受信する。

　図１５のデータセット選択部１３４は、上述したデータセット選択部１３４に対応する。データセット選択部１３４は、組合せ最適実行部２３２による組合せ最適化の処理の結果を基に最適なデータを選択する機能を有する。データセット選択部１３４は、組合せ最適実行部２３２による組合せ最適化の処理の結果を基に、マージデータからサブセットを選択する。

　非マカク属画像出力部１３５－１は、オナガザル科セットから選ばれた非マカク属のデータセットを出力する機能を有する。非マカク属画像出力部１３５－１は、上述した出力部１３５に対応する。例えば、非マカク属画像出力部１３５－１は、選択されたサブセットのうち、マカク属以外のデータを出力する。例えば、非マカク属画像出力部１３５－１は、選択されたサブセットのうち、第１画像群に含まれる画像データを、マカク属以外の画像データとして出力する。

　最適化マシン１０は、上述した最適化マシン１０に対応する。最適化マシン１０は、組合せ最適実行部２３２で作られた係数行列（ＱＵＢＯ行列）を入力し、組合せ結果を出力する。

　次に、図１６を用いて、処理フローの一例について説明する。図１６は、第５の実施例における処理の手順を示すフローチャートである。図１６は、情報処理システム１による第５の実施例における処理のフローの例である。以下では、情報処理装置１００を処理主体とする場合を一例として示すが、処理主体は、情報処理装置１００に限らず、情報処理システム１に含まれるいずれの装置であってもよい。

　図１６に示すように、情報処理装置１００は、クライアントからデータを受け取る（ステップＳ２０１）。例えば、情報処理装置１００は、ユーザが利用する端末装置２０からデータを取得する。例えば、情報処理装置１００は、クライアントから様々な情報を受け取る。例えば、情報処理装置１００は、オナガザル科等、データが欲しいドメインを示す情報を取得する。また、例えば、情報処理装置１００は、マカク属内のクラス等、既にクライアント側にあるクラスを示す情報を取得する。また、例えば、情報処理装置１００は、既にクライアント側にあるデータセットを取得する。

　情報処理装置１００は、データベースからデータを集める（ステップＳ２０２）。例えば、情報処理装置１００は、動物系統データセット５０－１等のデータベース５０から必要なデータを取得する。例えば、情報処理装置１００は、動物画像セット等を有するデータベース５０から必要なデータを集めてくる。また、例えば、情報処理装置１００は、クライアントが指定したドメイン（オナガザル科）のうち、マカク属内のクラス等のポジティブクラスを除くデータセットを取得する。

　情報処理装置１００は、集めたデータから最適化マシンへの入力を算出する（ステップＳ２０３）。例えば、情報処理装置１００は、集めたデータから最適化マシン１０への入力として、係数行列を算出する。

　情報処理装置１００は、最適化マシンの出力に基づいてサブセットを生成する（ステップＳ２０４）。例えば、情報処理装置１００は、係数行列を最適化マシン１０に送信し、最適化マシン１０から最適化マシン１０が計算した計算結果を受信する。例えば、情報処理装置１００は、最適化マシン１０の計算結果に基づいて、集めたデータからサブセットを選択する。このように、情報処理装置１００は、データセットから最適なサブセットを選択する。最適なサブセットは定性的には、例えば入力データに類似し、互いに類似しないデータの組合せである。

　例えば、情報処理装置１００は、以下の手順でサブセットを選択する。まず、情報処理装置１００は、データセットから既存の特徴抽出器で特徴量セットを生成する。そして、情報処理装置１００は、特徴セットから最適化マシン１０への入力データを生成する。ここで、入力データは、例えば、情報量ゲインの二値二次形式定式化における係数行列である。そして、情報処理装置１００は、最適化マシン１０から情報量ゲイン最大化するデータ組合せを示す情報を取得する。情報処理装置１００は、取得した組合せを示す情報に基づいて、サブセットを選択する。

　情報処理装置１００は、クライアントにサブセットを提供する（ステップＳ２０５）。例えば、情報処理装置１００は、サブセットをクライアント側に提示する。例えば、情報処理装置１００は、サブセットを、ユーザが利用する端末装置２０へ送信する。

　上述した第５の実施例における処理に基づく全体シナリオとしては以下のようになる。

　クライアントは、分類したいクラスのデータを集める。例えば、クライアントは、マカク属のいくつかの種別の画像データを収集する。

　また、クライアントは、クラスのデータを情報処理装置１００に送り、クラス外データ提供を要求する。クライアントは、情報処理装置１００が提示しているブラウザ等からドメイン（オナガザル科）を指定する。クライアントは、提供されたいクラスの代わりに収集したクラス（マカク属内の種別等）を指定する。

　そして、クライアントは、クラス外データを受け取る。例えば、ユーザが利用する端末装置２０は、情報処理装置１００からデータを受信する。クライアントは、クラス外データも利用し、クラス内外の判別器を獲得する。クライアントは、収集したクラスデータと提供されたクラス外データで判別器を学習する。例えば、ユーザが利用する端末装置２０は、自装置で有するデータ、及び情報処理装置１００から受信したデータを用いて、判別器（モデル）を学習する。

　そして、クライアントは、学習した判別器を、収集したクラスデータで学習したクラス分類器と組合せて使えるようにする。例えば、ユーザが利用する端末装置２０は、判別器を用いて、画像がマカク属の画像であるかを判別する処理である第１処理を行い、第１処理でマカク属と判別された画像については、分類器を用いて、画像に含まれるマカク属の種別が何であるかを分類する処理である第２処理を行う。

　この点について、図１７を用いて説明する。図１７は、画像判定処理の流れを示す図である。以下では、端末装置２０を処理主体とする場合を一例として示すが、処理主体は、端末装置２０に限らず、情報処理システム１に含まれるいずれの装置であってもよい。

　まず、端末装置２０は、処理対象となる画像ＩＭ１がマカク属の画像であるかを判別する処理を行う（ステップＳ３０１）。例えば、端末装置２０は、画像ＩＭ１を判別器に入力し、判別器の出力結果を基に、画像ＩＭ１がマカク属の画像であるかを判別する。

　第１処理で画像ＩＭ１がマカク属の画像ではないと判定した場合、端末装置２０は、第２処理を行うことなく処理を終了する。例えば、第１処理で画像ＩＭ１がマカク属の画像ではないと判定した場合、端末装置２０は、マカク属ではないことを示す結果ＲＳ１を出力して処理を終了する。

　一方で、第１処理で画像ＩＭ１がマカク属の画像であると判定した場合、端末装置２０は、画像ＩＭ１に含まれる物体がマカク属の中のなにかを分類する処理を行う（ステップＳ３０２）。例えば、端末装置２０は、画像ＩＭ１を分類器に入力し、分類器の出力結果を基に、画像ＩＭ１に含まれる物体がマカク属の中のなにかを分類する。図１７では、端末装置２０は、画像ＩＭ１に含まれる物体がマカク属の中のニホンザルであることを示す結果ＲＳ２を出力して処理を終了する。

［９－２．第６の実施例（生体分子）］
　例えば、機械学習のラベリングを様々な科学実験の計測評価と捉えると、多数ある調査対象のどのサンプルから評価すべきかの指針がわかる能動学習による効率アップの意義は大きい。

　例えば、半導体のバンドギャップは、半導体の様々な機能の特性を決める重要な物理量である。しかし、その計測には、機械学習のラベリングと同様に、その分野の専門家による手間と時間のコストがかかるため、計測対象のサンプルはできるだけ効率よく選ぶことが望まれている。同様に、磁性体の磁化率、誘電体の誘電率等もそれぞれの機能の特性を決める重要な物理量であるが、その計測には特別の計測器が必要である。無機化合物ならず有機化合物等による機能材料でも当てはまる。

　そこで、以下では、情報処理システム１の適用例を示す第６の実施例として、生体分子、特に遺伝子検査の例を説明する。

　まず、生体分子というと普通、タンパク質や、ＲＮＡ（Ribonucleic　Acid；リボ核酸）、ＤＮＡ（Deoxyribonucleic　Acid；デオキシリボ核酸）等が挙げられる。いずれの生体分子も、基本的な分子構造の一次元配列で構成される高分子であり、それぞれの生体分子に基づく生物のマクロな様々な機能は、その一次元配列の決められた領域における配列パターンによって決まることが知られている。

　また、タンパク質は、生物の体、構造を構成するための基本的な生体分子として知られる。タンパク質の種類は世の中には膨大にあるが、いずれも、二十（二十一）種類のアミノ酸を数千から数億の長さで一次元配列的に並べたものであり、この配列の所定の領域のパターンに応じた固有な機能をもつ多数のタンパク質が知られている。

　タンパク質のもつ固有な機能とは、例えば、酵素を活性化する（酵素）、生体構造を形成する（例えばコラーゲンやケラチン）、脂質やコレステロール等を運搬する（例えばアルブミン、アポリポタンパク質）、栄養やイオンを貯蔵する（例えばオボアルブミン、フェリチン、ヘモジデリン）、筋肉を構成して運動に関与する（例えばアクチン、ミオシン）、抗体と呼ばれる免疫機能に関与する（例えばグロブリン）、ＤＮＡの情報に基づいてタンパク質を合成する発現機能に関与したり、他のタンパク質の働きを調整したりするする（例えばカルモジュリン）等である。

　同様に、ＲＮＡ（リボ核酸）やＤＮＡ（デオキシリボ核酸）、遺伝子の実態となる生体分子として知られているが、その中身はタンパク質を合成するための情報を一次元配列上にコードした生体分子である。ＲＮＡ、ＤＮＡもタンパク質と同様に、基本的な単位の配列となって、いずれも、デオキシリボース（五炭糖）に核酸と四種類の塩基（アデニン（A）、グアニン（G）、シトシン（C）、チミン（T））のいずれかがが結合して構成されるデオキシヌクレオチドが一次元配列的に並んだ高分子である。

　ＲＮＡやＤＮＡは、タンパク質同様、その配列（コード）のパターンに応じた固有な機能を持っている。ＤＮＡやＲＮＡの基本的な機能は自己複製（転写）や、タンパク質の合成であるが、転写や合成のより詳細な機能（ブロック）では、例えば、メッセンジャＲＮＡにおけるタンパク質合成のための翻訳機能や、プロモータＤＮＡによる転写活性の機能等が挙げられる。

　これらの機能は、半導体の例等と同様に、特定の情報の計測によって確認することができる。たとえば、タンパク質配列情報に対する抗体結合の親和性情報の情報は平衡乖離度、酵素活性度の情報は酵素活性速度の計測によって確認する。また、遺伝子配列情報に対する生物の形質発現にかかわる情報（メッセンジャＲＮＡは翻訳効率で、プロモータＤＮＡの転写効率の計測、これらは、いずれもデータベース（遺伝子や分子のデータセット）を構築する観点でみると、ラベリングとみなせる。

　タンパク質やＲＮＡ、ＤＮＡは膨大な配列の組合せ中の特定の場所におけるパターンが所望の機能を有することは明らかになっているが、一方、必ずしもどのような機能をもたらすことになっているのかわからない箇所もかなりある。

　特に、ＤＮＡの場合、配列を情報ストレージとして見たてて、そのフォーマットが、コード領域と、非コード領域の２つのパートが混在した構成をしていると捉えるとわかりやすい。コード領域は、生成されるタンパク質や、あるいは、その結果としての生物の形質の情報との対応が明らかになっている領域である。また、非コード領域は、生成するタンパク質や発現する生物の形質との関係が明確ではなく、一見、遺伝情報に無関係な領域であると考えられていた領域である。

　従来、非コード領域は、遺伝情報との相関が低くあまり調査が進んでいなかった。しかし、昨今、ＤＮＡ等では、コード領域以外からの情報を積極的に解析してその機能の解析に利用しようという考えが進んでいる。

　例えば、ある種の神経難病は、異常タンパク質（αシスクレイン、レビー小体等）の脳細胞への蓄積が原因とされる。この異常タンパク質と関係があるとされる領域は、家族性（遺伝性）の場合の例等から知られているが、家族性（遺伝性）ではない孤発タイプの場合には、どの領域が関与しているか明確ではない。

　そこで、例えば、既知の関係領域から、探索領域を拡大しながら、同じ機能（異常タンパク質の合成）に関与している新規の配列領域や、パターンを探したり、あるいは、異常タンパク質の合成と相関がある別の機能を見つけたりすることが進められる。

　このように新規のパターンや新規の機能の発見を目的として、非コード領域の解析が進んでいる一方、非コード領域は、コード領域と同様に膨大な組合せが考えられるため、適切な探索が必要である。

　そこで、情報処理システム１は、これらのタンパク質やＲＮＡ、ＤＮＡからそれぞれの持っている機能に固有な新たな配列パターンを効率良く探索し、また、探索したパターンから新たな機能を発見することに用いることができる。

　以下、まず、配列パターンの効率の良い探索を説明し、続いて、探索したパターンから新たな機能を発見する手順を説明する。

（手順＃１．統計予測モデルに用いるデータセットの収集）
　まず、手順＃１について説明する。情報処理システム１では、新たな情報をデータセットから獲得するため、予測モデルを活用している。ここでいう予測モデルとは、生体分子の配列パターンを入力すると、その配列パターンがその機能を持っている予測値、あるいは、確率分布のスコアを出力する。例えば、前述の神経難病の例であれば、異常タンパク質の合成に関与する配列パターンに該当するかの予測モデル（判別モデル）ある。このような予測モデルを構築するためには、まず、配列パターンと機能の予測値等の対応関係のデータセットが必要である。このデータセットは、多数の配列パターンについて、それぞれ、予測したい機能に関する情報を計測することで構築する。あるいは、既知のデータベースから機能の情報を元に逆引きして求めてもよい。

（手順＃２．機械学習による統計予測モデルの学習）
　次に手順＃２について説明する。手順＃１に続いて、情報処理システム１では、パラメータつきの予測モデルを設計して、そのパラメータを機械学習技術で求める。代表的な予測モデルは、ニューラルネットであり、深層学習でパラメータを求めることができる。

　予測したい機能がどのようなものかで、予測モデルの設計は異なるが、大雑把にまとめると以下のような設計方針となる。
・入力層は、配列パターンの情報を入力できる構成をしている。
・中間層は、開発者の設定に基づき構成される。
・出力層は、予測したい機能に合わせて構成する。

　以下の出力周りに関する設計指針（ａ）～（ｃ）は共通である。

　設計指針（ａ）は、以下のような方針である。

　設計指針（ａ）では、機能の評価値が連続値ならば最終層を線形層にする。評価値が連続値の場合は、回帰モデルによる予測モデルを採用する。ニューラルネットの予測モデルの場合、最終層（出力層）に線形層を用いる。出力層を線形層にすることで、第３の実施例で説明したような回帰モデルを使うことができる。連続値の予測値そのものだけではなく、その標準偏差や分散等も予測したい場合は、変分オートコーダを用いて、平均予測値と分散予測値を出すように構成してもよい。回帰モデルでは、二乗誤差を最小化するような学習を行う。変分オートエンコーダでは、分散（共分散は含まないことが多い）を考慮した対数尤度の下界を最大化するように学習を行う。

　設計指針（ｂ）は、以下のような方針である。

　機能の評価値が有無等の二クラス、例えば、機能の評価をある特性の有無で評価したい場合等がある。このような場合は、二クラス分類が適切である。二クラス分類は、第３の実施例で説明したように、最終層にロジスティック回帰関数を有する線形層を用いる。ロジスティック回帰関数は、任意の入力に対して、0から1の間の値を出力する関数である。この構造を、0から1の確率を近似しているものとして、そのエントロピー、すなわちロジスティックエントロピーを最小化するように学習する。

　設計指針（ｃ）は、以下のような方針である。

　機能の評価値が多クラス、すなわち機能が多数の特性のどれかがあてはまるという場合等では、多クラス分類のためのモデルの適用を考える。多クラス分類では、第３の実施例で説明したように、最終層にソフトマックス関数を有する線形層を用いる。ソフトマックス関数は、任意の入力に対して、出力は起こりうるクラスのいずれかのスコアであるが、これらのスコアは全てのスコアを足すと1になるように規格化されている。この構造は、多クラス分類における多クラスの確率値とみなせるように学習されることができる。学習は、ソフトマックスエントロピーを最小化するように行われる。

　以上は、一般的によく使われるニューラルネットの予測モデルの出力層の設計方法である。

（手順＃３．情報処理システム１による最適なサンプルの選択）
　次に手順＃３について説明する。上述の手順により、予測モデルが構築できたので、以降が第６の実施例における情報処理システム１の主な適用範囲である。第６の実施例によれば、予測モデルにとって、最も曖昧なデータ空間上の領域、すなわち、検証すると得られる情報量が最も大きい領域を、示すことができる。あるいは、そのサンプル情報を提供することができる。また、第６の実施例によれば、複数のサンプルを同時に提供することができ、そのサンプルは、情報量が多くなるように、互いに類似していないサンプル同士が選ばれる。

　以上のように、第６の実施例では、膨大な領域の中から適切なサンプルを選ぶ指針として、情報量を大きくする指針を採用している。

　しかし、情報量を大きくする指針が定まっただけでは、膨大な探索領域の探索効率を高めたことにはならない。第６の実施例の場合、この膨大な探索領域の探索は、劣モジュラ最大化という探索問題に含まれることがわかっているため、その汎用的な近似方法として貪欲法が一般的である。貪欲法は、膨大な探索領域を効率よく探索する方法で計算時間の爆発がおこりにくい。そのため、この方法で、適切なサンプルを選べば、効率よく適切なサンプルを選べる。しかし、貪欲法は、汎用的かつ高速であるが、より良い近似があればそれを採用したい。

　第６の実施例では、理想的な条件（断熱近似が満たされる条件）では最適解にたどり着くことが保証されている、量子アニーリングを利用して膨大な探索領域を狭める。その方法、定式化に関しては、第１の実施例～第４の実施例で説明したとおりである。なお、量子アニーリング以外にも、最適解にただ降り着くことが保証されている例として熱アニーリングのシミュレーション（シミュレーテッドアニーリング）等もある。

　以上を用いることで、膨大なサンプルから、現在の予測モデルの状態に適した最適なサンプルを選ぶことができる。

（手順＃４．選択されたサンプルの解析）
　次に手順＃４について説明する。最後に、選択されたサンプルに関する解析を行う。もともとの目的は、サンプルの機能の有無の判別、あるいは、機能のカテゴリへの分類、あるいは、機能の程度の定量化である。

　これらの実験を、全てのサンプルに対して行わずに、選択されたサンプルだけで解析するのが最も効率が良い。これは、全てのサンプルの中で、計測しなくても、機能に関する情報が予測モデルだけで高い信頼性で予測できるものや、あるいは、計測しても、その領域の情報が少ないために，機能に関する情報との関連、規則性が導けないものは、あまり検証しても効果がないことを表している。

　予測モデル、すなわち、既に解析した知識からみて、適度に曖昧なため、もたらされる情報量が多いサンプルから、評価することで効率のよいデータセットの構築が実現されている。最後に、このサンプルの中から、あらたな、配列パターンを見出す（特に非コード領域から）あるいは、これらの配列パターンに共通の新機能を見出すことで、予測モデルのみならず、研究者自身も知識を効率的に拡大していくことができる。

［１０．その他の構成例等］
　上述した実施形態や変形例に係る処理は、上記実施形態や変形例以外にも種々の異なる形態（変形例）にて実施されてよい。なお、上述した例において、サブセットを選択する母集団となるデータセットを「第１データセット」と読み替え、第１データセットから選択されるサブセットを「第２データセット」と読み替えてもよい。

［１０－１．その他の構成例］
　なお、上記の例では、情報処理装置１００と、最適化マシン１０とが別体である場合を示したが、情報処理装置１００と最適化マシン１０とは一体であってもよい。例えば、最適化マシン１０が超伝導を使わずデジタル回路で実現された場合、最適化マシン１０はエッジ側に配置されてもよい。例えば、イジングモデルを用いた計算がエッジ側で行われる場合、情報処理装置１００と最適化マシン１０とが一体であってもよい。

［１０－２．プログラムやパラメータ等の処理に用いる情報の生成方法］
　上述した情報処理やパラメータ等を生成する方法が提供されてもよい。また、上述した最適化マシン１０が計算を実行する際に用いるプログラムを生成する方法が提供されてもよい。

［１０－３．その他］
　また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

［１１．本開示に係る効果］
　上記のように、本開示に係る情報処理装置（例えば実施形態では情報処理装置１００に対応）は、取得部（例えば実施形態では取得部１３１に対応）と、選択部（例えば、実施形態ではデータセット選択部１３４に対応）とを備える。取得部は、データ供給方法と、学習したいモデルと、モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得する。選択部は、モデルに応じて決定される情報エントロピーと、指定情報とに基づいて、データセットから、モデルの学習に用いるサンプルセットを選択する。

　このように、情報処理装置は、学習したいモデルに応じて決定される目的関数と指定情報とに基づいて、データセットからサンプルセットを選択する。これにより、情報処理装置は、データセットから適切なサンプルセットを選択することができる。

　データ供給方法は、データセットからのデータ供給であって、サンプルセットはデータセットのサブセットである。このように、情報処理装置は、データセットからのデータ供給を受け、データセットのサブセットをサンプルセットとして選択することで、データセットから適切なサンプルセットを選択することができる。

　学習したいモデルは、学習パラメータ付きの予測モデルであって、モデルのタスクとは、入力に対応する出力の種別である。このように、情報処理装置は、学習パラメータ付きの予測モデルを、学習したいモデルとして、サンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、モデルにもたらされる情報エントロピーは、カルバック・ライブラー情報量（「カルバックライブラー情報量」と記載する場合もある）、または、フィッシャー情報量を用いて算出される情報エントロピーである。このように、情報処理装置は、カルバックライブラー情報量、または、フィッシャー情報量を用いて算出される情報エントロピーであるに基づいて、データセットからサンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、選択部は、モデルにもたらされる情報エントロピーを示す目的関数を最適化するように、サンプルセットを選択する。このように、情報処理装置は、情報エントロピーを示す目的関数を最適化するように、サンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、選択部は、ＱＵＢＯ（Quadratic　Unconstrained　Binary　Optimization）形式で表現される目的関数に基づいて、サンプルセットを選択する。このように、情報処理装置は、ＱＵＢＯ形式で表現される目的関数に基づいて、データセットからサンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、情報処理装置は、最適化マシン通信部（例えば、実施形態では最適化マシン通信部１３３に対応）を備える。最適化マシン通信部は、組合せ最適化計算を行う最適化マシン（例えば、実施形態では最適化マシン１０に対応）に目的関数に対応する係数行列を送信し、最適化マシンから組合せ最適化計算の計算結果を受信する。選択部は、計算結果に基づいて、サンプルセットを選択する。このように、情報処理装置は、最適化マシンによる計算結果を用いてゲインを示す目的関数に基づいて、データセットからサンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、最適化マシン通信部は、組合せ最適化計算後の変数を示す計算結果を最適化マシンから受信する。このように、情報処理装置は、最適化マシンから受信した組合せ最適化計算後の変数を用いて、データセットからサンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、最適化マシン通信部は、各々がデータに対応するバイナリ変数に関する計算結果を最適化マシンから受信する。このように、情報処理装置は、最適化マシンから受信した最適化されたバイナリ変数を用いて、データセットからサンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、最適化マシン通信部は、量子コンピュータ、または組合せ最適化アクセラレータに係数行列を送信する。このように、情報処理装置は、量子コンピュータ、または組合せ最適化アクセラレータによる計算結果を用いて、データセットからサンプルセットを選択することで、データセットから適切なサンプルセットを選択することができる。

　また、最適化マシン通信部は、複数の最適化マシンのうち、ユーザにより選択された最適化マシンに係数行列を送信する。このように、情報処理装置は、複数の最適化マシンのうち、ユーザにより選択された最適化マシンに係数行列を送信することで、ユーザの選択に応じたサンプルセットを選択することができるため、データセットから適切なサンプルセットを選択することができる。

　また、情報処理装置は、抽出部（例えば、実施形態では最適化係数抽出部１３２に対応）を備える。抽出部は、係数行列を抽出する。最適化マシン通信部は、抽出部により抽出された係数行列を最適化マシンに送信する。このように、情報処理装置は、抽出した係数行列を最適化マシンに送信することで、最適化マシンから適切な計算結果を受信することができ、データセットから適切なサンプルセットを選択することができる。

　また、抽出部は、目的関数からイジング係数に対応する係数行列を抽出する。このように、情報処理装置は、目的関数から抽出したイジング係数に対応する係数行列を最適化マシンに送信することで、最適化マシンから適切な計算結果を受信することができ、データセットから適切なサンプルセットを選択することができる。

　また、取得部は、ユーザが学習したい予測モデルであるモデルを取得する。このように、情報処理装置は、ユーザが学習したい予測モデルを対象として、データセットから適切なサンプルセットを選択することができる。

　また、情報処理装置は、出力部（例えば、実施形態では出力部１３５に対応）を備える。出力部は、選択部により選択されたサンプルセットに関する情報を出力する。このように、情報処理装置は、選択されたサンプルセットに関する情報を出力することにより、選択したサンプルセットに応じて適切な情報提供を行うことができる。

　また、出力部は、サンプルセットをユーザが利用する端末装置（例えば、実施形態では端末装置２０に対応）へ送信する。このように、情報処理装置は、サンプルセットをユーザが利用する端末装置へ送信することで、選択したサンプルセットをユーザに提供することができる。

　また、出力部は、サンプルセットを用いて学習された学習済みモデルをユーザが利用する端末装置へ送信する。このように、情報処理装置は、サンプルセットを用いて学習された学習済みモデルをユーザが利用する端末装置へ送信することで、適切に学習されたモデルをユーザに提供することができる。

［１２．ハードウェア構成］
　上述してきた各実施形態や変形例に係る情報処理装置１００等の情報機器は、例えば図１８に示すような構成のコンピュータ１０００によって実現される。図１８は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。以下、情報処理装置１００を例に挙げて説明する。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read　Only　Memory）１３００、ＨＤＤ（Hard　Disk　Drive）１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る情報処理プログラム等の情報処理プログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされた情報処理プログラム等の情報処理プログラムを実行することにより、制御部１３０等の機能を実現する。また、ＨＤＤ１４００には、本開示に係る情報処理プログラム等の情報処理プログラムや、記憶部１２０内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得する取得部と、
　前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する選択部と、
　を備える情報処理装置。
（２）
　前記データ供給方法は、前記データセットからのデータ供給であって、前記サンプルセットは前記データセットのサブセットである
　（１）に記載の情報処理装置。
（３）
　前記学習したいモデルは、学習パラメータ付きの予測モデルであって、前記モデルのタスクとは、入力に対応する出力の種別である、
　（１）または（２）に記載の情報処理装置。
（４）
　前記モデルにもたらされる情報エントロピーは、カルバック・ライブラー情報量、または、フィッシャー情報量を用いて算出される情報エントロピーである、
　（１）～（３）のいずれか１つに記載の情報処理装置。
（５）
　前記選択部は、
　前記モデルにもたらされる情報エントロピーを示す目的関数を最適化するように、前記サンプルセットを選択する
　（１）～（４）のいずれか１つに記載の情報処理装置。
（６）
　前記選択部は、
　ＱＵＢＯ（Quadratic　Unconstrained　Binary　Optimization）形式で表現される前記目的関数に基づいて、前記サンプルセットを選択する
　（５）に記載の情報処理装置。
（７）
　組合せ最適化計算を行う最適化マシンに前記目的関数に対応する係数行列を送信し、前記最適化マシンから前記組合せ最適化計算の計算結果を受信する最適化マシン通信部、
　を備え、
　前記選択部は、
　前記計算結果に基づいて、前記サンプルセットを選択する
　（５）または（６）に記載の情報処理装置。
（８）
　前記最適化マシン通信部は、
　前記組合せ最適化計算後の変数を示す前記計算結果を前記最適化マシンから受信する
　（７）に記載の情報処理装置。
（９）
　前記最適化マシン通信部は、
　各々がデータに対応するバイナリ変数に関する前記計算結果を前記最適化マシンから受信する
　（８）に記載の情報処理装置。
（１０）
　前記最適化マシン通信部は、
　量子コンピュータ、または組合せ最適化アクセラレータに前記係数行列を送信する
　（７）～（９）のいずれか１つに記載の情報処理装置。
（１１）
　前記最適化マシン通信部は、
　複数の最適化マシンのうち、ユーザにより選択された前記最適化マシンに前記係数行列を送信する
　（７）～（１０）のいずれか１つに記載の情報処理装置。
（１２）
　前記係数行列を抽出する抽出部、
　を備え、
　前記最適化マシン通信部は、
　前記抽出部により抽出された前記係数行列を前記最適化マシンに送信する
　（７）～（１１）のいずれか１つに記載の情報処理装置。
（１３）
　前記抽出部は、
　前記目的関数からイジング係数に対応する前記係数行列を抽出する
　（１２）に記載の情報処理装置。
（１４）
　前記取得部は、
　ユーザが学習したい予測モデルである前記モデルを取得する
　（１）～（１３）のいずれか１つに記載の情報処理装置。
（１５）
　前記選択部により選択された前記サンプルセットに関する情報を出力する出力部、
　を備える
　（１）～（１４）のいずれか１つに記載の情報処理装置。
（１６）
　前記出力部は、
　前記サンプルセットをユーザが利用する端末装置へ送信する
　（１５）に記載の情報処理装置。
（１７）
　前記出力部は、
　前記サンプルセットを用いて学習された学習済みモデルをユーザが利用する端末装置へ送信する
　（１５）または（１６）に記載の情報処理装置。
（１８）
　データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得し、
　前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する
　処理を実行する情報処理方法。
（１９）
　データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得し、
　前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する
　処理を実行させる情報処理プログラム。

　１　情報処理システム
　１００　情報処理装置
　１１０　通信部
　１２０　記憶部
　１２１　データ記憶部
　１２２　関数情報記憶部
　１３０　制御部
　１３１　取得部
　１３２　最適化係数抽出部
　１３３　最適化マシン通信部
　１３４　データセット選択部
　１３５　出力部
　１０　最適化マシン
　１１　通信部
　１２　記憶部
　１３　量子デバイス部
　１４　制御部
　１４１　取得部
　１４２　計算部
　１４３　送信部
　２０　端末装置
　５０　データベース

Claims

　データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得する取得部と、
　前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する選択部と、
　を備える情報処理装置。
　前記データ供給方法は、前記データセットからのデータ供給であって、前記サンプルセットは前記データセットのサブセットである
　請求項１に記載の情報処理装置。
　前記学習したいモデルは、学習パラメータ付きの予測モデルであって、前記モデルのタスクとは、入力に対応する出力の種別である、
　請求項１に記載の情報処理装置。
　前記モデルにもたらされる情報エントロピーは、カルバック・ライブラー情報量、または、フィッシャー情報量を用いて算出される情報エントロピーである、
　請求項１に記載の情報処理装置。
　前記選択部は、
　前記モデルにもたらされる情報エントロピーを示す目的関数を最適化するように、前記サンプルセットを選択する
　請求項１に記載の情報処理装置。
　前記選択部は、
　ＱＵＢＯ（Quadratic　Unconstrained　Binary　Optimization）形式で表現される前記目的関数に基づいて、前記サンプルセットを選択する
　請求項５に記載の情報処理装置。
　組合せ最適化計算を行う最適化マシンに前記目的関数に対応する係数行列を送信し、前記最適化マシンから前記組合せ最適化計算の計算結果を受信する最適化マシン通信部、
　を備え、
　前記選択部は、
　前記計算結果に基づいて、前記サンプルセットを選択する
　請求項５に記載の情報処理装置。
　前記最適化マシン通信部は、
　前記組合せ最適化計算後の変数を示す前記計算結果を前記最適化マシンから受信する
　請求項７に記載の情報処理装置。
　前記最適化マシン通信部は、
　各々がデータに対応するバイナリ変数に関する前記計算結果を前記最適化マシンから受信する
　請求項８に記載の情報処理装置。
　前記最適化マシン通信部は、
　量子コンピュータ、または組合せ最適化アクセラレータに前記係数行列を送信する
　請求項７に記載の情報処理装置。
　前記最適化マシン通信部は、
　複数の最適化マシンのうち、ユーザにより選択された前記最適化マシンに前記係数行列を送信する
　請求項７に記載の情報処理装置。
　前記係数行列を抽出する抽出部、
　を備え、
　前記最適化マシン通信部は、
　前記抽出部により抽出された前記係数行列を前記最適化マシンに送信する
　請求項７に記載の情報処理装置。
　前記抽出部は、
　前記目的関数から前記最適化マシンの入力に対応する前記係数行列を抽出する
　請求項１２に記載の情報処理装置。
　前記取得部は、
　ユーザが学習したい予測モデルである前記モデルを取得する
　請求項１に記載の情報処理装置。
　前記選択部により選択された前記サンプルセットに関する情報を出力する出力部、
　を備える
　請求項１に記載の情報処理装置。
　前記出力部は、
　前記サンプルセットをユーザが利用する端末装置へ送信する
　請求項１５に記載の情報処理装置。
　前記出力部は、
　前記サンプルセットを用いて学習された学習済みモデルをユーザが利用する端末装置へ送信する
　請求項１５に記載の情報処理装置。
　データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得し、
　前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する
　処理を実行する情報処理方法。
　データ供給方法と、学習したいモデルと、前記モデルの学習に用いるサンプルセットのサイズとカテゴリに関する指定情報とを取得し、
　前記モデルに応じて決定される情報エントロピーと、前記指定情報とに基づいて、データセットから、前記モデルの学習に用いるサンプルセットを選択する
　処理を実行させる情報処理プログラム。