WO2021074990A1

WO2021074990A1 - 検索装置、検索方法、検索プログラム及び学習モデル検索システム

Info

Publication number: WO2021074990A1
Application number: PCT/JP2019/040614
Authority: WO
Inventors: 郁海森
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2021-04-22
Anticipated expiration: 2022-04-16
Also published as: EP4033417A1; CN114503131A; EP4033417A4; JPWO2021074990A1; US20220179912A1; JP6991412B2

Abstract

検索装置（１０）は、転移元装置（２０）における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第１データを取得する。また、検索装置（１０）は、転移先装置（３０）における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第２データを取得する。検索装置（１０）は、第１データと第２データとが類似するか否かを判定することにより、転移元装置（２０）が転送元として相応しいか否かを判定する。

Description

検索装置、検索方法、検索プログラム及び学習モデル検索システム

　この発明は、転移学習における転移元の検索技術に関する。

　ＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）機器上でＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）を利用するソリューションが増加している。例えば、以下のようなアプリケーションが挙げられる。（１）空調及び照明といったＩｏＴ家電の制御、（２）製造装置の故障診断、（３）製造ラインにおける製品の画像による検品、（４）ビル等の入門時の動画による不審者侵入検知、（４）ＥＭＳ（エネルギーマネジメントシステム）におけるエネルギー需要予測、（５）プラントの故障診断。

　ＩｏＴ機器毎にＡＩを利用する場合、学習処理に用いる十分な数の訓練データを確保することが困難になる。そこで、少ない訓練データで効率的に学習を行う必要がある。少ない訓練データで学習する方法として、訓練データが収集された環境とは異なる環境の訓練データ及び学習モデルを転移させる、転移学習と呼ばれる方法がある。
　転移学習では、転移元を特定するために、転移元の全データに対して転移元になり得るかを１つずつ評価する。評価の結果、転移が有効であることを示す「正の転移」であることを確認できた場合、転移元データとして決定する。この評価は、自動で行うことが望ましいが、何らかの形で人手が関わることがある。

　特許文献１には、転移元になり得るかを評価する技術について記載されている。具体的には、特許文献１には、転移元の訓練データを用いて学習を試行し、転移先のデータを入力とした推論結果と転移元のデータを入力とした推論結果との違いを利用して転移の有効性を判定することが記載されている。

特開２０１６－１９１９７５号公報

　特許文献１に記載された技術では、転移元になり得るかを評価する際、転移元の訓練データを用いて学習を試行せねばならず、転移元の探索空間が大きい場合は、処理時間を要してしまう。
　この発明は、短い処理時間で適切な転移元を特定可能にすることを目的とする。

　この発明に係る検索装置は、
　転移元装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第１データを取得する第１取得部と、
　転移先装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第２データを取得する第２取得部と、
　前記第１取得部によって取得された前記第１データと、前記第２取得部によって取得された前記第２データとが類似するか否かを判定する類似判定部と
を備える。

　この発明では、特徴量ベクトルを特徴軸毎の情報量を基準として基底変換して得られたデータが類似するか否かを判定する。データが類似するか否かにより、転移元になり得るかを評価することが可能である。データが類似するか否かを判定する処理は、転移元の訓練データを用いて学習を試行する処理に比べ処理時間がかからない。したがって、短い処理時間で適切な転移元を特定可能になる。

実施の形態１に係る学習モデル検索システム１００の構成図。実施の形態１に係る検索装置１０の構成図。実施の形態１に係る転移元装置２０の構成図。実施の形態１に係る転移先装置３０の構成図。実施の形態１に係る学習モデル検索システム１００の全体的な処理の説明図。実施の形態１に係る転移元装置２０の第１データ送信処理のフローチャート。実施の形態１に係る基底変換処理の説明図。実施の形態１に係る正規化処理の説明図。実施の形態１に係るベクトルｚ＾^→の説明図。実施の形態１に係る２次元画像の説明図。実施の形態１に係る軸の対応関係の説明図。実施の形態１に係る転移先装置３０の第２データ送信処理のフローチャート。実施の形態１に係る検索装置１０の検索処理のフローチャート。実施の形態１に係る無相関ではないと判定された場合における類似度計算処理のフローチャート。実施の形態１に係る軸の対応関係の説明図。実施の形態１に係る転移先装置３０の分析処理のフローチャート。実施の形態１に係る学習モデル検索システム１００を用いた転移元特定処理の説明図。転移元の候補となる転移元装置２０が２つ以上である場合における転移先装置３０の分析処理のフローチャート。実施の形態１に係る２次元画像の例の説明図。実施の形態２に係る類似判定処理のフローチャート。実施の形態３に係る類似判定処理のフローチャート。実施の形態３に係る検定方法選定の説明図。実施の形態４に係る類似判定処理のフローチャート。

　実施の形態１．
　＊＊＊構成の説明＊＊＊
　図１を参照して、実施の形態１に係る学習モデル検索システム１００の構成を説明する。
　学習モデル検索システム１００は、検索装置１０と、１つ以上の転移元装置２０と、転移先装置３０とを備える。検索装置１０と転移元装置２０と転移先装置３０とは、インターネットといった伝送路４０を介して接続されている。
　各転移元装置２０には、１つ以上のセンサ５０が接続されている。転移先装置３０には、１つ以上のセンサ６０が接続されている。

　図２を参照して、実施の形態１に係る検索装置１０の構成を説明する。
　検索装置１０は、クラウドコンピューティングにおけるサーバといったコンピュータである。
　検索装置１０は、コンピュータである。
　検索装置１０は、プロセッサ１１と、メモリ１２と、ストレージ１３と、通信インタフェース１４とのハードウェアを備える。プロセッサ１１は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。

　検索装置１０は、機能構成要素として、第１取得部１１１と、第２取得部１１２と、類似判定部１１３と、写像生成部１１４と、データ送信部１１５とを備える。検索装置１０の各機能構成要素の機能はソフトウェアにより実現される。
　ストレージ１３には、検索装置１０の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ１１によりメモリ１２に読み込まれ、プロセッサ１１によって実行される。これにより、検索装置１０の各機能構成要素の機能が実現される。

　また、ストレージ１３は、学習モデル記憶部１３１と、統計量記憶部１３２とを実現する。

　図３を参照して、実施の形態１に係る転移元装置２０の構成を説明する。
　転移元装置２０は、ＩｏＴ機器といったコンピュータである。
　転移元装置２０は、プロセッサ２１と、メモリ２２と、ストレージ２３と、通信インタフェース２４とのハードウェアを備える。プロセッサ２１は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。

　転移元装置２０は、機能構成要素として、基底変換部２１１と、正規化部２１２と、統計量計算部２１３と、データ送信部２１４とを備える。転移元装置２０の各機能構成要素の機能はソフトウェアにより実現される。
　ストレージ２３には、転移元装置２０の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ２１によりメモリ２２に読み込まれ、プロセッサ２１によって実行される。これにより、転移元装置２０の各機能構成要素の機能が実現される。

　また、ストレージ２３は、学習モデル記憶部２３１と、訓練データ記憶部２３２とを実現する。

　図４を参照して、実施の形態１に係る転移先装置３０の構成を説明する。
　転移先装置３０は、ＩｏＴ機器といったコンピュータである。
　転移先装置３０は、プロセッサ３１と、メモリ３２と、ストレージ３３と、通信インタフェース３４とのハードウェアを備える。プロセッサ３１は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。

　転移先装置３０は、機能構成要素として、基底変換部３１１と、正規化部３１２と、統計量計算部３１３と、データ送信部３１４と、データ取得部３１５と、学習モデル生成部３１６と、入力データ変換部３１７と、出力ラベル変換部３１８とを備える。転移先装置３０の各機能構成要素の機能はソフトウェアにより実現される。
　ストレージ３３には、転移先装置３０の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ３１によりメモリ３２に読み込まれ、プロセッサ３１によって実行される。これにより、転移先装置３０の各機能構成要素の機能が実現される。

　また、ストレージ３３は、学習モデル記憶部３３１と、観測データ記憶部３３２とを実現する。

　プロセッサ１１，２１，３１は、プロセッシングを行うＩＣ（Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）である。プロセッサ１１，２１，３１は、具体例としては、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）である。

　メモリ１２，２２，３２は、データを一時的に記憶する記憶装置である。メモリ１２，２２，３２は、具体例としては、ＳＲＡＭ（Ｓｔａｔｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）である。

　ストレージ１３，２３，３３は、データを保管する記憶装置である。ストレージ１３，２３，３３は、具体例としては、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）である。また、ストレージ１３，２３，３３は、ＳＤ（登録商標，Ｓｅｃｕｒｅ　Ｄｉｇｉｔａｌ）メモリカード、ＣＦ（ＣｏｍｐａｃｔＦｌａｓｈ，登録商標）、ＮＡＮＤフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ（登録商標）ディスク、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ）といった可搬記録媒体であってもよい。

　通信インタフェース１４，２４，３４は、外部の装置と通信するためのインタフェースである。通信インタフェース１４，２４，３４は、具体例としては、Ｅｔｈｅｒｎｅｔ（登録商標）、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）、ＨＤＭＩ（登録商標，Ｈｉｇｈ－Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）のポートである。

　＊＊＊動作の説明＊＊＊
　図５から図１６を参照して、実施の形態１に係る学習モデル検索システム１００の動作を説明する。
　実施の形態１に係る学習モデル検索システム１００の検索装置１０の動作手順は、実施の形態１に係る検索方法に相当する。また、実施の形態１に係る学習モデル検索システム１００の検索装置１０の動作を実現するプログラムは、実施の形態１に係る検索プログラムに相当する。

　図５を参照して、実施の形態１に係る学習モデル検索システム１００の全体的な処理について説明する。
　（１）各転移元装置２０は、訓練データから類似性の比較に必要な統計量とを生成する。訓練データは、各転移元装置２０がセンサ５０から取得したデータに対して教師データ（ラベル）の付与を行い生成されたデータである。（２）各転移元装置２０は、学習モデルと統計量とを検索装置１０に送信する。（３）転移先装置３０は、観測データから類似性の比較に必要な統計量を生成し、検索装置１０に送信する。観測データは、転移先装置３０がセンサ６０から取得したデータに対して教師データ（ラベル）の付与を行い生成されたデータである。
　（４）検索装置１０は、各転移元装置２０によって生成された統計量と、転移先装置３０によって生成された統計量とが類似するか否か判定する。これにより、検索装置１０は、転送元の候補になる転移元装置２０を特定する。（５）検索装置１０は、転移元の候補になる転移元装置２０について、データ写像ｆ及びラベル写像ｇを生成する。データ写像ｆは、転移先から転移元への入力変換である。ラベル写像ｇは、転移元から転移先への出力変換である。
　（６）転移先装置３０は、転移元の候補になった転移元装置２０の学習モデルを入力とし、転移先装置３０の学習器を生成する。（７）転移先装置３０は、観測データをデータ写像ｆで変換した後、生成された学習器に入力する。（８）転移先装置３０は、学習器から出力されたラベルをラベル写像ｇで変換する。（９）転移先装置３０は、変換されたラベルを出力する。

　図６を参照して、実施の形態１に係る転移元装置２０の第１データ送信処理（図５の（１）（２）の処理に相当）を説明する。
　（ステップＳ１１：基底変換処理）
　基底変換部２１１は、訓練データ記憶部２３２に記憶された訓練データの特徴量ベクトルの座標系を変換する。訓練データの特徴量ベクトルは、訓練データからラベルを除いたデータである。この処理は、転移元装置２０の訓練データの特徴量ベクトルの分布と、転移先装置３０の観測データの特徴量ベクトルの分布とを比較するために、座標系を揃える処理である。
　具体的には、基底変換部２１１は、特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換する。ここでは、図７に示すように、基底変換部２１１は、主成分分析を用いて、特徴量ベクトルの各要素の情報量が大きい特徴軸から順にベクトルｚ^→の要素ｚ_ｉを割り当てることにより、正規直交基底を得る。ここで、情報量は、分散値又は固有値と言い換えることができる。図７では、最も情報量が大きい特徴軸に基底要素ｚ_１が割り当てられ、次に情報量が大きい特徴軸に要素ｚ_２が割り当てられている。つまり、基底変換部２１１は、ｐ次元ユークリッド空間Ｒ^ｐ上の特徴量ベクトルｘ^→を、ｍ次元主成分空間Ｚ^ｍ上のベクトルｚ^→に変換する。
　ここで、ベクトルｚ^→の第ｉ主成分を要素ｚ_ｉ、要素ｚ_ｉの寄与率をＰＶ_ｉ、累積寄与率をＣＰＶ_ｍと表記する。この変換により、主成分同士が無相関化される。ベクトルｚ^→の次元数をｍとすると、１≦ｍ≦ｐ，０＜ＣＰＶ_ｍ≦１を満たす。特に、ｍ＜ｐの場合、次元削減と呼ばれる。主成分分析により、転移元装置２０及び転移先装置３０の特徴量ベクトル空間の軸が寄与率の降順にソートされる。

　（ステップＳ１２：正規化処理）
　正規化部２１２は、ステップＳ１１で座標系が変換された後のベクトルｚ^→を、定義域が一定の範囲に収まるように変換する。この処理は、転移元装置２０の訓練データの特徴量ベクトルの分布と、転移先装置３０の観測データの特徴量ベクトルの分布とをスケールにとらわれずに比較をするために、特徴量ベクトルを正規化する処理である。
　具体的には、図８に示すように、正規化部２１２は、ベクトルｚ^→の要素ｚ_ｉのスケールをｚ_ｍｉｎ≦ｚ_ｉ≦ｚ_ｍａｘとなるよう、数１により正規化する。ベクトルｚ^→を正規化したベクトルをｚ＾^→と表記する。

　（ステップＳ１３：統計量計算処理）
　統計量計算部２１３は、ステップＳ１２で変換されたデータに対して統計量を計算する。この処理は、転移元装置２０の訓練データの特徴量ベクトルの分布と、転移先装置３０の観測データの特徴量ベクトルの分布とを比較する際に使用する統計量を計算する処理である。

　具体的には、まず、統計量計算部２１３は、正規化されたベクトルｚ＾^→を２次元画像化する。図９に示すように、統計量計算部２１３は、この処理を、ラベルｙ_ｋ毎の正規化されたベクトルｚ＾^→に対して実行する。なお、ＭＤＳ（多次元尺度構成法）と、ＳＯＭ（自己組織化写像）と、ｔ－ＳＮＥ（ｔ－ｄｉｓｔｒｉｂｕｔｅｄ　Ｓｔｏｃｈａｓｔｉｃ　Ｎｅｉｇｈｂｏｒ　Ｅｍｂｅｄｄｉｎｇ）といったデータ可視化（次元削減）の技術が存在する。しかし、データ数を変化させると、出力画像の様相が大きく異なる場合がある。この場合、正常に類似性を判定することができない恐れがある。
　そこで、統計量計算部２１３は、正規化されたベクトルｚ＾^→を以下の手順で２次元画像化する。ここでは、正規化されたベクトルｚ＾^→は、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝２５５で正規化されているとする。
　まず、統計量計算部２１３は、数２に示すように、正規化されたベクトルｚ＾^→ _ｙ＿ｋの天井関数を計算して８ビットに量子化する。ここで、ｙ＿ｋは、ｙ_ｋを意味する。以下同様に、ｉ＿ｊは、ｉの下付きとしてｊが付されたｉ_ｊを意味する。

　次に、統計量計算部２１３は、量子化されたデータに対して寄与率ＰＶで重み付けしたグレースケール画像に変換する。グレースケール画像は，ユニットＵと呼ぶ小さな領域の集合からなる。ｉ行ｊ列のユニットをＵ（ｉ，ｊ）と表記する。すると、図１０に示すように、ユニットＵ（ｉ，ｊ）の画素値は数３に示すように正規化されたベクトルｚ＾^→の要素ｚ＾_ｊの天井関数を計算した値になり、高さは１になり、幅ｗ_ｊは数４に示す値になる。

　以降、グレースケール画像のｉ行ｊ列の画素値をｇ_ｉ，ｊ∈Ｇ（１≦ｉ≦Ｎ，１≦ｊ≦Σ_ｊ＝１ ^ｍｗ_ｊ）と表記する。ここで、図９に示すように、Ｎは、ラベル毎の特徴量ベクトル数である。図９では、例えば、Ｎ_ｙ＿１は、ラベルｙ_１の特徴量ベクトル数なので１０になっている。

　次に、統計量計算部２１３は、転移元装置２０と転移先装置３０との画素値の集合Ｇが類似しているか否かの判定を容易にするために、各ラベルについてヒストグラムを計算する。但し、特徴量ベクトルから生成されたヒストグラムは、本来の母集団の特徴を反映していない可能性がある。そこで、統計量計算部２１３は、母集団の確率密度関数の推定を行う。ここでは、集合Ｇを母集団の標本としてカーネル密度推定量ｆ＾_ｈ（ｘ）を数５により定義する。

　数５において、｜Ｇ｜は画素数であり、ｈは平滑化パラメータであるバンド幅であり、Ｋはカーネル関数である。
　統計量計算部２１３は、各ラベルについて計算されたカーネル密度推定量ｆ＾_ｈ（ｘ）の集合を、類似しているか否かの判定に用いられる統計量を表す第１データに設定する。

　（ステップＳ１４：統計量送信処理）
　データ送信部２１４は、ステップＳ１１で座標系が変換された前のデータと後のデータとの軸の対応関係と、ステップＳ１２で正規化される前の各軸ｉの最小値_ｍｉｎ（ｘ_ｉ）及び最大値_ｍａｘ（ｘ_ｉ）と、ステップＳ１３で計算された統計量を表す第１データとを検索装置１０に送信する。すると、検索装置１０の第１取得部１１１は、送信された軸の対応関係と、最小値_ｍｉｎ（ｘ_ｉ）及び最大値_ｍａｘ（ｘ_ｉ）と、第１データとを取得して、統計量記憶部１３２に書き込む。
　図１１に示すように、軸の対応関係は、軸の大小関係から特定される。図１１の場合には、軸の対応関係は、数６に示すように表される。

　（ステップＳ１５：学習モデル送信処理）
　データ送信部２１４は、訓練データ記憶部２３２に記憶された訓練データから生成された学習モデルを学習モデル記憶部２３１から読み出して、検索装置１０に送信する。すると、検索装置１０の第１取得部１１１は、送信された学習モデルを、ステップＳ１４で送信された第１データと関連付けて、学習モデル記憶部１３１に書き込む。

　図１２を参照して、実施の形態１に係る転移先装置３０の第２データ送信処理（図５の（３）の処理に相当）を説明する。
　（ステップＳ２１：基底変換処理）
　基底変換部３１１は、観測データ記憶部３３２に記憶された観測データの特徴量ベクトルの座標系を変換する。座標系の変換方法は、図６のステップＳ１１と同じである。

　（ステップＳ２２：正規化処理）
　正規化部３１２は、ステップＳ２１で座標系が変換された後のベクトルｚ^→を、定義域が一定の範囲に収まるように変換する。データの変換方法は、図６のステップＳ１２と同じである。なお、正規化部３１２は、図６のステップＳ１２と同じ定義域（最小値ｚ_ｍｉｎ及び最大値ｚ_ｍａｘ）を用いる。

　（ステップＳ２３：統計量計算処理）
　統計量計算部３１３は、ステップＳ２２で変換されたデータに対して統計量を計算する。統計量の計算方法は、図６のステップＳ１３と同じである。統計量計算部３１３は、各ラベルについて計算されたカーネル密度推定量ｆ＾_ｈ（ｘ）の集合を、類似しているか否かの判定に用いられる統計量を表す第２データに設定する。

　（ステップＳ２４：統計量送信処理）
　データ送信部３１４は、ステップＳ２１で座標系が変換された前のデータと後のデータとの軸の対応関係と、ステップＳ２２で正規化される前の各軸ｉの最小値_ｍｉｎ（ｘ_ｉ）及び最大値_ｍａｘ（ｘ_ｉ）と、ステップＳ２３で計算された統計量を表す第２データとを検索装置１０に送信する。すると、検索装置１０の第２取得部１１２は、送信された軸の対応関係と、最小値_ｍｉｎ（ｘ_ｉ）及び最大値_ｍａｘ（ｘ_ｉ）と、第２データとを取得して、メモリ１２に書き込む。

　図１３を参照して、実施の形態１に係る検索装置１０の検索処理（図５の（４）（５）の処理に相当）を説明する。
　（ステップＳ３１：類似判定処理）
　類似判定部１１３は、第１取得部１１１によって１つ以上の転移元装置２０から取得された第１データそれぞれを対象として、対象の第１データと、第２取得部１１２によって取得された第２データとが類似するか否かを判定する。つまり、類似判定部１１３は、第１データであるカーネル密度推定量ｆ＾_ｈ ^（Ｓ）（ｘ）の集合と、第２データであるカーネル密度推定量ｆ＾_ｈ ^（Ｔ）（ｘ）の集合とが類似するか否かを判定する。ここで、上付きで示された（Ｓ）（Ｔ）は転移元装置２０と転移先装置３０とを区別するための情報であり、（Ｓ）は転移元装置２０を表し、（Ｔ）は転移先装置３０を表す。
　具体的には、類似判定部１１３は、カーネル密度推定量ｆ＾_ｈ ^（Ｓ）（ｘ）の集合と、カーネル密度推定量ｆ＾_ｈ ^（Ｔ）（ｘ）の集合とについて、ピアソン相関係数による類似度比較を行う。なお、非特許文献「杉山　将，　山田　誠，　ドゥ・プレシ　マーティヌス・クリストフェル，　リウ　ソン：非定常環境下での学習：共変量シフト適応，クラスバランス変化適応，変化検知，　日本統計学会誌，　ｖｏｌ．４４，　ｎｏ．１，　ｐｐ．１１３-１３６（２０１４）．」には、類似度の評価にカルバック・ライブラー距離、ピアソン距離、又はＬ^２距離を用いる方法が記載されている。しかし、ＩｏＴでの転移を考える場合、転移先のデータ数が転移元のデータ数に比べ少ない状況（Ｎ_ｙ＿ｉ ^（Ｔ）＜Ｎ_ｙ＿ｊ ^（Ｓ））が多いと考えられる。そのため、各画素値に対する出現頻度分布に差異が生じ、前述の距離では、類似性を正しく判断できない。そこで、ここでは、類似判定部１１３は、２データ間の増減の関係に着目し、ピアソン相関係数を使用する。つまり、ここでは、類似判定部１１３は、対象の第１データと第２データとの増減の関係の類似性に基づき、第１データと第２データとが類似するか否かを判定する。

　まず、類似判定部１１３は、ピアソン無相関検定で対象の第１データと第２データとの間に相関があるかを検定する。そして、類似判定部１１３は、検定の結果、無相関ではないと判定した場合、数７に示すように、ピアソン相関係数を類似度とする。一方、類似判定部１１３は、検定の結果、無相関であるとは言えない（帰無仮説を棄却できない）場合、類似度を０と定義する。ピアソン無相関検定及び相関係数の計算に用いる標本は、ヒストグラムのｂｉｎ幅で十分であるので、ｘ＝１，…，２５５を代入したときのカーネル密度推定量ｆ＾ｈ^（Ｔ）（ｘ）及びカーネル密度推定量ｆ＾ｈ^（Ｓ）（ｘ）の値を使用する。

　数７では、ラベルｙ_ｋに対応するｆ＾_ｈ ^（Ｔ）（ｘ）がｆ＾_ｈ ^（Ｔ）（ｘ）_ｙ＿ｋ、ラベルｙ_ｌに対応するｆ＾_ｈ ^（Ｓ）（ｘ）がｆ＾_ｈ ^（Ｔ）（ｘ）_ｙ＿ｌと表記されている。ラベルｙ_ｋ ^（Ｔ）に対応するラベルｙ_ｌ ^（Ｓ）は、ｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））が最も高いものとする。
　具体的には、検定の結果、無相関ではないと判定した場合、類似判定部１１３は、第２データにおけるラベルｙ_ｋ ^（Ｔ）の探索始点を変更しながら、第２データにおける各ラベルｙ_ｋ ^（Ｔ）と相関係数が高い第１データにおけるラベルｙ_ｌ ^（Ｓ）を順次特定する。これにより、類似判定部１１３は、第２データにおける各ラベルｙ_ｋ ^（Ｔ）に対応する対象の第１データにおけるラベルｙ_ｌ ^（Ｓ）を特定する。そして、類似判定部１１３は、対象の第１データと第２データとについて、対応するラベルｙ_ｌとラベルｙ_ｋとの間の最大の相関係数を、対象の第１データと第２データとの類似度とする。なお、類似判定部１１３は、対応するラベルｙ_ｌとラベルｙ_ｋとの間の相関係数の平均値又は合計値を、対象の第１データと第２データとの類似度としてもよい。

　類似判定部１１３は、類似度が閾値Ｔよりも高い第１データの取得元である転移元装置２０のみを転移元の候補とする。あるいは、類似判定部１１３は、第１データを類似度の高い順にソートして、類似度の高い基準個の第１データの取得元の転移元装置２０のみを転移元の候補とする。これにより、類似判定部１１３は、転移元の候補となる転移元装置２０を絞り込む。

　図１４を参照して、実施の形態１に係る無相関ではないと判定された場合における類似度計算処理を説明する。
　ステップＳ３１１では、類似判定部１１３は、ｓｃｏｒｅ_ｍａｘに初期値として０を設定する。
　ループ１では、類似判定部１１３は、変数ｒを０からｑ^（Ｔ）－１まで１づつずらしながらステップＳ３１２からステップＳ３１７までの処理を繰り返し実行する。ここで、ｑ（Ｔ）は、転移先装置３０におけるラベルｙ^（Ｔ）の種類の数である。つまり、転移先装置３０におけるラベルｙ^（Ｔ）には、｛ｙ_０ ^（Ｔ），．．．，ｙ_{ｑ（Ｔ）－１} ^（Ｔ）｝のｑ^（Ｔ）種類のラベルが存在する。また、ループ２では、類似判定部１１３は、ｙ_ｒ ^（Ｔ），ｙ_１＋ｒ ^（Ｔ），．．．，ｙ_{（ｑ（Ｔ）－１＋ｒ）ｍｏｄｑ（Ｔ）} ^（Ｔ）の順に、ステップＳ３１２からステップＳ３１４までの処理を繰り返し実行する。ここで、下付きで表記されたｑ（Ｔ）はｑ^（Ｔ）を意味する。つまり、ループ１及びループ２では、探索順序をｙ_ｒ ^（Ｔ），ｙ_１＋ｒ ^（Ｔ），．．．，ｙ_{（ｑ（Ｔ）－１＋ｒ）ｍｏｄｑ（Ｔ）} ^（Ｔ）の順とし、探索の始点を表す変数ｒを０からｑ^（Ｔ）－１まで１づつずらしながら探索を行うことを意味する。
　ステップＳ３１２では、類似判定部１１３は、使用済のラベルの集合ｕｓｅｄに初期値として空集合を設定する。

　ループ３では、類似判定部１１３は、変数ｌを０からｑ^（Ｓ）まで１づつずらしながらステップＳ３１３の処理を繰り返し実行する。ステップＳ３１３では、類似判定部１１３は、第２データのラベルｙ_ｋ ^（Ｔ）と、対象の第１データのラベルｙ_ｌ ^（Ｓ）との間のピアソン相関係数を計算して、ｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））に設定する。

　ステップＳ３１４では、類似判定部１１３は、ラベルｙ_ｌ ^（Ｓ）が集合ｕｓｅｄに含まれていないラベルｙ_ｌ ^（Ｓ）のうち、ｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））が最大のラベルｙ_ｌ ^（Ｓ）を、対象のラベルｙ_ｌ ^（Ｓ）に設定する。類似判定部１１３は、対象のラベルｙ_ｌ ^（Ｓ）を集合ｕｓｅｄに加える。また、類似判定部１１３は、処理対象になっているラベルｙ_ｋ ^（Ｔ）と、対象のラベルｙ_ｌ ^（Ｓ）との間のｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））を、ｓｃｏｒｅ_ｔｍｐに設定する。また、類似判定部１１３は、処理対象になっているラベルｙ_ｋ ^（Ｔ）と、対象のラベルｙ_ｌ ^（Ｓ）との組（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））を集合ｇ_ｔｍｐに加える。

　ループ２及びループ３の処理を実行することにより、ループ１で設定された探索順序において、相関係数の高い順に、各ラベルｙ_ｋ ^（Ｔ）に対応するラベルｙ_ｌ ^（Ｓ）が特定される。そして、各ラベルｙ_ｋ ^（Ｔ）と対応するラベルｙ_ｌ ^（Ｓ）との間の相関係数のうち最も高い相関係数がｓｃｏｒｅ_ｔｍｐに設定される。また、各ラベルｙ_ｋ ^（Ｔ）と対応するラベルｙ_ｌ ^（Ｓ）との組が集合ｇ_ｔｍｐに設定される。

　ステップＳ３１５では、類似判定部１１３は、ｓｃｏｒｅ_ｍａｘよりもｓｃｏｒｅ_ｔｍｐが高いか否かを判定する。類似判定部１１３は、ｓｃｏｒｅ_ｍａｘよりもｓｃｏｒｅ_ｔｍｐが高い場合には処理をステップＳ３１６に進め、ｓｃｏｒｅ_ｍａｘよりもｓｃｏｒｅ_ｔｍｐが高くない場合には処理をステップＳ３１７の後に進める。
　ステップＳ３１６では、類似判定部１１３は、ｓｃｏｒｅ_ｔｍｐをｓｃｏｒｅ_ｍａｘに設定する。ステップＳ３１７では、類似判定部１１３は、集合ｇ_ｔｍｐを集合ｇに設定する。

　ループ１からループ３の処理を実行することにより、全ての探索順序で特定された相関係数ｓｃｏｒｅ_ｔｍｐのうち最も高い相関係数ｓｃｏｒｅ_ｔｍｐが相関係数ｓｃｏｒｅ_ｍａｘに設定される。ここでは、この相関係数ｓｃｏｒｅ_ｍａｘを対象の第１データと第２データとの類似度とする。また、相関係数ｓｃｏｒｅ_ｍａｘが計算された探索順序で特定された各ラベルｙ_ｋ ^（Ｔ）と対応するラベルｙ_ｌ ^（Ｓ）との組が集合ｇに設定される。

　ステップＳ３１で絞り込まれた転移元の候補となる転移元装置２０から取得された第１データそれぞれを対象として、ステップＳ３２からステップＳ３４の処理が実行される。

　（ステップＳ３２：ラベル写像生成処理）
　写像生成部１１４は、対象の第１データの元になった訓練データにおけるラベルと、第２データの元になった観測データにおけるラベルとの対応関係を示すラベル写像ｇを生成する。
　具体的には、写像生成部１１４は、ステップＳ３１で特定された各ラベルｙ_ｋ ^（Ｔ）に対応するラベルｙ_ｌ ^（Ｓ）を示す集合ｇをラベル写像ｇとして生成する。

　（ステップＳ３３：データ写像生成処理）
　写像生成部１１４は、対象の第１データの元になった訓練データの特徴量ベクトルと、第２データの元になった観測データの特徴量ベクトルとの対応関係を示すデータ写像ｆを生成する。
　具体的には、まず、写像生成部１１４は、対象の第１データとともに取得された軸の対応関係と、第２データとともに取得された軸の対応関係とに基づき、対象の第１データの元になった訓練データの特徴量ベクトルと、第２データの元になった観測データの特徴量ベクトルとの対応関係を特定する。対象の第１データの元になった訓練データの特徴量ベクトルと、第２データの元になった観測データの特徴量ベクトルとの対応関係は、転移先装置３０の元の座標系→転移先装置３０の基底変換後の座標系→転移元装置２０の基底変換後の座標系→転移元装置２０の元の座標系の順に対応関係を特定することで特定される。
　具体例としては、図１５に示すように、対象の第１データとともに取得された軸の対応関係が数８に示す関係であり、第２データとともに取得された軸の対応関係が数９に示す関係であるとする。また、図１５に示すように、対象の第１データの元になった訓練データの特徴量ベクトルの基底変換後のデータと、第２データの元になった観測データの特徴量ベクトル基底変換後のデータとの対応関係が数１０に示す関係であったとする。

　すると、対象の第１データの元になった訓練データの特徴量ベクトルと、第２データの元になった観測データの特徴量ベクトルとの対応関係Ｒは、数１１に示すようになる。

　この対応関係をＲ（ｉ）＝ｊと表すと、図１５の場合には、Ｒ（２）＝１，Ｒ（１）＝２になる。ここで、変数ｉは転移先装置３０の軸の添え字（ｘ_１ ^（Ｔ）であれば１）であり、変数ｊは転移元装置２０の軸の添え字（ｘ_２ ^（Ｓ）であれば２）である。

　そして、写像生成部１１４は、特定された対応関係Ｒと、対象の第１データとともに取得された各軸ｉの最小値_ｍｉｎ（ｘ_ｉ ^（Ｓ））及び最大値_ｍａｘ（ｘ_ｉ ^（Ｓ））と、第２データとともに取得された各軸ｉの最小値_ｍｉｎ（ｘ_ｉ ^（Ｔ））及び最大値_ｍａｘ（ｘ_ｉ ^（Ｔ））とに基づき、数１２に示すように、データ写像ｆを生成する。

　数１２において、ｐ^（Ｔ）は、第２データの元になった観測データの特徴量ベクトルｘ^→の次元数である。Ｃは、数１に定義された通りである。

　（ステップＳ３４：データ送信処理）
　データ送信部１１５は、対象の第１データについてステップＳ３２で生成されたラベル写像ｇと、対象の第１データについてステップＳ３３で生成されたデータ写像ｆと、対象の第１データの取得元である転移元装置２０から取得された学習モデルとを、転移先装置３０に送信する。
　すると、データ取得部３１５は、ラベル写像ｇとデータ写像ｆと学習モデルとを取得する。データ取得部３１５は、ラベル写像ｇを出力ラベル変換部３１８に設定し、データ写像ｆを入力データ変換部３１７に設定し、学習モデルを学習モデル記憶部３３１に書き込む。

　図１６を参照して、実施の形態１に係る転移先装置３０の分析処理（図５の（６）～（９）の処理に相当）を説明する。
　ここでは、ステップＳ３１で絞り込まれた転移元の候補となる転移元装置２０が１つである場合を説明する。

　（ステップＳ４１：学習モデル生成処理）
　学習モデル生成部３１６は、転移先装置３０用の学習モデルを生成する。ここでは、転移元の候補となる転移元装置２０が１つであるため、学習モデル生成部３１６は、ステップＳ３４で取得された学習モデルをそのまま転移先装置３０用の学習モデルに設定する。

　（ステップＳ４２：データ変換処理）
　入力データ変換部３１７は、センサ６０から取得された観測データを、ステップＳ３４で設定されたデータ写像ｆによって変換する。これにより、入力データ変換部３１７は、転移元の候補である転移元装置２０のデータの形式に観測データの形式を合わせる。つまり、観測データの形式は、転移元装置２０から取得された学習モデルの入力形式に変換される。
　具体例としては、転移先装置３０の観測データと、各軸の関係が図１５に示す関係であったとする。この場合には、入力データ変換部３１７は、数１１に示す対応関係Ｒに従い、数１３に示すように、ｘ_１ ^（Ｔ）軸をｘ_２ ^（Ｔ）軸に入れ替え、ｘ_２ ^（Ｔ）軸をｘ_１ ^（Ｔ）軸に入れ替えた上で、スケールの変換を行う。

　（ステップＳ４３：データ入力処理）
　入力データ変換部３１７は、ステップＳ４２で変換された観測データを、ステップＳ４１で生成された学習モデルに入力する。すると、学習モデルで推論された結果として出力ラベルが出力される。

　（ステップＳ４４：出力ラベル変換処理）
　出力ラベル変換部３１８は、ステップＳ４３で出力された出力ラベルを、ステップＳ３４で設定されたラベル写像ｇによって変換する。これにより、出力ラベル変換部３１８は、転移先装置３０のラベルに出力ラベルを変換する。そして、出力ラベル変換部３１８は、変換された出力ラベルを、観測データから推論された結果として出力する。
　具体例としては、ラベル写像ｇは｛（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））｝で表され、ラベル写像ｇ＝｛（りんご，自動車）、（みかん，バイク）、（ばなな，自転車）｝であったとする。このとき、ステップＳ４３で出力された出力ラベルがバイクであった場合には、バイクがみかんに変換される。

　つまり、図１７に示すように、実施の形態１に係る学習モデル検索システム１００は、転移元装置２０が学習モデルを生成した際に使用した訓練データと、転移先装置３０によって得られた少数の観測データとの類似性を判定して、転移元の候補となる転移元装置２０を絞り込む（フェーズ１）。その後、転移元の候補となる転移元装置２０から、転移元として採用する転移元装置２０が、自動的あるいは人手により抽出される（フェーズ２）。

　＊＊＊実施の形態１の効果＊＊＊
　以上のように、実施の形態１に係る学習モデル検索システム１００は、転移元装置２０の訓練データから生成された統計量と、転移先装置３０の観測データから生成された統計量とに基づき、転送元の候補となる転移元装置２０を絞り込む。これにより、短い処理時間で適切な転移元を特定可能である。その結果、短い処理時間で転移先装置３０の学習モデルを生成可能である。

　特に、実施の形態１に係る学習モデル検索システム１００は、訓練データとの特徴量ベクトルと観測データの特徴量ベクトルとのそれぞれを、特徴軸毎の情報量を基準として基底変換して得られたデータが類似するか否かを判定することにより、転送元の候補となる転移元装置２０を絞り込む。データが類似するか否かを判定する処理は、転移元の訓練データを用いて学習を試行する処理に比べ処理時間がかからない。したがって、短い処理時間で適切な転移元を特定可能になる。

　また、実施の形態１に係る学習モデル検索システム１００は、特徴量ベクトルが基底変換された後に、特徴量ベクトルのスケールが正規化されて得られたデータが類似するか否かを判定することにより、転送元の候補となる転移元装置２０を絞り込む。これにより、データのスケールの影響を除いた上で比較され、適切な判定が可能になる。

　また、実施の形態１に係る学習モデル検索システム１００は、データの増減の関係の類似性に基づき、データが類似するか否かを判定する。これにより、転移先のデータ数が転移元のデータ数に比べ少ない状況であっても、適切な判定が可能になる。

　また、実施の形態１に係る学習モデル検索システム１００は、データが類似するか否かの判定に用いる統計量はカーネル密度推定量ｆ＾_ｈ（ｘ）であり、ピアソン相関係数の計算時には、ｘ＝１，．．．，２５５を固定的に用いる。そのため、転移元装置２０の訓練データの数に依存せず、計算量を一定にすることが可能である。

　また、実施の形態１に係る学習モデル検索システム１００は、統計量である第１データ及び第２データと、転移元装置２０の学習モデルとだけが検索装置１０に与えられる。そのため、例えば、検索装置１０をクラウドコンピューティングのサーバによって実現するような場合であっても、検索装置１０によって転移元装置２０の訓練データが推測されるといったことがなく、安全性が高い。

　＊＊＊他の構成＊＊＊
　＜変形例１＞
　実施の形態１では、転移先装置３０の分析処理について、ステップＳ３１で絞り込まれた転移元の候補となる転移元装置２０が１つである場合を説明した。しかし、ステップＳ３１で絞り込まれた転移元の候補となる転移元装置２０が２つ以上である場合もある。

　図１８を参照して、ステップＳ３１で絞り込まれた転移元の候補となる転移元装置２０が２つ以上である場合における転移先装置３０の分析処理を説明する。
　ここでは、一対他分類器（ｏｎｅ－ｖｅｒｓｕｓ－ｔｈｅ－ｒｅｓｔ　ｃｌａｓｓｉｆｉｅｒ）の考え方に基づいた処理を説明する。

　（ステップＳ５１：学習モデル生成処理）
　学習モデル生成部３１６は、転移元の候補となる各転移元装置２０から取得された学習モデルを、弱学習モデルとして生成する。そして、学習モデル生成部３１６は、弱学習モデルの組を転移先装置３０用の学習モデルとして生成する。
　つまり、各転移元装置２０から取得された学習モデルは、転移先装置３０の一部のラベル識別が可能であると考えられる。そこで、学習モデル生成部３１６は、各転移元装置２０から取得された学習モデルを弱学習モデルとし、弱学習モデルの組を転移先装置３０用の学習モデルに設定する。

　（ステップＳ５２：学習モデル選択処理）
　入力データ変換部３１７は、ステップＳ５１で設定された転移先装置３０の学習モデルを構成する弱学習モデルのうち、未選択の１つの弱学習モデルを対象の弱学習モデルとして選択する。
　なお、入力データ変換部３１７は、未選択の弱学習モデルが存在しない場合には、観測データを分類不可と判定する。

　（ステップＳ５３：入力データ変換処理）
　入力データ変換部３１７は、センサ６０から取得された観測データを、ステップＳ５２で選択された弱学習モデルの取得元の転移元装置２０についてのデータ写像ｆによって変換する。

　（ステップＳ５４：データ入力処理）
　入力データ変換部３１７は、ステップＳ５３で変換された観測データを、ステップＳ５２で選択された弱学習モデルに入力する。すると、学習モデルで推論された結果として出力ラベル又は推論不可との結果が出力される。

　（ステップＳ５５：出力判定処理）
　入力データ変換部３１７は、ステップＳ５４で出力ラベルが出力されたか否かを判定する。
　入力データ変換部３１７は、出力ラベルが出力された場合には、処理をステップＳ５６に進める。一方、入力データ変換部３１７は、推論不可との結果が出力された場合には、処理をステップＳ５２に戻して、他の弱学習モデルを選択する。

　（ステップＳ５６：出力ラベル変換処理）
　出力ラベル変換部３１８は、ステップＳ５４で出力された出力ラベルを、ステップＳ５２で選択された弱学習モデルの取得元の転移元装置２０についてのラベル写像ｇによって変換する。

　上記処理は、一対他分類器の考え方に基づいた処理である。しかし、これに限らず、一対一分類器（ｏｎｅ－ｖｅｒｓｕｓ－ｏｎｅ　ｃｌａｓｓｉｆｉｅｒ）、又は、誤り訂正出力符号（ｅｒｒｏｒ　ｃｏｒｒｅｃｔｉｎｇ　ｏｕｔｐｕｔ　ｃｏｄｅ）の考え方に基づく処理としてもよい。

　＜変形例２＞
　実施の形態１では、類似度が閾値よりも高いか否かといった方法により転移元の候補となる転移元装置２０を絞り込んだ。しかし、転移元の候補とするか否かを最終的に人が判断してもよい。この場合には、検索装置１０は、ステップＳ１３で訓練データが２次元画像化された画像データと、ステップＳ２３で観測データが２次元画像化された画像データとを表示すればよい。そして、２次元画像化された画像データ同士を目視により比較することで、データが類似しているか否かを人が判定すればよい。
　２次元画像化された画像データ同士の比較であるため、人が容易に行うことが可能である。例えば、図１９に示すような２次元画像化された画像データが得られる。図１９では、転移先装置３０のラベル９．０と、転移元装置２０のラベル６．０とが類似しており、転移先装置３０のラベル１０．０と、転移元装置２０のラベル９．０とが類似していることが分かる。

　＜変形例３＞
　実施の形態１では、統計量の比較をする際、ピアソン相関係数を用いた。しかし、統計量の比較をする際、画像識別の技術を使用してもよい。具体例としては、類似判定部１１３は、訓練データが２次元画像化された画像データと、観測データが２次元画像化された画像データとのそれぞれから特徴点を抽出する。そして、類似判定部１１３は、訓練データが２次元画像化された画像データにおける特徴点同士の距離と、観測データが２次元画像化された画像データにおける特徴点同士の距離とを比較することが考えられる。

　＜変形例４＞
　実施の形態１では、転移元装置２０が第１データを生成した上で、第１データを検索装置１０に送信した。しかし、転移元装置２０は訓練データを検索装置１０に送信して、検索装置１０が第１データを生成してもよい。この場合には、転移元装置２０が備える基底変換部２１１と正規化部２１２と統計量計算部２１３との機能構成要素を検索装置１０が備えるようにすればよい。
　同様に、実施の形態１では、転移先装置３０が第２データを生成した上で、第２データを検索装置１０に送信した。しかし、転移先装置３０は観測データを検索装置１０に送信して、検索装置１０が第２データを生成してもよい。この場合には、転移先装置３０が備える基底変換部３１１と正規化部３１２と統計量計算部３１３との機能構成要素を検索装置１０が備えるようにすればよい

　なお、検索装置１０に訓練データを送信する場合には、検索装置１０に訓練データが漏洩することになる。同様に、検索装置１０に観測データを送信する場合には、検索装置１０に観測データが漏洩することになる。したがって、訓練データ又は観測データを外部に漏らしたくない場合には、実施の形態１の構成とすることが望ましい。

　＜変形例５＞
　実施の形態１では、各機能構成要素がソフトウェアで実現された。しかし、変形例５として、各機能構成要素はハードウェアで実現されてもよい。この変形例５について、実施の形態１と異なる点を説明する。

　各機能構成要素がハードウェアで実現される場合には、検索装置１０は、プロセッサ１１とメモリ１２とストレージ１３とに代えて、電子回路１５を備える。電子回路１５は、各機能構成要素と、メモリ１２と、ストレージ１３との機能とを実現する専用の回路である。

　同様に、各機能構成要素がハードウェアで実現される場合には、転移元装置２０は、プロセッサ２１とメモリ２２とストレージ２３とに代えて、電子回路２５を備える。電子回路２５は、各機能構成要素と、メモリ２２と、ストレージ２３との機能とを実現する専用の回路である。

　同様に、各機能構成要素がハードウェアで実現される場合には、転移先装置３０は、プロセッサ３１とメモリ３２とストレージ３３とに代えて、電子回路３５を備える。電子回路３５は、各機能構成要素と、メモリ３２と、ストレージ３３との機能とを実現する専用の回路である。

　電子回路１５，２５，３５としては、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックＩＣ、ＧＡ（Ｇａｔｅ　Ａｒｒａｙ）、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）が想定される。
　検索装置１０と転移元装置２０と転移先装置３０との各装置は、各機能構成要素を１つの電子回路１５，２５，３５で実現してもよいし、各機能構成要素を複数の電子回路１５に分散させて実現してもよい。

　＜変形例６＞
　変形例６として、検索装置１０と転移元装置２０と転移先装置３０との各装置は、一部の各機能構成要素がハードウェアで実現され、他の各機能構成要素がソフトウェアで実現されてもよい。

　プロセッサ１１，２１，３１とメモリ１２，２２，３２とストレージ１３，２３，３３と電子回路１５，２５，３５とを処理回路という。つまり、各機能構成要素の機能は、処理回路により実現される。

　実施の形態２．
　実施の形態２は、２次元画像化された画像データに代えて、ｍ次元主成分空間のベクトルｚ＾^→の要素ｚ＾_ｉ毎の確率密度推定量を統計量として用いる点が実施の形態１と異なる。実施の形態２では、この異なる点を説明して、同一の点については説明を省略する。

　＊＊＊動作の説明＊＊＊
　図６を参照して、実施の形態２に係る転移元装置２０の第１データ送信処理を説明する。
　ステップＳ１２では、正規化部２１２は、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝１として、ベクトルｚ^→を正規化してベクトルｚ＾^→を生成する。
　ステップＳ１３では、統計量計算部２１３は、数１４に示すように、ベクトルｚ＾^→の要素ｚ＾_ｉ毎のカーネル密度推定量ｆ＾_ｈ（ｘ）を用いて、確率密度関数を推定する。

　数１４において、｜ｚ＾_ｉ｜は、ベクトルｚ＾^→の第ｉ主成分軸のデータ総数である。

　図１２を参照して、実施の形態２に係る転移先装置３０の第２データ送信処理を説明する。
　ステップＳ２２では、図６のステップＳ１２と同様に、正規化部３１２は、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝１として、ベクトルｚ^→を正規化してベクトルｚ＾^→を生成する。
　ステップＳ２３では、図６のステップＳ１３と同様に、統計量計算部３１３は、ベクトルｚ＾^→の要素ｚ＾_ｉ毎のカーネル密度推定量ｆ＾_ｈ（ｘ）を用いて、確率密度関数を推定する。

　図１３を参照して、実施の形態２に係る検索装置１０の検索処理を説明する。
　ステップＳ３１では、類似判定部１１３は、数１５に示すように、要素ｚ＾_ｉの寄与率ＰＶ_ｉで重み付けしたピアソン相関係数を類似度とする。ここで、ピアソン無相関検定及び相関係数の計算に用いる標本は、ｘ＝０，０．００１，．．．，１を代入したときのカーネル密度推定量ｆ＾ｈ^（Ｔ）（ｘ）及びカーネル密度推定量ｆ＾ｈ^（Ｓ）（ｘ）の値を使用する。

　言い換えると、類似判定部１１３は、各特徴軸を対象として、対象の特徴軸についての第１データと第２データとの増減の関係の類似性（ピアソン相関係数）に対して、対象の特徴軸の情報量に応じて重み付け（寄与率ＰＶ_ｉで重み付け）して得られた結果を線形結合して、第１データと第２データとが類似するか否かを判定する。

　図２０を参照して実施の形態２に係る類似判定処理を説明する。
　類似度判定処理は、ループ３の処理が図１４に示す処理と異なる。ループ３では、ループ４の処理が実行される。ループ４では、類似判定部１１３は、変数ｉが１からｍｉｎ（ｍ^（Ｔ），ｍ^（Ｓ））まで１づつずらしながらステップＳ３１３の処理を繰り返し実行する。ステップＳ３１３では、類似判定部１１３は、要素ｚ＾_ｉの寄与率ＰＶ_ｉ ^（Ｔ）で重み付けした、第２データのラベルｙ_ｋ ^（Ｔ）と対象の第１データのｙ_ｌ ^（Ｓ）との間のピアソン相関係数を計算して、ｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））に加算する。

　＊＊＊実施の形態２の効果＊＊＊
　以上のように、実施の形態２に係る学習モデル検索システム１００は、特徴量ベクトルを基底変換して無相関化させた上で、ベクトルの要素毎の類似性を線形結合して類似するか否かを判定する。これにより、実施の形態１に比べて計算量を減らすことが可能になる。

　また、実施の形態２に係る学習モデル検索システム１００は、ベクトルの要素毎の類似性に対して、寄与率で重み付けする。これにより、機械学習における出力に重要な影響を与える要素が似ているほど、類似性が高いと判定されるようになり、適切な判定が可能になる。

　また、実施の形態２に係る学習モデル検索システム１００は、ベクトルの要素毎に外挿（確率密度推定）を行うことにより、適切な判定が可能になる。

　＊＊＊他の構成＊＊＊
　＜変形例７＞
　実施の形態２では、確率密度関数の推定にカーネル密度推定量を用いた。しかし、より計算量の少ない線形外挿又は直線外挿のような線形補間の技術を使用したアルゴリズムを用いてもよい。想定される定義域内のデータを万遍なく採取可能な場合のように、共変量シフトやクラスバランス変化を考慮しなくてよい場合、外挿ではなく線形補間又は多項式補間を用いてもよい。

　実施の形態３．
　実施の形態３は、ｍ次元主成分空間のベクトルｚ＾^→の要素ｚ＾_ｉ毎に統計的仮説検定を用いる点が実施の形態２と異なる。実施の形態３では、この異なる点を説明して、同一の点については説明を省略する。

　＊＊＊動作の説明＊＊＊
　図６を参照して、実施の形態３に係る転移元装置２０の第１データ送信処理を説明する。
　ステップＳ１２では、正規化部２１２は、実施の形態２と同様に、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝１として、ベクトルｚ^→を正規化してベクトルｚ＾^→を生成する。
　ステップＳ１３では、統計量計算部２１３は、統計量を計算しない。統計量計算部２１３は、統計的仮説検定における検定精度の低下を抑制するために、外れ値又はノイズの除去と、データの補間又は外挿とを行う。

　図１２を参照して、実施の形態３に係る転移先装置３０の第２データ送信処理を説明する。
　ステップＳ２２では、図６のステップＳ１２と同様に、正規化部３１２は、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝１として、ベクトルｚ^→を正規化してベクトルｚ＾^→を生成する。
　ステップＳ２３では、図６のステップＳ１３と同様に、統計量計算部３１３は、統計的仮説検定における検定精度の低下を抑制するために、外れ値又はノイズの除去と、データの補間又は外挿とを行う。

　図１３を参照して、実施の形態３に係る検索装置１０の検索処理を説明する。
　ステップＳ３１では、類似判定部１１３は、統計的仮説検定により類似度を計算する。統計的仮説検定では、帰無仮説Ｈ_０及び対立仮説Ｈ_１が定められ、Ｈ_０を棄却することによりＨ_１が採択される。ここでは、類似判定部１１３は、検定結果から類似度を計算するため、Ｈ_０が棄却された場合を０、棄却できない場合を１と定義し、検定結果を２値化する。但し、検定結果が１であってもＨ_０を採択しないことに注意する。検定の標本は、（ｚ＾_ｉ ^（Ｔ））_ｙ＿ｋ，（ｚ＾_ｉ ^（Ｓ））_ｙ＿ｌを用いる。下付きのｙ_ｋ及びｙ_ｌは、ラベルｙ_ｋ及びラベルｙ_ｌに対応する特徴量ベクトルｚ＾^→の要素ｚ＾_ｉであることを示す。
　類似判定部１１３は、数１６に示すように、実施の形態２と同様に、検定結果に寄与率ＰＶ_ｉで重み付けすることにより類似度を算出する。

　数１６において、Ｔｅｓｔは検定結果を２値化した値である。
　言い換えると、類似判定部１１３は、各特徴軸を対象として、対象の特徴軸についての第１データと第２データとの類似性を統計的仮説検定により特定する。そして、類似判定部１１３は、特定された類似性に対して、対象の特徴軸の情報量に応じて重み付けして得られた結果を線形結合して、第１データと第２データとが類似するか否かを判定する。

　図２１を参照して実施の形態３に係る類似判定処理を説明する。
　類似度判定処理は、ステップＳ３１３の処理が図２０と異なる。ステップＳ３１３では、類似判定部１１３は、ラベルｙ_ｋ ^（Ｔ）に対応する要素ｚ＾_ｉ ^（Ｔ）とラベルｙ_ｌ ^（Ｓ）に対応する要素ｚ＾_ｉ ^（Ｓ）との間の統計的仮説検定の検定結果に、要素ｚ＾_ｉの寄与率ＰＶ_ｉ ^（Ｔ）で重み付けして、ｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））に加算する。

　なお、検定方法を選定する場合には、転移元装置２０及び転移先装置３０の特定によって、以下のような条件を考慮する必要がある。
（１）正規性を仮定できない
（２）サンプル数が異なる（独立２標本，対応のない標本）
　（１）（２）の条件が成立する場合は、図２２に示す対応のないノンパラメトリック検定を使用する。対応のないノンパラメトリック検定には、マンホイットニのＵ検定と２標本コルモゴロフ－スミルノフ検定とがある。マンホイットニのＵ検定では、帰無仮説Ｈ_０を「両標本が同じ母集団から抽出された」とし、対立仮説Ｈ_１を「両標本が異なる母集団から抽出された」とする。２標本コルモゴロフ－スミルノフ検定では、帰無仮説Ｈ_０を「両標本の母集団の確率分布が等しい」とし、対立仮説Ｈ_１を「両標本の母集団の確率分布が等しくない」とする。

　転移元装置２０及び転移先装置３０の特性によっては、データに対応があること、又は、正規分布のようなある分布に従うことが想定できる場合がある。このような場合は、パラメトリック検定を利用してもよい。

　＊＊＊実施の形態３の効果＊＊＊
　以上のように、実施の形態３に係る学習モデル検索システム１００は、統計的仮説検定により、類似するか否かを判定する。これにより、入力サンプルではなく、入力サンプルの母集団の類似性を厳密に判定することができるため、適切な判定が可能になる。

　また、実施の形態３に係る学習モデル検索システム１００は、基底変換及び正規化を行って得られたベクトルｚ＾^→を用いて統計的仮説検定を行う。これにより、入力ベクトルの要素毎に検定を行うことができるため、高次元の入力ベクトルに対しても、既存の低次元の統計的仮説検定の手法を用いることが可能である。

　実施の形態４．
　実施の形態４は、２次元画像化された画像データに代えて、ｍ次元主成分空間のベクトルｚ＾^→の平均ベクトルのコサイン類似度を統計量として用いる点が実施の形態１と異なる。実施の形態４では、この異なる点を説明して、同一の点については説明を省略する。

　＊＊＊動作の説明＊＊＊
　図６を参照して、実施の形態４に係る転移元装置２０の第１データ送信処理を説明する。
　ステップＳ１２では、正規化部２１２は、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝１として、ベクトルｚ^→を正規化してベクトルｚ＾^→を生成する。
　ステップＳ１３では、統計量計算部２１３は、数１７に示すように、ベクトルｚ＾^→の代表値として相加平均ベクトルｚ＾^→－を計算する。

　数１７において、｜ｚ^→｜は、特徴量ベクトルｚ^→の総数（Ｎ_ｙ＿ｘ）である。

　図１２を参照して、実施の形態４に係る転移先装置３０の第２データ送信処理を説明する。
　ステップＳ２２では、図６のステップＳ１２と同様に、正規化部３１２は、ｚ_ｍｉｎ＝０，ｚ_ｍａｘ＝１として、ベクトルｚ^→を正規化してベクトルｚ＾^→を生成する。
　ステップＳ２３では、図６のステップＳ１３と同様に、統計量計算部３１３は、ベクトルｚ＾^→の代表値として相加平均ベクトルｚ＾^→－を計算する。

　図１３を参照して、実施の形態２に係る検索装置１０の検索処理を説明する。
　ステップＳ３１では、類似判定部１１３は、数１８に示すように、相加平均ベクトルｚ＾^{→－（Ｔ）}と相加平均ベクトルｚ＾^{→－（Ｓ）}とのコサイン類似度を計算する。

　言い換えると、類似判定部１１３は、第１データ及び第２データについて代表値を計算して、代表値により第１データと第２データとが類似するか否かを判定する。特に、類似判定部１１３は、第１データについての代表値と、第２データについての代表値とのコサイン類似度を計算することにより、第１データと第２データとが類似するか否かを判定する。

　図２３を参照して実施の形態４に係る類似判定処理を説明する。
　類似度判定処理は、ステップＳ３１３の処理が図１４に示す処理と異なる。ステップＳ３１３では、類似判定部１１３は、相加平均ベクトルｚ＾^{→－（Ｔ）}と相加平均ベクトルｚ＾^{→－（Ｓ）}とのコサイン類似度を計算して、ｓｃｏｒｅ（ｙ_ｋ ^（Ｔ），ｙ_ｌ ^（Ｓ））に設定する。

　＊＊＊実施の形態４の効果＊＊＊
　以上のように、実施の形態４に係る学習モデル検索システム１００は、ベクトルｚ＾^→の平均ベクトルのコサイン類似度により、類似するか否かを判定する。これにより、入力サンプル数によらず一度の比較で類似するか否かを判定することができるため、検索速度を一定に維持することが可能になる。

　＊＊＊他の構成＊＊＊
　＜変形例８＞
　実施の形態４では、代表値として相加平均ベクトルを用いた。しかし、代表値として、刈込平均と、中央値と、四分位点と、重心と、最頻値と、ｋ近傍といった値を用いてもよい。

　なお、上記説明において、数１９に示すベクトルを本文中でｚ^→と表記する。また、数２０に示す正規化されたベクトルを本文中でｚ＾^→と表記する。また、数２１に示す相加平均ベクトルをｚ＾^→－と表記する。また、本文中でｘ＿ｙと表記した場合には、ｘ_ｙを意味する。

　以上、この発明の実施の形態及び変形例について説明した。これらの実施の形態及び変形例のうち、いくつかを組み合わせて実施してもよい。また、いずれか１つ又はいくつかを部分的に実施してもよい。なお、この発明は、以上の実施の形態及び変形例に限定されるものではなく、必要に応じて種々の変更が可能である。

　１００　学習モデル検索システム、１０　検索装置、１１　プロセッサ、１２　メモリ、１３　ストレージ、１４　通信インタフェース、１５　電子回路、１１１　第１取得部、１１２　第２取得部、１１３　類似判定部、１１４　写像生成部、１１５　データ送信部、１３１　学習モデル記憶部、１３２　統計量記憶部、２０　転移元装置、２１　プロセッサ、２２　メモリ、２３　ストレージ、２４　通信インタフェース、２５　電子回路、２１１　基底変換部、２１２　正規化部、２１３　統計量計算部、２１４　データ送信部、２３１　学習モデル記憶部、２３２　訓練データ記憶部、３０　転移先装置、３１　プロセッサ、３２　メモリ、３３　ストレージ、３４　通信インタフェース、３５　電子回路、３１１　基底変換部、３１２　正規化部、３１３　統計量計算部、３１４　データ送信部、３１５　データ取得部、３１６　学習モデル生成部、３１７　入力データ変換部、３１８　出力ラベル変換部、４０　伝送路、５０　センサ、６０　センサ。

Claims

　転移元装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第１データを取得する第１取得部と、
　転移先装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第２データを取得する第２取得部と、
　前記第１取得部によって取得された前記第１データと、前記第２取得部によって取得された前記第２データとが類似するか否かを判定する類似判定部と
を備える検索装置。
　前記第１データ及び前記第２データは、前記特徴量ベクトルが基底変換された後に、前記特徴量ベクトルのスケールが正規化されて得られた
請求項１に記載の検索装置。
　前記第１データ及び前記第２データは、前記特徴量ベクトルが正規化された後に、２次元画像化された画像データの画素値の分布の統計量が計算されて得られた
請求項２に記載の検索装置。
　前記類似判定部は、前記第１データと前記第２データとの増減の関係の類似性に基づき、前記第１データと前記第２データとが類似するか否かを判定する
請求項３に記載の検索装置。
　前記第１データ及び前記第２データは、前記特徴量ベクトルが正規化された後に、前記特徴軸毎の値の分布の統計量が計算されて得られた
請求項２に記載の検索装置。
　前記類似判定部は、各特徴軸を対象として、対象の特徴軸についての前記第１データと前記第２データとの増減の関係の類似性に対して、前記対象の特徴軸の情報量に応じて重み付けして得られた結果を線形結合して、前記第１データと前記第２データとが類似するか否かを判定する
請求項５に記載の検索装置。
　前記類似判定部は、各特徴軸を対象として、対象の特徴軸についての前記第１データと前記第２データとの類似性を統計的仮説検定により特定して、前記類似性に対して、前記対象の特徴軸の情報量に応じて重み付けして得られた結果を線形結合して、前記第１データと前記第２データとが類似するか否かを判定する
請求項２に記載の検索装置。
　前記類似判定部は、前記第１データ及び前記第２データについて代表値を計算して、前記代表値により前記第１データと前記第２データとが類似するか否かを判定する
請求項２に記載の検索装置。
　前記類似判定部は、前記第１データについての前記代表値と、前記第２データについての前記代表値とのコサイン類似度を計算することにより、前記第１データと前記第２データとが類似するか否かを判定する
請求項８に記載の検索装置。
　前記検索装置は、さらに、
　前記第１データと前記第２データとが類似すると前記類似判定部によって判定された場合に、前記第１データを生成した際の基底変換と、前記第２データが生成された際の基底変換とに基づき、前記転移先装置における特徴量ベクトルを前記転移元装置における特徴量ベクトルに合わせるためのデータ写像を生成する写像生成部
を備える請求項１から９までのいずれか１項に記載の検索装置。
　前記転移元装置における特徴量ベクトルと、前記転移先装置における特徴量ベクトルとには、要素毎にラベルが付されており、
　前記写像生成部は、前記第１データと前記第２データとの類似度に基づき、前記第１データのラベルと前記第２データのラベルとの間の対応関係を示すラベル写像を生成する
請求項１０に記載の検索装置。
　第１取得部が、転移元装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第１データを取得し、
　第２取得部が、転移先装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第２データを取得し、
　類似判定部が、前記第１データと前記第２データとが類似するか否かを判定する検索方法。
　転移元装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第１データを取得する第１取得処理と、
　転移先装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第２データを取得する第２取得処理と、
　前記第１取得処理によって取得された前記第１データと、前記第２取得処理によって取得された前記第２データとが類似するか否かを判定する類似判定処理と
を行う検索装置としてコンピュータを機能させる検索プログラム。
　検索装置と転移先装置とを備える学習モデル検索システムであり、
　前記検索装置は、
　転移元装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第１データを取得する第１取得部と、
　前記転移先装置における特徴量ベクトルを、特徴軸毎の情報量を基準として基底変換して得られた第２データを取得する第２取得部と、
　前記第１取得部によって取得された前記第１データと、前記第２取得部によって取得された前記第２データとが類似するか否かを判定する類似判定部と
を備え、
　前記転移先装置は、前記類似判定部によって前記第１データと前記第２データとが類似すると判定された場合に、前記転移元装置の学習モデルに基づき学習モデルを生成する学習モデル生成部
を備える学習モデル検索システム。
　前記第１取得部は、複数の転移元装置それぞれを対象として、対象の転移元装置についての前記第１データを取得し、
　前記類似判定部は、前記複数の転移元装置それぞれを対象として、対象の転移元装置についての前記第１データと、前記第２データとが類似するか否かを判定し、
　前記学習モデル生成部は、２つ以上の転移元装置についての前記第１データと前記第２データとが類似すると判定された場合には、前記２つ以上の転移元装置の学習モデルに基づき学習モデルを生成する
請求項１４に記載の学習モデル検索システム。