WO2020179200A1

WO2020179200A1 - 情報処理方法及び情報処理システム

Info

Publication number: WO2020179200A1
Application number: PCT/JP2019/050480
Authority: WO
Inventors: 育規石井; 亮太藤村; 宗太郎築澤
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2019-03-04
Filing date: 2019-12-24
Publication date: 2020-09-10
Anticipated expiration: 2021-09-04
Also published as: EP3937094A1; EP3937094A4; JPWO2020179200A1; CN112703513A; US20210192348A1; CN112703513B

Abstract

コンピュータにより実行される情報処理方法では、識別器に第１データを入力して第１識別結果データを取得し、第２データを入力して第２識別結果データを取得し、識別器による第１データに対する識別処理におけるリファレンスデータと第１識別結果データとの第１差分を算出し、第１差分に基づいて、第１二乗誤差データ及び第１二乗誤差データの重みである第１重みを算出し、識別器による第２データに対する識別処理におけるリファレンスデータと第２識別結果データとの第２差分を算出し、第２差分に基づいて、第２二乗誤差データ及び第２二乗誤差データの重みである第２重みを算出し、第１二乗誤差データ、第２二乗誤差データ、第１重み及び第２重みに基づいて識別器を訓練する。第１識別結果データ及び第２識別結果データは、階数１以上のテンソルのデータである。

Description

情報処理方法及び情報処理システム

　本開示はコンピュータによって実行される情報処理方法、及び当該情報処理方法を実行する情報処理システムに関する。

　敵対的生成ネットワーク（ＧＡＮ：Generative Adversarial Networks）におけるディスクリミネータ（Discriminator、以下では識別器ともいう）の訓練の安定化を図るために、重みの正規化を利用する方法が提案されている（特許文献１参照）。

国際公開第２０１９／００４３５０号

Jun-Yan Zhu, Taesung Park, Phillip Isola, and Alexei A. Efros. "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks", in IEEE International Conference on Computer Vision (ICCV), 2017

　上記の方法では、訓練に用いられるデータによっては識別器の訓練（学習）の安定化が困難な場合がある。

　本開示は、このような場合において識別器の訓練をより安定的に収束させることが可能な情報処理方法等を提供する。

　本開示の一態様に係る情報処理方法は、コンピュータにより実行される情報処理方法であって、第１データ及び前記第１データに基づく模擬的なデータである第２データを取得し、識別器に前記第１データを入力して第１識別結果データを取得し、前記識別器による第１データに対する識別処理におけるリファレンスデータと前記第１識別結果データとの第１差分を算出し、前記第１差分に基づいて、第１二乗誤差データ及び前記第１二乗誤差データの重みである第１重みを算出し、前記識別器に前記第２データを入力して第２識別結果データを取得し、前記識別器による第２データに対する識別処理におけるリファレンスデータと前記第２識別結果データとの第２差分を算出し、前記第２差分に基づいて、第２二乗誤差データ及び前記第２二乗誤差データの重みである第２重みを算出し、前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記識別器を訓練し、前記第１識別結果データ及び前記第２識別結果データは、階数１以上のテンソルのデータである。

　また、本開示の一態様に係る情報処理システムは、第１データ及び前記第１データに基づく模擬的なデータである第２データを取得する取得部と、識別器に前記第１データを入力して取得される第１識別結果データと前記第１データに対する識別処理におけるリファレンスデータとの第１差分を算出し、前記識別器に前記第２データを入力して取得される第２識別結果データと前記第２データに対する識別処理におけるリファレンスデータとの第２差分を算出し、前記第１差分に基づいて、第１二乗誤差データ及び前記第１二乗誤差データの重みである第１重みを算出し、前記第２差分に基づいて、第２二乗誤差データ及び前記第２二乗誤差データの重みである第２重みを算出する重み算出部と、前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記識別器の訓練に用いられる誤差データを算出する誤差算出部と、前記誤差データを用いて前記識別器を訓練する訓練部とを備え、前記第１識別結果データ及び前記第２識別結果データは、階数１以上のテンソルのデータである。

　なお、包括的又は具体的なこれらの態様は、上記の方法及びシステムの他に、装置、集積回路、又はコンピュータが読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、装置、システム、集積回路、方法、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

　本開示に係る情報処理方法等によって、従来は訓練を収束させることが困難なデータを用いても識別器の訓練をより安定的に収束させることができる。

図１は、実施の形態に係る情報処理システムの学習フェーズにおける機能ブロック図である。図２は、実施の形態に係る情報処理システムの推論フェーズにおける機能ブロック図である。図３は、上記の学習フェーズにおいて設定される重みを示す関数のグラフを模式的に表したものである。図４は、上記の情報処理システムで識別器の訓練のために実行される情報処理方法の動作の手順例を示すフロー図である。

　（本開示の基礎となった知見）
　発明者らは、上述した提案されている従来の方法に関し、以下の問題が生じることを見出した。

　従来のこの方法では、識別器の重みが過大になることを避けるために、重みの正規化を行うことで識別器の出力の値が外れ値とならないようにする。より具体的には、識別器の各層の重みを要素とする重み行列の特異値を算出し、この特異値のノルムを用いて重み行列を正規化する。そして正規化後の重み行列を、当該識別器の出力の誤差に基づいて更新する。

　しかしながら、従来のこの方法では識別器の学習が収束しにくいケースもある。

　ＧＡＮには、例えば種類の異なる画像集合間の変換を目的として利用されるＣｙｃｌｅＧＡＮと呼ばれるものがある。ＣｙｃｌｅＧＡＮは、ＰａｔｃｈＧＡＮ方式かつＬＳＧＡＮ（Least Squares GAN）方式のＧＡＮである。ＰａｔｃｈＧＡＮ方式の識別器からの出力は、０又は１の値を取るスカラー値ではなく、入力画像全体を分割した複数の小領域（パッチ（ｐａｔｃｈ））各々について、生成器が出力する模擬的な画像と、生成器からの出力ではない画像とのいずれであるかの判定結果を示す値を要素とする行列である。そして、ＬＳＧＡＮ方式の当該識別器は、当該識別器が出力したこの行列と、この識別における正解を示す行列（０又は１が並ぶ行列）との二乗誤差に基づいて訓練される。このようなＣｙｃｌｅＧＡＮでは、位置合わせがなされていない画像のデータセットで訓練された生成器であっても好適な変換結果を示している（非特許文献１参照）。そのため、例えば訓練に必要な量の位置合わせ済みのデータセットの入手が現実的に難しい用途での高い実用性が期待されている。

　ところが、位置合わせがなされていないデータセットとして入手可能な画像のデータには、位置合わせ済みのものに比べて大きなノイズが含まれている可能性が高い。ここでいうノイズとは、例えば画像の画質、合焦の程度、又は色味に見られる変動によるものである。また、データセットが人物画像の場合には、写っている人物の姿勢、オクルージョン若しくは構図に応じて変わる画像に表れる身体の範囲、又は人物の持ち物若しくは背景といった、人物以外に写り込む物の変化もノイズの原因の例として挙げ得る。このようなノイズは、上記のＰａｔｃｈＧＡＮ方式かつＬＳＧＡＮ方式の識別器の訓練に影響を与える。具体的には、識別器の訓練を不安定にし、ひいては所望の質の画像を生成する生成器の取得を困難にする。そして、上述の従来の方法ではこのようなノイズに起因する識別器の訓練の安定化に対応できないという問題がある。

　このような問題に鑑みて案出された本開示の一態様に係る情報処理方法は、コンピュータにより実行される情報処理方法であって、第１データ及び前記第１データに基づく模擬的なデータである第２データを取得し、識別器に前記第１データを入力して第１識別結果データを取得し、前記識別器による第１データに対する識別処理におけるリファレンスデータと前記第１識別結果データとの第１差分を算出し、前記第１差分に基づいて、第１二乗誤差データ及び前記第１二乗誤差データの重みである第１重みを算出し、前記識別器に前記第２データを入力して第２識別結果データを取得し、前記識別器による第２データに対する識別処理におけるリファレンスデータと前記第２識別結果データとの第２差分を算出し、前記第２差分に基づいて、第２二乗誤差データ及び前記第２二乗誤差データの重みである第２重みを算出し、前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記識別器を訓練し、前記第１識別結果データ及び前記第２識別結果データは、階数１以上のテンソルのデータである。

　これにより、識別器の訓練データが含むノイズがある程度以上大きな場合には、その訓練の結果への影響が抑えられ、訓練をより安定的に収束させることができる。

　また、前記第１差分の絶対値が大きいほど前記第１重みをより小さくして前記第１二乗誤差データの前記識別器の訓練への影響度を下げ、前記第２差分の絶対値が大きいほど、前記第２重みをより小さくして、前記第２二乗誤差データの前記識別器の訓練への影響度を下げてもよい。

　また、前記第１差分の絶対値が閾値を超える場合、前記第１重みをゼロにし、前記第２差分の絶対値が閾値を超える場合、前記第２重みをゼロにしてもよい。

　また、前記第２データは、生成器によって前記第１データから生成されて出力され、前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記生成器を訓練してもよい。

　これにより、上記の識別器とＧＡＮにおいて敵対する生成器の訓練は、より安定的に収束する。

　また、前記第１データは画像データであってもよい。

　なお、包括的又は具体的なこれらの態様は、上記の方法及びシステムの他に、装置、集積回路、又はコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、装置、システム、集積回路、方法、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

　以下、本開示の一態様に係る情報処理方法及び情報処理システムの実施の形態について、図面を参照しながら説明する。ここで示す実施の形態は、本開示の一具体例を示すものである。したがって、以下の実施の形態で示される数値、形状、構成要素、構成要素の配置及び接続形態、並びにステップ（工程）及びステップの順序等は一例であって、本開示を限定するものではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素は任意に付加可能な構成要素である。また、各図は模式図であり、必ずしも厳密に図示されたものではない。

　（実施の形態）
　［１．構成］
　図１及び図２は、実施の形態に係る情報処理システムの機能構成例を示す機能ブロック図である。これらの情報処理システムは、それぞれプロセッサ及びメモリを備えてプログラムを実行する情報処理装置（コンピュータ）を一台以上用いて構成され、ＣｙｃｌｅＧＡＮを実装する。この情報処理システムの学習フェーズのための機能構成は図１に、推論フェーズのための機能構成は図２に分けて示している。各ブロックが示すこれらの機能構成の構成要素は、例えば、上記のプロセッサの一部又は全部がメモリの一部又は全部に記憶される１個又は複数個のプログラムを実行することで実現される。

　［１－１．訓練フェーズのための構成］
　図１に示すように、実施の形態に係る情報処理システム１０Ａは、第１変換部１１Ａ、判定部１２、重み算出部１３、第１誤差算出部１４、訓練部１５、第２変換部１６及び第２誤差算出部１７を備える。

　第１変換部１１Ａは、情報処理システム１０Ａが取得したＲｅａｌ画像に所定の変換を実施してＦａｋｅ画像を生成し出力する。所定の変換とは、例えば画質、又は画像のスタイル（作風）を変更することである。画像のスタイルの変更とは、例えば入力された実写画像を、所定の画家又は様式の絵画であるかのように見える画像にすること、またはその逆に、入力された油絵の画像又はＣＧ（Computer Graphics）による画像を、実写画像であるかのように見える画像にすることである。また、所定の変換の別の例として、画像に含まれる色を所定の方針で変更することであり、例えば入力された自然景観の写真画像を、異なる季節に同じ構図で撮られたものに見えるようにすることである。これに似たまた別の例としては、入力された画像に含まれる特定の被写体を、おもに色又は模様を変えることで別の被写体に見えるようにすることが挙げられる。より具体的には、画像に写る栗毛の馬がシマウマに、又はりんごがオレンジに見えるようにする変換である。第１変換部１１Ａによるこれらのような変換について別の表現をすると、入力された画像（Ｒｅａｌ画像）の基本的な構成は残しながら異なるスタイル、異なる季節の景観、又は異なる被写体の外観等を模擬した画像（Ｆａｋｅ画像）を生成して出力することであるとも言い得る。このような第１変換部１１Ａは、情報処理システム１０Ａによって実装されるＣｙｃｌｅＧＡＮに含まれる２つの生成器（Generator）のうちの一方であり、上記のような変換の用途に供するニューラルネットワークの生成モデルである。また、Ｒｅａｌ画像のデータは本実施の形態における第１データの例であり、Ｆａｋｅ画像のデータは本実施の形態における第２データの例である。

　判定部１２は、入力を受けた画像がＲｅａｌ画像であるか、第１変換部１１Ａが生成したＦａｋｅ画像であるかを判定する識別処理を行い、その結果を出力する。この識別処理は、上述したＰａｔｃｈＧＡＮの方式で行われ、識別処理の結果は、各小領域について、Ｒｅａｌ画像とＦａｋｅ画像とのいずれであるかの尤度を示す値を要素とする行列の形式で出力される。例えば、Ｒｅａｌ画像であると判定された小領域に対応する要素は１、Ｆａｋｅ画像であると判定された小領域に対応する要素は０、これら以外の小領域に対応する要素は、各小領域がＦａｋｅ画像であるか、Ｒｅａｌ画像であるかについての判定結果に応じた０より大きく１未満の値をとる行列である。このような判定部１２は、情報処理システム１０Ａによって実装されるＣｙｃｌｅＧＡＮにおける識別器であり、上記のような識別の用途に供するニューラルネットワークの識別モデルである。以下では、判定部１２が出力したこの識別処理の結果を示すデータ（以下、識別結果データともいう）のうち、Ｒｅａｌ画像の入力を受けて出力した識別結果データは、第１識別結果データともいい、Ｆａｋｅ画像の入力を受けて出力した識別結果データは、第２識別結果データともいう。

　重み算出部１３は、判定部１２が識別処理を実行して出力した識別結果データと、この識別処理の識別処理における正解を示すデータ（以下、リファレンスデータともいう）との差分を算出する。また、重み算出部１３は、この差分に基づいて、判定部１２が出力した識別結果データである行列の各要素の重み及び二乗誤差を算出する。リファレンスデータは、識別結果データと同サイズであって、全要素が１、又は全要素が０の行列である。上記の判定部１２の説明で用いた例に沿えば、Ｒｅａｌ画像が入力された場合に判定部１２が出力する行列の正解を示すのは、全要素が１の行列である。また、Ｆａｋｅ画像が入力された場合に判定部１２が出力する行列の正解を示すのは、全要素が０の行列である。なお、Ｒｅａｌ画像が入力された判定部１２が出力した識別結果に対して重み算出部１３が算出した重み及び二乗誤差を、以下ではそれぞれ第１重み、第１二乗誤差ともいう。また、Ｆａｋｅ画像が入力された判定部１２が出力した識別結果に対して重み算出部１３が算出した重み及び二乗誤差を、以下ではそれぞれ第２重み、第２二乗誤差ともいう。

　第１誤差算出部１４は、第１重み、第１二乗誤差、第２重み及び第２二乗誤差に基づいて、判定部１２の誤差を算出する。

　なお、重み算出部１３による上述の重みの算出、及び第１誤差算出部１４によるこの重みを用いた判定部１２の誤差の算出については、例を用いて後述する。

　訓練部１５は、第１誤差算出部１４が算出した誤差を用いて判定部１２の訓練を行う。

　第２変換部１６は、情報処理システム１０Ａによって実装されるＣｙｃｌｅＧＡＮにおける、ニューラルネットワークの生成モデルであるもう一方の生成器である。第２変換部１６は、第１変換部１１Ａが生成して出力したＦａｋｅ画像の入力を受ける。そして、このＦａｋｅ画像から、このＦａｋｅ画像に変換される前のＲｅａｌ画像を復元するような変換を実施し、変換によって生成した画像を出力する。

　第２誤差算出部１７は、第２変換部１６が出力した画像と、この画像に対応する正解の画像、つまり第１変換部１１Ａが出力したＦａｋｅ画像に変換される前のＲｅａｌ画像との差異に基づく誤差を算出する。この誤差は、訓練部１５に入力されて、第１変換部１１Ａの訓練に用いられる。

　情報処理システム１０Ａでは、これらの構成要素の各々が、情報処理システム１０Ａを構成する一台以上の情報処理装置によって実現される。

　なお、Ｒｅａｌ画像集合とは、第１変換部１１Ａによる上記のような何らかの模擬のための変換処理を受けていない画像の集合であって、複数の静止画像から、又は複数のフレームを含む動画像からなる。情報処理システム１０Ａは、Ｒｅａｌ画像集合のデータを、例えばＤＶＤ（Digital Versatile Disc）、半導体メモリなどの非一時的な記録媒体に記録されたものを、読取装置を用いて読み出して取得してもよいし、カメラから画像信号の入力を受けて取得してもよい。または情報処理システム１０Ａは、さらに通信装置を備えて、この通信装置が受信する信号を介してＲｅａｌ画像集合のデータを取得してもよい。

　［１－２．推論フェーズのための構成］
　図２に示すように、実施の形態に係る情報処理システム１０Ｂは、機械学習によって得られる生成モデルである変換部１１Ｂを備える。具体的には、変換部１１Ｂは、情報処理システム１０Ａにおいて上述の所定の変換のための訓練が繰返し実施された第１変換部１１Ａであり、例えばこのような変換性能に関する評価が所望の基準に達すると変換部１１Ｂとして扱われ得る。変換部１１Ｂは、未変換画像に所定の変換を実行して変換済画像を出力する。例えば変換部１１Ｂは、未変換画像として実写画像の入力を受けると、この実写画像を変換して所定の様式の絵画であるかのように見える変換済画像を生成して出力する。

　情報処理システム１０Ｂでは、変換部１１Ｂが、情報処理システム１０Ｂを構成する一台以上の情報処理装置によって実現される。情報処理システム１０Ｂを構成する情報処理装置は、情報処理システム１０Ａを構成するものと共通であってもよく、変換部１１Ｂは訓練がある程度以上収束した第１変換部１１Ａそのものであってもよい。また、情報処理システム１０Ｂを構成する情報処理装置は、情報処理システム１０Ａを構成するものと別のものであってもよい。例えば第１変換部１１Ａは、情報処理システム１０Ａを構成する複数台の据置型コンピュータ上にあり、変換部１１Ｂは、自動車等の移動体、携帯情報端末、又は家庭用電気機器等が備えるマイクロコントローラ上にあってもよい。この場合の変換部１１Ｂは、第１変換部１１Ａを軽量化（量子化）して取得されたものであってもよい。

　［２．外れ値の影響の抑制］
　従来のＧＡＮの訓練フェーズにおいては、識別器の出力と正解を示すリファレンスデータとの差分に基づいて算出される二乗誤差が識別器の訓練に用いられている。これに対して本実施の形態に係る情報処理システム１０Ａによる訓練フェーズでは、識別器である判定部１２の訓練における識別対象のデータに含まれる外れ値の影響を抑えるための処理がさらに実施される。この処理の具体例を以下に説明する。この例では、重みの設定にロバスト推定法のひとつであるＴｕｋｅｙのｂｉｗｅｉｇｈｔ推定法を利用している。

　情報処理システム１０Ａでは、上述のとおり、重み算出部１３によって、判定部１２が識別処理を実行して出力した識別結果データと、この識別処理におけるリファレンスデータとの差分が算出される。さらに重み算出部１３は、この差分に基づいて、判定部１２が出力した行列の各要素の重み（第１重み、第２重み）及び二乗誤差（第１二乗誤差、第２二乗誤差）を以下のように算出する。

　Ｒｅａｌ画像ｘが判定部１２に識別対象として入力された場合における、判定部１２が出力する第１識別結果データの各要素をＤ_１（ｘ）、リファレンスデータの各要素をＲ_１とすると、重み算出部１３は、第１識別結果データと当該リファレンスデータとの差分である第１差分ｄ_１を、
　ｄ_１＝Ｄ_１（ｘ）－Ｒ_１
　の式で表される演算によって得る。なお、この場合のリファレンスデータはすべての要素の値が１の行列であるため、Ｒ_１＝１である。

　ここで重み算出部１３は、第１差分ｄ_１の大きさ、すなわち絶対値が許容し得るか否かの境界を示す閾値（以下、誤差許容値という）をＴとすると、第１差分ｄ_１に対応する第１重みを示す次のような関数ｔ（ｄ_１）を算出する。

　ｄ_１＜－Ｔの場合：ｔ（ｄ_１）＝０

　Ｔ＜ｄ_１の場合：ｔ（ｄ_１）＝０

　図３は、第１重みを示す関数ｔ（ｄ_１）のグラフを模式的に表したものである。図３から分かるように、第１重みは、第１差分ｄ_１の絶対値が０から大きくなるにつれて１から減少して０に近づき、第１差分ｄ_１の絶対値が誤差許容値Ｔを超える範囲ではゼロになるよう設定される。

　同様に、Ｒｅａｌ画像ｚの入力を受けた生成器である第１変換部１１Ａによって出力されたＦａｋｅ画像Ｇ（ｚ）が判定部１２に識別対象として入力された場合における、判定部１２が出力する第２識別結果データの各要素をＤ_２（Ｇ（ｚ））、リファレンスデータの各要素をＲ_２とすると、重み算出部１３は、第２識別結果データと当該リファレンスデータとの差分である第２差分ｄ_２を、
　ｄ_２＝Ｄ_２（Ｇ（ｚ））－Ｒ_２
　の式で表される演算によって得る。なお、この場合のリファレンスデータはすべての要素の値が０の行列であるため、Ｒ_２＝０である。

　また、第２差分ｄ_２の絶対値の誤差許容値をＴとすると、第２差分ｄ_２に対応する第２重みを示す関数ｔ（ｄ_２）も、関数ｔ（ｄ_１）と同様に以下のとおり算出される。

　ｄ_２＜－Ｔの場合：ｔ（ｄ_２）＝０

　Ｔ＜ｄ_２の場合：ｔ（ｄ_２）＝０

　第２重みを示す関数ｔ（ｄ_２）のグラフもまた、模式的には図３のように表される。つまり、第２重みは、第２差分ｄ_２の絶対値が０から大きくなるにつれて１から減少して０に近づき、第２差分ｄ_２の絶対値が誤差許容値Ｔを超える範囲ではゼロになるよう設定される。

　重み算出部１３はさらに、判定部１２の識別結果の二乗誤差を算出する。具体的には、識別結果データである行列の各要素について上記で得た第１差分Ｄ_１（ｘ）－１に基づいて第１二乗誤差（Ｄ_１（ｘ）－１）^２を算出し、第２差分Ｄ_２（Ｇ（ｚ））－０に基づいて第２二乗誤差（Ｄ_２（Ｇ（ｚ））－０）^２を算出する。

　次は第１誤差算出部１４が、上記のように算出された第１重み、第１二乗誤差、第２重み及び第２二乗誤差に基づいて判定部１２の誤差を算出する。具体的には、第１二乗誤差の各要素に、ｄ_１の値に応じた第１重み（ｔ（ｄ_１））が乗じられる。この結果を以下ではＲｅａｌ画像誤差ともいう。また、第２二乗誤差の各要素に、ｄ_２の値に応じた第２重み（ｔ（ｄ_２））が乗じられる。この結果を以下ではＦａｋｅ画像誤差ともいう。そして、Ｒｅａｌ画像誤差とＦａｋｅ画像誤差とが加算された結果が判定部１２の誤差として得られる。この判定部１２の誤差が、訓練部１５によって判定部１２の訓練に用いられる。

　上記のように設定された重みを二乗誤差に適用することの意味は次のとおりである。第１差分又は第２差分の大きさ（絶対値）は、識別対象のデータの各部分（上記の画像の例では小領域）についての判定の正解からの乖離の大きさを示す。そして上記のように設定される各重みは、判定の正解からの乖離がより大きいほど小さい。このような重みを識別器への訓練に用いる二乗誤差に適用すると、判定部１２に訓練のために入力されたデータの各部分について、判定の正解からの乖離がより大きいほど、この訓練における誤差への加算が少ない。言い換えると、判定の正解からの乖離が大きいほど、訓練への影響が抑制される。ここで、判定部１２に訓練のために入力されたデータの外れ値を含む部分は、正解からより大きく乖離した判定がなされ得る。したがって、識別対象のデータに含まれる外れ値の、識別器の訓練への影響を抑制することができる。また、外れ値の逸脱の程度が大きいほど、その抑制は強く働く。上記の例では、判定の正解からの乖離が閾値を超える部分については重みがゼロに設定されるため、識別器の訓練への影響度はゼロになる。

　なお、上述の例では外れ値の影響を抑制するためにＴｕｋｅｙのｂｉｗｅｉｇｈｔ推定法を利用したが、外れ値の影響の抑制をする手法はこれに限定されない。上記のような二乗誤差の設定が可能なロバスト推定法である他のＭ推定法が用いられてもよい。

　［３．情報処理システムの動作］
　情報処理システム１０Ａにおいて実行される、識別器である判定部１２の訓練のための情報処理方法の動作について、その手順例を用いて説明する。図４は、この情報処理方法が実行される情報処理システム１０Ａの動作の手順例を示すフロー図である。

　（ステップＳ１０）識別器である判定部１２は、Ｒｅａｌ画像の集合から情報処理システム１０Ａが取得した画像の入力を受ける。

　（ステップＳ１１）判定部１２は、入力を受けた画像の小領域ごとにＲｅａｌ画像であるか、Ｆａｋｅ画像であるかを判定する識別処理を行い、その結果に基づく行列を算出して出力する。ここでは、識別対象の画像がＲｅａｌ画像であると想定して、算出された行列を便宜的に第１出力行列と称する。

　（ステップＳ１２）重み算出部１３は、ステップＳ１１で算出された第１出力行列を用いて各要素の重みである第１重みを算出する。第１重みの算出方法については、上述の「２．外れ値の影響の抑制」に挙げた例を参照されたい。

　（ステップＳ１３）重み算出部１３は、ステップＳ１１で算出された第１出力行列の各要素の二乗誤差である第１二乗誤差を算出する。第１二乗誤差の算出方法については、上述の「２．外れ値の影響の抑制」を参照されたい。

　（ステップＳ２０）判定部１２は、生成器である第１変換部１１ＡがＲｅａｌ画像を変換して生成したＦａｋｅ画像の入力を受ける。

　（ステップＳ２１）判定部１２は、入力を受けた画像の小領域ごとにＲｅａｌ画像であるか、Ｆａｋｅ画像であるかを判定する識別処理を行い、その結果に基づく行列を算出して出力する。ここでは、識別対象の画像がＦａｋｅ画像と想定して、算出された行列を便宜的に第２出力行列と称する。

　（ステップＳ２２）重み算出部１３は、ステップＳ２１で算出された第２出力行列を用いて各要素の重みである第２重みを算出する。第２重みの算出方法については、上述の「２．外れ値の影響の抑制」に挙げた例を参照されたい。

　（ステップＳ２３）重み算出部１３は、ステップＳ２１で算出された第２出力行列の各要素の二乗誤差である第２二乗誤差を算出する。第２二乗誤差の算出方法については、上述の「２．外れ値の影響の抑制」を参照されたい。

　（ステップＳ３０）第１誤差算出部１４は、ステップＳ１２で算出された第１重みをステップＳ１３で算出された第１二乗誤差に乗じて、Ｒｅａｌ画像誤差を算出する。

　（ステップＳ３１）第１誤差算出部１４は、ステップＳ２２で算出された第２重みをステップＳ２３で算出された第２二乗誤差に乗じて、Ｆａｋｅ画像誤差を算出する。

　（ステップＳ３２）第１誤差算出部１４は、ステップＳ３０で算出されたＲｅａｌ画像誤差とステップＳ３１で算出されたＦａｋｅ画像誤差とを加算して判定部１２の誤差を算出する。

　（ステップＳ３３）訓練部１５は、ステップＳ３２で算出された誤差を用いて識別器である判定部１２の訓練を実施する。

　なお、情報処理システム１０Ａによって行われる情報処理方法の内容は上記に限定されない。例えば、生成器である第１変換部１１Ａの訓練も訓練部１５によって行われる。この訓練は、例えば第２誤差算出部１７が算出する上述の誤差を用いて行われる。また、第１変換部１１Ａの訓練に、第１重み、第１二乗誤差データ、第２重み及び第２二乗誤差データが用いられてもよい。

　［４．補足事項］
　本開示の一又は複数の態様に係る情報処理方法及び情報処理システムは、上記の実施の形態の説明に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が想到する各種の変形を上記の実施の形態に施したものも、本開示の態様に含まれてもよい。下記にそのような変形の例、及び実施の形態の説明へのその他の補足事項を挙げる。

　（１）上記の実施の形態に係る情報処理システムは、ＣｙｃｌｅＧＡＮを実装するものを例に用いて説明したが、これに限定されない。本開示の一態様に係る情報処理システムは、ＰａｔｃｈＧＡＮ方式かつＬＳＧＡＮ方式の他の種類のＧＡＮ、例えばＣｏｍｂｏＧＡＮにも適用可能である。

　（２）上記の実施の形態に係る情報処理システムは、画像の変換及び識別を行うものを例に用いて説明したが、情報処理システムによる処理対象は画像のデータに限定されない。処理対象の他の例としては、音声、距離点群、圧力、温度、湿度、におい等のセンサデータ、言語のデータが含まれる。

　（３）上記の実施の形態に係る情報処理システムは、識別結果が行列形式である例を用いて説明したがこれに限定されない。本開示における情報処理システムは、階数１以上のテンソルのデータである識別結果データを扱う情報処理に適用し得る。

　（４）上述の各情報処理システムが備える機能的な構成要素の一部又は全部は、１個のシステムＬＳＩ（Large Scale Integration：大規模集積回路）で構成されてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ（Read-Only Memory）、ＲＡＭ（Random Access Memory）などを含んで構成されるコンピュータシステムである。ＲＯＭには、コンピュータプログラムが記憶されている。マイクロプロセッサがこのコンピュータプログラムに従って動作することにより、システムＬＳＩは各構成要素の機能を達成する。

　なお、ここでは、システムＬＳＩとしたが、集積度の違いにより、ＩＣ、ＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。また、集積回路化の手法はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）、あるいはＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　さらには、半導体技術の進歩又は派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてあり得る。

　（５）本開示の一態様は、上述の各情報処理システムだけではなく、情報処理システムに含まれる特徴的な構成要素による処理をステップとする情報処理方法であってもよい。この情報処理方法は、例えば、図４のフロー図を用いて説明した情報処理方法である。また、本開示の一態様は、この情報処理方法に含まれる特徴的な各ステップをコンピュータに実行させるコンピュータプログラムであってもよい。また、本開示の一態様は、そのようなコンピュータプログラムが記録された、コンピュータが読み取り可能な非一時的な記録媒体であってもよい。

　本開示は、ＧＡＮでの識別器の訓練に利用可能である。

　１０Ａ、１０Ｂ　情報処理システム
　１１Ａ　第１変換部
　１１Ｂ　変換部
　１２　判定部
　１３　重み算出部
　１４　第１誤差算出部
　１５　訓練部
　１６　第２変換部
　１７　第２誤差算出部

Claims

　コンピュータにより実行される情報処理方法であって、
　第１データ及び前記第１データに基づく模擬的なデータである第２データを取得し、
　識別器に前記第１データを入力して第１識別結果データを取得し、
　前記識別器による第１データに対する識別処理におけるリファレンスデータと前記第１識別結果データとの第１差分を算出し、
　前記第１差分に基づいて、第１二乗誤差データ及び前記第１二乗誤差データの重みである第１重みを算出し、
　前記識別器に前記第２データを入力して第２識別結果データを取得し、
　前記識別器による第２データに対する識別処理におけるリファレンスデータと前記第２識別結果データとの第２差分を算出し、
　前記第２差分に基づいて、第２二乗誤差データ及び前記第２二乗誤差データの重みである第２重みを算出し、
　前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記識別器を訓練し、
　前記第１識別結果データ及び前記第２識別結果データは、階数１以上のテンソルのデータである
　情報処理方法。
　前記第１差分の絶対値が大きいほど前記第１重みをより小さくして前記第１二乗誤差データの前記識別器の訓練への影響度を下げ、
　前記第２差分の絶対値が大きいほど、前記第２重みをより小さくして、前記第２二乗誤差データの前記識別器の訓練への影響度を下げる
　請求項１に記載の情報処理方法。
　前記第１差分の絶対値が閾値を超える場合、前記第１重みをゼロにし、
　前記第２差分の絶対値が閾値を超える場合、前記第２重みをゼロにする
　請求項２に記載の情報処理方法。
　前記第２データは、生成器によって前記第１データから生成されて出力され、
　前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記生成器を訓練する
　請求項１～３のいずれか１項に記載の情報処理方法。
　前記第１データは画像データである
　請求項１～４のいずれか１項に記載の情報処理方法。
　第１データ及び前記第１データに基づく模擬的なデータである第２データを取得する取得部と、
　識別器に前記第１データを入力して取得される第１識別結果データと前記第１データに対する識別処理におけるリファレンスデータとの第１差分を算出し、前記識別器に前記第２データを入力して取得される第２識別結果データと前記第２データに対する識別処理におけるリファレンスデータとの第２差分を算出し、前記第１差分に基づいて、第１二乗誤差データ及び前記第１二乗誤差データの重みである第１重みを算出し、前記第２差分に基づいて、第２二乗誤差データ及び前記第２二乗誤差データの重みである第２重みを算出する重み算出部と、
　前記第１二乗誤差データ及び前記第２二乗誤差データと、前記第１重み及び前記第２重みとに基づいて前記識別器の訓練に用いられる誤差データを算出する誤差算出部と、
　前記誤差データを用いて前記識別器を訓練する訓練部とを備え、
　前記第１識別結果データ及び前記第２識別結果データは、階数１以上のテンソルのデータである
　情報処理システム。