WO2023032360A1

WO2023032360A1 - 画像処理装置、画像処理方法、および画像処理プログラム

Info

Publication number: WO2023032360A1
Application number: PCT/JP2022/021174
Authority: WO
Inventors: 英樹竹原; 晋吾木田; 尹誠楊; 真季高見
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2021-08-31
Filing date: 2022-05-24
Publication date: 2023-03-09
Anticipated expiration: 2024-02-29
Also published as: JP2023034530A; EP4398186B1; JP7582127B2; EP4398186A4; US20240212323A1; EP4398186A1; CN117813633A

Abstract

基本クラス選択部（２０）は、入力データに対して、基本クラスを学習済みの基本ニューラルネットワークが出力する埋め込みベクトルと、基本クラスの重心ベクトルとに基づいて基本クラスを選択する。継続学習部（５０）は、基本クラスを学習済みの追加ニューラルネットワークを用いて追加クラスを継続学習する。追加クラス選択部（４０）は、入力データに対して、継続学習された追加ニューラルネットワークが出力する埋め込みベクトルと、基本クラスおよび追加クラスの重心ベクトルとに基づいて追加クラスを選択する。分類決定部（８０）は、基本クラス選択部（２０）により選択された基本クラスと、追加クラス選択部（４０）により選択された追加クラスとに基づいて、入力データをクラス分類する。

Description

画像処理装置、画像処理方法、および画像処理プログラム

　本発明は、機械学習に基づく画像処理技術に関する。

　人間は長期にわたる経験を通して新しい知識を学習することができ、昔の知識を忘れないように維持することができる。一方、畳み込みニューラルネットワーク（Convolutional Neural Network(CNN)）の知識は学習に使用したデータセットに依存しており、データ分布の変化に適応するためにはデータセット全体に対してＣＮＮのパラメータの再学習が必要となる。ＣＮＮでは、新しいタスクについて学習していくにつれて、昔のタスクに対する推定精度は低下していく。このようにＣＮＮでは連続学習を行うと新しいタスクの学習中に昔のタスクの学習結果を忘れてしまう致命的忘却(catastrophic forgetting)が避けられない。

　致命的忘却を回避する手法として、継続学習（incremental learningまたはcontinual learning）が提案されている。継続学習とは、新しいタスクや新しいデータが発生した時に、最初からモデルを学習するのではなく、現在の学習済みのモデルを改善して学習する学習方法である。継続学習の一つの手法として正則化ベースの継続学習があり、正則化損失を利用して学習する（特許文献１）。

国際公開第２０１７／１４５８５２号公報

Thomas Mensink, Jakob Verbeek, Florent Perronnin, Gabriela Csurka, "Distance-Based Image Classification: Generalizing to new classes at near-zero cost", IEEE Transactions on Pattern Analysis and Machine Intelligence, Institute of Electrical and Electronics Engineers, 2013, 35 (11), pp.2624-2637. Lu Yu, Bartlomiej Twardowski, Xialei Liu, Luis Herranz, Kai Wang, Yongmei Cheng, Shangling Jui, Joost van de Weijer, "Semantic Drift Compensation for Class-Incremental Learning", 2020 Computer Vision and Pattern Recognition, pp 6982-6991. Hanbin Zhao, Yongjian Fu, Mintong Kang, Qi Tian, Fei Wu, Xi Li, "MgSvF: Multi-Grained Slow vs. Fast Framework for Few-Shot Class-Incremental Learning", arXiv:2006.15524, 2021.

　特許文献１に記載の技術では、十分に致命的忘却を低減できないという課題があった。

　本発明はこうした状況に鑑みてなされたものであり、その目的は、致命的忘却を低減することができる機械学習に基づく画像処理技術を提供することにある。

　上記課題を解決するために、本実施形態のある態様の画像処理装置は、入力データに対して、基本クラスを学習済みの基本ニューラルネットワークが出力する埋め込みベクトルと、基本クラスの重心ベクトルとに基づいて基本クラスを選択する基本クラス選択部と、基本クラスを学習済みの追加ニューラルネットワークを用いて追加クラスを継続学習する継続学習部と、前記入力データに対して、継続学習された前記追加ニューラルネットワークが出力する埋め込みベクトルと、基本クラスおよび追加クラスの重心ベクトルとに基づいて追加クラスを選択する追加クラス選択部と、前記基本クラス選択部により選択された基本クラスと、前記追加クラス選択部により選択された追加クラスとに基づいて、前記入力データをクラス分類する分類決定部とを備える。

　本実施形態の別の態様は、画像処理方法である。この方法は、入力データに対して、基本クラスを学習済みの基本ニューラルネットワークが出力する埋め込みベクトルと、基本クラスの重心ベクトルとに基づいて基本クラスを選択する基本クラス選択ステップと、基本クラスを学習済みの追加ニューラルネットワークを用いて追加クラスを継続学習する継続学習ステップと、前記入力データに対して、継続学習された前記追加ニューラルネットワークが出力する埋め込みベクトルと、基本クラスおよび追加クラスの重心ベクトルとに基づいて追加クラスを選択する追加クラス選択ステップと、前記基本クラス選択ステップにより選択された基本クラスと、前記追加クラス選択ステップにより選択された追加クラスとに基づいて、前記入力データをクラス分類する分類決定ステップとを含む。

　なお、以上の構成要素の任意の組合せ、本実施形態の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本実施形態の態様として有効である。

　本実施形態によれば、致命的忘却を低減することができる機械学習に基づく画像処理技術を提供することができる。

実施の形態に係る画像処理装置の構成図である。図１の画像処理装置による継続学習処理を説明するフローチャートである。図１の基本ニューラルネットワーク処理部および追加ニューラルネットワーク処理部で用いられるニューラルネットワークモデルの構造を説明する図である。図１の画像処理装置による分類決定処理を説明するフローチャートである。

　図１は、実施の形態に係る画像処理装置１００の構成図である。画像処理装置１００は、基本ニューラルネットワーク処理部１０、基本クラス選択部２０、追加ニューラルネットワーク処理部３０、追加クラス選択部４０、継続学習部５０、重心導出部６０、重心ベクトル補正部７０、および分類決定部８０を含む。

　本実施の形態では、継続学習とメトリック学習を組み合わせた機械学習を行う。ここでは、入力データとして画像を例に説明するが、入力データは画像に限られない。画像間の関係性を考慮した埋め込み空間（特徴空間）を学習する手法としてメトリック学習がある（たとえば非特許文献１参照）。メトリック学習は、情報検索、データ分類、画像認識等の様々な分野で利用されている。正則化損失を利用して学習する継続学習は、メトリック損失を利用するメトリック学習と組み合わせることができる。

　本実施の形態では、継続学習の１つであるクラスインクリメンタル学習を利用する（たとえば非特許文献２、非特許文献３参照）。非特許文献２は１つのニューラルネットワークでクラスインクリメンタル学習を行う。非特許文献３は学習率の異なる２つのニューラルネットワークでクラスインクリメンタル学習を行い、２つのニューラルネットワークの特徴空間を結合した結合特徴空間で分類を行う。

　本実施の形態では、基本クラスを学習した基本ニューラルネットワークは変更せずに、基本クラスを学習済みで追加クラスを継続学習する追加ニューラルネットワークを更新する。入力画像に対して、基本ニューラルネットワークと追加ニューラルネットワークのそれぞれを用いてクラス分類（クラス選択）を行い、精度の高い（距離の近い）方のクラスに入力画像を分類する。

　図２は、画像処理装置１００による継続学習を説明するフローチャートである。図１および図２を参照して継続学習の構成と全体動作について説明する。

　最初に、基本クラスを学習済みのニューラルネットワークと、そのニューラルネットワークを用いて導出された基本クラスの重心ベクトルを取得する。基本クラスを学習済みのニューラルネットワークは、ネットワークから取得してもよく、基本クラスを含むデータセットを使って学習させてもよい。基本クラスを学習済みのニューラルネットワークはクラス分類学習されているものではなく、メトリック学習（埋め込み学習）されているものが望ましい。基本クラスの重心ベクトルは、ネットワークから取得してもよく、基本クラスの画像を学習済みのニューラルネットワークに入力し、学習済みのニューラルネットワークから出力される埋め込みベクトルについてクラス毎に重心を求め、クラス毎の重心ベクトルとして導出してもよい。ここでは、クラス毎の重心ベクトルの数は１とするが、複数でもよい。

　基本クラスを学習済みのニューラルネットワークを基本ニューラルネットワーク処理部１０と追加ニューラルネットワーク処理部３０に設定する（Ｓ１０）。

　基本クラスを学習済みのニューラルネットワークを用いて導出された基本クラスの重心ベクトルを基本クラス選択部２０と追加クラス選択部４０に設定する（Ｓ２０）。基本クラス選択部２０と追加クラス選択部４０はそれぞれ基本クラスの重心ベクトルを保存する。

　次に、継続学習である学習セッションｉをＮ回繰り返す（ｉ＝１，２，…，Ｎ）（Ｓ３０）。

　まず、追加ニューラルネットワーク処理部３０は、追加訓練データセットに含まれる追加クラス毎に、ある追加クラスの全ての画像を、学習セッションｉを行う前の追加ニューラルネットワークに入力して、当該追加クラスの全ての画像の埋め込みベクトルを導出する。重心導出部６０は、当該追加クラスの全ての画像の埋め込みベクトルから、当該追加クラスの重心ベクトルを導出する（Ｓ４０）。ここでの追加クラスの重心ベクトルは学習前の重心ベクトルである。なお、追加クラスの重心ベクトルは全ての追加クラスについて導出する。

　次に、継続学習部５０は、学習セッションｉとして、追加クラスを含む追加訓練データセットを使って、追加ニューラルネットワークを継続学習する（Ｓ５０）。

　次に、追加ニューラルネットワーク処理部３０は、追加訓練データセットに含まれる追加クラス毎に、ある追加クラスの全ての画像を、学習セッションｉを行った後の追加ニューラルネットワークに入力して、当該追加クラスの全ての画像の埋め込みベクトルを導出する。重心導出部６０は、当該追加クラスの全ての画像の埋め込みベクトルから、当該追加クラスの重心ベクトルを導出する（Ｓ６０）。ここでの追加クラスの重心ベクトルは学習後の重心ベクトルである。なお、追加クラスの重心ベクトルは全ての追加クラスについて導出する。

　次に、追加クラス選択部４０は、保存している基本クラスの重心ベクトルを削除する（Ｓ７０）。ここでは、削除する基本クラスの重心ベクトルの数は学習セッションｉで追加される追加クラスの数であるとする。削除する基本クラスの重心ベクトルは、学習セッションｉで追加される追加クラスの重心ベクトルと最近傍のものであるとする。基本クラスの重心ベクトルが全て削除された後は、重心ベクトルは削除しない。これにより、基本クラス選択部２０が保存する重心ベクトルの数と追加クラス選択部４０が保存する重心ベクトルの数を同一にすることができる。

　次に、重心ベクトル補正部７０は、追加クラス選択部４０が保存している既知のクラスの重心ベクトルを補正する（Ｓ８０）。既知のクラスには、基本クラスと学習セッション（ｉ－１）の追加クラスが含まれる。学習セッションｉの追加クラスは補正する必要はない。ｉを１だけインクリメントし（Ｓ９０）、ステップＳ３０に戻り、ｉ＝ＮまでステップＳ４０～Ｓ８０を繰り返し、ｉがＮを超えれば、終了する。

　学習済み（既知）のクラスの重心ベクトルの補正については、非特許文献２において図３を参照して説明されている方法を改良して利用する。

　重心ベクトル補正部７０は、学習済みのクラス（既知のクラス）の重心ベクトルの所定距離以内にある継続学習前のクラスの重心ベクトルと継続学習後のクラスの重心ベクトルにもとづいて、学習済みのクラスの重心ベクトルを補正する。具体的には、重心ベクトル補正部７０は、継続学習前のクラスの重心ベクトルから継続学習後のクラスの重心ベクトルの移動量を求め、それら移動量の平均移動量を算出する。重心ベクトル補正部７０は、平均移動量を学習済みのクラスの重心ベクトルに加算することにより、学習済みのクラスの重心ベクトルを補正する。

　非特許文献２では、既知クラスの重心ベクトルの半径Ｒ以内にある学習前の埋め込みベクトルを用いて補正するが、本実施の形態では、継続学習前のクラスの重心ベクトルと継続学習後のクラスの重心ベクトルの両方を用いて補正する点が異なる。平均移動量の算出において、重心ベクトルを多く利用する方が１つ１つの画像の細かい変動に影響されないようになるため、本実施の形態では、学習済みのクラスの重心ベクトルの所定距離以内にある継続学習前のクラスの重心ベクトルと継続学習後のクラスの重心ベクトルの両方を用いて補正することにした。

　継続学習部５０の構成と動作をより詳しく説明する。

　基本訓練データセットは多数の基本クラス（例えば、１００から１０００クラス程度）を含み、各クラスが多数画像（例えば、３０００画像）で構成される教師ありデータセットである。基本訓練データセットは、一般的な分類タスクを単独で学習させるのに十分なデータ量であるとする。

　それに対して、追加訓練データセットは少数の追加クラス（例えば、２から１０クラス程度）を含み、各追加クラスが少数画像（例えば、１から５枚程度）で構成される教師ありデータセットである。あるクラスに属するアンカー画像、アンカー画像と同じクラスに属するポジティブ画像、アンカー画像と異なるクラスに属するネガティブ画像の３つの画像を組にした訓練データを学習対象ニューラルネットワークに入力する。ここで、少数クラスを２としているのは、学習対象とするクラスが１であっても、ネガティブ画像として学習対象としないクラスが必要であるからである。また、ここでは、少数画像であるとするが、少数クラスであれば多数画像でもよい。

　図３は、基本ニューラルネットワーク処理部１０および追加ニューラルネットワーク処理部３０で用いられるニューラルネットワークモデルの構造を説明する図である。ニューラルネットワークは畳み込み層とプーリング層を含み、全結合層を含まないディープニューラルネットワークである。図３に示すＲｅｓＮｅｔ－１８の畳み込み層であるＣＯＮＶ－１からＣＯＮＶ－５を含み、その後に、グローバル平均プーリング層を有する構成であり、５１２次元の埋め込みベクトルを出力する。

　継続学習部５０は、メトリック損失Ｌｍｌと正則化損失Ｌｒを加算して次式のように全体損失Ｌを算出し、全体損失Ｌを最小化するようにニューラルネットワークを学習する。
　Ｌ＝Σ（Ｌｍｌ＋Ｌｒ）
ここで、Σは入力画像に対して和を取ることを示す。

　メトリック損失としてトリプレット損失を用いる。トリプレット損失Ｌｍｌは、アンカー画像の埋め込みベクトル、ポジティブ画像の埋め込みベクトル、およびネガティブ画像の埋め込みベクトルに基づいて次式で算出される。
　Ｌｍｌ＝ｄｐ－ｄｎ＋α
ここで、ｄｐは、アンカー画像の埋め込みベクトルとポジティブ画像間の埋め込みベクトルのユークリッド距離である。ｄｎは、アンカー画像の埋め込みベクトルとネガティブ画像間の埋め込みベクトルのユークリッド距離である。αはオフセットである。

　正則化損失Ｌｒは、次式のように画像をニューラルネットワークに入力した時に出力される埋め込みベクトルの学習セッション前後での差分を最小化するための埋め込みベクトル損失Ｌｒｖである。
　Ｌｒｖ＝｜｜Ｖ（ｉ）－Ｖ（ｉ―１）｜｜
ここで、Ｖ（ｉ）は、学習セッションｉのニューラルネットワークの出力する埋め込みベクトルである。Ｖ（ｉ―１）は、学習セッション（ｉ－１）のニューラルネットワークの出力する埋め込みベクトルである。｜｜・｜｜は、フロベニウスノルムを算出する意味を示す記号である。

　図４は、画像処理装置１００による分類決定を説明するフローチャートである。図１および図４を参照して分類決定の構成と全体動作について説明する。

　基本ニューラルネットワーク処理部１０は、分類対象の画像を基本ニューラルネットワークに入力し、追加ニューラルネットワーク処理部３０は、分類対象の画像を継続学習された追加ニューラルネットワークに入力する（Ｓ１００）。

　基本ニューラルネットワーク処理部１０は、基本ニューラルネットワークから出力される分類対象の画像の埋め込みベクトルを基本クラス選択部２０に供給し、追加ニューラルネットワーク処理部３０は、追加ニューラルネットワークから出力される分類対象の画像の埋め込みベクトルを追加クラス選択部４０に供給する（Ｓ１１０）。

　基本クラス選択部２０は、基本ニューラルネットワークが出力した基本埋め込みベクトルに基づいて、基本クラスを選択する（Ｓ１２０）。具体的には、基本埋め込みベクトルと最も距離が近い重心ベクトルを有する基本クラスを選択する。

　追加クラス選択部４０は、追加ニューラルネットワークが出力した追加埋め込みベクトルに基づいて、追加クラスを選択する（Ｓ１３０）。具体的には、追加埋め込みベクトルと最も距離が近い重心ベクトルを有する追加クラスを選択する。なお、追加クラス選択部４０は、追加埋め込みベクトルと最も距離が近い重心ベクトルを有するクラスが基本クラスであった場合でも基本クラスは選択しない。

　分類決定部８０は、基本クラス選択部２０により選択された基本クラスと、追加クラス選択部４０により選択された追加クラスとを比較して、重心ベクトルと埋め込みベクトルの距離がより近い方のクラスを、分類対象の画像の分類結果のクラスとして決定する（Ｓ１４０）。重心ベクトルと埋め込みベクトルの距離を逆数として確率のように扱い、確率の高低を判断し、確率の高い方のクラスを分類結果のクラスとして決定してもよい。ここで、選択された基本クラスと選択された追加クラスの間で、重心ベクトルと埋め込みベクトルの距離が同一である場合は、追加クラスの方を分類結果のクラスとして選択する。

（変形例）
　追加クラス選択部４０と分類決定部８０の変形例について説明する。実施の形態とは異なる動作のみを説明する。追加クラス選択部４０は、追加埋め込みベクトルと最も距離が近い重心ベクトルを、基本クラスであるか追加クラスであるかに関わらず選択する。ここで、基本クラス選択部２０で選択された基本クラスと追加クラス選択部４０で選択された基本クラスが異なる場合、分類決定部８０は基本クラス選択部２０で選択された基本クラスを分類結果のクラスとして選択する。ここで、分類決定部８０が基本クラス選択部２０で選択された基本クラスを分類結果のクラスとして選択する理由は、基本クラスについて基本ニューラルネットワークの方がより多いデータで学習しているからである。つまり、分類決定部８０は、より多くのデータで学習しているニューラルネットワークの分類結果を選択するようにする。

　以上説明した画像処理装置１００の各種の処理は、ＣＰＵやメモリ等のハードウェアを用いた装置として実現することができるのは勿論のこと、ＲＯＭ（リード・オンリ・メモリ）やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバと送受信することも、地上波あるいは衛星ディジタル放送のデータ放送として送受信することも可能である。

　以上述べたように、本実施の形態の画像処理装置１００によれば、基本ニューラルネットワークは継続学習しないため基本クラスを忘却しない。そのため、学習セッションが進んでも基本ニューラルネットワークは高い確率で基本クラスを分類することができる。基本ニューラルネットワークは追加クラスを継続学習しないため、基本ニューラルネットワークでは追加クラスを選択できないが、追加ニューラルネットワークは基本クラスに対して追加クラスを継続学習することで基本クラスと追加クラスの両方の特徴を考慮しながら学習し、追加クラスを選択することができる。

　本実施の形態によれば、基本クラスを忘却しない基本ニューラルネットワークによる分類結果と、追加クラスを継続学習した追加ニューラルネットワークによる分類結果とを評価して、より精度の高い方の分類結果を選択するため、致命的忘却を低減しつつ分類精度を向上させることができる。

　ここで、追加ニューラルネットワークが追加クラスのみを学習する場合、追加クラスのデータ数は少ないため、追加クラスの重心ベクトルは過剰適合になる可能性が高い。また、重心ベクトルの補正も同様に過剰に補正される可能性が高い。そのため、追加ニューラルネットワークの学習では追加クラスと共にデータ数の多い基本クラスを学習している基本ニューラルネットワークの出力する埋め込みベクトルを考慮することによって、追加クラスの重心ベクトルと重心ベクトルの補正が過剰適合により大きく変動するのを防ぎ、追加クラスの重心ベクトルと重心ベクトルの補正に対する過剰適合が大きく低減される。

　さらに、追加クラス選択部４０における基本クラスと追加クラスのクラス数の合計を一定とすることで、基本ニューラルネットワークと追加ニューラルネットワークの埋め込み空間を同程度の密度に保持することができ、基本クラス選択部２０と追加クラス選択部４０における埋め込み空間の距離を同程度に扱うことができる。基本クラス選択部２０と追加クラス選択部４０の間でクラス選択の偏りが生じるのを防ぐことができる。

　以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

　本発明は、機械学習に基づく画像処理技術に利用できる。

　１０　基本ニューラルネットワーク処理部、　２０　基本クラス選択部、　３０　追加ニューラルネットワーク処理部、　４０　追加クラス選択部、　５０　継続学習部、　６０　重心導出部、　７０　重心ベクトル補正部、　８０　分類決定部、　１００　画像処理装置。

Claims

　入力データに対して、基本クラスを学習済みの基本ニューラルネットワークが出力する埋め込みベクトルと、基本クラスの重心ベクトルとに基づいて基本クラスを選択する基本クラス選択部と、
　基本クラスを学習済みの追加ニューラルネットワークを用いて追加クラスを継続学習する継続学習部と、
　前記入力データに対して、継続学習された前記追加ニューラルネットワークが出力する埋め込みベクトルと、基本クラスおよび追加クラスの重心ベクトルとに基づいて追加クラスを選択する追加クラス選択部と、
　前記基本クラス選択部により選択された基本クラスと、前記追加クラス選択部により選択された追加クラスとに基づいて、前記入力データをクラス分類する分類決定部とを備えることを特徴とする画像処理装置。
　前記追加ニューラルネットワークが出力する埋め込みベクトルから重心ベクトルを導出する重心導出部と、
　前記重心導出部により導出された継続学習前の重心ベクトルと継続学習後の重心ベクトルとに基づいて、継続学習前に既知のクラスの重心ベクトルを補正する重心補正部とをさらに備えることを特徴とする請求項１に記載の画像処理装置。
　前記追加クラス選択部は、継続学習時の追加クラスの数だけ基本クラスの重心ベクトルを削除することを特徴とする請求項１に記載の画像処理装置。
　前記追加クラス選択部が選択したクラスが基本クラスであり、前記追加クラス選択部が選択した基本クラスと、前記基本クラス選択部が選択した基本クラスが異なる場合、前記分類決定部は前記基本クラス選択部が選択した基本クラスを分類結果とする請求項１に記載の画像処理装置。
　入力データに対して、基本クラスを学習済みの基本ニューラルネットワークが出力する埋め込みベクトルと、基本クラスの重心ベクトルとに基づいて基本クラスを選択する基本クラス選択ステップと、
　基本クラスを学習済みの追加ニューラルネットワークを用いて追加クラスを継続学習する継続学習ステップと、
　前記入力データに対して、継続学習された前記追加ニューラルネットワークが出力する埋め込みベクトルと、基本クラスおよび追加クラスの重心ベクトルとに基づいて追加クラスを選択する追加クラス選択ステップと、
　前記基本クラス選択ステップにより選択された基本クラスと、前記追加クラス選択ステップにより選択された追加クラスとに基づいて、前記入力データをクラス分類する分類決定ステップとを含むことを特徴とする画像処理方法。
　入力データに対して、基本クラスを学習済みの基本ニューラルネットワークが出力する埋め込みベクトルと、基本クラスの重心ベクトルとに基づいて基本クラスを選択する基本クラス選択ステップと、
　基本クラスを学習済みの追加ニューラルネットワークを用いて追加クラスを継続学習する継続学習ステップと、
　前記入力データに対して、継続学習された前記追加ニューラルネットワークが出力する埋め込みベクトルと、基本クラスおよび追加クラスの重心ベクトルとに基づいて追加クラスを選択する追加クラス選択ステップと、
　前記基本クラス選択ステップにより選択された基本クラスと、前記追加クラス選択ステップにより選択された追加クラスとに基づいて、前記入力データをクラス分類する分類決定ステップとをコンピュータに実行させることを特徴とする画像処理プログラム。