JP2022123734A - 画像判定方法、画像判定システムおよび画像判定プログラム - Google Patents
画像判定方法、画像判定システムおよび画像判定プログラム Download PDFInfo
- Publication number
- JP2022123734A JP2022123734A JP2021021239A JP2021021239A JP2022123734A JP 2022123734 A JP2022123734 A JP 2022123734A JP 2021021239 A JP2021021239 A JP 2021021239A JP 2021021239 A JP2021021239 A JP 2021021239A JP 2022123734 A JP2022123734 A JP 2022123734A
- Authority
- JP
- Japan
- Prior art keywords
- image
- determination
- model
- judgment
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004458 analytical method Methods 0.000 claims abstract description 51
- 230000006835 compression Effects 0.000 claims abstract description 31
- 238000007906 compression Methods 0.000 claims abstract description 31
- 238000004519 manufacturing process Methods 0.000 claims abstract description 21
- 238000013135 deep learning Methods 0.000 claims abstract description 14
- 239000003550 marker Substances 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 10
- 230000009471 action Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 24
- 238000003860 storage Methods 0.000 description 18
- 238000012800 visualization Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 14
- 235000014510 cooky Nutrition 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 230000002950 deficient Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Image Analysis (AREA)
- General Factory Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】効率よく判定精度の向上を図る画像判定方法、画像判定システムおよび画像判定プログラムを提供する。【解決手段】画像判定方法は、画像判定装置が、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定工程S107と、学習装置が、画像が判定モデルへ入力された場合の画像に対する判定モデルの着目点を抽出して可視化することによって判定モデルの判定結果を解析する第1の解析工程S111と、画像が判定モデルへ入力された場合の高次元空間における画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって判定モデルの判定結果を解析する第2の解析工程S112と、第1の解析工程S111および第2の解析工程S112における解析結果に基づいて分類された前記画像に基づいて判定モデルを学習する学習工程S104と、を含む。【選択図】図12
Description
開示の実施形態は、画像判定方法、画像判定システムおよび画像判定プログラムに関する。
従来、AI(Artificial Intelligence)の分野において、CNN(Convolutional Neural Network)等の深層学習ネットワークを判定モデルとして用いた画像判定により、画像中の物体を分類する技術が知られている(たとえば、特許文献1参照)。
こうした技術を利用することにより、たとえば製造ラインで製造された製品の画像から、かかる製品が良品であるか不良品であるか、また不良品であればどのような不良があるのかを分類することができる。
しかしながら、上述した従来技術には、効率よく判定精度の向上を図るうえで、さらなる改善の余地がある。
たとえば、深層学習ネットワークは、言わば一種の関数であり、ブラックボックスである。このため、従来技術では、誤判定が生じた場合などに、判定精度の向上のために学習用画像を再分類して判定モデルの再学習を行いたくとも、そもそもの判定根拠が不明確なため、適切に学習用画像を再分類することが難しかった。
また、判定精度の向上のためには、大量の学習用画像を用いて判定モデルを学習し、かかる判定モデルを大量の検証用画像を用いて検証することが望ましいが、従来技術では、その検証の多くを人が目視で行う必要があり、煩雑であった。
実施形態の一態様は、上記に鑑みてなされたものであって、効率よく判定精度の向上を図ることができる画像判定方法、画像判定システムおよび画像判定プログラムを提供することを目的とする。
実施形態の一態様に係る画像判定方法は、判定工程と、第1の解析工程と、第2の解析工程と、学習工程とを含む。前記判定工程は、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する。前記第1の解析工程は、前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する。前記第2の解析工程は、前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する。前記学習工程は、前記第1の解析工程および前記第2の解析工程における解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する。
実施形態の一態様によれば、効率よく判定精度の向上を図ることができる。
以下、添付図面を参照して、本願の開示する画像判定方法、画像判定システムおよび画像判定プログラムの実施形態を詳細に説明する。なお、以下に示す実施形態によりこの発明が限定されるものではない。
まず、実施形態に係る画像判定方法の概要について、図1および図2を参照して説明する。図1は、実施形態に係る画像判定方法の概要説明図(その1)である。また、図2は、実施形態に係る画像判定方法の概要説明図(その2)である。
なお、以下では、製造ラインにおいて製品として丸形のクッキーが製造され、かかるクッキーの出荷前検査等において、欠けや焦げ、割れなどのある不良品を検知する場合を例に挙げて説明を行う。また、以下では、画像判定用の判定モデルが、深層学習ネットワークであるものとする。
図1に示すように、実施形態に係る画像判定システム1は、学習装置10と、画像判定装置100と、プロジェクタ制御装置200とを含む。
画像判定装置100およびプロジェクタ制御装置200は、いわゆるエッジコンピューティングにおけるエッジプラットフォームに相当する装置であり、カメラ150、コンベア装置300、プロジェクタ400(図2参照)等を含む製造ラインに設けられる。
学習装置10は、イントラネットやインターネット、携帯電話回線網等のネットワークNを介して製造ラインと通信可能に設けられる。学習装置10は、主たる機能として、たとえば製造ラインから学習用画像を収集し、収集した学習用画像を分類して学習用データセットを生成し、かかるデータセットを用いた深層学習により判定モデルを学習する(機能F1)。また、学習装置10は、ネットワークNを介し、学習した判定モデルを画像判定装置100へ配信する。
画像判定装置100は、コンベア装置300を流れるクッキーP1,P2,P3…の画像を取得し、学習装置10によって学習された判定モデルを用いて画像判定を行い、学習装置10およびプロジェクタ制御装置200に対し、判定結果を出力する(機能F2)。
たとえば、図1には、画像判定装置100が画像判定により、クッキーP1は「欠け」のある不良品であり、クッキーP2は「焦げ」のある不良品であると判定した例を示している。なお、判定結果は少なくとも、判定された画像の分類クラスおよびそのスコア(類似度、確度等)を含む。
また、学習装置10に対する判定結果には、実際に判定された画像が学習用画像として含まれる。学習装置10は、かかる判定結果を、たとえばオペレータ(「ユーザ」の一例に相当)等の人手を介して検証し、誤判定等があれば、判定精度の向上のために学習用画像を再分類して判定モデルを再学習する。
このようなフィードバックを繰り返すことにより、画像判定システム1は、判定モデルの判定精度を向上させることができる。
ところで、既に述べたが、深層学習ネットワークは、言わば一種の関数であり、ブラックボックスである。このため、従来は、誤判定が生じた場合などに、学習用画像を再分類して判定モデルの再学習を行いたくとも、そもそもの判定根拠が不明確なため、適切に学習用画像を再分類することが難しかった。
また、判定精度の向上のためには、大量の学習用画像を用いて判定モデルを学習し、かかる判定モデルを大量の検証用画像を用いて検証することが望ましいが、従来は、その検証の多くをオペレータ等が目視で行う必要があり、煩雑であった。
そこで、実施形態に係る画像判定方法では、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定し、上記画像が判定モデルへ入力された場合の上記画像に対する判定モデルの着目点を抽出して可視化することによって判定モデルの判定結果を解析し、上記画像が判定モデルへ入力された場合の高次元空間における上記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって判定モデルの判定結果を解析し、着目点抽出および次元圧縮による解析結果に基づいて分類された上記画像に基づいて判定モデルを学習することとした。
具体的には、図1に示すように、実施形態に係る画像判定方法では、学習装置10が、2つの手法により判定モデルの判定結果を解析する(ステップS1)。第1の手法では、学習装置10は、勾配荷重クラス活性化マッピング手法(Grad-CAM:Gradient-weighted Class Activation Mapping)を用いた「着目点抽出」により、判定モデルによる判定根拠を可視化する。
これにより、オペレータは、判定モデルが「どこを見て分類(判定)したか」を一目で把握できるようになるため、たとえば誤判定している場合に、対象画像を適切に分類し直すことが可能となる。なお、かかる第1の手法による可視化の具体例については、図5および図6を用いた説明で後述する。
また、第2の手法では、学習装置10は、UMAP(Uniform Manifold Approximation and Projection)を用いた「次元圧縮」(次元削減とも言う)により、判定結果をより見やすい形で可視化する。
UMAPは、機械学習による非線形次元圧縮手法であり、リーマン幾何学と代数トポロジーに基づき、高次元空間のデータ構造を保ち、トポロジー間のクロス・エントロピーを最小にしながら低次元のデータに変換する。すなわち、実施形態に係る画像判定方法では、かかるUMAPを用いて、画像が判定モデルへ入力された場合の高次元空間における画像の特徴量を次元圧縮による低次元表現へ変換して可視化する。
このため、第2の手法によれば、低次元の埋め込み空間に、判定結果の分布をよりバラツキの少ない形で明示することが可能となり、誤判定している画像をオペレータが一目で分かるように可視化することが可能となる。かかる第2の手法による可視化の具体例については、図7~図9を用いた説明で後述する。
そして、学習装置10は、かかる2つの手法による解析結果に基づき、学習用画像を再分類して再学習を行い(ステップS2)、再学習した判定モデルを画像判定装置100へ配信する。そして、画像判定装置100は、再学習された判定モデルを用いて、以降の画像判定を行うこととなる。
したがって、実施形態に係る画像判定方法によれば、効率よく判定精度の向上を図ることができる。
一方、プロジェクタ制御装置200は、製造ラインに設けられたプロジェクタ400を制御する装置である。具体的には、図2に示すように、実施形態に係る画像判定方法では、プロジェクタ制御装置200は、画像判定装置100の判定結果に応じたプロジェクタ投影を行う。
より具体的には、プロジェクタ制御装置200は、コンベア装置300を流れるクッキーP1,P2,P3…に対し、プロジェクタ400によりマーカーを投影させる(ステップS3)。
このとき、プロジェクタ制御装置200は、コンベア装置300のコンベアの搬送速度と同じ速度でマーカーをスクロールさせる(ステップS31)。言い換えれば、プロジェクタ制御装置200は、マーカーが対象のクッキーP1,P2,P3…をトラッキングするように、プロジェクタ400によりマーカーを投影させる。
また、プロジェクタ制御装置200は、分類クラスや取るべき処置に応じて、マーカーの色や形を変更させる(ステップS32)。たとえば、プロジェクタ制御装置200は、分類クラスが「欠け」のクッキーP1と、「焦げ」のクッキーP2とで、マーカーの色や形を変更させる。
また、たとえば、プロジェクタ制御装置200は、「コンベアから除去すべき」や、「生産へフィードバックすべき」といった取るべき処置に応じて、マーカーの色や形を変更させる。また、プロジェクタ制御装置200は、判定結果に含まれる上述のスコアに応じて、「AIが判定に悩んだもの」、すなわちスコアがグレーゾーンのものに、それと分かるマーカーを投影し、ライン担当者の目視によるチェックを促すようにしてもよい。
これにより、実施形態に係る画像判定方法によれば、判定モデルの高い判定精度に応じて、その結果を適切に製造ラインに反映させることが可能となる。なお、プロジェクタ制御装置200は、「判定結果反映装置」の一例である。したがって、判定結果反映装置は、製造ラインに設けられ、画像判定装置100の判定結果を反映すべき他の装置であってもよい。たとえば、判定結果反映装置は、画像判定装置100の判定結果に応じて火加減を調節するクッキーのベイク装置等であってもよい。
以下、上述した実施形態に係る画像判定方法を適用した画像判定システム1の構成について、さらに具体的に説明する。
図3は、実施形態に係る学習装置10のブロック図である。また、図4は、解析部13dのブロック図である。なお、図3、図4、および、後に示す図10,11では、本実施形態の特徴を説明するために必要な構成要素を機能ブロックで表しており、一般的な構成要素についての記載を省略している。
換言すれば、図3、図4、図10および図11に図示される各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。たとえば、各機能ブロックの分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することが可能である。
なお、図3、図4、図10および図11を用いた説明では、これまでに既に述べた構成要素については、説明を簡略するか、省略する場合がある。
図3に示すように、実施形態に係る学習装置10は、通信部11と、記憶部12と、制御部13とを備える。また、学習装置10は、操作部3と、表示部5とが接続される。操作部3は、キーボードやマウス、タッチパネル等によって実現される。表示部5は、ディスプレイ等によって実現される。
通信部11は、たとえば、NIC(Network Interface Card)等によって実現される。通信部11は、ネットワークNに対し有線または無線で接続され、画像判定装置100を含む製造ラインとの間で情報の送受信を行う。
記憶部12は、たとえば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示す例では、記憶部12は、収集情報データベース(DB)12aと、学習用データセット12bと、判定モデル12cとを記憶する。
収集情報データベース12aは、通信部11を介し、後述する収集部13aによって収集される判定結果を含む各種のデータが格納されるデータベースである。学習用データセット12bは、収集情報データベース12aへ格納された判定結果、および、操作部3を介したオペレータの操作等に基づき、後述する分類部13bによって分類クラスごとに分類された学習用画像のデータセットである。判定モデル12cは、後述する学習部13cによって学習される深層学習ネットワークである。
制御部13は、コントローラ(controller)であり、たとえば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、記憶部12に記憶されている図示略の各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部13は、たとえば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現することができる。
制御部13は、収集部13aと、分類部13bと、学習部13cと、解析部13dと、表示制御部13eと、配信部13fとを有し、以下に説明する情報処理の機能や作用を実現または実行する。
収集部13aは、通信部11を介し、画像判定装置100からの判定結果を収集する。また、収集部13aは、収集した判定結果を収集情報データベース12aへ格納する。
分類部13bは、収集情報データベース12aへ格納された判定結果、および、操作部3を介したオペレータの操作等に基づき、学習用画像を「正常」、「欠け」、「焦げ」、「割れ」といった分類クラスごとに分類し、学習用データセット12bを生成する。学習部13cは、学習用データセット12bに基づき、判定モデル12cを学習する。
解析部13dは、収集情報データベース12aへ格納された判定結果、および、判定モデル12cに基づき、上述した第1の手法および第2の手法によって判定結果を解析する。図4に示すように、解析部13dは、着目点抽出部13daと、次元圧縮部13dbとを有する。
着目点抽出部13daは、上述したGrad-CAMを用いた着目点抽出により、学習用画像を判定モデル12cへ入力したときの判定モデル12cによる判定根拠を可視化する。
次元圧縮部13dbは、上述したUMAPを用いた次元圧縮により、低次元の埋め込み空間に、判定結果の分布を可視化する。なお、UMAPは、次元圧縮手法の一例であり、他の手法を用いることを限定するものではない。たとえば、主成分分析や、t分布型確率的近傍埋め込み法(t-SNE:t-distributed Stochastic Neighbor Embedding)等を用いてもよいが、計算速度は、UMAPがより高速である。
ここで、着目点抽出部13daおよび次元圧縮部13dbによる可視化の具体例について、図5~図9を用いて説明する。図5は、着目点抽出部13daによる可視化の具体例の説明図(その1)である。また、図6は、着目点抽出部13daによる可視化の具体例の説明図(その2)である。
また、図7は、次元圧縮部13dbによる可視化の具体例の説明図(その1)である。また、図8は、次元圧縮部13dbによる可視化の具体例の説明図(その2)である。また、図9は、次元圧縮部13dbによる可視化の具体例の説明図(その3)である。
まず、図6を用いた説明では、図5に示すように、判定モデル12cが、欠けCがあると判定するクッキーPの画像について考える。着目点抽出部13daは、このような欠けCがあると判定される画像p1,p2,p3…を判定モデル12cへ入力し、欠けCがあると判定された判定根拠を可視化する。
深層学習ネットワークは、畳み込み層とプーリング層を何層にもわたって積み重ねた特徴抽出部と、その特徴量出力を受け取ってクラスラベルと照合して教師あり学習を行う識別部との2つの部分に分けられる。また、識別部は通常、全結合の多層ニューラルネットワークで構成され、その最終層は特徴量を各分類クラスのスコアに変換するソフトマックス層になっている。
スコアは、入力画像に各分類クラスのタグが付与される確率(類似度と言い換えても可)や確度である。判定モデル12cによる判定結果は、かかるスコアが最大となる分類クラスである。
着目点抽出部13daは、Grad-CAMにより、分類クラスごとのスコアへの影響が大きい画像箇所を微分係数(勾配と言い換えても可)の平均化によって特定し、ヒートマップ化する。
図6には、かかるヒートマップの例を示している。図6の例では、画像p1,p2については、欠けCの部分のみがヒートマップ化され、判定モデル12cが、まさに欠けCに着目して欠けCがあると判定していることが分かる。したがって、画像p1,p2は、分類クラス「欠け」の学習用画像として適していることが一目で分かる。
一方で、画像p3については、欠けCの部分だけでなく、焦げBの部分もヒートマップ化され、判定モデル12cが、欠けCだけでなく焦げBにも着目していることが分かる。言い換えれば、画像p3は、分類クラス「欠け」の学習用画像としては、ノイズ成分を含むものであることが一目で分かる。こうした場合に、かかるヒートマップは、オペレータに、画像p3が分類クラス「欠け」の学習用画像としては適さないとして、学習用から除外させることができる。これにより、効率よく判定精度の向上に資することができる。
また、図7~図9に示すように、次元圧縮部13dbは、たとえば判定モデル12cの高次元空間の特徴量マップを低次元(ここでは、3次元)に次元圧縮し、低次元の埋め込み空間に判定結果の分布を可視化する。また、次元圧縮部13dbは、かかる可視化情報を、オペレータに操作可能なGUI(Graphic User Interface)ツールとして生成する。
たとえば、図7に示すように、次元圧縮部13dbは、各判定結果に対応するチェックボックスを有するGUIツールを生成する。かかるGUIツールにおいて、図7に示すように、「欠け」および「焦げ」がチェックされたものとする。
すると、図7に示すように、「欠け」の判定結果を受けた各画像と、「焦げ」の判定を受けた各画像との、次元圧縮された低次元空間における分布が可視化される。なお、図中の低次元空間における丸印の各々は、各画像に対応しており、次元圧縮部13dbは、オペレータがその一つ一つを選択可能となるようにGUIツールを生成する。
ここで、図中のカーソルCrが指すように、たとえば「欠け」と判定されているものの、特徴量としては「欠け」よりも「焦げ」の方にきわめて近い画像があり、オペレータがこれを選択したものとする。
すると、図8に示すように、次元圧縮部13dbは、かかる画像のファイル名や分類クラスのラベル名といった画像の詳細情報が示されるようにGUIツールを生成する。同図の場合、その詳細情報によれば、該当の画像「IMG_1001.png」が分類クラス「欠け」であるにも関わらず、その特徴量は「焦げ」にきわめて近いため、本来であれば該当の画像が「焦げ」と判定されるべき誤判定であることが分かる。
したがって、オペレータは、かかるGUIツールにより、誤判定を一目で把握することができる。そして、オペレータは、分類部13bに該当の画像の分類をやり直させたうえで、学習部13cが判定モデル12cを学習することにより、判定モデル12cの判定精度を向上させることができる。
なお、図9に示すように、GUIツールにおいて、さらに「割れ」のチェックボックスがチェックされた場合には、低次元空間にさらに「割れ」の各画像の分布が可視化されることとなる。また、図7~図9には図示していないが、オペレータは、GUIツール上の低次元空間を任意に360°回転させたり、拡大したり、縮小したりすることが可能である。
図3の説明に戻る。表示制御部13eは、解析部13dの解析結果を表示部5に表示させる。表示部5から操作部3へ破線の矢印で示すように、オペレータが、図5~図9に示したような解析部13dの解析結果に基づいて再分類を指示すると、分類部13bは、学習用データセット12bの学習用画像を再分類し、学習部13cに判定モデル12cを学習させる。
配信部13fは、通信部11を介し、学習部13cによって学習された判定モデル12cを画像判定装置100へ配信する。
次に、画像判定装置100の構成について説明する。図10は、実施形態に係る画像判定装置100のブロック図である。
図10に示すように、実施形態に係る画像判定装置100は、通信部101と、記憶部102と、制御部103とを備える。
通信部101は、上述した通信部11と同様に、たとえば、NIC等によって実現される。通信部101は、ネットワークN、カメラ150およびプロジェクタ制御装置200に対し有線または無線で接続され、学習装置10、カメラ150およびプロジェクタ制御装置200との間で情報の送受信を行う。
記憶部102は、上述した記憶部12と同様に、たとえば、RAM、ROM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図10に示す例では、記憶部102は、判定モデル102aを記憶する。判定モデル102aは、学習装置から配信される判定モデル12cに相当する。
制御部103は、上述した制御部13と同様に、コントローラであり、たとえば、CPUやMPU等によって、記憶部102に記憶されている図示略の各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部103は、上述した制御部13と同様に、たとえば、ASICやFPGA等の集積回路により実現することができる。
制御部103は、取得部103aと、判定部103bと、出力部103cとを有し、以下に説明する情報処理の機能や作用を実現または実行する。
取得部103aは、通信部101を介し、学習装置10から配信される判定モデル12cを取得し、判定モデル102aとして記憶部102へ記憶させる。また、取得部103aは、通信部101を介し、カメラ150によって撮影されるクッキーPの画像を取得し、判定部103bへ出力する。
判定部103bは、取得部103aによって取得された画像を判定モデル102aへ入力し、判定モデル102aから判定結果を取得する。また、判定部103bは、取得した判定結果を出力部103cへ出力する。
出力部103cは、通信部101を介し、判定部103bからの判定結果を学習装置10およびプロジェクタ制御装置200に対し出力する。
次に、プロジェクタ制御装置200の構成について説明する。図11は、実施形態に係るプロジェクタ制御装置200のブロック図である。
図11に示すように、実施形態に係るプロジェクタ制御装置200は、通信部201と、記憶部202と、制御部203とを備える。
通信部201は、上述した通信部11,101と同様に、たとえば、NIC等によって実現される。通信部201は、画像判定装置100およびコンベア装置300に対し有線または無線で接続され、画像判定装置100およびコンベア装置300との間で情報の送受信を行う。
記憶部202は、上述した記憶部12,102と同様に、たとえば、RAM、ROM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図11に示す例では、記憶部202は、投影設定情報202aを記憶する。投影設定情報202aは、画像判定装置100からの判定結果に応じたマーカーの投影に関する設定情報である。
制御部203は、上述した制御部13,103と同様に、コントローラであり、たとえば、CPUやMPU等によって、記憶部202に記憶されている図示略の各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部203は、上述した制御部13,103と同様に、たとえば、ASICやFPGA等の集積回路により実現することができる。
制御部203は、取得部203aと、投影制御部203bとを有し、以下に説明する情報処理の機能や作用を実現または実行する。
取得部203aは、通信部201を介し、画像判定装置100から出力される判定結果を取得し、投影制御部203bへ出力する。また、取得部203aは、通信部201を介し、コンベア装置300からコンベアの搬送速度を取得し、投影制御部203bへ出力する。
投影制御部203bは、取得部203aによって取得された判定結果、搬送速度および投影設定情報202aに基づき、プロジェクタ400によるマーカーの投影を制御する。
次に、実施形態に係る画像判定システム1が実行する処理手順について、図12を用いて説明する。図12は、実施形態に係る画像判定装置100が実行する処理手順を示す処理シーケンスである。
図12に示すように、まず画像判定システム1の運用前等において、学習装置10が学習用画像を収集する(ステップS101)。そして、学習装置10は、学習用画像を分類し(ステップS102)、学習用データセット12bを生成する(ステップS103)。
そして、学習装置10は、学習用データセット12bを用いて判定モデル12cを学習し(ステップS104)、画像判定装置100へ判定モデル12cを配信する(ステップS105)。
画像判定装置100は、カメラ150によって撮影された画像を取得し(ステップS106)、判定モデル102aを用いて画像を判定する(ステップS107)。そして、判定結果を学習装置10およびプロジェクタ制御装置200へ出力する(ステップS108,S109)。
学習装置10は、画像判定装置100からの判定結果を収集し(ステップS110)、着目点抽出による解析(ステップS111)、および、次元圧縮による解析(ステップS112)を実行する。
そして、学習装置10は、それらの解析結果に基づき、学習用画像を再分類させる(ステップS113)。そして、ステップS104からの処理を繰り返す。
一方、プロジェクタ制御装置200は、画像判定装置100からの判定結果に応じたプロジェクタ投影を行うことを繰り返す(ステップS114)。
なお、上述してきた実施形態に係る学習装置10、画像判定装置100およびプロジェクタ制御装置200は、たとえば図13に示すような構成のコンピュータ1000によって実現される。学習装置10を例に挙げて説明する。図13は、学習装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インタフェース(I/F)1500、入出力インタフェース(I/F)1600、および、メディアインタフェース(I/F)67を備える。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラムおよび当該プログラムによって使用されるデータ等を格納する。通信インタフェース1500は、通信ネットワークを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信ネットワークを介して他の機器へ送信する。
CPU1100は、入出力インタフェース1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インタフェース1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インタフェース1600を介して出力装置へ出力する。
メディアインタフェース1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、当該プログラムを、メディアインタフェース1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、たとえばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または、半導体メモリ等である。
たとえば、コンピュータ1000が実施形態に係る学習装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部13の各機能を実現する。また、HDD1400には、記憶部12内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信ネットワークを介してこれらのプログラムを取得してもよい。
上述してきたように、実施形態に係る画像判定システム1は、判定部103bと、着目点抽出部13da(「第1の解析部」の一例に相当)と、次元圧縮部13db(「第2の解析部」の一例に相当)と、学習部13cとを含む。判定部103bは、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する。着目点抽出部13daは、上記画像が判定モデルへ入力された場合の上記画像に対する判定モデルの着目点を抽出して可視化することによって判定モデルの判定結果を解析する。次元圧縮部13dbは、上記画像が判定モデルへ入力された場合の高次元空間における上記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって判定モデルの判定結果を解析する。学習部13cは、着目点抽出部13daおよび次元圧縮部13dbによる解析結果に基づいて分類された上記画像に基づいて判定モデルを学習する。
したがって、実施形態に係る画像判定システム1によれば、効率よく判定精度の向上を図ることができる。
なお、上述した実施形態では、学習用画像の再分類に際し、オペレータの操作を要することとしたが、これに限られるものではなく、解析部13dの解析結果に基づいて分類部13bが自動的に再分類を行うようにしてもよい。
かかる場合、分類部13bは、たとえば解析部13dが可視化したヒートマップや低次元空間マップを画像解析する画像解析機能を有し、その画像解析結果に基づいて学習用画像の再分類を行うこととなる。
また、上述した実施形態では、着目点抽出のアルゴリズムとしてGrad-CAMを用いることしたが、これに限られるものではなく、たとえばGuided Backpropagationの結果にGrad-CAMの出力を重ねるGuided Grad-CAMと呼ばれるアルゴリズム等を用いることとしてもよい。
また、上述した実施形態では、製造ラインにおける製品がクッキーPであることとしたが、無論、製品の種別を限定するものではない。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
1 画像判定システム
10 学習装置
12c 判定モデル
13 制御部
13a 収集部
13b 分類部
13c 学習部
13d 解析部
13da 着目点抽出部
13db 次元圧縮部
13e 表示制御部
13f 配信部
100 画像判定装置
102a 判定モデル
103 制御部
103a 取得部
103b 判定部
103c 出力部
200 プロジェクタ制御装置
203 制御部
203a 取得部
203b 投影制御部
300 コンベア装置
400 プロジェクタ
10 学習装置
12c 判定モデル
13 制御部
13a 収集部
13b 分類部
13c 学習部
13d 解析部
13da 着目点抽出部
13db 次元圧縮部
13e 表示制御部
13f 配信部
100 画像判定装置
102a 判定モデル
103 制御部
103a 取得部
103b 判定部
103c 出力部
200 プロジェクタ制御装置
203 制御部
203a 取得部
203b 投影制御部
300 コンベア装置
400 プロジェクタ
Claims (10)
- 製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定工程と、
前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する第1の解析工程と、
前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する第2の解析工程と、
前記第1の解析工程および前記第2の解析工程における解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する学習工程と
を含むことを特徴とする画像判定方法。 - 前記学習工程は、
前記第1の解析工程において、一つの前記画像について異なる複数の分類クラスに対応する前記着目点が抽出された場合に、当該画像を学習用画像から除外して前記判定モデルを学習する
ことを特徴とする請求項1に記載の画像判定方法。 - 前記第2の解析工程は、
前記低次元表現による前記判定モデルの判定結果の分布をGUI化し、該GUIを介してユーザに前記画像を分類させる
ことを特徴とする請求項1または2に記載の画像判定方法。 - 前記第1の解析工程は、
Grad-CAMを用いて前記着目点を抽出して可視化する
ことを特徴とする請求項1、2または3に記載の画像判定方法。 - 前記第2の解析工程は、
UMAPを用いた前記次元圧縮により前記画像の特徴量を前記低次元表現へ変換して可視化する
ことを特徴とする請求項1~4のいずれか一つに記載の画像判定方法。 - 前記判定モデルの判定結果を前記製造ラインに反映する判定結果反映工程
をさらに含むことを特徴とする請求項1~5のいずれか一つに記載の画像判定方法。 - 前記製造ラインは、
当該製造ライン上の前記製品に対してマーカーを投影するプロジェクタを有しており、
前記判定結果反映工程は、
前記製品の分類クラスおよび取るべき処置に応じて、少なくとも前記マーカーの色および形を変更させる
ことを特徴とする請求項6に記載の画像判定方法。 - 前記判定結果反映工程は、
前記製品の搬送速度と同じ速度で前記マーカーをスクロールさせる
ことを特徴とする請求項7に記載の画像判定方法。 - 製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定部と、
前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する第1の解析部と、
前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する第2の解析部と、
前記第1の解析部および前記第2の解析部による解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する学習部と
を備えることを特徴とする画像判定システム。 - 製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定手順と、
前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する第1の解析手順と、
前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する第2の解析手順と、
前記第1の解析手順および前記第2の解析手順における解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する学習手順と
をコンピュータに実行させることを特徴とする画像判定プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021021239A JP2022123734A (ja) | 2021-02-12 | 2021-02-12 | 画像判定方法、画像判定システムおよび画像判定プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021021239A JP2022123734A (ja) | 2021-02-12 | 2021-02-12 | 画像判定方法、画像判定システムおよび画像判定プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2022123734A true JP2022123734A (ja) | 2022-08-24 |
Family
ID=82940432
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021021239A Pending JP2022123734A (ja) | 2021-02-12 | 2021-02-12 | 画像判定方法、画像判定システムおよび画像判定プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2022123734A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024161744A1 (ja) * | 2023-02-02 | 2024-08-08 | 日東電工株式会社 | 画像分類装置、画像分類方法、検査システム及びプログラム |
| WO2025009089A1 (ja) * | 2023-07-05 | 2025-01-09 | 三菱電機株式会社 | 情報処理装置、再学習システム、再学習方法、及び再学習プログラム |
-
2021
- 2021-02-12 JP JP2021021239A patent/JP2022123734A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024161744A1 (ja) * | 2023-02-02 | 2024-08-08 | 日東電工株式会社 | 画像分類装置、画像分類方法、検査システム及びプログラム |
| WO2025009089A1 (ja) * | 2023-07-05 | 2025-01-09 | 三菱電機株式会社 | 情報処理装置、再学習システム、再学習方法、及び再学習プログラム |
| JP7642182B1 (ja) * | 2023-07-05 | 2025-03-07 | 三菱電機株式会社 | 情報処理装置、再学習システム、再学習方法、及び再学習プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP4388496B1 (en) | Methods and systems for generating segmentation masks | |
| EP3502966B1 (en) | Data generation apparatus, data generation method, and data generation program | |
| CN109598698B (zh) | 用于对多个项进行分类的系统、方法和非暂时性计算机可读取介质 | |
| JP5050607B2 (ja) | 検査装置、検査方法、検査プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体 | |
| TW202209153A (zh) | 檢查方案的自動最佳化 | |
| JP2020064367A (ja) | 異常検知装置及び異常検知方法 | |
| CN119810080A (zh) | 一种基于机器视觉的不锈钢表面缺陷检测方法 | |
| US20150242761A1 (en) | Interactive visualization of machine-learning performance | |
| CN113590396A (zh) | 一次设备的缺陷诊断方法、系统、电子设备及存储介质 | |
| CN101097564A (zh) | 参数学习方法及设备、模式识别方法及设备 | |
| WO2004111934A2 (en) | Segmentation and data mining for gel electrophoresis images | |
| JP7363912B2 (ja) | 表示方法、表示プログラム及び情報処理装置 | |
| CN118648033A (zh) | 用于晶片的成像数据集中异常的检测与分类的计算机实施方法以及使用此方法的系统 | |
| Caleb-Solly et al. | Adaptive surface inspection via interactive evolution | |
| JP7206892B2 (ja) | 画像検査装置、画像検査のための学習方法および画像検査プログラム | |
| US11321633B2 (en) | Method of classifying defects in a specimen semiconductor examination and system thereof | |
| JP2022123734A (ja) | 画像判定方法、画像判定システムおよび画像判定プログラム | |
| JP7392425B2 (ja) | 学習装置、学習方法およびプログラム | |
| CN108710576B (zh) | 基于异构迁移的数据集扩充方法及软件缺陷预测方法 | |
| JP5298552B2 (ja) | 判別装置、判別方法及びプログラム | |
| JP7363910B2 (ja) | 表示方法、表示プログラム及び情報処理装置 | |
| CN119150158A (zh) | 基于深度学习的o2o平台用户画像构建方法 | |
| JP5446127B2 (ja) | 判別方法、判別装置及びプログラム | |
| WO2022059135A1 (ja) | エラー要因の推定装置及び推定方法 | |
| JP7559633B2 (ja) | 統合モデルの生成方法、画像検査システム、画像検査用モデルの生成装置、画像検査用モデルの生成プログラム及び画像検査装置 |