JP2022123734A - Image judgment method, image judgment system and image judgment program - Google Patents

Image judgment method, image judgment system and image judgment program Download PDF

Info

Publication number
JP2022123734A
JP2022123734A JP2021021239A JP2021021239A JP2022123734A JP 2022123734 A JP2022123734 A JP 2022123734A JP 2021021239 A JP2021021239 A JP 2021021239A JP 2021021239 A JP2021021239 A JP 2021021239A JP 2022123734 A JP2022123734 A JP 2022123734A
Authority
JP
Japan
Prior art keywords
image
determination
model
judgment
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021021239A
Other languages
Japanese (ja)
Inventor
健太郎 斉藤
Kentaro Saito
大晃 竹田
Hiroaki Takeda
慧 青柳
Kei Aoyagi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YE Digital Co Ltd
Original Assignee
YE Digital Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YE Digital Co Ltd filed Critical YE Digital Co Ltd
Priority to JP2021021239A priority Critical patent/JP2022123734A/en
Publication of JP2022123734A publication Critical patent/JP2022123734A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Image Analysis (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】効率よく判定精度の向上を図る画像判定方法、画像判定システムおよび画像判定プログラムを提供する。【解決手段】画像判定方法は、画像判定装置が、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定工程S107と、学習装置が、画像が判定モデルへ入力された場合の画像に対する判定モデルの着目点を抽出して可視化することによって判定モデルの判定結果を解析する第1の解析工程S111と、画像が判定モデルへ入力された場合の高次元空間における画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって判定モデルの判定結果を解析する第2の解析工程S112と、第1の解析工程S111および第2の解析工程S112における解析結果に基づいて分類された前記画像に基づいて判定モデルを学習する学習工程S104と、を含む。【選択図】図12[Problem] To provide an image judgment method, an image judgment system, and an image judgment program for efficiently improving judgment accuracy. [Solution] The image judgment method includes a judgment step S107 in which an image judgment device acquires an image of a product on a production line and performs classification judgment using a judgment model that is a deep learning network, a first analysis step S111 in which a learning device analyzes the judgment result of the judgment model by extracting and visualizing a focus point of the judgment model for an image when the image is input to the judgment model, a second analysis step S112 in which a feature amount of the image in a high-dimensional space when the image is input to the judgment model is converted into a low-dimensional representation by dimensional compression and visualized, and a learning step S104 in which a judgment model is learned based on the image classified based on the analysis results in the first analysis step S111 and the second analysis step S112. [Selected Figure] Fig. 12

Description

開示の実施形態は、画像判定方法、画像判定システムおよび画像判定プログラムに関する。 The disclosed embodiments relate to an image determination method, an image determination system, and an image determination program.

従来、AI(Artificial Intelligence)の分野において、CNN(Convolutional Neural Network)等の深層学習ネットワークを判定モデルとして用いた画像判定により、画像中の物体を分類する技術が知られている(たとえば、特許文献1参照)。 Conventionally, in the field of AI (Artificial Intelligence), there has been known a technique for classifying objects in an image by image determination using a deep learning network such as a CNN (Convolutional Neural Network) as a determination model (for example, Patent Document 1).

こうした技術を利用することにより、たとえば製造ラインで製造された製品の画像から、かかる製品が良品であるか不良品であるか、また不良品であればどのような不良があるのかを分類することができる。 By using such technology, for example, from the image of a product manufactured on a production line, it is possible to classify whether the product is good or defective, and if it is a defective product, what kind of defect it has. can be done.

特開2018-022484号公報JP 2018-022484 A

しかしながら、上述した従来技術には、効率よく判定精度の向上を図るうえで、さらなる改善の余地がある。 However, the conventional technology described above has room for further improvement in terms of efficiently improving the determination accuracy.

たとえば、深層学習ネットワークは、言わば一種の関数であり、ブラックボックスである。このため、従来技術では、誤判定が生じた場合などに、判定精度の向上のために学習用画像を再分類して判定モデルの再学習を行いたくとも、そもそもの判定根拠が不明確なため、適切に学習用画像を再分類することが難しかった。 For example, a deep learning network is a kind of function, a black box. For this reason, in the conventional technology, even if an attempt is made to reclassify the learning images and relearn the determination model in order to improve the determination accuracy when an erroneous determination occurs, the basis for the determination is unclear in the first place. , it was difficult to properly reclassify the training images.

また、判定精度の向上のためには、大量の学習用画像を用いて判定モデルを学習し、かかる判定モデルを大量の検証用画像を用いて検証することが望ましいが、従来技術では、その検証の多くを人が目視で行う必要があり、煩雑であった。 In addition, in order to improve determination accuracy, it is desirable to learn a determination model using a large number of learning images and to verify the determination model using a large amount of verification images. Most of the operations had to be performed visually by a person, which was complicated.

実施形態の一態様は、上記に鑑みてなされたものであって、効率よく判定精度の向上を図ることができる画像判定方法、画像判定システムおよび画像判定プログラムを提供することを目的とする。 One aspect of the embodiments has been made in view of the above, and an object thereof is to provide an image determination method, an image determination system, and an image determination program capable of efficiently improving determination accuracy.

実施形態の一態様に係る画像判定方法は、判定工程と、第1の解析工程と、第2の解析工程と、学習工程とを含む。前記判定工程は、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する。前記第1の解析工程は、前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する。前記第2の解析工程は、前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する。前記学習工程は、前記第1の解析工程および前記第2の解析工程における解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する。 An image determination method according to an aspect of an embodiment includes a determination process, a first analysis process, a second analysis process, and a learning process. In the determination step, an image of the product on the production line is acquired, and a classification determination is performed using a determination model that is a deep learning network. The first analysis step analyzes the determination result of the determination model by extracting and visualizing the points of interest of the determination model with respect to the image when the image is input to the determination model. In the second analysis step, when the image is input to the judgment model, the feature amount of the image in a high-dimensional space is converted into a low-dimensional representation by dimensional compression and visualized, thereby making the judgment result of the judgment model. to parse The learning step learns the determination model based on the images classified based on the analysis results in the first analysis step and the second analysis step.

実施形態の一態様によれば、効率よく判定精度の向上を図ることができる。 According to one aspect of the embodiment, it is possible to efficiently improve the determination accuracy.

図1は、実施形態に係る画像判定方法の概要説明図(その1)である。FIG. 1 is a schematic explanatory diagram (Part 1) of an image determination method according to an embodiment. 図2は、実施形態に係る画像判定方法の概要説明図(その2)である。FIG. 2 is a schematic explanatory diagram (Part 2) of the image determination method according to the embodiment. 図3は、実施形態に係る学習装置のブロック図である。FIG. 3 is a block diagram of the learning device according to the embodiment. 図4は、解析部のブロック図である。FIG. 4 is a block diagram of the analysis unit. 図5は、着目点抽出部による可視化の具体例の説明図(その1)である。FIG. 5 is an explanatory diagram (Part 1) of a specific example of visualization by the point-of-interest extraction unit. 図6は、着目点抽出部による可視化の具体例の説明図(その2)である。FIG. 6 is an explanatory diagram (part 2) of a specific example of visualization by the point-of-interest extraction unit. 図7は、次元圧縮部による可視化の具体例の説明図(その1)である。FIG. 7 is an explanatory diagram (part 1) of a specific example of visualization by the dimension compression unit. 図8は、次元圧縮部による可視化の具体例の説明図(その2)である。FIG. 8 is an explanatory diagram (part 2) of a specific example of visualization by the dimension compression unit. 図9は、次元圧縮部による可視化の具体例の説明図(その3)である。FIG. 9 is an explanatory diagram (part 3) of a specific example of visualization by the dimension compression unit. 図10は、実施形態に係る画像判定装置のブロック図である。FIG. 10 is a block diagram of the image determination device according to the embodiment. 図11は、実施形態に係るプロジェクタ制御装置のブロック図である。FIG. 11 is a block diagram of the projector control device according to the embodiment. 図12は、実施形態に係る画像判定装置100が実行する処理手順を示す処理シーケンスである。FIG. 12 is a processing sequence showing a processing procedure executed by the image determination device 100 according to the embodiment. 図13は、学習装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 13 is a hardware configuration diagram showing an example of a computer that implements the functions of the learning device.

以下、添付図面を参照して、本願の開示する画像判定方法、画像判定システムおよび画像判定プログラムの実施形態を詳細に説明する。なお、以下に示す実施形態によりこの発明が限定されるものではない。 Hereinafter, embodiments of an image determination method, an image determination system, and an image determination program disclosed in the present application will be described in detail with reference to the accompanying drawings. In addition, this invention is not limited by embodiment shown below.

まず、実施形態に係る画像判定方法の概要について、図1および図2を参照して説明する。図1は、実施形態に係る画像判定方法の概要説明図(その1)である。また、図2は、実施形態に係る画像判定方法の概要説明図(その2)である。 First, an outline of an image determination method according to an embodiment will be described with reference to FIGS. 1 and 2. FIG. FIG. 1 is a schematic explanatory diagram (Part 1) of an image determination method according to an embodiment. FIG. 2 is a schematic explanatory diagram (part 2) of the image determination method according to the embodiment.

なお、以下では、製造ラインにおいて製品として丸形のクッキーが製造され、かかるクッキーの出荷前検査等において、欠けや焦げ、割れなどのある不良品を検知する場合を例に挙げて説明を行う。また、以下では、画像判定用の判定モデルが、深層学習ネットワークであるものとする。 In the following description, round cookies are manufactured as a product on a manufacturing line, and defective products with chips, scorches, cracks, etc. are detected in pre-shipment inspections of such cookies. In the following description, it is assumed that the determination model for image determination is a deep learning network.

図1に示すように、実施形態に係る画像判定システム1は、学習装置10と、画像判定装置100と、プロジェクタ制御装置200とを含む。 As shown in FIG. 1, the image determination system 1 according to the embodiment includes a learning device 10, an image determination device 100, and a projector control device 200. FIG.

画像判定装置100およびプロジェクタ制御装置200は、いわゆるエッジコンピューティングにおけるエッジプラットフォームに相当する装置であり、カメラ150、コンベア装置300、プロジェクタ400(図2参照)等を含む製造ラインに設けられる。 The image determination device 100 and the projector control device 200 are devices corresponding to an edge platform in so-called edge computing, and are provided in a production line including a camera 150, a conveyor device 300, a projector 400 (see FIG. 2), and the like.

学習装置10は、イントラネットやインターネット、携帯電話回線網等のネットワークNを介して製造ラインと通信可能に設けられる。学習装置10は、主たる機能として、たとえば製造ラインから学習用画像を収集し、収集した学習用画像を分類して学習用データセットを生成し、かかるデータセットを用いた深層学習により判定モデルを学習する(機能F1)。また、学習装置10は、ネットワークNを介し、学習した判定モデルを画像判定装置100へ配信する。 The learning device 10 is provided so as to be able to communicate with the manufacturing line via a network N such as an intranet, the Internet, or a mobile phone network. The main functions of the learning device 10 are, for example, collecting learning images from a manufacturing line, classifying the collected learning images to generate a learning data set, and learning a judgment model by deep learning using the data set. (function F1). Also, the learning device 10 distributes the learned determination model to the image determination device 100 via the network N. FIG.

画像判定装置100は、コンベア装置300を流れるクッキーP1,P2,P3…の画像を取得し、学習装置10によって学習された判定モデルを用いて画像判定を行い、学習装置10およびプロジェクタ制御装置200に対し、判定結果を出力する(機能F2)。 Image determination device 100 acquires images of cookies P1, P2, P3, . In response, the determination result is output (function F2).

たとえば、図1には、画像判定装置100が画像判定により、クッキーP1は「欠け」のある不良品であり、クッキーP2は「焦げ」のある不良品であると判定した例を示している。なお、判定結果は少なくとも、判定された画像の分類クラスおよびそのスコア(類似度、確度等)を含む。 For example, FIG. 1 shows an example in which the image determination apparatus 100 determines that the cookie P1 is defective with "missing" and the cookie P2 is defective with "burnt" through image determination. Note that the determination result includes at least the determined classification class of the image and its score (similarity, accuracy, etc.).

また、学習装置10に対する判定結果には、実際に判定された画像が学習用画像として含まれる。学習装置10は、かかる判定結果を、たとえばオペレータ(「ユーザ」の一例に相当)等の人手を介して検証し、誤判定等があれば、判定精度の向上のために学習用画像を再分類して判定モデルを再学習する。 In addition, the determination result for the learning device 10 includes the actually determined image as the learning image. The learning device 10 verifies the determination results manually, for example, by an operator (equivalent to an example of a “user”). to relearn the decision model.

このようなフィードバックを繰り返すことにより、画像判定システム1は、判定モデルの判定精度を向上させることができる。 By repeating such feedback, the image determination system 1 can improve the determination accuracy of the determination model.

ところで、既に述べたが、深層学習ネットワークは、言わば一種の関数であり、ブラックボックスである。このため、従来は、誤判定が生じた場合などに、学習用画像を再分類して判定モデルの再学習を行いたくとも、そもそもの判定根拠が不明確なため、適切に学習用画像を再分類することが難しかった。 By the way, as already mentioned, a deep learning network is, so to speak, a kind of function, a black box. For this reason, conventionally, when an erroneous judgment occurs, even if it is desired to reclassify the training images and re-learn the judgment model, the basis for the judgment is unclear in the first place. It was difficult to categorize.

また、判定精度の向上のためには、大量の学習用画像を用いて判定モデルを学習し、かかる判定モデルを大量の検証用画像を用いて検証することが望ましいが、従来は、その検証の多くをオペレータ等が目視で行う必要があり、煩雑であった。 In addition, in order to improve the accuracy of determination, it is desirable to learn a determination model using a large number of training images and to verify the determination model using a large amount of verification images. Many of them had to be visually checked by an operator, which was troublesome.

そこで、実施形態に係る画像判定方法では、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定し、上記画像が判定モデルへ入力された場合の上記画像に対する判定モデルの着目点を抽出して可視化することによって判定モデルの判定結果を解析し、上記画像が判定モデルへ入力された場合の高次元空間における上記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって判定モデルの判定結果を解析し、着目点抽出および次元圧縮による解析結果に基づいて分類された上記画像に基づいて判定モデルを学習することとした。 Therefore, in the image determination method according to the embodiment, an image of a product in a manufacturing line is acquired, a classification determination is performed using a determination model that is a deep learning network, and the image is determined when the image is input to the determination model. Analyzing the judgment result of the judgment model by extracting and visualizing the points of interest of the model, and converting the feature amount of the image in the high-dimensional space when the image is input to the judgment model into a low-dimensional representation by dimensional compression. The judgment model is analyzed by visualizing it as a model, and the judgment model is learned based on the images classified based on the analysis results obtained by extracting the point of interest and dimensionality reduction.

具体的には、図1に示すように、実施形態に係る画像判定方法では、学習装置10が、2つの手法により判定モデルの判定結果を解析する(ステップS1)。第1の手法では、学習装置10は、勾配荷重クラス活性化マッピング手法(Grad-CAM:Gradient-weighted Class Activation Mapping)を用いた「着目点抽出」により、判定モデルによる判定根拠を可視化する。 Specifically, as shown in FIG. 1, in the image determination method according to the embodiment, the learning device 10 analyzes the determination result of the determination model using two methods (step S1). In the first technique, the learning device 10 visualizes the basis of judgment by the judgment model by "focus point extraction" using a gradient-weighted class activation mapping technique (Grad-CAM).

これにより、オペレータは、判定モデルが「どこを見て分類(判定)したか」を一目で把握できるようになるため、たとえば誤判定している場合に、対象画像を適切に分類し直すことが可能となる。なお、かかる第1の手法による可視化の具体例については、図5および図6を用いた説明で後述する。 As a result, the operator can grasp at a glance "where the judgment model was classified (judgment)". It becomes possible. A specific example of visualization by the first method will be described later with reference to FIGS. 5 and 6. FIG.

また、第2の手法では、学習装置10は、UMAP(Uniform Manifold Approximation and Projection)を用いた「次元圧縮」(次元削減とも言う)により、判定結果をより見やすい形で可視化する。 In the second method, the learning device 10 visualizes the determination result in a more easily viewable form by “dimensionality reduction” (also referred to as dimensionality reduction) using UMAP (Uniform Manifold Approximation and Projection).

UMAPは、機械学習による非線形次元圧縮手法であり、リーマン幾何学と代数トポロジーに基づき、高次元空間のデータ構造を保ち、トポロジー間のクロス・エントロピーを最小にしながら低次元のデータに変換する。すなわち、実施形態に係る画像判定方法では、かかるUMAPを用いて、画像が判定モデルへ入力された場合の高次元空間における画像の特徴量を次元圧縮による低次元表現へ変換して可視化する。 UMAP is a non-linear dimensionality compression technique based on machine learning, based on Riemannian geometry and algebraic topology, which preserves the data structure of high-dimensional space and converts it to low-dimensional data while minimizing cross-entropy between topologies. That is, in the image determination method according to the embodiment, UMAP is used to convert the feature amount of the image in the high-dimensional space when the image is input to the determination model into a low-dimensional expression by dimensional compression and visualize it.

このため、第2の手法によれば、低次元の埋め込み空間に、判定結果の分布をよりバラツキの少ない形で明示することが可能となり、誤判定している画像をオペレータが一目で分かるように可視化することが可能となる。かかる第2の手法による可視化の具体例については、図7~図9を用いた説明で後述する。 For this reason, according to the second method, it is possible to express the distribution of judgment results in a low-dimensional embedding space in a form with less variation. Visualization becomes possible. A specific example of visualization by the second method will be described later with reference to FIGS. 7 to 9. FIG.

そして、学習装置10は、かかる2つの手法による解析結果に基づき、学習用画像を再分類して再学習を行い(ステップS2)、再学習した判定モデルを画像判定装置100へ配信する。そして、画像判定装置100は、再学習された判定モデルを用いて、以降の画像判定を行うこととなる。 Then, the learning device 10 reclassifies and re-learns the learning images based on the analysis results obtained by these two methods (step S2), and delivers the re-learned determination model to the image determination device 100. FIG. Then, the image determination apparatus 100 performs subsequent image determination using the re-learned determination model.

したがって、実施形態に係る画像判定方法によれば、効率よく判定精度の向上を図ることができる。 Therefore, according to the image determination method according to the embodiment, it is possible to efficiently improve the determination accuracy.

一方、プロジェクタ制御装置200は、製造ラインに設けられたプロジェクタ400を制御する装置である。具体的には、図2に示すように、実施形態に係る画像判定方法では、プロジェクタ制御装置200は、画像判定装置100の判定結果に応じたプロジェクタ投影を行う。 On the other hand, the projector control device 200 is a device that controls the projector 400 provided in the manufacturing line. Specifically, as shown in FIG. 2 , in the image determination method according to the embodiment, the projector control device 200 performs projector projection according to the determination result of the image determination device 100 .

より具体的には、プロジェクタ制御装置200は、コンベア装置300を流れるクッキーP1,P2,P3…に対し、プロジェクタ400によりマーカーを投影させる(ステップS3)。 More specifically, projector control device 200 causes projector 400 to project markers onto cookies P1, P2, P3, . . . flowing on conveyor device 300 (step S3).

このとき、プロジェクタ制御装置200は、コンベア装置300のコンベアの搬送速度と同じ速度でマーカーをスクロールさせる(ステップS31)。言い換えれば、プロジェクタ制御装置200は、マーカーが対象のクッキーP1,P2,P3…をトラッキングするように、プロジェクタ400によりマーカーを投影させる。 At this time, the projector control device 200 scrolls the marker at the same speed as the conveying speed of the conveyor of the conveyor device 300 (step S31). In other words, projector controller 200 causes projector 400 to project a marker such that the marker tracks target cookies P1, P2, P3, .

また、プロジェクタ制御装置200は、分類クラスや取るべき処置に応じて、マーカーの色や形を変更させる(ステップS32)。たとえば、プロジェクタ制御装置200は、分類クラスが「欠け」のクッキーP1と、「焦げ」のクッキーP2とで、マーカーの色や形を変更させる。 Also, the projector control device 200 changes the color and shape of the marker according to the classification class and the action to be taken (step S32). For example, the projector control device 200 changes the color and shape of the marker between the cookie P1 with the classification class of "missing" and the cookie P2 with the classification class of "burnt".

また、たとえば、プロジェクタ制御装置200は、「コンベアから除去すべき」や、「生産へフィードバックすべき」といった取るべき処置に応じて、マーカーの色や形を変更させる。また、プロジェクタ制御装置200は、判定結果に含まれる上述のスコアに応じて、「AIが判定に悩んだもの」、すなわちスコアがグレーゾーンのものに、それと分かるマーカーを投影し、ライン担当者の目視によるチェックを促すようにしてもよい。 Also, for example, the projector control device 200 changes the color or shape of the marker according to the action to be taken, such as "should be removed from the conveyor" or "should be fed back to production." In addition, according to the scores included in the determination result, the projector control device 200 projects a recognizable marker on "what the AI struggled to determine", that is, on the score in the gray zone, and the line manager A visual check may be prompted.

これにより、実施形態に係る画像判定方法によれば、判定モデルの高い判定精度に応じて、その結果を適切に製造ラインに反映させることが可能となる。なお、プロジェクタ制御装置200は、「判定結果反映装置」の一例である。したがって、判定結果反映装置は、製造ラインに設けられ、画像判定装置100の判定結果を反映すべき他の装置であってもよい。たとえば、判定結果反映装置は、画像判定装置100の判定結果に応じて火加減を調節するクッキーのベイク装置等であってもよい。 Thus, according to the image determination method according to the embodiment, it is possible to appropriately reflect the result on the production line according to the high determination accuracy of the determination model. Note that the projector control device 200 is an example of a “determination result reflecting device”. Therefore, the determination result reflection device may be another device that is provided in the manufacturing line and that should reflect the determination result of the image determination device 100 . For example, the determination result reflection device may be a cookie baking device or the like that adjusts the heat level according to the determination result of the image determination device 100 .

以下、上述した実施形態に係る画像判定方法を適用した画像判定システム1の構成について、さらに具体的に説明する。 The configuration of the image determination system 1 to which the image determination method according to the above-described embodiment is applied will now be described more specifically.

図3は、実施形態に係る学習装置10のブロック図である。また、図4は、解析部13dのブロック図である。なお、図3、図4、および、後に示す図10,11では、本実施形態の特徴を説明するために必要な構成要素を機能ブロックで表しており、一般的な構成要素についての記載を省略している。 FIG. 3 is a block diagram of the learning device 10 according to the embodiment. Moreover, FIG. 4 is a block diagram of the analysis part 13d. 3, 4, and FIGS. 10 and 11 shown later, constituent elements necessary for explaining the features of this embodiment are represented by functional blocks, and descriptions of general constituent elements are omitted. is doing.

換言すれば、図3、図4、図10および図11に図示される各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。たとえば、各機能ブロックの分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することが可能である。 In other words, each component illustrated in FIGS. 3, 4, 10 and 11 is functionally conceptual and does not necessarily need to be physically configured as illustrated. For example, the specific forms of distribution and integration of each functional block are not limited to those shown in the figure, and all or part of them can be functionally or physically distributed in arbitrary units according to various loads and usage conditions.・It is possible to integrate and configure.

なお、図3、図4、図10および図11を用いた説明では、これまでに既に述べた構成要素については、説明を簡略するか、省略する場合がある。 In the explanation using FIGS. 3, 4, 10 and 11, the explanation of the components already described may be simplified or omitted in some cases.

図3に示すように、実施形態に係る学習装置10は、通信部11と、記憶部12と、制御部13とを備える。また、学習装置10は、操作部3と、表示部5とが接続される。操作部3は、キーボードやマウス、タッチパネル等によって実現される。表示部5は、ディスプレイ等によって実現される。 As shown in FIG. 3 , the learning device 10 according to the embodiment includes a communication section 11 , a storage section 12 and a control section 13 . Further, the learning device 10 is connected to the operation unit 3 and the display unit 5 . The operation unit 3 is implemented by a keyboard, mouse, touch panel, or the like. The display unit 5 is realized by a display or the like.

通信部11は、たとえば、NIC(Network Interface Card)等によって実現される。通信部11は、ネットワークNに対し有線または無線で接続され、画像判定装置100を含む製造ラインとの間で情報の送受信を行う。 The communication unit 11 is implemented by, for example, a NIC (Network Interface Card) or the like. The communication unit 11 is wired or wirelessly connected to the network N, and transmits and receives information to and from the manufacturing line including the image determination device 100 .

記憶部12は、たとえば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示す例では、記憶部12は、収集情報データベース(DB)12aと、学習用データセット12bと、判定モデル12cとを記憶する。 The storage unit 12 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory), a ROM (Read Only Memory), a flash memory, or a storage device such as a hard disk or an optical disk. In the example shown in FIG. 3, the storage unit 12 stores a collected information database (DB) 12a, a learning data set 12b, and a determination model 12c.

収集情報データベース12aは、通信部11を介し、後述する収集部13aによって収集される判定結果を含む各種のデータが格納されるデータベースである。学習用データセット12bは、収集情報データベース12aへ格納された判定結果、および、操作部3を介したオペレータの操作等に基づき、後述する分類部13bによって分類クラスごとに分類された学習用画像のデータセットである。判定モデル12cは、後述する学習部13cによって学習される深層学習ネットワークである。 The collected information database 12a is a database in which various data including determination results collected by a collection unit 13a (to be described later) via the communication unit 11 are stored. The learning data set 12b is a collection of learning images classified into classification classes by the classification unit 13b, which will be described later, based on the determination results stored in the collected information database 12a and the operator's operation via the operation unit 3. is a dataset. The judgment model 12c is a deep learning network learned by a learning unit 13c, which will be described later.

制御部13は、コントローラ(controller)であり、たとえば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、記憶部12に記憶されている図示略の各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部13は、たとえば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現することができる。 The control unit 13 is a controller, and various programs (not shown) stored in the storage unit 12 are executed by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like, using the RAM as a work area. It is realized by being Also, the control unit 13 can be implemented by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

制御部13は、収集部13aと、分類部13bと、学習部13cと、解析部13dと、表示制御部13eと、配信部13fとを有し、以下に説明する情報処理の機能や作用を実現または実行する。 The control unit 13 includes a collection unit 13a, a classification unit 13b, a learning unit 13c, an analysis unit 13d, a display control unit 13e, and a distribution unit 13f. Realize or carry out.

収集部13aは、通信部11を介し、画像判定装置100からの判定結果を収集する。また、収集部13aは、収集した判定結果を収集情報データベース12aへ格納する。 The collection unit 13 a collects determination results from the image determination device 100 via the communication unit 11 . The collecting unit 13a also stores the collected determination results in the collected information database 12a.

分類部13bは、収集情報データベース12aへ格納された判定結果、および、操作部3を介したオペレータの操作等に基づき、学習用画像を「正常」、「欠け」、「焦げ」、「割れ」といった分類クラスごとに分類し、学習用データセット12bを生成する。学習部13cは、学習用データセット12bに基づき、判定モデル12cを学習する。 Based on the determination result stored in the collected information database 12a and the operator's operation via the operation unit 3, the classification unit 13b classifies the learning image into "normal", "missing", "burnt", and "cracked". are classified for each classification class, and a learning data set 12b is generated. The learning unit 13c learns the judgment model 12c based on the learning data set 12b.

解析部13dは、収集情報データベース12aへ格納された判定結果、および、判定モデル12cに基づき、上述した第1の手法および第2の手法によって判定結果を解析する。図4に示すように、解析部13dは、着目点抽出部13daと、次元圧縮部13dbとを有する。 The analysis unit 13d analyzes the determination result by the above-described first method and second method based on the determination result stored in the collected information database 12a and the determination model 12c. As shown in FIG. 4, the analysis unit 13d has a point-of-interest extraction unit 13da and a dimension compression unit 13db.

着目点抽出部13daは、上述したGrad-CAMを用いた着目点抽出により、学習用画像を判定モデル12cへ入力したときの判定モデル12cによる判定根拠を可視化する。 The point-of-interest extraction unit 13da extracts the point of interest using Grad-CAM as described above, and visualizes the basis for determination by the determination model 12c when the learning image is input to the determination model 12c.

次元圧縮部13dbは、上述したUMAPを用いた次元圧縮により、低次元の埋め込み空間に、判定結果の分布を可視化する。なお、UMAPは、次元圧縮手法の一例であり、他の手法を用いることを限定するものではない。たとえば、主成分分析や、t分布型確率的近傍埋め込み法(t-SNE:t-distributed Stochastic Neighbor Embedding)等を用いてもよいが、計算速度は、UMAPがより高速である。 The dimension compression unit 13db visualizes the distribution of the determination results in the low-dimensional embedding space by the dimension compression using UMAP described above. Note that UMAP is an example of a dimension compression method, and the use of other methods is not limited. For example, principal component analysis, t-distributed stochastic neighbor embedding (t-SNE), etc. may be used, but UMAP is faster in terms of calculation speed.

ここで、着目点抽出部13daおよび次元圧縮部13dbによる可視化の具体例について、図5~図9を用いて説明する。図5は、着目点抽出部13daによる可視化の具体例の説明図(その1)である。また、図6は、着目点抽出部13daによる可視化の具体例の説明図(その2)である。 Here, specific examples of visualization by the point-of-interest extraction unit 13da and the dimension compression unit 13db will be described with reference to FIGS. 5 to 9. FIG. FIG. 5 is an explanatory diagram (Part 1) of a specific example of visualization by the point-of-interest extraction unit 13da. FIG. 6 is an explanatory diagram (part 2) of a specific example of visualization by the point-of-interest extraction unit 13da.

また、図7は、次元圧縮部13dbによる可視化の具体例の説明図(その1)である。また、図8は、次元圧縮部13dbによる可視化の具体例の説明図(その2)である。また、図9は、次元圧縮部13dbによる可視化の具体例の説明図(その3)である。 FIG. 7 is an explanatory diagram (part 1) of a specific example of visualization by the dimension compression unit 13db. FIG. 8 is an explanatory diagram (part 2) of a specific example of visualization by the dimension compression unit 13db. FIG. 9 is an explanatory diagram (part 3) of a specific example of visualization by the dimension compression unit 13db.

まず、図6を用いた説明では、図5に示すように、判定モデル12cが、欠けCがあると判定するクッキーPの画像について考える。着目点抽出部13daは、このような欠けCがあると判定される画像p1,p2,p3…を判定モデル12cへ入力し、欠けCがあると判定された判定根拠を可視化する。 First, in the description using FIG. 6, as shown in FIG. 5, consider an image of a cookie P for which the determination model 12c determines that there is a chipped portion C. FIG. The point-of-interest extraction unit 13da inputs the images p1, p2, p3, .

深層学習ネットワークは、畳み込み層とプーリング層を何層にもわたって積み重ねた特徴抽出部と、その特徴量出力を受け取ってクラスラベルと照合して教師あり学習を行う識別部との2つの部分に分けられる。また、識別部は通常、全結合の多層ニューラルネットワークで構成され、その最終層は特徴量を各分類クラスのスコアに変換するソフトマックス層になっている。 A deep learning network consists of two parts: a feature extraction part that stacks many layers of convolution layers and pooling layers, and a classification part that receives the feature value output and compares it with class labels to perform supervised learning. divided. In addition, the classifier is usually composed of a fully-connected multi-layer neural network, the final layer of which is a softmax layer that converts the feature quantity into a score for each classification class.

スコアは、入力画像に各分類クラスのタグが付与される確率(類似度と言い換えても可)や確度である。判定モデル12cによる判定結果は、かかるスコアが最大となる分類クラスである。 The score is the probability (can also be referred to as similarity) or certainty that the tag of each classification class is assigned to the input image. The determination result of the determination model 12c is the classification class with the maximum score.

着目点抽出部13daは、Grad-CAMにより、分類クラスごとのスコアへの影響が大きい画像箇所を微分係数(勾配と言い換えても可)の平均化によって特定し、ヒートマップ化する。 The point-of-interest extracting unit 13da uses Grad-CAM to identify image locations that greatly affect the score for each classification class by averaging differential coefficients (which can be called gradients), and converts them into a heat map.

図6には、かかるヒートマップの例を示している。図6の例では、画像p1,p2については、欠けCの部分のみがヒートマップ化され、判定モデル12cが、まさに欠けCに着目して欠けCがあると判定していることが分かる。したがって、画像p1,p2は、分類クラス「欠け」の学習用画像として適していることが一目で分かる。 FIG. 6 shows an example of such a heat map. In the example of FIG. 6, for images p1 and p2, only the portion of chipping C is heatmapped, and it can be seen that the determination model 12c just focuses on chipping C and determines that chipping C exists. Therefore, it can be seen at a glance that the images p1 and p2 are suitable as learning images for the classification class "missing".

一方で、画像p3については、欠けCの部分だけでなく、焦げBの部分もヒートマップ化され、判定モデル12cが、欠けCだけでなく焦げBにも着目していることが分かる。言い換えれば、画像p3は、分類クラス「欠け」の学習用画像としては、ノイズ成分を含むものであることが一目で分かる。こうした場合に、かかるヒートマップは、オペレータに、画像p3が分類クラス「欠け」の学習用画像としては適さないとして、学習用から除外させることができる。これにより、効率よく判定精度の向上に資することができる。 On the other hand, for the image p3, not only the chipped portion C but also the burnt portion B are heat-mapped. In other words, it can be seen at a glance that the image p3 contains noise components as a learning image of the classification class “missing”. In such a case, such a heat map can cause the operator to exclude image p3 from training as it is not suitable as a training image for the classification class "missing". As a result, it is possible to efficiently improve the determination accuracy.

また、図7~図9に示すように、次元圧縮部13dbは、たとえば判定モデル12cの高次元空間の特徴量マップを低次元(ここでは、3次元)に次元圧縮し、低次元の埋め込み空間に判定結果の分布を可視化する。また、次元圧縮部13dbは、かかる可視化情報を、オペレータに操作可能なGUI(Graphic User Interface)ツールとして生成する。 Further, as shown in FIGS. 7 to 9, the dimension compression unit 13db dimension-compresses, for example, the high-dimensional space feature quantity map of the judgment model 12c to a low dimension (here, three dimensions) to obtain a low-dimensional embedding space. Visualize the distribution of judgment results. Also, the dimension compression unit 13db generates such visualization information as a GUI (Graphic User Interface) tool that can be operated by the operator.

たとえば、図7に示すように、次元圧縮部13dbは、各判定結果に対応するチェックボックスを有するGUIツールを生成する。かかるGUIツールにおいて、図7に示すように、「欠け」および「焦げ」がチェックされたものとする。 For example, as shown in FIG. 7, the dimension compression unit 13db generates a GUI tool having check boxes corresponding to each determination result. It is assumed that "missing" and "burning" are checked in such a GUI tool as shown in FIG.

すると、図7に示すように、「欠け」の判定結果を受けた各画像と、「焦げ」の判定を受けた各画像との、次元圧縮された低次元空間における分布が可視化される。なお、図中の低次元空間における丸印の各々は、各画像に対応しており、次元圧縮部13dbは、オペレータがその一つ一つを選択可能となるようにGUIツールを生成する。 Then, as shown in FIG. 7, the distribution in the dimensionally compressed low-dimensional space of each image determined as "missing" and each image determined as "burned" is visualized. Each circle in the low-dimensional space in the drawing corresponds to each image, and the dimension compression unit 13db generates a GUI tool so that the operator can select one of them.

ここで、図中のカーソルCrが指すように、たとえば「欠け」と判定されているものの、特徴量としては「欠け」よりも「焦げ」の方にきわめて近い画像があり、オペレータがこれを選択したものとする。 Here, as indicated by the cursor Cr in the figure, there is an image that is determined to be, for example, "missing", but the feature amount is much closer to "burnt" than "missing", and the operator selects this image. shall be

すると、図8に示すように、次元圧縮部13dbは、かかる画像のファイル名や分類クラスのラベル名といった画像の詳細情報が示されるようにGUIツールを生成する。同図の場合、その詳細情報によれば、該当の画像「IMG_1001.png」が分類クラス「欠け」であるにも関わらず、その特徴量は「焦げ」にきわめて近いため、本来であれば該当の画像が「焦げ」と判定されるべき誤判定であることが分かる。 Then, as shown in FIG. 8, the dimension compression unit 13db generates a GUI tool so that detailed information about the image, such as the file name of the image and the label name of the classification class, is displayed. In the case of the same figure, according to the detailed information, although the corresponding image "IMG_1001.png" is classified as "missing", its feature value is very close to "burnt". is an erroneous determination that should be determined as "burnt".

したがって、オペレータは、かかるGUIツールにより、誤判定を一目で把握することができる。そして、オペレータは、分類部13bに該当の画像の分類をやり直させたうえで、学習部13cが判定モデル12cを学習することにより、判定モデル12cの判定精度を向上させることができる。 Therefore, the operator can grasp the erroneous judgment at a glance by such a GUI tool. Then, the operator causes the classification unit 13b to reclassify the corresponding image, and the learning unit 13c learns the determination model 12c, thereby improving the determination accuracy of the determination model 12c.

なお、図9に示すように、GUIツールにおいて、さらに「割れ」のチェックボックスがチェックされた場合には、低次元空間にさらに「割れ」の各画像の分布が可視化されることとなる。また、図7~図9には図示していないが、オペレータは、GUIツール上の低次元空間を任意に360°回転させたり、拡大したり、縮小したりすることが可能である。 As shown in FIG. 9, when the "crack" check box is further checked in the GUI tool, the distribution of each "crack" image is further visualized in the low-dimensional space. Also, although not shown in FIGS. 7 to 9, the operator can arbitrarily rotate the low-dimensional space on the GUI tool by 360°, enlarge it, and reduce it.

図3の説明に戻る。表示制御部13eは、解析部13dの解析結果を表示部5に表示させる。表示部5から操作部3へ破線の矢印で示すように、オペレータが、図5~図9に示したような解析部13dの解析結果に基づいて再分類を指示すると、分類部13bは、学習用データセット12bの学習用画像を再分類し、学習部13cに判定モデル12cを学習させる。 Returning to the description of FIG. The display control unit 13e causes the display unit 5 to display the analysis result of the analysis unit 13d. As indicated by the dashed arrow from the display unit 5 to the operation unit 3, when the operator instructs reclassification based on the analysis results of the analysis unit 13d as shown in FIGS. The training images in the training data set 12b are reclassified, and the learning unit 13c learns the determination model 12c.

配信部13fは、通信部11を介し、学習部13cによって学習された判定モデル12cを画像判定装置100へ配信する。 The distribution unit 13 f distributes the determination model 12 c learned by the learning unit 13 c to the image determination device 100 via the communication unit 11 .

次に、画像判定装置100の構成について説明する。図10は、実施形態に係る画像判定装置100のブロック図である。 Next, the configuration of the image determination device 100 will be described. FIG. 10 is a block diagram of the image determination device 100 according to the embodiment.

図10に示すように、実施形態に係る画像判定装置100は、通信部101と、記憶部102と、制御部103とを備える。 As shown in FIG. 10, the image determination apparatus 100 according to the embodiment includes a communication section 101, a storage section 102, and a control section 103. FIG.

通信部101は、上述した通信部11と同様に、たとえば、NIC等によって実現される。通信部101は、ネットワークN、カメラ150およびプロジェクタ制御装置200に対し有線または無線で接続され、学習装置10、カメラ150およびプロジェクタ制御装置200との間で情報の送受信を行う。 The communication unit 101 is realized by, for example, a NIC, like the communication unit 11 described above. The communication unit 101 is wired or wirelessly connected to the network N, the camera 150 and the projector control device 200 and transmits and receives information to and from the learning device 10 , the camera 150 and the projector control device 200 .

記憶部102は、上述した記憶部12と同様に、たとえば、RAM、ROM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図10に示す例では、記憶部102は、判定モデル102aを記憶する。判定モデル102aは、学習装置から配信される判定モデル12cに相当する。 The storage unit 102 is realized by, for example, a semiconductor memory device such as a RAM, a ROM, a flash memory, or a storage device such as a hard disk or an optical disk, like the storage unit 12 described above. In the example shown in FIG. 10, the storage unit 102 stores a determination model 102a. The judgment model 102a corresponds to the judgment model 12c delivered from the learning device.

制御部103は、上述した制御部13と同様に、コントローラであり、たとえば、CPUやMPU等によって、記憶部102に記憶されている図示略の各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部103は、上述した制御部13と同様に、たとえば、ASICやFPGA等の集積回路により実現することができる。 The control unit 103 is a controller similar to the control unit 13 described above. Realized. Also, the control unit 103 can be implemented by an integrated circuit such as an ASIC or FPGA, like the control unit 13 described above.

制御部103は、取得部103aと、判定部103bと、出力部103cとを有し、以下に説明する情報処理の機能や作用を実現または実行する。 The control unit 103 has an acquisition unit 103a, a determination unit 103b, and an output unit 103c, and implements or executes information processing functions and actions described below.

取得部103aは、通信部101を介し、学習装置10から配信される判定モデル12cを取得し、判定モデル102aとして記憶部102へ記憶させる。また、取得部103aは、通信部101を介し、カメラ150によって撮影されるクッキーPの画像を取得し、判定部103bへ出力する。 Acquisition unit 103a acquires judgment model 12c distributed from learning device 10 via communication unit 101, and stores it in storage unit 102 as judgment model 102a. Acquisition unit 103a acquires an image of cookie P captured by camera 150 via communication unit 101, and outputs the image to determination unit 103b.

判定部103bは、取得部103aによって取得された画像を判定モデル102aへ入力し、判定モデル102aから判定結果を取得する。また、判定部103bは、取得した判定結果を出力部103cへ出力する。 The determination unit 103b inputs the image acquired by the acquisition unit 103a to the determination model 102a, and acquires the determination result from the determination model 102a. Further, the determination unit 103b outputs the acquired determination result to the output unit 103c.

出力部103cは、通信部101を介し、判定部103bからの判定結果を学習装置10およびプロジェクタ制御装置200に対し出力する。 The output unit 103 c outputs the determination result from the determination unit 103 b to the learning device 10 and the projector control device 200 via the communication unit 101 .

次に、プロジェクタ制御装置200の構成について説明する。図11は、実施形態に係るプロジェクタ制御装置200のブロック図である。 Next, the configuration of the projector control device 200 will be described. FIG. 11 is a block diagram of the projector control device 200 according to the embodiment.

図11に示すように、実施形態に係るプロジェクタ制御装置200は、通信部201と、記憶部202と、制御部203とを備える。 As shown in FIG. 11, the projector control device 200 according to the embodiment includes a communication section 201, a storage section 202, and a control section 203.

通信部201は、上述した通信部11,101と同様に、たとえば、NIC等によって実現される。通信部201は、画像判定装置100およびコンベア装置300に対し有線または無線で接続され、画像判定装置100およびコンベア装置300との間で情報の送受信を行う。 The communication unit 201 is implemented by, for example, a NIC, like the communication units 11 and 101 described above. The communication unit 201 is connected to the image determination device 100 and the conveyor device 300 by wire or wirelessly, and transmits and receives information to and from the image determination device 100 and the conveyor device 300 .

記憶部202は、上述した記憶部12,102と同様に、たとえば、RAM、ROM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図11に示す例では、記憶部202は、投影設定情報202aを記憶する。投影設定情報202aは、画像判定装置100からの判定結果に応じたマーカーの投影に関する設定情報である。 The storage unit 202 is realized by, for example, a semiconductor memory device such as a RAM, ROM, flash memory, or a storage device such as a hard disk or an optical disk, like the storage units 12 and 102 described above. In the example shown in FIG. 11, the storage unit 202 stores projection setting information 202a. The projection setting information 202 a is setting information regarding the projection of the marker according to the determination result from the image determination device 100 .

制御部203は、上述した制御部13,103と同様に、コントローラであり、たとえば、CPUやMPU等によって、記憶部202に記憶されている図示略の各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部203は、上述した制御部13,103と同様に、たとえば、ASICやFPGA等の集積回路により実現することができる。 The control unit 203 is a controller similar to the control units 13 and 103 described above, and various programs (not shown) stored in the storage unit 202 are executed by the CPU, MPU, etc., using the RAM as a work area. It is realized by Further, like the control units 13 and 103 described above, the control unit 203 can be implemented by an integrated circuit such as an ASIC or FPGA, for example.

制御部203は、取得部203aと、投影制御部203bとを有し、以下に説明する情報処理の機能や作用を実現または実行する。 The control unit 203 has an acquisition unit 203a and a projection control unit 203b, and implements or executes information processing functions and actions described below.

取得部203aは、通信部201を介し、画像判定装置100から出力される判定結果を取得し、投影制御部203bへ出力する。また、取得部203aは、通信部201を介し、コンベア装置300からコンベアの搬送速度を取得し、投影制御部203bへ出力する。 The acquisition unit 203a acquires the determination result output from the image determination apparatus 100 via the communication unit 201, and outputs the determination result to the projection control unit 203b. Also, the acquisition unit 203a acquires the conveying speed of the conveyor from the conveyor device 300 via the communication unit 201, and outputs it to the projection control unit 203b.

投影制御部203bは、取得部203aによって取得された判定結果、搬送速度および投影設定情報202aに基づき、プロジェクタ400によるマーカーの投影を制御する。 The projection control unit 203b controls projection of the marker by the projector 400 based on the determination result, the transport speed, and the projection setting information 202a acquired by the acquisition unit 203a.

次に、実施形態に係る画像判定システム1が実行する処理手順について、図12を用いて説明する。図12は、実施形態に係る画像判定装置100が実行する処理手順を示す処理シーケンスである。 Next, a processing procedure executed by the image determination system 1 according to the embodiment will be described with reference to FIG. 12 . FIG. 12 is a processing sequence showing a processing procedure executed by the image determination device 100 according to the embodiment.

図12に示すように、まず画像判定システム1の運用前等において、学習装置10が学習用画像を収集する(ステップS101)。そして、学習装置10は、学習用画像を分類し(ステップS102)、学習用データセット12bを生成する(ステップS103)。 As shown in FIG. 12, before the image determination system 1 is operated, the learning device 10 collects learning images (step S101). Then, the learning device 10 classifies the learning images (step S102) and generates a learning data set 12b (step S103).

そして、学習装置10は、学習用データセット12bを用いて判定モデル12cを学習し(ステップS104)、画像判定装置100へ判定モデル12cを配信する(ステップS105)。 Then, the learning device 10 learns the determination model 12c using the learning data set 12b (step S104), and distributes the determination model 12c to the image determination device 100 (step S105).

画像判定装置100は、カメラ150によって撮影された画像を取得し(ステップS106)、判定モデル102aを用いて画像を判定する(ステップS107)。そして、判定結果を学習装置10およびプロジェクタ制御装置200へ出力する(ステップS108,S109)。 The image determination device 100 acquires the image captured by the camera 150 (step S106), and determines the image using the determination model 102a (step S107). Then, the determination result is output to the learning device 10 and the projector control device 200 (steps S108 and S109).

学習装置10は、画像判定装置100からの判定結果を収集し(ステップS110)、着目点抽出による解析(ステップS111)、および、次元圧縮による解析(ステップS112)を実行する。 The learning device 10 collects determination results from the image determination device 100 (step S110), and performs analysis by extracting the point of interest (step S111) and analysis by dimension compression (step S112).

そして、学習装置10は、それらの解析結果に基づき、学習用画像を再分類させる(ステップS113)。そして、ステップS104からの処理を繰り返す。 Then, the learning device 10 reclassifies the learning images based on those analysis results (step S113). Then, the processing from step S104 is repeated.

一方、プロジェクタ制御装置200は、画像判定装置100からの判定結果に応じたプロジェクタ投影を行うことを繰り返す(ステップS114)。 On the other hand, the projector control device 200 repeats projector projection according to the determination result from the image determination device 100 (step S114).

なお、上述してきた実施形態に係る学習装置10、画像判定装置100およびプロジェクタ制御装置200は、たとえば図13に示すような構成のコンピュータ1000によって実現される。学習装置10を例に挙げて説明する。図13は、学習装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インタフェース(I/F)1500、入出力インタフェース(I/F)1600、および、メディアインタフェース(I/F)67を備える。 Note that the learning device 10, the image determination device 100, and the projector control device 200 according to the above-described embodiments are implemented by a computer 1000 configured as shown in FIG. 13, for example. The learning device 10 will be described as an example. FIG. 13 is a hardware configuration diagram showing an example of a computer that implements the functions of the learning device 10. As shown in FIG. Computer 1000 includes CPU 1100 , RAM 1200 , ROM 1300 , HDD (Hard Disk Drive) 1400 , communication interface (I/F) 1500 , input/output interface (I/F) 1600 , and media interface (I/F) 67 .

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on programs stored in the ROM 1300 or HDD 1400 and controls each section. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラムおよび当該プログラムによって使用されるデータ等を格納する。通信インタフェース1500は、通信ネットワークを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信ネットワークを介して他の機器へ送信する。 HDD 1400 stores programs executed by CPU 1100 and data used by the programs. Communication interface 1500 receives data from other devices via a communication network, sends the data to CPU 1100, and transmits data generated by CPU 1100 to other devices via the communication network.

CPU1100は、入出力インタフェース1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インタフェース1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インタフェース1600を介して出力装置へ出力する。 The CPU 1100 controls output devices such as displays and printers, and input devices such as keyboards and mice, via an input/output interface 1600 . CPU 1100 acquires data from an input device via input/output interface 1600 . CPU 1100 also outputs the generated data to an output device via input/output interface 1600 .

メディアインタフェース1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、当該プログラムを、メディアインタフェース1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、たとえばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または、半導体メモリ等である。 Media interface 1700 reads programs or data stored in recording medium 1800 and provides them to CPU 1100 via RAM 1200 . CPU 1100 loads the program from recording medium 1800 onto RAM 1200 via media interface 1700 and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or a PD (Phase change rewritable disc), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor. memory and the like.

たとえば、コンピュータ1000が実施形態に係る学習装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部13の各機能を実現する。また、HDD1400には、記憶部12内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信ネットワークを介してこれらのプログラムを取得してもよい。 For example, when computer 1000 functions as learning device 10 according to the embodiment, CPU 1100 of computer 1000 implements each function of control unit 13 by executing a program loaded on RAM 1200 . Data in the storage unit 12 is also stored in the HDD 1400 . CPU 1100 of computer 1000 reads and executes these programs from recording medium 1800, but as another example, these programs may be obtained from another device via a communication network.

上述してきたように、実施形態に係る画像判定システム1は、判定部103bと、着目点抽出部13da(「第1の解析部」の一例に相当)と、次元圧縮部13db(「第2の解析部」の一例に相当)と、学習部13cとを含む。判定部103bは、製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する。着目点抽出部13daは、上記画像が判定モデルへ入力された場合の上記画像に対する判定モデルの着目点を抽出して可視化することによって判定モデルの判定結果を解析する。次元圧縮部13dbは、上記画像が判定モデルへ入力された場合の高次元空間における上記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって判定モデルの判定結果を解析する。学習部13cは、着目点抽出部13daおよび次元圧縮部13dbによる解析結果に基づいて分類された上記画像に基づいて判定モデルを学習する。 As described above, the image determination system 1 according to the embodiment includes the determination unit 103b, the point-of-interest extraction unit 13da (corresponding to an example of the “first analysis unit”), and the dimension compression unit 13db (“second analysis unit”). (corresponding to an example of an “analysis unit”) and a learning unit 13c. The determination unit 103b acquires images of products on the production line, and classifies and determines them using a determination model that is a deep learning network. The point-of-interest extraction unit 13da analyzes the determination result of the determination model by extracting and visualizing the points of interest of the determination model with respect to the image when the image is input to the determination model. The dimension compression unit 13db analyzes the determination result of the determination model by converting the feature amount of the image in the high-dimensional space when the image is input to the determination model into a low-dimensional expression by dimensional compression and visualizing it. The learning unit 13c learns a determination model based on the images classified based on the analysis results by the point-of-interest extraction unit 13da and the dimension compression unit 13db.

したがって、実施形態に係る画像判定システム1によれば、効率よく判定精度の向上を図ることができる。 Therefore, according to the image determination system 1 according to the embodiment, it is possible to efficiently improve the determination accuracy.

なお、上述した実施形態では、学習用画像の再分類に際し、オペレータの操作を要することとしたが、これに限られるものではなく、解析部13dの解析結果に基づいて分類部13bが自動的に再分類を行うようにしてもよい。 In the above-described embodiment, an operator's operation is required to reclassify the learning images, but the present invention is not limited to this. Reclassification may be performed.

かかる場合、分類部13bは、たとえば解析部13dが可視化したヒートマップや低次元空間マップを画像解析する画像解析機能を有し、その画像解析結果に基づいて学習用画像の再分類を行うこととなる。 In such a case, the classification unit 13b has an image analysis function for image analysis of a heat map or a low-dimensional space map visualized by the analysis unit 13d, for example, and reclassifies the learning images based on the image analysis result. Become.

また、上述した実施形態では、着目点抽出のアルゴリズムとしてGrad-CAMを用いることしたが、これに限られるものではなく、たとえばGuided Backpropagationの結果にGrad-CAMの出力を重ねるGuided Grad-CAMと呼ばれるアルゴリズム等を用いることとしてもよい。 Further, in the above-described embodiment, Grad-CAM is used as an algorithm for extracting the point of interest, but it is not limited to this. An algorithm or the like may be used.

また、上述した実施形態では、製造ラインにおける製品がクッキーPであることとしたが、無論、製品の種別を限定するものではない。 Also, in the above-described embodiment, the product in the production line is the cookie P, but the type of the product is of course not limited.

さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。 Further effects and modifications can be easily derived by those skilled in the art. Therefore, the broader aspects of the invention are not limited to the specific details and representative embodiments so shown and described. Accordingly, various changes may be made without departing from the spirit or scope of the general inventive concept defined by the appended claims and equivalents thereof.

1 画像判定システム
10 学習装置
12c 判定モデル
13 制御部
13a 収集部
13b 分類部
13c 学習部
13d 解析部
13da 着目点抽出部
13db 次元圧縮部
13e 表示制御部
13f 配信部
100 画像判定装置
102a 判定モデル
103 制御部
103a 取得部
103b 判定部
103c 出力部
200 プロジェクタ制御装置
203 制御部
203a 取得部
203b 投影制御部
300 コンベア装置
400 プロジェクタ
1 image determination system 10 learning device 12c determination model 13 control unit 13a collection unit 13b classification unit 13c learning unit 13d analysis unit 13da attention point extraction unit 13db dimension compression unit 13e display control unit 13f distribution unit 100 image determination device 102a determination model 103 control Unit 103a Acquisition unit 103b Determination unit 103c Output unit 200 Projector control device 203 Control unit 203a Acquisition unit 203b Projection control unit 300 Conveyor device 400 Projector

Claims (10)

製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定工程と、
前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する第1の解析工程と、
前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する第2の解析工程と、
前記第1の解析工程および前記第2の解析工程における解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する学習工程と
を含むことを特徴とする画像判定方法。
A judgment step of acquiring an image of a product in a manufacturing line and classifying it using a judgment model that is a deep learning network;
a first analysis step of analyzing a determination result of the determination model by extracting and visualizing a focus point of the determination model with respect to the image when the image is input to the determination model;
a second analysis step of analyzing the determination result of the determination model by converting the feature amount of the image in a high-dimensional space when the image is input to the determination model into a low-dimensional representation by dimensional compression and visualizing the image. When,
and a learning step of learning the judgment model based on the images classified based on the analysis results of the first analysis step and the second analysis step.
前記学習工程は、
前記第1の解析工程において、一つの前記画像について異なる複数の分類クラスに対応する前記着目点が抽出された場合に、当該画像を学習用画像から除外して前記判定モデルを学習する
ことを特徴とする請求項1に記載の画像判定方法。
The learning step includes:
wherein, in the first analysis step, when the points of interest corresponding to a plurality of different classification classes are extracted for one of the images, the image is excluded from learning images and the judgment model is learned. The image determination method according to claim 1, wherein
前記第2の解析工程は、
前記低次元表現による前記判定モデルの判定結果の分布をGUI化し、該GUIを介してユーザに前記画像を分類させる
ことを特徴とする請求項1または2に記載の画像判定方法。
The second analysis step includes
3. The image determination method according to claim 1, wherein the distribution of determination results of the determination model based on the low-dimensional representation is made into a GUI, and a user is allowed to classify the images via the GUI.
前記第1の解析工程は、
Grad-CAMを用いて前記着目点を抽出して可視化する
ことを特徴とする請求項1、2または3に記載の画像判定方法。
The first analysis step includes
4. The image determination method according to claim 1, wherein the point of interest is extracted and visualized using a Grad-CAM.
前記第2の解析工程は、
UMAPを用いた前記次元圧縮により前記画像の特徴量を前記低次元表現へ変換して可視化する
ことを特徴とする請求項1~4のいずれか一つに記載の画像判定方法。
The second analysis step includes
The image determination method according to any one of claims 1 to 4, wherein the feature amount of the image is converted into the low-dimensional representation by the dimensional compression using UMAP and visualized.
前記判定モデルの判定結果を前記製造ラインに反映する判定結果反映工程
をさらに含むことを特徴とする請求項1~5のいずれか一つに記載の画像判定方法。
The image determination method according to any one of claims 1 to 5, further comprising a determination result reflecting step of reflecting the determination result of the determination model on the production line.
前記製造ラインは、
当該製造ライン上の前記製品に対してマーカーを投影するプロジェクタを有しており、
前記判定結果反映工程は、
前記製品の分類クラスおよび取るべき処置に応じて、少なくとも前記マーカーの色および形を変更させる
ことを特徴とする請求項6に記載の画像判定方法。
The production line is
Having a projector that projects a marker onto the product on the production line,
The determination result reflection step includes:
7. The image determination method according to claim 6, wherein at least the color and shape of the marker are changed according to the classification class of the product and the action to be taken.
前記判定結果反映工程は、
前記製品の搬送速度と同じ速度で前記マーカーをスクロールさせる
ことを特徴とする請求項7に記載の画像判定方法。
The determination result reflection step includes:
8. The image determination method according to claim 7, wherein the marker is scrolled at the same speed as the conveying speed of the product.
製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定部と、
前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する第1の解析部と、
前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する第2の解析部と、
前記第1の解析部および前記第2の解析部による解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する学習部と
を備えることを特徴とする画像判定システム。
A determination unit that acquires an image of a product in a manufacturing line and uses a determination model that is a deep learning network to make a classification determination;
a first analysis unit that analyzes a determination result of the determination model by extracting and visualizing a focus point of the determination model with respect to the image when the image is input to the determination model;
a second analysis unit for analyzing the determination result of the determination model by converting the feature amount of the image in a high-dimensional space when the image is input to the determination model into a low-dimensional representation by dimensional compression and visualizing the image; When,
and a learning unit that learns the determination model based on the images classified based on the analysis results of the first analysis unit and the second analysis unit.
製造ラインにおける製品の画像を取得し、深層学習ネットワークである判定モデルを用いて分類判定する判定手順と、
前記画像が前記判定モデルへ入力された場合の前記画像に対する前記判定モデルの着目点を抽出して可視化することによって前記判定モデルの判定結果を解析する第1の解析手順と、
前記画像が前記判定モデルへ入力された場合の高次元空間における前記画像の特徴量を次元圧縮による低次元表現へ変換して可視化することによって前記判定モデルの判定結果を解析する第2の解析手順と、
前記第1の解析手順および前記第2の解析手順における解析結果に基づいて分類された前記画像に基づいて前記判定モデルを学習する学習手順と
をコンピュータに実行させることを特徴とする画像判定プログラム。
A judgment procedure for acquiring images of products in the manufacturing line and classifying and judging using a judgment model that is a deep learning network;
a first analysis procedure for analyzing a determination result of the determination model by extracting and visualizing a focus point of the determination model for the image when the image is input to the determination model;
A second analysis procedure for analyzing the judgment result of the judgment model by converting the feature amount of the image in a high-dimensional space when the image is input to the judgment model into a low-dimensional representation by dimensional compression and visualizing it. When,
and a learning procedure for learning the judgment model based on the images classified based on the analysis results in the first analysis procedure and the second analysis procedure.
JP2021021239A 2021-02-12 2021-02-12 Image judgment method, image judgment system and image judgment program Pending JP2022123734A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021021239A JP2022123734A (en) 2021-02-12 2021-02-12 Image judgment method, image judgment system and image judgment program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021021239A JP2022123734A (en) 2021-02-12 2021-02-12 Image judgment method, image judgment system and image judgment program

Publications (1)

Publication Number Publication Date
JP2022123734A true JP2022123734A (en) 2022-08-24

Family

ID=82940432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021021239A Pending JP2022123734A (en) 2021-02-12 2021-02-12 Image judgment method, image judgment system and image judgment program

Country Status (1)

Country Link
JP (1) JP2022123734A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024161744A1 (en) * 2023-02-02 2024-08-08 日東電工株式会社 Image classification device, image classification method, inspection system, and program
WO2025009089A1 (en) * 2023-07-05 2025-01-09 三菱電機株式会社 Information processing device, relearning system, relearning method, and relearning program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024161744A1 (en) * 2023-02-02 2024-08-08 日東電工株式会社 Image classification device, image classification method, inspection system, and program
WO2025009089A1 (en) * 2023-07-05 2025-01-09 三菱電機株式会社 Information processing device, relearning system, relearning method, and relearning program
JP7642182B1 (en) * 2023-07-05 2025-03-07 三菱電機株式会社 Information processing device, relearning system, relearning method, and relearning program

Similar Documents

Publication Publication Date Title
EP4388496B1 (en) Methods and systems for generating segmentation masks
EP3502966B1 (en) Data generation apparatus, data generation method, and data generation program
CN109598698B (en) System, method, and non-transitory computer readable medium for classifying a plurality of items
JP5050607B2 (en) INSPECTION DEVICE, INSPECTION METHOD, INSPECTION PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING THE SAME
TW202209153A (en) Automatic optimization of an examination recipe
JP2020064367A (en) Abnormality detection device and abnormality detection method
CN119810080A (en) A stainless steel surface defect detection method based on machine vision
US20150242761A1 (en) Interactive visualization of machine-learning performance
CN113590396A (en) Method and system for diagnosing defect of primary device, electronic device and storage medium
CN101097564A (en) Parameter learning method and equipment, and pattern recognition method and equipment
WO2004111934A2 (en) Segmentation and data mining for gel electrophoresis images
JP7363912B2 (en) Display method, display program and information processing device
CN118648033A (en) Computer-implemented method for detecting and classifying anomalies in an imaging data set of a wafer and system using the same
Caleb-Solly et al. Adaptive surface inspection via interactive evolution
JP7206892B2 (en) Image inspection device, learning method for image inspection, and image inspection program
US11321633B2 (en) Method of classifying defects in a specimen semiconductor examination and system thereof
JP2022123734A (en) Image judgment method, image judgment system and image judgment program
JP7392425B2 (en) Learning devices, learning methods and programs
CN108710576B (en) Data set expansion method based on heterogeneous migration and software defect prediction method
JP5298552B2 (en) Discrimination device, discrimination method, and program
JP7363910B2 (en) Display method, display program and information processing device
CN119150158A (en) O2O platform user portrait construction method based on deep learning
JP5446127B2 (en) Discrimination method, discrimination device, and program
WO2022059135A1 (en) Error cause estimation device and estimation method
JP7559633B2 (en) Integrated model generation method, image inspection system, image inspection model generation device, image inspection model generation program, and image inspection device