JP2020003879A - Information processing device, information processing method, watermark detection device, watermark detection method, and program - Google Patents
Information processing device, information processing method, watermark detection device, watermark detection method, and program Download PDFInfo
- Publication number
- JP2020003879A JP2020003879A JP2018120128A JP2018120128A JP2020003879A JP 2020003879 A JP2020003879 A JP 2020003879A JP 2018120128 A JP2018120128 A JP 2018120128A JP 2018120128 A JP2018120128 A JP 2018120128A JP 2020003879 A JP2020003879 A JP 2020003879A
- Authority
- JP
- Japan
- Prior art keywords
- watermark
- learning
- image data
- pattern
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Facsimile Transmission Control (AREA)
- Image Analysis (AREA)
Abstract
【課題】学習モデルの出所を特定できるようにする。【解決手段】モデル取得部110は、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得する。透かしパターン取得部111は、学習モデルに埋め込むための透かしパターンを取得する。画像取得部112は、学習モデルに透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する。重畳用パターン取得部113は、透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが透かしパターンとなる複数のパターンを取得する。学習用データ生成部114は、透かし用画像データセットに含まれる画像データと複数のパターンとの組み合わせを再学習用学習データとして生成する。【選択図】図4PROBLEM TO BE SOLVED: To identify the source of a learning model. A model acquisition unit 110 is a learning model machine-learned to output an identification label composed of a plurality of index values indicating the probability that input image data is image data of a plurality of identification targets. To get. The watermark pattern acquisition unit 111 acquires a watermark pattern to be embedded in the learning model. The image acquisition unit 112 acquires a watermark image data set forming re-learning learning data used for re-learning for embedding a watermark pattern in a learning model. The superimposition pattern acquisition unit 113 acquires a plurality of patterns having the same number of patterns as the image data included in the watermark image data set, and the superposition of the patterns makes a watermark pattern. The learning data generation unit 114 generates a combination of image data included in the watermark image data set and a plurality of patterns as re-learning learning data. [Selection diagram] Fig. 4
Description
本発明は情報処理装置、情報処理方法、透かし検出装置、透かし検出方法、及びプログラムに関し、特に学習モデルに透かしを埋め込む技術及び学習モデルに埋め込んだ透かしを検出する技術に関する。 The present invention relates to an information processing device, an information processing method, a watermark detection device, a watermark detection method, and a program, and particularly to a technology for embedding a watermark in a learning model and a technology for detecting a watermark embedded in a learning model.
近年、CPU(Central Processing Unit)及びGPU(Graphics Processing Unit)の高速化、メモリの大容量化、及び機械学習技術が急速に進んできている。このため、数十万から百万といったオーダーの学習データを用いる機械学習が可能となり、精度の高い識別技術や分類技術が確立されつつある(非特許文献1参照)。 In recent years, CPUs (Central Processing Units) and GPUs (Graphics Processing Units) have become faster, memories have a larger capacity, and machine learning techniques have been rapidly advanced. For this reason, machine learning using learning data on the order of hundreds of thousands to one million is possible, and a highly accurate identification technology and classification technology are being established (see Non-Patent Document 1).
大量の学習データに基づく機械学習を実行するためには大量の計算コストがかかる。また、大量の学習データを用意すること、及び用意した学習データを機械学習に用いるために加工する前処理にも膨大な労力を要する。一方で、機械学習によって生成された学習モデルはデジタルデータであり、その複製は容易である。さらに、一般に学習モデル生成に用いられた学習データを、学習モデル自体から推測することは難しい。 Executing machine learning based on a large amount of learning data requires a large amount of calculation cost. In addition, a large amount of labor is required for preparing a large amount of learning data and for preprocessing for processing the prepared learning data for use in machine learning. On the other hand, a learning model generated by machine learning is digital data, and its copying is easy. Further, it is generally difficult to estimate learning data used for generating a learning model from the learning model itself.
このため、学習モデルを生成した者は、その学習モデルが第三者によって不正に利用されたとしても、不正を立証することが難しい。収集した学習データと、学習データに基づいて生成された学習モデルとはそれぞれ労力をかけて取得した価値あるものであり、不正利用から学習モデルを守ることが望まれている。 Therefore, it is difficult for a person who has generated the learning model to prove the fraud even if the learning model is fraudulently used by a third party. The collected learning data and the learning model generated based on the learning data are valuable values obtained with effort, and it is desired to protect the learning model from unauthorized use.
本発明はこれらの点に鑑みてなされたものであり、学習モデルの出所を特定できるようにする技術を提供することを目的とする。 The present invention has been made in view of these points, and an object of the present invention is to provide a technique that enables the source of a learning model to be specified.
本発明の第1の態様は、情報処理装置である。この装置は、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得するモデル取得部と、前記学習モデルに埋め込むための透かしパターンを取得する透かしパターン取得部と、前記学習モデルに前記透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する画像取得部と、前記透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが前記透かしパターンとなる複数のパターンを取得する重畳用パターン取得部と、前記透かし用画像データセットに含まれる画像データと前記複数のパターンとの組み合わせを前記再学習用学習データとして生成する学習用データ生成部と、を備える。 A first aspect of the present invention is an information processing device. This apparatus obtains a learning model machine-learned so as to output an identification label including a plurality of index values indicating the probability that the input image data is image data of a plurality of identification targets, respectively. A watermark pattern acquisition unit for acquiring a watermark pattern to be embedded in the learning model; and acquiring a watermark image data set constituting learning data for re-learning used for re-learning for embedding the watermark pattern in the learning model. An image acquisition unit that performs the same number of patterns as the image data included in the watermark image data set, and a superimposition pattern acquisition unit that acquires a plurality of patterns in which each pattern overlaps the watermark pattern; The combination of the image data included in the watermark image data set and the plurality of patterns is Comprising a learning data generating unit that generates a 習用 training data.
前記情報処理装置は、前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得するモデル適用部をさらに備えてもよく、前記重畳用パターン取得部は、前記モデル適用部が取得した複数の識別ラベルの重ね合わせが前記透かしパターンとなるように、前記複数の識別ラベルのうちの少なくとも一部の識別ラベルを修正した識別ラベルを前記パターンとして取得してもよく、前記学習用データ生成部は、各識別ラベルと当該識別ラベルに対応する前記画像データとの組み合わせを前記再学習用学習データとして生成してもよい。 The information processing apparatus may further include a model application unit that obtains a plurality of identification labels that are outputs of the learning model, each of which receives image data included in the watermark image data set, and the superimposition pattern The acquiring unit is an identification label obtained by correcting at least a part of the plurality of identification labels so that a superimposition of the plurality of identification labels acquired by the model application unit becomes the watermark pattern. The learning data generator may generate a combination of each identification label and the image data corresponding to the identification label as the learning data for re-learning.
前記情報処理装置は、前記再学習用学習データを用いて前記学習モデルを再学習する学習実行部をさらに備えてもよい。 The information processing device may further include a learning execution unit that re-learns the learning model using the learning data for re-learning.
前記識別ラベルは、前記複数の識別対象と同数の要素から構成されるベクトルであってもよく、前記透かしパターンは、前記識別ラベルの要素と同数の画素から構成される画像であってもよく、前記学習用データ生成部は、前記複数の識別ラベルそれぞれの要素を所定の手順にしたがって2次元データに変換する変換部と、前記変換部が変換した複数の2次元データのそれぞれと前記透かしパターンとに基づいて、前記2次元データそれぞれを修正する修正部と、を備えてもよく、前記変換部は、修正された前記2次元データを前記識別ラベルの形式に変換してもよい。 The identification label may be a vector composed of the same number of elements as the plurality of identification targets, the watermark pattern may be an image composed of the same number of pixels as the elements of the identification label, The learning data generation unit includes: a conversion unit configured to convert each element of the plurality of identification labels into two-dimensional data according to a predetermined procedure; and each of the plurality of two-dimensional data converted by the conversion unit and the watermark pattern. And a correction unit that corrects each of the two-dimensional data based on the two-dimensional data, and the conversion unit may convert the corrected two-dimensional data into the format of the identification label.
前記学習用データ生成部は、前記変換部が変換した2次元データと前記透かしパターンとの差異が所定の除外条件を満たす場合、当該2次元データに対応する画像データを前記透かし用画像データセットから除外する画像選択部をさらに備えてもよい。 When the difference between the two-dimensional data converted by the conversion unit and the watermark pattern satisfies a predetermined exclusion condition, the learning data generation unit converts image data corresponding to the two-dimensional data from the watermark image data set. An image selection unit to be excluded may be further provided.
前記透かしパターン取得部は、前記学習モデルに埋め込むための2以上の異なる透かしパターンを取得してもよく、前記画像取得部は、前記異なる透かしパターンそれぞれに対応する複数の前記透かし用画像データセットを取得してもよく、前記学習用データ生成部は、前記異なる透かしパターンそれぞれに対応する前記再学習用学習データを生成してもよい。 The watermark pattern obtaining unit may obtain two or more different watermark patterns for embedding in the learning model, and the image obtaining unit may obtain a plurality of the watermark image data sets corresponding to the different watermark patterns, respectively. The learning data generating unit may generate the learning data for re-learning corresponding to each of the different watermark patterns.
本発明の第2の態様は、情報処理方法である。この方法において、プロセッサが、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得するステップと、前記学習モデルに埋め込むための透かしパターンを取得するステップと、前記学習モデルに前記透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得するステップと、前記透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが前記透かしパターンとなる複数のパターンを取得するステップと、前記透かし用画像データセットに含まれる画像データと前記複数のパターンとの組み合わせを前記再学習用学習データとして生成するステップと、を実行する。 A second aspect of the present invention is an information processing method. In this method, the processor acquires a learning model machine-learned to output an identification label including a plurality of index values indicating the probability that the input image data is image data of each of the plurality of identification targets. Acquiring a watermark pattern for embedding in the learning model, and acquiring a watermark image data set constituting learning data for re-learning used for re-learning for embedding the watermark pattern in the learning model. Obtaining a plurality of patterns, the number of which is the same as the number of image data included in the watermark image data set, and each pattern being superimposed is the watermark pattern; and Learning for re-learning the combination of image data and the plurality of patterns Performing the steps of generating as over data, the.
本発明の第3の態様は、プログラムである。このプログラムは、コンピュータに、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得する機能と、前記学習モデルに埋め込むための透かしパターンを取得する機能と、前記学習モデルに前記透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する機能と、前記透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが前記透かしパターンとなる複数のパターンを取得する機能と、前記透かし用画像データセットに含まれる画像データと前記複数のパターンとの組み合わせを前記再学習用学習データとして生成する機能と、を実現させる。 A third aspect of the present invention is a program. This program acquires a learning model machine-learned to output, to a computer, an identification label composed of a plurality of index values indicating the probability that input image data is image data of each of a plurality of identification targets. A function for acquiring a watermark pattern for embedding in the learning model, and a function for acquiring a watermark image data set constituting learning data for re-learning used for re-learning for embedding the watermark pattern in the learning model. And a function of acquiring a plurality of patterns that are the same number as the image data included in the watermark image data set and in which each pattern is superimposed becomes the watermark pattern; and a function included in the watermark image data set. A combination of image data and the plurality of patterns is generated as the re-learning learning data. A function of, to realize.
本発明の第4の態様は、透かし検出装置である。この装置は、透かし検出の対象とする学習モデルであって、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得するモデル取得部と、学習モデルに埋め込まれた透かしを検出するための透かし用画像データセットを取得する画像取得部と、前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得するモデル適用部と、前記複数の識別ラベルを重ね合わせて生成されるパターンを出力するパターン出力部と、を備える。 A fourth aspect of the present invention is a watermark detection device. This apparatus outputs an identification label, which is a learning model to be subjected to watermark detection, and is composed of a plurality of index values indicating the probability that input image data is image data of each of a plurality of identification targets. A model acquisition unit that acquires a learning model that has been machine-learned; an image acquisition unit that acquires a watermark image data set for detecting a watermark embedded in the learning model; and image data included in the watermark image data set. A model application unit that acquires a plurality of identification labels that are outputs of the learning model, each of which is an input, and a pattern output unit that outputs a pattern generated by superimposing the plurality of identification labels.
前記透かし検出装置は、検証対象となる透かしパターンを取得する透かしパターン取得部と、前記パターン出力部が出力したパターンと前記透かしパターンとを比較可能な態様で提示するパターン提示部と、を備えてもよい。 The watermark detection device includes a watermark pattern acquisition unit that acquires a watermark pattern to be verified, and a pattern presentation unit that presents the pattern output by the pattern output unit and the watermark pattern in a comparable manner. Is also good.
本発明の第5の態様は、透かし検出方法である。この方法において、プロセッサが、透かし検出の対象とする学習モデルであって、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得するステップと、学習モデルに埋め込まれた透かしを検出するための透かし用画像データセットを取得するステップと、前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得するステップと、前記複数の識別ラベルを重ね合わせて生成されるパターンを出力するステップと、を実行する。 A fifth aspect of the present invention is a watermark detection method. In this method, the processor outputs an identification label, which is a learning model to be subjected to watermark detection, and includes a plurality of index values indicating the probability that the input image data is image data of each of the plurality of identification targets. Acquiring a learning model machine-learned so as to obtain a watermark image data set for detecting a watermark embedded in the learning model, and acquiring image data sets included in the watermark image data set. And a step of obtaining a plurality of identification labels that are outputs of the learning model, and outputting a pattern generated by superimposing the plurality of identification labels.
本発明の第6の態様は、プログラムである。このプログラムは、コンピュータに、透かし検出の対象とする学習モデルであって、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得する機能と、学習モデルに埋め込まれた透かしを検出するための透かし用画像データセットを取得する機能と、前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得する機能と、前記複数の識別ラベルを重ね合わせて生成されるパターンを出力する機能と、を実現させる。 A sixth aspect of the present invention is a program. This program outputs, to a computer, an identification label that is a learning model to be subjected to watermark detection and that is configured with a plurality of index values indicating the probability that the input image data is image data of a plurality of identification targets. A function of acquiring a learning model machine-learned so as to acquire a watermark image data set for detecting a watermark embedded in the learning model, and a function of acquiring a watermark image data set included in the watermark image data set. And a function of outputting a pattern generated by superimposing the plurality of identification labels, the function of acquiring a plurality of identification labels which are outputs of the learning model.
上記のプログラムを提供するため、あるいはプログラムの一部をアップデートするために、このプログラムを記録したコンピュータ読み取り可能な記録媒体が提供されてもよく、また、このプログラムが通信回線で伝送されてもよい。 In order to provide the above-mentioned program or update a part of the program, a computer-readable recording medium on which the program is recorded may be provided, and the program may be transmitted via a communication line. .
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。 Note that any combination of the above-described components and any conversion of the expression of the present invention between a method, an apparatus, a system, a computer program, a data structure, a recording medium, and the like are also effective as embodiments of the present invention.
本発明によれば、学習モデルの出所を特定できるようにする技術を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the technique which can specify the source of a learning model can be provided.
<実施の形態の概要>
以下、図1、図2、及び図3を参照して、実施の形態の概要を述べる。
<Outline of Embodiment>
Hereinafter, an outline of an embodiment will be described with reference to FIGS. 1, 2, and 3. FIG.
図1(a)−(b)は、画像判別用の学習モデルを説明するための模式図である。実施の形態に係る情報処理装置は、例えばニューラルネットワークやSVM(Support Vector Machine)等の既知の機械学習技術を用いて作成された画像判別用の学習モデルに、透かしデータを埋め込むための装置である。また、実施の形態に係る透かし検出装置は、情報処理装置が透かしを埋め込んだ学習モデルから、埋め込まれた透かしを検出するための装置である。 FIGS. 1A and 1B are schematic diagrams for explaining a learning model for image discrimination. The information processing apparatus according to the embodiment is an apparatus for embedding watermark data in a learning model for image discrimination created using a known machine learning technique such as a neural network or SVM (Support Vector Machine). . The watermark detection device according to the embodiment is a device for detecting an embedded watermark from a learning model in which the information processing device has embedded the watermark.
図1(a)−(b)において、学習モデルMは複数の動物を識別対象とするモデルである。図1(a)−(b)に示す例では、学習モデルMは、猫、猿、犬、象、羊、キリン等を含む100種類の動物を識別することができる。学習モデルMに画像データを入力すると、学習モデルMは、入力データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルLを出力する。限定はしないが、学習モデルMが出力する識別ラベルLは、識別対象である100種類の動物それぞれに対応する100種類の値を並べたデータであり、典型的には100個の要素を持つベクトルデータである。識別ラベルLの各要素は0以上1以下の値を取り、学習モデルMに入力された画像データが100種類の動物それぞれである蓋然性を示している。 1A and 1B, a learning model M is a model in which a plurality of animals are identified. In the example shown in FIGS. 1A and 1B, the learning model M can identify 100 types of animals including cats, monkeys, dogs, elephants, sheep, giraffes, and the like. When image data is input to the learning model M, the learning model M outputs an identification label L including a plurality of index values indicating the probability that the input data is image data of each of the plurality of identification targets. Although not limited, the identification label L output by the learning model M is data in which 100 kinds of values corresponding to 100 kinds of animals to be identified are arranged, and typically a vector having 100 elements. Data. Each element of the identification label L takes a value of 0 or more and 1 or less, and indicates that the image data input to the learning model M is 100 kinds of animals.
例えば、学習モデルMに猫画像Icを入力したときに学習モデルMが出力する識別ラベルLcは、「猫」に対応する要素が大きな値となり、その他の要素は小さな値となる。図1(a)−(b)では、識別ラベルの要素の値が大きいほど黒く、小さいほど白くなるように図示している。このため、図1(a)に示す識別ラベルLcでは、「猫」に対応する要素は黒くそれ以外の要素は白くなっている。同様に、学習モデルMに猿画像Imを入力した時に学習モデルMが出力する識別ラベルLmは、「猿」に対応する要素は黒くそれ以外の要素は白くなっている。 For example, in the identification label Lc output from the learning model M when the cat image Ic is input to the learning model M, the element corresponding to “cat” has a large value, and the other elements have small values. FIGS. 1A and 1B show that the larger the value of the element of the identification label is, the blacker it is, and the smaller the value of the element is, the whiter it is. Therefore, in the identification label Lc shown in FIG. 1A, the element corresponding to "cat" is black and the other elements are white. Similarly, in the identification label Lm output from the learning model M when the monkey image Im is input to the learning model M, the element corresponding to “monkey” is black, and the other elements are white.
一般に、学習モデルMが識別対象としていない被写体が写っている画像データを学習モデルMに入力した場合、学習モデルMが出力する識別ラベルLの各要素は、予測することが難しいランダムな値となる。図1(b)では、学習モデルMが識別対象としていない風景画像Ilを学習モデルMに入力すると、学習モデルMは、各要素がランダムな値である識別ラベルLlを出力したことを示している。同様に、学習モデルMが識別対象としていない雪だるま画像Isを学習モデルMに入力しても、学習モデルMは、各要素がランダムな値である識別ラベルLsを出力する。ここで、図1(b)に示すように、学習モデルMに入力する画像データが異なると、出力される識別ラベルLのパターンも異なる。 In general, when image data including a subject that is not an object to be identified by the learning model M is input to the learning model M, each element of the identification label L output by the learning model M is a random value that is difficult to predict. . In FIG. 1B, when a landscape image Il that the learning model M is not to identify is input to the learning model M, the learning model M outputs an identification label Ll in which each element is a random value. . Similarly, even if the snow model image Is not input to the learning model M is input to the learning model M, the learning model M outputs an identification label Ls in which each element is a random value. Here, as shown in FIG. 1B, when the image data input to the learning model M is different, the pattern of the output identification label L is also different.
実施の形態に係る情報処理装置は、まず、学習モデルに埋め込むための透かし画像と、透かし画像を埋め込む対象とする学習モデルとを取得する。次に、情報処理装置は、学習モデルMが識別対象としていない被写体が写っている画像データセットを用意する。最後に、情報処理装置は、画像データセットを構成する複数の画像データそれぞれを学習モデルMに入力したときに出力される複数の識別ラベルLを重ね合わせることで透かし画像となるように、学習モデルMを再学習(ファインチューニング;Fine-tuning)する。 First, the information processing apparatus according to the embodiment acquires a watermark image to be embedded in a learning model and a learning model to which the watermark image is to be embedded. Next, the information processing apparatus prepares an image data set in which a subject not identified by the learning model M is identified. Lastly, the information processing apparatus superimposes a plurality of identification labels L output when each of the plurality of image data constituting the image data set is input to the learning model M, so that the learning model can be obtained as a watermark image. Re-learn M (fine-tuning).
図2は、学習モデルMのファインチューニングを説明するための模式図である。図1(b)に示す風景画像Ilと雪だるま画像Isとはともに、透かし埋め込み及び透かし検出用として情報処理装置が取得した画像データセットIwの一部である。 FIG. 2 is a schematic diagram for explaining fine tuning of the learning model M. Both the landscape image Il and the snowman image Is shown in FIG. 1B are a part of the image data set Iw acquired by the information processing device for watermark embedding and watermark detection.
実施の形態に係る情報処理装置は、画像データセットIwと同数のランダム画像であって、各ランダム画像を重ね合わせると透かし画像Wとなるランダム画像群を用意する。情報処理装置は、各ランダム画像の要素から構成されるベクトルを生成して教師用識別ラベルLtとする。情報処理装置は、教師用識別ラベルLtと画像データセットIwを構成する画像データとを対応づけた再学習用学習データを生成する。 The information processing apparatus according to the embodiment prepares a random image group that is the same number of random images as the image data set Iw and becomes a watermark image W when each random image is superimposed. The information processing apparatus generates a vector including the elements of each random image and sets the vector as the teacher identification label Lt. The information processing apparatus generates learning data for re-learning in which the teacher identification label Lt is associated with the image data forming the image data set Iw.
情報処理装置は、学習モデルMに画像データを入力すると、その画像データに対応づけられた識別ラベルを出力するように、学習モデルMをファインチューニングする。例えば、学習モデルMがニューラルネットワークを用いて生成されている場合、画像データセットIwを構成する画像データを学習モデルMに入力したときの出力と、その画像データに対応づけた教師用識別ラベルLtとの誤差を取得する。情報処理装置は、取得した誤差に基づいて誤差逆伝播法により、学習モデルMのパラメータを更新する。 When the image data is input to the learning model M, the information processing apparatus finely tunes the learning model M so as to output an identification label associated with the image data. For example, when the learning model M is generated using a neural network, an output when image data constituting the image data set Iw is input to the learning model M, and a teacher identification label Lt associated with the image data. And get the error. The information processing device updates the parameters of the learning model M by the error backpropagation method based on the acquired error.
なお、情報処理装置は、再学習前の学習モデルMに画像データを入力したときに出力される識別ラベルと類似した識別ラベルを、その画像データと対応づけて再学習用学習データを生成してもよい。これにより、画像データセットIwを構成する画像データを学習モデルMに入力したときの出力と、その画像データに対応づけた教師用識別ラベルLtとの誤差が小さくなるため、再学習の収束を早めることが期待できる。 The information processing apparatus generates learning data for re-learning by associating an identification label similar to an identification label output when image data is input to the learning model M before re-learning with the image data. Is also good. Thereby, the error between the output when the image data constituting the image data set Iw is input to the learning model M and the teacher identification label Lt associated with the image data is reduced, and the convergence of the re-learning is accelerated. Can be expected.
図3は、複数の識別ラベルLを重ね合わせることで透かし画像Wが形成される様子を模式的に示す図である。実施の形態に係る透かし検出装置は、画像データセットIwを構成する各画像データを再学習された学習モデルMに入力し、出力される複数の識別ラベルLoを取得する。識別ラベルLoは100行1列のベクトルであるが、透かし検出装置は、図3に示すように、各識別ラベルLoの要素を並べ替えて10行10列の画像データを生成する。透かし検出装置は、識別ラベルLoの要素を並べ替えて生成した画像を重ね合わせることにより、透かし画像Wを取得する。図3は、透かし画像がアルファベットの「au」という文字が描かれた画像である場合の例を示している。 FIG. 3 is a diagram schematically illustrating a state in which a watermark image W is formed by overlapping a plurality of identification labels L. The watermark detection device according to the embodiment inputs each image data constituting the image data set Iw to the retrained learning model M, and acquires a plurality of identification labels Lo to be output. Although the identification label Lo is a vector having 100 rows and 1 column, the watermark detection apparatus rearranges the elements of each identification label Lo to generate image data of 10 rows and 10 columns, as shown in FIG. The watermark detection device obtains the watermark image W by superimposing images generated by rearranging the elements of the identification label Lo. FIG. 3 shows an example in which the watermark image is an image in which letters of the alphabet “au” are drawn.
情報処理装置は、学習モデルMのファインチューニングに用いた画像データセットIwと透かし画像Wとを、情報処理装置も含めて外部から改竄できない安全な保管場所に保管する。透かし検出装置は、透かし検出の対象となる学習モデルMを取得した場合、保管場所から画像データセットIwを取得して透かし検出の対象となる学習モデルMに入力する。透かし検出装置は、学習モデルMが出力した識別ラベルLoを重ね合わせて生成した画像と、保管場所から取得した透かし画像Wとを比較する。比較の結果、画像が一致すれば、透かし検出装置は、透かし検出の対象となる学習モデルMは、情報処理装置1が透かし画像を埋め込んだ学習モデルMであると判定する。 The information processing device stores the image data set Iw and the watermark image W used for the fine tuning of the learning model M in a safe storage location including the information processing device that cannot be falsified from the outside. When acquiring the learning model M to be subjected to watermark detection, the watermark detection device acquires the image data set Iw from the storage location and inputs the acquired image data set Iw to the learning model M to be subjected to watermark detection. The watermark detection device compares the image generated by superimposing the identification labels Lo output by the learning model M with the watermark image W obtained from the storage location. As a result of the comparison, if the images match, the watermark detection device determines that the learning model M to be subjected to the watermark detection is the learning model M in which the information processing device 1 has embedded the watermark image.
このように、実施の形態に係る情報処理装置は、学習モデルMに透かし画像Wを埋め込むことができる。また、実施の形態に係る透かし検出装置は、透かし画像Wが埋め込まれた学習モデルMから透かし画像Wを取り出すことができる。このように、実施の形態に係る情報処理装置及び透かし検出装置は、学習モデルMの出所を特定できるようにすることができる。 As described above, the information processing apparatus according to the embodiment can embed the watermark image W in the learning model M. Further, the watermark detection device according to the embodiment can extract the watermark image W from the learning model M in which the watermark image W is embedded. Thus, the information processing device and the watermark detection device according to the embodiment can specify the source of the learning model M.
<実施の形態に係る情報処理装置1の機能構成>
図4は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部10と制御部11とを備える。図4において、矢印は主なデータの流れを示しており、図4に示していないデータの流れがあってもよい。図4において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図4に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に別れて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
<Functional Configuration of Information Processing Apparatus 1 According to Embodiment>
FIG. 4 is a diagram schematically illustrating a functional configuration of the information processing apparatus 1 according to the embodiment. The information processing device 1 includes a storage unit 10 and a control unit 11. In FIG. 4, arrows indicate main data flows, and there may be data flows not shown in FIG. In FIG. 4, each functional block shows not a configuration of a hardware (device) unit but a configuration of a functional unit. Therefore, the functional blocks shown in FIG. 4 may be implemented in a single device, or may be separately implemented in a plurality of devices. The transfer of data between the functional blocks may be performed via any means such as a data bus, a network, a portable storage medium, and the like.
記憶部10は、情報処理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。 The storage unit 10 includes a read only memory (ROM) for storing a basic input output system (BIOS) of a computer that implements the information processing device 1, a random access memory (RAM) serving as a work area of the information processing device 1, and an OS ( It is a large-capacity storage device such as a hard disk drive (HDD) or a solid state drive (SSD) that stores an operating system, an application program, and various information referred to when the application program is executed.
制御部11は、情報処理装置1のCPUやGPU等のプロセッサであり、記憶部10に記憶されたプログラムを実行することによって、モデル取得部110、透かしパターン取得部111、画像取得部112、重畳用パターン取得部113、学習用データ生成部114、モデル適用部115、及び学習実行部116として機能する。 The control unit 11 is a processor such as a CPU or a GPU of the information processing device 1, and executes a program stored in the storage unit 10 to execute a model acquisition unit 110, a watermark pattern acquisition unit 111, an image acquisition unit 112, It functions as the use pattern acquisition unit 113, the learning data generation unit 114, the model application unit 115, and the learning execution unit 116.
なお、図4は、情報処理装置1が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部11を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。 FIG. 4 shows an example in which the information processing device 1 is configured by a single device. However, the information processing apparatus 1 may be implemented by a plurality of processors and computation resources such as memories, such as a cloud computing system. In this case, each unit constituting the control unit 11 is realized by at least one of a plurality of different processors executing a program.
モデル取得部110は、学習モデルMを取得する。モデル取得部110が取得する学習モデルMは、画像が入力されると識別ラベルLを出力するように機械学習された学習モデルMである。ここで、学習モデルMが出力する識別ラベルLは、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルである。 The model acquisition unit 110 acquires a learning model M. The learning model M acquired by the model acquiring unit 110 is a learning model M that has been machine-learned so as to output an identification label L when an image is input. Here, the identification label L output by the learning model M is an identification label composed of a plurality of index values indicating the probability that the input image data is the image data of each of the plurality of identification targets.
透かしパターン取得部111は、学習モデルMに埋め込むための透かしパターンを取得する。透かしパターン取得部111が取得する透かしパターンは、例えば上述した透かし画像Wである。しかしながら、透かしパターン取得部111が取得する透かしパターンは画像データに限らず、例えば1次元のベクトルであってもよい。 The watermark pattern acquisition unit 111 acquires a watermark pattern to be embedded in the learning model M. The watermark pattern acquired by the watermark pattern acquisition unit 111 is, for example, the watermark image W described above. However, the watermark pattern acquired by the watermark pattern acquisition unit 111 is not limited to image data, and may be, for example, a one-dimensional vector.
画像取得部112は、学習モデルMに透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する。画像取得部112が取得する透かし用画像データセットの具体例は、上述した画像データセットIwである。 The image obtaining unit 112 obtains a watermark image data set constituting learning data for re-learning used for re-learning for embedding a watermark pattern in the learning model M. A specific example of the watermark image data set acquired by the image acquisition unit 112 is the above-described image data set Iw.
重畳用パターン取得部113は、透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが透かしパターンとなる複数のパターンを取得する。重畳用パターン取得部113が取得する複数のパターンの詳細は後述する。 The superimposition pattern acquisition unit 113 acquires a plurality of patterns that are the same number as the image data included in the watermark image data set, and in which the superposition of each pattern becomes a watermark pattern. Details of the plurality of patterns acquired by the superimposition pattern acquisition unit 113 will be described later.
学習用データ生成部114は、透かし用画像データセットに含まれる画像データと複数のパターンとの組み合わせを再学習用学習データとして生成する。これにより、情報処理装置1は、透かしパターンを埋め込む対象とする学習モデルMに透かしパターンを埋め込むためのファインチューニングで用いる再学習用学習データを生成することができる。このため、情報処理装置1は、学習モデルMの出所を特定できるようにすることができる。 The learning data generating unit 114 generates a combination of the image data included in the watermark image data set and a plurality of patterns as learning data for re-learning. Thereby, the information processing apparatus 1 can generate learning data for re-learning used in fine tuning for embedding the watermark pattern in the learning model M in which the watermark pattern is to be embedded. For this reason, the information processing apparatus 1 can specify the source of the learning model M.
ここで、モデル適用部115は、透かし用画像データセットに含まれる画像データそれぞれを入力とする学習モデルMの出力である複数の識別ラベルLを取得する。重畳用パターン取得部113は、モデル適用部115が取得した複数の識別ラベルの重ね合わせが透かしパターンとなるように、複数の識別ラベルLのうちの少なくとも一部の識別ラベルを修正した識別ラベルを上述のパターンとして取得する。学習用データ生成部114は、各識別ラベルとその識別ラベルに対応する画像データとの組み合わせを再学習用学習データとして生成する。 Here, the model applying unit 115 acquires a plurality of identification labels L which are outputs of the learning model M which receives image data included in the watermark image data set, respectively. The superimposition pattern acquisition unit 113 converts an identification label obtained by correcting at least a part of the plurality of identification labels L so that the superposition of the plurality of identification labels acquired by the model application unit 115 becomes a watermark pattern. It is acquired as the above-mentioned pattern. The learning data generation unit 114 generates a combination of each identification label and image data corresponding to the identification label as learning data for re-learning.
図5(a)−(b)は、実施の形態に係る学習用データ生成部114による識別ラベルの修正の一例を説明するための図である。また、図6は、実施の形態に係る学習用データ生成部114の内部構成を模式的に示す図である。 FIGS. 5A and 5B are diagrams illustrating an example of correction of an identification label by the learning data generation unit 114 according to the embodiment. FIG. 6 is a diagram schematically illustrating an internal configuration of the learning data generation unit 114 according to the embodiment.
上述したように、学習モデルMが出力する識別ラベルLは、学習モデルMが識別可能な複数の識別対象と同数の要素から構成されるベクトルである。透かしパターンが透かし画像Wである場合、透かし画像Wは識別ラベルLの要素と同数の画素から構成される画像である。 As described above, the identification label L output by the learning model M is a vector including the same number of elements as the plurality of identification targets that can be identified by the learning model M. When the watermark pattern is the watermark image W, the watermark image W is an image including the same number of pixels as the elements of the identification label L.
識別ラベルを修正するため、学習用データ生成部114は、変換部1140と修正部1141とを備えている。変換部1140は、複数の識別ラベルそれぞれの要素を所定の手順にしたがって透かしパターンである透かし画像Wの画素配列と同じ配列の2次元データに変換する。図5(a)−(b)において、符号Lが付された画像は、変換部1140が識別ラベルLから変換した画像である。図5(a)−(b)に示すように、透かし用画像データセットに含まれる画像データは学習モデルMの識別対象ではないため、画像に変換された識別ラベルLは、ノイズ画像のような画像となっている。 To correct the identification label, the learning data generation unit 114 includes a conversion unit 1140 and a correction unit 1141. The conversion unit 1140 converts each element of the plurality of identification labels into two-dimensional data having the same array as the pixel array of the watermark image W, which is a watermark pattern, according to a predetermined procedure. In FIGS. 5A and 5B, the image denoted by reference symbol L is an image converted by the conversion unit 1140 from the identification label L. As shown in FIGS. 5A and 5B, since the image data included in the watermark image data set is not an identification target of the learning model M, the identification label L converted into an image is similar to a noise image. It is an image.
修正部1141は、変換部1140が変換した複数の2次元データのそれぞれと透かしパターンである透かし画像Wとに基づいて、各2次元データを修正する。具体的には、図5(a)−(b)において、白抜きの丸で示す記号はアダマール積を表す。変換部1140は、透かし画像Wと画像化した識別ラベルLとのアダマール積を、上述のパターン(すなわち、再学習に用いる教師用識別ラベルLt)とする。これにより、モデル適用部115は、各識別ラベルLの特徴を残しつつ、かつ透かし画像Wの特徴を含めた教師用識別ラベルLtを取得することができる。 The correction unit 1141 corrects each two-dimensional data based on each of the plurality of two-dimensional data converted by the conversion unit 1140 and the watermark image W that is a watermark pattern. Specifically, in FIGS. 5A and 5B, symbols indicated by white circles represent Hadamard products. The conversion unit 1140 sets the Hadamard product of the watermark image W and the imaged identification label L as the above-described pattern (that is, the teacher identification label Lt used for re-learning). Accordingly, the model applying unit 115 can acquire the teacher identification label Lt including the feature of the watermark image W while leaving the feature of each identification label L.
なお、透かし画像Wの背景(図3の例では「au」という文字以外の領域)の画素値を0とした場合、教師用識別ラベルLtの背景に対応する領域も0となる。透かし画像Wの背景の画素値を0に近い実数とすると、教師用識別ラベルLtの背景に対応する領域も0以外の値を持つことになる。図3は、透かし画像Wの背景の画素値が0以外の値である場合の例を示している。 When the pixel value of the background of the watermark image W (the area other than the character “au” in the example of FIG. 3) is 0, the area corresponding to the background of the teacher identification label Lt is also 0. If the pixel value of the background of the watermark image W is a real number close to 0, the area corresponding to the background of the teacher identification label Lt also has a value other than 0. FIG. 3 shows an example where the background pixel value of the watermark image W is a value other than 0.
図4の説明に戻る。学習実行部116は、学習用データ生成部114が生成した再学習用学習データを用いて学習モデルMをファインチューニングによって再学習する。これにより、学習実行部116は、学習モデルMに透かし画像Wを埋め込むことができる。 Returning to the description of FIG. The learning execution unit 116 re-learns the learning model M by fine tuning using the re-learning learning data generated by the learning data generation unit 114. Thereby, the learning execution unit 116 can embed the watermark image W in the learning model M.
ここで、学習実行部116は、学習モデルMの再学習時における学習率(学習モデルMのモデルパラメータの更新幅)を、学習モデルMの生成時における学習率より小さくしてもよい。これにより、学習実行部116は、再学習用学習データによって学習モデルMが過学習されることを抑制できる。 Here, the learning execution unit 116 may set the learning rate at the time of re-learning the learning model M (the update width of the model parameters of the learning model M) to be smaller than the learning rate at the time of generating the learning model M. Accordingly, the learning execution unit 116 can suppress the learning model M from being over-learned by the learning data for re-learning.
また、学習実行部116は、学習モデルMの再学習時に、学習用データ生成部114が生成した再学習用学習データに加えて、学習モデルMの生成時に用いた学習データを加えたデータを用いて、学習モデルMを再学習してもよい。このとき、学習実行部116は、再学習用学習データによって学習モデルMが過学習されることを抑制するために、学習用データ生成部114が生成した再学習用学習データに加える画像データの数が、学習用データ生成部114が生成した再学習用学習データに含まれる画像データよりも多くなるようにしてもよい。学習用データ生成部114が生成した再学習用学習データの数と、加算する学習用データの数との比率は、過学習の抑制と再学習にかかるコスト等を勘案して実験により定めればよいが、例えば1対10である。これにより、学習実行部116は、再学習用学習データによって学習モデルMが過学習されることを抑制できる。 The learning execution unit 116 uses data obtained by adding the learning data used when generating the learning model M, in addition to the learning data for re-learning generated by the learning data generation unit 114 when re-learning the learning model M. Then, the learning model M may be re-learned. At this time, the learning execution unit 116 determines the number of image data to be added to the re-learning learning data generated by the learning data generation unit 114 in order to prevent the learning model M from being over-learned by the re-learning learning data. May be larger than the image data included in the re-learning learning data generated by the learning data generation unit 114. The ratio between the number of learning data for re-learning generated by the learning data generation unit 114 and the number of learning data to be added is determined by experiments in consideration of suppression of over-learning and costs for re-learning. Good, but for example one to ten. Accordingly, the learning execution unit 116 can suppress the learning model M from being over-learned by the learning data for re-learning.
図2を参照して説明したように、学習実行部116は、再学習用学習データを入力とした場合に学習モデルMが出力する識別ラベルLと、教師用識別ラベルLtとの誤差に基づいて、誤差逆伝播法に基づいて学習モデルMのパラメータを更新する。このため、識別ラベルLと教師用識別ラベルLtとの誤差が小さい方が再学習の収束が早く、かつ再学習後の学習モデルMが学習前に持っていた識別性能を維持しやすいと考えられる。 As described with reference to FIG. 2, the learning execution unit 116 determines based on the error between the identification label L output by the learning model M when the learning data for re-learning is input and the identification label Lt for teacher. , The parameters of the learning model M are updated based on the backpropagation method. For this reason, it is considered that the smaller the error between the identification label L and the teacher identification label Lt, the faster the re-learning convergence and the easier it is to maintain the identification performance that the learning model M after re-learning had before learning. .
そのため、学習用データ生成部114は、画像選択部1142も備えている。画像選択部1142は、変換部1140が変換した2次元データと透かしパターンである透かし画像Wとの差異が所定の除外条件を満たす場合、その2次元データに対応する画像データを透かし用画像データセットから除外する。 Therefore, the learning data generation unit 114 also includes an image selection unit 1142. When the difference between the two-dimensional data converted by the conversion unit 1140 and the watermark image W as the watermark pattern satisfies a predetermined exclusion condition, the image selection unit 1142 converts the image data corresponding to the two-dimensional data into a watermark image data set. Exclude from
ここで「所定の除外条件」とは、画像選択部1142が再学習用画像データを構成する画像データを選択する際に参照する「画像選択条件」である。所定の除外条件の具体的な内容は、学習の収束性や透かし画像Wの特徴等を考慮して定めればよい。一例としては、2次元データと透かし画像Wとの差分画像の強度(例えば差分画像の画素値の絶対値の和や、差分画像の画素値の二乗和)が、透かし画像Wの強度の半分以上となることを、所定の除外条件としてもよい。 Here, the “predetermined exclusion condition” is an “image selection condition” that is referred to when the image selection unit 1142 selects the image data constituting the re-learning image data. The specific contents of the predetermined exclusion condition may be determined in consideration of the convergence of learning, the characteristics of the watermark image W, and the like. As an example, the intensity of the difference image between the two-dimensional data and the watermark image W (for example, the sum of the absolute values of the pixel values of the difference image or the sum of the squares of the pixel values of the difference image) is equal to or more than half of the intensity of the watermark image W. May be a predetermined exclusion condition.
これにより、学習用データ生成部114は、学習実行部116による学習モデルMのファインチューニングの収束性を向上することができ、再学習にかかるコストを低減することができる。 Accordingly, the learning data generation unit 114 can improve the convergence of the fine tuning of the learning model M by the learning execution unit 116, and can reduce the cost for re-learning.
以上、学習モデルMに埋め込む透かしパターンが1つであることを前提として説明したが、透かしパターンは複数であってもよい。この場合、透かしパターン取得部111は、学習モデルMに埋め込むための2以上の異なる透かしパターンを取得することになる。画像取得部112は、異なる透かしパターンそれぞれに対応する複数の透かし用画像データセットを取得する。これにより、学習用データ生成部114は、異なる透かしパターンそれぞれに対応する再学習用学習データを生成することができる。モデル適用部115は、学習用データ生成部114が生成した再学習用学習データを用いて学習モデルMをファインチューニングすることにより、学習モデルMに複数種類の透かしパターンを埋め込むことができる。 Although the description has been made on the assumption that one watermark pattern is embedded in the learning model M, a plurality of watermark patterns may be provided. In this case, the watermark pattern acquisition unit 111 acquires two or more different watermark patterns to be embedded in the learning model M. The image acquisition unit 112 acquires a plurality of watermark image data sets corresponding to different watermark patterns. Thereby, the learning data generation unit 114 can generate learning data for re-learning corresponding to each of the different watermark patterns. The model application unit 115 can embed a plurality of types of watermark patterns in the learning model M by fine tuning the learning model M using the learning data for re-learning generated by the learning data generation unit 114.
以上、情報処理装置1が学習モデルMに透かしパターンを埋め込む工程について説明した。続いて、透かしパターンが埋め込まれた学習モデルMから透かしパターンを検出する工程について説明する。 The process in which the information processing apparatus 1 embeds the watermark pattern in the learning model M has been described above. Next, a process of detecting a watermark pattern from the learning model M in which the watermark pattern is embedded will be described.
<実施の形態に係る透かし検出装置2の機能構成>
図7は、実施の形態に係る透かし検出装置2の機能構成を模式的に示す図である。透かし検出装置2は、記憶部20と制御部21とを備える。図7において、矢印は主なデータの流れを示しており、図7に示していないデータの流れがあってもよい。図7において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図7に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に別れて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
<Functional Configuration of Watermark Detection Apparatus 2 According to Embodiment>
FIG. 7 is a diagram schematically illustrating a functional configuration of the watermark detection device 2 according to the embodiment. The watermark detection device 2 includes a storage unit 20 and a control unit 21. In FIG. 7, arrows indicate main data flows, and there may be data flows not shown in FIG. In FIG. 7, each functional block shows a configuration of a function unit, not a configuration of a hardware (device) unit. Therefore, the functional blocks illustrated in FIG. 7 may be implemented in a single device, or may be separately implemented in a plurality of devices. The transfer of data between the functional blocks may be performed via any means such as a data bus, a network, a portable storage medium, and the like.
記憶部20は、透かし検出装置2を実現するコンピュータのBIOS等を格納するROMや透かし検出装置2の作業領域となるRAM、OSやアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するHDDやSSD等の大容量記憶装置である。 The storage unit 20 stores a ROM for storing a BIOS or the like of a computer that implements the watermark detection device 2, a RAM serving as a work area of the watermark detection device 2, an OS, an application program, and various information referred to when the application program is executed. It is a large-capacity storage device such as an HDD or SSD for storing.
制御部21は、透かし検出装置2のCPUやGPU等のプロセッサであり、記憶部20に記憶されたプログラムを実行することによって、モデル取得部210、画像取得部211、モデル適用部212、パターン出力部213、透かしパターン取得部214、及びパターン提示部215として機能する。 The control unit 21 is a processor such as a CPU and a GPU of the watermark detection device 2, and executes a program stored in the storage unit 20 to execute a model acquisition unit 210, an image acquisition unit 211, a model application unit 212, and a pattern output unit. Function as a unit 213, a watermark pattern acquisition unit 214, and a pattern presentation unit 215.
なお、図7は、透かし検出装置2が単一の装置で構成されている場合の例を示している。しかしながら、透かし検出装置2は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部11を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。また、透かし検出装置2の機能の少なくとも一部又は全部を、情報処理装置1が備えていてもよい。 FIG. 7 shows an example in which the watermark detection device 2 is configured by a single device. However, the watermark detection device 2 may be realized by a plurality of processors and computational resources such as memories as in a cloud computing system. In this case, each unit constituting the control unit 11 is realized by at least one of a plurality of different processors executing a program. The information processing device 1 may include at least a part or all of the functions of the watermark detection device 2.
モデル取得部210は、透かし検出の対象とする学習モデルMを取得する。学習モデルMは、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルLを出力するように機械学習された学習モデルである。 The model acquisition unit 210 acquires a learning model M to be subjected to watermark detection. The learning model M is a learning model that has been machine-learned so as to output an identification label L including a plurality of index values indicating the probability that the input image data is image data of each of a plurality of identification targets.
画像取得部211は、学習モデルMに埋め込まれた透かしを検出するための透かし用画像データセットを取得する。具体的には、画像取得部211が取得する透かし用画像データセットは、モデル適用部115が学習モデルMをファインチューニングする際に使用した再学習用学習データを構成する透かし用画像データセットと同一である。 The image acquisition unit 211 acquires a watermark image data set for detecting a watermark embedded in the learning model M. Specifically, the watermark image data set acquired by the image acquisition unit 211 is the same as the watermark image data set constituting the learning data for re-learning used when the model application unit 115 fine-tunes the learning model M. It is.
モデル適用部212は、透かし用画像データセットに含まれる画像データそれぞれを入力とする学習モデルMの出力である複数の識別ラベルLを取得する。パターン出力部213は、複数の識別ラベルLを重ね合わせて生成されるパターンを出力する。 The model applying unit 212 acquires a plurality of identification labels L which are outputs of the learning model M which receives image data included in the watermark image data set as input. The pattern output unit 213 outputs a pattern generated by overlapping a plurality of identification labels L.
図8(a)−(e)は、実施の形態に係るパターン出力部213が出力するパターンの一例を示す図である。具体的には、図8(a)は、60個の異なる識別ラベルLを重ね合わせてできるパターンを示す図であり、図8(b)は、240個の異なる識別ラベルLを重ね合わせてできるパターンを示す図である。同様に、図8(c)は、約2000個の異なる識別ラベルLを重ね合わせてできるパターンを示す図であり、図8(d)は、3000個の異なる識別ラベルLを重ね合わせてできるパターンを示す図である。なお、図8(e)は、透かし画像Wの元画像である。図8(d)に示すパターンに2値化処理を施すと、図8(e)に示す画像と一致する。 FIGS. 8A to 8E are diagrams illustrating an example of a pattern output by the pattern output unit 213 according to the embodiment. Specifically, FIG. 8A is a diagram illustrating a pattern formed by superimposing 60 different identification labels L, and FIG. 8B is a diagram illustrating a pattern obtained by superimposing 240 different identification labels L. It is a figure showing a pattern. Similarly, FIG. 8C is a diagram showing a pattern formed by overlapping about 2000 different identification labels L, and FIG. 8D is a pattern formed by overlapping 3000 different identification labels L. FIG. FIG. 8E shows the original image of the watermark image W. When the pattern shown in FIG. 8D is subjected to the binarization process, the pattern matches the image shown in FIG.
図8(a)−(d)に示すように、パターン出力部213が重ね合わせる識別ラベルLの数が少ないときは、識別ラベルLを重ね合わせても透かし画像Wを再現することができない。これにより、万が一透かし用画像データセットに含まれる画像データの一部が第三者に漏洩したとしても、漏洩した画像データの数が少なければ、第三者は透かし画像Wを特定することが困難である。このため、実施の形態に係る情報処理装置1は、第三者が推定することが困難な態様で学習モデルMに透かしパターンを埋め込むことができる。 As shown in FIGS. 8A to 8D, when the number of identification labels L to be superimposed by the pattern output unit 213 is small, the watermark image W cannot be reproduced even when the identification labels L are superimposed. Thereby, even if some of the image data included in the watermark image data set leaks to a third party, it is difficult for the third party to specify the watermark image W if the number of leaked image data is small. It is. For this reason, the information processing apparatus 1 according to the embodiment can embed the watermark pattern in the learning model M in a manner that is difficult for a third party to estimate.
図7の説明に戻る。透かしパターン取得部214は、検証対象となる透かしパターンを取得する。上述したように、透かしパターンである透かし画像Wは、透かし用画像データセットとともに外部から改竄できない安全な保管場所に保管されている。透かしパターン取得部214は、この保管場所から透かし画像Wを読み出して取得する。 Returning to the description of FIG. The watermark pattern acquisition unit 214 acquires a watermark pattern to be verified. As described above, the watermark image W, which is a watermark pattern, is stored together with the watermark image data set in a secure storage location that cannot be tampered with from the outside. The watermark pattern acquisition unit 214 reads and acquires the watermark image W from this storage location.
パターン提示部215は、パターン出力部213が出力したパターンと透かしパターン取得部214が取得した透かしパターンとを比較可能な態様で提示する。
図9は、実施の形態に係るパターン提示部215が提示する比較画面の一例を模式的に示す図である。図9は、学習モデルMに「透かしA」と「透かしB」との2種類の透かしパターンが埋め込まれている場合の例を示している。図9において、「透かしA」はアルファベットの「au」という文字が描かれた画像であり、「透かしB」は人の顔が描かれた画像である。
The pattern presentation unit 215 presents the pattern output by the pattern output unit 213 and the watermark pattern acquired by the watermark pattern acquisition unit 214 in a manner that allows comparison.
FIG. 9 is a diagram schematically illustrating an example of a comparison screen presented by the pattern presentation unit 215 according to the embodiment. FIG. 9 shows an example in which two types of watermark patterns “watermark A” and “watermark B” are embedded in the learning model M. In FIG. 9, “watermark A” is an image in which the letters “au” of the alphabet are drawn, and “watermark B” is an image in which a human face is drawn.
図9に示すように、パターン提示部215は、情報処理装置1が学習モデルMに埋め込んだ透かしパターンである透かし画像Wと、透かし検出装置2が透かし検出の対象とする学習モデルMから検出した画像とを並べて表示部Dに表示する。これにより、透かし検出装置2のユーザは、透かし検出の対象とする学習モデルMから検出した画像が透かし画像Wと一致するか否かを一見して確認することができる。 As illustrated in FIG. 9, the pattern presenting unit 215 detects a watermark image W that is a watermark pattern embedded in the learning model M by the information processing device 1 and a learning model M that is a target of the watermark detection by the watermark detection device 2. The images are displayed side by side on the display unit D. Thereby, the user of the watermark detection device 2 can see at a glance whether or not the image detected from the learning model M as the target of the watermark detection matches the watermark image W.
また、パターン提示部215は、透かし検出の対象とする学習モデルMから検出した画像と透かし画像Wとが一致するか否かを演算によって判定し、その結果を表示部Dに提示するようにしてもよい。具体的には、パターン提示部215は透かし検出の対象とする学習モデルMから検出した画像と透かし画像Wとの差分画像の強度が所定の条件(例えば、透かし画像Wの強度の10%以下となること)を満たす場合、両者が一致すると判定すればよい。パターン提示部215が算出した判定結果を表示部Dに表示させることにより、透かし検出装置2のユーザは、透かし検出の対象とする学習モデルMから検出した画像と透かし画像Wとが一致するか否かの判断の一助とすることができる。 Further, the pattern presenting unit 215 determines whether or not the image detected from the learning model M to be subjected to the watermark detection matches the watermark image W by calculation, and presents the result to the display unit D. Is also good. Specifically, the pattern presentation unit 215 determines that the strength of the difference image between the watermark image W and the image detected from the learning model M that is the target of the watermark detection is a predetermined condition (for example, 10% or less of the watermark image W strength). Satisfies), it may be determined that they match. By displaying the determination result calculated by the pattern presentation unit 215 on the display unit D, the user of the watermark detection device 2 can determine whether the image detected from the learning model M to be subjected to the watermark detection matches the watermark image W. This can help in the determination.
<情報処理装置1が実行する学習方法の処理フロー>
図10は、実施の形態に係る情報処理装置1が実行する処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
<Processing Flow of Learning Method Performed by Information Processing Apparatus 1>
FIG. 10 is a flowchart illustrating a flow of a process performed by information processing device 1 according to the embodiment. The process in this flowchart is started, for example, when the information processing device 1 is started.
モデル取得部110は、透かしパターンの埋め込み対象とする学習モデルMを取得する(S2)。透かしパターン取得部111は、学習モデルMに埋め込むための透かしパターンを取得する(S4)。画像取得部112は、学習モデルMに透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する(S6)。 The model acquisition unit 110 acquires a learning model M for embedding a watermark pattern (S2). The watermark pattern acquisition unit 111 acquires a watermark pattern to be embedded in the learning model M (S4). The image acquisition unit 112 acquires a watermark image data set that constitutes learning data for re-learning used for re-learning for embedding a watermark pattern in the learning model M (S6).
重畳用パターン取得部113は、透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが透かしパターンを再現するように構成された複数のパターンを取得する(S8)。学習用データ生成部114は、透かし用画像データセットに含まれる画像データと複数のパターンとの組み合わせを再学習用学習データとして生成する(S10)。 The superimposition pattern acquisition unit 113 acquires a plurality of patterns that are the same number as the image data included in the watermark image data set and are configured so that the superposition of the patterns reproduces the watermark pattern (S8). ). The learning data generation unit 114 generates a combination of image data and a plurality of patterns included in the watermark image data set as re-learning learning data (S10).
学習実行部116は、再学習用学習データを用いてファインチューニングにより学習モデルMを再学習する(S12)。これにより、学習実行部116は、学習モデルMに透かしパターンを埋め込むことができる。学習実行部116が再学習を実行すると、本フローチャートにおける処理は終了する。 The learning execution unit 116 re-learns the learning model M by fine tuning using the learning data for re-learning (S12). Thereby, the learning execution unit 116 can embed the watermark pattern in the learning model M. When the learning execution unit 116 executes the re-learning, the processing in this flowchart ends.
<実施の形態に係る情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、学習モデルMの出所を特定できるようにすることができる。
<Effects of Information Processing Apparatus 1 According to Embodiment>
As described above, according to the information processing apparatus 1 according to the embodiment, the source of the learning model M can be specified.
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。 As described above, the present invention has been described using the embodiment. However, the technical scope of the present invention is not limited to the scope described in the above embodiment, and various modifications and changes can be made within the scope of the gist. is there. For example, the specific embodiment of the distribution / integration of the apparatus is not limited to the above-described embodiment, and all or a part of the apparatus may be functionally or physically distributed / integrated in an arbitrary unit. Can be. Further, new embodiments that are generated by arbitrary combinations of the plurality of embodiments are also included in the embodiments of the present invention. The effect of the new embodiment caused by the combination has the effect of the original embodiment.
<第1の変形例>
上記では、情報処理装置1が学習モデルMに透かしパターンを埋め込む場合について説明した。ここで、透かしパターンは一つの独立した図柄でなくてもよく、例えば、一つの画像を2以上の部分画像に分割し、各部分画像をそれぞれ透かしパターンとしてもよい。このとき、情報処理装置1は、少なくとも1つの部分画像を学習モデルMに埋め込まずに保管用画像として保管する。この場合、透かし検出装置2は、学習モデルMから各透かしパターンを検出した上でそれらを組み合わせ、かつ保管用画像と組み合わせることで初めて完全な画像を得る。各部分画像は、いわば電子的な「割符」として機能する。これにより、万が一第三者に透かしパターンの一部が漏洩したとしても、第三者はその透かしパターンから全体画像を構成することは困難であるため、安全性をより向上することができる。
<First Modification>
The case where the information processing apparatus 1 embeds the watermark pattern in the learning model M has been described above. Here, the watermark pattern does not have to be one independent pattern. For example, one image may be divided into two or more partial images, and each partial image may be used as a watermark pattern. At this time, the information processing apparatus 1 stores at least one partial image as a storage image without embedding it in the learning model M. In this case, the watermark detection device 2 obtains a complete image for the first time by detecting each watermark pattern from the learning model M, combining them, and combining with the storage image. Each partial image functions as an electronic "tally". Thus, even if a part of the watermark pattern leaks to the third party, it is difficult for the third party to compose the whole image from the watermark pattern, so that the security can be further improved.
<第2の変形例>
上記では、学習用データ生成部114が、複数の識別ラベルLそれぞれの要素を所定の手順にしたがって透かしパターンの画素配列と同じ配列の2次元データに変換し、変換した複数の2次元データのそれぞれと透かしパターンとに基づいて、2次元データそれぞれを修正する場合について説明した。これに替えて、学習用データ生成部114は、透かしパターンの画素配列を所定の手順に従って識別ラベルLと同じ配列の1次元データに変換し、変換した複数の1次元データのそれぞれと透かしパターンとに基づいて、識別ラベルLを修正してもよい。
<Second Modification>
In the above description, the learning data generation unit 114 converts the elements of each of the plurality of identification labels L into two-dimensional data having the same array as the pixel array of the watermark pattern according to a predetermined procedure. The case has been described in which each of the two-dimensional data is corrected based on the watermark pattern. Instead, the learning data generation unit 114 converts the pixel array of the watermark pattern into one-dimensional data having the same array as the identification label L according to a predetermined procedure, and outputs each of the plurality of converted one-dimensional data and the watermark pattern. May be used to modify the identification label L.
<第3の変形例>
上記では、変換部1140が、透かし画像Wと画像化した識別ラベルLとのアダマール積を、再学習に用いる教師用識別ラベルLtとする場合について説明した。しかしながら、教師用識別ラベルLtの取得方法は上記に限られない。例えば、変換部1140は、透かし画像Wと画像化した識別ラベルLとのアダマール積の結果、画素値を大きい順に所定の数だけ選択し、残りは0又は0に近い実数(例えば、選択した画素値の中の最小値の10%)としてもよい。さらに、変換部1140は、選択した画素の値を1とし、それ以外の画素の値は0又は0に近い実数として教師用識別ラベルLtを2値化してもよい。
<Third Modification>
In the above, the case where the converting unit 1140 sets the Hadamard product of the watermark image W and the imaged identification label L as the teacher identification label Lt used for re-learning has been described. However, the method of acquiring the teacher identification label Lt is not limited to the above. For example, as a result of the Hadamard product of the watermark image W and the imaged identification label L, the conversion unit 1140 selects a predetermined number of pixel values in descending order, and the rest are 0 or a real number close to 0 (for example, the selected pixel (10% of the minimum value among the values). Furthermore, the conversion unit 1140 may binarize the teacher identification label Lt assuming that the value of the selected pixel is 1 and the values of the other pixels are 0 or a real number close to 0.
1・・・情報処理装置
10・・・記憶部
11・・・制御部
110・・・モデル取得部
111・・・透かしパターン取得部
112・・・画像取得部
113・・・重畳用パターン取得部
114・・・学習用データ生成部
1140・・・変換部
1141・・・修正部
1142・・・画像選択部
115・・・モデル適用部
116・・・学習実行部
2・・・透かし検出装置
20・・・記憶部
21・・・制御部
210・・・モデル取得部
211・・・画像取得部
212・・・モデル適用部
213・・・パターン出力部
214・・・透かしパターン取得部
215・・・パターン提示部
D・・・表示部
DESCRIPTION OF SYMBOLS 1 ... Information processing apparatus 10 ... Storage part 11 ... Control part 110 ... Model acquisition part 111 ... Watermark pattern acquisition part 112 ... Image acquisition part 113 ... Superposition pattern acquisition part 114 learning data generation unit 1140 conversion unit 1141 correction unit 1142 image selection unit 115 model application unit 116 learning execution unit 2 watermark detection device 20 ... Storage unit 21 ... Control unit 210 ... Model acquisition unit 211 ... Image acquisition unit 212 ... Model application unit 213 ... Pattern output unit 214 ... Watermark pattern acquisition unit 215 ... .Pattern presentation section D: Display section
Claims (12)
前記学習モデルに埋め込むための透かしパターンを取得する透かしパターン取得部と、
前記学習モデルに前記透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する画像取得部と、
前記透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが前記透かしパターンとなる複数のパターンを取得する重畳用パターン取得部と、
前記透かし用画像データセットに含まれる画像データと前記複数のパターンとの組み合わせを前記再学習用学習データとして生成する学習用データ生成部と、
を備える情報処理装置。 A model acquisition unit that acquires a learning model machine-learned to output an identification label including a plurality of index values indicating the probability that the input image data is the image data of each of the plurality of identification targets,
A watermark pattern acquisition unit that acquires a watermark pattern for embedding in the learning model,
An image acquisition unit that acquires a watermark image data set that constitutes learning data for re-learning used for re-learning for embedding the watermark pattern in the learning model;
A superimposition pattern acquisition unit that acquires the same number of patterns as the image data included in the watermark image data set, and acquires a plurality of patterns in which the superposition of the patterns is the watermark pattern.
A learning data generation unit that generates a combination of the image data and the plurality of patterns included in the watermark image data set as the re-learning learning data,
An information processing device comprising:
前記重畳用パターン取得部は、前記モデル適用部が取得した複数の識別ラベルの重ね合わせが前記透かしパターンとなるように、前記複数の識別ラベルのうちの少なくとも一部の識別ラベルを修正した識別ラベルを前記パターンとして取得し、
前記学習用データ生成部は、各識別ラベルと当該識別ラベルに対応する前記画像データとの組み合わせを前記再学習用学習データとして生成する、
請求項1に記載の情報処理装置。 The image processing apparatus further includes a model application unit that obtains a plurality of identification labels that are outputs of the learning model, each of which includes input image data included in the watermark image data set,
The superimposing pattern acquisition unit is an identification label obtained by correcting at least a part of the plurality of identification labels so that the superposition of the plurality of identification labels acquired by the model application unit becomes the watermark pattern. Is obtained as the pattern,
The learning data generation unit generates a combination of each identification label and the image data corresponding to the identification label as the learning data for re-learning,
The information processing device according to claim 1.
請求項1又は2に記載の情報処理装置。 Further comprising a learning execution unit for re-learning the learning model using the learning data for re-learning,
The information processing device according to claim 1.
前記透かしパターンは、前記識別ラベルの要素と同数の画素から構成される画像であり、
前記学習用データ生成部は、
前記複数の識別ラベルそれぞれの要素を所定の手順にしたがって2次元データに変換する変換部と、
前記変換部が変換した複数の2次元データのそれぞれと前記透かしパターンとに基づいて、前記2次元データそれぞれを修正する修正部と、を備え、
前記変換部は、修正された前記2次元データを前記識別ラベルの形式に変換する、
請求項1から3のいずれか一項に記載の情報処理装置。 The identification label is a vector composed of the same number of elements as the plurality of identification targets,
The watermark pattern is an image composed of the same number of pixels as the elements of the identification label,
The learning data generation unit includes:
A conversion unit configured to convert each element of the plurality of identification labels into two-dimensional data according to a predetermined procedure;
A correction unit that corrects each of the two-dimensional data based on each of the plurality of two-dimensional data converted by the conversion unit and the watermark pattern,
The conversion unit converts the corrected two-dimensional data into a format of the identification label.
The information processing device according to claim 1.
前記変換部が変換した2次元データと前記透かしパターンとの差異が所定の除外条件を満たす場合、当該2次元データに対応する画像データを前記透かし用画像データセットから除外する画像選択部をさらに備える、
請求項4に記載の情報処理装置。 The learning data generation unit includes:
When the difference between the two-dimensional data converted by the conversion unit and the watermark pattern satisfies a predetermined exclusion condition, the image processing apparatus further includes an image selection unit that excludes image data corresponding to the two-dimensional data from the watermark image data set. ,
The information processing device according to claim 4.
前記画像取得部は、前記異なる透かしパターンそれぞれに対応する複数の前記透かし用画像データセットを取得し、
前記学習用データ生成部は、前記異なる透かしパターンそれぞれに対応する前記再学習用学習データを生成する、
請求項1から5のいずれか一項に記載の情報処理装置。 The watermark pattern acquisition unit acquires two or more different watermark patterns for embedding in the learning model,
The image acquisition unit acquires a plurality of watermark image data sets corresponding to each of the different watermark patterns,
The learning data generation unit generates the re-learning learning data corresponding to each of the different watermark patterns.
The information processing device according to claim 1.
入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得するステップと、
前記学習モデルに埋め込むための透かしパターンを取得するステップと、
前記学習モデルに前記透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得するステップと、
前記透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが前記透かしパターンとなる複数のパターンを取得するステップと、
前記透かし用画像データセットに含まれる画像データと前記複数のパターンとの組み合わせを前記再学習用学習データとして生成するステップと、
を実行する情報処理方法。 The processor
A step of acquiring a learning model machine-learned to output an identification label composed of a plurality of index values indicating the probability that the input image data is the image data of each of the plurality of identification targets,
Obtaining a watermark pattern for embedding in the learning model;
Acquiring a watermark image data set constituting retraining learning data used for retraining for embedding the watermark pattern in the learning model,
Acquiring the same number of patterns as the image data included in the watermark image data set, and obtaining a plurality of patterns in which each pattern is the watermark pattern,
Generating a combination of the image data and the plurality of patterns included in the watermark image data set as the learning data for re-learning,
Information processing method for executing.
入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得する機能と、
前記学習モデルに埋め込むための透かしパターンを取得する機能と、
前記学習モデルに前記透かしパターンを埋め込むための再学習に用いる再学習用学習データを構成する透かし用画像データセットを取得する機能と、
前記透かし用画像データセットに含まれる画像データと同数のパターンであって、各パターンの重ね合わせが前記透かしパターンとなる複数のパターンを取得する機能と、
前記透かし用画像データセットに含まれる画像データと前記複数のパターンとの組み合わせを前記再学習用学習データとして生成する機能と、
を実現させるプログラム。 On the computer,
A function of acquiring a learning model machine-learned to output an identification label composed of a plurality of index values indicating the probability that the input image data is the image data of each of the plurality of identification targets,
A function of acquiring a watermark pattern for embedding in the learning model;
A function of acquiring a watermark image data set constituting learning data for re-learning used for re-learning for embedding the watermark pattern in the learning model,
A function of acquiring a plurality of patterns, which are the same number of patterns as the image data included in the watermark image data set, and in which each pattern is the watermark pattern,
A function of generating a combination of the image data and the plurality of patterns included in the watermark image data set as the learning data for re-learning,
The program that realizes.
学習モデルに埋め込まれた透かしを検出するための透かし用画像データセットを取得する画像取得部と、
前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得するモデル適用部と、
前記複数の識別ラベルを重ね合わせて生成されるパターンを出力するパターン出力部と、
を備える透かし検出装置。 A learning model to be subjected to watermark detection, wherein the input image data is machine-learned so as to output an identification label including a plurality of index values indicating probabilities that are image data of a plurality of identification targets. A model acquisition unit for acquiring a learning model,
An image acquisition unit that acquires a watermark image data set for detecting a watermark embedded in the learning model;
A model application unit that obtains a plurality of identification labels that are outputs of the learning model, each of which receives image data included in the watermark image data set,
A pattern output unit that outputs a pattern generated by overlapping the plurality of identification labels,
A watermark detection device comprising:
前記パターン出力部が出力したパターンと前記透かしパターンとを比較可能な態様で提示するパターン提示部と、
を備える請求項9に記載の透かし検出装置。 A watermark pattern acquisition unit that acquires a watermark pattern to be verified;
A pattern presenting unit that presents the pattern output by the pattern output unit and the watermark pattern in a comparable manner,
The watermark detection device according to claim 9, further comprising:
透かし検出の対象とする学習モデルであって、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得するステップと、
学習モデルに埋め込まれた透かしを検出するための透かし用画像データセットを取得するステップと、
前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得するステップと、
前記複数の識別ラベルを重ね合わせて生成されるパターンを出力するステップと、
を実行する透かし検出方法。 The processor
A learning model to be subjected to watermark detection, wherein the input image data is machine-learned so as to output an identification label including a plurality of index values indicating probabilities that are image data of a plurality of identification targets. Obtaining a learning model;
Obtaining a watermark image data set for detecting a watermark embedded in the learning model;
Acquiring a plurality of identification labels that are outputs of the learning model with each of the image data included in the watermark image data set as an input,
Outputting a pattern generated by superimposing the plurality of identification labels,
Perform watermark detection method.
透かし検出の対象とする学習モデルであって、入力された画像データが複数の識別対象それぞれの画像データである蓋然性を示す複数の指標値から構成される識別ラベルを出力するように機械学習された学習モデルを取得する機能と、
学習モデルに埋め込まれた透かしを検出するための透かし用画像データセットを取得する機能と、
前記透かし用画像データセットに含まれる画像データそれぞれを入力とする前記学習モデルの出力である複数の識別ラベルを取得する機能と、
前記複数の識別ラベルを重ね合わせて生成されるパターンを出力する機能と、
を実現させるプログラム。
On the computer,
A learning model to be subjected to watermark detection, wherein the input image data is machine-learned so as to output an identification label including a plurality of index values indicating probabilities that are image data of a plurality of identification targets. A function to acquire a learning model,
A function of acquiring a watermark image data set for detecting a watermark embedded in the learning model,
A function of acquiring a plurality of identification labels that are outputs of the learning model with each of the image data included in the watermark image data set as an input,
A function of outputting a pattern generated by superimposing the plurality of identification labels,
The program that realizes.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018120128A JP6892844B2 (en) | 2018-06-25 | 2018-06-25 | Information processing device, information processing method, watermark detection device, watermark detection method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018120128A JP6892844B2 (en) | 2018-06-25 | 2018-06-25 | Information processing device, information processing method, watermark detection device, watermark detection method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020003879A true JP2020003879A (en) | 2020-01-09 |
| JP6892844B2 JP6892844B2 (en) | 2021-06-23 |
Family
ID=69100405
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018120128A Active JP6892844B2 (en) | 2018-06-25 | 2018-06-25 | Information processing device, information processing method, watermark detection device, watermark detection method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6892844B2 (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111738062A (en) * | 2020-05-09 | 2020-10-02 | 广智微芯(扬州)有限公司 | Automatic re-identification method and system based on embedded platform |
| CN113887438A (en) * | 2021-09-30 | 2022-01-04 | 平安银行股份有限公司 | Watermark detection method, device, equipment and medium for face image |
| JP2024518148A (en) * | 2021-05-20 | 2024-04-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Signing and authenticating digital images and other data arrays - Patents.com |
| WO2025169704A1 (en) * | 2024-02-05 | 2025-08-14 | Lineヤフー株式会社 | Information processing device, server, information processing method, and program |
-
2018
- 2018-06-25 JP JP2018120128A patent/JP6892844B2/en active Active
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111738062A (en) * | 2020-05-09 | 2020-10-02 | 广智微芯(扬州)有限公司 | Automatic re-identification method and system based on embedded platform |
| CN111738062B (en) * | 2020-05-09 | 2024-05-17 | 广智微芯(扬州)有限公司 | Automatic re-identification system based on embedded platform |
| JP2024518148A (en) * | 2021-05-20 | 2024-04-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Signing and authenticating digital images and other data arrays - Patents.com |
| JP7769455B2 (en) | 2021-05-20 | 2025-11-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Signing and authenticating digital images and other data arrays - Patents.com |
| CN113887438A (en) * | 2021-09-30 | 2022-01-04 | 平安银行股份有限公司 | Watermark detection method, device, equipment and medium for face image |
| CN113887438B (en) * | 2021-09-30 | 2024-06-04 | 平安银行股份有限公司 | Watermark detection method, device, equipment and medium for face image |
| WO2025169704A1 (en) * | 2024-02-05 | 2025-08-14 | Lineヤフー株式会社 | Information processing device, server, information processing method, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6892844B2 (en) | 2021-06-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20250191403A1 (en) | Forgery detection of face image | |
| Zhou et al. | Coverless image steganography using partial-duplicate image retrieval | |
| US10891476B2 (en) | Method, system, and neural network for identifying direction of a document | |
| JP2020003879A (en) | Information processing device, information processing method, watermark detection device, watermark detection method, and program | |
| JP2021521566A (en) | A method of learning and testing a data embedding network that synthesizes original data and mark data to generate marked data, and a learning device and test device using it. | |
| CN114549698B (en) | Text synthesis method and device and electronic equipment | |
| CN109344709A (en) | A method for detecting fake images generated by faces | |
| US20240144729A1 (en) | Generation method and information processing apparatus | |
| Zhou et al. | Dual-granularity feature alignment for change detection in remote sensing images | |
| Fang et al. | Attacking image splicing detection and localization algorithms using synthetic traces | |
| CN113887408A (en) | Method, device and equipment for detecting activated face video and storage medium | |
| Patel et al. | Deepfake video detection using neural networks | |
| Yu et al. | DFREC: Deepfake identity recovery based on identity-aware masked autoencoder | |
| CN113723518B (en) | Task hierarchical deployment method and device based on transfer learning and computer equipment | |
| CN116523725A (en) | Watermark processing method and device of neural network model | |
| CN113158838B (en) | Face Representation Attack Detection Method Based on Full-Size Depth Map Supervision | |
| JP7264272B2 (en) | Detection method, detection program and detection device | |
| US20230237778A1 (en) | Real time face swapping system and methods thereof | |
| Ahmed et al. | Deepfake detection system using deep learning | |
| Nataraj et al. | Holistic image manipulation detection using pixel co-occurrence matrices | |
| Oke et al. | Image Forgery Detection Using Cryptography and Deep Learning | |
| CN120881213B (en) | Security analysis methods and devices for protecting the personal privacy of image data | |
| CN112348061B (en) | Classification vector generation method, device, computer equipment and storage medium | |
| Khaled et al. | Boosting Deepfake Detection Accuracy with Unsharp Masking and EfficientNet Models. | |
| Raha et al. | Robust Face Liveness Detection for Biometric Authentication using Single Image |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200626 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210519 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210528 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6892844 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |