WO2023012967A1 - 生成方法、情報処理装置および生成プログラム - Google Patents
生成方法、情報処理装置および生成プログラム Download PDFInfo
- Publication number
- WO2023012967A1 WO2023012967A1 PCT/JP2021/029117 JP2021029117W WO2023012967A1 WO 2023012967 A1 WO2023012967 A1 WO 2023012967A1 JP 2021029117 W JP2021029117 W JP 2021029117W WO 2023012967 A1 WO2023012967 A1 WO 2023012967A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- neural network
- layer
- layers
- image data
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/40—Spoof detection, e.g. liveness detection
Definitions
- an object of the present invention is to reduce the computational cost of determination.
- an information processing device having a storage unit and a processing unit is provided. Also, in one aspect, a generating program for execution by a computer is provided.
- the information processing device 10 has a storage unit 11 and a processing unit 12 .
- the storage unit 11 may be a volatile semiconductor memory such as a RAM (Random Access Memory), or may be a non-volatile storage such as a HDD (Hard Disk Drive) or flash memory.
- the processing unit 12 is, for example, a processor such as a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), or a DSP (Digital Signal Processor). However, the processing unit 12 may include a specific application electronic circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).
- the processor executes programs stored in a memory such as a RAM (which may be the storage unit 11), for example.
- a collection of processors may be called a multiprocessor or simply a "processor.”
- the processing unit 12 calculates parameters for each of multiple layers included in the neural network 13 .
- the processing unit 12 may calculate the parameters by error backpropagation. For example, the processing unit 12 inputs image data to the neural network 13 and calculates the error between the output of the neural network 13 and the teacher label.
- the processing unit 12 propagates the error information in the reverse direction from the rear to the front of the neural network 13, calculates the gradient of the error with respect to the weight of each edge, and updates the weight based on the gradient.
- the neural network 14 includes layer 15 and does not include layer 16.
- Neural network 14 may include fewer layers than neural network 13 or may be a subset of the layers included in neural network 13 .
- the processing unit 12 sets the parameter 18 calculated for the layer 15 of the neural network 13 to the layer 15 of the neural network 14 . Thereby, the processing unit 12 generates a judgment model for judging the authenticity of the biometric image of the person included in the received image data.
- the layer 15 may be placed before the layer 16.
- the neural network 13 may also include First Layers, Middle Layers, and Last Layers, each of which includes a plurality of layers.
- the central layer group is arranged behind the front layer group, and the rear layer group is arranged behind the central layer group.
- layer 15 belongs to the central layer group and layer 16 belongs to the rear layer group.
- Neural network 14 may include all layers belonging to the central group of layers and none of the layers belonging to the rear group of layers. Also, the neural network 14 may include some layers belonging to the front layer group.
- the processing unit 12 divides the moving image read by the image sensor by a specific number of frames to generate a plurality of image data each including a plurality of continuous frames (for example, 3 continuous frames). good too.
- the processing unit 12 may use a plurality of image data generated from the same moving image as training data for calculating the parameters 18 .
- the processing unit 12 may generate one piece of image data by extracting only a specific number of frames from the head of the moving image read by the image sensor.
- the processing unit 12 may use this image data during a test for evaluating the determination accuracy of the neural network 14, or may use this image data during operation of the biometric authentication system.
- the information processing device 10 calculates the parameters of each of the multiple layers included in the neural network 13 by machine learning, and inherits the parameters of some of the layers to the neural network 14 to generate a judgment model.
- the information processing apparatus 10 can reduce the size of the judgment model, and can reduce the calculation cost for judging whether or not there is a presentation attack.
- the neural network 14 takes over the role of some layers in the neural network 13 . For this reason, compared to generating a judgment model with few layers from the beginning, a judgment model with many layers (deep) can enjoy the advantage of a multi-layered structure that makes it easier to extract essential features from image data. A decrease in model accuracy is suppressed.
- the neural network 14 takes over the parameters of a certain layer and does not take over the parameters of the layers behind it, thereby suppressing the deterioration of the accuracy of the judgment model.
- the neural network 14 does not include a backward layer group, the dependence on training data is reduced and the judgment accuracy is improved.
- the neural network 14 includes a central layer group, the highly versatile essential pattern information learned under the multi-layer structure is inherited, and the judgment accuracy is improved.
- neural network 14 does not include some of the forward layers, further reducing computational costs.
- FIG. 3 is a block diagram showing an example of software of the information processing device.
- the information processing apparatus 100 has a face image storage section 121 and a model storage section 122 . These storage units are implemented using the RAM 102 or the HDD 103, for example.
- the information processing device 100 also has a training data generation unit 123 , a machine learning unit 124 , a test data generation unit 125 and an attack detection unit 126 . These processing units are implemented using, for example, the CPU 101 or GPU 104 and programs.
- the machine learning unit 124 generates a judgment model by transfer learning.
- the machine learning unit 124 generates a certain three-dimensional convolutional neural network, and uses the parameters optimized here to generate another three-dimensional convolutional neural network as a judgment model.
- the latter three-dimensional convolutional neural network is a compact decision model with fewer layers than the former three-dimensional convolutional neural network.
- the attack detection unit 126 reads the determination model from the model storage unit 122.
- the attack detection unit 126 uses the test data generated by the test data generation unit 125 to evaluate the accuracy of the judgment model.
- the attack detection unit 126 inputs the input data included in the test data to the determination model, and calculates the error between the output of the determination model and the teacher label included in the test data.
- the attack detection unit 126 may store the accuracy of the judgment model in a non-volatile storage, display it on the display device 111, or transmit it to another information processing device.
- Each of the pooling layers 141 and 150 performs pooling that combines multiple adjacent elements in the tensor into one element. Thus, pooling layers 141 and 150 each reduce the height and width of the tensor. Pooling layers 141 and 150 combine, for example, 3 ⁇ 3 or 5 ⁇ 5 subregions into one element.
- the pooling is, for example, maximum value pooling that selects the maximum value element from among the small regions, or average pooling that calculates the average of a plurality of elements included in the small region.
- the front layer group is learned to have basic pattern information for extracting various basic features from facial images.
- the central layer group is trained to have essential pattern information for extracting the essential features of the face image from the basic features extracted in the front layer group.
- the rear layer group is learned to have abstract pattern information for further abstracting the essential features extracted in the central layer group for class determination.
- the central layer group sandwiched between the front layer group and the rear layer group will have general-purpose, high-quality essential pattern information. This is because the central layer group is far from the input data and the error information indicating the error with the teacher label, and is not greatly affected by the bias and noise contained in the training data.
- increasing the number of layers in the three-dimensional convolutional neural network increases the computational cost during class determination.
- Convolutional blocks 172-174 correspond to convolutional blocks 144-146 in FIG.
- the machine learning unit 124 copies the parameters of the convolution blocks 144-146 as initial values of the parameters of the convolution blocks 172-174.
- convolutional blocks 172-174 are expected to have essential pattern information for extracting essential features from the basic features extracted by convolutional block 171.
- the convolution block 140 is configured so that the tensor 181 a 12 , a 13 , a 14 , a 22 , a 23 , a 24 , a 32 , a 33 , a 34 and the kernel 182 k 11 , k 12 , k 13 , k 21 , k 22 , k 23 , k 31 , k 32 , and k 33 are calculated to calculate c 12 of the feature map 183 .
- the training data generator 123 normalizes each frame. Frame normalization includes facial region extraction, resizing, and pixel value normalization.
- the training data generation unit 123 generates training data including a plurality of records by combining three consecutive frames of input data and teacher labels assigned to moving images.
- the information processing apparatus 100 generates, through machine learning, a judgment model for judging whether or not a presentation attack is appropriate from an accepted face image. This improves the accuracy of determination and improves the security of the biometric authentication system. In addition, it becomes possible to flexibly deal with various presentation attack methods and various electronic devices.
- the detection model can accurately determine presentation attacks by taking into consideration biological-like movements, changes in reflected light, and changes over time such as changes in the environment. can. Moreover, by dividing the moving image into three frames and using them as training data, a diverse and sufficient amount of training data can be secured. In addition, by using the first three frames of the moving image as test data, the accuracy of the determination model can be appropriately evaluated assuming actual biometric authentication operation.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Image Analysis (AREA)
Abstract
Description
本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。
[第1の実施の形態]
第1の実施の形態を説明する。
第1の実施の形態の情報処理装置10は、生体認証システムに対するプレゼンテーション攻撃の検知に用いられる判定モデルを、機械学習によって生成する。情報処理装置10は、生成された判定モデルを用いてプレゼンテーション攻撃を検知してもよい。情報処理装置10は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置10が、コンピュータ、機械学習装置または生成装置と呼ばれてもよい。
次に、第2の実施の形態を説明する。
第2の実施の形態の情報処理装置100は、機械学習によって、生体認証システムに対するプレゼンテーション攻撃を検知するための判定モデルを生成する。第2の実施の形態の生体認証は、顔画像に基づいてユーザを認証する顔認証である。第2の実施の形態の判定モデルは、連続する複数フレーム分の顔画像を攻撃クラスまたは真正クラスに分類する三次元畳み込みニューラルネットワーク(3D_CNN)である。
情報処理装置100は、バスに接続されたCPU101、RAM102、HDD103、GPU104、入力インタフェース105、媒体リーダ106および通信インタフェース107を有する。CPU101は、第1の実施の形態の処理部12に対応する。RAM102またはHDD103は、第1の実施の形態の記憶部11に対応する。
情報処理装置100は、顔画像記憶部121およびモデル記憶部122を有する。これらの記憶部は、例えば、RAM102またはHDD103を用いて実装される。また、情報処理装置100は、訓練データ生成部123、機械学習部124、テストデータ生成部125および攻撃検知部126を有する。これらの処理部は、例えば、CPU101またはGPU104とプログラムとを用いて実装される。
図4は、訓練データ用およびテストデータ用の入力データの生成例を示す図である。
前述の通り、訓練データ生成部123は、複数のフレームを含む動画像を分割して、3フレームずつの入力データを生成する。訓練データ生成部123は、フレーム#1,#2,#3を含む入力データ131と、フレーム#4,#5,#6を含む入力データ132と、フレーム#7,#8,#9を含む入力データ133と、フレーム#10,#11,#12を含む入力データ134を生成する。入力データ131,132,133,134は、訓練データの中の異なるレコードに含まれるテンソルを形成する。
前述の通り、機械学習部124は、ある三次元畳み込みニューラルネットワークを生成し、転移学習によって別の三次元畳み込みニューラルネットワークを生成する。1つ目の三次元畳み込みニューラルネットワークは、図5に示すように、先頭から順に畳み込みブロック140、プーリング層141、畳み込みブロック142~149、プーリング層150、全結合層151および活性化層152を含む。
畳み込みブロック140は、先頭から順に畳み込み層161、バッチ正規化層162、活性化層163、畳み込み層164、バッチ正規化層165および活性化層166を含む。畳み込みブロック142~149などの他の畳み込みブロックが、畳み込みブロック140と同様のレイヤー構造を有してもよい。
転移学習によって生成される2つ目の三次元畳み込みニューラルネットワークは、図7に示すように、先頭から順に畳み込みブロック171~174、プーリング層175、全結合層176および活性化層177を含む。
畳み込みブロック140は、テンソル181を受け付ける。テンソル181は、例えば、高さ120かつ幅120のサイズをもつ。また、畳み込みブロック140は、ニューラルネットワークのエッジの重みの集合に相当するカーネル182をもつ。カーネル182は、例えば、高さ3かつ幅3、または、高さ5かつ幅5のサイズをもつ。機械学習部124は、機械学習によってカーネル182の係数を算出する。畳み込みブロック140は、テンソル181の上でカーネル182をスライドさせながら積和演算を行い、特徴マップ183を生成する。この畳み込み演算のストライドは、例えば、1である。特徴マップ183は、例えば、高さ120かつ幅120のサイズをもつ。
図9は、機械学習の手順例を示すフローチャートである。
(S10)訓練データ生成部123は、顔の動画像を3フレーム毎に分割する。
(S12)訓練データ生成部123は、連続する3フレームの入力データと動画像に付与された教師ラベルとを組み合わせて、複数のレコードを含む訓練データを生成する。
(S14)機械学習部124は、ステップS12で生成された訓練データのうちの少なくとも一部のレコードを用いて、機械学習によりモデルAのパラメータを最適化する。
(S16)機械学習部124は、モデルAのブロックA1,A4,A5,A6のパラメータを、モデルBのブロックB1~B4に初期値として複写する。
図10は、モデルテストの手順例を示すフローチャートである。
(S20)テストデータ生成部125は、顔の動画像の先頭3フレームを抽出する。
(S22)攻撃検知部126は、判定モデルである三次元畳み込みニューラルネットワークを読み出す。攻撃検知部126は、ステップS20で抽出された3フレームの顔画像を含む入力データを判定モデルに入力する。
11 記憶部
12 処理部
13,14 ニューラルネットワーク
15,16 レイヤー
17 画像データ
18 パラメータ
Claims (8)
- 人の生体画像をそれぞれ含む複数の画像データを用いた第1の機械学習により、第1のニューラルネットワークに含まれる複数のレイヤーそれぞれのパラメータを算出し、
前記複数のレイヤーのうちの第1のレイヤーを含み第2のレイヤーを含まない第2のニューラルネットワークの中の前記第1のレイヤーに、前記第1のニューラルネットワークの前記第1のレイヤーに対して算出された前記パラメータを設定することで、受け付けた画像データに含まれる人の生体画像の真正性を判定する判定モデルを生成する、
処理をコンピュータが実行する生成方法。 - 前記判定モデルの生成は、設定された前記パラメータを初期値として用いて、前記第2のニューラルネットワークを更新する第2の機械学習を実行することを含み、
前記判定モデルは、更新された前記第2のニューラルネットワークである、
請求項1記載の生成方法。 - 前記第2のレイヤーは、前記第1のレイヤーよりも後方のレイヤーである、
請求項1記載の生成方法。 - 前記複数のレイヤーは、前記第1のレイヤーを含む複数の第1のレイヤーと、前記第2のレイヤーを含み前記複数の第1のレイヤーよりも後方にある複数の第2レイヤーと、前記複数の第1のレイヤーよりも前方にある複数の第3のレイヤーとを含み、
前記第2のニューラルネットワークは、前記複数のレイヤーのうち、前記複数の第1のレイヤーを含み前記複数の第2のレイヤーを含まない、
請求項1記載の生成方法。 - 前記第2のニューラルネットワークは、前記複数の第3のレイヤーのうち、一部の第3のレイヤーを含み他の第3のレイヤーを含まない、
請求項4記載の生成方法。 - 前記第1の機械学習に用いられる前記複数の画像データは、複数のフレームを含む第1の動画像データを特定のフレーム数ずつ分割することで生成され、
前記判定モデルが受け付ける前記画像データは、第2の動画像データの先頭から前記特定のフレーム数のフレームを抽出することで生成される、
請求項1記載の生成方法。 - 人の生体画像をそれぞれ含む複数の画像データを記憶する記憶部と、
前記複数の画像データを用いた第1の機械学習により、第1のニューラルネットワークに含まれる複数のレイヤーそれぞれのパラメータを算出し、前記複数のレイヤーのうちの第1のレイヤーを含み第2のレイヤーを含まない第2のニューラルネットワークの中の前記第1のレイヤーに、前記第1のニューラルネットワークの前記第1のレイヤーに対して算出された前記パラメータを設定することで、受け付けた画像データに含まれる人の生体画像の真正性を判定する判定モデルを生成する処理部と、
を有する情報処理装置。 - 人の生体画像をそれぞれ含む複数の画像データを用いた第1の機械学習により、第1のニューラルネットワークに含まれる複数のレイヤーそれぞれのパラメータを算出し、
前記複数のレイヤーのうちの第1のレイヤーを含み第2のレイヤーを含まない第2のニューラルネットワークの中の前記第1のレイヤーに、前記第1のニューラルネットワークの前記第1のレイヤーに対して算出された前記パラメータを設定することで、受け付けた画像データに含まれる人の生体画像の真正性を判定する判定モデルを生成する、
処理をコンピュータに実行させる生成プログラム。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP21952792.6A EP4383188A4 (en) | 2021-08-05 | 2021-08-05 | GENERATION METHOD, INFORMATION PROCESSING DEVICE AND GENERATION PROGRAM |
| JP2023539481A JP7688289B2 (ja) | 2021-08-05 | 2021-08-05 | 判定モデル生成方法、情報処理装置および判定モデル生成プログラム |
| PCT/JP2021/029117 WO2023012967A1 (ja) | 2021-08-05 | 2021-08-05 | 生成方法、情報処理装置および生成プログラム |
| CN202180100743.4A CN117751380A (zh) | 2021-08-05 | 2021-08-05 | 生成方法、信息处理装置以及生成程序 |
| US18/405,358 US20240144729A1 (en) | 2021-08-05 | 2024-01-05 | Generation method and information processing apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/029117 WO2023012967A1 (ja) | 2021-08-05 | 2021-08-05 | 生成方法、情報処理装置および生成プログラム |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| US18/405,358 Continuation US20240144729A1 (en) | 2021-08-05 | 2024-01-05 | Generation method and information processing apparatus |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2023012967A1 true WO2023012967A1 (ja) | 2023-02-09 |
Family
ID=85154329
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2021/029117 Ceased WO2023012967A1 (ja) | 2021-08-05 | 2021-08-05 | 生成方法、情報処理装置および生成プログラム |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20240144729A1 (ja) |
| EP (1) | EP4383188A4 (ja) |
| JP (1) | JP7688289B2 (ja) |
| CN (1) | CN117751380A (ja) |
| WO (1) | WO2023012967A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025041253A1 (ja) * | 2023-08-22 | 2025-02-27 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法及び記録媒体 |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP4266260B1 (en) * | 2022-04-20 | 2026-01-07 | Axis AB | Encoding of training data for training of a neural network |
| US12505334B1 (en) * | 2024-06-20 | 2025-12-23 | Autobrains Technologies Ltd | Shared representation of neural network resources |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019500110A (ja) * | 2015-12-18 | 2019-01-10 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 頭部コンピュータ断層撮影における緊急性の特徴の解釈及び定量化 |
| US20190057268A1 (en) | 2017-08-15 | 2019-02-21 | Noblis, Inc. | Multispectral anomaly detection |
| WO2020158217A1 (ja) * | 2019-02-01 | 2020-08-06 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
| JP2020201243A (ja) * | 2019-06-05 | 2020-12-17 | 国立大学法人電気通信大学 | センシングシステム、及びセンシング方法 |
Family Cites Families (38)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106170800A (zh) * | 2014-09-12 | 2016-11-30 | 微软技术许可有限责任公司 | 经由输出分布来学习学生dnn |
| KR102276339B1 (ko) * | 2014-12-09 | 2021-07-12 | 삼성전자주식회사 | Cnn의 근사화를 위한 학습 장치 및 방법 |
| US20170161591A1 (en) * | 2015-12-04 | 2017-06-08 | Pilot Ai Labs, Inc. | System and method for deep-learning based object tracking |
| US10990808B2 (en) * | 2016-02-09 | 2021-04-27 | Aware, Inc. | Face liveness detection using background/foreground motion analysis |
| CN114386567B (zh) * | 2016-02-18 | 2026-01-09 | 谷歌有限责任公司 | 图像分类神经网络 |
| US10579860B2 (en) * | 2016-06-06 | 2020-03-03 | Samsung Electronics Co., Ltd. | Learning model for salient facial region detection |
| US10289823B2 (en) * | 2016-07-22 | 2019-05-14 | Nec Corporation | Camera system for traffic enforcement |
| KR102483642B1 (ko) * | 2016-08-23 | 2023-01-02 | 삼성전자주식회사 | 라이브니스 검사 방법 및 장치 |
| WO2018052586A1 (en) * | 2016-09-14 | 2018-03-22 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks |
| US10467458B2 (en) * | 2017-07-21 | 2019-11-05 | Altumview Systems Inc. | Joint face-detection and head-pose-angle-estimation using small-scale convolutional neural network (CNN) modules for embedded systems |
| US10360494B2 (en) * | 2016-11-30 | 2019-07-23 | Altumview Systems Inc. | Convolutional neural network (CNN) system based on resolution-limited small-scale CNN modules |
| US10726244B2 (en) * | 2016-12-07 | 2020-07-28 | Samsung Electronics Co., Ltd. | Method and apparatus detecting a target |
| KR102370063B1 (ko) * | 2017-03-28 | 2022-03-04 | 삼성전자주식회사 | 얼굴 인증 방법 및 장치 |
| US10552663B2 (en) * | 2017-05-02 | 2020-02-04 | Techcyte, Inc. | Machine learning classification and training for digital microscopy cytology images |
| CN107358157B (zh) * | 2017-06-07 | 2020-10-02 | 创新先进技术有限公司 | 一种人脸活体检测方法、装置以及电子设备 |
| US20190197395A1 (en) * | 2017-12-21 | 2019-06-27 | Fujitsu Limited | Model ensemble generation |
| CN111712830B (zh) * | 2018-02-21 | 2024-02-09 | 罗伯特·博世有限公司 | 使用深度传感器的实时对象检测 |
| ES2828358T3 (es) * | 2018-03-16 | 2021-05-26 | Identy Inc | Procedimiento para identificar un objeto dentro de una imagen y dispositivo móvil para ejecutar el procedimiento |
| JP7257756B2 (ja) * | 2018-08-20 | 2023-04-14 | キヤノン株式会社 | 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク |
| KR102140340B1 (ko) * | 2018-10-18 | 2020-07-31 | 엔에이치엔 주식회사 | 컨볼루션 뉴럴 네트워크를 통해 이미지 위변조를 탐지하는 시스템 및 이를 이용하여 무보정 탐지 서비스를 제공하는 방법 |
| US11972630B2 (en) * | 2019-06-03 | 2024-04-30 | West Virginia University | Cross-matching contactless fingerprints against legacy contact-based fingerprints |
| WO2021064787A1 (ja) * | 2019-09-30 | 2021-04-08 | 日本電気株式会社 | 学習システム、学習装置、および学習方法 |
| KR20210060146A (ko) * | 2019-11-18 | 2021-05-26 | 삼성전자주식회사 | 딥 뉴럴 네트워크 모델을 이용한 데이터 처리 방법 및 장치, 딥 뉴럴 네트워크 모델을 학습시키는 학습 방법 및 장치 |
| KR102748555B1 (ko) * | 2019-12-12 | 2025-01-02 | 삼성전자주식회사 | 라이브니스 검사 방법 및 라이브니스 검사 장치 |
| US11620516B2 (en) * | 2019-12-23 | 2023-04-04 | Arm Limited | Specializing neural networks for heterogeneous systems |
| JP7461485B2 (ja) * | 2020-02-03 | 2024-04-03 | グーグル エルエルシー | 復号ニューラルネットワークを使用した画像の真正性の検証 |
| KR20210155179A (ko) * | 2020-06-15 | 2021-12-22 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
| EP3940604A1 (en) * | 2020-07-09 | 2022-01-19 | Nokia Technologies Oy | Federated teacher-student machine learning |
| WO2022098207A1 (ko) * | 2020-11-09 | 2022-05-12 | 삼성전자 주식회사 | 인공지능 부호화 및 인공지능 복호화를 수행하기 위한 방법 및 장치 |
| CN116584093A (zh) * | 2020-12-09 | 2023-08-11 | 三星电子株式会社 | Ai编码装置及其操作方法和ai解码装置及其操作方法 |
| US11960572B2 (en) * | 2020-12-16 | 2024-04-16 | Fractal Analytics Private Limited | System and method for identifying object information in image or video data |
| US11934958B2 (en) * | 2021-01-13 | 2024-03-19 | Adobe Inc. | Compressing generative adversarial neural networks |
| US11842485B2 (en) * | 2021-03-04 | 2023-12-12 | GE Precision Healthcare LLC | System and methods for inferring thickness of anatomical classes of interest in two-dimensional medical images using deep neural networks |
| US12080054B2 (en) * | 2021-03-10 | 2024-09-03 | Acronis International Gmbh | Systems and methods for detecting small objects in an image using a neural network |
| US12087096B2 (en) * | 2021-03-31 | 2024-09-10 | Samsung Electronics Co., Ltd. | Method and apparatus with biometric spoofing consideration |
| US11875494B2 (en) * | 2021-06-23 | 2024-01-16 | Lendbuzz, Inc. | Artificial intelligence architectures for determining image authenticity |
| EP4421692A4 (en) * | 2021-10-21 | 2025-01-08 | Fujitsu Limited | Machine learning program, machine learning method, and information processing device |
| EP4235508B1 (en) * | 2022-02-28 | 2025-02-26 | Fujitsu Limited | Knowledge transfer |
-
2021
- 2021-08-05 CN CN202180100743.4A patent/CN117751380A/zh active Pending
- 2021-08-05 JP JP2023539481A patent/JP7688289B2/ja active Active
- 2021-08-05 WO PCT/JP2021/029117 patent/WO2023012967A1/ja not_active Ceased
- 2021-08-05 EP EP21952792.6A patent/EP4383188A4/en active Pending
-
2024
- 2024-01-05 US US18/405,358 patent/US20240144729A1/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019500110A (ja) * | 2015-12-18 | 2019-01-10 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 頭部コンピュータ断層撮影における緊急性の特徴の解釈及び定量化 |
| US20190057268A1 (en) | 2017-08-15 | 2019-02-21 | Noblis, Inc. | Multispectral anomaly detection |
| WO2020158217A1 (ja) * | 2019-02-01 | 2020-08-06 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
| JP2020201243A (ja) * | 2019-06-05 | 2020-12-17 | 国立大学法人電気通信大学 | センシングシステム、及びセンシング方法 |
Non-Patent Citations (1)
| Title |
|---|
| See also references of EP4383188A4 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025041253A1 (ja) * | 2023-08-22 | 2025-02-27 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法及び記録媒体 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7688289B2 (ja) | 2025-06-04 |
| EP4383188A4 (en) | 2024-09-18 |
| US20240144729A1 (en) | 2024-05-02 |
| EP4383188A1 (en) | 2024-06-12 |
| JPWO2023012967A1 (ja) | 2023-02-09 |
| CN117751380A (zh) | 2024-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11971924B2 (en) | Liveness test method and apparatus | |
| Elangovan et al. | Glaucoma assessment from color fundus images using convolutional neural network | |
| US20250191403A1 (en) | Forgery detection of face image | |
| CN110136224B (zh) | 图像融合方法和设备 | |
| US20240144729A1 (en) | Generation method and information processing apparatus | |
| CN108629168A (zh) | 脸部验证方法、设备以及计算设备 | |
| WO2021144943A1 (ja) | 制御方法、情報処理装置および制御プログラム | |
| CN115147875A (zh) | 防欺骗方法和设备 | |
| CN111104925A (zh) | 图像处理方法、装置、存储介质和电子设备 | |
| CN109934083A (zh) | 对象识别方法和设备 | |
| US20230030937A1 (en) | Method and apparatus with image preprocessing | |
| CN111898561A (zh) | 一种人脸认证方法、装置、设备及介质 | |
| Chakraborty | PRNU-based image manipulation localization with discriminative random fields | |
| CN114707572B (zh) | 一种基于损失函数敏感度的深度学习样本测试方法与装置 | |
| EP4116928A1 (en) | Control method, control program, and information processing device | |
| WO2022190301A1 (ja) | 学習装置、学習方法、及びコンピュータ可読媒体 | |
| TW202223839A (zh) | 血管偵測裝置及基於影像的血管偵測方法 | |
| CN116959124A (zh) | 活体检测模型训练方法、活体检测方法和装置 | |
| Chhikara et al. | Exploring deepfake detection: a comparative study of CNN models | |
| Prasad et al. | Influence of standalone and ensemble classifiers in face spoofing detection using lbp and cnn models | |
| Gupta et al. | Texture, Quality, and Motion-Based Analysis for Face Spoofing Detection System: A Review | |
| CN117037244A (zh) | 人脸安全检测方法、装置、计算机设备和存储介质 | |
| Jayabharathi et al. | POC-net: pelican optimization-based convolutional neural network for recognizing large pose variation from video | |
| JP7838677B2 (ja) | 情報処理装置、情報処理方法及び記録媒体 | |
| US20250238907A1 (en) | Body pose tracking of players from sports broadcast video feed |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21952792 Country of ref document: EP Kind code of ref document: A1 |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2023539481 Country of ref document: JP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 202180100743.4 Country of ref document: CN |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| ENP | Entry into the national phase |
Ref document number: 2021952792 Country of ref document: EP Effective date: 20240305 |