JP7728313B2 - インライヤーとアウトライヤーデータを分類するためのデータ分類方法 - Google Patents
インライヤーとアウトライヤーデータを分類するためのデータ分類方法Info
- Publication number
- JP7728313B2 JP7728313B2 JP2023190037A JP2023190037A JP7728313B2 JP 7728313 B2 JP7728313 B2 JP 7728313B2 JP 2023190037 A JP2023190037 A JP 2023190037A JP 2023190037 A JP2023190037 A JP 2023190037A JP 7728313 B2 JP7728313 B2 JP 7728313B2
- Authority
- JP
- Japan
- Prior art keywords
- inlier
- images
- unmarked
- outlier
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/809—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Description
S110、S112、S114、S116、S120、S130、S140、S141、S142、S150、S152、S154、S310、S312、S314、S320、S330、S340、S342、S350、S360、S370、S380、S510、S512、S514、S520、S530、S540、S542、S550、S560、S570、S580、S590、S591、S592、S593、S594 ステップ
200 電子装置
220 入力インターフェース
240 処理ユニット
260 記憶ユニット
280 ディスプレイ
ULIMG マークなし画像
IMG1、IMG2、IMG3、IMG4、IMG5、IMG6 画像
MLB 手動入力マーク
INL 指定インライヤー画像
OUTL 指定アウトライヤー画像
PRED 予測データ
SMX1、SMX1a、SMX1b 類似度行列
SS15、SS21 類似度スコア
SSc1 第1類似度スコア
SSc2 第2類似度スコア
WMX 重み付け行列
R1、R2…RQ 予測ラウンド
INLa 集合予測インライヤー画像
PREDR1、PREDR2、PREDRQ 中間インライヤー-アウトライヤー予測データ
PREDALL 集合予測データ
PREDp1 一部の予測データ
ADJ 調整入力データ
LBadj 調整後の手動入力マーク
Claims (9)
- 複数のマークなし画像を取得するステップと、
前記マークなし画像に対してQ個の予測ラウンドを実行し、Qは正の整数であり、前記Q個の予測ラウンドのそれぞれは、前記マークなし画像の中から複数のデフォルトインライヤー画像をランダムに選択することと、前記マークなし画像の前記デフォルトインライヤー画像に対する複数の第1類似度スコアを含む第1類似度行列を計算することと、前記第1類似度行列に基づいて、そのうちの1つの予測ラウンドにおける前記マークなし画像に関する複数の中間インライヤー-アウトライヤー予測データを生成することと、を含むステップと、
前記Q個の予測ラウンドのそれぞれにおいて生成された前記マークなし画像の前記中間インライヤー-アウトライヤー予測データを集合して、前記マークなし画像の中から複数の集合予測インライヤー画像を選択するステップと、
前記マークなし画像の前記集合予測インライヤー画像に対する複数の第2類似度スコアを含む第2類似度行列を計算するステップと、
前記第2類似度行列に基づいて、前記マークなし画像のそれぞれをインライヤーデータセット又はアウトライヤーデータセットに分類して、前記マークなし画像の複数のインライヤー-アウトライヤー予測データを生成するステップと、
を含むデータ分類方法。 - 前記マークなし画像に関する前記中間インライヤー-アウトライヤー予測データは、
全ての前記Q個の予測ラウンドにおいて、インライヤーに分類された前記マークなし画像の一部を前記集合予測インライヤー画像として選択することによって集合される請求項1に記載のデータ分類方法。 - 前記第1類似度スコアは、前記マークなし画像から取得された複数の特徴ベクトルと前記デフォルトインライヤー画像との間で類似度アルゴリズムを実行する方法によって計算される請求項1に記載のデータ分類方法。
- 前記類似度アルゴリズムは、コサイン類似度アルゴリズム、ユークリッド距離類似度アルゴリズム、マンハッタン距離アルゴリズム、又はハミング距離アルゴリズムである請求項3に記載のデータ分類方法。
- 前記中間インライヤー-アウトライヤー予測データは、
前記マークなし画像の前記第1類似度スコアと閾値類似度値とを比較するステップと、
前記マークなし画像のうちの1つに含まれる前記第1類似度スコアが前記閾値類似度値より高いことに応答して、前記マークなし画像のうちの1つを前記中間インライヤー-アウトライヤー予測データにおけるインライヤーとして予測するステップと、
前記マークなし画像のうちのもう1つに含まれる前記第1類似度スコアが前記閾値類似度値より低いことに応答して、前記マークなし画像のうちのもう1つを前記中間インライヤー-アウトライヤー予測データにおけるアウトライヤーとして予測するステップと、
によって生成される請求項1に記載のデータ分類方法。 - 前記インライヤーデータセットは、機械学習モデルを訓練する訓練データとして用いられ、前記アウトライヤーデータセットは、前記訓練データとして用いられない請求項1に記載のデータ分類方法。
- Qは、10~20の範囲にある請求項1に記載のデータ分類方法。
- 複数のマークなし画像を取得するステップと、
前記マークなし画像の中から指定インライヤー画像を選択するステップと、
前記マークなし画像の中から指定アウトライヤー画像を選択するステップと、
前記マークなし画像の前記指定インライヤー画像に対する複数の第1類似度スコアを含む第1類似度行列及び前記マークなし画像の前記指定アウトライヤー画像に対する複数の第2類似度スコアを計算するステップと、
前記第1類似度行列の各行に沿って最大値を選択して第2類似度行列を生成するステップであって、前記第2類似度行列は、前記第1類似度スコアおよび前記第2類似度スコアに基づいて第3類似度スコアを有するステップと、
前記第2類似度行列に重み付け行列を乗算して、第4類似度スコアを有する第3類似度行列を生成するステップであって、前記重み付け行列における重み付け値は、最大値が前記指定インライヤー画像に対応するか前記指定アウトライヤー画像に対応するかによって決定される、ステップと、
前記第3類似度行列の前記第4類似度スコアに基づいて、前記マークなし画像のそれぞれをインライヤーデータセット又はアウトライヤーデータセットに分類して、前記マークなし画像の複数のインライヤー-アウトライヤー予測データを生成するステップと、
を含むデータ分類方法。 - 複数のマークなし画像を取得するステップと、
前記マークなし画像に対してQ個の予測ラウンドを実行し、Qは正の整数であり、前記Q個の予測ラウンドのそれぞれは、前記マークなし画像の中から複数のデフォルトインライヤー画像をランダムに選択することと、前記マークなし画像の前記デフォルトインライヤー画像に対する第1類似度スコアを含む第1類似度行列を計算することと、前記第1類似度行列に基づいて、そのうちの1つの予測ラウンドにおける前記マークなし画像に関する複数の中間インライヤー-アウトライヤー予測データを生成することと、を含むステップと、
前記Q個の予測ラウンドのそれぞれにおいて生成された前記マークなし画像の前記中間インライヤー-アウトライヤー予測データを集合して、前記マークなし画像の中から複数の集合予測インライヤー画像を選択するステップと、
前記マークなし画像の前記集合予測インライヤー画像に対する複数の第2類似度スコアを含む第2類似度行列を計算するステップと、
前記第2類似度行列に基づいて、前記マークなし画像のそれぞれをインライヤーデータセット又はアウトライヤーデータセットに分類して、前記マークなし画像の複数の第1インライヤー-アウトライヤー予測データを生成するステップと、
前記マークなし画像の前記第1インライヤー-アウトライヤー予測データの一部を表示するステップと、
前記第1インライヤー-アウトライヤー予測データに基づいて修正された調整入力データを取得するステップと、
前記マークなし画像の前記調整入力データに対する複数の第3類似度スコアを含む第3類似度行列を計算するステップと、
前記第3類似度行列に基づいて、前記マークなし画像のそれぞれを前記インライヤーデータセット又は前記アウトライヤーデータセットに分類して、前記マークなし画像の複数の第2インライヤー-アウトライヤー予測データを生成するステップと、
を含むデータ分類方法。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202263382723P | 2022-11-08 | 2022-11-08 | |
| US63/382,723 | 2022-11-08 | ||
| US202363488976P | 2023-03-08 | 2023-03-08 | |
| US63/488,976 | 2023-03-08 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024068659A JP2024068659A (ja) | 2024-05-20 |
| JP7728313B2 true JP7728313B2 (ja) | 2025-08-22 |
Family
ID=91028182
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023190037A Active JP7728313B2 (ja) | 2022-11-08 | 2023-11-07 | インライヤーとアウトライヤーデータを分類するためのデータ分類方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US12292919B2 (ja) |
| JP (1) | JP7728313B2 (ja) |
| TW (1) | TWI862264B (ja) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000285141A (ja) | 1999-01-27 | 2000-10-13 | Ricoh Co Ltd | 画像検索装置,画像分類装置およびそれらの装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
| WO2019102043A1 (en) | 2017-11-27 | 2019-05-31 | Deciphex | Automated screening of histopathology tissue samples via analysis of a normal model |
| JP2020003846A (ja) | 2018-06-25 | 2020-01-09 | アズビル株式会社 | 判別ラベル付与支援装置および判別ラベル付与支援方法 |
| JP2020032044A (ja) | 2018-08-31 | 2020-03-05 | 富士フイルム株式会社 | 類似度決定装置、方法およびプログラム |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3567547A1 (en) * | 2013-10-11 | 2019-11-13 | Mauna Kea Technologies | Method for characterizing images acquired through a video medical device |
| US10614379B2 (en) * | 2016-09-27 | 2020-04-07 | Disney Enterprises, Inc. | Robust classification by pre-conditioned lasso and transductive diffusion component analysis |
| CN110832596B (zh) * | 2017-10-16 | 2021-03-26 | 因美纳有限公司 | 基于深度学习的深度卷积神经网络训练方法 |
| US12307668B2 (en) * | 2019-07-12 | 2025-05-20 | Bruker Nano, Inc | Methods and systems for defects detection and classification using X-rays |
| US11409772B2 (en) * | 2019-08-05 | 2022-08-09 | International Business Machines Corporation | Active learning for data matching |
| CN111046933B (zh) * | 2019-12-03 | 2024-03-05 | 东软集团股份有限公司 | 图像分类方法、装置、存储介质及电子设备 |
| CN111310846B (zh) | 2020-02-28 | 2024-07-02 | 平安科技(深圳)有限公司 | 一种选取样本图像的方法、装置、存储介质和服务器 |
| US20220138504A1 (en) * | 2020-10-29 | 2022-05-05 | Oracle International Corporation | Separation maximization technique for anomaly scores to compare anomaly detection models |
| US20240242131A1 (en) * | 2021-04-30 | 2024-07-18 | INDIAN INSTITUTE OF TECHNOLOGY MADRAS (IIT Madras) | System and method for data classification |
| CN114154570B (zh) * | 2021-11-30 | 2025-08-26 | 深圳壹账通智能科技有限公司 | 一种样本筛选方法、系统及神经网络模型训练方法 |
| CN114650167B (zh) * | 2022-02-08 | 2023-06-27 | 联想(北京)有限公司 | 一种异常检测方法、装置、设备及计算机可读存储介质 |
-
2023
- 2023-11-07 US US18/503,197 patent/US12292919B2/en active Active
- 2023-11-07 JP JP2023190037A patent/JP7728313B2/ja active Active
- 2023-11-07 TW TW112142925A patent/TWI862264B/zh active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000285141A (ja) | 1999-01-27 | 2000-10-13 | Ricoh Co Ltd | 画像検索装置,画像分類装置およびそれらの装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
| WO2019102043A1 (en) | 2017-11-27 | 2019-05-31 | Deciphex | Automated screening of histopathology tissue samples via analysis of a normal model |
| JP2021508373A (ja) | 2017-11-27 | 2021-03-04 | デシフェックス | 正常モデルの分析による組織病理学検査用組織サンプルの自動スクリーニング |
| JP2020003846A (ja) | 2018-06-25 | 2020-01-09 | アズビル株式会社 | 判別ラベル付与支援装置および判別ラベル付与支援方法 |
| JP2020032044A (ja) | 2018-08-31 | 2020-03-05 | 富士フイルム株式会社 | 類似度決定装置、方法およびプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024068659A (ja) | 2024-05-20 |
| TW202420235A (zh) | 2024-05-16 |
| US12292919B2 (en) | 2025-05-06 |
| TWI862264B (zh) | 2024-11-11 |
| US20240160660A1 (en) | 2024-05-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Shi et al. | COVID-19 automatic diagnosis with radiographic imaging: Explainable attention transfer deep neural networks | |
| Dasanayaka et al. | Deep learning methods for screening pulmonary tuberculosis using chest X-rays | |
| Fleuret et al. | Comparing machines and humans on a visual categorization test | |
| Rabbah et al. | Improving pneumonia diagnosis with high-accuracy CNN-Based chest X-ray image classification and integrated gradient | |
| US12165311B2 (en) | Unsupervised representation learning and active learning to improve data efficiency | |
| Nair et al. | Enhanced lung cancer detection: Integrating improved random walker segmentation with artificial neural network and random forest classifier | |
| JP2017102906A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| Kar et al. | Performance analysis of support Vector Machine (SVM) on challenging datasets for Forest Fire Detection | |
| CN109034218B (zh) | 模型训练方法、装置、设备及存储介质 | |
| Zunaed et al. | Learning to generalize towards unseen domains via a content-aware style invariant model for disease detection from chest X-rays | |
| CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
| Kausalya et al. | Enhancing chronic kidney disease diagnosis through Densenet-121 approach | |
| JP7728313B2 (ja) | インライヤーとアウトライヤーデータを分類するためのデータ分類方法 | |
| Shen et al. | Discovering the signal subgraph: An iterative screening approach on graphs | |
| Chakraborty et al. | Deep Learning and X‐Ray Imaging Innovations for Pneumonia Infection Diagnosis: Introducing DeepPneuNet | |
| Khan et al. | Enhancing Tuberculosis Diagnosis and Treatment Outcomes: A Stacked Loopy Decision Tree Approach Empowered by Moth Search Algorithm Optimization. | |
| Mishra et al. | Optimized VGG16 Model for Pneumonia Detection from Chest X-Rays | |
| Kaur et al. | PCOS Diagnosis Through Time-Series Analysis Using RNN with Attention Mechanism | |
| Jusman et al. | COVID-19 X-Ray Images Classification using Support Vector Machine and K-Nearest Neighbor | |
| CN118015323A (zh) | 用于分类内群与离群数据的数据分类方法 | |
| Prasetyo et al. | Optimizing Pneumonia Classification on Pediatric Chest X-Ray Images Using ConvNeXt Network | |
| Krinski et al. | DACov: a deeper analysis of data augmentation on the computed tomography segmentation problem | |
| Hapsari et al. | Automated Detection of Knee Osteoarthritis Using CNN with Adaptive Moment Estimation. | |
| Indratno et al. | Classification of images using Gaussian copula model in empirical cumulative distribution function space | |
| EP4273796A1 (en) | Processing spectral image data generated by a computed tomography scanner |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240116 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240116 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241111 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241119 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250214 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250408 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250520 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250715 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250812 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7728313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |