JP7811282B2 - 自己教師あり学習を用いた医療画像解析の方法 - Google Patents
自己教師あり学習を用いた医療画像解析の方法Info
- Publication number
- JP7811282B2 JP7811282B2 JP2024561905A JP2024561905A JP7811282B2 JP 7811282 B2 JP7811282 B2 JP 7811282B2 JP 2024561905 A JP2024561905 A JP 2024561905A JP 2024561905 A JP2024561905 A JP 2024561905A JP 7811282 B2 JP7811282 B2 JP 7811282B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- training
- patch
- masked
- masking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7753—Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Description
Claims (20)
- データ処理ハードウェアで実行される、コンピュータで実施される方法であって、前記データ処理ハードウェアに、
複数のアノテーションされていない多次元医療画像を含む第一の教師データセットを得るステップと、
自己教師ありマスク画像モデリング(MIM)訓練プロセスを実行して、前記第一の教師データセットで画像エンコーダを事前訓練するステップと、
複数のアノテーションされた多次元医療画像を含む第二の教師データセットを得るステップであって、前記アノテーションされた多次元医療画像のそれぞれは、対応する画像ボクセルが属する、複数のクラス候補のうちの1つを示す対応する正解ラベルとそれぞれ対になる、複数の画像ボクセルを含む、ステップと、
前記第二の教師データセットで画像解析モデルを学習させる教師あり訓練プロセスを実行して、対応する前記アノテーションされた多次元医療画像の複数の画像ボクセルに対応する正解ラベルを予測する方法を学習することによってそれぞれの対応するアノテーションされた多次元医療画像の強化された多次元医療画像を生成する方法を学習することを前記画像解析モデルに学習させるステップと、
を含む動作を行わせ、
前記画像解析モデルは、事前訓練済みの前記画像エンコーダを組み込み、
前記教師あり訓練プロセスの実行の間に前記画像解析モデルによって生成された前記強化された多次元医療画像は、それぞれのクラスに属するそれぞれの対応する画像ボクセルにかぶせるためのそれぞれのセグメンテーションマスクを定義することによって、前記複数のクラス候補のそれぞれのクラスを、複数のタスク候補のそれぞれの他のクラスから分離し、
前記第一の教師データセットの前記複数のアノテーションされていない多次元医療画像は、前記第二の教師データセットの前記複数のアノテーションされた多次元医療画像とは、異なる医療領域と関連づけられる、
方法。 - 前記自己教師ありMIM訓練プロセスを実行して、前記画像エンコーダを事前訓練するステップは、前記第一の教師データセットに対応するアノテーションされていない多次元医療画像のそれぞれについて、
対応するアノテーションされていない多次元医療画像を入力として受信するように構成された画像トークナイザを使用し、前記対応するアノテーションされていない多次元医療画像を特徴づける一連の離散ビジュアルトークンを生成する工程と、
前記対応するアノテーションされていない多次元医療画像を複数の画像パッチに分割する工程と、
前記対応するアノテーションされていない多次元医療画像から分割された前記画像パッチの一部をランダムにマスクする工程であって、
マスクされた画像パッチのそれぞれについて、
前記マスクされた画像パッチのためのエンコード済み隠れ表現を、前記画像エンコーダを用いて生成することと、
前記エンコード済み隠れ表現に基づき、対応する予測トークンを、デコーダを用いて生成することと、
を含む工程と、
前記マスクされた画像パッチに生成された前記予測トークン、及び前記マスクされた画像パッチと一致する前記一連の離散ビジュアルトークンからの対応するビジュアルトークンに基づき訓練損失を決定する工程と、
前記訓練損失に基づき前記画像エンコーダのパラメータをアップデートする工程と、
を含む、
請求項1に記載の方法。 - 前記画像エンコーダは、複数のマルチヘッドアテンション層を含み、
デコーダは、複数のマルチヘッドアテンション層を含む、
請求項2に記載の方法。 - 前記画像パッチの一部をランダムにマスクする工程は、様々なマスクされたパッチサイズ及びマスキング比率を使用する、中心領域マスキングストラテジ、ブロックごとのマスキングストラテジ、又は一様ランダムマスキングストラテジのうちの1つを用い、前記画像パッチの一部をランダムにマスクすることを含む、
請求項2又は3に記載の方法。 - 一連の離散ビジュアルトークンにおけるビジュアルトークンの数は、複数の画像パッチにおける画像パッチの数と等しい、
請求項2又は3に記載の方法。 - 前記自己教師ありMIM訓練プロセスを実行して、前記画像エンコーダを事前訓練するステップは、前記第一の教師データセットに対応するアノテーションされていない多次元医療画像のそれぞれについて、
前記対応するアノテーションされていない多次元医療画像を、複数の画像パッチに分割する工程であって、各画像パッチは、対応する生のボクセル値のセットによって表現される、工程と、
前記対応するアノテーションされていない多次元医療画像から分割された前記画像パッチの一部をランダムにマスクする工程であって、
マスクされた画像パッチのそれぞれについて、
前記マスクされた画像パッチのためのエンコード済み隠れ表現を、前記画像エンコーダを用いて生成することと、
前記エンコード済み隠れ表現に基づき、前記マスクされた画像パッチについての予測ボクセル値(270)を、予測ヘッドを用いて生成することと、
を含む工程と、
前記マスクされた画像パッチに生成された予測ボクセル値、及び前記マスクされた画像パッチを表現する前記対応する生のボクセル値のセットに基づき訓練損失を決定する工程と、
前記訓練損失に基づき前記画像エンコーダのパラメータをアップデートする工程と、
を含む、
請求項1から3のいずれかに記載の方法。 - 前記画像エンコーダは、複数のマルチヘッドアテンション層を含み、
前記予測ヘッドは、単一の線形層予測ヘッドを含み、デコーダの使用なしで前記エンコード済み隠れ表現から前記予測ボクセル値を生成するように構成される、
請求項6に記載の方法。 - 前記画像パッチの一部をランダムにマスクする工程は、様々なマスクされたパッチサイズ及びマスキング比率を使用する、中心領域マスキングストラテジ、ブロックごとのマスキングストラテジ、又は一様ランダムマスキングストラテジのうちの1つを用い、前記画像パッチの一部をランダムにマスクすることを含む、
請求項6に記載の方法。 - 前記画像解析モデルは、腫瘍セグメンテーションモデルを含む、
請求項1から3のいずれかに記載の方法。 - 前記画像解析モデルは、多臓器セグメンテーションモデルを含む、
請求項1から3のいずれかに記載の方法。 - システムであって、
データ処理ハードウェアと、
前記データ処理ハードウェアと通信し、前記データ処理ハードウェアで実行されると、前記データ処理ハードウェアに動作を行わせる命令を保存するメモリハードウェアと、
を含み、
前記動作は、
複数のアノテーションされていない多次元医療画像を含む第一の教師データセットを得るステップと、
自己教師ありマスク画像モデリング(MIM)訓練プロセスを実行して、前記第一の教師データセットで画像エンコーダを事前訓練するステップと、
複数のアノテーションされた多次元医療画像を含む第二の教師データセットを得るステップであって、前記アノテーションされた多次元医療画像のそれぞれは、対応する画像ボクセルが属する複数のクラス候補のうちの1つを示す対応する正解ラベルとそれぞれ対になる、複数の画像ボクセルを含む、ステップと、
前記第二の教師データセットで画像解析モデルを学習させる教師あり訓練プロセスを実行して、対応する前記アノテーションされた多次元医療画像の複数の画像ボクセルに対応する正解ラベルを予測する方法を学習することによってそれぞれの対応するアノテーションされた多次元医療画像の強化された多次元医療画像を生成する方法を学習することを前記画像解析モデルに学習させるステップと、
を含み、
前記画像解析モデルは、事前訓練済みの前記画像エンコーダを組み込み、
前記教師あり訓練プロセスの実行の間に前記画像解析モデルによって生成された前記強化された多次元医療画像は、それぞれのクラスに属するそれぞれの対応する画像ボクセルにかぶせるためのそれぞれのセグメンテーションマスクを定義することによって、前記複数のクラス候補のそれぞれのクラスを、複数のタスク候補のそれぞれの他のクラスから分離し、
前記第一の教師データセットの前記複数のアノテーションされていない多次元医療画像は、前記第二の教師データセットの前記複数のアノテーションされた多次元医療画像よりも、異なる医療領域と関連づけられる、
システム。 - 前記自己教師ありMIM訓練プロセスを実行して、前記画像エンコーダを事前訓練するステップは、前記第一の教師データセットに対応するアノテーションされていない多次元医療画像のそれぞれについて、
対応するアノテーションされていない多次元医療画像を入力として受信するように構成された画像トークナイザを使用し、前記対応するアノテーションされていない多次元医療画像を特徴づける一連の離散ビジュアルトークンを生成する工程と、
前記対応するアノテーションされていない多次元医療画像を複数の画像パッチに分割する工程と、
前記対応するアノテーションされていない多次元医療画像から分割された前記画像パッチの一部をランダムにマスクする工程であって、
マスクされた画像パッチそれぞれについて、
前記マスクされた画像パッチのためのエンコード済み隠れ表現を、前記画像エンコーダを用いて生成することと、
前記エンコード済み隠れ表現に基づき、対応する予測トークンを、デコーダを用いて生成することと、
を含む工程と、
前記マスクされた画像パッチに生成された前記予測トークン、及び前記マスクされた画像パッチと一致する前記一連の離散ビジュアルトークンからの対応するビジュアルトークンに基づき訓練損失を決定する工程と、
前記訓練損失に基づき前記画像エンコーダのパラメータをアップデートする工程と、
を含む、
請求項11に記載のシステム。 - 前記画像エンコーダは、複数のマルチヘッドアテンション層を含み、
デコーダは、複数のマルチヘッドアテンション層を含む、
請求項12に記載のシステム。 - 前記画像パッチの一部をランダムにマスクする工程は、様々なマスクされたパッチサイズ及びマスキング比率を使用する、中心領域マスキングストラテジ、ブロックごとのマスキングストラテジ、又は一様ランダムマスキングストラテジのうちの1つを用い、前記画像パッチの一部をランダムにマスクすることを含む、
請求項12又は13に記載のシステム。 - 一連の離散ビジュアルトークンにおけるビジュアルトークンの数は、複数の画像パッチにおける画像パッチの数と等しい、
請求項12又は13に記載のシステム。 - 前記自己教師ありMIM訓練プロセスを実行して、前記画像エンコーダを事前訓練するステップは、前記第一の教師データセットに対応するアノテーションされていない多次元医療画像のそれぞれについて、
前記対応するアノテーションされていない多次元医療画像を、複数の画像パッチに分割する工程であって、各画像パッチは、対応する生のボクセル値のセットによって表現される、工程と、
前記対応するアノテーションされていない多次元医療画像から分割された前記画像パッチの一部をランダムにマスクする工程であって、
マスクされた画像パッチのそれぞれについて、
前記マスクされた画像パッチのためのエンコード済み隠れ表現を、前記画像エンコーダを用いて生成することと、
前記エンコード済み隠れ表現に基づき、前記マスクされた画像パッチについての予測ボクセル値を、予測ヘッドを用いて生成することと、
を含む工程と、
前記マスクされた画像パッチに生成された予測ボクセル値、及びマスクされた画像パッチを表現する前記対応する生のボクセル値のセットに基づき訓練損失を決定する工程と、
前記訓練損失に基づき画像エンコーダのパラメータをアップデートする工程と、
を含む、
請求項11から13のいずれかに記載のシステム。 - 前記画像エンコーダは、複数のマルチヘッドアテンション層を含み、
前記予測ヘッドは、単一の線形層予測ヘッドを含み、デコーダの使用なしで前記エンコード済み隠れ表現から前記予測ボクセル値を生成するように構成される、
請求項16に記載のシステム。 - 前記画像パッチの一部をランダムにマスクする工程は、様々なマスクされたパッチサイズ及びマスキング比率を使用する、中心領域マスキングストラテジ、ブロックごとのマスキングストラテジ、又は一様ランダムマスキングストラテジのうちの1つを用い、前記画像パッチの一部をランダムにマスクすることを含む、
請求項16に記載のシステム。 - 前記画像解析モデルは、腫瘍セグメンテーションモデルを含む、
請求項11から13のいずれかに記載のシステム。 - 前記画像解析モデルは、多臓器セグメンテーションモデルを含む、
請求項11から13のいずれかに記載のシステム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202263333495P | 2022-04-21 | 2022-04-21 | |
| US63/333,495 | 2022-04-21 | ||
| PCT/US2023/019323 WO2023205372A1 (en) | 2022-04-21 | 2023-04-20 | Medical imaging analysis using self-supervised learning |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025516144A JP2025516144A (ja) | 2025-05-27 |
| JP7811282B2 true JP7811282B2 (ja) | 2026-02-04 |
Family
ID=86386914
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024561905A Active JP7811282B2 (ja) | 2022-04-21 | 2023-04-20 | 自己教師あり学習を用いた医療画像解析の方法 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US20230410483A1 (ja) |
| EP (1) | EP4490703B1 (ja) |
| JP (1) | JP7811282B2 (ja) |
| KR (1) | KR20250004841A (ja) |
| CN (1) | CN119343708A (ja) |
| AU (1) | AU2023257293A1 (ja) |
| CA (1) | CA3249084A1 (ja) |
| WO (1) | WO2023205372A1 (ja) |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP4449305A1 (en) * | 2021-12-17 | 2024-10-23 | F. Hoffmann-La Roche AG | Computer-implemented method for performing a clinical prediction |
| US12266160B2 (en) * | 2022-07-27 | 2025-04-01 | Meta Platforms, Inc. | Masked autoencoders for computer vision |
| US12469147B2 (en) * | 2023-01-05 | 2025-11-11 | City University Of Hong Kong | Weakly-supervised 3D medical image segmentation using geometric prior and contrastive similarity |
| US12548163B2 (en) * | 2023-01-06 | 2026-02-10 | Siemens Healthineers Ag | Quantification of body composition using contrastive learning in CT images |
| US12456182B2 (en) * | 2023-03-16 | 2025-10-28 | International Business Machines Corporation | Anomaly detection using masked auto-encoder |
| JP2024164447A (ja) * | 2023-05-15 | 2024-11-27 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
| CN116664588B (zh) * | 2023-05-29 | 2025-12-23 | 华中科技大学 | 基于掩码建模的3d医学图像分割模型建立方法及其应用 |
| CN120416680A (zh) * | 2024-01-30 | 2025-08-01 | 北京有竹居网络技术有限公司 | 用于生成视频的方法、装置、电子设备和计算机程序产品 |
| CN118135297B (zh) * | 2024-02-28 | 2025-07-04 | 上海人工智能创新中心 | 一种基于解码器视觉Transformer架构的图像分类方法 |
| US20250308224A1 (en) * | 2024-03-29 | 2025-10-02 | L'oreal | Systems and methods for self-supervised facial landmark detection |
| CN118247582B (zh) * | 2024-05-27 | 2024-09-10 | 长春理工大学 | 一种基于Swin Transformer的脑肿瘤图像自动分类方法和系统 |
| CN118710920B (zh) * | 2024-08-29 | 2024-11-22 | 阿里巴巴(中国)有限公司 | 图像处理方法、脂肪肝计算机辅助诊断方法、设备、系统、计算机存储介质及计算机程序产品 |
| CN119625297B (zh) * | 2024-11-12 | 2025-09-30 | 中国科学院深圳先进技术研究院 | 基于sam自适应微调的多模态半监督医学图像分割方法 |
| CN119624833B (zh) * | 2024-11-27 | 2025-11-11 | 中国科学技术大学 | 一种无需图像的底层视觉预训练方法 |
| CN119648690B (zh) * | 2025-02-12 | 2025-05-09 | 深圳市生利科技有限公司 | 用于pvd镀膜的基材表面清洁度检测方法和装置 |
| CN119762496B (zh) * | 2025-03-07 | 2025-05-27 | 山东师范大学 | 基于互适应学习框架的胰腺图像分割方法及系统 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019167884A1 (ja) | 2018-02-28 | 2019-09-06 | 富士フイルム株式会社 | 機械学習方法及び装置、プログラム、学習済みモデル、並びに判別装置 |
| WO2020243756A1 (en) | 2019-05-31 | 2020-12-03 | Abiomed, Inc. | Intra-aortic pressure forecasting |
| WO2021154878A1 (en) | 2020-01-28 | 2021-08-05 | PAIGE.AI, Inc. | Systems and methods for processing electronic images for biomarker localization |
| US20220067579A1 (en) | 2020-09-03 | 2022-03-03 | S&P Global | Dynamic ontology classification system |
| WO2022049901A1 (ja) | 2020-09-07 | 2022-03-10 | 富士フイルム株式会社 | 学習装置、学習方法、画像処理装置、内視鏡システム及びプログラム |
-
2023
- 2023-04-20 CA CA3249084A patent/CA3249084A1/en active Pending
- 2023-04-20 AU AU2023257293A patent/AU2023257293A1/en active Pending
- 2023-04-20 US US18/304,330 patent/US20230410483A1/en active Pending
- 2023-04-20 JP JP2024561905A patent/JP7811282B2/ja active Active
- 2023-04-20 KR KR1020247038615A patent/KR20250004841A/ko active Pending
- 2023-04-20 CN CN202380045163.9A patent/CN119343708A/zh active Pending
- 2023-04-20 EP EP23724507.1A patent/EP4490703B1/en active Active
- 2023-04-20 WO PCT/US2023/019323 patent/WO2023205372A1/en not_active Ceased
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2019167884A1 (ja) | 2018-02-28 | 2019-09-06 | 富士フイルム株式会社 | 機械学習方法及び装置、プログラム、学習済みモデル、並びに判別装置 |
| WO2020243756A1 (en) | 2019-05-31 | 2020-12-03 | Abiomed, Inc. | Intra-aortic pressure forecasting |
| WO2021154878A1 (en) | 2020-01-28 | 2021-08-05 | PAIGE.AI, Inc. | Systems and methods for processing electronic images for biomarker localization |
| US20220067579A1 (en) | 2020-09-03 | 2022-03-03 | S&P Global | Dynamic ontology classification system |
| WO2022049901A1 (ja) | 2020-09-07 | 2022-03-10 | 富士フイルム株式会社 | 学習装置、学習方法、画像処理装置、内視鏡システム及びプログラム |
Non-Patent Citations (2)
| Title |
|---|
| CAI Zhiyuan et al.,Uni4Eye: Unified 2D and 3D Self-supervised Pre-training via Masked Image Modeling Transformer for Ophthalmic Image Classification,arXiv.org[online],arXiv:2203.04614v2,2022年03月12日,pp.1-13,[取得日2025.09.11],取得先 <https://arxiv.org/pdf/2203.04614> |
| 古賀,「BEiT: 画像処理版のBERT」自己教師あり事前学習のためのモデルBEiTを詳細解説!,DeepSquare Media[online],2021年06月28日,[取得日2025.09.12],取得先 <https://deepsquare.jp/2021/06/beit/> |
Also Published As
| Publication number | Publication date |
|---|---|
| CN119343708A (zh) | 2025-01-21 |
| CA3249084A1 (en) | 2023-10-26 |
| EP4490703B1 (en) | 2026-02-18 |
| KR20250004841A (ko) | 2025-01-08 |
| US20230410483A1 (en) | 2023-12-21 |
| AU2023257293A1 (en) | 2024-11-07 |
| EP4490703A1 (en) | 2025-01-15 |
| EP4490703C0 (en) | 2026-02-18 |
| WO2023205372A1 (en) | 2023-10-26 |
| JP2025516144A (ja) | 2025-05-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7811282B2 (ja) | 自己教師あり学習を用いた医療画像解析の方法 | |
| Li et al. | CorrDiff: Corrective diffusion model for accurate MRI brain tumor segmentation | |
| Yang et al. | Dltta: Dynamic learning rate for test-time adaptation on cross-domain medical images | |
| EP4143780B1 (en) | Image harmonization for deep learning model optimization | |
| CN110692107B (zh) | 用于临床决策支持的对原始医学成像数据的机器学习 | |
| Shi et al. | Diffusion models for medical image computing: A survey | |
| Sharan et al. | Encoder modified U-Net and feature pyramid network for multi-class segmentation of cardiac magnetic resonance images | |
| Jagadeesh et al. | Brain tumor segmentation with missing MRI modalities using edge aware discriminative feature fusion based transformer U-net | |
| Tummala et al. | Liver tumor segmentation from computed tomography images using multiscale residual dilated encoder‐decoder network | |
| CN113935957A (zh) | 医疗图像对比方法、装置、电子设备及存储介质 | |
| He et al. | Deep learning-based image classification for AI-assisted integration of pathology and radiology in medical imaging | |
| Wu et al. | S 3 TU-Net: Structured convolution and superpixel transformer for lung nodule segmentation | |
| Phan et al. | Efficient brain hemorrhage detection on 3D CT scans with deep neural network | |
| Fanyang et al. | CS U‐NET: A Medical Image Segmentation Method Integrating Spatial and Contextual Attention Mechanisms Based on U‐NET | |
| Zheng et al. | WGCTA-Net: wavelet-guided CNN-Transformer fusion with attention mechanism for PET/CT tumor segmentation | |
| Koc et al. | A Review of U-Net Based Deep Learning Frameworks for MRI-Based Brain Tumor Segmentation | |
| Rais et al. | Dynamic feature context activation and data augmentation for enhanced medical image segmentation | |
| Injarabian et al. | Interpreting CT-Scans with CLIP: An Explorative Study of Attribution Methods for 3D Vision-Language Models | |
| US20260011123A1 (en) | Aberrant image synthesis via truncated reverse-diffusion | |
| Sankaramurthy et al. | Lung disease prediction based on CT images using REInf-net and world cup optimization based BI-LSTM classification | |
| Khan et al. | Multimodal radiological AI with LSO-Net++ for lumbar spine osteoporosis detection | |
| Wu | Token-Based Multi-condition Autoregressive Diffusion for Lung CT Image Generation | |
| Alzu’bi et al. | Bridging spatial awareness and global context in medical image segmentation | |
| Wu | Weak Supervision in Deep Learning for Medical Imaging and Astrophysics | |
| Alsayat et al. | RAUM-GANs: a multi-layer GAN-enhanced framework for accurate multiple sclerosis lesion segmentation in MRI |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241119 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20241119 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250917 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250930 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251224 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260106 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260123 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7811282 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |