LU506063B1 - Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit - Google Patents
Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit Download PDFInfo
- Publication number
- LU506063B1 LU506063B1 LU506063A LU506063A LU506063B1 LU 506063 B1 LU506063 B1 LU 506063B1 LU 506063 A LU506063 A LU 506063A LU 506063 A LU506063 A LU 506063A LU 506063 B1 LU506063 B1 LU 506063B1
- Authority
- LU
- Luxembourg
- Prior art keywords
- module
- attention
- channel
- detection
- data
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30024—Cell structures in vitro; Tissue sections in vitro
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Image Analysis (AREA)
Abstract
Die vorliegende Erfindung bezieht sich auf das Gebiet der Zelldetektionstechnologie, insbesondere auf ein Verfahren zur automatischen Klassifizierung und Detektion von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, das die folgenden Schritte umfasst: Aufbau eines CPCA-Mechanismus für räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls und Erzeugung einer dynamisch verteilten räumlichen Aufmerksamkeitskarte auf jedem Kanal; Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Proben für die Erkennung kleiner Ziele zu lösen, wird zusätzlich zur Mosaik- Datenverbesserung, affinen Transformation und perspektivischen Transformation das Mixup- Modul hinzugefügt, um die Datenverbesserung durchzuführen, d. h. zwei Bilder werden zufällig aus jedem Batch ausgewählt und in einem bestimmten Verhältnis gemischt, um ein neues Bild zu erzeugen; Der vorteilhafte Effekt ist: die automatische Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, die durch die vorliegende Erfindung vorgeschlagen wird, integriert das CPCA-Modul auf der Grundlage des ursprünglichen Yolov5s- Netzwerkmodells, das das Netzwerkmodell zur Erkennung pathologischer Merkmale abnormaler Gebärmutterhalszellen verbessert, indem es die Kanal- und Positionsinformationen erfasst und die wichtigen Merkmale effektiv hervorhebt, und es hat einen geringeren Berechnungsaufwand.
Description
Ein Verfahren zur automatischen Klassifizierung von Zellen in LU506063
Gebärmutterhalsflüssigkeit
Technischer Bereich
Die vorliegende Erfindung bezieht sich auf das Gebiet der Zelldetektionstechnologie, insbesondere auf ein Verfahren zur automatischen Klassifizierung von Zellen in
Gebärmutterhalsflüssigkeit.
Technologie im Hintergrund
Gebärmutterhalskrebs ist die zweithäufigste Krebserkrankung bei Frauen weltweit und ein häufiger bösartiger Tumor bei Frauen. Einschlägige Daten zeigen, dass die Inzidenz von
Gebärmutterhalskrebs in China sechsmal höher ist als in den Industrieländern. Im Jahr 2020 wird es in China etwa 110.000 neue Fälle von Gebärmutterhalskrebs und etwa 59.000 Todesfälle geben, was etwa 18 Prozent der weltweiten Todesfälle ausmacht.
Gebärmutterhalskrebs ist nach dem Stand der Technik vermeidbar, und eine frühzeitige
Diagnose ist entscheidend für die Verbesserung der Überlebensrate bei Gebärmutterhalskrebs.
Zytologische Screeningverfahren sind seit mehr als einem halben Jahrhundert eine wichtige
Methode der Gebärmutterhalskrebsdiagnose und -prävention, die die Diagnose von präkanzerösen und krebsartigen Läsionen erheblich verbessert hat. Die Zytologie des Gebärmutterhalses wird in der Regel von einem Zytopathologen anhand eines herkömmlichen Pap-Abstrichs oder eines flüssigkeitsbasierten Zytologie-Objekttragers diagnostiziert, der zunächst abnorme Läsionszellen aus Tausenden von Zellen identifiziert und dann den Abstrich sortiert, um einen zytologischen
Bericht zu erstellen. Die manuelle Untersuchung zervikaler zytologischer Abstriche ist jedoch gleichbedeutend mit der Suche nach der Nadel im Heuhaufen, die sehr mühsam und kompliziert und anfällig für subjektive Fehler ist; um die Effektivität und Effizienz des zervikalen zytologischen Screenings weiter zu verbessern, besteht daher ein extrem hoher Bedarf an der
Entwicklung einer automatisierten Analyse der zervikalen Zytologie. Es gibt viele computergestützte Analysemethoden zur Erkennung abnormaler oder kranker Zellen auf Bildern von Gebärmutterhalszellen. Die Erkennung von Zellen aus Gebärmutterhalsflüssigkeiten in der traditionellen Medizin weist viele Mängel auf, und die Methoden der Zellerkennung werden schrittweise verbessert. Mit der kontinuierlichen Entwicklung der Deep-Learning-Technologie sind viele klassische und fortschrittliche Algorithmen entstanden, wie Fast R-CNN, ResNet,
YOLOV3 und YOLOVS. Diese Deep-Learning-Algorithmen können die Aufgaben der
Klassifizierung und Erkennung erfüllen, indem sie die Merkmale der Bilddaten extrahieren und die komplexen Merkmalsbeziehungen zwischen den Bildern lernen.
Für den Nachweis abnormaler Gebärmutterhalszellen können normale und abnormale Zellen jedoch ein sehr ähnliches Aussehen haben, so dass eine solche lokalisierte Argumentation oft nicht ausreicht. In der klinischen Medizin vergleicht der Zytopathologe, um festzustellen, ob eine
Gebärmutterhalszelle normal ist oder nicht, in der Regel die sie umgebenden Referenzzellen, um ihre Kategorie zu bestimmen. Die Kategorisierung von Gebärmutterhalszellen kann sich nicht allein auf Merkmale stützen, die aus der Zielregion oder der Region von Interesse der Zellen extrahiert werden. Bestehenden Methoden fehlt es oft an Merkmalen, die zwischen den Zellen interagieren, was zu einer schlechten Klassifizierungsleistung führt.
Inhalt der Erfindung
Ziel der vorliegenden Erfindung ist es, ein Verfahren zur automatischen Klassifizierung von
Zellen in Gebärmutterhalsflüssigkeit bereitzustellen, um die oben genannten Probleme des Standes der Technik zu lösen.
Um das obige Ziel zu erreichen, bietet die vorliegende Erfindung die folgende techniscH&/506063
Lösung: ein Verfahren zur automatischen Klassifizierung von Zellen in Gebärmutterhalsflüssigkeit, wobei das Verfahren die folgenden Schritte umfasst:
Konstruktion eines CPCA-Mechanismus für räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls zur Erzeugung einer dynamisch verteilten räumlichen
Aufmerksamkeitskarte auf jedem Kanal;
Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Stichproben bei der Erkennung kleiner Ziele zu lösen, wird zusätzlich zur
Mosaikdatenverbesserung, affinen Transformation und perspektivischen Transformation das
Mixup-Modul zur Datenverbesserung hinzugefügt, d. h. zwei Bilder werden zufällig aus jedem
Batch ausgewählt und mit einem bestimmten Verhältnis gemischt, um ein neues Bild zu erzeugen;
Verbesserung der Verlustfunktion durch Ersetzen der Verlustfunktion „Generalised
Intersection and Combination Ratio“ GIoU durch die Verlustfunktion „Complete Intersection and
Combination Ratio“ CIoU, um die Leistung der Bounding-Box-Regression und der Lokalisierung zur Identifizierung von zervikalen pathologischen Zellfraktionen mit komplexer Umgebung zu verbessern.
Vorzugsweise wird das CPCA-Modul dem Backbone-Netz und dem Neck-Netz hinzugefügt und nach dem C3-Modul platziert. Während des Netzwerktrainings verbessert das CPCA-Modul das Erlernen von Informationen über kleine Zielmerkmale, indem es die Gewichte des Kanal- und des räumlichen Aufmerksamkeitsmoduls dynamisch anpasst.
Vorzugsweise führt der Mechanismus der Kanal-A-priori-Faltungsaufmerksamkeit CPCA nacheinander zwei Modulaufgaben der Kanalaufmerksamkeit CA und der räumlichen
Aufmerksamkeit SA durchführt, wobei angenommen wird, dass das Eingangsbildmerkmal
FeER“"" ist. Eine eindimensionale Kanalaufmerksamkeitsmerkmalskarte M, € RR“ wird zunächst durch das Kanalaufmerksamkeitsmodul CA erhalten, und dann wird AM. Element für
Element mit dem Fingangsmerkmal /# multipliziert, um den Kanalaufmerksamkeitswert aus der räumlichen Dimension zu übertragen, um so ein besseres Bildmerkmal F. eR" mit
Kanalaufmerksamkeit zu erhalten; Das räumliche Aufmerksamkeitsmodul SA erzeugt eine räumliche 3D-Aufmerksamkeitskarte M, € R°""" durch Datenverarbeitung der Bildmerkmale
F.., und gibt dann schließlich die verarbeiteten Bildmerkmale # € RR“ durch elementweise
Multiplikation von M, und FF, aus, und der gesamte Prozess wird durch die folgende
Gleichung ausgedrückt:
F. =CA(F)OF
F =SA(F.)®F.
Vorzugsweise erzeugt das Kanalaufmerksamkeitsmodul eine
Kanalaufmerksamkeitsmerkmalskarte, indem es die in den Bildmerkmalen vorhandenen
Beziehungen zwischen den Kanälen untersucht; die räumliche Aufmerksamkeitskarte wird durch
Extraktion räumlicher Zuordnungsbeziehungen erzeugt. LUS06063
Vorzugsweise verwendet das Mischmodul ein lineares Differenzverfahren anwendet, um zwei unterschiedliche Trainingsproben und Etikettenproben aus dem ursprünglichen Datensatz zum Mischen und Erzeugen einer neuen Probe auszuwählen, und dass zwei unterschiedliche
Trainingsprobendaten (d,,/) und (d,,/,) zufällig aus dem Trainingssatz ausgewählt werden.
Wobei d die Trainingsdaten, 1 die etikettierten Daten und 1# bezeichnet, dann werden die beiden Zufallsstichproben durch den folgenden Algorithmus berechnet, um eine neue Stichprobe zu erzeugen, der Algorithmus ist in der folgenden Gleichung angegeben: d = Ad, +(1- Ad, ;
I= +4}, ;
Dabei ist À €[0,1] ein Hyperparameter, der der Betae(œ,œ) Verteilung gehorcht, d.h. der Intensitätskoeffizient, der die Interpolation steuert. Die Größe von « ist proportional zur
Intensität der Interpolation, die die Mischtiefe der Bildmusterdaten beeinflusst, und wenn G=0 ist, werden die Daten nicht gemischt und Mixup funktioniert nicht.
Vorzugsweise wird CIoU als Regressionsverlustfunktion verwendet, wie in der folgenden
Gleichung ausgedrückt: d
Lie =1-1oUl (B, B,)+— +0 ; c
V - a=—— ; 1+-ZOU +v 4 wê Wo. v= 7 (arctan, Re arctan > ;
Dabei steht w für die Breite des Vorhersagekastens, h für die Hôhe des Vorhersagekastens, w® für die Breite des Zielkastens und A“ für die Höhe der Zielbibliothek.
Verglichen mit dem Stand der Technik hat die vorliegende Erfindung folgende vorteilhafte
Auswirkungen:
Das Verfahren zur automatischen Klassifizierung von Zellen in Gebärmutterhalsflüssigkeit, die durch die vorliegende Erfindung vorgeschlagen wird, verbessert das Netzwerkmodell zur
Erkennung von pathologischen Merkmalen von abnormalen Gebärmutterhalszellen durch die
Integration des CPCA-Moduls auf der Grundlage des ursprünglichen Yolov5s-Netzwerkmodells, hebt die wichtigen Merkmale durch die Erfassung der Kanal- und Positionsinformationen effektiv hervor und hat einen geringeren Rechenaufwand.
Beschreibung der beigefügten Zeichnungen
Bild 1 zeigt ein schematisches Diagramm der YOLOv5s-CPCA-Netzwerkstruktur der vorliegenden Erfindung;
Bild 2 zeigt ein schematisches Diagramm der Struktur des CPCA-
Aufmerksamkeitsmechanismus der vorliegenden Erfindung. LU506063
Detaillierte Beschreibung
Um den Zweck der vorliegenden Erfindung, die technischen Lösungen fiir eine klare und vollständige Beschreibung, und die Vorteile klarer zu verstehen, sind die folgenden
Ausführungsformen der vorliegenden Erfindung im Detail in Verbindung mit den beigefügten
Zeichnungen beschrieben. Es sollte verstanden werden, dass die spezifischen Ausführungsformen hierin beschrieben sind Teil der Ausführungsformen der vorliegenden Erfindung, nicht alle der
Ausführungsformen, nur für die Erklärung der Ausführungsformen der vorliegenden Erfindung, und wird nicht verwendet, um die Ausfithrungsformen der vorliegenden Erfindung zu begrenzen, alle anderen Ausführungsformen durch den normalen Fachmann auf dem Gebiet erhalten, ohne dass kreative Arbeit unter der Prämisse des Schutzes des Anwendungsbereichs der vorliegenden
Erfindung.
Ausführungsform 1
Unter Bezugnahme auf die Bilder 1 bis 2 bietet die vorliegende Erfindung eine technische
Lösung: ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, wobei das Verfahren die folgenden Schritte umfasst:
Aufbau eines CPCA-Mechanismus fiir räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls zur Erzeugung einer dynamisch verteilten räumlichen
Aufmerksamkeitskarte auf jedem Kanal;
Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Stichproben für die Erkennung kleiner Ziele zu lösen, wird zusätzlich zur
Mosaik-Datenverbesserung, affınen Transformation und perspektivischen Transformation das
Mixup-Modul hinzugefügt, um eine Datenverbesserung durchzuführen, d.h. zwei Bilder werden zufällig aus jedem Batch ausgewählt und in einem bestimmten Verhältnis gemischt, um ein neues
Bild zu erzeugen;
Verbesserung der Verlustfunktion durch Ersetzen der Verlustfunktion „Generalised
Intersection and Combination Ratio“ GIoU durch die Verlustfunktion „Complete Intersection and
Combination Ratio“ CIoU, um die Leistung der Bounding-Box-Regression und der Lokalisierung zur Identifizierung von zervikalen pathologischen Zellfraktionen mit komplexer Umgebung zu verbessern.
Das YOLOv5s-Basismodell wurde so verbessert, dass es auch in der komplexen Umgebung von Gebärmutterhalszellen über starke Erkennungsfähigkeiten verfügt. Der Backbone-Netzteil des
Modells wird verwendet, um Merkmale aus dem Bild auf verschiedenen feinkörnigen Ebenen zu extrahieren, und das ursprüngliche Backbone-Netz besteht aus Conv, C3, C3Res2 und Spatial
Pyramid Pooling-Fast (SPPF). Die Größe des Eingangsbildes von Zellen auf der Basis von
Gebärmutterhalsflüssigkeit im YOLOv5s-Modell ist so gewählt, dass die Details der
Bildgenauigkeit vollständig erhalten bleiben. Die Größe des Eingangsbildes beträgt 1024x1024x3 und die Anzahl der Faltungskerne ist 32 in der ersten Focus-Struktur. Nach der Faltung beträgt die
Größe der Merkmalskarte 512x512x32. Das Modul C3 wird verwendet, um die Merkmale der
Gebarmutterhalszellen zu extrahieren, die im Backbone-Netzwerkteil und im Halsnetzwerkteil verwendet werden. Im Backbone-Netzwerkteil enthält das C3-Modul detaillierte
Standortinformationen, aber weniger semantische Informationen; Im Teil des Halsnetzwerks wird das C3-Modul verwendet, um Merkmale zu extrahieren, die detaillierte semantische Informationen, aber weniger Positionsinformationen enthalten, und seine Verarbeitung von
Merkmalsinformationen für kleine Ziele führt zu mehr fehlenden Positionsinformationen des Ziels,
wodurch leicht Merkmalsinformationen verloren gehen.SPPF wird verwendet, uh/506063
Merkmalskarten verschiedener Größen als Ausgabe miteinander zu verbinden. Der Header-
Vorhersageteil der Ausgabe sagt die verarbeiteten Gebärmutterhalszell-Bildmerkmale in drei verschiedenen Maßstäben voraus, erzeugt Bounding Boxes und sagt die Klasse des Ziels voraus. 5 Um die oben genannten Probleme weiter zu verbessern und die Erkennungsgenauigkeit des ursprünglichen Modells für Gebarmutterhalszellen verschiedener Falltypen zu erhöhen, schlagen wir ein verbessertes YOLOv5s-Netzwerkmodell vor, wie in Abb. 1 dargestellt. Das CPCA-Modul wurde zu den Backbone- und Zervikalnetzwerken hinzugefügt und nach dem C3-Modul platziert.
Das CPCA-Modul verbessert das Lernen von Informationen über kleine Zielobjekte, indem es die
Gewichte des Kanal- und des räumlichen Aufmerksamkeitsmoduls während des
Netzwerktrainings dynamisch anpasst.
Wie aus Bild 2 ersichtlich ist, führt der Mechanismus der Kanal-A-priori-
Faltungsaufmerksamkeit CPCA nacheinander zwei Modulaufgaben der Kanalaufmerksamkeit CA und der räumlichen Aufmerksamkeit SA durchführt, wobei angenommen wird, dass das
Eingangsbildmerkmal FeR ist. Eine eindimensionale
Kanalaufmerksamkeitsmerkmalskarte M.eR wird zunächst = durch = das
Kanalaufmerksamkeitsmodul CA erhalten, und dann wird AM. Element für Element mit dem
Eingangsmerkmal / multipliziert, um den Kanalaufmerksamkeitswert aus der räumlichen
Dimension zu übertragen, um so ein besseres Bildmerkmal Fe RS" wit
Kanalaufmerksamkeit zu erhalten; Das räumliche Aufmerksamkeitsmodul SA erzeugt eine räumliche 3D-Aufmerksamkeitskarte M, € R°""" durch Datenverarbeitung der Bildmerkmale
F.., und gibt dann schließlich die verarbeiteten Bildmerkmale Fe R” durch elementweise
Multiplikation von M, und FF, aus, und der gesamte Prozess wird durch die folgende
Gleichung ausgedrückt:
F. =CA(F)OF
F =SA(F.)®F.
Kanalaufmerksamkeitsmodul (CA): Das Kanalaufmerksamkeitsmodul erzeugt eine
Kanalaufmerksamkeitsmerkmalskarte, indem es die in den Bildmerkmalen vorhandenen
Beziehungen zwischen den Kanälen untersucht. Zunächst werden die räumlichen Informationen aus dem Merkmalsbild extrahiert und die Operationen des durchschnittlichen Poolings und des maximalen Poolings werden unter Verwendung der im CBAM-Aufmerksamkeitsmechanismus vorgeschlagenen Methode angewandt; anschließend werden die aus dem durchschnittlichen
Pooling und dem maximalen Pooling gewonnenen räumlichen Kontextinformationen an das gemeinsame mehrschichtige Perzeptron (MLP) gesendet. Dann werden die MLP-Ausgänge durch elementweise Summierung fusioniert, und schließlich erhält man die Merkmalskarten für die
Kanalaufmerksamkeit. Um die Menge der Parameterdaten zu reduzieren, besteht die MLP-
Struktur aus einer einzigen verborgenen Schicht, deren Größe auf RY" festgelegt ist, wobei r den Dämpfungskoeffizienten bezeichnet. Das Kanalaufmerksamkeitsmodul kann unte}506063
Verwendung von Gleichung wie folgt ausgedrückt werden:
CAF) = 6(MLP(AvgPool(F)) + MLP(MaxPool(F"))) wobei 6 die sigmod-Aktivierungsfunktion bezeichnet.
Räumliches Aufmerksamkeitsmodul (SA): Räumliche Aufmerksamkeitskarten werden durch
Extraktion räumlicher Zuordnungsbeziehungen erstellt. Es wurde festgestellt, dass eine einheitliche Verteilung der räumlichen Aufmerksamkeitsgewichte für jeden Kanal in der räumlichen Aufmerksamkeitskarte vermieden werden sollte, und die räumlichen
Aufmerksamkeitsgewichte sollten dynamisch auf der Grundlage der spezifischen Merkmale jedes
Kanals angepasst werden. Bild 3 veranschaulicht die Verwendung eines in der Tiefe trennbaren
Faltungsmoduls zur Erfassung der räumlichen Beziehungen zwischen den Merkmalen, wodurch sichergestellt wird, dass die Beziehungen zwischen den Kanälen beibehalten werden und gleichzeitig die Rechenkomplexität verringert wird. Eine Multiskalenstruktur wird verwendet, um die Fähigkeit der Faltungsoperation zu verbessern, räumliche Beziehungen zu erfassen, räumliche
Aufmerksamkeitsmerkmalskarten unter verschiedenen Kanälen zu erzeugen und schließlich die 1x1-Faltungsfusion der räumlichen Aufmerksamkeitsmodule verschiedener Kanäle in einem
Hybridmodul zu verwenden, um optimierte Merkmalskarten zu erzeugen.
SA(F)=Conv,, Œ, Branch (DwConv(F))) wobei DwConv die tiefen-separierbare Faltungsoperation bezeichnet, Branch, 1e {0,1,2,3} die Faltungsoperation des i-ten Zweigs, und zur Erfassung von Mehrskaleninformationen werden zwei kleine Kernel-Faltungen verwendet, um die Kanalfaltung des groBen Kernels anzunähern, und es werden Faltungskerne unterschiedlicher Größe festgelegt.
Die Modelle der Kanalaufmerksamkeit und der räumlichen Aufmerksamkeit konzentrieren sich auf die semantischen bzw. räumlichen Informationen der Merkmale, und die experimentellen
Ergebnisse zeigen, dass die sequentielle Anordnung der beiden Aufmerksamkeitsmodule effektiver ist als die parallele Anordnung.
Bei der Methode zur Verbesserung von Mischdaten werden zunächst zwei verschiedene
Trainingsdaten (d,,/) und (d,,/,) zufällig aus dem Trainingssatz ausgewählt, wobei d die
Trainingsdaten und 1 die gelabelten Daten bezeichnet und 1# j. Dann werden diese beiden
Zufallsstichproben durch den folgenden Algorithmus berechnet, um neue Probendaten zu erzeugen: d = Ad, +(1- Ad, ;
I= +4}, ;
Dabei ist À €[0,1] ein Hyperparameter, der der Betae(œ,œ) Verteilung gehorcht, d.h. der Intensitätskoeffizient, der die Interpolation steuert. Die Größe von « ist proportional zur
Intensität der Interpolation, die die Mischtiefe der Bildmusterdaten beeinflusst, und wenn G=0 ist, werden die Daten nicht gemischt und Mixup funktioniert nicht.
Im Experiment werden zunächst N Stichproben aus dem Originaldatensatz ausgewählt, um den Stichprobendatensatz zu bilden, und der N-Stichproben-Datensatz wird dem Zufallsumstut#/506063 unterzogen, ausgedrückt als Gleichung *.
Sp App au) dpa a2) (dps Lan)
Die N Stichproben werden dann wie in Gleichung * ausgedrückt erneut randomisiert, was zu zwei zufällig angeordneten Stichproben-Datensätzen führt.
EC ANA
Zu diesem Zeitpunkt sind die Stichproben, die den beiden Stichprobensätzen §, und 5, entsprechen, gemäß der folgenden Gleichung unterschiedlich:
Cr VF Ka Ya)
Unter Verwendung von Gleichung (1) und Gleichung (2) für die S,- und 5, -Stichproben ergibt sich ein neuer Stichproben-Datensatz, $,...„, der wie folgt ausgedrückt werden kann:
S mixup = {dd 1, (d,, L),..(dy, 1)
Der neue Datensatz nach dem Mischen durch Mixup ersetzt den Originaldatensatz für das
Training.
CIoU wurde als Regressionsverlustfunktion verwendet, wie in der folgenden Gleichung ausgedrückt: d
Le =1-1oUl (B, B,)4— +09 ; c
V - a=—— ; 1-IoU +v 4 wê Wo. v= = (arctan, pr arctan >) ;
Dabei steht w für die Breite des Vorhersagekastens, h für die Höhe des Vorhersagekastens, w® für die Breite des Zielkastens und A“ für die Höhe der Zielbibliothek.
Ausführungsform 2
Auf der Grundlage von Ausführungsform 1 wird Folgendes vorgeschlagen: Das Verfahren zur Erstellung des in den Experimenten dieser Studie verwendeten Datensatzes der Zellproben aus dem Gebärmutterhals wurde wie folgt durchgeführt: Das Präparat der Zellen aus dem
Gebärmutterhals wurde mit einem vollautomatischen Scanner für Zellen aus dem Gebärmutterhals gescannt, der von JingCast Biologicals selbst entwickelt wurde, und ein Panorama der Zellproben aus dem Gebärmutterhals wurde erstellt. Dann wurde das Panorama der Proben gescreent, und es wurden 150 positive und 150 negative Proben ausgewählt. Von den positiven Proben enthielten 50 abnorme Zellhaufen; die negativen Proben enthielten jeweils 15 Mykobakterien, Trichomonaden,
Aktinomyzeten, Clue-Zellen, Herpes und Aktinomyzeten; die restlichen 60 negativen Proben waren frei von mikrobiellen Infektionen und enthielten 5 Proben mit atrophischen Zellen und L4/506063
Proben mit Chemotaxis-Zellen. Ein Pathologe wurde dann gebeten, die Panoramaproben zu beschriften und die beschrifteten Diagramme zu schneiden, um den Datensatz der auf
Gebärmutterhalsflüssigkeit basierenden Zellproben zu erhalten.
Die Beispieldaten werden durch Mosaikdatenverbesserung, affine Transformation und
Perspektive-Transformation verbessert, auf deren Grundlage das Mixup-Modul zur
Datenverbesserung hinzugefügt wird. Die Kernidee besteht darin, zwei Bilder aus jedem Stapel nach dem Zufallsprinzip auszuwählen und sie in einem bestimmten Verhältnis zu mischen, um ein neues Bild zu erzeugen, und der gesamte Trainingsprozess verwendet das gemischte neue Bild zum Training, wobei das Originalbild nicht mehr in das Training einbezogen wird.
In diesem Experiment wurde der Zelldatensatz aus der Gebärmutterhalsflüssigkeit bei der
Durchführung des Tests in insgesamt 10 Kategorien eingeteilt. Die einzelnen Kategorien sind in
Tabelle 1 aufgeführt.
Tabelle 1 Datensatz von Zellen auf der Basis von Gebärmutterhalsflüssigkeit
Zelltyp Anzahl Gattung Zeiltyp Anzahl Gattung
LSIL 2687 | Positiv PARASITE | 2305 | Miktoons
AnIsmen ze
ABC 100% | Positiv LEPTOTRICHIA | 23g | Mikroors
ACTINOMYCES | typ | Mikwor
A A AN N penne ÉOLIEN
FUNGAL 2005 | Milktoore HERPES 530 | Miko i amismen i arsinen
Dieses experimentelle Training wurde mit dem Betriebssystem Ubuntul8.04 unter
Verwendung von Pytorchl.8.1, dem CUDA11.4 Deep-Learning-Trainingsframework und der
NIVDIA RTX3090TiGPU durchgeführt, um das Modelltraining zu beschleunigen, und die
Trainingsparameter wurden wie folgt festgelegt: Epoch ist auf 100 mal eingestellt, batch size ist auf 32 eingestellt, die EingabebildgrôBe ist 1024x1024, und die Kombination aus regulärem
Training und Freeze-Training wird angenommen, um während des Trainingsprozesses zu iterieren, um das Overfitting-Phänomen, das während des Trainingsprozesses auftreten kann, weiter zu hemmen, und das spezifische Trainingsschema ist wie folgt:
Schritt 1: Konventionelle Trainingsmethode, zufällige Auswahl der Hälfte der Daten im
Datensatz, Durchführung eines konventionellen Trainings für das ausgewählte Netzwerk, alle
Parameter werden in diesem Prozess gleichzeitig aktualisiert, und man erhält Modell1;
Schritt 2: Auswahl des besten Modells im ersten Schritt des konventionellen Trainings, zufällige Auswahl der Hälfte der Trainingsdaten, mit 100 Epochen als Stufe, die ersten 40 Epochen werden die Kopfschicht eingefroren, und nur die Backbone-Schicht wird trainiert; In der 40. bis 100. Epoche wird das Backbone eingefroren und nur die HEAD-Schicht trainiert, und die
Parameter der Backbone- und HEAD-Schicht werden nacheinander aktualisiert, um Modell2 zu erhalten;
Schritt 3: Wählen Sie auf der Grundlage von Modell2 alle Trainingsdaten aus, passen Sie die
Lernrate um eine Größenordnung nach unten an und trainieren Sie in eingefrorener Weise gemäß
Schritt 2, um das endgültige Modell zu erhalten. LU506063
Die gängigen Bewertungsmalistibe, die derzeit für Zielerkennungsmodelle verwendet werden, sind Genauigkeit, Präzision, Wiedererkennungswert und mAP, wobei der
Wiedererkennungswert verwendet wird, um zu bewerten, ob die Vorhersage des Netzwerkmodells umfassend ist oder nicht, und die Präzision, um zu beurteilen, ob die Vorhersageergebnisse genau sind oder nicht. AP misst, wie gut das trainierte Modell in jeder Kategorie ist, und mAP misst, wie gut das trainierte Modell in allen Kategorien ist; die oben genannten Metriken werden mit der folgenden Formel ausgedrückt
Recall = AP
TP + FN
Precision = IP
TP + FP
AP =| p(rd = |, p(rydr
N
> AP(n) mMAP=
N wobei 7 (r) die Precision-Recall-Kurve bezeichnet, N die Gesamtzahl der Kategorien der kategorisierten Daten ist und n die Kategorie der aktuellen Daten ist.
Obwohl Ausführungsformen der vorliegenden Erfindung gezeigt und beschrieben worden sind, wird der Fachmann erkennen, dass eine Vielzahl von Änderungen, Modifikationen,
Substitutionen und Variationen an diesen Ausführungsformen vorgenommen werden können, ohne von dem Prinzip und dem Geist der vorliegenden Erfindung abzuweichen, deren Umfang durch die beigefügten Ansprüche und deren Äquivalente begrenzt ist.
Claims (6)
1. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, dadurch gekennzeichnet, dass das Verfahren die folgenden Schritte umfasst: Konstruktion eines CPCA-Mechanismus für räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls zur Erzeugung einer dynamisch verteilten räumlichen Aufmerksamkeitskarte auf jedem Kanal; Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Stichproben für die Erkennung kleiner Ziele anzugehen, zusätzlich zur Mosaik- Datenverbesserung, affinen Transformation und perspektivischen Transformation, Hinzufügen des Mixup-Moduls zur Datenverbesserung, d.h. zufällige Auswahl von zwei Bildern aus jedem Batch und Mischen dieser Bilder in einem bestimmten Verhältnis, um ein neues Bild zu erzeugen; Verbesserung der Verlustfunktion durch Ersetzen der Verlustfunktion „Generalised Intersection and Combination Ratio“ GIoU durch die Verlustfunktion „Complete Intersection and Combination Ratio“ CIoU, um die Leistung der Bounding-Box-Regression und der Lokalisierung zur Identifizierung von zervikalen pathologischen Zellfraktionen mit komplexer Umgebung zu verbessern.
2. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass das CPCA-Modul dem Backbone-Netzwerk und dem Halsnetzwerk hinzugefügt und nach dem C3-Modul platziert wird, und dass das CPCA-Modul im Prozess des Netzwerktrainings das Lernen der Merkmalsinformationen des kleinen Ziels durch dynamisches Einstellen der Kanal- und Raumaufmerksamkeitsmodul-Gewichte verbessert.
3. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass: der Mechanismus der Kanal-A-priori-Faltungsaufmerksamkeit CPCA nacheinander zwei Modulaufgaben der Kanalaufmerksamkeit CA und der räumlichen Aufmerksamkeit SA durchführt, wobei angenommen wird, dass das Eingangsbildmerkmal F € R°"”" ist. Eine eindimensionale Kanalaufmerksamkeitsmerkmalskarte M.eR wird zunächst = durch = das Kanalaufmerksamkeitsmodul CA erhalten, und dann wird AM. Element für Element mit dem Eingangsmerkmal / multipliziert, um den Kanalaufmerksamkeitswert aus der räumlichen Dimension zu übertragen, um so ein besseres Bildmerkmal Fe RS" wit Kanalaufmerksamkeit zu erhalten; Das räumliche Aufmerksamkeitsmodul SA erzeugt eine räumliche 3D-Aufmerksamkeitskarte M, € R°""" durch Datenverarbeitung der Bildmerkmale
F.., und gibt dann schließlich die verarbeiteten Bildmerkmale Fe R” durch elementweise Multiplikation von M, und FF, aus, und der gesamte Prozess wird durch die folgende Gleichung ausgedrückt:
F.=CA(F)®F
7 LU506063 F=SA(F.)OF.
4. Fin Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 3, dadurch gekennzeichnet, dass das Kanalaufmerksamkeitsmodul eine Kanalaufmerksamkeitsmerkmalskarte erzeugt, indem es die in den Bildmerkmalen vorhandenen Beziehungen zwischen den Kanälen untersucht, und dass die räumliche Aufmerksamkeitskarte durch Extraktion räumlicher Abbildungsbeziehungen erzeugt wird.
5. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass das Mischmodul ein lineares Differenzverfahren anwendet, um zwei unterschiedliche Trainingsproben und Etikettenproben aus dem ursprünglichen Datensatz zum Mischen und Erzeugen einer neuen Probe auszuwählen, und dass zwei unterschiedliche Trainingsprobendaten (d,,/) und Cd; /) zufällig aus dem Trainingssatz ausgewählt werden. Wobei d die Trainingsdaten, 1 die etikettierten Daten und 1# bezeichnet, dann werden die beiden Zufallsstichproben durch den folgenden Algorithmus berechnet, um eine neue Stichprobe zu erzeugen, der Algorithmus ist in der folgenden Gleichung angegeben: d= Ad, +(1-A)d, ; I= +4}, ; Dabei ist À e[0,1] ein Hyperparameter, der der Betae(œ,œ) Verteilung gehorcht, d.h. der Intensitätskoeffizient, der die Interpolation steuert. Die Größe von œ ist proportional zur Intensität der Interpolation, die die Mischtiefe der Bildmusterdaten beeinflusst, und wenn G=0 ist, werden die Daten nicht gemischt und Mixup funktioniert nicht.
6. automatisches Zellsortier- und -nachweisverfahren auf der Basis von Zervixflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass CIoU als Regressionsverlustfunktion verwendet wird, die in der folgenden Formel ausgedrückt wird: d Le =1=10UI (B, B)+—+av c y a=—— 1-ZOU+v 4 w8 W., v = — (arctan, — — arctan —) 1 h* h Dabei steht w für die Breite des Vorhersagekastens, h für die Hôhe des Vorhersagekastens, w* für die Breite des Zielkastens und A“ für die Höhe der Zielbibliothek.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| LU506063A LU506063B1 (de) | 2024-01-09 | 2024-01-09 | Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| LU506063A LU506063B1 (de) | 2024-01-09 | 2024-01-09 | Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| LU506063B1 true LU506063B1 (de) | 2024-07-09 |
Family
ID=91810629
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| LU506063A LU506063B1 (de) | 2024-01-09 | 2024-01-09 | Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit |
Country Status (1)
| Country | Link |
|---|---|
| LU (1) | LU506063B1 (de) |
-
2024
- 2024-01-09 LU LU506063A patent/LU506063B1/de active IP Right Grant
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110647875B (zh) | 一种血细胞分割、识别模型构造的方法及血细胞识别方法 | |
| DE68926796T2 (de) | System und Verfahren für automatische Zellenklassifizierung, basierend auf ein Neuronalnetzwerk | |
| CN116258914B (zh) | 基于机器学习及局部和全局特征融合的遥感图像分类方法 | |
| DE69532276T2 (de) | Automatisiertes cytologisches probenklassifizierungsverfahren | |
| JP2023544466A (ja) | Pet/ctに基づく肺腺癌扁平上皮癌診断モデルの訓練方法及び装置 | |
| CN112116603A (zh) | 一种基于多任务学习的肺结节假阳性筛查方法 | |
| CN109344699A (zh) | 基于分层深度卷积神经网络的冬枣病害识别方法 | |
| CN114140437B (zh) | 一种基于深度学习的眼底硬渗出物分割方法 | |
| CN111898432A (zh) | 一种基于改进YOLOv3算法的行人检测系统及方法 | |
| DE4211904C2 (de) | Automatisches Verfahren zum Erstellen einer Liste unterschiedlicher Arten für eine flüssige Probe | |
| CN119559479B (zh) | 基于改进YOLOv8s的输电线路多缺陷检测方法和系统 | |
| CN113160261A (zh) | 一种用于oct图像角膜层分割的边界增强卷积神经网络 | |
| EP1797533B1 (de) | Verfahren und vorrichtung zur segmentierung einer digitalen abbildung von zellen | |
| Amorim et al. | A novel approach on segmentation of agnor-stained cytology images using deep learning | |
| EP4064186B1 (de) | Verfahren und systeme zur erzeugung synthetischer mikrostrukturbilder von material mit gewünschten eigenschaften | |
| CN116342389B (zh) | 基于多尺度增强模块的遥感影像超分辨率重建方法及系统 | |
| LU506063B1 (de) | Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit | |
| DE202025105629U1 (de) | Ein System zur Klassifizierung von Apfelblattkrankheiten mittels Deep Learning und Merkmalsfusion | |
| DE102006044595B4 (de) | Bildverarbeitungsvorrichtung zur Segmentierung anhand von Konturpunkten | |
| Ji et al. | LKCA-Net: Hybrid large kernel and clustering attention network for medical image segmentation | |
| DE102005049017B4 (de) | Verfahren zur Segmentierung in einem n-dimensionalen Merkmalsraum und Verfahren zur Klassifikation auf Grundlage von geometrischen Eigenschaften segmentierter Objekte in einem n-dimensionalen Datenraum | |
| DE102022206025A1 (de) | Populationsklassifikation mittels Punktwolken-Merkmalen | |
| Wang et al. | Vegetable disease identification algorithm based on improved Swin transformer | |
| Kapida et al. | Automated rice disease detection using a deep learning approach with convolutional neural networks | |
| LU602796B1 (de) | Ein Verfahren zur Klassifizierung und Identifizierung von Zellclustern |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FG | Patent granted |
Effective date: 20240709 |