LU506063B1

LU506063B1 - Ein verfahren zur automatischen klassifizierung von zellen in gebärmutterhalsflüssigkeit

Info

Publication number: LU506063B1
Application number: LU506063A
Authority: LU
Inventors: Xudong Shen
Original assignee: Jiaxing Vocational & Technical College
Priority date: 2024-01-09
Filing date: 2024-01-09
Publication date: 2024-07-09

Abstract

Die vorliegende Erfindung bezieht sich auf das Gebiet der Zelldetektionstechnologie, insbesondere auf ein Verfahren zur automatischen Klassifizierung und Detektion von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, das die folgenden Schritte umfasst: Aufbau eines CPCA-Mechanismus für räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls und Erzeugung einer dynamisch verteilten räumlichen Aufmerksamkeitskarte auf jedem Kanal; Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Proben für die Erkennung kleiner Ziele zu lösen, wird zusätzlich zur Mosaik- Datenverbesserung, affinen Transformation und perspektivischen Transformation das Mixup- Modul hinzugefügt, um die Datenverbesserung durchzuführen, d. h. zwei Bilder werden zufällig aus jedem Batch ausgewählt und in einem bestimmten Verhältnis gemischt, um ein neues Bild zu erzeugen; Der vorteilhafte Effekt ist: die automatische Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, die durch die vorliegende Erfindung vorgeschlagen wird, integriert das CPCA-Modul auf der Grundlage des ursprünglichen Yolov5s- Netzwerkmodells, das das Netzwerkmodell zur Erkennung pathologischer Merkmale abnormaler Gebärmutterhalszellen verbessert, indem es die Kanal- und Positionsinformationen erfasst und die wichtigen Merkmale effektiv hervorhebt, und es hat einen geringeren Berechnungsaufwand.

Description

Ein Verfahren zur automatischen Klassifizierung von Zellen in LU506063

Gebärmutterhalsflüssigkeit

Technischer Bereich

Die vorliegende Erfindung bezieht sich auf das Gebiet der Zelldetektionstechnologie, insbesondere auf ein Verfahren zur automatischen Klassifizierung von Zellen in

Gebärmutterhalsflüssigkeit.

Technologie im Hintergrund

Gebärmutterhalskrebs ist die zweithäufigste Krebserkrankung bei Frauen weltweit und ein häufiger bösartiger Tumor bei Frauen. Einschlägige Daten zeigen, dass die Inzidenz von

Gebärmutterhalskrebs in China sechsmal höher ist als in den Industrieländern. Im Jahr 2020 wird es in China etwa 110.000 neue Fälle von Gebärmutterhalskrebs und etwa 59.000 Todesfälle geben, was etwa 18 Prozent der weltweiten Todesfälle ausmacht.

Gebärmutterhalskrebs ist nach dem Stand der Technik vermeidbar, und eine frühzeitige

Diagnose ist entscheidend für die Verbesserung der Überlebensrate bei Gebärmutterhalskrebs.

Zytologische Screeningverfahren sind seit mehr als einem halben Jahrhundert eine wichtige

Methode der Gebärmutterhalskrebsdiagnose und -prävention, die die Diagnose von präkanzerösen und krebsartigen Läsionen erheblich verbessert hat. Die Zytologie des Gebärmutterhalses wird in der Regel von einem Zytopathologen anhand eines herkömmlichen Pap-Abstrichs oder eines flüssigkeitsbasierten Zytologie-Objekttragers diagnostiziert, der zunächst abnorme Läsionszellen aus Tausenden von Zellen identifiziert und dann den Abstrich sortiert, um einen zytologischen

Bericht zu erstellen. Die manuelle Untersuchung zervikaler zytologischer Abstriche ist jedoch gleichbedeutend mit der Suche nach der Nadel im Heuhaufen, die sehr mühsam und kompliziert und anfällig für subjektive Fehler ist; um die Effektivität und Effizienz des zervikalen zytologischen Screenings weiter zu verbessern, besteht daher ein extrem hoher Bedarf an der

Entwicklung einer automatisierten Analyse der zervikalen Zytologie. Es gibt viele computergestützte Analysemethoden zur Erkennung abnormaler oder kranker Zellen auf Bildern von Gebärmutterhalszellen. Die Erkennung von Zellen aus Gebärmutterhalsflüssigkeiten in der traditionellen Medizin weist viele Mängel auf, und die Methoden der Zellerkennung werden schrittweise verbessert. Mit der kontinuierlichen Entwicklung der Deep-Learning-Technologie sind viele klassische und fortschrittliche Algorithmen entstanden, wie Fast R-CNN, ResNet,

YOLOV3 und YOLOVS. Diese Deep-Learning-Algorithmen können die Aufgaben der

Klassifizierung und Erkennung erfüllen, indem sie die Merkmale der Bilddaten extrahieren und die komplexen Merkmalsbeziehungen zwischen den Bildern lernen.

Für den Nachweis abnormaler Gebärmutterhalszellen können normale und abnormale Zellen jedoch ein sehr ähnliches Aussehen haben, so dass eine solche lokalisierte Argumentation oft nicht ausreicht. In der klinischen Medizin vergleicht der Zytopathologe, um festzustellen, ob eine

Gebärmutterhalszelle normal ist oder nicht, in der Regel die sie umgebenden Referenzzellen, um ihre Kategorie zu bestimmen. Die Kategorisierung von Gebärmutterhalszellen kann sich nicht allein auf Merkmale stützen, die aus der Zielregion oder der Region von Interesse der Zellen extrahiert werden. Bestehenden Methoden fehlt es oft an Merkmalen, die zwischen den Zellen interagieren, was zu einer schlechten Klassifizierungsleistung führt.

Inhalt der Erfindung

Ziel der vorliegenden Erfindung ist es, ein Verfahren zur automatischen Klassifizierung von

Zellen in Gebärmutterhalsflüssigkeit bereitzustellen, um die oben genannten Probleme des Standes der Technik zu lösen.

Um das obige Ziel zu erreichen, bietet die vorliegende Erfindung die folgende techniscH&/506063

Lösung: ein Verfahren zur automatischen Klassifizierung von Zellen in Gebärmutterhalsflüssigkeit, wobei das Verfahren die folgenden Schritte umfasst:

Konstruktion eines CPCA-Mechanismus für räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls zur Erzeugung einer dynamisch verteilten räumlichen

Aufmerksamkeitskarte auf jedem Kanal;

Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Stichproben bei der Erkennung kleiner Ziele zu lösen, wird zusätzlich zur

Mosaikdatenverbesserung, affinen Transformation und perspektivischen Transformation das

Mixup-Modul zur Datenverbesserung hinzugefügt, d. h. zwei Bilder werden zufällig aus jedem

Batch ausgewählt und mit einem bestimmten Verhältnis gemischt, um ein neues Bild zu erzeugen;

Verbesserung der Verlustfunktion durch Ersetzen der Verlustfunktion „Generalised

Intersection and Combination Ratio“ GIoU durch die Verlustfunktion „Complete Intersection and

Combination Ratio“ CIoU, um die Leistung der Bounding-Box-Regression und der Lokalisierung zur Identifizierung von zervikalen pathologischen Zellfraktionen mit komplexer Umgebung zu verbessern.

Vorzugsweise wird das CPCA-Modul dem Backbone-Netz und dem Neck-Netz hinzugefügt und nach dem C3-Modul platziert. Während des Netzwerktrainings verbessert das CPCA-Modul das Erlernen von Informationen über kleine Zielmerkmale, indem es die Gewichte des Kanal- und des räumlichen Aufmerksamkeitsmoduls dynamisch anpasst.

Vorzugsweise führt der Mechanismus der Kanal-A-priori-Faltungsaufmerksamkeit CPCA nacheinander zwei Modulaufgaben der Kanalaufmerksamkeit CA und der räumlichen

Aufmerksamkeit SA durchführt, wobei angenommen wird, dass das Eingangsbildmerkmal

FeER“"" ist. Eine eindimensionale Kanalaufmerksamkeitsmerkmalskarte M, € RR“ wird zunächst durch das Kanalaufmerksamkeitsmodul CA erhalten, und dann wird AM. Element für

Element mit dem Fingangsmerkmal /# multipliziert, um den Kanalaufmerksamkeitswert aus der räumlichen Dimension zu übertragen, um so ein besseres Bildmerkmal F. eR" mit

Kanalaufmerksamkeit zu erhalten; Das räumliche Aufmerksamkeitsmodul SA erzeugt eine räumliche 3D-Aufmerksamkeitskarte M, € R°""" durch Datenverarbeitung der Bildmerkmale

F.., und gibt dann schließlich die verarbeiteten Bildmerkmale # € RR“ durch elementweise

Multiplikation von M, und FF, aus, und der gesamte Prozess wird durch die folgende

Gleichung ausgedrückt:

F. =CA(F)OF

F =SA(F.)®F.

Vorzugsweise erzeugt das Kanalaufmerksamkeitsmodul eine

Kanalaufmerksamkeitsmerkmalskarte, indem es die in den Bildmerkmalen vorhandenen

Beziehungen zwischen den Kanälen untersucht; die räumliche Aufmerksamkeitskarte wird durch

Extraktion räumlicher Zuordnungsbeziehungen erzeugt. LUS06063

Vorzugsweise verwendet das Mischmodul ein lineares Differenzverfahren anwendet, um zwei unterschiedliche Trainingsproben und Etikettenproben aus dem ursprünglichen Datensatz zum Mischen und Erzeugen einer neuen Probe auszuwählen, und dass zwei unterschiedliche

Trainingsprobendaten (d,,/) und (d,,/,) zufällig aus dem Trainingssatz ausgewählt werden.

Wobei d die Trainingsdaten, 1 die etikettierten Daten und 1# bezeichnet, dann werden die beiden Zufallsstichproben durch den folgenden Algorithmus berechnet, um eine neue Stichprobe zu erzeugen, der Algorithmus ist in der folgenden Gleichung angegeben: d = Ad, +(1- Ad, ;

I= +4}, ;

Dabei ist À €[0,1] ein Hyperparameter, der der Betae(œ,œ) Verteilung gehorcht, d.h. der Intensitätskoeffizient, der die Interpolation steuert. Die Größe von « ist proportional zur

Intensität der Interpolation, die die Mischtiefe der Bildmusterdaten beeinflusst, und wenn G=0 ist, werden die Daten nicht gemischt und Mixup funktioniert nicht.

Vorzugsweise wird CIoU als Regressionsverlustfunktion verwendet, wie in der folgenden

Gleichung ausgedrückt: d

Lie =1-1oUl (B, B,)+— +0 ; c

V - a=—— ; 1+-ZOU +v 4 wê Wo. v= 7 (arctan, Re arctan > ;

Dabei steht w für die Breite des Vorhersagekastens, h für die Hôhe des Vorhersagekastens, w® für die Breite des Zielkastens und A“ für die Höhe der Zielbibliothek.

Verglichen mit dem Stand der Technik hat die vorliegende Erfindung folgende vorteilhafte

Auswirkungen:

Das Verfahren zur automatischen Klassifizierung von Zellen in Gebärmutterhalsflüssigkeit, die durch die vorliegende Erfindung vorgeschlagen wird, verbessert das Netzwerkmodell zur

Erkennung von pathologischen Merkmalen von abnormalen Gebärmutterhalszellen durch die

Integration des CPCA-Moduls auf der Grundlage des ursprünglichen Yolov5s-Netzwerkmodells, hebt die wichtigen Merkmale durch die Erfassung der Kanal- und Positionsinformationen effektiv hervor und hat einen geringeren Rechenaufwand.

Beschreibung der beigefügten Zeichnungen

Bild 1 zeigt ein schematisches Diagramm der YOLOv5s-CPCA-Netzwerkstruktur der vorliegenden Erfindung;

Bild 2 zeigt ein schematisches Diagramm der Struktur des CPCA-

Aufmerksamkeitsmechanismus der vorliegenden Erfindung. LU506063

Detaillierte Beschreibung

Um den Zweck der vorliegenden Erfindung, die technischen Lösungen fiir eine klare und vollständige Beschreibung, und die Vorteile klarer zu verstehen, sind die folgenden

Ausführungsformen der vorliegenden Erfindung im Detail in Verbindung mit den beigefügten

Zeichnungen beschrieben. Es sollte verstanden werden, dass die spezifischen Ausführungsformen hierin beschrieben sind Teil der Ausführungsformen der vorliegenden Erfindung, nicht alle der

Ausführungsformen, nur für die Erklärung der Ausführungsformen der vorliegenden Erfindung, und wird nicht verwendet, um die Ausfithrungsformen der vorliegenden Erfindung zu begrenzen, alle anderen Ausführungsformen durch den normalen Fachmann auf dem Gebiet erhalten, ohne dass kreative Arbeit unter der Prämisse des Schutzes des Anwendungsbereichs der vorliegenden

Erfindung.

Ausführungsform 1

Unter Bezugnahme auf die Bilder 1 bis 2 bietet die vorliegende Erfindung eine technische

Lösung: ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, wobei das Verfahren die folgenden Schritte umfasst:

Aufbau eines CPCA-Mechanismus fiir räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls zur Erzeugung einer dynamisch verteilten räumlichen

Aufmerksamkeitskarte auf jedem Kanal;

Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Stichproben für die Erkennung kleiner Ziele zu lösen, wird zusätzlich zur

Mosaik-Datenverbesserung, affınen Transformation und perspektivischen Transformation das

Mixup-Modul hinzugefügt, um eine Datenverbesserung durchzuführen, d.h. zwei Bilder werden zufällig aus jedem Batch ausgewählt und in einem bestimmten Verhältnis gemischt, um ein neues

Bild zu erzeugen;

Das YOLOv5s-Basismodell wurde so verbessert, dass es auch in der komplexen Umgebung von Gebärmutterhalszellen über starke Erkennungsfähigkeiten verfügt. Der Backbone-Netzteil des

Modells wird verwendet, um Merkmale aus dem Bild auf verschiedenen feinkörnigen Ebenen zu extrahieren, und das ursprüngliche Backbone-Netz besteht aus Conv, C3, C3Res2 und Spatial

Pyramid Pooling-Fast (SPPF). Die Größe des Eingangsbildes von Zellen auf der Basis von

Gebärmutterhalsflüssigkeit im YOLOv5s-Modell ist so gewählt, dass die Details der

Bildgenauigkeit vollständig erhalten bleiben. Die Größe des Eingangsbildes beträgt 1024x1024x3 und die Anzahl der Faltungskerne ist 32 in der ersten Focus-Struktur. Nach der Faltung beträgt die

Größe der Merkmalskarte 512x512x32. Das Modul C3 wird verwendet, um die Merkmale der

Gebarmutterhalszellen zu extrahieren, die im Backbone-Netzwerkteil und im Halsnetzwerkteil verwendet werden. Im Backbone-Netzwerkteil enthält das C3-Modul detaillierte

Standortinformationen, aber weniger semantische Informationen; Im Teil des Halsnetzwerks wird das C3-Modul verwendet, um Merkmale zu extrahieren, die detaillierte semantische Informationen, aber weniger Positionsinformationen enthalten, und seine Verarbeitung von

Merkmalsinformationen für kleine Ziele führt zu mehr fehlenden Positionsinformationen des Ziels,

wodurch leicht Merkmalsinformationen verloren gehen.SPPF wird verwendet, uh/506063

Merkmalskarten verschiedener Größen als Ausgabe miteinander zu verbinden. Der Header-

Vorhersageteil der Ausgabe sagt die verarbeiteten Gebärmutterhalszell-Bildmerkmale in drei verschiedenen Maßstäben voraus, erzeugt Bounding Boxes und sagt die Klasse des Ziels voraus. 5 Um die oben genannten Probleme weiter zu verbessern und die Erkennungsgenauigkeit des ursprünglichen Modells für Gebarmutterhalszellen verschiedener Falltypen zu erhöhen, schlagen wir ein verbessertes YOLOv5s-Netzwerkmodell vor, wie in Abb. 1 dargestellt. Das CPCA-Modul wurde zu den Backbone- und Zervikalnetzwerken hinzugefügt und nach dem C3-Modul platziert.

Das CPCA-Modul verbessert das Lernen von Informationen über kleine Zielobjekte, indem es die

Gewichte des Kanal- und des räumlichen Aufmerksamkeitsmoduls während des

Netzwerktrainings dynamisch anpasst.

Wie aus Bild 2 ersichtlich ist, führt der Mechanismus der Kanal-A-priori-

Faltungsaufmerksamkeit CPCA nacheinander zwei Modulaufgaben der Kanalaufmerksamkeit CA und der räumlichen Aufmerksamkeit SA durchführt, wobei angenommen wird, dass das

Eingangsbildmerkmal FeR ist. Eine eindimensionale

Kanalaufmerksamkeitsmerkmalskarte M.eR wird zunächst = durch = das

Kanalaufmerksamkeitsmodul CA erhalten, und dann wird AM. Element für Element mit dem

Eingangsmerkmal / multipliziert, um den Kanalaufmerksamkeitswert aus der räumlichen

Dimension zu übertragen, um so ein besseres Bildmerkmal Fe RS" wit

F.., und gibt dann schließlich die verarbeiteten Bildmerkmale Fe R” durch elementweise

Gleichung ausgedrückt:

F. =CA(F)OF

F =SA(F.)®F.

Kanalaufmerksamkeitsmodul (CA): Das Kanalaufmerksamkeitsmodul erzeugt eine

Beziehungen zwischen den Kanälen untersucht. Zunächst werden die räumlichen Informationen aus dem Merkmalsbild extrahiert und die Operationen des durchschnittlichen Poolings und des maximalen Poolings werden unter Verwendung der im CBAM-Aufmerksamkeitsmechanismus vorgeschlagenen Methode angewandt; anschließend werden die aus dem durchschnittlichen

Pooling und dem maximalen Pooling gewonnenen räumlichen Kontextinformationen an das gemeinsame mehrschichtige Perzeptron (MLP) gesendet. Dann werden die MLP-Ausgänge durch elementweise Summierung fusioniert, und schließlich erhält man die Merkmalskarten für die

Kanalaufmerksamkeit. Um die Menge der Parameterdaten zu reduzieren, besteht die MLP-

Struktur aus einer einzigen verborgenen Schicht, deren Größe auf RY" festgelegt ist, wobei r den Dämpfungskoeffizienten bezeichnet. Das Kanalaufmerksamkeitsmodul kann unte}506063

Verwendung von Gleichung wie folgt ausgedrückt werden:

CAF) = 6(MLP(AvgPool(F)) + MLP(MaxPool(F"))) wobei 6 die sigmod-Aktivierungsfunktion bezeichnet.

Räumliches Aufmerksamkeitsmodul (SA): Räumliche Aufmerksamkeitskarten werden durch

Extraktion räumlicher Zuordnungsbeziehungen erstellt. Es wurde festgestellt, dass eine einheitliche Verteilung der räumlichen Aufmerksamkeitsgewichte für jeden Kanal in der räumlichen Aufmerksamkeitskarte vermieden werden sollte, und die räumlichen

Aufmerksamkeitsgewichte sollten dynamisch auf der Grundlage der spezifischen Merkmale jedes

Kanals angepasst werden. Bild 3 veranschaulicht die Verwendung eines in der Tiefe trennbaren

Faltungsmoduls zur Erfassung der räumlichen Beziehungen zwischen den Merkmalen, wodurch sichergestellt wird, dass die Beziehungen zwischen den Kanälen beibehalten werden und gleichzeitig die Rechenkomplexität verringert wird. Eine Multiskalenstruktur wird verwendet, um die Fähigkeit der Faltungsoperation zu verbessern, räumliche Beziehungen zu erfassen, räumliche

Aufmerksamkeitsmerkmalskarten unter verschiedenen Kanälen zu erzeugen und schließlich die 1x1-Faltungsfusion der räumlichen Aufmerksamkeitsmodule verschiedener Kanäle in einem

Hybridmodul zu verwenden, um optimierte Merkmalskarten zu erzeugen.

SA(F)=Conv,, Œ, Branch (DwConv(F))) wobei DwConv die tiefen-separierbare Faltungsoperation bezeichnet, Branch, 1e {0,1,2,3} die Faltungsoperation des i-ten Zweigs, und zur Erfassung von Mehrskaleninformationen werden zwei kleine Kernel-Faltungen verwendet, um die Kanalfaltung des groBen Kernels anzunähern, und es werden Faltungskerne unterschiedlicher Größe festgelegt.

Die Modelle der Kanalaufmerksamkeit und der räumlichen Aufmerksamkeit konzentrieren sich auf die semantischen bzw. räumlichen Informationen der Merkmale, und die experimentellen

Ergebnisse zeigen, dass die sequentielle Anordnung der beiden Aufmerksamkeitsmodule effektiver ist als die parallele Anordnung.

Bei der Methode zur Verbesserung von Mischdaten werden zunächst zwei verschiedene

Trainingsdaten (d,,/) und (d,,/,) zufällig aus dem Trainingssatz ausgewählt, wobei d die

Trainingsdaten und 1 die gelabelten Daten bezeichnet und 1# j. Dann werden diese beiden

Zufallsstichproben durch den folgenden Algorithmus berechnet, um neue Probendaten zu erzeugen: d = Ad, +(1- Ad, ;

I= +4}, ;

Im Experiment werden zunächst N Stichproben aus dem Originaldatensatz ausgewählt, um den Stichprobendatensatz zu bilden, und der N-Stichproben-Datensatz wird dem Zufallsumstut#/506063 unterzogen, ausgedrückt als Gleichung *.

Sp App au) dpa a2) (dps Lan)

Die N Stichproben werden dann wie in Gleichung * ausgedrückt erneut randomisiert, was zu zwei zufällig angeordneten Stichproben-Datensätzen führt.

EC ANA

Zu diesem Zeitpunkt sind die Stichproben, die den beiden Stichprobensätzen §, und 5, entsprechen, gemäß der folgenden Gleichung unterschiedlich:

Cr VF Ka Ya)

Unter Verwendung von Gleichung (1) und Gleichung (2) für die S,- und 5, -Stichproben ergibt sich ein neuer Stichproben-Datensatz, $,...„, der wie folgt ausgedrückt werden kann:

S mixup = {dd 1, (d,, L),..(dy, 1)

Der neue Datensatz nach dem Mischen durch Mixup ersetzt den Originaldatensatz für das

Training.

CIoU wurde als Regressionsverlustfunktion verwendet, wie in der folgenden Gleichung ausgedrückt: d

Le =1-1oUl (B, B,)4— +09 ; c

V - a=—— ; 1-IoU +v 4 wê Wo. v= = (arctan, pr arctan >) ;

Dabei steht w für die Breite des Vorhersagekastens, h für die Höhe des Vorhersagekastens, w® für die Breite des Zielkastens und A“ für die Höhe der Zielbibliothek.

Ausführungsform 2

Auf der Grundlage von Ausführungsform 1 wird Folgendes vorgeschlagen: Das Verfahren zur Erstellung des in den Experimenten dieser Studie verwendeten Datensatzes der Zellproben aus dem Gebärmutterhals wurde wie folgt durchgeführt: Das Präparat der Zellen aus dem

Gebärmutterhals wurde mit einem vollautomatischen Scanner für Zellen aus dem Gebärmutterhals gescannt, der von JingCast Biologicals selbst entwickelt wurde, und ein Panorama der Zellproben aus dem Gebärmutterhals wurde erstellt. Dann wurde das Panorama der Proben gescreent, und es wurden 150 positive und 150 negative Proben ausgewählt. Von den positiven Proben enthielten 50 abnorme Zellhaufen; die negativen Proben enthielten jeweils 15 Mykobakterien, Trichomonaden,

Aktinomyzeten, Clue-Zellen, Herpes und Aktinomyzeten; die restlichen 60 negativen Proben waren frei von mikrobiellen Infektionen und enthielten 5 Proben mit atrophischen Zellen und L4/506063

Proben mit Chemotaxis-Zellen. Ein Pathologe wurde dann gebeten, die Panoramaproben zu beschriften und die beschrifteten Diagramme zu schneiden, um den Datensatz der auf

Gebärmutterhalsflüssigkeit basierenden Zellproben zu erhalten.

Die Beispieldaten werden durch Mosaikdatenverbesserung, affine Transformation und

Perspektive-Transformation verbessert, auf deren Grundlage das Mixup-Modul zur

Datenverbesserung hinzugefügt wird. Die Kernidee besteht darin, zwei Bilder aus jedem Stapel nach dem Zufallsprinzip auszuwählen und sie in einem bestimmten Verhältnis zu mischen, um ein neues Bild zu erzeugen, und der gesamte Trainingsprozess verwendet das gemischte neue Bild zum Training, wobei das Originalbild nicht mehr in das Training einbezogen wird.

In diesem Experiment wurde der Zelldatensatz aus der Gebärmutterhalsflüssigkeit bei der

Durchführung des Tests in insgesamt 10 Kategorien eingeteilt. Die einzelnen Kategorien sind in

Tabelle 1 aufgeführt.

Tabelle 1 Datensatz von Zellen auf der Basis von Gebärmutterhalsflüssigkeit

Zelltyp Anzahl Gattung Zeiltyp Anzahl Gattung

LSIL 2687 | Positiv PARASITE | 2305 | Miktoons

AnIsmen ze

ABC 100% | Positiv LEPTOTRICHIA | 23g | Mikroors

ACTINOMYCES | typ | Mikwor

A A AN N penne ÉOLIEN

FUNGAL 2005 | Milktoore HERPES 530 | Miko i amismen i arsinen

Dieses experimentelle Training wurde mit dem Betriebssystem Ubuntul8.04 unter

Verwendung von Pytorchl.8.1, dem CUDA11.4 Deep-Learning-Trainingsframework und der

NIVDIA RTX3090TiGPU durchgeführt, um das Modelltraining zu beschleunigen, und die

Trainingsparameter wurden wie folgt festgelegt: Epoch ist auf 100 mal eingestellt, batch size ist auf 32 eingestellt, die EingabebildgrôBe ist 1024x1024, und die Kombination aus regulärem

Training und Freeze-Training wird angenommen, um während des Trainingsprozesses zu iterieren, um das Overfitting-Phänomen, das während des Trainingsprozesses auftreten kann, weiter zu hemmen, und das spezifische Trainingsschema ist wie folgt:

Schritt 1: Konventionelle Trainingsmethode, zufällige Auswahl der Hälfte der Daten im

Datensatz, Durchführung eines konventionellen Trainings für das ausgewählte Netzwerk, alle

Parameter werden in diesem Prozess gleichzeitig aktualisiert, und man erhält Modell1;

Schritt 2: Auswahl des besten Modells im ersten Schritt des konventionellen Trainings, zufällige Auswahl der Hälfte der Trainingsdaten, mit 100 Epochen als Stufe, die ersten 40 Epochen werden die Kopfschicht eingefroren, und nur die Backbone-Schicht wird trainiert; In der 40. bis 100. Epoche wird das Backbone eingefroren und nur die HEAD-Schicht trainiert, und die

Parameter der Backbone- und HEAD-Schicht werden nacheinander aktualisiert, um Modell2 zu erhalten;

Schritt 3: Wählen Sie auf der Grundlage von Modell2 alle Trainingsdaten aus, passen Sie die

Lernrate um eine Größenordnung nach unten an und trainieren Sie in eingefrorener Weise gemäß

Schritt 2, um das endgültige Modell zu erhalten. LU506063

Die gängigen Bewertungsmalistibe, die derzeit für Zielerkennungsmodelle verwendet werden, sind Genauigkeit, Präzision, Wiedererkennungswert und mAP, wobei der

Wiedererkennungswert verwendet wird, um zu bewerten, ob die Vorhersage des Netzwerkmodells umfassend ist oder nicht, und die Präzision, um zu beurteilen, ob die Vorhersageergebnisse genau sind oder nicht. AP misst, wie gut das trainierte Modell in jeder Kategorie ist, und mAP misst, wie gut das trainierte Modell in allen Kategorien ist; die oben genannten Metriken werden mit der folgenden Formel ausgedrückt

Recall = AP

TP + FN

Precision = IP

TP + FP

AP =| p(rd = |, p(rydr

N

> AP(n) mMAP=

N wobei 7 (r) die Precision-Recall-Kurve bezeichnet, N die Gesamtzahl der Kategorien der kategorisierten Daten ist und n die Kategorie der aktuellen Daten ist.

Obwohl Ausführungsformen der vorliegenden Erfindung gezeigt und beschrieben worden sind, wird der Fachmann erkennen, dass eine Vielzahl von Änderungen, Modifikationen,

Substitutionen und Variationen an diesen Ausführungsformen vorgenommen werden können, ohne von dem Prinzip und dem Geist der vorliegenden Erfindung abzuweichen, deren Umfang durch die beigefügten Ansprüche und deren Äquivalente begrenzt ist.

Claims

Ansprüche LU506063

1. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit, dadurch gekennzeichnet, dass das Verfahren die folgenden Schritte umfasst: Konstruktion eines CPCA-Mechanismus für räumliche Aufmerksamkeit unter Verwendung eines tiefen Faltungsmoduls zur Erzeugung einer dynamisch verteilten räumlichen Aufmerksamkeitskarte auf jedem Kanal; Um die Zielvielfalt zu erhöhen und das Problem unzureichender Datensätze und unausgewogener Stichproben für die Erkennung kleiner Ziele anzugehen, zusätzlich zur Mosaik- Datenverbesserung, affinen Transformation und perspektivischen Transformation, Hinzufügen des Mixup-Moduls zur Datenverbesserung, d.h. zufällige Auswahl von zwei Bildern aus jedem Batch und Mischen dieser Bilder in einem bestimmten Verhältnis, um ein neues Bild zu erzeugen; Verbesserung der Verlustfunktion durch Ersetzen der Verlustfunktion „Generalised Intersection and Combination Ratio“ GIoU durch die Verlustfunktion „Complete Intersection and Combination Ratio“ CIoU, um die Leistung der Bounding-Box-Regression und der Lokalisierung zur Identifizierung von zervikalen pathologischen Zellfraktionen mit komplexer Umgebung zu verbessern.

2. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass das CPCA-Modul dem Backbone-Netzwerk und dem Halsnetzwerk hinzugefügt und nach dem C3-Modul platziert wird, und dass das CPCA-Modul im Prozess des Netzwerktrainings das Lernen der Merkmalsinformationen des kleinen Ziels durch dynamisches Einstellen der Kanal- und Raumaufmerksamkeitsmodul-Gewichte verbessert.

3. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass: der Mechanismus der Kanal-A-priori-Faltungsaufmerksamkeit CPCA nacheinander zwei Modulaufgaben der Kanalaufmerksamkeit CA und der räumlichen Aufmerksamkeit SA durchführt, wobei angenommen wird, dass das Eingangsbildmerkmal F € R°"”" ist. Eine eindimensionale Kanalaufmerksamkeitsmerkmalskarte M.eR wird zunächst = durch = das Kanalaufmerksamkeitsmodul CA erhalten, und dann wird AM. Element für Element mit dem Eingangsmerkmal / multipliziert, um den Kanalaufmerksamkeitswert aus der räumlichen Dimension zu übertragen, um so ein besseres Bildmerkmal Fe RS" wit Kanalaufmerksamkeit zu erhalten; Das räumliche Aufmerksamkeitsmodul SA erzeugt eine räumliche 3D-Aufmerksamkeitskarte M, € R°""" durch Datenverarbeitung der Bildmerkmale

F.., und gibt dann schließlich die verarbeiteten Bildmerkmale Fe R” durch elementweise Multiplikation von M, und FF, aus, und der gesamte Prozess wird durch die folgende Gleichung ausgedrückt:

F.=CA(F)®F

7 LU506063 F=SA(F.)OF.

4. Fin Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 3, dadurch gekennzeichnet, dass das Kanalaufmerksamkeitsmodul eine Kanalaufmerksamkeitsmerkmalskarte erzeugt, indem es die in den Bildmerkmalen vorhandenen Beziehungen zwischen den Kanälen untersucht, und dass die räumliche Aufmerksamkeitskarte durch Extraktion räumlicher Abbildungsbeziehungen erzeugt wird.

5. Ein Verfahren zur automatischen Klassifizierung und Erkennung von Zellen auf der Basis von Gebärmutterhalsflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass das Mischmodul ein lineares Differenzverfahren anwendet, um zwei unterschiedliche Trainingsproben und Etikettenproben aus dem ursprünglichen Datensatz zum Mischen und Erzeugen einer neuen Probe auszuwählen, und dass zwei unterschiedliche Trainingsprobendaten (d,,/) und Cd; /) zufällig aus dem Trainingssatz ausgewählt werden. Wobei d die Trainingsdaten, 1 die etikettierten Daten und 1# bezeichnet, dann werden die beiden Zufallsstichproben durch den folgenden Algorithmus berechnet, um eine neue Stichprobe zu erzeugen, der Algorithmus ist in der folgenden Gleichung angegeben: d= Ad, +(1-A)d, ; I= +4}, ; Dabei ist À e[0,1] ein Hyperparameter, der der Betae(œ,œ) Verteilung gehorcht, d.h. der Intensitätskoeffizient, der die Interpolation steuert. Die Größe von œ ist proportional zur Intensität der Interpolation, die die Mischtiefe der Bildmusterdaten beeinflusst, und wenn G=0 ist, werden die Daten nicht gemischt und Mixup funktioniert nicht.

6. automatisches Zellsortier- und -nachweisverfahren auf der Basis von Zervixflüssigkeit nach Anspruch 1, dadurch gekennzeichnet, dass CIoU als Regressionsverlustfunktion verwendet wird, die in der folgenden Formel ausgedrückt wird: d Le =1=10UI (B, B)+—+av c y a=—— 1-ZOU+v 4 w8 W., v = — (arctan, — — arctan —) 1 h* h Dabei steht w für die Breite des Vorhersagekastens, h für die Hôhe des Vorhersagekastens, w* für die Breite des Zielkastens und A“ für die Höhe der Zielbibliothek.