LU600539B1

LU600539B1 - Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz

Info

Publication number: LU600539B1
Application number: LU600539A
Authority: LU
Inventors: Zhipeng Wang; Tianyu Yu; Luyao Liu; Yan Pan; Zhou Ren; Yongfeng Ni; Hui Li; Roujia TAO; Qiang Suo; Qiwen Cao
Original assignee: Shanghai Prothentic Tech Co Ltd
Priority date: 2025-03-12
Filing date: 2025-03-12
Publication date: 2025-09-12

Abstract

Die vorliegende Erfindung betrifft den technischen Bereich der Verarbeitung von Aufgaben der künstlichen Intelligenz, insbesondere ein Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz. Es umfasst ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Inferenzlogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein Optimierungs- und Verbesserungsmodul.Das Datenvorverarbeitungsmodul dient der Erkennung von Datenverzerrungen sowie der Datenbereinigung und -korrektur.Die vorliegende Erfindung nutzt ein Multi-Task-Learning-Framework zur gleichzeitigen Bearbeitung mehrerer zusammenhängender Aufgaben, wodurch die Generalisierungsfähigkeit und Effizienz des Modells verbessert wird. Darüber hinaus können kontrafaktische Beispiele generiert und kausale Schlussfolgerungen abgeleitet werden, um eine theoretische Grundlage für die Entscheidungsfindung bereitzustellen und die Erklärbarkeit des Modells zu verbessern.Durch den Einsatz von Wahrscheinlichkeitsinferenz- und Robustheitsoptimierungsmethoden wird Unsicherheit effektiv behandelt, wodurch die Stabilität und Zuverlässigkeit des Modells in Umgebungen mit Rauschen und Unsicherheiten erhöht wird. Bild 1

Description

Verfahren und System zur Bearbeitung von Aufgaben der künstlichen LU600539

Intelligenz

Technischer Bereich

Die vorliegende Erfindung betrifft den technischen Bereich der Bearbeitung von

Aufgaben der künstlichen Intelligenz, insbesondere ein Verfahren und System zur

Bearbeitung von Aufgaben der künstlichen Intelligenz.

Technologie im Hintergrund

Künstliche Intelligenz-Aufgaben beziehen sich auf Probleme oder Arbeiten, die mithilfe von KI-Technologien gelöst oder ausgeführt werden müssen. Die

Verarbeitung von KI-Aufgaben bezeichnet den Prozess, bei dem Algorithmen,

Modelle und Rechenressourcen eingesetzt werden, um solche Aufgaben auszuführen.

Dies umfasst die Erfassung und Vorverarbeitung von Daten, die Merkmalsextraktion, das Training von Modellen, die Inferenz sowie die Interpretation und Darstellung der

Ergebnisse. Ziel der Aufgabenverarbeitung ist es, die Aufgaben präzise und effizient zu erledigen, während gleichzeitig die Erklärbarkeit und Robustheit der Modelle sichergestellt wird.

Allerdings beruhen herkömmliche Verfahren zur Verarbeitung von KI-Aufgaben meist auf einzelnen Algorithmen oder Modellen wie Entscheidungsbäumen, Support

Vector Machines oder neuronalen Netzen. Diese zeigen bei bestimmten Datentypen oder Aufgaben zwar gute Ergebnisse, verfügen jedoch oft über eine begrenzte

Generalisierungsfähigkeit und können sich nur schwer an komplexe und dynamische

Umgebungen anpassen. Darüber hinaus wird bei herkömmlichen Methoden der

Erklärbarkeit der Modelle oft wenig Aufmerksamkeit geschenkt, wodurch es für die

Nutzer schwierig wird, die Entscheidungsprozesse der Modelle nachzuvollziehen.

Zudem bestehen Einschränkungen im Umgang mit Unsicherheiten, der domänenübergreifenden Anpassungsfähigkeit und dem Kontextverständnis.

Vor diesem Hintergrund bietet die vorliegende Erfindung ein Verfahren und

System zur Bearbeitung von Aufgaben der künstlichen Intelligenz an, um die oben genannten technischen Probleme zu lösen.

Inhalt der Erfindung

Ziel der vorliegenden Erfindung ist es, ein Verfahren und System zur

Bearbeitung von Aufgaben der künstlichen Intelligenz bereitzustellen, um die in der obigen Hintergrundtechnologie beschriebenen Probleme zu lösen.

Um dieses Ziel zu erreichen, stellt die vorliegende Erfindung die folgende technische Lösung bereit:

Erster Aspekt der vorliegenden Erfindung:

Es wird ein System zur Bearbeitung von Aufgaben der künstlichen Intelligenz bereitgestellt, das ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Schlussfolgerungslogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein

Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein

Optimierungs- und Verbesserungsmodul umfasst.

Das Datenvorverarbeitungsmodul dient der Erkennung von Datenverzerrungen sowie der Datenbereinigung und -korrektur. LU600539

Das Modul zur Generierung kontrafaktischer Beispiele dient der

Szenarienkonstruktion und der Musterauswahl.

Das Modul zur Modellschulung und -bewertung dient dem Multi-Task-Learning und der Kreuzvalidierung.

Das Modul zur kontrafaktischen Schlussfolgerungslogik dient der kausalen

Inferenz und der Integration von Entscheidungsbaumregeln.

Das Modul zur Unsicherheitsbehandlung dient der Wahrscheinlichkeitsinferenz und der Robustheitsoptimierung.

Das Modul für domänenübergreifende Anpassung und Transferlernen dient der

Merkmalsausrichtung und der Entwicklung von Transferlernstrategien.

Das Kontextmodellierungsmodul dient der Kontexterkennung und der kontextuellen Modellierung.

Das Optimierungs- und Verbesserungsmodul dient der Bereitstellung erklärbarer

Modelle sowie einer Schnittstelle zur Erhöhung der Transparenz.

Vorzugsweise umfasst das Datenvorverarbeitungsmodul außerdem eine Einheit zur Erkennung von Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur.

Die Einheit zur Erkennung von Datenverzerrungen dient der Identifizierung von

Selektionsverzerrungen, Messfehlern oder Annotationfehlern in den Trainingsdaten.

Die Einheit zur Datenbereinigung und -korrektur bereinigt und korrigiert die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen

Annotation und Korrektur.

Vorzugsweise umfasst das Modul zur Generierung kontrafaktischer Beispiele außerdem eine Einheit zur Szenarienkonstruktion und eine Einheit zur

Musterauswahl.

Die Einheit zur Szenarienkonstruktion erzeugt kontrafaktische Szenarien mittels generativer adversarialer Netzwerke (GAN) und bedingter variationaler Autoencoder (VAE).

Die Einheit zur Musterauswahl überprüft und selektiert die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.

Vorzugsweise umfasst das Modul zur Modellschulung und -bewertung außerdem eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungs-Einheit.

Die Multi-Task-Learning-Einheit trainiert das Modell gleichzeitig im Rahmen eines Multi-Task-Learning-Frameworks sowohl fiir die Standardaufgabe als auch fiir die kontrafaktische Schlussfolgerungsaufgabe.

Die Kreuzvalidierungs-Einheit bewertet die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.

Vorzugsweise umfasst das Modul zur kontrafaktischen Schlussfolgerungslogik außerdem eine Kausalinferenz-Einheit und eine

Entscheidungsbaumregel-Integrations-Einheit.

Die Kausalinferenz-Einheit analysiert den Einfluss unterschiedlicher

Entscheidungen auf das Ergebnis.

Die Entscheidungsbaumregel-Integrations-Einheit generiert mithilfe von LUB00539

Entscheidungsbäumen und Regellernen eine leicht verständliche und interpretierbare

Entscheidungslogik.

Vorzugsweise umfasst das Modul zur Unsicherheitsbehandlung außerdem eine

Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Finheit.

Die Wahrscheinlichkeitsinferenz-Finheit quantifiziert die Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse.

Die Robustheitsoptimierungs-Finheit trainiert das Modell mithilfe von

Robustheitsoptimierungsalgorithmen.

Vorzugsweise umfasst das Modul für domänenübergreifende Anpassung und

Transferlernen außerdem eine Merkmalsausrichtungs-Einheit und eine

Transferlernstrategie-Finheit.

Die Merkmalsausrichtungs-Einheit führt die Merkmalsausrichtung mittels adversarialer Trainingsverfahren auf Basis der maximalen mittleren Diskrepanz (Maximum Mean Discrepancy, MMD) durch.

Die Transferlernstrategie-Einheit dient der Übertragung von Wissen aus der

Quell-Domäne in die Ziel-Domäne.

Vorzugsweise umfasst das Kontextmodellierungsmodul außerdem eine

Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit.

Die Kontexterkennungseinheit erkennt und versteht die Aufgabenkontexte mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer

Vision.

Die kontextuelle Modellierungseinheit erfasst die Abhängigkeiten und dynamischen Veränderungen zwischen verschiedenen Flementen.

Vorzugsweise umfasst das Optimierungs- und Verbesserungsmodul außerdem eine Einheit für erklärbare Modelle und eine Einheit zur Transparenzsteigerung.

Die Einheit für erklärbare Modelle erzeugt mithilfe von SHAP-Werten und dem

LIME-Algorithmus erklärbare Modellausgaben.

Die Einheit zur Transparenzsteigerung stellt eine Schnittstelle zur Verbesserung der Transparenz bereit.

Basierend auf dem oben beschriebenen System schlägt die vorliegende

Erfindung außerdem ein Verfahren zur Bearbeitung von Aufgaben der künstlichen

Intelligenz vor, das die folgenden Schritte umfasst:

S1. Erkennung und Korrektur von Datenverzerrungen mittels statistischer

Analysen und maschinellen Lernens sowie Bereinigung und Korrektur fehlerhafter

Daten.

S2. Generierung kontrafaktischer Beispiele durch Einsatz von generativen

Modellen zur Erstellung vielfältiger kontrafaktischer Szenarien und Überprüfung der

Stichhaltigkeit der Beispiele mithilfe eines Expertensystems.

S3. Training des Modells im Rahmen eines Multi-Task-Learning-Frameworks sowie Bewertung der Modellleistung mittels K-facher Kreuzvalidierung.

S4. Kontrafaktische Inferenzlogik, bei der kausale Schlussfolgerungen durch

Kausalgraphenmodelle und Entscheidungsbaumalgorithmen abgeleitet werden, um eine erklärbare Entscheidungslogik zu erzeugen.

S5. Behandlung von Unsicherheiten durch Anwendung von Bayes‘ scher Inferenz LU600539 und Robustheitsoptimierung zur Quantifizierung der Ergebniszuverlässigkeit.

S6. Reduzierung von Domänenverzerrungen durch Merkmalsausrichtung und

Transferlernstrategien sowie Anpassung des Modells an neue Domänen mittels domänenübergreifendem Transferlernen.

S7. Durchführung von Kontextverständnis und kontextueller Modellierung,

Erkennung von Kontexten mittels NLP-/CV-Technologien und Modellierung des

Kontexts mithilfe von RNN- oder GNN-Methoden.

S8. Generierung erklärbarer Modellausgaben sowie Bereitstellung einer

Schnittstelle zur Erhöhung der Transparenz.

Verglichen mit dem Stand der Technik bietet die vorliegende Erfindung folgende vorteilhafte Wirkungen:

Durch das Multi-Task-Learning-Framework ist das System in der Lage, mehrere zusammenhängende Aufgaben gleichzeitig zu bearbeiten, wodurch die

Generalisierungsfähigkeit und Effizienz des Modells verbessert wird. Es können kontrafaktische Beispiele generiert und kausale Schlussfolgerungen gezogen werden, um eine theoretische Grundlage für die Entscheidungsfindung zu schaffen und die

Erklärbarkeit des Modells zu erhöhen.Mithilfe von Wahrscheinlichkeitsinferenz- und

Robustheitsoptimierungsmethoden wird Unsicherheit effektiv behandelt, wodurch die

Stabilität und Zuverlässigkeit des Modells in verrauschten oder unsicheren

Umgebungen erhöht wird. Durch Merkmalsausrichtung und Transferlernstrategien können Domänenunterschiede verringert und die Anpassungsfähigkeit des Modells in neuen Domänen verbessert werden.Mit Hilfe von Technologien der natürlichen

Sprachverarbeitung und der Computer Vision werden Kontexte erkannt und verstanden, wodurch kontextbezogene Informationen für die Aufgabenbearbeitung bereitgestellt und die kontextuelle Verständniskompetenz des Modells verbessert wird.Durch die Generierung erklärbarer Modellausgaben und die Bereitstellung einer

Schnittstelle zur Transparenzsteigerung wird das Vertrauen und das Verständnis der

Benutzer gegenüber dem Modell gestärkt.Zusammenfassend bietet das in der vorliegenden Erfindung beschriebene System und Verfahren zur Bearbeitung von

Aufgaben der künstlichen Intelligenz die Vorteile umfassender Funktionalität,

Multi-Task-Learning, kontrafaktischer Inferenz, Unsicherheitsbehandlung sowie domänenübergreifendem Transferlernen. Dadurch können komplexe und dynamische

KI-Aufgaben wesentlich effektiver bewältigt werden.

Beschreibung der beigefügten Zeichnungen

Bild 1 zeigt das Topologiediagramm des Verarbeitungssystems für Aufgaben der künstlichen Intelligenz gemäß der vorliegenden Erfindung.

Bild 2 zeigt das Flussdiagramm des Verfahrens zur Bearbeitung von Aufgaben der künstlichen Intelligenz gemäß der vorliegenden Erfindung.

Detaillierte Beschreibung

Im Folgenden werden die technischen Lösungen der Ausführungsbeispiele der vorliegenden Erfindung klar und vollständig beschrieben. Offensichtlich stellen die beschriebenen Ausführungsbeispiele nur einen Teil der Ausführungsbeispiele der vorliegenden Erfindung dar und nicht sämtliche Ausführungsbeispiele. Auf Grundlage der in der vorliegenden Erfindung beschriebenen Ausführungsbeispiele gehören alle LUB00539 weiteren Ausführungsbeispiele, die von einem Fachmann auf diesem Gebiet ohne erfinderische Tätigkeit erzielt werden können, ebenfalls zum Schutzbereich der vorliegenden Erfindung. 5 Ausführungsbeispiel 1

Bitte beziehen Sie sich auf Bild 1, die vorliegende Erfindung schlägt ein

Verarbeitungssystem für Aufgaben der künstlichen Intelligenz vor. Dieses System umfasst ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Schlussfolgerungslogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein

Kontextmodellierungsmodul zur Kontext- und Situationsverstindnis sowie ein

Optimierungs- und Verbesserungsmodul.

Dabei ist anzumerken, dass das Datenvorverarbeitungsmodul zur Erkennung von

Datenverzerrungen sowie zur Datenbereinigung und -korrektur dient, das Modul zur

Generierung kontrafaktischer Beispiele zur Szenarienkonstruktion und Musterauswahl, das Modul zur Modellschulung und -bewertung zur Durchführung von

Multi-Task-Learning und Kreuzvalidierung, das Modul zur kontrafaktischen

Schlussfolgerungslogik zur ~~ kausalen —Inferenz und Integration von

Entscheidungsbaumregeln, das Modul zur Unsicherheitsbehandlung zur

Wahrscheinlichkeitsinferenz und ~~ Robustheitsoptimierung, das Modul für domänenübergreifende Anpassung und Transferlernen zur Merkmalsausrichtung und

Entwicklung von Transferlernstrategien, das Kontextmodellierungsmodul zur

Kontexterkennung und kontextuellen Modellierung sowie das Optimierungs- und

Verbesserungsmodul zur Bereitstellung erklärbarer Modelle und einer Schnittstelle zur Transparenzsteigerung.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das

Datenvorverarbeitungsmodul zusätzlich eine Einheit zur Erkennung von

Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur umfasst.

Darüber hinaus dient die Einheit zur Erkennung von Datenverzerrungen der

Identifizierung von Selektionsverzerrungen, Messfehlern oder Annotationsfehlern in den Trainingsdaten.

Des Weiteren bereinigt und korrigiert die Einheit zur Datenbereinigung und -korrektur die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen Annotation und Korrektur.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur

Generierung kontrafaktischer Beispiele zusätzlich eine Einheit zur

Szenarienkonstruktion und eine Einheit zur Musterauswahl umfasst.

Darüber hinaus erzeugt die Einheit zur Szenarienkonstruktion mithilfe von

Generative Adversarial Networks (GAN) und Conditional Variational Autoencoders (CVAE) kontrafaktische Szenarien, die den bekannten Fakten widersprechen.

Des Weiteren überprüft und selektiert die Einheit zur Musterauswahl die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur LU600539

Modellschulung und -bewertung zusätzlich eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungseinheit umfasst.

Darüber hinaus trainiert die Multi-Task-Learning-Einheit das Modell gleichzeitig fir die Standardaufgabe und die kontrafaktische Schlussfolgerungsaufgabe im

Rahmen eines Multi-Task-Learning-Frameworks.

Des Weiteren bewertet die Kreuzvalidierungseinheit die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur kontrafaktischen Schlussfolgerungslogik zusätzlich eine Kausalinferenz-Einheit und eine Entscheidungsbaumregel-Integrations-Einheit umfasst.

Darüber hinaus dient die Kausalinferenz-Einheit der Analyse der Auswirkungen unterschiedlicher Entscheidungen auf das Ergebnis.

Des Weiteren generiert die Entscheidungsbaumregel-Integrations-Einheit mithilfe von Entscheidungsbäumen und Regellernen eine Entscheidungslogik, die leicht verständlich und interpretierbar ist.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur

Unsicherheitsbehandlung zusätzlich eine Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Einheit umfasst.

Darüber hinaus dient die Wahrscheinlichkeitsinferenz-Einheit der

Quantifizierung der Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse.

Des Weiteren trainiert die Robustheitsoptimierungs-Einheit das Modell mithilfe von Robustheitsoptimierungsalgorithmen.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul für domänenübergreifende Anpassung und Transferlernen zusätzlich eine

Merkmalsausrichtungs-Einheit und eine Transferlernstrategie-Einheit umfasst.

Darüber hinaus führt die Merkmalsausrichtungs-Einheit die

Merkmalsausrichtung mithilfe von adversarialem Training basierend auf maximaler mittlerer Diskrepanz (Maximum Mean Discrepancy, MMD) durch.

Des Weiteren dient die Transferlernstrategie-Einheit der Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das

Kontextmodellierungsmodul zusätzlich eine Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit umfasst.

Darüber hinaus erkennt und versteht die Kontexterkennungseinheit den

Aufgabenkontext mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer Vision.

Des Weiteren erfasst die kontextuelle Modellierungseinheit die Abhängigkeiten und dynamischen Veränderungen zwischen den verschiedenen Elementen.

In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das

Optimierungs- und Verbesserungsmodul zusätzlich eine Einheit für erklärbare

Modelle und eine Einheit zur Transparenzsteigerung umfasst.

Darüber hinaus erzeugt die Einheit für erklärbare Modelle mithilfe von

SHAP-Werten und dem LIME-Algorithmus erklärbare Modellausgaben.

Des Weiteren dient die Einheit zur Transparenzsteigerung der Bereitstellung LU600539 einer Schnittstelle zur Verbesserung der Transparenz.

Ausführungsbeispiel 2

Bitte beziehen Sie sich auf Bild 2, in einer praktischen Anwendung schlägt die vorliegende Erfindung basierend auf dem oben beschriebenen System außerdem ein

Verfahren zur Bearbeitung von Aufgaben der künstlichen Intelligenz vor, das im

Einzelnen die folgenden Schritte umfasst: (1) Datenvorverarbeitung: (1.1) Erkennung von Datenverzerrungen:

Mithilfe statistischer Analyse- und maschineller Lernmodelle werden

Ausreißererkennung und Analyse der Datenverteilung durchgeführt, um

Selektionsverzerrungen, Messfehler oder Annotationsfehler in den Trainingsdaten zu identifizieren. Die Ausreißererkennung erfolgt mit der Z-Score- oder IQR-Methode, indem die Datenpunkte mit den statistischen Eigenschaften des gesamten Datensatzes verglichen werden, um Verzerrungen zu erkennen. (1.2) Datenbereinigung und -korrektur:

Mithilfe eines regelbasierten Engines zur automatisierten Annotation und

Korrektur werden die erkannten verzerrten Daten bereinigt und korrigiert. Dabei korrigiert das regelbasierte System automatisch fehlerhafte Annotationen oder ergänzt fehlende Werte gemäß vordefinierten Regeln. (2) Generierung kontrafaktischer Beispiele: (2.1) Szenarienkonstruktion:

Generative Adversarial Networks (GAN) oder Conditional Variational

Autoencoders (CVAE) werden eingesetzt, um kontrafaktische Szenarien zu generieren, die im Widerspruch zu bekannten Fakten stehen. Dies erhöht die Vielfalt der

Trainingsdaten und deckt eine größere Bandbreite an Szenarien ab. Die

Verlustfunktion des CVAE umfasst einen Rekonstruktionsfehler-Term sowie einen

KL-Divergenz-Term, um die Balance zwischen der Vielfalt der generierten Beispiele und deren Ähnlichkeit zu den Originaldaten sicherzustellen. (2.2) Musterauswahl:

Mithilfe eines Konsistenzprüfungsalgorithmus basierend auf einem

Expertensystem werden die generierten kontrafaktischen Beispiele validiert und gefiltert, um deren Plausibilität und Eignung für das weitere Training sicherzustellen. (3) Modelltraining und -bewertung: (3.1) Multi-Task-Learning:

Ein Multi-Task-Learning-Framework wird eingesetzt, um das Modell gleichzeitig für die Standardaufgabe und die kontrafaktische Inferenzaufgabe zu trainieren. Dies verbessert die Generalisierungsfähigkeit des Modells und ermöglicht die Bearbeitung unterschiedlicher Aufgaben. Die unteren Schichten des Modells dienen zur gemeinsamen Merkmalsextraktion, während für jede Aufgabe separate

Ausgabeschichten definiert und die Verlustfunktionen gemeinsam optimiert werden. (3.2) Kreuzvalidierung:

Mithilfe von K-facher Kreuzvalidierung und verschiedenen Bewertungsmetriken wird die Leistung des Modells bewertet, um die Stabilität und Genauigkeit des

Modells in verschiedenen Aufgaben und Datensätzen sicherzustellen. LU600539 (4) Kontrafaktische Inferenzlogik: (4.1) Kausale Inferenz:

Ein Bayes‘sches Netzwerk mit kausalen Graphen wird verwendet, um kausale

Schlussfolgerungen zu ziehen. Dies analysiert die Auswirkungen verschiedener

Entscheidungen auf die Ergebnisse und bietet eine theoretische Grundlage für kontrafaktische Inferenz. Die bedingten Wahrscheinlichkeitstabellen des Bayes‘schen

Netzwerks beschreiben die Abhängigkeitsbeziehungen zwischen den Variablen und dienen zur Berechnung posteriorer Wahrscheinlichkeiten unter Berücksichtigung vorhandener Evidenz. (4.2) Integration von Entscheidungsbaumregeln:

Mithilfe von Entscheidungsbaumalgorithmen wird eine leicht verständliche und erklärbare Entscheidungslogik erzeugt, die den kontrafaktischen Inferenzprozess steuert und die Interpretierbarkeit der Ergebnisse erhöht. (5) Unsicherheitsbehandlung: (5.1) Wahrscheinlichkeitsinferenz:

Mithilfe von Bayes‘scher Inferenz und Monte-Carlo-Methoden wird

Unsicherheit behandelt und die Vertrauenswiirdigkeit kontrafaktischer

Inferenz-Ergebnisse quantifiziert. Die Bayes‘schen Theoreme werden zur Berechnung posteriorer Wahrscheinlichkeiten eingesetzt, während Monte-Carlo-Methoden zur

Annäherung von Integralen oder Summen durch Stichproben genutzt werden. (5.2) Robustheitsoptimierung:

Mithilfe von Robustheitsoptimierungsalgorithmen wird das Modell trainiert, um die Stabilität und Robustheit des Modells bei Unsicherheit und Rauschen zu verbessern. (6) Domänenübergreifende Anpassung und Transferlernen: (6.1) Merkmalsausrichtung:

Mithilfe der Maximum Mean Discrepancy (MMD) oder adversarialem Training wird die Merkmalsausrichtung durchgeführt, um Domänenunterschiede zu verringern und die Anpassungsfähigkeit des Modells an neue Domänen zu verbessern. MMD misst den Abstand zwischen zwei Verteilungen und minimiert diesen, um die

Merkmalsverteilungen aus verschiedenen Domänen einander anzunähern. (6.2) Transferlernstrategie:

Automatische Auswahl der am besten geeigneten Transferlernstrategie zur

Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne, um die

Genauigkeit der kontrafaktischen Inferenz zu verbessern. (7) Kontextverständnis und kontextuelle Modellierung:

Mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) oder

Computer Vision wird der Kontext erkannt und verstanden, um kontrafaktische

Inferenz mit Kontextinformationen zu unterstützen und die Genauigkeit zu erhöhen,

Kontextmodellierung:

Mithilfe von Recurrent Neural Networks (RNN) oder Graph Neural Networks (GNN) wird der Kontext modelliert, um Abhängigkeitsbeziehungen und dynamische

Veränderungen zwischen den verschiedenen Elementen zu erfassen und so die

Kontextverständniskompetenz des Modells zu verbessern. LUB00539 (8) Optimierung und Verbesserung: (8.1) Erklarbare Modelle:

Mithilfe von SHAP-Werten oder dem LIME-Algorithmus werden erklärbare

Modellausgaben erzeugt, um den Benutzern den Entscheidungsprozess und die

Entscheidungsgrundlage der kontrafaktischen Inferenz verständlich zu machen und die Transparenz des Modells zu erhöhen.

SHAP-Werte basieren auf dem Shapley-Wert aus der Spieltheorie und dienen zur

Zuweisung des Beitrags jedes Merkmals zum Vorhersageergebnis. (8.2) Schnittstelle zur Transparenzsteigerung:

Uber eine visuelle und interaktive Benutzeroberfliche wird eine

Transparenzschnittstelle bereitgestellt, mit der Benutzer die Ergebnisse der kontrafaktischen Inferenz intuitiv anzeigen und überprüfen können, um das Vertrauen in das Modell zu stärken.

Durch die oben beschriebenen Schritte bietet das in der vorliegenden Erfindung vorgeschlagene System und Verfahren zur Bearbeitung von Aufgaben der kiinstlichen

Intelligenz die Vorteile umfassender Funktionalität, Multi-Task-Learning, kontrafaktischer Inferenz, Unsicherheitsbehandlung sowie domänenübergreifendem

Transferlernen. Dadurch können komplexe und dynamische KI-Aufgaben wesentlich effektiver bearbeitet werden.

In der Beschreibung der vorliegenden Patentschrift beziehen sich die Begriffe „ein Ausführungsbeispiel“, „ein Beispiel“, „ein spezifisches Beispiel“ usw. darauf, dass die beschriebenen konkreten Merkmale, Strukturen, Materialien oder

Eigenschaften im Zusammenhang mit diesem Ausführungsbeispiel oder Beispiel in mindestens einem Ausführungsbeispiel oder Beispiel der vorliegenden Erfindung enthalten sind. In dieser Patentschrift ist die schematische Verwendung dieser Begriffe nicht notwendigerweise auf dasselbe Ausführungsbeispiel oder Beispiel bezogen.

Darüber hinaus können die beschriebenen konkreten Merkmale, Strukturen,

Materialien oder Eigenschaften in beliebigen geeigneten Kombinationen in einem oder mehreren Ausführungsbeispielen oder Beispielen kombiniert werden.

Die bevorzugten Ausführungsbeispiele der vorliegenden Erfindung, die oben offengelegt wurden, dienen lediglich zur Erläuterung der vorliegenden Erfindung. Die bevorzugten Ausführungsbeispiele beschreiben nicht alle Details vollständig und beschränken die Erfindung auch nicht auf die beschriebenen konkreten

Ausführungsformen. Es ist offensichtlich, dass auf Grundlage der Inhalte dieser

Beschreibung zahlreiche Modifikationen und Änderungen vorgenommen werden können. Die ausgewählten und beschriebenen Ausführungsbeispiele dienen lediglich dazu, die Prinzipien und die praktische Anwendung der vorliegenden Erfindung besser zu erläutern, sodass Fachleute auf diesem technischen Gebiet die Erfindung vollständig verstehen und nutzen können. Die vorliegende Erfindung ist lediglich durch die Ansprüche sowie deren gesamten Schutzbereich und Aquivalente beschränkt.

Claims

Ansprüche LU600539

1. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz, dadurch gekennzeichnet, dass es ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Inferenzlogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für doméneniibergreifende Anpassung und —Transferlernen, ein Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein Optimierungs- und Verbesserungsmodul umfasst. Das Datenvorverarbeitungsmodul dient zur Erkennung von Datenverzerrungen sowie zur Datenbereinigung und -korrektur. Das Modul zur Generierung kontrafaktischer Beispiele dient zur Szenarienkonstruktion und Musterauswahl. Das Modul zur Modellschulung und -bewertung dient der Durchführung von Multi-Task-Learning und Kreuzvalidierung. Das Modul zur kontrafaktischen Inferenzlogik dient der kausalen Inferenz und der Integration von Entscheidungsbaumregeln. Das Modul zur Unsicherheitsbehandlung dient der Wahrscheinlichkeitsinferenz und der Robustheitsoptimierung. Das Modul für domänenübergreifende Anpassung und Transferlernen dient der Merkmalsausrichtung und der Entwicklung von Transferlernstrategien. Das Kontextmodellierungsmodul dient der Kontexterkennung und der kontextuellen Modellierung. Das Optimierungs- und Verbesserungsmodul dient der Bereitstellung erklärbarer Modelle sowie einer Schnittstelle zur Transparenzsteigerung.

2. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Datenvorverarbeitungsmodul außerdem eine Einheit zur Erkennung von Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur umfasst. Die Einheit zur Erkennung von Datenverzerrungen dient der Identifizierung von Selektionsverzerrungen, Messfehlern oder Annotationsfehlern in den Trainingsdaten. Die Einheit zur Datenbereinigung und -korrektur bereinigt und korrigiert die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen Annotation und Korrektur.

3. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur Generierung kontrafaktischer Beispiele außerdem eine Einheit zur Szenarienkonstruktion und eine Einheit zur Musterauswahl umfasst. Die Einheit zur Szenarienkonstruktion erzeugt mithilfe von Generative Adversarial Networks (GAN) oder Conditional Variational Autoencoders (CVAE) kontrafaktische Szenarien, die im Widerspruch zu bekannten Fakten stehen. Die Einheit zur Musterauswahl validiert und selektiert die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.

4. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch

1, dadurch gekennzeichnet, dass das Modul zur Modellschulung und -bewertung LU600539 außerdem eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungseinheit umfasst. Die Multi-Task-Learning-Einheit trainiert das Modell gleichzeitig im Rahmen eines Multi-Task-Learning-Frameworks sowohl für die Standardaufgabe als auch für die kontrafaktische Inferenzaufgabe. Die Kreuzvalidierungseinheit bewertet die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.

5. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur kontrafaktischen Inferenzlogik außerdem eine Kausalinferenz-Einheit und eine Entscheidungsbaumregel-Integrations-Einheit umfasst. Die Kausalinferenz-Einheit dient der Analyse der Auswirkungen unterschiedlicher Entscheidungen auf die Ergebnisse. Die Entscheidungsbaumregel-Integrations-Einheit generiert mithilfe von Entscheidungsbäumen und Regellernen eine leicht verständliche und interpretierbare Entscheidungslogik.

6. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur Unsicherheitsbehandlung außerdem eine Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Einheit umfasst. Die Wahrscheinlichkeitsinferenz-Einheit dient der Quantifizierung der Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse. Die Robustheitsoptimierungs-Einheit trainiert das Modell mithilfe von Robustheitsoptimierungsalgorithmen.

7. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul für domänenübergreifende Anpassung und Transferlernen außerdem eine Merkmalsausrichtungs-Einheit und eine Transferlernstrategie-Einheit umfasst. Die Merkmalsausrichtungs-Einheit führt die Merkmalsausrichtung mithilfe von adversarialem Training basierend auf maximaler mittlerer Diskrepanz (Maximum Mean Discrepancy, MMD) durch. Die Transferlernstrategie-Einheit dient der Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne.

8. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Kontextmodellierungsmodul außerdem eine Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit umfasst. Die Kontexterkennungseinheit erkennt und versteht die Aufgabenkontexte mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer Vision. Die kontextuelle Modellierungseinheit erfasst die Abhängigkeiten und dynamischen Veränderungen zwischen den verschiedenen Elementen.

9. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Optimierungs- und Verbesserungsmodul außerdem eine Einheit für erklarbare Modelle und eine Einheit zur LUB00539 Transparenzsteigerung umfasst. Die Einheit für erklärbare Modelle erzeugt mithilfe von SHAP-Werten und dem LIME-Algorithmus erklärbare Modellausgaben. Die Einheit zur Transparenzsteigerung dient der Bereitstellung einer Schnittstelle zur Verbesserung der Transparenz.

10. Verfahren zur Bearbeitung von Aufgaben der kiinstlichen Intelligenz, angewendet in einem Verarbeitungssystem fiir Aufgaben der künstlichen Intelligenz nach einem der Anspriiche 1 bis 9, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst:

S1. Erkennung und Korrektur von Datenverzerrungen durch statistische Analysen und maschinelles Lernen sowie Bereinigung und Korrektur fehlerhafter Daten.

S2. Generierung kontrafaktischer Beispiele, Erstellung vielfältiger kontrafaktischer Szenarien mithilfe generativer Modelle und Validierung der Stichhaltigkeit der Beispiele durch ein Expertensystem.

S4. Kontrafaktische Inferenzlogik, Durchführung kausaler Inferenz mithilfe von Kausalgraphenmodellen und Entscheidungsbaumalgorithmen zur Erzeugung einer erklärbaren Entscheidungslogik.

S5. Behandlung von Unsicherheiten durch Bayes'sche Inferenz und Robustheitsoptimierung sowie Quantifizierung der Ergebniszuverlässigkeit.

S6. Reduzierung von Domänenverzerrungen durch Merkmalsausrichtung und Transferlernstrategien, sowie Anpassung des Modells an neue Domänen durch domänenübergreifendes Transferlernen.

S7. Kontextverständnis und kontextuelle Modellierung, Erkennung von Kontexten mittels NLP- oder Computer-Vision-Technologien, sowie Modellierung des Kontexts mittels RNN oder GNN.

S8. Erzeugung erklärbarer Modellausgaben und Bereitstellung einer Schnittstelle zur Transparenzsteigerung.