LU600539B1 - Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz - Google Patents

Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz

Info

Publication number
LU600539B1
LU600539B1 LU600539A LU600539A LU600539B1 LU 600539 B1 LU600539 B1 LU 600539B1 LU 600539 A LU600539 A LU 600539A LU 600539 A LU600539 A LU 600539A LU 600539 B1 LU600539 B1 LU 600539B1
Authority
LU
Luxembourg
Prior art keywords
module
unit
counterfactual
model
inference
Prior art date
Application number
LU600539A
Other languages
English (en)
Inventor
Zhipeng Wang
Tianyu Yu
Luyao Liu
Yan Pan
Zhou Ren
Yongfeng Ni
Hui Li
Roujia TAO
Qiang Suo
Qiwen Cao
Original Assignee
Shanghai Prothentic Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Prothentic Tech Co Ltd filed Critical Shanghai Prothentic Tech Co Ltd
Priority to LU600539A priority Critical patent/LU600539B1/de
Application granted granted Critical
Publication of LU600539B1 publication Critical patent/LU600539B1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

Die vorliegende Erfindung betrifft den technischen Bereich der Verarbeitung von Aufgaben der künstlichen Intelligenz, insbesondere ein Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz. Es umfasst ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Inferenzlogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein Optimierungs- und Verbesserungsmodul.Das Datenvorverarbeitungsmodul dient der Erkennung von Datenverzerrungen sowie der Datenbereinigung und -korrektur.Die vorliegende Erfindung nutzt ein Multi-Task-Learning-Framework zur gleichzeitigen Bearbeitung mehrerer zusammenhängender Aufgaben, wodurch die Generalisierungsfähigkeit und Effizienz des Modells verbessert wird. Darüber hinaus können kontrafaktische Beispiele generiert und kausale Schlussfolgerungen abgeleitet werden, um eine theoretische Grundlage für die Entscheidungsfindung bereitzustellen und die Erklärbarkeit des Modells zu verbessern.Durch den Einsatz von Wahrscheinlichkeitsinferenz- und Robustheitsoptimierungsmethoden wird Unsicherheit effektiv behandelt, wodurch die Stabilität und Zuverlässigkeit des Modells in Umgebungen mit Rauschen und Unsicherheiten erhöht wird. Bild 1

Description

Verfahren und System zur Bearbeitung von Aufgaben der künstlichen LU600539
Intelligenz
Technischer Bereich
Die vorliegende Erfindung betrifft den technischen Bereich der Bearbeitung von
Aufgaben der künstlichen Intelligenz, insbesondere ein Verfahren und System zur
Bearbeitung von Aufgaben der künstlichen Intelligenz.
Technologie im Hintergrund
Künstliche Intelligenz-Aufgaben beziehen sich auf Probleme oder Arbeiten, die mithilfe von KI-Technologien gelöst oder ausgeführt werden müssen. Die
Verarbeitung von KI-Aufgaben bezeichnet den Prozess, bei dem Algorithmen,
Modelle und Rechenressourcen eingesetzt werden, um solche Aufgaben auszuführen.
Dies umfasst die Erfassung und Vorverarbeitung von Daten, die Merkmalsextraktion, das Training von Modellen, die Inferenz sowie die Interpretation und Darstellung der
Ergebnisse. Ziel der Aufgabenverarbeitung ist es, die Aufgaben präzise und effizient zu erledigen, während gleichzeitig die Erklärbarkeit und Robustheit der Modelle sichergestellt wird.
Allerdings beruhen herkömmliche Verfahren zur Verarbeitung von KI-Aufgaben meist auf einzelnen Algorithmen oder Modellen wie Entscheidungsbäumen, Support
Vector Machines oder neuronalen Netzen. Diese zeigen bei bestimmten Datentypen oder Aufgaben zwar gute Ergebnisse, verfügen jedoch oft über eine begrenzte
Generalisierungsfähigkeit und können sich nur schwer an komplexe und dynamische
Umgebungen anpassen. Darüber hinaus wird bei herkömmlichen Methoden der
Erklärbarkeit der Modelle oft wenig Aufmerksamkeit geschenkt, wodurch es für die
Nutzer schwierig wird, die Entscheidungsprozesse der Modelle nachzuvollziehen.
Zudem bestehen Einschränkungen im Umgang mit Unsicherheiten, der domänenübergreifenden Anpassungsfähigkeit und dem Kontextverständnis.
Vor diesem Hintergrund bietet die vorliegende Erfindung ein Verfahren und
System zur Bearbeitung von Aufgaben der künstlichen Intelligenz an, um die oben genannten technischen Probleme zu lösen.
Inhalt der Erfindung
Ziel der vorliegenden Erfindung ist es, ein Verfahren und System zur
Bearbeitung von Aufgaben der künstlichen Intelligenz bereitzustellen, um die in der obigen Hintergrundtechnologie beschriebenen Probleme zu lösen.
Um dieses Ziel zu erreichen, stellt die vorliegende Erfindung die folgende technische Lösung bereit:
Erster Aspekt der vorliegenden Erfindung:
Es wird ein System zur Bearbeitung von Aufgaben der künstlichen Intelligenz bereitgestellt, das ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Schlussfolgerungslogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein
Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein
Optimierungs- und Verbesserungsmodul umfasst.
Das Datenvorverarbeitungsmodul dient der Erkennung von Datenverzerrungen sowie der Datenbereinigung und -korrektur. LU600539
Das Modul zur Generierung kontrafaktischer Beispiele dient der
Szenarienkonstruktion und der Musterauswahl.
Das Modul zur Modellschulung und -bewertung dient dem Multi-Task-Learning und der Kreuzvalidierung.
Das Modul zur kontrafaktischen Schlussfolgerungslogik dient der kausalen
Inferenz und der Integration von Entscheidungsbaumregeln.
Das Modul zur Unsicherheitsbehandlung dient der Wahrscheinlichkeitsinferenz und der Robustheitsoptimierung.
Das Modul für domänenübergreifende Anpassung und Transferlernen dient der
Merkmalsausrichtung und der Entwicklung von Transferlernstrategien.
Das Kontextmodellierungsmodul dient der Kontexterkennung und der kontextuellen Modellierung.
Das Optimierungs- und Verbesserungsmodul dient der Bereitstellung erklärbarer
Modelle sowie einer Schnittstelle zur Erhöhung der Transparenz.
Vorzugsweise umfasst das Datenvorverarbeitungsmodul außerdem eine Einheit zur Erkennung von Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur.
Die Einheit zur Erkennung von Datenverzerrungen dient der Identifizierung von
Selektionsverzerrungen, Messfehlern oder Annotationfehlern in den Trainingsdaten.
Die Einheit zur Datenbereinigung und -korrektur bereinigt und korrigiert die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen
Annotation und Korrektur.
Vorzugsweise umfasst das Modul zur Generierung kontrafaktischer Beispiele außerdem eine Einheit zur Szenarienkonstruktion und eine Einheit zur
Musterauswahl.
Die Einheit zur Szenarienkonstruktion erzeugt kontrafaktische Szenarien mittels generativer adversarialer Netzwerke (GAN) und bedingter variationaler Autoencoder (VAE).
Die Einheit zur Musterauswahl überprüft und selektiert die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.
Vorzugsweise umfasst das Modul zur Modellschulung und -bewertung außerdem eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungs-Einheit.
Die Multi-Task-Learning-Einheit trainiert das Modell gleichzeitig im Rahmen eines Multi-Task-Learning-Frameworks sowohl fiir die Standardaufgabe als auch fiir die kontrafaktische Schlussfolgerungsaufgabe.
Die Kreuzvalidierungs-Einheit bewertet die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.
Vorzugsweise umfasst das Modul zur kontrafaktischen Schlussfolgerungslogik außerdem eine Kausalinferenz-Einheit und eine
Entscheidungsbaumregel-Integrations-Einheit.
Die Kausalinferenz-Einheit analysiert den Einfluss unterschiedlicher
Entscheidungen auf das Ergebnis.
Die Entscheidungsbaumregel-Integrations-Einheit generiert mithilfe von LUB00539
Entscheidungsbäumen und Regellernen eine leicht verständliche und interpretierbare
Entscheidungslogik.
Vorzugsweise umfasst das Modul zur Unsicherheitsbehandlung außerdem eine
Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Finheit.
Die Wahrscheinlichkeitsinferenz-Finheit quantifiziert die Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse.
Die Robustheitsoptimierungs-Finheit trainiert das Modell mithilfe von
Robustheitsoptimierungsalgorithmen.
Vorzugsweise umfasst das Modul für domänenübergreifende Anpassung und
Transferlernen außerdem eine Merkmalsausrichtungs-Einheit und eine
Transferlernstrategie-Finheit.
Die Merkmalsausrichtungs-Einheit führt die Merkmalsausrichtung mittels adversarialer Trainingsverfahren auf Basis der maximalen mittleren Diskrepanz (Maximum Mean Discrepancy, MMD) durch.
Die Transferlernstrategie-Einheit dient der Übertragung von Wissen aus der
Quell-Domäne in die Ziel-Domäne.
Vorzugsweise umfasst das Kontextmodellierungsmodul außerdem eine
Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit.
Die Kontexterkennungseinheit erkennt und versteht die Aufgabenkontexte mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer
Vision.
Die kontextuelle Modellierungseinheit erfasst die Abhängigkeiten und dynamischen Veränderungen zwischen verschiedenen Flementen.
Vorzugsweise umfasst das Optimierungs- und Verbesserungsmodul außerdem eine Einheit für erklärbare Modelle und eine Einheit zur Transparenzsteigerung.
Die Einheit für erklärbare Modelle erzeugt mithilfe von SHAP-Werten und dem
LIME-Algorithmus erklärbare Modellausgaben.
Die Einheit zur Transparenzsteigerung stellt eine Schnittstelle zur Verbesserung der Transparenz bereit.
Basierend auf dem oben beschriebenen System schlägt die vorliegende
Erfindung außerdem ein Verfahren zur Bearbeitung von Aufgaben der künstlichen
Intelligenz vor, das die folgenden Schritte umfasst:
S1. Erkennung und Korrektur von Datenverzerrungen mittels statistischer
Analysen und maschinellen Lernens sowie Bereinigung und Korrektur fehlerhafter
Daten.
S2. Generierung kontrafaktischer Beispiele durch Einsatz von generativen
Modellen zur Erstellung vielfältiger kontrafaktischer Szenarien und Überprüfung der
Stichhaltigkeit der Beispiele mithilfe eines Expertensystems.
S3. Training des Modells im Rahmen eines Multi-Task-Learning-Frameworks sowie Bewertung der Modellleistung mittels K-facher Kreuzvalidierung.
S4. Kontrafaktische Inferenzlogik, bei der kausale Schlussfolgerungen durch
Kausalgraphenmodelle und Entscheidungsbaumalgorithmen abgeleitet werden, um eine erklärbare Entscheidungslogik zu erzeugen.
S5. Behandlung von Unsicherheiten durch Anwendung von Bayes‘ scher Inferenz LU600539 und Robustheitsoptimierung zur Quantifizierung der Ergebniszuverlässigkeit.
S6. Reduzierung von Domänenverzerrungen durch Merkmalsausrichtung und
Transferlernstrategien sowie Anpassung des Modells an neue Domänen mittels domänenübergreifendem Transferlernen.
S7. Durchführung von Kontextverständnis und kontextueller Modellierung,
Erkennung von Kontexten mittels NLP-/CV-Technologien und Modellierung des
Kontexts mithilfe von RNN- oder GNN-Methoden.
S8. Generierung erklärbarer Modellausgaben sowie Bereitstellung einer
Schnittstelle zur Erhöhung der Transparenz.
Verglichen mit dem Stand der Technik bietet die vorliegende Erfindung folgende vorteilhafte Wirkungen:
Durch das Multi-Task-Learning-Framework ist das System in der Lage, mehrere zusammenhängende Aufgaben gleichzeitig zu bearbeiten, wodurch die
Generalisierungsfähigkeit und Effizienz des Modells verbessert wird. Es können kontrafaktische Beispiele generiert und kausale Schlussfolgerungen gezogen werden, um eine theoretische Grundlage für die Entscheidungsfindung zu schaffen und die
Erklärbarkeit des Modells zu erhöhen.Mithilfe von Wahrscheinlichkeitsinferenz- und
Robustheitsoptimierungsmethoden wird Unsicherheit effektiv behandelt, wodurch die
Stabilität und Zuverlässigkeit des Modells in verrauschten oder unsicheren
Umgebungen erhöht wird. Durch Merkmalsausrichtung und Transferlernstrategien können Domänenunterschiede verringert und die Anpassungsfähigkeit des Modells in neuen Domänen verbessert werden.Mit Hilfe von Technologien der natürlichen
Sprachverarbeitung und der Computer Vision werden Kontexte erkannt und verstanden, wodurch kontextbezogene Informationen für die Aufgabenbearbeitung bereitgestellt und die kontextuelle Verständniskompetenz des Modells verbessert wird.Durch die Generierung erklärbarer Modellausgaben und die Bereitstellung einer
Schnittstelle zur Transparenzsteigerung wird das Vertrauen und das Verständnis der
Benutzer gegenüber dem Modell gestärkt.Zusammenfassend bietet das in der vorliegenden Erfindung beschriebene System und Verfahren zur Bearbeitung von
Aufgaben der künstlichen Intelligenz die Vorteile umfassender Funktionalität,
Multi-Task-Learning, kontrafaktischer Inferenz, Unsicherheitsbehandlung sowie domänenübergreifendem Transferlernen. Dadurch können komplexe und dynamische
KI-Aufgaben wesentlich effektiver bewältigt werden.
Beschreibung der beigefügten Zeichnungen
Bild 1 zeigt das Topologiediagramm des Verarbeitungssystems für Aufgaben der künstlichen Intelligenz gemäß der vorliegenden Erfindung.
Bild 2 zeigt das Flussdiagramm des Verfahrens zur Bearbeitung von Aufgaben der künstlichen Intelligenz gemäß der vorliegenden Erfindung.
Detaillierte Beschreibung
Im Folgenden werden die technischen Lösungen der Ausführungsbeispiele der vorliegenden Erfindung klar und vollständig beschrieben. Offensichtlich stellen die beschriebenen Ausführungsbeispiele nur einen Teil der Ausführungsbeispiele der vorliegenden Erfindung dar und nicht sämtliche Ausführungsbeispiele. Auf Grundlage der in der vorliegenden Erfindung beschriebenen Ausführungsbeispiele gehören alle LUB00539 weiteren Ausführungsbeispiele, die von einem Fachmann auf diesem Gebiet ohne erfinderische Tätigkeit erzielt werden können, ebenfalls zum Schutzbereich der vorliegenden Erfindung. 5 Ausführungsbeispiel 1
Bitte beziehen Sie sich auf Bild 1, die vorliegende Erfindung schlägt ein
Verarbeitungssystem für Aufgaben der künstlichen Intelligenz vor. Dieses System umfasst ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Schlussfolgerungslogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein
Kontextmodellierungsmodul zur Kontext- und Situationsverstindnis sowie ein
Optimierungs- und Verbesserungsmodul.
Dabei ist anzumerken, dass das Datenvorverarbeitungsmodul zur Erkennung von
Datenverzerrungen sowie zur Datenbereinigung und -korrektur dient, das Modul zur
Generierung kontrafaktischer Beispiele zur Szenarienkonstruktion und Musterauswahl, das Modul zur Modellschulung und -bewertung zur Durchführung von
Multi-Task-Learning und Kreuzvalidierung, das Modul zur kontrafaktischen
Schlussfolgerungslogik zur ~~ kausalen —Inferenz und Integration von
Entscheidungsbaumregeln, das Modul zur Unsicherheitsbehandlung zur
Wahrscheinlichkeitsinferenz und ~~ Robustheitsoptimierung, das Modul für domänenübergreifende Anpassung und Transferlernen zur Merkmalsausrichtung und
Entwicklung von Transferlernstrategien, das Kontextmodellierungsmodul zur
Kontexterkennung und kontextuellen Modellierung sowie das Optimierungs- und
Verbesserungsmodul zur Bereitstellung erklärbarer Modelle und einer Schnittstelle zur Transparenzsteigerung.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das
Datenvorverarbeitungsmodul zusätzlich eine Einheit zur Erkennung von
Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur umfasst.
Darüber hinaus dient die Einheit zur Erkennung von Datenverzerrungen der
Identifizierung von Selektionsverzerrungen, Messfehlern oder Annotationsfehlern in den Trainingsdaten.
Des Weiteren bereinigt und korrigiert die Einheit zur Datenbereinigung und -korrektur die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen Annotation und Korrektur.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur
Generierung kontrafaktischer Beispiele zusätzlich eine Einheit zur
Szenarienkonstruktion und eine Einheit zur Musterauswahl umfasst.
Darüber hinaus erzeugt die Einheit zur Szenarienkonstruktion mithilfe von
Generative Adversarial Networks (GAN) und Conditional Variational Autoencoders (CVAE) kontrafaktische Szenarien, die den bekannten Fakten widersprechen.
Des Weiteren überprüft und selektiert die Einheit zur Musterauswahl die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur LU600539
Modellschulung und -bewertung zusätzlich eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungseinheit umfasst.
Darüber hinaus trainiert die Multi-Task-Learning-Einheit das Modell gleichzeitig fir die Standardaufgabe und die kontrafaktische Schlussfolgerungsaufgabe im
Rahmen eines Multi-Task-Learning-Frameworks.
Des Weiteren bewertet die Kreuzvalidierungseinheit die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur kontrafaktischen Schlussfolgerungslogik zusätzlich eine Kausalinferenz-Einheit und eine Entscheidungsbaumregel-Integrations-Einheit umfasst.
Darüber hinaus dient die Kausalinferenz-Einheit der Analyse der Auswirkungen unterschiedlicher Entscheidungen auf das Ergebnis.
Des Weiteren generiert die Entscheidungsbaumregel-Integrations-Einheit mithilfe von Entscheidungsbäumen und Regellernen eine Entscheidungslogik, die leicht verständlich und interpretierbar ist.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur
Unsicherheitsbehandlung zusätzlich eine Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Einheit umfasst.
Darüber hinaus dient die Wahrscheinlichkeitsinferenz-Einheit der
Quantifizierung der Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse.
Des Weiteren trainiert die Robustheitsoptimierungs-Einheit das Modell mithilfe von Robustheitsoptimierungsalgorithmen.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul für domänenübergreifende Anpassung und Transferlernen zusätzlich eine
Merkmalsausrichtungs-Einheit und eine Transferlernstrategie-Einheit umfasst.
Darüber hinaus führt die Merkmalsausrichtungs-Einheit die
Merkmalsausrichtung mithilfe von adversarialem Training basierend auf maximaler mittlerer Diskrepanz (Maximum Mean Discrepancy, MMD) durch.
Des Weiteren dient die Transferlernstrategie-Einheit der Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das
Kontextmodellierungsmodul zusätzlich eine Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit umfasst.
Darüber hinaus erkennt und versteht die Kontexterkennungseinheit den
Aufgabenkontext mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer Vision.
Des Weiteren erfasst die kontextuelle Modellierungseinheit die Abhängigkeiten und dynamischen Veränderungen zwischen den verschiedenen Elementen.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das
Optimierungs- und Verbesserungsmodul zusätzlich eine Einheit für erklärbare
Modelle und eine Einheit zur Transparenzsteigerung umfasst.
Darüber hinaus erzeugt die Einheit für erklärbare Modelle mithilfe von
SHAP-Werten und dem LIME-Algorithmus erklärbare Modellausgaben.
Des Weiteren dient die Einheit zur Transparenzsteigerung der Bereitstellung LU600539 einer Schnittstelle zur Verbesserung der Transparenz.
Ausführungsbeispiel 2
Bitte beziehen Sie sich auf Bild 2, in einer praktischen Anwendung schlägt die vorliegende Erfindung basierend auf dem oben beschriebenen System außerdem ein
Verfahren zur Bearbeitung von Aufgaben der künstlichen Intelligenz vor, das im
Einzelnen die folgenden Schritte umfasst: (1) Datenvorverarbeitung: (1.1) Erkennung von Datenverzerrungen:
Mithilfe statistischer Analyse- und maschineller Lernmodelle werden
Ausreißererkennung und Analyse der Datenverteilung durchgeführt, um
Selektionsverzerrungen, Messfehler oder Annotationsfehler in den Trainingsdaten zu identifizieren. Die Ausreißererkennung erfolgt mit der Z-Score- oder IQR-Methode, indem die Datenpunkte mit den statistischen Eigenschaften des gesamten Datensatzes verglichen werden, um Verzerrungen zu erkennen. (1.2) Datenbereinigung und -korrektur:
Mithilfe eines regelbasierten Engines zur automatisierten Annotation und
Korrektur werden die erkannten verzerrten Daten bereinigt und korrigiert. Dabei korrigiert das regelbasierte System automatisch fehlerhafte Annotationen oder ergänzt fehlende Werte gemäß vordefinierten Regeln. (2) Generierung kontrafaktischer Beispiele: (2.1) Szenarienkonstruktion:
Generative Adversarial Networks (GAN) oder Conditional Variational
Autoencoders (CVAE) werden eingesetzt, um kontrafaktische Szenarien zu generieren, die im Widerspruch zu bekannten Fakten stehen. Dies erhöht die Vielfalt der
Trainingsdaten und deckt eine größere Bandbreite an Szenarien ab. Die
Verlustfunktion des CVAE umfasst einen Rekonstruktionsfehler-Term sowie einen
KL-Divergenz-Term, um die Balance zwischen der Vielfalt der generierten Beispiele und deren Ähnlichkeit zu den Originaldaten sicherzustellen. (2.2) Musterauswahl:
Mithilfe eines Konsistenzprüfungsalgorithmus basierend auf einem
Expertensystem werden die generierten kontrafaktischen Beispiele validiert und gefiltert, um deren Plausibilität und Eignung für das weitere Training sicherzustellen. (3) Modelltraining und -bewertung: (3.1) Multi-Task-Learning:
Ein Multi-Task-Learning-Framework wird eingesetzt, um das Modell gleichzeitig für die Standardaufgabe und die kontrafaktische Inferenzaufgabe zu trainieren. Dies verbessert die Generalisierungsfähigkeit des Modells und ermöglicht die Bearbeitung unterschiedlicher Aufgaben. Die unteren Schichten des Modells dienen zur gemeinsamen Merkmalsextraktion, während für jede Aufgabe separate
Ausgabeschichten definiert und die Verlustfunktionen gemeinsam optimiert werden. (3.2) Kreuzvalidierung:
Mithilfe von K-facher Kreuzvalidierung und verschiedenen Bewertungsmetriken wird die Leistung des Modells bewertet, um die Stabilität und Genauigkeit des
Modells in verschiedenen Aufgaben und Datensätzen sicherzustellen. LU600539 (4) Kontrafaktische Inferenzlogik: (4.1) Kausale Inferenz:
Ein Bayes‘sches Netzwerk mit kausalen Graphen wird verwendet, um kausale
Schlussfolgerungen zu ziehen. Dies analysiert die Auswirkungen verschiedener
Entscheidungen auf die Ergebnisse und bietet eine theoretische Grundlage für kontrafaktische Inferenz. Die bedingten Wahrscheinlichkeitstabellen des Bayes‘schen
Netzwerks beschreiben die Abhängigkeitsbeziehungen zwischen den Variablen und dienen zur Berechnung posteriorer Wahrscheinlichkeiten unter Berücksichtigung vorhandener Evidenz. (4.2) Integration von Entscheidungsbaumregeln:
Mithilfe von Entscheidungsbaumalgorithmen wird eine leicht verständliche und erklärbare Entscheidungslogik erzeugt, die den kontrafaktischen Inferenzprozess steuert und die Interpretierbarkeit der Ergebnisse erhöht. (5) Unsicherheitsbehandlung: (5.1) Wahrscheinlichkeitsinferenz:
Mithilfe von Bayes‘scher Inferenz und Monte-Carlo-Methoden wird
Unsicherheit behandelt und die Vertrauenswiirdigkeit kontrafaktischer
Inferenz-Ergebnisse quantifiziert. Die Bayes‘schen Theoreme werden zur Berechnung posteriorer Wahrscheinlichkeiten eingesetzt, während Monte-Carlo-Methoden zur
Annäherung von Integralen oder Summen durch Stichproben genutzt werden. (5.2) Robustheitsoptimierung:
Mithilfe von Robustheitsoptimierungsalgorithmen wird das Modell trainiert, um die Stabilität und Robustheit des Modells bei Unsicherheit und Rauschen zu verbessern. (6) Domänenübergreifende Anpassung und Transferlernen: (6.1) Merkmalsausrichtung:
Mithilfe der Maximum Mean Discrepancy (MMD) oder adversarialem Training wird die Merkmalsausrichtung durchgeführt, um Domänenunterschiede zu verringern und die Anpassungsfähigkeit des Modells an neue Domänen zu verbessern. MMD misst den Abstand zwischen zwei Verteilungen und minimiert diesen, um die
Merkmalsverteilungen aus verschiedenen Domänen einander anzunähern. (6.2) Transferlernstrategie:
Automatische Auswahl der am besten geeigneten Transferlernstrategie zur
Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne, um die
Genauigkeit der kontrafaktischen Inferenz zu verbessern. (7) Kontextverständnis und kontextuelle Modellierung:
Mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) oder
Computer Vision wird der Kontext erkannt und verstanden, um kontrafaktische
Inferenz mit Kontextinformationen zu unterstützen und die Genauigkeit zu erhöhen,
Kontextmodellierung:
Mithilfe von Recurrent Neural Networks (RNN) oder Graph Neural Networks (GNN) wird der Kontext modelliert, um Abhängigkeitsbeziehungen und dynamische
Veränderungen zwischen den verschiedenen Elementen zu erfassen und so die
Kontextverständniskompetenz des Modells zu verbessern. LUB00539 (8) Optimierung und Verbesserung: (8.1) Erklarbare Modelle:
Mithilfe von SHAP-Werten oder dem LIME-Algorithmus werden erklärbare
Modellausgaben erzeugt, um den Benutzern den Entscheidungsprozess und die
Entscheidungsgrundlage der kontrafaktischen Inferenz verständlich zu machen und die Transparenz des Modells zu erhöhen.
SHAP-Werte basieren auf dem Shapley-Wert aus der Spieltheorie und dienen zur
Zuweisung des Beitrags jedes Merkmals zum Vorhersageergebnis. (8.2) Schnittstelle zur Transparenzsteigerung:
Uber eine visuelle und interaktive Benutzeroberfliche wird eine
Transparenzschnittstelle bereitgestellt, mit der Benutzer die Ergebnisse der kontrafaktischen Inferenz intuitiv anzeigen und überprüfen können, um das Vertrauen in das Modell zu stärken.
Durch die oben beschriebenen Schritte bietet das in der vorliegenden Erfindung vorgeschlagene System und Verfahren zur Bearbeitung von Aufgaben der kiinstlichen
Intelligenz die Vorteile umfassender Funktionalität, Multi-Task-Learning, kontrafaktischer Inferenz, Unsicherheitsbehandlung sowie domänenübergreifendem
Transferlernen. Dadurch können komplexe und dynamische KI-Aufgaben wesentlich effektiver bearbeitet werden.
In der Beschreibung der vorliegenden Patentschrift beziehen sich die Begriffe „ein Ausführungsbeispiel“, „ein Beispiel“, „ein spezifisches Beispiel“ usw. darauf, dass die beschriebenen konkreten Merkmale, Strukturen, Materialien oder
Eigenschaften im Zusammenhang mit diesem Ausführungsbeispiel oder Beispiel in mindestens einem Ausführungsbeispiel oder Beispiel der vorliegenden Erfindung enthalten sind. In dieser Patentschrift ist die schematische Verwendung dieser Begriffe nicht notwendigerweise auf dasselbe Ausführungsbeispiel oder Beispiel bezogen.
Darüber hinaus können die beschriebenen konkreten Merkmale, Strukturen,
Materialien oder Eigenschaften in beliebigen geeigneten Kombinationen in einem oder mehreren Ausführungsbeispielen oder Beispielen kombiniert werden.
Die bevorzugten Ausführungsbeispiele der vorliegenden Erfindung, die oben offengelegt wurden, dienen lediglich zur Erläuterung der vorliegenden Erfindung. Die bevorzugten Ausführungsbeispiele beschreiben nicht alle Details vollständig und beschränken die Erfindung auch nicht auf die beschriebenen konkreten
Ausführungsformen. Es ist offensichtlich, dass auf Grundlage der Inhalte dieser
Beschreibung zahlreiche Modifikationen und Änderungen vorgenommen werden können. Die ausgewählten und beschriebenen Ausführungsbeispiele dienen lediglich dazu, die Prinzipien und die praktische Anwendung der vorliegenden Erfindung besser zu erläutern, sodass Fachleute auf diesem technischen Gebiet die Erfindung vollständig verstehen und nutzen können. Die vorliegende Erfindung ist lediglich durch die Ansprüche sowie deren gesamten Schutzbereich und Aquivalente beschränkt.

Claims (10)

Ansprüche LU600539
1. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz, dadurch gekennzeichnet, dass es ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Inferenzlogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für doméneniibergreifende Anpassung und —Transferlernen, ein Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein Optimierungs- und Verbesserungsmodul umfasst. Das Datenvorverarbeitungsmodul dient zur Erkennung von Datenverzerrungen sowie zur Datenbereinigung und -korrektur. Das Modul zur Generierung kontrafaktischer Beispiele dient zur Szenarienkonstruktion und Musterauswahl. Das Modul zur Modellschulung und -bewertung dient der Durchführung von Multi-Task-Learning und Kreuzvalidierung. Das Modul zur kontrafaktischen Inferenzlogik dient der kausalen Inferenz und der Integration von Entscheidungsbaumregeln. Das Modul zur Unsicherheitsbehandlung dient der Wahrscheinlichkeitsinferenz und der Robustheitsoptimierung. Das Modul für domänenübergreifende Anpassung und Transferlernen dient der Merkmalsausrichtung und der Entwicklung von Transferlernstrategien. Das Kontextmodellierungsmodul dient der Kontexterkennung und der kontextuellen Modellierung. Das Optimierungs- und Verbesserungsmodul dient der Bereitstellung erklärbarer Modelle sowie einer Schnittstelle zur Transparenzsteigerung.
2. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Datenvorverarbeitungsmodul außerdem eine Einheit zur Erkennung von Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur umfasst. Die Einheit zur Erkennung von Datenverzerrungen dient der Identifizierung von Selektionsverzerrungen, Messfehlern oder Annotationsfehlern in den Trainingsdaten. Die Einheit zur Datenbereinigung und -korrektur bereinigt und korrigiert die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen Annotation und Korrektur.
3. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur Generierung kontrafaktischer Beispiele außerdem eine Einheit zur Szenarienkonstruktion und eine Einheit zur Musterauswahl umfasst. Die Einheit zur Szenarienkonstruktion erzeugt mithilfe von Generative Adversarial Networks (GAN) oder Conditional Variational Autoencoders (CVAE) kontrafaktische Szenarien, die im Widerspruch zu bekannten Fakten stehen. Die Einheit zur Musterauswahl validiert und selektiert die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.
4. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch
1, dadurch gekennzeichnet, dass das Modul zur Modellschulung und -bewertung LU600539 außerdem eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungseinheit umfasst. Die Multi-Task-Learning-Einheit trainiert das Modell gleichzeitig im Rahmen eines Multi-Task-Learning-Frameworks sowohl für die Standardaufgabe als auch für die kontrafaktische Inferenzaufgabe. Die Kreuzvalidierungseinheit bewertet die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.
5. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur kontrafaktischen Inferenzlogik außerdem eine Kausalinferenz-Einheit und eine Entscheidungsbaumregel-Integrations-Einheit umfasst. Die Kausalinferenz-Einheit dient der Analyse der Auswirkungen unterschiedlicher Entscheidungen auf die Ergebnisse. Die Entscheidungsbaumregel-Integrations-Einheit generiert mithilfe von Entscheidungsbäumen und Regellernen eine leicht verständliche und interpretierbare Entscheidungslogik.
6. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur Unsicherheitsbehandlung außerdem eine Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Einheit umfasst. Die Wahrscheinlichkeitsinferenz-Einheit dient der Quantifizierung der Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse. Die Robustheitsoptimierungs-Einheit trainiert das Modell mithilfe von Robustheitsoptimierungsalgorithmen.
7. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul für domänenübergreifende Anpassung und Transferlernen außerdem eine Merkmalsausrichtungs-Einheit und eine Transferlernstrategie-Einheit umfasst. Die Merkmalsausrichtungs-Einheit führt die Merkmalsausrichtung mithilfe von adversarialem Training basierend auf maximaler mittlerer Diskrepanz (Maximum Mean Discrepancy, MMD) durch. Die Transferlernstrategie-Einheit dient der Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne.
8. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Kontextmodellierungsmodul außerdem eine Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit umfasst. Die Kontexterkennungseinheit erkennt und versteht die Aufgabenkontexte mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer Vision. Die kontextuelle Modellierungseinheit erfasst die Abhängigkeiten und dynamischen Veränderungen zwischen den verschiedenen Elementen.
9. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Optimierungs- und Verbesserungsmodul außerdem eine Einheit für erklarbare Modelle und eine Einheit zur LUB00539 Transparenzsteigerung umfasst. Die Einheit für erklärbare Modelle erzeugt mithilfe von SHAP-Werten und dem LIME-Algorithmus erklärbare Modellausgaben. Die Einheit zur Transparenzsteigerung dient der Bereitstellung einer Schnittstelle zur Verbesserung der Transparenz.
10. Verfahren zur Bearbeitung von Aufgaben der kiinstlichen Intelligenz, angewendet in einem Verarbeitungssystem fiir Aufgaben der künstlichen Intelligenz nach einem der Anspriiche 1 bis 9, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst:
S1. Erkennung und Korrektur von Datenverzerrungen durch statistische Analysen und maschinelles Lernen sowie Bereinigung und Korrektur fehlerhafter Daten.
S2. Generierung kontrafaktischer Beispiele, Erstellung vielfältiger kontrafaktischer Szenarien mithilfe generativer Modelle und Validierung der Stichhaltigkeit der Beispiele durch ein Expertensystem.
S3. Training des Modells im Rahmen eines Multi-Task-Learning-Frameworks sowie Bewertung der Modellleistung mittels K-facher Kreuzvalidierung.
S4. Kontrafaktische Inferenzlogik, Durchführung kausaler Inferenz mithilfe von Kausalgraphenmodellen und Entscheidungsbaumalgorithmen zur Erzeugung einer erklärbaren Entscheidungslogik.
S5. Behandlung von Unsicherheiten durch Bayes'sche Inferenz und Robustheitsoptimierung sowie Quantifizierung der Ergebniszuverlässigkeit.
S6. Reduzierung von Domänenverzerrungen durch Merkmalsausrichtung und Transferlernstrategien, sowie Anpassung des Modells an neue Domänen durch domänenübergreifendes Transferlernen.
S7. Kontextverständnis und kontextuelle Modellierung, Erkennung von Kontexten mittels NLP- oder Computer-Vision-Technologien, sowie Modellierung des Kontexts mittels RNN oder GNN.
S8. Erzeugung erklärbarer Modellausgaben und Bereitstellung einer Schnittstelle zur Transparenzsteigerung.
LU600539A 2025-03-12 2025-03-12 Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz LU600539B1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
LU600539A LU600539B1 (de) 2025-03-12 2025-03-12 Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
LU600539A LU600539B1 (de) 2025-03-12 2025-03-12 Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz

Publications (1)

Publication Number Publication Date
LU600539B1 true LU600539B1 (de) 2025-09-12

Family

ID=96993873

Family Applications (1)

Application Number Title Priority Date Filing Date
LU600539A LU600539B1 (de) 2025-03-12 2025-03-12 Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz

Country Status (1)

Country Link
LU (1) LU600539B1 (de)

Similar Documents

Publication Publication Date Title
DE102018111905A1 (de) Domänenspezifische Sprache zur Erzeugung rekurrenter neuronaler Netzarchitekturen
DE102022203475B4 (de) System zum Erzeugen einer von einem Menschen wahrnehmbaren Erklärungsausgabe für eine von einem Anomalieerkennungsmodul vorhergesagte Anomalie auf hochfrequenten Sensordaten oder davon abgeleiteten Größen eines industriellen Fertigungsprozesses und Verfahren und Computerprogramm zur Überwachung einer auf künstlicher Intelligenz basierenden Anomalieerkennung bei einer End-of-Line Akustikprüfung eines Getriebes
Wu et al. Applications of deep learning for smart water networks
WO2022171788A1 (de) Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten
Beliakov et al. Citation-based journal ranks: the use of fuzzy measures
DE102014223226A1 (de) Diskriminator, Unterscheidungsprogramm und Unterscheidungsverfahren
Dopazo et al. An automatic methodology for the quality enhancement of requirements using genetic algorithms
CN118196567B (zh) 基于大语言模型的数据评价方法、装置、设备及存储介质
CN111125186B (zh) 一种基于调查问卷的数据处理方法及系统
DE112023003516T5 (de) Zero-shot-domänen-generalisierung mit vorwissen
LU600539B1 (de) Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz
Grimmer et al. The unreliability of measures of intercoder reliability, and what to do about it
Singh et al. The Overfitting Dilemma: Exploring Solutions for Robust Classification Performance
Haddad et al. Learning possibilistic networks from data: a survey.
LU601421B1 (de) Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system
Liu et al. An intelligent tool for analysis of imprecise software quality requirements from different perspectives
LU600584B1 (de) Algorithmisches Modellempfehlungsverfahren und -system mit künstlicher Intelligenz
Xu et al. Fuzzy comprehensive evaluation model based on rough set theory
LU601419B1 (de) Verfahren und System zur Bewertung der Programmierfähigkeit von Algorithmen der künstlichen Intelligenz
DE102024135358A1 (de) Visual analytics-framework für die modellvalidierung auf der grundlage von erklärbaren datensegmenten
EP2756361A1 (de) Ansteuerung einer maschine
Oeda et al. Deep Learning-based Source Code Classification and Visualization of Decision Rationales
Tsakonas et al. Deriving models for software project effort estimation by means of genetic programming
Parveen et al. A comprehensive study of knowledge-based system and their advanced fuzzy techniques
DE102023204153A1 (de) Computerimplementiertes Verfahren und Vorrichtung zum Ermitteln mindestens eines Unsicherheitsmaßes

Legal Events

Date Code Title Description
FG Patent granted

Effective date: 20250912