LU600539B1 - Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz - Google Patents
Verfahren und System zur Bearbeitung von Aufgaben der künstlichen IntelligenzInfo
- Publication number
- LU600539B1 LU600539B1 LU600539A LU600539A LU600539B1 LU 600539 B1 LU600539 B1 LU 600539B1 LU 600539 A LU600539 A LU 600539A LU 600539 A LU600539 A LU 600539A LU 600539 B1 LU600539 B1 LU 600539B1
- Authority
- LU
- Luxembourg
- Prior art keywords
- module
- unit
- counterfactual
- model
- inference
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Image Analysis (AREA)
Abstract
Die vorliegende Erfindung betrifft den technischen Bereich der Verarbeitung von Aufgaben der künstlichen Intelligenz, insbesondere ein Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz. Es umfasst ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Inferenzlogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein Optimierungs- und Verbesserungsmodul.Das Datenvorverarbeitungsmodul dient der Erkennung von Datenverzerrungen sowie der Datenbereinigung und -korrektur.Die vorliegende Erfindung nutzt ein Multi-Task-Learning-Framework zur gleichzeitigen Bearbeitung mehrerer zusammenhängender Aufgaben, wodurch die Generalisierungsfähigkeit und Effizienz des Modells verbessert wird. Darüber hinaus können kontrafaktische Beispiele generiert und kausale Schlussfolgerungen abgeleitet werden, um eine theoretische Grundlage für die Entscheidungsfindung bereitzustellen und die Erklärbarkeit des Modells zu verbessern.Durch den Einsatz von Wahrscheinlichkeitsinferenz- und Robustheitsoptimierungsmethoden wird Unsicherheit effektiv behandelt, wodurch die Stabilität und Zuverlässigkeit des Modells in Umgebungen mit Rauschen und Unsicherheiten erhöht wird. Bild 1
Description
Verfahren und System zur Bearbeitung von Aufgaben der künstlichen LU600539
Intelligenz
Technischer Bereich
Die vorliegende Erfindung betrifft den technischen Bereich der Bearbeitung von
Aufgaben der künstlichen Intelligenz, insbesondere ein Verfahren und System zur
Bearbeitung von Aufgaben der künstlichen Intelligenz.
Technologie im Hintergrund
Künstliche Intelligenz-Aufgaben beziehen sich auf Probleme oder Arbeiten, die mithilfe von KI-Technologien gelöst oder ausgeführt werden müssen. Die
Verarbeitung von KI-Aufgaben bezeichnet den Prozess, bei dem Algorithmen,
Modelle und Rechenressourcen eingesetzt werden, um solche Aufgaben auszuführen.
Dies umfasst die Erfassung und Vorverarbeitung von Daten, die Merkmalsextraktion, das Training von Modellen, die Inferenz sowie die Interpretation und Darstellung der
Ergebnisse. Ziel der Aufgabenverarbeitung ist es, die Aufgaben präzise und effizient zu erledigen, während gleichzeitig die Erklärbarkeit und Robustheit der Modelle sichergestellt wird.
Allerdings beruhen herkömmliche Verfahren zur Verarbeitung von KI-Aufgaben meist auf einzelnen Algorithmen oder Modellen wie Entscheidungsbäumen, Support
Vector Machines oder neuronalen Netzen. Diese zeigen bei bestimmten Datentypen oder Aufgaben zwar gute Ergebnisse, verfügen jedoch oft über eine begrenzte
Generalisierungsfähigkeit und können sich nur schwer an komplexe und dynamische
Umgebungen anpassen. Darüber hinaus wird bei herkömmlichen Methoden der
Erklärbarkeit der Modelle oft wenig Aufmerksamkeit geschenkt, wodurch es für die
Nutzer schwierig wird, die Entscheidungsprozesse der Modelle nachzuvollziehen.
Zudem bestehen Einschränkungen im Umgang mit Unsicherheiten, der domänenübergreifenden Anpassungsfähigkeit und dem Kontextverständnis.
Vor diesem Hintergrund bietet die vorliegende Erfindung ein Verfahren und
System zur Bearbeitung von Aufgaben der künstlichen Intelligenz an, um die oben genannten technischen Probleme zu lösen.
Inhalt der Erfindung
Ziel der vorliegenden Erfindung ist es, ein Verfahren und System zur
Bearbeitung von Aufgaben der künstlichen Intelligenz bereitzustellen, um die in der obigen Hintergrundtechnologie beschriebenen Probleme zu lösen.
Um dieses Ziel zu erreichen, stellt die vorliegende Erfindung die folgende technische Lösung bereit:
Erster Aspekt der vorliegenden Erfindung:
Es wird ein System zur Bearbeitung von Aufgaben der künstlichen Intelligenz bereitgestellt, das ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Schlussfolgerungslogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein
Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein
Optimierungs- und Verbesserungsmodul umfasst.
Das Datenvorverarbeitungsmodul dient der Erkennung von Datenverzerrungen sowie der Datenbereinigung und -korrektur. LU600539
Das Modul zur Generierung kontrafaktischer Beispiele dient der
Szenarienkonstruktion und der Musterauswahl.
Das Modul zur Modellschulung und -bewertung dient dem Multi-Task-Learning und der Kreuzvalidierung.
Das Modul zur kontrafaktischen Schlussfolgerungslogik dient der kausalen
Inferenz und der Integration von Entscheidungsbaumregeln.
Das Modul zur Unsicherheitsbehandlung dient der Wahrscheinlichkeitsinferenz und der Robustheitsoptimierung.
Das Modul für domänenübergreifende Anpassung und Transferlernen dient der
Merkmalsausrichtung und der Entwicklung von Transferlernstrategien.
Das Kontextmodellierungsmodul dient der Kontexterkennung und der kontextuellen Modellierung.
Das Optimierungs- und Verbesserungsmodul dient der Bereitstellung erklärbarer
Modelle sowie einer Schnittstelle zur Erhöhung der Transparenz.
Vorzugsweise umfasst das Datenvorverarbeitungsmodul außerdem eine Einheit zur Erkennung von Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur.
Die Einheit zur Erkennung von Datenverzerrungen dient der Identifizierung von
Selektionsverzerrungen, Messfehlern oder Annotationfehlern in den Trainingsdaten.
Die Einheit zur Datenbereinigung und -korrektur bereinigt und korrigiert die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen
Annotation und Korrektur.
Vorzugsweise umfasst das Modul zur Generierung kontrafaktischer Beispiele außerdem eine Einheit zur Szenarienkonstruktion und eine Einheit zur
Musterauswahl.
Die Einheit zur Szenarienkonstruktion erzeugt kontrafaktische Szenarien mittels generativer adversarialer Netzwerke (GAN) und bedingter variationaler Autoencoder (VAE).
Die Einheit zur Musterauswahl überprüft und selektiert die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.
Vorzugsweise umfasst das Modul zur Modellschulung und -bewertung außerdem eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungs-Einheit.
Die Multi-Task-Learning-Einheit trainiert das Modell gleichzeitig im Rahmen eines Multi-Task-Learning-Frameworks sowohl fiir die Standardaufgabe als auch fiir die kontrafaktische Schlussfolgerungsaufgabe.
Die Kreuzvalidierungs-Einheit bewertet die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.
Vorzugsweise umfasst das Modul zur kontrafaktischen Schlussfolgerungslogik außerdem eine Kausalinferenz-Einheit und eine
Entscheidungsbaumregel-Integrations-Einheit.
Die Kausalinferenz-Einheit analysiert den Einfluss unterschiedlicher
Entscheidungen auf das Ergebnis.
Die Entscheidungsbaumregel-Integrations-Einheit generiert mithilfe von LUB00539
Entscheidungsbäumen und Regellernen eine leicht verständliche und interpretierbare
Entscheidungslogik.
Vorzugsweise umfasst das Modul zur Unsicherheitsbehandlung außerdem eine
Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Finheit.
Die Wahrscheinlichkeitsinferenz-Finheit quantifiziert die Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse.
Die Robustheitsoptimierungs-Finheit trainiert das Modell mithilfe von
Robustheitsoptimierungsalgorithmen.
Vorzugsweise umfasst das Modul für domänenübergreifende Anpassung und
Transferlernen außerdem eine Merkmalsausrichtungs-Einheit und eine
Transferlernstrategie-Finheit.
Die Merkmalsausrichtungs-Einheit führt die Merkmalsausrichtung mittels adversarialer Trainingsverfahren auf Basis der maximalen mittleren Diskrepanz (Maximum Mean Discrepancy, MMD) durch.
Die Transferlernstrategie-Einheit dient der Übertragung von Wissen aus der
Quell-Domäne in die Ziel-Domäne.
Vorzugsweise umfasst das Kontextmodellierungsmodul außerdem eine
Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit.
Die Kontexterkennungseinheit erkennt und versteht die Aufgabenkontexte mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer
Vision.
Die kontextuelle Modellierungseinheit erfasst die Abhängigkeiten und dynamischen Veränderungen zwischen verschiedenen Flementen.
Vorzugsweise umfasst das Optimierungs- und Verbesserungsmodul außerdem eine Einheit für erklärbare Modelle und eine Einheit zur Transparenzsteigerung.
Die Einheit für erklärbare Modelle erzeugt mithilfe von SHAP-Werten und dem
LIME-Algorithmus erklärbare Modellausgaben.
Die Einheit zur Transparenzsteigerung stellt eine Schnittstelle zur Verbesserung der Transparenz bereit.
Basierend auf dem oben beschriebenen System schlägt die vorliegende
Erfindung außerdem ein Verfahren zur Bearbeitung von Aufgaben der künstlichen
Intelligenz vor, das die folgenden Schritte umfasst:
S1. Erkennung und Korrektur von Datenverzerrungen mittels statistischer
Analysen und maschinellen Lernens sowie Bereinigung und Korrektur fehlerhafter
Daten.
S2. Generierung kontrafaktischer Beispiele durch Einsatz von generativen
Modellen zur Erstellung vielfältiger kontrafaktischer Szenarien und Überprüfung der
Stichhaltigkeit der Beispiele mithilfe eines Expertensystems.
S3. Training des Modells im Rahmen eines Multi-Task-Learning-Frameworks sowie Bewertung der Modellleistung mittels K-facher Kreuzvalidierung.
S4. Kontrafaktische Inferenzlogik, bei der kausale Schlussfolgerungen durch
Kausalgraphenmodelle und Entscheidungsbaumalgorithmen abgeleitet werden, um eine erklärbare Entscheidungslogik zu erzeugen.
S5. Behandlung von Unsicherheiten durch Anwendung von Bayes‘ scher Inferenz LU600539 und Robustheitsoptimierung zur Quantifizierung der Ergebniszuverlässigkeit.
S6. Reduzierung von Domänenverzerrungen durch Merkmalsausrichtung und
Transferlernstrategien sowie Anpassung des Modells an neue Domänen mittels domänenübergreifendem Transferlernen.
S7. Durchführung von Kontextverständnis und kontextueller Modellierung,
Erkennung von Kontexten mittels NLP-/CV-Technologien und Modellierung des
Kontexts mithilfe von RNN- oder GNN-Methoden.
S8. Generierung erklärbarer Modellausgaben sowie Bereitstellung einer
Schnittstelle zur Erhöhung der Transparenz.
Verglichen mit dem Stand der Technik bietet die vorliegende Erfindung folgende vorteilhafte Wirkungen:
Durch das Multi-Task-Learning-Framework ist das System in der Lage, mehrere zusammenhängende Aufgaben gleichzeitig zu bearbeiten, wodurch die
Generalisierungsfähigkeit und Effizienz des Modells verbessert wird. Es können kontrafaktische Beispiele generiert und kausale Schlussfolgerungen gezogen werden, um eine theoretische Grundlage für die Entscheidungsfindung zu schaffen und die
Erklärbarkeit des Modells zu erhöhen.Mithilfe von Wahrscheinlichkeitsinferenz- und
Robustheitsoptimierungsmethoden wird Unsicherheit effektiv behandelt, wodurch die
Stabilität und Zuverlässigkeit des Modells in verrauschten oder unsicheren
Umgebungen erhöht wird. Durch Merkmalsausrichtung und Transferlernstrategien können Domänenunterschiede verringert und die Anpassungsfähigkeit des Modells in neuen Domänen verbessert werden.Mit Hilfe von Technologien der natürlichen
Sprachverarbeitung und der Computer Vision werden Kontexte erkannt und verstanden, wodurch kontextbezogene Informationen für die Aufgabenbearbeitung bereitgestellt und die kontextuelle Verständniskompetenz des Modells verbessert wird.Durch die Generierung erklärbarer Modellausgaben und die Bereitstellung einer
Schnittstelle zur Transparenzsteigerung wird das Vertrauen und das Verständnis der
Benutzer gegenüber dem Modell gestärkt.Zusammenfassend bietet das in der vorliegenden Erfindung beschriebene System und Verfahren zur Bearbeitung von
Aufgaben der künstlichen Intelligenz die Vorteile umfassender Funktionalität,
Multi-Task-Learning, kontrafaktischer Inferenz, Unsicherheitsbehandlung sowie domänenübergreifendem Transferlernen. Dadurch können komplexe und dynamische
KI-Aufgaben wesentlich effektiver bewältigt werden.
Beschreibung der beigefügten Zeichnungen
Bild 1 zeigt das Topologiediagramm des Verarbeitungssystems für Aufgaben der künstlichen Intelligenz gemäß der vorliegenden Erfindung.
Bild 2 zeigt das Flussdiagramm des Verfahrens zur Bearbeitung von Aufgaben der künstlichen Intelligenz gemäß der vorliegenden Erfindung.
Detaillierte Beschreibung
Im Folgenden werden die technischen Lösungen der Ausführungsbeispiele der vorliegenden Erfindung klar und vollständig beschrieben. Offensichtlich stellen die beschriebenen Ausführungsbeispiele nur einen Teil der Ausführungsbeispiele der vorliegenden Erfindung dar und nicht sämtliche Ausführungsbeispiele. Auf Grundlage der in der vorliegenden Erfindung beschriebenen Ausführungsbeispiele gehören alle LUB00539 weiteren Ausführungsbeispiele, die von einem Fachmann auf diesem Gebiet ohne erfinderische Tätigkeit erzielt werden können, ebenfalls zum Schutzbereich der vorliegenden Erfindung. 5 Ausführungsbeispiel 1
Bitte beziehen Sie sich auf Bild 1, die vorliegende Erfindung schlägt ein
Verarbeitungssystem für Aufgaben der künstlichen Intelligenz vor. Dieses System umfasst ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Schlussfolgerungslogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für domänenübergreifende Anpassung und Transferlernen, ein
Kontextmodellierungsmodul zur Kontext- und Situationsverstindnis sowie ein
Optimierungs- und Verbesserungsmodul.
Dabei ist anzumerken, dass das Datenvorverarbeitungsmodul zur Erkennung von
Datenverzerrungen sowie zur Datenbereinigung und -korrektur dient, das Modul zur
Generierung kontrafaktischer Beispiele zur Szenarienkonstruktion und Musterauswahl, das Modul zur Modellschulung und -bewertung zur Durchführung von
Multi-Task-Learning und Kreuzvalidierung, das Modul zur kontrafaktischen
Schlussfolgerungslogik zur ~~ kausalen —Inferenz und Integration von
Entscheidungsbaumregeln, das Modul zur Unsicherheitsbehandlung zur
Wahrscheinlichkeitsinferenz und ~~ Robustheitsoptimierung, das Modul für domänenübergreifende Anpassung und Transferlernen zur Merkmalsausrichtung und
Entwicklung von Transferlernstrategien, das Kontextmodellierungsmodul zur
Kontexterkennung und kontextuellen Modellierung sowie das Optimierungs- und
Verbesserungsmodul zur Bereitstellung erklärbarer Modelle und einer Schnittstelle zur Transparenzsteigerung.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das
Datenvorverarbeitungsmodul zusätzlich eine Einheit zur Erkennung von
Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur umfasst.
Darüber hinaus dient die Einheit zur Erkennung von Datenverzerrungen der
Identifizierung von Selektionsverzerrungen, Messfehlern oder Annotationsfehlern in den Trainingsdaten.
Des Weiteren bereinigt und korrigiert die Einheit zur Datenbereinigung und -korrektur die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen Annotation und Korrektur.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur
Generierung kontrafaktischer Beispiele zusätzlich eine Einheit zur
Szenarienkonstruktion und eine Einheit zur Musterauswahl umfasst.
Darüber hinaus erzeugt die Einheit zur Szenarienkonstruktion mithilfe von
Generative Adversarial Networks (GAN) und Conditional Variational Autoencoders (CVAE) kontrafaktische Szenarien, die den bekannten Fakten widersprechen.
Des Weiteren überprüft und selektiert die Einheit zur Musterauswahl die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur LU600539
Modellschulung und -bewertung zusätzlich eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungseinheit umfasst.
Darüber hinaus trainiert die Multi-Task-Learning-Einheit das Modell gleichzeitig fir die Standardaufgabe und die kontrafaktische Schlussfolgerungsaufgabe im
Rahmen eines Multi-Task-Learning-Frameworks.
Des Weiteren bewertet die Kreuzvalidierungseinheit die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur kontrafaktischen Schlussfolgerungslogik zusätzlich eine Kausalinferenz-Einheit und eine Entscheidungsbaumregel-Integrations-Einheit umfasst.
Darüber hinaus dient die Kausalinferenz-Einheit der Analyse der Auswirkungen unterschiedlicher Entscheidungen auf das Ergebnis.
Des Weiteren generiert die Entscheidungsbaumregel-Integrations-Einheit mithilfe von Entscheidungsbäumen und Regellernen eine Entscheidungslogik, die leicht verständlich und interpretierbar ist.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul zur
Unsicherheitsbehandlung zusätzlich eine Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Einheit umfasst.
Darüber hinaus dient die Wahrscheinlichkeitsinferenz-Einheit der
Quantifizierung der Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse.
Des Weiteren trainiert die Robustheitsoptimierungs-Einheit das Modell mithilfe von Robustheitsoptimierungsalgorithmen.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das Modul für domänenübergreifende Anpassung und Transferlernen zusätzlich eine
Merkmalsausrichtungs-Einheit und eine Transferlernstrategie-Einheit umfasst.
Darüber hinaus führt die Merkmalsausrichtungs-Einheit die
Merkmalsausrichtung mithilfe von adversarialem Training basierend auf maximaler mittlerer Diskrepanz (Maximum Mean Discrepancy, MMD) durch.
Des Weiteren dient die Transferlernstrategie-Einheit der Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das
Kontextmodellierungsmodul zusätzlich eine Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit umfasst.
Darüber hinaus erkennt und versteht die Kontexterkennungseinheit den
Aufgabenkontext mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer Vision.
Des Weiteren erfasst die kontextuelle Modellierungseinheit die Abhängigkeiten und dynamischen Veränderungen zwischen den verschiedenen Elementen.
In diesem Ausführungsbeispiel ist außerdem zu erläutern, dass das
Optimierungs- und Verbesserungsmodul zusätzlich eine Einheit für erklärbare
Modelle und eine Einheit zur Transparenzsteigerung umfasst.
Darüber hinaus erzeugt die Einheit für erklärbare Modelle mithilfe von
SHAP-Werten und dem LIME-Algorithmus erklärbare Modellausgaben.
Des Weiteren dient die Einheit zur Transparenzsteigerung der Bereitstellung LU600539 einer Schnittstelle zur Verbesserung der Transparenz.
Ausführungsbeispiel 2
Bitte beziehen Sie sich auf Bild 2, in einer praktischen Anwendung schlägt die vorliegende Erfindung basierend auf dem oben beschriebenen System außerdem ein
Verfahren zur Bearbeitung von Aufgaben der künstlichen Intelligenz vor, das im
Einzelnen die folgenden Schritte umfasst: (1) Datenvorverarbeitung: (1.1) Erkennung von Datenverzerrungen:
Mithilfe statistischer Analyse- und maschineller Lernmodelle werden
Ausreißererkennung und Analyse der Datenverteilung durchgeführt, um
Selektionsverzerrungen, Messfehler oder Annotationsfehler in den Trainingsdaten zu identifizieren. Die Ausreißererkennung erfolgt mit der Z-Score- oder IQR-Methode, indem die Datenpunkte mit den statistischen Eigenschaften des gesamten Datensatzes verglichen werden, um Verzerrungen zu erkennen. (1.2) Datenbereinigung und -korrektur:
Mithilfe eines regelbasierten Engines zur automatisierten Annotation und
Korrektur werden die erkannten verzerrten Daten bereinigt und korrigiert. Dabei korrigiert das regelbasierte System automatisch fehlerhafte Annotationen oder ergänzt fehlende Werte gemäß vordefinierten Regeln. (2) Generierung kontrafaktischer Beispiele: (2.1) Szenarienkonstruktion:
Generative Adversarial Networks (GAN) oder Conditional Variational
Autoencoders (CVAE) werden eingesetzt, um kontrafaktische Szenarien zu generieren, die im Widerspruch zu bekannten Fakten stehen. Dies erhöht die Vielfalt der
Trainingsdaten und deckt eine größere Bandbreite an Szenarien ab. Die
Verlustfunktion des CVAE umfasst einen Rekonstruktionsfehler-Term sowie einen
KL-Divergenz-Term, um die Balance zwischen der Vielfalt der generierten Beispiele und deren Ähnlichkeit zu den Originaldaten sicherzustellen. (2.2) Musterauswahl:
Mithilfe eines Konsistenzprüfungsalgorithmus basierend auf einem
Expertensystem werden die generierten kontrafaktischen Beispiele validiert und gefiltert, um deren Plausibilität und Eignung für das weitere Training sicherzustellen. (3) Modelltraining und -bewertung: (3.1) Multi-Task-Learning:
Ein Multi-Task-Learning-Framework wird eingesetzt, um das Modell gleichzeitig für die Standardaufgabe und die kontrafaktische Inferenzaufgabe zu trainieren. Dies verbessert die Generalisierungsfähigkeit des Modells und ermöglicht die Bearbeitung unterschiedlicher Aufgaben. Die unteren Schichten des Modells dienen zur gemeinsamen Merkmalsextraktion, während für jede Aufgabe separate
Ausgabeschichten definiert und die Verlustfunktionen gemeinsam optimiert werden. (3.2) Kreuzvalidierung:
Mithilfe von K-facher Kreuzvalidierung und verschiedenen Bewertungsmetriken wird die Leistung des Modells bewertet, um die Stabilität und Genauigkeit des
Modells in verschiedenen Aufgaben und Datensätzen sicherzustellen. LU600539 (4) Kontrafaktische Inferenzlogik: (4.1) Kausale Inferenz:
Ein Bayes‘sches Netzwerk mit kausalen Graphen wird verwendet, um kausale
Schlussfolgerungen zu ziehen. Dies analysiert die Auswirkungen verschiedener
Entscheidungen auf die Ergebnisse und bietet eine theoretische Grundlage für kontrafaktische Inferenz. Die bedingten Wahrscheinlichkeitstabellen des Bayes‘schen
Netzwerks beschreiben die Abhängigkeitsbeziehungen zwischen den Variablen und dienen zur Berechnung posteriorer Wahrscheinlichkeiten unter Berücksichtigung vorhandener Evidenz. (4.2) Integration von Entscheidungsbaumregeln:
Mithilfe von Entscheidungsbaumalgorithmen wird eine leicht verständliche und erklärbare Entscheidungslogik erzeugt, die den kontrafaktischen Inferenzprozess steuert und die Interpretierbarkeit der Ergebnisse erhöht. (5) Unsicherheitsbehandlung: (5.1) Wahrscheinlichkeitsinferenz:
Mithilfe von Bayes‘scher Inferenz und Monte-Carlo-Methoden wird
Unsicherheit behandelt und die Vertrauenswiirdigkeit kontrafaktischer
Inferenz-Ergebnisse quantifiziert. Die Bayes‘schen Theoreme werden zur Berechnung posteriorer Wahrscheinlichkeiten eingesetzt, während Monte-Carlo-Methoden zur
Annäherung von Integralen oder Summen durch Stichproben genutzt werden. (5.2) Robustheitsoptimierung:
Mithilfe von Robustheitsoptimierungsalgorithmen wird das Modell trainiert, um die Stabilität und Robustheit des Modells bei Unsicherheit und Rauschen zu verbessern. (6) Domänenübergreifende Anpassung und Transferlernen: (6.1) Merkmalsausrichtung:
Mithilfe der Maximum Mean Discrepancy (MMD) oder adversarialem Training wird die Merkmalsausrichtung durchgeführt, um Domänenunterschiede zu verringern und die Anpassungsfähigkeit des Modells an neue Domänen zu verbessern. MMD misst den Abstand zwischen zwei Verteilungen und minimiert diesen, um die
Merkmalsverteilungen aus verschiedenen Domänen einander anzunähern. (6.2) Transferlernstrategie:
Automatische Auswahl der am besten geeigneten Transferlernstrategie zur
Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne, um die
Genauigkeit der kontrafaktischen Inferenz zu verbessern. (7) Kontextverständnis und kontextuelle Modellierung:
Mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) oder
Computer Vision wird der Kontext erkannt und verstanden, um kontrafaktische
Inferenz mit Kontextinformationen zu unterstützen und die Genauigkeit zu erhöhen,
Kontextmodellierung:
Mithilfe von Recurrent Neural Networks (RNN) oder Graph Neural Networks (GNN) wird der Kontext modelliert, um Abhängigkeitsbeziehungen und dynamische
Veränderungen zwischen den verschiedenen Elementen zu erfassen und so die
Kontextverständniskompetenz des Modells zu verbessern. LUB00539 (8) Optimierung und Verbesserung: (8.1) Erklarbare Modelle:
Mithilfe von SHAP-Werten oder dem LIME-Algorithmus werden erklärbare
Modellausgaben erzeugt, um den Benutzern den Entscheidungsprozess und die
Entscheidungsgrundlage der kontrafaktischen Inferenz verständlich zu machen und die Transparenz des Modells zu erhöhen.
SHAP-Werte basieren auf dem Shapley-Wert aus der Spieltheorie und dienen zur
Zuweisung des Beitrags jedes Merkmals zum Vorhersageergebnis. (8.2) Schnittstelle zur Transparenzsteigerung:
Uber eine visuelle und interaktive Benutzeroberfliche wird eine
Transparenzschnittstelle bereitgestellt, mit der Benutzer die Ergebnisse der kontrafaktischen Inferenz intuitiv anzeigen und überprüfen können, um das Vertrauen in das Modell zu stärken.
Durch die oben beschriebenen Schritte bietet das in der vorliegenden Erfindung vorgeschlagene System und Verfahren zur Bearbeitung von Aufgaben der kiinstlichen
Intelligenz die Vorteile umfassender Funktionalität, Multi-Task-Learning, kontrafaktischer Inferenz, Unsicherheitsbehandlung sowie domänenübergreifendem
Transferlernen. Dadurch können komplexe und dynamische KI-Aufgaben wesentlich effektiver bearbeitet werden.
In der Beschreibung der vorliegenden Patentschrift beziehen sich die Begriffe „ein Ausführungsbeispiel“, „ein Beispiel“, „ein spezifisches Beispiel“ usw. darauf, dass die beschriebenen konkreten Merkmale, Strukturen, Materialien oder
Eigenschaften im Zusammenhang mit diesem Ausführungsbeispiel oder Beispiel in mindestens einem Ausführungsbeispiel oder Beispiel der vorliegenden Erfindung enthalten sind. In dieser Patentschrift ist die schematische Verwendung dieser Begriffe nicht notwendigerweise auf dasselbe Ausführungsbeispiel oder Beispiel bezogen.
Darüber hinaus können die beschriebenen konkreten Merkmale, Strukturen,
Materialien oder Eigenschaften in beliebigen geeigneten Kombinationen in einem oder mehreren Ausführungsbeispielen oder Beispielen kombiniert werden.
Die bevorzugten Ausführungsbeispiele der vorliegenden Erfindung, die oben offengelegt wurden, dienen lediglich zur Erläuterung der vorliegenden Erfindung. Die bevorzugten Ausführungsbeispiele beschreiben nicht alle Details vollständig und beschränken die Erfindung auch nicht auf die beschriebenen konkreten
Ausführungsformen. Es ist offensichtlich, dass auf Grundlage der Inhalte dieser
Beschreibung zahlreiche Modifikationen und Änderungen vorgenommen werden können. Die ausgewählten und beschriebenen Ausführungsbeispiele dienen lediglich dazu, die Prinzipien und die praktische Anwendung der vorliegenden Erfindung besser zu erläutern, sodass Fachleute auf diesem technischen Gebiet die Erfindung vollständig verstehen und nutzen können. Die vorliegende Erfindung ist lediglich durch die Ansprüche sowie deren gesamten Schutzbereich und Aquivalente beschränkt.
Claims (10)
1. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz, dadurch gekennzeichnet, dass es ein Datenvorverarbeitungsmodul, ein Modul zur Generierung kontrafaktischer Beispiele, ein Modul zur Modellschulung und -bewertung, ein Modul zur kontrafaktischen Inferenzlogik, ein Modul zur Unsicherheitsbehandlung, ein Modul für doméneniibergreifende Anpassung und —Transferlernen, ein Kontextmodellierungsmodul zur Kontext- und Situationsverständnis sowie ein Optimierungs- und Verbesserungsmodul umfasst. Das Datenvorverarbeitungsmodul dient zur Erkennung von Datenverzerrungen sowie zur Datenbereinigung und -korrektur. Das Modul zur Generierung kontrafaktischer Beispiele dient zur Szenarienkonstruktion und Musterauswahl. Das Modul zur Modellschulung und -bewertung dient der Durchführung von Multi-Task-Learning und Kreuzvalidierung. Das Modul zur kontrafaktischen Inferenzlogik dient der kausalen Inferenz und der Integration von Entscheidungsbaumregeln. Das Modul zur Unsicherheitsbehandlung dient der Wahrscheinlichkeitsinferenz und der Robustheitsoptimierung. Das Modul für domänenübergreifende Anpassung und Transferlernen dient der Merkmalsausrichtung und der Entwicklung von Transferlernstrategien. Das Kontextmodellierungsmodul dient der Kontexterkennung und der kontextuellen Modellierung. Das Optimierungs- und Verbesserungsmodul dient der Bereitstellung erklärbarer Modelle sowie einer Schnittstelle zur Transparenzsteigerung.
2. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Datenvorverarbeitungsmodul außerdem eine Einheit zur Erkennung von Datenverzerrungen und eine Einheit zur Datenbereinigung und -korrektur umfasst. Die Einheit zur Erkennung von Datenverzerrungen dient der Identifizierung von Selektionsverzerrungen, Messfehlern oder Annotationsfehlern in den Trainingsdaten. Die Einheit zur Datenbereinigung und -korrektur bereinigt und korrigiert die erkannten verzerrten Daten mithilfe eines regelbasierten Engines zur automatischen Annotation und Korrektur.
3. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur Generierung kontrafaktischer Beispiele außerdem eine Einheit zur Szenarienkonstruktion und eine Einheit zur Musterauswahl umfasst. Die Einheit zur Szenarienkonstruktion erzeugt mithilfe von Generative Adversarial Networks (GAN) oder Conditional Variational Autoencoders (CVAE) kontrafaktische Szenarien, die im Widerspruch zu bekannten Fakten stehen. Die Einheit zur Musterauswahl validiert und selektiert die generierten kontrafaktischen Beispiele mithilfe eines Konsistenzprüfungsverfahrens basierend auf einem Expertensystem.
4. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch
1, dadurch gekennzeichnet, dass das Modul zur Modellschulung und -bewertung LU600539 außerdem eine Multi-Task-Learning-Einheit und eine Kreuzvalidierungseinheit umfasst. Die Multi-Task-Learning-Einheit trainiert das Modell gleichzeitig im Rahmen eines Multi-Task-Learning-Frameworks sowohl für die Standardaufgabe als auch für die kontrafaktische Inferenzaufgabe. Die Kreuzvalidierungseinheit bewertet die Modellleistung anhand verschiedener Bewertungsmetriken mittels K-facher Kreuzvalidierung.
5. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur kontrafaktischen Inferenzlogik außerdem eine Kausalinferenz-Einheit und eine Entscheidungsbaumregel-Integrations-Einheit umfasst. Die Kausalinferenz-Einheit dient der Analyse der Auswirkungen unterschiedlicher Entscheidungen auf die Ergebnisse. Die Entscheidungsbaumregel-Integrations-Einheit generiert mithilfe von Entscheidungsbäumen und Regellernen eine leicht verständliche und interpretierbare Entscheidungslogik.
6. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul zur Unsicherheitsbehandlung außerdem eine Wahrscheinlichkeitsinferenz-Einheit und eine Robustheitsoptimierungs-Einheit umfasst. Die Wahrscheinlichkeitsinferenz-Einheit dient der Quantifizierung der Vertrauenswürdigkeit der kontrafaktischen Inferenz-Ergebnisse. Die Robustheitsoptimierungs-Einheit trainiert das Modell mithilfe von Robustheitsoptimierungsalgorithmen.
7. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Modul für domänenübergreifende Anpassung und Transferlernen außerdem eine Merkmalsausrichtungs-Einheit und eine Transferlernstrategie-Einheit umfasst. Die Merkmalsausrichtungs-Einheit führt die Merkmalsausrichtung mithilfe von adversarialem Training basierend auf maximaler mittlerer Diskrepanz (Maximum Mean Discrepancy, MMD) durch. Die Transferlernstrategie-Einheit dient der Übertragung von Wissen aus der Quell-Domäne in die Ziel-Domäne.
8. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Kontextmodellierungsmodul außerdem eine Kontexterkennungseinheit und eine kontextuelle Modellierungseinheit umfasst. Die Kontexterkennungseinheit erkennt und versteht die Aufgabenkontexte mithilfe von Technologien der natürlichen Sprachverarbeitung (NLP) und Computer Vision. Die kontextuelle Modellierungseinheit erfasst die Abhängigkeiten und dynamischen Veränderungen zwischen den verschiedenen Elementen.
9. Verarbeitungssystem für Aufgaben der künstlichen Intelligenz nach Anspruch 1, dadurch gekennzeichnet, dass das Optimierungs- und Verbesserungsmodul außerdem eine Einheit für erklarbare Modelle und eine Einheit zur LUB00539 Transparenzsteigerung umfasst. Die Einheit für erklärbare Modelle erzeugt mithilfe von SHAP-Werten und dem LIME-Algorithmus erklärbare Modellausgaben. Die Einheit zur Transparenzsteigerung dient der Bereitstellung einer Schnittstelle zur Verbesserung der Transparenz.
10. Verfahren zur Bearbeitung von Aufgaben der kiinstlichen Intelligenz, angewendet in einem Verarbeitungssystem fiir Aufgaben der künstlichen Intelligenz nach einem der Anspriiche 1 bis 9, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst:
S1. Erkennung und Korrektur von Datenverzerrungen durch statistische Analysen und maschinelles Lernen sowie Bereinigung und Korrektur fehlerhafter Daten.
S2. Generierung kontrafaktischer Beispiele, Erstellung vielfältiger kontrafaktischer Szenarien mithilfe generativer Modelle und Validierung der Stichhaltigkeit der Beispiele durch ein Expertensystem.
S3. Training des Modells im Rahmen eines Multi-Task-Learning-Frameworks sowie Bewertung der Modellleistung mittels K-facher Kreuzvalidierung.
S4. Kontrafaktische Inferenzlogik, Durchführung kausaler Inferenz mithilfe von Kausalgraphenmodellen und Entscheidungsbaumalgorithmen zur Erzeugung einer erklärbaren Entscheidungslogik.
S5. Behandlung von Unsicherheiten durch Bayes'sche Inferenz und Robustheitsoptimierung sowie Quantifizierung der Ergebniszuverlässigkeit.
S6. Reduzierung von Domänenverzerrungen durch Merkmalsausrichtung und Transferlernstrategien, sowie Anpassung des Modells an neue Domänen durch domänenübergreifendes Transferlernen.
S7. Kontextverständnis und kontextuelle Modellierung, Erkennung von Kontexten mittels NLP- oder Computer-Vision-Technologien, sowie Modellierung des Kontexts mittels RNN oder GNN.
S8. Erzeugung erklärbarer Modellausgaben und Bereitstellung einer Schnittstelle zur Transparenzsteigerung.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| LU600539A LU600539B1 (de) | 2025-03-12 | 2025-03-12 | Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| LU600539A LU600539B1 (de) | 2025-03-12 | 2025-03-12 | Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| LU600539B1 true LU600539B1 (de) | 2025-09-12 |
Family
ID=96993873
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| LU600539A LU600539B1 (de) | 2025-03-12 | 2025-03-12 | Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz |
Country Status (1)
| Country | Link |
|---|---|
| LU (1) | LU600539B1 (de) |
-
2025
- 2025-03-12 LU LU600539A patent/LU600539B1/de active IP Right Grant
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE102018111905A1 (de) | Domänenspezifische Sprache zur Erzeugung rekurrenter neuronaler Netzarchitekturen | |
| DE102022203475B4 (de) | System zum Erzeugen einer von einem Menschen wahrnehmbaren Erklärungsausgabe für eine von einem Anomalieerkennungsmodul vorhergesagte Anomalie auf hochfrequenten Sensordaten oder davon abgeleiteten Größen eines industriellen Fertigungsprozesses und Verfahren und Computerprogramm zur Überwachung einer auf künstlicher Intelligenz basierenden Anomalieerkennung bei einer End-of-Line Akustikprüfung eines Getriebes | |
| Wu et al. | Applications of deep learning for smart water networks | |
| WO2022171788A1 (de) | Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten | |
| Beliakov et al. | Citation-based journal ranks: the use of fuzzy measures | |
| DE102014223226A1 (de) | Diskriminator, Unterscheidungsprogramm und Unterscheidungsverfahren | |
| Dopazo et al. | An automatic methodology for the quality enhancement of requirements using genetic algorithms | |
| CN118196567B (zh) | 基于大语言模型的数据评价方法、装置、设备及存储介质 | |
| CN111125186B (zh) | 一种基于调查问卷的数据处理方法及系统 | |
| DE112023003516T5 (de) | Zero-shot-domänen-generalisierung mit vorwissen | |
| LU600539B1 (de) | Verfahren und System zur Bearbeitung von Aufgaben der künstlichen Intelligenz | |
| Grimmer et al. | The unreliability of measures of intercoder reliability, and what to do about it | |
| Singh et al. | The Overfitting Dilemma: Exploring Solutions for Robust Classification Performance | |
| Haddad et al. | Learning possibilistic networks from data: a survey. | |
| LU601421B1 (de) | Ein auf Algorithmen der künstlichen Intelligenz basierendes Dateninteraktionsverfahren und -system | |
| Liu et al. | An intelligent tool for analysis of imprecise software quality requirements from different perspectives | |
| LU600584B1 (de) | Algorithmisches Modellempfehlungsverfahren und -system mit künstlicher Intelligenz | |
| Xu et al. | Fuzzy comprehensive evaluation model based on rough set theory | |
| LU601419B1 (de) | Verfahren und System zur Bewertung der Programmierfähigkeit von Algorithmen der künstlichen Intelligenz | |
| DE102024135358A1 (de) | Visual analytics-framework für die modellvalidierung auf der grundlage von erklärbaren datensegmenten | |
| EP2756361A1 (de) | Ansteuerung einer maschine | |
| Oeda et al. | Deep Learning-based Source Code Classification and Visualization of Decision Rationales | |
| Tsakonas et al. | Deriving models for software project effort estimation by means of genetic programming | |
| Parveen et al. | A comprehensive study of knowledge-based system and their advanced fuzzy techniques | |
| DE102023204153A1 (de) | Computerimplementiertes Verfahren und Vorrichtung zum Ermitteln mindestens eines Unsicherheitsmaßes |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FG | Patent granted |
Effective date: 20250912 |