AT528486A2 - Verfahren zum trainieren eines maschinellen lernmodells, um automatisch die emotionale färbung, die ausdrücken/wortformen in einem mehrere wörter enthaltenden text eigen ist, und ihre intensität zu erkennen, sowie verfahren und system für ein solches erkennen - Google Patents

Verfahren zum trainieren eines maschinellen lernmodells, um automatisch die emotionale färbung, die ausdrücken/wortformen in einem mehrere wörter enthaltenden text eigen ist, und ihre intensität zu erkennen, sowie verfahren und system für ein solches erkennen

Info

Publication number
AT528486A2
AT528486A2 ATA95012/2025A AT950122025A AT528486A2 AT 528486 A2 AT528486 A2 AT 528486A2 AT 950122025 A AT950122025 A AT 950122025A AT 528486 A2 AT528486 A2 AT 528486A2
Authority
AT
Austria
Prior art keywords
word
database
text
words
rules
Prior art date
Application number
ATA95012/2025A
Other languages
English (en)
Inventor
Mykolaivna Babich Oksana
Viktorivna Zamaruieva Iryna
Original Assignee
Mykolaivna Babich Oksana
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mykolaivna Babich Oksana filed Critical Mykolaivna Babich Oksana
Publication of AT528486A2 publication Critical patent/AT528486A2/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Machine Translation (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken in einem Text mit mehreren Wörtern eigen ist, sowie deren Intensität zu erkennen, wobei das Verfahren Folgendes beinhaltet: - Erstellen einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; - Erstellen einer Datenbank emotional gefärbter Wörter oder Wortkombinationen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; - Erstellen einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern oder Wortkombinationen in einem Satz; - Erstellen einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen; - Erstellen eines Trainingsdatensatzes unter Verwendung der erstellten Datenbanken; - Trainieren eines Modells unter Verwendung des erstellten Trainingsdatensatzes, um ein trainiertes maschinelles Lernmodell zu erhalten.

Description

x bes AT 528 486 A2 2026-01-15
Ss N
Beschreibung
VERFAHREN ZUM TRAINIEREN EINES MASCHINELLEN LERNMODELLS, UM AUTOMATISCH DIE EMOTIONALE FÄRBUNG, DIE AUSDRÜCKEN/WORTFORMEN IN EINEM MEHRERE WÖRTER ENTHALTENDEN TEXT EIGEN IST, UND IHRE INTENSITÄT ZU ERKENNEN, SOWIE VERFAHREN UND SYSTEM FÜR EIN SOLCHES ERKENNEN
[0001] Die Erfindung betrifft das Gebiet der analytischen Überprüfung von Texten, insbesondere ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken in einem Text mit mehreren Wörtern eigen ist, und deren Intensität zu erkennen, sowie ein Verfahren für ein solches Erkennen, und es kann beispielsweise dazu verwendet werden, die emotionale Färbung von Nachrichten in den Medien und die Intensität der emotionalen Wirkung auf die Zielgruppe zu bewerten.
[0002] Derzeit gibt es mehrere Verfahren zur Analyse der emotionalen Färbung eines Textes.
[0003] Ein Verfahren zur Erkennung von Aggression und „Cybermobbing“ in sozialen Netzwerken wurde von Forschern wie Aditya Malte und Pratik Ratadiya durch die Untersuchung von Schlüsselwörtern und Wortkombinationen erforscht. Unter Verwendung der bidirektionalen Transformer-Architektur BERT untersuchten sie Facebook-Texte in zwei Sprachen: Englisch und Hindi (Acheampong, FA, Wenyu, C, Nunoo-Mensah, H. (2020). Text-Based Emotion Detection: Advances, Challenges, and Opportunities. Engineering Reports; 2:e12189. [Online]. Verfügbar: https://doi.org/10. 1002/eng2.12189 (letzter Zugriff am 23. September 2021)) [1].
[0004] Die Erkennung von Emotionen anhand von Emojis im Text wurde von den Forschern Chen und LeCompte vorgeschlagen. Sie verwendeten das Keyword-Erkennungsverfahren, die Support Vector Machine und die multinomiale Naive-Bayes-Methode, wodurch eine Klassifizierung der Emotionen in Traurigkeit, Wut, Angst, Vergnügen, Überraschung, Dankbarkeit und Liebe erzielt wurde. Dieser Ansatz verbesserte die Erkennungsfähigkeiten.
[0005] Die automatische Datenerkennung in einem mehrsprachigen Text wurde in der Studie [1] von Jian et al. beschrieben. Die vorgeschlagene Struktur verwendet das Verfahren der natürlichen Sprachverarbeitung (NLP), um ausgewählte Wörter auf der Grundlage von Ekman's Konzept (der Emotionsmodelle) zu klassifizieren, indem zunächst das SVM-Verfahren (Support Vector Machine) und anschließend NB (Naive Bayes) verwendet werden.
[0006] In [1] wird die Entwicklung eines automatischen Emotionsklassifikators für die Untersuchung des Twitter-Netzwerks beschrieben, bei dem Tweets anhand von drei Textkorpora von Emotionen analysiert werden, wobei zunächst Charakteristika aus diesen Datenbanken einzeln extrahiert und anschließend mithilfe des WordNet-Wörterbuchs in den Datenbanken Synonyme für Wörter, die Emotionen bezeichnen, generiert werden. Das Modell wurde unter Verwendung des SVM-Klassifikators trainiert, und die Emotionen wurden unter einer der sechs Kategorien des Ekman-Modells gruppiert.
[0007] Das Emotex-Modell wurde entwickelt, um das soziale Netzwerk Twitter zu analysieren, insbesondere um Stimmungen der Zielgruppe richtig einzuschätzen (Hasan, M., Elke, A., Rundensteiner, E.Agu. (2014). EMOTEX: Detecting Emotions in Twitter Messages. [Online]. Verfügbar: https://web.cs.wpi.edu/-emmanuel/publications/PDFs/C30.pdf (letzter Zugriff am 23 September 2021))[2], was es ermöglicht, Emotionen in einem Text mithilfe des lehrergestützten Verfahrens und Emotionswörterbüchern zu erkennen. Der Ansatz beinhaltet zwei Verfahren zur Durchführung von Klassifizierungsaufgaben mit und ohne Verteilung lexikalischer Elemente im Internet. Das Emotex-Modell basiert auf Texten aus dem sozialen Netzwerk Twitter mit gekennzeichneten Emotionen und SVM-, NB-Klassifikatoren und dem Entscheidungsbaum. Die Daten werden vorverarbeitet und entsprechend den Vektoren in Strukturen unterteilt, aus denen als Ergebnis Trainingssätze (Datensätze) für ein Klassifizierungsmodell erstellt werden. Bei der Arbeit mit Twitter werden für die Echtzeitklassifizierung von Tweets im Internet Datensätze und Verarbeitungsprozesse verwendet, die offline verfügbar sind. Das Modell hat eine einfache Struktur und beschreibt eine Vielzahl von emotionalen Zuständen, die mit 28 Hauptwörtern bezeichnet werden. Es ist mit dem Circumplex-Modell kompatibel, wobei die gefundenen Emotionen auf ei-
x bes AT 528 486 A2 2026-01-15
Ss N
ner zweidimensionalen Skala verteilt sind, auf der sie nach den Eigenschaften „zufrieden” — „unzufrieden” und dem Grad der Aktivität bewertet werden: „zufrieden aktiv” — „zufrieden inaktiv” und „unzufrieden aktiv” — „unzufrieden inaktiv”.
[0008] Die Analyse bestehender Ansätze zeigt, dass es an geeigneten Analyseapparaten mangelt, die verschiedene Fälle der Verwendung von Wortformen berücksichtigen, die die emotionale Färbung des Textes beeinflussen, dass die Auswahl an Emotionen und emotionalen Zuständen, die mit den verfügbaren Instrumenten erkannt werden können, zu begrenzt ist und dass es keinen Mechanismus zur Analyse der Wechselwirkung von Wortformen gibt, die die emotionale Färbung beeinflussen.
[0009] Zusätzlich fehlt allen aufgeführten Ansätzen eine sorgfältige Bewertung der emotionalen Eigenschaften des Textes. Dies wird insbesondere auf die Bewertung der Charakteristika der in den Medien behandelten Nachrichten angewendet, die die öffentliche Meinung prägen und entsprechende Konsequenzen nach sich ziehen. Die vorhandenen Instrumente sind nicht in der Lage, eine Vielzahl von Emotionen zu erkennen, die in der modernen Forschung auf dem Gebiet der Psychologie untersucht werden und als wichtige Eigenschaft des Menschen gelten. Außerdem lassen sich mit den aufgeführten Modellen Emotionen wie Humor und Ironie als Ableitung ihrer Ausprägung nicht definieren.
[0010] Somit besteht die Aufgabe der beanspruchten Erfindung darin, Folgendes zu entwickeln: ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, sowie deren Intensität zu erkennen, ein Verfahren zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, und deren Intensität, sowie ein System, das das Verfahren implementiert, wodurch die Erzielung eines technischen Effekts sichergestellt würde, der in der Fähigkeit besteht, die emotionale Färbung des Textes und deren Intensität sorgfältig zu bewerten, insbesondere um den Grad der Empathie des Textes zu messen.
[0011] Die Aufgabe wird durch die Entwicklung eines Verfahrens zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, und deren Intensität zu erkennen gelöst, das Folgendes beinhaltet:
[0012] Erstellen einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist;
[0013] Erstellen einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist;
[0014] Erstellen einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz;
[0015] Erstellen einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Anderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen;
[0016] Erstellen eines Trainingsdatensatzes unter Verwendung der erstellten Datenbanken;
[0017] Trainieren eines Modells unter Verwendung des erstellten Trainingsdatensatzes, um ein trainiertes maschinelles Lernmodell zu erhalten.
[0018] Zusätzlich wird die Aufgabe durch die Entwicklung eines Verfahrens zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität gelöst, das Folgendes beinhaltet:
[0019] Empfangen eines Textes und Aufteilen in Sätze;
[0020] Analysieren des Textes unter Verwendung eines maschinellen Lernmodells mit der Kennzeichnung seiner emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten;
Ss Ss
Ss N
Sr ‚hes AT 528 486 A2 2026-01-15
[0021] wobei das maschinelle Lernmodell unter Verwendung eines Trainingsdatensatzes trainiert wird, der unter Verwendung der folgenden Datenbanken erstellt wurde: einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; einer Datenbank der Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen;
[0022] Analysieren des nach dem Durchführen des vorherigen Schritts erhaltenen Textes unter Verwendung der Regeln der syntaktischen Unterordnung mit der Erkennung von Sprachkonstrukten/Wortformen innerhalb des Textes und der Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen;
[0023] Visualisieren der Analyseergebnisse.
[0024] Die Aufgabe wird auch durch die Entwicklung eines Systems zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität gelöst, wobei das System Folgendes beinhaltet:
[0025] mindestens einen Prozessor,
[0026] mindestens ein maschinenlesbares Medium, das mit dem mindestens einen Prozessor kommunikativ verbunden ist, und
[0027] Programmanweisungen zum Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität, die auf dem mindestens einen maschinenlesbaren Medium gespeichert sind und von dem mindestens einen Prozessor ausgeführt werden, wobei die Programmanweisungen Folgendes beinhalten Programmanweisungen zum Empfangen eines Textes und Aufteilen in Sätze;
[0028] ein maschinelles Lernmodell, das unter Verwendung eines Trainingsdatensatzes trainiert wurde, der unter Verwendung von folgenden Datenbanken erstellt wurde: einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; einer Datenbank der Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen;
[0029] Programmanweisungen zum Analysieren des Textes unter Verwendung des maschinellen Lernmodells mit der Kennzeichnung seiner emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten;
[0030] Programmanweisungen zum Analysieren des nach dem Durchführen des vorherigen Schritts erhaltenen Textes unter Verwendung der Regeln der syntaktischen Unterordnung mit der Erkennung von Sprachkonstrukten/Wortformen innerhalb des Textes und der Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen;
[0031] Programmanweisungen zum Visualisieren der Analyseergebnisse.
[0032] Die Erstellung der vorstehend aufgeführten Datenbanken mit der Aufgabe des anschließBenden Trainings eines maschinellen Lernmodells, die eine Datenbank, in die eine Vielzahl von Emotionen eingegeben werden kann, insbesondere solche, die in der modernen Forschung auf dem Gebiet der Psychologie untersucht werden und als wichtige Eigenschaft eines Menschen gelten; eine Datenbank mit Wörtern/Wortkombinationen/Wortformen, denen jeweils eine zugehörige Emotion und ihr Gewichtungskoeffizient für die Intensität zugewiesen sind; sowie eine Datenbank mit logischen und semantischen Regeln (LSR), die die Interaktion von Wörtern/Wortkombinationen/Wortformen innerhalb eines Satzes bestimmen, um ein geeignetes Ergebnis zu
x bes AT 528 486 A2 2026-01-15
Ss N
erhalten, beinhalten, ermöglicht es, die emotionale Färbung eines Textes korrekt und genauer zu bestimmen.
[0033] Das Verfahren und System gemäß den Ansprüchen „verarbeiten“ einen Text im Wesentlichen mit einem maschinellen Lernmodell, einschließlich der Verwendung von LSR, das, wie vorstehend erwähnt, die Interaktion von Wörtern/Wortkombinationen/Wortformen innerhalb eines Satzes bestimmt, um geeignete Ergebnisse zu erhalten, und im nächsten Schritt den Text unter Verwendung der Regeln der syntaktischen Unterordnung (RSS) analysiert, die die syntaktische Struktur des Satzes und die Eigenheiten der Interaktion berücksichtigen und die Kohärenz zwischen seinen Bestandteilen sicherstellen.
[0034] Somit ermöglicht die Fähigkeit, eine Vielzahl von Emotionen für die Klassifizierung von Wörtern/Wortkombinationen/Wortformen, die Eigenheiten der Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz und die Eigenheiten der Interaktion sowie die Sicherstellung der Kohärenz zwischen seinen Mitgliedern zu bestimmen, einen technischen Effekt zu erzielen, der in einer sorgfältigen Bewertung der emotionalen Färbung eines Textes und seiner Intensität besteht.
[0035] Bevorzugt werden die Analyseergebnisse durch Kennzeichnen der emotional gefärbten Wörter/Wortkombinationen/Wortformen und/oder durch Erstellen eines Diagramms und/oder durch Erstellen einer Darstellung visualisiert.
[0036] Die emotional gefärbten Wörter/Wortkombinationen/Wortformen innerhalb des verarbeiteten Textes werden mit einer geeigneten Farbe gekennzeichnet, die einer bestimmten Emotion entspricht.
[0037] Das Diagramm kann die Verteilung des emotionalen Charakters des Textes und die Dynamik der emotionalen Färbung darstellen.
[0038] In dem Diagramm können die Farben das Verhältnis der im Text erkannten Emotionen anzeigen, die in den emotional gefärbten Wortformen enthalten sind.
[0039] Hauptsächlich werden im Schritt der Textanalyse unter Verwendung des maschinellen Lernmodells zusätzlich eine Datenbank emotional gefärbter Wörtern/Wortkombinationen/Wortformen, eine Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes, und eine Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz verwendet.
[0040] Außerdem werden zusätzlich, hauptsächlich im Schritt der Textanalyse unter Verwendung der Regeln der syntaktischen Unterordnung, eine Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist; und eine Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkung auf die Änderung der emotionalen Färbung eines Satzes verwendet.
[0041] Daher wird die Textanalyse bevorzugt sowohl unter Verwendung eines maschinellen Lernmodells durchgeführt, das unter Verwendung eines mit den oben aufgeführten Datenbanken erstellten Trainingsdatensatzes trainiert wurde, als auch direkt unter Verwendung dieser Datenbanken.
[0042] Zusätzlich wird bei den Schritten der Analyse eine digitale Codierung verwendet, für die nachstehend ein Beispiel gegeben wird. Selbstverständlich kann diese Codierung modifiziert werden, ohne vom Sinn der Erfindung abzuweichen.
[0043] Die Erfindungen können im Rahmen eines globalen Systems, das mit Texten arbeitet, umgesetzt werden.
[0044] Ein Beispiel für ein solches globales System wird anhand der folgenden Zeichnungen im Detail erläutert:
x bes AT 528 486 A2 2026-01-15
Ss N
[0045] Fig. 1 ist ein Blockschema einer ersten Anwendung eines globalen Systems, das mit Texten arbeitet und ein System zur automatischen Erkennung der emotionalen Färbung gemäß der beanspruchten Erfindung beinhaltet;
[0046] Fig. 2 ist ein Blockschema einer zweiten Anwendung eines globalen Systems, das mit Texten arbeitet.
[0047] Das globale System, in dem das beanspruchte System verwendet werden kann, reiht Texte (z. B. Nachrichten) nach ihrer emotionalen Färbung und ihrem Thema. Es besteht aus zwei Anwendungen, die unabhängig voneinander arbeiten.
[0048] Fig. 1 ist ein Blockschema der Funktionsweise einer ersten Anwendung eines globalen Systems, das eine ständige Nachrichtensuche, -sammlung (Herunterladen ihrer Texte), Bestimmung der emotionalen Färbung und des Themas sowie das Speichern von Informationen bereitstellt.
[0049] Es durchsucht bestimmte Websites und lädt Nachrichten für einen bestimmten Zeitraum herunter. Nachrichtentexte werden nach folgendem Schema heruntergeladen: Abrufen 1 einer Liste von Nachrichtenlinks aus RSS-Kanälen, Abrufen 2 von Nachrichtentexten aus den Links, Klassifizieren 3 der Texte nach emotionaler Färbung und Klassifizieren 4 der Texte nach Thema, Bestimmen 5 der Wichtigkeit der Nachrichten anhand der emotionalen Färbung und des Themas, Speichern 6 des Ergebnisses in einer Datenbank.
[0050] Fig. 2 ist ein Blockschema der Funktionsweise einer zweiten Anwendung eines globalen Systems, das Nachrichtenverarbeitung durchführt. Es basiert auf einer Client-Server-Architektur (ein Client 7, ein Server 8, eine Datenbank 9) und als Ergebnis seines Betriebs werden die heruntergeladenen und gespeicherten Nachrichten, sortiert nach dem Indikator der emotionalen Färbung, angezeigt.
[0051] Die zweite Anwendung funktioniert nach folgendem Schema: Ein Client 7 fordert Artikel von einem Server 8 an, woraufhin der Server 8 Informationen zu den Artikeln von einer Datenbank 9 anfordert. Die Datenbank 9 stellt dem Server 8 Informationen zu den Artikeln bereit, und dieser wiederum stellt dem Client 7 statistische Daten und die wichtigsten Nachrichten bereit.
[0052] Nachfolgend wird eine der am meisten bevorzugten Ausführungsformen der beanspruchten Erfindung detailliert beschrieben.
[0053] 1) Eine Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist wie folgt erstellt.
[0054] Zunächst wird eine Liste von Emotionen erstellt, die auf der Grundlage von Daten aus dem Gebiet der Psychologieforschung im Voraus zusammengestellt wurde und mit einem Zahlen- und Buchstabencode versehen ist, wovon nachstehend ein Beispiel in Tabelle 1 gegeben ist. Die Aufgabe des Codes wird im Folgenden näher erläutert.
[0055] Tabelle 1 — Liste der Emotionen Numerischer Bezeichnung der Emotion/des emotionalen Zustands Buchstabencode
Code der der Emotion Emotion 1 Aggression A 2 Antipathie B 3 Apathie C 4 Sicherheit D 5 Ekel E 6 Verzweiflung F 7 Gefühl von Unsicherheit, Unwissenheit G (enthält mangelndes Selbstvertrauen) 8 Gefühl von Respekt H 9 Selbstvertrauen |
10 Stolz J 11 Bereitschaft, geduldig zu sein K 12 Freundlichkeit L 13 Vertrauen M 14 Verärgerung N 15 Euphorie oO 16 Mitleid P 17 Entsetzen Q 18 Zufriedenheit R 19 Neid S 20 Gelassenheit T 21 Überraschung U 22 Böswilligkeit V 23 Vernachlässigung W 24 Ironie X 25 Moralische Zufriedenheit Y 26 Moralsteigerung Z 27 Hoffnung ZA 28 Vergnügen AA 29 Wachsamkeit AB 30 Inspiration AC 31 Misstrauen AD 32 Unzufriedenheit AE 33 Hass AF 34 Empörung AG 35 Depression AH 36 Freude Al 37 Irritation AJ 38 Enttäuschung AK 39 Sarkasmus AL 40 Sympathie AM 41 Mut (ein Gefühl von Mut) AN 42 Scham AO 43 Mitgefühl AP 44 Ruhe AQ 45 Angst AR 46 Trauer AS 47 Anerkennung AT 48 Ängstlichkeit, Besorgnis AU 49 Bedauern über etwas AV
[0056] Als nächstes wird mindestens eine Gruppe 1 von Experten zusammengestellt, um den Gewichtungskoeffizienten (k) für die Intensität für jede Emotion aus der Liste zu erhalten. Jeder der Experten erhält eine Liste mit den Bezeichnungen der Emotionen, Tabellen zur Bewertung der Charakteristika dieser Emotionen mit einer geeigneten Liste von Charakteristika und bipolare Skalen zur Bewertung der Charakteristika nach dem semantischen Differentialverfahren. Die Bewertung erfolgt auf der Grundlage von EPA-Faktoren (Evaluation, Potency, Activity, die für Evaluation, Stärke und Aktivität stehen). Durch die Definition numerischer Indikatoren anhand verschiedener Faktoren und Skalen lässt sich auch die Überzeugungskraft des Textes ermitteln. Je näher die Indikatoren an den Polen der Skalen liegen, desto größer ist die Wirkung der ausgewählten Faktoren auf die Zielgruppe.
[0057] Nachdem die Experten gemäß des vorgegebenen Beispiels bewertet haben, wird die end-
7118
x bes AT 528 486 A2 2026-01-15
Ss N
gültige Bewertung jeder Emotion berechnet, indem der gewichtete Durchschnitt auf der Grundlage der Ergebnisse der Berechnung der von den Experten der Gruppe 1 in einem bestimmten Schritt für jede Emotion abgegebenen Charakteristikabewertungen berechnet wird. Die erhaltenen Werte sind die Werte der Gewichtungskoeffizienten k für die Intensität der relevanten Emotionen. In Tabelle 2 unten sind sie in der 5. Spalte „Gewichtungskoeffizient k” eingetragen und nach ihrem Betrag von |1]| bis |8| gruppiert.
[0058] Tabelle 2 — Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist
Positionsnr. | Numerischer Bezeichnung der Buchstabencode GewichtungsCode der Emotion der Emotion koeffizient Emotion k 1 44* Ruhe AQ 1 2 46* Trauer AS -1 3 3* Apathie C -1 4 4* Gefühl von Sicherheit D 1 5 13* Vertrauen M 1 6 7* Gefühl von Unsicher- ©) -2 heit 7 31* Misstrauen AD -2 8 35* Depression AH -2 9 20* Gelassenheit T 2 10 9* Selbstvertrauen | 2 11 43* Mitgefühl AP -3 12 2* Antipathie B -3 13 49* Bedauern (über etwas) AV -3 14 37* Irritation AJ -3 15 14* Verärgerung N -3 16 23* Vernachlässigung W -3 (einschließlich Nichtbeachtung) 17 11 Bereitschaft, geduldig K 3 Zu sein 18 8* Gefühl von Respekt H 3 19 29* Wachsamkeit AB -4 20 32* Unzufriedenheit AE -4 21 19* Neid S -4 22 18* Zufriedenheit R 4 23 12* Freundlichkeit L 4 24 40* Sympathie AM 4 25 16* Mitleid P -5 26 24* Ironie X -5 27 22* Böswilligkeit V -5 28 21* Überraschung U 5 29 47* Anerkennung AT 5 30 38* Enttäuschung AK -5 31 39* Sarkasmus AL -6 32 42* Scham AO -6 33 10* Stolz J 6 34 41* Mut AN 6 35 48* Ängstlichkeit AU -6 36 27* Hoffnung ZA 6 37 25* Moralische Y 6 Zufriedenheit
38 1* Aggression A -7 39 6* Verzweiflung F -7 40 34* Empörung AG -7 41 33* Hass AF -7 42 36* Freude Al 7 43 26* Moralsteigerung Z 7 44 30* Inspiration AC 7 45 28* Vergnügen AA 7 46 45* Angst AR -8 47 17* Entsetzen Q -8 48 15* Euphorie oO 8 49 5* Ekel E -8
[0059] Der mit (*) gekennzeichnete numerische Code wird für die weitere Kodierung während der Textverarbeitung mit einem Programm und unter Verwendung der bereits erstellten Datenbanken in dessen Betrieb benötigt, was nachstehend näher beschrieben wird.
[0060] 2) Eine Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist, wird wie folgt erstellt.
[0061] Mindestens eine Gruppe 2 von Experten, die die Sprache fließend beherrschen, ist an der Analyse einer bestimmten Gruppe von Nachrichtentexten in dieser Sprache beteiligt. Die Experten müssen die Texte (in den Texten der Gruppe die emotional gefärbten Wörter/Wortkombinationen/Wortformen markieren, deren Bedeutungsinhalt einen Eindruck hinterlässt, eine positive/negative emotionale Reaktion hervorruft, d. h. die für die automatisierte Bewertung von Texten in der jeweiligen Sprache entscheidend sind) mit einem zugehörigen Buchstabencode (einem Buchstabencode aus den Tabellen 1 und 2) kennzeichnen. Dieser Schritt wird intuitiv durchgeführt, basierend auf der Wahrnehmung der Person, die die Bewertung vornimmt. Nach einer solchen Kennzeichnung können die gekennzeichneten Texte überprüft werden, um die Bewertung zu verifizieren und zu korrigieren, um Subjektivität zu vermeiden. Nach Abschluss des Kennzeichnungsvorgangs werden die genannten Wörter/Wortkombinationen/Wortformen mit dem zugehö6rigen Gewichtungskoeffizienten k, der der vom Experten zugewiesenen Emotion entspricht, in die Datenbank für Wörter/Wortkombinationen/Wortformen eingegeben. Ein Ausschnitt aus einer solchen Datenbank, aufgebaut als Tabelle 3, ist nachfolgend als Beispiel aufgeführt.
[0062] Tabelle 3 — Ausschnitt aus einer Datenbank emotional gefärbter Wörter und Wortkombinationen
Positionsnr. | Buchstaben- Bezeichnung der Wort/Wortkombination/Wortform code der Emotion Emotion 1 F Verzweiflung liefert kein Ergebnis 2 F Verzweiflung hatte genug 3 ©) Gefühl von Unsicher- |Unstimmigkeit
heit, Unwissenheit (enthält mangelndes Selbstvertrauen)
4 ©) Gefühl von Unsicher- |es ist unmöglich festzustellen, ob ein heit, Unwissenheit hochrangiger Beamter dies tut oder (enthält mangelndes nicht Selbstvertrauen)
5 ©) Gefühl von Unsicher- |wir werden darüber nachdenken... heit, Unwissenheit (enthält mangelndes Selbstvertrauen)
6 ©) Gefühl von Unsicher- |und vielleicht nicht nur sie heit, Unwissenheit (enthält mangelndes Selbstvertrauen) 7 ©) Gefühl von Unsicher- |die Gespräche haben noch keine Erheit, Unwissenheit gebnisse gebracht (enthält mangelndes Selbstvertrauen)
[0063] Die Anzahl der Gruppen 1 und 2 sowie die Anzahl der Personen in jeder Gruppe werden entsprechend den Anforderungen einer bestimmten Untersuchung festgelegt.
[0064] Somit ermöglicht der Buchstabencode, Wörter/Wortkombinationen/Wortformen mit dem zugehörigen Buchstabencode der Emotion zu kennzeichnen, der der lexikalischen Einheit entspricht, ohne dass der Experte Zeit mit der Suche nach dem numerischen Wert k verschwenden muss, und gibt außerdem den Grad der Positivität/Negativität des Wortes/der Wortkombination/der Wortform als Träger dieser Emotion an.
[0065] Als Nächstes werden Daten für die Klassifizierung von Sätzen nach ihrer Bedeutung anhand semantischer Kategorien wie Objekt der Emotion, Subjekt der Emotion usw. sowie logischer und semantischer Regeln während der automatisierten Textbewertung ermittelt. Die nachstehende Tabelle 4 stellt den numerischen Code der semantischen Kategorie des Satzes und den Charakter seiner Bedeutung gemäß den Regeln (Spalte 1), die semantische Kategorie des Satzes und den Indikator für die Art der Interaktion seiner Komponenten (Spalte 2) sowie die CodeIndikatoren (+ oder —) für die Wörter, die an erster oder zweiter Stelle nach dem *-Zeichen stehen (Spalten 3 und 4) bereit.
[0066] In den Spalten von Tabelle 4 geben diese +/- das Vorhandensein oder Fehlen eines Charakteristikums in den Komponenten einer Wortform an. Das Zeichen „+“ bedeutet, dass die Positionierung eines Wortes nach * dem Tabellenwert von 1-8 der emotionalen Färbungsintensität entspricht (die sowohl positiv (+) als auch negativ (-) sein kann). Das „-“ Zeichen in der Spalte „Vorhandensein der Eigenschaft” in Tabelle 4 bedeutet, dass die Positionierung eines Wortes nach * (an erster oder zweiter Stelle nach *) dem Wert „0” entspricht und nicht bewertet wird.
[0067] Die Symbole in den Spalten 1, 3 und 4 dienen dazu, ein Modell so zu trainieren, dass es bei der anschließenden Verarbeitung der Texte die semantischen Kategorien der Spalte 2 erkennt. Diese Kategorien sind mit der Bedeutung von emotional gefärbten Wörtern/Wortkombinationen/Wortformen verknüpft und ermöglichen es, Sätze in sinnvolle Fragmente zu unterteilen, anhand derer sich die Bedeutung im gesamten Text nachvollziehen lässt.
[0068] Tabelle 4 — Art der Darstellung der digitalen Kodierung semantischer Kategorien sowie logischer und semantischer Regeln
Numerischer Semantische Kategorie Vorhandensein der | Vorhandensein der Code der se- Eigenschaft Eigenschaft mantischen Kategorie
60* Objekt der Emotion + —
61* Subjekt der Emotion + —
70* Verstärkung emotionaler Zeichen + +
71* Auswirkung auf denGewichtskoeffi- -_ +
zientenbetrag bei einer Änderung seines Vorzeichens (+/-) 72* Abschwächung des + + Gewichtskoeffizientenbetrags einer Wortform
10 / 18
Andere Vorgangsweisen entsprechend den Eigenheiten des Textes 78* Indikator für die Intensität emotiona- + + ler Effekte
[0069] 3) Eine Datenbank mit LSR für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz wird auf der Grundlage der Durchführung zahlreicher Verfahren zur Analyse der Interaktion einer großen Anzahl von Wörtern, Wortkombinationen und Sätzen in Texten mit emotionaler Färbung erstellt. Ein Beispiel für die erstellte Datenbank ist nachstehend in Tabelle 5 aufgeführt. Diese Regeln tragen dazu bei, sowohl Satzfragmente als auch den gesamten Text auf lexikalischer Organisationsebene genauer zu bewerten.
[0070] Tabelle 5 — Datenbank logischer und semantischer Regeln für die Interaktion von Wortformen in einem Satz
Positi- Numerischer Gemäß dem Formel für die Regel onsnr. Code Regeln | Koeffizienten angewendete Regel 1 70* Verstärkung. k(S)= | k(wi)|+p(w)), p=0.5
Für die Verstärkung der emotionalen Färbung einer Wortform, mit der sie interagiert.
2 71* Negation (Zeichenumkehr). |k(Si) = - k(w;) + k(wi), Um die Emotion einer Wort- | wenn k(wj)) € [-2; -0.1], form ins Gegenteil umzukeh- | und k(w)) € [2; 0.1] ren.
3 72* Abschwächung. k(S)=] k(w) | - m(w)), m=0.5 Für die Abschwächung der emotionalen Färbung einer Wortform, mit der sie interagiert.
4 73* Zeicheninteraktionen. Zum |k(S) = ki, wenn Zusammensetzen von k der | | k(wi) | >| k(wi)| Konstrukte mit positiven und negativen Vorzeichen.
5 74* Erfassung k(S)) = kj, wenn Um in einem Satz Wortfor- | | k(wj) | = | k(wi) | men zu bewerten, die Emotionen mit denselben Zeichen vermitteln.
6 75* Doppelte Negation (Nega- |%(/S)) = kw +kw) tion der Negation). Um den 2 Charakter einer Wortform zu bestimmen, wenn sie aus zwei in der Bedeutung verwandten Wortformen mit negativer Bedeutung besteht.
7 76* Verdeckte a2026 Bedeutungsebenen (verdeckte (k(Si) = k(wi) + k(w)) >0, Bedeutungsebenen - FB). Wenn Wi, Wi Um die emotionale Färbung | (K(S) = k(wi) + k(w))) Eigenschaften der Zielgruppe zu bestimmen. EA CEeZ
Zielgruppe zu bestimmen. EA
CEeZ
8 717* Um die spezifische Gewich- nn tung des Gewichtungskoeffi- x. zienten der emotionalen Färbungsintensität einer Wortform zu ermitteln und auf dieser Grundlage den Grad der Wichtigkeit einer Quelle (ihre Wirkung in der gegebenen Informationsumgebung)
Die Bewertung des Grades der Wichtigkeit G einer Quelle (Website) hinsichtlich ihrer „Wirkung” wird als das gesamte spezifische Gewicht definiert:
- { zu bestimmen. G, „ Sqı ode] 9 78* Bewertung der emotionalen A G Färbungsintensität einer 2 7 Nachricht (das Verhältnis SA des Gesamtindikators für die | opei / die Gesamtintensität der emotionale Färbung aller | virkung der Botschaft unter BeKomponenten zur Anzahl rücksichtigung der in den drei dieser Komponenten). vorherigen Schritten bewerteten Daten ist;
G ist der Indikator für die emotionalen Färbungsintensität unter Berücksichtigung quantitativer und qualitativer Indikatoren für das Thema und die emotionale Färbung, die auf deren Verstärkung hinweisen;
n ist die Anzahl der zu bewertenden Komponenten.
Spalte 3 von Tabelle 5 beschreibt den Inhalt von Spalte 2 von Tabelle 4.
[0071] 4) Datenbanken mit Verfahren zur Verarbeitung von Wörtern/Wortkombinationen/Wortformen und Texten sowie mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Einfluss auf die Anderung der emotionalen Färbung eines Satzes werden wie folgt erhalten.
[0072] Die Regel der Negation (71*, Tabelle 5) führt zur Bildung von Tabelle 6 mit Antonympaaren von Emotionen, um den Charakter einer Wortform zu bestimmen, ob positiv oder negativ, je nach ihrem Kontext.
[0073] Tabelle 6. — Tabelle von Antonympaaren von Emotionen
Feld 1 Feld2 Feld 3 1*17 Aggression 36*27 1528 Euphorie E A5*18 3447 Empörung El A7°25 3627 Freude a 17 A518 Angst El 15*28 A725 Anerkennung a 3417
usw. nach dem gleichen Prinzip ...
x bes AT 528 486 A2 2026-01-15
Ss N
[0074] Darüber hinaus gibt es Fälle, in denen die Interpretation der emotionalen Färbung eines Satzes/einer Information von der Partei abhängt, die ihn/sie übermittelt. Dies führt zu den Regeln von „verdeckten Bedeutungsebenen“, wenn derselbe Ausdruck von der Zielgruppe sowohl positiv als auch negativ wahrgenommen werden kann, je nach den Ansichten dieser Zielgruppe und seiner Einstellung gegenüber der Informationsquelle.
[0075] Die Regeln für „verdeckten Bedeutungsebenen“ beinhalten:
[0076] Regeln für verdeckte Bedeutungsebenen des Kontexts, die eng mit dem Wahrnehmung und den Ansichten der Zielgruppe verbunden sind;
[0077] Regeln für verdeckte Bedeutungsebenen für die Quelle, die die emotionale Färbung bestimmter Wortformen der Nachrichten in Abhängigkeit von der politischen Position der Publikation bestimmen.
[0078] Daher sind die vorstehend genannten Regeln die Hauptregeln für die Beurteilung des Charakters eines Textes und basieren auf Wortformen, die die lexikalische Organisationsebene des Textes repräsentieren.
[0079] Darüber hinaus ist eine korrekte Erkennung syntaktischer Konstrukte wichtig, die durch die Beachtung der Regeln der syntaktischen Unterordnung sichergestellt wird.
[0080] Die folgenden syntaktischen Prinzipien (SP) gelten für diese Regeln: [0081] syntaktische Regeln zur Gewährleistung der Kohärenz;
[0082] syntaktische Regeln zur Kontrolle;
[0083] syntaktische Regeln zur Konjunktion.
[0084] Die Anwendung der genannten Regeln (LSR und SP) gewährleistet die Bewertung des Charakters eines Textes anhand bestimmter Wortformen, die die lexikalische Organisationsebene des Textes repräsentieren, und ihre Wirkung wird durch die Verwendung der syntaktischen Organisationsebene des Textes sichergestellt, die die syntaktische Struktur eines Satzes mit SPRegeln und die Eigenheiten der Interaktion der Satzglieder unter Sicherstellung der Kohärenz zwischen Wortformen auf der syntaktischen Ebene der Textdarstellung berücksichtigt.
[0085] Die Tabellen 2-6 werden zum Trainieren eines unüberwachten maschinellen Lernmodells sowie in den Schritten der Textanalyse verwendet.
[0086] Um die emotionale Färbung, die den Ausdrücken eines bestimmten Textes eigen ist, und deren Intensität zu erkennen, wird dieser Text mithilfe eines maschinellen Lernmodells analysiert, wobei die emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten gekennzeichnet werden. Die Tabellen 3, 4, 5 und 6 werden ebenfalls in diesem Schritt verwendet. Insbesondere werden in jedem Satz des Textes alle Verben und Substantive erkannt, es wird eine Suche nach den Wörtern des Satzes in der Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen (Tabelle 3) durchgeführt, die erkannten Wortformen mit Emotionen, die zum gleichen Feld gehören, werden gefiltert, wobei längere Sequenzen unter Berücksichtigung der emotionalen Färbungsintensität des Satzes (unter Verwendung von Tabelle 5) übrig bleiben, die Emotionen des Satzes und ihre Statistiken werden hinzugefügt und in der Datenbank gespeichert, die emotional gefärbte Texte enthält, die in diesem Prozess analysiert wurden, und die emotionale Färbungsintensität des Textes wird berechnet (unter Verwendung von Tabelle 5).
[0087] Statistiken beziehen sich auf einen numerischen Indikator dafür, wie viele Wortformen mit bestimmten Emotionen in einem bestimmten Satz erkannt wurden, sowie auf das quantitative Verhältnis der emotional gefärbten Wortformen zur Gesamtzahl der Wörter in einem Satz. Dadurch lässt sich die emotionale Färbungsintensität des Satzes und anschließend des gesamten Textes berechnen.
[0088] Die Datenbank, die die in diesem Prozess analysierten emotional gefärbten Texte beinhaltet, wird benötigt, damit dem Benutzer am Ende der Verarbeitung Folgendes angezeigt wird:
x bes AT 528 486 A2 2026-01-15
Ss N
1) Texte von verarbeiteten Nachrichten, in denen Wörter/Wortkombinationen/Wortformen mit einer bestimmten Farbe markiert sind, 2) Darstellungen, die das Vorhandensein bestimmter Emotionen und deren Verhältnis in einem bestimmten Text und in der Gesamtheit der Texte, die für einen vom Benutzer festgelegten Zeitraum hochgeladen wurden, veranschaulichen.
[0089] Wortformen können sowohl Wörter als auch Wortkombinationen sein, je nachdem, welche davon in einem bestimmten Satz benötigt wird.
[0090] Die für diese Aktionen verwendeten Hauptalgorithmen sind wie folgt: „Unüberwachtes maschinelles Lernen“ (Unsupervised machine learning), „FastText-Embedding“, ElasticSearch (metrischer Klassifikator und k-NN-Verfahren der nächsten Nachbarn).
[0091] Anschließend wird der nach dem Durchführen des vorherigen Schritts erhaltene Text anhand der Regeln für die syntaktische Unterordnung (Sicherstellung von Kohärenz, Kontrolle, KonjJunktion) durch Erkennen von Sprachkonstruktionen innerhalb des Textes und Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen analysiert. In diesem Schritt werden die Verfahren zur Synthese der Ausgabedaten und die Tabellen 2, 4 und 6 verwendet. Anhand dieser Tabellen werden schließlich die emotionale Färbung der ausgegebenen Wortformen und ihre Klasse bewertet und die syntaktische Struktur des Textes erkannt. Die Verfahren zur Synthese der Ausgabedaten sind für die endgültige Bestimmung der syntaktischen Struktur des Satzes und anschließend des gesamten Textes erforderlich, und anhand der Tabellen 2, 4 und 6 wird die emotionale Färbung der syntaktischen Konstrukte in der Wortform/im Satz/im gesamten Text berechnet.
[0092] Die Ergebnisse werden in geeigneter Weise visualisiert, beispielsweise durch Kennzeichnen der emotional gefärbten Wörter/Wortkombinationen/Wortformen und/oder durch Erstellen eines Diagramms und/oder durch Erstellen einer Darstellung.
[0093] Ein Beispiel für die Erkennung der emotionalen Färbung eines Artikels ist nachstehend aufgeführt.
[0094] Reaktion auf ÖKOZID (45*18): Die Umweltaktivistin Greta Thunberg traf sich am 29. Juni in Kiew mit Selensky)
[0095] Der Präsident der Ukraine, Wolodymyr Selenskyj, traf sich mit Greta Thunberg. Eine BEKANNTE (70*08) Umweltaktivistin traf heute, am 29. Juni, als Mitglied der Internationalen Arbeitsgruppe zu UMWELTFOLGEN (29*14) des KRIEGES (45*18) in Kiew ein.
Details
[0096] Greta Thunberg DANKTE (12*24) für die Einladung und betonte, dass sie Vertreter von Öffentlichen Umweltorganisationen in einen Dialog über die Hauptaufgaben der Internationalen Arbeitsgruppe einbinden und die Aufmerksamkeit auf die UMWELTFOLGEN (29*14) des KRIEGES (45*18) lenken werde. Volodymyr Selenskyj wies seinerseits darauf hin, dass sich die internationale Arbeitsgruppe mit einer Vielzahl von Fragen befassen sollte, die mit den Auswirkungen der RUSSISCHEN AGGRESSION (61*17) auf das Ökosystem der Ukraine zusammenhängen.
[0097] Thunberg wies darauf hin, dass der ÖKOZID (45*18) und die ZERSTÖRUNG (48*16) der Umwelt eine Form des KRIEGES (45*18) sind, die in Russland bekannt ist. Sie sagte:
[0098] Sie GREIFEN (32*14) GEZIELT (70*14) die Umwelt, die Lebensgrundlage der Menschen, AN und ZERSTÖREN auch LEBEN (45*18). Schließlich geht es hier letztendlich um Menschen. Hier geht es um UKRAINER, die unter diesem KRIEG (45*18) LEIDEN (16*15).
[0099] Die Umweltaktivistin ÄUSSERTE DIE HOFFNUNG (72*26), dass unterschiedliche Organisationen und Behörden in der Lage sein werden, Bewertungsinformationen über die FOLGEN (29*14) der ZERSTÖRUNG (48*16) DER UMWELT sammeln zu können, um „EINE CHANCE (70*95) ZU SCHAFFEN, RUSSLAND für seine HANDLUNGEN UND VERBRECHEN (34*17) ZUR VERANTWORTUNG (47*25) ZU ZIEHEN“ und „auf beharrliche Weise” eine CHANCE (70*95) ZU SCHAFFEN für die WIEDERHERSTELLUNG (47*25) der Ukraine.
14 / 18
x bes AT 528 486 A2 2026-01-15
Ss N
Hauptemotionen: [00100] Berechnen der Klassen, die Emotionen entsprechen. In diesem Text:
[00101] 45*18, Angst — 7 (erscheint 6 Mal im Text und erscheint 1 Mal in der Überschrift dieser Meldung);
[00102] 48*16, Ängstlichkeit — 3 (erscheint 3 Mal im Text); [00103] 29*14, Wachsamkeit — 3 (erscheint 3 Mal im Text); [00104] 47*25, Anerkennung — 2 (erscheint 2 Mal im Text); [00105] 34*17, Empörung — 1 (erscheint 1 Mal im Text);
[00106] 32*14, Unzufriedenheit — 1 (erscheint 1 Mal im Text); [00107] 12*24, Freundlichkeit — 1 (erscheint 1 Mal im Text); [00108] 16*15, Mitleid — 1 (erscheint 1 Mal im Text);
[00109] Die Schlussfolgerung lautet also wie folgt:
[00110] Die Hauptemotionen, die dem Text eigen sind:
[00111] Angst, mit einem hohen Ausprägungsgrad (7);
[00112] Ängstlichkeit, ebenfalls mit hohem Ausprägungsgrad (3); [00113] Wachsamkeit (3).
[00114] Zusätzliche Emotionen:
[00115] Anerkennung (2), Unzufriedenheit (1), Empörung (1), Freundlichkeit (1), Mitleid (1).
[00116] Somit stellt die beanspruchte Erfindung ein Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, sowie deren Intensität zu erkennen, ein Verfahren zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text eigen ist, und deren Intensität, sowie ein System, das das Verfahren implementiert, was die Erzielung eines technischen Effekts sicherstellt, der in der Fähigkeit besteht, die emotionale Färbung des Textes und deren Intensität sorgfältig zu bewerten, insbesondere um den Grad der Empathie des Textes zu messen, bereit.

Claims (9)

Ss Ss Ss N Sr ‚hes AT 528 486 A2 2026-01-15 Patentansprüche
1. Verfahren zum Trainieren eines maschinellen Lernmodells, um automatisch die emotionale Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, sowie deren Intensität zu erkennen, wobei das Verfahren Folgendes beinhaltet: Erstellen einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist;
Erstellen einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist;
Erstellen einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz;
Erstellen einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen;
Erstellen eines Trainingsdatensatzes unter Verwendung der erstellten Datenbanken; Trainieren eines Modells unter Verwendung des erstellten Trainingsdatensatzes, um ein trainiertes maschinelles Lernmodell zu erhalten.
2. Verfahren zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, und deren Intensität, wobei das Verfahren Folgendes beinhaltet:
Empfangen eines Textes und Aufteilen in Sätze;
Analysieren des Textes unter Verwendung eines maschinellen Lernmodells mit der Kennzeichnung seiner emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten;
wobei das maschinelle Lernmodell unter Verwendung eines Trainingsdatensatzes trainiert wird, der unter Verwendung der folgenden Datenbanken erstellt wurde: einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen,
denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; einer Datenbank der Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen; Analysieren des nach dem Durchführen des vorherigen Schritts erhaltenen Textes unter Verwendung der Regeln der syntaktischen Unterordnung mit der Erkennung von Sprachkonstrukten/Wortformen innerhalb des Textes und der Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen;
Visualisieren der Analyseergebnisse.
3. Verfahren nach Anspruch 2, wobei die Analyseergebnisse durch Kennzeichnen der emotional gefärbten Wörter/Wortkombinationen/Wortformen und/oder durch Erstellen eines Diagramms und/oder durch Erstellen einer Darstellung visualisiert werden.
4. Verfahren nach Anspruch 2, wobei im Schritt der Textanalyse unter Verwendung des maschinellen Lernmodells zusätzlich eine Datenbank mit emotional gefärbten Wörtern/Wortkombinationen/Wortformen, eine Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes, und eine Datenbank mit logischen und semantischen Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz verwendet werden.
5. Verfahren nach Anspruch 2, wobei im Schritt der Textanalyse unter Verwendung der Regeln der syntaktischen Unterordnung zusätzlich eine Datenbank der Emotionen, denen jeweils der Gewichtungskoeffizient k für die emotionale Färbungsintensität zugewiesen ist, und eine
16 / 18
Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkung auf die Anderung der emotionalen Färbung eines Satzes verwendet werden.
6. System zum automatischen Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, und deren Intensität, das Folgendes beinhaltet: mindestens einen Prozessor, mindestens ein maschinenlesbares Medium, das mit dem mindestens einem Prozessor kommunikativ verbunden ist, und Programmanweisungen zum Erkennen der emotionalen Färbung, die Ausdrücken/Wortformen in einem Text mit mehreren Wörtern/Wortformen eigen ist, und deren Intensität, die auf dem mindestens einen maschinenlesbaren Medium gespeichert sind und von dem mindestens einen Prozessor ausgeführt werden, wobei die Programmanweisungen Folgendes beinhalten;
Programmanweisungen zum Empfangen eines Textes und Aufteilen in Sätze;
ein maschinelles Lernmodell, das unter Verwendung eines Trainingsdatensatzes trainiert wurde, der unter Verwendung von folgenden Datenbanken erstellt wurde: einer Datenbank der Emotionen, denen jeweils ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank emotional gefärbter Wörter/Wortkombinationen/Wortformen, denen jeweils eine Emotion und ein Gewichtungskoeffizient für die emotionale Färbungsintensität zugewiesen ist; einer Datenbank logischer und semantischer Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz; einer Datenbank der Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes sowie mit Regeln für verdeckte Bedeutungsebenen;
Programmanweisungen zum Analysieren des Textes unter Verwendung des maschinellen Lernmodells mit der Kennzeichnung seiner emotional gefärbten Wörter/Wortkombinationen/Wortformen mit einer der Emotionen und ihrem Gewichtungskoeffizienten; Programmanweisungen zum Analysieren des nach dem Durchführen des vorherigen Schritts erhaltenen Textes unter Verwendung der Regeln der syntaktischen Unterordnung mit der Erkennung von Sprachkonstrukten/Wortformen innerhalb des Textes und der Interpretation ausgewählter emotional gefärbter Wörter/Wortkombinationen/Wortformen; Programmanweisungen zum Visualisieren der Analyseergebnisse.
7. Verfahren nach Anspruch 6, wobei die Programmanweisungen zum Visualisieren der AnaIlyseergebnisse Programmanweisungen zum Visualisieren der Analyseergebnisse durch Kennzeichnen der emotional gefärbten Wörter/Wortkombinationen/Wortformen und/oder durch Erstellen eines Diagramms und/oder durch Erstellen einer Darstellung beinhalten.
8. Verfahren nach Anspruch 6, wobei die Programmanweisungen zum Analysieren des Textes unter Verwendung des maschinellen Lernmodells ferner Anweisungen zum Analysieren des Textes unter Verwendung einer Datenbank mit emotional gefärbten Wörtern/Wortkombinationen/Wortformen, einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes, und einer Datenbank mit logischen und semantischen Regeln für die Interaktion von Wörtern/Wortkombinationen/Wortformen in einem Satz beinhalten.
9. Verfahren nach Anspruch 6, wobei die Programmanweisungen zum Analysieren des Textes unter Verwendung der Regeln der syntaktischen Unterordnung ferner Anweisungen zum Analysieren des Textes unter Verwendung einer Datenbank mit Regeln für die Arbeit mit Antonymen von Emotionen und deren Auswirkungen auf die Änderung der emotionalen Färbung eines Satzes beinhalten.
Hierzu 1 Blatt Zeichnungen
ATA95012/2025A 2023-12-19 2023-12-19 Verfahren zum trainieren eines maschinellen lernmodells, um automatisch die emotionale färbung, die ausdrücken/wortformen in einem mehrere wörter enthaltenden text eigen ist, und ihre intensität zu erkennen, sowie verfahren und system für ein solches erkennen AT528486A2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/UA2023/000062 WO2025136344A1 (en) 2023-12-19 2023-12-19 A method for training a machine learning model to automatically detect the emotional coloring peculiar to expressions/word forms in a text containing multiple words and its intensity, as well as a method and system for such detection

Publications (1)

Publication Number Publication Date
AT528486A2 true AT528486A2 (de) 2026-01-15

Family

ID=90721003

Family Applications (1)

Application Number Title Priority Date Filing Date
ATA95012/2025A AT528486A2 (de) 2023-12-19 2023-12-19 Verfahren zum trainieren eines maschinellen lernmodells, um automatisch die emotionale färbung, die ausdrücken/wortformen in einem mehrere wörter enthaltenden text eigen ist, und ihre intensität zu erkennen, sowie verfahren und system für ein solches erkennen

Country Status (2)

Country Link
AT (1) AT528486A2 (de)
WO (1) WO2025136344A1 (de)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12340175B2 (en) * 2021-01-29 2025-06-24 Elaboration, Inc. Automated classification of emotio-cogniton

Also Published As

Publication number Publication date
WO2025136344A1 (en) 2025-06-26

Similar Documents

Publication Publication Date Title
Prasad Content analysis
DE112018000334T5 (de) System und Verfahren zur domänenunabhängigen Aspektebenen-Stimmungserkennung
DE69623082T2 (de) Automatische Methode zur Extraktionszusammenfassung durch Gebrauch von Merkmal-Wahrscheinlichkeiten
DE69617515T2 (de) Automatisches Verfahren zur Erzeugung von thematischen Zusammenfassungen
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
EP3100174A1 (de) Verfahren zur automatischen sinnerkennung und messung der eindeutigkeit von text
DE102013205737A1 (de) System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen
DE112012001794T5 (de) Verfahren zum Bestimmen einer Stimmung aus einem Text
DE112013002654T5 (de) Verfahren zum Klassifizieren von Text
DE102019107591A1 (de) Anzeigesystem, programm und speichermedium
DE112018001165T5 (de) Automatisierte dokumentenanalyse für unterschiedliche natürliche sprachen
DE202023102803U1 (de) System zur Erkennung von Emotionen und zur Stimmungsanalyse durch maschinelles Lernen
CN108363699A (zh) 一种基于百度贴吧的网民学业情绪分析方法
DE202022102766U1 (de) System zur Erkennung und Vermeidung von irreführenden Nachrichten und falschen Gerüchten in sozialen Medien
Merino-Tejedor et al. The assessment of detachment among university students: Validation of the Recovery Experience Questionnaire in educational contexts
Bieberstein et al. Gender differences in the meanings associated with food hazards: A means-end chain analysis
Jasim et al. Studies on linguistic stylistic analysis of suicide notes and suicidal thoughts posts
AT528486A2 (de) Verfahren zum trainieren eines maschinellen lernmodells, um automatisch die emotionale färbung, die ausdrücken/wortformen in einem mehrere wörter enthaltenden text eigen ist, und ihre intensität zu erkennen, sowie verfahren und system für ein solches erkennen
EP2221735A2 (de) Verfahren zum automatischen Klassifizieren eines Textes durch ein Computersystem
EP3905097A1 (de) Vorrichtung und verfahren zum bestimmen eines knowledge graph
Grzybowski et al. The words of affectivity. Affect, category, and social evaluation norms for 400 Polish adjectives
Li et al. Category exemplar production norms for Hong Kong Cantonese: Instance probabilities and word familiarity
DE202023105413U1 (de) System zur automatisierten Texterzeugung mit Fehlerkorrektur
DE102012221927A1 (de) Verfahren zum Verwalten von E-Mail
DE202022106104U1 (de) System zur effizienten Zeitreihen-Sentimentsanalyse von nutzergenerierten Daten