EP4325450B1

EP4325450B1 - Verfahren und system zur analyse der augenbewegung

Info

Publication number: EP4325450B1
Application number: EP22216993.0A
Authority: EP
Inventors: Qichao Zhao; Ran YANG
Original assignee: Kingfar International Inc
Current assignee: Kingfar International Inc
Priority date: 2022-08-19
Filing date: 2022-12-28
Publication date: 2025-10-29
Anticipated expiration: 2042-12-28
Also published as: CN115661913A; US12315178B2; US20240062400A1; EP4325450A1; EP4325450C0

Claims

Verfahren zur Analyse von Augenbewegungen, umfassend:
Erfassen eines ersten Szenenvideos, das von einem Zielbenutzer in einer voreingestellten Umgebung gesehen wird, und Erfassen von Blickbewegungsdaten des Zielbenutzers in der Umgebung;

Durchführung einer semantischen Segmentierung des ersten Szenenvideos auf der Grundlage eines Deep-Learning-Algorithmus, um ein zweites Szenenvideo zu erhalten; wobei das zweite Szenenvideo so unterteilt wird, dass es einen interessierenden Bereich für die Augenbewegung aufweist;

Zuweisen eines semantischen Tags zu jedem Pixel im ersten Szenenvideo;

Aufteilen eines interessierenden Augenbewegungsbereichs auf der Grundlage des semantischen Tags; wobei Pixel mit demselben semantischen Tag demselben interessierenden Augenbewegungsbereich zugeordnet werden;

Überlagern der Blickbewegungsdaten mit dem zweiten Szenenvideo, um einen Blickpixelpunkt zu erhalten, der den Blickbewegungsdaten im zweiten Szenenvideo entspricht; und

Bestimmen des Blickpunkts, der jedem Einzelbild im zweiten Szenenvideo entspricht, und Ausgeben eines Blickbewegungsdatenindex des Zielbenutzers, der den interessierenden Blickbewegungsbereich betrachtet, in Kombination mit einer Zeitsequenz;

dadurch gekennzeichnet, dass die voreingestellte Umgebung ein Forschungsobjekt enthält;

wobei das Überlagern der Blickbewegungsdaten mit dem zweiten Szenenvideo, um einen Blickpunkt zu erhalten, der den Blickbewegungsdaten im zweiten Szenenvideo entspricht, Folgendes umfasst:
Erfassen eines ersten Koordinatenpunkts, der den Blickbewegungsdaten in einem ersten Koordinatensystem entspricht, wobei das erste Koordinatensystem ein dreidimensionales Koordinatensystem ist und wobei das erste Koordinatensystem eine Szenenkamera, die das erste Szenenvideo aufnimmt, als Koordinatenursprung nimmt, eine vertikale Richtung als Koordinaten-Z-Achse nimmt, eine horizontale Aufnahmerichtung, auf die die Szenenkamera direkt ausgerichtet ist, als Koordinaten-X-Achse nimmt und eine Richtung senkrecht zur horizontalen Aufnahmerichtung der Szenenkamera als Koordinaten-Y-Achse nimmt;

Umwandeln des ersten Koordinatenpunkts in ein zweites Koordinatensystem des zweiten Szenenvideos, um einen zweiten Koordinatenpunkt zu erhalten, wobei das zweite Koordinatensystem ein zweidimensionales Koordinatensystem ist und das zweite Koordinatensystem einen zentralen Pixelpunkt des zweiten Szenenvideos als Koordinatenursprung nimmt, eine Querrichtung der Pixel als Koordinaten-X-Achse nimmt und eine Längsrichtung der Pixel als Koordinaten-Y-Achse nimmt; und

Zuordnen des zweiten Koordinatenpunkts zu einem Pixelpunkt im zweiten Szenenvideo, um den Blickpunkt zu erhalten, der den Blickbewegungsdaten im zweiten Szenenvideo entspricht.
Verfahren zur Analyse von Augenbewegungen nach Anspruch 1, wobei der Deep-Learning-Algorithmus DeepLab, EncNet, SegNet oder PSPNet verwendet.
Verfahren zur Analyse von Augenbewegungen nach Anspruch 1, wobei das Bestimmen des Blickpunktpixels, das jedem Einzelbild im zweiten Szenenvideo entspricht, und das Ausgeben, in Kombination mit einer Zeitsequenz, des Augenbewegungsdatenindex des Zielbenutzers, der auf den interessierenden Augenbewegungsbereich blickt, Folgendes umfasst:
Bestimmen einer Reihenfolge und einer Anzahl, in der semantische Tags von Blickpixelpunkten in jedem Einzelbild des zweiten Szenenvideos in der Zeitsequenz erscheinen; und

Berechnen und Ausgeben des Augenbewegungsdatenindex auf der Grundlage der Reihenfolge und der Anzahl, in der die semantischen Tags in der Zeitsequenz erscheinen.
Verfahren zur Analyse von Augenbewegungen nach einem der Ansprüche 1 bis 3, wobei der Augenbewegungsdatenindex Folgendes umfasst: erste Blickzeit, Anzahl der Besuche, Gesamtbesuchsdauer, Blickzeiten, Gesamtblickdauer und durchschnittliche Blickdauer.
Augenbewegungsanalysesystem, das Folgendes umfasst: ein erstes Erfassungsmodul, ein zweites Erfassungsmodul, ein semantisches Segmentierungsmodul, ein Überlagerungsmodul und ein Ausgabemodul, dadurch gekennzeichnet, dass
das erste Erfassungsmodul zum Erfassen eines ersten Szenenvideos konfiguriert ist, das von einem Zielbenutzer in einer voreingestellten Umgebung gesehen wird;

das zweite Erfassungsmodul so konfiguriert ist, dass es gleichzeitig Blickbewegungsdaten des Zielbenutzers in der Umgebung erfasst, wenn das erste Erfassungsmodul das erste Szenenvideo erfasst;

das semantische Segmentierungsmodul so konfiguriert ist, dass es das erste Szenenvideo empfängt und eine semantische Segmentierung des ersten Szenenvideos auf der Grundlage eines Deep-Learning-Algorithmus durchführt, um ein zweites Szenenvideo zu erhalten, wobei das zweite Szenenvideo so unterteilt ist, dass jedem Pixel im ersten Szenenvideo ein semantisches Tag zugewiesen wird, und der interessierende Bereich der Augenbewegung auf der Grundlage des semantischen Tags unterteilt wird, wobei Pixel mit demselben semantischen Tag in denselben interessierenden Bereich der Augenbewegung unterteilt werden;

das Überlagerungsmodul so konfiguriert ist, dass es das zweite Szenenvideo und die Blickbewegungsdaten empfängt und die Blickbewegungsdaten mit dem zweiten Szenenvideo überlagert, um einen Blickpixelpunkt zu erhalten, der den Blickbewegungsdaten im zweiten Szenenvideo entspricht;

das Ausgabemodul so konfiguriert ist, dass es den Blickpunkt jedes Einzelbildes im zweiten Szenenvideo bestimmt und in Kombination mit einer Zeitsequenz einen Augenbewegungsdatenindex des Zielbenutzers ausgibt, der den interessierenden Augenbewegungsbereich betrachtet;

wobei das Überlagerungsmodul eine Erfassungseinheit, eine Umwandlungseinheit und eine Zuordnungseinheit umfasst; wobei

die Erfassungseinheit so konfiguriert ist, dass sie einen ersten Koordinatenpunkt erfasst, der den Blickbewegungsdaten in einem ersten Koordinatensystem entspricht, wobei das erste Koordinatensystem ein dreidimensionales Koordinatensystem ist und das erste Koordinatensystem eine Szenenkamera, die das erste Szenenvideo aufnimmt, als Koordinatenursprung nimmt, eine vertikale Richtung als Koordinaten-Z-Achse nimmt, eine horizontale Aufnahmerichtung, auf die die Szenenkamera direkt ausgerichtet ist, als Koordinaten-X-Achse nimmt und eine Richtung senkrecht zur horizontalen Aufnahmerichtung der Szenenkamera als Koordinaten-Y-Achse nimmt;

die Umwandlungseinheit so konfiguriert ist, dass sie den ersten Koordinatenpunkt in ein zweites Koordinatensystem des zweiten Szenenvideos umwandelt, um einen zweiten Koordinatenpunkt zu erhalten, wobei das zweite Koordinatensystem ein zweidimensionales Koordinatensystem ist und das zweite Koordinatensystem einen zentralen Pixelpunkt des zweiten Szenenvideos als Koordinatenursprung nimmt, eine Queranordnungsrichtung der Pixel als Koordinaten-X-Achse nimmt und eine Längsanordnungsrichtung der Pixel als Koordinaten-Y-Achse nimmt;

die Zuordnungseinheit so konfiguriert ist, dass sie den zweiten Koordinatenpunkt einem Pixelpunkt im zweiten Szenenvideo zuordnet, um den Blickpunkt zu erhalten, der den Blickbewegungsdaten im zweiten Szenenvideo entspricht.
Computerlesbares Speichermedium mit einem darauf gespeicherten Computerprogramm, dadurch gekennzeichnet, dass das Computerprogramm so konfiguriert ist, dass es von einem Prozessor geladen wird, um das Verfahren nach einem der Ansprüche 1 bis 4 auszuführen.