AT414311B - Verfahren zur objekterkennung - Google Patents
Verfahren zur objekterkennung Download PDFInfo
- Publication number
- AT414311B AT414311B AT0128404A AT12842004A AT414311B AT 414311 B AT414311 B AT 414311B AT 0128404 A AT0128404 A AT 0128404A AT 12842004 A AT12842004 A AT 12842004A AT 414311 B AT414311 B AT 414311B
- Authority
- AT
- Austria
- Prior art keywords
- wavelet
- jets
- basis
- image
- wavelets
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/446—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
2
AT 414 311 B
Die vorliegende Erfindung betrifft ein Verfahren zur Objekterkennung, insbesondere Gesichtserkennung, in einem Objektbild durch Vergleichen von Wavelet-Jets signifikanter Punkte des Objektbildes mit Wavelet-Jets zumindest eines Referenzbildes. 5 Ein derartiges Verfahren ist in der Arbeit von David S. Bolme, „Elastic Bunch Graph Matching“, Thesis MSc, Colorado State University, Sommer 2003, beruhend u.a. auf der Arbeit von Laurenz Wiskott, Jean-Marc Feiious, Norbert Krüger und Christoph von der Malsburg, „Face Re-cognition by Elastic Bunch Graph Matching“, Tech. Report 96-08, Ruhr-Universität Bochum, April 1996, beschrieben. 10
Bei den bekannten Verfahren wird als Basis für die Erzeugung der Jets ein Satz von geradlinigen Gabor-Wavelets verwendet, und zwar sowohl im ersten Schritt der Lokalisierung der signifikanten Punkte als auch im zweiten Schritt des Ähnlichkeitsvergleiches mit dem Referenzbild. Es hat sich gezeigt, daß praktische Implementierungen dieser Verfahren eine überaus hohe Reis chenleistung erfordern und dennoch eine verhältnismäßig hohe Fehlerrate bei der Objekterkennung aufweisen, was einem breiteren industriellen Einsatz, z.B. in der Sicherheitstechnik, entgegensteht.
Die Erfindung setzt sich zum Ziel, ein Verfahren der genannten Art so weiterzubilden, daß es 20 eine geringere Fehleranfälligkeit und höhere Robustheit besitzt als die bekannten Lösungen, bei gleichzeitig geringerem Rechenleistungsbedarf. Dieses Ziel wird mit einem Verfahren der einleitend genannten Art erreicht, welches sich gemäß der Erfindung dadurch auszeichnet, daß die Wavelet-Jets im ersten Schritt auf Basis von Haar-Wavelets und im zweiten Schritt auf Basis von in der Mehrzahl gekrümmten Gabor-Wavelets erzeugt werden. 25
Die Erfindung beruht auf der Erkenntnis, daß sowohl die Verarbeitungsgeschwindigkeit als auch die Treffsicherheit der Objekterkennung wesentlich gesteigert werden können, wenn die beiden Schritte des Verfahrens, Lokalisation und Ähnlichkeitsvergleich, auf vollkommen getrennte, jeweils speziell angepaßte Wavelet-Basen abgestellt werden. Der Einsatz von einfachen Haar-30 Wavelets im Lokalisierungsschritt ermöglicht ein fehlertolerantes, robustes und rasches Auffinden der signifikanten Punkte, während die anschließende Auswertung der aufgefundenen Punkte mit Hilfe von detailreichen gekrümmten Gabor-Wavelets genau und treffsicher erfolgt. Die Fehlerrate des Verfahrens kann damit wesentlich gesenkt werden. Die Jet-Generierung auf Basis von Haar-Wavelets benötigt nur äußerst geringe Rechenleistung, wobei die erzielte Ein-35 sparung den zusätzlichen Rechenleistungsbedarf für die gesonderte Jet-Extraktion im zweiten Schritt bei weitem überwiegt. Der Rechenbedarf des gesamten Verfahrens ist damit wesentlich geringer als bei den bekannten Verfahren, und dies bei gleichzeitig höherer Treffsicherheit. Der geringe Rechenleistungsbedarf ermöglicht erstmals praktische Realisierungen mit langsamen, lüfterlosen Prozessoren, was einen industriellen Einsatz in breiterem Umfang, beispielsweise für 40 Sicherheitsschleusen oder Schlösser mit Onboard-Prozessoren, in greifbare Nähe rückt.
Eine bevorzugte Ausführungsform der Erfindung zeichnet sich dadurch aus, daß für jeden signifikanten Punkt die Koordinatenermittlung im ersten Schritt durch Ähnlichkeitsvergleich mit einem Bündel von ersten Wavelet-Jets verschiedener Referenzbilder erfolgt. Ein solcher Bün-45 delvergleich ist aus den genannten Arbeiten von Bolme und Wiskott et al. an sich bekannt und verbessert die Lokalisierung der signifikanten Punkte in dem zu untersuchenden Objektbild.
Besonders vorteilhaft ist es, wenn gemäß einem weiteren Merkmal der Erfindung als Haar-Wavelet-Basis eine Lienhart-Maydt-Basis verwendet wird, bevorzugt in mehreren Skalierungs-50 schritten, besonders bevorzugt in 24 Skalierungsschritten.
Unter einer Lienhart-Maydt-Basis wird in der vorliegenden Beschreibung der von Rainer Lienhardt und Jochen Maydt in der Arbeit „An Extended Set of Haar-Like Features for Rapid Object Detection“, Intel Laboratories, 2002, vorgeschlagene Satz von 14 bzw. 15 Haar-Funktionen zur 55 schnellen Objekterkennung verstanden, welcher u.a. auf Arbeiten von Papageorgiou et al. und 3
AT 414 311 B
Viola et al. zurückgeht.
Bevorzugt wird die Lienhart-Maydt-Basis in mehreren Skalierungsschritten angewandt, um die Genauigkeit der Lokalisierung zu erhöhen, ohne den Rechenleistungsbedarf des gesamten 5 Verfahrens signifikant zu erhöhen. In der Praxis hat sich ein Wert von 24 Skalierungsschritten als besonders günstig erwiesen.
Ein weiteres bevorzugtes Merkmal der Erfindung besteht darin, daß als Gabor-Wavelet-Basis Wavelets der Funktion 10 mit 15 20 und dem Parametersatz .2 2.2 ^ x +r y f ψ{χ,γ,0,Θ,λ,φ,σ,γ)= e 2σ CO^ 2Π~ + φ x = xcos(©) + ysin(©)+y2C, y = -x sin(0) + y cos(©) C = {0,±0.04,±0.07,±0.1}, 25 „-in — — — 7Π ® |°’ 8 ’ 8 ’ 8 ’ 8 λ = {4,472,8,872,16}. 30 φ-σ = λ, 35 γ = 1-0, verwendet werden. Mit diesem Parametersatz ergibt sich eine Basis von 800 Gabor-Wavelets, von denen 700 gekrümmt sind. Dies führt zu einer äußerst detailreichen, genauen Analyse der 40 Bildbereiche in der Umgebung der signifikanten Punkte. Aufgrund der gewählten Krümmungen ist die erfindungsgemäße Wavelet-Basis an Gesichtskonturen besonders gut angepaßt und damit für die Gesichtserkennung besonders gut geeignet.
Die Erfindung wird nachstehend anhand eines in den beigeschlossenen Zeichnungen darge-45 stellten Ausführungsbeispieles näher erläutert. In den Zeichnungen zeigt
Fig. 1 ein Flußdiagramm des Verfahrens der Erfindung,
Fig. 2 eine Lienhart-Maydt-Basis von Haar-Wavelets und
Fig. 3 einige beispielhafte Wavelets der Basis von gekrümmten Gabor-Wavelets. 50
Das in Fig. 1 dargestellte Verfahren baut auf den genannten Arbeiten von Bolme, Wiskott et al. und Lienhart-Maydt auf und für eine genaue Erläuterung der theoretischen Grundlagen des Verfahrens wird auf diese Schriften verwiesen. Ziel des Verfahrens ist es, mittels digitaler Bildverarbeitung ein Objekt, z.B. ein Gesicht, ein Fahrzeug usw., in einem Bild Pobj des Objektes zu 55 erkennen, und zwar durch Ähnlichkeitsvergleich mit einem oder mehreren Referenzbildern Pref 4
AT 414 311 B des Objektes.
Der Ähnlichkeitsvergleich erfolgt nicht durch Vergleichen des gesamten Bildes Pobj mit dem gesamten Referenbild Pref, sondern durch Vergleichen von einzelnen Bildbereichen rund um signifikante Punkte des Objektes, sog. „Landmarks“ Im,. Im Falle der Gesichtserkennung sind geeignete signifikante Punkte bzw. Landmarks Inij beispielsweise das Zentrum der Pupille des linken Auges, das Zentrum der Pupille des rechten Auges, die Nasenspitze, der linke und rechte Mundwinkel usw. Im weiteren werden M Landmarks Im, (i = 1..M) betrachtet.
Der Bildbereich P rund um einen Landmark Irrij wird nicht direkt, sondern mittels Wavelet-Transformation in einem Transformationsraum J ausgewertet. Das Ergebnis der Wavelet-Transformation an einem Ort (x, y) wird als Jet J bezeichnet und kann als Vektor
dargestellt werden, dessen N komplexe Koeffizienten q den Faltungen des Bildes P am Ort (x, y) mit einem Satz von N Wavelets ψ] entsprechen: ci = cC {Γ p{x,y)xvJUy)dxdy.
Die Menge aller N Wavelets (j = 1..N) wird als Wavelet-Basis B der Wavelet-Transformation bezeichnet.
Zurückkommend auf Fig. 1 ist das im Betrieb ablaufende Verfahren zur Objekterkennung als Ablaufteil A („runtime“) in der rechten Hälfte von Fig. 1 dargestellt und gliedert sich in einen ersten Schritt a), in welchem die Landmarks lmobji im Objektbild Pobj lokalisiert werden, und einen zweiten Schritt b), in welchem Jets Jobj,i an den Landmarks lmobj,i extrahiert und mit Jets Jrefj.s eines oder mehrerer Referenzbilder Pref,s verglichen werden, um die Objekterkennung („match“) durchzuführen.
In einem vorhergehenden Trainingsteil T des Verfahrens werden die für die Schritte a) und b) des Ablaufteiles A erforderlichen Referenzdaten ermittelt und bereitgestellt. Es versteht sich, daß der Trainingsteil T nur ein Mal für eine Vielzahl von Ablaufteilen A durchlaufen werden muß und auch in großem zeitlichen Abstand zu letzterem liegen kann; zum besseren Verständnis werden die Teile T und A jedoch im weiteren gleichzeitig erläutert.
Im Trainingsteil T werden für den Schritt a) in einem Satz von R Referenzbildern Pbibr (r = 1..R) in jedem einzelnen Referenzbild die Koordinaten lmman,i,r vorgegebener Landmarks Imi manuell ermittelt, beispielsweise durch manuelles Markieren der Pupillenzentren, der Nasenspitze usw. mit Hilfe eines interaktiven Bildbearbeitungswerkzeuges.
Im Block 10 werden aus jedem Referenzbild Pbib,r am Ort jedes Landmarks lmman,i,r Jets Jbibii,r generiert, und zwar auf Grundlage einer Wavelet-Basis BH aus N Haar-Wavelets ψΗ,; (j = 1 ..N).
Die Haar-Wavelets ipH.j können an sich aus jeder beliebigen Haar-Funktion aufgebaut sein. Bevorzugt wird jedoch als Haar-Wavelets iyH,j eine Lienhart-Maydt-Basis von 15 bzw. 14 Haar-Wavelets verwendet, welche in Fig. 2 in ihrer Struktur graphisch dargestellt ist und eine normier- 5
AT 414 311 B te Ausdehnung von 3 x 3 bis 3 x 5 Pixeln besitzt.
Die Haar-Wavelets ψΗ] der Lienhart-Maydt-Basis BH von Fig. 2 können in beliebiger Skalierung verwendet werden; bevorzugt werden sie gleichzeitig in mehreren, insbesondere 24 Skalierungsschritten von 1- bis 24-facher Größe eingesetzt, so daß die gesamte Anzahl N an Haar-Wavelets in der Basis BH 14 x 24 = 336 beträgt.
Das Ergebnis der Jet-Extraktion von Block 10 wird als Referenzdatensatz Gbib gespeichert und dem Ablaufteil A zur Verfügung. Der Referenzdatensatz Gbib kann als Matrix
% A,1 *Ä,2 A,2 Ar j Ί J\R ΓΜ b2 Al Λ*, ι V Ar Jm,r J geschrieben werden und stellt gleichzeitig einen Spaltenvektor von M Bündeln bi (i = 1..M) von Jets, sog. „bunches“, für jeden Landmark Irrii dar. Der Referenzdatensatz Gbib wird daher auch als „Bunch Graph“ bezeichnet.
Im Ablaufteil A sind die genauen Koordinaten (x, y) der gewählten Landmarks Irrii (linkes Pupillenzentrum, rechtes Pupillenzentrum usw.) im Objektbild Pobj zunächst nicht bekannt und werden durch Anfangswerte und/oder Schätzungen lmest,i ersetzt. Im Block 20 werden am Ort der geschätzten Landmarks lmest,i Jets Jesu extrahiert, und zwar auf Grundlage derselben Wavelet-Basis Bh, die im Block 10 zur Erzeugung der Referenzdaten verwendet und anhand von Fig. 2 erläutert wurde.
In einem anschließenden Block 30 werden die tatsächlichen bzw. aktuellen Koordinaten (x, y) der Landmarks Im, des Objektbildes Pobj lokalisiert. Dazu werden die Jets Jest,i an den geschätzten Landmarks lmestii des Objektbildes Pobj mit den Jets Jbib,i,r des Bunch Graphs Gbib verglichen.
Soferne mehrere Referenzbilder Pbibr zugrunde gelegt wurden (R > 1), d.h. der Bunch Graph Gbib aus Bündeln b, von Jets für jeden Landmark Im, besteht, wird jeweils der ähnlichste Jet aus einem Bündel b, für einen bestimmten Landmark Im, zum Vergleich herangezogen. Dies kann beispielsweise für den ersten Landmark Im! (z.B. „linkes Pupillenzentrum“) ein vom dritten Referenzbild Pbib,3 stammender Jet J1i3 sein, für den zweiten Landmark lm2 (z.B. „rechtes Pupillenzentrum“) ein vom ersten Referenzbild Pbib>1 stammender Jet J2.i usw., wodurch für den Vergleich das jeweils „passendste“ Auge, die jeweils „passendste“ Nase usw. herangezogen wird.
Der Vergleich im Block 30 kann auf verschiedene in der Technik bekannte Arten durchgeführt werden, soferne daraus die örtliche Abweichung des tatsächlichen Landmarks lmobjii vom geschätzten Landmark lmest,i ermittelt werden kann. Beispielsweise könnten die Jets von allen Punkten in einer Umgebung des geschätzten Landmarks aus dem Objektbild extrahiert und mit den entsprechenden Referenz-Jets des Referenzbildes auf maximale Ähnlichkeit verglichen werden.
Ein von Bolme vorgeschlagenes, besonders rasch zu berechnendes Verfahren beruht auf einer Schätzung des Jets J', in einem Abstand d vom geschätzten Landmark lmest.i durch Anwendung der Näherung, daß sich ein Jet J' in einem geringen Abstand von einem Jet J vorwiegend in seinem Phasenversatz unterscheidet:
In Polarkoordinatendarstellung 5 10 6 9/ (ai> Ψί) kann ein Jet
AT 414 311 B in einem Abstand 15 d = dx dy von einem vorgegebenen Jet 20 J =
Ci c2 25
Ci
CN 30 angenähert werden zu ajÄ a) <Pj ~ <Pj +kj d 35 mit ^2Yl cos 0y 2IIsin0y 40 kj = und 45 0j ... Orientierung des Wavelets ψί Äj ... Wellenlänge des Wavelets ψί·
Durch Variieren des Abstandsvektors d solange, bis der Umgebungsjet J' maximale Ähnlichkeit so mit dem Jet J des gesuchten Landmarks Im, hat, können der Abstandsvektor d und damit die aktuellen Koordinaten lmobjii des Landmarks Im, im Objektbild Pobj ermittelt werden.
Das Variieren des Abstandsvektors d kann mit allen in der Technik bekannten Suchalgorithmen durchgeführt werden, z.B. mittels Grid-Sample-, Predictive-Step-, Predictive-Iteration-, 55 Fixed-Local-Search- oder Narrowing-Local-Search-Algorithmen, wie z.B. in der Arbeit von 7
AT 414 311 B
Bolme erörtert. Für den Ähnlichkeitsvergleich zweier Jets, wie der Jets J und J', kann ebenfalls jedes in der Technik bekannte Ähnlichkeitsmaß verwendet werden, beispielsweise ein betragsmäßiges Korrelationsmaß ΣΝ , y=iaja i Ιχ'Ν 2χΝ,2 1 ai "y=1 9 i oder ein auch den Phasenversatz berücksichtigendes Korrelationsmaß SV{J,J')
Wird in letztere Gleichung die obige Phasenabschätzung für den Umgebungsjet J’ im Abstand d eingesetzt, kann letzteres Ähnlichkeitsmaß auch geschrieben werden als
Σ" 1 aja'j cos(?y - Ip'j+k]' d)
ΙχΝ 2χΝ [F VA-=1ayZy=1ay bzw. durch Taylorreihenentwicklung noch weiter genähert als s,(j.j',d)= [1-0.4 i)1
Durch Variieren des Abstandsvektors d mittels der genannten Suchalgorithmen im Hinblick auf eine Maximierung des Ähnlichkeitsmaßes S<p kann somit der Versatz d des geschätzten Ortes lmest,i vom richtigen Ort lm0bj.i des Landmarks Im, und damit der Landmark lm0bj,i im Objektbild P0bj lokalisiert werden.
Das Ergebnis des Blocks 30 ist somit eine Liste mit allen im Objektbild Pobj lokalisierten Landmarks lmobjji, beispielsweise in der Form lmobj,i linksaugenmitte rechtsaugenmitte nasenbrücke usw. x-Position 41.047727 90.913636 67.162529 y-Position 49.115525 49.852737 38.257454
Auf Grundlage der im Schritt a) lokalisierten Landmarks lmobj,i kann nun im Schritt b) der Ähnlichkeitsvergleich des Objektbildes P0bj mit einem bestimmten Referenzbild Pref („Verifizierung eines Objektes“) oder mit mehreren Referenzbildern PrefiS (s = 1..S) („Identifizierung eines Objektes unter mehreren“) erfolgen.
Es ist zu beachten, daß die in Schritt b) verwendeten Referenzbilder PrefiS dieselben sein können wie die Referenzbilder Pbjbr von Schritt a) oder auch nicht. So können beide Sätze von Referenzbildern ident sein, oder aber der erste Satz von Referenzbildern Pbib,r ist z.B. eine umfangreiche Bibliothek repräsentativer Gesichtsformen, -färben, Brillen- und Bartaccessoires usw., während der zweite Satz von Referenzbildern PrefiS nur das oder die zu verifizierende(n) 8
AT 414 311 B oder identifizierende(n) Objekt(e) umfaßt.
Im Trainingsteil T werden im Block 40 für den Schritt b) aus den Referenzbildern Pref,s an manuell selektierten Landmarks lmman.i.s Jets Jref,i,s extrahiert, u.zw. auf Grundlage einer Wavelet-5 Basis Bb, welche einen Satz von Ν' Gabor-Wavelets ψΒι, umfaßt, von denen die Mehrzahl gekrümmt ist.
Unter gekrümmten Gabor-Wavelets („Banana-Wavelets“) werden Wavelets der allgemeinen Gleichung 10 ψ{χ, y, C, Θ, λ,φ,σ,γ) = .2 2.2 x 2σ
COS
Λ X 2Π- + ρ A J 15 mit 2 x = xcos(©)+y sin(©) + y C y = -x sin(0) + y cos(0) 20 verstanden, wobei 25 C .. Krümmung des Wavelets Θ .. Orientierung des Wavelets λ .. Wellenlänge der Sinusoidfunktion cp .. Phasenverschiebung σ .. Radius der einhüllenden Gaußkurve 30 γ .. Seiten/Höhen-Verhältnis des Wavelets ist. Einige beispielhafte Wavelets ψΒ,, sind in Fig. 3 gezeigt.
Bevorzugt wird zur Erzeugung der Wavelet-Basis Bb der folgende Parametersatz gewählt: 35 C = {0,±0.04,±0.07,±0.1}, I Π 2Π 3Π 7Π 40 M Τ' 8 ' 8 ' 8 ..... 8 λ = {4,4·>/2,8,8 V2,1 θ},
45 σ = λ und 50 γ = 1.0.
Dies führt zu 700 gekrümmten und 100 geradlinigen Gabor-Wavelets, d.h. Ν' = 800, und damit zu einer äußerst detailreichen Bildanalyse. 55 Die Jets Jref,iiS an den Landmarks lmmaniiiS der Referenzbilder Pref,s werden in einem Referenzda- 5 5 9
AT 414 311 B tensatz Gref für den Ablaufteil A zur Verfügung gestellt. Der Referenzdatensatz Gref umfaßt für jedes Referenzbild Pref,s einen sogenannten „Face-Graphen“ Gs: 10
Gref = r A,1 A,2 Ά.1 ^2,2
As A.i λ = g2
Gs GSI A,1 J,,
'M,S
Im Ablaufteil A des Verfahrens wird nun im Block 50 für jeden lokalisierten Landmark lm0bj.i des Objektbildes Pobj ein Jet Jobjii extrahiert, und zwar auf Grundlage derselben Gabor-Wavelet-Basis Bb, welche im Extraktionsblock 40 des Trainingsteiles T verwendet und anhand von Fig. 3 15 erläutert wurde.
In einem anschließenden Block 60 wird der Ähnlichkeitsvergleich zwischen den Jets Jobj,i des Objektbildes Pobj und den Jets Jref,its des Referenzdatensatzes Gref durchgeführt. Als Ähnlichkeitsmaße für die Bestimmung der Ähnlichkeit zweier Jets Jobj,i und JrefiiiS können beliebige Kor-20 relationsmaße herangezogen werden, bevorzugt das obengenannte Phasenmaß 25
objj^ref.j COSyJpQky y - Ψτβί, j
2 yw 2 &obj,j ^/=1 ®ref.j
Dabei kann ein Gesamtähnlichkeitsmaß 8φ.ββ$ zwischen allen Landmarks Imj des Objektbildes Pobj und einem bestimmten Referenzbild Pref,s verwendet werden, beispielsweise durch Mittelwertbildung über die Ähnlichkeitsmaße S<piiiS der Landmarks Imj bezüglich eines bestimmten 30 Referenzbildes Pref,s: c =_> c '“V.ges.s i^j f-j '-V./'.s · 35
Alternativ oder zusätzlich könnten auch die geometrischen Abweichungen zwischen den Landmarks eines bestimmten Referenzbildes Pref,s und den Landmarks des Objektbildes Pobj in das Ähnlichkeitsmaß eingehen. 40 Wird das Verfahren zur Verifikation eines Objektes, z.B. Gesichts, eingesetzt, d.h. zum Vergleich mit einem einzigen Referenzbild Pref oder mit einem Satz von verschiedenen Referenzbildern Pref.s ein und desselben Objekts, wird als Ausgang des Blocks 60 eine Verifikation („match“) angezeigt, wenn das im Block 60 ausgewertete Ähnlichkeitsmaß einen vorgegebenen Schwellwert überschreitet. 45
Wird hingegen das Verfahren zur Identifikation eines Objektes unter mehreren möglichen Objekten verwendet, z.B. zur Identifikation des Gesichts eines Benutzers von mehreren möglichen Benutzern, von denen jeweils ein oder auch mehrere Referenzbilder Pref,s vorliegen, wird als Ausgang des Blocks 60 dasjenige Objekt bzw. Gesicht identifiziert („match“), dessen Ähnlich-50 keitsmaß das aller anderen übersteigt.
Die Erfindung ist nicht auf die dargestellten Ausführungsformen beschränkt, sondern umfaßt alle Varianten und Modifikationen, die in den Rahmen der angeschlossenen Ansprüche fallen. 55
Claims (4)
1 0 AT 414 311 B Patentansprüche: 1. Verfahren zur Objekterkennung, insbesondere Gesichtserkennung, in einem Objektbild (Pobj) durch Vergleichen von Wavelet-Jets signifikanter Punkte (Imi) des Objektbildes mit Wavelet-Jets zumindest eines Referenzbildes (Pbib.r. Pret.s), wobei in einem ersten Schritt im Objektbild (Pobj) die aktuellen Koordinaten (lmobj,i) der signifikanten Punkte (Im,) ermittelt werden, indem jeweils im Umgebungsbereich einer Schätzung (lmest,i) der Koordinaten die Koordinaten jenes Punktes mit der maximalen Ähnlichkeit seines Wavelet-Jets (J',) zu den Wavelet-Jets (Jbib,i,r) der signifikanten Punkte (lmman,i,r) des Referenzbildes (Pbib.r) ermittelt werden, und in einem zweiten Schritt die Erkennung des Objektes durch Ähnlichkeitsvergleich zwischen den Wavelet-Jets (Jobj,i) der lokalisierten signifikanten Punkte (lm0bj.i) des Objektbildes (Pobj) und den Wavelet-Jets (Jref,i,s) der signifikanten Punkte (lmman.i,s) des Referenzbildes (Pref,s) erfolgt, dadurch gekennzeichnet, daß die Wavelet-Jets (Jest,i. Jbib.u, J’O im ersten Schritt auf Basis von Haar-Wavelets (i|jHlj; BH) und die Wavelet-Jets (Jobj,i. «Ws) im zweiten Schritt auf Basis von in der Mehrzahl gekrümmten Gabor-Wavelets (ψΒι]; Bb) erzeugt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für jeden signifikanten Punkt (Im,) die Koordinatenermittlung im ersten Schritt durch Ähnlichkeitsvergleich mit einem Bündel (bi) von ersten Wavelet-Jets (Jbib.i,r) verschiedener Referenzbilder (Pbib,r) erfolgt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß als Haar-Wavelet-Basis (BH) eine Lienhart-Maydt-Basis verwendet wird, bevorzugt in mehreren Skalierungsschritten, besonders bevorzugt in 24 Skalierungsschritten.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß als Gabor-Wavelet-Basis (Bb) Wavelets der Funktion
mit x = xcos(0) + ysin(0) + y2C, y = -x sin(0) + y cos(0) und dem Parametersatz C = (0+0.04, ±0.07, ±0.1},
λ = {4,4λ/2,8,8λ/2,16},
σ = λ, 7 = 1.0, 1 1 AT 414 311 B verwendet werden. Hiezu 2 Blatt Zeichnungen 5 10 15 20 25 30 35 40 45 50 55
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| AT0128404A AT414311B (de) | 2004-07-28 | 2004-07-28 | Verfahren zur objekterkennung |
| PCT/AT2005/000296 WO2006010187A1 (de) | 2004-07-28 | 2005-07-27 | Verfahren zur objekterkennung |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| AT0128404A AT414311B (de) | 2004-07-28 | 2004-07-28 | Verfahren zur objekterkennung |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| ATA12842004A ATA12842004A (de) | 2005-07-15 |
| AT414311B true AT414311B (de) | 2007-01-15 |
Family
ID=34715984
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| AT0128404A AT414311B (de) | 2004-07-28 | 2004-07-28 | Verfahren zur objekterkennung |
Country Status (2)
| Country | Link |
|---|---|
| AT (1) | AT414311B (de) |
| WO (1) | WO2006010187A1 (de) |
-
2004
- 2004-07-28 AT AT0128404A patent/AT414311B/de not_active IP Right Cessation
-
2005
- 2005-07-27 WO PCT/AT2005/000296 patent/WO2006010187A1/de not_active Ceased
Non-Patent Citations (1)
| Title |
|---|
| SUN Z., BEBIS G., MILLER R., ''IMPROVING THE PERFORMANCE OF ON-ROAD VEHICLE DETECTION BY COMBINING GABOR AND WAVELET FEATURES'', IN: INTELLIGENT TRANSPORTATION SYSTEMS, 5TH INTERNATIONAL CONFERENCE, SINGAPUR, IEEE 2002, SEITEN 130-135 * |
Also Published As
| Publication number | Publication date |
|---|---|
| ATA12842004A (de) | 2005-07-15 |
| WO2006010187A1 (de) | 2006-02-02 |
| WO2006010187A8 (de) | 2006-03-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0780002B1 (de) | Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen | |
| Radüntz et al. | EEG artifact elimination by extraction of ICA-component features using image processing algorithms | |
| Kruizinga et al. | Nonlinear operator for oriented texture | |
| Fellous | Gender discrimination and prediction on the basis of facial metric information | |
| DE69833999T2 (de) | Verfahren zur automatischen erkennung menschlicher augen in digitalbildern | |
| DE69333811T2 (de) | Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones | |
| DE69333431T2 (de) | Verfahren zum Erkennen von handgeschriebenen Symbolen | |
| DE69610689T2 (de) | System zum Klassifizieren von Fingerabdrücken | |
| CN100447808C (zh) | 人脸表情图像的分类及语义评判量化方法 | |
| DE102017220896A1 (de) | Verfahren und Vorrichtung zur Sicherheitskontrolle | |
| DE102021201777A1 (de) | Verfahren zur Verhaltenserkennung, Vorrichtung zur Verhaltenserkennung und computerlesbares Aufzeichnungsmedium | |
| DE69623564T2 (de) | Gerät zur Extraktion von Fingerabdruckmerkmalen | |
| DE102018220920A1 (de) | Informationsverarbeitungsgerät, Verfahren zur biometrischen Authentifizierung und Aufzeichnungsmedium mit einem darauf aufgezeichneten Prgoramm zur biometrischen Authentifizierung | |
| AT414311B (de) | Verfahren zur objekterkennung | |
| DE10027657B4 (de) | Verfahren zur Ermittlung von Referenzpunkten in einem Fingerabdruckbild | |
| EP2070010A1 (de) | Verfahren und vorrichtung zum erkennen eines gesichts sowie ein gesichtserkennungsmodul | |
| WO2012052106A1 (de) | Verfahren zur klassifizierung von mustern in bilddatensätzen | |
| DE10260642A1 (de) | Verfahren zur Erstellung einer Referenz für Fingerprints und zum Vergleich von Fingerprints | |
| WO2001086585A1 (de) | Verfahren und anordnung zum ermitteln eines objekts in einem bild | |
| AT7635U1 (de) | Verfahren und programmlogik zur objekterkennung | |
| Stojanović et al. | Fingerprint ROI segmentation using fourier coefficients and neural networks | |
| EP1402460B1 (de) | Automatische identifikation und/oder verifikation linienhafter texturen wie fingerabdrücke | |
| CN117935315A (zh) | 强化纹线信息的非接触掌纹识别方法及装置 | |
| EP3214602B1 (de) | Verfahren zur dreidimensionalen erfassung von objekten | |
| DE102008025213A1 (de) | Verfahren zur Segmentierung von Fingerabdruckbildern |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A1J | Withdrawal paragraph 166 lit. 6 | ||
| A1WE | Concession of restitution | ||
| ELJ | Ceased due to non-payment of the annual fee |