VERFAHREN ZUR VISUALISIERUNG VON DREIDIMENSIONALEN BILDERN AUF EINER 3D-ANZEIGEVORRICHTUNG UND
3D-ANZEIGEVORRICHTUNG
Die Erfindung betrifft ein Verfahren zur Visualisierung von dreidimensionalen Bildern auf einer 3D- Anzeigevorrichtung, wobei ein zu visualisierendes Bild als ein Eingabebild zugeführt wird. Des Weiteren betrifft die Erfindung eine SD- Anzeigevorrichtung, insbesondere ein stereoskopisches oder autostereo- skopisches Display, zur Visualisierung von dreidimensionalen Bildern.
Verfahren und 3D-Anzeigevorrichtungen der in Rede stehenden Art sind seit Jahren aus der Praxis bekannt. Es gibt stereoskopische Vorrichtungen, die mit Sehhilfen wie z.B. rot/blau-Brillen, Shutter- oder Polarisationsbrillen etc. das Betrachten eines dreidimensionalen Bildes ermöglichen.
Des Weiteren gibt es autostereoskopische Visualisierungssysteme, die es einem oder mehreren Betrachtern, die sich vor einem autostereoskopischen Display befinden, ermöglichen, ein dreidimensionales Bild ohne Sehhilfen betrachten zu können. Zu diesem Zweck dienen z.B. Parallaxen-Barriere-Systeme oder Lentikularlinsen-Systeme, die vor dem Display-Panel angeordnet sind. Da sich ein oder mehrere Betrachter in verschiedenen Winkeln relativ zu einer Richtung senkrecht zum Display befinden können, müssen stets mehr als zwei Perspektiven erzeugt und dem jeweiligen linken bzw. rechten Auge zugeführt werden, um in allen Positionen der Betrachter einen möglichst natürlichen dreidimensionalen Bildeindruck für den jeweiligen Betrachter zu ermöglichen. Diese Systeme werden auch als Mehr-Betrachter-Systeme oder Multiview- Systeme bezeichnet.
Bei den bekannten 3D-Anzeigevorrichtungen ist jedoch problematisch, dass die Qualität der Bildwiedergabe für den Betrachter bisher nicht zufriedenstellend ist.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren zur Visualisierung von dreidimensionalen Bildern auf einer 3D-Anzeigevorrichtung der eingangs genannten Art derart auszugestalten und weiterzubilden, dass die
BESTÄTIGUNGSKOPIE
Visualisierung von dreidimensionalen Bildern mit einfachen konstruktiven Mitteln verbessert ist. Des Weiteren ist eine entsprechende 3D-Anzeigevorrichtung anzugeben.
Erfindungsgemäß ist die voranstehende Aufgabe durch die Merkmale des Patentanspruchs 1 gelöst. Danach ist das in Rede stehende Verfahren zur Visualisierung von dreidimensionalen Bildern auf einer 3D-Anzeigevorrichtung dadurch gekennzeichnet, dass unter Verwendung des Eingabebilds mindestens eine Merkmalsmatrix bestimmt wird, wobei die Merkmalsmatrizen Hell/Dunkel- Informationen definieren, und dass aus dem Eingabebild unter Verwendung der Hell/Dunkel-Informationen ein Anzeigebild zur Wiedergabe auf der SD- Anzeigevorrichtung erzeugt wird.
Des Weiteren ist die voranstehende Aufgabe durch die Merkmale des Patentanspruchs 17 gelöst. Danach ist die in Rede stehende SD- Anzeigevorrichtung, insbesondere ein stereoskopisches oder autostereo- skopisches Display, zur Visualisierung von dreidimensionalen Bildern, dadurch gekennzeichnet, dass die 3D-Anzeigevorrichtung Mittel aufweist, die unter Verwendung eines zugeführten Eingabebilds mindestens eine Merkmalsmatrix bestimmen, wobei die Merkmalsmatrizen Hell/Dunkel-Informationen definieren, und dass die Mittel aus dem Eingabebild unter Verwendung der Hell/Dunkel- Informationen ein Anzeigebild zur Wiedergabe auf der 3D-Anzeigevorrichtung erzeugen.
In erfindungsgemäßer Weise ist zunächst einmal erkannt worden, dass es für die Visualisierung von dreidimensionalen Bildern von ganz erheblichem Vorteil ist, wenn man berücksichtigt, dass das menschliche Auge ein Vielfaches mehr an Hell/Dunkel-Rezeptoren als an Farbrezeptoren besitzt. In weiter erfindungsgemäßer Weise ist erkannt worden, dass es von besonderem Vorteil ist, wenn man das Verfahren bzw. die 3D-Anzeigevorrichtung an die Anatomie des Auges und die nachgeschaltete Informationsanzeige anpasst. Im Konkreten wird unter Verwendung des Eingabebildes mindestens eine Merkmalsmatrix bestimmt, wobei die Merkmalsmatrix bzw. die Merkmalsmatrizen Hell/Dunkel-Informationen definieren. Unter Verwendung der Hell/Dunkel-Informationen wird aus dem
Eingabebild ein Anzeigebild zur Wiedergabe auf der 3D-Anzeigevorrichtung erzeugt. Folglich ist mit einfachen konstruktiven Mitteln die Visualisierung von dreidimensionalen Bildern verbessert.
In vorteilhafter Weise kann das Eingabebild zwei Perspektiven - Teilbilder - umfassen, die einem linken und einem rechten Teilbild entsprechen.
Hinsichtlich einer einfachen Verarbeitung/Bearbeitung können die Teilbilder rektifiziert werden, d.h. auf Stereo-Normalform gebracht werden.
In vorteilhafter Weise können zur Erzeugung einer Merkmalsmatrix mittels einer Merkmalsextraktion Merkmale aus dem Eingabebild bzw. den Teilbildern extrahiert werden.
Dabei können die Merkmale lokale Eigenschaften beschreiben. Zum Beispiel können als lokale Eigenschaften Formen, Texturen und/oder Kanten berücksichtigt werden.
In einer vorteilhaften Ausgestaltung kann zur Merkmalsextraktion eine Sobel- Merkmalsextraktion verwendet werden.
In besonders vorteilhaftere Weise umfasst eine Merkmalsmatrix Kanteninformationen. Das menschliche Gehirn verwendet zu einem wesentlichen Teil Kanten an Objekten dazu, um im Gehirn das dreidimensionale Raumbild aufzubauen. Folglich werden durch die Kanteninformationen die Arbeit des Gehirns des Betrachters erheblich erleichtert und die Anpassung an die Anatomie des Auges und die nachgeschaltete Informationsverarbeitung im Gehirn verbessert.
In einer weiter vorteilhaften Ausgestaltung kann zur Merkmalsextraktion eine Speed up Robust Features (SURF) Merkmalsextraktion verwendet werden. Hinsichtlich weiterer Details in Bezug auf das SURF Verfahren sei auf H. Bay, T. Tuytelaars and L. V. Gool, "SURF: Speeded Up Robust Features", Computer Vision and Image Understanding, 110(3), 2008, pp. 346-359 verwiesen.
In vorteilhafter Weise kann eine Merkmalsmatrix Informationen über markante Bildpunkte umfassen.
In weiter vorteilhafter Weise kann durch eine Merkmalsmatrix einem Pixel einer Perspektive des Eingabebildes als Hell/Dunkel-Information ein Merkmalswert zugeordnet werden. Folglich können jedem Pixel einer Perspektive des Eingabebildes als Hell/Dunkel-Informationen Merkmalswerte zugeordnet werden.
In einer vorteilhaften Ausgestaltung kann der Merkmalswert auf die Subpixel des zugehörigen Pixels im Anzeigebild addiert und/oder multipliziert werden.
In vorteilhafterweise kann der Merkmalswert mit einem Skalierungsfaktor gewichtet werden. Zudem kann der Skalierungsfaktor durch eine Kontrolleinheit interaktiv, vorzugsweise mit einer Fernbedienung, veränderbar sein.
Es können bei einer Anzeigevorrichtung mit RGB-Subpixeln die Merkmale eines verwendeten Kanten-Operators zur Hervorhebung der Kanten in den RGB- Subpixeln verwendet werden. Ein Pixel, z.B. bestehend aus den RGB-Subpixeln, kann wie folgt an die Anatomie des Auges angepasst werden:
Rneu(i,j) := R(i,j) + M(i,j,1 ) - s,
Gneu(«J) := G(i,j) + M(i,j,1 ) . s,
Bneu(U) := B(i,j) + M(ij,1 ) - s, wobei R(i,j), G(i,j) und B(i,j) die jeweiligen Farben rot, grün und blau definieren. M(i,j,1) ist der Wert des Kanten-Operators bzw. der Merkmalsmatrix mit Kanteninformationen für den Pixel (i,j). s ist ein frei einzustellender Skalierungsparameter. Wenn er über eine Fernbedienung gesteuert wird, so kann sich jeder Betrachter die Kantenhervorhebung für sein Empfinden individuell einstellen.
Durch dieses Verfahren werden die Farbwerte des Stereobildes in den Kanten leicht hervorgehoben (aber nicht farbverfälscht) und für die Hell/Dunkel- Rezeptoren leichter erkennbar.
Dabei können mehrere Merkmale wie folgt integriert werden:
Rneu(i,j) := R(iJ) + s · ZM,(i,j) · s„
Gneu(i,j) := G(ij) + s · ZM,(i,j) · s„
Bneu(i,j) := B(i,j) + s · M,(i,j) · s„ mit den Merkmalsvektoren M(i,j) := (M(i,j,1 ),..., M(i,j,K)), wobei K die Anzahl der unterschiedlichen extrahierten Merkmale ist, und dem Wichtungsvektor
S:= (s,,..., sK) für jeden Pixel (i,j). Eine solche optische Aufwertung kann natürlich auch multiplikativ erfolgen.
Des Weiteren können in einer besonders vorteilhaften Ausgestaltung die Hell/Dunkel-Informationen mit zusätzlich ergänzten Hell/Dunkel-Subpixeln im Anzeigebild dargestellt werden. Die Hell/Dunkel-Subpixel können den Raumbildeindruck des Betrachters durch Anzeigen von Kanteninformationen erheblich verbessern.
Beispielsweise könnte als 3D-Anzeigevorrichtung ein autostereoskopisches Display charakterisiert sein durch ein Panel von Subpixeln und einem vorgeschalteten optischen Element. Die Subpixel können sowohl Farbsubpixel wie z.B. RGB oder CMY als auch Hell/Dunkel-Subpixel sein. In den Farbsubpixeln kann die Farbinformation der Subpixel der darzustellenden Perspektiven angezeigt werden. Die Hell/Dunkel-Subpixel können z.B. als Grauwerte den SD- Eindruck unterstützende Bildmerkmale enthalten. So wird berücksichtigt, dass das menschliche Auge ca. 1 10 Mio. Hell/Dunkel-Rezeptoren und nur ca. 6.5 Mio. Farbrezeptoren besitzt. Da außerdem das menschliche Gehirn zu einem wesentlichen Teil Kanten an Objekten dazu verwendet, um im Gehirn das dreidimensionale Raumbild aufzubauen, können über Hell/Dunkel-Subpixel Kanteninformationen angezeigt werden, und somit werden diese Bildinformationen
über die viel größere Anzahl der Hell/Dunkel-Rezeptoren aufgenommen. Die Arbeit des Gehirns wird erleichtert.
Zur Verbesserung der Qualität des Anzeigebildes kann zusätzlich die Anzahl der angezeigten Subpixel wesentlich erhöht werden. Ein pseudoholographisches Display kann z.B. mindestens 10 bis 20 mal so viele Subpixel enthalten wie in einem als Stereobild zugeführten Eingabebild vorhanden sind. Diese größere Anzahl der Subpixel ermöglicht es, aus den vielen Perspektiven, die synthetisiert werden, eine größere Anzahl von Pixeln pro Perspektive darzustellen. High- Definition-Bilder und -Videos der heutigen Generation besitzen etwa 1920x1080 Pixel mit 5760 Subpixel pro Zeile. Bei einer Verzehnfachung und unter Berücksichtigung derjenigen Subpixel, welche Merkmalsinformationen anzeigen, kann ein Display in vorteilhafter Weise mindestens 76.800x1080 Subpixel besitzen. Dabei wird berücksichtigt, dass bei den autostereoskopischen Displays die Zuordnung der Perspektiven auf Subpixel-Ebene erfolgt. Eine Zusammenfassung zu Pixeln ist dort nicht relevant.
In einer konkreten vorteilhaften Ausgestaltung kann als 3D-Anzeigevorrichtung ein stereoskopisches Display oder ein autostereoskopisches Display verwendet werden.
In einer weiteren vorteilhaften Ausgestaltung kann das Eingabebild eine erste Perspektive und eine zweite Perspektive aufweisen, wobei die zweite Perspektive durch Verschiebung der ersten Perspektive um einen Betrag m > 0 erzeugt wird. So kann in einem ersten Schritt das zugeführte 2D-Bild als linkes Teilbild verwendet werden. Als rechtes Teilbild kann das gleiche 2D-Bild jedoch um einen Betrag m > 0 nach rechts verschoben verwendet werden. Zudem kann eine Disparitätsmatrix der folgenden Art erzeugt werden:
D2D' : = { m l i = 1 NZ ; j = 1 NS }, wobei NZ die Anzahl der Zeilen und NS die Anzahl der Spalten ist.
Dadurch haben alle Betrachter den Eindruck, das 2D-Bild (welches noch als solches empfunden wird) schwebt in einem gewissen Abstand vor dem Display.
Würde das 2D-Bild um einen gewissen Betrag m < 0 nach links verschoben, so haben die Betrachter den Eindruck, das Bild wird ins Display nach innen verschoben.
Des Weiteren könnte man den Betrachter den Betrag m interaktiv wählen lassen, z.B. mittels einer Fernbedienung, so kann der Betrachter sich den„Pop-out"- oder „Pop-in"-Effekt jederzeit selbst einstellen.
In vorteilhafter Weise kann die 3D-Anzeigevorrichtung Subpixel aufweisen, die Subpixel zur Darstellung einer Farbe eines vorgebbaren Farbsystems und Hell/Dunkel-Subpixel zur Darstellung von Merkmalsinformationen umfassen.
Des Weiteren können die Subpixel in vorteilhafter Weise als eigenständige Elemente ausgebildet sein.
In vorteilhafter Weise können die Subpixel in horizontaler und vertikaler Richtung die gleiche Ausdehnung aufweisen. In besonders vorteilhafter Weise sind die Subpixel quadratisch ausgebildet, wodurch eine höhere Auflösung erzielt werden kann. Denkbar ist auch eine runde Ausgestaltung der Subpixel. So wird die bisher übliche Anforderung, dass alle Subpixel eines Pixels zusammen ein Quadrat bilden, fallen gelassen. Vielmehr ist jeder Subpixel ein eigenständiges Element. Jeder dieser Subpixel besitzt eine Farbe des gewählten Farbsystems und besitzt in horizontaler und vertikaler Richtung die gleiche Ausdehnung. Mit der OLED- oder Nano-Technologie ist dies technisch problemlos realisierbar.
Es gibt nun verschiedene Möglichkeiten, die Lehre der vorliegenden Erfindung in vorteilhafter Weise auszugestalten und weiterzubilden. Dazu ist einerseits auf die den Patentansprüchen 1 und 17 nachgeordneten Ansprüche und andererseits auf die nachfolgende Erläuterung eines bevorzugten Ausführungsbeispiels der Erfindung anhand der Zeichnung zu verweisen. In Verbindung mit der Erläuterung des bevorzugten Ausführungsbeispiels der Erfindung anhand der Zeichnung
werden auch im Allgemeinen bevorzugte Ausgestaltungen und Weiterbildungen der Lehre erläutert. In der Zeichnung zeigen
Fig. 1 ein Blockdiagramm zur Darstellung des Gesamtsystems gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens und der erfindungsgemäßen 3D-Anzeigevorrichtung,
Fig. 2 ein Flussdiagramm zu dem Gesamtsystem aus Fig. 1 ,
Fig. 3 ein herkömmliches Subpixel-Layout im Vergleich zu einem neuen
Subpixel-Layout gemäß einem Ausführungsbeispiel einer erfindungsgemäßen 3D-Anzeigevorrichtung,
Fig. 4 ein herkömmliches Subpixel-Layout im Vergleich zu einem neuen
Subpixel-Layout gemäß einem weiteren Ausführungsbeispiel einer erfindungsgemäßen 3D-Anzeigevorrichtung und
Fig. 5 das Subpixel-Layout aus Fig. 4, wobei eine größere Anzahl von unterschiedlichen Perspektiven angesteuert wird.
Fig. 1 zeigt ein Blockdiagramm zur Darstellung des Gesamtsystems gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens und der erfindungsgemäßen 3D-Anzeigevorrichtung. Das Ausführungsbeispiel gemäß Fig. 1 betrifft ein Verfahren zur Visualisierung von dreidimensionalen Bildern auf einem autostereoskopischen Display als 3D-Anzeigevorrichtung, auf welchem aus einem zugeführten Stereobild in einem beliebigen 3D-Format eine Vielzahl von Perspektiven, im allgemeinen mehr als 100, verkämmt auf dem Display angezeigt werden. Das Display besteht aus einem optischen Element und einer bilderzeugenden Einheit. Die Vielzahl von Perspektiven wird in der Weise erzeugt, dass immer nur diejenigen Pixel einer Perspektive erzeugt werden, welche auch angezeigt werden müssen. Die bilderzeugende Einheit des Displays besteht aus Subpixeln, welche eine Farbe, z.B. Rot, Grün oder Blau, abstrahlen.
Das autostereoskopische Display ist in der Lage ein 3D-Bild oder eine SD- Bildfolge in jedem Format, wie z.B. einem Stereobild oder einer Stereobildfolge, zu empfangen. Andere Formate, wie z.B. Stereobild inklusive einer Disparitätskarte, können ebenso empfangen und verarbeitet werden.
Ein empfangenes Stereobild wird zunächst rektifiziert, d.h. auf Stereo-Normalform bzw. in die epipolare Standardkonfiguration gebracht. Ist dies schon der Fall, so ergibt sich hier die identische Abbildung.
Anschließend werden gemäß Fig. 1 in den beiden Bildern R, und Rr verschiedene Merkmale wie z.B. Kanten oder markante Bildpunkte (SURF) identifiziert. Verschiedene Merkmale können hier extrahiert werden. Eine besondere Einschränkung ist nicht gegeben. Diese Merkmale werden sowohl für die Berechnung der Disparitätskarte, falls dies erforderlich ist, als auch für die Visualisierung in bestimmten zusätzlichen Subpixeln verwendet.
Wurde die Disparitätskarte bereits mit dem Eingabebild empfangen, so wird der nächste Schritt übersprungen. Ansonsten wird die Disparitätskarte des Stereobildes berechnet. Sie enthält eine Zuordnung der Pixel vom linken und rechten Teilbild, die in beiden empfangenen Perspektiven vorhanden sind. Außerdem werden die Links- und Rechtsverdeckungen identifiziert.
Mittels der Disparitätskarte D des empfangenen Stereobildes und der Merkmale werden sodann beliebig viele Perspektiven synthetisiert. Dabei wird so vorgegangen, dass immer nur diejenigen Subpixel synthetisiert werden, die auf dem Display auch tatsächlich angezeigt werden müssen. Folglich werden bei 100 anzuzeigenden Perspektiven aus jeder Perspektive nur 1 % der Subpixel berechnet.
Die Information, welche Perspektive auf welchem Subpixel angezeigt werden soll, ist in der Perspektivenkarte P festgelegt. Die Perspektivenkarte wird bei der Produktion des Displays durch einen Kalibrierungsprozess zwischen Subpixeln und optischem System festgelegt und abgespeichert. Benachbarte Subpixel sind im Allgemeinen unterschiedlichen Perspektiven zugeordnet. Die Speicherung der
verschiedenen Subpixel aus den unterschiedlichen Perspektiven im pseudoholographischen Bild B wird als Verkämmung bezeichnet.
Das autostereoskopische Display ist charakterisiert durch ein Panel von Subpixeln und einem vorgeschalteten optischen Element. Die Subpixel sind Farbsubpixel wie z.B. RGB oder CMY. In den Farbsubpixeln wird die Farbinformation der Subpixel der darzustellenden Perspektiven angezeigt.
Zur Verbesserung der Qualität des Bildes B wird zusätzlich die Anzahl der angezeigten Subpixel wesentlich erhöht. Ein pseudoholographisches Display gemäß Fig. 1 besitzt mindestens 10 bis 20 mal so viele Subpixel wie im empfangenen Stereobild vorhanden sind. Diese größere Anzahl der Subpixel ermöglicht es, aus den vielen Perspektiven, die synthetisiert werden, eine größere Anzahl von Pixeln pro Perspektive darzustellen.
Fig. 2 zeigt ein Flussdiagramm mit den einzelnen Schritten zu dem Gesamtsystem aus Fig. 1.
Im Folgenden werden die Schritte gemäß Fig. 1 und Fig. 2 näher beschrieben. Im Rahmen des Ausführungsbeispiels wird davon ausgegangen, dass durch ein Empfangsmodul z.B. über eine Antenne oder das Internet eine Bildfolge von Stereobildern empfangen, dekodiert und in den Speicherbereichen I, und lr zur Verfügung gestellt wird.
Nach dem Empfang wird das Stereobild auf die Auflösung des angeschlossenen pseudoholographischen Displays vergrößert bzw. verkleinert. Ein Display der Auflösung 19.200 x 10.800 Pixel kann als hochauflösend angenommen werden. In diesem Fall wird z.B. ein Stereo-HD-Bild zehnfach horizontal und vertikal vergrößert.
In einem ersten Schritt wird die Rektifizierung durchgeführt. Diese Verfahren sind aus der Literatur bekannt. Im Ausführungsbeispiel gemäß Fig. 1 und Fig. 2 werden im linken Teilbild I, neun markante Punkte, die gleichmäßig über das Bild verteilt sind, nach dem SURF- Verfahren gesucht. Die Koordinate eines jeden markanten
Punktes wird als Mittelpunkt eines Suchblockes im rechten Teilbild lr verwendet. In diesem Suchblock wird der ähnlichste Punkt im rechten Teilbild lr gesucht. Mittels der Disparitäten der neun markanten Punkte wird eine lineare Transformationsmatrix definiert, mit welcher jedes der Teilbilder I, und lr nach R, und Rr rektifiziert wird:
/, -> R, und \, -> Rr
Damit ist die Rektifizierung durchgeführt, sodass nun die Epipolaren parallel zu den Zeilen des Bildes laufen und alle späteren Operationen zeilenweise durchgeführt werden können.
Zur Berechnung von Merkmalen können z.B. das SURF (Speed up Robust Features) oder das Sobel-Edge-Detector Verfahren angewendet werden.
SURF-Merkmalsextraktion:
Dieses Verfahren beruht darauf, dass für jeden Pixel die Determinante der Hesse- Matrix approximiert wird. Dabei wird wie folgt vorgegangen.
In einer Matrix Isum, welche jeweils für das linke und rechte rektifizierte Teilbild erstellt wird, werden für jeden Pixel die Teilsummen der Grauwerte des unteren Bildbereiches gespeichert: süm(/,y') := ^ X /(/■ ,;' )
/,=o y,=o
mit i :=1 ,...NZ und j :=1 ,...NS, wobei NZ die Anzahl der Zeilen und NS die Anzahl der Spalten ist.
In der Berechnung wird so vorgegangen, dass zunächst jeder Zeile i eine Zeilenrecheneinheit i zugeordnet wird, welche die Teilsumme rekursiv berechnet:
Isum, (y) := Isum, (y - i)+ Rr (/', y)
für i := 1 ....NZ und j := 1 ,..NS und in Isum abspeichert. Danach wird jeder Spalte j eine Recheneinheit j zugeordnet, welche die Spaltensumme rekursiv berechnet: lsum(i, j) := lsum(j - 1, j) + lsumt (y)
für i := 1 ....NZ und j := 1 ...NS.
Die so berechnete Matrix enthält nun für jedes Teilbild links und rechts die gewünschten Teilsummen. Nun wird jeder Zeile i wieder eine Recheneinheit i
(=Zeilenrecheneinheit i) zugeordnet, welche zunächst die folgenden Zwischenwerte berechnet:
Dxx ('· y) := lsum(i - 4, j - 5) - lsum(i + 2 - 5)
+ lsum(i + 2, j ' + 4) - lsum(i - 4, j ' + 4)
- 3 · lsum(i + 2, j + 1) + 3 · lsum(i + 2 - 2)
+ 3 · lsum(i - 4, j ' + 1) - 3 · lsum(i - 4, j - 2)
Dyy (i> y) := lsum(i + 4, y + 2) - lsum(i + 4, j - 3)
+ lsum(i - 5, j + 2} + lsum(i - 5, j - 3)
- 3 · lsum(i + 1, y ' + 2) + 3 · lsum(i + 1, j - 3)
+ 3 · lsum(i - 2, y + 2) - 3 · lsum(i - 2, j - 3)
DRO (/', y) := lsum(i + 3, j + 3) - lsum(i + 3, y)
- Isum(i, y + 3) + lsum(i, j)
DLO (/', y) := lsum(i + 3, j - 1) - lsum(i + 3, y - 4)
- Isum(i, lsum(i, j - 4)
DLU ( , y) := lsum(i - 1, y - 1) - lsum(i - 1, y - 4)
- /st m(/' - 4, y - 1) + /st m(/' - 4, y - 4)
DRU ('> J) '■= lsum(i - 1, y + 3) - lsum(i - 1, j)
- Isum(i - 4, y + 3) + lsum(i - 4, j )
Danach ergibt sich
£> y (/'. y) := oto ( , j) + (/, j)■ DRO (/, y) - DLU ( , y)
Die approximierte Determinante der Hessematrix wird sodann für jeden Pixel des rechten Teilbildes in der Merkmalsmatrix Mr(1 ) abgespeichert:
Mr (/, y',1) := (/, j)■ Dyy ( , j) - 0,81 · (/, j)■ ( , j)
Die gleiche Vorgehensweise wird für jeden Pixel des linken Teilbildes R, durchgeführt und in der Merkmalsmatrix M,(1 ) abgespeichert. Insgesamt ergeben sich die Merkmalsmatrizen Mr(1 ) und M,(1 ). Hinsichtlich weiterer Details sei auf H. Bay, T. Tuytelaars and L. V. Gool, "SURF: Speeded Up Robust Features", Computer Vision and Image Understanding, 1 10(3), 2008, pp. 346-359 verwiesen.
Sobel-Merkmalsextraktion:
Der Sobel-Operator ist nur einer aus einer großen Anzahl von Kanten-Operatoren und ist daher exemplarisch beschrieben.
Für die Disparitätskarte ist ein Kanten-Operator von besonderer Bedeutung, da er hilft, dass bei der Zuordnung den Kanten eine höhere Bedeutung zugeteilt wird als den glatten Flächen. Da eine Kante immer auch eine regionale Eigenschaft ist, ermöglicht diese Vorgehensweise innerhalb einer Zeile auch die Eigenschaften von lokalen Regionen mit berücksichtigen zu können.
Der Sobel-Prewitt-Operator arbeitet z.B. mit 3x3.Matrizen, welche die Kanten in verschiedene Richtungen detektieren. Grundsätzlich sind hier horizontale,
vertikale, links und rechts diagonale Kanten zu unterscheiden. Zu ihrer Detektion werden die folgenden 3x3-Matrizen verwendet:
Eine Implementierung gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens geht dabei so vor, dass jeder Zeile i eine Zeilenrecheneinheit i zugeordnet wird. Für alle Zeilen i und Spalten j wird das recheneinheiten-lokale Feld Kante(1) bis Kante(9) aus dem rechten rektifizierten Teilbild Rr wie folgt gefüllt:
Kante ):=Rr(i-Xj-i) Kante{2):= Rr{j-\j) Kante(3):= F?r( -1,y' + l) Kante(4) := Rr(i,j-i) Kantei ) := Rr{i,j) Kante(6) :=Rr(i,j + i) Kante(7) := F?r( + 1,/-1) Kanteiß) := Rr(i + Xj) Kante(9) :=Rr(i + j + i) für i := 1.....NZ undj := 1.....NS Sodann berechnet jede Zeilenrecheneinheit i für jeden Index j:
ΗΛ := 2 · Kante(2) + 2 · Kante(5) + 2 · Kante(8)
- Kantet) - Kante(4) - Kante(7)
- Kante(3) - Kante(6) - Kante(9)
H2 := 2■ Kante(A) + 2 · Kante(5) + 2 · Kante{6)
- Kante(1) - Kante(2) - Kante(3)
- Kante(7) - Kante(8) - Kante(9)
H3 := 2 - Kante(7) + 2■ Kante(5) + 2■ Kante(3)
- Kante(1) - Kante(2) - Kante(4)
- Kante{8) - Kantefß) - Kante(6)
H4 := 2 - Kante(1) + 2 · Kante(5) + 2■ Kante{9)
- Kante(2) - Kante(3) - Kante(6)
- Kante(4) - Kante(7) - Kante(8)
Mr(i,j,2) ergibt sich dann als Mr(i,j,2) := Η + H2 + H3 + H4 für i = 1 ,...,NZ und j = 1 ,...NS.
Dieses Verfahren wird in gleicher Weise für das linke rektifizierte Teilbild R, durchgeführt. Insgesamt ergeben sich die Merkmalsmatrizen Mr(2) und M,(2).
Fig. 3 zeigt links ein herkömmliches Pixel-Layout mit den drei Subpixeln R (rot), G (grün) und B (blau). Mit diesen Subpixeln werden die drei Perspektiven 1 , 2 und 3 bedient unter Verwendung einer Lentikularlinse als optisches Element O. Fig. 3 zeigt rechts ein neues Subpixel-Layout, wobei die eigenständigen Subpixel gemäß einem Ausführungsbeispiel der erfindungsgemäßen 3D-Anzeigevorrichtung als autostereoskopisches Display eine quadratische Ausgestaltung aufweisen. Dabei können mit 9 Subpixeln 9 Perspektiven durch das optische Element O angesteuert werden.
In Fig. 4 ist links wiederum ein herkömmliches Pixel-Layout dargestellt. In Fig. 4 rechts ist ein weiteres Ausführungsbeispiel einer erfindungsgemäßen SD- Anzeigevorrichtung als autostereoskopisches Display gezeigt. Dort ist eine wesentlich feinere und detailliertere Subpixel-Struktur erzeugt. Anstelle von drei Subpixel im herkömmlichen Pixel-Layout sind im Subpixel-Layout des Ausführungsbeispiels 144 Subpixel erzeugt. Dabei sind die Subpixel R (rot), G (grün) und B (blau) um ein weiteres Subpixel W (z.B. weiss oder gelb) zur
Darstellung von Hell/Dunkel-Informationen ergänzt. Mit diesen 144 Subpixeln werden in der dargestellten Ausführung 36 Perspektiven angesteuert.
Fig. 5 zeigt das Subpixel-Layout aus Fig. 4, wobei die 144 einzelnen, eigenständigen Subpixel zur Ansteuerung von 144 Perspektiven verwendet werden.
Gemäß einem weiteren Ausführungsbeispiels des erfindungsgemäßen Verfahrens und einer erfindungsgemäßen 3D-Anzeigevorrichtung, kann für ein autostereoskopisches Display wie folgt vorgegangen werden.
Zur Anpassung an die anatomischen Gegebenheiten des menschlichen Auges werden zwei Eigenschaften berücksichtigt. Dies sind:
1. die Auflösung des Auges und
2. die Anzahl und Eigenschaften der Rezeptoren im Auge.
Die Auflösung des menschlichen Auges liegt i.A. zwischen 0,5' und 1 .5'. Daher haben heutige Displays meistens einen Dot-Pitch von 0,2 bis 0,3 mm. Das heißt, ab einem Abstand von ca. 1 m sind die Pixel des Displays nicht mehr zu erkennen. Bei dem hier vorgestellten Ausführungsbeispiel einer erfindungsgemäßen 3D-Anzeigevorrichtung liegt die Linsenbreite des verwendeten Linsenrasters im Bereich von 0,2 mm. Das heißt ca. 125 LPI (Linsen pro Inch). Dadurch ist die Linsenstruktur ab einem Betrachtungsabstand von ca. 1 m nicht mehr zu erkennen. Die Anzahl der Subpixel, die hinter einer Linse liegen, liegt in der Größenordnung von 10 Subpixeln pro Linse. Das heißt, dass der Dot-Pitch eines pseudoholographischen Displays in der Größenordnung von ca. 0,06 mm liegt. Während man bei konventionellen Displays z.B. 1920 x 1080 Pixel (HD-TV) darstellt, besteht ein hier vorgestelltes pseudoholographisches Display aus mindestens 19.200 x 1080 Pixeln.
Das Linsenraster kann z.B. aus Lentikularlinsen oder auch aus Hexagonallinsen bestehen, die in diesem Falle einen Durchmesser von 0,2 mm besitzen.
Berücksichtigt man, dass im menschlichen Auge ca. 6,5 Mio. Farbrezeptoren vorhanden sind und ca. 100 Mio. Hell/Dunkel-Rezeptoren, so ist ersichtlich, dass ca. 15 mal so viele Hell/Dunkel-Rezeptoren vorhanden sind wie Farbrezeptoren. Des Weiteren verwendet das menschliche Gehirn für die Erzeugung des inneren Raumbildes zu einem sehr großen Teil die Kanteninformation. Kanten geben mit den dort vorhandenen Rechts- und Linksverdeckungen Auskunft über die Vorne/Hinten-Beziehung von Objekten.
In einem Ausführungsbeispiel werden daher besonders vorteilhaft die bekannten Subpixel RGB oder YMC durch Hell/Dunkel-Subpixel ergänzt, welche die in der Merkmalextraktionsphase durch die Kanten-Operatoren erzeugte Kanteninformation anzeigen.
Homogene Flächen enthalten keine Kanten. Die Hell/Dunkel-Subpixel stellen dort im Bild keine Information dar.
Kanten werden in den Hell/Dunkel-Subpixeln gemäß der Intensität der erkannten Kante heller dargestellt. Dadurch werden die im Bild vorhandenen Kanten hervorgehoben und durch die 100 Mio. Hell/Dunkel-Rezeptoren leichter erkannt.
Das Gehirn hat es so leichter das innere Raumbild zu erzeugen. Muster auf homogenen Flächen werden im menschlichen Gehirn aufgrund des Lerneffektes als solche erkannt und beeinflussen den Raumbildeindruck nicht.
Die geometrische Anordnung der Hell/Dunkel-Subpixel kann erfindungsgemäß variiert werden. In Fig. 3, Fig. 4 und Fig. 5 sind verschiedene Aufteilungen dargestellt. Neben den Hell/Dunkel-Subpixeln zur Verbesserung der Kanten- Erkennung können noch weitere Merkmale zur Raumbilderzeugung hinzugefügt werden. Hier sei exemplarisch, aber nicht ausschließlich, der SURF-Operator genannt.
Zusätzlich wird die Aufteilung der Pixel in Farb-Subpixel (i. A. RGB-Subpixel) aufgehoben. Berücksichtigt man, dass die Zuordnung der Perspektiven für ein autostereoskopisches Display immer auf der Ebene der Subpixel mit Färb- und
Hell/Dunkel-Subpixeln stattfindet, so wird in dem hier beschriebenen Display auf die Gruppierung von Subpixeln zu Pixeln verzichtet. Jeder Färb- oder Hell/Dunkel- Subpixel ist für sich ein eigenständiges Lichtelement, dem eine bestimmte Perspektive zugeordnet ist, und besitzt in horizontaler und vertikaler Richtung die gleiche Ausdehnung. Dies ist in Fig. 3, Fig. 4 und Fig. 5 jeweils auf der rechten Seite bereits berücksichtigt. Eine Rückwärts-Kompatibilität ist weiterhin gegeben, sodass auch alle 2D-Bilder und -Videos problemlos dargestellt werden können. Die Herstellung eines solchen autostereoskopischen Displays ist auf Basis der OLED-Technologie möglich.
Hinsichtlich weiterer vorteilhafter Ausgestaltungen des erfindungsgemäßen Verfahrens und der erfindungsgemäßen Anzeigevorrichtung wird zur Vermeidung von Wiederholungen auf den allgemeinen Teil der Beschreibung sowie auf die beigefügten Ansprüche verwiesen.
Schließlich sei ausdrücklich darauf hingewiesen, dass die voranstehend beschriebenen Ausführungsbeispiele des erfindungsgemäßen Verfahrens und der erfindungsgemäßen Vorrichtung lediglich zur Erörterung der beanspruchten Lehre dienen, diese jedoch nicht auf die Ausführungsbeispiele einschränken.