WO2004008393A1 - Verfahren zum komprimieren und dekomprimieren von videobilddaten - Google Patents

Verfahren zum komprimieren und dekomprimieren von videobilddaten Download PDF

Info

Publication number
WO2004008393A1
WO2004008393A1 PCT/EP2003/007451 EP0307451W WO2004008393A1 WO 2004008393 A1 WO2004008393 A1 WO 2004008393A1 EP 0307451 W EP0307451 W EP 0307451W WO 2004008393 A1 WO2004008393 A1 WO 2004008393A1
Authority
WO
WIPO (PCT)
Prior art keywords
objects
data
image
determined
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/EP2003/007451
Other languages
English (en)
French (fr)
Inventor
Uwe Prochnow
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Atvisican AG
Original Assignee
Atvisican AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Atvisican AG filed Critical Atvisican AG
Priority to UAA200501272A priority Critical patent/UA84274C2/ru
Priority to JP2004520560A priority patent/JP2005533419A/ja
Priority to MXPA05000563A priority patent/MXPA05000563A/es
Priority to EP03763779A priority patent/EP1522050B1/de
Priority to EA200500194A priority patent/EA006638B1/ru
Priority to CA002492141A priority patent/CA2492141A1/en
Priority to DE50302754T priority patent/DE50302754D1/de
Priority to BRPI0312618A priority patent/BRPI0312618A2/pt
Priority to AU2003250021A priority patent/AU2003250021B2/en
Priority to US10/521,116 priority patent/US20060153288A1/en
Publication of WO2004008393A1 publication Critical patent/WO2004008393A1/de
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/04Colour television systems using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Definitions

  • the invention relates to a method for compressing and decompressing video image data from video image sequences or the like. , which are present as a sequence of associated pixel data in each case in two-dimensionally addressable pixels, whereby the pixel data of selected pixel sets are analyzed with mathematical functions and reduced to their functional parameters and, after storage and / or transmission, are decompressed with a correspondingly mathematical function, largely regenerated.
  • Such methods have become known under the ISO standards MPEG, MPEG1 to MPEG4, JPEG, etc.
  • functional parameters are determined by a differential analysis, pattern analysis, Fourier analysis or the like.
  • the pixel quantity data of image sections, so-called tiles, and in particular of such tile data in relation to the tile data of the tile with the same image line and image column coordinates from previous video images and below Consideration of changes in these video image sequences according to agreed standard frame formats.
  • the frame formats each contain an indication of the corresponding compression function, the more compressively selected the more the content of successive images or similar tiles of such images match, and the parameters obtained in each case when the function is used.
  • the information about the respective compression function is taken from the frame in each case and the original pixel quantity, with the exception of tolerance errors, is restored in accordance with a corresponding function and the parameters provided and, if appropriate, data from the tile (s) of at least one previous image.
  • the solution is that in a basic analysis of the video data of a video picture
  • Contain a number of pixels below a predefinable threshold be assigned to a background, one for the individual objects and the background
  • Color dominance and a color gradient is determined vectorially according to direction and size, the position and extent of the individual objects are determined vectorially, one for each object and the background
  • Structure function is determined, and that in the case of subsequent analyzes of video images, the differential changes in brightness
  • Objects are determined, the objects thus defined and and the background, together with the optical, positional and structural data thus obtained, are arranged and provided in a structured basic frame or subsequent frame; the basic framework and
  • Subframe data becomes decompression and one
  • Image processing is transformed into pixel data by determining the associated contour position data in the pixel image from the basic frame data, for the background of the image and the objects, each limited by the contour position data, the pixel representation according to the respective associated structural function
  • Pixel data are filled in according to the color dominance value and the
  • the compilations of the mathematical functional descriptions of the various objects can also be taken from the neural network, which are only to be provided with corresponding current parameters, such as radius, center point vector, start and end coordinates, etc.
  • the structure function of an object is often the same or close to that of objects of the same type, so that it can serve as a first approximation if it is stored in the neural network and removed from it.
  • a very high compression is advantageously achieved by using the knowledge that the pixel data of a pixel line is a series of numbers that can be represented by elementary arithmetic operations performed with natural numbers.
  • the division and the nth root in particular are simple operations which bring more or less periodic pixel data of a line well approximated.
  • the display of the line then shrinks to the encrypted specification of the function and the numerical values, which are preferably shown as the sum or differences of prime powers.
  • Each structure description of this type that has already been found for a pixel data sequence is preferably stored in a neural network, so that it can be used there directly or as a first approximation when a similar pixel data sequence is available later.
  • the pixel data can be generated from the structure data during the runtime of an image display; decompression is completely problem-free.
  • the compression of video runtime data in its individual steps is advantageously adapted in its precision to the tolerance of deviations.
  • the minimum number of pixels for which an object is defined is adapted to a computing time that is still available.
  • the largest objects are processed first and if there is still computing time for a picture time, smaller objects are separated from the background and described in detail geometrically and structurally and placed in the frame.
  • a maximum time specification is advantageously made, whereby the knowledge is used that deviations of the individual pixel data, if they do not occur in an adjacent manner, do not occur bring significant image quality losses, since the structure affects only the general appearance of the surface of an object but no image details.
  • xth root from a high m +/- b high n through c high p +/- d high q;
  • x integer 1 ⁇ 3;
  • a, b, c, d prime numbers up to 17;
  • m, n, p, q integer 1 -s- 9.
  • 256 pixels of an image line section or of an 8 x 8 or 16 x 16 pixel image section are taken as the pixel quantity to be analyzed.
  • the pixel data is usually encrypted in 8-bit. Accordingly, the operations are not carried out decimal or hexadecimal but modulo 256, so that the source data such as the encryption data and the recovered target data are always immediately available as 8-bit pixel data.
  • Fig. 1 shows a block diagram of the image encryption.
  • the video data VD are gradually subjected to the various process steps.
  • the object recognition OE takes place first, the objects 01 *; 02 * as well as the first neural network NN1 stored objects can be used as auxiliary information.
  • the recognized objects are subjected to object smoothing OG, a resolution limit MIN being specified.
  • the smoothed objects are subjected to an object description taking into account the neighborhood boundary relationships, so that objects 01, 02 etc. are functionally stored in the frame FR.
  • the OLV of the position and direction vectors 0L1, 0L2 etc. is determined for the individual objects, as is the color description OFV using the color and gradient vector OF1, OF2 etc.
  • the structure functions and their parameters 0S1, 0S2 etc. for objects 01, 02 etc. are preferably determined with the aid of a second neural network NN2 and stored in the frame FR, as are the position and color vectors.
  • the color vectors HGF and the background structures HGS are determined from the background HG and placed in the frame FR.
  • a complete frame FR of an image is then provided as a historical frame FRH, the contents of which, each marked with an asterisk on the reference symbol, are made available as the starting material for the encryption of the next image.
  • the encryption time is monitored by a time manager TMG and kept within limits by suitable specifications of the minimum resolution MIN and the maximum time TMAx of the structure analysis.
  • a very high packing density in the frame can also be achieved if three bits for eight functions, 3 bits for the eight first prime numbers and two bits for their exponents from 1-4 are stored in a byte.
  • B. encode the four basic arithmetic operations, the root and power functions and formula brackets.
  • further special functions can be specified in the further 5 bits of the byte, such as a formula end character or complex functions.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Color Television Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Circuits (AREA)

Abstract

Verfahren zum Komprimieren und Dekomprimieren von Videobilddaten, wobei in einer Grundanalyse der Videodaten eines Videobildes Konturen von Bildstrukturen anhand von sprunghaften Änderungen von Helligkeit und/oder Farbwert bei einander benachbarten Pixeln ermittelt werden, die so gefundenen Konturen, jeweils abschnittweise durch eine parametrisierte mathematische Funktion beschrieben und als Objekte definiertt werden, für die einzelnen Objekte eine Farbdominanz und ein Farbverlauf sowie die Lage und eine Erstreckung der einzelnen Objekte und eine Strukturfunktion ermittelt wird, and dass bei Folgeanalysen von Videobildern jeweils die differentiellen Veränderungen der Helligkeit, Grösse, Lage und Orientierung der Objekte unter Berücksichtigung gemeinsamer Konturen aneinanderstossender Objekte bestimmt werden. Die so definierten Objekte werden in einem strukturierten Grundrahmen oder Folgerahmen angeordnet und bereitgestellt. Die Konturanalyse und die Strukturanalyse wird mittels neuronaler Netze vorgenommen.

Description

VERFAHREN ZUM KOMPRIMIEREN UND DEKOMPRIMIEREN VON VIDEOBILDDATEN
Die Erfindung betrifft ein Verfahren zum Komprimieren und Dekomprimieren von Videobilddaten von Videobildfolgen od. dgl . , die als eine Folge von jeweils in zweidimensional adressierbaren Pixeln zugehöriger Pixeldaten vorliegen, wobei jeweils die Pixeldaten ausgewählter Pixelmengen mit mathematischen Funktionen analysiert und auf deren Funktionsparamter reduziert komprimiert werden und nach einer Speicherung und/oder Übertragung mit einer entsprechend mathematischen Funktion weitgehend regeneriert dekomprimiert werden.
Derartige Verfahren sind unter den ISO-Standards MPEG, MPEG1 bis MPEG4 , JPEG, etc. bekannt geworden. Bei diesen werden durch eine Differentialanalyse, Musteranalyse, Fourieranalyse od. dgl. der Pixelmengendaten von Bildausschnitten, sog. Kacheln, und insbesondere von solchen Kacheldaten in Bezug auf die Kacheldaten der Kachel mit gleichen Bildzeilen- und Bildspalten-Koordinaten von vorhergehenden Videobildern Funktionsparamter ermittelt und unter Berücksichtigung von Veränderungen in diesen Videobildfolgen verabredente Standard- Rahmenformaten gemäß dargestellt. Die Rahmenformate enthalten jeweils eine Angabe der entsprechenden Kompressionsfunktion, die jeweils umso weitergehend komprimierend ausgewählt ist je stärker der Inhalt aufeinanderfolgender Bilder oder gleichgelagerter Kacheln von solchen Bildern übereinstimmen, und die bei der Anwendung der Funktion jeweils gewonnenen Paramter . Zur Dekompression wird jeweils aus dem Rahmen die Angabe über die jeweilige Kompressionsfunktion entnommen und dieser gemäß mittels einer entsprechenden Funktion und den bereitgestellten Parametern sowie ggf. Daten der Kachel (n) mindestens eines vorhergehenden Bildes die ursprüngliche Pixelmenge bis auf Toleranzfehler wieder hergestellt.
Es ist Aufgabe der Erfindung, eine wesentlich höhere Komprimierung der Daten im Echtzeitdurchlauf von Videobildfolgedaten bei annähernd gleicher Bildqualität wie die bekannten Verfahren zu erbringen.
Die Lösung besteht darin, daß in einer Grundanalyse der Videodaten eines Videobildes
Konturen von Bildstrukturen anhand von sprunghaften
Änderungen von Helligkeit und/oder Farbwert bei einander benachbarten Pixeln ermittelt werden, durch Interpolation eine Konturglättung und -Schließung vorgenommen wird, die so gefundenen Konturen jeweils abschnittsweise durch eine parametrisierte mathematische Funktion beschrieben und als Objekte definiert werden, wobei alle Objekte, die eine
Pixelanzahl unterhalb einer vorgebbaren Schwelle enthalten, einem Hintergrund zugeordnet werden, für die einzelnen Objekte und den Hintergrund eine
Farbdominanz und ein Farbverlauf vektoriell nach Richtung und Größe ermittelt wird, die Lage und Erstreckung der einzelnen Objekte jeweils vektoriell bestimmt werden, für die einzelnen Objekte und den Hintergrund je eine
Strukturfunktion ermittelt wird, und daß bei Folgeanalysen von Videobildern jeweils die differentiellen Veränderungen der Helligkeit,
Größe, Lage und Orientierung der Objekte unter Berücksichtigung gemeinsamer Konturen aneinanderstoßender
Objekte bestimmt werden, die so definierten Objekte und und der Hintergrund zusammen mit ihren so gewonnenen optischen, lagemäßigen und strukturellen Daten in einem strukturierten Grundrahmen oder Folgerahmen angeordnet und bereitgestellt werden; die demgemäß bereitgestellten Grundrahmen- und
Folgerahmendaten werden zur Dekompression und einer
Bildwiederaufbereitung in Pixeldaten transformiert, indem aus den Grundrahmendaten aus den Objekten deren zugehörigen Konturlagedaten im Pixelbild bestimmt werden, für den Hintergrund des Bildes und die Objekte, jeweils anhand der Konturlagedaten begrenzt, die Pixeldarstellung entsprechend der jeweilig zugehörigen Strukturfunktion mit
Pixeldaten aufgefüllt werden, die gemäß des Farbdominanzwertes und des
Farbverlaufsvektors sowie des Helligkeitswertes restituiert werden, und die Folgerahmendaten jeweils auf die vorherige
Pixeldarstellung zur Verlagerung und/oder Veränderung der
Objekte angewandt werden.
Vorteilhafte Ausgestaltungen sind in den Unteransprüchen angegeben .
Die Ermittlung und Beschreibung der Objekte anhand ihrer Konturen und deren Strukturen führt zu der extrem hohen Datenkompression im Vergleich zu den herkömmlichen Verfahren, bei denen jeweils einzelne rechteckige Ausschnitt bearbeitet werden, ohne einen größeren bildlichen Zusammenhang zu erfassen und zu nutzen.
Zur Beschleunigung des Verfahrens werden außerdem in den einzelnen Verfahrensschritten vorteilhafte neuartige Methoden angewandt, die auch als selbständige Erfindungen zu werten sind. Aufgrund der Erkenntnis, daß sich viele Objekte in ihrer Grundstruktur und in ihrer Beziehung zu anderen gleichen, z. B. Kopf, Arme, Oberkörper, Unterkörper, Beine zu einer Person etc., werden einmal erkannte und funktionsmäßig charakterisierte Objekte anhand ihrer Daten in einem neuronalen Netz zugeordnet zu dessen weiteren und zugehörigen Objekten Konturdaten abgelegt, so daß jeweils zu einem aufgefundenen Objekt üblicher Weise angrenzende Objekte später unmittelbar aufgefunden werden und zur Erleichterung der Konturermittlung herangezogen werden können .
Auch können die Zusammenstellungen der mathematischen Funktionsbeschreibungen der verschiedenen Objekte aus dem neuronalen Netz entnommen werden, die nur mit entsprechenden aktuellen Parametern, wie Radius, Mittelpunktsvektor, Anfangsund Endkoordinaten etc. zu versehen sind.
Auch die Strukturfunktion eines Objektes ist häufig der gleichartiger Objekte gleich oder nahekommend, so daß sie als erste Annäherung dienen kann, wenn sie im Neuronennetz gespeichert ist und diesem entnommen wird.
Eine sehr hohe Kompression wird vorteilhaft durch die Nutzung der Erkenntnis erreicht, daß die Pixeldaten einer Pixelzeile jeweils eine Zahlenreihe ist, die sich durch mit natürlichen Zahlen ausgeführte elementare Rechenoperationen darstellen läßt. Insbesondere die Division und die n-te Wurzel sind einfache Operationen, die mehr oder weniger periodische Pixeldaten einer Zeile gut angenähert erbringen. Die Darstellung der Zeile schrumpft dann auf die verschlüsselte Angabe der Funktion und die Zahlenwerte, die vorzugsweise als Summe oder Differenzen von Primzahlenpotenzen dargestellt sind. Jede bereits zu einer Pixeldatenfolge aufgefundene derartige Strukturbeschreibung wird vorzugsweise in einem neuronalen Netz abgelegt, so daß sie dort unmittelbar nutzbar oder als erste Annäherung bei späterem Vorliegen einer ähnlichen Pixeldatenfolge abzurufen ist.
Da die zu verwendenden Funktionen elementar sind und von üblichen Rechnern mit hoher Geschwindigkeit als Festkommaoperationen auszuführen sind, lassen sich aus den Strukturdaten die Pixeldaten in der Laufzeit einer Bildwiedergabe generieren; die Dekompression ist völlig problemlos .
Die Kompression von Video-Laufzeitdaten wird in ihren einzelnen Schritten vorteilhaft in ihrer Präzision an die Verträglichkeit von Abweichungen angepaßt.
Es wird bei der Konturdatenermittlung, Glättung etc. einer hohen Auflösung von bewegten Vordergrundobjekten mehr Aufmerksamkeit gewidmet als dem Hintergrund und den passiven Objekten zuteil wird, indem den Objekten jeweils zur Bearbeitung unterschiedliche maximale Rechenzeiten zugeteilt werden.
Weiterhin wird die Minimal -Anzahl der Pixel, für die ein Objekt definiert wird, jeweils einer noch verfügbaren Rechenzeit angepaßt. Die größten Objekte werden zuerst bearbeitet und soweit noch Rechenzeit für eine Bildzeit übrig ist, werden kleinere Objekte aus dem Hintergrund herausgetrennt und detailliert geometrisch und strukturell beschrieben und in den Rahmen eingestellt .
Für die Ermittlung einer Strukturfunktion eines Objektes wird vorteilhaft jeweils eine MaximalZeitvorgabe vorgenommen, wobei die Erkenntnis genutzt wird, daß Abweichungen der einzelnen Pixeldaten, wenn sie nicht benachbart gehäuft auftreten, keine wesentlichen Bildqualitätseinbußen erbringen, da die Struktur nur das allgemeine Aussehen der Oberfläche eines Objektes aber keine Bilddetails betrifft.
Als Beispiel einer Strukturfunktion sei zur Veranschaulichung genannt :
x-te Wurzel aus a hoch m +/- b hoch n durch c hoch p +/- d hoch q; x = ganzzahlig 1 ^ 3; a, b, c, d = Primzahlen bis 17; m, n, p, q = ganzzahlig 1 -s- 9.
Als zu analysierende Pixelmenge werden beispielsweise jeweils 256 Pixel eines Bildzeilenabschnittes oder eines 8 x 8 oder 16 x 16 Pixelbild-Ausschnittes genommen. Die Pixeldaten sind gewöhnlich in 8-bit verschlüsselt. Demgemäß werden die Operationen nicht dezimal oder hexadezimal sondern modulo 256 ausgeführt, so daß die Quelldaten wie die Verschlüsselungsdaten und die zurückgewonnenen Zieldaten stets als 8-bit Pixeldaten unmittelbar vorliegen.
Werden mehrere Zeilenabschnitte einer Bildzeile oder aufeinanderfolgender Bildzeilen analysiert, so ergibt sich häufig aus einer Fortführung und/oder aus einer Versetzung um einige Stellen der zuvor zutreffenden Strukturfunktion eine passende Lösung in sehr einfacher und zeitsparender Weise. Statt einer neuen Strukturfunktion wird dann die Abwandlung im zugehörigen Rahmen angegeben.
Fig. 1 zeigt ein Blockschaltbild der Bildverschlüsselung.
Die Videodaten VD werden nach und nach den verschiedenen Verfahrensschritten unterzogen.
Als erstes erfolgt die Objekterkennung OE, wobei die im Bild zuvor erkannten Objekte 01*; 02* sowie die in einem ersten neuronalen Netz NN1 abgelegten Objekte als Hilfsinformationen genutzt werden. Die erkannten Objekte werden einer Objektglättung OG unterzogen, wobei eine Auflösungsgrenze MIN vorgegeben ist.
Die geglätteten Objekte werden einer Objektbeschreibung unter Beachtung der Nachbarschaftsgrenzbeziehungen unterzogen, so daß die Objekte 01, 02 etc. funktional in dem Rahmen FR abgelegt werden.
Zu den einzelnen Objekten erfolgt die Festlegung OLV der Lage- und Richtungsvektoren 0L1, 0L2 etc. sowie die Farbbeschreibung OFV mittels der Färb- und Farbverlaufsvektoren OF1, OF2 etc.
Weiterhin werden zu den Objekten 01, 02 etc. die Strukturfunktionen und deren Parameter 0S1, 0S2 etc. vorzugsweise unter Zuhilfenahme eines zweiten neuronalen Netzes NN2 bestimmt und im Rahmen FR abgelegt, ebenso wie die Lage- und Farbvektoren .
Sind alle Objekte im Rahmen festgehalten, werden vom Hintergrund HG noch die Farbvektoren HGF und die Hintergrundstrukturen HGS ermittelt und in den Rahmen FR abgestellt. Ein kompletter Rahmen FR eines Bildes wird dann als historischer Rahmen FRH bereitgestellt, dessen Inhalte, die jeweils mit einem Stern am Referenzzeichen gekennzeichnet sind, der Verschlüsselung des nächsten Bildes als Ausgangsmaterial zur Verfügung gestellt.
Falls nur geringe Änderungen der Farbe, Lage, Struktur oder Orientierung eines Objektes festgestellt wird, werden nur die Änderungen im Folgerahmen spezifiziert, was eine erhebliche Einsparung an Verarbeitungszeit, Speicher- und Übertragungskapazität erbringt . Jeweils aufgefundene Objektbeschreibungen, ihre Nachbarschaftsbeziehungen sowie die Strukturfunktionen werden den Basen der neuronalen Netze NN1 , NN2 zugeführt, so daß ähnliche Objekte und Strukturen aufgefunden und bei der Verschlüsselung neuer Bilder genutzt werden.
Die Verschlüsselungszeit wird jeweils über einen Zeitmanager TMG überwacht und durch geeignete Vorgaben der Mindestauflösung MIN und der Maximalzeit TMAx der Strukturanalyse in Grenzen gehalten.
Eine Alternative der Berechnung der Strukturfunktionen zur zuvor beschriebenen läßt sich ähnlich vorteilhaft mit hexadezimalen Operationen vornehmen, wozu die üblichen 8-bit-Pixelinfor- mationen in zwei 4-bit-Zeichen geteilt werden und so die doppelte Stellenzahl berechnet und auf größtmögliche Ähnlichkeit geprüft wird. Die Funktionen und deren Parameter werden zweckmäßig, insbesondere in dem Zusammenhang, auch als Hexadezimalziffern verschlüsselt und paarweise in 8-bit Bytes im Rahmen verpackt. Je nach der angegebenen Funktion sind mehr oder weniger Parameter anzugeben.
Eine sehr hohe Packungsdichte im Rahmen läßt sich auch dadurch erreichen, wenn in einem Byte jeweils drei Bit für acht Funktionen, 3 Bit für die acht ersten Primzahlen und zwei Bit für deren Exponenten von 1 - 4 abgelegt werden. Als Funktionselemente lassen sich z. B. die vier Grundrechenarten, die Wurzel- und Potenzfunktion sowie Formelklammern verschlüsseln. Zu den Klammerfunktionen lassen sich in den weiteren 5 bit des Bytes weitere Sonderfunktionen angeben, wie ein Formelendezeichen oder komplexe Funktionen.

Claims

Patentansprüche
1. Verfahren zum Komprimieren und Dekomprimieren von
Videobilddaten von Videobildfolgen od. dgl., die als eine
Folge von jeweils in zweidimensional adressierbaren Pixeln zugehöriger Pixeldaten vorliegen, wobei jeweils die
Pixeldaten ausgewählter Pixelmengen mit mathematischen
Funktionen analysiert und auf deren Funktionsparamter reduziert komprimiert werden und nach einer Speicherung und/oder Übertragung mit einer entsprechenden mathematischen Funktion weitgehend regeneriert dekomprimiert werden, dadurch gekennzeichnet, daß in einer
Grundanalyse der Videodaten eines Videobildes
Konturen von Bildstrukturen anhand von sprunghaften
Änderungen von Helligkeit und/oder Farbwert bei einander benachbarten Pixeln ermittelt werden, durch Interpolation eine Konturglättung und -Schließung vorgenommen wird, die so gefundenen Konturen jeweils abschnittsweise durch eine parametrisierte mathematische Funktion beschrieben und als Objekte definiert werden, wobei alle Objekte, die eine
Pixelanzahl unterhalb einer vorgebbaren Schwelle enthalten, einem Hintergrund zugeordnet werden, für die einzelnen Objekte und den Hintergrund eine
Farbdominanz und ein Farbverlauf vektoriell nach Richtung und Größe ermittelt wird, die Lage und Erstreckung der einzelnen Objekte jeweils vektoriell bestimmt werden, für die einzelnen Objekte und den Hintergrund je eine
Strukturfunktion ermittelt wird, und daß bei Folgeanalysen von Videobildern jeweils die differentiellen Veränderungen der Helligkeit,
Größe, Lage und Orientierung der Objekte unter
Berücksichtigung gemeinsamer Konturen aneinanderstoßender
Objekte bestimmt werden, die so definierten Objekte und der Hintergrund zusammen mit ihren so gewonnenen optischen, lagemäßigen und strukturellen Daten in einem strukturierten Grundrahmen oder Folgerahmen angeordnet und bereitgestellt werden; die demgemäß bereitgestellten Grundrahmen- und Folgerahmendaten werden zur Dekompression und einer Bildwiederaufbereitung in Pixeldaten transformiert, indem aus den Grundrahmendaten aus den Objekten deren zugehörigen Konturlagedaten im Pixelbild bestimmt werden, für den Hintergrund des Bildes und die Objekte, jeweils anhand der Konturlagedaten begrenzt, die Pixeldarstellung entsprechend der jeweilig zugehörigen Strukturfunktion mit Pixeldaten aufgefüllt werden, die gemäß des Farbdominanzwertes und des
Farbverlaufsvektors sowie des Helligkeitswertes restituiert werden, und die Folgerahmendaten jeweils auf die vorherige Pixeldarstellung zur Verlagerung und/oder Veränderung der Objekte angewandt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die beschriebenen Objekte mit ihren mathematischen Funktionen in einem neuronalen Netz (NN1) abgelegt werden, das der weiteren Erkennung (OE) von Objekten in Videobilddaten (VD) dient .
3. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß ermittelte Strukturfunktionen (OS) mit deren Parametern von Objekten und Hintergründen in einem neuronalen Netz (NN2) gespeichert werden, das bei der weiteren Ermittlung von Strukturfunktionen (OS) mit deren Parametern als eine Ausgangsbasis dient.
4. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß die Strukturfunktion (OS) jeweils als eine mathematische Funktion dargestellt ist und die Parameter ganzzahlige Größen sind und die Funktion eine unbegrenzte Zahl von Nachkommasteilen liefert.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Strukturfunktion (OS) ein Bruch, eine n-te Wurzel oder eine transzendente Funktion ist.
6. Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet, daß die ganzzahligen Größen als Potenzen von Primzahlen sowie Summen oder Differenz von diesen verschlüsselt dargestellt sind.
7. Verfahren nach einem der Ansprüche 4 bis 6, dadurch gekennzeichnet, daß die Parameter modulo 2 hoch 8 dargestellt sind und die Funktion mit Größen, die modulo 2 hoch 8 dargestellt sind, ausgeführt werden und solche Größen als Nachkommastellen liefern.
8. Verfahren nach einem der Ansprüche 4 bis 7, dadurch gekennzeichnet, daß die einzelnen Strukturfunktionen (OS) jeweils annähernd passend zu einer Pixeldatenfolge eines Bildzeilenabschnittes einer vorgegebenen Länge oder eines rechteckigen Pixelbildausschnittes bestimmt werden.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß der Zeilenabschnitt eine Länge von 64, 128 oder 256 Bytes hat oder der Pixelbildausschnitt eine Größe von 8 mal 8 oder 16 mal 16 Bytes aufweist.
10. Verfahren nach einem der Ansprüche 8 oder 9, dadurch gekennzeichnet, daß die Strukturfunktion (OS) jeweils solange oder so genau durch sukzessive Approximation an die jeweils annährend darzustellende Pixeldatenfolge angepaßt wird, die durch eine Zeitvorgabe (TMAx) oder eine Genauigkeitsvorgabe bestimmt ist.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß die Zeit -oder Genauigkeitsvorgabe abhängig von der Lage oder einer jeweiligen Lageveränderungsgeschwindigkeit des jeweiligen Objektes bestimmt wird, wobei für mittig im Bild liegende und/oder ruhende Objekte eine längere Zeit und/oder eine höhere Genauigkeit zugeteilt wird als randseitigen und/oder relativ schnell bewegten Objekten und/oder dem Hintergrund.
12. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß jeweils nur solche Objekte einer weiteren Erkennung und Charakterisierung unterzogen werden, die eine Mindestanzahl von Pixeln aufweist, und kleinere Objekte dem Hintergrund zugeordnet werden.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die Objekte mit fallender Anzahl von Pixeln nacheinander bearbeitet werden solange die verfügbare Rechenzeit reicht, wodurch bei der Verschlüsselung eines Bildinhaltes die Mindestanzahl der Pixel der Objekte je nach der verfügbaren Rechenzeit bestimmt ist.
PCT/EP2003/007451 2002-07-12 2003-07-10 Verfahren zum komprimieren und dekomprimieren von videobilddaten Ceased WO2004008393A1 (de)

Priority Applications (10)

Application Number Priority Date Filing Date Title
UAA200501272A UA84274C2 (ru) 2002-07-12 2003-07-10 Способ сжатия и восстановления данных видеоизображения
JP2004520560A JP2005533419A (ja) 2002-07-12 2003-07-10 ビデオ画像データの圧縮及び圧縮解除方法
MXPA05000563A MXPA05000563A (es) 2002-07-12 2003-07-10 Procedimiento para comprimir y descomprimir datos de imagenes de video.
EP03763779A EP1522050B1 (de) 2002-07-12 2003-07-10 Verfahren zum komprimieren und dekomprimieren von videobilddaten
EA200500194A EA006638B1 (ru) 2002-07-12 2003-07-10 Способ сжатия и восстановления данных видеоизображения
CA002492141A CA2492141A1 (en) 2002-07-12 2003-07-10 Method for compressing and decompressing video image data
DE50302754T DE50302754D1 (de) 2002-07-12 2003-07-10 Verfahren zum komprimieren und dekomprimieren von videobilddaten
BRPI0312618A BRPI0312618A2 (pt) 2002-07-12 2003-07-10 método para a compressão e descompressão de dados de imagem de vídeo
AU2003250021A AU2003250021B2 (en) 2002-07-12 2003-07-10 Method for compressing and decompressing video image data
US10/521,116 US20060153288A1 (en) 2002-07-12 2003-07-10 Method for compressing and decompressing video image data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10231613.9 2002-07-12
DE10231613A DE10231613B4 (de) 2002-07-12 2002-07-12 Verfahren zum Komprimieren und Dekomprimieren von Videobilddaten od. dgl.

Publications (1)

Publication Number Publication Date
WO2004008393A1 true WO2004008393A1 (de) 2004-01-22

Family

ID=30009928

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2003/007451 Ceased WO2004008393A1 (de) 2002-07-12 2003-07-10 Verfahren zum komprimieren und dekomprimieren von videobilddaten

Country Status (14)

Country Link
US (1) US20060153288A1 (de)
EP (1) EP1522050B1 (de)
JP (1) JP2005533419A (de)
KR (1) KR20050042463A (de)
CN (1) CN1669054A (de)
AT (1) ATE321319T1 (de)
AU (1) AU2003250021B2 (de)
BR (1) BRPI0312618A2 (de)
CA (1) CA2492141A1 (de)
DE (2) DE10231613B4 (de)
EA (1) EA006638B1 (de)
MX (1) MXPA05000563A (de)
UA (1) UA84274C2 (de)
WO (1) WO2004008393A1 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10231613B4 (de) * 2002-07-12 2004-12-30 Atvisican Ag Verfahren zum Komprimieren und Dekomprimieren von Videobilddaten od. dgl.
DE102005026521A1 (de) * 2005-06-08 2006-12-14 Endress + Hauser Process Solutions Ag Verfahren zur Reduktion des Datentransfers zwischen einem Feldgerät der Automatisierungstechnik und einer Steuereinheit
DE102007033316A1 (de) 2007-07-16 2009-01-22 Atvisican Ag Verfahren zum Vektorisieren von Videobildern
CA2950943C (en) * 2011-12-22 2019-06-04 Samsung Electronics Co., Ltd. Video encoding method using offset adjustment according to classification of pixels by maximum encoding units and apparatus thereof, and video decoding method and apparatus thereof
CN103761754B (zh) * 2014-01-22 2016-10-12 浙江宇视科技有限公司 一种对曲线进行熵编码的方法
JP6729170B2 (ja) * 2016-08-23 2020-07-22 沖電気工業株式会社 画像処理システム及び画像復号装置
JP2018063381A (ja) * 2016-10-14 2018-04-19 矢崎総業株式会社 表示装置
CN111406404B (zh) * 2019-07-15 2022-07-12 上海极清慧视科技有限公司 获得视频文件的压缩方法、解压缩方法、系统及存储介质
CN111556316B (zh) * 2020-04-08 2022-06-03 北京航空航天大学杭州创新研究院 一种基于深度神经网络加速的快速块分割编码方法和装置
JP7793301B2 (ja) * 2021-06-10 2026-01-05 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
CN117857808B (zh) * 2024-03-06 2024-06-04 深圳市旭景数字技术有限公司 一种基于数据分类压缩的高效视频传输方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778100A (en) * 1996-03-08 1998-07-07 Lucent Technologies Inc. Method and apparatus for reducing the bit rate in a video object planes sequence coder

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10231613B4 (de) * 2002-07-12 2004-12-30 Atvisican Ag Verfahren zum Komprimieren und Dekomprimieren von Videobilddaten od. dgl.

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778100A (en) * 1996-03-08 1998-07-07 Lucent Technologies Inc. Method and apparatus for reducing the bit rate in a video object planes sequence coder

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHRISTOPOULOS V A ET AL: "Segmented image coding with contour simplification for video sequences", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP) LAUSANNE, SEPT. 16 - 19, 1996, NEW YORK, IEEE, US, vol. 1, 16 September 1996 (1996-09-16), pages 693 - 696, XP010202160, ISBN: 0-7803-3259-8 *
CHUANG GU ET AL: "Very low bit-rate video coding using multi-criterion segmentation", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP) AUSTIN, NOV. 13 - 16, 1994, LOS ALAMITOS, IEEE COMP. SOC. PRESS, US, vol. 3 CONF. 1, 13 November 1994 (1994-11-13), pages 418 - 422, XP010146204, ISBN: 0-8186-6952-7 *
EDIRISINGHE E A ET AL: "A contour analysis based technique to extract objects for MPEG-4", MULTIMEDIA COMPUTING AND SYSTEMS, 1999. IEEE INTERNATIONAL CONFERENCE ON FLORENCE, ITALY 7-11 JUNE 1999, LOS ALAMITOS, CA, USA,IEEE COMPUT. SOC, US, 7 June 1999 (1999-06-07), pages 369 - 374, XP010342839, ISBN: 0-7695-0253-9 *
KAUP A: "OBJECT-BASED TEXTURE CODING ON MOVING VIDEO IN MPEG-4", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE INC. NEW YORK, US, vol. 9, no. 1, February 1999 (1999-02-01), pages 5 - 15, XP000802283, ISSN: 1051-8215 *

Also Published As

Publication number Publication date
EA006638B1 (ru) 2006-02-24
MXPA05000563A (es) 2005-08-29
DE50302754D1 (de) 2006-05-11
EP1522050A1 (de) 2005-04-13
JP2005533419A (ja) 2005-11-04
BRPI0312618A2 (pt) 2016-06-21
EP1522050B1 (de) 2006-03-22
CN1669054A (zh) 2005-09-14
DE10231613A1 (de) 2004-02-05
US20060153288A1 (en) 2006-07-13
AU2003250021A1 (en) 2004-02-02
AU2003250021B2 (en) 2008-10-09
CA2492141A1 (en) 2004-01-22
UA84274C2 (ru) 2008-10-10
KR20050042463A (ko) 2005-05-09
EA200500194A1 (ru) 2005-06-30
DE10231613B4 (de) 2004-12-30
ATE321319T1 (de) 2006-04-15

Similar Documents

Publication Publication Date Title
DE69020564T2 (de) Verfahren und vorrichtung zur behandlung von numerischen daten.
DE69609503T2 (de) Verfahren und vorrichtung zur kompression von farbvideodaten
DE69124758T2 (de) Verfahren und Vorrichtung zur Farbbildkonturbestimmung
DE69211328T2 (de) Verfahren zur verbesserten Farbwiedergewinnung in einem graphischen Rechnersystem
DE4309105C2 (de) Verfahren zum Behandeln eines Teils eines verdichteten Bildes für eine Aufbereitung
DE10120644B4 (de) Bilddatenverdichtungsverfahren und -vorrichtung, welche Bilddaten separat durch Modifizieren der Farbe verdichten
DE69629715T2 (de) Datenkomprimierung
DE69434131T2 (de) Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern
DE4428517A1 (de) Verfahren zum Behandeln eines Teils eines komprimierten Bildes, Bildaufbereitungseinrichtung und Bildaufbereitungssystem
DE10231613B4 (de) Verfahren zum Komprimieren und Dekomprimieren von Videobilddaten od. dgl.
DE19919600A1 (de) Einrichtung und Verfahren zum Komprimieren von Bilddaten, die von einem Bildsensor empfangen werden, der ein Bayer-Muster aufweist
DE69607529T2 (de) Kodierung von videofarbbildern
DE69517791T2 (de) Vorrichtung zur Darstellung von Objektkonturen mit Konturannäherung
DE19721032B4 (de) Vorrichtung und Verfahren zur Datenkodierung
DE69105784T2 (de) Bildkompression.
DE69331403T2 (de) Verfahren zur Komprimierung und Erweiterung eines Bildes durch Orthogonaltransformation und Kodierung des Bildes
DE69512824T2 (de) Kompressions- und Dekompressionsverfahren für mehrdimensionale mehrwertige Farbbilder
DE69513841T2 (de) Paketiertes yuv9 format zur verschachtelten speicherung und effizienten bearbeitung von digitalen videodaten
DE69027640T2 (de) Verfahren und gerät zur filterung von numerischen daten
DE69130553T2 (de) Arithmetisch logische Einheit
DE69917380T2 (de) Vektordatenkompression
DE69322216T2 (de) Verfahren und Gerät zur graphischen Mustererzeugung
EP0908056B1 (de) Verfahren und vorrichtung zur bearbeitung von bildpunkten eines bildsegments durch einen rechner
DE69122855T2 (de) Vorrichtung zur dynamischen stufenwertdiskretisierung
DE19944213C1 (de) Verfahren zum Komprimieren eines digitalen Bildes mit mehreren Bit-Ebenen

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PH PL PT RO RU SC SD SE SG SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2492141

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2004520560

Country of ref document: JP

Ref document number: 1020057000597

Country of ref document: KR

Ref document number: 2003816633X

Country of ref document: CN

Ref document number: PA/a/2005/000563

Country of ref document: MX

WWE Wipo information: entry into national phase

Ref document number: 2003763779

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2003250021

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: 200500194

Country of ref document: EA

WWP Wipo information: published in national office

Ref document number: 2003763779

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020057000597

Country of ref document: KR

ENP Entry into the national phase

Ref document number: 2006153288

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10521116

Country of ref document: US

WWG Wipo information: grant in national office

Ref document number: 2003763779

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10521116

Country of ref document: US

ENP Entry into the national phase

Ref document number: PI0312618

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20050112