CH709721A2 - Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix. - Google Patents

Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix. Download PDF

Info

Publication number
CH709721A2
CH709721A2 CH00996/14A CH9962014A CH709721A2 CH 709721 A2 CH709721 A2 CH 709721A2 CH 00996/14 A CH00996/14 A CH 00996/14A CH 9962014 A CH9962014 A CH 9962014A CH 709721 A2 CH709721 A2 CH 709721A2
Authority
CH
Switzerland
Prior art keywords
signal
channel
downmix
channels
upmix
Prior art date
Application number
CH00996/14A
Other languages
English (en)
Inventor
Clemens Par
Original Assignee
Stormingswiss Sàrl C O Fidacor Sàrl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stormingswiss Sàrl C O Fidacor Sàrl filed Critical Stormingswiss Sàrl C O Fidacor Sàrl
Priority to CH00996/14A priority Critical patent/CH709721A2/de
Priority to PCT/EP2015/060812 priority patent/WO2015173422A1/de
Publication of CH709721A2 publication Critical patent/CH709721A2/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Zur Vermeidung von Residualen in Fourier-transformierten Signalen werden in der erfindungsgemässen Downmixvorrichtung, die eine Fouriertransformationsvorrichtung und einen Downmixer (52) umfasst, für unterschiedliche Kanäle unterschiedliche Fensterfunktionen verwendet. In der Upmix- oder Kodiervorrichtung werden die Kanäle des Downmix durch Korrelationsvergleich in zwei individuelle Signale und ein korreliertes Signal aufgeteilt und die drei Kanäle des Upmixsignals durch geschickte Kombination der zwei Kanäle des Downmix und der beiden individuellen Signale und des korrelierten Signals erhalten.

Description

[0001] Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix.
[0002] Um Audiosignale zu verarbeiten, werden diese im Stand der Technik oft in den Frequenzraum überführt. Ein unendlich langes Signal kann theoretisch in den Fourierraum und wieder zurücktransformiert werden, ohne einen Verlust zu erleiden. Tatsächlich sind aber alle Signale endlich. Meistens werden Signale sogar in kürzere Fenster unterteilt, um die Fouriertransformation und die nachfolgende Signalverarbeitung für diese kürzeren Fenster durchzuführen. Mathematisch wird somit das unendlich lange Signal mit einem Rechteck-Signal multipliziert. Da die Multiplikation zweier Signale im Fourierraum aber zu einer Faltung der jeweils Fouriertransformierten Signale führt, wird ein Fouriertransformiertes endliches Signal mit einem Fouriertransformierten Rechteck gefaltet. Dies führt zu einer Verfälschung des Amplitudenspektrums mit einer Verstärkung der Amplitudenbeträge gewisser Frequenzen und einer Abschwächung anderer Frequenzen (Das Amplitudenspektrum ist als das Spektrum der Absolutwerte der Amplituden im Frequenzraum oder im Zeitraum definiert). Dieser Fehler wird als Residual bezeichnet. Um dieses für die jeweilige Anwendung zu reduzieren, werden Signalfenster vor deren Fouriertransformation mit einer Fensterfunktion multipliziert. Verschiedene Fenster haben verschiedene Eigenschaften. Es gibt einerseits Fenster, die eine sehr hohe Frequenzauflösung haben, aber nur eine sehr schlechte Amplitudenauflösung, wie das zum Beispiel für das Rechtecksfenster der Fall ist. Anderseits gibt es Fensterfunktionen wie das Flat-top-Fenster, das eine sehr schlechte Frequenzauflösung hat, aber dafür eine sehr gute Amplitudenauflösung hat. In der Regel werden aber Fensterfunktionen verwendet, die einerseits eine akzeptable Frequenz- und andererseits eine akzeptable Amplitudenauflösung haben, wie z.B. das Hamming-Fenster. In der Audioverarbeitung wird sehr häufig das Hamming-Fenster verwendet, das sowohl für eine gute Frequenz- als auch eine gute Amplitudenauflösung notwendig ist. Allerdings erzeugt jede Fensterfunktion einen Fehler in dem in den Zeitraum zurücktransformierten Signal, das bereits genannte Residual.
[0003] Zur Datenreduktion oder für andere Gründe wird die Kanalzahl eines Audio- oder Videomultikanalsignals mittels eines Downmix reduziert. In manchen Fällen wird die Linearkombination von Kanälen für den Downmix im Fourierraum durchgeführt, z.B. um den Kammfilter durch phasenverschobene Signalanteile in den zu summierenden Signalen zu korrigieren (WO 11 057 922). Für die Fouriertransformation werden in der Regel Hamming-Fensterfunktionen verwendet, die die oben beschriebenen Probleme aufweisen. Somit gehen in dem Downmix zusätzliche Informationen verloren, die somit in dem Upmix nicht mehr wiederhergestellt werden können. Andererseits könnte man dieses Problem vermeiden, wenn man den Downmix nur im Zeitraum erstellt. Allerdings erlaubt dies nicht, andere Probleme, wie z.B. den oben beschriebenen Kammfilter, präzise zu beheben.
[0004] Deshalb ist es Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung zum Downmixen und zum Upmixen bzw. Kodieren zu schaffen, welche einen für den Upmix optimierten Downmix schafft und die genannten Residuale vermeidet.
[0005] Dies ist dadurch gelöst, dass die für die Fouriertransformation verwendeten Fenster eines ersten Kanals (LO(t)) und eines zweiten Kanals (RO(t)) eines Multikanalsignals für den Downmix vor der Fouriertransformation jeweils mit einer ersten Fensterfunktion zur Unterdrückung des Leck-Effekts multipliziert werden, und die für die Fouriertransformation verwendeten Fenster eines dritten Kanals (CO(t)) des Multikanalsignals für den Downmix vor der Fouriertransformation mit einer zweiten Fensterfunktion zur Unterdrückung des Leck-Effekts multipliziert werden.
[0006] Die Verwendung von unterschiedlichen Fensterfunktionen für verschiedene Kanäle erlaubt es, manche Kanäle mit einer hohen Frequenzauflösung und andere Kanäle mit einer hohen Amplitudeninformation zu transferieren. Durch die Summation der Kanäle werden somit unterschiedliche Informationen aufrechterhalten. Dies ist insbesondere, aber nicht ausschliesslich, vorteilhaft für Kanäle mit ähnlichen, insbesondere harmonischen Signalanteilen. Das Flat-top-Fenster hat sich für die zweite Fensterfunktion als besonders günstig erwiesen. Allerdings sind auch andere Kombinationen von Fensterfunktionen möglich. (N.B. Die Umkehrung dieses Wirkungsprinzips ist ebenfalls möglich: Das Flat-top-Fenster wird demnach für die erste Fensterfunktion verwendet, und für die zweite Fensterfunktion eine andere Fensterfunktion, beispielsweise ein Hamming-Fenster, die eine akzeptable Amplituden und Frequenzauflösung bietet.)
[0007] Gleichzeitig ist die Aufgabe durch eine Upmix- oder Kodiervorrichtung mit einer Korrelationsvergleichsvorrichtung gelöst, die durch Korrelationsvergleich ein korreliertes Signal, ein erstes individuelles Signal und ein zweites individuelles Signal aus den zwei Kanälen des Downmix erhält. Durch geschickte Kombination der zwei Kanäle des Downmixsignals und des korrelierten Signals, des ersten individuellen Signals und des zweites individuelles Signals werden die durch die Fouriertransformationen erzeugten Residuale ausgelöscht, und die durch die verschiedenen Fensterfunktionen im Downmixer erhaltenen Informationen geschickt auf die drei Kanäle des durch den Upmix erhaltenen Multikanalsignals aufgeteilt.
[0008] Durch den Korrelationsvergleich werden die gemeinsamen Signalanteile und die jeweils individuellen Signalanteile getrennt. Danach werden durch geschicktes Summieren und Subtrahieren der Signale des Downmix mit den gemeinsamen und individuellen Signalanteilen die Informationen mit hoher Frequenzauflösung und die Informationen mit hoher Amplitudenauflösung aufgeteilt, und die schlecht auflösenden Informationen durch geschickte Subtraktion entfernt.
[0009] Verschiedene Ausführungsformen der vorliegenden Erfindung werden im Folgenden beispielhaft beschrieben, wobei auf folgende Zeichnungen Bezug genommen wird: Fig. 1 zeigt eine Ausführungsform einer Downmixvorrichtung im Frequenzbereich; Fig. 2 zeigt eine erste Ausführungsform einer Upmix- oder Kodiervorrichtung; Fig. 3 zeigt eine zweite Ausführungsform einer Upmix-oder Kodiervorrichtung; Fig. 4 zeigt eine Downmixvorrichtung nach dem Stand der Technik; Fig. 5 zeigt eine Ausführungsform des Korrelationsvergleichs; Fig. 6 zeigt eine Ausführungsform für eine Upmixsignal mit acht Kanälen; Fig. 7 zeigt eine Ausführungsform für eine Upmix- oder Kodiervorrichtung für eine Downmixsignal mit vier Kanälen und ein Upmixsignal mit acht Kanälen; Fig. 8 zeigt eine Ausführungsform für eine Upmix- oder Kodiervorrichtung für eine Downmixsignal mit vier Kanälen und ein Upmixsignal mit acht Kanälen; Fig. 9 zeigt eine Ausführungsform für eine Upmix- oder Kodiervorrichtung für eine Downmixsignal mit vier Kanälen und ein Upmixsignal mit acht Kanälen; Fig. 10 zeigt ein Ausführungsbeispiel für eine Berechnung der Pegel/Loudness der Kanäle des Upmixsignals/Multikanalsignals zur Anpassung der Pegel/Loudness der Kanäle des Upmixsignals an die Pegel/Loudness der Kanäle des Multikanalsignals; und Fig. 11 zeigt ein Ausführungsbeispiel für eine Berechnung der Pegel/Loudness der Kanäle des Upmixsignals/Multikanalsignals zur Anpassung der Pegel/Loudness der Kanäle des Upmixsignals an die Pegel/Loudness der Kanäle des Multikanalsignals.
[0010] Fig. 1 zeigt ein Ausführungsbeispiel einer Downmixvorrichtung 10. Die Downmixvorrichtung weist eine Fouriertransformationsvorrichtung 11, einen Downmixer 12, eine inverse Fouriertransformationsvorrichtung 13 und einen Verstärker 14 auf.
[0011] Drei Kanäle RO(t), LO(t) und CO(t) eines Audiomultikanalsignals werden der Fouriertransformationsvorrichtung 11 zugeführt, wobei der Mittenkanal CO(t) idealerweise für eine Lautsprecheranordnung bestimmt ist, die zwischen den den Seitenkanälen RO(t) und LO(t) zugeordneten Lautsprecheranordnungen liegt (von dieser Regel kann allerdings - bei guten Ergebnissen - abgewichen werden). Die Fouriertransformationsvorrichtung 11 weist für jeden Kanal LO(t), RO(t) und CO(t) jeweils eine Fouriertransformationseinheit 11.L, 11.R, 11.C auf, die jeweils geeignet ist, eine Fouriertransformation (FT) des Eingangssignals LO(t), RO(t) oder CO(t) durchzuführen. Dies ist vorzugsweise eine diskrete Fouriertransformation (DFT), insbesondere eine Fast Fourier Transform (FFT). Jede Fouriereinheit 11.L, 11.R, 11.C ist ausgebildet, das Eingangssignal in vorzugsweise gleichlange Signalfenster zu unterteilen. In einem Ausführungsbeispiel weist die Fensterlänge 2<n>auf, z.B. 512, 1024, 2048, 4096, die besonders gut für die Fouriertransformation geeignet ist. In einem Ausführungsbeispiel überlappen sich die Signalfenster zeitlich. In einem alternativen Ausführungsbeispiel sind die Signalfenster zeitlich nicht überlappend. Jedes Signalfenster wird in der Fouriereinheit mit einer Fensterfunktion multipliziert, die diegleicheLänge wie das Signalfenster hat. Dabei wird in der Fouriereinheit 11.L und 11.R eine erste Fensterfunktion verwendet, während in der Fouriereinheit 11.C eine zweite Fensterfunktion verwendet wird. In einem Ausführungsbeispiel wird für die erste Fensterfunktion ein Hamming-Fenster verwendet. Alternativ könnten für die erste Fensterfunktion andere Fensterfunktionen verwendet werden, die eine akzeptable Amplituden und Frequenzauflösung bieten, z.B. ein Hann-Fenster. In einem Ausführungsbeispiel wird ein Flat-top-Fenster für die zweite Fensterfunktion verwendet. Alternativ könnten auch andere Fensterfunktionen verwendet werden, die eine hohe Amplitudenauflösung haben, aber eine niedrige Frequenzauflösung. (N.B. Ebenso lässt sich dieses Wirkungsprinzip umkehren: Demnach kann für die erste Fensterfunktion beispielsweise ein Flat-Top-Fenster oder auch eine andere Fensterfunktion verwendet werden, die eine hohe Amplitudenauflösung hat aber eine niedrige Frequenzauflösung, und für die zweite Fensterfunktion ein Hamming-Fenster oder auch eine andere Fensterfunktion, die eine akzeptable Amplituden- und Frequenzauflösung bietet.) Die Erfindung funktioniert besonders gut mit den beschriebenen Fensterfunktionen, allerdings könnte man auch andere unterschiedliche Fensterfunktionen verwenden, die unterschiedliche Frequenz-Amplituden-Auflösungen aufweisen. Die Fouriereinheiten 11.L, 11.R und 11.C geben jeweils den entsprechend Fourier-transformierten Kanal LO(k), RO(k) und CO(k) aus.
[0012] In diesem Ausführungsbeispiel wird der Mittenkanal CO(k), jeweils mit 0.5 (–6dB) multipliziert, auf die Seitenkanäle LO(k) und RO(k) aufsummiert. Allerdings ist die Erfindung nicht auf diesen Faktor beschränkt. Auch eine direkte Summe oder jede andere Linearkombination wäre möglich. Dazu ist der Verstärker 14 irgendwo zwischen dem Signaleingang und dem Summierer in dem Downmixer 12 in dem Mittenkanal CO(t) oder dem Fourier-transformierten Mittenkanal CO(k) angeordnet. Auch ein adaptives Verfahren bei zeitlich variablem Verstärker 14 ist möglich, beispielsweise, um die Frequenzauflösung für den Fourier-transformierten Mittenkanal CO(k) zeitlich zu optimieren.
[0013] Der Downmixer 12 weist einen ersten Downmixer 12. L und einen zweiten Downmixer 12. R auf. Der erste Downmixer 12. L mischt dabei den Fourier-transformierten ersten Seitenkanal LO(k) mit dem mit 0.5 multiplizierten Fourier-transformierten Mittenkanal CO(k) und gibt den Fourier-transformierten ersten Kanal LD(k) des Downmixsignals aus. Der zweite Downmixer 12. R mischt dabei den Fourier-transformierten zweiten Seitenkanal RO(k) mit dem mit 0.5 multiplizierten Fourier-transformierten Mittenkanal CO(k) und gibt den Fourier-transformierten zweiten Kanal RD(k) des Downmixsignals aus. In einem Ausführungsbeispiel führt der erste Downmixer die Funktion LD(k) = LO(k) + 0.5 * CO(k) aus und der zweite Downmixer die Funktion RD(k) = RO(k) + 0.5 * CO(k)
[0014] In einem anderen Ausführungsbeispiel wird zusätzlich eine Phasenkorrektur in dem ersten Downmixer 12. L und dem zweiten Downmixer 12.R durchgeführt, die einen Kammfilter vermeidet oder reduziert. Dazu wird die Amplitude der komplexen Zahl LD(k) bzw. RD(k) so angepasst, dass gilt RD(k)<2>= RO(k)<2>+ 0.5<2>* CO(k)<2> bzw. LD(k)2 = LO(k)<2>+ 0.5<2>* CO(k)<2>.
[0015] So kann ein Kammfilter unterdrückt werden. Auch der Downmixer arbeitet weiter auf den von der Fouriertransformationsvorrichtung erzeugten Signalfenstern.
[0016] Alternativ Hesse sich eine solche Korrektur auch nur auf dem Fourier-transformierten Mittenkanal CO(k) vor dem Downmix mit LO(k) bzw. mit RO(k) ausführen (Verfahren von Runow), siehe auch WO 11 057 922.
[0017] Die inverse Fouriertransformationsvorrichtung 13 weist für jeden Kanal LD(k) und RD(k) jeweils eine inverse Fouriertransformationseinheit 13.L, 13.R auf, die jeweils geeignet ist, eine inverse Fouriertransformation (IFT) des Eingangssignals LD(k) oder RD(k) durchzuführen und die Kanäle LD(t) oder RD(t) des Downmixsignals auszugeben (oder weiterzuverarbeiten). Dies ist vorzugsweise eine inverse diskrete Fouriertransformation (IDFT), insbesondere eine Inverse Fast Fourier Transform (IFFT). Jedes Signalfenster von LD(k) und RD(k) wird in den inversen Fouriereinheiten 13.L und 13.R mit der Fourier-transformierten ersten Fensterfunktion (N.B. bei oben beschriebener Umkehrung des Wirkungsprinzips: mit der zweiten Fensterfunktion) multipliziert, die bereits in den Fouriereinheiten 11.L und 11.R (N.B. bei oben beschriebener Umkehrung des Wirkungsprinzips: in der Fouriereinheit 11.C) verwendet wurde. Dieses mit der Fouriertransformierten ersten (N.B. bei oben beschriebener Umkehrung des Wirkungsprinzips: zweiten) Fensterfunktion multiplizierte Signalfenster wird mittels einer inversen Fouriertransformation zurück in den Zeitraum transformiert.
[0018] Fig. 2 zeigt ein erstes Ausführungsbeispiel der Upmix- oder Kodiervorrichtung 20. Die Upmix- oder Kodiervorrichtung 20 weist eine Fouriertransformationsvorrichtung 21, eine Korrelationsvergleichsvorrichtung 22, eine Korrekturvorrichtung 29 und eine vierte Signalverarbeitungsvorrichtung 28 auf.
[0019] Die Fouriertransformationsvorrichtung 21 weist eine erste und eine zweite Fouriertransformationseinheit 21.L und 21.R auf. Die Fouriertransformationsvorrichtung 21 ist ausgebildet, einen ersten Kanal LD(t) und einen zweiten Kanal RD(t) eines Downmixsignals in den Fourierraum zu transformieren. Analog zu der Fouriertransformationsvorrichtung 11 werden auch die Kanäle LD(t) und RD(t) in Signalfenster unterteilt und danach die jeweiligen Signalfenster in den Fourierraum transformiert. Vorzugsweise wird vor der Transformation jedes Signalfenster mit einer Fensterfunktion multipliziert. Vorzugsweise wird als Fensterfunktion auch die erste (N.B. bei oben beschriebener Umkehrung des Wirkungsprinzips: zweiten) Fensterfunktion aus der Fouriertransformationsvorrichtung 11 verwendet. Die Fouriertransformationsvorrichtung 21 gibt die Fouriertransformierten Kanäle LD(k) und RD(k) des Downmixsignals aus. Im Folgenden wird nicht mehr explizit erwähnt, dass die Kanäle LD(k) und RD(k) des Downmixsignals Fouriertransformiert sind.
[0020] Die Kanäle LD(k) und RD(k) des Downmixsignals werden der Korrelationsvergleichsvorrichtung 22 zugeführt. Die Korrelationsvergleichsvorrichtung 22 ist ausgebildet, die korrelierten Signalanteile der Kanäle LD(k) und RD(k) des Downmixsignals, die nur dem ersten Kanal LD(k) spezifischen Signalanteile und die nur dem zweiten Kanal RD(k) spezifischen Signalanteile zu extrahieren. Die Korrelationsvergleichsvorrichtung 22 ist ausgebildet, aus den korrelierten Signalanteilen das korrelierte Signal CK(k), aus den dem ersten Kanal LD(k) spezifischen Signalanteilen das erste individuelle Signal LK(k) und aus den dem zweiten Kanal RD(k) spezifischen Signalanteilen das zweite individuelle Signal RK(k) zu bilden. Ein Verfahren zur Bestimmung der korrelierten und spezifischen Signalanteile der Kanäle LD(k) und RD(k) wird später mit Fig. 5 beschrieben. Allerdings ist jedes andere Verfahren zur Bestimmung der korrelierten und spezifischen Anteile möglich.
[0021] Die Korrekturvorrichtung 29 weist eine erste Signalverarbeitungsvorrichtung 23, eine zweite Signalverarbeitungsvorrichtung 24, eine dritte Signalverarbeitungsvorrichtung 25 auf.
[0022] Die erste Signalverarbeitungsvorrichtung 23 empfängt den ersten Kanal LD(k) des Downmixsignals, das korrelierte Signal CK(k) und das erste individuelle Signal LK(k). Die erste Signalverarbeitungsvorrichtung 23 ist ausgebildet, das folgendermassen gebildete erste Signal SL(k) zu bilden: SL(k) = 2 * Lk(k) – LD(k) + CK(k).
[0023] Die zweite Signalverarbeitungsvorrichtung 24 empfängt den zweiten Kanal RD(k) des Downmixsignals, das korrelierte Signal CK(k) und das zweite individuelle Signal RK(k). Die zweite Signalverarbeitungsvorrichtung 24 ist ausgebildet, das folgendermassen gebildete zweite Signal SR(k) zu bilden: SR(k) = 2 * Rk(k) – RD(k) + CK(k).
[0024] Die dritte Signalverarbeitungsvorrichtung 25 empfängt den ersten Kanal LD(k) und den zweiten Kanal RD(k) des Downmixsignals, das korrelierte Signal CK(k), das erste individuelle Signal LK(k) und das zweite individuelle Signal RK(k). Die dritte Signalverarbeitungsvorrichtung 25 ist ausgebildet, das folgendermassen gebildete dritte Signal SC(k) zu bilden: SC(k) = Lk(k) – LD(k) + Rk(k) – RD(k) + 4 * CK(k).
[0025] Die vierte Signalverarbeitungsvorrichtung 28 weist die inverse Fouriertransformationsvorrichtung 26 und die fünfte Signalverarbeitungsvorrichtung 27 auf.
[0026] Die inverse Fouriertransformationsvorrichtung 26 ist ausgebildet, das erste Signal SL(k), das zweite Signal SR(k), das dritte Signal SC(k), das korrelierte Signal CK(k), das erste individuelle Signal LK(k) und das zweite individuelle Signal RK(k) durch Anwendung einer inversen Fouriertransformation in den Zeitraum zu transformieren. Für jede der sechs inversen Fouriertransformationen wird das entsprechende Signalfenster mit einer Fensterfunktion multipliziert. Vorzugsweise mit der. ersten (N.B. bei oben beschriebener Umkehrung des Wirkungsprinzips: zweiten) Fensterfunktion. Die inverse Fouriertransformationsvorrichtung 26 weist eine erste inverse Fouriertransformationseinheit 26.SL, eine zweite inverse Fouriertransformationstionseinheit 26.SR, eine dritte inverse Fouriertransformationseinheit 26.SC, eine vierte inverse Fouriertransformationstionseinheit 26.LK, eine fünfte inverse Fouriertransformationseinheit 26.RK, eine sechste inverse Fouriertransformationstionseinheit 26.CK auf. Die erste inverse Fouriertransformationseinheit 26. SL ist ausgebildet, das erste Signal SL(k) invers in das erste Signal SL(t) zu Fourier-transformieren. Die zweite inverse Fouriertransformationseinheit 26.SR ist ausgebildet, das zweite Signal SR(k) invers in das zweite Signal SR(t) zu Fourier-transformieren. Die dritte inverse Fouriertransformationseinheit 26.SC ist ausgebildet, das dritte Signal SC(k) invers in das dritte Signal Sc(t) zu Fourier-transformieren. Die vierte inverse Fouriertransformationseinheit 26.LK ist ausgebildet, das erste individuelle Signal LK(k) invers in das erste individuelle Signal LK(t) im Zeitraum zu Fourier-transformieren. Die fünfte inverse Fouriertransformationseinheit 26.RK ist ausgebildet, das zweite individuelle Signal RK(k) invers in das zweite individuelle Signal RK(t) im Zeitraum zu Fouriertransformieren. Die sechste inverse Fouriertransformationseinheit 26.CK ist ausgebildet, das korrelierte Signal CK(k) invers in das korrelierte Signal CK(t) im Zeitraum zu Fourier-transformieren.
[0027] Die fünfte Signalverarbeitungsvorrichtung 27 empfängt die folgenden Fourier-transformierten Signale: das erste Signal SL(t), das zweite Signal SR(t), das dritte Signal Sc(t), das korrelierte Signal CK(t), das erste individuelle Signal LK(t) und das zweite individuelle Signal RK(t). Die fünfte Signalverarbeitungsvorrichtung 27 verarbeitet diese Signale wie folgt zu drei Ausgabesignalen: LU(t) = (SL(t) + CK(t)) RU(t) = (SR(t) + CK(t)) CU(t) = (SC(t) + RK(t) + LK(t)) * 0.3548.
[0028] Anstatt des Gains 0.3548 können auch andere Gains oder die Gains 0.3 oder 0.35 verwendet werden. Anstatt eines festen Gains können auch für alle Signale Gains in Abhängigkeit des Originalpegels oder der Loudness der entsprechenden Kanäle des Multikanalsignals verwendet werden, wie dies später im Detail beschrieben wird. Diese drei Ausgabesignale werden als drei Kanäle eines Upmixsignals verwendet oder weiterverarbeitet zu drei Kanälen eines Upmixsignals.
[0029] Die linearen Rechenoperationen nach dem Korrelationsvergleich können sowohl im Zeitraum als auch im Fourierraum durchgeführt werden; somit sind weitere äquivalente Ausführungsformen möglich. Sie bilden einen Teil der Erfindung.
[0030] Fig. 3 zeigt ein zweites Ausführungsbeispiel der Upmix- oder Kodiervorrichtung 40. Die Upmix- oder Kodiervorrichtung 40 weist eine Fouriertransformationsvorrichtung 41, eine Korrelationsvergleichsvorrichtung 42, eine Korrekturvorrichtung 49 und ’ eine vierte Signalverarbeitungsvorrichtung 48 auf.
[0031] Die Fouriertransformationsvorrichtung 41 und die Korrelationsvergleichsvorrichtung 42 entsprechen der Fouriertransformationsvorrichtung 21 und der Korrelationsvergleichsvorrichtung 22 des ersten Ausführungsbeispiels.
[0032] Die Korrekturvorrichtung 49 weist eine erste Signalverarbeitungsvorrichtung 43, eine zweite Signalverarbeitungsvorrichtung 44 und eine dritte Signalverarbeitungsvorrichtung 45 auf.
[0033] Die erste Signalverarbeitungsvorrichtung 43 empfängt den ersten Kanal LD(k) des Downmixsignals, das korrelierte Signal CK(k) und das erste individuelle Signal LK(k). Die erste Signalverarbeitungsvorrichtung 43 ist ausgebildet, das folgendermassen gebildete erste Signal LU(k) zu bilden: LU(k) = 2 * Lk(k) – LD(k) + 2 * CK(k).
[0034] Die zweite Signalverarbeitungsvorrichtung 44 empfängt den zweiten Kanal RD(k) des Downmixsignals, das korrelierte Signal CK(k) und das zweite individuelle Signal RK(k). Die zweite Signalverarbeitungsvorrichtung 44 ist ausgebildet, das folgendermassen gebildete zweite Signal RU(k) zu bilden: RU(k) = 2 * Rk(k) – RD(k) + 2 * CK(k).
[0035] Die dritte Signalverarbeitungsvorrichtung 45 empfängt den ersten Kanal LD(k) und den zweiten Kanal RD(k) des Downmixsignals, das korrelierte Signal CK(k), das erste individuelle Signal LK(k) und das zweite individuelle Signal RK(k). Die dritte Signalverarbeitungsvorrichtung 45 ist ausgebildet, das folgendermassen gebildete dritte Signal CU(k) zu bilden: CU(k) = 2 * (Lk(k) + Rk(k)) – LD(k) – RD(k) + 4 * CK(k).
[0036] Die vierte Signalverarbeitungsvorrichtung 48 weist die inverse Fouriertransformationsvorrichtung 46 auf.
[0037] Die inverse Fouriertransformationsvorrichtung 46 ist ausgebildet, das erste individuelle Signal LU(k), das zweite individuelle Signal RU(k) und das korrelierte Signal CU(k) durch Anwendung von je einer inversen Fouriertransformation in den Zeitraum zu transformieren.
[0038] Optional kann die vierte Signalverarbeitungsvorrichtung 48 auch eine fünfte Signalverarbeitungsvorrichtung enthalten, die CU(k) oder CU(t) mit einem Gain 0.3548 (oder 0.3 oder 0.35 oder einem anderen Gain) multipliziert. Auch können für alle Signale wiederum Gains in Abhängigkeit des Originalpegels oder der Loudness der entsprechenden Kanäle des Multikanalsignals verwendet werden, wie dies später im Detail beschrieben wird. Diese drei Ausgabesignale werden als drei Kanäle eines Upmixsignals verwendet oder weiterverarbeitet zu drei Kanälen eines Upmixsignals.
[0039] Das zweite Ausführungsbeispiel der Upmix- oder Kodiervorrichtung 40 hat den gleichen Vorteil wie das erste Ausführungsbeispiel, dass durch geschicktes Addieren und Subtrahieren der verschiedenen Signale eine höhere Frequenz -und Amplitudenauflösung für die mit den unterschiedlichen Fensterfunktionen erstellten Downmixsignale erreicht wird. Das zweite Ausführungsbeispiel der Upmix- oder Kodiervorrichtung 40 hat den gleichen Vorteil wie das erste Ausführungsbeispiel, dass das es die Phasensprünge, die durch die Fouriertransformationen und/oder die Korrelationsvergleichsvorrichtung 42 entstehen, gleichermassen eliminiert. Entgegen dem ersten Ausführungsbeispiel kann diese Ausführungsform 40 jedoch auch für Downmixsignale verwendet werden, die nicht durch eine Downmixvorrichtung 10 mit unterschiedlichen Fensterfunktionen erzeugt wurden. Dies könnte z.B. die Downmixvorrichtung 10 sein, wobei anstatt zweier unterschiedlicher Fensterfunktionen, zwei gleiche Fensterfunktionen verwendet werden. Alternativ ist dieses Ausführungsbeispiel auch für einen Downmix geeignet, der im Zeitbereich erstellt wurde.
[0040] Fig. 4 zeigt ein Ausführungsbeispiel des Stands der Technik einer Downmixvorrichtung im Zeitbereich. In Fig. 4 wird der Mittenkanal CO(t), jeweils mit einem Gain K, z.B. K = 0.5 (–6dB), multipliziert, auf die Seitenkanäle LO(t) und RO(t) aufsummiert. Allerdings ist das Ausführungsbeispiel nicht auf diesen Faktor beschränkt. Auch eine direkte Summe oder jede andere Linearkombination wäre möglich. Im Downmixer 52 Hesse sich auch ein sogenanntes Phase Alignment ausführen, bei der, abhängig von der Frequenz, die Phase wenigstens eines der Eingangssignale LO(t), RO(t) und CO(t) im Zeitbereich verschoben wird. Ebenso ist ein Phase Alignment für die Kanäle LD(t) oder RD(t) des Downmixsignals im Zeitbereich möglich. Allerdings führt dieses zum Übersprechen von Signalanteilen, sofern anschliessend eine Upmix-oder Kodierungvorrichtung 20 oder 40 zum Einsatz kommt. Dieser Effekt ist demnach zu minimieren.
[0041] Fig. 5 zeigt ein Ausführungsbeispiel für einen Korrelationsvergleich zweier Signale Li ́ und Ri ́, bei welchen respektive identische Signalanteile x(t) und y(t) bestimmt werden, für welche die Kurzzeit-Kreuzkorrelation
den Korrelationsgrad +1 aufweist, vorgeschlagen, der einerseits für zeitinvariante (stationäre) Signale eine mathematisch exakte Lösung darstellt, und bei zeitvarianten (nichtstationären) Signalen ein spezifisches Residualverhalten aufweist (wobei ein Residual die Differenz zwischen dem ursprünglichen, nichtstationären Signalabschnitts und dessen Fourier-Transformation darstellt).
[0042] Betrachtet werden zwei Kanäle Li ́, Ri ́, 1 ≤ i ≤ n, welche gleichartige Signalanteile Ci* aufweisen, wobei gilt: Li ́ = Li* + Ci* = Ii’(t) = Ii*(t) + ci*(t) Ri ́ = Ri* + Ci* = ri ́(t) = ri*(t) + ci*(t)
[0043] Für die zeitabhängigen Signale Ii ́(t) und ri ́(t) werden nunmehr jeweils die Fourier-Reihen bestimmt. Es gilt demnach für die Synthese, k = …, –1, 0, 1,...
und für die Analyse
und in der Praxis für die diskrete Fourier-Transformationen (DFT), aus der sich unmittelbar die Fast Fourier Transforms (FFT) ableiten lassen, wobei nunmehr k = 0, …, N – 1:
Die Realteile von Li, Riund Cilassen sich für stationäre Signale für alle k = 0, …, N – 1 dann gemäss folgender Regeln wiedergewinnen: 1. Bestimme die Vorzeichen der Realteile von Li ́(k) und Ri ́(k). 2. Sind für k die Vorzeichen identisch, bestimme – die Beträge der Realteile von Li ́(k) und Ri ́(k), – die Minima bzw. Maxima dieser Beträge der Realteile von Li ́(k) und Ri ́(k). – Wähle jeweils als Realteil für Ci(k) den diesem Minimum zugrundeliegenden Realteil von Li ́(k) und Ri ́(k),. – Subtrahiere den Realteil von Ci(k) von dem dem Maximum zugrundeliegenden Realteil von Li’ (k) oder Ri’ (k) und wähle, sofern der Realteil von Li ́(k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Realteil für Li ́(k), andernfalls, sofern der Realteil von Ri ́(k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Realteil für Ri ́(k). – Setze den noch nicht bestimmten Realteil von Li ́(k) oder Ri ́(k) gleich Null. 3. Sind die Vorzeichen der Realteile von Li ́(k) und Ri ́(k) nicht identisch, setze Ci(k) gleich Null und setze Li ́(k) = Li ́(k) und Ri ́(k) = Ri ́(k).
[0044] Die Imaginärteile von Li, Riund Cilassen sich für stationäre Signale für alle k = 0, …, N – 1 gemäss folgender Regeln wiedergewinnen: 1. Bestimme die Vorzeichen der Imaginärteile von Li ́(k) und Ri ́(k). 2. Sind für k die Vorzeichen identisch, bestimme – die Beträge der Imaginärteile von Li ́(k) und Ri ́(k), – die Minima bzw. Maxima dieser Beträge der Imaginärteile von Li ́(k) und Ri ́(k). – Wähle jeweils als Imaginärteil für Ci(k) den diesem Minimum zugrundeliegenden Imaginärteil von Li ́(k) oder Ri ́(k). – Subtrahiere den Imaginärteil von Ci(k) von dem dem Maximum zugrundeliegenden Imaginärteil von Li ́(k) oder Ri ́(k) und wähle, sofern der Imaginärteil von Li ́(k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Imaginärteil für Li ́(k), andernfalls, sofern der Imaginärteil von Ri ́(k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Imaginärteil für Ri ́(k). – Setze den noch nicht bestimmten Imaginärteil von Ri ́(k) oder Ri ́(k) gleich Null. 3. Sind die Vorzeichen der Imaginärteile von Li ́(k) und Ri ́(k) nicht identisch, setze Ci(k) gleich Null und setze Li ́(k) = Li ́(k)und Ri ́(k) = Ri ́(k).
[0045] Diese Fallunterscheidung für den Vorzeichenvergleich ist schematisch in Fig. 5 dargestellt. Um abschliessend Li, Riund Ciim Zeitraum zu gewinnen, werden für die Synthese für die zeitabhängigen Signale, k = …, –1, 0, 1, …,
(bzw. in der Praxis für die Analyse mittels diskreten Fourier-Transformationen (DFT), k = 0, …, N – 1,
aus der sich unmittelbar die Fast Fourier Transforms (FFT) ableiten lassen) für die Synthese die Koeffizienten fk, gk, hkbestimmt, k = …, –1, 0, 1, …, gemäss der Analyse
bzw. für die Synthese gemäss der inversen diskreten Fourier-Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transforms (IFFT) ableiten lassen, k = 0, …, N – 1,
[0046] Zur Berechnung der diskreten individuellen und gemeinsamen Spektralsignale werden die Spektralanteile vorzugsweise nur bis zur Nyquistfrequenz berechnet, und die übrigen Spektralanteile durch Spiegelung der bereits berechneten Werte an der Nyquistfrequenz bestimmt, wobei anstatt der berechneten Anteile nur die komplex konjugierten Anteile verwendet werden. Alternativ müssten nach der inversen Fouriertransformation die Imaginärteile gelöscht werden.
[0047] Die Ausführungsbeispiele der Upmix- oder Kodiervorrichtung 20 und 40 zeigen nur die Funktionsweise zur residualfreien Bestimmung eines Upmixsignals mit drei Kanälen aus einem Downmixsignal mit zwei Kanälen. Allerdings ist es auch möglich, dass nur einer oder nur zwei der drei Kanäle CU(t) oder CU(k), LU(t) oder LU(k) und RU(t) oder RU(k) bestimmt werden (siehe z.B. Fig. 7 bis 9 ). Entsprechend wird/werden auch nur eine oder nur zwei der Signalverarbeitungsvorrichtungen 23/43, 24/44 und 25/45 der Korrekturvorrichtung 29/49 benötigt.
[0048] Die Ausführungsbeispiele der Upmix- oder Kodiervorrichtung 20 und 40 zeigen nur die Funktionsweise zur residualfreien Bestimmung für ein Multikanalsignal/Upmixsignal mit drei Kanälen und ein Downmixsignal mit zwei Kanälen. Allerdings kann diese Ausführungsform auch für Multikanalsignale/Upmixsignale mit höherer Kanalanzahl verwendet werden. Fig. 6 zeigt ein Ausführungsbeispiel eines Downmixsignals mit vier Kanälen, z.B. FLD, FRD, BRDund BLD. Daraus soll ein Upmixsignal mit den acht Kanälen FLU, FCU, FRU, SiRU, BRU, BCU, BLUund SiLUbestimmt werden.
[0049] Fig. 7 zeigt ein mögliches Ausführungsbeispiel einer Upmix-oder Kodiervorrichtung 80 zur Bestimmung des Upmixsignals durch Anwendung der vier Upmix- oder Kodiervorrichtungen 81.1, 81.2, 81.3 und 81.4 auf die vier benachbarten Signalpaare FLD-FRD, FRD-BRD, BRD-BLDund BLD-FLD. Die vier Upmix- oder Kodiervorrichtungen 81.1, 81.2, 81.3 und 81.4 können zum Beispiel wie in Fig. 2 oder 3 ausgeführt sein. Allerdings ist jede andere Ausführungsform, die unter den Schutzbereich der Erfindung fällt, möglich. Hier werden die Kanäle FLU, BLUund SiLUdes Upmixsignals aus der Anwendung der Upmix- oder Kodiervorrichtungen 81.1 auf das Signalpaar BLD-FLDermittelt. Der Kanal FCUdes Upmixsignals wird aus der Anwendung der Upmix- oder Kodiervorrichtungen 81.2 auf das Signalpaar FLD-FRDermittelt. Die Kanäle FRUund SiRUdes Upmixsignals werden aus der Anwendung der Upmix- oder Kodiervorrichtungen 81.3 auf das Signalpaar FRD-BRDermittelt. Die Kanäle BRUund BCUdes Upmixsignals werden aus der Anwendung der Upmix- oder Kodiervorrichtungen 81.4 auf das Signalpaar BRD-BLDermittelt. Da sich die Ecksignale oder Seitensignale FLU, FRU, BRUund BLUjeweils aus den zwei benachbarten Signalpaaren bestimmen lassen, muss das Ecksignal immer nur durch eines der beiden möglichen Signalpaare bestimmt werden. Somit muss jede Upmix-oder Kodiervorrichtungen 81.1, 81.2, 81.3 und 81.4 den entsprechenden Mittenkanal FCU, SiRU, BCU, oder SiLU, der aus dem eingegebenen Signalpaar ermittelt wird, bestimmen. Die Verteilung, welches der Upmix- oder Kodiervorrichtungen 81.1, 81.2, 81.3 und 81.4, die Seitensignale bestimmt, ist beliebig. Somit können hier durch die Upmix- oder Kodiervorrichtung 20 oder 40 nur zwei Ausgangssignale oder nur der zentrale Kanal zwischen dem Signalpaar berechnet werden, wenn eines oder beide der Seitenkanäle des Signalpaars durch beide benachbarten Signalpaare oder durch ein benachbartes Signalpaar bestimmt wird.
[0050] Fig. 8 zeigt ein weiteres mögliches Ausführungsbeispiel einer Upmix- oder Kodiervorrichtung 90 zur Bestimmung des Upmixsignals durch Anwendung der vier Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 und 91.4 auf die vier benachbarten Signalpaare BLD-FLD, FLD-FRD, FRD-BRDund BRD-BLD. Die vier Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 und 91.4 entsprechen hier den vier Upmix- oder Kodiervorrichtungen 81.1, 81.2, 81.3 und 81.4. Zusätzlich werden die aus den vier Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 und 91.4 ausgegebenen Zentralkanäle FCK, SiRK, BCKund SiLKmit einem zweiten Faktor B korrigiert, um das richtige Verhältnis zu den Seitenkanälen herzustellen. In einem Ausführungsbeispiel ist der zweite Faktor B = –15dB = 0.1774. Dies wird durch die Gains 94.1, 94.2, 94.3 und 94.4 erreicht. Da die vier Seitenkanäle FLD, FRd, BRd und BLD des Downmixsignals jeweils die Anteile der zwei benachbarter Mittenkanäle enthalten, bleibt in dem von einer Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 oder 91.4 ausgegebenen Seitenkanal FLK, FRK, BRKoder BLKnoch der Anteil des Mittenkanals enthalten, der aus dem Signalpaar ermittelt wird, das nicht für die Bestimmung des entsprechenden Seitenkanals verwendet wird. Deshalb ist es vorteilhaft, die Eckkanäle FLK, FRK, BRKoder BLKdurch diesen weiteren Mittenkanal FCK, SiRK, SiLKoder BCKzu korrigieren. Dies wird durch die Subtrahierer 95.1, 95.2, 95.3 und 95.4 erreicht. Zur Bestimmung der resultierenden Mittenkanäle FCU, SiRU, SiLUoder BCUwerden nunmehr die Gains 93.1, 93.2, 93.3 und 93.4 mit dem Faktor A angewandt. Somit werden die Kanäle des Upmixsignals aus den korrigierten Signalen FLK, FRK, BRK, BLK, FCK, SiRK, BCKund SiLKwie folgt bestimmt: BLU= BLK– B * BCK, SiLU= A * B * SiLK, FLU= FLK– B * FCK, FCU= A * B * FCK, FRU= FRK– B * FCK, SiRU= A * B * SiRK, BRU= BRK– B * SiRK, und BCU= A * B * BCK
[0051] Aus dieser Bestimmung lassen sich unmittelbar eine Reihe von äquivalenten Ausführungsvarianten ableiten: So lassen sich etwa Gains auch für die von einer Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 oder 91.4 ausgegebenen Seitenkanäle FLK, FRK, BRKoder BLKvor und/oder nach den Subtrahieren 95.1, 95.2, 95.3 und 95.4 einführen, oder auch unmittelbar Gains für die aus den vier Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 und 91.4 ausgegebenen Zentralkanäle FCK, SiRK, BCKund SiLKunmittelbar vor den Subtrahieren 95.1, 95.2, 95.3 und 95.4. Auch können hier beschriebene Gains ganz oder teilweise entfallen oder Vielfache der angegebenen Signale gebildet werden. Alle diese Ausführungsvarianten sollen als Teil der Erfindung gelten.
[0052] Allerdings hängt gerade die Korrektur der Seitenkanäle davon ab, welche Seitenkanäle mit welchen Kanalpaaren berechnet wurden.
[0053] Besonders an der Korrektur der Mittenkanäle in den Upmix- oder Kodiervorrichtung 20, 40, 81.1 bis 81.4 oder 91.1 bis 91.4 ist, dass diese Signalanteile der Seitenkanäle RD und LD des Downmixsignals und der Seitenkanäle RKund LKdes Korrelationsvergleichs für die Korrektur des Mittenkanals CKdes Korrelationsvergleichs verwendet werden. Die Ausgabe CUder Upmix- oder Kodiervorrichtung 20 oder 40, oder die Ausgaben FCK, SiRK, BCKund SiLKder Upmix- oder Kodiervorrichtung 81.1 bis 81.4 oder 91.1 bis 91.4 enthalten somit auch Signalanteile der Eckkanäle. Dies hat den Effekt, dass die Mittenkanäle gemeinsame Anteile haben, und es durch sogenanntes Übersprechen beispielsweise zu keiner sauberen Bildung von Phantomschallquellen kommt. Deshalb wird in einem weiteren möglichen Ausführungsbeispiel einer Upmix- oder Kodiervorrichtung 100 vorgeschlagen, die Mittenkanäle von den gemeinsamen Signalanteilen mit benachbarten Mittenkanälen zu befreien. Die vier Upmix- oder Kodiervorrichtungen 101.1, 101.2, 101.3 und 101.4 entsprechen hier den vier Upmix- oder Kodiervorrichtungen 91.1, 91.2, 91.3 und 91.4. Die Gains 103.1, 103.2, 103.3 und 103.4 und die Gains 104.1, 104.2, 104.3 und 104.4 entsprechen den Gains 93.1, 93.2, 93.3 und 93.4 und den Gains 94.1, 94.2, 94.3 und 94.4. Die Subtrahierer 105.1, 105.2, 105.3 und 105.4 entsprechen den Subtrahierern 95.1, 95.2, 95.3 und 95.4. Zusätzlich wird nun für jedes benachbarte Paar von Mittenkanälen ein Korrelationsvergleich 102.1, 102.2, 102.3 oder 102.4 durchgeführt, um die korrelierten Anteile K1, K2, K3oder K4herauszufinden. Die entsprechenden Mittenkanäle FCK, SiRK, SiLKoder BCKwerden durch die entsprechenden korrelierten Anteile K1, K2, K3oder K4korrigiert. Dadurch wird eine saubere Auflösung der Phantomschallquellen erreicht und die Qualität des Upmixsignals weiter erhöht. Die Korrelationsvorrichtungen 102.1, 102.2, 102.3 oder 102.4 entsprechen den Korrelationsvorrichtungen 22 oder 42, wobei nur der korrelierte Anteil ausgegeben wird. Weiterhin wäre es vorteilhaft, die inverse Fouriertransformation 26 oder 46 aus den Upmix- oder Kodiervorrichtungen hinter die Korrektur der Mittenkanäle durch die korrelierten Anteile K1, K2, K3oderK4zu verschieben. Dadurch können die Korrelationsvorrichtungen 102.1, 102.2, 102.3 oder 102.4 den korrelierten Anteil direkt ohne weitere FT und IFT, wie mit Fig. 5 beschrieben, im Frequenzraum bestimmen. Die Mittenkanäle werden wie folgt korrigiert: SiR ́ = SiRK– K1, BC ́ = BCK– K2, SiL ́ = SiLK– K3und FC ́ = FCK– K4.
[0054] In dem gezeigten Ausführungsbeispiel wird ein erstes korreliertes Signal K1eines benachbarten Paares FCK-SiRKder Mittenkanäle direkt aus den von den Upmix- oder Kodiervorrichtungen 101.2 und 101.3 ausgegebenen Mittenkanälen FCKund SiRKbestimmt. Die weiteren bestimmten korrelierten Signale K2, K3und K4werden vorzugsweise durch einen von den Upmix- oder Kodiervorrichtungen 101.1, 101.2, 101.3 und 101.4 ausgegebenen Mittenkanal und durch einen der bereits durch ein korreliertes Signal K1, K2, K3oder K4korrigierten Mittenkanäle bestimmt. Die Reihenfolge und das Signalpaar, mit dem begonnen wird, sind dabei irrelevant. Allerdings ist es gemäss obigen Überlegungen vorteilhaft, wenn immer nur das korrelierte Signal von benachbarten Mittenkanälen berechnet wird. Somit ergeben sich die Kanäle des Upmixsignals in diesem Ausführungsbeispiel zu BLU= BLK– B * (BCK– K2), SiLU= A * B * (SiLK– K3), FLU= FLK - B* ( FCK– K4), FCU= A * B * (FCK– K4), FRU= FRK - B* (FCK– K4), SiRU= A * B * (SiRK– K1), BRU= BRK – B * (SiRK– K1), und BCU= A * B * (BCK– K2).
[0055] Allerdings hängt die Korrektur der Seitenkanäle davon ab, welche Seitenkanäle mit welchen Kanalpaaren berechnet wurden.
[0056] Wie zuvor erwähnt können die resultierenden Kanäle eines Upmixsignals, z.B. des durch die Upmix- oder Kodiervorrichtung(en) 20, 40, 80, 90 oder 100 bestimmten Kanäle, durch Gains bzw. einen Gain angepasst werden, die/der von dem Pegel oder der Loudness des originalen Multikanalsignals bzw. von der Summe von dessen Amplitudenspektrum abhängen/abhängt. Im Folgenden sollen Verfahren beschrieben werden, um die Pegel/Loudness bzw. die Summe des Amplitudenspektrums des Upmixsignals an das originale Multikanalsignal anzupassen. Allerdings können die folgenden Verfahren auch auf andere Upmixsignale oder Multikanalsignale angewandt werden. Dieser Originalpegel oder die Originalloudness bzw. die Summe des originalen Amplitudenspektrums können zum Beispiel mit dem Downmixsignal mitübertragen werden.
[0057] Fig. 10 zeigt ein Verfahren/Vorrichtung zur Berechnung einer Loudness bzw. der Summe des Amplitudenspektrums eines Upmixsignals/Multikanalsignals mit mehreren Kanälen nach der ITU-R Empfehlung BS.1770-3. Dabei wird auf jedes zu verarbeitende Signalfenster eines jeden Kanals ein K-Filter 61 angewandt. Danach wird für jeden Kanal die Summe der Quadrate der Datenpunkte des Signalfensters in der Einheit 62 gebildet, was der Leistung des Kanals in dem Signalfenster entspricht (abgeleitet vom Leistungsspektrum). Alternativ kann dazu die Summe des Amplitudenspektrums des Signalfensters im Zeitraum oder im Fourierraum in der Einheit 62 gebildet werden. Danach wird die Leistung/die Summe des Amplitudenspektrums jedes Kanals mit einem entsprechenden Gain 63 gewichtet, bevor diese in 64 aufsummiert werden. Die Einheiten 65 und 66 sind weitere Verarbeitungen der Ausgabe der Summe 64. Details können in der genannten Empfehlung nachgelesen werden, welche hier per Referenz eingefügt wird. Wenn die Original-Loudness bzw. die Summe des originalen Amplitudenspektrums auf der Basis des Multikanalsignals entsprechend berechnet wird, so können alle Kanäle des Upmixsignals mit dem Verhältnis aus der Summe der originalen Amplitudenspektren (auch abgeleitet aus der Original-Loudness) und der Summe der Amplitudenspektren (auch abgeleitet aus der Loudness) des Upmixsignals korrigiert werden.
[0058] Fig. 11 zeigt nun ein weiteres Ausführungsbeispiel für die Berechnung der Loudness bzw. der Summe der Amplitudenspektren eines Upmixsignals/Multikanalsignals zur Anpassung der Loudness bzw. der Summe der Amplitudenspektren des Upmixsignals an das Multikanalsignal. Hier werden die Kanäle des Multikanalsignals/Upmixsignals in zwei Gruppen unterteilt. Zum Beispiel in Seitenkanäle und in Mittenkanäle. Seitenkanäle sind zum Beispiel FL, FR, BL, BR, TpFL, TpFR, TpBL, TpBR, BtFR, BtFL, FRc, FLc oder deren Unterkombinationen. Mittenkanäle sind zum Beispiel FC, BC, SiR, SiL, TpFC, TpBC, TpSiR, TpSiL, TpC, BtFC oder deren Unterkombinationen. Allgemein sollen die Seitenkanäle in Fig. 11 als S1, S2, etc. bezeichnet werden. Allgemein sollen die Mittenkanäle in Fig. 11 als C1, C2, etc. bezeichnet werden. Für die erste Gruppe (Seitenkanäle) wird eine gemeinsame Loudness/eine gemeinsame Summe der Amplitudenspektren berechnet und für die zweite Gruppe (Mittenkanäle) wird für jeden Kanal jeweils eine individuelle Loudness/eine individuelle Summe des Amplitudenspektrums berechnet. Dies wird sowohl für das originale Multikanalsignal mit den Seitenkanälen SO1, SO2, SO3,... und mit den Mittenkanälen CO1, CO2, CO3,... als auch für das Upmixsignal mit den Seitenkanälen SU1, SU2, SU3,... und mit den Mittenkanälen CU1, CU2, CU3,... gemacht. Die gemeinsame Loudness GSObzw. die gemeinsame Summe der Amplitudenspektren ASOder Seitenkanäle SO1, SO2, SO3,... des Multikanalsignals und die individuelle Loudness GCO1, GCO2, GCO3, … bzw. die individuellen Summen der Amplitudenspektren ACO1, ACO2, ACO3, … der Mittenkanäle CO1, CO2, CO3,... des Multikanalsignal werden in der Downmixvorrichtung in periodischen Abständen berechnet und mit dem Downmixsignal an die Upmixvorrichtung übertragen. Die periodischen Abstände entsprechen in der Regel der Länge eines zu verarbeitenden Signals, wobei die Fensterlänge für die Berechnungen nur den Anfang umfassen kann (beispielsweise einen Look-ahead von rund 900ms), einen längeren Abschnitt oder die gesamte Signallänge. Die gemeinsame Loudness GSUbzw. die gemeinsame Summe der Amplitudenspektren ASUder Seitenkanäle SU1, SU2, SU3,... des Upmixsignals und die individuelle Loudness GCU1, GCU2; GCU3, … bzw. die individuelle Summe der Amplitudenspektren ACU1, ACU2, ACU3, … der Mittenkanäle CU1, CU2, CU3,... des Upmixsignal werden in der Upmix- oder Kodiervorrichtung in den periodischen Abständen berechnet. Die entsprechenden Signalabschnitte/Signalfenster der Seitenkanäle SU1, SU2, SU3,... des Upmixsignals werden dann mit dem Faktor ASO/ASUmultipliziert. Die entsprechenden Signalabschnitte/Signalfenster der Mittenkanäle CU1, CU2, CU3, … des Upmixsignals werden jeweils mit dem zugehörigen individuellen Faktor ACO1/ACU1, ACO2/ACU2, ACO3/ACU3, … multipliziert. Dies hat den grossen Vorteil, dass die durch die Korrekturen hervorgerufenen Lautstärkeveränderungen zwischen den Mittenkanälen und den Seitenkanälen besser korrigiert werden können, und gleichzeitig die weniger anfälligen Seitenkanäle durch eine einfache gemeinsame Pegelkorrektur angepasst werden können.
[0059] Die Korrektur der Pegel/Loudness/Amplitudenspektren ist nicht auf die hier dargestellten Ausführungsbeispiele beschränkt. Insbesondere können die Ansprüche bezgl. dieser Korrektur (z.B. 23 bis 26) auch auf andere Upmixsignale angewandt werden, und ist nicht auf die Upmixsignale der rückbezogenen Ansprüche beschränkt.
[0060] Die Erfindung ist nicht auf die beschriebenen Ausführungsbeispiele beschränkt. Auch wenn die Erfindung im Zusammenhang mit Audiosignalen beschrieben wurde, ist diese nicht auf diese beschränkt. Die Erfindung kann auf alle korrelierten Multikanalsignale Anwendung finden. Ein Beispiel ist ein Downmix von drei Farbkanälen eines Videosignals in zwei Farbkanäle und die darauffolgende Wiederherstellung durch das in den Ausführungsbeispielen beschriebene Verfahren.

Claims (35)

1. Downmixvorrichtung zum Downmixen eines Multikanalsignals mit einem ersten Kanal (LO(t)), mit einem zweiten Kanal (RO(t)) und mit einem dritten Kanal (CO(t)) aufweisend: eine Fouriertransformationsvorrichtung (11) ausgebildet zum Fouriertransformieren des ersten Kanals (LO(t)), des zweiten Kanals (RO(t)) und des dritten Kanals (CO(t)) des Multikanalsignals; einen Downmixer (12) zum Bilden einer ersten Linearkombination aus dem Fourier-transformierten ersten Kanal (LO(k)) und dem Fouriertransformierten dritten Kanal (CO(k)) und einer zweiten Linearkombination aus dem Fouriertransformierten zweiten Kanal (RO(k)) und dem Fouriertransformierten dritten Kanal (CO(k)); dadurch gekennzeichnet, dass die Fouriertransformationsvorrichtung (11) ausgebildet ist, die für die Fouriertransformation verwendeten Fenster des ersten Kanals (LO(t)) und des zweiten Kanals (RO(t)) des Multikanalsignals vor der Fouriertransformation jeweils mit einer ersten Fensterfunktion zur Unterdrückung des Leck-Effekts zu multiplizieren und die für die Fouriertransformation verwendeten Fenster des dritten Kanals (CO(t)) des Multikanalsignals vor der Fouriertransformation mit einer zweiten Fensterfunktion zur Unterdrückung des Leck-Effekts zu multiplizieren.
2. Downmixvorrichtung nach Anspruch 1, wobei sich die erste Fensterfunktion von der zweiten Fensterfunktion unterscheidet.
3. Downmixvorrichtung nach Anspruch 1 oder 2, wobei die erste Fensterfunktion eine Flat-top-Fensterfunktion ist.
4. Downmixvorrichtung nach Anspruch 1 oder 2, wobei die erste Fensterfunktion eine Hamming-Fensterfunktion ist.
5. Downmixvorrichtung nach einem der Ansprüche 1 bis 4, wobei die zweite Fensterfunktion eine Flat-top-Fensterfunktion ist.
6. Downmixvorrichtung nach einem der Ansprüche 1 bis 4, wobei die zweite Fensterfunktion eine Hamming-Fensterfunktion ist.
7. Downmixvorrichtung nach einem der Ansprüche 1 bis 6, wobei die Signalvorrichtung eine inverse Fouriertransformationsvorrichtung (13) zur inversen Fouriertransformation der ersten Linearkombination und der zweiten Linearkombination oder von aus diesen gebildeten Signalen aufweist.
8. Downmixvorrichtung nach einem der Ansprüche 1 bis 7, wobei der Downmixer ausgebildet ist, den Fouriertransformierten ersten Kanal (LO(k)) und den mit einhalb multiplizierten Fourier-transformierten dritten Kanal (CO(k)) zu addieren und den Fourier-transformierten zweiten Kanal (RO(k)) und den mit einhalb multiplizierten Fourier-transformierten dritten Kanal (CO(k)) zu addieren.
9. Downmixvorrichtung nach einem der Ansprüche 1 bis 8, wobei die Downmixvorrichtung eine Phasenkorrekturvorrichtung aufweist.
10. Downmixvorrichtung nach Anspruch 9, wobei die Phasenkorrekturvorrichtung ausgebildet ist, die Amplitude der Summe der spektralen Anteile der für die Linearkombination zu summierenden Signale pro Frequenz in Abhängigkeit der Summe der spektralen Anteile der Powerspektren der für die Linearkombination zu summierenden Signale zu korrigieren.
11. Downmixvorrichtung nach einem der Ansprüche 1 bis 10, aufweisend eine Signalvorrichtung zum Bilden eines ersten Kanals des Downmixsignals auf der Basis der ersten Linearkombination (LD(k)) und zum Bilden eines zweiten Kanals des Downmixsignals (RD(k)) auf der Basis der zweiten Linearkombination.
12. Upmix- oder Kodiervorrichtung zur Bestimmung eines Multikanalsignals mit einem ersten Kanal (LU(t), LU(k)), mit einem zweiten Kanal (RU(t), RU(k)) und mit einem dritten Kanal (CU(t), CU(k)) aus einem Downmixsignal mit einem ersten Kanal (LD(t), LD(k)) und mit einem zweiten Kanal (RD(t), RD(k)) aufweisend: eine Korrelationsvergleichsvorrichtung (22, 42) zur Bestimmung eines korrelierten Signals (CK(t), CK(k)) auf der Basis der korrelierten Anteile des ersten Kanals (LD(t), LD(k)) und des zweiten Kanals (RD(t), RD(k)) des Downmixsignals und zur Bestimmung zumindest eines Signals aus einem ersten individuellen Signal (LK(t) und, LK(k)) und einem zweiten individuellen Signal (RK(t) und, RK(k)), wobei das erste individuelle Signal auf der Basis der dem ersten Kanal (LD(t), LD(k)) des Downmixsignals spezifischen Anteile bestimmt wird und/oder das zweite individuelle Signal (RK(t), RK(k)) auf der Basis der dem zweiten Kanal (RD(t), RD(k)) des Downmixsignals spezifischen Anteile bestimmt wird; eine Korrekturvorrichtung (29, 49) aufweisend eine oder eine Kombination von einer ersten Signalverarbeitungsvorrichtung (23, 43) zur Bestimmung eines ersten Signals (SL(t), SL(k); LU(t), LU(k)) auf der Basis des ersten individuellen Signals (LK(t), LK(k)), des ersten Kanals (LD(t), LD(k)) des Downmixsignals und des korrelierten Signals (CK(t), CK(k)), einer zweiten Signalverarbeitungsvorrichtung (24, 44) zur Bestimmung eines zweiten Signals (SR(t), SR(k); RU(t), RU(k)) auf der Basis des zweiten individuellen Signals (RK(t), RK(k)), des zweiten Kanals (RD(t), RD(k)) des Downmixsignals und des korrelierten Signals (CK(t), CK(k)), und/oder einer dritten Signalverarbeitungsvorrichtung (25, 45) zur Bestimmung eines dritten Signals (SC(t), SC(k); CU(t) CU(k)) auf der Basis des ersten individuellen Signals (LK(t), LK(k)), des ersten Kanals (LD(t), LD(k)) des Downmixsignals, des zweiten individuellen Signals (RK(t), RK(k)), des zweiten Kanals (RD(t), RD(k)) des Downmixsignals und des korrelierten Signals (CK(t), CK(k)); und eine vierte Signalverarbeitungsvorrichtung (28, 48) zur Bestimmung eines oder einer Kombination von einem ersten Kanal (LU(t), LU(k)) eines Multikanalsignals auf der Basis des ersten Signals (SL(t), SL(k); LU(t), LU(k)), einem zweiten Kanal (RU(t), RU(k)) eines Multikanalsignals auf der Basis des zweiten Signals (SR(t), SR(k); RU(t), RU(k)) und/oder einem dritten Kanal (CU(t), CU(k)) eines Multikanalsignals auf der Basis des dritten Signals (SC(t), SC(k); CU(t), CU(k)).
13. Upmix- oder Kodiervorrichtung nach Anspruch 12, wobei die erste Signalverarbeitungsvorrichtung (23, 43) ausgebildet ist, das erste individuelle Signal (LK(t), LK(k)) und das korrelierte Signal (CK(t), CK(k)) gewichtet zu addieren und den ersten Kanal (LD(t), LD(k)) des Downmixsignals zu subtrahieren, um das erste Signal (SL(t), SL(k); LU(t), LU(k)) zu erhalten; und/oder die zweite Signalverarbeitungsvorrichtung (24, 44) ausgebildet ist, das zweite individuelle Signal (RK(t), RK(k)) und das korrelierte Signal (CK(t), CK(k)) gewichtet zu addieren und den zweiten Kanal (RD(t), RD(k)) des Downmixsignals zu subtrahieren, um das zweite Signal (SR(t), SR(k); RU(t), RU(k)) zu erhalten; und/oder die dritte Signalverarbeitungsvorrichtung (25, 45) ausgebildet ist, das erste individuelle Signal (LK(t), LK(k)), das zweite individuelle Signal (RK(t), RK(k)) und das korrelierte Signal (CK(t), CK(k)) gewichtet zu addieren und den ersten Kanal (LD(t), LD(k)) und den zweiten Kanal (RD(t), RD(k)) des Downmixsignals zu subtrahieren, um das dritte Signal (SC(t), SC(k); CU(t), CU(k)) zu erhalten.
14. Upmix- oder Kodiervorrichtung nach Anspruch 13, wobei die erste Signalverarbeitungsvorrichtung (23) ausgebildet ist, das erste individuelle Signal (LK(t), LK(k)) doppelt und das korrelierte Signal (CK(t), CK(k)) einfach zu gewichten; und/oder die zweite Signalverarbeitungsvorrichtung (24) ausgebildet ist, das zweite individuelle Signal (RK(t), RK(k)) doppelt und das korrelierte Signal (CK(t), CK(k)) einfach zu gewichten; und/oder die dritte Signalverarbeitungsvorrichtung (25) ausgebildet ist, das erste individuelle Signal (LK(t), LK(k)) einfach, das zweite individuelle Signal (RK(t), RK(k)) einfach und das korrelierte Signal (CK(t), CK(k)) vierfach zu gewichten.
15. Upmix- oder Kodiervorrichtung nach einem der Ansprüche 12 bis 14, wobei die vierte Signalverarbeitungsvorrichtung (28) eine fünfte Signalvorrichtung (27) aufweist, die ausgebildet ist, das erste Signal (SL(t), SL(k)) und/oder das zweite Signal (SR(t), SR(k)) auf der Basis des korrelierten Signals (CK(t), CK(k)) zu korrigieren und/oder das dritte Signal (SC(t), SC(k)) auf der Basis des ersten und zweiten individuellen Signals (LK(t), LK(k); RK(t), RK(k)) zu korrigieren.
16. Upmix- oder Kodiervorrichtung nach einem der Ansprüche 12 bis 15, wobei die vierte Signalverarbeitungsvorrichtung (28) eine fünfte Signalvorrichtung (27) aufweist, die ausgebildet ist, den aus dem dritten Signal (SC(t), SC(k)) gebildeten Kanal (CU(t), CU(k)) des Multikanalsignals mit –9dB abzuschwächen.
17. Upmix- oder Kodiervorrichtung nach Anspruch 13, wobei die erste Signalverarbeitungsvorrichtung (43) ausgebildet ist, das erste individuelle Signal (LK(t), LK(k)) doppelt und das korrelierte Signal (CK(t), CK(k)) doppelt zu gewichten; und/oder die zweite Signalverarbeitungsvorrichtung (44) ausgebildet ist, das zweite individuelle Signal (RK(t), RK(k) ) doppelt und das korrelierte Signal (CK(t), CK(k)) doppelt zu gewichten; und/oder die dritte Signalverarbeitungsvorrichtung (45) ausgebildet ist, das erste individuelle Signal (LK(t), LK(k)) doppelt, das zweite individuelle Signal (RK(t), RK(k)) doppelt und das korrelierte Signal (CK(t), CK(k)) vierfach zu gewichten.
18. Upmix- oder Kodiervorrichtung nach einem der Ansprüche 12 bis 17, aufweisend eine Fouriertransformationsvorrichtung (21, 41) zur Fouriertransformation des ersten Kanals (LD(t)) und des zweiten Kanals (RD(t)) des Downmixsignals, wobei die Korrelationsvergleichsvorrichtung (22, 42), die erste Signalverarbeitungsvorrichtung (23, 43), die zweite Signalverarbeitungsvorrichtung (24, 44) und die dritte Signalverarbeitungsvorrichtung (25, 45) ausgebildet sind, deren Eingangssignale im Fourierraum zu verarbeiten; und/oder eine inverse Fouriertransformationsvorrichtung (26, 46) in der vierten Signalverarbeitungsvorrichtung (28, 48) zur inversen Fouriertransformation des ersten Signals (SL(k), LU(k)), des zweiten Signals (SR(k) ), RU(k)) und des dritten Signals (SC(k), ), CU(k)).
19. Upmix- oder Kodiervorrichtung nach Anspruch 18, wobei die inverse Fouriertransformationsvorrichtung (26) weiter ausgebildet ist, eine inverse Fouriertransformation des ersten individuellen Signals (LK(k)), des zweiten individuellen Signals (RK(k)) und/oder des korrelierten Signals (CK(k)) zu bestimmen, wobei die fünfte Signalverarbeitungsvorrichtung (27) deren Eingangssignale im Zeitraum verarbeitet.
20. Upmix- oder Kodiervorrichtung zum Bestimmen eines Upmixsignals mit mindestens fünf Kanälen aus einem Downmixsignal mit mindestens drei Kanälen, aufweisend mindestens zwei Upmixer (81.1, 81.2, 81.3, 81.4; 91.1, 91.2, 91.3, 91.4; 101.1, 101.2, 101.3, 101.4;) nach Ansprüchen 12 bis 19 zum Bestimmen zumindest zweier Mittenkanäle des Upmixsignals und zumindest dreier Seitenkanäle des Upmixsignals.
21. Upmix- oder Kodiervorrichtung nach Anspruch 20, wobei die Upmixer ausgebildet sind, wenigsten einen der zumindest drei Seitenkanäle mit einem der zumindest zwei Mittenkanäle zu korrigieren.
22. Upmix- oder Kodiervorrichtung nach Anspruch 21, wobei einer der zumindest drei Seitenkanäle des Upmixsignals aus einem Paar benachbarter Kanäle des Downmixsignals mittels eines der zumindest zwei Upmixer ermittelt wird, und dieser der zumindest drei Seitenkanäle durch denjenigen der zumindest zwei Mittenkanäle korrigiert wird, der durch ein zweites Paar benachbarter Kanäle des Downmixsignals, das ebenfalls zur Bestimmung dieses der zumindest drei Seitenkanäle verwendet werden könnte, bestimmt wird.
23. Upmix- oder Kodiervorrichtung nach einem der Ansprüche 12 bis 22, wobei die Pegel oder die Loudness oder die Summe der Amplitudenabsolutbeträge der Kanäle des Upmixsignals an die Pegel oder die Loudness oder die Amplitudenabsolutbeträge der Kanäle des Multikanalsignals, auf dem das Downmixsignal basiert, angepasst werden.
24. Upmix- oder Kodiervorrichtung nach Anspruch 23, wobei ein gemeinsamer Wert einer ersten Gruppe von Kanälen des Upmixsignals an einen gemeinsamen Wert einer ersten Gruppe von Kanälen des Multikanalsignals angepasst wird, und individuelle Werte einer zweiten Gruppe von Kanälen des Upmixsignals an die entsprechenden individuellen Werte einer zweiten Gruppe von Kanälen des Multikanalsignals angepasst werden.
25. Upmix- oder Kodiervorrichtung nach Anspruch 24, wobei der gemeinsame Wert des Multikanalsignals und/oder des Upmixsignals durch die Summe von Kanalwerten der Kanäle der ersten Gruppe bestimmt wird, wobei jeder Kanalwert eines Kanals durch die Summe der Amplitudenabsolutbeträge oder Quadrate bestimmt wird, wobei evtl. vor der Summe der Amplitudenabsolutbeträge oder Quadrate die Kanäle K-gefiltert wurden; und/oder jeder individuelle Wert eines Kanals der zweiten Gruppe durch die Summe der Amplitudenabsolutbeträge oder Quadrate des Kanals bestimmt wird.
26. Upmix- oder Kodiervorrichtung nach Anspruch 24 oder 25, wobei die erste Gruppe von Kanälen Seitenkanäle enthält und die zweite Gruppen von Kanälen Mittenkanäle enthält.
27. Ein System aufweisend: eine Downmixvorrichtung zum Downmixen eines Multikanalsignals mit einem ersten Kanal (LO(t)), mit einem zweiten Kanal (RO(t)) und mit einem dritten Kanal (CO(t)) in ein Downmixsignal mit einem ersten Kanal (LD(t)) und mit einem zweiten Kanal (RD(t)); eine Upmix- oder Kodiervorrichtung nach einem der Ansprüche 12 bis 19 zum Bestimmen eines ersten Kanals (LU(t) LU(k)), eines zweiten Kanals (RU(t), RU(k)) und eines dritten Kanals (CU(t), CU(k)) eines Multikanalsignals aus dem ersten Kanal (LD(t), LD(k)) und dem zweiten Kanal (RD(t), RD(k)) des Downmixsignals.
28. System nach Anspruch 27 aufweisend Speichermittel und/oder Streamingdaten zum Übertragen des Downmixsignals von der Downmixvorrichtung zu der Upmix- oder Kodiervorrichtung.
29. System nach Anspruch 27 oder 28, wobei die Downmixvorrichtung eine Downmixvorrichtung nach einem der Ansprüche 1 bis 11 ist.
30. Downmixverfahren zum Downmixen eines Multikanalsignals mit einem ersten Kanal (LO(t)), mit einem zweiten Kanal (RO(t)) und mit einem dritten Kanal (CO(t)) aufweisend die Schritte: Fourier-transformieren des ersten Kanals (LO(t)), des zweiten Kanals (RO(t)) und des dritten Kanals (CO(t)) des Multikanalsignals; Bilden einer ersten Linearkombination aus dem Fourier-transformierten ersten Kanal (LO(k)) und dem Fourier-transformierten dritten Kanal (CO(k)) und einer zweiten Linearkombination aus dem Fouriertransformierten zweiten Kanal (RO(k)) und dem Fouriertransformierten dritten Kanal (CO(k)); Bilden eines ersten Kanals (LD(t)) des Downmixsignals auf der Basis der ersten Linearkombination (LD(k)) und zum Bilden eines zweiten Kanals (RD(t)) des Downmixsignals auf der Basis der zweiten Linearkombination (RD(k)); dadurch gekennzeichnet, dass die für die Fouriertransformation verwendeten Fenster des ersten Kanals (LO(t)) und des zweiten Kanals (RO(t)) des Multikanalsignals vor der Fouriertransformation jeweils mit einer ersten Fensterfunktion zur Unterdrückung des Leck-Effekts multipliziert werden und die für die Fouriertransformation verwendeten Fenster des dritten Kanals (CO(t)) des Multikanalsignals vor der Fouriertransformation mit einer zweiten Fensterfunktion zur Unterdrückung des Leck-Effekts multipliziert werden.
31. Upmix- oder Kodierverfahren zur Bestimmung eines ersten Kanals (LU(t), LU(k)), eines zweiten Kanals (RU(t), RU(k)) und/oder eines dritten Kanal (CU(t), CU(k)) aus einem Downmixsignal mit einem ersten Kanal (LD(t), LD(k)) und mit einem zweiten Kanal (RD(t), RD(k)), aufweisend die Schritte: Bestimmung eines korrelierten Signals (CK(t), CK(k)) auf der Basis der korrelierten Anteile des ersten Kanals (LD(t), LD(k)) und des zweiten Kanals (RD(t), RD(k)) des Downmixsignals, Bestimmung eines ersten individuellen Signals (LK(t), LK(k)) auf der Basis der dem ersten Kanal (LD(t), LD(k)) des Downmixsignals spezifischen Anteile und Bestimmung eines zweiten individuellen Signals (RK(t), RK(k)) auf der Basis der dem zweiten Kanal (RD(t), RD(k)) des Downmixsignals spezifischen Anteile; Bestimmung eines ersten Signals (SL(t), SL(k)) auf der Basis des ersten individuellen Signals (LK(t), LK(k)), des ersten Kanals (LD(t), LD(k)) des Downmixsignals und des korrelierten Signals (CK(t), CK(k)); Bestimmung eines zweiten Signals (SR(t), SR(k)) auf der Basis des zweiten individuellen Signals (RK(t), RK(k)), des zweiten Kanals (RD(t), RD(k)) des Downmixsignals und des korrelierten Signals (CK(t), CK(k)); Bestimmung eines dritten Signals (SC(t), SC(k)) auf der Basis des ersten individuellen Signals (LK(t), LK(k)), des ersten Kanals (LD(t), LD(k)) des Downmixsignals, des zweiten individuellen Signals (RK(t), RK(k)), des zweiten Kanals (RD(t), RD(k)) des Downmixsignals und des korrelierten Signals (CK(t), CK(k)); Bestimmung eines ersten Kanals (LU(t), LU(k)) eines Multikanalsignals auf der Basis des ersten Signals (SL(t), SL(k)), eines zweiten Kanals (RU(t), RU(k)) eines Multikanalsignals auf der Basis des zweiten Signals (SR(t), SR(k)) und eines dritten Kanals (CU(t), CU(k)) eines Multikanalsignals auf der Basis des dritten Signals (SC(t), SC(k)).
32. Ein Verfahren aufweisend: ein Downmixverfahren zum Downmixen eines Multikanalsignals mit einem ersten Kanal (LO(t)), mit einem zweiten Kanal (RO(t)) und mit einem dritten Kanal (CO(t)) in ein Downmixsignal mit einem ersten Kanal (LD(t)) und mit einem zweiten Kanal (RD(t)); ein Upmix- oder Kodierverfahren nach Anspruch 31 zum Bestimmen eines ersten Kanals (LU(t), LU(k)), eines zweiten Kanals (RU(t), RU(k)) und eines dritten Kanals (CU(t), CU(k)) eines Multikanalsignals aus dem ersten Kanal (LD(t), LD(k)) und dem zweiten Kanal (RD(t), RD(k)) des Downmixsignals.
33. Verfahren nach Anspruch 32 aufweisend den Schritt des Übermitteins des Downmixsignals von einer Downmixvorrichtung zu einer Upmix- oder Kodiervorrichtung.
34. Verfahren nach einem der Ansprüche 32 bis 33, wobei das Upmixverfahren ein Verfahren nach Anspruch 31 ist.
35. Computerprogramm ausgebildet bei Ausführung auf einem Prozessor die Schritte des Verfahrens nach einem der Ansprüche 30 bis 34 auszuführen.
CH00996/14A 2014-05-15 2014-07-01 Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix. CH709721A2 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CH00996/14A CH709721A2 (de) 2014-05-15 2014-07-01 Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix.
PCT/EP2015/060812 WO2015173422A1 (de) 2014-05-15 2015-05-15 Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CH7442014 2014-05-15
CH00996/14A CH709721A2 (de) 2014-05-15 2014-07-01 Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix.

Publications (1)

Publication Number Publication Date
CH709721A2 true CH709721A2 (de) 2015-11-30

Family

ID=54700248

Family Applications (1)

Application Number Title Priority Date Filing Date
CH00996/14A CH709721A2 (de) 2014-05-15 2014-07-01 Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix.

Country Status (1)

Country Link
CH (1) CH709721A2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003857A (zh) * 2021-09-25 2022-02-01 淮阴师范学院 一种基于可变滑动窗口的短时线性正则变换时频分析方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114003857A (zh) * 2021-09-25 2022-02-01 淮阴师范学院 一种基于可变滑动窗口的短时线性正则变换时频分析方法
CN114003857B (zh) * 2021-09-25 2025-01-28 淮阴师范学院 一种基于可变滑动窗口的短时线性正则变换时频分析方法

Similar Documents

Publication Publication Date Title
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
DE69603166T2 (de) Verfahren und vorrichtung zur effizienten implementierung von einseitenband-filterbänken, die genaue werte der spektralen amplitude und phase erzeugen
EP0719483B1 (de) Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen
EP0624866B1 (de) Frequenzanalyseverfahren
DE102012217582A1 (de) Kalibrierung eines rekonstruierten Signals unter Anwendung eines Mehrton-Kalibriersignals
DE102013217181A1 (de) Verfahren und System zum Durchführen einer Spektralanalyse eines nicht stationären Signals in Echtzeit
DE102006047197B3 (de) Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
DE69221228T2 (de) Adaptives Filterverfahren eines in Teilbändern transformierten Signals und entsprechende Filteranordnung
DE102019119776B4 (de) Zeitverschachtelte digital-analog-wandler-korrektur
DE10234130B3 (de) Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
WO2015049334A1 (de) Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
WO1993009644A1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
DE69317802T2 (de) Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
WO2015049332A1 (de) Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
EP0957471B1 (de) Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen
DE2446287B2 (de) Kernresonanzspektrometer
EP1239455A2 (de) Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung
DE102014210009A1 (de) Verfahren zur Signalverarbeitung mithilfe variabler Koeffizienten
DE10255687B4 (de) Verfahren zur Verringerung des Crestfaktors eines Multiträgersignals
DE69823557T2 (de) Schnelle frequenztransformationstechnik für transform audio koder
CH709721A2 (de) Verfahren und Vorrichtung zur residualfreien Erzeugung eines Upmix aus einem Downmix.
DE2635564A1 (de) Digitale schaltungsanordnung zur analyse eines signalverlaufs
WO2015173422A1 (de) Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
DE102012210498A1 (de) Signalmessgerät, Signalmessverfahren und Programm
DE69515509T2 (de) Sprachverarbeitung

Legal Events

Date Code Title Description
AZW Rejection (application)