EP2115741B1

EP2115741B1 - Fortgeschrittene kodierung/dekodierung von digitalen tonsignalen

Info

Publication number: EP2115741B1
Application number: EP08762010A
Authority: EP
Inventors: Stéphane RAGOT; Cyril Guillaume
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2007-02-02
Filing date: 2008-01-30
Publication date: 2010-07-07
Anticipated expiration: 2028-01-30
Also published as: EP2115741A1; KR20090104846A; CN101622661B; KR101425944B1; ATE473504T1; ES2347850T3; US20100121646A1; FR2912249A1; WO2008104663A1; DE602008001718D1; US8543389B2; JP5357055B2; JP2010518422A; CN101622661A

Claims

Verfahren zum Codieren eines Tonsignals in mehreren Unterbändern, bei dem mindestens ein erstes und ein zweites benachbartes Unterband transformationscodiert werden (601, 602; 901, 902), dadurch gekennzeichnet, dass das Verfahren zur Anwendung einer perzeptuellen Gewichtung im transformierten Bereich auf mindestens das zweite Unterband aufweist:
- eine Bestimmung mindestens einer Frequenzmaskierungsschwelle (606; 905; 906b), die an das zweite Unterband anzuwenden ist, und

- eine Normalisierung der Maskierungsschwelle, um eine spektrale Kontinuität zwischen dem ersten und dem zweiten Unterband zu gewährleisten.
Verfahren nach Anspruch 1, bei dem eine Anzahl von jedem Unterband zuzuweisenden Bits ausgehend von einer spektral Hüllkurve bestimmt wird,
dadurch gekennzeichnet, dass die Zuweisung der Bits (607) für mindestens das zweite Unterband außerdem in Abhängigkeit von einer Berechung einer normalisierten Maskierungskurve bestimmt wird, die mindestens an das zweite Unterband (606) angewendet wird.
Verfahren nach Anspruch 2, bei dem die Codierung an mehr als zwei Unterbändern durchgeführt wird, wobei das erste Unterband in einem ersten Spektralband und das zweite Unterband in einem zweiten Spektralband enthalten ist, dadurch gekennzeichnet, dass die Anzahl von Bits pro Unterband nbit(j) für jedes Unterband mit dem Index j sich in Abhängigkeit von einer perzeptuellen Größe (ip(j) ergibt, die ausgehend von einer Beziehung des folgenden Typs berechnet wird:
- $ip (j) = \frac{1}{2} rms_index (j),$
wenn j ein Unterband-Index im ersten Band ist, und

- $ip (j) = \frac{1}{2} [rms_index (j) - log_mask (j)],$
wenn j ein Unterband-Index im zweiten Band ist, mit log_mask(j) = log₂(M(j))-normfac, wobei:
- rms_index(j) aus der Codierung der Hüllkurve stammende quantisierte Werte für das Unterband j sind,

- M(j) die Maskierungsschwelle für das Unterband mit dem Index j ist, und

- normfac ein bestimmter Normalisierungsfaktor ist, um die spektrale Kontinuität zwischen dem ersten und dem zweiten Unterband zu gewährleisten.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das transformierte Signal im zweiten Unterband mit einem Faktor proportional zur Quadratwurzel der normalisierten Maskierungsschwelle für das zweite Unterband gewichtet wird (905).
Verfahren nach Anspruch 4, bei dem die Codierung an mehr als zwei Unterbändern durchgeführt wird, wobei das erste Unterband in einem ersten Spektralband und das zweite Unterband in einem zweiten Spektralband enthalten ist, dadurch gekennzeichnet, dass Gewichtungswerte von $\sqrt{M (j)}$
codiert werden (906), wobei M(j) die normalisierte Maskierungsschwelle für ein Unterband mit dem Index j ist, das im zweiten Spektralband enthalten ist.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Transformationscodierung in einer oberen Schicht (110) eines hierarchischen Codierers stattfindet,
- wobei das erste Unterband ein Signal $(d_{LB}^{w})$
aufweist, das von einer Kerncodierung (105) des hierarchischen Codierers stammt,

- und das zweite Unterband ein originales Signal (S_HB) aufweist.
Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das von der Kerncodierung stammende Signal $(d_{LB}^{w})$
perzeptuell gewichtet wird (600; 900).
Verfahren nach einem der Ansprüche 6 und 7, dadurch gekennzeichnet, dass das von der Kerncodierung stammende Signal $(d_{LB}^{w})$
ein für eine Differenz zwischen einem originalen Signal und einer Synthese dieses originalen Signals repräsentatives Signal ist.
Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass die Transformationscodierung vom Typ TDAC in einem globalen Codierer gemäß der Norm G.729.1 ist, und dass das erste Unterband in einem Band niederer Frequenzen (T1) enthalten ist, während das zweite Unterband in einem Band hoher Frequenzen enthalten ist.
Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass das Band hoher Frequenzen sich bis 7000 Hz (T2) erstreckt, mindestens (T3).
Verfahren nach einem der vorhergehenden Ansprüche, bei dem eine spektrale Hüllkurve berechnet wird (604; 904), dadurch gekennzeichnet, dass die Maskierungsschwelle für ein Unterband definiert wird durch eine Faltung zwischen:
- einem Ausdruck der spektralen Hüllkurve und

- einer Spreizfunktion, die eine zentrale Frequenz des Unterbands benutzt.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem eine Information (305) erhalten wird, gemäß der das zu codierende Signal ein tonales Signal ist oder nicht, dadurch gekennzeichnet, dass die perzeptuelle Gewichtung des zweiten Unterbands mit der Bestimmung der Maskierungsschwelle und der Normalisierung nur durchgeführt werden, wenn das Signal nicht tonal ist.
Verfahren zur Decodierung eines Tonsignals in mehreren Unterbändern, bei dem mindestens ein erstes und ein zweites benachbartes Unterband transformationsdecodiert werden (709, 711; 1007, 1009), dadurch gekennzeichnet, dass das Verfahren zur Anwendung einer perzeptuellen Gewichtung im transformierten Bereich auf mindestens das zweite Unterband aufweist:
- eine Bestimmung mindestens einer Frequenzmaskierungsschwelle (702; 1001; 1011b), die ausgehend von einer decodierten spektralen Hüllkurve an das zweite Unterband anzuwenden ist, und

- eine Normalisierung der Maskierungsschwelle, um eine spektrale Kontinuität zwischen dem ersten und dem zweiten Unterband zu gewährleisten.
Verfahren nach Anspruch 13, bei dem eine Anzahl von jedem Unterband (703) zuzuweisenden Bits ausgehend von einer Decodierung der spektralen Hüllkurve (701) bestimmt wird,
dadurch gekennzeichnet, dass die Zuweisung der Bits (703) für mindestens das zweite Unterband außerdem in Abhängigkeit von einer Berechung einer normalisierten Maskierungskurve (702) bestimmt wird, die mindestens an das zweite Unterband angewendet wird.
Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass das transformierte Signal im zweiten Unterband mit einem Faktor proportional zur Quadratwurzel der normalisierten Maskierungsschwelle für das zweite Unterband gewichtet wird (1004).
EDV-Programm, das in einem Speicher eines Codierers eines Telekommunikations-Endgeräts gespeichert ist und/oder auf einem Speicherträger gespeichert ist, der dazu bestimmt ist, mit einem Lesegerät des Codierers zusammenzuwirken,
dadurch gekennzeichnet, dass es Anweisungen zur Durchführung des Codierverfahrens nach einem der Ansprüche 1 bis 12 aufweist, wenn die Anweisungen von einem Prozessor des Codierers ausgeführt werden.
Codierer, dadurch gekennzeichnet, dass er mindestens einen Speicher aufweist, der ein EDV-Programm nach Anspruch 16 speichert.
EDV-Programm, das in einem Speicher eines Decodierers eines Telekommunikations-Endgeräts gespeichert ist und/oder auf einem Speicherträger gespeichert ist, der dazu bestimmt ist, mit einem Lesegerät des Decodierers zusammenzuwirken,
dadurch gekennzeichnet, dass es Anweisungen zur Durchführung des Decodierverfahrens nach einem der Ansprüche 13 bis 15 aufweist, wenn die Anweisungen von einem Prozessor des Decodierers ausgeführt werden.
Decodierer, dadurch gekennzeichnet, dass er mindestens einen Speicher aufweist, der ein EDV-Programm nach Anspruch 18 speichert.