EP0657874B1

EP0657874B1 - Stimmkodierer und Verfahren zum Suchen von Kodebüchern

Info

Publication number: EP0657874B1
Application number: EP94119533A
Authority: EP
Inventors: Kazunori C/O Nec Corporation Ozawa
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1993-12-10
Filing date: 1994-12-09
Publication date: 2001-03-14
Anticipated expiration: 2014-12-09
Also published as: DE69426860D1; US5633980A; DE69426860T2; CA2137756C; CA2137756A1; EP0657874A1

Claims

Sprachcodierer mit:

einer Maskierberechnungseinrichtung (205, 360, 910) zum Berechnen von Maskierschwellwerten aus gelieferten diskreten Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen;

einer Hörgefühlswichtungseinrichtung (220) zum Berechnen von Filterkoeffizienten auf der Grundlage der Maskierschwellwerte und Wichtungseingangssignale auf der Grundlage der Filterkoeffizienten;

einem Codebuch (210, 235), das aus mehreren Codevektoren besteht; und

einer Sucheinrichtung (230) zum Suchen eines Codevektors, der eine Ausgangssignalleistung der Hörgefühlswichtungseinrichtung minimiert, aus dem Codebuch.
Sprachcodierer nach Anspruch 1, wobei das Codebuch ein Erregungscodebuch (235) ist.
Sprachcodierer nach Anspruch 1, wobei das Codebuch ein adaptives Codebuch (210, 710) ist.
Sprachcodierer nach einem der Ansprüche 1 bis 3, mit einer Teilrahmenerzeugungseinrichtung (150) zum Teilen der Sprachsignale in Rahmen einer vorher festgelegten Zeitlänge und zum Erzeugen von Teilrahmen durch Teilen der Rahmen in vorher festgelegte Zeitlängeneinteilungen, wobei das Durchsuchen des Codebuchs nach jedem Teilrahmen durchgeführt wird.
Sprachcodierer nach Anspruch 1, ferner mit:

einer Teilungseinrichtung (110) zum Teilen der gelieferten diskreten Sprachsignale in vorher festgelegte Zeitlängenrahmen;

einer Teilrahmenerzeugungseinrichtung (150) zum Erzeugen von Teilrahmen durch Teilen der Rahmen in vorher festgelegte Zeitlängeneinteilungen;

einer adaptiven Codebucheinrichtung, die Teil des Codebuchs ist, zum Regenerieren der Sprachsignale für die Teilrahmen auf der Grundlage eines adaptiven Codebuchs (210, 710);

wobei die Maskierberechnungseinrichtung zum Berechnen von Maskierschwellwerten für jeden der Teilrahmen dient;

wobei die Hörgefühlswichtungseinrichtung ferner zum Durchführen einer Hörgefühlswichtung an einem Fehlersignal eines mit der adaptiven Codebucheinrichtung regenerierten Signals und eines Sprachsignals dient;

einem Erregungscodebuch (235), das ein weiterer Teil des Codebuchs ist und das aus mehreren Codevektoren besteht; und

wobei die Sucheinrichtung zum Suchen eines Codevektors dient, der Fehlersignalleistung minimiert, die mit der Hörgefühlswichtungseinrichtung gewichtet ist.
Sprachcodierer nach Anspruch 1, ferner mit:

einer Teilungseinrichtung (110) zum Teilen der gelieferten diskreten Sprachsignale in vorher festgelegte Zeitlängenrahmen;

einer Teilrahmenerzeugungseinrichtung (150) zum Erzeugen von Teilrahmen durch Teilen der Rahmen in vorher festgelegte Zeitlängeneinteilungen;

wobei die Maskierberechnungseinrichtung zum Berechnen von Maskierschwellwerten für jeden der Teilrahmen dient;

wobei die Hörgefühlswichtungseinrichtung (220) ferner zum Durchführen einer Hörgefühlswichtung an den Sprachsignalen dient;

einer adaptiven Codebucheinrichtung (210), die Teil des Codebuchs ist, zum Berechnen eines adaptiven Codevektors, der eine Leistung eines Differenzsignals zwischen einem Antwortsignal und einem Sprachsignal minimiert, das mit der Hörgefühlswichtungseinrichtung gewichtet ist;

wobei das Codebuch ein Erregungscodebuch (235) ist, das ein weiterer Teil des Codebuchs ist und aus mehreren Erregungscodevektoren besteht; und

wobei die Sucheinrichtung zum Suchen eines Codevektors dient, der eine Fehlersignalleistung zwischen einem Ausgangssignal der adaptiven Codebucheinrichtung und dem Differenzsignal minimiert.
Sprachcodierer nach Anspruch 6, wobei die adaptive Codebucheinrichtung (210, 710) für jeden der Teilrahmen einen Tonhöhenparameter berechnet, so daß ein Signal, das auf der Grundlage eines adaptiven Codebuchs regeneriert ist, das aus vorherigen Erregungssignalen besteht, dem Sprachsignal nahekommt.
Sprachcodierer mit:

einer Teilungseinrichtung (110) zum Teilen gelieferter diskreter Sprachsignale in vorher festgelegte Zeitlängenrahmen;

einer Teilrahmenerzeugungseinrichtung (150) zum Erzeugen von Teilrahmen durch Teilen der Rahmen in vorher festgelegte Zeitlängeneinteilungen;

einer adaptiven Codebucheinrichtung (210) zum Regenerieren der Sprachsignale für jeden der Teilrahmen auf der Grundlage eines adaptiven Codebuchs;

einer Maskierberechnungseinrichtung (205) zum Berechnen von Maskierschwellwerten aus den Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen;

einer Hörgefühlswichtungseinrichtung (220) zum Berechnen von Filterkoeffizienten auf der Grundlage der Maskierschwellwerte und zum Durchführen einer Hörgefühlswichtung an einem Fehlersignal zwischen dem Sprachsignal und einem Signal, das mit der adaptiven Codebucheinrichtung auf der Grundlage der Filterkoeffizienten regeneriert ist; und

einer Berechnungseinrichtung (3000) zum Berechnen eines Mehrfachimpulses, der eine Fehlersignalleistung minimiert, die mit der Hörgefühlswichtungseinrichtung gewichtet ist.
Sprachcodierer nach einem der Ansprüche 1 bis 8, ferner mit einer Bandteilungseinrichtung zum Bandteilen der Sprachsignale, wobei die Hörgefühlswichtungseinrichtung eine Wichtung an einem Signal durchführt, das von der Bandteilungseinrichtung bandgeteilt ist.
Sprachcodierer nach Anspruch 9, ferner mit:

einer Bitzuweisungseinrichtung (340, 715) zum Zuweisen von Quantisierungsbits an bandgeteilte Signale; und

einer Umschalteinrichtung (350) zum Umschalten einer Anzahl von Bits des Erregungscodebuchs entsprechend den Bits, die mit der Zuweisungseinrichtung zugewiesen sind.
Sprachcodierer nach einem der Ansprüche 1 bis 10, mit einer Spektralparameterberechnungseinrichtung zum Berechnen und Ausgeben, für jeden der Rahmen, eines Spektralparameters, der eine Spektralhüllkurve der Sprachsignale darstellt.
Sprachcodierer nach Anspruch 8, wobei
die adaptive Codebucheinrichtung zum Berechnen von Tonhöhenparametern vorgesehen ist, um zu bewirken, daß Signale, die auf der Grundlage der adaptiven Codebücher regeneriert sind, die aus vorherigen Erregungssignalen bestehen, für jeden der Teilrahmen den Sprachsignalen nahekommen;
wobei der Sprachcodierer ferner aufweist:

eine Entscheidungseinrichtung zum Festlegen einer Anzahl von Mehrfachimpulsen für jeden der Teilrahmen auf der Grundlage der Maskierschwellwerte; wobei

die Berechnungseinrichtung einen Mehrfachimpuls, der die Fehlersignalleistung minimiert, unter Verwendung einer Anzahl von Mehrfachimpulsen berechnet, die für jeden der Teilrahmen festgelegt sind, und Erregungssignale der Sprachsignale unter Verwendung des Mehrfachimpulses darstellt.
Sprachcodierer nach Anspruch 1 mit:
einer Teilungseinrichtung (610, 650) zum Teilen gelieferter diskreter Sprachsignale in Rahmen einer vorher festgelegten Zeitlänge und zum weiteren Teilen der Rahmen in Teilrahmen einer vorher festgelegten Zeitlänge;
wobei der Sprachcodierer ferner aufweist:

eine Entscheidungseinrichtung zum Festlegen einer Anzahl von Mehrfachimpulsen für jeden der Teilrahmen auf der Grundlage der Maskierschwellwerte; und

eine Einrichtung zum Darstellen von Erregungssignalen der Sprachsignale in Form eines Mehrfachimpulses unter Verwendung einer Anzahl von Mehrfachimpulsen, die für jeden der Teilrahmen festgelegt sind.
Sprachcodierer nach Anspruch 13, ferner mit einer Bandteilungseinrichtung zum Bandteilen der Sprachsignale, wobei die Entscheidungseinrichtung eine Anzahl von Mehrfachimpulsen für jedes bandgeteilte Signal festlegt.
Sprachcodierer nach Anspruch 1, ferner mit:

einer Teilungseinrichtung (610, 650) zum Teilen gelieferter diskreter Sprachsignale in Rahmen einer vorher festgelegten Zeitlänge und zum weiteren Teilen der Rahmen in Teilrahmen einer vorher festgelegten Zeitlänge;

wobei das Codebuch so strukturiert ist, daß es mehrere Codebücher (750₁, ..., 750_N; 1000₁, ..., 100_N) enthält, deren Bitanzahlen sich voneinander unterscheiden;

einer Bitanzahlzuweisungseinrichtung (715, 920) zum Zuweisen einer Anzahl von Bits der Codebücher auf der Grundlage der Maskierschwellwerte; und

wobei die Sucheinrichtung (730, 1030) zum Suchen eines Codevektors durch Umschalten der Codebücher für jeden der Teilrahmen auf der Grundlage der zugewiesenen Anzahl von Bits dient.
Sprachcodierer nach Anspruch 15, wobei die Codebücher Erregungscodebücher sind.
Sprachcodierer nach Anspruch 15, wobei die Codebücher Verstärkungscodebücher sind.
Sprachcodierer nach einem der Ansprüche 15 bis 17, ferner mit einer Bandteilungseinrichtung zum Bandteilen der Sprachsignale.
Sprachcodierer nach Anspruch 16, ferner mit:

einer adaptiven Codebucheinrichtung (710) zum Berechnen von Tonhöhenparametern, um zu bewirken, daß Signale, die auf der Grundlage der adaptiven Codebücher regeneriert sind, die aus vorherigen Erregungssignalen bestehen, für jeden der Teilrahmen den Sprachsignalen nahekommen;

wobei die Hörgefühlswichtungseinrichtung ferner zum Durchführen einer Hörgefühlswichtung an den Fehlersignalen zwischen Signalen, die mit der adaptiven Codebucheinrichtung regeneriert sind, und den Sprachsignalen auf der Grundlage der Filterkoeffizienten dient;

wobei die Sucheinrichtung zum Umschalten der Erregungscodebücher für jeden der Teilrahmen auf der Grundlage der zugewiesenen Anzahl von Bits und zum Suchen eines Erregungscodevektors, der Fehlersignalleistung minimiert, die mit der Hörgefühlswichtungseinrichtung gewichtet ist, aus einem umgeschalteten Erregungscodebuch dient.
Sprachcodierer nach Anspruch 19, ferner mit einer Bandteilungseinrichtung zum Bandteilen der Sprachsignale, wobei die Bitzuweisungseinrichtung bandgeteilten Signalen eine Bitanzahl zuweist.
Sprachcodierer nach Anspruch 18 oder 20, wobei Impulsantworten von Bandteilungsfiltern in den Codebüchern gefaltet werden.
Verfahren zum Durchsuchen eines Codebuchs, das zum Codieren von diskreten Sprachsignalen verwendet wird, unter Verwendung von Signalen, die mit Maskierschwellwerten gewichtet sind, die aus den Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen berechnet sind;
wobei Filterkoeffizienten auf der Grundlage der Maskierschwellwerte berechnet werden und die Eingangssignale auf der Grundlage der Filterkoeffizienten gewichtet werden.
Verfahren nach Anspruch 22, mit den Schritten:

(a) Teilen der Sprachsignale in vorher festgelegte Zeitlängenrahmen;

(b) Erzeugen von Teilrahmen durch Teilen der Rahmen in vorher festgelegte Zeitlängeneinteilungen;

(c) Regenerieren der Sprachsignale für jeden der Teilrahmen auf der Grundlage eines adaptiven Codebuchs;

(d) Berechnen von Maskierschwellwerten aus den Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen;

(e) Berechnen von Filterkoeffizienten auf der Grundlage der Maskierschwellwerte und Durchführen einer Hörgefühlswichtung an einem Fehlersignal zwischen einem in dem Schritt (c) regenerierten Signal und dem Sprachsignal auf der Grundlage der Filterkoeffizienten; und

(f) Suchen eines Erregungscodevektors, der eine in dem Schritt (e) gewichtete Fehlersignalleistung minimiert.
Verfahren nach Anspruch 22, mit den Schritten:

(a) Teilen der Sprachsignale in vorher festgelegte Zeitlängenrahmen;

(b) Erzeugen von Teilrahmen durch Teilen der Rahmen in vorher festgelegte Zeitlängeneinteilungen;

(c) Berechnen von Maskierschwellwerten aus den Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen;

(d) Berechnen von Filterkoeffizienten auf der Grundlage der Maskierschwellwerte und Durchführen einer Hörgefühlswichtung an dem Sprachsignal auf der Grundlage der Filterkoeffizienten;

(e) Berechnen, für jeden der Teilrahmen und unter Verwendung eines Differenzsignals zwischen einem Antwortsignal und einem in dem Schritt (d) gewichteten Sprachsignal, eines adaptiven Codevektors, der eine Leistung des Differenzsignals minimiert, und Regenerieren des Sprachsignals; und

(f) Suchen eines Erregungscodevektors, der eine Fehlersignalleistung zwischen einem in dem Schritt (e) regenerierten Signal und dem Sprachsignal minimiert.
Verfahren nach Anspruch 23 oder 24, mit dem Schritt: (g) Berechnen eines Mehrfachimpulses, der eine in dem Schritt (e) gewichteten Fehlersignalleistung minimiert, anstelle des Schrittes (f).
Verfahren nach Anspruch 23 oder 24, ferner mit einem Schritt des Bandteilens der Sprachsignale, wobei der Schritt (d) ein Schritt des Durchführens einer Wichtung an bandgeteilten Signalen ist.
Verfahren nach Anspruch 26, ferner mit einem Schritt des Zuweisens von Quantisierungsbits an bandgeteilte Signale und einem Schritt des Umschaltens einer Anzahl von Bits des Erregungscodebuchs entsprechend den Bits, die in dem Schritt des Zuweisens von Quantisierungsbits zugewiesen werden.
Verfahren nach Anspruch 22, mit den Schritten:

(a) Schritt des Teilens gelieferter diskreter Sprachsignale in Rahmen von vorher festgelegter Zeitlänge und des weiteren Teilens der Rahmen in Teilrahmen von vorher festgelegter Zeitlänge;

(b) Schritt des Berechnens von Maskierschwellwerten aus den Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen;

(c) Schritt des Zuweisens einer Bitanzahl von Codebüchern an jeden der Teilrahmen auf der Grundlage der Maskierschwellwerte; und

(d) Schritt des Suchens eines Codevektors für jeden der Teilrahmen unter Verwendung eines Codebuchs mit zugewiesener Bitanzahl.
Verfahren nach Anspruch 28, wobei die Codebücher Erregungscodebücher sind.
Verfahren nach Anspruch 28, wobei die Codebücher Verstärkungscodebücher sind.
Verfahren nach einem der Ansprüche 28 bis 30, wobei die Schritte (b) bis (d) in jedem Band durchgeführt werden.
Verfahren nach Anspruch 31, wobei Impulsantworten von Bandteilungsfiltern vorher gefaltet werden.
Mehrfachimpulsberechnungsverfahren mit:

(a) Schritt des Teilens und Bandteilens gelieferter diskreter Sprachsignale in Rahmen einer vorher festgelegten Zeitlänge und ferner des Teilens der Rahmen in Teilrahmen einer vorher festgelegten Zeitlänge;

(b) Schritt des Berechnens von Maskierschwellwerten aus den Sprachsignalen auf der Grundlage von Hörgefühlsmaskiermerkmalen;

(c) Schritt des Festlegens einer Anzahl von Mehrfachimpulsen für jeden der Teilrahmen auf der Grundlage der Maskierschwellwerte; und

(d) Schritt des Berechnens eines Mehrfachimpulses, der die Fehlersignalleistung minimiert, unter Verwendung einer Anzahl von Mehrfachimpulsen, die für jeden der Teilrahmen festgelegt sind, und des Darstellens von Erregungssignalen der Sprachsignale unter Verwendung des Mehrfachimpulses.
Mehrfachimpulsberechnungsverfahren nach Anspruch 33, wobei die Schritte (b) bis (d) in jedem Band durchgeführt werden.