DE60222996T2 - Einrichtung zum konvertieren von sprachcodesequenzen - Google Patents

Einrichtung zum konvertieren von sprachcodesequenzen Download PDF

Info

Publication number
DE60222996T2
DE60222996T2 DE60222996T DE60222996T DE60222996T2 DE 60222996 T2 DE60222996 T2 DE 60222996T2 DE 60222996 T DE60222996 T DE 60222996T DE 60222996 T DE60222996 T DE 60222996T DE 60222996 T2 DE60222996 T2 DE 60222996T2
Authority
DE
Germany
Prior art keywords
code sequence
pitch period
circuit
pitch
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60222996T
Other languages
English (en)
Other versions
DE60222996D1 (de
Inventor
Masahiro c/o NEC Corporation Minato-ku SERIZAWA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of DE60222996D1 publication Critical patent/DE60222996D1/de
Application granted granted Critical
Publication of DE60222996T2 publication Critical patent/DE60222996T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung betrifft eine Vorrichtung und ein Verfahren zur Codesequenzkonvertierung, wobei bei einer zwischen zwei Typen von Sprachcodiersystemen ausgeführten Sprachkommunikation eine durch ein Codierungssystem erhaltene Sprachcodesequenz in eine Sprachcodesequenz konvertiert wird, die durch das andere System decodiert werden kann, insbesondere eine Vorrichtung zur Konvertierung von Sprachcodesequenzen und ein Verfahren zur Konvertierung von Codesequenzen, wobei die Sprachcodesequenz bei geringer Belastung und kleinem Rechenaufwand konvertiert werden kann.
  • Ein Sprachcodiersystem, das bisher am häufigsten in einem Mobiltelefon verwendet wurde, ist ein CELP-(Code Excited Linear Prediction)-System. Ein Dokument, in dem das CELP-System beschrieben ist, ist "Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates" (IEEE Proc. ICASSP-85, S. 937 bis 940, 1985) (nachstehend als Entgegenhaltung 1 bezeichnet).
  • In einer Codiervorrichtung nach dem CELP-System werden ein linearer Vorhersagekoeffizient (LP-Koeffizient) und ein Erregungssignal getrennt codiert. Der LP-Koeffizient gibt ein Merkmal einer Spektrumseinhüllenden an, das erhalten wird, indem ein Eingangssprachsignal einer linearen Vorhersageanalyse und -berechnung (LP-Analyse und -Berechnung) unterzogen wird. Das Erregungssignal treibt ein LP-Synthesefilter, das den LP-Koeffizienten aufweist. Die LP-Analyse und die Codierung des LP-Koeffizienten werden für jeden Rahmen ausgeführt, der eine vorbestimmte Länge aufweist. Dieser Rahmen wird weiter in Unterrahmen unterteilt, und das zu codierende Erregungssignal wird für jeden Unterrahmen codiert.
  • Hier besteht das Erregungssignal aus einer Periodenkomponente, welche eine Tonhöhenperiode eines Eingangssignals angibt, verbleibenden Restfehlerkomponenten und Verstärkungen der Komponenten. Die eine Tonhöhenperiode des Eingangssignals angebende Periodenkomponente wird durch einen adaptiven Codevektor dargestellt, der in einem Codebuch gespeichert ist, welches als ein adaptives Codebuch bezeichnet wird und das vorhergehende Erregungssignal enthält. Die Restfehlerkomponente wird durch ein Mehrimpulssignal dargestellt, welches aus mehreren Impulsen, welche als Sprachquellen-Codevektor bezeichnet werden, oder einem zuvor festgelegten Signal besteht. Informationen über den Sprachquellen-Codevektor werden in einem Sprachquellen-Codebuch gesammelt.
  • In einer Decodiervorrichtung nach dem CELP-System werden die decodierte Tonhöhenperiodenkomponente und das anhand des Restfehlersignals berechnete Erregungssignal in das Synthesefilter eingegeben, das den decodierten LP-Koeffizienten aufweist, um ein synthetisiertes Sprachsignal zu erhalten.
  • Eine herkömmliche Konvertierungsvorrichtung zum Konvertieren der durch ein Codierungssystem erhaltenen Sprachcodesequenz in die durch das andere System decodierbare Sprachcodesequenz bei der Kommunikation zwischen zwei verschiedenen CELP-Systemen ist eine Konvertierungsvorrichtung, bei der ein Sprachsignal, das anhand der von der Decodiervorrichtung eines CELP-Systems eingegebenen Sprachcodesequenz decodiert wurde, in das andere CELP-System codiert wird, um eine Ausgangssprachcodesequenz zu erhalten.
  • Als nächstes wird dieser Typ einer Konvertierungsvorrichtung der Sprachcodesequenz, der bisher verwendet wurde, mit Bezug auf 1 beschrieben. 1 ist ein Blockdiagramm eines Beispiels des Aufbaus der Konvertierungsvorrichtung, welche die Sprachcodesequenz eines CELP-Systems A in jene des anderen CELP-Systems B konvertiert.
  • Die dargestellte Konvertierungsvorrichtung weist einen Eingangsanschluss 10, eine Demultiplexerschaltung 11, eine LP-Koeffizienten-Decodierschaltung 12, eine Tonhöhenkomponenten-Decodierschaltung 113, eine Restfehlerkomponenten-Decodierschaltung 14 und eine Sprachsyntheseschaltung 15 zur Decodierverarbeitung des CELP-Systems A auf. Eine Rahmenschaltung 21, eine Unterrahmenschaltung 22, eine LP-Analyseschaltung 130, eine LP-Koeffizienten-Codierschaltung 31, eine Tonhöhenperiodenkandidaten-Wählschaltung 132, eine Tonhöhenkomponenten-Codierschaltung 41, eine Restfehlerkomponenten-Codierschaltung 51, eine Erregungssignal-Syntheseschaltung 52, eine Multiplexerschaltung 53 und ein Ausgangsanschluss 50 sind bereitgestellt, um die Codierverarbeitung des CELP-Systems B auszuführen.
  • Über den Eingangsanschluss 10 wird die Codesequenz des CELP-Systems A für jeden Rahmen des CELP-Systems A eingegeben, und die Sequenz wird zur Demultiplexerschaltung 11 übertragen. Die Demultiplexerschaltung 11 trennt jeden Code von der vom Eingangsanschluss 10 übertragenen Codesequenz. Die Demultiplexerschaltung 11 trennt den Code des getrennten Quantisierungs-LP-Koeffizienten, um den Code zur LP-Koeffizienten-Decodierschaltung 12 zu übertragen, überträgt den Code der Tonhöhenperiode zur Tonhöhenkomponenten-Decodierschaltung 113 und überträgt weiter den Code des Restfehlerkomponenten-Signals zur Restfehlerkomponenten-Decodierschaltung 14.
  • Die LP-Koeffizienten-Decodierschaltung 12 verwendet den von der Demultiplexerschaltung 11 übertragenen Code, um den ein Spektrumsmerkmal angebenden LP-Koeffizienten zu decodieren, und überträgt den decodierten Koeffizienten zur Sprachsyntheseschaltung 15.
  • Ein Verfahren zum Codieren und Decodieren des LP-Koeffizienten ist ein Verfahren zum Ausführen einer Vektorquantisierung des LP-Koeffizienten nach einer Änderung zu einem Linienspektrumspaar (LSP). Bei der Vektorquantisierung haben eine Codiereinheit und eine Decodiereinheit die gleiche Quantisierungsvektortabelle, und es wird der mit jedem Vektor verbundene Code übertragen. Die Decodiereinheit gibt den Vektor aus, der dem übertragenen Code entspricht. Für Einzelheiten eines LSP-Vektorquantisierungsverfahrens sei auf "Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame" (IEEE Proc. ICASSP-91, S. 661 bis 664, 1991) (nachstehend als Entgegenhaltung 2 bezeichnet) verwiesen.
  • Die Tonhöhenkomponenten-Decodierschaltung 113 decodiert eine Tonhöhenperiode L und eine Tonhöhenverstärkung ga von dem durch die Demultiplexerschaltung 11 übertragenen Code. Die Tonhöhenperiode L und die Tonhöhenverstärkung ga werden skalar quantisiert, und ein dem übertragenen Code entsprechender Wert wird aus einer vorab festgelegten Quantisierungstabelle abgerufen, um einen decodierten Wert zu erhalten. Die Tonhöhenkomponenten-Decodierschaltung 113 akkumuliert das von der Sprachsyntheseschaltung 15 übertragene Erregungssignal bis zu einem Abtastwert in Bezug auf die vorhergehende Tonhöhenperiode L und verfolgt die akkumulierten Erregungssignale für die vorhergehende Tonhöhenperiode L zurück und schneidet diese aus, um einen adaptiven Codevektor Ca zu präparieren. Schließlich wird ein Tonhöhenkomponenten-Signal Ea (= ga·Ca) berechnet und zur Sprachsyntheseschaltung 15 übertragen.
  • Die Restfehlerkomponenten-Decodierschaltung 14 verwendet den von der Demultiplexerschaltung 11 übertragenen Code, um einen Sprachquellen-Codevektor Cr und eine Sprachquellenverstärkung gr zu decodieren, berechnet ein Restfehlerkomponenten-Signal Er (= gr·Cr) und überträgt das Signal zur Sprachsyntheseschaltung 15. Die Sprachquellenverstärkung gr wird skalar quantisiert, und der dem übertragenen Code entsprechende Wert wird aus der vorab festgelegten Quantisierungstabelle abgerufen, um den decodierten Wert zu erhalten. Für den Sprachquellen-Codevektor Cr wird der dem übertragenen Code entsprechende Vektor aus dem vorab präparierten Sprachquellen-Codebuch abgerufen, um einen decodierten Vektor zu erhalten.
  • Die Sprachsyntheseschaltung 15 verwendet das von der Tonhöhenkomponenten-Decodierschaltung 113 übertragene Tonhöhenkomponenten-Signal Ea und das von der Restfehlerkomponenten-Decodierschaltung 14 übertragene Restfehlerkomponenten-Signal Er zum Berechnen eines Erregungssignalvektors Ex nach der folgenden Gleichung 1 und überträgt ein berechnetes Ergebnis zur Tonhöhenkomponenten-Decodierschaltung 113. Ex = Ea + Er = ga·Ca + gr·Cr (1)
  • Ferner verwendet die Sprachsyntheseschaltung 15 ein Synthesefilter H(z), das aus einem von der LP-Koeffizienten-Decodierschaltung 12 übertragenen LP-Koeffizienten a(i) besteht, wie in der folgenden Gleichung 2 dargestellt ist, um den vorab berechneten Erregungssignalvektor Ex zu filtern, erhält das decodierte Signal des CELP-Systems A und überträgt das decodierte Signal zur Rahmenschaltung 21.
  • Figure 00050001
  • In Gleichung 2 bezeichnet "p" die Ordnung des LP-Koeffizienten.
  • Zum Verbessern der Sprachqualität im CELP-System wird ein als Nachfilter bezeichnetes Filter zum Verstärken einer Spektrumsspitze in Bezug auf das decodierte Signal verwendet. Wenn die Codierung jedoch wieder ausgeführt wird, wird die Codierungsbelastung erhöht, und dieses Nachfilter wird daher nicht verwendet.
  • Die Rahmenschaltung 21 schneidet das von der Sprachsyntheseschaltung 15 übertragene decodierte Signal mit einer Rahmenlänge des CELP-Systems B und überträgt die Signale zur LP-Analyseschaltung 130, zur Tonhöhenperiodenkandidaten-Wählschaltung 132 und zur Unterrahmenschaltung 22. Die Unterrahmenschaltung 22 unterteilt das von der Rahmenschaltung 21 übertragene decodierte Signal in Unterrahmenlängen des CELP-Systems B und überträgt die Signale zur Tonhöhenkomponenten-Codierschaltung 41.
  • Die LP-Analyseschaltung 130 führt eine LP-Analyse des von der Rahmenschaltung 21 übertragenen decodierten Signals aus, um den LP-Koeffizienten zu erhalten. Als nächstes überträgt die LP-Analyseschaltung 130 den erhaltenen LP-Koeffizienten zur LP-Koeffizienten-Codierschaltung 30 und zur Tonhöhenperiodenkandidaten-Wählschaltung 132.
  • Die LP-Koeffizienten-Codierschaltung 31 führt eine Vektorquantisierung des von der LP-Analyseschaltung 130 übertragenen LP-Koeffizienten durch und überträgt den Code zur Multiplexerschaltung 53. Für dieses Quantisierungsverfahren kann auf die vorstehend beschriebene Entgegenhaltung 2 Bezug genommen werden. Ferner überträgt die LP-Koeffizienten-Codierschaltung 31 den quantisierten LP-Koeffizienten zur Tonhöhenkomponenten-Codierschaltung 41 und zur Restfehlerkomponenten-Codierschaltung 51.
  • Die Tonhöhenperiodenkandidaten-Wählschaltung 132 verwendet das von der Rahmenschaltung 21 übertragene decodierte Signal zum Auswählen eines Kandidaten der Tonhöhenperiode und überträgt den Kandidaten zur Tonhöhenkomponenten-Codierschaltung 41. Zur Auswahl des Kandidaten wird zuerst das von der Rahmenschaltung 21 übertragene decodierte Signal durch ein Lastfilter W(z) gefiltert, das aus dem von der LP-Analyseschaltung 130 übertragenen LP-Koeffizienten a(i) besteht und in der folgenden Gleichung 3 dargestellt ist. In Gleichung 3 bezeichnen "β" und "γ" Koeffizienten zum Einstellen eines Lastbereichs zum Verbessern der Sprachqualität, welche Werte annehmen, welche "0 < γ < β ≤ 1" erfüllen.
  • Figure 00060001
  • Als nächstes berechnet die Tonhöhenperiodenkandidaten-Wählschaltung 132 eine Autokorrelationsfunktion des lastdecodierten Signals in einem Bereich von Korrelationsverzögerungen "20 bis 147" und wählt eine Korrelationsverzögerung, bei der die Autokorrelation maximiert ist, und einen benachbarten Wert als Kandidaten der Tonhöhenperiode.
  • Die Tonhöhenkomponenten-Codierschaltung 41 codiert die Tonhöhenperiodenkomponente eines decodierten Signalvektors Sd, der von der Unterrahmenschaltung 22 übertragen wurde und der Unterrahmenlänge für jeden Unterrahmen entspricht, und überträgt den Code zur Multiplexerschaltung 53. Die Tonhöhenkomponenten-Codierschaltung 41 verfolgt zuerst das Erregungssignal zurück, das von der Restfehlerkomponenten-Codierschaltung 51 übertragen worden ist und in der Vergangenheit für eine Zeit L decodiert wurde, und schneidet das Signal durch die Unterrahmenlänge aus, um den adaptiven Codevektor zu präparieren. Als nächstes filtert die Tonhöhenkomponenten-Codierschaltung 41 diesen adaptiven Codevektor durch die vorstehend beschriebene Gleichung 2 und berechnet ein decodiertes Signal Sa(L) nur von der Tonhöhenkomponente. Ferner verwendet die Tonhöhenkomponenten-Codierschaltung 41 die vorstehend beschriebene Gleichung 3, um den decodierten Signalvektor Sd und den Tonhöhenperiodenkomponenten-Vektor Sa(L) mit einer Last zu versehen, um einen lastdecodierten Signalvektor Sdw und einen Lasttonhöhenperiodenkomponenten-Vektor Saw(L) zu erhalten.
  • Die Tonhöhenkomponenten-Codierschaltung 41 führt eine die vorstehend beschriebene Tonhöhenperiodenkomponente betreffende Operation in Bezug auf jeden von der Tonhöhenperiodenkandidaten-Wählschaltung 132 übertragenen Kandidaten der Tonhöhenperiode aus und bestimmt eine optimale Tonhöhenperiode Lo, in der der quadratische Abstand Da zwischen dem lastdecodierten Signalvektor Sdw und dem Lasttonhöhenperiodenkomponenten-Vektor Saw(L) minimiert ist.
  • Der quadratische Abstand Da wird durch die folgende Gleichung 4 unter Verwendung einer für jede Tonhöhenperiode L berechneten optimalen Tonhöhenverstärkung ga(L) erhalten. Die optimale Tonhöhenverstärkung ga(L) wird durch die folgende Gleichung 5 erhalten. Hierbei bezeichnen in der folgenden Beschreibung das Symbol ||x|| die Norm eines Vektors x und das Symbol <x, y> das innere Produkt der Vektoren x und y. Da = |Sdw – ga(L)·Saw(L)| (4) ga(L) = <Sdw, Saw(L)>/|Saw(L)| (5)
  • Die Tonhöhenkomponenten-Codierschaltung 41 überträgt schließlich den durch die Skalarquantisierung der optimalen Tonhöhenperiode Lo erhaltenen Code und die entsprechende Tonhöhenverstärkung ga(Lo) zur Multiplexerschaltung 53.
  • Ferner überträgt die Tonhöhenkomponenten-Codierschaltung 41 einen durch Subtrahieren des durch Integrieren eines Lasttonhöhenperiodenkomponenten-Vektors Saw(Lo) mit einer quantisierten optimalen Tonhöhenverstärkung gaq(Lo) erhaltenen Vektors von dem lastdecodierten Signalvektor Sdw erhaltenen Restfehlersignal-Vektor Sdw' zur Restfehlerkomponenten-Codierschaltung 51. Überdies überträgt die Tonhöhenkomponenten-Codierschaltung 41 ein durch Integrieren eines der optimalen Tonhöhenperiode Lo entsprechenden adaptiven Codevektors Ca(Lo) mit der quantisierten optimalen Tonhöhenverstärkung gaq(Lo) erhaltenes Tonhöhenkomponenten Erregungssignal E'a zur Erregungssignal-Syntheseschaltung 52.
  • Die Restfehlerkomponenten-Codierschaltung 51 codiert den als Restfehlerkomponente des decodierten Signalvektors Sd von der Tonhöhenkomponenten-Codierschaltung 41 übertragenen Restfehlersignal-Vektor Sdw' für jeden Unterrahmen und überträgt den Code zum Multiplexer 53.
  • Das heißt, dass die Restfehlerkomponenten-Codierschaltung 51 zuerst einen k-ten Sprachquellen-Codevektor Cr(k) aus dem vorab festgelegten und akkumulierten Sprachquellen-Codebuch entnimmt. Als nächstes filtert die Restfehlerkomponenten-Codierschaltung 51 den Sprachquellen-Codevektor nach der vorstehend beschriebenen Gleichung 2 und berechnet ein decodiertes Signal Sr(k) nur von der Restfehlerkomponente. Ferner verwendet die Restfehlerkomponenten-Codierschaltung 51 die vorstehend beschriebene Gleichung 3 zum Versehen des decodierten Signalvektors Sd und des Restfehlerkomponenten-Vektors Sr(k) mit einer Last und erhält den lastdecodierten Signalvektor Sdw und den mit einer Last versehenen Restfehlerkomponenten-Vektor Srw(k). Die Restfehlerkomponenten-Codierschaltung 51 führt die die vorstehend beschriebene Restfehlerkomponente betreffende Operation in Bezug auf alle im Sprachquellen-Codebuch akkumulierten Sprachquellen-Codevektoren aus und bestimmt einen Code ko des Sprachquellen-Codevektors, so dass der quadratische Abstand Dr zwischen dem Restfehlersignal-Vektor Sdw' und dem von der Tonhöhenkomponenten-Codierschaltung 41 übertragenen Lastrestfehlerkomponenten-Vektor Srw(k) minimiert wird.
  • Der quadratische Abstand Dr wird nach der folgenden Gleichung 6 unter Verwendung einer für jede Verzögerung berechneten optimalen Sprachquellenverstärkung gr(k) erhalten. Die optimale Sprachquellenverstärkung gr(k) wird durch die folgende Gleichung 7 erhalten. Dr = |Sdw' – gr(K)·Srw(K)| (6) gr(K) = <Sdw, Srw(K)>/|Srw(k)| (7)
  • Schließlich führt die Restfehlerkomponenten-Codierschaltung 51 eine Skalarquantisierung einer optimalen Sprachquellenverstärkung gr(ko) aus und überträgt den Code und den Code ko des Sprachquellen-Codevektors zur Multiplexerschaltung 53. Die Restfehlerkomponenten-Codierschaltung 51 überträgt ein durch Integrieren eines ausgewählten Sprachquellen-Codevektors Cr(ko) mit der quantisierten optimalen Sprachquellenverstärkung grq(ko) erhaltenes Restfehlerkomponenten-Erregungssignal E'r zur Erregungssignal-Syntheseschaltung 52.
  • Die Erregungssignal-Syntheseschaltung 52 addiert ein von der Tonhöhenkomponenten-Codierschaltung 41 übertragenes Tonhöhenkomponenten-Erregungssignal E'a und das von der Restfehlerkomponenten-Codierschaltung 51 übertragene Restfehlerkomponenten-Erregungssignal E'r, um ein Erregungssignal Ex' nach der folgenden Gleichung 8 zu berechnen, und überträgt das Signal zur Tonhöhenkomponenten-Codierschaltung 41. Ex' = E'a + E'r = gaq(Lo) Ca(Lo) + grq(ko)·Cr(ko) (8)
  • Die Multiplexerschaltung 53 verbindet die Codes in einer vorbestimmten Reihenfolge miteinander, wobei die Codes von der LP-Koeffizienten-Codierschaltung 31, der Tonhöhenkomponenten-Codierschaltung 41 und der Restfehlerkomponenten-Codierschaltung 51 übertragen und durch die Codierung erhalten wurden, um die Codesequenz zu erzeugen, und überträgt die Sequenz zum Ausgangsanschluss 50. Der Ausgangsanschluss 50 gibt die von der Multiplexerschaltung 53 übertragene Codesequenz aus.
  • Die vorstehend beschriebene Konvertierungsvorrichtung der Sprachcodesequenz ist jedoch unvorteilhaft, weil der Codekonvertierungs-Verarbeitungsaufwand hoch ist und eine Vergrößerung nicht vermieden werden kann.
  • Ein Grund hierfür besteht darin, dass die alle Parameter betreffende Codesequenz über das synthetisierte decodierte Signal konvertiert wird, wenn das durch Synthetisieren der vom CELP-System A auf einer Eingangsseite von der Demultiplexerschaltung über die Decodierschaltung codierten Codesequenz erhaltene decodierte Signal durch das CELP-System B auf einer Ausgangsseite durch die Rahmenschaltung codiert wird.
  • JP-08-146997 A und WO-00/48170 A offenbaren CELP-Transcodiersysteme, bei denen eine Tonhöhe eines zweiten Codierers aus einer Tonhöhe eines ersten Codierers ausgewählt wird, jedoch ohne mehrere Tonhöhenperiodenkandidaten in der Umgebung jedes Unterrahmens zu erzeugen.
  • Daher besteht eine Aufgabe der vorliegenden Erfindung darin, eine Konvertierungsvorrichtung einer Sprachcodesequenz und ein Verfahren bereitzustellen, wobei eine einzugebende Sprachcodesequenz zu einer anderen Sprachcodesequenz decodiert und konvertiert wird, ohne die Belastung zu erhöhen, und die Sequenz mit einem kleinen Rechenaufwand konvertiert werden kann. Diese Aufgabe wird mit den Merkmalen der Ansprüche gelöst.
  • Gemäß der vorliegenden Erfindung ist vorgesehen: eine Sprachcodesequenz-Konvertierungsvorrichtung mit einem Schaltungsaufbau, der aufweist: eine Decodierschaltung für eine erste Codesequenz, welche eine Sprachsynthetisierung an Codes vornimmt, die in die Codes eines linearen Quantisierungs-Vorhersagekoeffizienten (Quantisierungs-LP-Koeffizienten), einer Tonhöhenperiode und eines Restfehlerkomponenten-Signals anhand der ersten Codesequenz, einschließlich der einzugebenden Tonhöhenperiode, zerlegt und decodiert wurden, um ein decodiertes Signal zu erzeugen, und eine Codierschaltung für eine zweite Codesequenz, welche das decodierte Signal mit einer Rahmenlänge der zweiten Codesequenz teilt, weiter die Rahmenlänge in Unterrahmenlängen unterteilt, den LP-Koeffizienten vektorquantisiert, um einen quantisierten LP-Koeffizienten zu erzeugen, eine Tonhöhenkomponente zu einer optimalen Tonhöhe codiert und berechnete und erhaltene Restfehlerkomponenten codiert und synthetisiert, um ein codiertes Signal auszugeben.
  • Wenn bei der Sprachcodesequenz-Konvertierungsvorrichtung gemäß der vorliegenden Erfindung in der vorstehend beschriebenen Vorrichtung die erste Codesequenz in eine zweite Codesequenz konvertiert wird, wird der anhand der ersten Codesequenz decodierte LP-Koeffizient als ein LP-Analyseergebnis in Bezug auf die zweite Codesequenz verwendet. Daher ist bei der zweiten Codesequenzverarbeitung eine LP-Analyseverarbeitung in Bezug auf das decodierte Signal unnötig. Die durch die erste Codesequenz decodierte Tonhöhenperiode oder die Tonhö henperiode in der Umgebung werden in der zweiten Codesequenz als Tonhöhenperiodenkandidaten verwendet. Daher ist bei der Verarbeitung der zweiten Codesequenz eine Auswahlverarbeitung des Tonhöhenperiodenkandidaten in Bezug auf das decodierte Signal unnötig.
  • Das heißt, dass eine Sprachcodesequenz-Konvertierungsvorrichtung gemäß der vorliegenden Erfindung dadurch gekennzeichnet ist, dass die Codierschaltung auf einer zweiten Codesequenzseite die folgende Tonhöhenkomponenten-Berechnungseinrichtung aufweist. Die Tonhöhenkomponenten-Berechnungseinrichtung ist eine Tonhöhenkomponenten-Berechnungsschaltung, welche die Tonhöhenperiode der ersten Codesequenz von einer Tonhöhenkomponenten-Decodierschaltung auf einer ersten Codesequenzseite empfängt, um die in der ersten Codesequenz enthaltene Tonhöhenperiode als die in der zweiten Codesequenz enthaltene Tonhöhenperiode für jeden Unterrahmen, der eine Zeiteinheit zum Codieren der Tonhöhenperiode der zweiten Codesequenz ist, zu erhalten.
  • Bei einer anderen Sprachcodesequenz-Konvertierungsvorrichtung weist die Codierschaltung auf der zweiten Codesequenzseite auf: sowohl eine Tonhöhenperioden-Interpolationsschaltung, welche die Tonhöhenperiode der ersten Codesequenz von der Tonhöhenkomponenten-Decodierschaltung auf der ersten Codesequenzseite empfängt und die Tonhöhenperiode anhand der Tonhöhenperiode in einem Unterrahmen der ersten Codesequenz und der Tonhöhenperiode in einem vorhergehenden Unterrahmen für jeden Unterrahmen, der eine Zeiteinheit zum Codieren der Tonhöhenperiode der zweiten Codesequenz ist, berechnet, um die Tonhöhenperioden zu interpolieren, als auch eine Tonhöhenperioden-Mittelungsschaltung, welche die Tonhöhenperioden mittelt, und eine Tonhöhenkomponenten-Berechnungsschaltung, welche die berechnete Tonhöhenperiode als die in der zweiten Codesequenz enthaltene Tonhöhenperiode als Tonhöhenkomponenten-Berechnungseinrichtung erhält.
  • Bei einer weiteren Sprachcodesequenz-Konvertierungsvorrichtung weist die Codierschaltung auf der zweiten Codese quenzseite auf: eine Tonhöhenperiodenkandidaten-Erzeugungsschaltung zum Empfangen der Tonhöhenperiode der ersten Codesequenz von der Tonhöhenkomponenten-Decodierschaltung auf der ersten Codesequenzseite, um die in der ersten Codesequenz enthaltene Tonhöhenperiode und mindestens einige Tonhöhenperiodenkandidaten in der Umgebung der Tonhöhenperiode für jeden Unterrahmen, der eine Zeiteinheit zum Codieren der Tonhöhenperiode der zweiten Codesequenz ist, zu erzeugen, und eine Tonhöhenkomponenten-Codierschaltung zum Erhalten eines beliebigen der erzeugten Kandidaten als die in der zweiten Codesequenz als Tonhöhenkomponenten-Codiereinrichtung enthaltene Tonhöhenperiode.
  • Ferner ist die Sprachcodesequenz-Konvertierungsvorrichtung dadurch gekennzeichnet, dass die Codierschaltung auf der zweiten Codesequenzseite die Tonhöhenkomponenten-Codiereinrichtung aufweist. Die Tonhöhenkomponenten-Codiereinrichtung weist auf: sowohl eine Tonhöhenperioden-Interpolationsschaltung zum Empfangen der Tonhöhenperiode der ersten Codesequenz von der Tonhöhenkomponenten-Decodierschaltung auf der ersten Codesequenzseite und zum Berechnen der Tonhöhenperiode anhand der Tonhöhenperiode in dem entsprechenden Unterrahmen der ersten Codesequenz und der Tonhöhenperiode in dem vorhergehenden Unterrahmen für jeden Unterrahmen, der die Zeiteinheit für das Codieren der Tonhöhenperiode der zweiten Codesequenz ist, um die Tonhöhenperiode zu interpolieren, als auch eine Tonhöhenperioden-Mittelungsschaltung zum Mitteln der Tonhöhenperiode, eine Tonhöhenperiodenkandidaten-Erzeugungsschaltung zum Erzeugen der berechneten Tonhöhenperiode und mindestens einiger Tonhöhenperioden in der Umgebung der Tonhöhenperiode als Tonhöhenperiodenkandidaten und eine Tonhöhenkomponenten-Codierschaltung zum Erhalten eines beliebigen der erzeugten Kandidaten als die in der zweiten Codesequenz enthaltene Tonhöhenperiode.
  • Die Tonhöhenkomponenten-Codierschaltung in den vorstehend beschriebenen letzten beiden Sprachcodesequenz-Konvertierungsvorrichtungen kann die in der zweiten Codesequenz ent haltene Tonhöhenperiode so auswählen, dass der Abstand zwischen Sprachsignalen oder Erregungssignalen, die anhand der ersten und der zweiten Codesequenz für jeden Unterrahmen decodiert wurden, minimiert wird.
  • Ferner wird die folgende LP-Koeffizienten-Codiereinrichtung in der Sprachcodesequenz-Konvertierungsvorrichtung gemäß der vorliegenden Erfindung verwendet.
  • Bei einer Einrichtung weist die Codierschaltung auf der zweiten Codesequenzseite eine LP-Koeffizienten-Codierschaltung zum Empfangen eines Spektrumsmerkmals. der ersten Codesequenz von einer LP-Koeffizienten-Decodierschaltung auf der ersten Codesequenzseite und zum Erhalten des in der ersten Codesequenz enthaltenen Spektrumsmerkmals als das in der zweiten Codesequenz enthaltene Spektrumsmerkmal für jeden Rahmen, der die Zeiteinheit für das Codieren des Spektrumsmerkmals der zweiten Codesequenz ist, auf. Für jeden Rahmen können eine Schaltung zum Interpolieren oder Mitteln des LP-Koeffizienten zum Berechnen des Spektrumsmerkmals anhand des Spektrumsmerkmals in dem entsprechenden Rahmen der ersten Codesequenz und des Spektrumsmerkmals des vorhergehenden Rahmens und eine LP-Koeffizienten-Codierschaltung zum Erhalten des berechneten Spektrumsmerkmals als das in der zweiten Codesequenz enthaltene Spektrumsmerkmal als LP-Koeffizienten-Codiereinrichtung angeordnet werden.
  • Weiter werden als andere Einrichtung für jeden Rahmen der zweiten Codesequenz eine Banderweiterungs-Konvertierungsschaltung zum Konvertieren einer Banderweiterungsintensität des in der ersten Codesequenz enthaltenen Spektrumsmerkmals und eine LP-Koeffizienten-Codierschaltung zum Erhalten des konvertierten/erhaltenen Spektrumsmerkmals als das in der zweiten Codesequenz enthaltene Spektrumsmerkmal als LP-Koeffizienten-Codiereinrichtung angeordnet.
  • Weiter können als eine andere Einrichtung für jeden Rahmen, der die Zeiteinheit für das Codieren des Spektrumsmerkmals der zweiten Codesequenz ist, eine Schaltung zum Interpolieren oder Mitteln des LP-Koeffizienten zum Berechnen des Spektrumsmerkmals anhand des Spektrumsmerkmals in dem entsprechenden Rahmen der ersten Codesequenz und des Spektrumsmerkmals des vorhergehenden Rahmens, eine Banderweiterungs-Konvertierungsschaltung zum Konvertieren der Banderweiterungsintensität des berechneten Spektrumsmerkmals und eine LP-Koeffizienten-Codierschaltung zum Erhalten des konvertierten/erhaltenen Spektrumsmerkmals als das in der zweiten Codesequenz enthaltene Spektrumsmerkmal als die LP-Koeffizienten-Codiereinrichtung angeordnet werden.
  • Die vorliegende Erfindung wird mit Bezug auf die anliegende Zeichnung in weiteren Einzelheiten beschrieben.
  • Es zeigen:
  • 1 ein Diagramm eines Beispiels eines herkömmlichen Schaltungsaufbaus,
  • 2 ein Diagramm einer Ausführungsform des Schaltungsaufbaus gemäß der vorliegenden Erfindung,
  • 3 ein Diagramm einer Ausführungsform des Schaltungsaufbaus, der von dem vorstehend beschriebenen aus 2 gemäß der vorliegenden Erfindung verschieden ist,
  • 4 ein Diagramm einer Ausführungsform des Schaltungsaufbaus, der von den vorstehend beschriebenen aus den 2 und 3 gemäß der vorliegenden Erfindung verschieden ist,
  • 5 eine erklärende Ansicht einer Interpolationsverarbeitung eines LP-Koeffizienten gemäß der vorliegenden Erfindung,
  • 6 eine erklärende Ansicht der Interpolationsverarbeitung einer Tonhöhenperiode gemäß der vorliegenden Erfindung,
  • 7 ein Diagramm einer Ausführungsform des Schaltungsaufbaus, der von den vorstehend beschriebenen aus den 2 bis 4 gemäß der vorliegenden Erfindung verschieden ist,
  • 8 ein Diagramm einer Ausführungsform des Schaltungsaufbaus, der von den vorstehend beschriebenen aus den 2 bis 4 oder 7 gemäß der vorliegenden Erfindung verschieden ist,
  • 9 eine erklärende Ansicht einer Mittelungsverarbeitung des LP-Koeffizienten gemäß der vorliegenden Erfindung,
  • 10 eine erklärende Ansicht der Mittelungsverarbeitung der Tonhöhenperiode gemäß der vorliegenden Erfindung und
  • 11 ein Diagramm einer Ausführungsform des Schaltungsaufbaus, der von den vorstehend beschriebenen aus den 2 bis 4 oder 7 oder 8 gemäß der vorliegenden Erfindung verschieden ist.
  • 2 ist ein Diagramm einer Ausführungsform eines Funktionsblocks gemäß der vorliegenden Erfindung. In diesem Modus stimmen eine Rahmenlänge und eine Unterrahmenlänge eines CELP-Systems A mit jenen eines CELP-Systems B überein.
  • Für eine dargestellte Konvertierungsvorrichtung einer Sprachcodesequenz sind ein Eingangsanschluss 10, eine Demultiplexerschaltung 11, eine LP-Koeffizienten-Decodierschaltung 12, eine Tonhöhenkomponenten-Decodierschaltung 13, eine Restfehlerkomponenten-Decodierschaltung 14 und eine Sprachsyntheseschaltung 15 für die Decodierverarbeitung des CELP-Systems A bereitgestellt. Eine Rahmenschaltung 21, eine Unterrahmenschaltung 22, eine LP-Koeffizienten-Codierschaltung 31, eine Tonhöhenkomponenten-Berechnungsschaltung 40, eine Restfehlerkomponenten-Codierschaltung 51, eine Erregungssignal-Syntheseschaltung 52, eine Multiplexerschaltung 53 und ein Ausgangsanschluss 50 sind zum Ausführen der Codierverarbeitung des CELP-Systems B bereitgestellt.
  • Gesichtspunkte, die von jenen in 1 verschieden sind, welche als eine herkömmliche Konvertierungsvorrichtung bezeichnet wird, bestehen darin, dass die LP-Analyseschaltung 130 und die Tonhöhenperiodenkandidaten-Wählschaltung 132 entfernt sind, die Tonhöhenkomponenten-Decodierschaltung 113 durch die Tonhöhenkomponenten-Decodierschaltung 13 ersetzt ist und die Tonhöhenkomponenten-Codierschaltung 41 durch die Tonhöhenkomponenten-Berechnungsschaltung 40 ersetzt ist.
  • In der Codesequenz-Konvertierungsvorrichtung wird die Codesequenz des CELP-Systems A über den Eingangsanschluss 10 eingegeben, und die Sequenz wird zur Demultiplexerschaltung 11 übertragen. Die Demultiplexerschaltung 11 trennt die vom Eingangsanschluss 10 übertragene Codesequenz, überträgt den Code eines quantisierten LP-Koeffizienten zur LP-Koeffizienten-Decodierschaltung 12, überträgt den Code einer Tonhöhenkomponente zur Tonhöhenkomponenten-Decodierschaltung 13 und überträgt weiter den Code eines Restfehlerkomponenten-Signals zur Restfehlerkomponenten-Decodierschaltung 14.
  • Die LP-Koeffizienten-Decodierschaltung 12 verwendet den von der Demultiplexerschaltung 11 übertragenen Code zum Decodieren des LP-Koeffizienten, der ein Spektrumsmerkmal angibt, und überträgt den decodierten Koeffizienten zur Sprachsyntheseschaltung 15 und zur LP-Koeffizienten-Codierschaltung 31. Die Tonhöhenkomponenten-Decodierschaltung 13 decodiert eine Tonhöhenperiode L und eine Tonhöhenverstärkung ga von dem durch die Demultiplexerschaltung 11 übertragenen Code. Die Tonhöhenkomponenten-Decodierschaltung 13 unterscheidet sich nur dadurch von der Tonhöhenkomponenten-Decodierschaltung 113 aus 1, dass die zur Tonhöhenkomponenten-Berechnungsschaltung 40 übertragene Tonhöhenperiode L verschieden ist. Die Schaltung akkumuliert weiter das von der Sprachsyntheseschaltung 15 übertragene Erregungssignal bis zu einem Abtastwert für die vorhergehende Tonhöhenperiode L und verfolgt die akkumulierten Erregungssignale für die Tonhöhenperiode L bis in die Vergangenheit zurück und schneidet diese aus, um einen adaptiven Codevektor Ca zu präparieren. Schließlich wird ein Tonhöhenkomponenten-Signal Ea (= ga·Ca) berechnet und zur Sprachsyntheseschaltung 15 übertragen.
  • Die Restfehlerkomponenten-Decodierschaltung 14 verwendet den von der Demultiplexerschaltung 11 übertragenen Code, um einen Sprachquellen-Codevektor Cr und eine Sprachquellen verstärkung gr zu decodieren, berechnet ein Restfehlerkomponenten-Signal Er (= gr·Cr) und überträgt das Signal zur Sprachsyntheseschaltung 15. Die Sprachsyntheseschaltung 15 verwendet das von der Tonhöhenkomponenten-Decodierschaltung 13 übertragene Tonhöhenkomponenten-Signal Ea und das von der Restfehlerkomponenten-Decodierschaltung 14 übertragene Restfehlerkomponenten-Signal Er zum Berechnen eines Erregungssignalvektors Ex nach der vorstehend beschriebenen Gleichung 1 und überträgt das Ergebnis zur Tonhöhenkomponenten-Decodierschaltung 13. Ferner filtert die Sprachsyntheseschaltung 15 den Erregungssignalvektor Ex mit einem Synthesefilter H(z), das nach der vorstehend beschriebenen Gleichung 2 durch einen von der Sprachsyntheseschaltung 15 übertragenen LP-Koeffizienten a(i) gebildet ist, um einen decodierten Signalvektor Sd zu erhalten, und überträgt den Vektor zur Rahmenschaltung 21.
  • Die Rahmenschaltung 21 zerlegt das von der Sprachsyntheseschaltung 15 übertragene decodierte Signal nach einer Rahmenlänge des CELP-Systems B und überträgt die Signale zur Unterrahmenschaltung 22. Die Unterrahmenschaltung 22 unterteilt das von der Rahmenschaltung 21 übertragene decodierte Signal in Unterrahmenlängen des CELP-Systems B und überträgt die Signale zur Tonhöhenkomponenten-Berechnungsschaltung 40.
  • Die LP-Koeffizienten-Codierschaltung 31 quantisiert den von der LP-Koeffizienten-Decodierschaltung 12 übertragenen LP-Koeffizienten und überträgt den Code zur Multiplexerschaltung 53. Ferner überträgt die LP-Koeffizienten-Codierschaltung 31 den quantisierten LP-Koeffizienten zur Tonhöhenkomponenten-Berechnungsschaltung 40 und zur Restfehlerkomponenten-Codierschaltung 51.
  • Die Tonhöhenkomponenten-Berechnungsschaltung 40 verfolgt das von der Erregungssignal-Syntheseschaltung 52 übertragene und decodierte Erregungssignal für die Zeit L in die Vergangenheit zurück und schneidet das Signal mit einer Unterrahmenlänge aus, um einen adaptiven Codevektor zu erzeugen. Als nächstes filtert die Tonhöhenkomponenten-Berechnungsschaltung 40 diesen adaptiven Codevektor nach der vorstehend beschriebenen Gleichung 2 und berechnet ein decodiertes Signal Sa(L) nur der Tonhöhenkomponente. Ferner verwendet die Tonhöhenkomponenten-Berechnungsschaltung 40 die vorstehend beschriebene Gleichung 3, um den decodierten Signalvektor Sd und den Tonhöhenperiodenkomponenten-Vektor Sa(L) mit einer Last zu versehen, und erhält einen lastdecodierten Signalvektor Sdw und einen Lasttonhöhenperiodenkomponenten-Vektor Saw(L).
  • Die Tonhöhenkomponenten-Berechnungsschaltung 40 verwendet diese Werte zum Berechnen einer Tonhöhenverstärkung ga(L) nach der vorstehend beschriebenen Gleichung 5. Schließlich überträgt die Tonhöhenkomponenten-Berechnungsschaltung 40 den durch Skalarquantisierung der Tonhöhenperiode L und der Tonhöhenverstärkung ga(L) erhaltenen Code zur Multiplexerschaltung 53. Ein durch ein Produkt einer quantisierten Tonhöhenverstärkung gaq(L) und eines adaptiven Codevektors Caq(L) berechnetes Tonhöhenkomponenten-Signal E'a wird zur Erregungssignal-Syntheseschaltung 52 übertragen.
  • Die Restfehlerkomponenten-Codierschaltung 51 codiert eine Restfehlerkomponente des von der Tonhöhenkomponenten-Berechnungsschaltung 40 übertragenen decodierten Signalvektors Sd für jeden Unterrahmen und überträgt den Code zum Multiplexer 53.
  • Zuerst entnimmt die Rest fehlerkomponenten-Codierschaltung 51 den k-ten Sprachquellen-Codevektor Cr(k) aus dem vorab festgelegten und akkumulierten Sprachquellen-Codebuch. Als nächstes filtert die Restfehlerkomponenten-Codierschaltung 51 den Sprachquellen-Codevektor nach der vorstehend beschriebenen Gleichung 2 und berechnet ein decodiertes Signal Sr(k) nur von der Restfehlerkomponente. Ferner verwendet die Restfehlerkomponenten-Codierschaltung 51 die vorstehend beschriebene Gleichung 3 zum Versehen des decodierten Signalvektors Sd und des Restfehlerkomponenten-Vektors Sr(k) mit einer Last und erhält den lastdecodierten Signalvektor Sdw und den Lastrestfehlerkomponenten-Vektor Srw(k).
  • Die Restfehlerkomponenten-Codierschaltung 51 führt die die vorstehend beschriebene Restfehlerkomponente betreffende Operation in Bezug auf alle in dem Sprachquellen-Codebuch akkumulierten Sprachquellen-Codevektoren aus und berechnet den quadratischen Abstand Dr zwischen dem Restfehlersignal-Vektor Sdw' und dem Lastrestfehlerkomponenten-Vektor Srw(k), die von der Tonhöhenkomponenten-Berechnungsschaltung 40 übertragen wurden, unter Verwendung der vorstehend beschriebenen Gleichung 6, um einen Code ko des Sprachquellen-Codevektors zu bestimmen, um dadurch den Abstand zu minimieren.
  • Schließlich führt die Restfehlerkomponenten-Codierschaltung 51 eine Skalarquantisierung einer optimalen Sprachquellenverstärkung gr(ko) durch und überträgt den Code und den Code ko des Sprachquellen-Codevektors zur Multiplexerschaltung 53. Die Restfehlerkomponenten-Codierschaltung 51 überträgt ein durch Integrieren eines ausgewählten Sprachquellen-Codevektors Cr(ko) mit der quantisierten optimalen Sprachquellenverstärkung grq(ko) erhaltenes Restfehlerkomponenten-Erregungssignal E'r zur Erregungssignal-Syntheseschaltung 52.
  • Die Erregungssignal-Syntheseschaltung 52 berechnet ein Erregungssignal Ex' nach der vorstehend beschriebenen Gleichung 8 zum Addieren eines von der Tonhöhenkomponenten-Berechnungsschaltung 40 übertragenen Tonhöhenkomponenten-Erregungssignals E'a und des von der Restfehlerkomponenten-Codierschaltung 51 übertragenen Restfehlerkomponenten-Erregungssignals E'r und überträgt das Signal zur Tonhöhenkomponenten-Berechnungsschaltung 40.
  • Die Multiplexerschaltung 53 verbindet den LP-Koeffizienten, die Tonhöhenperiode, die Tonhöhenverstärkung, das Sprachquellen-Codebuch und den Code der Sprachquellenverstärkung, welche von der LP-Koeffizienten-Codierschaltung 31, der Tonhöhenkomponenten-Berechnungsschaltung 40 und der Restfehlerkomponenten-Codierschaltung 51 übertragen worden sind, in einer vorbestimmten Ordnung miteinander, um die Codesequenz zu erzeugen, und überträgt die Sequenz zum Aus gangsanschluss 50. Der Ausgangsanschluss 50 gibt die von der Multiplexerschaltung 53 übertragene Codesequenz aus.
  • Als nächstes wird eine von der vorstehend beschriebenen Ausführungsform der vorliegenden Erfindung getrennte Ausführungsform mit Bezug auf 3 beschrieben.
  • Gemäß dieser Ausführungsform werden eine Banderweiterungs-Konvertierungsverarbeitung zum Korrigieren einer Differenz der Banderweiterungsverarbeitung eines Spektrums zwischen den CELP-Systemen A und B und eine Tonhöhenperiodenkandidaten-Erzeugungsverarbeitung zum Erzeugen eines Kandidaten der Tonhöhenperiode hinzugefügt.
  • 3 unterscheidet sich in der Hinsicht von 2, dass eine Banderweiterungs-Konvertierungsschaltung 30 und eine Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 hinzugefügt sind und eine mit Bezug auf 1 beschriebene Tonhöhenkomponenten-Codierschaltung 41 an Stelle der Tonhöhenkomponenten-Berechnungsschaltung 40 verwendet wird. Die Banderweiterungs-Konvertierungsschaltung 30 ist zwischen der LP-Koeffizienten-Decodierschaltung 12 und der LP-Koeffizienten-Codierschaltung 31 angeordnet. Die Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 ist zwischen der Tonhöhenkomponenten-Decodierschaltung 13 und der Tonhöhenkomponenten-Codierschaltung 41 angeordnet.
  • In 3 sind die gleichen Bestandteile wie in 2 mit den gleichen Bezugszahlen versehen, und es wird auf ihre Beschreibung verzichtet. Daher werden als nächstes die Banderweiterungs-Konvertierungsschaltung 30 und die Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32, die diesen Prozessen zugeordnet sind, beschrieben.
  • Die Banderweiterungsverarbeitung ist ein Prozess zum Integrieren einer Fensterfunktion w(i) in der Art eines Indexfensters mit einer Autokorrelationsfunktion r(i) zum Erhalten von "w(j)·r(i)" bei der Berechnung des LP-Koeffizienten a(i) anhand der Autokorrelationsfunktion r(i) des Eingangssignals, um zu verhindern, dass eine steile Spitze durch das Spektrumsmerkmal erzeugt wird. Weil die Fensterfunktion w(i) vom Codiersystem abhängt, wird diese Differenz bei der Codesequenzkonvertierung korrigiert, und die Verschlechterung durch die Konvertierung kann dementsprechend verringert werden. Die Tonhöhenperiodenkandidaten-Erzeugungsverarbeitung ist ein Prozess zum Auswählen der Periode aus der Tonhöhenperiode und der benachbarten Tonhöhenperiode an Stelle der Verwendung der im CELP-System A decodierten Tonhöhenperiode als jene im CELP-System B. Bei dieser Verarbeitung ist, verglichen mit der Verwendung der Tonhöhenperiode als solche, ein Rechenaufwand für die Bestimmung der Tonhöhenperiode erforderlich, die Verschlechterung der Konvertierung kann jedoch verringert werden.
  • Die Banderweiterungs-Konvertierungsschaltung 30 berechnet eine Impulsantwort eines LP-Filters, das den von der LP-Koeffizienten-Decodierschaltung 12 übertragenen LP-Koeffizienten aufweist, integriert die Autokorrelationsfunktion dieser Impulsantwort mit einem Kehrwert eines Banderweiterungskoeffizienten wa(i) des CELP-Systems A und integriert weiter einen Banderweiterungskoeffizienten wb(i) des CELP-Systems B. Als nächstes berechnet die Banderweiterungs-Konvertierungsschaltung 30 den LP-Koeffizienten anhand der Autokorrelations funktion nach dem Levinson-Durbin-Verfahren und überträgt den Koeffizienten zur LP-Koeffizienten-Codierschaltung 31.
  • Die Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 überträgt die von der Tonhöhenkomponenten-Decodierschaltung 13 übertragene Tonhöhenperiode L und die benachbarte Tonhöhenperiode als die Tonhöhenperiodenkandidaten zur Tonhöhenkomponenten-Codierschaltung 41. In der übertragenen Tonhöhenperiode können auch ganzzahlige Vielfache der Tonhöhenperiode L oder ein Wert von 1 für eine ganze Zahl oder der Wert in der Umgebung als Tonhöhenperiodenkandidaten aufgenommen werden, um die Sprachqualitätsverschlechterung durch die Codesequenzkonvertierung zu unterbinden.
  • Die Tonhöhenkomponenten-Codierschaltung 41 führt die gleiche Operation aus wie jene, die in dem herkömmlichen System beschrieben wurde, wenn die Tonhöhenperiodenkandidaten von der Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 übertragen werden. Hierbei kann die Tonhöhenkomponenten-Codierschaltung 41 zum Verringern des Rechenaufwands und zum Fortlassen des Filterns nach der vorstehend beschriebenen Gleichung 2 und der Last nach der vorstehend beschriebenen Gleichung 3 eine optimale Tonhöhenverstärkung G'a(L) verwenden, die für jede Verzögerung berechnet wird, um eine optimale Tonhöhenperiode Lo zu bestimmen, so dass der quadratische Abstand D'a zwischen dem von der Sprachsyntheseschaltung 15 berechneten Erregungssignal Ex und dem adaptiven Codevektor Ca(L) minimiert wird.
  • Der quadratische Abstand D'a wird unter Verwendung der folgenden Gleichung 9 erhalten, und die optimale Tonhöhenverstärkung G'a(L) wird unter Verwendung der folgenden Gleichung 10 erhalten. D'a = |Ex – G'a(L)·Ca(L)| (9) G'a(L) = <Ex, C'a(L)>/|C'a(L)| (10)
  • Als nächstes wird eine Ausführungsform, die von den vorstehend beschriebenen Ausführungsformen gemäß der vorliegenden Erfindung verschieden ist, mit Bezug auf 4 beschrieben.
  • Bei dieser Ausführungsform sind eine Rahmenlänge Na und eine Unterrahmenlänge Nsa des CELP-Systems A länger als eine Rahmenlänge Nb bzw. eine Unterrahmenlänge Nsb des CELP-Systems B. Diese Ausführungsform unterscheidet sich von der zweiten Ausführungsform in Bezug auf Prozesse zum Einstellen der Differenzen der Rahmenlänge und der Unterrahmenlänge.
  • 4 unterscheidet sich in der Hinsicht von 3, dass eine LP-Koeffizienten-Interpolationsschaltung 60 und eine Tonhöhenperioden-Interpolationsschaltung 70, die diesen Prozessen zugeordnet sind, hinzugefügt sind. Die LP-Koeffizienten-Interpolationsschaltung 60 ist zwischen der LP- Koeffizienten-Decodierschaltung 12 und der Banderweiterungs-Konvertierungsschaltung 30 angeordnet. Die Tonhöhenperioden-Interpolationsschaltung 70 ist zwischen der Tonhöhenkomponenten-Decodierschaltung 13 und der Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 angeordnet.
  • In 4 sind die gleichen Bestandteile wie in 3 mit den gleichen Bezugszahlen bezeichnet, und es wird auf ihre Beschreibung verzichtet. Daher werden als nächstes die hinzugefügte LP-Koeffizienten-Interpolationsschaltung 60 und die hinzugefügte Tonhöhenperioden-Interpolationsschaltung 70 beschrieben.
  • Hierbei wird für die konkrete Beschreibung angenommen, dass die Rahmenlänge Na des CELP-Systems A 20 ms beträgt und die Unterrahmenlänge Nsa 10 ms beträgt und die Rahmenlänge Nb des CELP-Systems B 10 ms beträgt und die Unterrahmenlänge Nsb 5 ms beträgt. Es wird auch angenommen, dass der LP-Koeffizient durch eine LP-Analysefensterzentrierung am letzten Unterrahmen jedes Rahmens berechnet wird.
  • Anhand des von der LP-Koeffizienten-Decodierschaltung 12 alle 20 ms, was die Rahmenlänge Na ist, übertragenen LP-Koeffizienten und des von dem vorhergehenden Rahmen übertragenen LP-Koeffizienten berechnet die LP-Koeffizienten-Interpolationsschaltung 60 den LP-Koeffizienten der Rahmenlänge Nb alle 10 ms für die Verwendung im CELP-System B und überträgt den Koeffizienten zur Banderweiterungs-Konvertierungsschaltung 30.
  • 5 ist ein Diagramm einer Beziehung zwischen den LP-Koeffizienten der CELP-Systeme A und B. Die dargestellte X-Markierung gibt das Zentrum des vorstehend beschriebenen LP-Analysefensters und das Zentrum bei der Interpolation des LP-Koeffizienten an. Eine Rahmennummer ist durch "k" im CELP-System A und durch "t" im CELP-System B dargestellt. Ein Pfeil gibt den unter Verwendung des LP-Koeffizienten des CELP-Systems A zu berechnenden LP-Koeffizienten des CELP-Systems B an.
  • Der LP-Koeffizient, der das Spektrumsmerkmal des Rahmens des CELP-Systems A angibt, wird alle 20 ms von der LP-Koeffizienten-Decodierschaltung 12 übertragen, der LP-Koeffizient ist im CELP-System B jedoch alle 10 ms erforderlich. Daher werden unter der Annahme, dass die Reihenfolge der in 5 dargestellten Pfeile "i = 1, 2, ..., oder p" ist, die LP-Koeffizienten ab (t – 1, i) und ab (t, i) des CELP-Systems B in den Rahmennummern "t – 1" und "t" nach den folgenden Gleichungen 11 und 12 unter Verwendung des LP-Koeffizienten aa (k, i) des entsprechenden Rahmens im CELP-System A und des LP-Koeffizienten aa (k – j, i) in dem um j Rahmen in die Vergangenheit zurückverfolgten Rahmen berechnet. Bei der Berechnung wird eine Lastfunktion w(j), welche ein Interpolationsverfahren definiert, verwendet. Weiterhin werden unter Berücksichtigung einer Positionsbeziehung von X Markierungen in dem in 5 dargestellten Beispiel mit dem LP-Koeffizienten ab(t – 1, i) in Gleichung 11 "w(0) = 5/8, w(1) = 3/8" und "M = 2" verwendet. Mit dem LP-Koeffizienten ab(t, i) in Gleichung 12 werden "w (0) = 1 " und "M = 1 " verwendet. ab(t – 1, i) = w(0)·aa(k, i) + w(1)·aa(k – 1, i) + ... + w(M – 1) aa(k – M + 1, i) (11) ab(t, i) = w(0)·aa(k, i) + w(1)·aa(k – 1, i) + ... + w(M – 1)·aa(k – M + 1, i) (12)
  • Die Tonhöhenperioden-Interpolationsschaltung 70 berechnet die Tonhöhenperiode alle 5 ms, welches die Unterrahmenlänge Nsb für die Verwendung im CELP-System B ist, anhand der alle 10 ms der Unterrahmenlänge Nsa von der Tonhöhenkomponenten-Decodierschaltung 13 übertragenen Tonhöhenperiode und der im vorhergehenden Unterrahmen übertragenen Tonhöhenperiode und überträgt die Tonhöhenperiode zur Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32.
  • 6 zeigt die Beziehung zwischen den Tonhöhenperioden der CELP-Systeme A und B. Wie dargestellt ist, ist die Rahmennummer im CELP-System A durch "k" dargestellt und im CELP-System B durch "t" dargestellt. Der Pfeil gibt die Tonhöhenperiode des CELP-Systems B an, die unter Verwendung der Tonhöhenperiode des CELP-Systems A zu berechnen ist.
  • Die Tonhöhenperiode des Unterrahmens des CELP-Systems A wird alle 10 ms von der Tonhöhenkomponenten-Decodierschaltung 13 übertragen. Die Tonhöhenperiode ist jedoch alle 5 ms im CELP-System B erforderlich. Daher werden, wie durch die Pfeile aus 6 dargestellt ist, für die Tonhöhenperioden L1b(t) und L2b(t) des CELP-Systems B im ersten und zweiten Unterrahmen der Rahmennummer "t" die Tonhöhenperioden L1a(k) und L2a(k) des entsprechenden Rahmens im CELP-System A und die Tonhöhenperioden L1a(k – j) und L2a(k – j) in dem um j Rahmen in die Vergangenheit zurückverfolgten Rahmen verwendet, um eine Tonhöhenperiode Lsb(t) nach der folgenden Gleichung 13 zu berechnen. Bei der Berechnung wird eine Lastfunktion u(j) verwendet, welche das Interpolationsverfahren definiert. Lsb(t) = u(0)·L1a(k) + u(1)·L2a(k) ... + u(M – 2)· L1a(k – M/2 + 1) + u(M – 1)·L1a(k – M/2 + 1) (13)
  • Ferner werden unter Berücksichtigung der Positionsbeziehung der Unterrahmen zwischen beiden CELP-Systemen in dem in 6 dargestellten Beispiel, wenn die Tonhöhenperiode Lsb(t) in Gleichung 13 die Tonhöhenperiode L1b(t) ist, "u(0) = 3/4, u(1) = 1/4" und "M = 2" verwendet. Wenn die Tonhöhenperiode Lsb(t) die Tonhöhenperiode L2b(t) ist, werden "u(0) = 1" und "M = 1" verwendet.
  • Als nächstes wird eine Ausführungsform, die von den vorstehend beschriebenen Ausführungsformen gemäß der vorliegenden Erfindung verschieden ist, mit Bezug auf 7 beschrieben.
  • Bei dieser Ausführungsform sind ebenso wie gemäß der vorstehend mit Bezug auf 4 beschriebenen Ausführungsform die Rahmenlänge Na und die Unterrahmenlänge Nsa des CELP-Systems A länger als die Rahmenlänge Nb bzw. die Unterrahmenlänge Nsb des CELP-Systems B.
  • Daher sind die Banderweiterungs-Konvertierungsverarbeitung zum Korrigieren der Differenz der Banderweiterungsverarbeitung des Spektrums zwischen den CELP-Systemen A und B und die Tonhöhenperiodenkandidaten-Erzeugungsverarbeitung zur Erzeugung der Kandidaten der Tonhöhenperiode hinzugefügt.
  • Das heißt, dass in 7 die LP-Koeffizienten-Interpolationsschaltung 60 und die Tonhöhenperioden-Interpolationsschaltung 70 zu 2 hinzugefügt sind. Andererseits sind verglichen mit 4 die Banderweiterungs-Konvertierungsschaltung 30 und die Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 entfernt, und die mit Bezug auf 2 beschriebene Tonhöhenkomponenten-Berechnungsschaltung 40 wird an Stelle der Tonhöhenkomponenten-Codierschaltung 41 verwendet. Daher ist die LP-Koeffizienten-Interpolationsschaltung 60 zwischen der LP-Koeffizienten-Decodierschaltung 12 und der LP-Koeffizienten-Codierschaltung 31 angeordnet. Die Tonhöhenperioden-Interpolationsschaltung 70 ist zwischen der Tonhöhenkomponenten-Decodierschaltung 13 und der Tonhöhenkomponenten-Berechnungsschaltung 40 angeordnet.
  • In 7 sind die gleichen Bestandteile wie in 2 mit den gleichen Bezugszahlen versehen, und es wird auf ihre Beschreibung verzichtet. Die LP-Koeffizienten-Interpolationsschaltung 60 und die Tonhöhenperioden-Interpolationsschaltung 70 sind zu 2 hinzugefügt, sie weisen jedoch die gleiche Funktion auf wie jene, die vorstehend mit Bezug auf die 4 bis 6 beschrieben wurden.
  • Das heißt, dass die LP-Koeffizienten-Interpolationsschaltung 60 den von der LP-Koeffizienten-Decodierschaltung 12 übertragenen LP-Koeffizienten interpoliert und den Koeffizienten zur LP-Koeffizienten-Codierschaltung 31 überträgt. Die Tonhöhenperioden-Interpolationsschaltung 70 interpoliert die von der Tonhöhenkomponenten-Decodierschaltung 13 übertragene Tonhöhenperiode und überträgt die Tonhöhenperiode zur Tonhöhenkomponenten-Berechnungsschaltung 40.
  • Als nächstes wird eine von der vorstehend beschriebenen Ausführungsform gemäß der vorliegenden Erfindung verschiedene Ausführungsform mit Bezug auf 8 beschrieben.
  • Gemäß dieser Ausführungsform sind die Rahmenlänge Na und die Unterrahmenlänge Nsa des CELP-Systems A kürzer als die Rahmenlänge Nb bzw. die Unterrahmenlänge Nsb des CELP-Systems B. Diese Ausführungsform unterscheidet sich von der vorstehend mit Bezug auf 3 beschriebenen Ausführungsform in der Hinsicht, dass die Verarbeitung zum Einstellen der Differenzen der Rahmenlänge und der Unterrahmenlänge vorgesehen ist, und sie unterscheidet sich von der vorstehend mit Bezug auf 4 beschriebenen Ausführungsform durch ein Einstellungsverarbeitungsverfahren der Differenzen.
  • Das heißt, dass sich 8 von 3 dadurch unterscheidet, dass Verarbeitungsschaltungen, einschließlich einer LP-Koeffizienten-Mittelungsschaltung 61 und einer Tonhöhenperioden-Mittelungsschaltung 71, hinzugefügt sind. Andererseits unterscheidet sich 8 in der Hinsicht von 4, dass die LP-Koeffizienten-Interpolationsschaltung 60 und die Tonhöhenperioden-Interpolationsschaltung 70, die diesen Prozessen in 4 zugeordnet sind, durch die LP-Koeffizienten-Mittelungsschaltung 61 bzw. die Tonhöhenperioden-Mittelungsschaltung 71 ersetzt sind. Daher befindet sich die LP-Koeffizienten-Mittelungsschaltung 61 zwischen der LP-Koeffizienten-Decodierschaltung 12 und der Banderweiterungs-Konvertierungsschaltung 30. Die Tonhöhenperioden-Mittelungsschaltung 71 befindet sich zwischen der Tonhöhenkomponenten-Decodierschaltung 13 und der Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32.
  • In 8 sind die gleichen Bestandteile wie in 4 mit den gleichen Bezugszahlen bezeichnet, und es wird auf ihre Beschreibung verzichtet. Daher werden als nächstes die LP-Koeffizienten-Mittelungsschaltung 61 und die Tonhöhen perioden-Mittelungsschaltung 71, welche diese ersetzen, beschrieben.
  • Hier wird zum Konkretisieren der Beschreibung angenommen, dass die Rahmenlänge Na des CELP-Systems A 10 ms ist und die Unterrahmenlänge Nsa 5 ms ist und die Rahmenlänge Nb des CELP-Systems B 20 ms ist und die Unterrahmenlänge Nsb 10 ms ist. Es wird auch angenommen, dass der LP-Koeffizient durch die LP-Analysefensterzentrierung am letzten Unterrahmen jedes Rahmens berechnet wird.
  • Die LP-Koeffizienten-Mittelungsschaltung 61 berechnet den LP-Koeffizienten alle 20 ms, welches die Rahmenlänge Nb für die Verwendung im CELP-System B ist, anhand des von der LP-Koeffizienten-Decodierschaltung 12 alle 10 ms, welches die Rahmenlänge Na ist, übertragenen LP-Koeffizienten und des im vorhergehenden Rahmen übertragenen LP-Koeffizienten und überträgt den Koeffizienten zur Banderweiterungs-Konvertierungsschaltung 30.
  • 9 ist ein Diagramm, das eine Beziehung zwischen den LP-Koeffizienten des CELP-Systems A und des CELP-Systems B zeigt. Die dargestellten X-Markierungen geben das Zentrum des vorstehend beschriebenen LP-Analysefensters und das Zentrum bei der Mittelung des LP-Koeffizienten an. Die Rahmennummer ist im CELP-System A durch "k" dargestellt und im CELP-System B durch "t" dargestellt. Der Pfeil gibt den LP-Koeffizienten des CELP-Systems B an, der unter Verwendung des LP-Koeffizienten des CELP-Systems A zu berechnen ist.
  • Der LP-Koeffizient, der das Spektrumsmerkmal des Rahmens des CELP-Systems A angibt, wird alle 10 ms von der LP-Koeffizienten-Decodierschaltung 12 übertragen, der LP-Koeffizient wird jedoch im CELP-System B alle 20 ms benötigt. Daher wird unter der Annahme, dass die Ordnung "i" der in 9 dargestellten Pfeile "i = 1, 2, ..., oder p" ist, der LP-Koeffizient ab(t, i) des CELP-Systems B in der Rahmennummer "t" nach der vorstehend beschriebenen Gleichung 12 unter Verwendung des LP-Koeffizienten aa(k, i) des entsprechenden Rahmens im CELP-System A und des LP-Koeffizienten aa(k – j, i) in dem um j Rahmen in die Vergangenheit zurückverfolgten Rahmen berechnet. Bei der Berechnung wird die Lastfunktion w(j) verwendet, welche ein Mittelungsverfahren definiert. Ferner werden unter Berücksichtigung der Positionsbeziehung der X-Markierungen in dem in 9 dargestellten Beispiel mit dem LP-Koeffizienten ab(t, i) in Gleichung 12 "w(0) = 3/4, w(1) = 1/4" und "M = 2" verwendet.
  • Die Tonhöhenperioden-Mittelungsschaltung 71 berechnet die Tonhöhenperiode alle 5 ms, welches die Unterrahmenlänge Nsb für die Verwendung im CELP-System B ist, anhand der von der Tonhöhenkomponenten-Decodierschaltung 13 alle 10 ms, welches die Unterrahmenlänge Nsa ist, übertragenen Tonhöhenperiode und der im vorhergehenden Unterrahmen übertragenen Tonhöhenperiode und überträgt die Tonhöhenperiode zur Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32.
  • 10 ist ein Diagramm, in dem die Beziehung zwischen den Tonhöhenperioden der CELP-Systeme A und B dargestellt ist. Die Rahmennummer ist in dem CELP-System A durch "k" und in dem CELP-System B durch "t" dargestellt. Der Pfeil gibt die unter Verwendung der Tonhöhenperiode des CELP-Systems A zu berechnende Tonhöhenperiode des CELP-Systems B an.
  • Die Tonhöhenperiode des Unterrahmens des CELP-Systems A wird alle 5 ms von der Tonhöhenkomponenten-Decodierschaltung 13 übertragen. Die Tonhöhenperiode wird jedoch im CELP-System B alle 10 ms benötigt. Daher werden, wie durch die Pfeile aus 10 dargestellt ist, für die Tonhöhenperioden L1b(t) und L2b(t) des CELP-Systems B im ersten und im zweiten Unterrahmen der Rahmennummer "t" die Tonhöhenperioden L1a(k) und L2a(k) des entsprechenden Rahmens im CELP-System A und die Tonhöhenperioden L1a(k – j) und L2a(k – j) in dem um j Rahmen in die Vergangenheit zurückverfolgten Rahmen verwendet, um die Tonhöhenperiode Lsb(t) nach der vorstehend beschriebenen Gleichung 13 zu berechnen.
  • Bei der Berechnung wird die Lastfunktion u(j) verwendet, welche das Interpolationsverfahren definiert. Weiter werden unter Berücksichtigung der Positionsbeziehung der Unterrahmen zwischen beiden CELP-Systemen in dem in 10 dargestellten Beispiel, wenn die Tonhöhenperiode Lsb(t) in Gleichung 13 die Tonhöhenperiode L1b(t) ist, "u(0) = 1/2, u(1) = 1/2" und "M = 2" verwendet. Ähnlich werden, wenn die Tonhöhenperiode L2b(t) ist, "u(0) = 0, u(1) = 0, u(2) = 1/2, u(3) = 1/2" und "M = 4" verwendet.
  • Als nächstes wird eine Ausführungsform, die von den vorstehend beschriebenen Ausführungsformen gemäß der vorliegenden Erfindung verschieden ist, mit Bezug auf 11 beschrieben.
  • Gemäß dieser Ausführungsform sind ebenso wie gemäß der vorstehend mit Bezug auf 8 beschriebenen Ausführungsform die Rahmenlänge Na und die Unterrahmenlänge Nsa des CELP-Systems A kürzer als die Rahmenlänge Nb bzw. die Unterrahmenlänge Nsb des CELP-Systems B. Diese Ausführungsform unterscheidet sich von der vorstehend mit Bezug auf 3 beschriebenen Ausführungsform in der Hinsicht, dass die Verarbeitung für das Einstellen der Differenzen der Rahmenlänge und der Unterrahmenlänge vorgesehen ist. Verglichen mit der vorstehend mit Bezug auf 8 beschriebenen Ausführungsform sind die Einstellungsverarbeitungsverfahren der Differenzen verschieden.
  • Das heißt, dass sich 11 in der Hinsicht von 2 unterscheidet, dass die LP-Koeffizienten-Mittelungsschaltung 61 und die Tonhöhenperioden-Mittelungsschaltung 71 hinzugefügt sind. Andererseits bestehen die Gesichtspunkte, die sich von jenen in 8 unterscheiden, darin, dass die Banderweiterungs-Konvertierungsschaltung 30 und die Tonhöhenperiodenkandidaten-Erzeugungsschaltung 32 entfernt sind und die Tonhöhenkomponenten-Berechnungsschaltung 40, die mit Bezug auf 2 beschrieben wurde, an Stelle der Tonhöhenkomponenten-Codierschaltung 41 verwendet wird. Daher befindet sich die LP-Koeffizienten-Mittelungsschaltung 61 zwischen der LP-Koeffizienten-Decodierschaltung 12 und der LP-Koeffizienten-Codierschaltung 31. Die Tonhöhenperioden-Mittelungsschaltung 71 befindet sich zwischen der Tonhöhenkomponenten- Decodierschaltung 13 und der Tonhöhenkomponenten-Berechnungsschaltung 40.
  • In 11 sind die gleichen Bestandteile wie in 2 mit den gleichen Bezugszahlen bezeichnet, und es wird auf ihre Beschreibung verzichtet. Die LP-Koeffizienten-Mittelungsschaltung 61 und die Tonhöhenperioden-Mittelungsschaltung 71 sind zu 2 hinzugefügt, sie gleichen jedoch jenen, die mit Bezug auf die 8 bis 10 beschrieben wurden.
  • Das heißt, dass in der gleichen Weise wie gemäß der fünften Ausführungsform die LP-Koeffizienten-Mittelungsschaltung 61 die von der LP-Koeffizienten-Decodierschaltung 12 übertragenen LP-Koeffizienten mittelt und den Koeffizienten zur LP-Koeffizienten-Codierschaltung 31 überträgt. Die Tonhöhenperioden-Mittelungsschaltung 71 mittelt die von der Tonhöhenkomponenten-Decodierschaltung 13 übertragenen Tonhöhenperioden und überträgt die Tonhöhenperiode zur Tonhöhenkomponenten-Berechnungsschaltung 40.
  • In der vorstehenden Beschreibung wurde der Schaltungsaufbau dargestellt, und es wurde auf ihn Bezug genommen, die Schaltungsfunktionen können jedoch frei getrennt oder kombiniert werden, solange die vorstehend beschriebenen Funktionen erfüllt sind.
  • Wie vorstehend beschrieben wurde, werden der LP-Koeffizient und die Tonhöhenperiode, die anhand der Codesequenz des CELP-Systems auf der Eingangsseite decodiert wurden, direkt auf der Ausgangsseite verwendet und nicht durch das durch Decodieren der eingegebenen Codesequenz erhaltene decodierte Signal codekonvertiert. Daher können die LP-Analyse und die Auswahl des Tonhöhenperiodenkandidaten, die bisher in Bezug auf das decodierte Signal auf der Eingangsseite ausgeführt wurden, überflüssig gemacht werden, und es ist daher eine Codesequenzkonvertierung mit einem Rechenaufwand, der kleiner ist als beim herkömmlichen System, möglich.
  • Industrielle Anwendbarkeit
  • Wie vorstehend beschrieben wurde, sind eine Vorrichtung und ein Verfahren gemäß der vorliegenden Erfindung für eine Sprachcodesequenz-Konvertierung geeignet, bei der bei einer zwischen zwei Typen von Sprachcodiersystemen ausgeführten Sprachkommunikation eine durch Codieren eines Systems erhaltene Sprachcodesequenz in eine Sprachcodesequenz konvertiert werden kann, die bei geringer Belastung und geringem Rechenaufwand durch das andere System decodiert werden kann.

Claims (6)

  1. Sprachcodesequenz-Konvertierungsvorrichtung, welche aufweist: eine Decodierschaltung für eine erste Codesequenz, welche eine Sprachsynthetisierung an Codes vornimmt, die in die Codes eines linearen Quantisierungs-Vorhersagekoeffizienten (Quantisierungs-LP-Koeffizienten), einer Tonhöhenperiode und eines Restfehlerkomponenten-Signals anhand der ersten Codesequenz, einschließlich der einzugebenden Tonhöhenperiode, zerlegt und decodiert wurden, um ein decodiertes Signal zu erzeugen, und eine Codierschaltung für eine zweite Codesequenz, welche das decodierte Signal mit einer Rahmenlänge der zweiten Codesequenz einschließlich der Tonhöhenperiode teilt, weiter die Rahmenlänge in Unterrahmenlängen unterteilt, den LP-Koeffizienten vektorquantisiert, um einen quantisierten LP-Koeffizienten zu erzeugen, eine Tonhöhenkomponente zu einer optimalen Tonhöhe codiert und berechnete und erhaltene Restfehlerkomponenten codiert und synthetisiert, um ein codiertes Signal auszugeben, wobei die Codierschaltung aufweist: eine Tonhöhenkomponenten-Codiereinrichtung (41) zum Empfangen der Tonhöhenperiode der ersten Codesequenz von einer Tonhöhenkomponenten-Decodierschaltung (13) auf einer ersten Codesequenzseite und zum Erzeugen zumindest mehrerer Tonhöhenperiodenkandidaten anhand der in der ersten Codesequenz enthaltenen Tonhöhenperiode und der Umgebung der Tonhöhenperiode für jeden Unterrahmen, der eine Zeiteinheit zum Codieren der Tonhöhenperiode der zweiten Codesequenz ist, um einen beliebigen der Kandidaten als die in der zweiten Codesequenz enthaltene Tonhöhenperiode zu erhalten.
  2. Codesequenz-Konvertierungsvorrichtung nach Anspruch 1, wobei die Codierschaltung aufweist: eine Tonhöhenkomponenten-Codiereinrichtung (41) zum Erhalten der Tonhöhenperiode berechnet anhand der Tonhöhenperiode in einem Unterrahmen der ersten Codesequenz und der Tonhöhenperiode eines Unterrahmens der Vergangenheit für jeden Unterrahmen, der eine Zeiteinheit zum Codieren der Tonhöhenperiode der zweiten Codesequenz ist.
  3. Codesequenz-Konvertierungsvorrichtung nach Anspruch 1 oder 2, wobei die Tonhöhenkomponenten-Codiereinrichtung (41) die in der zweiten Codesequenz enthaltene Tonhöhenperiode für jeden Unterrahmen so auswählt, dass der Abstand zwischen Sprachsignalen oder Erregungssignalen, die anhand der ersten und der zweiten Codesequenz decodiert wurden, minimiert wird.
  4. Codesequenz-Konvertierungsverfahren zum Konvertieren einer ersten Codesequenz, einschließlich einer Tonhöhenperiode, zu einer die Tonhöhenperiode einschließenden zweiten Codesequenz mit folgenden Schritten: Erzeugen der in der ersten Codesequenz enthaltenen Tonhöhenperiode und mindestens mehrerer Tonhöhenperioden in der Umgebung der Tonhöhenperiode als Tonhöhenperiodenkandidaten für jeden Unterrahmen, der eine Zeiteinheit für das Codieren der Tonhöhenperiode der zweiten Codesequenz ist, und Erhalten eines beliebigen der Tonhöhenperiodenkandidaten als die in der zweiten Codesequenz enthaltene Tonhöhenperiode.
  5. Codesequenz-Konvertierungsverfahren nach Anspruch 4 mit folgenden Schritten: Berechnen der Tonhöhenperiode anhand der Tonhöhenperiode eines Unterrahmens der ersten Codesequenz und der Tonhöhenperiode eines Unterrahmens der Vergangenheit für jeden Unterrahmen, der eine Zeiteinheit zum Codieren der Tonhöhenperiode der zweiten Codesequenz ist, und Erhalten einer beliebigen der berechneten Tonhöhenperioden als die in der zweiten Codesequenz enthaltene Tonhöhenperiode.
  6. Codesequenz-Konvertierungsverfahren nach Anspruch 4 oder 5 mit folgenden Schritten: Decodieren sowohl eines Sprachsignals als auch eines Erregungssignals anhand der ersten Codesequenz für jeden Unterrahmen und Auswählen der in der zweiten Codesequenz enthaltenen Tonhöhenperiode, so dass der Abstand zwischen dem decodierten Signal und dem anhand der zweiten Codesequenz decodierten Signal minimiert wird.
DE60222996T 2001-02-02 2002-02-01 Einrichtung zum konvertieren von sprachcodesequenzen Expired - Lifetime DE60222996T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001026906A JP2002229599A (ja) 2001-02-02 2001-02-02 音声符号列の変換装置および変換方法
JP2001026906 2001-02-02
PCT/JP2002/000843 WO2002063610A1 (en) 2001-02-02 2002-02-01 Voice code sequence converting device and method

Publications (2)

Publication Number Publication Date
DE60222996D1 DE60222996D1 (de) 2007-11-29
DE60222996T2 true DE60222996T2 (de) 2008-02-07

Family

ID=18891647

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60222996T Expired - Lifetime DE60222996T2 (de) 2001-02-02 2002-02-01 Einrichtung zum konvertieren von sprachcodesequenzen

Country Status (6)

Country Link
US (1) US7505899B2 (de)
EP (1) EP1363274B1 (de)
JP (1) JP2002229599A (de)
CA (1) CA2437314C (de)
DE (1) DE60222996T2 (de)
WO (1) WO2002063610A1 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1279167B1 (de) * 2000-04-24 2007-05-30 QUALCOMM Incorporated Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
US6829579B2 (en) 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
CN100527225C (zh) * 2002-01-08 2009-08-12 迪里辛姆网络控股有限公司 基于celp的语音代码之间的代码转换方案
EP1483758A4 (de) * 2002-03-12 2007-04-11 Dilithium Networks Pty Ltd Verfahren zur adaptiven codebuch-pitch-leiter-berechnung in audiotranscodern
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
JP5036317B2 (ja) * 2004-10-28 2012-09-26 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
FR2880724A1 (fr) * 2005-01-11 2006-07-14 France Telecom Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
JP2008226300A (ja) * 2007-03-09 2008-09-25 Nec Electronics Corp 復号方法及び復号回路

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2709926B2 (ja) * 1987-10-09 1998-02-04 株式会社エイ・ティ・アール自動翻訳電話研究所 声質変換方法
JP2880508B2 (ja) * 1988-02-19 1999-04-12 株式会社エイ・ティ・アール自動翻訳電話研究所 音声の規則合成装置
JPH04147300A (ja) * 1990-10-11 1992-05-20 Fujitsu Ltd 話者の声質変換処理方式
JPH05289700A (ja) * 1992-04-09 1993-11-05 Olympus Optical Co Ltd 音声符号化装置
JP3431655B2 (ja) * 1993-03-10 2003-07-28 三菱電機株式会社 符号化装置及び復号化装置
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JP3071388B2 (ja) 1995-12-19 2000-07-31 国際電気株式会社 可変レート音声符号化方式
JPH1031499A (ja) 1996-07-16 1998-02-03 Nippon Telegr & Teleph Corp <Ntt> 音声情報符号化・復号化装置および通信装置
JP3444396B2 (ja) * 1996-09-11 2003-09-08 日本電信電話株式会社 音声合成方法、その装置及びプログラム記録媒体
JPH1091193A (ja) * 1996-09-18 1998-04-10 Toshiba Corp 音声符号化方法および音声復号方法
JPH10161699A (ja) * 1996-11-27 1998-06-19 Nec Corp 音声格納再生装置および方法
JPH1195796A (ja) * 1997-09-16 1999-04-09 Toshiba Corp 音声合成方法
JP3754819B2 (ja) 1998-03-24 2006-03-15 株式会社日立国際電気 音声通信方法及び音声通信装置
WO1999053677A2 (en) * 1998-04-09 1999-10-21 Koninklijke Philips Electronics N.V. Lossless encoding/decoding in a transmission system
JP2000163097A (ja) * 1998-11-27 2000-06-16 Ricoh Co Ltd 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP3478209B2 (ja) * 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US6917916B2 (en) * 2001-12-13 2005-07-12 Motorola, Inc. Method and apparatus for testing digital channels in a wireless communication system

Also Published As

Publication number Publication date
WO2002063610A1 (en) 2002-08-15
JP2002229599A (ja) 2002-08-16
EP1363274B1 (de) 2007-10-17
DE60222996D1 (de) 2007-11-29
EP1363274A4 (de) 2006-09-20
EP1363274A1 (de) 2003-11-19
CA2437314C (en) 2010-07-06
US20040068407A1 (en) 2004-04-08
US7505899B2 (en) 2009-03-17
CA2437314A1 (en) 2002-08-15

Similar Documents

Publication Publication Date Title
DE69900786T2 (de) Sprachkodierung
DE69328450T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE60011051T2 (de) Celp-transkodierung
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE69836624T2 (de) Audiokodierer und -dekodierer
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69915400T2 (de) Vorrichtung zur Kodierung und Dekodierung von Audiosignalen
DE69718234T2 (de) Sprachkodierer
DE69633944T2 (de) Verfahren und gerät zum kodieren von digitalen daten
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE69223335T2 (de) Sprachkodiersystem
DE19647298A1 (de) Kodiersystem
DE10296562T5 (de) Rauschunterdrückung
DE69033510T3 (de) Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE69329568T2 (de) Verfahren zur Sprachkodierung
DE69727256T2 (de) Sprachkodierer hoher Qualität mit niedriger Bitrate
DE60309651T2 (de) Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens
DE60222996T2 (de) Einrichtung zum konvertieren von sprachcodesequenzen
DE68913691T2 (de) System zur Sprachcodierung und -decodierung.
DE60101827T2 (de) Relative Pulsposition für einen CELP-Sprachkodierer
DE69921066T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69830816T2 (de) Mehrstufige Audiodekodierung
DE69329476T2 (de) Sprachkodierungsystem

Legal Events

Date Code Title Description
8364 No opposition during term of opposition