SE524905C2 - Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal - Google Patents
Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av talInfo
- Publication number
- SE524905C2 SE524905C2 SE0200785A SE0200785A SE524905C2 SE 524905 C2 SE524905 C2 SE 524905C2 SE 0200785 A SE0200785 A SE 0200785A SE 0200785 A SE0200785 A SE 0200785A SE 524905 C2 SE524905 C2 SE 524905C2
- Authority
- SE
- Sweden
- Prior art keywords
- amplitude
- pulse
- speech signal
- positions
- codebook
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
:25 n ~ ~ Q ~ n ' ' " _ 2 4 9 Q 5 -ï lf ' -.'.=' I? 2 För att syntetisera tal enligt CELP-tekniken syntetiseras varje block av talsamplingar genom att filtrera den vederbörande kodvektom från kodboken genom tidsvarierande filter, som modellerar talsignalens spektrala karakteristika. På kodningssidan beräknas den syntetiska utsignalen för alla eller en undergrupp av kandidatkodvektorema från kodboken (kodbokssökning). Den valda kodvektorn är den som alstrar den syntetiska utsignal som ligger närmast den ursprungliga talsignalen enligt ett varseblivningsmäs- sigt viktat distorsionsmått.
En första typ av kodböcker är de s.k. "stokastiska" kodböckerna. En nackdel med så- dana kodböcker är att de ofta innefattar stora fysiska lagringsmängder. De är stokastis- ka, dvs. slumpmässiga i den meningen, att vägen från index till tillhörande kodvektor innefattar uppslagstabeller, som är resultatet av slumpmässigt alstrade tal eller statis- tiska tekniker, tillämpade på stora talträningsuppsättningar. Storleken på stokastiska kodböcker tenderar att begränsas av komplexiteten för lagring och/eller sökning.
En andra typ av kodböcker är de algebraiska kodböckema. I motsats till de stokastiska kodböckema är algebraiska kodböcker icke slumpmässiga och fordrar ingen lagring.
En algebraisk kodbok är en uppsättning av indexerade kodvektorer, där amplitudema och lägena för pulsema i den k-te kodvektorn kan härledas från dess index k genom en regel som fordrar ingen eller minimal fysisk lagring. Följaktligen är en algebraisk kod- boks storlek ej begränsad av lagringskrav. Algebraiska kodböcker kan även konstrue- ras för effektiv sökning.
Syfte med uppfinningen Ett syfte med föreliggande uppfinning är följaktligen att åstadkomma en metod och anordning för att drastiskt reducera komplexiteten för kodbokssökrringen efter kodning av en ljudsignal, vilken metod och anordning skall vara tillämpbara för en stor klass av kodböcker. ._2525 'zzxèo . ~ ~ n n ~ ' ' '° a u n - - a . n _ . . . . . - 5 _' _; _ . . - g n. . .c ._ s; _ , .. . - - _;_ ___ z z _ , . s... I' '° Sammanfattning av uppfinningen Närmare bestämt och i enlighet med föreliggande uppfinning åstadkommes en metod för att genomföra en sökning i en kodbok för att koda en ljudsignal. Kodboken består av en uppsättning av pulsamplitud/positionskombinationer, där varje pulsampli- tud/positionskombination definierar L olika positioner p och omfattar både nollampli- tudpulser och icke-nollamplitudpulser, tillordnade respektive positioner p = 1, 2, ...L i kombinationen. Varje icke-nollamplitudpuls antar minst en av q möjliga amplituder.
Denna kodboksökningsutförandemetod omfattar förval från kodboken av en under- grupp av pulsamplitud/positionskombinationer i relation till ljudsignalen; och sökning endast i undergruppen av pulsamplitud/positionskombinationer för att koda ljudsigna- len, varvid komplexiteten minskas i sökningen, eftersom bara en undergrupp av puls- amp1itud/positionskombinationer i kodboken genomsökes. Förval av en undergrupp av pulsamplitud/positionskombinationer omfattar att på förhand upprätta, i förhållande till ljudsignalen, en amplitud/positionsfunktion mellan positionerna p = 1, 2, ...L och de q möjliga amplituderna. Att på förhand upprätta en amplitud/positionsfunktion omfattar att på förhand tillordna en av de q möjliga amplitudema som gällande amplitud till varje position p. Att på förhand tillordna en av de q möjliga positionerna till varje po- sition p omfattar (a) bearbetning av ljudsignalen för att åstadkomma en bakåtfiltrerad målsignal D och en tonhöjdseliminerad residualsignal R', (b) beräkning av en ampli- tuduppskattningsvektor i motsvarighet till den bakåtfiltrerade målsignalen D och den tonhöjdseliminerade residualsignalen R°, och (c) för var och en av positionema p kvantiseras en arnplituduppskattning BP för vektom B för att erhålla den amplitud som skall väljas för nämnda position p. Slutligen omfattar sökning i pulsamplitud/posi- tionskombinationernas undergrupper en begränsning av sökningen till de pulsampli- tud/positionskombinationer i kodboken som har icke-nollamplitudpulser vilka satisfie- rar den på förhand upprättade funktionen.
Föreliggande uppfinning hänför sig även till en anordning för utförande av en sökning i en kodbok för att koda en ljudsignal. Kodboken består av en uppsättning av pulsamp- litud/positionskombinationer, där varje pulsamplitud/positionskombination definierar L ..:ï:'25 yäo . - . . 4 ~ I ' ' " . 524 905 4 ' . I , . . . .Q fl olika positioner p och omfattar både nollamplitudpulser och icke-nollamplitudpulser, tillordnade till respektive positioner p = 1, 2, ...L i kombinationen. Varje icke-noll- amplitudpuls antar minst en av q möjliga amplituder. Denna kodboksökningsutföran- deanordning omfattar medel för förval ur kodboken av en undergrupp av pulsampli- tud/positionskombinationer i relation till ljudsignalen, och medel för sökning endast av undergruppen av pulsamplitud/positionskombinationen för att koda ljudsignalen, var- vid sökningens komplexitet förminskas, eftersom bara en undergrupp av pulsampli- tud/positionskombinationerna i kodboken genomsökes. De förvalda medlen omfattar medel att på förhand upprätta, i förhållande till ljudsignalen, en amplitud/positions- funktion mellan positionema p = 1, 2, ...L och de q möjliga amplitudema, och de på förhand upprättade medlen omfattar medel att på förhand tillordna en av de q möjliga amplituderna som gällande amplitud till varje position p. Medlen att på förhand till- ordna en av de q möjliga positionema till varje position p omfattar (a) medel för bear- betning av ljudsignalen för att åstadkomma en bakåtfiltrerad målsignal D och en ton- höj dseliminerad residualsignal R', (b) medel för beräkning av en amplituduppskatt- ningsvektor i motsvarighet till den bakåtfiltrerade målsignalen D och den tonhöjdseli- minerade residualsignalen R', och (c) medel att för var och en av positionema p kvan- tisera en amplituduppskattning Bp för vektom B för att erhålla den amplitud som skall väljas för nämnda position p. Slutligen omfattar medlen för sökning i pulsampli- tud/positionskombinationemas undergrupper en begränsning av sökningen till de puls- amplitud/positionskombinationer i kodboken som har icke-nollamplitudpulser vilka satisfierar den på förhand upprättade funktionen.
F ördelaktigt är den på förhand upprättade fimktionen uppfylld när en pulsampli- tud/positionskombinations icke-nollamplitudpulser var och en har en amplitud som är lika med den amplitud som på förhand är tillordnad av den på förhand upprättade funktionen till positionen p av närrmda icke-nollamplitudpuls.
Enligt en föredragen utförningsfonn beräknas amplituduppskattningsvektom B genom att summera den bakåtfiltrerade målsignalen D i nonnaliserad form: 21:25 n o n Q ø n ° ° " 524 905 :Pàäå2Ä¿@3¿f¿¿v D ° ß) llßu med den tonhöjdseliminerade residualsignalen R' i normaliserad form: RI ßf HR Il för att därvid erhålla en amplituduppskattningsvektor B med formen: D R' ß=u-ß> , HM! HRM +ß där ß är en fast konstant, som har ett värde som ligger mellan O och 1.
I enlighet med en ytterligare föredragen utförningsform utföres kvantiseringen på en toppnormaliserad amplituduppskattning B P uttryck: B p / max B" där nänmaren max B,,| är en normaliseringsfaktor, som representerar en toppamplitud för icke-nollampli- tudpulsema.
Enligt en tredje föredragen utfórningsform omfattar metoden vidare begränsning av icke-nollamplitudpulsernas positioner för kodbokens kombinationer i överensstämmel- se med en grupp av pulspositionsspår. Varje spårs pulsposition kan intersekvenseras med de andra spårens pulspositioner. Pulskombinationema kan var och en omfatta ett antal N icke-nollamplitudpulser, gruppen av spår kan omfatta N pulspositionsspår var för sig förbundna med de N icke-nollamplitudpulsema, och varje icke-nollamplitud- puls pulspositioner är begränsade till det förbundna spårets position. av vektorn B med användning av följ ande ' " -Ãfffzs n ø - . u n ° ' ' " . u. ~ 524 905 6 « . » . .- Enligt en fjärde föredragen utförningsform: - pulsamplitud/positionskombinationema omfattar vardera ett antal N icke- nollamplitudpulser; - undergruppen av pulsamplitud/positionskombinationer sökes genom maximering av en given kvot med en nämnare (m2 beräknad medelst N i varandra kopplade slingor i enlighet med följande uttryck: al: = Uxpi wp1) + U'(p2sp2)+ 2U,(pl>p2) +U'(P3»p3) +2U'(PuP3)+2U'(Pz=Ps) +U'(P~,11~)+2U'(p1,p~)+2U'(P2,P~)+---+2U'(P~-1,P~) där beräkningen för varje slinga är skriven på en separat rad från en yttersta slinga till en innersta slinga av de N sammanvävda slingorna, där pn är positionen för den n-te icke-nollamplitudpulsen i kombinationen, och där U'(px, py) är en funktion, som beror av amplituden S x som på förhand tillordnats till en position px bland positionerna p, P och amplituden S y som på förhand tillordnats till en position py bland positionerna p; P och: - maximering av den givna kvoten omfattar att överhoppa åtminstone den innersta slingan av de N sammanvävda slingoma, så snart följande olikhet är uppfylld: N-l S "D < TD l P P» n: där Spn är den amplitud som på förhand är tillordnad till positionen pn, D är den pn- pn te komponenten i målvektom D, och Td är ett tröskelvärde, som hör ihop med den bak- åtfiltzrerade målvektom D.
Föreliggande uppfinning hänför sig vidare till ett cellkommunikationssystem för betjä- ..I5.'25 :1330 . | ø - ~ n u - . .- 2 4 9 0 5 ~; ä ß .=;: - a: :::= 7 ning av ett stort geografiskt område, uppdelat i ett flertal celler, omfattande: mobila bärbara sändar-/mottagarenheten cellbasstationer placerade i respektive celler; medel för styming av kommunikation mellan cellbasstationerna; ett dubbelriktat radiokommunikationssubsystem mellan varje mobil enhet, placerad i en cell och cellbasstationen i samma cell, vilket dubbelriktade radiokommunikations- subsystem omfattar, både i den mobila enheten och cellbasstationen (a), en sändare, innefattande medel för kodning av en talsignal och medel för utsändning av den koda- de talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen. Talsig- nalkodningsmedlen omfattar medel mottagliga för att producera talsignalkodningspa- rametrar, och dessa talsignalkodningsparameterproducerande medel omfattar en an- ordning beskriven här ovan, för att utföra en sökning i en kodbok för att producera åt- minstone en av talkodsignalsparametrama, vari talsignalen utgör ljudsignalen.
Enligt uppfinningen är vidare tillhandahållet: - ett cellnätverkselement som omfattar (a) en sändare, som innefattar medel för kod- ning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen. Talsignalkodningsmedlen omfattar medel mottagliga för att producera talsignalkodningsparametrar, och dessa talsignal- kodningsparameterproducerande medel omfattar en anordning beskriven här ovan, för att utföra en sökning i en kodbok för att producera åtminstone en av talkodsignalspa- rametrama, vari talsignalen utgör ljudsignalen.
- En mobil sändar-/mottagarenhet av celltyp som omfattar (a) en sändare, som innefat- tar medel för kodning av en talsignal och medel för överföring av den kodade talsig- nalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen. Talsignalkod- ningsmedlen omfattar medel mottagliga för att producera talsignalkodningsparametrar, och dessa talsignalkodningsparameterproducerande medel omfattar en anordning be- ..:š'25 '::::'_3,0 . .. .. . . . . . . . . . .. 5Q4 :..':.': ::: : °. .».. : : : skriven här ovan, för att utföra en sökning i en kodbok för att producera åtminstone en av talkodsignalsparametrama, vari talsignalen utgör ljudsignalen.
I ett kommunikationssystem av celltyp för betjäning av ett stort geografiskt område, uppdelat i ett flertal celler, omfattande: mobila portabla sändarmottagarenheter; cellbasstationer anordnade i var sina celler; medel (5) för styrning av kommunikatio- nen mellan cellbasstationema; ett dubbelriktat trådlöst kommunikationsundersystem mellan varje mobil enhet, som finns i en cell och cellbasstatíonen för denna cell, vilket dubbelriktade kommunika- tionsundersystem omfattar, i både den mobila enheten och cellbasstationen (a) en sän- dare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen.
Talsignalkodningsmedlen omfattar medel mottagliga for att producera talsignalkod- ningsparametrar, och dessa talsignalkodningsparameterproducerande medel omfattar en anordning beskriven här ovan, för att utföra en sökning i en kodbok för att produce- ra åtminstone en av talkodsignalsparametrama, vari talsignalen utgör ljudsignalen.
Syften, fördelar och andra särdrag enligt föreliggande uppfinning kommer att framgå tydligare genom läsning av den följande icke-begränsande beskrivningen av ett före- draget utföringsexempel därav, som alltså bara är ett exempel, med hänvisning till rit- ningama.
Kort figgrbeskrivning Fig. 1 är ett schematiskt blockschema över en ljudsignalkodande anordning, omfattan- de en amplitudväljare och en optimeringsstyrare i enlighet med uppfinningen; fig. 2 är ett schematiskt blockschema över en avkodningsanordning, samverkande med kodningsanordningen i fig. 1; fig. 3a är en följd av grundoperationer för den snabba kodboksgenomsökningen i en- lighet med uppfinningen, baserat på signalvalda pulsamplituder; "gi 25 '212230 uu- uu. u u uu uu u u u ~ u u u u - uu u uu uu u u. u u u uu uu u u u u u u u u uuu uuu u u u u u u u uu u uu u u u u u u u u u u u I u u ~ v u u u u u uuuu uu uu u u u ~ uu fig. 3b är en följd av operationer för förbestärrming av en av de q amplitudema för varje position p i pulsamplitud/positionskombinationema; fig. 3c är en följd av operationer, ingående i den N-inbäddade slingsökning, där den innersta slingan överhoppas så snart bidraget från de första N-1 pulserna till tälj aren DAkT bedömas otillräckligt; fig. 4 är en schematisk representation av de N-innästlade slingoma, som används i kodbokssökningen; och fig. 5 är ett schematiskt blockschema, som visar infrastrukturen för ett typiskt kommu- nikationssystem av celltyp.
Detaljerad beskrivning av det föredragna utföringsexemplet Fig. 5 visar infrastrukturen för ett typiskt kommunikationssystem 1 av celltyp.
Ehuru tillämpningen av metoden för sökgenomförande och anordningen enligt uppñn- ningen vid ett kommunikationssystem av celltyp visas som ett icke begränsande exem- pel i den här föreliggande beskrivning, bör hållas i minnet att metoden och anordning- en kan användas med samma fördelar i många andra typer av kommunikationssystem, där ljudsignalskodning krävs.
Vid ett kommunikationssystem av celltyp, såsom 1, tillhandahålles en telekommunika- tionstjänst över ett stort geografiskt område genom att uppdcla detta stora område i ett antal mindre celler. Varje cell har en cellbasstation 2 (fig. 5) för att åstadkomma radio- signaleringskanaler och audio- och datakanaler.
Radiosignaleringskanalema användes för att kalla mobila radiotelefoner (mobila sän- darmottagarenheter) såsom 3 inom gränserna för cellbasstationens täckningsyta (cel- len), och att placera anrop till andra radiotelefoner antingen inom eller utom basstatio- nens cell, eller till ett annat nät, såsom det allmänna telefonnätet (PSTN) 4.
Så snart en radiotelefon 3 framgångsrikt placerat eller mottagit ett anrop, uppsättes en 2-30 524 905 audio- eller datakanal till cellbasstationen 2, som svarar mot cellen, där radiotelefonen 3 befinner sig, och kommunikation mellan basstationen 2 och radiotelefonen 3 sker över denna audio- eller datakanal. Radiotelefonen 3 kan även motta styr- eller tidsgiv- ningsinfonnation via signalkanalen medan ett samtal pågår.
Om en radiotelefon 3 lärrmar en cell under ett samtal och kommer in i en annan cell, så överlämnar radiotelefonen samtalet till en tillgänglig audio- eller datakanal i den nya cellen (handover). Likaså, och om inget samtal pågår, sändes ett styrmeddelande via signalkanalen, så att radiotelefonen loggar mot basstationen 2, som tillhör den nya cellen. På detta sätt är mobilkommunikation möjlig över ett stort geografiskt område.
Cellkommunikationssystemet 1 omfattar vidare en terminal 5 för att styra kommunika- tionen mellan cellbasstationerna 2 och allmänna telefonnätet 4, exempelvis under en kommunikation mellan en radiotelefon 3 och nätet 4, eller mellan en radiotelefon 3 i en första cell och en radiotelefon 3 i en andra cell.
Givetvis erfordras ett dubbelriktat trådlöst radiokommunikationsundersystem för att upprätta kommunikation mellan varje radiotelefon 3, som finns i en cell och cellbas- stationen 2 i denna cell. Ett dylikt dubbelriktat trådlöst radiokommunikationssystem omfattar typiskt i både radiotelefonen 3 och cellbasstationen 2 (a) en sändare för att koda talsignalen och sända den kodade talsignalen genom en antenn såsom 6 eller 7 och (b) en mottagare för mottagning av en utsänd kodad talsignal genom samma an- tenn 6 eller 7 och för att avkoda den mottagna kodade talsignalen. Som är väl bekant för fackmannen, erfordras talkodning för att minska den nödvändiga bandbredden för att överföra tal via det dubbelriktade trådlösa radiokommunikationssystemet, dvs. mellan en radiotelefon 3 och en basstation 2.
Syftet med föreliggande uppfinning är att åstadkomma en effektiv digital talkodnings- teknik med hög kvot mellan subjektiv kvalitet och bithastighet, exempelvis för dubbel- riktad transmission av talsignaler mellan en cellbasstation 2 och en radiotelefon 3 via en audio- eller datakanal. Fig. 1 är ett schematiskt blockschema över en digital talkod- 524 905 11 ningsanordning, lämplig för att utföra denna effektiva teknik.
Talkodningsanordningen i fig. 1 är samma kodningsanordning som visas i fig. 1 iden amerikanska stamansökan nr 07/927 528, till vilken en amplitudväljare 112 i enlighet med föreliggande uppñnning har tillagts. Den amerikanska stamansökan nr 07/927 528 ingavs den 10 september 1992 för en uppfinningen med titeln: "Dynamic Codebook for Efficient Speech Coding Based on Algebraic Codes".
Den analoga talsignalen samplas och blockbehandlas. Man bör inse att Föreliggande uppfinning ej är begränsad till en tillämpning på talsignaler. Kodning av andra typer av ljudsignaler kan även övervägas.
I det visade exemplet omfattar blocket för ingående samplat tal S (fig. 1) L på varandra följande samplingar. I CELP-litteraturen betecknas L som "subframe"-längden (läng- den för underramen) och ligger typiskt mellan 20 och 80. Likaså betecknas blocken av L samplingar som L-dimensionella vektorer. Olika L-dimensionella vektorer alstras under gången av kodningsproceduren. En lista av dessa vektorer, som föreligger i fig. 1 och 2, jämte en lista av överförda parametrar lämnas nedan: Lista över de huvudsakliga L-dimensionella vektorema: S ingående talvektor; R' frekvenseliminerad residualvektor; X målvektor; D bakåtfiltrerad målvektor; Ak kodvektor med index k från den algebraiska kodboken; och Ck innovationsvektor (filtrerad kodvektor).
Lista över översända parametrar: k kodvektorindex (ingång till den algebraiska kodboken); g förstärkning; STP kortsiktiga förutsägelseparametrar (definierande A(z)); och _25 12 LTP långsiktiga förutsägelseparametrar (definierande en sekvensförstärkning b och en frekvensfördröjning T).
Avkodningsprincig: Det förmodas vara att föredraga att först beskriva talavkodningsanordningen i fig. 2, som visar de olika steg som utföres mellan den digitala ingången (ingången till avmul- tiplexeraren 205) och det utkommande samplade talet (utgången på syntesfiltret 204).
Avmultiplexeraren 205 uttar fyra olika parametrar ur den binära information som mot- tages från en digital ingångskanal, nämligen index k, íörstärkningen g, de kortsiktiga förutsägelseparametrama STP och de långsiktiga törutsägelseparametrarna LTP. Den föreliggande L-dimensionella vektom S från talsignalen syntetiseras på basis av dessa fyra parametrar, på sätt som kommer att förklaras i den fortsatta beskrivningen.
Talavkodningsanordningen i fig. 2 omfattar en dynamisk kodbok 208, sammansatt av en algebraisk kodgenerator 201 och ett adaptivt förfilter 202, en förstärkare 206, en adderare 207, en långsiktprediktor 203 och ett syntesfilter 204.
Vid ett första steg alstrar den algebraiska kodgeneratom 201 en kodvektor Ak i mot- svarighet till index k.
Vid ett andra steg behandlas kodvektorn Ak av ett adaptivt förfilter 202, som försörjes med långsiktsförutsägelseparametrarna LTP för att alstra en utgående innovationsvek- tor Ck. Ändamålet med det adaptiva förfiltret 202 är att dynamiskt styra frekvensinne- hållet för den utgående innovationsvektom Ck för att öka talkvaliteten, dvs. minska den hörbara distorsion som orsakas av frekvenser som stör det mänskliga örat. Typiska överföringsfunktioner F(z) för det adaptiva förfiltret 202 lämnas här: F (2): Ac/m ° Awm f-zß uuu uuu u u uu uu u u u u u u u u u uu u u u u u u u u u u u u uu u u u u u u u u u u u u u u uuu uuu u u u u u u u u u u u u u u u u u u u u u u u u u u u u _ u u u u u uuuu uu uu u u u u .u l Ffwïffm Fa(z) är ett formantförfilter, i vilket O <'Y1 formantornrådena och arbetar mycket effektivt speciellt vid kodhastigheter under 5 kbit/s.
Fb(z) är ett tonhöj dsförfilter, där T är den tidsvarierande tonhöjdsfördröjningen och bo är antingen konstant eller lika med den kvantiserade långsiktiga tonhöjdsförutsägelse- parametem ur närvarande eller tidigare underramar. Fb(z) är mycket effektiv för att framhålla tonhöj dens harmoniska frekvenser vid alla bithastigheter. Följaktligen inne- fattar F(z) typiskt ett tonhöjdsförfilter, ibland kombinerat med ett formantförfilter, nämligen: F (2) = F.(2)Fb(2) I enlighet med CELP-tekniken erhålles den utgående samplade talsignalen S genom att skala innovationsvektom Ck ur kodboken 208 med förstärkning g genom förstärkaren 206. Adderaren 207 adderar sedan den skalade vågformen gCk till utsignalen E (lång- siktsförutsägelsekomponenten för signalexcitationen på syntesfiltret 204) med en lång- siktsprediktor 203, som levereras med LTP-parametrama, placeras i en återkopplings- slinga och med en överföringsfunktion B(z), definierad enligt följande: B(z) = bz 'T där b och T är ovan definierade tonhöjdsiörstärloiing respektive fördröjning.
Prediktorn 203 är ett filter med en överföringsfiinktion, som står i överensstämmelse med senast mottagna LTP-parametrar b och T för att modellbygga tonhöj dsperiodici- teten i tal. Den tillför lämplig tonhöj dsförstärkning b och fördröjning T i samplingar.
IIïšO - . ø . . . - - . s. ... ... . . .. .. . .. .. . . . . . . . ._ . . .. .. . . . . . . . . ..._ Z"I'.'..'1Z."'.I.I' I .
I... s s - . - n.. .- n» - . . - .- Den sammansatta signalen E + gCk utgör signalexcitationen för syntesfiltret 204, som har en överföringsfunktion 1/A(z) (varvid A(z) är definierat i den följande beskriv- ningen). Filtret 204 levererar korrekt spektrumformning i enlighet med senast mottag- na STP-parametrar. Närmare bestämt modellerar filtret 204 de resonansfrekvenserna (formanterna) i tal. Utgångsblocket S är den syntetiserade samplade talsignal som kan omvandlas till en analog signal med rätt anti-aliaserande filtrering i enlighet med en teknik, som är välkänd för fackmannen.
Det finns många sätt att konstruera en algebraisk kodgenerator 201. En lämplig metod, beskriven i den ovan nämnda amerikanska patentansökan nr 07/927 528, består av att använda minst en N-mellanlagd enkelpuls permutationskod.
Detta begrepp kommer att illustreras genom en enkel algebraisk kodgenerator 201. Vid detta exempel är L = 40, och uppsättningen av 40-dimensionella kodvektorer innehål- ler bara N = 5 pulser med amplituder skild från noll, som kommer att betecknas S S P1' P2, Sp3, Sp4, SPS. Vid denna mera genomförda notation står pi för placeringen av den i-te pulsen inom underramen (dvs. pi går från O till L-1). Antag att pulsen SPI är be- gränsad till åtta möjliga positioner pl enligt följande: pl = o,s,1o,1s,2o,2s,3o,3s = o+sm1;m1 = o,1...7.
Inom dessa åtta positioner, som kan betecknas "banan" #1, kan Spi och sju nollampli- tudpulser fritt permutera. Detta är en "enkelpulspermutationskod". Låt oss nu samman- väva fem sådana "enkelpulspermutationskoder" genom att också lägga tvångsvillkor på positionema för de övriga pulsema på liknande sätt (dvs. bana #2, bana #3, bana #4 och bana #5).
P1=0,5,l0,15,2O,25,30,35=O+8m1 P2=l,6,1 1,16,21,26,31,36=1+8m2 P3=2,7,12,17,22,27,32,37=2+8m3 P4=3,8,l3,l8,23,28,33,38=3+8rn4 P5=4,9,14,19,24,29,34,39=4+8m5 .gg -fff30 524 905 %ïê2*íI¿Ä¿~Åb Lägg märke till att heltalen mi = 0, 1, ..., 7 helt definierar positionen pi för varje puls Spi. Således kan ett enkelt positionsindex kp härledas genom enkel multiplexering av m i-na med användning av följande uttryck: Kp = 4096m1 + 512m; + 64m3 + 8m4 + m5 Det bör framhållas att andra kodböcker kan härledas genom användning av de ovan- nämnda pulsbanoma. Exempelvis kan man använda bara fyra pulser, där de första tre pulsema upptar positionerna i de första tre banorna, under det att den fjärde pulsen upptar antingen den fiärde eller den femte banan med en bit för att specificera vilken bana. Denna konstruktion ger upphov till en 13-bitpositions kodbok.
Vid tidigare känd teknik antogs pulsema med amplitud skild från noll ha fast amplitud för alla praktiska ändamål av orsaker som har att göra med komplexiteten för kodvek- torsökningen. Om sålunda pulsen Spi kan anta en av q möjliga amplituder, så måste så många som qN pulsamplitudkombinationer tagas hänsyn till under sökningen. Om ex- empelvis de fem pulserna i det första exemplet tillåtes anta en av q = 4 möjliga ampli- tuder, exempelvis Spi = +1, -1, +2, -2, i stället för en fast amplitud, så stegras storleken av den algebraiska kodboken från 15 till l5+(5x2) bitar = 25 bitar, innebärande en sökning som är tusen gånger mera komplex.
Det är syftet med föreliggande uppfinning att avslöja det överraskande faktum att mycket goda egenskaper kan uppnås med q-amplitudpulser utan att betala ett högt pris därför. Lösningen består i att begränsa sökningen till en begränsad undergrupp av kod- vektorer. Metoden för val av kodvektorema är relaterad till den ingående talsignalen, som kommer att beskrivas i den följ ande beskrivningen.
Den praktiska nyttan med föreliggande uppfinning år att möjliggöra en ökning av storleken av den dynamiska algebraiska kodboken 208 genom att tillåta enskilda pulser ..:š2S 32:30 . . .. ._ . . . . . . . . . .. 5Q4 :..':.': ::: : f.. : : : .:. att antaga olika möjliga amplituder utan att öka komplexiteten av kodvektorsökningen.
Kodningsprincip Den samplade talsignalen S kodas genom en block-för-block-basis genom kodningssy- stemet i fig. 1, som är uppbruten i elva moduler, betecknade från 102 till 112. Funktio- nen och operationen för de flesta av dessa moduler är oförändrade i förhållande till beskrivningen i amerikanska stampatentansökan nr 07/927 528. Ehuru sålunda den följ ande beskrivningen kommer att åtminstone i korthet förklara funktionen och ope- rationen för varje modul, kommer beskrivningen att koncentreras på det som är nytt i förhållande till det beskrivna i den amerikanska patentansökan nr 07/927 528.
För varje block av L samplingar av talsignal alstras en uppsättning av linjära förutsäg- ningskodnings-(LPC)-pararnetrar, betecknade kortsiktsprediktions-(STP)-parametrar, i enlighet med en tidigare känd teknik genom en LPC-spektrum analyserare 102. Närma- re bestämt modulerar analyseraren 102 de spektrala egenskaperna för varje block S av L samplingar.
Ingångsblocket S av L-samplingar vitgöres genom ett vitningsfilter 103, som har föl- jande överföringsfunktion, baserat på föreliggande värden på STP-parametrarna: A(z) = Éq-íi i=0 där ai = 1 och z är den vanliga variabeln i den s.k. z-transformen. Som framgår i fig. 1, alstrar vitfiltret 103 en residual vektor R.
En tonhöjdsextraktor 104 användes för att beräkna och kvantifiera LTP-parametrama, nämligen tonhöj dsfördröjningen T och tonhöjdsförstärkningen g. Det ursprungliga till- ståndet för extraktorn 104 är också inställt till ett värde FS ur en urtillståndsextraktor 110. En detaljerad procedur för beräkning och kvantisering av LTP-parametrama be- skrives i den amerikanska stampatentansökan nr 07/927 528 och fönnodas vara väl- E25 17 känd för vanliga fackmän på området. Följaktligen kommer den inte att beskrivas yt- terligare i föreliggande beskrivning.
En filtersvarkännetecknare 105 (fig. 1) förses med STP- och LTP-parametrarna för att beräkna en filtersvarkänneteckning F RC för användning i de senare stegen. F RC- informationen består av följande tre komponenter, där n = 1, 2, ...L. - f(n): svaret för F(z) lägg märke till att F(z) typiskt innefattar tonhöjdsflârñltret. ~ h(n): svaret på åf 427-.) p (n) där är en perceptionsfaktor. Allmännare sett är h(n) pulssvaret pà F(z)W(z)/A(z), vilket är kaskaden av förfiltret F(z), perceptual- Vikïfiltret W(z) och syntesfiltret l/A(z). Man kan lägga märke till att F(z) och l/A(z) är samma filter som användes i avkodaren i fig. 2.
° U(i,j): autokorrelationen för h(n) i enlighet med följ ande uttryck: ungj) =Éh(k-f+1)h(k-j+1) k=l förlgi5Lochi5jgL;h(n)=0förn<1.
Långtidsprediktorn 106 förses med föregående excitationssignal (dvs. E + gCk för fö- regående underram) för att bilda den nya E-komponenten med användning av rätt ton- höjdsfördröjning T och -fórstärkning b.
Det ursprungliga tillståndet för perceptionsfiltret 107 inställes till det värde FS som levereras från ínitialtillståndsextraktorn 1 10. Den tonhöjdsbefriade residualvektorn R'= R-E, beräknad genom en subtraherare 121 (fig. 1) levereras sedan till perceptualfiltret §..:¿, ø . n < ~ » - n - a. 524 905 18 ~ - - - ~ . - - - - . - .u 107 för att på dess utgång erhålla en målvektor X. Som framgår av ñg. 1, pålägges STP-parametrama på filtret 107 för att variera dess överföringsfilnktion i förhållande till dessa parametrar. Väsentligen gäller X = R'- P, där P representerar bidraget från långsiktsförutsägelsen (LTP), inklusive "ringning" från föregående excitationer. MSE- kriteriet som gäller för A kan nu fastställas i följande matrisnotationer: rnkinflAflz = InkinHS' - S" 2 = InkinHS' - [P - gAkH T n: = ngnflx - gA,HT||2 där H är en L x L undertriangulär Toeplitz-matris, bildad av h(n)-svaret enligt följande.
Tennen h(O) upptar matrisdiagonalen och h(l), h(2), ...h(L-1) upptar respektive nedre diagonaler.
Ett bakåtfiltrerande steg utföres av filtret 108 i fig. 1. Genom att sätta till noll derivatan med avseende på g i ovanstående ekvation erhålles optimal förstärkning enligt följan- de: a A 2 lågt :O _ X (AkH T )T _ Ilftfffllz Med detta värde på g blir minimiseringen: fltinw* :mr ||A~H'|l Syftet är att finna det särskilda index k, för vilket minimeringen uppnås. Lägg märke till att eftersom I l X I Iz är en fast kvantitet, så kan samma index finnas genom att maximera följ ande kvantitet: :fas :".: '. -f ;..
:I- :.:' 2 - _ , . .. . . . _ _. .... ._ 19 f21rT>2 :mfxuwiff 2 x * llflrflfal a a där D = (mmm af =||A,,HT||2 I bakåtfiltret 108 beräknas en bakåtfiltrerad målvektor D = (XH). Termen "bakåtfiltre- ring" for denna operation kommer ur tolkningen av (XH) som filtreringen av tidsrever- serade X.
Endast en amplitudväljare 112 har tillagts till fig. 1 i ovan nämnda amerikanska stam- patentansökan nr 07/927 528. Funktionen för amplitudselektorn 112 är att begränsa så att kodvektorerna Ak avsökes av optimeringsstyraren 109 till de mest lovande kod- vektorema Ak for att därvid reducera komplexiteten av kodvektorsökningen. Som be- skrivits i föregående beskrivning, är varje kodvektor Ak en pulsampli- tud/positoinskombinationsvågfonn, som definierar L olika positioner p och omfattar både nollamplitudpulser och från noll skilda amplitudpulser, tillordnade till respektive positioner p = 1, 2, ...L i kombinationen, varvid varje från noll skild amplitudpuls antar minst en av q olika möjliga amplituder.
Med hänvisning till fig. 3a, 3b och 3c är ändamålet med amplitudselektom 112 att för- utbeståmma en funktion Sp mellan positionerna p för kodvektorvågforrnen och de q möjliga värdena for pulsamplitudema. Den förutupprättade funktionen Sp härledes i relation till talsignalen före kodbokssökningen. Närmare bestämt består fórutupprät- tandet av denna funktion av ett törutval, i relation till talsignalen, av minst en av de q möjliga amplitudema För varje position p i vågformen (steg 301 i fig. 3a).
För att förvälja en av de q amplitudema till varje position p i vågforrnen beräknas en amplituduppskattningsvektor B i motsvarighet till den baklängesfiltrerade målvektom D och den tonhöjdseliminerade residualvektom R'. Närmare bestämt beräknas ampli- Åïfés ~ . . . a» . ... . . .. H .l t 2' . . . . . - - ° . m.. . _ y -. . p v " , - 1- - - ...e ø n . '-13 2 _' ° . 1 ~ _ . , . . . . . . .. ? 1 9 Û 5 _ _, . . . u.. ._ .- tuduppskattningsvektom B genom att summera (understeget 301-1 i ñg. 3b) den bak- längesfiltrerade målvektom D i normaliserad form: och den tonhöj dseliminerade residualvektom R' i normaliserad form: R, "m för att därvid erhålla en amplituduppskattningsvektor B av formen: D B=u-ß) IIDII R' 'rß-'T WU där ß är en fast konstant med typiskt värde 1/2 (värdet på ß väljes mellan O och 1, bero- ende på procentsatsen av de från noll skilda amplitudpulsema, som användes i den al- gebraiska koden).
För varje position p i vågformen erhålles den amplitud Sp som skall fórutbestämmas till denna position p genom att kvantisera ett motsvarande amplituduppskattningsvärde Bp for vektom B. Närmare bestämt kvantiseras for varje position p i vågfonnen ett toppnorrnaliserat amplituduppskattningsvärde B for vektom B (understeget 301-2 i P fig. 3b) med användning av följande uttryck: sp = Qlß, /mnax J B" där Q (.) är kvantiseringsfiinktionen och maXIB" | II är en normaliseringsfaktor, som representerar en toppamplitud for de från noll skilda pulserna. 3225 524 905 «if»»;a~»i 21 I det viktiga specialfall, där: - q = 2, dvs. då pulsamplituderna bara kan anta två värden (dvs. Spi = i )- och - densiteten for från noll skilda pulser N/L är lägre än eller lika med 15%; så kan värdet på ß vara lika med noll; i så fall reduceras amplituduppskattningsvektorn B helt enkelt till den bakåtfiltrerade målvektom D, och följaktligen gäller Sp = sign(Dp). Ändamålet med optimeringskontrollen 109 är att välja den bästas kodvektorn Ak ur den algebraiska kodbokcn. Valkriteriet är bestämt i form av en kvot som skall beräknas for varje kodvektor Ak och maximeras över alla kodvektorer (steg 303): r 2 max (pAkz ) k ak där D =(xH)och af =||Akf1fl|z Eftersom Ak är en algebraisk kodvektor med N från noll skilda amplitudpulser med respektive amplituder Spi så blir tälj aren kvadraten på N DA* T = Z DP: SP: i=l och nämnaren är en energiterrn, som kan uttryckas såsom: N N-I N af =2S,,,*U+22 2s,,,s,,,U í=l :=1 j=1+1 där U(pi, pj) är den korrelation som hör ihop med två pulser med amplituden 1, den ena i position pi och den andra vid positionen pj. Denna matris beräknas i enlighet med . Q-gs . . ~ » -a . .. s» o ~ ' ' ° _ _ a una-an L. . »o- z. _' _ 4, 504 x ::'.' .. .. .... ..
L- 22 ovanstående ekvation i filtersvarskarakteriseraren 105 och ingår i uppsättningen av parametrar som betecknas som F RC i blockschemat i fig. 1.
En snabb metod för att beräkna denna nämnare (steg 304) innefattar de N-nätlagda slingor som visas i fig. 4, där notationen S(i) och SS(i,j) användes i stället för respekti- ve kvantiteter "S i" och "S -S ". Beräkningen av nämnaren (lkz är den mest tidskrä- p P1 pi vande processen. De beräkningar som bidrar till Gkz, som utföres i vari e slinga i fig. 4, kan skrivas på separata rader från den yttersta slingan till den innersta slingan enligt följ ande: af =S,,,2U(P.,p.) +Spfrflpvpn+2S,,,S,,,U +SpfU+2[S,,,S,,,U+S,,S,,,U] +S,,~2U+2[S,,,S,,U+S,,,S,,NU+...+S,,N_,S,,,U] där pi är positionen för den i-te från noll skilda amplitudpulsen. Man kan lägga märke till att de N-nätlagda slingorna i fig. 4 möjliggör en begränsning av de från noll skilda amplitudpulserna i kodvektorema Ak i enlighet med N sammanvävda enkelpulsper- mutationskoder.
Vid föreliggande uppfinning reduceras sökkomplexiteten drastiskt genom att begränsa den undergrupp av kodvektorer Ak till kodvektorer, där de N från noll skilda ampli- tudpulserna respekterar den funktion som förut upprättats i steget 301 i fig. 3a. Den förut upprättade funktionen är respekterad när de N från noll skilda amplitudpulsema i en kodvektor Ak vardera har en amplitud, som är lika med den amplitud som förut till- ordnats till positionen p för de från noll skilda amplitudpulsema.
Denna begränsning av undergruppen av kodvektorer förforrnas genom att först kombi- nera den förut upprättade funktionen S med elementen i matrisen U(i,j) (steg 302 i P fig. 3a), och sedan genom användning av de N-nätlagda slingoma i fig. 4 med alla pul- . . . - . - - ~ ~ H u-o :av D I II i' I D b IG I '. . ' . ._ »nu n o n to n O " Û ° ' ' l ... . - . - a 0 _' *f :_ 2' 2 s : 1 I ',' "'."".... _. .. - - - - -- 23 ser S(i) antagna att vara fixerade, positiva och med enhetsamplitud (steg 303). Även om alltså amplituden för från noll skilda pulser kan anta vilket som helst av q möjliga värden i den algebraiska kodboken, så förminskas sökkomplexiteten till fallet med fasta pulsamplituder. Närmare bestämt kombineras matrisen U(i,j) som åstadkommes genom filterresponskarakteriseraren 105, med den förut upprättade funktionen i enlig- het med följ ande uttryck (steg 302): UIÜÄI) = SiSjUÜÄ/I) där Si resulterar från valmetoden för amplitudväljaren 112, nämligen så att Si är den amplitud som är vald för en enskild position i, efter kvantisering av motsvarande amp- lituduppskattning.
Med denna nya matris kan beräkningen för varje slinga i den snabba algoritmen skrivas på en separat rad, från den yttersta till den innersta slingan, enligt följ ande: af =U'(P,,P.) + U'(p,,122)+ 2U'(P1,P2) + U'(P,,1>,)+2U'(P.,P,) + 2U'(P2,P,) +U'(p~,p~)+2U'(p.,.v~)+2U'(p2,p~)+---+2U'(p~-.,p~) där px är positionen för den x-te, från noll skilda arnplitudpulsen i vågformen, och där px, som förut tillordnats till en som är förut tillordnad till en po- U'(px,py) är en funktion, som beror av den amplitud S position px bland positionerna p och amplituden Spy sition py bland positionerna p.
För att ytterligare minska sökkomplexiteten kan man hoppa över (se flg. 3c) i synner- het, men ej uteslutande, den innersta slingan så snart följande olikhet är uppfylld: N-i ZSmDP.. < TD n=l där Spn är den amplitud som är förut tillordnad till positionen pn, Dpn är den pnzte mål- - . u . » ~ ~ \ ~ H- 524 905 24 vektom D, och TD är ett tröskelvärde, som är relaterat till den bakåtfiltrerade målvek- tom D.
Den globala signalexcitationssignalen E + gCk beräknas genom en adderare 120 (fig. 1) ur signalen gCk från styranordningen 109 och utsignalen E från prediktom 106. Ur- sprungstillståndsextraktrriodulen 110, som utgöres av ett perceptionsfilter med en över- föringsfunktion 1/A(ZY'1) som varierar i förhållande till STP-parametrarna, subtraherar från residualsignalen R signalexcitationssignalen E + gCk för det uteslutande ändamålet att erhålla det slutliga filtertillståndet FS för användning som initialtillstånd i filtret 107 och tonhöjdsuttagaren 104.
Uppsättningen av fyra parametrar k, g, LTP och STP omvandlas till det riktiga digital- kanalsformatet genom en multiplexerare 111, som kompletterar proceduren för att koda ett block S av samplingar av talsignal.
Ehuru föreliggande uppfinning har beskrivits ovan med hänvisning till föredragna ut- föranden därav, så kan dessa utföranden modifieras godtyckligt, inom ramen för bifo- gade patentkrav, utan att frångå anda och natur hos föreliggande uppfinning.
Claims (24)
1. Metod för utförande av sökning i en kodbok för att koda en ljudsignal, i vilken: - kodboken består av en uppsättning av pulsamplitud/position kombinationer (Ak); - varje kombination pulsamplitud/position (Ak) definierar ett antal L olika positioner (p) och omfattar både nollamplitudpulser och icke-nollamplitudpulser, tillordnade till var sina positioner p = 1, 2, ...L i kombinationen; - var och en av icke-nollamplitudpulsema antar minst en av q möjliga amplituder; och nämnda kodbokssökningsutförandemetod omfattar: att förvälja från nämnda kodbok en undergrupp av pulsamplitud/positions- kombinationer (Ak) i beroende av ljudsignalen; och att endast denna undergrupp av pulsamplitud/positionskombinationer (Ak) genomsö- kes, för att koda ljudsignalen varvid sökningens komplexitet förrninskas, eftersom en- dast en undergrupp av pulsamplitud/positionskombinationerna i kodboken genomsö- kes; vari: förval av en undergrupp av pulsamplitud/positionskombinationer (Ak) omfattar att på förhand upprätta, i förhållande till ljudsignalen, en amplitud/positionsfunktion (Sp) mellan positionerna p = 1, 2, ...L och de q möjliga amplitudema; att på förhand upprätta en amplitud/positionsfurildion (Sp) omfattar att på förhand till- ordna en av de q möjliga amplitudema som gällande amplitud till varje position p; och att på förhand tillordna en av de q möjliga positionerna till varje position p omfattar: bearbetning av ljudsignalen för att åstadkomma en bakåtfiltrerad målsignal D och en tonhöj dseliminerad residualsignal R'; beräkning av en amplituduppskattningsvektor i motsvarighet till den bakåtfiltrerade målsignalen D och en tonhöj dseliminerade residualsignalen R'; och för var och en av nämnda positioner p, kvantisering av en amplituduppskattning BP för vektom B för att erhålla den amplitud som skall väljas för nämnda position p; och sökning i nämnda pulsamplitud/positionskombinationers (Ak) undergrupper omfattar en begränsning av sökningen till de pulsamplitud/positionskombinationer (Ak) i nämn- 10 15 20 g¿5 ~ . - . u ... u. 0 ~ .. u ~ :HH u o . n n - ou I _ _ ~° _ . . .. - . . v . . . - ~ ~- n. - . . v . - ~ . . ~ - 4 - ~ . . s . a - . . a . . q - - . . . _ _ u.. .. .- ~ - - ~ -- ~ 26 da kodbok som har icke-nollamplitudpulser vilka satisñerar den på förhand upprättade funktionen (Sp).
2. Metod enligt krav 1, kännetecknad av att den på förhand upprättade funktionen (Sp) är uppfylld när en pulsamplitud/positionskombinations (Ak) icke-nollamplitudpulser var och en har en amplitud som är lika med den amplitud som på förhand är tillordnad av den på förhand upprättade funktionen (Sp) till positionen p av nämnda icke- nollamplitudpuls.
3. Metod enligt krav 1 eller 2, kännetecknad av att beräkning av en amplituduppskatt- ningsvektor B omfattar att summera den bakåtfiltrerade målsignalen D i nonnaliserad form: med den tonhöj dseliminerade residualsignalen R' i nonnaliserad form: RI ß-*T WH för att därvid erhålla en amplituduppskattningsvektor B med formen: D R' ß=u-ß) , IW" HRM +ß där ß är en fast konstant.
4. _ Metod enligt krav 3, kännetecknad av att ß är en fast konstant med ett värde lig- gande mellan 0 och l.
5. Metod enligt något av kraven 1 till 4, kännetecknad av att, för var och en av de nämnda positionema p, kvantisering av en amplitudvektorsuppskattning omfattar kvantisering av en toppnormaliserad amplituduppskattning BP för den nämnda vektom 10 15 '20 šïáø » < - . . - ~ - - »- 524 905 'šVf-.-*ï.ï.=:I'=..=-. " 27 B med användning av följande uttryck: B p / max B,,| där nämnaren max|B,,| är en normaliseringsfaktor, som representerar en toppamplitud fór icke- nollamplitudpulsema.
6. Metod enligt något av kraven 1 till 5 kännetecknad av att de vidare omfattar be- gränsning av de icke-nollamplitudpulsemas positionerna för kodbokens kombinationer (Ak) i överensstämmelse med en grupp av pulspositionsspår.
7. Metod enligt krav 6 kännetecknad av att varje spårs pulsposition intersekvenseras med de andra spårens pulspositioner.
8. Metod enligt krav 6, kännetecknad av att - nämnda pulskombinationer (Ak) vardera omfattar ett antal N icke- nollamplitudpulser; - gruppen av spår innefattar N pulspositionsspår var för sig förbundna till de N icke- nollamplitudpulsema; - varje spårs pulspositioner intersekvenseras med de N-1 andra spårens pulspositio- ner; och - det begränsande steget innefattar begränsning av varje icke-nollamplitudpuls puls- positioner till det förbundna spårets positioner.
9. Metod enligt något av kraven 1 till 8, kännetecknad av att nämnda pulsampli- tud/positionskombinationer (Ak) vardera omfattar ett antal N icke-nollamplitudpulser, och varvid sökning i nämnda undergrupp av pulsamplitud/positionskombinationer (Ak) omfattar att maximera en given kvot med en nämnare O-kz beräknad med hjälp av N 10 15 20 ...- ÉN: ÉÜÉ l :ut “Ü 't 28 sammanvävda slingor i enlighet med följande uttryck: aZ=U'(p1,P.) +U'(p,,p,)+2U'(p1,p2) +U'(P,,P3)+2U'(PHP,)+ZUTPPPB) +U'(PN=PN)+ ZUTPvPN) +2U'(P2»PN)+-- - + 2U'(PN-ißPN) där beräkningen för varje slinga är skriven på en separat rad från en yttersta slinga till en innersta slinga av de N sammanvävda slingoma, där pn är positionen för den n-te icke-nollamplitudpulsen i kombinationen, och där U'l(px, py) är en funktion, som beror av amplituden S som på förhand tillordnats till en position px bland positionerna p, pX och amplituden S som på förhand är tillordnad till en position py bland positionerna PY p.
10. Metod enligt krav 9, kännetecknad av att maximering av den givna kvoten om- fattar att överhoppa åtminstone den innersta slingan av de N sammanvävda slingoma, så snart följande olikhet är uppfylld: N -1 ZSß..Dß.. < TD =1 R där Spn är den amplitud som på förhand är tillordnad till positionen pn, Dpn te komponenten i målvektom D, och Td är ett tröskelvärde, som hör ihop med den är den pn- bakåtñltrerade målvektom D.
11. Anordning för utförande av sökning i en kodbok för att koda en ljudsignal, i vil- ken: kodboken består av en uppsättning av pulsamplitud/position kombinationer (Ak); varje kombination pulsamplitud/position (Ak) definierar ett antal L olika positioner (p) och omfattar både nollamplitudpulser och icke-nollarnplitudpulser, tillordnade till var sina positioner p = 1, 2, ...L i kombinationen; 10 15 20 ..I325 5330 52 4 9 0 5 f .f .ai-ai 29 - var och en av icke-nollamplitudpulserna antar minst en av q möjliga amplituder; och - nämnda kodbokssökningsutförandemetod omfattar: medel att förvälja från nämnda kodbok en undergrupp av pulsamplitud/positions- kombinationer (Ak) i beroende av ljudsignalen; och medel att genomsöka endast denna undergrupp av pulsamplitud/positionskombina- tioner (Ak), för att koda ljudsignalen varvid sökningens komplexitet förminskas, efter- som endast en undergrupp av pulsamplitud/positionskombinationema i kodboken ge- nomsökes; vari: förvalsmedlen omfattar medel att på förhand upprätta, i förhållande till ljudsignalen, en amplitud/positionsfunktion (Sp) mellan positionerna p = 1, 2, ...L och de q möjliga amplitudema; de på förhand upprättade medlen omfattar medel att på förhand tillordna en av de q möjliga amplituderna som gällande amplitud till varje position p; och medlen att på förhand tillordna en av de q möjliga positionema till varj e position p om- fattar: medel för bearbetning av ljudsignalen för att åstadkomma en bakåtfiltrerad målsignal D och en tonhöjdseliminerad residualsignal R'; medel för beräkning av en amplituduppskattningsvektor i motsvarighet till den bakåt- filtrerade målsignalen D och den tonhöjdseliminerade residualsignalen R'; och medel för kvantisering, för var och en av nämnda positioner p, av en amplitudupp- skattning Bp för nämnda vektor B för att erhålla den amplitud som skall välj as för nämnda position p; och sökningsmedlen omfattar en begränsning av sökningen till de pulsamplitud/positions- kombinationer (Ak) i nämnda kodbok som har icke-nollamplitudpulser vilka satisfierar den på förhand upprättade funktionen (Sp).
12. Anordning enligt krav 11, kännetecknad av att den på förhand upprättade funktio- nen (Sp) är uppfylld när en pulsamplitud/positionskombinations (Ak) icke-nollampli- tudpulser var och en har en amplitud som är lika med den amplitud som på förhand är 10 15 20 ï--zs - . - . . . . . . .- ..a u. . . .- a. n u. nu a e. o v. u a n» ~ o v. u. n a a n n u a » ~~s nav u a v v n u u a» a en - I I a ~ - o 1 a a a . - -. 1 - . n n o ~ u o... a. a» . . a - .- tillordnad av den på förhand upprättade funktionen (Sp) till positionen p av nämnda icke-nollamplitudpuls.
13. Anordning enligt krav lleller 12, kännetecknad av att medel för beräkning av en amplituduppskattningsvektor B omfattar medel for att summera den bakåtfiltrerade målsignalen D i nonnaliserad form: med den tonhöjdseliminerade residualsignalen R' i normaliserad form: RI /3-7 ||R || för att därvid erhålla en amplituduppskattningsvektor B med formen: D R' B=°'ß)|u>n nu +ß där ß är en fast konstant.
14. Anordning enligt krav 13, kännetecknad av att ß är en fast konstant med ett värde liggande mellan 0 och 1.
15. Anordning enligt något av kraven 11 till 14, kännetecknad av att medlen for kvantisering av en amplitudvektorsuppskattning omfattar medel fór kvantisering, för var och en av de nämnda positionerna p, av en toppnormaliserad amplituduppskattning Bp for den nämnda vektom B med användning av följande uttryck: Bp/max Il B, där nämnaren maX 10 15 20 .as 524 905 %ïëe*š§@§¿%= 31 är en normaliseringsfaktor, som representerar en toppamplitud för icke-nollamplitud- pulserna.
16. Anordning enligt något av kraven 11 till 15, kännetecknad av att medlen vidare omfattar begränsning av de icke-nollamplitudpulsemas positionerna för kodbokens kombinationer (Ak) i överensstämmelse med en grupp av pulspositionsspår.
17. Anordning enligt krav 16, kännetecknad av att varje spårs pulsposition interse- kvenseras med de andra spårens pulspositioner.
18. Anordning enligt krav 16, kännetecknad av att: nämnda pulskombinationer (Ak) vardera omfattar ett antal N icke-nollamplitud- pulser; - gruppen av spår innefattar N pulspositionsspår var for sig förbundna till de N icke- nollamplitudpulsema; - varje spårs pulspositioner intersekvenseras med de N-1 andra spårens pulspositio- ner; och - det begränsande medlen innefattar begränsning av varje icke-nollamplitudpuls pulspositioner till det förbundna spårets positioner.
19. Anordning enligt något av kraven 11 till 18, kännetecknad av att nämnda puls- amplitud/positionskombinationer (Ak) vardera omfattar ett antal N icke-nollamplitud- pulser, och varvid medlen för sökning i nämnda undergrupp av pulsamplitud/posi- tionskombinationer (Ak) omfattar medel for att maximera en given kvot med en näm- nare akz beräknad med hjälp av N sammanvävda slingor i enlighet med följande ut- tryck: 10 15 20 íÉïfS . - - . . . o - . .- 524 905 32 af =U'(1>1,1>.) + U'(P2 =p2) + 2U,(p1 vpz) + Uxpppa) + 2U'(P1s P3) + ZUTP; spa) +UI(PN=PN)+ 2U,(P1»PN)+2U'(Pz>PN) + - - - + zUïpu-npzv) där beräkningen för varje slinga är skriven på en separat rad från en yttersta slinga till en innersta slinga av de N sammanvävda slingorna, där pn är positionen för den n-te icke-nollamplitudpulsen i kombinationen, och där U'(px, py) är en funktion, som beror av amplituden S som på förhand tillordnats till en position px bland positionerna p, pX och amplituden S som på förhand är tillordnad till en position py bland positionerna PY p.
20. Anordning enligt krav 19, kännetecknad av att medlen för maximering av den givna kvoten omfattar medel för att överhoppa åtminstone den innersta slingan av de N sammanvävda slingorna, så snart följande olikhet är uppfylld: N-l ZSmDP» < TD n=l där Spn är den amplitud som på förhand är tillordnad till positionen pn, Dpn te komponenten i målvektorn D, och Td är ett tröskelvärde, som hör ihop med den är den pn- bakåtfiltrerade målvektorn D.
21. Kommunikationssystem av celltyp för betjäning av ett stort geografiskt område, uppdelat i ett flertal celler, omfattande: bärbara sändar-/mottagarenheter (3); cellbasstationer (2), anordnade i respektive cell; medel (5) för styrning av kommunikationema mellan cellbasstationerna (2); ett dubbelriktat trådlöst kommunikationsundersystem mellan varje mobil enhet (3), som finns i en cell och cellbasstationen (2) för denna cell, vilket dubbelriktade kom- 10 15 20 -Qäs -fffßfl , . . .. .. . . . . _. . a I _ un... e.. .... a. . . 33 munikationsundersystem omfattar, i både den mobila enheten (3) och cellbasstationen (2) (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att pro- ducera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproduceran- de medlen innefattar en anordning reciterad i något av kraven 11 till 20, för att genom- föra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodpa- rametrar, vari talsignalen utgör nämnda ljudsignal.
22. Ett cel1nätverkselement(2) som omfattar (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att pro- ducera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproduceran- de medlen innefattar en anordning reciterad i något av kraven 11 till 20, för att genom- föra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodpa- rametrar, vari talsignalen utgör nämnda ljudsignal.
23. En mobil sändar-/mottagarenhet (3) av celltyp som omfattar (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att pro- ducera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproduceran- de medlen innefattar en anordning reciterad i något av kraven 11 till 20, för att genom- föra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodpa- rametrar, vari talsignalen utgör nämnda ljudsignal. 10 15 - - - - - - n u - .- 524 905 34 . o . a ~ n e - n . ~ - - »-
24. I ett kommunikationssystem av celltyp for betjäning av ett stort geografiskt områ- de, uppdelat i ett flertal celler, omfattande: mobila portabla sändarrnottagarenheter (3); cellbasstationer (2) anordnade i var sina celler; medel (5) för styrning av kommunikationen mellan cellbasstationema (2); ett dubbelriktat trådlöst kommunikationsundersystem mellan varje mobil enhet (3 ), som ñnns i en cell och cellbasstationen (2) för denna cell, vilket dubbelriktade kom- munikationsundersystem omfattar, i både den mobila enheten (3) och cellbasstationen (2) (a) en sändare, som innefattar medel för kodning av en talsignal och medel för överföring av den kodade talsignalen, och (b) en mottagare som innefattar medel för mottagning av en utsänd kodad talsignal och medel för avkodning av den mottagna kodade talsignalen; varvid talsignalkodningsmedlen omfattar medel mottagliga för talsignalen för att pro- ducera talsignalkodparametrar, och vari de nämnda talsignalkodparameterproduceran- de medlen innefattar en anordning reciterad i något av kraven 11 till 20, för att genom- föra en sökning i en kodbok för att producera åtminstone en av nämnda talsignalkodpa- l rametrar, vari talsignalen utgör nämnda ljudsignal.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SE0200785A SE524905C2 (sv) | 1995-02-06 | 2002-03-15 | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US38396895A | 1995-02-06 | 1995-02-06 | |
| US08/508,801 US5754976A (en) | 1990-02-23 | 1995-07-28 | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
| SE9600437A SE520553C2 (sv) | 1995-02-06 | 1996-02-06 | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal |
| SE0200785A SE524905C2 (sv) | 1995-02-06 | 2002-03-15 | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| SE0200785L SE0200785L (sv) | 2002-03-15 |
| SE0200785D0 SE0200785D0 (sv) | 2002-03-15 |
| SE524905C2 true SE524905C2 (sv) | 2004-10-19 |
Family
ID=27484542
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| SE0200785A SE524905C2 (sv) | 1995-02-06 | 2002-03-15 | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal |
Country Status (1)
| Country | Link |
|---|---|
| SE (1) | SE524905C2 (sv) |
-
2002
- 2002-03-15 SE SE0200785A patent/SE524905C2/sv not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| SE0200785L (sv) | 2002-03-15 |
| SE0200785D0 (sv) | 2002-03-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU708392C (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
| KR100299408B1 (ko) | 음성의고속코딩을위한심도우선대수코드북검색 | |
| US7774200B2 (en) | Method and apparatus for transmitting an encoded speech signal | |
| KR0143076B1 (ko) | 다중-요소 신호 코딩 방법 및 장치 | |
| US5729655A (en) | Method and apparatus for speech compression using multi-mode code excited linear predictive coding | |
| JP3996213B2 (ja) | 入力標本列処理方法 | |
| US5091955A (en) | Voice coding/decoding system having selected coders and entropy coders | |
| SE524905C2 (sv) | Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal | |
| CA2210765E (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
| CA2618002C (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
| KR100409167B1 (ko) | 정보 신호를 부호화하는 방법 및 장치 | |
| MXPA97005997A (en) | Algebraic coding book with amplitude signal deimpulse selected for a rapidacodification of | |
| CA2485547A1 (en) | Device, method, and program for encoding/decoding of speech with function of encoding silent period | |
| CN1239796A (zh) | 具有高效、容错、激励向量编码的声码器 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| NUG | Patent has lapsed |