RS64614B1 - Poboljšana ekstenzija frekvencijskog opsega u dekoderu audiofrekvencijskih signala - Google Patents
Poboljšana ekstenzija frekvencijskog opsega u dekoderu audiofrekvencijskih signalaInfo
- Publication number
- RS64614B1 RS64614B1 RS20230844A RSP20230844A RS64614B1 RS 64614 B1 RS64614 B1 RS 64614B1 RS 20230844 A RS20230844 A RS 20230844A RS P20230844 A RSP20230844 A RS P20230844A RS 64614 B1 RS64614 B1 RS 64614B1
- Authority
- RS
- Serbia
- Prior art keywords
- signal
- frequency
- band
- low
- khz
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K3/00—Apparatus for stamping articles having integral means for supporting the articles to be stamped
- B41K3/54—Inking devices
- B41K3/56—Inking devices using inking pads
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K1/00—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor
- B41K1/02—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor with one or more flat stamping surfaces having fixed images
- B41K1/04—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor with one or more flat stamping surfaces having fixed images with multiple stamping surfaces; with stamping surfaces replaceable as a whole
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K1/00—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor
- B41K1/08—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor with a flat stamping surface and changeable characters
- B41K1/10—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor with a flat stamping surface and changeable characters having movable type-carrying bands or chains
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K1/00—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor
- B41K1/08—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor with a flat stamping surface and changeable characters
- B41K1/12—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor with a flat stamping surface and changeable characters having adjustable type-carrying wheels
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K1/00—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor
- B41K1/36—Details
- B41K1/38—Inking devices; Stamping surfaces
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K1/00—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor
- B41K1/36—Details
- B41K1/38—Inking devices; Stamping surfaces
- B41K1/40—Inking devices operated by stamping movement
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41K—STAMPS; STAMPING OR NUMBERING APPARATUS OR DEVICES
- B41K1/00—Portable hand-operated devices without means for supporting or locating the articles to be stamped, i.e. hand stamps; Inking devices or other accessories therefor
- B41K1/36—Details
- B41K1/38—Inking devices; Stamping surfaces
- B41K1/40—Inking devices operated by stamping movement
- B41K1/42—Inking devices operated by stamping movement with pads or rollers movable for inking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
Opis
[0001] Predmetni pronalazak se odnosi na oblast kodiranja/dekodiranja i obrade audiofrekvencijskog signala (kao što su signali govora, muzike ili drugi) za njihov prenos ili skladištenje.
[0002] Tačnije, pronalazak se odnosi na jednu proceduru i jedan uređaj za ekstenziju frekvencijskog opsega u dekoderu ili procesoru koji vrši poboljšanje audiofrekvencijskog signala.
[0003] Postoje mnogobrojne tehnike za komprimovanje (sa gubitkom) audiofrekvencijskih signala kao što je govor ili muzika.
[0004] Klasični postupci kodiranja za konverzacijske aplikacije su generalno klasifikovane kao kodiranje talasnog oblika (MIC za „Pulsnu i kodirajuću modulaciju“, MICDA za „Pulsnu modulaciju i prilagodljivo diferencijalno kodiranje“, transformacijsko kodiranje…), parametarsko kodiranje (LPC za „Linearno Prediktivno kodiranje“ na engleskom, sinusoidno kodiranje…) i parametarsko hibridno kodiranje sa kvantifikacijom parametara „analizom putem sinteze“ od kojih je CELP kodiranje (za „Code Excited Linear Prediction“ na engleskom) najpoznatiji primer.
[0005] Za nekonverzacijske primene, stanje tehnike kodiranja audio signala (mono) sastoji se od perceptivnog kodiranja transformacijom ili u podopsezima, sa parametarskim kodiranjem visokih frekvencija replikacijom opsega (SBR za spektralnu replikaciju opsega, na engleskom).
Pregled klasičnih postupaka kodiranja govora i zvuka može se naći u W.B. Kleijn i K.K. Paliwal (urednici), Speech Coding and Synthesis, Elsevier, 1995 ; M. Bosi, R.E. Goldberg, Introduction to Digital Audio Coding and Standards, Springer 2002; J. Benesty, M.M. Sondhi, Y. Huang (Urednici), Handbook of Speech Processing, Springer 2008.
[0006] Ovde smo posebno zainteresovani za standardizovani kodek (koder i dekoder) 3GPP AMR-WB (za „Adaptive Multi-Rate Wideband“ na engleskom) koji radi na ulazno/izlaznoj frekvenciji od 16 kHz i u kojem je signal podeljen na dva podopsega, niski opseg (0-6.4 kHz) koji se uzorkuje na 12.8 kHz i kodiran je CELP modelom i visoki opseg (6.4-7 kHz) koji je rekonstruisan na parametrički način „ekstenzijom opsega“ (ili BWE za „Proširenje propusnog opsega”) sa ili bez dodatnih informacija u zavisnosti od režima trenutnog okvira.
Ovde se može primetiti da je ograničenje kodiranog opsega AMR-WB kodeka na 7 kHz u suštini povezano sa činjenicom da je frekvencijski odziv u prenosu terminala širokog opsega bio aproksimiran u vreme standardizacije (ETSI/3GPP zatim UIT-T) prema frekvencijskoj maski definisanoj u normi ITU-T P.341 i tačnije korišćenjem takozvanog „P341” filtera definisanog u normi UIT-T G.191 koji seče frekvencije iznad 7 kHz (ovaj filter poštuje masku definisanu u P.341). Međutim, u teoriji, dobro je poznato da signal uzorkovan na 16 kHz može imati definisan audio opseg od 0 do 8000 Hz; AMR-WB kodek stoga uvodi ograničenje visokog opsega u poređenju sa teorijskim propusnim opsegom od 8 kHz.
[0007] Govorni kodek 3GPP AMR-WB je standardizovan 2001. uglavnom za primene telefonije u režimu kola (CS) na GSM (2G) i UMTS (3G). Ovaj isti kodek je, takođe, standardizovan 2003. na UIT-T kao preporuka G.722.2 „Wideband coding speech at around 16kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)”.
[0008] Uključuje devet brzina prenosa, nazvanih režimi, od 6.6 do 23.85 kbit/s, i uključuje mehanizme kontinualnog prenosa (DTX za Isprekidani prenos, „Discontinuous Transmission”) sa detekcijom glasovne aktivnosti (VAD za Otkrivanje glasovne aktivnost, „Voice Activity Détection”) i generisanjem komfornog šuma (CNG za generisanje komfornog šuma, „Confort Noise Génération”) na okvirima deskriptora tišine (SID za Deskriptor umetanja tišine, „Silence Insertion Descriptor“), kao i mehanizme korekcije izgubljenih okvira (FEC za prikrivanje brisanja okvira „Frame Erasure Concealment“, ponekad nazvan PLC za prikrivanje gubitka paketa, „Packet Loss Concealment“).
[0009] Detalji AMR-WB algoritma kodiranja i dekodiranja se ovde ne prikazuju, detaljan opis ovog kodeka se nalazi u 3GPP specifikacijama (TS 26.190, 26.191, 26.192, 26.193, 26.194, 26.204.G. i UIT-T-G.722.2. odgovarajućim Aneksima i Odgovarajućim dodacima) kao i u članku B. Bessette i autora „The adaptive multirate wideband speech codée (AMR-WB)”, IEEE Transactions on Speech and Audio Processing, vol. 10, br. 8, 2002, str. 620-636 i izvornim kodovima povezanih 3GPP i ITU-T standarda.
[0010] Princip proširenja opsega u AMR-WB kodeku je prilično uprošćen. Zaista, visoki opseg (6.4-7 kHz) se generiše oblikovanjem belog šuma kroz temporalni omotač (primenjen u obliku pojačanja po podokviru) i frekvencije (primenom filtera sinteze linearnog predviđanja ili LPC za Linearno prediktivno kodiranje, „Linear Predictive Coding“). Ova tehnika proširenja opsega prikazana je na slici 1.
[0011] Beli šum, uHB1(n), n = 0,···,79, generiše se na 16 kHz po podokviru od 5 ms pomoću linearnog kongruentnog generatora (blok 100). Ovaj šum uHB1(n) se oblikuje tokom vremena primenom pojačanja po podokviru; ova operacija je podeljena na dve etape obrade (blokovi 102, 106 ili 109).
● Izračunava se prvi faktor (blok 101) da bi se beli šum uHB1(n) (bloc 102) (blok 102) stavio na nivo sličan onom kod ekscitacije, u(n), n = 0,...,63, dekodiran na 12.8 kHz u niskom opsegu:
[0012] Ovde se može primetiti da se standardizacija energija vrši upoređivanjem blokova različitih veličina u(n) i 80 za uHB1(n)), bez kompenzacija razlika u frekvencijama uzorkovanja (12.8 ili 16 kHz).
● Ekscitacija u visokom opsegu se tada dobija (blok 106 ili 109) u obliku:
gde se pojačanje ĝHBdobija različito u zavisnosti od brzine prenosa. Ako je brzina trenutnog okvira <23.85 kbit/s, pojačanje ĝHBse procenjuje „na slepo“ (tj. bez dodatnih informacija); u ovom slučaju, blok 103 filtrira niskoopsežni dekodirani signal pomoću visokopropusnog filtera (koji propušta visoke frekvence) koji ima graničnu frekvenciju od 400 Hz da bi se dobio signal ŝhp(n), n = 0,···,63 - ovaj visokopropusni filter eliminiše uticaj veoma niskih frekvencija koje mogu da deformišu procenu napravljenu u bloku 104 - zatim se izračunava „nagib“ (indikator spektralnog nagiba) označen etiltsignala ŝhp(n) standardizovanom autokorelacijom (blok 104):
o ĝHBu obliku:
gde gSP=1-etiltje pojačanje primenjeno na okvire aktivnog govora (SP za govor), gBG=1.25gSPje pojačanje primenjeno na neaktivne okvire govora koji su povezani sa pozadinskim šumom (BG za pozadinu) a wSPje funkcija ponderacije koja zavisi od detekcija glasovne aktivnosti (VAD). Podrazumeva se da procena nagiba ( etilt) omogućava prilagođavanje nivoa visokog opsega u funkciji spektralne prirode signala; ova procena je posebno važna kada je spektralni nagib dekodiranog signala CELP takav da se prosečna energija smanjuje kada se frekvencija povećava (slučaj gde je etiltblizu 1, pa se stoga gSP=1-etiltsmanjuje). Takođe imajte na umu da je faktor ĝHBu AMR-WB dekodiranju ograničen tako da uzima vrednosti u intervalu [0.1, 1.0]. U stvari, za signale čiji spektar ima više energije na visokim frekvencijama (etiltblizu -1, gSPblizu 2), pojačanje ĝHBje obično potcenjeno.
[0013] Pri brzini od 23.85 kbit/s, AMR-WB koder emituje jednu dekodiranu informaciju korekcije (blokovi 107, 108) da bi se profinilo procenjeno pojačanje po podokviru (4 bita na svakih 5 ms, tj.
0.8 kbit/s).
[0014] Veštačka ekscitacija uHB(n) se zatim filtrira (blok 111) pomoću LPC sintetskog filtera sa funkcijom prenosa 1/ AHB(z) i koji radi na frekvenciji uzorkovanja od 16 kHz. Realizacija ovog filtera zavisi od brzine trenutnog opsega:
● Pri 6.6 kbit/s, 1/ AHB(z) filter se dobija ponderisanjem jednim faktorom γ=0.9 jedan LPC filter reda 20, 1 <ext>(z) koji „ekstrapolira“ LPC filter reda 16, 1/ (z), dekodirano u niskom opsegu (na 12.8 kHz) - detalji ekstrapolacije u domenu ISF parametara (za „Imittance Spectral Frequency“ na engleskom) opisani su u standardu G.722.2 u odeljku 6.3. 2.1; u ovom slučaju,
● Pri brzinama prenosa > 6.6 kbit/s, 1/ AHB(z) filter je reda 16 i jednostavno odgovara:
gde γ=0.6. Treba primetiti da se u ovom slučaju filter 1/ (z / γ) koristi na 16 kHz, što rezultira širenjem (putem homotetije) frekvencijskog odziva ovog filtera od [0, 6.4 kHz] do [0, 8 kHz].
[0015] Rezultat, sHB(n), se na kraju obrađuje pomoću opsežno propusnog filtera (blok 112) tipa FIR (filter sa konačnim impulsnim odzivom, „Finite Impulse Response“), da bi se zadržao samo opseg od 6-7 kHz; pri 23.85 kbit/s, niskopropusni filter, takođe, FIR tipa (blok 113) se dodaje u obradu da bi se dalje prigušile frekvencije iznad 7 kHz. Visokofrekventna (HF) sinteza se konačno dodaje (blok 130) sintezi niske frekvencije (LF) koja se dobija sa blokovima 120 do 123 i ponovo uzorkovana na 16 kHz (blok 123). Dakle, čak i ako se visoki opseg proteže u teoriji od 6.4 do 7 kHz u AMR-WB kodeku, HF sinteza je prilično uključena u opseg 6-7 kHz pre dodavanja sa BF sintezom.
[0016] Možemo identifikovati nekoliko nedostataka tehnike proširenja opsega kodeka AMR-WB:
● Signal u visokom opsegu je oblikovani beli šum (prema vremenskim pojačanjima po podokviru, filtriranjem od 1/ AHB(z) i opsežno propusnim filtriranjem), što nije dobar opšti model signala u opsegu 6.4-7 kHz. Postoje, na primer, veoma harmonični muzički signali za koje opseg od 6.4-7 kHz sadrži sinusne komponente (ili tonove) i nijedan šum (ili malo šuma), za ove signale ekstenzije opsega AMR-WB kodeka snažno degradira kvalitet. ● Niskopropusni filter na 7 kHz (blok 113) uvodi pomeranje od skoro 1 ms između niskog i visokog opsega, što potencijalno može da degradira kvalitet određenih signala blagom desinhronizacijom dva opsega od 23.85 kbit/s - ova desinhronizacija, takođe, može izazvati probleme pri prelasku sa 23.85 kbit/s na druge režime.
● Procena pojačanja po podokviru (blok 101, 103 do 105) nije optimalna. Delimično se zasniva na „apsolutnom“ izjednačavanju energije po podokviru (blok 101) između signala na različitim frekvencijama: veštačka ekscitacija na 16 kHz (beli šum) i jedan signal na 12.8 kHz (dekodirana ACELP ekscitacija). Posebno se može primetiti da ovaj pristup implicitno indukuje slabljenje ekscitacije visokog opsega (odnos 12.8/16=0.8); u stvari, takođe treba napomenuti da se na visokom opsegu u AMR-WB kodeku ne vrši otklanjanje niskog opsega (ili uklanjanja faza), što implicitno indukuje relativno pojačanje od blizu 0,6 (što odgovara vrednosti frekvencije odgovora od 1/(1-0.68z<-1>) na 6400 Hz). U stvari, faktori 1/0.8 i 0.6 približno kompenzuju jedan drugog.
● Što se tiče govora, testovi karakterizacije 3GPP AMR-WB kodeka dokumentovani u 3GPP TR 26.976 izveštaju su pokazali da režim od 23.85 kbit/s ima niži kvalitet nego pri 23.05 kbit/s, njegov kvalitet je u stvari sličan onom režimu od 15.85 kbit/s. Ovo posebno pokazuje da se nivo veštačkog HF signala mora kontrolisati na veoma pažljiv način, jer se kvalitet degradira na 23.85 kbit/s, dok bi 4 bita po okviru trebalo da omoguće bolji pristup energiji originalne visoke frekvencije.
● Ograničenje kodiranog opsega na 7 kHz je rezultat primene strogog modela odziva u emisiji akustičnih terminala (filter P.341 u normi UIT-T G.191). Međutim, za frekvenciju uzorkovanja od 16 kHz, frekvencije u opsegu 7-8 kHz ostaju važne, posebno za muzičke signale, kako bi se osigurao dobar nivo kvaliteta.
[0017] Algoritam za dekodiranje AMR-WB je delimično poboljšan razvojem UIT-T G.718 skalabilnog kodeka koji je standardizovan 2008. godine.
[0018] Norma UIT-T G.718 uključuje takozvani interoperabilni režim, za koji je glavno kodiranje kompatibilno sa G.722.2 (AMR-WB) kodiranjem na 12.65 kbit/s; štaviše, G.718 dekoder je poseban po tome što može da dekodira binarni niz AMR-WB/G.722.2 pri svim mogućim brzinama AMR-WB kodeka (od 6.6 do 23.85 kbit/s).
[0019] Interoperabilni G.718 dekoder u režimu malog kašnjenja („low delay“ na engleskom) (G.718-LD) je prikazan na slici 2. Ispod su navedena poboljšanja urađena u funkcionalnosti dekodiranja binarnog niza AMR-WB u G.718 dekoderu, sa upućivanjem na sliku 1 kad je potrebno:
Proširenje opsega (opisano na primer u klauzuli 7.13.1 preporuke G.718, blok 206) je identično onom kod AMR-WB dekodera, osim što opsežnopropusni filter 6-7 kHz i filter sinteze 1/AHB(z) (blokovi 111 i 112) su dati obrnutim redosledom. Štaviše, pri 23.85 kbit/s, 4 bita koja se prenose podokvirima od strane AMR-WB kodera ne koriste se u interoperabilnom G.718 dekoderu; sinteza visokih frekvencija (HF) od 23.85 kbit/s je stoga identična na 23.05 kbit/s, čime se izbegava poznati problem kvaliteta AMR-WB dekodiranja na 23.85 kbit/s. Štaviše, niskopropusni filter na 7 kHz (blok 113) se ne koristi, a specifično dekodiranje režima na 23.85 kbit/s je izostavljeno (blokovi 107 do 109).
[0020] Naknadna obrada sinteze na 16 kHz (videti klauzulu 7.14 G.718) je uvedena u G.718 pomoću audio procesora eliminatora šuma („noise gate“) u bloku 208 (da bi se „poboljšao“ kvalitet tišine redukcijom nivoa) visokopropusno filtriranje (blok 209), niskofrekventni post-filter (koji se naziva „bass posfilier“) u bloku 210 koji prigušuje interharmonički šum na niskim frekvencijama i jedna potpuna konverzija 16-bita sa kontrolom zasićenja (sa kontrolom pojačanja ili AGC) u bloku 211.
[0021] Međutim, ekstenzija opsega u AMR-WB i/ili G.718 koderima (interoperabilni režim) je i dalje ograničena u nekoliko aspekata.
[0022] Konkretno, ostvarena sinteza visokih frekvencija putem belog šuma (pomoću vremenskog pristupa tipa LPC izvor-filter) je veoma ograničen model signala u opsegu frekvencija iznad 6.4 kHz.
[0023] Samo opseg od 6.4-7 kHz se ponovo sintetiše veštački, dok je u praksi širi opseg (do 8 kHz) teoretski moguć na frekvenciji uzorkovanja od 16 kHz, što potencijalno može poboljšati kvalitet signala, ako nisu prethodno obrađeni filterom tipa P.341 (50-7000 Hz) kako je definisano u biblioteci softverskih alata, Software Tool Library (standard G.191) UIT-T.
[0024] Članak „Nova poboljšanja kompleta alata za proširenje audio propusnog opsega (ABET) „New Enhancements to the Audio Bandwidth Extension Toolkit“ autora Anndana i drugih, opisuje niz poboljšanja alata za proširenje frekvencijskog opsega (ASR, FSSM i MBTAC).
[0025] Stoga postoji potreba da se poboljša proširenje opsega u kodeku tipa AMR-WB ili za jednu interoperabilnu verziju ovog kodeka ili uopštenije da se poboljša proširenje opsega audio signala, posebno da se poboljša frekvencijski sadržaj proširenja opsega.
[0026] Predmetni pronalazak poboljšava situaciju.
[0027] Pronalazak za ovu svrhu predlaže postupak za proširenje frekvencijskog opsega audio frekvencijskog signala tokom procesa dekodiranja ili poboljšanja koji obuhvata jednu etapu dobijanja jednog dekodiranog signala u prvom opsegu frekvencije koji se naziva niski opseg.
[0028] Postupak je takav da uključuje etape prema patentnom zahtevu 1.
[0029] Primetiće se da će se kasnije „proširenje opsega“ uzeti u širem smislu i da će uključivati ne samo slučaj ekstenzije jednog podopsega na visokim frekvencijama već i slučaj zamene podopsega postavljenog na nulu (tipa „ispunjavanje buke“ u kodiranju putem transformacije).
[0030] Dakle, i uzimanje u obzir tonskih komponenti i jednog ambijentalnog signala ekstrahovanog iz signala koji je rezultat dekodiranja niskog opsega omogućava da se izvrši proširenje opsega sa modelom signala koji je prilagođen pravoj prirodi signala za razliku od korišćenja veštačke buke. Kvalitet proširenja opsega je time poboljšan, a posebno za određene tipove signala kao što su muzički signali.
[0031] Zaista, dekodirani signal u niskom opsegu obuhvata deo koji odgovara zvučnom okruženju koji se može transponovati visokom frekvencijom tako da mešanje harmonijskih komponenti i postojećeg okruženja omogućava da se obezbedi koherentna rekonstruisana visoka frekvencija.
[0032] Treba primetiti da čak i ako je pronalazak motivisan poboljšanjem kvaliteta proširenja opsega u kontekstu interoperabilnog AMR-WB kodiranja, različita tehnička rešenja se primenjuju na opštiji slučaj rastezanja opsega audio signala, posebno u uređaju za poboljšanje koji izvodi analizu audio signala da bi izdvojio parametre neophodne za proširenje opsega.
[0033] Različita posebna tehnička rešenja pomenuta u nastavku mogu se dodati nezavisno ili u kombinaciji jedno sa drugom, etapama procedure ekstenzije definisane ranije u tekstu.
[0034] U jednom načinu tehničkog rešenja, ekstenzija opsega se izvodi u domenu ekscitacije i dekodirani signal niskog opsega je dekodirani signal ekscitacije dekodiranog niskog opsega.
[0035] Prednost ovog načina tehničkog rešenja je u tome što je moguća transformacija bez prozora (ili ekvivalentni način sa implicitnim pravougaonim prozorom dužine okvira) u domenu ekscitacije. U ovom slučaju se ne čuje nikakav artefakt (efekti bloka).
[0036] U prvom načinu tehničkog rešenja koje nije obuhvaćena tekstom zahteva, ekstrakcija tonskih komponenti i ambijentalnog signala se vrši prema sledećim etapama:
• detekcija dominantnih tonskih komponenti dekodiranog ili dekodovanog i proširenog signala niskog opsega, u frekvencijskom domenu;
• proračun jednog rezidualnog signala ekstrakcijom dominantnih tonskih komponenti za dobijanje ambijentalnog signala.
[0037] Ovaj način tehničkog rešenja omogućava preciznu detekciju tonskih komponenti.
[0038] U drugom načinu tehničkog rešenja, male složenosti, ekstrakcija tonskih komponenti i ambijentalnog signala se vrši prema sledećim etapama:
• dobijanje jednog ambijentalnog signala izračunavanjem prosečne vrednosti spektra dekodiranog ili dekodiranog i proširenog signala niskog opsega;
• dobijanje tonskih komponenti oduzimanjem jednog izračunatog ambijentalnog signala od dekodiranog ili dekodiranog i proširenog signala niskog opsega.
[0039] U jednom načina tehničkog rešenja etape kombinovanja, faktor kontrole nivoa energije koji se koristi za adaptivno mešanje se izračunava kao funkcija ukupne energije dekodovanog ili dekodovanog i proširenog signala niskog opsega i tonskih komponenti.
[0040] Primena ovog kontrolnog faktora omogućava da se etapa kombinovanja prilagodi karakteristikama signala u cilju optimizacije relativne proporcije ambijentalnog signala u mešavini. Nivo energije se tako kontroliše kako bi se izbegli zvučni artefakti.
[0041] U poželjnom načinu tehničkog rešenja, dekodirani signal niskog opsega prolazi kroz etapu dekompozicije u podopsege transformacijom ili pomoću grupe filtera, pri čemu se etape ekstrakcije i kombinovanja zatim izvode u frekvencijskom domenu ili u podopsezima.
[0042] Uvođenje ekstenzije opsega u frekventnom domenu omogućava da se dobije preciznost frekventne analize koja ne raspolaže vremenskim pristupom, a takođe omogućava da se dobije jedna frekvencijska rezolucija koja je dovoljna da detektuje tonske komponente.
[0043] U jednom detaljnom načinu tehničkog rešenja, dekodirani i prošireni signal niskog opsega dobija se prema sledećoj jednačini:
sa k indeksom uzorkovanja, U(k) spektar signala dobijen nakon etape transformacije UHB1(k) spektra proširenog signala, i start_band jedna unapred definisana promenljiva. Dakle, ova funkcija uključuje ponovno uzorkovanje signala dodavanjem uzoraka (odbiraka) u spektar ovog signala. Međutim, mogući su i drugi načini proširenja signala, na primer translacijom u jednoj obradi podopsega.
[0044] Predmetni pronalazak se, takođe, odnosi na jedan uređaj za ekstenziju frekvencijskog opsega audiofrekvencijskog signala, pri čemu je signal dekodiran u prvom frekvencijskom opsegu koji je nazvan niski opseg. Uređaj je takav da sadrži:
• jedan modul za ekstrahovanje tonskih komponenti i jednog ambijentalnog signala iz signala koji dolazi iz dekodiranog signala niskog opsega;
• jedan modul za kombinovanje tonskih komponenti i jednog ambijentalnog signala adaptivnim mešanjem korišćenjem faktora kontrole nivoa energije za dobijanje jednog audio signala, koji se naziva kombinovani signal;
• jedan modul ekstenzije na najmanje drugom frekvencijskom opsegu višem od prvog frekvencijskog opsega koji je postavljen na niskoopsežnom dekodiranom signalu pre modula ekstrakcije.
[0045] Ovaj uređaj ima iste prednosti kao i gore opisani postupak koji se u njemu izvodi.
[0046] Pronalazak se odnosi na dekoder koji sadrži uređaj takav kao što je opisano.
[0047] Pronalazak obuhvata kompjuterski program koji sadrži instrukcije koda za izvođenje etapa postupka proširenja opsega kao što je opisano, kad ove instrukcije izvršava jedan procesor.
[0048] Konačno, pronalazak se odnosi na podlogu za skladištenje, koju može da očita jedan procesor, integrisanu ili ne u uređaj za proširenje opsega, po potrebi uklonjivu, koja memoriše jedan kompjuterski program koji ostvaruje postpak ekstenzije kao što je prethodno opisano.
[0049] Ostale karakteristike i prednosti pronalaska će se jasnije pokazati čitanjem sledećeg opisa, datog samo kao neograničavajući primer, i napravljenog u vezi sa priloženim crtežima, na kojima:
● Slika 1 prikazuje jedan deo dekodera tipa AMR-WB koji ostvaruje etape ekstenzije frekvencijskog opsega u skladu sa stanjem tehnike i kao što je prethodno opisano;
● slika 2 prikazuje dekoder interoperabilnog tipa G.718-LD na 16 kHz u skladu sa stanjem tehnike i kao što je prethodno opisano;
● slika 3 prikazuje dekoder koji je interoperabilan sa AMR-WB kodiranjem i koji integriše jedan uređaj za proširenje opsega prema jednom načinu tehničkog rešenja pronalaska; ● slika 4 prikazuje u obliku organigrama, osnovne etape jedne procedure proširenja opsega prema jednom načinu tehničkog rešenja pronalaska;
● slika 5 prikazuje jedan način tehničkog rešenja u frekvencijskom domenu jednog uređaja za proširenje opsega prema pronalasku integrisanog u dekoder; i
● slika 6 prikazuje jedno materijalno tehničko rešenje jednog uređaja proširenja (ekstenzije) opsega prema pronalasku.
[0050] Slika 3 prikazuje jedan primer dekodera, kompatibilnog sa normom AMR-WB/G.722.2 u kojem postoji naknadna obrada slična onoj uvedenoj u G.718 i opisanoj u vezi sa slikom 2 i jedno poboljšano proširenje opsega u skladu sa procedurom proširenja pronalaska koja je realizovana pomoću uređaja za proširenje opsega ilustrovanog blokom 309.
[0051] Za razliku od AMR-WB dekodiranja koje radi sa izlaznom frekvencijom uzorkovanja od 16 kHz i od G.718 dekodiranja koje radi na 8 ili 16 kHz, ovde razmatramo dekoder koji može da radi sa jednim izlaznim signalom (sintezom) na frekvenciji fs = 8, 16, 32 ili 48 kHz. Treba imati na umu da se ovde pretpostavlja da je kodiranje obavljeno prema AMR-WB algoritmu sa internom frekvencijom od 12.8 kHz za CELP kodiranje u niskom opsegu i na 23.85 kbit/s jedno kodiranje pojačanja po podopsezima na frekvenciji od 16 kHz, ali su moguće i interoperabilne varijante AMR-WB kodera; čak i ako je pronalazak ovde opisan na nivou dekodiranja, ovde se pretpostavlja da kodiranje može da radi i sa jednim ulaznim signalom na frekvenciji fs = 8, 16, 32 ili 48 kHz i adekvatne operacije ponovnog uzorkovanja, koje prevazilaze okvire pronalaska, dodate su u kodiranje kao funkcija vrednosti fs.
Može se primetiti da kada je fs=8 kHz na dekoderu, u slučaju dekodiranja kompatibilnog sa AMR-WB, nije potrebno proširiti niski opseg 0-6.4 kHz, jer je rekonstruisani audio opseg na frekvenciji fs ograničen na 0-4000 Hz.
[0052] Na slici 3, CELP dekodiranje (BF za niske frekvencije) uvek radi na internoj frekvenciji od 12.8 kHz, kao u AMR-WB i G.718, a proširenje opsega (HF za visoke frekvencije) čineći predmet pronalaska funkcionnalnim je na frekvenciji od 16 kHz, BF i HF sinteze se kombinuju (blok 312) na frekvenciji fs nakon adekvatnog ponovnog uzorkovanja (blokovi 307 i 311). U varijantama pronalaska, kombinacija niskog i visokog opsega se može izvršiti na 16 kHz, nakon ponovnog uzorkovanja niskog opsega od 12.8 do 16 kHz, pre ponovnog uzorkovanja kombinovanog signala na frekvenciji fs.
[0053] Dekodiranje prema slici 3 zavisi od AMR-WB režima (ili brzine) povezanog sa trenutnim primljenim okvirom. Kao indikacija i bez uticaja na blok 309, dekodiranje dela CELP u niskom opsegu obuhvata sledeće etape:
● Razdvajanje kodiranih parametara posle multipleksiranja (blok 300) u slučaju ispravno primljenog okvira (bfi=0 gde je bfi „indikator lošeg okvira“ jednak 0 za primljeni okvir i 1 za izgubljeni okvir).
● Dekodiranje ISF parametara sa interpolacijom i konverzijom u LPC koeficijente (blok 301) kako je opisano u tački 6.1 norme G.722.2.
● Dekodiranje CELP ekscitacije (blok 302), sa adaptivnim i fiksnim delom za rekonstrukciju ekscitacije (ekc ili u '(n)) u svakom podokviru dužine 64 na 12.8 kHz:
prateći oznake klauzule 7.1.2.1 od G.718 koje se odnose na CELP dekodiranje, gde su v(n) i c(n) redom kodne reči adaptivnog i fiksnog rečnika, a ĝpi ĝcsu povezana dekodirana proširenja. Ovo proširenje u'(n) se koristi u adaptivnom rečniku sledećeg podokvira; zatim se naknadno obrađuje i razlikujemo, kao u G.718, ekscitaciju u'(n) (takođe označenu ekc) od njene modifikovane naknadno obrađene verzije u(n) (takođe označene ekc2) koja služi kao ulaz za filter sinteze, (1/ (z), u bloku 303. U varijantama koje se mogu ostvariti za pronalazak, naknadna obrada primenjena na ekscitaciju se može modifikovati (na primer, može se poboljšati fazna disperzija) ili ovi naknadni procesi mogu da se prošire (na primer, može se primeniti smanjenje inter-harmoničkog šuma), bez uticaja na prirodu procedure proširenja opsega prema pronalasku.
● Filtriranje sinteze putem 1/ (z) (bloc 303) gde je dekodirani LPC filter A(z) reda 16. ● Uska naknadna obrada (blok 304) prema klauzuli 7.3 od G.718 ako je fs=8 kHz.
● Skidanje nižih opsega (blok 305) filterom 1/ (1 - 0,68z-1)
● Niskofrekventna naknadna obrada (blok 306) kao što je opisano u klauzuli 7.14.1.1 G.718. Ova obrada uvodi kašnjenje koje se uzima u obzir pri dekodiranju visokog opsega (>6.4 kHz).
● Interne frekvencije ponovnog uzorkovanja od 12.8 kHz na izlaznoj frekvenciji fs (blok 307). Moguće je nekoliko realizacija. Bez gubitka opštosti, ovde kao primer razmatramo da ako je fs=8 ili 16 kHz, ponavlja se ponovno uzorkovanje opisano u klauzuli 7.6 G.718, a ako je fs=32 ili 48 kHz, koriste se filteri sa konačnim impulsivnim odzivom (FIR). ● Proračun parametara eliminatora šuma „noise gate“ (blok 308) koji se vrši prvenstveno kao što je opisano u tački 7.14.3 G.718.
[0054] U varijantama koje se mogu primeniti za pronalazak, naknadna obrada primenjena na ekscitaciju može biti modifikovana (na primer, disperzija faze može biti poboljšana) ili se ove naknadne obrade mogu proširiti (na primer, može se primeniti redukcija interharmonske buke), bez uticaja na prirodu opsega. Ovde nije opisan slučaj dekodiranja niskog opsega kada se trenutni okvir izgubi (bfi=1) koje je informativno u 3GPP AMR-WB normi; generalno, bilo da se radi o AMR-WB dekoderu ili opštem dekoderu zasnovanom na modelu izvor-filter, obično se radi o najboljoj proceni LPC ekscitacije i koeficijenata sinteze LPC filtera kako bi se rekonstituisao izgubljeni signal čuvajući model izvor-filter. Kada je bfi=1 ovde se smatra da ekstenzija opsega (blok 309) može da radi kao u slučaju bfi=0 i brzina <23.85 kbit/s; prema tome, opis pronalaska će u daljem tekstu i bez gubitka opštosti pretpostaviti da je bfi=0.
[0055] Može se primetiti da je upotreba blokova 306, 308, 314 fakultativna.
[0056] Takođe će se primetiti da dekodiranje niskog opsega opisano ranije u tekstu pretpostavlja trenutni takozvani „aktivni“ okvir sa bitskom brzinom između 6.6 i 23.85 kbit/s. U stvari, kada je DTX režim (neprekidni prenos na francuskom) aktiviran, neki okviri mogu biti kodirani kao „neaktivni“ i u ovom slučaju možete ili preneti jedan deskriptor tišine (na 35 bita) ili ništa ne prenositi. Posebno podsećamo da SID okvir kodera AMR-WB opisuje nekoliko parametara: ISF parametri prosečni za 8 okvira, prosečna energija za 8 okvira, „diter zastavica“ za rekonstrukciju nestacionarnog šuma. U svim slučajevima u dekoderu nalazimo isti model dekodiranja kao i za aktivni okvir, sa rekonstrukcijom ekscitacije i jednog LPC filtera za tekući okvir, što omogućava primenu pronalaska čak i na neaktivnim okvirima. Isto zapažanje važi za dekodiranje „izgubljenih okvira“ (ili FEC, PLC) u kojima se primenjuje LPC model.
[0057] Ovaj primer dekodera radi u domenu ekscitacije i stoga uključuje jednu etapu za dekodiranje signala ekscitacije niskog opsega. Uređaj za ekstenziju opsega i postupka ekscitacije opsega u okviru pronalaska, takođe, funkcionišu u domenu različitom od domena ekscitacije i posebno sa dekodiranim direktnim signalom u niskom opsegu ili sa signalom koji je ponderisan perceptivnim filterom.
[0058] Za razliku od AMR-WB ili G.718 dekodiranja, opisani dekoder omogućava proširenje dekodiranog niskog opsega (50-6400 Hz uzimajući u obzir visokopropusno filtriranje na 50 Hz na dekoderu, 0-6400 Hz u opštem slučaju) do proširenog opsega čija širina varira, u rasponu približno od 50-6900 Hz do 50-7700 Hz u zavisnosti od režima u trenutnom okviru.
Dakle, možemo govoriti o jednom prvom frekvencijskom opsegu od 0 do 6400 Hz i o jednom drugom frekvencijskom opsegu od 6400 do 8000 Hz. U stvarnosti, u poželjnom načinu tehničkog rešenja, pobuda za visoke frekvencije je generisana u frekvencijskom domenu u opsegu od 5000 do 8000 Hz, da bi se omogućilo filtriranje propusnog opsega širine 6000 do 6900 ili 7700 Hz čiji nagib nije previše strm u gornji odbačeni opseg.
[0059] Deo sinteze visokog opsega se izvodi u bloku 309 koji predstavlja uređaj za ekstenziju opsega prema pronalasku i koji je detaljno prikazan na slici 5 u jednom načinu tehničkog rešenja.
[0060] Da bi se uskladili dekodirani niski i visoki opsegevi, uvodi se kašnjenje (blok 310) da bi se sinhronizovali izlazi blokova 306 i 309 a sintetizovani visoki opseg od 16 kHz se ponovo uzorkuje sa 16 kHz na frekvenciji fs (izlazni blok 311). Vrednost kašnjenja T će morati da se prilagodi za ostale slučajeve (fs=32.48 kHz) u skladu sa primenjenom obradom. Zapamtite da kada je fs=8 kHz, nije potrebno primeniti blokove 309 do 311 jer je opseg signala na izlazu dekodera ograničen na 0-4000 Hz.
[0061] Treba napomenuti da postupak ekstenzije pronalaska uveden u blok 309 prema prvom načinu tehničkog rešenja prvenstveno ne uvodi nikakvo dodatno kašnjenje u odnosu na rekonstruisani niski opseg na 12.8 kHz; međutim, u varijantama pronalaska (na primer, korišćenjem vremenske/frekventne transformacije sa preklapanjem), može se uvesti kašnjenje. Dakle, generalno će vrednost T u bloku 310 morati da se prilagodi u zavisnosti od specifičnog uvođenja. Na primer, u slučaju kada se naknadna obrada niskih frekvencija (blok 306) ne koristi, kašnjenje koje treba uvesti za fs=16 kHz može se fiksirati na T=15.
[0062] Niski i visoki opsezi se zatim kombinuju (dodaju) u blok 312 i dobijena sinteza se naknadno obrađuje visokopropusnim filtriranjem na 50 Hz (IIR tip) reda 2, čiji koeficijenti zavise od frekvencije fs (blok 313) i naknadne obrade izlaza sa eventualnom primenom eliminatora šuma („noise gate“) na sličan način kao G.718 (blok 314).
[0063] Uređaj za proširenje opsega prema pronalasku, prikazan blokom 309 u skladu sa načinom tehničkog rešenja dekodera sa slike 5, uvodi jedan postupak ekstenzije opsega (u širem smislu) koji je sada opisan u vezi sa slikom 4.
[0064] Ovaj uređaj za ekstenziju, takođe, može da bude nezavisan od dekodera i može da primeni postupak opisan na slici 4 da izvrši ekstenziju opsega postojećeg audio signala koji se čuva ili prenosi na uređaj, uz analizu audio signala na primer, jedna ekscitacija i jedan LPC filter.
[0065] Ovaj uređaj prima na ulazu jedan dekodirani signal u prvom frekventnom opsegu koji se zove niski opseg u(n) koji može biti u polju ekscitacije ili u polju signala. U ovde opisanom načinu tehničkog rešenja, etapa dekompozicije na podopsege (E401b) vremensko-frekvencijskom transformacijom ili nizom filtera se primenjuje na dekodirani signal niskog opsega da bi se dobio spektar dekodiranog signala niskog opsega U(k) za uvođenje u frekvencijski domen.
[0066] Etapa E401a ekstenzije dekodiranog signala niskog opsega u drugom frekvencijskom opsegu koji je viši od prvog frekvencijskom opsega, da bi se dobio prošireni niskoopsežni dekodirani signal UHB1(k), može se izvesti na ovom niskoopsežnom dekodovanom signalu pre ili posle etape analize (dekompozicija na podopsege). Ova etapa ekstenzije može da sadrži i etapu ponovnog uzorkovanja i etapu ekstenzije ili jednostavno etapu translacije ili frekvencijske transpozicije kao funkciju signala dobijenog na ulazu. Treba napomenuti da bi se u varijantama, etapa E401a mogla izvesti na kraju obrade opisane na slici 4, odnosno na kombinovanom signalu, pri čemu se ova obrada tada uglavnom izvodi na signalu niskog opsega pre ekstenzije, rezultat je ekvivalentan.
[0067] Ova etapa je detaljno opisana kasnije u načinu tehničkog rešenja opisanom uz upućovanje na sliku 5.
[0068] Etapa E402 ekstrakcije jednog ambijentalnog signala (UHBA(k)) i tonskih komponenti (y(k)) se izvodi iz dekodiranog signala niskog opsega (U(k)) ili dekodiranog i proširenog (UHB1(k)). Ambijent je ovde definisan kao rezidualni signal koji se dobija uklanjanjem glavnih (ili dominantnih) harmonika (ili tonskih komponenti) iz postojećeg signala.
[0069] U većini signala proširenog opsega (uzorkovanih na 16 kHz), visoki opseg (>6 kHz) sadrži informacije o ambijentu koji je generalno sličan onom koji je prisutan u niskom opsegu.
[0070] Etapa ekstrakcije tonskih komponenti i ambijentalnog signala obuhvata, na primer, sledeće etape:
• detekciju dominantnih tonskih komponenti dekodiranog (ili dekodovanog i proširenog) signala niskog opsega, u frekvencijskom domenu; i
• proračun rezidualnog signala ekstrakcijom dominantnih tonskih komponenti za dobijanje ambijentalnog signala.
[0071] Ova etapa se, takođe, može dobiti:
• dobijanjem ambijentalnog signala izračunavanjem proseka dekodiranog (ili dekodiranog i proširenog) signala niskog opsega; i
• dobijanjem tonskih komponenti oduzimanjem izračunatog ambijentalnog signala od dekodiranog (ili dekodiranog i proširenog) signala niskog opsega.
[0072] Tonske komponente i ambijentalni signal se zatim kombinuju adaptivno koristeći faktore kontrole nivoa energije u etapi E403 da bi se dobio takozvani kombinovani signal (UHB2(k)). Etapa ekstenzije E401a se tada može uvesti ako već nije izvedena na dekodiranom signalu niskog opsega.
[0073] Dakle, kombinacija ova dva tipa signala omogućava dobijanje kombinovanog signala sa karakteristikama koje više odgovaraju određenim tipovima signala kao što su muzički signali i bogatijeg frekvencijskog sadržaja i u proširenom frekvencijskom opsegu koji odgovara bilo kom frekvencijskom opsegu uključujući i prvi i drugi frekvencijski opseg.
[0074] Ekstenzija opsega prema postupku poboljšava kvalitet za ovu vrstu signala u poređenju sa proširenjem opisanim u AMR-WB standardu.
[0075] Činjenica da se koristi kombinacija ambijentalnog signala i tonskih komponenti omogućava da se ovaj signal ekstenzije obogati da bi se približio karakteristikama stvarnog signala, a ne veštačkog signala.
[0076] Ova etapa kombinovanja će biti detaljno objašnjena kasnije uz upućivanje na sliku 5.
[0077] Jedna etapa sinteze, koja odgovara analizi u 401b, izvodi se u E404b da bi se signal vratio u vremenski domen.
[0078] Opcionalno, jedna etapa podešavanja nivoa energije signala visokog opsega može se izvesti u E404a, pre i/ili posle etape sinteze, primenom pojačanja i/ili odgovarajućim filtriranjem. Ova etapa će biti detaljnije objašnjena u načinu realizacije koji je opisan na slici 5 za blokove 501 do 507.
[0079] U jednom primeru tehničkog rešenja, uređaj za ekstenziju opsega 500 je sada opisan sa referencom na slici 5 prikazujući kako ovaj uređaj tako i module za obradu pogodne za uvođenje u dekoder interoperabilnog tipa sa AMR-WB kodiranjem. Ovaj uređaj 500 uvodi jednu proceduru ekstenzije opsega koji je prethodno opisan uz upućivanje na sliku 4.
[0080] Dakle, blok za obradu 510 prima dekodirani signal niskog opsega (u(n)). U jednom posebnom načinu izvođenja, ekstenzija opsega koristi dekodovanu pobudu na 12.8 kHz (exc2 ili u(n)) na izlazu bloka 302 na slici 3.
[0081] Ovaj signal se deli na frekvencijske podopsege pomoću modula za dekompoziciju na podopsege 510 (koji uvodi etape E401b sa slikom 4) koji generalno vrši transformaciju ili primenjuje grupu filtera, da bi dobio dekompoziciju na podopsegeve U(k ) signala u(n).
[0082] U posebnom tehničkom rešenju, transformacija tipa DCT-IV (za Diskretnu kosinusnu transformaciju - Tip IV, „Discrete Cosine Transform“ na engleskom) (blok 510) se primenjuje na trenutni okvir od 20 ms (256 uzoraka), bez prozora, što predstavlja direktnu transformaciju u(n) sa n = 0,<...>,255 prema sledećoj formuli:
gde je N = 256 i k = 0,···,255.
[0083] Transformacija bez prozora (ili na ekvivalentni način sa uvedenim pravougaonim prozorom dužine okvira) je moguća kada se obrada vrši u domenu ekscitacije, a ne u domenu signala. U ovom slučaju, nijedan artefakt (efekti bloka) se ne čuje, što predstavlja važnu prednost ovog tehničkog rešenja pronalaska.
[0084] U ovom načinu tehničkog rešenja, DCT-IV transformacija se uvodi pomoću FFT-a prema takozvanom „Evolved DCT (EDCT)“ algoritmu opisanom u članku D.M. Zhang, H.T. Li, A Low Complexity Transform - Evolved DCT, IEEE, 14. Međunarodna konferencija o računarskim naukama i inženjerstvu (CSE), avg.2011, str.144-149, i uveden u ITU-T G.718 Aneks B i G.729.1 Aneks E.
[0085] U varijantama pronalaska i bez gubitka opštosti, DCT-IV transformacija može biti zamenjena drugim kratkoročnim vremensko-frekventnim transformacijama iste dužine i u polju ekscitacije ili u polju signala, kao što je FFT (za Brzu Furijeovu transformaciju, „Fast Fourier Transform“ na engleskom) ili DCT-II (Discrete Cosine Transform - Type II , Diskretna kosinusna transformacija - tip II). Alternativno, DCT-IV na okviru se može zameniti transformacijom sa dodavanjem preklapanja i prozorima dužine veće od dužine trenutnog okvira, na primer korišćenjem MDCT (za Modifikovana diskretna kosinusna transformacija, „Modified Discrète Cosine Tranform“ na engleskom). U ovom slučaju, kašnjenje T u bloku 310 sa slike 3, moraće da se podesi (smanji) na adekvatan način prema dodatnom kašnjenju usled analize/sinteze ovom transformacijom.
[0086] U drugom načinu tehničkog rešenja, dekompozicija na podslojeve se izvodi primenom grupe filtera, na primer tipa realnog ili kompleksnog PQMF (Pseudo-QMF). Za određene grupe filtera, dobija se, za svaki podopseg u datom okviru, ne samo jedna spektralna vrednost, već niz vremenskih vrednosti povezanih sa podopsegom; u ovom slučaju, poželjna realizacija pronalaska se može primeniti tako što se, na primer, transformiše svaki podopseg i izračunava ambijentalni signal u domenu apsolutnih vrednosti, pri čemu se tonske komponente uvek dobijaju razlikom između signala (u apsolutnoj vrednosti) i ambijentalnog signala. U slučaju kompleksne grupe filtera, kompleksni modul uzoraka će zameniti apsolutnu vrednost.
[0087] U drugim načinima tehničkog rešenja, pronalazak će biti primenjen u sistemu koji koristi dva podopsega, pri čemu se nisko područje analizira transformacijom ili nizom filtera.
[0088] U slučaju DCT-a, DCT spektra, U(k), od 256 uzoraka koji pokrivaju opseg 0-6400 Hz (na 12,8 kHz), se zatim proširuje (blok 511) u spektar od 320 uzoraka koji pokrivaju opseg 0-8000 Hz (na 16 kHz) u sledećem obliku:
gde preferencijalno uzimamo start_band = 160.
[0089] Blok 511 uvodi etapu E401a sa slike 4, to jest ekstenziju dekodiranog signala niskog opsega. Ova etapa, takođe, može da uključi ponovno uzorkovanje od 12.8 do 16 kHz u frekvencijskom domenu, dodavanjem 1⁄4 odbiraka (k = 240,•••,319) spektru, pri čemu odnos između 16 i 12.8 je 5/4.
[0090] U frekvencijskom opsegu koji odgovara odbircima u rasponu od indeksa 200 do 239, originalni spektar je sačuvan, kako bi se mogao primeniti progresivni odgovor slabljenja visokopropusnog filtera u ovom frekventnom opsegu, a takođe i kako se ne bi uveli zvučni defekti tokom etape dodavanja sinteze niske frekvencije visokofrekvencijskoj sintezi.
[0091] Treba napomenuti da se u ovo tehničkom rešenju generisanje prekomerno uzorkovanog proširenog spektra vrši u frekvencijskom opsegu u rasponu od 5 do 8 kHz, uključujući i drugi frekvencijski opseg (6.4-8 kHz) viši od prvog frekvencijskog opsega.0-6.4 kHz).
[0092] Dakle, ekstenzija jednog dekodiranog signala niskog opsega odvija se bar na drugom frekvencijskom opsegu, ali takođe i na delu prvog frekvencijskog opsega.
[0093] Očigledno, vrednosti koje definišu ove frekvencijske opsege mogu biti različite u zavisnosti od dekodera ili uređaja za obradu na koji se pronalazak primenjuje.
[0094] Pored toga, blok 511 izvodi implicitno visokopropusno filtriranje u opsegu 0-5000 Hz pošto je prvih 200 uzoraka UHB1(k) postavljeno na nulu; kao što je kasnije objašnjeno, ovo visokopropusno filtriranje takođe može biti dopunjeno progresivnim slabljenjem dela spektralnih vrednosti indeksa k =200,<...>,255 u opsegu 5000-6400 Hz, ovo progresivno slabljenje se primenjuje u bloku 501 ali bi se moglo izvesti odvojeno izvan bloka 501. Na ekvivalentni način i u varijantama pronalaska, uvodjenje visokopropusnog filtriranja razdvojeno na blokove koeficijenata indeksa k=0,<...>,199 postavljenih na nulu, sa oslabljenim koeficijentima k=200,<...>, 255, u transformisanom domenu, stoga će moći da se izvedu u jednoj jedinoj etapi.
[0095] U ovoj primernoj varijanti i prema definiciji UHB1(k), primećuje se da je opseg od 5000-6000 Hz UHB1(k) (koji odgovara indeksima k = 200,<...>,239) kopiran na osnovu opsega od 5000-6000 Hz za U(k). Ovaj pristup čuva originalni spektar u ovom opsegu i izbegava uvođenje distorzije u opsegu 5000-6000 Hz kada se dodaje HF sinteza sa BF sintezom – posebno faza signala (implicitno predstavljena u DCT-IV domenu) u ovom opsegu je očuvana.
[0096] Opseg od 6000-8000 Hz za UHB1(k) je ovde definisan kopiranjem opsega od 4000-6000 Hz za U(k) pošto je vrednost start_band poželjno fiksirana na 160.
[0097] U jednoj varijanti tehničkog rešenja, vrednost start_band može da se prilagodi oko vrednosti od 160, bez modifikacije prirode pronalaska. Detalji prilagođavanja vrednosti start_band ovde nisu opisani jer prevazilaze obim pronalaska bez promene njegovog obima.
[0098] U većini signala proširenog opsega (uzorkovanih na 16 kHz), visoki opseg (>6 kHz) sadrži informacije o ambijentu koje su prirodno slične onima koje su prisutne u niskom opsegu. Ambijent je ovde definisan kao rezidualni signal koji se dobija potiskivanjem glavnih (ili dominantnih) harmonika u postojećem signalu. Nivo harmonije u opsegu 6000-8000 Hz je generalno u korelaciji sa onim u opsegu nižih frekvencija.
[0099] Ovaj dekodirani i prošireni signal niskog opsega obezbeđuje se na ulazu uređaja za proširenje 500, a posebno na ulazu modula 512. Tako blok 512 za izdvajanje tonskih komponenti i ambijentalnog signala, uvodi etapu E402 sa slike 4 u frekvencijski domen. Ambijentalni signal, UHBA(k) za k =240,<...>,319 (80 odbiraka) se tako dobija za drugi takozvani frekventni opseg visoke frekvencije da bi se zatim adaptivno kombinovao sa ekstrahovanim tonalnim komponentama y(k), u bloku za kombinovanje 513.
[0100] U jednom posebnom načinu tehničkog rešenja, ekstrakcija tonskih komponenti i ambijentalnog signala (u opsegu 6000-8000 Hz) se vrši prema sledećim operacijama:
● Proračun ukupne energije proširenog dekodiranog signala niskog opsega enerHB:
gde je ε=0.1 (ova vrednost može biti različita, ovde je postavljena kao primer).
• Proračun ambijenta (u apsolutnoj vrednosti) koji ovde odgovara prosečnom nivou lev(i) spektra (linija po linija) i izračunavanje energije dominantnih tonskih delova (u spektru visokih frekvencija)
[0101] Za i = 0... L - 1, ovaj prosečan nivo se dobija sledećom jednačinom:
[0102] Ovo odgovara prosečnom nivou (u apsolutnoj vrednosti) i stoga predstavlja neku vrstu omotača spektra. U ovom načinu realizacije, L=80 i predstavlja dužinu spektra, a indeks i od 0 do L-1 odgovara indeksima j+240 od 240 do 319, odnosno spektru od 6 do 8 kHz.
[0103] Uopšteno, fb(i) = i -7 i fn(i) = i 7, međutim prvih i poslednjih 7 indeksa
- 7,<...>, L-1) zahtevaju poseban tretman i bez gubitka opštosti onda definišemo:
[0104] U varijantama pronalaska, prosek |UHS1(j+240)|, j = jb(i),..., fn(i), može se zameniti srednjom vrednošću na istom skupu vrednosti, tj. (i) = medianj=fb(i),...,fn(i)(|UHB1(j 240)| Ova varijanta ima nedostatak što je složenija (u smislu broja proračuna) od pokretnog proseka U drugim varijantama, neuniformno ponderisanje se može primeniti na prosečne termine, ili srednje filtriranje može biti zamenjeno, na primer, drugim nelinearnim filterima tipa „stek filteri“ , (stack filters).
[0105] Preostali signal se takođe izračunava:
što odgovara (približno) tonskim komponentama ako je vrednost y(i) na datoj liniji i pozitivna (y(i) >0).
[0106] Ovaj proračun stoga uključuje implicitnu detekciju tonskih komponenti. Tonski delovi se stoga implicitno detektuju korišćenjem srednjeg pojma y(i) koji predstavlja adaptivni prag. Uslov detekcije je y(i)>0. U varijantama pronalaska, ovaj uslov se može promeniti, na primer, definisanjem adaptivnog praga kao funkcije lokalnog omotača signala ili u obliku y(i) > lev(i)+ xdB gde x ima unapred definisanu vrednost (na primer x =10dB).
[0107] Energija dominantnih tonskih delova je definisana sledećom jednačinom:
[0108] Naravno, mogu se predvideti i druge metode ekstrakcije ambijentalnog signala. Na primer, ovaj ambijentalni signal se može izdvojiti iz signala niske frekvencije ili eventualno drugog frekvencijskog opsega (ili nekoliko frekvencijskih opsega).
[0109] Detekcija vrhova ili tonskih komponenti moći će se uraditi drugačije.
[0110] Ekstrakcija ovog ambijentalnog signala će takođe moći da se izvrši na dekodiranoj, ali ne i proširenoj ekstrakciji, tj. pre etape spektralne ekstenzije ili translacije, tj. na primer na delu signala niske frekvencije, a ne direktno na visokofrekvencijskom signalu.
[0111] U jednoj varijanti tehničkog rešenja, ekstrakcija tonskih komponenti i ambijentalnog signala se vrši drugačijim redosledom i prema sledećim etapama:
• detekcija dominantnih tonskih komponenti dekodiranog (ili dekodiranog i proširenog) signala niskog obima, u frekvencijskom domenu;
• proračun rezidualnog signala ekstrakcijom dominantnih tonskih komponenti za dobijanje ambijentalnog signala.
[0112] Ova varijanta se, na primer, može primeniti na sledeći način: jedan vrh (ili tonska komponenta) je detektovan na liniji indeksa i u amplitudskom spektru |UHB1(i+240)| ako je verifikovan sledeći kriterijum:
za i = 0,...,L - 1. Čim se detektuje pik na liniji indeksa i, primenjuje se sinusoidalni model da bi se procenili parametri amplituda, frekvencija i eventualno fazni parametri tonske komponente povezane sa ovim vrhom. Detalji ove procene nisu ovde predstavljeni, ali procena frekvencije obično može da zahteva paraboličku interpolaciju na 3 tačke kako bi se locirao maksimum parabole koji aproksimira 3 tačke amplitude |UHB1(i+240)| (vraća se u dB), pri čemu se procena amplitude dobija pomoću ove iste interpolacije. Ovde korišćeni domen po transformaciji (DCT-IV) ne omogućava direktno dobijanje faze, moguće je u jednom načinu realizacije zanemariti ovaj termin, ali u varijantama je moguće primeniti kvadraturnu transformaciju tipa DST da bi se procenio fazni član.
Početna vrednost y(i) je postavljena na nulu za i = 0,...,L-1. Sinusoidni parametri (frekvencija, amplituda i eventualno faza) svake tonske komponente koja se procenjuje, termin y(i) se zatim izračunavaju kao zbir unapred definisanih prototipova (spektara) čistih sinusoida transformisanih u DCT-IV domenu (ili drugom ako se koristi druga dekompozicija na podopsegeve) prema procenjenim sinusoidnim parametrima. Konačno, apsolutna vrednost se primenjuje na pojmove y(i) da bi se svela na domen amplitudnog spektra u apsolutnim vrednostima.
[0113] Mogući su i drugi postupci za određivanje tonskih komponenti, na primer, takođe bi bilo moguće izračunati omotač signala env(i) splajn interpolacijom lokalnih maksimalnih vrednosti (detektovanih vrhova) |UHB1(i+240) )|, da se ovaj omotač smanji za određeni nivo u dB da bi se otkrile komponente tona kao što su vrhovi koji prelaze ovaj omotač i da bi se definisali y(i) kao
[0114] U ovoj varijanti atmosfera se stoga dobija jednačinom:
[0115] U drugim varijantama pronalaska apsolutna vrednost spektralnih vrednosti će biti zamenjena, na primer kvadratom spektralnih vrednosti, bez promene principa pronalaska; u ovom slučaju kvadratni koren će biti neophodan za povratak u domen signala, što je složenije za postizanje.
[0116] Modul za kombinovanje 513 izvodi jednu etapu kombinovanja adaptivnim mešanjem ambijentalnog signala i tonskih komponenti. Da bi se to uradilo, faktor kontrole nivoa ambijenta Г je definisan sledećom jednačinom:
β faktor za koji je u nastavku dat primer izračunavanja.
[0117] Da bismo dobili prošireni signal, prvo dobijamo kombinovani signal u apsolutnim vrednostima za i = 0...L-1:
na koje primenjujemo znake UHB1(k) :
[0118] Po definiciji, faktor Γ je > 1. Tonske komponente, detektovane liniju po liniju uslovom y(i) > 0, redukovane su faktorom Γ ; prosečan nivo je pojačan 1 / Γ .
[0119] U bloku adaptivnog mešanja 513, faktor kontrole nivoa energije se izračunava na osnovu ukupne energije dekodiranog (ili dekodiranog i proširenog) signala niskog opsega i tonskih komponenti.
[0120] U poželjnom tehničkom rešenju adaptivnog mešanja, podešavanje energije se vrši na sledeći način:
UHB2(k) je kombinovani signal za proširenje opsega.
[0121] Faktor prilagođavanja je definisan sledećom jednačinom:
[0122] Gde y omogućava da se izbegne precenjivanje energije. U jednom primeru izvođenja, β se izračunava tako da zadrži isti nivo ambijentalnog signala u odnosu na energiju tonskih komponenti u uzastopnim opsegevima signala. Energiju tonskih komponenti računamo u tri opsega: 2000-4000 Hz, 4000-6000 Hz i 6000-8000 Hz, sa
gde
[0123] I gde je N(k1,k2) skup indeksa k za koje je koeficijent indeksa k klasifikovan kao povezan sa tonalnim komponentama. Ovaj skup se, na primer, može dobiti detekcijom lokalnih vrhova u U'(k) proveravajući |U(k)| > lev(k) ili lev(k) ili lev(k) se izračunava kao srednji nivo spektra liniju po liniju.
[0124] Može se primetiti da su mogući i drugi postupci izračunavanja energije tonskih komponenti, na primer, uzimanjem srednje vrednosti spektra na razmatranom opsegu.
[0125] Fiksiramo β tako da je odnos između energije tonskih komponenti u opsezima od 4-6 kHz i 6-8 kHz isti kao između opsega 2-4 kHz i 4-6 kHz:
a max(.,.) je funkcija koja daje maksimum od dva argumenta.
[0126] U varijantama pronalaska, izračunavanje β može biti zamenjeno drugim postupcima. Na primer, u jednoj varijanti, možemo izdvojiti (izračunati) različite parametre (ili „features“ na engleskom) koji karakterišu signal niskog opsega, uključujući parametar „nagib“ sličan onom koji se izračunava u kodeku AMR-WB, i mi ćemo proceniti faktor β kao funkciju linearne regresije iz ovih različitih parametara ograničavanjem njegove vrednosti između 0 i 1. Linearna regresija se, na primer, može proceniti na nadgledan način procenom faktora β dajući sebi originalni visoki opseg na jednoj osnovi učenja. Primetiće se da način izračunavanja β ne ograničava prirodu pronalaska.
[0127] Zatim, parametar β
možemo izračunati γ kao opadajuću funkciju od α, na primer
b = 1.1, a = 1.2 i γ ograničen od 0.3 do 1. Ovde su ponovo moguće druge definicije α i γ u okviru pronalaska.
[0128] Na izlazu uređaja za ekstenziju opsega 500, blok 501, u jednom posebnom opcionom načinu tehničkog rešenja, izvodi se dvostruka operacija primene frekvencijskog odgovora propusnog filtera i filtriranja (ili skidanja nižih opsega) u frekvencijskom domenu.
[0129] U jednoj varijanti pronalaska, filtriranje skidanja nižih opsega se može izvesti u vremenskom domenu, posle bloka 502 ili čak pre bloka 510; međutim, u ovom slučaju, filtriranje propusnog opsega izvedenog u bloku 501 može ostaviti neke komponente niske frekvencije veoma niskih nivoa koji su pojačani skidanjem nižih opsega, što može blago primetno promeniti dekodirani niski opseg. Iz tog razloga, ovde je poželjnije da se izvrši skidanje niskog opsega u frekvencijskom domenu. U poželjnoj varijanti, koeficijenti indeksa k=0,<...>,199 su postavljeni na nulu, tako da je skidanje nižih opsega ograničen na veće koeficijente.
[0130] Ekscitaciji su prvo skinuti niži opsezi prema sledećoj jednačini:
gde Gdeemph(k) odziv u frekvenci filtera 1/(1-0.68z<-1>) je frekvencijski odgovor filtera 1/(1-0.68z-1) preko ograničenog diskretnog frekvencijskog opsega. Uzimajući u obzir diskretne (neparne) frekvencije DCT-IV, ovde definišemo Gdeemph(k) kao:
[0131] U slučaju kada se koristi transformacija koja nije DCT-IV, definicija θkmoći će da se podesi (na primer za parne frekvencije).
[0132] Imajte na umu da se skidanje niskih opsega primenjuje u dve faze za k = 200,<...>,255 što odgovara frekvencijskom opsegu 5000-6400 Hz, gde se odziv 1/(1-0.68z-1) primenjuje na 12.8 kHz , i za k = 256,<...>,319 što odgovara frekvencijskom opsegu 6400-8000 Hz, gde je odziv proširen od 16 kHz ovde do konstantne vrednosti u opsegu 6.4-8 kHz.
[0133] Može se primetiti da u AMR-WB kodeku HF sinteza nije sa skidanjem nižih opsega. U ovde predstavljenom načinu rešenja, visokofrekventni signal je naprotiv sa skinutim nižim opsegom da bi se vratio u koherentni domen sa niskofrekvencijskim signalom (0-6.4 kHz) koji izlazi iz bloka 305 na slici 3. Ovo je važno za procenu i kasnije prilagođavanje energije HF sinteze.
[0134] U jednom načinu realizacije, da bi se smanjila složenost, moguće je fiksirati Gdeemph(k) na konstantnu vrednost nezavisnu od k, uzimajući na primer Gdeemph(k) = 0.6 što približno odgovara prosečnoj vrednosti Gdeemph(k) za k = 200,···, pod uslovima gore opisanog načina realizacije.
[0135] U drugoj varijanti tehničkog rešenja dekodera, skidanje nižih opsega se može izvesti na ekvivalentan način u vremenskom domenu posle inverznog DCT.
[0136] Pored uklanjanja nižih opsega, filtriranje propusnih opsega se primenjuje sa dva odvojena dela: jedan fiksni visokopropusni, drugi adaptivni niskopropusni (u zavisnosti od brzine prenosa).
[0137] Ovo filtriranje se vrši u frekvencijskom domenu.
[0138] U poželjnom načinu tehičkog rešenja, delimični odziv niskopropusnog filtera u frekvencijskom domenu se izračunava na sledeći način:
gde Nlp=60 na 6.6 kbit/s, 40 na 8.85 kbit/s, 20 na brzini >8.85 bit/s. Zatim se primenjuje propusnoopsegni filter u obliku:
[0139] Definicija Ghp(k), k = 0,···,55, data je na primer u tabeli 1 ispod.
Ghp(k), k=0,<....>, 55,
Tabela 1
[0140] Treba napomenuti da će u varijantama pronalaska vrednosti Ghp(k) moći da se modifikuju uz zadržavanje progresivnog slabljenja. Slično, niskopropusno filtriranje sa promenljivom širinom opsega, Glp(k), moći će da se podesi sa različitim vrednostima ili podrškom za frekvenciju, bez promene principa ove etape filtriranja.
[0141] Takođe će se primetiti da se propusno filtriranje može prilagoditi definisanjem jedne jedine etape filtriranja koja kombinuje visokopropusno i niskopropusno filtriranje.
[0142] U drugom načinu tehničkog rešenja, filtriranje opsega može da se izvede na ekvivalentan način u vremenskom domenu (kao u bloku 112 na slici 1) sa različitim koeficijentima filtera prema brzini bitova, nakon inverzne DCT etape. Međutim, treba primetiti da je korisno vršiti ovu etapu direktno u frekvencijskom domenu jer se filtriranje vrši u domenu LPC pobude i stoga su problemi kružne konvolucije i ivičnih efekata veoma ograničeni u ovom domenu.
[0143] Blok inverzne transformacije 502 realizuje inverzni DCT na 320 uzoraka da pronađe visokofrekvencijski signal uzorkovan na 16 kHz. Njegovo uvodjenje je identično bloku 510, jer je DCT-IV ortonormalan, osim što je dužina transformacije 320 umesto 256, i dobijamo:
gde N16k= 320 i k = 0,···,319.
[0144] U slučaju kada blok 510 nije DCT, već druga transformacija ili dekompozicija u podopsege, blok 502 izvodi sintezu koja odgovara analizi izvršenoj u bloku 510.
[0145] Uzorkovani signal od 16 kHz se zatim opciono skalira po pojačanjima definisanim po podokviru od 80 uzoraka (blok 504).
[0146] U poželjnom načinu tehničkog rešenja, povećanje gHB1(m) se prvo izračunava (blok 503) po podokviru na osnovu energetskih odnosa podokvirova tako da je u svakom podokviru indeks m =0, 1, 2 ili 3 trenutnog okvira:
što pokazuje da je u signalu uHBobezbeđen isti odnos između energije po podokviru i energije po okviru kao i u signalu u(n).
[0147] Blok 504 vrši skaliranje kombinovanog signala (uključenog u etapi E404a na slici 4) prema sledećoj jednačini:
[0148] Primetiće se da se tehničko rešenje bloka 503 razlikuje od tehničkog rešenja bloka 101 na slici 1, pošto je energija na nivou trenutnog okvira uzeta u obzir pored energije podokvira. Ovo omogućava da se dobije odnos energije svakog podokvira u odnosu na energiju okvira. Odnosi energije (ili relativne energije) se stoga porede radije nego apsolutne energije između niskog i visokog opsega.
[0149] Dakle, ova etapa skaliranja omogućava da se u visokom opsegu očuva odnos energije između podokvira i okvira na isti način kao u niskom opsegu.
[0150] Opciono, blok 506 zatim izvodi skaliranje signala (uključenog u etapu E404a na slici 4) prema sledećoj jednačini:
gde se pojačanje gHB2(m) dobija iz bloka 505 izvršavanjem blokova 103, 104 i 105 AMR-WB kodeka (ulaz u blok 103 je dekodirana ekscitacija niskog opsega, u(n) ). Blokovi 505 i 506 su korisni za podešavanje nivoa LPC filtera za sintezu (blok 507), ovde prema nagibu signala. Druge metode za izračunavanje Blokovi 505 i 506 su korisni za podešavanje nivoa LPC filtera za sintezu (blok 507), ovde prema nagibu signala. Druge metode za izračunavanje povećanja gHB2(m) su moguće bez promene prirode pronalaska.
[0151] Konačno, signal, uHB'(n) ili uHB"(n), filtrira modul za filtriranje 507 koji se ovde može izvesti uzimanjem kao prenosne funkcije 1/ (z/ γ), gde γ =0.9 na 6.6 kbit/s i γ =0.6 pri drugim brzinama bitova, što ograničava redosled filtera na red 16.
[0152] U jednoj varijanti, ovo filtriranje bi se moglo izvesti na isti način kao što je opisano za blok 111 na slici 1 AMR-WB dekodera, međutim redosled filtera se menja na 20 na brzini od 6.6, što ne menja značajno kvalitet sintetizovanog signala. U drugoj nekoj varijanti, filtriranje LPC sinteze se može izvršiti u frekvencijskom domenu, nakon što se izračuna frekvencijski odziv filtera uvedenog u blok 507.
[0153] U varijantama tehničkog rešenja pronalaska, kodiranje niskog opsega (0-6,4 kHz) može biti zamenjeno CELP koderom drugačijim od onog koji se koristi u AMR-WB, kao što je na primer CELP koder u G. 718 pri 8 kbit/s. Bez gubitka opštosti, mogu se koristiti i drugi širokoopsegni koderi ili koderi koji rade na frekvencijama iznad 16 kHz, u kojima koder niskog opsega radi na internoj frekvenciji od 12.8 kHz. Štaviše, pronalazak se očigledno može prilagoditi frekvencijama uzorkovanja različitim od 12.8 kHz, kada niskofrekvencijski koder radi na frekvenciji uzorkovanja nižoj od one koju ima originalni ili rekonstruisani signal. Kada dekodiranje niskog opsega ne koristi linearno predviđanje, nema signala za ekscitaciju, u ovom slučaju se LPC analiza rekonstruisanog signala može izvršiti u trenutnom okviru i LPC pobuda će se izračunati tako da može da se primeni pronalazak.
[0154] Konačno, u drugoj varijanti pronalaska, ekscitacija ili signal niskog opsega ( u(n)) se ponovo uzorkuje, na primer linearnom interpolacijom ili kubičnim „splinom“, od 12.8 do 16 kHz pre transformacije (na primer DCT-IV) dužine 320. Ova varijanta ima nedostatak da je složenija, jer se transformacija (DCT-IV) pobude ili signala tada izračunava na većoj dužini i ponovno uzorkovanje se ne vrši u domenu transformacije.
[0155] Štaviše, u varijantama pronalaska, sva izračunavanja neophodna za procenu pojačanja (GHBN, gHB1(m), gHB2(m), gHBN, ...) mogu se izvršiti u jednom logaritamskom domenu.
[0156] Slika 6 predstavlja primer materijalnog tehničkog rešenja uređaja za ekstenziju opsega 600 prema pronalasku. Ovo može biti sastavni deo jednog dekodera audiofrekvencijskog signala ili neke opreme koja prima dekodirane ili nedekodirane audofrekvencijske signale.
[0157] Ovaj tip uređaja obuhvata procesor PROC koji sarađuje sa memorijskim blokom BM koji sadrži memorijsku i/ili radnu memoriju MEM.
[0158] Takav uređaj obuhvata ulazni modul E koji je sposoban da primi dekodirani ili ekstrahovani audio signal u prvom takozvanom frekvencijskom opsegu niskog opsega koji se vraća u frekvencijski domen (U(k)). Sastoji se od izlaznog modula S koji je sposoban da prenosi signal proširenja u drugom frekvencijskom opsegu (UHB2(k)) na primer, do modula filtera 501 sa slike 5.
[0159] Memorijski blok može povoljno da obuhvata kompjuterski program koji sadrži instrukcije koda za uvođenje etapa procedure ekstenzije opsega u smislu pronalaska, kada ove instrukcije izvršava procesor PROC, a posebno etape ekstrakcije (E402) tonskih komponenti i jednog ambijentalnog signala od signala koji potiče od dekodiranog signala niskog opsega (UHBA(k)) adaptivnim mešanjem koristeći faktore kontrole nivoa energije za dobijanje jednog audio signala, nazvanog kombinovani signal (UHB2(k)), od ekstenzije (E401a) na najmanje drugom frekvencijskom opsegu višem od prvog frekvencijskog opsega niskog opsega dekodiranog signala pre etape ekstrakcije ili kombinovanog signala nakon etape kombinovanja.
[0160] Tipično, opis slike 4 ponavlja etape jednog algoritma jednog takvog kompjuterskog programa. Kompjuterski program se, takođe, može čuvati na memorijskoj podlozi koju može da čita čitač uređaja ili koja se može preuzeti u memorijski prostor ovog drugog.
[0161] Memorijski MEM generalno beleži sve podatke potrebne za uvođenje postupka.
[0162] U jednom mogućem načinu tehničkog rešenja, ovako opisan uređaj može takođe da obuhvata funkcije dekodiranja niskog opsega i druge funkcije obrade opisane, na primer, na slikama 5 i 3 pored funkcija proširenja opsega prema pronalasku.
Claims (9)
- Patentni zahtevi 1. Postupak za ekstenziju frekvencijskog opsega audiofrekvencijskog signala tokom procesa dekodiranja ili poboljšanja koji obuhvata etapu dobijanja dekodiranog signala u prvom frekvencijskom opsegu koji se naziva niski opseg, pri čemu je postupak naznačen time što uključuje sledeće etape: - Ekstenziju (E401a) preko najmanje drugog frekvencijskog opsega višeg od prvog frekvencijskog opsega dekodiranog signala niskog opsega da bi se formirao prošireni dekodirani signal niskog opsega UHB1(k), pri čemu k predstavlja uzorke koji pokrivaju spektar UHB1(k) ; - Ekstrakciju (E402) tonskih komponenti i jednog ambijentalnog signala iz signala koji dolazi iz proširenog dekodiranog signala niskog opsega; - Kombinaciju (E403) tonskih komponenti i ambijentalnog signala adaptivnim mešanjem koristeći faktore kontrole nivoa energije za dobijanje kombinovanog signala; - sintezu (E404b) audio signala za vraćanje signala iz kombinovanog signala u vremenski domen; i pri čemu etapa ekstrakcije (E402) tonskih komponenti i ambijentalnog signala obuhvata sledeće operacije: (a) izračunavanje ukupne energije proširenog dekodiranog signala niskog opsega; (b) proračun ambijenta u apsolutnoj vrednosti koja odgovara prosečnom nivou spektra linija po linija i proračun energije dominantnih tonskih delova u spektru visokih frekvencija.
- 2. Postupak prema patentnom zahtevu 1, prema kome etapa (a) izračunavanja ukupne energije proširenog dekodiranog signala niskog opsega obuhvata izračunavanje:gde ε=0.1.
- 3. Postupak prema patentnom zahtevu 1 ili 2, pri čemu se prosečni nivo spektra linija po linija dobija pomoću jednačine:gde fb(i) = 0 i fn(i)= i+7 za i=0,...,6 fb(i)= i-7 i fn(i)= i+7 za i=7,...,L-8 fb(i)= i-7 i fn(i)= L-1 za i=L-7,. ,L-1, gde L je dužina spektra.
- 4. Postupak prema patentnom zahtevu 1, 2 ili 3, pri čemu proračun energije dominantnih tonskih komponenti obuhvata izračunavanje zaostalog signala:
- 5. Postupak prema patentnom zahtevu 4, koji obuhvata etapu detekcije tonskih komponenti na osnovu uslova detekcije na zaostalom signalu y(i).
- 6. Postupak prema patentnom zahtevu 5, pri čemu je uslov detekcije y(i)>0.
- 7. Postupak prema patentnom zahtevu 6, pri čemu se energija dominantnih tonskih komponenti definiše pomoću
- 8. Uređaj za ekstenziju frekvencijskog opsega audiofrekvencijskog signala, gde je signal dekodiran u prvom frekvencijskom opsegu koji se naziva niski opseg, pri čemu je uređaj naznačen time što obuhvata: - jedan modul (511) ekstenzije na najmanje drugom frekvencijskom opsegu višem od prvog frekvencijskog opsega uvedenog u dekodirani signal niskog opsega da se formira prošireni dekodirani signal niskog opsega UHB1(k), pri čemu k predstavlja odbirke koji pokrivaju spektar UHB1(k), - jedan modul (512) ekstrakcije tonskih komponenti i ambijentalnog signala iz signala koji dolazi iz proširenog dekodiranog signala niskog opsega; - jedan modul (513) kombinovanja tonskih komponenti i ambijentalnog signala adaptivnim mešanjem korišćenjem faktora kontrole nivoa energije za dobijanje kombinovanog audiosignala; - modul (502) sinteze jednog audio signala za vraćanje kombinovanog signala u vremenski domen; i u kojem je modul ekstrakcije (512) tonskih komponenti i ambijentalnog signala prilagođen za obavljanje sledećih operacija: (a) izračunavanje ukupne energije proširenog dekodiranog signala niskog opsega; (b) proračun ambijenta u apsolutnoj vrednosti koja odgovara prosečnom nivou spektra linija po linija i proračun energije dominantnih tonskih delova u spektru visokih frekvencija.
- 9. Dekoder audiofrekvencijskog signala, naznačen time što obuhvata uređaj za ekstenziju frekvencijskog opsega prema patentnom zahtevu 8.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1450969A FR3017484A1 (fr) | 2014-02-07 | 2014-02-07 | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
| EP17206563.3A EP3330966B1 (fr) | 2014-02-07 | 2015-02-04 | Extension améliorée de bande de fréquence dans un décodeur de signaux audiofréquences |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RS64614B1 true RS64614B1 (sr) | 2023-10-31 |
Family
ID=51014390
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RS20230844A RS64614B1 (sr) | 2014-02-07 | 2015-02-04 | Poboljšana ekstenzija frekvencijskog opsega u dekoderu audiofrekvencijskih signala |
| RS20210945A RS62160B1 (sr) | 2014-02-07 | 2015-02-04 | Poboljšana ekstenzija frekvencijskog opsega u dekoderu audio frekventnih signala |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RS20210945A RS62160B1 (sr) | 2014-02-07 | 2015-02-04 | Poboljšana ekstenzija frekvencijskog opsega u dekoderu audio frekventnih signala |
Country Status (22)
| Country | Link |
|---|---|
| US (5) | US10043525B2 (sr) |
| EP (4) | EP3330967B1 (sr) |
| JP (4) | JP6625544B2 (sr) |
| KR (5) | KR102380205B1 (sr) |
| CN (4) | CN105960675B (sr) |
| BR (2) | BR112016017616B1 (sr) |
| DK (2) | DK3330966T3 (sr) |
| ES (4) | ES2978878T3 (sr) |
| FI (1) | FI3330966T3 (sr) |
| FR (1) | FR3017484A1 (sr) |
| HR (2) | HRP20211187T1 (sr) |
| HU (2) | HUE062979T2 (sr) |
| LT (2) | LT3103116T (sr) |
| MX (2) | MX363675B (sr) |
| PL (4) | PL3330967T3 (sr) |
| PT (2) | PT3103116T (sr) |
| RS (2) | RS64614B1 (sr) |
| RU (4) | RU2763547C2 (sr) |
| SI (2) | SI3103116T1 (sr) |
| SM (2) | SMT202100395T1 (sr) |
| WO (1) | WO2015118260A1 (sr) |
| ZA (4) | ZA201606173B (sr) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2951819B1 (en) * | 2013-01-29 | 2017-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer medium for synthesizing an audio signal |
| FR3017484A1 (fr) | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
| EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
| EP3382702A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal |
| CN109688531B (zh) * | 2017-10-18 | 2021-01-26 | 宏达国际电子股份有限公司 | 获取高音质音频变换信息的方法、电子装置及记录介质 |
| EP3518562A1 (en) * | 2018-01-29 | 2019-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal processor, system and methods distributing an ambient signal to a plurality of ambient signal channels |
| IL313348B2 (en) * | 2018-04-25 | 2025-08-01 | Dolby Int Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
| WO2020146867A1 (en) * | 2019-01-13 | 2020-07-16 | Huawei Technologies Co., Ltd. | High resolution audio coding |
| KR102308077B1 (ko) * | 2019-09-19 | 2021-10-01 | 에스케이텔레콤 주식회사 | 학습 모델 기반의 인공 대역 변환장치 및 방법 |
| CN113192517B (zh) * | 2020-01-13 | 2024-04-26 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
| CN113593586B (zh) * | 2020-04-15 | 2025-01-10 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
| CN113539281B (zh) * | 2020-04-21 | 2024-09-06 | 华为技术有限公司 | 音频信号编码方法和装置 |
Family Cites Families (52)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998001847A1 (en) * | 1996-07-03 | 1998-01-15 | British Telecommunications Public Limited Company | Voice activity detector |
| SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
| TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
| JP4135240B2 (ja) * | 1998-12-14 | 2008-08-20 | ソニー株式会社 | 受信装置及び方法、通信装置及び方法 |
| US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
| JP4792613B2 (ja) * | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
| US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
| DE10041512B4 (de) * | 2000-08-24 | 2005-05-04 | Infineon Technologies Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
| WO2003003345A1 (en) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
| CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
| DE60212696T2 (de) * | 2001-11-23 | 2007-02-22 | Koninklijke Philips Electronics N.V. | Bandbreitenvergrösserung für audiosignale |
| US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
| DE60228891D1 (de) * | 2002-06-28 | 2008-10-23 | Pirelli | Vorrichtung zur überwachung von kennzeichnenden parametern eines reifens |
| US6845360B2 (en) * | 2002-11-22 | 2005-01-18 | Arbitron Inc. | Encoding multiple messages in audio data and detecting same |
| BRPI0608270A2 (pt) * | 2005-04-01 | 2009-10-06 | Qualcomm Inc | sistemas, métodos e equipamento para filtragem anti-dispersão |
| US8145478B2 (en) * | 2005-06-08 | 2012-03-27 | Panasonic Corporation | Apparatus and method for widening audio signal band |
| FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
| US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
| CN101089951B (zh) * | 2006-06-16 | 2011-08-31 | 北京天籁传音数字技术有限公司 | 频带扩展编码方法及装置和解码方法及装置 |
| JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
| KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
| US8229106B2 (en) * | 2007-01-22 | 2012-07-24 | D.S.P. Group, Ltd. | Apparatus and methods for enhancement of speech |
| US8489396B2 (en) * | 2007-07-25 | 2013-07-16 | Qnx Software Systems Limited | Noise reduction with integrated tonal noise reduction |
| US8041577B2 (en) * | 2007-08-13 | 2011-10-18 | Mitsubishi Electric Research Laboratories, Inc. | Method for expanding audio signal bandwidth |
| EP2186087B1 (en) * | 2007-08-27 | 2011-11-30 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved transform coding of speech and audio signals |
| WO2009039897A1 (en) * | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
| US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
| AU2008339211B2 (en) * | 2007-12-18 | 2011-06-23 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
| DE602008005250D1 (de) * | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
| US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
| DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
| US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
| KR101381513B1 (ko) * | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
| US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
| US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
| ES2976382T3 (es) * | 2008-12-15 | 2024-07-31 | Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V | Decodificador de extensión de ancho de banda |
| US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
| RU2452044C1 (ru) * | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
| CN101990253A (zh) * | 2009-07-31 | 2011-03-23 | 数维科技(北京)有限公司 | 一种带宽扩展方法及其装置 |
| JP5493655B2 (ja) * | 2009-09-29 | 2014-05-14 | 沖電気工業株式会社 | 音声帯域拡張装置および音声帯域拡張プログラム |
| WO2011062538A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Bandwidth extension of a low band audio signal |
| JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
| US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
| KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
| SG192718A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Audio codec using noise synthesis during inactive phases |
| WO2012131438A1 (en) * | 2011-03-31 | 2012-10-04 | Nokia Corporation | A low band bandwidth extender |
| WO2013066238A2 (en) | 2011-11-02 | 2013-05-10 | Telefonaktiebolaget L M Ericsson (Publ) | Generation of a high band extension of a bandwidth extended audio signal |
| WO2013141638A1 (ko) * | 2012-03-21 | 2013-09-26 | 삼성전자 주식회사 | 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치 |
| US9228916B2 (en) * | 2012-04-13 | 2016-01-05 | The Regents Of The University Of California | Self calibrating micro-fabricated load cells |
| KR101897455B1 (ko) * | 2012-04-16 | 2018-10-04 | 삼성전자주식회사 | 음질 향상 장치 및 방법 |
| US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
| FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
-
2014
- 2014-02-07 FR FR1450969A patent/FR3017484A1/fr active Pending
-
2015
- 2015-02-04 PL PL17206567.4T patent/PL3330967T3/pl unknown
- 2015-02-04 CN CN201580007250.0A patent/CN105960675B/zh active Active
- 2015-02-04 CN CN201711459702.6A patent/CN107993667B/zh active Active
- 2015-02-04 PL PL17206563.3T patent/PL3330966T3/pl unknown
- 2015-02-04 ES ES17206567T patent/ES2978878T3/es active Active
- 2015-02-04 PT PT157056870T patent/PT3103116T/pt unknown
- 2015-02-04 RU RU2017144523A patent/RU2763547C2/ru active
- 2015-02-04 EP EP17206567.4A patent/EP3330967B1/fr active Active
- 2015-02-04 RU RU2016136008A patent/RU2682923C2/ru active
- 2015-02-04 KR KR1020167024350A patent/KR102380205B1/ko active Active
- 2015-02-04 SI SI201531646T patent/SI3103116T1/sl unknown
- 2015-02-04 LT LTEP15705687.0T patent/LT3103116T/lt unknown
- 2015-02-04 DK DK17206563.3T patent/DK3330966T3/da active
- 2015-02-04 KR KR1020177037710A patent/KR102426029B1/ko active Active
- 2015-02-04 RU RU2017144522A patent/RU2763481C2/ru active
- 2015-02-04 PT PT172065633T patent/PT3330966T/pt unknown
- 2015-02-04 RS RS20230844A patent/RS64614B1/sr unknown
- 2015-02-04 WO PCT/FR2015/050257 patent/WO2015118260A1/fr not_active Ceased
- 2015-02-04 PL PL15705687T patent/PL3103116T3/pl unknown
- 2015-02-04 JP JP2016549732A patent/JP6625544B2/ja active Active
- 2015-02-04 EP EP17206563.3A patent/EP3330966B1/fr active Active
- 2015-02-04 MX MX2016010214A patent/MX363675B/es unknown
- 2015-02-04 BR BR112016017616-2A patent/BR112016017616B1/pt active IP Right Grant
- 2015-02-04 SI SI201531958T patent/SI3330966T1/sl unknown
- 2015-02-04 KR KR1020177037706A patent/KR102380487B1/ko active Active
- 2015-02-04 CN CN201711459695.XA patent/CN108109632B/zh active Active
- 2015-02-04 EP EP15705687.0A patent/EP3103116B1/fr active Active
- 2015-02-04 RS RS20210945A patent/RS62160B1/sr unknown
- 2015-02-04 RU RU2017144521A patent/RU2763848C2/ru active
- 2015-02-04 HU HUE17206563A patent/HUE062979T2/hu unknown
- 2015-02-04 PL PL17206569.0T patent/PL3327722T3/pl unknown
- 2015-02-04 BR BR122017027991-2A patent/BR122017027991B1/pt active IP Right Grant
- 2015-02-04 SM SM20210395T patent/SMT202100395T1/it unknown
- 2015-02-04 CN CN201711459701.1A patent/CN108022599B/zh active Active
- 2015-02-04 KR KR1020227007471A patent/KR102510685B1/ko active Active
- 2015-02-04 SM SM20230335T patent/SMT202300335T1/it unknown
- 2015-02-04 LT LTEP17206563.3T patent/LT3330966T/lt unknown
- 2015-02-04 DK DK15705687.0T patent/DK3103116T3/da active
- 2015-02-04 ES ES15705687T patent/ES2878401T3/es active Active
- 2015-02-04 US US15/117,100 patent/US10043525B2/en active Active
- 2015-02-04 EP EP17206569.0A patent/EP3327722B1/fr active Active
- 2015-02-04 HR HRP20211187TT patent/HRP20211187T1/hr unknown
- 2015-02-04 FI FIEP17206563.3T patent/FI3330966T3/fi active
- 2015-02-04 ES ES17206563T patent/ES2955964T3/es active Active
- 2015-02-04 ES ES17206569T patent/ES2978967T3/es active Active
- 2015-02-04 HU HUE15705687A patent/HUE055111T2/hu unknown
- 2015-02-04 MX MX2017015657A patent/MX381498B/es unknown
- 2015-02-04 KR KR1020177037700A patent/KR20180002906A/ko not_active Ceased
- 2015-02-04 HR HRP20231164TT patent/HRP20231164T1/hr unknown
-
2016
- 2016-09-06 ZA ZA2016/06173A patent/ZA201606173B/en unknown
-
2017
- 2017-12-11 ZA ZA2017/08368A patent/ZA201708368B/en unknown
- 2017-12-11 ZA ZA2017/08367A patent/ZA201708367B/en unknown
- 2017-12-11 ZA ZA2017/08366A patent/ZA201708366B/en unknown
-
2018
- 2018-01-12 US US15/869,560 patent/US10668760B2/en active Active
- 2018-06-18 US US16/011,153 patent/US10730329B2/en active Active
-
2019
- 2019-06-07 JP JP2019107009A patent/JP6775065B2/ja active Active
- 2019-06-07 JP JP2019107007A patent/JP6775063B2/ja active Active
- 2019-06-07 JP JP2019107008A patent/JP6775064B2/ja active Active
-
2020
- 2020-07-13 US US16/926,818 patent/US11312164B2/en active Active
- 2020-07-27 US US16/939,104 patent/US11325407B2/en active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11325407B2 (en) | Frequency band extension in an audio signal decoder | |
| RU2756435C2 (ru) | Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты |