RU2012147587A - Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания - Google Patents
Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания Download PDFInfo
- Publication number
- RU2012147587A RU2012147587A RU2012147587/08A RU2012147587A RU2012147587A RU 2012147587 A RU2012147587 A RU 2012147587A RU 2012147587/08 A RU2012147587/08 A RU 2012147587/08A RU 2012147587 A RU2012147587 A RU 2012147587A RU 2012147587 A RU2012147587 A RU 2012147587A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- channel
- decoded
- prediction
- combined
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 4
- 230000005236 sound signal Effects 0.000 claims abstract 22
- 230000003595 spectral effect Effects 0.000 claims 20
- 238000001228 spectrum Methods 0.000 claims 4
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000005457 optimization Methods 0.000 claims 2
- 230000009466 transformation Effects 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
1. Аудиодекодер для декодирования кодированного многоканального аудиосигнала (100), причем кодированный многоканальный аудиосигнал содержит кодированный первый комбинированный сигнал, сформированный на основании правила комбинирования для комбинирования аудиосигнала первого канала и аудиосигнала второго канала многоканального аудиосигнала, кодированный остаточный сигнал предсказания и информацию о предсказании, содержащий:декодер (110) сигнала для декодирования кодированного первого комбинированного сигнала (104), чтобы получать декодированный первый комбинированный сигнал (112), и для декодирования кодированного остаточного сигнала (106), чтобы получать декодированный остаточный сигнал (114); ивычислитель (116) декодера для расчета декодированного многоканального сигнала, содержащего декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала, с использованием декодированного остаточного сигнала (114), информации (108) о предсказании и декодированного первого комбинированного сигнала (112), так что декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала являются по меньшей мере приближениями сигнала первого канала и сигнала второго канала многоканального сигнала, при этом информация (108) о предсказании содержит вещественную часть, отличную от нуля, и/или мнимую часть, отличную от нуля,при этом информация (108) о предсказании содержит мнимый коэффициент, отличный от нуля,при этом вычислитель (116) декодера содержит предсказатель (1160), сконфигурированный для оценки (1160a) мнимой части декодированного первого комбинированного сигнала (112) с использованием вещественн
Claims (21)
1. Аудиодекодер для декодирования кодированного многоканального аудиосигнала (100), причем кодированный многоканальный аудиосигнал содержит кодированный первый комбинированный сигнал, сформированный на основании правила комбинирования для комбинирования аудиосигнала первого канала и аудиосигнала второго канала многоканального аудиосигнала, кодированный остаточный сигнал предсказания и информацию о предсказании, содержащий:
декодер (110) сигнала для декодирования кодированного первого комбинированного сигнала (104), чтобы получать декодированный первый комбинированный сигнал (112), и для декодирования кодированного остаточного сигнала (106), чтобы получать декодированный остаточный сигнал (114); и
вычислитель (116) декодера для расчета декодированного многоканального сигнала, содержащего декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала, с использованием декодированного остаточного сигнала (114), информации (108) о предсказании и декодированного первого комбинированного сигнала (112), так что декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала являются по меньшей мере приближениями сигнала первого канала и сигнала второго канала многоканального сигнала, при этом информация (108) о предсказании содержит вещественную часть, отличную от нуля, и/или мнимую часть, отличную от нуля,
при этом информация (108) о предсказании содержит мнимый коэффициент, отличный от нуля,
при этом вычислитель (116) декодера содержит предсказатель (1160), сконфигурированный для оценки (1160a) мнимой части декодированного первого комбинированного сигнала (112) с использованием вещественной части декодированного первого комбинированного сигнала (112),
при этом предсказатель (1160) сконфигурирован для умножения мнимой части (601) декодированного первого комбинированного сигнала на мнимый коэффициент информации (108) о предсказании при получении сигнала предсказания;
при этом вычислитель (116) декодера дополнительно содержит вычислитель (1161) комбинированного сигнала, сконфигурированный для линейного комбинирования сигнала предсказания и декодированного остаточного сигнала, чтобы получать второй комбинированный сигнал (1165); и
при этом вычислитель (116) декодера дополнительно содержит объединитель (1162) для комбинирования второго комбинированного сигнала (1165) и декодированного первого комбинированного сигнала, чтобы получать декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала.
2. Аудиодекодер по п.1, в котором вычислитель (116) декодера содержит:
предсказатель (1160) для применения информации (108) о предсказании к декодированному первому комбинированному сигналу (112) или к сигналу (601), выведенному из декодированного первого комбинированного сигнала, чтобы получать сигнал (1163) предсказания;
вычислитель (1161) комбинированного сигнала для расчета второго комбинированного сигнала (1165) посредством комбинирования декодированного остаточного сигнала (114) и сигнала (1163) предсказания; и
объединитель (1162) для комбинирования декодированного первого комбинированного сигнала (112) и второго комбинированного сигнала (1165), чтобы получать декодированный многоканальный аудиосигнал, содержащий декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала.
3. Аудиодекодер по п.1,
в котором кодированный первый комбинированный сигнал (104) и кодированный остаточный сигнал (106) были сформированы с использованием время-спектрального преобразования с формированием наложения спектров,
при этом декодер дополнительно содержит:
спектрально-временной преобразователь (52, 53) для формирования сигнала первого канала временной области и сигнала второго канала временной области с использованием алгоритма спектрально-временного преобразования, приведенного в соответствие алгоритму время-спектрального преобразования;
процессор (522) наложения/сложения для проведения обработки наложения-сложения для сигнала первого канала временной области и для сигнала второго канала временной области, чтобы получать свободный от наложения спектров первый сигнал временной области и свободный от наложения спектров второй сигнал временной области.
4. Аудиодекодер по п.1, в котором информация (108) о предсказании содержит вещественный коэффициент, отличный от нуля,
в котором предсказатель (1160) сконфигурирован для умножения декодированного первого комбинированного сигнала на вещественный коэффициент, чтобы получать первую часть сигнала предсказания, и
в котором вычислитель комбинированного сигнала сконфигурирован для линейного комбинирования декодированного остаточного сигнала и первой части сигнала предсказания.
5. Аудиодекодер по п.1,
в котором каждый из кодированного или декодированного первого комбинированного сигнала (104) и кодированного или декодированного остаточного сигнала (106) предсказания содержит первое множество сигналов субполосы,
при этом информация о предсказании содержит второе множество параметров информации о предсказании, причем второе множество является меньшим, чем первое множество,
при этом предсказатель (1160) сконфигурирован для применения одного и того же параметра предсказания к по меньшей мере двум разным сигналам субполосы декодированного первого комбинированного сигнала,
при этом вычислитель (116) декодера, или вычислитель (1161) комбинированного сигнала, или объединитель (1162) сконфигурированы для выполнения обработки по субполосам; и
при этом аудиодекодер дополнительно содержит гребенку (52, 53) фильтров синтеза для комбинирования сигналов субполосы декодированного первого комбинированного сигнала и декодированного второго комбинированного сигнала, чтобы получать первый декодированный сигнал временной области и второй декодированный сигнал временной области.
6. Аудиодекодер по п.2,
в котором предсказатель (1160) сконфигурирован для фильтрации по меньшей мере двух следующих по времени кадров, причем один из двух следующих по времени кадров предшествует или следует за текущим кадром первого комбинированного сигнала, чтобы получать оцененную мнимую часть текущего кадра первого комбинированного сигнала с использованием линейного фильтра (1004, 1005, 1006, 1007).
7. Аудиодекодер по п.2,
в котором декодированный первый комбинированный сигнал содержит последовательность вещественнозначных кадров сигнала, и
в котором предсказатель (1160) сконфигурирован для оценки (1160a) мнимой части текущего кадра сигнала с использованием только текущего вещественнозначного кадра сигнала или с использованием текущего вещественнозначного кадра сигнала и любого из только одного или более предшествующих или только одного или более последующих вещественнозначных кадров сигнала, или с использованием текущего вещественнозначного кадра сигнала и одного или более предыдущих вещественнозначных кадров сигнала и одного или более последующих вещественнозначных кадров сигнала.
8. Аудиодекодер по п.2, в котором предсказатель (1160) сконфигурирован для приема информации (109) о форме окна и для использования разных коэффициентов фильтра для расчета мнимого спектра, причем разные коэффициенты фильтра зависят от разных форм окна, указанных информацией (109) о форме окна.
9. Аудиодекодер по п.5,
в котором декодированный первый комбинированный сигнал ассоциирован с разными длинами преобразования, указанными указателем длины преобразования, включенным в кодированный многоканальный сигнал (100), и
в котором предсказатель (1160) сконфигурирован, чтобы использовать только один или более кадров первого комбинированного сигнала, имеющего одну и ту же ассоциированную длину преобразования для оценки мнимой части для текущего кадра для первого комбинированного сигнала.
10. Аудиодекодер по п.2,
в котором предсказатель (1160) сконфигурирован для использования множества субполос декодированного первого комбинированного сигнала, смежных по частоте, для оценки мнимой части первого комбинированного сигнала, и
при этом, в случае низких или высоких частот, используется симметричное расширение по частоте текущего кадра первого комбинированного сигнала для субполос, ассоциированных с частотами, более низкими или равными нулю или более высокими или равными половине частоты выборки, на которой основан текущий кадр, или в котором коэффициенты фильтра у фильтра, включенного в предсказатель (1160a), установлены в другие значения для отсутствующих субполос по сравнению с неотсутствующими субполосами.
11. Аудиодекодер по п.1,
в котором информация (108) о предсказании включена в кодированный многоканальный сигнал в квантованном и энтропийно кодированном представлении,
при этом аудиодекодер дополнительно содержит декодер (65) информации о предсказании для энтропийного декодирования или деквантования, чтобы получать декодированную информацию о предсказании, используемую предсказателем (1160), или
в котором кодированный многоканальный аудиосигнал содержит блок данных, указывающий в первом состоянии, что предсказатель (1160) должен использовать по меньшей мере один кадр, предшествующий или следующий по времени за текущим кадром декодированного первого комбинированного сигнала, и указывающий во втором состоянии, что предсказатель (1160) должен использовать только один кадр декодированного первого комбинированного сигнала для оценки мнимой части для текущего кадра декодированного первого комбинированного сигнала, и в котором предсказатель (1160) сконфигурирован для считывания состояния блока данных для действия соответствующим образом.
12. Аудиодекодер по п.1, в котором информация (108) о предсказании содержит кодовые слова или разности между последовательными по времени или смежными по частоте комплексными значениями, и
при этом аудиодекодер сконфигурирован для выполнения этапа энтропийного декодирования и последующего этапа декодирования разности, чтобы получать последовательные по времени квантованные комплексные значения предсказания или комплексные значения предсказания для смежных частотных полос.
13. Аудиодекодер по п.1, в котором кодированный многоканальный сигнал содержит, в качестве побочной информации, указатель вещественности, указывающий, что все коэффициенты предсказания для кадра кодированного многоканального сигнала являются вещественнозначными,
при этом декодер аудиосигналов сконфигурирован для извлечения указателя вещественности из кодированного многоканального аудиосигнала (100), и
при этом вычислитель (116) декодера сконфигурирован, чтобы не рассчитывать мнимый сигнал для кадра, для которого указатель вещественности является указывающим только вещественнозначные коэффициенты предсказания.
14. Аудиокодер для кодирования многоканального аудиосигнала, содержащего сигналы двух или более каналов, содержащий:
вычислитель (203) кодера для расчета первого комбинированного сигнала (204) и остаточного сигнала (205) предсказания с использованием сигнала (201) первого канала и сигнала (202) второго канала, и информации (206) о предсказании, так что остаточный сигнал предсказания, при комбинировании с сигналом предсказания, выведенным из первого комбинированного сигнала, или сигналом, выведенным из первого комбинированного сигнала и информации (206) о предсказании, дает в результате второй комбинированный сигнал (2032), причем первый комбинированный сигнал (204) и второй комбинированный сигнал (2032) являются выводимыми из сигнала (201) первого канала и сигнала (202) второго канала с использованием правила комбинирования;
оптимизатор (207) для расчета информации (206) о предсказании, так чтобы остаточный сигнал (205) предсказания удовлетворял цели (208) оптимизации;
кодер (209) сигнала для кодирования первого комбинированного сигнала (204) и остаточного сигнала (205) предсказания, чтобы получать кодированный первый комбинированный сигнал (210) и кодированный остаточный сигнал (211); и
выходной интерфейс (212) для комбинирования кодированного первого комбинированного сигнала (210), кодированного остаточного сигнала (211) предсказания и информации (206) о предсказании, чтобы получать кодированный многоканальный аудиосигнал,
при этом сигнал первого канала является спектральным представлением блока отсчетов;
при этом сигнал второго канала является спектральным представлением блока отсчетов,
при этом спектральные представления являются или чисто вещественными спектральными представлениями, или чисто мнимыми спектральными представлениями,
при этом оптимизатор (207) сконфигурирован для расчета информации (206) о предсказании в качестве вещественного коэффициента, отличного от нуля, и/или в качестве мнимого коэффициента, отличного от нуля,
при этом вычислитель (203) кодера содержит вещественно-мнимый преобразователь (2070) или мнимо-вещественный преобразователь для выведения спектрального представления преобразования из первого комбинированного сигнала, и
при этом вычислитель (203) кодера сконфигурирован, чтобы рассчитывать первый комбинированный сигнал (204) и первый остаточный сигнал (2032), так что сигнал предсказания выводится из преобразованного спектра с использованием мнимого коэффициента.
15. Аудиокодер по п.14, в котором вычислитель (203) кодера содержит:
объединитель (2031) для комбинирования сигнала (201) первого канала и сигнала (202) второго канала двумя разными способами, чтобы получать первый комбинированный сигнал (204) и второй комбинированный сигнал (2032);
предсказатель (2033) для применения информации (206) о предсказании к первому комбинированному сигналу (204) или сигналу (600), выведенному из первого комбинированного сигнала (204), чтобы получать сигнал (2035) предсказания; и
вычислитель (2034) остаточного сигнала для расчета остаточного сигнала (205) предсказания посредством комбинирования сигнала (2035) предсказания и второго комбинированного сигнала (2032).
16. Аудиокодер по п.15, в котором предсказатель (2033) содержит квантователь для квантования сигнала первого канала, сигнала второго канала, первого комбинированного сигнала или второго комбинированного сигнала, чтобы получать один или более квантованных сигналов, и при этом предсказатель (2033) сконфигурирован для расчета остаточного сигнала с использованием квантованных сигналов.
17. Аудиокодер по п.14,
в котором сигнал первого канала является спектральным представлением блока отсчетов,
в котором сигнал второго канала является спектральным представлением блока отсчетов,
при этом спектральные представления являются или чисто вещественными спектральными представлениями, или чисто мнимыми спектральными представлениями,
в котором оптимизатор (207) сконфигурирован для расчета информации (206) о предсказании в качестве вещественного коэффициента, отличного от нуля, и/или в качестве мнимого коэффициента, отличного от нуля, и
в котором вычислитель (203) кодера сконфигурирован, чтобы рассчитывать первый комбинированный сигнал и остаточный сигнал предсказания, так что сигнал предсказания выводится из чисто вещественного спектрального представления или чисто мнимого спектрального представления с использованием вещественного коэффициента.
18. Аудиокодер по п.14,
в котором предсказатель (2033) сконфигурирован для умножения первого комбинированного сигнала (204) на вещественную часть информации (2073) о предсказании, чтобы получать первую часть сигнала предсказания;
для оценки (2070) мнимой части (600) первого комбинированного сигнала с использованием первого комбинированного сигнала (204);
для умножения мнимой части первого комбинированного сигнала на мнимую часть информации (2074) о предсказании, чтобы получать вторую часть сигнала предсказания; и
при этом вычислитель (2034) остаточного сигнала сконфигурирован для линейного комбинирования сигнала первой части сигнала предсказания или сигнала второй части сигнала предсказания и второго комбинированного сигнала, чтобы получать остаточный сигнал (205) предсказания.
19. Способ декодирования кодированного многоканального аудиосигнала (100), причем кодированный многоканальный аудиосигнал содержит кодированный первый комбинированный сигнал, сформированный на основании правила комбинирования для комбинирования аудиосигнала первого канала и аудиосигнала второго канала многоканального аудиосигнала, кодированный остаточный сигнал предсказания и информацию о предсказании, содержащий этапы, на которых:
декодируют (110) кодированный первый комбинированный сигнал (104), чтобы получать декодированный первый комбинированный сигнал (112), и декодируют кодированный остаточный сигнал (106), чтобы получать декодированный остаточный сигнал (114); и
рассчитывают (116) декодированный многоканальный сигнал, содержащий декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала, с использованием декодированного остаточного сигнала (114), информации (108) о предсказании и декодированного первого комбинированного сигнала (112), так что декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала являются по меньшей мере приближениями сигнала первого канала и сигнала второго канала многоканального сигнала, при этом информация (108) о предсказании содержит вещественную часть, отличную от нуля, и/или мнимую часть, отличную от нуля,
при этом информация (108) о предсказании содержит мнимый коэффициент, отличный от нуля,
при этом мнимую часть декодированного первого комбинированного сигнала (112) оценивают (1160a) с использованием вещественной части декодированного первого комбинированного сигнала (112),
при этом мнимую часть (601) декодированного первого комбинированного сигнала умножают на мнимый коэффициент информации (108) о предсказании при получении сигнала предсказания;
при этом сигнал предсказания и декодированный остаточный сигнал линейно комбинируют, чтобы получать второй комбинированный сигнал (1165); и
при этом второй комбинированный сигнал (1165) и декодированный первый комбинированный сигнал комбинируют, чтобы получать декодированный сигнал (117) первого канала и декодированный сигнал (118) второго канала.
20. Способ кодирования многоканального аудиосигнала, содержащего сигналы двух или более каналов, содержащий этапы, на которых:
рассчитывают (203) первый комбинированный сигнал (204) и остаточный сигнал (205) предсказания с использованием сигнала (201) первого канала и сигнала (202) второго канала, и информацию (206) о предсказании, так что остаточный сигнал предсказания, при комбинировании с сигналом предсказания, выведенным из первого комбинированного сигнала, или сигналом, выведенным из первого комбинированного сигнала и информации (206) о предсказании, дает в результате второй комбинированный сигнал (2032), причем первый комбинированный сигнал (204) и второй комбинированный сигнал (2032) являются выводимыми из сигнала (201) первого канала и сигнала (202) второго канала с использованием правила комбинирования;
рассчитывают (207) информацию (206) о предсказании, так чтобы остаточный сигнал (205) предсказания удовлетворял цели (208) оптимизации;
кодируют (209) первый комбинированный сигнал (204) и остаточный сигнал (205) предсказания, чтобы получать кодированный первый комбинированный сигнал (210) и кодированный остаточный сигнал (211); и
комбинируют (212) кодированный первый комбинированный сигнал (210), кодированный остаточный сигнал (211) предсказания и информацию (206) о предсказании, чтобы получать кодированный многоканальный аудиосигнал,
при этом сигнал первого канала является спектральным представлением блока отсчетов;
при этом сигнал второго канала является спектральным представлением блока отсчетов,
при этом спектральные представления являются или чисто вещественными спектральными представлениями, или чисто мнимыми спектральными представлениями,
при этом информацию (206) о предсказании рассчитывают в качестве вещественнозначного коэффициента, отличного от нуля, и/или в качестве мнимого коэффициента, отличного от нуля,
выполняют вещественно-мнимое преобразование (2070) или мнимо-вещественное преобразование для выведения спектрального представления преобразования из первого комбинированного сигнала, и
при этом первый комбинированный сигнал (204) и первый остаточный сигнал (2032) рассчитывают так, чтобы сигнал предсказания выводился из преобразованного спектра с использованием мнимого коэффициента.
21. Компьютерная программа для выполнения, при исполнении на компьютере или процессоре, способа по п.19 или 20.
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US32268810P | 2010-04-09 | 2010-04-09 | |
| US61/322,688 | 2010-04-09 | ||
| US36390610P | 2010-07-13 | 2010-07-13 | |
| EP10169432.1 | 2010-07-13 | ||
| US61/363,906 | 2010-07-13 | ||
| EP10169432A EP2375409A1 (en) | 2010-04-09 | 2010-07-13 | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
| PCT/EP2011/054485 WO2011124473A1 (en) | 2010-04-09 | 2011-03-23 | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2012147587A true RU2012147587A (ru) | 2014-05-20 |
| RU2577195C2 RU2577195C2 (ru) | 2016-03-10 |
Family
ID=43828187
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2012147587/08A RU2577195C2 (ru) | 2010-04-09 | 2011-03-23 | Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания |
Country Status (17)
| Country | Link |
|---|---|
| US (1) | US8655670B2 (ru) |
| EP (8) | EP2375409A1 (ru) |
| JP (1) | JP5705964B2 (ru) |
| KR (1) | KR101425155B1 (ru) |
| CN (1) | CN103098126B (ru) |
| AR (1) | AR080842A1 (ru) |
| AU (1) | AU2011238010B2 (ru) |
| CA (1) | CA2804907C (ru) |
| ES (3) | ES2701862T3 (ru) |
| MX (1) | MX2012011603A (ru) |
| MY (1) | MY160467A (ru) |
| PL (7) | PL2947655T3 (ru) |
| RU (1) | RU2577195C2 (ru) |
| SG (1) | SG184815A1 (ru) |
| TW (1) | TWI444990B (ru) |
| WO (1) | WO2011124473A1 (ru) |
| ZA (1) | ZA201208364B (ru) |
Families Citing this family (68)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2992917C (en) * | 2010-04-09 | 2020-05-26 | Dolby International Ab | Mdct-based complex prediction stereo coding |
| JP5820464B2 (ja) * | 2010-04-13 | 2015-11-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオまたはビデオエンコーダ、オーディオまたはビデオデコーダ、及び予測方向可変の予測を使用したマルチチャンネルオーディオまたはビデオ信号処理方法 |
| US8654984B2 (en) * | 2011-04-26 | 2014-02-18 | Skype | Processing stereophonic audio signals |
| US9317458B2 (en) * | 2012-04-16 | 2016-04-19 | Harman International Industries, Incorporated | System for converting a signal |
| JP6065452B2 (ja) | 2012-08-14 | 2017-01-25 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
| TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
| WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
| JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
| JP6146069B2 (ja) * | 2013-03-18 | 2017-06-14 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
| RU2625444C2 (ru) | 2013-04-05 | 2017-07-13 | Долби Интернэшнл Аб | Система обработки аудио |
| TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
| EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
| EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
| EP2830054A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
| EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
| SG11201601298WA (en) | 2013-08-23 | 2016-03-30 | Fraunhofer Ges Forschung | Apparatus and method for processing an audio signal using an aliasing error signal |
| CN105637584B (zh) | 2013-09-12 | 2020-03-03 | 杜比国际公司 | 基于qmf的处理数据的时间对齐 |
| WO2015036352A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Coding of multichannel audio content |
| EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
| EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
| EP2980791A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
| DE102015101847B4 (de) * | 2015-02-10 | 2017-11-02 | Eyesense Gmbh | Strahlteiler und Anordnung zur Untersuchung einer mittels elektromagnetischer Strahlung anregbaren Probe |
| EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
| EP3067889A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
| WO2016162283A1 (en) | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
| EP3107096A1 (en) * | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
| US9972334B2 (en) * | 2015-09-10 | 2018-05-15 | Qualcomm Incorporated | Decoder audio classification |
| WO2017125544A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
| MY196436A (en) | 2016-01-22 | 2023-04-11 | Fraunhofer Ges Forschung | Apparatus and Method for Encoding or Decoding a Multi-Channel Signal Using Frame Control Synchronization |
| EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
| US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
| RU2725178C1 (ru) | 2016-11-08 | 2020-06-30 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для кодирования или декодирования многоканального сигнала с использованием коэффициента передачи побочного сигнала и коэффициента передачи остаточного сигнала |
| US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
| CN108877815B (zh) * | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
| US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| US10580420B2 (en) * | 2017-10-05 | 2020-03-03 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
| WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
| EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| BR112020012654A2 (pt) * | 2017-12-19 | 2020-12-01 | Dolby International Ab | métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf |
| TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
| CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
| KR20200000649A (ko) | 2018-06-25 | 2020-01-03 | 네이버 주식회사 | 오디오 병렬 트랜스코딩을 위한 방법 및 시스템 |
| EP3818524B1 (en) * | 2018-07-02 | 2023-12-13 | Dolby Laboratories Licensing Corporation | Methods and devices for generating or decoding a bitstream comprising immersive audio signals |
| CN112352277B (zh) | 2018-07-03 | 2024-05-31 | 松下电器(美国)知识产权公司 | 编码装置及编码方法 |
| US11263550B2 (en) * | 2018-09-09 | 2022-03-01 | International Business Machines Corporation | Audit machine learning models against bias |
| US11308414B2 (en) * | 2018-10-11 | 2022-04-19 | International Business Machines Corporation | Multi-step ahead forecasting using complex-valued vector autoregregression |
| EP3671739A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Apparatus and method for source separation using an estimation and control of sound quality |
| AU2020310952A1 (en) | 2019-07-08 | 2022-01-20 | Voiceage Corporation | Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding |
| US11527252B2 (en) | 2019-08-30 | 2022-12-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | MDCT M/S stereo |
| CN112040435A (zh) * | 2020-09-09 | 2020-12-04 | 成都智联科鸿电子科技有限公司 | 一种多通道捆绑的物联网数据回传装置 |
| MX2023003962A (es) | 2020-10-09 | 2023-05-25 | Fraunhofer Ges Forschung | Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una conversion de parametros. |
| CN116457878A (zh) * | 2020-10-09 | 2023-07-18 | 弗劳恩霍夫应用研究促进协会 | 使用带宽扩展来处理编码音频场景的装置、方法或计算机程序 |
| KR20230084244A (ko) | 2020-10-09 | 2023-06-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
| WO2022074202A2 (en) | 2020-10-09 | 2022-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing |
| US12483272B2 (en) | 2021-02-18 | 2025-11-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding complex data |
| CN113343591B (zh) * | 2021-07-16 | 2022-05-03 | 浙江大学 | 基于自注意力网络的产品关键零件寿命端到端预测方法 |
| CN115691514B (zh) * | 2021-07-29 | 2026-01-02 | 华为技术有限公司 | 一种多声道信号的编解码方法和装置 |
| WO2023031498A1 (en) * | 2021-08-30 | 2023-03-09 | Nokia Technologies Oy | Silence descriptor using spatial parameters |
| WO2023113490A1 (ko) * | 2021-12-15 | 2023-06-22 | 한국전자통신연구원 | 복소수 데이터를 이용한 오디오 처리 방법 및 그를 수행하는 장치 |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB8913758D0 (en) * | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
| US6430529B1 (en) * | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
| SE519976C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
| DE10234130B3 (de) * | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
| US8359197B2 (en) | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
| US6980933B2 (en) | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
| SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
| US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
| US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
| US7917561B2 (en) * | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
| DE102006047197B3 (de) | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
| CN101512639B (zh) | 2006-09-13 | 2012-03-14 | 艾利森电话股份有限公司 | 用于语音/音频发送器和接收器的方法和设备 |
| BRPI0908630B1 (pt) * | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
| PL2301020T3 (pl) * | 2008-07-11 | 2013-06-28 | Fraunhofer Ges Forschung | Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu |
| CA2992917C (en) * | 2010-04-09 | 2020-05-26 | Dolby International Ab | Mdct-based complex prediction stereo coding |
-
2010
- 2010-07-13 EP EP10169432A patent/EP2375409A1/en not_active Withdrawn
-
2011
- 2011-03-23 EP EP11709735.2A patent/EP2543038B1/en active Active
- 2011-03-23 AU AU2011238010A patent/AU2011238010B2/en active Active
- 2011-03-23 WO PCT/EP2011/054485 patent/WO2011124473A1/en not_active Ceased
- 2011-03-23 EP EP15176783.7A patent/EP2947655B1/en active Active
- 2011-03-23 EP EP15176778.7A patent/EP2947653B1/en active Active
- 2011-03-23 MY MYPI2012004489A patent/MY160467A/en unknown
- 2011-03-23 PL PL15176783T patent/PL2947655T3/pl unknown
- 2011-03-23 EP EP15176785.2A patent/EP2947657B1/en active Active
- 2011-03-23 EP EP15176784.5A patent/EP2947656B1/en active Active
- 2011-03-23 KR KR1020127027867A patent/KR101425155B1/ko active Active
- 2011-03-23 ES ES15176776T patent/ES2701862T3/es active Active
- 2011-03-23 SG SG2012075214A patent/SG184815A1/en unknown
- 2011-03-23 ES ES11709735.2T patent/ES2552839T3/es active Active
- 2011-03-23 ES ES15176784T patent/ES2701456T3/es active Active
- 2011-03-23 CA CA2804907A patent/CA2804907C/en active Active
- 2011-03-23 CN CN201180028369.8A patent/CN103098126B/zh active Active
- 2011-03-23 PL PL15176785T patent/PL2947657T3/pl unknown
- 2011-03-23 MX MX2012011603A patent/MX2012011603A/es active IP Right Grant
- 2011-03-23 PL PL15176776T patent/PL2947652T3/pl unknown
- 2011-03-23 PL PL11709735T patent/PL2543038T3/pl unknown
- 2011-03-23 EP EP15176781.1A patent/EP2947654B1/en active Active
- 2011-03-23 EP EP15176776.1A patent/EP2947652B1/en active Active
- 2011-03-23 JP JP2013503057A patent/JP5705964B2/ja active Active
- 2011-03-23 PL PL15176778T patent/PL2947653T3/pl unknown
- 2011-03-23 PL PL15176781T patent/PL2947654T3/pl unknown
- 2011-03-23 PL PL15176784T patent/PL2947656T3/pl unknown
- 2011-03-23 RU RU2012147587/08A patent/RU2577195C2/ru active
- 2011-03-29 TW TW100110751A patent/TWI444990B/zh active
- 2011-04-07 AR ARP110101166A patent/AR080842A1/es active IP Right Grant
-
2012
- 2012-10-05 US US13/645,700 patent/US8655670B2/en active Active
- 2012-11-07 ZA ZA2012/08364A patent/ZA201208364B/en unknown
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2012147587A (ru) | Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания | |
| CA2796292C (en) | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction | |
| KR101617816B1 (ko) | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 | |
| RU2016105613A (ru) | Аудиокодер, аудиодекодер и связанные способы с использованием двухканальной обработки в инфраструктуре интеллектуального заполнения интервалов отсутствия сигнала | |
| RU2016105517A (ru) | Заполнение шумом при многоканальном кодировании аудио | |
| TW201405549A (zh) | 使用改良機率分布估計之基於線性預測的音訊寫碼技術 | |
| US8825494B2 (en) | Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program | |
| US20130103394A1 (en) | Device and method for efficiently encoding quantization parameters of spectral coefficient coding | |
| HK40110179A (en) | Audio decoding method for processing stereo audio signals using a variable prediction direction | |
| HK40113094A (en) | Audio decoding method for processing stereo audio signals using a variable prediction direction | |
| HK40046866A (en) | Audio decoding method for processing stereo audio signals using a variable prediction direction | |
| HK40046866B (en) | Audio decoding method for processing stereo audio signals using a variable prediction direction | |
| HK40046869A (en) | Audio decoder for processing stereo audio using a variable prediction direction | |
| HK40046871B (en) | Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction | |
| HK1183740B (en) | Audio or video encoder, audio or video decoder and method of encoding and decoding | |
| HK1180823B (en) | Decoding of multi-channel audio signals using complex prediction |