RU2015148317A - Устройство и способ масштабирования центрального сигнала и улучшения стереофонии на основе отношения сигнал-понижающее микширование - Google Patents

Устройство и способ масштабирования центрального сигнала и улучшения стереофонии на основе отношения сигнал-понижающее микширование Download PDF

Info

Publication number
RU2015148317A
RU2015148317A RU2015148317A RU2015148317A RU2015148317A RU 2015148317 A RU2015148317 A RU 2015148317A RU 2015148317 A RU2015148317 A RU 2015148317A RU 2015148317 A RU2015148317 A RU 2015148317A RU 2015148317 A RU2015148317 A RU 2015148317A
Authority
RU
Russia
Prior art keywords
signal
information
denotes
audio
audio channels
Prior art date
Application number
RU2015148317A
Other languages
English (en)
Other versions
RU2663345C2 (ru
Inventor
Кристиан УЛЕ
Петер ПРОКАЙН
Оливер ХЕЛЛЬМУТ
Себастьян ШАРРЕР
Эмануэль ХАБЕТС
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015148317A publication Critical patent/RU2015148317A/ru
Application granted granted Critical
Publication of RU2663345C2 publication Critical patent/RU2663345C2/ru

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Claims (82)

1. Устройство для генерации модифицированного аудиосигнала, содержащего два или более модифицированных аудиоканалов, из входного аудиосигнала, включающего в себя два или более входных аудиоканалов, причем устройство содержит:
генератор (110) информации для генерации информации сигнал-понижающее микширование, причем генератор (110) информации выполнен с возможностью генерации информации сигнала путем комбинирования спектральных значений каждого из упомянутых двух или более входных аудиоканалов первым способом, причем генератор (110) информации выполнен с возможностью генерации информации понижающего микширования путем комбинирования спектральных значений каждого из упомянутых двух или более входных аудиоканалов вторым способом, отличным от первого способа, причем генератор (110) информации выполнен с возможностью комбинирования информации сигнала и информации понижающего микширования для получения информации сигнал-понижающее микширование, и
аттенюатор (120) сигналов для ослабления двух или более входных аудиоканалов в зависимости от информации сигнал-понижающее микширование для получения двух или более модифицированных аудиоканалов,
причем генератор (110) информации выполнен с возможностью генерации информации
Figure 00000001
сигнала в соответствии с формулой:
Figure 00000002
,
причем генератор (110) информации выполнен с возможностью генерации информации
Figure 00000003
понижающего микширования в соответствии с формулой
Figure 00000004
, и
причем генератор (110) информации выполнен с возможностью генерации отношения сигнал-понижающее микширование в виде информации Rg(m, k, β) сигнал-понижающее микширование в соответствии с формулой
Figure 00000005
,
где X(m, k) обозначает входной аудиосигнал, причем
Figure 00000006
,
где N обозначает количество входных аудиоканалов входного аудиосигнала,
m обозначает временной индекс, и k обозначает индекс частоты,
X1(m, k) обозначает первый входной аудиоканал, XN(m, k) обозначает N-й входной аудиоканал,
V обозначает матрицу или вектор,
W обозначает матрицу или вектор,
H обозначает сопряженное транспонирование матрицы или вектора,
Figure 00000007
представляет собой операцию математического ожидания,
β представляет собой вещественное число, где β>0, и
tr{ } представляет собой след матрицы.
2. Устройство по п. 1, в котором V представляет собой вектор-строку длины N, чьи элементы равны единице и W представляет собой единичную матрицу размера N×N.
3. Устройство по п. 1, в котором V =[1,1], W=[1,-1],и N=2.
4. Устройство по п. 1, в котором количество модифицированных аудиоканалов равно количеству входных аудиоканалов, или в котором количество модифицированных аудиоканалов меньше, чем количество входных аудиоканалов.
5. Устройство по п. 1, в котором генератор (110) информации выполнен с возможностью обработки спектрального значения каждого из двух или более входных аудиоканалов для получения двух или более обработанных значений, и в котором генератор (110) информации выполнен с возможностью комбинирования двух или более обработанных значений для получения информации сигнала, и
в котором генератор (110) информации выполнен с возможностью комбинирования спектральных значений каждого из двух или более входных аудиоканалов для получения
комбинированного значения, и в котором генератор (110) информации выполнен с возможностью обработки комбинированного значения для получения информации понижающего микширования.
6. Устройство по п. 1, в котором генератор (110) информации выполнен с возможностью обработки спектральных значений каждого из двух или более входных аудиоканалов путем умножения упомянутого спектрального значения на комплексное сопряжение упомянутого спектрального значения для получения автоспектральной плотности мощности упомянутого спектрального значения для каждого из упомянутых двух или более входных аудиоканалов.
7. Устройство по п. 6, в котором генератор (110) информации выполнен с возможностью обработки комбинированного значения путем определения спектральной плотности мощности комбинированного значения.
8. Устройство по п. 7, в котором генератор (110) информации выполнен с возможностью определения:
Figure 00000008
,
для получения информации сигнала,
где
Figure 00000009
обозначает автоспектральную плотность мощности спектрального значения i-го канала аудиосигнала.
9. Устройство по п. 8, в котором генератор (110) информации выполнен с возможностью определения
Figure 00000010
,
для получения отношения сигнал-понижающее микширование,
где
Figure 00000011
представляет собой спектральную плотность мощности комбинированного значения.
10. Устройство по п. 1, в котором аттенюатор (120) сигналов выполнен с возможностью ослабления упомянутых двух или более входных аудиоканалов в зависимости от функции усиления G(m, k) в соответствии с формулой
Figure 00000012
,
где функция G(m, k) усиления зависит от информации сигнал-понижающее микширование, и функция G(m, k) усиления представляет собой монотонно возрастающую функцию информации сигнал-понижающее микширование или монотонно убывающую функцию информации сигнал-понижающее микширование,
X(m, k) обозначает входной аудиосигнал,
Y(m, k) обозначает модифицированный аудиосигнал,
m обозначает временной индекс, и
k обозначает индекс частоты.
11. Устройство по п. 10,
в котором функция G(m, k) усиления представляет собой первую функцию
Figure 00000013
, вторую функцию
Figure 00000014
, третью функцию
Figure 00000015
или четвертую функцию
Figure 00000016
,
причем
Figure 00000017
,
Figure 00000018
,
Figure 00000019
,
Figure 00000020
,
β представляет собой вещественное число, β>0,
γ представляет собой вещественное число, γ>0, и
Rmin обозначает минимум R.
12. Система, содержащая:
фазовый компенсатор (210) для генерации компенсированного по фазе аудиосигнала, содержащего два или более компенсированных по фазе аудиоканалов, из необработанного аудиосигнала, содержащего два или более необработанных аудиоканалов, и
устройство (220) согласно одному из предшествующих пунктов для приема компенсированного по фазе аудиосигнала в качестве входного аудиосигнала и для генерации модифицированного аудиосигнала, содержащего два или более модифицированных аудиоканалов, из входного аудиосигнала, содержащего два или более компенсированных по фазе аудиоканалов, в качестве двух или более входных аудиоканалов,
причем один из упомянутых двух или более необработанных аудиоканалов является опорным каналом,
причем фазовый компенсатор (210) выполнен с возможностью оценки для каждого необработанного аудиоканала из упомянутых двух или более необработанных аудиоканалов, который не является опорным каналом, функции передачи фазы между упомянутыми необработанным аудиоканалом и опорным каналом, и
причем фазовый компенсатор (210) выполнен с возможностью генерации компенсированного по фазе аудиосигнала с помощью модификации каждого необработанного аудиоканала из упомянутых необработанных аудиоканалов, который не является опорным каналом, в зависимости от функции передачи фазы упомянутого необработанного аудиоканала.
13. Способ генерации модифицированного аудиосигнала, содержащего два или более модифицированных аудиоканалов, из входного аудиосигнала, включающего в себя два или более входных аудиоканалов, причем способ содержит:
генерацию информации сигнала с помощью комбинирования спектральных значений каждого из упомянутых двух или более входных аудиоканалов первым способом,
генерацию информации понижающего микширования путем комбинирования спектральных значений каждого из упомянутых двух или более входных аудиоканалов вторым способом, отличным от первого способа,
генерацию информации сигнал-понижающее микширование путем комбинирования информации сигнала и информации понижающего микширования, и
ослабление упомянутых двух или более входных аудиоканалов в зависимости от информации сигнал-понижающее микширование для получения двух или более модифицированных аудиоканалов,
причем генерацию информации
Figure 00000021
сигнала выполняют в
соответствии с формулой:
Figure 00000022
,
генерацию информации
Figure 00000023
понижающего микширования выполняют в соответствии с формулой
Figure 00000024
, и
отношение сигнал-понижающее микширование генерируют в виде информации Rg(m, k, β) сигнал-понижающее микширование в соответствии с формулой
Figure 00000025
,
где X(m, k) обозначает входной аудиосигнал, причем
Figure 00000026
N обозначает количество входных аудиоканалов входного аудиосигнала,
m обозначает временной индекс, и k представляет собой индекс частоты,
X1(m, k) обозначает первый входной аудиоканал, XN(m, k) обозначает N-й входной аудиоканал,
V обозначает матрицу или вектор,
W обозначает матрицу или вектор,
H обозначает сопряженное транспонирование матрицы или вектора,
Figure 00000027
представляет собой операцию математического ожидания,
β представляет собой вещественное число, где β>0, и
tr{} представляет собой след матрицы.
14. Компьютерная программа для осуществления способа по п. 13 при ее выполнении на компьютере или сигнальном процессоре.
RU2015148317A 2013-04-12 2014-04-07 Устройство и способ масштабирования центрального сигнала и улучшения стереофонии на основе отношения сигнал-понижающее микширование RU2663345C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13163621.9 2013-04-12
EP13163621 2013-04-12
EP13182103.5 2013-08-28
EP13182103.5A EP2790419A1 (en) 2013-04-12 2013-08-28 Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
PCT/EP2014/056917 WO2014166863A1 (en) 2013-04-12 2014-04-07 Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio

Publications (2)

Publication Number Publication Date
RU2015148317A true RU2015148317A (ru) 2017-05-18
RU2663345C2 RU2663345C2 (ru) 2018-08-03

Family

ID=48087459

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015148317A RU2663345C2 (ru) 2013-04-12 2014-04-07 Устройство и способ масштабирования центрального сигнала и улучшения стереофонии на основе отношения сигнал-понижающее микширование

Country Status (12)

Country Link
US (1) US9743215B2 (ru)
EP (2) EP2790419A1 (ru)
JP (1) JP6280983B2 (ru)
KR (1) KR101767330B1 (ru)
CN (1) CN105284133B (ru)
BR (1) BR112015025919B1 (ru)
CA (1) CA2908794C (ru)
ES (1) ES2755675T3 (ru)
MX (1) MX347466B (ru)
PL (1) PL2984857T3 (ru)
RU (1) RU2663345C2 (ru)
WO (1) WO2014166863A1 (ru)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2790419A1 (en) 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
CN106024005B (zh) * 2016-07-01 2018-09-25 腾讯科技(深圳)有限公司 一种音频数据的处理方法及装置
JP7008716B2 (ja) * 2016-11-08 2022-01-25 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
EP3550561A1 (en) * 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
CN117809663A (zh) 2018-12-07 2024-04-02 弗劳恩霍夫应用研究促进协会 从包括至少两个声道的信号产生声场描述的装置、方法
EP3671739A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Apparatus and method for source separation using an estimation and control of sound quality
MX2021010570A (es) 2019-03-06 2021-10-13 Fraunhofer Ges Forschung Mezcladora para reducir el numero de canales de audio y metodo de mezclado para reducir el numero de canales de audio.
CN113259283B (zh) * 2021-05-13 2022-08-26 侯小琪 一种基于循环神经网络的单通道时频混叠信号盲分离方法
CN113889125B (zh) * 2021-12-02 2022-03-04 腾讯科技(深圳)有限公司 音频生成方法、装置、计算机设备和存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630500B1 (en) 1994-04-15 2009-12-08 Bose Corporation Spatial disassembly processor
US8214221B2 (en) * 2005-06-30 2012-07-03 Lg Electronics Inc. Method and apparatus for decoding an audio signal and identifying information included in the audio signal
EP2038878B1 (en) * 2006-07-07 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for combining multiple parametrically coded audio sources
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
JP4327886B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8705769B2 (en) * 2009-05-20 2014-04-22 Stmicroelectronics, Inc. Two-to-three channel upmix for center channel derivation
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
EP2464145A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a downmixer
EP2790419A1 (en) 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio

Also Published As

Publication number Publication date
KR101767330B1 (ko) 2017-08-23
CN105284133A (zh) 2016-01-27
EP2984857A1 (en) 2016-02-17
MX347466B (es) 2017-04-26
CA2908794A1 (en) 2014-10-16
KR20150143669A (ko) 2015-12-23
US20160037283A1 (en) 2016-02-04
BR112015025919A2 (pt) 2017-07-25
CN105284133B (zh) 2017-08-25
EP2790419A1 (en) 2014-10-15
ES2755675T3 (es) 2020-04-23
PL2984857T3 (pl) 2020-03-31
MX2015014189A (es) 2015-12-11
BR112015025919B1 (pt) 2022-03-15
JP6280983B2 (ja) 2018-02-14
CA2908794C (en) 2019-08-20
US9743215B2 (en) 2017-08-22
JP2016518621A (ja) 2016-06-23
EP2984857B1 (en) 2019-09-11
RU2663345C2 (ru) 2018-08-03
WO2014166863A1 (en) 2014-10-16

Similar Documents

Publication Publication Date Title
RU2015148317A (ru) Устройство и способ масштабирования центрального сигнала и улучшения стереофонии на основе отношения сигнал-понижающее микширование
JP5612125B2 (ja) マルチチャネル脱相関を使った改善されたマルチチャネル上方混合
RU2015146225A (ru) Аудиоустройство и способ предоставления аудиоустройством аудио
CN102568493B (zh) 一种基于最大矩阵对角率的欠定盲分离方法
RU2009147727A (ru) Способ и устройство для генерации стереосигнала с усовершенствованным перцепционным качеством
EP3785453B1 (en) Blind detection of binauralized stereo content
RU2013131774A (ru) Устройство и способ для разложения входного сигнала с использованием понижающего микшера
CN102222508A (zh) 一种基于矩阵变换的欠定盲分离方法
WO2010089357A4 (en) Sound system
RU2011106584A (ru) Устройство для определения преобразованного пространственного звукового сигнала
RU2013154768A (ru) Устройство и способ генерирования выходного сигнала с применением блока разложения сигнала
MX2021006565A (es) Aparato, metodo y programa de computadora para codificacion, decodificacion, procesamiento de escenas y otros procedimientos relacionados con codificacion de audio espacial basada en dirac que utiliza compensacion difusa.
JP5753270B2 (ja) 多チャネルオーディオ信号をダウンミックスする方法及び装置
RU2016106975A (ru) Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
RU2009104047A (ru) Концепция для объединения множества параметрически кодированных аудиоисточников
US20150317983A1 (en) Methods and systems for processing and mixing signals using signal decomposition
CA2835742C (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
WO2021252795A2 (en) Perceptual optimization of magnitude and phase for time-frequency and softmask source separation systems
US10497379B2 (en) Method and device for processing internal channels for low complexity format conversion
RU2011126333A (ru) Устройство для создания многоканального аудиосигнала
CN104424971A (zh) 一种音频文件播放方法及装置
US9478223B2 (en) Method and apparatus for down-mixing multi-channel audio
CN109997369B (zh) 用于处理音频信号的方法、装置和计算机程序
KR102627374B1 (ko) 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
US10504528B2 (en) Method and device for processing internal channels for low complexity format conversion