KR20200040745A - 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 - Google Patents
다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 Download PDFInfo
- Publication number
- KR20200040745A KR20200040745A KR1020207001183A KR20207001183A KR20200040745A KR 20200040745 A KR20200040745 A KR 20200040745A KR 1020207001183 A KR1020207001183 A KR 1020207001183A KR 20207001183 A KR20207001183 A KR 20207001183A KR 20200040745 A KR20200040745 A KR 20200040745A
- Authority
- KR
- South Korea
- Prior art keywords
- sound field
- field description
- sound
- description
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0346—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of the device orientation or free movement in a three-dimensional [3D] space, e.g. 3D mice, 6-DOF [six degrees of freedom] pointers using gyroscopes, accelerometers or tilt-sensors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
- H04S7/306—For headphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
도 1a는 증강된 음장 묘사를 생성하기 위한 장치의 바람직한 실시예이다.
도 1b는 본 발명의 기초가 되는 예시적인 문제를 설명하는 도면이다.
도 2는 증강된 음장 묘사를 생성하기 위한 장치의 바람직한 구현예이다.
도 3a는 오디오 데이터 및 오디오 데이터를 위한 부수적 정보를 포함하는 증강된 음장 묘사를 도시한다.
도 3b는 오디오 데이터 및 각각의 음장 묘사에 대한 기하형태적 정보와 같은 공간적 정보와 관련된 메타데이터를 포함하는 증강된 음장 묘사의 추가적인 도면을 도시한다.
도 4a는 수정된 음장 묘사를 생성하기 위한 장치의 구현예를 도시한다.
도 4b는 수정된 음장 묘사를 생성하기 위한 장치의 추가적인 구현예를 도시한다.
도 4c는 기준 배치/위치 A, 추가적인 기준 배치/위치 B, 및 병진 운동에 기인한 상이한 기준 위치를 갖는 시나리오를 도시한다.
도 5는 일반적인 의미에서 공간적 오디오의 6DoF 재생을 나타낸다.
도 6a는 음장 계산기의 구현을 위한 바람직한 실시예를 도시한다.
도 6b는 새로운/상이한 기준 위치와 관련하여 음원의 새로운 DoA 및 새로운 거리를 계산하기 위한 바람직한 구현예를 도시한다.
도 6c는, 예를 들어, 각각의 개별적인 음장 묘사를 위한, 증강된 음장 묘사를 생성하기 위한 장치 및 매칭된 음원을 위한 수정된 음장 묘사를 생성하기 위한 장치를 포함하는 6DoF 재생의 바람직한 실시예를 도시한다.
도 7은 광대역 또는 협대역 객체에 대한 수정된 음장을 계산하기 위해서 제1 및 제2 음장 묘사 중 하나를 선택하기 위한 바람직한 실시예를 도시한다.
도 8은 모노-신호와 같은 오디오 신호 및 도달 방향 데이터로부터 음장 묘사를 생성하기 위한 예시적인 장치를 도시한다.
도 9는 음장 계산기의 추가적인 바람직한 실시예를 도시한다.
도 10은 수정된 음장 묘사를 생성하기 위한 장치의 바람직한 구현예를 도시한다.
도 11은 수정된 음장 묘사를 생성하기 위한 장치의 추가적인 바람직한 구현예를 도시한다.
도 12a는 종래 기술의 DirAC 분석 구현예를 도시한다.
도 12b는 종래 기술의 DirAC 합성 구현예를 도시한다.
Claims (50)
- 증강된 음장 묘사를 생성하기 위한 장치에 있어서,
적어도 하나의 기준 위치에 대한 음장을 나타내는 적어도 하나의 음장 묘사를 생성하기 위한 음장 생성기; 및
상기 음장에 관한 공간적 정보와 관련된 메타데이터를 생성하기 위한 메타데이터 생성기를 포함하고,
상기 적어도 하나의 음장 묘사와 상기 메타데이터가 증강된 음장 묘사를 구성하는 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 제1항에 있어서,
상기 음장 생성기는 상기 기준 위치와 관련된 제1 음장 묘사 및 추가적인 기준 위치와 관련된 제2 음장 묘사를 생성하도록 구성되고,
상기 추가적인 기준 위치는 상기 기준 위치와 상이하며,
상기 메타데이터 생성기는, 상기 기준 위치 및 상기 추가적인 기준 위치를 개별적으로 메타데이터로서 결정하도록, 또는 상기 기준 위치와 상기 추가적인 기준 위치 사이의 거리 또는 상기 기준 위치와 상기 추가적인 기준 위치 사이의 위치 벡터를 메타데이터로서 결정하도록 구성되는 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 제2항에 있어서,
상기 제1 음장 묘사는 제1 앰비소닉 묘사이고 상기 제2 음장 묘사는 제2 앰비소닉 묘사이거나, 또는
상기 제1 음장 묘사와 상기 제2 음장 묘사가 앰비소닉 또는 DirAC 묘사 중 어느 하나인 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 제1항 내지 제3항 중 어느 한 항에 있어서,
제1 기하형태적 묘사가, 미리 결정된 원점으로부터 제1 음장 묘사의 기준 위치까지 지향된 제1 벡터에 관한 정보이고, 그리고
제2 기하형태적 묘사가, 미리 결정된 원점으로부터 제2 음장 묘사의 추가적인 기준 위치까지 지향된 제2 벡터에 관한 정보인 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 제1항 내지 제4항 중 어느 한 항에 있어서,
제1 기하 형태적 묘사가, 미리 결정된 원점으로부터 제1 음장 묘사의 기준 위치까지 지향된 제1 벡터 및 미리 결정된 원점으로부터 제2 음장 묘사의 추가적인 기준 위치까지 지향된 제2 벡터 중 하나에 관한 정보, 그리고 상기 기준 위치와 상기 추가적인 기준 위치 사이의 벡터에 관한 정보인 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 기준 위치 및 상기 추가적인 기준 위치 중 하나가 미리 결정된 원점이고, 상기 메타데이터는 상기 미리 결정된 원점과 상기 기준 위치 및 상기 추가적인 기준 위치 중 다른 하나 사이의 벡터에 관한 정보를 포함하는 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 음장 생성기는, 실제 마이크로폰 디바이스를 이용하여 또는 가상 마이크로폰 기술을 이용하는 사운드 합성에 의해서, 상기 제1 음장 묘사 또는 상기 제2 음장 묘사를 생성하도록 구성되는 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 장치.
- 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치에 있어서,
상기 공간적 정보, 상기 음장 묘사, 및 기준 위치로부터 상이한 기준 위치로의 병진 운동을 나타내는 병진 운동 정보를 이용하여 수정된 음장을 계산하기 위한 음장 계산기를 포함하는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항에 있어서,
상기 음장 계산기는, 신호-기반 병진 운동 방법(signal-based translation method)을 이용하여, 수정된 음장 묘사를 계산하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 또는 제9항에 있어서,
상기 음장 계산기가,
상기 제1 기준 위치와 관련된 제1 음장 묘사를 수신하고 상기 기준 위치와 상이한 추가적인 기준 위치와 관련된 제2 음장 묘사를 수신하고,
하나 이상의 추출된 객체의 제1 그룹을 획득하기 위한 제1 음장 묘사 및 하나 이상의 추출된 객체의 제2 그룹을 획득하기 위한 제2 음장 묘사로의 음원 분리를 실시하고,
추출된 객체에 대한 도달 방향(DoA) 데이터를 계산하고,
제1 음장 묘사의 추출된 객체의 제1 그룹 및 제2 음장 묘사의 추출된 객체의 제2 그룹을 매칭시키고,
하나 이상의 매칭된 객체의 위치를 추정하고, 그리고
상기 매칭된 객체의 추정된 위치 및 상기 상이한 기준 위치를 기초로 하나 이상의 매칭된 객체를 수정하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제10항에 있어서,
상기 음장 계산기가,
상기 매칭된 객체의 도달 방향 데이터(direction of arrival data)를 계산하고, 그리고
상기 상이한 기준 위치에 대한 계산된 도달 방향 데이터를 이용하여 각각의 매칭된 객체에 대한 음장 묘사를 결정하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제9항 내지 제11항 중 어느 한 항에 있어서,
상기 음장 계산기는, 비-매칭된 객체(non-matched objects)를 위해서 획득된 도달 방향 데이터를 이용하여 하나 이상의 비-매칭된 객체에 대한 음장 데이터를 계산하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제9항 내지 제12항 중 어느 한 항에 있어서,
상기 음장 계산기는, 상기 하나 이상의 매칭된 객체 및 상기 하나 이상의 비-매칭된 객체에 대한 음장 묘사 데이터를 조합하는 것에 의해서 상기 수정된 음장 묘사를 계산하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항에 있어서,
상기 음장 계산기는 파라메트릭-기반의 병진 운동 방법(parametric-based translation method)을 실시하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 또는 제14항에 있어서,
상기 음장 계산기는,
음장 모델을 가정하고,
가정된 음장의 신호 성분 및/또는 매개변수를 추정하고,
상기 병진 운동 정보에 따라 또는 상기 상이한 기준 위치에 따라 상기 신호 성분 및/또는 매개변수를 수정하고, 그리고
상기 수정된 신호 성분 및/또는 상기 수정된 매개변수를 이용하여 상기 수정된 음장 묘사를 생성하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제15항에 있어서,
상기 음장 계산기는, 상기 음장을 하나 이상의 다이렉트 사운드 성분 및 하나 이상의 확산 사운드 성분으로 분해하는 것을 이용하여 또는 상기 음장을 하나 이상의 다이렉트/주 사운드 성분 및 잔류 사운드 성분으로 분해하는 것을 이용하여 상기 신호 성분 및/또는 상기 매개변수를 추정하도록 구성되고, 상기 잔류 사운드 성분은 단일-채널 신호 또는 다중-채널 신호일 수 있는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제16항 중 어느 한 항에 있어서,
상기 음장 계산기는 상기 수정된 음장 묘사의 회전을 적용하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제12항 중 어느 한 항에 있어서,
상기 수정된 음장 묘사가 앰비소닉 음장 묘사인 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제18항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는,
상기 음장 묘사로서, 제1 음장 묘사 및 제2 음장 묘사를 수신하고,
상기 제1 및 제2 음장 묘사에서 음원 분리를 수행하여 상기 제1 및 제2 음장 묘사의 음원 및 추출된 음원에 대한 도달 방향(DoA) 데이터를 추출하고,
각각의 추출된 음원에 대해서, 상기 DoA 데이터 및 상기 병진 운동 정보를 이용하여 상기 상이한 위치와 관련된 수정된 DoA 데이터를 계산하고,
상기 수정된 음장 묘사를 획득하기 위해서 상기 추출된 음원 및 상기 수정된 DoA 데이터를 프로세스하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제19항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는,
각각의 음장 묘사에 대해서 음원 분리를 개별적으로 실시하고 그리고 각각의 음장 묘사에 대해서 주변/확산/잔류 신호를 추출하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제20항 중 어느 한 항에 있어서,
병진 운동 정보 또는 상기 수정된 음장에 대한 의도된 청취자의 회전을 나타내는 회전 정보를 제공하기 위한 병진 운동 인터페이스(410);
상기 메타데이터를 상기 음장 계산기(420)에 공급하기 위한 메타데이터 공급기(402, 400);
상기 음장 묘사를 상기 음장 계산기(420)에 공급하기 위한 음장 공급기(404, 400); 및
상기 수정된 음장 묘사 및 상기 병진 운동 정보를 이용하여 상기 메타데이터로부터 유도된 수정된 메타데이터를 포함하는 수정된 음장을 출력하기 위한, 또는 각각이 미리 규정된 라우드스피커 위치와 관련되는, 복수의 라우드스피커 채널을 출력하기 위한, 또는 상기 수정된 음장의 바이노럴 표상을 출력하기 위한 출력 인터페이스(421)를 더 포함하는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제21항 중 어느 한 항에 있어서,
상기 음장 묘사가 복수의 음장 성분을 포함하고, 상기 복수의 음장 성분은 전방향 성분 및 적어도 하나의 방향성 성분을 포함하며,
상기 음장 계산기는,
상이한 주파수 빈(different frequency bins)들에 대해서, 도달 방향 정보를 유도하기 위해서 상기 음장 성분을 분석하기 위한 음장 분석기(422);
거리 정보를 상기 주파수 빈에 의해서 표시된 음원에 연관시키는 깊이 맵을 포함하는 메타데이터와 상기 방향 정보를 이용하여 주파수 빈 마다 수정된 도달 방향 정보를 계산하기 위한 병진 운동 변환기(423)메타데이터; 및
상기 음원에 대한 깊이 맵에 의해서 제공되는 거리에 따라 달라지는 거리 보상 정보 및 상기 수정된 도달 방향 정보와 관련된 주파수 빈과 연관된 새로운 거리를 이용하여 상기 수정된 음장을 계산하기 위한 거리 보상기를 포함하는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제22항 중 어느 한 항에 있어서,
하나 이상의 음원을 위한 상기 음장 계산기(420)는,
상기 음장의 분석(1102)에 의해서 얻어진 상기 기준 위치로부터 음원(510)으로 향하는 제1 벡터를 계산하고(1104);
상기 제1 벡터, 및 상기 기준 위치(522)로부터 상기 상이한 기준 위치(500)로의 병진 운동 벡터를 규정하는 상기 병진 운동 정보를 이용하여, 상이한 기준 위치(500)로부터 음원(510)으로 향하는 제2 벡터를 계산하고(1106); 그리고
상기 상이한 기준 위치(500), 상기 음원(510)의 위치, 및 상기 제2 벡터를 이용하여, 또는 상기 상이한 기준 위치(500)로부터 상기 음원(510)의 위치 및 상기 제2 벡터를 이용하여, 거리 수정 값을 계산하도록(1106) 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제23항 중 어느 한 항에 있어서,
도달 방향 단위 벡터와 상기 메타데이터 내에 포함된 거리를 곱하는 것에 의해서 제1 벡터가 계산되거나,
제1 벡터로부터 병진 운동 벡터를 차감함으로써 제2 벡터가 계산되거나,
제2 벡터를 제1 벡터의 노름(norm)으로 나누는 것에 의해서 상기 거리 수정 값이 계산되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제24항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는, 상기 병진 운동 정보에 더하여, 회전 정보를 수신하도록 구성되고, 그리고
상기 음장 계산기(420)는 상기 회전 정보를 이용하여 음장에 대한 도달 방향 데이터를 회전시키기 위해서 회전 변환(424)을 실시하도록 구성되고,
상기 도달 방향 데이터는 상기 음장 묘사의 음장 분석에 의해서 그리고 상기 병진 운동을 이용하여 얻어진 도달 방향 데이터로부터 유도되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제25항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는,
음장 분석에 의해서 상기 음장 묘사 및 상기 음원에 대한 방향으로부터 음원을 결정하고(1200, 1240);
음원에 대해서, 상기 메타데이터를 이용하여 상기 기준 위치로부터 상기 음원의 거리를 결정하고(1220);
상기 음원에 대한 방향 및 상기 병진 운동 정보를 이용하여 상기 상이한 기준 위치와 관련된 상기 음원의 새로운 방향을 결정하고(1250);
상기 상이한 기준 위치와 관련된 음원에 대한 새로운 거리 정보를 결정하고(1230); 그리고
음원의 새로운 방향, 새로운 거리 정보, 및 음장 묘사 또는 음장 묘사로부터 유도된 음원에 상응하는 음원 신호를 이용하여 상기 수정된 음장을 생성하도록(1260) 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제26항 중 어느 한 항에 있어서,
상기 음장 계산기는,
사운드 분석에 의해서 상기 음장 묘사 및 상기 기준 위치와 관련된 음원 신호의 방향으로부터 음원 신호를 결정하고(1200);
상기 병진 운동 정보를 이용하여 상기 상이한 기준 위치와 관련된 음원 신호의 새로운 방향을 계산하고(1230);
상기 상이한 기준 위치와 관련된 음원에 대한 거리 정보를 계산하고(1230); 그리고
상기 거리 정보, 상기 음원 신호 및 상기 새로운 방향을 이용하여 상기 수정된 음장을 합성하도록(1260) 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제27항에 있어서,
상기 음장 계산기(420)는,
리플레이 설정과 관련하여 새로운 방향에 의해서 주어진 방향에 대해서 음원 신호를 패닝하는 것에 의해서, 그리고 패닝 실시 전에 또는 패닝 실시 후에 거리 정보를 이용하여 음원 신호를 스케일링하는 것에 의해서 상기 수정된 음장을 합성하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제27항 또는 제28항에 있어서,
상기 음장 계산기(420)는 확산 신호를 상기 음원 신호의 다이렉트 부분에 부가하도록 구성되고, 상기 다이렉트 부분은 상기 확산 신호에 부가되기 전에 상기 거리 정보에 의해서 수정되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제27항 내지 제29항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는,
상기 음장 묘사의 시간-주파수 변환을 실시하며 시간 프레임의 복수의 주파수 빈에 대해서 도달 방향을 계산하고(422),
각각의 주파수 빈에 대해서 새로운 방향을 계산하고(423, 424),
각각의 주파수 빈에 대해서 거리 정보를 계산하고, 그리고
각각의 주파수 빈에 대해서, 해당 주파수 빈에 대한 오디오 신호와, 해당 주파수 빈에 대한 새로운 방향으로부터 유도된 해당 주파수 빈에 대한 패닝 이득와, 그리고 상기 상응 음원에 대한 거리 정보로부터 유도된 해당 주파수 빈에 대한 스케일링 인자를 이용하여 다이렉트 합성을 실시하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제30항에 있어서,
상기 음장 계산기(420)는,
상기 주파수 빈에 대한 오디오 신호로부터 유도된 확산 오디오 신호를 이용하여 그리고 상기 주파수 빈에 대한 사운드 분석에 의해서 유도된 확산 매개변수를 이용하여 확산 합성을 수행하며 상기 주파수 빈에 대한 합성된 오디오 신호를 획득하기 위해서 상기 다이렉트 부분 및 상기 확산 부분을 조합하고; 그리고
상기 수정된 음장으로서 시간 도메인 합성된 오디오 신호를 획득하기 위해서 시간 프레임에 대해서 상기 주파수 빈에 대한 오디오 신호를 이용하여 주파수-시간 변환을 실시하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제27항 내지 제31항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는, 각각의 음원에 대해서, 상기 상이한 기준 위치와 관련된 음장을 합성하도록 구성되고,
상기 합성은,
각각의 음원에 대해서, 상기 상이한 기준 위치와 관련된 음원 신호의 음장 묘사를 획득하기 위해서 상기 음원 신호에 대한 새로운 방향을 이용하여 음원 신호를 프로세싱하는 것(430);
상기 음원 신호를 프로세싱하기 전에 상기 음원 신호를 수정하는 것 또는 상기 방향 정보를 이용하여 상기 음장 묘사를 수정하는 것; 그리고
상기 상이한 기준 위치와 관련된 수정된 음장을 획득하기 위해서 상기 음원에 대한 상기 음장 묘사를 부가하는 것을 포함하는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제27항 내지 제32항 중 어느 한 항에 있어서,
상기 사운드 분석(1200)은 음원 분리 알고리즘에 의해서 상기 음원 신호를 결정하고 그리고 상기 확산 신호를 획득하기 위해서 상기 음원 신호의 적어도 일부를 상기 음장 묘사로부터 차감하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제33항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는, 각각의 매칭된 음원에 대한 도달 방향 정보를 결정하되,
상기 도달 방향 정보 및 적어도 하나의 음장 묘사를 위한 메타데이터를 이용하여 새로운 기준 위치에 대한 음원의 거리를 결정하고,
상기 새로운 기준 위치에 대한 음원의 거리를 이용하여 스케일링 인자를 결정하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제8항 내지 제34항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는,
상기 메타데이터를 이용하여 하나 이상의 추출된 객체의 제1 그룹 또는 하나 이상의 추출된 객체에 대한 도달 방향 정보를 획득하기 위해서 음장 묘사에 대해서 그리고 하나 이상의 추출 객체의 제2 그룹 또는 하나 이상의 추출된 객체에 대한 도달 방향 정보를 획득하기 위해서 추가적인 기준 위치와 관련된 추가적인 음장 묘사에 대해서 사운드 분석을 수행하고(700, 740, 741);
적어도 하나의 매칭된 객체를 찾기 위해서 상기 그룹으로부터의 객체 신호 또는 상기 그룹으로부터 객체에 대한 도달 방향 정보를 이용하여 상기 제1 그룹 및 상기 제2 그룹을 매칭시키고(704);
상기 메타데이터 및 상기 제1 그룹을 획득하기 위해서 상기 사운드 분석을 실시하는 것에 의해서 상기 매칭된 객체에 대해서 얻어진 제1 도달 방향 정보 및 상기 제2 그룹을 획득하기 위해서 상기 사운드 분석을 실시하는 것에 의해서 상기 매칭된 객체에 대해서 얻어진 제2 도달 방향 정보를 이용하여 상기 매칭된 객체의 추정 위치를 계산하고(706, 746);
상기 추정된 위치 및 상기 병진 운동 정보를 기초로 거리 보상 프로세스를 상기 매칭된 객체에 적용하도록(710, 748) 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제35항에 있어서,
상기 사운드 분석은 각각의 시간-주파수 빈에 대한 신호 및 각각의 시간-주파수 빈에 대한 도달 방향 값 및 선택적인 확산 값을 초래하는 DirAC 분석(740, 741)이고,
상기 매칭은 각각의 개별적인 시간-주파수 빈에 대해서 수행되어 적어도 하나의 빈을 상기 매칭된 객체로서 결정하고, 그리고
상기 적어도 하나의 빈에 대한 추정된 위치가 계산되는(746) 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제35항에 있어서,
상기 사운드 분석은 추출된 광대역 신호 및 추출된 광대역 신호에 대한 도달 방향 정보 그리고, 선택적으로, 확산 신호를 초래하는 광대역 음원 분석(700)이고,
상기 음원 매칭(704)은 제1 그룹으로부터의 추출된 광대역 신호 및 제2 그룹으로부터의 추출된 광대역 신호의 각각의 쌍에 대한 상관화 수단(correlation measure)을 이용하여 상기 추출된 광대역 신호에 대해서 수행되고, 그리고
상기 적어도 하나의 매칭된 광대역 객체에 대한 추정된 위치가 계산되는(706) 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제35항 내지 제37항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는 상기 음장 묘사로부터 유도된 제1 도달 방향 정보 및 상기 추가적인 음장 묘사로부터 유도된 제2 도달 방향 정보, 그리고 상기 기준 위치와 상기 추가적인 기준 위치 사이의 벡터를 유도하는데 이용될 수 있는 정보를 포함하는 상기 메타데이터를 이용하여 상기 매칭된 객체의 위치의 계산을 실시하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제1항 내지 제38항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는, 상기 상이한 기준 위치와 관련된 매칭된 객체에 대한 음장 묘사의 계산을 위해서, 병진 운동 정보에 의해서 결정된 청취자 위치에 대한 기준 위치 또는 추가적인 기준 위치의 거리에 따라 음장 묘사에 관련된 또는 추가적인 음장 묘사에 관련된 정보를 선택하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제39항에 있어서,
상기 음장 계산기는,
상기 기준 위치와 상기 새로운 청취자 위치 사이의 제1 거리를 계산하고(720);
상기 추가적인 기준 위치와 상기 새로운 청취자 위치 사이의 제2 거리를 계산하고(722);
상기 제1 및 제2 거리 중 더 작은 거리를 가지는 기준 위치를 갖는 음장 묘사를 선택하도록(724) 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제35항 내지 제40항 중 어느 한 항에 있어서,
상기 음장 계산기는, 각각의 매칭된 객체에 대해서, 상기 음장 묘사 및 상기 추가적인 음장 묘사로부터 유도된 도달 방향 정보 중 하나를 이용하여 새로운 도달 방향 정보를 계산하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제40항 또는 제41항에 있어서,
상기 음장 계산기(420)는, 각각의 매칭된 객체에 대해서, 새로운 도달 방향 정보를 이용하여 음장 묘사를 계산하도록, 그리고 상기 매칭된 객체의 추정된 위치를 이용하여 상기 음원 신호 또는 상기 음원 신호의 음장 묘사를 스케일링하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제35항 내지 제42항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는, 상응하는 도달 방향 정보를 이용하여, 상기 제1 그룹으로부터 각각의 비-매칭 객체에 대한 음장 묘사를 계산하도록 그리고 제2 그룹으로부터 각각의 비-매칭 객체에 대한 음장 묘사를 계산하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제43항에 있어서,
상기 음장 계산기(420)는, 상기 매칭된 객체의 음장 묘사 및 상기 비-매칭 객체의 음장 묘사를 조합하는 것(712)에 의해서 상기 수정된 음장을 계산하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 제35항 내지 제44항 중 어느 한 항에 있어서,
상기 음장 계산기(420)는 상기 제1 그룹 및 상기 제2 그룹 중 적어도 하나에 대한 확산 신호에 관한 정보를 결정하도록 구성되고, 그리고
상기 음장 계산기는 확산 신호를 매칭된 객체의 음장 묘사 또는 비-매칭 객체의 음장 묘사에 부가하도록 구성되는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 장치.
- 증강된 음장 묘사를 생성하기 위한 방법에 있어서,
적어도 하나의 기준 위치에 대한 음장을 나타내는 적어도 하나의 음장 묘사를 생성하는 단계; 및
상기 음장의 공간 정보와 관련된 메타데이터를 생성하는 단계를 포함하고,
상기 적어도 하나의 음장 묘사와 상기 메타데이터가 증강된 음장 묘사를 구성하는 것을 특징으로 하는 증강된 음장 묘사를 생성하기 위한 방법.
- 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 방법에 있어서,
상기 공간적 정보, 상기 음장 묘사, 및 기준 위치로부터 상이한 기준 위치로의 병진 운동을 나타내는 병진 운동 정보를 이용하여 수정된 음장을 계산하는 단계를 포함하는 것을 특징으로 하는 음장 묘사 및 음장 묘사의 공간적 정보와 관련된 메타데이터로부터 수정된 음장 묘사를 생성하기 위한 방법.
- 컴퓨터 또는 프로세서 상에서 동작될 때, 제46항의 방법 또는 제47항의 방법을 실시하기 위한 컴퓨터 프로그램.
- 증강된 음장 묘사로서,
적어도 하나의 기준 위치에 대한 음장을 나타내는 적어도 하나의 음장 묘사 및 상기 음장의 공간 정보와 관련된 메타데이터를 포함하는 것을 특징으로 하는 증강된 음장 묘사.
- 제49항에 있어서,
상기 적어도 하나의 음장 묘사가 상기 기준 위치와 관련된 제1 음장 묘사 및 추가적인 기준 위치와 관련된 제2 음장 묘사를 포함하고, 상기 추가적인 기준 위치는 상기 기준 위치와 상이하며, 그리고
상기 메타데이터는, 개별적으로 상기 기준 위치 및 상기 추가적인 기준 위치 또는 상기 기준 위치와 상기 추가적인 기준 위치 사이의 거리 또는 상기 기준 위치와 상기 추가적인 기준 위치 사이의 위치 벡터 또는 상기 기준 위치 및 상기 추가적인 기준 위치와 관련된 임의의 정보를 포함하는 것을 특징으로 하는 증강된 음장 묘사.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020227021791A KR102654507B1 (ko) | 2017-07-14 | 2018-07-13 | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP17181488 | 2017-07-14 | ||
| EP17181488.2 | 2017-07-14 | ||
| PCT/EP2018/069140 WO2019012131A1 (en) | 2017-07-14 | 2018-07-13 | CONCEPT FOR GENERATING AN ENHANCED AUDIO FIELD DESCRIPTION OR A MODIFIED AUDIO FIELD DESCRIPTION USING A MULTIPOINT SOUND FIELD DESCRIPTION |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227021791A Division KR102654507B1 (ko) | 2017-07-14 | 2018-07-13 | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20200040745A true KR20200040745A (ko) | 2020-04-20 |
| KR102491818B1 KR102491818B1 (ko) | 2023-01-26 |
Family
ID=59631530
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020207001183A Active KR102491818B1 (ko) | 2017-07-14 | 2018-07-13 | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
| KR1020227021791A Active KR102654507B1 (ko) | 2017-07-14 | 2018-07-13 | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227021791A Active KR102654507B1 (ko) | 2017-07-14 | 2018-07-13 | 다중-지점 음장 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
Country Status (15)
| Country | Link |
|---|---|
| US (3) | US11463834B2 (ko) |
| EP (1) | EP3652735A1 (ko) |
| JP (2) | JP7119060B2 (ko) |
| KR (2) | KR102491818B1 (ko) |
| CN (2) | CN111149155B (ko) |
| AR (1) | AR112451A1 (ko) |
| AU (1) | AU2018298874C1 (ko) |
| BR (1) | BR112020000775A2 (ko) |
| CA (1) | CA3069241C (ko) |
| MY (1) | MY204183A (ko) |
| RU (1) | RU2736418C1 (ko) |
| SG (1) | SG11202000330XA (ko) |
| TW (1) | TWI713866B (ko) |
| WO (1) | WO2019012131A1 (ko) |
| ZA (1) | ZA202000020B (ko) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20220071869A (ko) * | 2020-11-24 | 2022-05-31 | 네이버 주식회사 | 사용자 맞춤형 현장감 실현을 위한 오디오 콘텐츠를 제작하는 컴퓨터 시스템 및 그의 방법 |
| US11930349B2 (en) | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for producing audio content for realizing customized being-there and method thereof |
| US11930348B2 (en) | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for realizing customized being-there in association with audio and method thereof |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118824259A (zh) | 2018-04-11 | 2024-10-22 | 杜比国际公司 | 用于6dof音频渲染的方法、设备和系统及用于6dof音频渲染的数据表示和位流结构 |
| US10735882B2 (en) * | 2018-05-31 | 2020-08-04 | At&T Intellectual Property I, L.P. | Method of audio-assisted field of view prediction for spherical video streaming |
| CN112352278A (zh) * | 2018-07-04 | 2021-02-09 | 索尼公司 | 信息处理装置和方法以及程序 |
| WO2020072297A1 (en) | 2018-10-03 | 2020-04-09 | Arizona Board Of Regents On Behalf Of Arizona State University | Direct rf signal processing for heart-rate monitoring using uwb impulse radar |
| US11019449B2 (en) * | 2018-10-06 | 2021-05-25 | Qualcomm Incorporated | Six degrees of freedom and three degrees of freedom backward compatibility |
| GB2582748A (en) * | 2019-03-27 | 2020-10-07 | Nokia Technologies Oy | Sound field related rendering |
| WO2021018378A1 (en) | 2019-07-29 | 2021-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for processing a sound field representation in a spatial transform domain |
| JP7578219B2 (ja) | 2019-07-30 | 2024-11-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数のスピーカーを通じた複数のオーディオ・ストリームの再生の管理 |
| WO2021021752A1 (en) | 2019-07-30 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Coordination of audio devices |
| US11341952B2 (en) * | 2019-08-06 | 2022-05-24 | Insoundz, Ltd. | System and method for generating audio featuring spatial representations of sound sources |
| CN110544486B (zh) * | 2019-09-02 | 2021-11-02 | 上海其高电子科技有限公司 | 基于麦克风阵列的语音增强方法及系统 |
| US11690563B2 (en) | 2019-10-28 | 2023-07-04 | Arizona Board Of Regents On Behalf Of Arizona State University | Methods and systems for remote sleep monitoring |
| US11988772B2 (en) * | 2019-11-01 | 2024-05-21 | Arizona Board Of Regents On Behalf Of Arizona State University | Remote recovery of acoustic signals from passive sources |
| DE112020005550T5 (de) * | 2019-11-13 | 2022-09-01 | Sony Group Corporation | Signalverarbeitungsvorrichtung, verfahren und programm |
| WO2021127286A1 (en) | 2019-12-18 | 2021-06-24 | Dolby Laboratories Licensing Corporation | Audio device auto-location |
| CN112153538B (zh) * | 2020-09-24 | 2022-02-22 | 京东方科技集团股份有限公司 | 显示装置及其全景声实现方法、非易失性存储介质 |
| FR3115103B1 (fr) * | 2020-10-12 | 2023-05-12 | Renault Sas | Dispositif et procédé de mesure et de visualisation d’un champ sonore |
| CN114584913B (zh) * | 2020-11-30 | 2023-05-16 | 华为技术有限公司 | Foa信号和双耳信号的获得方法、声场采集装置及处理装置 |
| GB2602148A (en) * | 2020-12-21 | 2022-06-22 | Nokia Technologies Oy | Audio rendering with spatial metadata interpolation and source position information |
| US11653166B2 (en) * | 2021-05-27 | 2023-05-16 | Qualcomm Incorporated | Directional audio generation with multiple arrangements of sound sources |
| EP4396810A1 (en) * | 2021-09-03 | 2024-07-10 | Dolby Laboratories Licensing Corporation | Music synthesizer with spatial metadata output |
| GB202114833D0 (en) * | 2021-10-18 | 2021-12-01 | Nokia Technologies Oy | A method and apparatus for low complexity low bitrate 6dof hoa rendering |
| CN116567516A (zh) * | 2022-01-28 | 2023-08-08 | 华为技术有限公司 | 一种音频处理方法和终端 |
| JP2025529877A (ja) * | 2022-08-24 | 2025-09-09 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数のデバイスによってキャプチャされた音声のレンダリング |
| CN119889341B (zh) * | 2025-01-17 | 2025-09-19 | 中国科学技术大学 | 方位引导的语音拾取方法和语音拾取装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20140000240A (ko) * | 2010-11-05 | 2014-01-02 | 톰슨 라이센싱 | 고차 앰비소닉 오디오 데이터를 위한 데이터 구조 |
| WO2017098949A1 (ja) * | 2015-12-10 | 2017-06-15 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
Family Cites Families (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB1512514A (en) * | 1974-07-12 | 1978-06-01 | Nat Res Dev | Microphone assemblies |
| JPH08107600A (ja) | 1994-10-04 | 1996-04-23 | Yamaha Corp | 音像定位装置 |
| US5970152A (en) * | 1996-04-30 | 1999-10-19 | Srs Labs, Inc. | Audio enhancement system for use in a surround sound environment |
| JP2006074589A (ja) | 2004-09-03 | 2006-03-16 | Matsushita Electric Ind Co Ltd | 音響処理装置 |
| EP2205007B1 (en) | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
| EP2346028A1 (en) * | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
| ES2525839T3 (es) * | 2010-12-03 | 2014-12-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Adquisición de sonido mediante la extracción de información geométrica de estimativos de dirección de llegada |
| EP2469741A1 (en) | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
| EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
| EP2600637A1 (en) | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for microphone positioning based on a spatial power density |
| EP2600343A1 (en) | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
| CN104054126B (zh) | 2012-01-19 | 2017-03-29 | 皇家飞利浦有限公司 | 空间音频渲染和编码 |
| US9516446B2 (en) | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
| JP6038312B2 (ja) | 2012-07-27 | 2016-12-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ラウドスピーカ・エンクロージャ・マイクロホンシステム記述を提供する装置及び方法 |
| WO2014036121A1 (en) * | 2012-08-31 | 2014-03-06 | Dolby Laboratories Licensing Corporation | System for rendering and playback of object based audio in various listening environments |
| US9769588B2 (en) | 2012-11-20 | 2017-09-19 | Nokia Technologies Oy | Spatial audio enhancement apparatus |
| CN104019885A (zh) | 2013-02-28 | 2014-09-03 | 杜比实验室特许公司 | 声场分析系统 |
| US9959875B2 (en) * | 2013-03-01 | 2018-05-01 | Qualcomm Incorporated | Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams |
| US9384741B2 (en) * | 2013-05-29 | 2016-07-05 | Qualcomm Incorporated | Binauralization of rotated higher order ambisonics |
| US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
| US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
| CN104244164A (zh) * | 2013-06-18 | 2014-12-24 | 杜比实验室特许公司 | 生成环绕立体声声场 |
| US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
| EP2866475A1 (en) | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
| EP2884491A1 (en) * | 2013-12-11 | 2015-06-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Extraction of reverberant sound using microphone arrays |
| DE102013225892A1 (de) | 2013-12-13 | 2015-06-18 | Robert Bosch Gmbh | Schrägscheibenmaschine, Schrägscheibe und Verfahren zur hydrostatischen Entlastung einer Stellteilanbindung einer Schrägscheibenmaschine und zum Druckabbau eines Arbeitsmediums während eines Umsteuervorgangs der Schrägscheibenmaschine |
| CN109996166B (zh) | 2014-01-16 | 2021-03-23 | 索尼公司 | 声音处理装置和方法、以及程序 |
| US10412522B2 (en) * | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
| EP3007167A1 (en) | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
| CN105635635A (zh) | 2014-11-19 | 2016-06-01 | 杜比实验室特许公司 | 调节视频会议系统中的空间一致性 |
| US10659906B2 (en) | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
| US10182303B1 (en) * | 2017-07-12 | 2019-01-15 | Google Llc | Ambisonics sound field navigation using directional decomposition and path distance estimation |
-
2018
- 2018-07-13 BR BR112020000775-7A patent/BR112020000775A2/pt not_active Application Discontinuation
- 2018-07-13 AR ARP180101958 patent/AR112451A1/es active IP Right Grant
- 2018-07-13 JP JP2020500728A patent/JP7119060B2/ja active Active
- 2018-07-13 RU RU2020106725A patent/RU2736418C1/ru active
- 2018-07-13 CN CN201880060064.7A patent/CN111149155B/zh active Active
- 2018-07-13 EP EP18737640.5A patent/EP3652735A1/en not_active Withdrawn
- 2018-07-13 MY MYPI2019007862A patent/MY204183A/en unknown
- 2018-07-13 CN CN202311248978.5A patent/CN117319917A/zh active Pending
- 2018-07-13 SG SG11202000330XA patent/SG11202000330XA/en unknown
- 2018-07-13 KR KR1020207001183A patent/KR102491818B1/ko active Active
- 2018-07-13 WO PCT/EP2018/069140 patent/WO2019012131A1/en not_active Ceased
- 2018-07-13 AU AU2018298874A patent/AU2018298874C1/en not_active Ceased
- 2018-07-13 CA CA3069241A patent/CA3069241C/en active Active
- 2018-07-13 KR KR1020227021791A patent/KR102654507B1/ko active Active
- 2018-07-16 TW TW107124520A patent/TWI713866B/zh active
-
2020
- 2020-01-02 ZA ZA2020/00020A patent/ZA202000020B/en unknown
- 2020-01-10 US US16/740,272 patent/US11463834B2/en active Active
-
2022
- 2022-08-03 JP JP2022124044A patent/JP2022153626A/ja active Pending
- 2022-08-29 US US17/898,016 patent/US11950085B2/en active Active
-
2023
- 2023-11-17 US US18/513,090 patent/US12302086B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20140000240A (ko) * | 2010-11-05 | 2014-01-02 | 톰슨 라이센싱 | 고차 앰비소닉 오디오 데이터를 위한 데이터 구조 |
| WO2017098949A1 (ja) * | 2015-12-10 | 2017-06-15 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
Non-Patent Citations (32)
| Title |
|---|
| -, "Spatial sound reproduction with directional audio coding," Journal Audio Eng. Soc., vol. 55, no. 6, pp. 503-516, Jun. 2007. |
| [10] Rungta, A., Schissler, C., Rewkowski, N., Mehra, R., and Manocha, D., "Diffraction Kernels for Interactive Sound Propagation in Dynamic Environments," IEEE Trans. Visualization & Comp. Graphics, 24(4), pp. 1613-1622, 2018. |
| Anderson, R., Gallup, D., Barron, J. T., Kontkanen, J., Snavely, N., Esteban, C. H., Agarwal, S., and Seitz, S. M., "Jump: Virtual Reality Video," ACM Transactions on Graphics, 35(6), p. 198, 2016. |
| Bates, E. and Boland, F., "Spatial Music, Virtual Reality, and 360 Media," in Audio Eng. Soc. Int. Conf. on Virtual and Augmented Reality, Los Angeles, CA, U.S.A., 2016. |
| Blauert, J., Spatial Hearing - Revised Edition: The Psychophysics of Human Sound Localization, The MIT Press, 1996, ISBN 0262024136. |
| BorB, C., "A polygon-based panning method for 3D loudspeaker setups," in Audio Eng. Soc. Conv., pp. 343-352, Los Angeles, CA, USA, 2014. |
| C. Faller and F. Baumgarte, "Binaural cue coding - part ii: Schemes and applications, "IEEE Trans. Speech Audio Process,, vol. 11, no. 6, Nov. 2003. |
| C. Faller, "Parametric multichannel audio coding: Synthesis of coherence cues," IEEE Trans. Speech Audio Process., vol. 14, no. 1, Jan. 2006. |
| C. G. and G. M., "Coincident microphone simulation covering three dimensional space and yielding various directional outputs," U.S. Patent 4042779, 1977. |
| Engelke, U., Darcy, D. P., Mulliken, G. H., Bosse, S., Martini, M. G., Arndt, S., Antons, J.-N., Chan, K. Y., Ramzan, N., and Brunnstrom, K., "Psychophysiology-Based QoE Assessment: A Survey," IEEE Selected Topics in Signal Processing, 11(1), pp. 6-21, 2017. |
| H. P. J. E. E. Schuijers, J. Breebaart, "Low complexity parametric stereo coding," in Proc, of the 116th A ES Convention, Berlin, Germany, 2004. |
| International Telecommunication Union, "ITU-R BS. 1534-3, Method for the subjective assessment of intermediate quality level of audio systems," 2015. |
| J. G. Tylka and E. Y. Choueiri, "Comparison of techniques for binaural navigation of higher- order ambisonics sound fields," in Proc, of the AES International Conference on Audio for Virtual and Augmented Reality, New York, Sep. 2016. |
| Khaddour, H., Schimmel, J., and Rund, F., "A Novel Combined System of Direction Estimation and Sound Zooming of Multiple Speakers," Radioengineering, 24(2), 2015. |
| Kowalczyk, K., Thiergart. O., Taseska, M., Del Galdo, G., Pulkki, V., and Habets, E. A. P., "Parametric Spatial Sound Processing: A Flexible and Efficient Solution to Sound Scene Acquisition, Modification, and Reproduction," IEEE Signal Process. Mag., 32(2), pp. 31-42, 2015. |
| Kronlachner, M. and Zotter, F., "Spatial Transformations for the Enhancement of Ambisonics Recordings," in 2nd International Conference on Spatial Audio, Erlangen, Germany, 2014. |
| Kuttruff, H., Room Acoustics, Taylor & Francis, 4 edition, 2000. |
| Liitola, T., Headphone sound externalization, Ph.D. thesis, Helsinki University of Technology. Department of Electrical and Communications Engineering Laboratory of Acoustics and Audio Signal Processing., 2006. |
| M. A. Gerzon, "Periphony: With-height sound reproduction," J. Acoust. Soc. Am., vol. 21,110, 1, pp. 2-10, 1973. |
| Merimaa, J., Analysis, Synthesis, and Perception of Spatial Sound: Binaural Localization Modeling and Multichannel Loudspeaker Reproduction, Ph.D. thesis, Helsinki University of Technology, 2006. |
| Pulkki, V., "Spatial Sound Reproduction with Directional Audio Coding," J. Audio Eng. Soc., 55(6), pp. 503-516, 2007. |
| Rummukainen. O., Schlecht, S., Plinge, A., and Habets, E. A. P., '"Evaluating Binaural Reproduction Systems from Behavioral Patterns in a Virtual Reality - A Case Study with Impaired Binaural Cues and Tracking Latency," in Audio Eng. Soc. Conv. 143, New York, NY, USA, 2017. |
| Schlecht, S. J. and Habets, E. A. P., "Sign-Agnostic Matrix Design for Spatial Artificial Reverberation with Feedback Delay Networks," in Proc. Audio Eng. Soc. Conf., pp. 1-10- accepted, Tokyo, Japan, 2018. |
| Taylor, M., Chandak, A., Mo, Q., Lauterbach, C., Schissler, C., and Manocha, D., "Guided multi-view ray tracing for fast auralization," IEEE Trans. Visualization & Comp. Graphics, 18, pp. 1797- 1810, 2012. |
| Thiergart, O., Del Galdo, G., Kuech, F., and Prus, M., "Three-Dimensional Sound Field Analysis with Directional Audio Coding Based on Signal Adaptive Parameter Estimators," in Audio Eng. Soc. Conv. Spatial Audio: Sense the Sound of Space, 2010. |
| Thiergart. O., Galdo, G. D., Taseska, M., and Habets, E. A. P., "Geometry-Based Spatial Sound Acquisition using Distributed Microphone Arrays," IEEE Trans. Audio, Speech, Language Process., 21(12), pp. 2583-2594, 2013. |
| Thiergart. O., Kowalczyk, K., and Habets, E. A. P., "An Acoustical Zoom based on Informed Spatial Filtering," in Int. Workshop on Acoustic Signal Enhancement, pp. 109- 113, 2014. |
| Tsingos, N., Gallo, E., and Drettakis, G., "Perceptual Audio Rendering of Complex Virtual Environments," ACM Transactions on Graphics, 23(3), pp. 249-258, 2004. |
| V. Pulkki, "Directional audio coding in spatial sound reproduction and stereo upmixing," in Proc, of the 28th AES International Conference, 2006. |
| V. Pulkki, "Virtual sound source positioning using vector base amplitude panning," J. Acoust. Soc. A m., vol. 45, no. 6, pp. 456-466, Jun. 1997. |
| Zhang, W., Samarasinghe, P. N., Chen, H., and Abhayapala, T. D., "Surround by Sound: A Re-view of Spatial Audio Recording and Reproduction," Applied Sciences, 7(5), p. 532, 2017. |
| Ziegler, M., Keinert, J., Holzer, N., Wolf, T., Jaschke, T., op het Veld, R., Zakeri, F. S., and Foessel, S., "Immersive Virtual Reality for Live-Action Video using Camera Arrays," in IBC, Amsterdam, Netherlands, 2017. |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20220071869A (ko) * | 2020-11-24 | 2022-05-31 | 네이버 주식회사 | 사용자 맞춤형 현장감 실현을 위한 오디오 콘텐츠를 제작하는 컴퓨터 시스템 및 그의 방법 |
| US11930349B2 (en) | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for producing audio content for realizing customized being-there and method thereof |
| US11930348B2 (en) | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for realizing customized being-there in association with audio and method thereof |
| US11942096B2 (en) | 2020-11-24 | 2024-03-26 | Naver Corporation | Computer system for transmitting audio content to realize customized being-there and method thereof |
Also Published As
| Publication number | Publication date |
|---|---|
| US20220417695A1 (en) | 2022-12-29 |
| RU2736418C1 (ru) | 2020-11-17 |
| JP7119060B2 (ja) | 2022-08-16 |
| TWI713866B (zh) | 2020-12-21 |
| EP3652735A1 (en) | 2020-05-20 |
| TW201909657A (zh) | 2019-03-01 |
| CA3069241A1 (en) | 2019-01-17 |
| CA3069241C (en) | 2023-10-17 |
| WO2019012131A1 (en) | 2019-01-17 |
| JP2020527746A (ja) | 2020-09-10 |
| AU2018298874C1 (en) | 2023-10-19 |
| US20200228913A1 (en) | 2020-07-16 |
| MY204183A (en) | 2024-08-14 |
| AU2018298874A1 (en) | 2020-02-20 |
| BR112020000775A2 (pt) | 2020-07-14 |
| KR102654507B1 (ko) | 2024-04-05 |
| AR112451A1 (es) | 2019-10-30 |
| ZA202000020B (en) | 2021-10-27 |
| JP2022153626A (ja) | 2022-10-12 |
| CN111149155A (zh) | 2020-05-12 |
| US11463834B2 (en) | 2022-10-04 |
| KR20220098261A (ko) | 2022-07-11 |
| US11950085B2 (en) | 2024-04-02 |
| CN117319917A (zh) | 2023-12-29 |
| US12302086B2 (en) | 2025-05-13 |
| SG11202000330XA (en) | 2020-02-27 |
| AU2018298874B2 (en) | 2021-08-19 |
| US20240098445A1 (en) | 2024-03-21 |
| KR102491818B1 (ko) | 2023-01-26 |
| CN111149155B (zh) | 2023-10-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12302086B2 (en) | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description | |
| US11863962B2 (en) | Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description | |
| KR102448736B1 (ko) | 깊이-확장형 DirAC 기술 또는 기타 기술을 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20200114 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210226 Patent event code: PE09021S01D |
|
| E90F | Notification of reason for final refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20211224 Patent event code: PE09021S02D |
|
| PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20220624 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221019 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230119 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20230120 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |






