KR20190067902A - 사운드 처리 방법 및 장치 - Google Patents
사운드 처리 방법 및 장치 Download PDFInfo
- Publication number
- KR20190067902A KR20190067902A KR1020197014937A KR20197014937A KR20190067902A KR 20190067902 A KR20190067902 A KR 20190067902A KR 1020197014937 A KR1020197014937 A KR 1020197014937A KR 20197014937 A KR20197014937 A KR 20197014937A KR 20190067902 A KR20190067902 A KR 20190067902A
- Authority
- KR
- South Korea
- Prior art keywords
- sound signal
- sound
- current frame
- signal
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S11/00—Systems for determining distance or velocity not using reflection or reradiation
- G01S11/14—Systems for determining distance or velocity not using reflection or reradiation using ultrasonic, sonic or infrasonic waves
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic or infrasonic waves
-
- G06K9/00221—
-
- G06K9/00268—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- H04M1/7255—
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers
- H04R3/005—Circuits for transducers for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers
- H04R3/04—Circuits for transducers for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S2205/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S2205/01—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations specially adapted for specific applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Studio Devices (AREA)
Abstract
Description
도 2a, 도 2b, 또는 도 2c는 본 발명의 실시예에 따른 단말 상의 마이크로폰의 배열의 개략도이며,
도 3은 본 발명의 실시예에 따른 사운드 처리 방법의 흐름도이고,
도 4a는 단말의 전방 및 후방 마이크로폰 간의 에너지 차이 및 ILD 간의 관계의 개략도이며,
도 4b는 마이크로폰을 사용함으로써 사운드 소스 측위 동안에 사운드 소스 방향을 판정하는 것의 개략도이고,
도 5는 위상 차이에 기반한 사운드 소스 측위 기술의 원리도이며,
도 6은 일반화된 상호 상관(cross-correlation) 사운드 소스 측위 방법의 개략적인 구현도이고,
도 7은 본 발명의 실시예에 따른 사운드 처리 장치의 개략적인 구조도이다.
Claims (22)
- 사운드 처리 방법으로서,
상기 방법은 상부에 2개의 마이크로폰을 갖는 단말에 적용되고, 상기 2개의 마이크로폰은 상기 단말의 전방 표면 및 후방 표면 상에 각각 위치되며, 상기 방법은,
상기 단말의 카메라가 촬영 상태에 있는 경우, 상기 2개의 마이크로폰을 사용함으로써 상기 단말의 현재 환경에서 현재 프레임의 사운드 신호를 획득하는 단계와,
제1 사전설정된 알고리즘에 따라 상기 현재 프레임의 상기 획득된 사운드 신호에 기반하여 상기 2개의 마이크로폰 간의 양이 레벨 차이(interaural level difference)를 계산하는 단계와,
상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 사운드 소스 방향 판정 조건을 충족하는지를 판정하는 단계와,
상기 사운드 소스 방향 판정 조건이 충족되는 경우, 상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이에 기반하여, 상기 현재 프레임의 상기 사운드 신호가 후방 사운드 신호를 포함하는지를 판정하는 단계 - 상기 후방 사운드 신호는 사운드 소스가 상기 카메라의 후방에 위치된 사운드 신호임 - 와,
상기 현재 프레임의 상기 사운드 신호가 상기 후방 사운드 신호를 포함한다고 판정되는 경우, 상기 현재 프레임의 상기 사운드 신호로부터 상기 후방 사운드 신호를 걸러 내는(filtering out) 단계를 포함하는,
사운드 처리 방법. - 제1항에 있어서,
상기 2개의 마이크로폰을 사용함으로써 상기 단말의 현재 환경에서 현재 프레임의 사운드 신호를 획득하는 단계는,
상기 2개의 마이크로폰을 사용함으로써, 상기 현재 프레임의 상기 사운드 신호 S1 및 S2를 획득하는 단계를 포함하고,
제1 사전설정된 알고리즘에 따라 상기 획득된 사운드 신호에 기반하여 상기 2개의 마이크로폰 간의 양이 레벨 차이를 계산하는 단계는,
고속 푸리에 변환(Fast Fourier Transformation: FFT) 알고리즘을 사용함으로써 S1 및 S2에 기반하여 S1 및 S2의 파워 스펙트럼(power spectrum) P1 및 P2을 계산하는 단계와,
공식 을 사용함으로써 P1 및 P2에 기반하여 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이를 계산하는 단계를 포함하되,
P1은 상기 현재 프레임에서 상부-전방 마이크로폰에 대응하는 파워 사운드 스펙트럼을 나타내고, P2는 상기 현재 프레임에서 상부-후방 마이크로폰에 대응하는 파워 사운드 스펙트럼을 나타내며, P1 및 P2는 각각 N개의 요소를 갖는 벡터이고, 상기 N개의 요소는 상기 현재 프레임의 상기 사운드 신호에 대해 고속 푸리에 변환이 수행된 후에 획득되는 N개의 대응하는 주파수 포인트의 값이며, N은 1보다 큰 정수이고, ILDnow는 상기 N개의 주파수 포인트에 대응하는 양이 레벨 차이를 포함하는 벡터인,
사운드 처리 방법. - 제2항에 있어서,
상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 사운드 소스 방향 판정 조건을 충족하는지를 판정하는 단계는,
제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 양이 레벨 차이를 사용함으로써 제2 사전설정된 알고리즘에 따라, 상기 제i 주파수 포인트에 대응하는 최대 참조 값 및 최소 참조 값을 계산하는 단계 - 상기 제i 주파수 포인트는 상기 N개의 주파수 포인트 중 하나이고, i는 N보다 크지 않은 모든 양의 정수라고 가정됨 - 와,
상기 제i 주파수 포인트의 상기 최대 참조 값 및 상기 최소 참조 값 간의 차이가 상기 제i 주파수 포인트에 대응하는 제1 임계치보다 큰 경우, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제i 주파수 포인트 상에서 상기 사운드 소스 방향 판정 조건을 충족한다고 판정하는 단계,
상기 최대 참조 값 및 상기 최소 참조 값 간의 차이가 상기 제i 주파수 포인트에 대응하는 제1 임계치보다 크지 않은 경우, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제i 주파수 포인트 상에서 상기 사운드 소스 방향 판정 조건을 충족하지 않는다고 판정하는 단계, 또는
상기 N개의 주파수 포인트 중의 M개의 주파수 포인트가 상기 사운드 소스 방향 판정 조건을 충족하는 경우, 상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 사운드 소스 방향 판정 조건을 충족한다고 판정하는 단계 - M은 N/2보다 크거나 같음 - 를 포함하는,
사운드 처리 방법. - 제3항에 있어서,
제i 주파수 포인트에 대응하는 상기 2개의 마이크로폰 간의 양이 레벨 차이를 사용함으로써 제2 사전설정된 알고리즘에 따라, 상기 제i 주파수 포인트에 대응하는 최대 참조 값 및 최소 참조 값을 계산하는 단계는,
제(i-1) 주파수 포인트에 대응하는 최대 참조 값을 획득하는 단계 - 상기 제(i-1) 주파수 포인트는 상기 제i 주파수 포인트의 이전 주파수 포인트임 - 와, 상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최대 참조 값보다 크지 않은 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최대 참조 값을 계산하는 단계, 또는
상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최대 참조 값보다 큰 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최대 참조 값을 계산하는 단계와,
상기 제(i-1) 주파수 포인트에 대응하는 최소 참조 값을 획득하는 단계와, 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최소 참조 값보다 큰 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최소 참조 값을 계산하는 단계, 또는
상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최소 참조 값보다 크지 않은 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최소 참조 값을 계산하는 단계를 포함하되,
ILDnow는 상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이를 나타내고, ILDmax는 제i 주파수 포인트에 대응하는 상기 최대 참조 값을 나타내며, 은 제(i-1) 주파수 포인트에 대응하는 상기 최대 참조 값을 나타내고, ILDmin은 제i 주파수 포인트에 대응하는 상기 최소 참조 값을 나타내며, 은 제(i-1) 주파수 포인트에 대응하는 상기 최소 참조 값을 나타내고, 및 은 사전설정된 스텝 값을 나타내며, 인,
사운드 처리 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이에 기반하여, 상기 현재 프레임의 상기 사운드 신호가 후방 사운드 신호를 포함하는지를 판정하는 단계는,
제j 주파수 포인트에 대응하는 양이 레벨 차이가 상기 제j 주파수 포인트에 대응하는 제2 임계치보다 작은 경우, 상기 제j 주파수 포인트에서 후방 사운드 신호가 포함된다고 판정하는 단계 - 상기 제j 주파수 포인트는 상기 M개의 주파수 포인트 중 하나이고, j는 M보다 크지 않은 모든 양의 정수라고 가정됨 - , 또는
제j 주파수 포인트에 대응하는 상기 2개의 마이크로폰 간의 양이 레벨 차이가 제2 임계치보다 작지 않은 경우, 상기 제j 주파수 포인트에서 어떠한 후방 사운드 신호도 포함되지 않는다고 판정하는 단계를 포함하는,
사운드 처리 방법. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 현재 프레임의 상기 사운드 신호로부터 상기 후방 사운드 신호를 걸러 내는 단계는,
촬영을 수행하고 있는 상기 단말의 상기 카메라가 전면(front-facing) 카메라인 경우, 상부-후방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 후방 사운드 신호를 걸러 내도록(filter out) 상기 단말 내의 적응 필터를 제어하는 단계, 또는
촬영을 수행하고 있는 상기 단말의 상기 카메라가 후면(rear-facing) 카메라인 경우, 상부-전방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 후방 사운드 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하는 단계를 포함하는,
사운드 처리 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 단말이 하부에 제3 마이크로폰을 더 포함하고, 촬영을 수행하고 있는 상기 카메라가 전면 카메라인 경우, 상기 방법은,
상기 제3 마이크로폰 및 상부-전방 마이크로폰에 의해 획득된, 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위(delay difference based positioning)를 수행하여 상기 현재 프레임의 상기 사운드 신호의 상하 방위각(up-down azimuth)을 획득하는 단계와,
상기 상하 방위각이 제1 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정하는 단계 - 상기 부차적 잡음 신호는 상기 전면 카메라의 전방에 위치되고 상기 전면 카메라의 촬영 범위를 넘어서 위치된 잡음 신호임 - 와,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상부-후방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상기 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하는 단계를 더 포함하는,
사운드 처리 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 단말이 하부에 제3 마이크로폰을 더 포함하고, 촬영을 수행하고 있는 상기 카메라는 후면 카메라인 경우, 상기 방법은,
상기 제3 마이크로폰 및 상부-후방 마이크로폰에 의해 획득된, 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 상하 방위각을 획득하는 단계와,
상기 상하 방위각이 제1 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정하는 단계 - 상기 부차적 잡음 신호는 상기 후면 카메라의 전방에 위치되고 상기 후면 카메라의 촬영 범위를 넘어서 위치된 잡음 신호임 - 와,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상부-전방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상기 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하는 단계를 더 포함하는,
사운드 처리 방법. - 제7항에 있어서,
상기 단말이 하부에 제4 마이크로폰을 더 포함하고, 상기 제3 마이크로폰 및 상기 제4 마이크로폰이 좌측에서 우측으로 상기 단말의 상기 하부에 배열되는 경우, 상기 방법은,
상기 제3 마이크로폰 및 상기 제4 마이크로폰에 의해 획득된, 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 좌우 방위각(left-right azimuth)을 획득하는 단계와,
상기 좌우 방위각이 제2 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정하는 단계와,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상기 상부-후방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상기 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 상기 적응 필터를 제어하는 단계를 더 포함하는,
사운드 처리 방법. - 제8항에 있어서,
상기 단말이 하부에 제4 마이크로폰을 더 포함하고, 상기 제3 마이크로폰 및 상기 제4 마이크로폰이 좌측에서 우측으로 상기 단말의 상기 하부에 배열되는 경우, 상기 방법은,
상기 제3 마이크로폰 및 상기 제4 마이크로폰에 의해 획득된, 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 좌우 방위각을 획득하는 단계와,
상기 좌우 방위각이 제2 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정하는 단계와,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상기 상부-전방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상기 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 상기 적응 필터를 제어하는 단계를 더 포함하는,
사운드 처리 방법. - 사운드 처리 장치로서,
상기 장치는 상부에 2개의 마이크로폰을 갖는 단말에 적용되고, 상기 2개의 마이크로폰이 상기 단말의 전방 표면 및 후방 표면 상에 각각 위치되며, 상기 장치는,
상기 단말의 카메라가 촬영 상태에 있는 경우, 상기 2개의 마이크로폰을 사용함으로써 상기 단말의 현재 환경에서 현재 프레임의 사운드 신호를 획득하도록 구성된 획득 모듈과,
제1 사전설정된 알고리즘에 따라 상기 현재 프레임의 상기 획득된 사운드 신호에 기반하여 상기 2개의 마이크로폰 간의 양이 레벨 차이를 계산하도록 구성된 계산 모듈과,
상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 사운드 소스 방향 판정 조건을 충족하는지를 판정하도록 구성된 판단 모듈과,
상기 사운드 소스 방향 판정 조건이 충족되는 경우, 상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이에 기반하여, 상기 현재 프레임의 상기 사운드 신호가 후방 사운드 신호를 포함하는지를 판정하도록 구성된 판정 모듈 - 상기 후방 사운드 신호는 사운드 소스가 상기 카메라의 후방에 위치된 사운드 신호임 - 과,
상기 현재 프레임의 상기 사운드 신호가 상기 후방 사운드 신호를 포함한다고 판정되는 경우, 상기 현재 프레임의 상기 사운드 신호로부터 상기 후방 사운드 신호를 걸러 내도록 구성된 필터링 모듈을 포함하는,
사운드 처리 장치. - 제11항에 있어서,
상기 획득 모듈은,
상기 2개의 마이크로폰을 사용함으로써, 상기 현재 프레임의 상기 사운드 신호 S1 및 S2를 획득하도록 구체적으로 구성되고,
상기 계산 모듈은,
고속 푸리에 변환(FFT) 알고리즘을 사용함으로써 S1 및 S2에 기반하여 S1 및 S2의 파워 스펙트럼 P1 및 P2를 계산하고,
공식 을 사용함으로써 P1 및 P2에 기반하여 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이를 계산하도록 구체적으로 구성되되,
P1은 상기 현재 프레임에서 상부-전방 마이크로폰에 대응하는 파워 사운드 스펙트럼을 나타내고, P2는 상기 현재 프레임에서 상부-후방 마이크로폰에 대응하는 파워 사운드 스펙트럼을 나타내며, P1 및 P2 각각은 N개의 요소를 갖는 벡터이고, 상기 N개의 요소는 상기 현재 프레임의 상기 사운드 신호에 대해 고속 푸리에 변환이 수행된 후에 획득되는 N개의 대응하는 주파수 포인트의 값이며, N은 1보다 큰 정수이고, ILDnow는 상기 N개의 주파수 포인트에 대응하는 양이 레벨 차이를 포함하는 벡터인,
사운드 처리 장치. - 제12항에 있어서,
상기 판단 모듈은,
제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 양이 레벨 차이를 사용함으로써 제2 사전설정된 알고리즘에 따라, 상기 제i 주파수 포인트에 대응하는 최대 참조 값 및 최소 참조 값을 계산 - 상기 제i 주파수 포인트는 상기 N개의 주파수 포인트 중 하나이고, i는 N보다 크지 않은 모든 양의 정수라고 가정됨 - 하고,
상기 제i 주파수 포인트의 상기 최대 참조 값 및 상기 최소 참조 값 간의 차이가 상기 제i 주파수 포인트에 대응하는 제1 임계치보다 큰 경우, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제i 주파수 포인트 상에서 상기 사운드 소스 방향 판정 조건을 충족한다고 판정하거나,
상기 최대 참조 값 및 상기 최소 참조 값 간의 차이가 상기 제i 주파수 포인트에 대응하는 제1 임계치보다 크지 않은 경우, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제i 주파수 포인트 상에서 상기 사운드 소스 방향 판정 조건을 충족하지 않는다고 판정하거나,
상기 N개의 주파수 포인트 중의 M개의 주파수 포인트가 상기 사운드 소스 방향 판정 조건을 충족하는 경우, 상기 현재 프레임에 대한 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 사운드 소스 방향 판정 조건을 충족한다고 판정 - M은 N/2보다 크거나 같음 - 하도록 구체적으로 구성된,
사운드 처리 장치. - 제13항에 있어서,
상기 판단 모듈은,
제(i-1) 주파수 포인트에 대응하는 최대 참조 값을 획득 - 상기 제(i-1) 주파수 포인트는 상기 제i 주파수 포인트의 이전 주파수 포인트임 - 하고, 상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최대 참조 값보다 크지 않은 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최대 참조 값을 계산하거나,
상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최대 참조 값보다 큰 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최대 참조 값을 계산하고,
상기 제(i-1) 주파수 포인트에 대응하는 최소 참조 값을 획득하고, 상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최소 참조 값보다 큰 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최소 참조 값을 계산하거나,
상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이가 상기 제(i-1) 주파수 포인트에 대응하는 상기 최소 참조 값보다 크지 않은 경우, 공식 을 사용함으로써, 상기 제i 주파수 포인트에 대응하는 상기 최소 참조 값을 계산하도록 구체적으로 구성되되,
ILDnow는 상기 제i 주파수 포인트에 대응하는, 상기 2개의 마이크로폰 간의 상기 양이 레벨 차이를 나타내고, ILDmax는 제i 주파수 포인트에 대응하는 상기 최대 참조 값을 나타내며, 은 제(i-1) 주파수 포인트에 대응하는 상기 최대 참조 값을 나타내고, ILDmin은 제i 주파수 포인트에 대응하는 상기 최소 참조 값을 나타내며, 은 제(i-1) 주파수 포인트에 대응하는 상기 최소 참조 값을 나타내고, 및 은 사전설정된 스텝 값을 나타내며, 인,
사운드 처리 장치. - 제11항 내지 제14항 중 어느 한 항에 있어서,
상기 판정 모듈은,
제j 주파수 포인트에 대응하는 양이 레벨 차이가 상기 제j 주파수 포인트에 대응하는 제2 임계치보다 작은 경우, 후방 사운드 신호가 상기 제j 주파수 포인트에서 포함된다고 판정 - 상기 제j 주파수 포인트는 상기 M개의 주파수 포인트 중 하나이고, j는 M보다 크지 않은 모든 양의 정수라고 가정됨 - 하거나,
제j 주파수 포인트에 대응하는 상기 2개의 마이크로폰 간의 양이 레벨 차이가 제2 임계치보다 작지 않은 경우, 어떠한 후방 사운드 신호도 상기 제j 주파수 포인트에서 포함되지 않는다고 판정하도록 구체적으로 구성된,
사운드 처리 장치. - 제11항 내지 제15항 중 어느 한 항에 있어서,
상기 필터링 모듈은,
촬영을 수행하고 있는 상기 단말의 상기 카메라가 전면 카메라인 경우, 상부-후방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 후방 사운드 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하거나,
촬영을 수행하고 있는 상기 단말의 상기 카메라가 후면 카메라인 경우, 상부-전방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 후방 사운드 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하도록 구체적으로 구성된,
사운드 처리 장치. - 제11항 내지 제16항 중 어느 한 항에 있어서,
상기 단말이 하부에 제3 마이크로폰을 더 포함하고, 촬영을 수행하고 있는 상기 카메라가 전면 카메라인 경우, 상기 장치는 부차적 잡음 필터링 모듈을 더 포함하되, 상기 부차적 잡음 필터링 모듈은,
상기 제3 마이크로폰 및 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 상하 방위각을 획득하고,
상기 상하 방위각이 제1 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정 - 상기 부차적 잡음 신호는 상기 전면 카메라의 정면에 위치되고 상기 전면 카메라의 촬영 범위를 넘어서 위치된 잡음 신호임 - 하고,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상부-후방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로 사용하고, 상기 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하도록 구체적으로 구성된,
사운드 처리 장치. - 제11항 내지 제16항 중 어느 한 항에 있어서,
상기 단말이 하부에 제3 마이크로폰을 더 포함하고, 촬영을 수행하고 있는 상기 카메라가 후면 카메라인 경우, 상기 장치는 부차적 잡음 필터링 모듈을 더 포함하되, 상기 부차적 잡음 필터링 모듈은,
상기 제3 마이크로폰 및 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 상하 방위각을 획득하고,
상기 상하 방위각이 제1 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정 - 상기 부차적 잡음 신호는 상기 후면 카메라의 정면에 위치되고 상기 후면 카메라의 촬영 범위를 넘어서 위치된 잡음 신호임 - 하고,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상부-전방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로 사용하고, 상기 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 적응 필터를 제어하도록 구체적으로 구성된,
사운드 처리 장치. - 제17항에 있어서,
상기 단말이 하부에 제4 마이크로폰을 더 포함하고, 상기 제3 마이크로폰 및 상기 제4 마이크로폰이 좌측에서 우측으로 상기 단말의 상기 하부에 배열되는 경우, 상기 부차적 잡음 필터링 모듈은,
상기 제3 마이크로폰 및 상기 제4 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 좌우 방위각을 획득하고,
상기 좌우 방위각이 제2 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정하고,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상기 상부-후방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로서 사용하고, 상기 상부-전방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 상기 적응 필터를 제어하도록 구체적으로 구성된,
사운드 처리 장치. - 제18항에 있어서,
상기 단말이 하부에 제4 마이크로폰을 더 포함하고, 상기 제3 마이크로폰 및 상기 제4 마이크로폰이 좌측에서 우측으로 상기 단말의 상기 하부에 배열되는 경우, 상기 부차적 잡음 필터링 모듈은,
상기 제3 마이크로폰 및 상기 제4 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호에 대해 지연 차이 기반 측위를 수행하여 상기 현재 프레임의 상기 사운드 신호의 좌우 방위각을 획득하고,
상기 좌우 방위각이 제2 사전설정된 각도보다 큰 경우, 상기 현재 프레임의 상기 사운드 신호가 부차적 잡음 신호를 포함한다고 판정하고,
상기 현재 프레임의 상기 사운드 신호가 상기 부차적 잡음 신호를 포함한다고 판정되는 경우, 상기 상부-전방 마이크로폰에 의해 획득된 사운드 신호를 참조 신호로 사용하고, 상기 상부-후방 마이크로폰에 의해 획득된 상기 현재 프레임의 사운드 신호로부터 상기 부차적 잡음 신호를 걸러 내도록 상기 단말 내의 상기 적응 필터를 제어하도록 구체적으로 구성된,
사운드 처리 장치. - 단말 디바이스로서,
마이크로폰, 카메라, 메모리, 프로세서, 버스를 포함하되, 상기 마이크로폰, 상기 카메라, 상기 메모리 및 상기 프로세서는 상기 버스를 사용하여 서로 연결되고,
상기 마이크로폰은 상기 프로세서의 제어 하에 사운드 신호를 획득하도록 구성되며,
상기 카메라는 상기 프로세서의 제어 하에 이미지 신호를 획득하도록 구성되고,
상기 메모리는 컴퓨터 프로그램 및 명령어를 저장하도록 구성되며,
상기 프로세서는 제1항 내지 제10항 중 어느 한 항에 따른 방법을 수행하기 위해, 상기 메모리에 저장된 상기 명령어 및 상기 컴퓨터 프로그램을 호출하도록 구성된,
단말 디바이스. - 제21항에 있어서,
상기 단말 디바이스는 안테나 시스템을 더 포함하고, 상기 프로세서의 제어 하에, 상기 안테나 시스템은 무선 통신 신호를 수신하고 발신하여, 모바일 통신 네트워크와의 무선 통신을 구현하고, 상기 모바일 통신 네트워크는 GSM 네트워크, CDMA 네트워크, 3G 네트워크, FDMA 네트워크, TDMA 네트워크, PDC 네트워크, TACS 네트워크, AMPS 네트워크, WCDMA 네트워크, TDSCDMA 네트워크, WiFi 네트워크 및 LTE 네트워크 중 하나 이상을 포함하는,
단말 디바이스.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201610970977.5 | 2016-10-27 | ||
| CN201610970977.5A CN107026934B (zh) | 2016-10-27 | 2016-10-27 | 一种声源定位方法和装置 |
| PCT/CN2017/106905 WO2018077109A1 (zh) | 2016-10-27 | 2017-10-19 | 一种声音处理方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20190067902A true KR20190067902A (ko) | 2019-06-17 |
| KR102305066B1 KR102305066B1 (ko) | 2021-09-24 |
Family
ID=59525239
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020197014937A Active KR102305066B1 (ko) | 2016-10-27 | 2017-10-19 | 사운드 처리 방법 및 장치 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US10575096B2 (ko) |
| EP (1) | EP3531674B1 (ko) |
| KR (1) | KR102305066B1 (ko) |
| CN (1) | CN107026934B (ko) |
| WO (1) | WO2018077109A1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20210068332A (ko) * | 2020-05-21 | 2021-06-09 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 네거티브 지연 시간 검출 방법, 장치, 전자 기기 및 저장 매체 |
Families Citing this family (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107026934B (zh) * | 2016-10-27 | 2019-09-27 | 华为技术有限公司 | 一种声源定位方法和装置 |
| CN108089152B (zh) * | 2016-11-23 | 2020-07-03 | 杭州海康威视数字技术股份有限公司 | 一种设备控制方法、装置及系统 |
| CN109036448B (zh) * | 2017-06-12 | 2020-04-14 | 华为技术有限公司 | 一种声音处理方法和装置 |
| US10334360B2 (en) * | 2017-06-12 | 2019-06-25 | Revolabs, Inc | Method for accurately calculating the direction of arrival of sound at a microphone array |
| CN108269582B (zh) * | 2018-01-24 | 2021-06-01 | 厦门美图之家科技有限公司 | 一种基于双麦克风阵列的定向拾音方法及计算设备 |
| CN108519583A (zh) * | 2018-04-11 | 2018-09-11 | 吉林大学 | 适用于各向异性二维板的声发射源定位方法 |
| CN108254721A (zh) * | 2018-04-13 | 2018-07-06 | 歌尔科技有限公司 | 一种机器人声源定位方法和机器人 |
| CN110441738B (zh) * | 2018-05-03 | 2023-07-28 | 阿里巴巴集团控股有限公司 | 车载语音定位的方法、系统、车辆和存储介质 |
| CN108734733B (zh) * | 2018-05-17 | 2022-04-26 | 东南大学 | 一种基于麦克风阵列与双目摄像头的说话人定位与识别方法 |
| CN108766457B (zh) | 2018-05-30 | 2020-09-18 | 北京小米移动软件有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
| CN108922555A (zh) * | 2018-06-29 | 2018-11-30 | 北京小米移动软件有限公司 | 语音信号的处理方法及装置、终端 |
| CN109754803B (zh) * | 2019-01-23 | 2021-06-22 | 上海华镇电子科技有限公司 | 车载多音区语音交互系统及方法 |
| CN111479180B (zh) * | 2019-01-24 | 2022-04-29 | Oppo广东移动通信有限公司 | 拾音控制方法及相关产品 |
| CN110198372B (zh) * | 2019-05-31 | 2020-10-09 | 华为技术有限公司 | 确定摄像组件伸缩状态的方法、可读存储介质及相关设备 |
| CN111025233B (zh) * | 2019-11-13 | 2023-09-15 | 阿里巴巴集团控股有限公司 | 一种声源方向定位方法和装置、语音设备和系统 |
| CN110853657B (zh) * | 2019-11-18 | 2022-05-13 | 北京小米智能科技有限公司 | 空间划分方法、装置及存储介质 |
| CN113132863B (zh) * | 2020-01-16 | 2022-05-24 | 华为技术有限公司 | 立体声拾音方法、装置、终端设备和计算机可读存储介质 |
| CN111505583B (zh) * | 2020-05-07 | 2022-07-01 | 北京百度网讯科技有限公司 | 声源定位方法、装置、设备和可读存储介质 |
| CN111665422A (zh) * | 2020-06-08 | 2020-09-15 | 郑州精铖电力设备有限公司 | 基于fpga的麦克风阵列非侵入式宽频声波实时成像检测系统 |
| CN112129402B (zh) * | 2020-08-21 | 2021-07-13 | 东风汽车集团有限公司 | 一种异响源探测装置 |
| US12352605B2 (en) * | 2020-10-20 | 2025-07-08 | Google Llc | Barometer adaptive sampling by tight integration with other sensors and actuators |
| CN115529531A (zh) * | 2021-06-25 | 2022-12-27 | Oppo广东移动通信有限公司 | 音频处理方法、装置、电子设备和计算机可读存储介质 |
| CN113640744B (zh) * | 2021-08-20 | 2024-07-30 | 歌尔科技有限公司 | 声源定位方法及音频设备 |
| CN114171061B (zh) * | 2021-12-29 | 2024-12-20 | 苏州科达特种视讯有限公司 | 时延估计方法、设备及存储介质 |
| CN115035882A (zh) * | 2022-06-09 | 2022-09-09 | 哈尔滨工业大学(威海) | 一种具有降噪点追踪功能的车内噪声主动控制系统及方法 |
| CN115119105A (zh) * | 2022-06-23 | 2022-09-27 | 歌尔股份有限公司 | 一种播放声音的设备、方法、装置、智能手表及介质 |
| CN115615624B (zh) * | 2022-12-13 | 2023-03-31 | 杭州兆华电子股份有限公司 | 一种基于无人巡检装置的设备泄漏检测方法及系统 |
| CN118315042B (zh) * | 2024-06-07 | 2024-10-18 | 大连玖柒医疗科技有限公司 | 一种医疗听诊器数据线上处理方法及系统 |
| CN120018023B (zh) * | 2025-04-21 | 2025-07-18 | 深圳市美恩微电子有限公司 | 基于音频信号处理的耳机环绕立体声处理方法及介质 |
| CN120510699B (zh) * | 2025-07-22 | 2025-09-26 | 四川省中车铁投轨道交通有限公司 | 基于互联网平台的无人值守站台监控报警系统及方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20080092404A (ko) * | 2006-01-05 | 2008-10-15 | 오디언스 인코포레이티드 | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 |
| US20100110232A1 (en) * | 2008-10-31 | 2010-05-06 | Fortemedia, Inc. | Electronic apparatus and method for receiving sounds with auxiliary information from camera system |
| US20130054231A1 (en) * | 2011-08-29 | 2013-02-28 | Intel Mobile Communications GmbH | Noise reduction for dual-microphone communication devices |
| KR20150069535A (ko) * | 2013-12-13 | 2015-06-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 단말 상에서 음성 제어 동작을 수행하기 위한 방법 및 장치 |
| US20150245133A1 (en) * | 2014-02-26 | 2015-08-27 | Qualcomm Incorporated | Listen to people you recognize |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7245726B2 (en) * | 2001-10-03 | 2007-07-17 | Adaptive Technologies, Inc. | Noise canceling microphone system and method for designing the same |
| EP1443498B1 (en) | 2003-01-24 | 2008-03-19 | Sony Ericsson Mobile Communications AB | Noise reduction and audio-visual speech activity detection |
| US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
| CN101203063B (zh) * | 2007-12-19 | 2012-11-28 | 北京中星微电子有限公司 | 麦克风阵列的噪声消除方法及装置 |
| US8194882B2 (en) * | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
| US8761412B2 (en) | 2010-12-16 | 2014-06-24 | Sony Computer Entertainment Inc. | Microphone array steering with image-based source location |
| KR101761312B1 (ko) | 2010-12-23 | 2017-07-25 | 삼성전자주식회사 | 마이크 어레이를 이용한 방향성 음원 필터링 장치 및 그 제어방법 |
| JP5701142B2 (ja) * | 2011-05-09 | 2015-04-15 | 株式会社オーディオテクニカ | マイクロホン |
| US9197974B1 (en) * | 2012-01-06 | 2015-11-24 | Audience, Inc. | Directional audio capture adaptation based on alternative sensory input |
| US9521502B2 (en) * | 2013-01-04 | 2016-12-13 | Huawei Technologies Co., Ltd. | Method for determining a stereo signal |
| CN104270489A (zh) * | 2014-09-10 | 2015-01-07 | 中兴通讯股份有限公司 | 一种从多个麦克风中确定主副麦克风的方法和系统 |
| CN107026934B (zh) * | 2016-10-27 | 2019-09-27 | 华为技术有限公司 | 一种声源定位方法和装置 |
| US10262673B2 (en) * | 2017-02-13 | 2019-04-16 | Knowles Electronics, Llc | Soft-talk audio capture for mobile devices |
-
2016
- 2016-10-27 CN CN201610970977.5A patent/CN107026934B/zh active Active
-
2017
- 2017-10-19 KR KR1020197014937A patent/KR102305066B1/ko active Active
- 2017-10-19 WO PCT/CN2017/106905 patent/WO2018077109A1/zh not_active Ceased
- 2017-10-19 EP EP17863390.5A patent/EP3531674B1/en active Active
-
2019
- 2019-04-29 US US16/397,666 patent/US10575096B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20080092404A (ko) * | 2006-01-05 | 2008-10-15 | 오디언스 인코포레이티드 | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 |
| US20100110232A1 (en) * | 2008-10-31 | 2010-05-06 | Fortemedia, Inc. | Electronic apparatus and method for receiving sounds with auxiliary information from camera system |
| US20130054231A1 (en) * | 2011-08-29 | 2013-02-28 | Intel Mobile Communications GmbH | Noise reduction for dual-microphone communication devices |
| KR20150069535A (ko) * | 2013-12-13 | 2015-06-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 단말 상에서 음성 제어 동작을 수행하기 위한 방법 및 장치 |
| US20150245133A1 (en) * | 2014-02-26 | 2015-08-27 | Qualcomm Incorporated | Listen to people you recognize |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20210068332A (ko) * | 2020-05-21 | 2021-06-09 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 네거티브 지연 시간 검출 방법, 장치, 전자 기기 및 저장 매체 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN107026934A (zh) | 2017-08-08 |
| US20190253802A1 (en) | 2019-08-15 |
| CN107026934B (zh) | 2019-09-27 |
| KR102305066B1 (ko) | 2021-09-24 |
| WO2018077109A1 (zh) | 2018-05-03 |
| EP3531674B1 (en) | 2024-02-14 |
| EP3531674A1 (en) | 2019-08-28 |
| US10575096B2 (en) | 2020-02-25 |
| EP3531674A4 (en) | 2019-11-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102305066B1 (ko) | 사운드 처리 방법 및 장치 | |
| US11094334B2 (en) | Sound processing method and apparatus | |
| EP3852106B1 (en) | Sound processing method, apparatus and device | |
| JP6400566B2 (ja) | ユーザインターフェースを表示するためのシステムおよび方法 | |
| US9668048B2 (en) | Contextual switching of microphones | |
| US9525938B2 (en) | User voice location estimation for adjusting portable device beamforming settings | |
| EP2882170B1 (en) | Audio information processing method and apparatus | |
| TWI437555B (zh) | 空間前處理目標干擾比權衡之濾波裝置及其方法 | |
| US10186278B2 (en) | Microphone array noise suppression using noise field isotropy estimation | |
| US20160360314A1 (en) | Microphone-based orientation sensors and related techniques | |
| US10341775B2 (en) | Apparatus, method and computer program for rendering a spatial audio output signal | |
| EP3576430B1 (en) | Audio signal processing method and device, and storage medium | |
| CN113160846A (zh) | 噪声抑制方法和电子设备 | |
| CN107742523A (zh) | 语音信号处理方法、装置以及移动终端 | |
| US10154345B2 (en) | Surround sound recording for mobile devices | |
| EP3230827B1 (en) | Speech enhancement using a portable electronic device | |
| CN117153180A (zh) | 声音信号处理方法、装置、存储介质及电子设备 | |
| CN108234792A (zh) | 声音信号处理方法、电子装置及计算机可读存储介质 | |
| TW201642597A (zh) | 信號處理裝置、信號處理方法及信號處理程式與終端裝置 | |
| CN119580759A (zh) | 一种多说话人语音分离方法及相关装置 | |
| US20200059549A1 (en) | Audio Processing Method And Terminal Device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-2-2-P10-P22-nap-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| U11 | Full renewal or maintenance fee paid |
Free format text: ST27 STATUS EVENT CODE: A-4-4-U10-U11-OTH-PR1001 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 5 |






