KR20170131465A - 스피치의 방향에 기초한 전자 디바이스의 제어 - Google Patents
스피치의 방향에 기초한 전자 디바이스의 제어 Download PDFInfo
- Publication number
- KR20170131465A KR20170131465A KR1020177027318A KR20177027318A KR20170131465A KR 20170131465 A KR20170131465 A KR 20170131465A KR 1020177027318 A KR1020177027318 A KR 1020177027318A KR 20177027318 A KR20177027318 A KR 20177027318A KR 20170131465 A KR20170131465 A KR 20170131465A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- electronic device
- frequency range
- determining
- voice command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Navigation (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
도 1 은 본 개시의 하나의 실시형태에 따른, 사용자에 의해 말해진 스피치를 검출하고 그 스피치의 출발의 방향에 기초하여 기능을 수행하도록 구성된 전자 디바이스들을 나타낸다.
도 2 는 본 개시의 하나의 실시형태에 따른, 사용자에 의해 말해지고 전자 디바이스에서 사운드 센서에 의해 수신된 음성 커맨드들에 대한 출발의 방향들을 나타낸다.
도 3 은 본 개시의 하나의 실시형태에 따른, 출발의 방향에서 사용자에 의해 말해지고 전자 디바이스들의 각각에서 하나 이상의 사운드 센서들에 의해 수신된 음성 커맨드를 나타낸다.
도 4 는 본 개시의 하나의 실시형태에 따른, 스피치의 출발의 방향이 그 자신을 향한 것인지 여부를 결정하고 그 스피치에서의 음성 커맨드와 연관된 기능을 수행하도록 구성된 전자 디바이스의 블록도를 나타낸다.
도 5 는 본 개시의 하나의 실시형태에 따른, 사용자에 의해 말해진 스피치에 응답하여 전자 디바이스를 제어하기 위한 일 예시적인 방법의 플로우차트를 나타낸다.
도 6 은 본 개시의 하나의 실시형태에 따른, 사용자로부터 수신된 스피치의 출발의 방향 (DOD) 이 그 자신을 향한 것인지 여부를 결정하기 위해 전자 디바이스에서 수행되는 일 예시적인 방법의 플로우차트를 나타낸다.
도 7 은 본 개시의 하나의 실시형태에 따른, 다른 전자 디바이스들과 관련하여 사용자에 의해 말해진 스피치에 응답하여 전자 디바이스를 제어하기 위한 일 예시적인 방법의 플로우차트를 나타낸다.
도 8 은 본 개시의 하나의 실시형태에 따른, 주파수의 함수로서 특정된 시간에서 수신된 입력 사운드의 에너지 값들을 폴롯팅함으로써 전자 디바이스에 의해 생성될 수도 있는 일 예시적인 그래프를 나타낸다.
도 9 는 본 개시의 하나의 실시형태에 따른, 사용자에 의해 말해진 스피치의 의도된 타겟을 결정하기 위해 통신 네트워크를 통해 서버 (920) 와 통신하도록 구성된 복수의 전자 디바이스들을 나타낸다.
도 10 은 본 개시의 하나의 실시형태에 따른, 서버와 관련하여 사용자에 의해 말해진 스피치에 응답하여 전자 디바이스를 제어하기 위한 일 예시적인 방법의 플로우차트를 나타낸다.
도 11 은 사용자에 의해 말해진 스피치에 응답하여 전자 디바이스를 제어하기 위한 본 개시의 방법들 및 장치가 일부 실시형태들에 따라 구현될 수도 있는 전자 디바이스의 블록도를 나타낸다.
도 12 는 일부 실시형태들에 따라 구현되는, 전술된 서버들의 임의의 하나일 수도 있는 서버 시스템을 나타내는 블록도이다.
Claims (30)
- 사용자에 의해 말해진 스피치에 응답하여 전자 디바이스를 제어하기 위한 방법으로서,
사운드 센서에 의해 입력 사운드를 수신하는 단계;
상기 입력 사운드에서 상기 사용자에 의해 말해진 상기 스피치를 검출하는 단계;
상기 입력 사운드에서 상기 스피치를 검출하는 것에 응답하여 상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하는 단계; 및
상기 제 1 및 제 2 특성들에 기초하여 상기 사용자에 의해 말해진 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 단계를 포함하는, 전자 디바이스를 제어하기 위한 방법. - 제 1 항에 있어서,
상기 제 1 주파수 범위는 상기 제 2 주파수 범위보다 더 높은, 전자 디바이스를 제어하기 위한 방법. - 제 1 항에 있어서,
상기 제 1 및 제 2 주파수 범위들은 적어도 하나의 주파수를 포함하는, 전자 디바이스를 제어하기 위한 방법. - 제 1 항에 있어서,
상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것이라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하는 단계; 및
인식된 상기 음성 커맨드와 연관된 기능을 수행하는 단계를 더 포함하는, 전자 디바이스를 제어하기 위한 방법. - 제 1 항에 있어서,
상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하는 단계는,
상기 제 1 특성들로서 상기 제 1 주파수 범위의 제 1 에너지 값을 결정하는 단계; 및
상기 제 2 특성들로서 상기 제 2 주파수 범위의 제 2 에너지 값을 결정하는 단계를 포함하는, 전자 디바이스를 제어하기 위한 방법. - 제 5 항에 있어서,
상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 단계는,
상기 제 1 에너지 값과 상기 제 2 에너지 값 사이의 비율을 결정하는 단계; 및
상기 비율에 기초하여 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것임을 결정하는 단계를 포함하는, 전자 디바이스를 제어하기 위한 방법. - 제 6 항에 있어서,
상기 비율은 상기 입력 사운드의 신호 강도와는 독립적인, 전자 디바이스를 제어하기 위한 방법. - 제 1 항에 있어서,
외부 디바이스로부터 상기 스피치의 말해진 방향의 표시를 수신하는 단계를 더 포함하는, 전자 디바이스를 제어하기 위한 방법. - 제 8 항에 있어서,
상기 제 1 및 제 2 특성들 및 상기 외부 디바이스로부터의 상기 표시에 기초하여 상기 스피치의 타겟이 상기 전자 디바이스 또는 상기 외부 디바이스인지 여부를 결정하는 단계;
상기 스피치의 타겟이 상기 전자 디바이스라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하는 단계; 및
인식된 상기 음성 커맨드와 연관된 기능을 수행하는 단계를 더 포함하는, 전자 디바이스를 제어하기 위한 방법. - 전자 디바이스로서,
입력 사운드를 수신하도록 구성된 사운드 센서;
상기 입력 사운드에서 사용자에 의해 말해진 스피치를 검출하도록 구성된 스피치 검출기;
상기 입력 사운드에서 상기 스피치를 검출하는 것에 응답하여 상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하도록 구성된 주파수 분석 유닛; 및
상기 제 1 및 제 2 특성들에 기초하여 상기 사용자에 의해 말해진 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하도록 구성된 스피치 방향 결정 유닛을 포함하는, 전자 디바이스. - 제 10 항에 있어서,
상기 제 1 주파수 범위는 상기 제 2 주파수 범위보다 더 높은, 전자 디바이스. - 제 10 항에 있어서,
상기 제 1 및 제 2 주파수 범위들은 적어도 하나의 주파수를 포함하는, 전자 디바이스. - 제 10 항에 있어서,
상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것이라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하도록 구성된 스피치 인식 유닛을 더 포함하고,
상기 전자 디바이스는 인식된 상기 음성 커맨드와 연관된 기능을 수행하는, 전자 디바이스. - 제 10 항에 있어서,
상기 주파수 분석 유닛은,
상기 제 1 특성들로서 상기 제 1 주파수 범위의 제 1 에너지 값을 결정하고; 그리고
상기 제 2 특성들로서 상기 제 2 주파수 범위의 제 2 에너지 값을 결정하도록 구성되는, 전자 디바이스. - 제 14 항에 있어서,
상기 스피치 방향 결정 유닛은,
상기 제 1 에너지 값과 상기 제 2 에너지 값 사이의 비율을 결정하고; 그리고
상기 비율에 기초하여 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것임을 결정하도록 구성되는, 전자 디바이스. - 제 15 항에 있어서,
상기 비율은 상기 입력 사운드의 신호 강도와는 독립적인, 전자 디바이스. - 제 10 항에 있어서,
외부 디바이스로부터 상기 스피치의 말해진 방향의 표시를 수신하도록 구성된 통신 유닛을 더 포함하는, 전자 디바이스. - 제 17 항에 있어서,
상기 스피치 방향 결정 유닛은, 상기 제 1 및 제 2 특성들 및 상기 외부 디바이스로부터의 상기 표시에 기초하여 상기 스피치의 타겟이 상기 전자 디바이스 또는 상기 외부 디바이스인지 여부를 결정하도록 구성되고,
상기 전자 디바이스는, 상기 스피치의 타겟이 상기 전자 디바이스라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하도록 구성된 스피치 인식 유닛을 더 포함하며,
상기 전자 디바이스는, 인식된 상기 음성 커맨드와 연관된 기능을 수행하는, 전자 디바이스. - 전자 디바이스로서,
입력 사운드를 수신하는 수단;
상기 입력 사운드에서 사용자에 의해 말해진 스피치를 검출하는 수단;
상기 입력 사운드에서 상기 스피치를 검출하는 것에 응답하여 상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하는 수단; 및
상기 제 1 및 제 2 특성들에 기초하여 상기 사용자에 의해 말해진 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 수단을 포함하는, 전자 디바이스. - 제 19 항에 있어서,
상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것이라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하는 수단; 및
인식된 상기 음성 커맨드와 연관된 기능을 수행하는 수단을 더 포함하는, 전자 디바이스. - 제 19 항에 있어서,
상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하는 수단은,
상기 제 1 특성들로서 상기 제 1 주파수 범위의 제 1 에너지 값을 결정하고; 그리고
상기 제 2 특성들로서 상기 제 2 주파수 범위의 제 2 에너지 값을 결정하도록 구성되는, 전자 디바이스. - 제 21 항에 있어서,
상기 사용자에 의해 말해진 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 수단은,
상기 제 1 에너지 값과 상기 제 2 에너지 값 사이의 비율을 결정하고; 그리고
상기 비율에 기초하여 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것임을 결정하도록 구성되는, 전자 디바이스. - 제 19 항에 있어서,
외부 디바이스로부터 상기 스피치의 말해진 방향의 표시를 수신하는 수단을 더 포함하는, 전자 디바이스. - 제 23 항에 있어서,
상기 사용자에 의해 말해진 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 수단은, 상기 제 1 및 제 2 특성들 및 상기 외부 디바이스로부터의 상기 표시에 기초하여 상기 스피치의 타겟이 상기 전자 디바이스 또는 상기 외부 디바이스인지 여부를 결정하도록 구성되고,
상기 전자 디바이스는,
상기 스피치의 타겟이 상기 전자 디바이스라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하는 수단; 및
인식된 상기 음성 커맨드와 연관된 기능을 수행하는 수단을 더 포함하는, 전자 디바이스. - 명령들을 포함하는 비-일시적 컴퓨터 판독가능 저장 매체로서,
상기 명령들은 전자 디바이스의 적어도 하나의 프로세서로 하여금,
사운드 센서에 의해 입력 사운드를 수신하는 동작;
상기 입력 사운드에서 사용자에 의해 말해진 스피치를 검출하는 동작;
상기 입력 사운드에서 상기 스피치를 검출하는 것에 응답하여 상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하는 동작; 및
상기 제 1 및 제 2 특성들에 기초하여 상기 사용자에 의해 말해진 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 동작
의 동작들을 수행하게 하는, 비-일시적 컴퓨터 판독가능 저장 매체. - 제 25 항에 있어서,
상기 전자 디바이스의 상기 적어도 하나의 프로세서로 하여금,
상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것이라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하는 동작; 및
인식된 상기 음성 커맨드와 연관된 기능을 수행하는 동작
의 동작들을 수행하게 하는 명령들을 더 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체. - 제 25 항에 있어서,
상기 스피치의 제 1 주파수 범위의 제 1 특성들 및 제 2 주파수 범위의 제 2 특성들을 결정하는 동작은,
상기 제 1 특성들로서 상기 제 1 주파수 범위의 제 1 에너지 값을 결정하는 동작; 및
상기 제 2 특성들로서 상기 제 2 주파수 범위의 제 2 에너지 값을 결정하는 동작을 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체. - 제 27 항에 있어서,
상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것인지 여부를 결정하는 동작은,
상기 제 1 에너지 값과 상기 제 2 에너지 값 사이의 비율을 결정하는 동작; 및
상기 비율에 기초하여 상기 스피치의 출발의 방향이 상기 전자 디바이스를 향하는 것임을 결정하는 동작을 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체. - 제 25 항에 있어서,
상기 전자 디바이스의 상기 적어도 하나의 프로세서로 하여금, 외부 디바이스로부터 상기 스피치의 말해진 방향의 표시를 수신하는 동작을 수행하게 하는 명령들을 더 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체. - 제 29 항에 있어서,
상기 전자 디바이스의 상기 적어도 하나의 프로세서로 하여금,
상기 제 1 및 제 2 특성들 및 상기 외부 디바이스로부터의 상기 표시에 기초하여 상기 스피치의 타겟이 상기 전자 디바이스 또는 상기 외부 디바이스인지 여부를 결정하는 동작;
상기 스피치의 타겟이 상기 전자 디바이스라고 결정하는 것에 응답하여 상기 스피치에서 음성 커맨드를 인식하는 동작; 및
인식된 상기 음성 커맨드와 연관된 기능을 수행하는 동작
의 동작들을 수행하게 하는 명령들을 더 포함하는, 비-일시적 컴퓨터 판독가능 저장 매체.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14/671,858 US9911416B2 (en) | 2015-03-27 | 2015-03-27 | Controlling electronic device based on direction of speech |
| US14/671,858 | 2015-03-27 | ||
| PCT/US2016/016649 WO2016160123A1 (en) | 2015-03-27 | 2016-02-04 | Controlling electronic device based on direction of speech |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20170131465A true KR20170131465A (ko) | 2017-11-29 |
| KR101981878B1 KR101981878B1 (ko) | 2019-05-23 |
Family
ID=55404841
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020177027318A Active KR101981878B1 (ko) | 2015-03-27 | 2016-02-04 | 스피치의 방향에 기초한 전자 디바이스의 제어 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US9911416B2 (ko) |
| EP (1) | EP3274988B1 (ko) |
| JP (1) | JP2018512619A (ko) |
| KR (1) | KR101981878B1 (ko) |
| CN (1) | CN107408386B (ko) |
| ES (1) | ES2754448T3 (ko) |
| HU (1) | HUE047117T2 (ko) |
| WO (1) | WO2016160123A1 (ko) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020246824A1 (en) * | 2019-06-05 | 2020-12-10 | Lg Electronics Inc. | Method of controlling electronic devices |
| KR20210005200A (ko) * | 2018-06-01 | 2021-01-13 | 애플 인크. | 디지털 어시스턴트를 이용한 오디오 정보 제공 |
| KR20230138541A (ko) * | 2021-03-11 | 2023-10-05 | 애플 인크. | 디지털 어시스턴트를 사용하는 지속적인 다이얼로그 |
Families Citing this family (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106125048B (zh) | 2016-07-11 | 2019-05-24 | 浙江大华技术股份有限公司 | 一种声源定位方法及装置 |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
| EP2911149B1 (en) * | 2014-02-19 | 2019-04-17 | Nokia Technologies OY | Determination of an operational directive based at least in part on a spatial audio property |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
| KR102052127B1 (ko) * | 2015-06-26 | 2020-01-08 | 삼성전자주식회사 | 소리를 판별하는 방법 및 이를 위한 장치 |
| US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US11587559B2 (en) * | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| KR102427833B1 (ko) * | 2015-11-30 | 2022-08-02 | 삼성전자주식회사 | 사용자 단말장치 및 디스플레이 방법 |
| WO2017138934A1 (en) * | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
| US9911417B2 (en) * | 2016-04-01 | 2018-03-06 | Tai-An Lu | Internet of things system with voice-controlled functions and method for processing information of the same |
| US12197817B2 (en) | 2016-06-11 | 2025-01-14 | Apple Inc. | Intelligent device arbitration and control |
| US10147423B2 (en) * | 2016-09-29 | 2018-12-04 | Intel IP Corporation | Context-aware query recognition for electronic devices |
| US9642225B1 (en) * | 2016-10-20 | 2017-05-02 | Kai-kong Ng | Voice-controlled lighting control system |
| KR101893768B1 (ko) * | 2017-02-27 | 2018-09-04 | 주식회사 브이터치 | 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
| US12444433B2 (en) * | 2017-02-27 | 2025-10-14 | VTouch Co., Ltd. | Method and system for providing voice recognition trigger and non-transitory computer-readable recording medium |
| US10403276B2 (en) * | 2017-03-17 | 2019-09-03 | Microsoft Technology Licensing, Llc | Voice enabled features based on proximity |
| KR102471493B1 (ko) * | 2017-10-17 | 2022-11-29 | 삼성전자주식회사 | 전자 장치 및 음성 인식 방법 |
| TWM562433U (zh) * | 2018-01-05 | 2018-06-21 | Thermaltake Technology Co Ltd | 聲控輸入系統 |
| US11150869B2 (en) | 2018-02-14 | 2021-10-19 | International Business Machines Corporation | Voice command filtering |
| US11238856B2 (en) | 2018-05-01 | 2022-02-01 | International Business Machines Corporation | Ignoring trigger words in streamed media content |
| US11200890B2 (en) | 2018-05-01 | 2021-12-14 | International Business Machines Corporation | Distinguishing voice commands |
| DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
| WO2019246562A1 (en) | 2018-06-21 | 2019-12-26 | Magic Leap, Inc. | Wearable system speech processing |
| CN108922528B (zh) * | 2018-06-29 | 2020-10-23 | 百度在线网络技术(北京)有限公司 | 用于处理语音的方法和装置 |
| US11062703B2 (en) * | 2018-08-21 | 2021-07-13 | Intel Corporation | Automatic speech recognition with filler model processing |
| NO20181210A1 (en) | 2018-08-31 | 2020-03-02 | Elliptic Laboratories As | Voice assistant |
| CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
| US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
| CN109831709B (zh) * | 2019-02-15 | 2020-10-09 | 杭州嘉楠耘智信息科技有限公司 | 音源定向方法及装置和计算机可读存储介质 |
| WO2020180719A1 (en) | 2019-03-01 | 2020-09-10 | Magic Leap, Inc. | Determining input for speech processing engine |
| US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
| US12327573B2 (en) | 2019-04-19 | 2025-06-10 | Magic Leap, Inc. | Identifying input for speech recognition engine |
| CN110459213A (zh) * | 2019-06-28 | 2019-11-15 | 浙江想能睡眠科技股份有限公司 | 基于语音控制的智能床垫及其控制方法 |
| US11328740B2 (en) | 2019-08-07 | 2022-05-10 | Magic Leap, Inc. | Voice onset detection |
| US11355108B2 (en) | 2019-08-20 | 2022-06-07 | International Business Machines Corporation | Distinguishing voice commands |
| US11205433B2 (en) * | 2019-08-21 | 2021-12-21 | Qualcomm Incorporated | Method and apparatus for activating speech recognition |
| KR102329353B1 (ko) * | 2020-03-17 | 2021-11-22 | 성균관대학교산학협력단 | 심층 신경망을 이용한 음성 발생 방향 추론 방법 및 그 장치 |
| US11917384B2 (en) | 2020-03-27 | 2024-02-27 | Magic Leap, Inc. | Method of waking a device using spoken voice commands |
| US12301635B2 (en) | 2020-05-11 | 2025-05-13 | Apple Inc. | Digital assistant hardware abstraction |
| US12417766B2 (en) | 2020-09-30 | 2025-09-16 | Magic Leap, Inc. | Voice user interface using non-linguistic input |
| US11778370B2 (en) * | 2020-12-07 | 2023-10-03 | Gulfstream Aerospace Corporation | Microphone array onboard aircraft to determine crew/passenger location and to steer a transducer beam pattern to that location |
| CN115083402B (zh) * | 2021-03-15 | 2025-08-22 | Oppo广东移动通信有限公司 | 响应控制语音的方法、装置、终端及存储介质 |
| CN115086096A (zh) * | 2021-03-15 | 2022-09-20 | Oppo广东移动通信有限公司 | 响应控制语音的方法、装置、设备及存储介质 |
| US12266354B2 (en) * | 2021-07-15 | 2025-04-01 | Apple Inc. | Speech interpretation based on environmental context |
| US12094487B2 (en) * | 2021-09-21 | 2024-09-17 | Meta Platforms Technologies, Llc | Audio system for spatializing virtual sound sources |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7167544B1 (en) * | 1999-11-25 | 2007-01-23 | Siemens Aktiengesellschaft | Telecommunication system with error messages corresponding to speech recognition errors |
| KR20130122839A (ko) * | 2012-05-01 | 2013-11-11 | 엘지전자 주식회사 | 적어도 하나의 마이크 센서를 갖는 모바일 디바이스 및 그 제어방법 |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6219645B1 (en) * | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
| DE10133126A1 (de) | 2001-07-07 | 2003-01-16 | Philips Corp Intellectual Pty | Richtungssensitives Audioaufnahmesystem mit Anzeige von Aufnahmegebiet und/oder Störquelle |
| JP4157581B2 (ja) * | 2004-12-03 | 2008-10-01 | 本田技研工業株式会社 | 音声認識装置 |
| JP4873913B2 (ja) | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
| DK1699261T3 (da) * | 2005-03-01 | 2011-08-15 | Oticon As | System og fremgangsmåde til bestemmelse af direktionalitet af lyd detekteret af et høreapparat |
| EP2237271B1 (en) | 2009-03-31 | 2021-01-20 | Cerence Operating Company | Method for determining a signal component for reducing noise in an input signal |
| US8588441B2 (en) * | 2010-01-29 | 2013-11-19 | Phonak Ag | Method for adaptively matching microphones of a hearing system as well as a hearing system |
| US9053697B2 (en) * | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
| WO2012098844A1 (ja) * | 2011-01-18 | 2012-07-26 | パナソニック株式会社 | 車両方向特定装置、車両方向特定方法、及びそのプログラム |
| US20120259638A1 (en) * | 2011-04-08 | 2012-10-11 | Sony Computer Entertainment Inc. | Apparatus and method for determining relevance of input speech |
| US20130204629A1 (en) | 2012-02-08 | 2013-08-08 | Panasonic Corporation | Voice input device and display device |
| US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
| US9251787B1 (en) * | 2012-09-26 | 2016-02-02 | Amazon Technologies, Inc. | Altering audio to improve automatic speech recognition |
| WO2014087495A1 (ja) | 2012-12-05 | 2014-06-12 | 株式会社日立製作所 | 音声対話ロボット、音声対話ロボットシステム |
| US9525938B2 (en) * | 2013-02-06 | 2016-12-20 | Apple Inc. | User voice location estimation for adjusting portable device beamforming settings |
| US20140244267A1 (en) * | 2013-02-26 | 2014-08-28 | Avaya Inc. | Integration of user orientation into a voice command system |
| US9384751B2 (en) | 2013-05-06 | 2016-07-05 | Honeywell International Inc. | User authentication of voice controlled devices |
| EP2911149B1 (en) | 2014-02-19 | 2019-04-17 | Nokia Technologies OY | Determination of an operational directive based at least in part on a spatial audio property |
| EP2928210A1 (en) * | 2014-04-03 | 2015-10-07 | Oticon A/s | A binaural hearing assistance system comprising binaural noise reduction |
-
2015
- 2015-03-27 US US14/671,858 patent/US9911416B2/en active Active
-
2016
- 2016-02-04 WO PCT/US2016/016649 patent/WO2016160123A1/en not_active Ceased
- 2016-02-04 HU HUE16705671A patent/HUE047117T2/hu unknown
- 2016-02-04 KR KR1020177027318A patent/KR101981878B1/ko active Active
- 2016-02-04 EP EP16705671.2A patent/EP3274988B1/en active Active
- 2016-02-04 CN CN201680014289.XA patent/CN107408386B/zh active Active
- 2016-02-04 ES ES16705671T patent/ES2754448T3/es active Active
- 2016-02-04 JP JP2017549296A patent/JP2018512619A/ja not_active Ceased
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7167544B1 (en) * | 1999-11-25 | 2007-01-23 | Siemens Aktiengesellschaft | Telecommunication system with error messages corresponding to speech recognition errors |
| KR20130122839A (ko) * | 2012-05-01 | 2013-11-11 | 엘지전자 주식회사 | 적어도 하나의 마이크 센서를 갖는 모바일 디바이스 및 그 제어방법 |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20210005200A (ko) * | 2018-06-01 | 2021-01-13 | 애플 인크. | 디지털 어시스턴트를 이용한 오디오 정보 제공 |
| US12147733B2 (en) | 2018-06-01 | 2024-11-19 | Apple Inc. | Providing audio information with a digital assistant |
| WO2020246824A1 (en) * | 2019-06-05 | 2020-12-10 | Lg Electronics Inc. | Method of controlling electronic devices |
| US12308025B2 (en) | 2019-06-05 | 2025-05-20 | Lg Electronics Inc. | Method of controlling electronic devices |
| KR20230138541A (ko) * | 2021-03-11 | 2023-10-05 | 애플 인크. | 디지털 어시스턴트를 사용하는 지속적인 다이얼로그 |
| US12400677B2 (en) | 2021-03-11 | 2025-08-26 | Apple Inc. | Continuous dialog with a digital assistant |
Also Published As
| Publication number | Publication date |
|---|---|
| KR101981878B1 (ko) | 2019-05-23 |
| ES2754448T3 (es) | 2020-04-17 |
| WO2016160123A1 (en) | 2016-10-06 |
| HUE047117T2 (hu) | 2020-04-28 |
| US20160284350A1 (en) | 2016-09-29 |
| CN107408386A (zh) | 2017-11-28 |
| CN107408386B (zh) | 2018-11-23 |
| EP3274988B1 (en) | 2019-08-07 |
| US9911416B2 (en) | 2018-03-06 |
| JP2018512619A (ja) | 2018-05-17 |
| EP3274988A1 (en) | 2018-01-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101981878B1 (ko) | 스피치의 방향에 기초한 전자 디바이스의 제어 | |
| EP3134896B1 (en) | Method and apparatus for activating application by speech input | |
| US11756563B1 (en) | Multi-path calculations for device energy levels | |
| CN105190746B (zh) | 用于检测目标关键词的方法和设备 | |
| EP2994911B1 (en) | Adaptive audio frame processing for keyword detection | |
| US9892729B2 (en) | Method and apparatus for controlling voice activation | |
| KR101752119B1 (ko) | 다수의 디바이스에서의 핫워드 검출 | |
| US20150302856A1 (en) | Method and apparatus for performing function by speech input | |
| CN105556595B (zh) | 用于调整用于激活话音辅助功能的检测阈值的方法及设备 | |
| US9837068B2 (en) | Sound sample verification for generating sound detection model | |
| US9558758B1 (en) | User feedback on microphone placement | |
| US20250378833A1 (en) | Speech interaction method and related device | |
| US11195545B2 (en) | Method and apparatus for detecting an end of an utterance |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| A201 | Request for examination | ||
| A302 | Request for accelerated examination | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PA0302 | Request for accelerated examination |
St.27 status event code: A-1-2-D10-D17-exm-PA0302 St.27 status event code: A-1-2-D10-D16-exm-PA0302 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| FPAY | Annual fee payment |
Payment date: 20220325 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| U11 | Full renewal or maintenance fee paid |
Free format text: ST27 STATUS EVENT CODE: A-4-4-U10-U11-OTH-PR1001 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 7 |
