KR20200089728A - 디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 - Google Patents
디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 Download PDFInfo
- Publication number
- KR20200089728A KR20200089728A KR1020207018067A KR20207018067A KR20200089728A KR 20200089728 A KR20200089728 A KR 20200089728A KR 1020207018067 A KR1020207018067 A KR 1020207018067A KR 20207018067 A KR20207018067 A KR 20207018067A KR 20200089728 A KR20200089728 A KR 20200089728A
- Authority
- KR
- South Korea
- Prior art keywords
- digital assistant
- computing device
- assistant computing
- audio signal
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
- H04L67/125—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Cardiology (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Selective Calling Equipment (AREA)
Abstract
Description
도 1은 음성 구동 컴퓨팅 환경에서 컴퓨팅 디바이스들 사이에서 신호 프로세싱을 조정하기 위한 시스템의 예시이다.
도 2는 음성 구동 컴퓨팅 환경에서 컴퓨팅 디바이스들 사이에서 신호 프로세싱을 조정하기 위한 시스템의 동작을 도시한 도면이다.
도 3은 음성 구동 컴퓨팅 환경에서 컴퓨팅 디바이스들 사이에서 신호 프로세싱을 조정하는 방법의 예시이다.
도 4는 본 명세서에 기술되고 도시된 시스템 및 방법의 구성요소를 구현하기 위해 사용될 수 있는 컴퓨터 시스템을 위한 일반적인 아키텍처를 도시하는 블록도이다.
| 디바이스의 유형 | 우선순위 랭킹(1이 가장 높음) |
| 전용 디지털 어시스턴트 컴퓨팅 디바이스 | 1 |
| 스피커 디바이스 | 2 |
| 텔레비전 디바이스 | 3 |
| 모바일 디바이스 | 4 |
| 웨어러블 디바이스 | 5 |
Claims (20)
- 음성 구동 컴퓨팅 환경에서 컴퓨팅 디바이스들 사이에서 신호 프로세싱을 조정하는 시스템으로서,
제1 디지털 어시스턴트 컴퓨팅 디바이스 및 제2 디지털 어시스턴트 컴퓨팅 디바이스를 포함하는 복수의 디지털 어시스턴트 컴퓨팅 디바이스, 상기 복수의 디지털 어시스턴트 컴퓨팅 디바이스는 복수의 네트워크 연결 디바이스를 제어하도록 동작가능하며;
조정자 컴포넌트 및 다이렉트 액션 애플리케이션 프로그래밍 인터페이스("API")를 실행하기 위한 하나 이상의 프로세서 및 메모리를 포함하는 데이터 프로세싱 시스템, 상기 데이터 프로세싱 시스템은 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 설정하며;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서를 통해, 입력 오디오 신호를 검출하는 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 상기 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하고, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 상기 데이터 프로세싱 시스템에 전송하는, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행되는 신호 품질 검사기;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서를 통해, 상기 입력 오디오 신호를 검출하는 제2 디지털 어시스턴트 컴퓨팅 디바이스;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 상기 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 상기 데이터 프로세싱 시스템에 전송하는, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행되는 상기 신호 품질 검사기;
상기 데이터 프로세싱 시스템의 상기 조정자 컴포넌트는:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스로부터의 상기 표시를 수신하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스로부터의 상기 표시를 수신하고;
주 신호 프로세서로 설정된 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스 및 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시에 기초하여, 상기 입력 오디오 신호를 프로세싱하기 위해 상기 제1 디지털 어시스턴트를 선택하고;
상기 입력 오디오 신호를 프로세싱하기 위해 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 지시하고;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하는 것을 방지하기 위해 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 대기 모드에 진입하도록 지시하고;
상기 다이렉트 액션 API는:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스로부터 명령을 포함하는 데이터 패킷을 수신하고, 상기 명령은 상기 입력 오디오 신호에 기초하여 상기 제1 디지털 어시스턴트에 의해 생성되며;
상기 복수의 네트워크 연결 디바이스로부터 선택된 네트워크 연결 디바이스에 대해, 상기 명령에 기초하여 액션 데이터 구조를 생성하고;
상기 네트워크 연결 디바이스를 제어하기 위해 상기 액션 데이터 구조를 상기 네트워크 연결 디바이스에 전송하는, 시스템. - 청구항 1에 있어서, 상기 복수의 디지털 어시스턴트 컴퓨팅 디바이스는 이종 디바이스이고, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스는 제1 유형의 디바이스를 포함하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스는 제2 유형의 디바이스를 포함하는, 시스템.
- 청구항 2에 있어서, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스 및 상기 네트워크 연결 디바이스 각각은 어시스턴트 소프트웨어 개발 키트로 구성되며,
제1 유형의 디바이스는 스피커 디바이스, 텔레비전 디바이스, 모바일 디바이스 및 웨어러블 디바이스 중 적어도 하나를 포함하고,
제2 유형의 디바이스는 스피커 디바이스, 텔레비전 디바이스, 모바일 디바이스 및 웨어러블 디바이스 중 적어도 하나를 포함하고, 그리고
네트워크 연결 디바이스는 스피커 디바이스, 텔레비전 디바이스, 모바일 디바이스, 웨어러블 디바이스, 디지털 램프, 디지털 온도 조절기, 디지털 기기 및 디지털 자동차 중 적어도 하나를 포함하는, 시스템. - 임의의 선행하는 청구항에 있어서, 상기 데이터 프로세싱 시스템은:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성을 획득하기 위해 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 폴링하고;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성을 획득하기 위해 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 폴링하고;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성과 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성의 비교에 기초하여, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 설정하도록 결정하고; 그리고
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로 설정하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 설정하는, 시스템. - 임의의 선행하는 청구항에 있어서, 상기 데이터 프로세싱 시스템은:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스와 상기 네트워크 연결 디바이스 사이의 제1 링크 및 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스와 상기 네트워크 연결 디바이스 사이의 제2 링크를 상기 메모리의 중앙화된 계정에 저장하고; 그리고
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 선택에 응답하여, 상기 제1 링크에 기초하여, 상기 액션 데이터 구조의 생성을 위한 정보를 검색하는 것에 응답하여 상기 중앙화된 계정에 액세스하는, 시스템. - 청구항 5에 있어서, 상기 중앙화된 계정은 상기 제1 디지털 어시스턴트 및 상기 제2 디지털 어시스턴트 중 적어도 하나에 대한 링크를 갖는 복수의 이종 네트워크 연결 디바이스와 연관된 정보를 저장하며, 상기 데이터 프로세싱 시스템은:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해 검출된 상기 입력 오디오 신호의 특성의 제1 값을 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해 검출된 상기 입력 오디오 신호의 특성의 제2 값과 비교하고; 그리고
상기 비교에 기초하여, 상기 복수의 네트워크 연결 디바이스로부터 상기 네트워크 연결 디바이스를 선택하는, 시스템. - 임의의 선행하는 청구항에 있어서, 상기 데이터 프로세싱 시스템은:
기계 학습 모델에 기초하여, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로 설정하도록 결정하는, 시스템. - 임의의 선행하는 청구항에 있어서, 상기 데이터 프로세싱 시스템은:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 조건의 변화를 검출하고; 그리고
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 조건의 변화에 기초하여, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로 스위칭하고, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 스위칭하는, 시스템. - 임의의 선행하는 청구항에 있어서, 상기 데이터 프로세싱 시스템은:
기계 학습 모델에 기초하여, 신호 프로세싱을 위한 상기 임계치를 결정하고; 그리고
상기 임계치를 상기 메모리의 중앙화된 계정에 저장하는, 시스템. - 임의의 선행하는 청구항에 있어서,
제2 입력 오디오 신호를 수신하는 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 상기 제2 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족하지 않는다고 결정하고, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하지 않다는 표시를 상기 데이터 프로세싱 시스템에 전송하는, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행되는 상기 신호 품질 검사기;
상기 제2 입력 오디오 신호를 수신하는 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 상기 제2 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 상기 데이터 프로세싱 시스템에 전송하는, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행되는 상기 신호 품질 검사기를 포함하며;
상기 데이터 프로세싱 시스템은:
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스로부터, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하지 않다는 표시를 수신하고;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스로부터, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 수신하고;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하지 않고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 것에 기초하여, 상기 제2 입력 오디오 신호를 프로세싱하기 위해 상기 제2 디지털 어시스턴트 컴퓨팅을 선택하고;
상기 다이렉트 액션 API는 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스로부터 제2 명령을 포함하는 데이터 패킷을 수신하는, 시스템. - 음성 구동 컴퓨팅 환경에서 컴퓨팅 디바이스들 사이에서 신호 프로세싱을 조정하는 방법으로서,
제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서를 통해 입력 오디오 신호를 검출하는 단계;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행된 신호 품질 검사기에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하는 단계;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 하나 이상의 프로세서 및 메모리를 포함하는 데이터 프로세싱 시스템에 전송하는 단계;
제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서를 통해 상기 입력 오디오 신호를 검출하는 단계;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행된 신호 품질 검사기에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하는 단계;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 상기 데이터 프로세싱 시스템에 전송하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스로부터의 상기 표시 및 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스로부터의 상기 표시를 수신하는 단계;
상기 데이터 프로세싱 시스템에 의해, 주 신호 프로세서로 설정된 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스 및 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시에 기초하여, 상기 입력 오디오 신호를 프로세싱하기 위해 상기 제1 디지털 어시스턴트를 선택하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 입력 오디오 신호를 프로세싱하기 위해 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 지시하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하는 것을 방지하기 위해 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 대기 모드에 진입하도록 지시하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스로부터 명령을 포함하는 데이터 패킷을 수신하는 단계, 상기 명령은 상기 입력 오디오 신호에 기초하여 상기 제1 디지털 어시스턴트에 의해 생성되며;
상기 데이터 프로세싱 시스템에 의해, 복수의 네트워크 연결 디바이스로부터 선택된 네트워크 연결 디바이스에 대해, 상기 명령에 기초하여 액션 데이터 구조를 생성하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 네트워크 연결 디바이스를 제어하기 위해 상기 액션 데이터 구조를 네트워크 연결 디바이스에 전송하는 단계를 포함하는, 방법. - 청구항 11에 있어서, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스는 제1 유형의 디바이스를 포함하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스는 제2 유형의 디바이스를 포함하고,
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스, 제2 디지털 어시스턴트 컴퓨팅 디바이스 및 네트워크 연결 디바이스 각각은 어시스턴트 소프트웨어 개발 키트로 구성되며,
제1 유형의 디바이스는 스피커 디바이스, 텔레비전 디바이스, 모바일 디바이스 및 웨어러블 디바이스 중 적어도 하나를 포함하고,
제2 유형의 디바이스는 스피커 디바이스, 텔레비전 디바이스, 모바일 디바이스 및 웨어러블 디바이스 중 적어도 하나를 포함하고, 그리고
네트워크 연결 디바이스는 스피커 디바이스, 텔레비전 디바이스, 모바일 디바이스, 웨어러블 디바이스, 디지털 램프, 디지털 온도 조절기, 디지털 기기 및 디지털 자동차 중 적어도 하나를 포함하는, 방법. - 청구항 11 또는 청구항 12에 있어서,
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성을 획득하기 위해 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 폴링하는 단계;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성을 획득하기 위해 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 폴링하는 단계;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성과 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 하나 이상의 특성의 비교에 기초하여, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 설정하도록 결정하는 단계; 및
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로 설정하고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 설정하는 단계를 더 포함하는, 방법. - 청구항 11, 12 또는 13에 있어서,
상기 데이터 프로세싱 시스템에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스와 상기 네트워크 연결 디바이스 사이의 제1 링크 및 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스와 상기 네트워크 연결 디바이스 사이의 제2 링크를 상기 메모리의 중앙화된 계정에 저장하는 단계; 및
상기 데이터 프로세싱 시스템에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 선택에 응답하여, 상기 제1 링크에 기초하여, 상기 액션 데이터 구조의 생성을 위한 정보를 검색하는 것에 응답하여 상기 중앙화된 계정에 액세스하는 단계를 포함하는, 방법. - 청구항 11 내지 14 중 어느 한 항에 있어서,
기계 학습 모델에 기초하여, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로 설정하도록 결정하는 단계를 포함하는, 방법. - 청구항 11 내지 15 중 어느 한 항에 있어서,
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 조건의 변화를 검출하는 단계;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 조건의 변화에 기초하여, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스를 주 신호 프로세서로 스위칭하는 단계; 및
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스를 부 신호 프로세서로 스위칭하는 단계를 포함하는, 방법. - 청구항 11 내지 16 중 어느 한 항에 있어서,
기계 학습 모델에 기초하여, 신호 프로세싱을 위한 상기 임계치를 결정하는 단계; 및
상기 임계치를 상기 메모리의 중앙화된 계정에 저장하는 단계를 포함하는, 방법. - 청구항 11 내지 17 중 어느 한 항에 있어서,
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해, 제2 입력 오디오 신호를 수신하는 단계;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행된 신호 품질 검사기에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 상기 제2 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족하지 않는다고 결정하는 단계;
상기 제1 디지털 어시스턴트 컴퓨팅 디바이스에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하지 않다는 표시를 상기 데이터 프로세싱 시스템에 전송하는 단계;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해, 상기 제2 입력 오디오 신호를 수신하는 단계;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해 실행된 신호 품질 검사기에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 제2 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하는 단계;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 상기 데이터 프로세싱 시스템에 전송하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스로부터, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하지 않다는 표시를 수신하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스로부터, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시를 수신하는 단계;
상기 데이터 프로세싱 시스템에 의해, 상기 제1 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하지 않고, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 제2 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 것에 기초하여, 상기 제2 입력 오디오 신호를 프로세싱하기 위해 상기 제2 디지털 어시스턴트 컴퓨팅을 선택하는 단계;
상기 다이렉트 액션 API에 의해, 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스로부터 제2 명령을 포함하는 데이터 패킷을 수신하는 단계를 포함하는, 방법. - 디지털 어시스턴트 컴퓨팅 디바이스로서,
입력 오디오 신호를 검출하는 센서; 및
오디오 드라이버;
프리-프로세서 컴포넌트에 의해 실행되는 신호 품질 검사기;
상기 센서 및 상기 오디오 드라이버에 연결된 프리-프로세서 컴포넌트를 포함하며, 상기 프리-프로세서 컴포넌트는:
상기 디지털 어시스턴트 컴퓨팅 디바이스의 센서에 의해 검출된 상기 입력 오디오 신호가 신호 프로세싱을 위한 임계치를 만족한다고 결정하고;
상기 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하도록 동작가능하다는 표시를 네트워크를 통해 데이터 프로세싱 시스템에 전송하고, 상기 표기는 상기 데이터 프로세싱 시스템으로 하여금:
상기 디지털 어시스턴트 컴퓨팅 디바이스로부터 상기 표시를 수신하게 하고;
상기 디지털 컴퓨팅 디바이스가 주 신호 프로세서로 설정되고, 상기 입력 오디오 신호를 검출하는 제2 디지털 컴퓨팅 디바이스가 부 신호 프로세서로 설정된다고 결정하게 하고, 상기 제2 디지털 컴퓨팅 디바이스는 상기 입력 오디오 신호를 프로세싱하도록 동작하고;
상기 주 신호 프로세서로 설정된 상기 디지털 어시스턴트 컴퓨팅 디바이스 및 상기 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하기 위해 동작가능하다는 표시에 기초하여, 상기 입력 오디오 신호를 프로세싱하기 위해 상기 디지털 어시스턴트를 선택하게 하고;
상기 입력 오디오 신호를 프로세싱하기 위한 명령어를 상기 디지털 어시스턴트 컴퓨팅 디바이스에 전송하고;
상기 제2 디지털 어시스턴트 컴퓨팅 디바이스가 상기 입력 오디오 신호를 프로세싱하는 것을 방지하기 위해 대기 모드에 진입하는 명령어를 상기 제2 디지털 어시스턴트 컴퓨팅 디바이스에 전송하고;
상기 디지털 어시스턴트 컴퓨팅 디바이스의 상기 프리-프로세서 컴포넌트는:
상기 입력 오디오 신호를 프로세싱하기 위한 명령어를 수신하고;
상기 입력 오디오 신호에 기초한 명령을 포함하는 데이터 패킷을 생성하고; 그리고
상기 데이터 패킷을 상기 데이터 프로세싱 시스템에 전송하여 상기 데이터 프로세싱 시스템으로 하여금:
상기 복수의 네트워크 연결 디바이스로부터 선택된 네트워크 연결 디바이스에 대해, 상기 디지털 컴퓨팅 디바이스로부터 수신된 상기 명령에 기초하여 액션 데이터 구조를 생성하게 하고;
상기 네트워크 연결 디바이스를 제어하기 위해 상기 액션 데이터 구조를 상기 네트워크 연결 디바이스에 전송하게 하는, 디지털 어시스턴트 컴퓨팅 디바이스. - 청구항 19에 있어서,
오디오 드라이버;
스피커 컴포넌트; 및
상기 프리-프로세서 컴포넌트를 포함하며, 상기 프리-프로세서 컴포넌트는 상기 네트워크 연결 디바이스에 전송된 상기 액션 데이터 구조의 상태의 표시를 수신하고, 상기 오디오 드라이버에 지시하여 상기 스피커 컴포넌트로 하여금 상기 상태의 표시에 대응하는 오디오 출력을 전송하게 하는 출력 오디오 신호를 생성하는, 디지털 어시스턴트 컴퓨팅 디바이스.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020227044827A KR102691427B1 (ko) | 2017-12-08 | 2017-12-08 | 디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/US2017/065462 WO2019112625A1 (en) | 2017-12-08 | 2017-12-08 | Signal processing coordination among digital voice assistant computing devices |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227044827A Division KR102691427B1 (ko) | 2017-12-08 | 2017-12-08 | 디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20200089728A true KR20200089728A (ko) | 2020-07-27 |
| KR102480949B1 KR102480949B1 (ko) | 2022-12-23 |
Family
ID=60943105
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020207018067A Active KR102480949B1 (ko) | 2017-12-08 | 2017-12-08 | 디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 |
| KR1020227044827A Active KR102691427B1 (ko) | 2017-12-08 | 2017-12-08 | 디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227044827A Active KR102691427B1 (ko) | 2017-12-08 | 2017-12-08 | 디지털 음성 어시스턴트 컴퓨팅 디바이스들 사이에서 신호 프로세싱 조정 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US11037555B2 (ko) |
| EP (2) | EP4191412B1 (ko) |
| JP (1) | JP6977169B2 (ko) |
| KR (2) | KR102480949B1 (ko) |
| CN (2) | CN117632482A (ko) |
| WO (1) | WO2019112625A1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20230112781A (ko) * | 2022-01-20 | 2023-07-28 | 주식회사 마인드웨어웍스 | 질의 처리 장치 |
Families Citing this family (95)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
| US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
| DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
| US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
| US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
| KR101959188B1 (ko) | 2013-06-09 | 2019-07-02 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
| WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
| US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
| US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
| US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| US12223282B2 (en) | 2016-06-09 | 2025-02-11 | Apple Inc. | Intelligent automated assistant in a home environment |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| US12197817B2 (en) | 2016-06-11 | 2025-01-14 | Apple Inc. | Intelligent device arbitration and control |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
| DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
| US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Multi-modal interfaces |
| US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
| DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
| JP6481787B1 (ja) * | 2018-02-14 | 2019-03-13 | オムロン株式会社 | デバイス選択装置、データセット選択装置、デバイス選択方法及びプログラム |
| KR20190102509A (ko) * | 2018-02-26 | 2019-09-04 | 삼성전자주식회사 | 음성 명령을 수행하는 방법 및 시스템 |
| US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
| JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
| US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
| US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
| US10649727B1 (en) * | 2018-05-14 | 2020-05-12 | Amazon Technologies, Inc. | Wake word detection configuration |
| JP7131077B2 (ja) * | 2018-05-24 | 2022-09-06 | カシオ計算機株式会社 | 会話装置、ロボット、会話装置制御方法及びプログラム |
| DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
| US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
| DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
| DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
| CN108922528B (zh) * | 2018-06-29 | 2020-10-23 | 百度在线网络技术(北京)有限公司 | 用于处理语音的方法和装置 |
| US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
| WO2020070878A1 (ja) * | 2018-10-05 | 2020-04-09 | 本田技研工業株式会社 | エージェント装置、エージェント制御方法、およびプログラム |
| KR102179085B1 (ko) * | 2018-10-26 | 2020-11-16 | 주식회사 뮤즈라이브 | 비접촉 방식의 사용자 인증 방법 |
| KR102739672B1 (ko) * | 2019-01-07 | 2024-12-09 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법. |
| CN120321062A (zh) * | 2019-02-08 | 2025-07-15 | 谷歌有限责任公司 | 适应第三方服务器的设备状态报告的差异 |
| US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
| US11973894B2 (en) | 2019-04-30 | 2024-04-30 | Apple Inc. | Utilizing context information with an electronic device |
| US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
| DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
| US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
| DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
| DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | User activity shortcut suggestions |
| US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
| US20210050003A1 (en) * | 2019-08-15 | 2021-02-18 | Sameer Syed Zaheer | Custom Wake Phrase Training |
| TWI842905B (zh) * | 2019-12-16 | 2024-05-21 | 南韓商恩希軟件股份有限公司 | 線上服務存取控制裝置及方法 |
| KR102877081B1 (ko) | 2019-12-19 | 2025-10-24 | 삼성전자주식회사 | 컴퓨팅 장치 및 그 동작 방법 |
| EP4085358B1 (en) * | 2019-12-30 | 2025-06-18 | Telecom Italia SpA | Method for authenticating a user, and artificial intelligence system operating according to said method |
| US11393471B1 (en) * | 2020-03-30 | 2022-07-19 | Amazon Technologies, Inc. | Multi-device output management based on speech characteristics |
| US11183193B1 (en) * | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
| US11810578B2 (en) | 2020-05-11 | 2023-11-07 | Apple Inc. | Device arbitration for digital assistant-based intercom systems |
| US12301635B2 (en) | 2020-05-11 | 2025-05-13 | Apple Inc. | Digital assistant hardware abstraction |
| US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
| JP7310706B2 (ja) * | 2020-05-18 | 2023-07-19 | トヨタ自動車株式会社 | エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム |
| US11367447B2 (en) * | 2020-06-09 | 2022-06-21 | At&T Intellectual Property I, L.P. | System and method for digital content development using a natural language interface |
| US11735197B2 (en) * | 2020-07-07 | 2023-08-22 | Google Llc | Machine-learned differentiable digital signal processing |
| US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
| US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
| US11907676B1 (en) * | 2020-08-28 | 2024-02-20 | Amazon Technologies, Inc. | Processing orchestration for systems including distributed components |
| EP3989218A1 (de) * | 2020-10-21 | 2022-04-27 | Deutsche Telekom AG | Bedienungsfreundlicher virtueller sprachassistent |
| US12404698B1 (en) | 2020-11-03 | 2025-09-02 | Josh.Ai, Inc. | Physical sensor switch for premises automation |
| US12175972B1 (en) * | 2020-11-03 | 2024-12-24 | Josh.Ai, Inc. | Distributed architecture for premises automation |
| US11605387B1 (en) * | 2021-03-30 | 2023-03-14 | Amazon Technologies, Inc. | Assistant determination in a skill |
| US11538480B1 (en) * | 2021-03-30 | 2022-12-27 | Amazon Technologies, Inc. | Integration of speech processing functionality with organization systems |
| CN113689884B (zh) * | 2021-09-17 | 2024-01-26 | 中国电子科技集团公司第五十八研究所 | 多通道语音信号评估系统及方法 |
| US12243519B2 (en) * | 2021-11-03 | 2025-03-04 | Merlyn Mind, Inc. | Automatic adaptation of multi-modal system components |
| US12284256B2 (en) * | 2022-02-22 | 2025-04-22 | Intuition Robotics, Ltd. | System and method thereof for determining availability of a user for interaction with a digital assistant |
| US12153879B2 (en) * | 2022-04-19 | 2024-11-26 | International Business Machines Corporation | Syntactic and semantic autocorrect learning |
| US12386901B2 (en) * | 2022-09-30 | 2025-08-12 | Google Llc | Selecting a device to respond to device-agnostic user requests |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20170090864A1 (en) * | 2015-09-28 | 2017-03-30 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
Family Cites Families (47)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0765084A3 (en) | 1995-09-21 | 1997-10-15 | At & T Corp | Automatic video tracking system |
| JP4086280B2 (ja) * | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
| KR100506168B1 (ko) * | 2003-03-11 | 2005-08-05 | 현대통신 주식회사 | 원격에서 음성인식을 이용한 홈오토메이션/홈네트웍 상태감시 장치 및 그방법 |
| US20060085183A1 (en) | 2004-10-19 | 2006-04-20 | Yogendra Jain | System and method for increasing recognition accuracy and modifying the behavior of a device in response to the detection of different levels of speech |
| KR20090022379A (ko) * | 2007-08-30 | 2009-03-04 | 주식회사 티이씨앤코 | 홈서버 기능이 내장된 다기능 인터넷 화상전화기 및 그것을이용한 홈네트워크 시스템 |
| US8159990B2 (en) * | 2009-03-11 | 2012-04-17 | Sony Ericsson Mobile Communications Ab | Wireless audio data distribution using broadcast and bidirectional communication channels |
| JP5521908B2 (ja) * | 2010-08-30 | 2014-06-18 | ヤマハ株式会社 | 情報処理装置、音響処理装置、音響処理システムおよびプログラム |
| JP2013257418A (ja) | 2012-06-12 | 2013-12-26 | Sony Corp | 情報処理装置、および情報処理方法、並びにプログラム |
| US9547647B2 (en) * | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
| DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
| US9875494B2 (en) * | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
| US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
| US9520054B2 (en) | 2013-10-07 | 2016-12-13 | Google Inc. | Mobile user interface for smart-home hazard detector configuration |
| US20150195649A1 (en) | 2013-12-08 | 2015-07-09 | Flyover Innovations, Llc | Method for proximity based audio device selection |
| EP3084623B1 (en) | 2013-12-19 | 2018-09-12 | Intel Corporation | Context-aware collaborative user tracking |
| WO2015094369A1 (en) * | 2013-12-20 | 2015-06-25 | Intel Corporation | Transition from low power always listening mode to high power speech recognition mode |
| US20160049147A1 (en) * | 2014-08-13 | 2016-02-18 | Glen J. Anderson | Distributed voice input processing based on power and sensing |
| US20160071399A1 (en) | 2014-09-08 | 2016-03-10 | On Guard LLC | Personal security system |
| US10204622B2 (en) | 2015-09-10 | 2019-02-12 | Crestron Electronics, Inc. | Acoustic sensory network |
| KR101630067B1 (ko) | 2014-10-02 | 2016-06-13 | 유한회사 밸류스트릿 | 복수의 모바일 기기들을 이용한 사용자 위치 파악 및 사용자 제스쳐 인식에 의한 오디오 데이터 컨트롤 방법 및 장치 |
| US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
| US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
| US10079012B2 (en) * | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
| US9848075B1 (en) * | 2015-05-14 | 2017-12-19 | Invoy Technologies, Llc | Communication system for pairing user devices with medical devices |
| US9924010B2 (en) * | 2015-06-05 | 2018-03-20 | Apple Inc. | Audio data routing between multiple wirelessly connected devices |
| US10938873B2 (en) | 2015-06-22 | 2021-03-02 | Loose Cannon Systems, Inc. | Portable group communication device having audio playback and/or phone call capability |
| CN106469040B (zh) * | 2015-08-19 | 2019-06-21 | 华为终端有限公司 | 通信方法、服务器及设备 |
| KR20170027999A (ko) | 2015-09-03 | 2017-03-13 | 삼성전자주식회사 | 사용자 단말 장치, 시스템 및 그 제어 방법 |
| US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
| US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
| US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
| US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
| CN105242556A (zh) | 2015-10-28 | 2016-01-13 | 小米科技有限责任公司 | 智能设备的语音控制方法、装置、控制设备及智能设备 |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10044798B2 (en) | 2016-02-05 | 2018-08-07 | International Business Machines Corporation | Context-aware task offloading among multiple devices |
| US9779735B2 (en) * | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
| US9749583B1 (en) | 2016-03-31 | 2017-08-29 | Amazon Technologies, Inc. | Location based device grouping with voice control |
| CN107404381A (zh) * | 2016-05-19 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 一种身份认证方法和装置 |
| US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
| WO2018022085A1 (en) | 2016-07-29 | 2018-02-01 | Hewlett-Packard Development Company, L.P. | Identification of preferred communication devices |
| CN106448658B (zh) * | 2016-11-17 | 2019-09-20 | 海信集团有限公司 | 智能家居设备的语音控制方法及智能家居网关 |
| US10839795B2 (en) * | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
| KR101925034B1 (ko) | 2017-03-28 | 2018-12-04 | 엘지전자 주식회사 | 스마트 컨트롤링 디바이스 및 그 제어 방법 |
| CN107135445A (zh) | 2017-03-28 | 2017-09-05 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
| CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
| US10237393B1 (en) | 2017-09-12 | 2019-03-19 | Intel Corporation | Safety systems and methods that use portable electronic devices to monitor the personal safety of a user |
| US10685648B2 (en) | 2017-11-08 | 2020-06-16 | International Business Machines Corporation | Sensor fusion model to enhance machine conversational awareness |
-
2017
- 2017-12-08 EP EP23154081.6A patent/EP4191412B1/en active Active
- 2017-12-08 CN CN202311517679.7A patent/CN117632482A/zh active Pending
- 2017-12-08 EP EP17826346.3A patent/EP3707607B1/en active Active
- 2017-12-08 JP JP2020531042A patent/JP6977169B2/ja active Active
- 2017-12-08 KR KR1020207018067A patent/KR102480949B1/ko active Active
- 2017-12-08 WO PCT/US2017/065462 patent/WO2019112625A1/en not_active Ceased
- 2017-12-08 US US15/764,907 patent/US11037555B2/en active Active
- 2017-12-08 KR KR1020227044827A patent/KR102691427B1/ko active Active
- 2017-12-08 CN CN201780098121.6A patent/CN111542810B/zh active Active
-
2021
- 2021-06-11 US US17/346,009 patent/US11705127B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20170090864A1 (en) * | 2015-09-28 | 2017-03-30 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20230112781A (ko) * | 2022-01-20 | 2023-07-28 | 주식회사 마인드웨어웍스 | 질의 처리 장치 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6977169B2 (ja) | 2021-12-08 |
| CN111542810A (zh) | 2020-08-14 |
| US20210304761A1 (en) | 2021-09-30 |
| EP3707607A1 (en) | 2020-09-16 |
| KR102480949B1 (ko) | 2022-12-23 |
| EP3707607B1 (en) | 2023-02-01 |
| CN111542810B (zh) | 2023-12-01 |
| US11705127B2 (en) | 2023-07-18 |
| US11037555B2 (en) | 2021-06-15 |
| KR102691427B1 (ko) | 2024-08-05 |
| JP2021513693A (ja) | 2021-05-27 |
| WO2019112625A1 (en) | 2019-06-13 |
| KR20230004947A (ko) | 2023-01-06 |
| EP4191412A1 (en) | 2023-06-07 |
| US20200312317A1 (en) | 2020-10-01 |
| EP4191412B1 (en) | 2026-02-04 |
| CN117632482A (zh) | 2024-03-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11705127B2 (en) | Signal processing coordination among digital voice assistant computing devices | |
| US11823704B2 (en) | Signal processing coordination among digital voice assistant computing devices | |
| US20240152320A1 (en) | Architecture for a Hub Configured to Control a Second Device While a Connection to a Remote System is Unavailable | |
| JP7044916B2 (ja) | データ送信のためのフィードバックコントローラ | |
| EP3633503B1 (en) | User-adaptive volume selection | |
| JP2022547598A (ja) | コンテキストデータを使用した対話処理のための技術 | |
| US12374336B2 (en) | Combining device or assistant-specific hotwords in a single utterance | |
| KR20200091895A (ko) | 네트워크 시스템의 분산 식별 | |
| JP7328304B2 (ja) | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 | |
| US11442692B1 (en) | Acoustic workflow system distribution |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PA0104 | Divisional application for international application |
St.27 status event code: A-0-1-A10-A18-div-PA0104 St.27 status event code: A-0-1-A10-A16-div-PA0104 |
|
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| U11 | Full renewal or maintenance fee paid |
Free format text: ST27 STATUS EVENT CODE: A-4-4-U10-U11-OTH-PR1001 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 4 |