TW201719631A - 經由鼻振動感測進行語音擷取的系統 - Google Patents

經由鼻振動感測進行語音擷取的系統 Download PDF

Info

Publication number
TW201719631A
TW201719631A TW105124480A TW105124480A TW201719631A TW 201719631 A TW201719631 A TW 201719631A TW 105124480 A TW105124480 A TW 105124480A TW 105124480 A TW105124480 A TW 105124480A TW 201719631 A TW201719631 A TW 201719631A
Authority
TW
Taiwan
Prior art keywords
sensor
user
electronic signal
voice
nasal
Prior art date
Application number
TW105124480A
Other languages
English (en)
Other versions
TWI696170B (zh
Inventor
波羅 羅佩茲邁爾
黑客多 寇多利爾瑪屋
裘莉歐 札莫拉艾桂爾
亞樂甲多 伊巴拉凡博
瓊斯 卡馬丘佩樂
Original Assignee
英特爾股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/854,927 external-priority patent/US9924265B2/en
Application filed by 英特爾股份有限公司 filed Critical 英特爾股份有限公司
Publication of TW201719631A publication Critical patent/TW201719631A/zh
Application granted granted Critical
Publication of TWI696170B publication Critical patent/TWI696170B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/46Special adaptations for use as contact microphones, e.g. on musical instrument, on stethoscope
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/04Supports for telephone transmitters or receivers
    • H04M1/05Supports for telephone transmitters or receivers specially adapted for use on head, throat or breast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72409User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
    • H04M1/72412User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/13Hearing devices using bone conduction transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Electric hearing aids
    • H04R25/60Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles
    • H04R25/604Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)

Abstract

本發明涉及用於經由鼻振動感測進行語音擷取的系統。由使用者佩戴的系統可以能夠在使用者說話時感測通過使用者鼻子的振動,基於感測的振動產生電子訊號並且基於電子訊號產生語音資料。以這種方式,系統可以擷取使用者的語音,同時還屏蔽外部雜訊(例如,基於人類頭骨的聲音衰減特性)。一種範例系統可包括可穿戴的框(例如,鏡框),在其上裝上至少一感測器和裝置。該至少一感測器可感測在使用者鼻子中的振動且可基於該振動產生電子訊號。該裝置可接收來自至少一感測器之電子訊號並且基於電子訊號產生語音資料。

Description

經由鼻振動感測進行語音擷取的系統
本發明係有關於電子通訊,且更特別地是有關於用於基於組態以感測鼻共振之感測器擷取使用者語音的系統。
電子通訊已成為現代社會的一個組成部分。例如,人們可以依靠移動通訊來進行商業和/或個人互動以進行金融交易、查詢各種不同的資料,可用於位置相關的輔助來玩遊戲或觀看多媒體表演等等。諸如全球局域網路(GAN)、像是網際網路的廣域網路(WAN)、區域網路(LAN)、個人區域網路(PAN)等等的多種無線網路的擴展進一步促進使用者在更多的位置中能夠在他們的行動裝置上執行更多的活動。現在,使用者可以在操作機動車輛、乘坐公共交通工具、在工作中、在學校、在家裡、在公共活動等等時打電話、存取網際網路、執行金融交易等。
雖然上述的好處是顯而易見的,但也可能存在可能的負面結果。目前活躍的風潮為當操作機動車輛時不可使用 行動裝置。當開車時使用行動裝置可能使駕駛員從路面分心且導致意外。此外,在公共活動時由於環境噪音使行動裝置難以操作。這些有問題的情況可以透過「免持」周邊設備的出現來緩解。免持週邊設備可提供介面,使用者可透過該介面與保持儲存、在衝電器中的行動裝置互動。這種互動可以透過有線或無線通訊鏈路進行。免持週邊設備之範例可包括但不限制於揚聲器電話、耳機、麥克風、遙控器等等。雖然這些裝置可能有幫助,但它們不是萬能的安排。例如,耳機可以促進免持通訊,但是在某些雜訊的情況下也可能經歷問題。佩戴耳機還需要使用者保持他們通常不會佩戴另一設備,除非期望或需要免持操作,以及在一些區域中佩戴耳機(例如,聽筒)可能具有負面風格影響。
100‧‧‧系統
102‧‧‧框
104,104’‧‧‧感測器
106‧‧‧裝置
108‧‧‧控制電路
110‧‧‧通訊電路
112‧‧‧使用者介面
114‧‧‧電源電路
116‧‧‧外部裝置
118‧‧‧揚聲器
200‧‧‧鼻樑架
202‧‧‧感測電路
204‧‧‧結構支撐件
206‧‧‧振動
208‧‧‧導線
300,302,304,306,308,310,312,314,316‧‧‧操作
所要求保護的發明標的之各種實施例的特徵和優點將在進行下面的詳細敘述及參考附圖而變得顯而易見,其中相同的元件標號表示相同的部份,以及其中:圖1根據本發明至少一實施例闡明用於經由鼻振動感測進行語音擷取的系統;圖2根據本發明至少一實施例闡明用於感測器之範例組態;圖3根據本發明至少一實施例闡明用於經由鼻振動感測進行語音擷取的範例操作。
雖然下面的詳細描述將參考示例性實施例進行,但是對於本領域技術人員來說,許多替換、修改和變化將是顯而易見的。
【發明內容及實施方式】
本發明涉及用於經由鼻振動感測進行語音擷取的系統。由使用者佩戴的系統可以能夠在使用者說話時感測通過使用者鼻子的振動,基於感測的振動產生電子訊號並且基於電子訊號產生語音資料。以這種方式中,系統可擷取使用者的語音以用於例如聽寫、電話通訊等等,同時還屏蔽外部雜訊(例如,基於人類顱骨的自然聲音衰減性質)。一種範例系統可包括可穿戴的框(例如,鏡框),在其上裝上至少一感測器和裝置。該至少一感測器可感測在使用者鼻子中的振動且可基於該振動產生電子訊號。該裝置可接收來自至少一感測器之電子訊號並且基於電子訊號產生語音資料。其它特徵可包括例如對於其中不能感測到振動的情況時的補償、基於用於例如電話通訊等等中接收的音頻資料的聲音產生。
在至少一實施例中,用以擷取使用者語音之系統可包含至少一框、安裝在該框上的至少一感測器以及安裝在該框的裝置。該框可以是使用者可佩戴的。該至少一感測器可為用以當使用者講話時基於在使用者鼻子內感測的振動產生電子訊號。該裝置可以至少從至少一感測器接收該電子訊號,並且處理該電子訊號以產生語音資料。
該框可以用於眼鏡。在此範例實施中,至少一感測器可以結合在眼鏡的至少一鼻樑架中。也可以將兩個感測器嵌入到鼻樑架的兩側中。例如,兩個感測器可以串聯耦接,並且該裝置係用於接收由兩個感測器產生的組合電子訊號。或者,該裝置可以選擇處理從兩個感測器中的一者產生的電子訊號。
該至少一感測器可包含用以產生電子訊號之壓電振動膜(diaphragm)。該裝置可至少包含用以從電子訊號產生語音資料的控制電路。該控制電路也可用以判定語音資料是否包括區域命令,以及如果判定為包括區域命令,則基於該區域命令執行至少一活動。該裝置也可以至少包含用以傳輸語音資料至外部裝置的通訊電路以及用以允許使用者與該系統互動之使用者介面電路。在至少一實施例中,使用者介面電路可用以基於經由該通訊電路從該外部裝置接收的音頻資料產生聲音。與本發明一致,一種用於從使用者擷取語音資料的範例方法可包含啟動感測在可穿戴系統中的鼻部振動、利用可穿戴系統中的至少一感測器感測鼻部振動、基於鼻部振動產生電子訊號以及基於該電子訊號產生語音資料。
圖1根據本發明至少一實施例闡明用於經由鼻振動感測進行語音擷取的系統100。雖然在本文中將採用具體實施方式(例如,在眼鏡中)和/或技術(例如,壓電感測器、藍芽無線通訊等等)的範例,提供這些示例僅僅是為了提供容易理解的觀點,從中可以理解到本文所教導的更 一般化的設備、系統、方法等等。其他應用、組態、技術等等可以導致保持與本文所呈現教導一致的實施方式。
系統100可以包括框102,其上可以安裝至少一感測器104(例如,下文中稱為「感測器104」)以及裝置106。「安裝」可包括經由機械附接(例如,螺釘、釘或其他緊固件)、黏著劑附接(例如,膠水、環氧樹脂等)或被結合在框102結構內而被附接至框102之感測器104和裝置106。為了說明的目的,框102被揭露為一副眼鏡。眼鏡作出適當的基礎,在其上可以實現與本公開一致的各種特徵。此外,因為眼鏡、太陽眼鏡、安全眼鏡等已經被人們常規佩戴,這也意味著對於該技術的採用幾乎沒有障礙。使用者不需要佩戴或攜帶僅用於語音擷取的附加設備。儘管具有上述類型的眼鏡提供的上述優點,但是本文揭露的教導可以替代地以不同的形式因子來實施,包括例如接觸鼻子或至少接近鼻子的任何結構,並且能夠作為本文所敘述的各種系統、裝置、組件等等的平台。
感測器104可包含振動感測電路。在至少一實施例中,感測電路可包含例如壓電組件,諸如振動膜。壓電振動膜可轉換振動(例如,機械壓力波)為電子訊號。與本發明一致,在感測器104中振動感測電路可與佩戴框102之使用者的鼻子接觸或至少靠近佩戴框102之使用者的鼻子。例如,使用者的鼻子的橋是骨,以及當使用者說話時可以共振。感測器104能夠檢測由與使用者的語音共振的鼻骨引起的振動,並且可以將感測到的振動轉換為隨後提 供給裝置106的電子訊號。
裝置106可組態以執行系統100中的活動,諸如(例如)從感測器104產生的電子訊號產生語音資料、傳送該語音資料至外部裝置116、從外部裝置116接收音頻資料、基於接收的音頻資料產生聲音、識別和處理區域命令等等。裝置106可包含例如控制電路108、通訊電路110、使用者介面112以及電源電路114。控制電路108可至少包含資料處理和記憶體資源。資料處理資源可包括例如位於單獨組件中一或多個處理器或者替代地包括在組件(例如,系統晶片(SoC)配置)中的一個或多個處理核心、以及任何處理器相關的支持電路(例如,橋接介面等等)。範例處理器可包括(但不限制於)可從Intel公司獲得的各種基於x86基微處理器,包括Pentium®、Xeon®、Itanium®、Celeron®、Atom®、Quark®、Core i系列、產品系列、高階RISC(例如,精簡指令集計算)機器或「ARM」處理器等等。支持電路的範例可以包括用以提供其中資料處理資源可在裝置106中與其它系統組件以不同速度、在不同匯流排上操作的互動的表面的晶片組(例如,可從Intel公司獲得的Northbridge、Southbridge等)。通常與支持電路相關聯的一些或全部功能也可以包括在與處理器相同的物理封裝中(例如,諸如可從Intel公司取得的Sandy Bridge系列處理器)。
資料處理資源可組態以執行各種裝置106中的指令。指令可包括組態以導致資料處理資源以執行有關於讀取資 料、寫入資料、處理資料、制定資料、轉換資料、變換資料等等的活動的程式碼。資訊(例如,指令、資料等等)可儲存在記憶體資源中。記憶體資源可包含以固定或可去除格式的隨機存取記憶體(RAM)或唯讀記憶體(ROM)。RAM可包括組態以在裝置106操作期間保持資訊之揮發性記憶體,諸如(例如)靜態RAM(SRAM)和動態RAM(DRAM)。ROM可以包括基於BIOS、UEFI等組態以在裝置106被啟動時提供指令的非揮發性(non-volatile;NV)記憶體電路,諸如電子可編程ROM(EPROMS)、快閃記憶體等可編程記憶體。其他固定/可移除記憶體可以包括但不限於諸如(例如)軟碟、硬碟驅動器等的磁性記憶體,諸如固態快閃記憶體(例如,嵌入式多媒體卡(eMMC)等等)的電子記憶體、可移除記憶體卡或棒(例如,微儲存設備(uSD)、USB等),諸如基於光碟的ROM(CD-ROM),數位影音光碟(DVD),藍光光碟等等的光學記憶體。
通訊電路110可管理用於裝置106之通訊相關操作,其可包括組態以支持有線和/或無線通訊的資源。裝置106可包含多組通訊電路110(例如,包括用於有線協定和/或無線無線電之分開的物理介面電路)。有線通訊可以包括諸如乙太網路、通用串列匯流排(USB)、火線、雷霆(Thunderbolt)、數位影音介面(DVI)、高清晰度多媒體介面(HDMI)等的串行和並行有線媒體。無線通訊可以包括,例如近距離無線媒體(例如,基於RF標識 (RFID)或近場通訊(NFC)標準、紅外線(IR)等等的射頻(RF)),短距離無線媒體(例如,藍芽、WLAN、Wi-Fi等等)、遠程無線媒體(例如,蜂巢廣域無線電通訊、基於衛星的通訊等等)、經由聲波的電子通訊等等。在一實施例中,通訊電路110可以被組態以防止無線通訊間的彼此干擾。在執行該功能時,通訊電路110可以基於例如等待傳輸訊息的相對優先級來排程通訊活動。
使用者介面電路112可以包括允許使用者與裝置106互動的硬體和/或軟體,諸如(例如)各種輸入機制(例如麥克風、開關、按鈕、旋鈕、鍵盤、揚聲器、觸敏(touch-sensitive)表面、組態以擷取影像和/或感測接近度、距離、運動、手勢、方向、生物測定資料等等的一或多個感測器)和各種輸出機制(例如,揚聲器、顯示器、照明/閃爍指示器、用於振動、運動等等的機電組件)。在使用者介面電路112中的硬體可結合在裝置106內和/或可經由有線或無線通訊媒體耦接至裝置106。電源電路114可包括內部電源(例如,電池、燃料電池等等)和/或外部電源(例如,電網、機電或太陽能發電器、外部燃料電池等等)以及組態以提供裝置106所需用來操作之電源的相關電路。
外部裝置116可以包括至少能夠處理由裝置106產生的語音資料的設備。外部裝置116的範例可以包括但不限於諸如基於來自Google公司的Android® OS、來自蘋果 公司的iOS®或Mac OS®的蜂巢式手機或智慧型電話、來自微軟公司的Windows® OS、Linux® OS、Tizen® OS和/或可以被認為是來自Linux Foundation的Linux® OS的衍生物、來自Mozilla Project的Firefox® OS、來自Blackberry公司的Blackberry®OS,來自Hewlett-Packard公司的Palm® OS,來自Symbian Foundation的Symbian® OS等等的行動通訊裝置、行動計算裝置,諸如來自蘋果公司之像是iPad®、來自微軟公司的Surface®、來自三星公司的Galaxy Tab®、來自亞馬遜公司的Kindle®等等的平板電腦、包括來自Intel公司的低功率晶片組的輕薄型筆電、筆記型電腦、膝上型電腦、掌上型電腦等等、諸如來自三星的Galaxy Gear®、來自蘋果公司的Apple Watch®等等的手錶形狀因子計算裝置的可穿戴設備、諸如桌上型電腦的典型固定計算設備、伺服器、組織在高性能計算(HPC)架構中計算裝置組、智慧型電視或其他類型的「智慧型」裝置、來自Intel公司的下一單元的計算(NUC)平台的小形狀因數計算解決方案(例如,用於空間有限的應用、電視機頂盒等等)等等或它們的組合。
在一範例操作中,系統100可由使用者穿戴以及藉由使用者與使用者介面電路112的互動來手動啟動、或者藉由使用者啟動外部裝置116自動啟動、啟動在外部裝置116上的應用程式、說出區域命令等等。在說出區域命令中,裝置106可以處於節能模式並且裝置106可以識別某個聲音、字、短語等(例如,以電子訊號形式或者在轉換 為語音資料之後)的話作為區域命令以啟動系統100(例如,轉變裝置106從節能模式到活動模式)。其它區域命令可以例如停用系統100、靜音系統100(例如,暫時停止感測操作或傳輸操作)、增加或減少揚聲器音量等。在啟動系統100之後,感測器104可以感測鼻子中的振動(例如,使用者鼻子的骨橋),並且可以基於振動產生電子訊號。電子訊號可由裝置106接收,其可基於電子訊號產生語音資料。例如,控制電路108可轉換類比訊號為數位語音資料。下一個操作取決於系統100被使用的情況。例如,如果正在發生簡單聽寫,則控制電路108可以將語音資料儲存在記憶體中以供稍後取回。如果進行電話呼叫,則通訊電路110可以將語音資料發送到外部設備116(例如,行動通訊裝置),並且可以從外部設備116接收關於在呼叫中的另一方的音頻資料。使用者介面電路112可接著經由(例如)揚聲器118產生聲音,使得使用者可與另一個呼叫者互動。在至少一實施例中,可以透過揚聲器118產生使用者自己的語音的聲音,以向使用者的系統100提供聽覺反饋。
圖2根據本發明至少一實施例闡明用於感測器104’之範例組態。圖2顯示了在鼻樑架200內的感測器104’。鼻樑架200可包含例如至少固定到結構支撐件204的感測電路202。感測電路202可包括例如用以轉換振動206為電子訊號的壓電振動膜。振動206可以由於來自使用者說話的顱骨共振而發生。這種效果具有雙重好處,因為它允許 擷取使用者的語音,同時還基於人類頭骨自然抑制外部噪聲的能力來屏蔽外部雜訊。壓電振動膜的使用是有利的,因為它們能夠準確地產生指示語音的電子訊號並且不需要外部電源(例如,壓力波可壓縮壓電晶體以產生電子訊號)。
雖然圖2中顯示的導線208係用以將電子訊號傳送到裝置106,無線通訊的使用也可以傳送電子訊號。各種感測器配置可以與本發明一致地實現。例如,假設兩個鼻樑架200存在於一般的一副眼鏡中,兩個鼻樑架200中的至少一可以包括感測器104’。在另一範例實施中,兩個鼻樑架200皆可包括感測器104’。在每一鼻樑架200中的感測器104’可以串聯佈線以產生更強的電子訊號。在另一實施例中,每個鼻樑架200中的感測器104’可以單獨地佈線,並且裝置106(例如,控制電路108)中的資源可以接著基於從每個感測器104’接收的電子訊號的強度來選擇要採用的感測器104’。以這種方式,系統100能夠考慮每個使用者的鼻骨中的特性(例如,斷裂、自然變形,諸如偏差的隔膜等)並且選擇可以提供最強以及最乾淨的電子訊號的特定感測器104’以用於產生語音資料。
圖3根據本發明至少一實施例闡明用於經由鼻振動感測進行語音擷取的範例操作。在圖3中以虛線輪廓顯示的操作可以基於實現的細節為可選擇的,包括例如系統(例如,系統內的感測器、裝置等等)之能力、系統的配置、系統預期的使用等等。在操作300中,鼻振動感測可以啟 動。啟動可以是手動的(例如由系統的使用者發起)或自動的(例如,由外部裝置活動、區域命令等觸發)。在操作302中可以判定是否由系統中的至少一個感測器感測到鼻振動。如果在操作302中確定沒有感測到鼻振動,則在操作304中可以發生至少一個校正動作。校正動作的範例可包括產生對於使用者為可聽、可視和/或觸覺通知,如返回到操作300的箭頭所示之重新啟動系統,系統中另一感測器的選擇(例如,當系統是眼鏡時,在相對的鼻樑架中的感測器)等等。
如果在操作302中判定感測到鼻振動,則在操作306中,可以基於由至少一個感測器產生的電子訊號產生語音資料。在操作308中可以判定電子訊號和/或語音資料是否包括區域命令。例如,可以在系統中組態成區域命令組,並且系統中的控制電路可以將電子訊號和/或語音資料與區域命令組進行比較,以判定是否存在匹配。如果在操作308中判定接收到區域命令,則在操作310中,可以基於感測到的區域命令來執行至少一個活動。可以執行的活動的範例包括但不限於打開/關閉系統、調整系統音量、暫時禁用語音擷取和/或語音資料傳輸等等。在操作308中判定沒有接收到區域命令之後可以在操作312中將語音資料傳輸到外部裝置(例如,像是智能手機的移動通信設備)。在操作314中,可以從外部裝置接收音頻資料(例如,相應於在電話呼叫中的其他參與者的語音資料)。在操作316中,可以基於接收的音頻資料產生聲 音,其後可以返回操作302以繼續鼻振動感測。
雖然圖3根據實施例闡明了操作,但是應當理解到並非圖3中所描繪的所有操作對於其它實施例是必要的。實際上,在本文中完全預期在本發明的其它實施例中,圖3中所描繪的操作和/或本文敘述的其它操作可以以任何附圖中未具體示出的方式組合,但是仍然於本發明完全一致。因此,針對在圖式中未精確示出的特徵和/或操作之所申請保護範圍被認為在本發明的範圍和內容內。
如在本申請以及申請專利範圍中使用的,藉由術語「和/或」加入的項目的列表可以表示所列出的項目的任何組合。例如,短語「A,B和/或C」可以表示A、B、C、A和B、A和C、B和C、或A、B和C。如在本申請和申請專利範圍中所使用的,藉由術語「至少一」加入的項目的列表可以表示所列術語的任何組合。例如,短語「A、B或C中的至少一者」可以表示A、B、C、A和B、A和C、B和C或A、B和C。
如本文的任何實施例中所使用的術語「模組」可以指被組態為執行任何上述操作的軟體、韌體和/或電路。軟體可被實施作為記錄在非暫態電腦可讀儲存媒體的軟體封包、代碼、指令,指令集和/或資料。韌體可被實施作為記憶體裝置中硬編碼(例如,非揮發)的代碼、指令或指令集和/或資料。如本文的任何實施例中所使用的「電路」可以包括例如單個或任何組合的固線式電路、諸如包含一或多個單獨指令處理核心的電腦處理器的可編程電 路、狀態機器電路和/或儲存由可編程電路執行之指令的韌體。這些模組可以共同地或單獨地實施為形成較大的系統,例如積體電路(IC)、系統晶片(SoC)、桌上型電腦、膝上型電腦、平板電腦、伺服器、智慧型手機等等。
本文敘述的任何操作可以在系統中實施,系統包括一或多個儲存媒體(例如,非暫態儲存媒體),其具有單獨地或組合地儲存其上的指令,當指令由一或多個處理器執行時執行該方法。本文中,處理器可包括例如伺服器CPU、行動裝置CPU和/或其它可編程電路。此外,本文敘述的操作的意圖可以橫跨複數個物理裝置分佈,諸如在超過一個的不同物理位置處的處理結構。儲存媒體可以包括任何類型的有形媒體,例如任何類型的碟,包括硬碟、軟碟、光碟、唯讀光碟記憶體(CD-ROM)、可抹寫光碟(CD-RW)和磁光碟、諸如唯讀記憶體(ROM)的半導體裝置、諸如動態和靜態RAM的隨機存取記憶體(RAM)、可消除程式化唯讀記憶體(EPROM)、電子式可清除程式化唯讀記憶體(EEPROM)、快閃記憶體、固態磁碟(SSD)、嵌入式多媒體卡(eMMC)、安全數字輸入/輸出(SDIO)卡、磁卡或光學卡或適於儲存電子指令的任何類型的媒體。其它實施例可被實施作為由可編程控制裝置執行的軟體模組。
因此,本發明涉及用於經由鼻振動感測進行語音擷取的系統。由使用者佩戴的系統可以能夠在使用者說話時感 測通過使用者鼻子的振動,基於感測的振動產生電子訊號並且基於電子訊號產生語音資料。以這種方式,系統可以擷取使用者的語音,同時還屏蔽外部雜訊(例如,基於人類頭骨的聲音衰減特性)。一種範例系統可包可穿戴的框(例如,鏡框),在其上裝上至少一感測器和裝置。該至少一感測器可感測在使用者鼻子中的振動且可基於該振動產生電子訊號。該裝置可接收來自至少一感測器之電子訊號並且基於電子訊號產生語音資料。
下面的範例涉及到進一步的實施例。本發明的以下範例可包括如下面提供的主題材料,諸如設備、方法、用於儲存指令的至少一機器可讀媒體,所述指令被執行時導致機器基於該方法執行動作、基於該方法的手段和/或用於經由鼻振動感測進行語音擷取的系統。
根據範例1,提供了一種用以擷取使用者語音的系統。該系統可包含使用者可穿戴的框,安裝於該框之至少一感測器,其中該至少一感測器係用以基於當該使用者說話時在該使用者鼻中感測的振動產生電子訊號,以及安裝於該框之裝置,其中該裝置係至少用以從該至少一感測器接收該電子訊號以及處理該電子訊號以產生語音資料。
範例2可包括範例1的該些元件,其中該框係用於眼鏡。
範例3可包括範例2的該些元件,其中該至少一感測器結合在用於該眼鏡的至少一鼻樑架中。
範例4可包括範例3的該些元件,其中該至少一鼻樑 架至少包含感測電路和結構支撐。
範例5可包括任何範例3至4的該些元件,其中兩個感測器係嵌入在該鼻樑架之兩側中。
範例6可包括範例5的該些元件,其中該兩個感測器可以串聯耦接,並且該裝置係用以接收由該兩個感測器產生的組合電子訊號。
範例7可包括任何範例5至6的該些元件,其中該裝置係用以選擇處理從該兩個感測器中的一者產生的該電子訊號。
範例8可包括任何範例1至7的該些元件,其中該至少一感測器包含用以產生電子訊號之壓電振動膜。
範例9可包括任何範例1至8的該些元件,其中該裝置可至少包含用以從該電子訊號產生該語音資料的控制電路。
範例10可包括範例9的該些元件,其中該控制電路係用以判定該語音資料是否包括區域命令,以及如果判定為包括區域命令,則基於該區域命令執行至少一活動。
範例11可包括任何範例1至10的該些元件,其中該裝置至少包含用以傳輸該語音資料至外部裝置的通訊電路。
範例12可包括範例11的該些元件,其中該裝置經由無線通訊鏈結耦接至該外部裝置。
範例13可包括任何範例11至12的該些元件,其中該裝置至少包含用以允許該使用者與該系統互動之使用者 介面電路。
範例14可包括範例13的該些元件,其中該使用者介面電路係用以基於經由該通訊電路從該外部裝置接收的音頻資料產生聲音。
範例15可包括任何範例1至14的該些元件,其中該至少一感測器經由佈線耦接至該裝置。
範例16可包括任何範例1至15的該些元件,其中該至少一感測器經由無線通訊鏈結耦接至該裝置。
範例17可包括任何範例1至16的該些元件,其中該框係用於眼鏡以及該至少一感測器結合在用於該眼鏡的至少一鼻樑架中。
範例18可包括任何範例1至17的該些元件,其中該裝置至少包含用以從該電子訊號產生該語音資料、判定該語音資料是否包括區域命令以及如果判定包括區域命令,則基於該區域命令執行至少一活動中的至少一者的控制電路。
根據範例19,提供了一種用於從使用者擷取語音資料的方法。該方法可包含啟動感測在可穿戴系統中的鼻部振動、利用可穿戴系統中的至少一感測器感測鼻部振動、基於鼻部振動產生電子訊號以及基於該電子訊號產生語音資料。
範例20可包括範例19的該些元件,且可更包含判定鼻振動是否已經感測以及如果沒有感測到鼻振動則執行校正動作。
範例21可包括範例20的該些元件,其中執行校正動作包含重新啟動該可穿戴系統或在該可穿戴系統中的另一感測器感測。
範例22可包括任何範例19至21的該些元件,且更包含判定該語音資料是否包含區域命令以及基於該語音資料包含至少一區域命令的判定執行至少一活動。
範例23可包括任何範例19至22的該些元件,且可更包含基於在可穿戴系統中接收的音頻資料產生聲音。
根據範例24,提供一種包括至少一裝置之用於擷取語音資料的系統,該系統被配置以執行上述範例19至23中任一方法。
根據範例25,提供一種配置以執行上述範例19至23中任一方法的晶片組。
根據範例26,提供至少一種機器可讀媒體,其包含回應於在計算裝置上之執行的複數個指令,而導致該計算裝置實施根據上述範例19至23中任一方法。
根據範例27,提供一種組態以擷取語音資料的至少一裝置,該裝置被配置以執行上述範例19至23中任一方法。
根據範例28,提供了一種用於擷取語音資料的系統。該系統可包含用於啟動感測在可穿戴系統中的鼻部振動的手段、用於利用可穿戴系統中的至少一感測器感測鼻部振動的手段、用於基於鼻部振動產生電子訊號的手段以及用於基於該電子訊號產生語音資料的手段。
範例29可包括範例28的該些元件,且更可包含用於判定鼻振動是否已經感測的手段以及用於如果沒有感測到鼻振動,則執行校正動作的手段。
範例30可包括範例29的該些元件,其中該用於執行校正動作的手段包含用於重新啟動該可穿戴系統或以在該可穿戴系統中的另一感測器感測的手段。
範例31可包括任何範例28至30的該些元件,且更包含用於判定該語音資料是否包含區域命令的手段以及用於基於該語音資料包含至少一區域命令的判定執行至少一活動的手段。
範例32可包括任何範例28至31的該些元件,且可更包含用於基於在可穿戴系統中接收的音頻資料產生聲音的手段。
在本文中使用的術語和表達被用為描述性而不是限制性術語,並且在使用這些術語和表達時,並不意圖排除所示出和描述的特徵(或其部分)的以外任何等同物,並且辨識在申請專利範圍內的各種修改是可能的。因此,申請專利範圍旨在涵蓋所有此種均等。
100‧‧‧系統
102‧‧‧框
104‧‧‧感測器
106‧‧‧裝置
108‧‧‧控制電路
110‧‧‧通訊電路
112‧‧‧使用者介面
114‧‧‧電源電路
116‧‧‧外部裝置
118‧‧‧揚聲器

Claims (22)

  1. 一種用以擷取使用者語音的系統,包含:使用者可佩戴的框;安裝到該框的至少一感測器,其中該至少一感測器係用以當該使用者講話時基於在使用者鼻子內感測的振動產生電子訊號;以及安裝到該框的裝置,其中該裝置係用以至少從該至少一感測器接收該電子訊號,並且處理該電子訊號以產生語音資料。
  2. 如申請專利範圍第1項所述之系統,其中該框係用於眼鏡。
  3. 如申請專利範圍第2項所述之系統,其中該至少一感測器係結合在用於該眼鏡的至少一鼻樑架中。
  4. 如申請專利範圍3項所述之系統,其中兩個感測器係嵌入在該鼻樑架之兩側中。
  5. 如申請專利範圍4項所述之系統,其中該兩個感測器可以串聯耦接,並且該裝置係用以接收由該兩個感測器產生的組合電子訊號。
  6. 如申請專利範圍4項所述之系統,其中該裝置係用以選擇處理從該兩個感測器中的一者產生的該電子訊號。
  7. 如申請專利範圍1項所述之系統,其中該至少一感測器包含用以產生該電子訊號之壓電振動膜。
  8. 如申請專利範圍1項所述之系統,其中該裝置至 少包含用以從該電子訊號產生該語音資料的控制電路。
  9. 如申請專利範圍8項所述之系統,其中該控制電路係用以判定該語音資料是否包括區域命令,以及如果判定為包括區域命令,則基於該區域命令執行至少一活動。
  10. 如申請專利範圍1項所述之系統,其中該裝置至少包含用以傳輸該語音資料至外部裝置的通訊電路。
  11. 如申請專利範圍10項所述之系統,其中該裝置至少包含用以允許該使用者與該系統互動的使用者介面電路。
  12. 如申請專利範圍11項所述之系統,其中該使用者介面電路係用以基於經由該通訊電路從該外部裝置接收的音頻資料產生聲音。
  13. 一種用於從使用者擷取語音資料的方法,包含:啟動在可穿戴系統中對鼻振動的感測;在該可穿戴系統中利用至少一感測器感測鼻振動;基於該鼻振動產生電子訊號;以及基於該電子訊號產生語音資料。
  14. 如申請專利範圍第13項所述之方法,更包含:判定是否已經感測到鼻振動;以及如果沒有感測到鼻振動,則執行校正動作。
  15. 如申請專利範圍第14項所述之方法,其中執行校正動作包含重新啟動該可穿戴系統或在該可穿戴系統中的另一感測器感測。
  16. 如申請專利範圍第13項所述之方法,更包含: 判定該語音資料是否包括區域命令;以及基於該語音資料包含至少一區域命令的確定來執行至少一活動。
  17. 如申請專利範圍第13項所述之方法,更包含:基於在該可穿戴系統中接收的音頻資料產生聲音。
  18. 至少一機器可讀儲存裝置,其上單獨地或組合地儲存有用於從使用者擷取語音資料的指令,當指令由一或多個處理器執行時導致該一或多個處理器以:啟動在可穿戴系統中對鼻振動的感測;在該可穿戴系統中利用至少一感測器感測鼻振動;基於該鼻振動產生電子訊號;以及基於該電子訊號產生語音資料。
  19. 如申請專利範圍第18項所述之儲存裝置,更包含指令,當由一或多個處理器執行時,使得該一或多個處理器以:判定是否已經感測到鼻振動;以及如果沒有感測到鼻振動,則執行校正動作。
  20. 如申請專利範圍第19項所述之儲存裝置,其中用以執行校正動作的該指令包含用以重新啟動該可穿戴系統或以在該可穿戴系統中的另一感測器感測的指令。
  21. 如申請專利範圍第18項所述之儲存裝置,更包含指令,當由一或多個處理器執行時,使得該一或多個處理器以:判定該語音資料是否包括區域命令;以及 基於該語音資料包含至少一區域命令的確定來執行至少一活動。
  22. 如申請專利範圍第18項所述之儲存裝置,更包含指令,當由一或多個處理器執行時,使得該一或多個處理器以:基於在該可穿戴系統中接收的音頻資料產生聲音。
TW105124480A 2015-09-15 2016-08-02 用以從使用者擷取語音資料的系統、方法及儲存裝置 TWI696170B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US14/854,927 US9924265B2 (en) 2015-09-15 2015-09-15 System for voice capture via nasal vibration sensing
US14/854,927 2015-09-15
US14/965,095 US9872101B2 (en) 2015-09-15 2015-12-10 System for sound capture and generation via nasal vibration
US14/965,095 2015-12-10

Publications (2)

Publication Number Publication Date
TW201719631A true TW201719631A (zh) 2017-06-01
TWI696170B TWI696170B (zh) 2020-06-11

Family

ID=58238996

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105124480A TWI696170B (zh) 2015-09-15 2016-08-02 用以從使用者擷取語音資料的系統、方法及儲存裝置

Country Status (2)

Country Link
US (1) US9872101B2 (zh)
TW (1) TWI696170B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3236669A4 (en) 2014-12-18 2018-10-03 Rohm Co., Ltd. Cartilage conduction hearing device using electromagnetic-type vibration unit, and electromagnetic-type vibration unit
US10324494B2 (en) 2015-11-25 2019-06-18 Intel Corporation Apparatus for detecting electromagnetic field change in response to gesture
US10206620B2 (en) 2016-03-23 2019-02-19 Intel Corporation User's physiological context measurement method and apparatus
US10241583B2 (en) 2016-08-30 2019-03-26 Intel Corporation User command determination based on a vibration pattern
KR102629534B1 (ko) * 2017-11-16 2024-01-25 사필로 소시에타 아지오나리아 화브리카 이탈리아나 라보라지온 옥치알리 에스. 피. 에이. 바이오 센서를 가진 안경
US11006875B2 (en) 2018-03-30 2021-05-18 Intel Corporation Technologies for emotion prediction based on breathing patterns
JP2020053948A (ja) 2018-09-28 2020-04-02 株式会社ファインウェル 聴取装置
CN110737489A (zh) * 2019-10-08 2020-01-31 成都中讯创新科技股份有限公司 一种智能型高性能计算中心
US11335362B2 (en) 2020-08-25 2022-05-17 Bose Corporation Wearable mixed sensor array for self-voice capture
US11985487B2 (en) 2022-03-31 2024-05-14 Intel Corporation Methods and apparatus to enhance an audio signal

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0109646A1 (en) 1982-11-16 1984-05-30 Pilot Man-Nen-Hitsu Kabushiki Kaisha Pickup device for picking up vibration transmitted through bones
JPH03121603A (ja) 1989-10-04 1991-05-23 Nec Ic Microcomput Syst Ltd 差動増幅器
US7555136B2 (en) * 2004-06-25 2009-06-30 Victorion Technology Co., Ltd. Nasal bone conduction wireless communication transmitting device
US7580540B2 (en) 2004-12-29 2009-08-25 Motorola, Inc. Apparatus and method for receiving inputs from a user
US11428937B2 (en) 2005-10-07 2022-08-30 Percept Technologies Enhanced optical and perceptual digital eyewear
EP2486450B1 (en) * 2008-11-02 2021-05-19 David Chaum Near to eye display system and appliance
CN101742387B (zh) 2008-11-21 2013-01-09 新兴盛科技股份有限公司 低背景音骨肤振动式麦克风以及包含该麦克风的眼镜
CN101753221A (zh) * 2008-11-28 2010-06-23 新兴盛科技股份有限公司 蝶颞骨传导通讯与/或助听装置
KR20120080852A (ko) 2011-01-10 2012-07-18 주식회사 이랜텍 골전도 진동자가 구비된 액정 셔터 안경
US8543061B2 (en) * 2011-05-03 2013-09-24 Suhami Associates Ltd Cellphone managed hearing eyeglasses
KR20130035290A (ko) 2011-09-30 2013-04-09 주식회사 이랜텍 골전도 스피커가 구비된 3d 안경
US9094749B2 (en) 2012-07-25 2015-07-28 Nokia Technologies Oy Head-mounted sound capture device

Also Published As

Publication number Publication date
TWI696170B (zh) 2020-06-11
US20170078464A1 (en) 2017-03-16
US9872101B2 (en) 2018-01-16

Similar Documents

Publication Publication Date Title
US9924265B2 (en) System for voice capture via nasal vibration sensing
TWI696170B (zh) 用以從使用者擷取語音資料的系統、方法及儲存裝置
JP6891172B2 (ja) 鼻振動を介した音響のキャプチャ及び生成のためのシステム
US11922935B2 (en) Voice interaction method and apparatus, terminal, and storage medium
US9620116B2 (en) Performing automated voice operations based on sensor data reflecting sound vibration conditions and motion conditions
CN106465006B (zh) 麦克风的操作方法和支持该方法的电子设备
US20210407508A1 (en) Method of providing voice command and electronic device supporting the same
US10204624B1 (en) False positive wake word
US11386886B2 (en) Adjusting speech recognition using contextual information
CN109154858B (zh) 智能电子设备及其操作方法
CN112470217A (zh) 用于确定要执行语音识别的电子装置的方法及电子装置
US9766852B2 (en) Non-audio notification of audible events
TWI688947B (zh) 用於噪音降低之控制器、電子裝置及電腦程式產品
US9818404B2 (en) Environmental noise detection for dialog systems
KR102811235B1 (ko) 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법
US11609596B2 (en) Electronic device for controlling frequency of processor and method of operating the same
US11622198B2 (en) Electronic device, and method for processing stereo audio signal thereof
CN106453818A (zh) 声音数据的自适应处理
US20180324703A1 (en) Systems and methods to place digital assistant in sleep mode for period of time
US20190362709A1 (en) Offline Voice Enrollment
CN104572007A (zh) 一种终端的音量调节方法
WO2019061292A1 (zh) 一种终端降噪方法及终端
US20150189072A1 (en) Intelligent ancillary electronic device
JP2018056769A (ja) 電子機器、制御方法、及び制御プログラム

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees