TWI342010B - Speech recognition method and system with intelligent classification and adjustment - Google Patents
Speech recognition method and system with intelligent classification and adjustment Download PDFInfo
- Publication number
- TWI342010B TWI342010B TW095146777A TW95146777A TWI342010B TW I342010 B TWI342010 B TW I342010B TW 095146777 A TW095146777 A TW 095146777A TW 95146777 A TW95146777 A TW 95146777A TW I342010 B TWI342010 B TW I342010B
- Authority
- TW
- Taiwan
- Prior art keywords
- error
- user
- speech
- continuously
- voice
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 41
- 230000008569 process Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 230000001629 suppression Effects 0.000 claims description 11
- 230000006978 adaptation Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims 1
- 230000007246 mechanism Effects 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010255 response to auditory stimulus Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
Description
1342010 九、發明說明: 【發明所屬之技術領域】 本案係為一種語音辨識方法,尤指一種具有智慧 型鑑別調適功能之語音辨識方法。 【先前技術】 使用聲控指令的語音辨識系統的最大問題,就是 辨識率不是百分之一百準確。辨識的錯誤會增加許多 的不便,甚至有的時候會造成系統運作順暢的風險。 目前,大部分的聲控指令的語音辨識系統,一開 始沒有考慮語音辨識錯誤,直接設計對連續的錯誤沒 有感覺,也沒有對應系統來改善連續錯誤。使用者面 對聲控指令的語音辨識系統,常常因而感覺無奈,無 法解決屢次出現的錯誤,以及使用上繁瑣的困擾。最 後,只好被動的選擇不用它了。 甚至有些時候,某些聲控指令的辨識錯誤,會造 成系統運作相當的風險,對此,習用之聲控指令的語 音辨識系統也只是單純的加上針對所有或是部份的 辨識指令,進行多一步的確認動作。這樣的設計,增 加了使用語音辨識系統上的麻煩。因此,不如更積極 的透過智慧型的學習機制,提升部分或是整體指令辨 識的鑑別率。 爰是之故,申請人有鑑於習知技術之缺失,發明 出本案「具有智慧型鑑別調適功能之語音辨識方 5 1342010 法」,用以改善上述習用手段之缺失。 【發明内容】 本案之主要目的係為提供一種具有智慧型鑑別 調適功能之語音辨識方法,其深入的考慮到使用者的 感覺,在沒有增加使用者的麻煩下,提升系統的辨識 率。此外,加上運用語者辨識的技術,可以擴大上述 的學習機制,成為多人使用的操作介面。 根據上述構想,本案係提供一種語音辨識方法, 其步驟包含(a)接收一使用者之語音;(b)辨識該語音 以產生一辨識結果,該辨識結果具有一分數;(c)對於 分數高的辨識結果,不作聲學模型的鑑別調適,但利 用該語音之使用率來學習新的語言文法機率模型; (d)對於分數低而後被該使用者確認的辨識結果,進 行聲學模型的鑑別調適,調高該語音之出現可能,並 利用該語音之使用率來學習新的語言文法機率模型; 以及(e)對於分數低而後被該使用者拒絕的辨識結 果,進行聲學模型的鑑別調適,調低該語音之出現可 塵。 如所述之方法,該語音係為一口語指令。 根據上述構想,本案另提供一種語音辨識方法, 用以辨識多個使用者之語音,其步驟包含(a)接收一 特定使用者之語音;(b)辨識該語音以產生一辨識結 果,該辨識結果具有一分數;(c)對於分數高的辨識結 6 況下定使用者之系統令;⑷在一般情 者立U &的辨識結果,繼續進行該特定使用 直到累積出—定信任度,才切換至該 特疋使用者之系統中,·以及( 數低的㈣W、_ ()在特殊情況下’對於分 換行詢問該特定使用者,並立刻切 換至该特定使用者之系統中。 如所述之方法,每—传用去目Α Α ή ΛΑ . 吏用者具有各自的系統,紀 錚m 口 °。才曰令之使用成功和錯誤之相關紀 亦各自訓練調適出各自的聲學和語言之機率模 如所述之方法 如所述之方法, 生連續錯誤時。 ,該語音係為一口語指令。 該特殊情況係為當該口語指令發 你爾Γ述之方法’該特殊情況㈣當進行對該特定 使用者之私密資料處理時。 t據上想,本案又提供—種語音處理方法, 吝匕含⑷接收-使用者之語音;(b)辨識該語音以 —辨識結果;⑷當該賴結果連續出現錯誤時, 辨識結果以取得其錯誤型態;以及_該錯 =、t匕、而進行一調適處理。 如所述之方法,該語音係為一口語指令。 ^如所述之方法,該錯誤型態包含一第一類型 /使用者連續重覆輸人相同的口 辨 Π的錯誤;一第二類型,係該使用者連續重覆 語指令,卻被連續辨識出各自不同的錯 、,第—類型,係連續輸入非口語之背景雜立,、 分別被辨識為有意義之語音指令.以及 Ί ’部 係為其它零散的輸人錯料續發生。第四類型’ 述之方法’㈣適處理包含抑㈣覆發生的 錯誤k項,暫時性的調整語言文法機率模型。 所述之方法’該調適處理包含另行建立抑制扑 =暫時性資料庫,降低連續被拒絕的選項再出“ ,上述構想,本案再提供—種語音辨識/處理 包含-語音辨識單S,用以接收並辨識—使 °曰以產生一辨識結果;一錯誤偵測單元 連結於該語音辨識單元,用以於該辨識結果連續出現 2誤時,偵測該辨識結果以取得其錯誤型態;以及 -錯誤抑解元,連結於該錯誤_單元,^ 該錯誤型態而進行一調適處理。 如所述之系統,該語音係為一口語指令。 如所述之系統,該錯誤型態包含一第一類型, 該使用者連續重覆輸人姻的口料令,卻被連續辨 識出相同的錯誤;m係該使用者連續重覆 輸入相同的口語指令,卻被連續職出各自不同的^ 誤;一第三類型,係連續輸入非口語之背景雜音,备曰 分別被辨識為有意義之語音指令;以及一第四^型部 係為其它零散的輸入錯誤連續發生。 如所述之系統,該調適處理包含抑制重覆發生的 錯誤選項,暫時性的調整語言文法機率模型。 如所述之系統,該調適處理包含另行建立抑制指 令的暫時性資料庫,降低連續被拒絕的選項再出現的 機率。 【實施方式】 本發明所設計的學習機制,是以底下的語音辨識 (Speech Recognition)系統的架構為前提。語音辨識系 統的口語辨識操作步驟包含:口語輸入、語音辨識、 自動結果確認、以聲音或影像回應辨識結果、手動結 果確認或是其他口語輸入更正。每個口語輸入之後, 辨識結果會有一個分數,分數高的口語指令可以不需 手動確認就執行;其他分數低的口語指令則需手動確 認來輔助執行。此時,系統可能會以聲音或影像等回 應的形式,通知使用者進行手動或是口語的再確認步 驟,例如,以按鍵確認或拒絕,或是以口語指令回答 對或錯。如果使用者已確認,就完成了該口語指令的 流程。如果是拒絕動作,則要進行重新輸入的流程, 或是進行更正錯誤的流程,直到辨識結果正確為止。 本發明所設計的學習機制,係包含自動的語者辨 識(Speaker Recognition)技術於系統中。語者辨識 系統的使用,包含針對新使用者的學習階段,以及認 識使用者之後的正常使用階段。 1342010 的鑑別調適;但是利用其口語指令的使用率,學習新 的語言文法機率模型。 針對分數低而後被確認的口語指令,本發明將進 行聲學模型的鑑別調適,調高其出現可能;且利用其 口語指令的使用率,學習新的語言文法機率模型。 針對分數低而後被拒絕的口語指令,本發明將進 行聲學模型的鑑別調適,調低其出現可能;卻不拿來 用在學習新的語言文法機率模型上。 基本整體的鑑別調適處理,幫助學習使用者的特 殊錯誤情形,並建立該使用者特有的聲學和語言模 型。 〔多語者模型切換模式下之基本整體的鑑別調適處 理〕 藉由語者辨識技術,上述的基本整體的鑑別調適 處理,可以自動的學習出多語者的系統環境,並且使 用在多語者操控的口語指令語音辨識系統上。語者辨 識和使用者的切換機制,在語者辨識技術的應用下自 動的進行。各登錄有名的使用者,有各自的系統環 境:紀錄著各自的口語指令的使用成功和錯誤的相關 紀錄;也各自訓練調適出各自的聲學和語言的機率模 型。請參閱第一圖,其係本案之使用者的切換處理流 程圖。切換使用者的機制,可以如下進行。 (1)語者辨識技術,在語音辨識功能進行之後接 11 1342010 著進行(S21)。當辨識為同一語者時(S22),則系統不 動作。 (2) 當辨識出不同語者之後,針對分數高的語者 辨識結果,進行自動切換的動作,並顯示在被操控的 機器上的角落。 (3) —般情況下,針對分數低的語者辨識結果, 留著隨後進行的口語指令再一次進行語者辨識的確 認,直到累積出一定信任,才進行使用者切換的動作 (S23)。 (4) 特殊情況下,針對分數低的語者辨識結果, 逕行詢問使用者,並立刻進行切換的動作(S24)。例 如,當口語指令發生連續錯誤時,可以進行切換語 者,立即改善辨識品質。或是例如,當進行對使用者 之私密資料處理時,可以逕行詢問使用者,以正確的 進行使用者之私密資料處理。 〔針對連續錯誤的情形進行暫時性的鑑別調適處理〕 本發明的設計將針對連續錯誤的發生,設計抑制 錯誤再發生的法則,進行暫時性的鑑別調適處理,以 有效抑制錯誤的連續發生,維持口語操作介面的方便 自然度。連續錯誤的定義,是指被操控的機器在相同 的狀態下,口語指令的語音辨識結果連續出現錯誤而 沒能進行指令的動作。所謂的「機器在相同的狀態」 包含T V的電台沒有更動,音量的大小沒有變化,以 12 ^42010 j的強暗等等口語指令操控的範圍,沒有 付合「機器在相同的狀態」下,可以進 :語指令的連續錯誤發生,是輪入了相同的口二 7 ’因而可猎此_抑制相同的錯誤再發生。 ,參閱第二圖’其係本#之語音辨識/處理系統 塊圖。该糸統包含_語音辨識單元21、 =單元I及-錯誤抑制單元23。本案之㈣: 適=係經由該錯誤偵測單元22來偵測出 :U ’再經由該錯誤抑制單元23來處理不同型 ^的錯騎制動作。而該錯誤仙單元22所摘測的 連續錯誤分為以下A〜;d類型: A型划者連續重複輸人相_語音指令, 遭到連續辨識出相同的錯誤。 、B型:使用者連續重複輪人相同的語音指令 遭到連續辨識出各自不同的錯誤。
、C型:係連續輸入了非口語的背景雜音,卻分別 被辨識為有意義的語音指令。 D型:其它零散的輸入錯誤連續發生。 睛參閱第三圖,其係本案之連續辨識錯誤的鑑別 處理流程圖。如第三圖所示,當連續錯誤發生Ν次 時(S31) ’系統會偵測語音能量是否大於等於一預設 值E(S32) ’如否,則判定該語音屬於c型。當語音 能量大於㈣設值E _ ’系統會偵測該語音之錯誤 相似度(全段)是否大於等於—預設值ρι%,如是,則 13 1342010 判定該語音屬於A型。當該語音之全段錯誤相似度 小於該預設值P】%時,系、统會偵測該語音之中段(去 除指定比例句頭及指定比例句尾的語㈣段)錯誤相 似度是否大於等於-職值p2%,如是,則判定該 語音屬於B型。剩下其他情形,則判定該語音屬於D 型。 &本案之錯誤抑制單元23係根據_的錯誤型 恶’分別給予調適處理。處理主要是抑制 錯誤選項’暫時性的調整語言文法機率模型;是: 行建立抑制指令的暫時性f料庫,降低連續被拒絕的 出現的機率。在機器狀態改變之後,就視為新 的條件狀態,應將暫時性的調整解除,回到原來正^ 的使用狀態’並重新計算錯誤發生的連續次數。* 暫時性的語言文法機率調整,可以是某_比 機率降低,甚至降低至零。可以直接調整在進行中 語言文法機率模型’但是要另外儲存常態模型 以在解除暫時性的調整之後,回覆至常態模型 以另外儲存-個語言文法的抑制機率模型首3 行中的語f文法機率時,採取常態模型和抑制模^ 減的結果。
△紅所述’本㈣提供—種具有智慧型鑑別 功能之語音辨識方法,直深入沾去· * Z I 覺,在沒有增加使用者的的感 率。此外’加上運用語者辨識的技術 1342010 的子%機制成為多人使用的操作介面。因此,本荦 能有效改善f知技術之缺失,是故具有產#價值,進 而達成發展本案之目的。 本案得由熟悉本技藝之人士任施匠思、而為 修飾,然皆不脫如附申請專利範圍所欲保護者。 l圓八間單說明】
ί一係本案之使用者的切換處理流程圖。 =-圖:其係本案之語音 圖。糸本案之連續辨識錯誤的鑑別處理流程 【主要元件符號說明】 21:語音辨識單元 22:錯誤偵測單元 23:錯誤抑制單元
Claims (1)
1342010 補充修正日期:民國丨〇〇年3月3曰。 十、申請專利範圍: 1. 一種語音辨識方法,其步驟包含: (a) 接收一使用者之語音; (b) 辨識該語音以產生一辨識結果,該辨識結果具 有一分數; (c) 對於分數高的辨識結果,不作聲學模型的鑑別 調適,但利用該語音之使用率來學習新的語言文法機 率模型; (d) 對於分數低而後被該使用者確認的辨識結 果,進行聲學模型的鑑別調適,調高該語音之出現可 能,並利用該語音之使用率來學習新的語言文法機率 模型;以及 (e) 對於分數低而後被該使用者拒絕的辨識結 果,進行聲學模型的鑑別調適,調低該語音之出現可 能。 2. 如申請專利範圍第1項所述之方法,其中該語音係 為一口語指令。 3. —種語音處理方法,其步驟包含: (a) 接收一使用者之語音; (b) 辨識該語音以產生一辨識結果; (c) 當該辨識結果連續出現錯誤時,偵測該辨識結 果以取得其錯誤型態;以及 (d) 根據該錯誤型態而進行一調適處理。 4. 如申請專利範圍第3項所述之方法,其中該語音係 16 補充修正日期:民國100年3月 3曰 補充修正日期:民國100年3月 3曰 為 口語指令 型i:包V.專利範圍第4項所述之方法,其中該錯誤 第類型’係該使用者連續重覆輸人相同的口 ,卻被連續辨識出相同的錯誤; 纽社人第一類型’係該使用者連續重覆輸入相同的口 ’卻被連續辨識出各自不同的錯誤; 分職連續輸人非σ語之f景雜音,卻 刀财辨識為有意義之語音指令;以及 S四類型’係為其它零散的輸人錯誤連續發 生。 利範圍第4項所述之方法,其中該調適 :匕3 Ρ制重覆發生的錯誤選項,暫時性的調整語 言文法機率模型。 7.如申請專利範圍第4項所述之方法,其中 處理包含另行建立抑制指令的暫時低 續被拒絕的選項再出現的機率。計犀降低連 8·—種語音辨識/處理系統,其包含: -語音辨識單元,用以接收並辨識一使用者之語 曰,以產生一辨識結果; -錯誤债測單元’連結於該語音辨識單元,用以 於該辨識結果連續_#料,_ 得其錯誤型態;以及 飞。禾以取 一錯誤抑制單元,連結於該錯誤偵測單 元,用以 1342010 補充修正曰期:民國100年3月3日。 根據該錯誤型態而進行一調適處理。 9.如申請專利範圍第8項所述之系統,其中該語音係 為一口語指令。 10·如申請專利範圍第9項所述之系統,其中該錯誤 型態包含: 一第一類型’係該使用者連續重覆輸入相同的口 語指令’卻被連續辨識出相同的錯誤; 一第二類型’係該使用者連續重覆輸入相同的口 語指令’卻被連續辨識出各自不同的錯誤; 一第三類型,係連續輸入非口語之背景雜音,卻 分別被辨識為有意義之語音指令;以及 一第四類型’係為其它零散的輸入錯誤連續發 生。 11‘如申請專利範圍第8項所述之系統,其中該調適 處理包含抑制重覆發生的錯誤選項,暫時性的調整語 言文法機率模型。 12.如申請專利範圍第8項所述之系統,其中該調適 處理包含另行建立抑制指令的暫時性資料庫,降低連 續被拒絕的選項再出現的機率。 18
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW095146777A TWI342010B (en) | 2006-12-13 | 2006-12-13 | Speech recognition method and system with intelligent classification and adjustment |
| US11/772,877 US20080147396A1 (en) | 2006-12-13 | 2007-07-03 | Speech recognition method and system with intelligent speaker identification and adaptation |
| EP07150007A EP1933301A3 (en) | 2006-12-13 | 2007-12-13 | Speech recognition method and system with intelligent speaker identification and adaptation |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW095146777A TWI342010B (en) | 2006-12-13 | 2006-12-13 | Speech recognition method and system with intelligent classification and adjustment |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW200826064A TW200826064A (en) | 2008-06-16 |
| TWI342010B true TWI342010B (en) | 2011-05-11 |
Family
ID=39167945
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW095146777A TWI342010B (en) | 2006-12-13 | 2006-12-13 | Speech recognition method and system with intelligent classification and adjustment |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20080147396A1 (zh) |
| EP (1) | EP1933301A3 (zh) |
| TW (1) | TWI342010B (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI466101B (zh) * | 2012-05-18 | 2014-12-21 | Asustek Comp Inc | 語音識別方法及系統 |
| US10224029B2 (en) | 2013-07-09 | 2019-03-05 | Via Technologies, Inc. | Method for using voiceprint identification to operate voice recognition and electronic device thereof |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
| US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
| US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
| US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
| US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
| US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
| US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
| US9263034B1 (en) * | 2010-07-13 | 2016-02-16 | Google Inc. | Adapting enhanced acoustic models |
| KR20120046627A (ko) * | 2010-11-02 | 2012-05-10 | 삼성전자주식회사 | 화자 적응 방법 및 장치 |
| US8639508B2 (en) * | 2011-02-14 | 2014-01-28 | General Motors Llc | User-specific confidence thresholds for speech recognition |
| GB2489489B (en) * | 2011-03-30 | 2013-08-21 | Toshiba Res Europ Ltd | A speech processing system and method |
| US9384738B2 (en) * | 2014-06-24 | 2016-07-05 | Google Inc. | Dynamic threshold for speaker verification |
| US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
| EP4478276A3 (en) | 2014-09-16 | 2025-01-22 | VB Assets, LLC | Voice commerce |
| CN107003999B (zh) | 2014-10-15 | 2020-08-21 | 声钰科技 | 对用户的在先自然语言输入的后续响应的系统和方法 |
| US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
| US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
| US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
| US20180158462A1 (en) * | 2016-12-02 | 2018-06-07 | Cirrus Logic International Semiconductor Ltd. | Speaker identification |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5852801A (en) * | 1995-10-04 | 1998-12-22 | Apple Computer, Inc. | Method and apparatus for automatically invoking a new word module for unrecognized user input |
| US5719921A (en) * | 1996-02-29 | 1998-02-17 | Nynex Science & Technology | Methods and apparatus for activating telephone services in response to speech |
| US6088669A (en) * | 1997-01-28 | 2000-07-11 | International Business Machines, Corporation | Speech recognition with attempted speaker recognition for speaker model prefetching or alternative speech modeling |
| US6122613A (en) * | 1997-01-30 | 2000-09-19 | Dragon Systems, Inc. | Speech recognition using multiple recognizers (selectively) applied to the same input sample |
| JP4267081B2 (ja) * | 1997-10-20 | 2009-05-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 分散システムにおけるパターン認識登録 |
| US5970451A (en) * | 1998-04-14 | 1999-10-19 | International Business Machines Corporation | Method for correcting frequently misrecognized words or command in speech application |
| US7505905B1 (en) * | 1999-05-13 | 2009-03-17 | Nuance Communications, Inc. | In-the-field adaptation of a large vocabulary automatic speech recognizer (ASR) |
| US7016835B2 (en) * | 1999-10-29 | 2006-03-21 | International Business Machines Corporation | Speech and signal digitization by using recognition metrics to select from multiple techniques |
| US7203651B2 (en) * | 2000-12-07 | 2007-04-10 | Art-Advanced Recognition Technologies, Ltd. | Voice control system with multiple voice recognition engines |
| US6836758B2 (en) * | 2001-01-09 | 2004-12-28 | Qualcomm Incorporated | System and method for hybrid voice recognition |
| US20020104027A1 (en) * | 2001-01-31 | 2002-08-01 | Valene Skerpac | N-dimensional biometric security system |
| US6898567B2 (en) * | 2001-12-29 | 2005-05-24 | Motorola, Inc. | Method and apparatus for multi-level distributed speech recognition |
| US6996526B2 (en) * | 2002-01-02 | 2006-02-07 | International Business Machines Corporation | Method and apparatus for transcribing speech when a plurality of speakers are participating |
| US7620547B2 (en) * | 2002-07-25 | 2009-11-17 | Sony Deutschland Gmbh | Spoken man-machine interface with speaker identification |
| EP1422691B1 (en) * | 2002-11-15 | 2008-01-02 | Sony Deutschland GmbH | Method for adapting a speech recognition system |
| US7917364B2 (en) * | 2003-09-23 | 2011-03-29 | Hewlett-Packard Development Company, L.P. | System and method using multiple automated speech recognition engines |
-
2006
- 2006-12-13 TW TW095146777A patent/TWI342010B/zh not_active IP Right Cessation
-
2007
- 2007-07-03 US US11/772,877 patent/US20080147396A1/en not_active Abandoned
- 2007-12-13 EP EP07150007A patent/EP1933301A3/en not_active Withdrawn
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI466101B (zh) * | 2012-05-18 | 2014-12-21 | Asustek Comp Inc | 語音識別方法及系統 |
| US10224029B2 (en) | 2013-07-09 | 2019-03-05 | Via Technologies, Inc. | Method for using voiceprint identification to operate voice recognition and electronic device thereof |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1933301A2 (en) | 2008-06-18 |
| US20080147396A1 (en) | 2008-06-19 |
| EP1933301A3 (en) | 2008-09-17 |
| TW200826064A (en) | 2008-06-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI342010B (en) | Speech recognition method and system with intelligent classification and adjustment | |
| JP4837917B2 (ja) | 音声に基づく装置制御 | |
| JP4241376B2 (ja) | 認識されたテキスト中の音声シーケンスと手動入力される補正ワードの音声転写との比較を通した音声認識により認識されたテキストの補正 | |
| JPH0962293A (ja) | 音声認識対話装置および音声認識対話処理方法 | |
| CN111833876A (zh) | 会议发言控制方法、系统、电子设备及存储介质 | |
| TWI815343B (zh) | 降噪處理方法 | |
| CN120457484A (zh) | 针对多个用户的说话者特定语音过滤 | |
| JP2009178783A (ja) | コミュニケーションロボット及びその制御方法 | |
| WO2017200079A1 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
| JP2007322523A (ja) | 音声翻訳装置及びその方法 | |
| CN112927688B (zh) | 用于车辆的语音交互方法及系统 | |
| US7177806B2 (en) | Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system | |
| JP2004258233A (ja) | 適応型音声対話システム及び方法 | |
| JP2004004239A (ja) | 音声認識対話装置およびプログラム | |
| CN101221761A (zh) | 具有智慧型鉴别调适功能的语音辨识方法及系统 | |
| CN120390954A (zh) | 用于语音处理的语音过滤器 | |
| CN115731915B (zh) | 对话机器人的主动对话方法、装置、电子设备及存储介质 | |
| JPH0225517B2 (zh) | ||
| JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
| JP2004212533A (ja) | 音声コマンド対応機器操作装置、音声コマンド対応機器、プログラム、及び記録媒体 | |
| JP2021103191A (ja) | 情報処理装置および情報処理方法 | |
| Tahon et al. | Cross-corpus experiments on laughter and emotion detection in HRI with elderly people | |
| CN108245886A (zh) | 基于语音控制的游戏化语言学习方法及系统 | |
| JP2656234B2 (ja) | 会話音声理解方法 | |
| JP2000089780A (ja) | 音声認識方法および音声認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | Annulment or lapse of patent due to non-payment of fees |