JPH08508108A - 休止検出を行う音声認識 - Google Patents
休止検出を行う音声認識Info
- Publication number
- JPH08508108A JPH08508108A JP6520841A JP52084194A JPH08508108A JP H08508108 A JPH08508108 A JP H08508108A JP 6520841 A JP6520841 A JP 6520841A JP 52084194 A JP52084194 A JP 52084194A JP H08508108 A JPH08508108 A JP H08508108A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- signal
- noise
- pattern
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000004044 response Effects 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 24
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000012935 Averaging Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000007717 exclusion Effects 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims 3
- 230000001419 dependent effect Effects 0.000 claims 2
- 238000003909 pattern recognition Methods 0.000 claims 2
- 238000012360 testing method Methods 0.000 description 29
- 230000015654 memory Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 9
- 230000007704 transition Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Indicating And Signalling Devices For Elevators (AREA)
- Time-Division Multiplex Systems (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1.音声信号を受信するための入力手段;音声信号を処理して所定のパターン に対する類似性を示す認識処理手段;前記認識処理手段は、繰り返して音声信号 をパターンを含む部分、及び前記パターンを含む部分に先行及び続くノイズ、あ るいは、無音信号に分割し、前記パターンを含む部分に対応するパターンを識別 する;前記パターンの一つの認識を示す認識信号を供給するための出力手段とで 構成される認識システムにおいて、 パターンを含む部分に続くノイズ、あるいは、無音部分を検出するための休止 検出手段、その検出に応答して、前記パターン部分に対応する現在のパターンを 識別する信号を出力手段に供給する手段に特徴を有するシステム。 2.前記パターンは、音素、単語、語句、あるいは文に対応することを特徴と する請求項1記載のシステム。 3.前記パターンは、単語に対応することを特徴とする請求項2記載のシステ ム。 4.前記休止検出手段は、前記認識処理手段による前記分割に依存しない前記 音声信号から由来する少なくとも一つの信号パラメータを受け取ることを特徴と する請求項1〜3のいずれかに記載のシステム。 5.前記休止検出手段は、前記認識処理手段による前記分割に従って、前記信 号パラメータを処理し、前記分割の精度に依存する少なくとも一つの測度を生成 することを特徴とす る請求項4記載のシステム。 6.前記信号パラメータは、ノイズ、あるいは、無音が存在する際に、パター ンが存在する場合の大きさとは異なる大きさを有することを特徴とする請求項5 記載のシステム。 7.前記パラメータは、前記音声信号のエネルギーに関連していることえお特 徴とする請求項6記載のシステム。 8.前記休止検出手段は、時間に関する前記パラメータを平滑化するための手 段を有することを特徴とする請求項4〜7のいずれかに記載のシステム。 9.前記平滑化手段が、前記パラメータの移動平均値を導出するための手段を 有し、前記測度、あるいは、複数の測度を生成する際に前記移動平均が用いられ ることを特徴とする請求項8記載のシステム。 10.非線形平滑化を前記パラメータに適用して、その突然の大きさの変動の 影響を削減するように前記移動平均手段が構成されていることを特徴とする請求 項9記載のシステム。 11.前記パラメータの中央値を追跡するために、前記移動平均を導出するこ とを特徴とする請求項9または請求項10記載のシステム。 12.前記休止検出手段は、前記パターンを含む部分に続く前記ノイズ、ある いは、無音部分内で、前記パラメータ、あるいは、パラメータに由来する変動の レベルの測度を導出するための変動検出手段を有することを特徴とする請求項5 〜11のいずれかに記載のシステム。 13.前記変動検出手段が、前記パラメータ、あるいは、 導出パラメータの最大値及び最小値を導出し、その間の比率に依存するように前 記測度を導出することを特徴とする請求項12記載のシステム。 14.前記比率が、小さい数による分割を避けるように導出されることを特徴 とする請求項13記載のシステム。 15.前記変動検出手段が、前記後に続くノイズ、あるいは、無音部分内にあ る音声信号の予め決定された過去の部分に渡って延びる時間ウインドウに関する 前記パラメータの値に応じて、前記測度を導出することを特徴とする請求項12 〜14のいずれかに記載のシステム。 16.前記休止検出手段が、前記パラメータの相対レベル、あるいは、前記パ ターンを含む部分に関して、及び前記無音、あるいは、ノイズ部分に関してそこ から導出されたパラメータを示す測度を導出するための手段を有することを特徴 とする請求項5〜15のいずれかに記載のシステム。 17.前記パターンを含む部分から導出された第1の値と前記無音、あるいは 、ノイズ部分から導出された第2の値との間の比率に依存するように、前記測度 が導出されることを特徴とする請求項16記載のシステム。 18.第1の値が、前記パラメータ、あるいは、導出パラメータの最大値であ ることを特徴とする請求項17記載のシステム。 19.第2の値が、前記パラメータ、あるいは、導出パラメータの平均値であ ることを特徴とする請求項17記載のシステム。 20.前記認識処理手段は、ノイズ、あるいは、無音を認識するように構成さ れており、前記休止検出手段は、ノイズ、あるいは、無音の前記認識の信頼性の レベルの応答するよう構成されていることを特徴とする請求項1〜19のいずれ か1項に記載のシステム。 21.前記休止検出手段は、前記パターンを含む部分に続く無音、あるいは、 ノイズ部分の持続時間に応答するよう構成されていることを特徴とする請求項1 〜19のいずれか1項に記載のシステム。 22.音声信号を受信するための入力手段;所定のパターンに対する類似性を 示すために音声信号を処理するための認識処理手段;前記パターンの一つの認識 を示す認識信号を供給するための出力手段;所定の条件で認識信号を排除するた めの排除手段とで構成される認識システムにおいて、 前記排除手段は、前記認識手段の出力に依存しない前記音声信号から導出され た少なくとも一つの信号パラメータを受け取ることを特徴とするシステム。 23.前記認識手段は、音声信号をパターンを含む部分、及び前記パターンを 含む部分に先行し、その後に続くノイズ、あるいは、無音部分に分割し、前記排 除手段は、前記分割に応答することを特徴とする請求項22記載のシステム。 24.前記排除手段は、パターンを含んでいる部分の間、あるいは、ノイズ、 あるいは、無音部分の間に、パラメータ、あるいは、それから導出されたパラメ ータの相対的な大きさに依存して、前記認識信号を排除することを特徴とする請 求 項23記載のシステム。 25.前記排除手段は、パラメータ、あるいは、無音、あるいは、ノイズ部分 に関して導出されたパラメータの変動の程度に依存して、前記認識信号を取り扱 うことを特徴とする請求項23または24に記載のシステム。 26.前記認識処理手段は、複数の状態シーケンス確率を定義するデータを保 存するため、及び、各々の状態シーケンスに対応する前記音声信号の可能性を計 算するための手段を有することを特徴とする請求項1〜25のいずれか1項に記 載のシステム。 27.前記認識処理手段は、異なる状態に対応する複数の連続確率分布を定義 するデータを保存するための手段、及び、前記分布データを前記音声信号に適用 して、音声信号と各々の前記状態との間の一致の測度を計算するための手段を有 することを特徴とする請求項26記載のシステム。 28.前記音声信号を連続する部分のシーケンスに分割するため、及び、前記 部分を先行する部分と比較するための手段をさらに備え、前記部分がその先行す る部分と大幅に異ならない場合に、前記システムが、前記認識処理手段を動作さ せないことを特徴とする請求項1〜25のいずれか1項に記載のシステム。 29.音声認識信号を繰り返して生成するために音声信号に応じて動作する音 声認識システムにおいて、即時音声認識出力を供給できるように、音声の終わり を検出するよう規定されている休止検出器 30.音声認識システムにおいて、音声信号のエネルギーから導出したパラメ ータに依存して、音声の終わりを検出するための休止検出器。 31.音声信号に応じて動作する認識システムにおいて、エネルギー平均処理 部:平均エネルギー・レベルを保存するための手段;音声信号エネルギーと前記 平均エネルギー・レベルとの間の差を所定の閾値と比較するための手段;差が閾 値を超過した場合に、保存された平均エネルギー・レベルを確認するための手段 ;差が閾値を超過した場合に、音声信号に依存して閾値を確認するための手段を 通することを特徴とする認識システム。 32.請求項1〜31のいずれか1項の機能を実行する音声認識の方法。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP93302302 | 1993-03-25 | ||
| EP93302302.0 | 1993-03-25 | ||
| EP93302541 | 1993-03-31 | ||
| EP93302541.3 | 1993-03-31 | ||
| PCT/GB1994/000630 WO1994022131A2 (en) | 1993-03-25 | 1994-03-25 | Speech recognition with pause detection |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH08508108A true JPH08508108A (ja) | 1996-08-27 |
| JP3691511B2 JP3691511B2 (ja) | 2005-09-07 |
Family
ID=26134232
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP52084194A Expired - Fee Related JP3691511B2 (ja) | 1993-03-25 | 1994-03-25 | 休止検出を行う音声認識 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US5848388A (ja) |
| EP (2) | EP0962913B1 (ja) |
| JP (1) | JP3691511B2 (ja) |
| AU (1) | AU6433094A (ja) |
| CA (1) | CA2158849C (ja) |
| DE (2) | DE69421911T2 (ja) |
| ES (1) | ES2141824T3 (ja) |
| SG (1) | SG93215A1 (ja) |
| WO (1) | WO1994022131A2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003524794A (ja) * | 1999-02-08 | 2003-08-19 | クゥアルコム・インコーポレイテッド | 雑音のある信号におけるスピーチのエンドポイント決定 |
Families Citing this family (57)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB9620082D0 (en) | 1996-09-26 | 1996-11-13 | Eyretel Ltd | Signal monitoring apparatus |
| GB9625284D0 (en) * | 1996-12-04 | 1997-01-22 | Canon Kk | A data processing method and apparatus for identifying a classification to which data belongs |
| EP0944036A4 (en) * | 1997-04-30 | 2000-02-23 | Japan Broadcasting Corp | METHOD AND DEVICE FOR DETECTING LANGUAGE AREAS, AND METHOD AND DEVICE FOR LANGUAGE SPEED CONVERSION |
| US5930748A (en) * | 1997-07-11 | 1999-07-27 | Motorola, Inc. | Speaker identification system and method |
| US6374219B1 (en) * | 1997-09-19 | 2002-04-16 | Microsoft Corporation | System for using silence in speech recognition |
| US6006182A (en) * | 1997-09-22 | 1999-12-21 | Northern Telecom Limited | Speech recognition rejection method using generalized additive models |
| US6718302B1 (en) * | 1997-10-20 | 2004-04-06 | Sony Corporation | Method for utilizing validity constraints in a speech endpoint detector |
| JP3075250B2 (ja) * | 1998-03-04 | 2000-08-14 | 日本電気株式会社 | 話者認識方法及び装置 |
| DE19824354A1 (de) * | 1998-05-30 | 1999-12-02 | Philips Patentverwaltung | Vorrichtung zur Verifizierung von Signalen |
| DE19824353A1 (de) * | 1998-05-30 | 1999-12-02 | Philips Patentverwaltung | Vorrichtung zur Verifizierung von Signalen |
| DE19939102C1 (de) * | 1999-08-18 | 2000-10-26 | Siemens Ag | Verfahren und Anordnung zum Erkennen von Sprache |
| GB2355833B (en) * | 1999-10-29 | 2003-10-29 | Canon Kk | Natural language input method and apparatus |
| US6910035B2 (en) * | 2000-07-06 | 2005-06-21 | Microsoft Corporation | System and methods for providing automatic classification of media entities according to consonance properties |
| US7035873B2 (en) | 2001-08-20 | 2006-04-25 | Microsoft Corporation | System and methods for providing adaptive media property classification |
| US20020042709A1 (en) * | 2000-09-29 | 2002-04-11 | Rainer Klisch | Method and device for analyzing a spoken sequence of numbers |
| US20030023439A1 (en) * | 2001-05-02 | 2003-01-30 | Gregory Ciurpita | Method and apparatus for automatic recognition of long sequences of spoken digits |
| US20040104062A1 (en) * | 2002-12-02 | 2004-06-03 | Yvon Bedard | Side panel for a snowmobile |
| EP1363271A1 (de) | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
| DE10220524B4 (de) | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
| US7356466B2 (en) * | 2002-06-28 | 2008-04-08 | Samsung Electronics Co., Ltd. | Method and apparatus for performing observation probability calculations |
| US20040044517A1 (en) * | 2002-08-30 | 2004-03-04 | Robert Palmquist | Translation system |
| US7539086B2 (en) * | 2002-10-23 | 2009-05-26 | J2 Global Communications, Inc. | System and method for the secure, real-time, high accuracy conversion of general-quality speech into text |
| JP4463526B2 (ja) * | 2003-10-24 | 2010-05-19 | 株式会社ユニバーサルエンターテインメント | 声紋認証システム |
| CN1890668A (zh) * | 2003-12-16 | 2007-01-03 | 思比驰盖尔公司 | 翻译机数据库 |
| US7359849B2 (en) * | 2003-12-17 | 2008-04-15 | Speechgear, Inc. | Translation techniques for acronyms and ambiguities |
| US7664642B2 (en) * | 2004-03-17 | 2010-02-16 | University Of Maryland | System and method for automatic speech recognition from phonetic features and acoustic landmarks |
| US9117460B2 (en) | 2004-05-12 | 2015-08-25 | Core Wireless Licensing S.A.R.L. | Detection of end of utterance in speech recognition system |
| US7558389B2 (en) * | 2004-10-01 | 2009-07-07 | At&T Intellectual Property Ii, L.P. | Method and system of generating a speech signal with overlayed random frequency signal |
| US7584098B2 (en) * | 2004-11-29 | 2009-09-01 | Microsoft Corporation | Vocabulary-independent search of spontaneous speech |
| US8175877B2 (en) * | 2005-02-02 | 2012-05-08 | At&T Intellectual Property Ii, L.P. | Method and apparatus for predicting word accuracy in automatic speech recognition systems |
| EP1708172A1 (en) * | 2005-03-30 | 2006-10-04 | Top Digital Co., Ltd. | Voiceprint identification system for E-commerce |
| KR101116363B1 (ko) * | 2005-08-11 | 2012-03-09 | 삼성전자주식회사 | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 |
| US7603275B2 (en) * | 2005-10-31 | 2009-10-13 | Hitachi, Ltd. | System, method and computer program product for verifying an identity using voiced to unvoiced classifiers |
| WO2007069377A1 (ja) * | 2005-12-14 | 2007-06-21 | Mitsubishi Electric Corporation | 音声認識装置 |
| JP4906379B2 (ja) * | 2006-03-22 | 2012-03-28 | 富士通株式会社 | 音声認識装置、音声認識方法、及びコンピュータプログラム |
| EP1933302A1 (en) * | 2006-12-12 | 2008-06-18 | Harman Becker Automotive Systems GmbH | Speech recognition method |
| US20080221882A1 (en) * | 2007-03-06 | 2008-09-11 | Bundock Donald S | System for excluding unwanted data from a voice recording |
| RU2441286C2 (ru) * | 2007-06-22 | 2012-01-27 | Войсэйдж Корпорейшн | Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов |
| DE102008039329A1 (de) * | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
| US9020816B2 (en) * | 2008-08-14 | 2015-04-28 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
| US8838449B2 (en) * | 2010-12-23 | 2014-09-16 | Microsoft Corporation | Word-dependent language model |
| US8924213B2 (en) * | 2012-07-09 | 2014-12-30 | Nuance Communications, Inc. | Detecting potential significant errors in speech recognition results |
| US9064492B2 (en) | 2012-07-09 | 2015-06-23 | Nuance Communications, Inc. | Detecting potential significant errors in speech recognition results |
| US10957310B1 (en) | 2012-07-23 | 2021-03-23 | Soundhound, Inc. | Integrated programming framework for speech and text understanding with meaning parsing |
| US9799328B2 (en) * | 2012-08-03 | 2017-10-24 | Veveo, Inc. | Method for using pauses detected in speech input to assist in interpreting the input during conversational interaction for information retrieval |
| US20140365068A1 (en) * | 2013-06-06 | 2014-12-11 | Melvin Burns | Personalized Voice User Interface System and Method |
| US9928851B2 (en) * | 2013-09-12 | 2018-03-27 | Mediatek Inc. | Voice verifying system and voice verifying method which can determine if voice signal is valid or not |
| US10832005B1 (en) | 2013-11-21 | 2020-11-10 | Soundhound, Inc. | Parsing to determine interruptible state in an utterance by detecting pause duration and complete sentences |
| US9311932B2 (en) * | 2014-01-23 | 2016-04-12 | International Business Machines Corporation | Adaptive pause detection in speech recognition |
| KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
| US10339918B2 (en) | 2016-09-27 | 2019-07-02 | Intel IP Corporation | Adaptive speech endpoint detector |
| US9984689B1 (en) * | 2016-11-10 | 2018-05-29 | Linearhub | Apparatus and method for correcting pronunciation by contextual recognition |
| US10636421B2 (en) | 2017-12-27 | 2020-04-28 | Soundhound, Inc. | Parse prefix-detection in a human-machine interface |
| RU2761940C1 (ru) | 2018-12-18 | 2021-12-14 | Общество С Ограниченной Ответственностью "Яндекс" | Способы и электронные устройства для идентификации пользовательского высказывания по цифровому аудиосигналу |
| KR102913171B1 (ko) * | 2019-12-18 | 2026-01-15 | 엘지전자 주식회사 | 간투어 검출 모델을 훈련시키기 위한 훈련 데이터 생성 방법 및 장치 |
| US12118984B2 (en) | 2020-11-11 | 2024-10-15 | Rovi Guides, Inc. | Systems and methods to resolve conflicts in conversations |
| US11705125B2 (en) | 2021-03-26 | 2023-07-18 | International Business Machines Corporation | Dynamic voice input detection for conversation assistants |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| USRE31188E (en) * | 1978-10-31 | 1983-03-22 | Bell Telephone Laboratories, Incorporated | Multiple template speech recognition system |
| DE3066499D1 (en) * | 1979-08-13 | 1984-03-15 | Linear Pneumatics Inc | Method of removing stuck gaskets and pneumatic impact tool therefor |
| US4348553A (en) * | 1980-07-02 | 1982-09-07 | International Business Machines Corporation | Parallel pattern verifier with dynamic time warping |
| US4761815A (en) * | 1981-05-01 | 1988-08-02 | Figgie International, Inc. | Speech recognition system based on word state duration and/or weight |
| US4481593A (en) * | 1981-10-05 | 1984-11-06 | Exxon Corporation | Continuous speech recognition |
| US4989248A (en) * | 1983-01-28 | 1991-01-29 | Texas Instruments Incorporated | Speaker-dependent connected speech word recognition method |
| US4783804A (en) * | 1985-03-21 | 1988-11-08 | American Telephone And Telegraph Company, At&T Bell Laboratories | Hidden Markov model speech recognition arrangement |
| GB2182795B (en) * | 1985-11-12 | 1988-10-05 | Nat Res Dev | Apparatus and methods for speech analysis |
| US5040127A (en) * | 1986-06-02 | 1991-08-13 | Motorola, Inc. | Continuous speech recognition system |
| JPH0760318B2 (ja) * | 1986-09-29 | 1995-06-28 | 株式会社東芝 | 連続音声認識方式 |
| US4829578A (en) * | 1986-10-02 | 1989-05-09 | Dragon Systems, Inc. | Speech detection and recognition apparatus for use with background noise of varying levels |
| US4837831A (en) * | 1986-10-15 | 1989-06-06 | Dragon Systems, Inc. | Method for creating and using multiple-word sound models in speech recognition |
| US4803729A (en) * | 1987-04-03 | 1989-02-07 | Dragon Systems, Inc. | Speech recognition method |
| EP0295354B1 (de) * | 1987-06-16 | 1990-10-17 | Santex AG | Verfahren zum Glätten und Schrumpfen von textiler Schlauchware |
| US5228110A (en) * | 1989-09-15 | 1993-07-13 | U.S. Philips Corporation | Method for recognizing N different word strings in a speech signal |
| DE69128990T2 (de) * | 1990-09-07 | 1998-08-27 | Toshiba Kawasaki Kk | Sprecherkennungsvorrichtung |
| FR2677828B1 (fr) * | 1991-06-14 | 1993-08-20 | Sextant Avionique | Procede de detection d'un signal utile bruite. |
| JP2870224B2 (ja) * | 1991-06-19 | 1999-03-17 | 松下電器産業株式会社 | 音声認識方法 |
| US5388183A (en) * | 1991-09-30 | 1995-02-07 | Kurzwell Applied Intelligence, Inc. | Speech recognition providing multiple outputs |
| US5390278A (en) * | 1991-10-08 | 1995-02-14 | Bell Canada | Phoneme based speech recognition |
| US5583961A (en) * | 1993-03-25 | 1996-12-10 | British Telecommunications Public Limited Company | Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands |
| US5524169A (en) * | 1993-12-30 | 1996-06-04 | International Business Machines Incorporated | Method and system for location-specific speech recognition |
| US5621859A (en) * | 1994-01-19 | 1997-04-15 | Bbn Corporation | Single tree method for grammar directed, very large vocabulary speech recognizer |
-
1994
- 1994-03-25 CA CA002158849A patent/CA2158849C/en not_active Expired - Fee Related
- 1994-03-25 ES ES94912002T patent/ES2141824T3/es not_active Expired - Lifetime
- 1994-03-25 DE DE69421911T patent/DE69421911T2/de not_active Expired - Lifetime
- 1994-03-25 EP EP99202632A patent/EP0962913B1/en not_active Expired - Lifetime
- 1994-03-25 JP JP52084194A patent/JP3691511B2/ja not_active Expired - Fee Related
- 1994-03-25 US US08/525,730 patent/US5848388A/en not_active Expired - Lifetime
- 1994-03-25 WO PCT/GB1994/000630 patent/WO1994022131A2/en not_active Ceased
- 1994-03-25 DE DE69432570T patent/DE69432570T2/de not_active Expired - Lifetime
- 1994-03-25 AU AU64330/94A patent/AU6433094A/en not_active Abandoned
- 1994-03-25 EP EP94912002A patent/EP0691022B1/en not_active Expired - Lifetime
- 1994-03-25 SG SG9904114A patent/SG93215A1/en unknown
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003524794A (ja) * | 1999-02-08 | 2003-08-19 | クゥアルコム・インコーポレイテッド | 雑音のある信号におけるスピーチのエンドポイント決定 |
Also Published As
| Publication number | Publication date |
|---|---|
| SG93215A1 (en) | 2002-12-17 |
| EP0962913B1 (en) | 2003-04-23 |
| DE69432570T2 (de) | 2004-03-04 |
| CA2158849C (en) | 2000-09-05 |
| DE69421911D1 (de) | 2000-01-05 |
| ES2141824T3 (es) | 2000-04-01 |
| EP0691022A1 (en) | 1996-01-10 |
| CA2158849A1 (en) | 1994-09-29 |
| JP3691511B2 (ja) | 2005-09-07 |
| DE69432570D1 (de) | 2003-05-28 |
| US5848388A (en) | 1998-12-08 |
| WO1994022131A2 (en) | 1994-09-29 |
| EP0691022B1 (en) | 1999-12-01 |
| AU6433094A (en) | 1994-10-11 |
| DE69421911T2 (de) | 2000-07-20 |
| WO1994022131A3 (en) | 1995-01-12 |
| EP0962913A1 (en) | 1999-12-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3691511B2 (ja) | 休止検出を行う音声認識 | |
| US5732394A (en) | Method and apparatus for word speech recognition by pattern matching | |
| KR100312919B1 (ko) | 화자인식을위한방법및장치 | |
| JP4322785B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
| US20140156276A1 (en) | Conversation system and a method for recognizing speech | |
| JP3451146B2 (ja) | スペクトルサブトラクションを用いた雑音除去システムおよび方法 | |
| US7359856B2 (en) | Speech detection system in an audio signal in noisy surrounding | |
| KR20090030063A (ko) | 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치 | |
| JPH0990974A (ja) | 信号処理方法 | |
| JP4355322B2 (ja) | フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置 | |
| KR100930587B1 (ko) | 혼동 행렬 기반 발화 검증 방법 및 장치 | |
| JP4696418B2 (ja) | 情報検出装置及び方法 | |
| JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
| Pfau et al. | A combination of speaker normalization and speech rate normalization for automatic speech recognition | |
| JP3428805B2 (ja) | 音声認識のための音声区間始端補正方法及び装置並びに音声認識方法 | |
| Ouzounov | Telephone speech endpoint detection using Mean-Delta feature | |
| KR100526110B1 (ko) | 화자인식시스템의 화자 특징벡터 생성방법 및 시스템 | |
| Sriskandaraja et al. | A model based voice activity detector for noisy environments. | |
| JP2007508577A (ja) | 音声認識システムの環境的不整合への適応方法 | |
| JPH05249987A (ja) | 音声検出方法および音声検出装置 | |
| Fakotakis et al. | A continuous HMM text-independent speaker recognition system based on vowel spotting. | |
| WO1997037345A1 (en) | Speech processing | |
| Goronzy et al. | Phone-duration-based confidence measures for embedded applications. | |
| JPH034918B2 (ja) | ||
| JP4391031B2 (ja) | 音声認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040316 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040511 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050517 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050616 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090624 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100624 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110624 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110624 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120624 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120624 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130624 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |