SU544990A1 - Устройство дл распознавани речи - Google Patents
Устройство дл распознавани речиInfo
- Publication number
- SU544990A1 SU544990A1 SU2016330A SU2016330A SU544990A1 SU 544990 A1 SU544990 A1 SU 544990A1 SU 2016330 A SU2016330 A SU 2016330A SU 2016330 A SU2016330 A SU 2016330A SU 544990 A1 SU544990 A1 SU 544990A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- blocks
- comparison
- units
- main
- amplifiers
- Prior art date
Links
- 238000001514 detection method Methods 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
1
Изобретение относитс к области вычислительной техники и автоматики и может быть использовано дл ввода речевой информации в вычислительные маилины, исполнительные автоматы и т. д.
Известны устройства дл автоматического распознавани звуков речи, в которых инвариантные признаки получают в результате сопоставлени эпергий частотных полос речевого спектра. В этих устройствах звуковой сигнал посредством микрофона преобразуетс в электрический, усиливаетс усилителем, подвергаетс компрессии, спектральному анализу гребенкой фильтров. Затем выдел етс огибающа полученных полос спектра и после временной обработки проводитс их сопоставление (обычно попарно) в блоках сравнени . По результатам сопоставлени уровней суд т о наличии того или иного инвариантного признака . Инвариантные признаки, полученные как описанным методом, т. е. путем сопоставлени энергетических уровней разных спектральных полос речевого сигнала, так и на основе других параметров речи, поступают на блоки решени о фонемах. Так, например, в одном из устройств звуковой сигнал, преобразованный в электрический, подаетс на избирательный усилитель с автоматической регулировкой усилени , где усиливаетс , ограничиваетс и сжимаетс по динамическому диапазону , после чего анализируютс частотновременные характеристик.
Динамический диапазон несет определенную информацию о звуках речи и достигает значительной величины (с учетом возможных интонационных изменений и перемещений диктора-свыше 80 дб). Ограничение и сжатие динамического диапазона приводит к потере части информации. Кроме того, в блоках усилени и временной обработк при большом динамическом диапазоне возникают нелинейные искажени . Все это, как следствие, снижает достоверность распознавани .
Наиболее близким к изобретению вл етс устройство дл распознавани речи, содержащее блоки прин ти решени и микрофон, подключенный к группе фильтров, каждый из которых последовательно соединен с первым усилителем и основным блоком детектировани , попарно подключенными к основным блокам сравнени .
Однако такое устройство не обеспечивает достаточной достоверности распознавани речевых сигналов.
Цель изобретени - повышение достоверности распознавани речи за счет устранени вли ни инерционности цепей регулировани и исключени как потери части информации ири компрессии динамического диапазона.речи , так и искажений, возникающих при обработке сигналов с широким динамическим диапазоном .
Дл этого в устройство введены дополнительные блоки сравнени , группы элементов ИЛИ, последовательно соединенные вторые усилители, подключенные к первым усилител м , и дополнительные блоки детектировани , попарно подключенные к дополнительным блокам сравнени , соединенным с первыми входами группы элементов ИЛИ, вторые входы которых св заны с основными блоками сравнени , а выходы-с блоками прин ти решени .
На чертеже приведена блок-схема предлагаемого устройства.
Оно состоит из микрофона 1, группы фильтров 2, первых усилителей 3, основных блоков 4 детектировани , вторых усилителей 5, дополнительных блоков 6 детектировани , основных 7 и дополнительных 8 блоков сравнени , групп элементов ИЛИ 9 и блоков 10 прин ти решени .
Микрофоном 1 звуковой сигнал преобразуетс в электрический и подаетс на частотноанализирующую гребенку из группы фильтров 2 разных частот (/i, fa, /з ... fn). К каждому из выходов группы фильтров 2 подключены усилители 3, с которых выделенные полосы спектров поступают на основной 4 и дополнительный 6 блоки детектировани через усилители 5. Полученные напр жени определенных уровней с блоков 4 и 6 детектировани разных фильтров, например fi и /2, подаютс соответственно на основной 7 и дополнительный 8 блоки сравнени , а результируюш,ие сигналы с них попадают на группы элементов ИЛИ 9, которые отрегулированы таким образом , чтобы они срабатывали только при наличии уровн определенной пол рности, хот бы на выходе одного из основного или дополнительного блоков сравнени . Срабатывание группы элементов ИЛИ 9 свидетельствует о
выработке инвариантного признака, но дл этого с выходов блоков 7 и 8 (или одного из них) должны поступать сигналы определенной пол рности и по своему уровню превосходить порог срабатывани элемента ИЛИ в группе элементов ИЛИ 9. Иол рность выходных сигналов блоков 7 и 8 определ етс соотношением сравниваемых уровней. Дл нормальной работы устройства коэффициент усилени усилителей 5 должен быть по своей величине равен заданному динамическому диапазону. Уменьшение коэффициента усилени усилителей 5 ниже величины динамического диапазона приводит к сужению
динамического диапазона устройства.
Предлагаемое устройство выгодно отличаетс от известных возможностью исключить вли ние нелинейных искажений, возникаюш ,их при распознавании речи с широким динамическим диапазоном, что способствует повышению достоверности распознавани .
Claims (1)
- Формула изобретениУстройство дл распознавани речи, содержаш ,ее блоки прин ти решени и микрофон, подключенный к группе фильтров, каждый из которых последовательно соединен с первым усилителем и основным блоком детектировани , которые попарно подключены к основным блокам сравнени , отличаюшеес тем, что, с целью повышени достоверности распознавани , в него введены дополнительные блоки сравнени , группы элементов ИЛИ, последовательно соединенные вторые усилители , подключенные к первым усилител м, и дополнительные блоки детектировани , попарно подключенные к дополнительным блокам сравнени , соединенным с первыми входами группы элементов ИЛИ, вторые входыкоторых подключены к основным блокам сравнени , а выходы - к блокам прин ти решени .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SU2016330A SU544990A1 (ru) | 1974-04-08 | 1974-04-08 | Устройство дл распознавани речи |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SU2016330A SU544990A1 (ru) | 1974-04-08 | 1974-04-08 | Устройство дл распознавани речи |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| SU544990A1 true SU544990A1 (ru) | 1977-01-30 |
Family
ID=20582064
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| SU2016330A SU544990A1 (ru) | 1974-04-08 | 1974-04-08 | Устройство дл распознавани речи |
Country Status (1)
| Country | Link |
|---|---|
| SU (1) | SU544990A1 (ru) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2363994C2 (ru) * | 2003-07-29 | 2009-08-10 | Майкрософт Корпорейшн | Система детектирования речи |
-
1974
- 1974-04-08 SU SU2016330A patent/SU544990A1/ru active
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2363994C2 (ru) * | 2003-07-29 | 2009-08-10 | Майкрософт Корпорейшн | Система детектирования речи |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Atal | Effectiveness of linear prediction characteristics of the speech wave for automatic speaker identification and verification | |
| US3097349A (en) | Information processing apparatus | |
| US3588363A (en) | Word recognition system for voice controller | |
| US4516215A (en) | Recognition of speech or speech-like sounds | |
| US4817158A (en) | Normalization of speech signals | |
| US5144672A (en) | Speech recognition apparatus including speaker-independent dictionary and speaker-dependent | |
| US5878392A (en) | Speech recognition using recursive time-domain high-pass filtering of spectral feature vectors | |
| Hoffmann et al. | Bass enhancement settings in portable devices based on music genre recognition | |
| US3304369A (en) | Sound actuated devices | |
| CN105323677A (zh) | 音频信号处理电路、及使用其的电子设备 | |
| SU544990A1 (ru) | Устройство дл распознавани речи | |
| JPH04369698A (ja) | 音声認識方式 | |
| JPH04100099A (ja) | 音声検出装置 | |
| US5175799A (en) | Speech recognition apparatus using pitch extraction | |
| JPS6334477B2 (ru) | ||
| JPS6229799B2 (ru) | ||
| SU847317A1 (ru) | Устройство дл ввода речевойиНфОРМАции | |
| SU728225A2 (ru) | Анализатор сигнала речи | |
| JP2975712B2 (ja) | 音声切出し方式 | |
| SU781883A2 (ru) | Устройство дл классификации шумов | |
| JP2975808B2 (ja) | 音声認識装置 | |
| JPS60208800A (ja) | 単語音声認識装置 | |
| WO1993009531A1 (en) | Processing of electrical and audio signals | |
| JPH03122699A (ja) | 雑音除去装置及び該装置を用いた音声認識装置 | |
| Veesa et al. | Linear Prediction Networks for Residual based Replay Speech Detection |