SU544990A1

SU544990A1 - Устройство дл распознавани речи

Info

Publication number: SU544990A1
Application number: SU2016330A
Authority: SU
Inventors: Вера Лазаревна Могильницкая; Лазарь Моисеевич Могилиницкий; Моисей Львович Ханин
Priority date: 1974-04-08
Filing date: 1974-04-08
Publication date: 1977-01-30

Description

1

Изобретение относитс к области вычислительной техники и автоматики и может быть использовано дл ввода речевой информации в вычислительные маилины, исполнительные автоматы и т. д.

Известны устройства дл автоматического распознавани звуков речи, в которых инвариантные признаки получают в результате сопоставлени эпергий частотных полос речевого спектра. В этих устройствах звуковой сигнал посредством микрофона преобразуетс в электрический, усиливаетс усилителем, подвергаетс компрессии, спектральному анализу гребенкой фильтров. Затем выдел етс огибающа полученных полос спектра и после временной обработки проводитс их сопоставление (обычно попарно) в блоках сравнени . По результатам сопоставлени уровней суд т о наличии того или иного инвариантного признака . Инвариантные признаки, полученные как описанным методом, т. е. путем сопоставлени энергетических уровней разных спектральных полос речевого сигнала, так и на основе других параметров речи, поступают на блоки решени о фонемах. Так, например, в одном из устройств звуковой сигнал, преобразованный в электрический, подаетс на избирательный усилитель с автоматической регулировкой усилени , где усиливаетс , ограничиваетс и сжимаетс по динамическому диапазону , после чего анализируютс частотновременные характеристик.

Динамический диапазон несет определенную информацию о звуках речи и достигает значительной величины (с учетом возможных интонационных изменений и перемещений диктора-свыше 80 дб). Ограничение и сжатие динамического диапазона приводит к потере части информации. Кроме того, в блоках усилени и временной обработк при большом динамическом диапазоне возникают нелинейные искажени . Все это, как следствие, снижает достоверность распознавани .

Наиболее близким к изобретению вл етс устройство дл распознавани речи, содержащее блоки прин ти решени и микрофон, подключенный к группе фильтров, каждый из которых последовательно соединен с первым усилителем и основным блоком детектировани , попарно подключенными к основным блокам сравнени .

Однако такое устройство не обеспечивает достаточной достоверности распознавани речевых сигналов.

Цель изобретени - повышение достоверности распознавани речи за счет устранени вли ни инерционности цепей регулировани и исключени как потери части информации ири компрессии динамического диапазона.речи , так и искажений, возникающих при обработке сигналов с широким динамическим диапазоном .

Дл этого в устройство введены дополнительные блоки сравнени , группы элементов ИЛИ, последовательно соединенные вторые усилители, подключенные к первым усилител м , и дополнительные блоки детектировани , попарно подключенные к дополнительным блокам сравнени , соединенным с первыми входами группы элементов ИЛИ, вторые входы которых св заны с основными блоками сравнени , а выходы-с блоками прин ти решени .

На чертеже приведена блок-схема предлагаемого устройства.

Оно состоит из микрофона 1, группы фильтров 2, первых усилителей 3, основных блоков 4 детектировани , вторых усилителей 5, дополнительных блоков 6 детектировани , основных 7 и дополнительных 8 блоков сравнени , групп элементов ИЛИ 9 и блоков 10 прин ти решени .

Микрофоном 1 звуковой сигнал преобразуетс в электрический и подаетс на частотноанализирующую гребенку из группы фильтров 2 разных частот (/i, fa, /з ... fn). К каждому из выходов группы фильтров 2 подключены усилители 3, с которых выделенные полосы спектров поступают на основной 4 и дополнительный 6 блоки детектировани через усилители 5. Полученные напр жени определенных уровней с блоков 4 и 6 детектировани разных фильтров, например fi и /2, подаютс соответственно на основной 7 и дополнительный 8 блоки сравнени , а результируюш,ие сигналы с них попадают на группы элементов ИЛИ 9, которые отрегулированы таким образом , чтобы они срабатывали только при наличии уровн определенной пол рности, хот бы на выходе одного из основного или дополнительного блоков сравнени . Срабатывание группы элементов ИЛИ 9 свидетельствует о

выработке инвариантного признака, но дл этого с выходов блоков 7 и 8 (или одного из них) должны поступать сигналы определенной пол рности и по своему уровню превосходить порог срабатывани элемента ИЛИ в группе элементов ИЛИ 9. Иол рность выходных сигналов блоков 7 и 8 определ етс соотношением сравниваемых уровней. Дл нормальной работы устройства коэффициент усилени усилителей 5 должен быть по своей величине равен заданному динамическому диапазону. Уменьшение коэффициента усилени усилителей 5 ниже величины динамического диапазона приводит к сужению

динамического диапазона устройства.

Предлагаемое устройство выгодно отличаетс от известных возможностью исключить вли ние нелинейных искажений, возникаюш ,их при распознавании речи с широким динамическим диапазоном, что способствует повышению достоверности распознавани .

Claims

Формула изобретени

Устройство дл распознавани речи, содержаш ,ее блоки прин ти решени и микрофон, подключенный к группе фильтров, каждый из которых последовательно соединен с первым усилителем и основным блоком детектировани , которые попарно подключены к основным блокам сравнени , отличаюшеес тем, что, с целью повышени достоверности распознавани , в него введены дополнительные блоки сравнени , группы элементов ИЛИ, последовательно соединенные вторые усилители , подключенные к первым усилител м, и дополнительные блоки детектировани , попарно подключенные к дополнительным блокам сравнени , соединенным с первыми входами группы элементов ИЛИ, вторые входы

которых подключены к основным блокам сравнени , а выходы - к блокам прин ти решени .