SU792247A1 - Устройство дл ввода и вывода речевой информации - Google Patents
Устройство дл ввода и вывода речевой информации Download PDFInfo
- Publication number
- SU792247A1 SU792247A1 SU772562176A SU2562176A SU792247A1 SU 792247 A1 SU792247 A1 SU 792247A1 SU 772562176 A SU772562176 A SU 772562176A SU 2562176 A SU2562176 A SU 2562176A SU 792247 A1 SU792247 A1 SU 792247A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- signal
- unit
- switch
- subtractor
- adder
- Prior art date
Links
- 238000000926 separation method Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000005056 compaction Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 claims 2
- XUKUURHRXDUEBC-KAYWLYCHSA-N Atorvastatin Chemical compound C=1C=CC=CC=1C1=C(C=2C=CC(F)=CC=2)N(CC[C@@H](O)C[C@@H](O)CC(O)=O)C(C(C)C)=C1C(=O)NC1=CC=CC=C1 XUKUURHRXDUEBC-KAYWLYCHSA-N 0.000 claims 1
- 230000008447 perception Effects 0.000 claims 1
- 239000013598 vector Substances 0.000 description 6
- 230000005284 excitation Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 210000001331 nose Anatomy 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000001584 soft palate Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
1
Изобретение относитс к области речевой св зи человека с машинами.
Известны устройства дл передачи и приема речевых сигналов на основе идентификации параметров речеобраэующего тракта (1, 2) методами линейного предсказани по критерию минимума дисперсии ошибки предсказани l и 12
Наиболее близким по технической сущности вл етс вокодерное устройство , в котором предполагаетс , что модель речеобразующего тракта, структура которой одновременно вл етс и структурой синтезатора речи на приемной стороне, содержит генератор возбуждающей функции e(t), котора может быть или шумовой (e(t)e(t)) .дл невокализованных участков речи или квазипериодической импульсной последовательностью (e(t)e(t)) с частотой основного тока f;, дл невокализованных участков речи з . В соответствии с этим такой синтезатор состоит из генератора белого шума с равномерным спектром и генератора квазипериодических импульсов. В зависимости от вида возбуждающей функции к одному из указанных генераторов подключаетс с помощью переключател тон-шум усилитель, регулируемый коэффициент А усилени которого определ ет интенсивность соответствующих участков речи. Выходной сигнал усилител E(t)A e(t) подаетс i;a первый вход сумматора, выход которого через линейный фильтр с регулируемыми параметрами А
10 ( дClip) подключен ко входу второго сумматора. Указанные сумматор и фильтр образуют линейную систему с переменными параметрами, модулирующу .о речеобразу1мций голосовой 15 тракт. Выходной сигнал этой линейной системы вл етс речевым сигналом S(t). .
На передающей стороне анализатор 20 речевого сигнала по его дискритизированной копии { дает оченки р да параметров, что выполн ет специальные оцениватели, функционирующие по известному алгоритму. В их число 25 входит устройство оценки соотношени тон-шум,устройство оценки интенсивности А участка речи, выделитель основного тона, идентификатор вектора параметров. Последний определ ет оценку А вектора d в ссответствин с алгоритмом минимума среднеквадратической ошибки.
С выхода анализатора через уплотнитель в канал (далее он предполагаетс дискретным) передаютс сигнал классификации тон-шум (например О - тон, 1 - шум) оценка А интенсивности анализируемого участка речи, оценка f на выходе блока выделени основного тона, оценка d. вектора ct с выхода блока идентификации параметров, на вход которого подаетс сигнал и ошибка .
На приемной стороне прин тые оценки тон-шум А, f , i после их разделени в блоке разделени сигналов подаютс в соответствующие блоки синтезатора: на переключатель тоншум , усилитель с регулируемым коэффициентом усилени , генератор квазипериодических импзльсов, линейный фильтр с регулируемыми параметрами. Структура синтезатора, как указывалось , полностью повтор ет модель речеобразующего тракта.
Такой вокодер не позвол ет добитьс высокого качества системы синтетической телефонии в силу отсутстви в ней компонента моделирующих участков речевого сигнала, соответствующих носовым звукам. Это снижает узнаваемость говор щего, речевое сообщение которого передаетс по такой системе синтетической телефонии.
Целью изобретени вл етс улуч .шение качества вводимой и выводимой информации путем повышени степени идентификации сигналов.
Поставленна цель достигаетс тем что в устройство дл ввода и вывода речевой информации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последовательно соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор , блок уплотнени сигн.алов параллельно подключенный через блоки измерени интенсивности речевого сигнала и выделени основного тона к . аналого-цифровому преобразователю блок сопр жени , блок разделени сигналов , подключенный через второй линейный фильтр к первому сумматору, первый генератор, первый переключатель , подключенный ко второму генератору и блоку разделени сигналов, и усилитель, подключенный к блоку раделени сигналов, дополнительно введены последовательно соединенные второй переключатель, подключенный к аналогО-цифровому преобразователю и блоку уплотнени сигналов, второй вычитатель, третий вычитатель, третий линейный фильтр, первый блок идентификации параметров, под1с01юченный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к
аналого-цифровому преобразователю и блоку уплотнени сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный к первому линейному фильтру, блоку уплотнени сигналов и второму вычитателю, четвертый линейный фильтр, подключенный к первому вычиттелю , четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку идентификации параметров, второй сумматор , подключенный к третьему переключателю , и п тый линейный фильтр, подключенный ко второму дискриминатору , и последовательно соединенные четвертый переключатель, подключенный к усилителю, блоку разделени сигналов и первому сумматору, третий сумг.атор, шестой линейный фильтр, подключенный к блоку разделени сигналов , четвертый сумматор, подключенный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделени сигналов, первому сумматору и второму линейному фильтру.
Предлагаемое уАройство, блоксхема которого представлена на чертеже , содержит аналого-цифровой преобразователь . 1, второй переключатель 2, четвертый :вычитатель. 3, четвертый линейный фильтр 4, первый вычитатель 5, первый линейный фильтр 6, третий переключатель 7, п тый линейный фильтр 8, второй блок 9 идентификации параметров,второй вычитатель 10, третий вычитатель 11, третий линейный фильтр 12, первый блок 13 идентификации параметров, первый дискриминатор 14, блок 15 измерени интенсивности сигнала, блок 16 ВЕЛделени основного тока, второй дискриминатор 17, блок 18 сопр жени , второй генератор 19, первый генератор 20, первый переключатель 21, усилитель 22, четвертый переключатель 23, первый сумматор 24, второй линейный фильтр 25, седьмой линейный фильтр 26, четвертый сумматор 27, шестой линейный фильтр 28, блок 29 уплотнени сигналов, блок 30 разделени сигналов , второй сумматор 31, третий сумматор 32, выходна шина 33 и микрофон 34.
Гфедложенное устройство работает следующимобразом.
Речевой сигнал S(t) подвергаетс обработке на приемной стороне в анализаторе с целью оценки по нему параметров модели речеобразующего тракта . При цифровой реализации предлагаемого устройства сигнал S(t) проходит блок 1, где дискредитируетс с частотой f (обычно 6-20 кГц) и квантуетс Полученна последователь ность проходит через схему обtaзoвaни оценки функции возбуждени {.t) дл случа прохождени E(t) через модель голосового тракта или E(t дл случа прохождени E(t) через мо дель носового тракта. Рассмотрим (t). Переключатель 2 стоит в положении голосовой тракт. В вычитателе 3 образуетс (t) - оценк у (t)S(t)-Z(t), а (t) - оценка Z(t) образуема на выходе сумматора 31. Вычитание Z(t) необходимо дл устранени вли ни отключенного носового тракта. Сигнал z(t) проходит линейный фильтр 4. Далее полученный на выходе фильтра сигнал x(t) проходит вычитатель 5 и линейный фильтр б цепи обратной св зи. Вычитатель 5 и линейный фильтр 6 выполн ют роль линейного предсказател . Точно такую же роль играют вычитатель 11 и линей ный фильтр 12.В вычитателе 10 образуетс сигнал T(t) S(t) - y(t), гд устран етс вли ние отключенного голосового тракта. Блоки 9 и 13 идентификации параметров на основе анализа соответственно сигналов y(t) и Z(t), а также l(t} и T(t) производ т оценки параметров линейных фильтров i., & и . Эти оценки управл ют параметрами линейных фильтров 4 и 6 (дл d Hjb и линеных фильтров 8 и 12 (дл ). Новым вл етс второй дискриминатор 17. Его работа в простейшем случае : может быть основана на том, что непосредственно перед лицом говор щего став т специальный микрофон с двум раздельными секци ми, направленными на нос и рот. Более интенсивный сигнал в одной из секций и определ ет положение переключател . Другое решение - включение избирательного фильтра в схему переключател (такой случай изображен на чертеже), характеристика которого моделирует носовую полость ((фильтр, согласованный с линейной системой, образующий сигнал y(t) из E(t)). Превышение за интервал анализа уровнем сигнала заданного порога показывает, что E(t) про ходит в течение этого интервала через носовую область. Выходной сигнал дискриминатора 17 подаетс на спаренные переключатели 2 и 7. Оценки векторов А, и 7 а так же выходные сигналы дискриминаторов 14 и 17, а также блоков 15 и 16 пода ютс в блок 18 сопр жени через блок 29 уплотнени сигналов. Рассмотрим работу синтезатора на приемной стороне, параметры которого измен ютс под воздействием соответствующих сигналов, принимаемых из канала. Функци возбуждени e(t), соответствующа вокализованным участкам речи, генерируетс блоком 20. Частот следовани импульсов fg-j соответству ет частоте основного тона и может мен тьс в требуемых пределах. функци возбуждени e(t) дл нёвокализованных участков речи формируетс генератором 19, на выходе которого по вл етс случайный процесс с равномерным спектром. Переключатель 21 выбирает в соответствии с участком речи тип функции возбуждени е (t) путем подключени к формирователю речевого сигнала генераторов 19 или 20. После усилени в блоке 22 функци E(t) А e{t) подаетс на переключатель 23. Он вьтолн ет роль м гкого неба, отключа блоки , моделирующие голосовой тракт в момент произнесени носовых звуков. Функци E(t) с выхода сумматора 24 подаетс на линейный фильтр 8, вектор параметров tp f ) которого подбираетс так, чтобы корректировать требуемым образом сквозную характеристику., «здeлиpyющyю форму голосового тракта. Парготетры d и (i отражают положение артикул ционных органов, причем вектор (5 определ ет в некоторой мере характер коартикул ции и взаимодействие голосового и носового трактов. В другом положении переключател 23 (стрелка вниз) сигнал E(t) подаетс на линейный фильтр образованный сумма гором 32 и фильтром с параметраи и У ( Т,, . . -Ifi, в петле обратной св зи (фильтр 28). В простейшем случае параметры f, посто нны, если считать, что форма носовой полости неизменна. На выходе сумматора 27 образуетс речевой сигнал Sjt) Z(t) + y(t), где Z(t) сигнал на выходе линейного фильтра, моделирующего носовой тракт,а y(t) выходной сигнал фильтра 26. Параметрами генератора 20, положением переключателей 21 и 23, усилением блока 22, фильтров 26, 27 и 28 управл ют-соответственно переданные через блок 18 выходные сигналы блока 16, дискриминаторов 14 и 17, блока 15, блоков идентификации параметров 9 (оценки oL и pi) и 13 (оценка j). Указанные сигналы подаютс в соответствующие блоки после их разделени в блоке 30 разделени сигналов . Предложенное устройство дл ввода и.вывода речевых сообщений позвол ет существенно повысить качество системы при незначительном увеличении скорости передачи цифровой информации об оценках параметров модели речеобразующего тракта, что обеспечит более высокую степень идентификации говор щего. При использовании предложенного устройства в системах речевого общени человека и ЭВМ значительно расшир ютс возможности систем путем улучшени характеристик идентификации дикторов или их верификации .
Claims (3)
- Формула изобретения.Устройство для ввода и вывода речевой информации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последовательно соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор, блок уплотнения сигналов, параллельно подключенный через блоки измерения интенсивности речевого сигнала и выделения основного тона к аналого-цифровому преобразователю, блок сопряжения, блок разделения сигналов, подключенный через второй линейный фильтр к первому сумматору, первый генератор, первый переключатель, подключенный ко второму генератору и блоку разделения сигналов, и усилитель, подключенный.к блоку разделения сигналов, отличают еес я тем, что, с целью улучшения качества вводимой и выводимой информации путем повышения степени идентификации сигналов, в устройство введены последовательно соединенные второй переключатель, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, второй вычитатель, третий вычитатель, третий линейный фильтр, первый блок идентификации параметров, подключенный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный’ к первому линейному фильтру, блоку уплотнения сигналов и второму вычие тателю, четвертый линейный фильтр, подключенный к первому вычитателю, четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку иденти.« фикации параметров, второй сумма*и тор, подключенный к третьему переключателю, и пятый линейный фильтр, подключенный ко второму дискриминатору, и последовательно соединенные четвертый переключатель, подключен15 ный к усилителю, блоку разделения сигналов и первому сумматору, третий сумматор, шестой линейный фильтр, подключенный к блоку разделения сигналов, четвертый сумматор, подклю20 ченный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделения сигналов, первому сумматору и второму линейному фильтру.ng — Источники информации, принятые во внимание при экспертизе1. Шефер, Рабинер. Цифровое представление речевых сигналов. — ТИИЭР, т.6.3, » 4,1975. с.141-159.
- 2. Шредер. Вокодеры, анализ и синтез речи. - ТИИЭР, т. 54, № 5, 1966.
- 3. Flanagan I.L. Speech Analysis, Synthesis and Perception, 2-nd35 ed. Springer-VerIog. Serlin, 1972 (прототип).ВНИИПИ Заказ 9434/48Тираж 751 ПодписноеФилиал ППП ''Патент11,г. Ужгород, ул. Проектная, 4
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SU772562176A SU792247A1 (ru) | 1977-12-25 | 1977-12-25 | Устройство дл ввода и вывода речевой информации |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SU772562176A SU792247A1 (ru) | 1977-12-25 | 1977-12-25 | Устройство дл ввода и вывода речевой информации |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| SU792247A1 true SU792247A1 (ru) | 1980-12-30 |
Family
ID=20741201
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| SU772562176A SU792247A1 (ru) | 1977-12-25 | 1977-12-25 | Устройство дл ввода и вывода речевой информации |
Country Status (1)
| Country | Link |
|---|---|
| SU (1) | SU792247A1 (ru) |
-
1977
- 1977-12-25 SU SU772562176A patent/SU792247A1/ru active
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Dudley | Remaking speech | |
| US7149682B2 (en) | Voice converter with extraction and modification of attribute data | |
| US6349277B1 (en) | Method and system for analyzing voices | |
| JP2738534B2 (ja) | 異なる型の励起情報を有するディジタル音声符号器 | |
| KR960029798A (ko) | 신호 특성 측정 방법 및 장치. 음성 신호의 음질 측정 방법 및 신호 성질 측정 방법 | |
| KR101840015B1 (ko) | 스테레오 음악신호를 위한 반주신호 추출방법 및 장치 | |
| CA1326912C (en) | Speech coding system | |
| JP2019061135A (ja) | 電子楽器、電子楽器の楽音発生方法、及びプログラム | |
| SU792247A1 (ru) | Устройство дл ввода и вывода речевой информации | |
| US4845753A (en) | Pitch detecting device | |
| US2824906A (en) | Transmission and reconstruction of artificial speech | |
| SE438386B (sv) | Sett och anordning for alstring av en artificiell talsignal | |
| JP2841797B2 (ja) | 音声分析・合成装置 | |
| Holmes | Copy synthesis of female speech using the JSRU parallel formant synthesiser. | |
| CN114121040B (zh) | 用于借助听力设备评估语音信号的语音质量的方法 | |
| JP2615991B2 (ja) | 線形予測型音声分析合成装置 | |
| JP3166797B2 (ja) | 音声符号化法及び音声復号化法並びに音声符復号化装置 | |
| JP2650355B2 (ja) | 音声分析合成装置 | |
| JP3368949B2 (ja) | 音声分析合成装置 | |
| SU120658A1 (ru) | Способ анализа и синтеза речи формантного или вокадерного типа | |
| JPH0690638B2 (ja) | 音声分析方式 | |
| Kelly | Speech and vocoders | |
| JPS59176782A (ja) | デジタル音響装置 | |
| JPS5853357B2 (ja) | 音声分析合成方式 | |
| JPH05204397A (ja) | 音声分析合成装置 |