SU792247A1 - Устройство дл ввода и вывода речевой информации - Google Patents

Устройство дл ввода и вывода речевой информации Download PDF

Info

Publication number
SU792247A1
SU792247A1 SU772562176A SU2562176A SU792247A1 SU 792247 A1 SU792247 A1 SU 792247A1 SU 772562176 A SU772562176 A SU 772562176A SU 2562176 A SU2562176 A SU 2562176A SU 792247 A1 SU792247 A1 SU 792247A1
Authority
SU
USSR - Soviet Union
Prior art keywords
signal
unit
switch
subtractor
adder
Prior art date
Application number
SU772562176A
Other languages
English (en)
Inventor
Владимир Александрович Свириденко
Виктор Сергеевич Звездин
Original Assignee
Московский Институт Инженеров Гражданской Авиации
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Московский Институт Инженеров Гражданской Авиации filed Critical Московский Институт Инженеров Гражданской Авиации
Priority to SU772562176A priority Critical patent/SU792247A1/ru
Application granted granted Critical
Publication of SU792247A1 publication Critical patent/SU792247A1/ru

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

1
Изобретение относитс  к области речевой св зи человека с машинами.
Известны устройства дл  передачи и приема речевых сигналов на основе идентификации параметров речеобраэующего тракта (1, 2) методами линейного предсказани  по критерию минимума дисперсии ошибки предсказани  l и 12
Наиболее близким по технической сущности  вл етс  вокодерное устройство , в котором предполагаетс , что модель речеобразующего тракта, структура которой одновременно  вл етс  и структурой синтезатора речи на приемной стороне, содержит генератор возбуждающей функции e(t), котора  может быть или шумовой (e(t)e(t)) .дл  невокализованных участков речи или квазипериодической импульсной последовательностью (e(t)e(t)) с частотой основного тока f;, дл  невокализованных участков речи з . В соответствии с этим такой синтезатор состоит из генератора белого шума с равномерным спектром и генератора квазипериодических импульсов. В зависимости от вида возбуждающей функции к одному из указанных генераторов подключаетс  с помощью переключател  тон-шум усилитель, регулируемый коэффициент А усилени  которого определ ет интенсивность соответствующих участков речи. Выходной сигнал усилител  E(t)A e(t) подаетс  i;a первый вход сумматора, выход которого через линейный фильтр с регулируемыми параметрами А
10 ( дClip) подключен ко входу второго сумматора. Указанные сумматор и фильтр образуют линейную систему с переменными параметрами, модулирующу .о речеобразу1мций голосовой 15 тракт. Выходной сигнал этой линейной системы  вл етс  речевым сигналом S(t). .
На передающей стороне анализатор 20 речевого сигнала по его дискритизированной копии { дает оченки р да параметров, что выполн ет специальные оцениватели, функционирующие по известному алгоритму. В их число 25 входит устройство оценки соотношени  тон-шум,устройство оценки интенсивности А участка речи, выделитель основного тона, идентификатор вектора параметров. Последний определ ет оценку А вектора d в ссответствин с алгоритмом минимума среднеквадратической ошибки.
С выхода анализатора через уплотнитель в канал (далее он предполагаетс  дискретным) передаютс  сигнал классификации тон-шум (например О - тон, 1 - шум) оценка А интенсивности анализируемого участка речи, оценка f на выходе блока выделени  основного тона, оценка d. вектора ct с выхода блока идентификации параметров, на вход которого подаетс  сигнал и ошибка .
На приемной стороне прин тые оценки тон-шум А, f , i после их разделени  в блоке разделени  сигналов подаютс  в соответствующие блоки синтезатора: на переключатель тоншум , усилитель с регулируемым коэффициентом усилени , генератор квазипериодических импзльсов, линейный фильтр с регулируемыми параметрами. Структура синтезатора, как указывалось , полностью повтор ет модель речеобразующего тракта.
Такой вокодер не позвол ет добитьс  высокого качества системы синтетической телефонии в силу отсутстви  в ней компонента моделирующих участков речевого сигнала, соответствующих носовым звукам. Это снижает узнаваемость говор щего, речевое сообщение которого передаетс  по такой системе синтетической телефонии.
Целью изобретени   вл етс  улуч .шение качества вводимой и выводимой информации путем повышени  степени идентификации сигналов.
Поставленна  цель достигаетс  тем что в устройство дл  ввода и вывода речевой информации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последовательно соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор , блок уплотнени  сигн.алов параллельно подключенный через блоки измерени  интенсивности речевого сигнала и выделени  основного тона к . аналого-цифровому преобразователю блок сопр жени , блок разделени  сигналов , подключенный через второй линейный фильтр к первому сумматору, первый генератор, первый переключатель , подключенный ко второму генератору и блоку разделени  сигналов, и усилитель, подключенный к блоку раделени  сигналов, дополнительно введены последовательно соединенные второй переключатель, подключенный к аналогО-цифровому преобразователю и блоку уплотнени  сигналов, второй вычитатель, третий вычитатель, третий линейный фильтр, первый блок идентификации параметров, под1с01юченный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к
аналого-цифровому преобразователю и блоку уплотнени  сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный к первому линейному фильтру, блоку уплотнени  сигналов и второму вычитателю, четвертый линейный фильтр, подключенный к первому вычиттелю , четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку идентификации параметров, второй сумматор , подключенный к третьему переключателю , и п тый линейный фильтр, подключенный ко второму дискриминатору , и последовательно соединенные четвертый переключатель, подключенный к усилителю, блоку разделени  сигналов и первому сумматору, третий сумг.атор, шестой линейный фильтр, подключенный к блоку разделени  сигналов , четвертый сумматор, подключенный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделени  сигналов, первому сумматору и второму линейному фильтру.
Предлагаемое уАройство, блоксхема которого представлена на чертеже , содержит аналого-цифровой преобразователь . 1, второй переключатель 2, четвертый :вычитатель. 3, четвертый линейный фильтр 4, первый вычитатель 5, первый линейный фильтр 6, третий переключатель 7, п тый линейный фильтр 8, второй блок 9 идентификации параметров,второй вычитатель 10, третий вычитатель 11, третий линейный фильтр 12, первый блок 13 идентификации параметров, первый дискриминатор 14, блок 15 измерени  интенсивности сигнала, блок 16 ВЕЛделени  основного тока, второй дискриминатор 17, блок 18 сопр жени , второй генератор 19, первый генератор 20, первый переключатель 21, усилитель 22, четвертый переключатель 23, первый сумматор 24, второй линейный фильтр 25, седьмой линейный фильтр 26, четвертый сумматор 27, шестой линейный фильтр 28, блок 29 уплотнени  сигналов, блок 30 разделени  сигналов , второй сумматор 31, третий сумматор 32, выходна  шина 33 и микрофон 34.
Гфедложенное устройство работает следующимобразом.
Речевой сигнал S(t) подвергаетс  обработке на приемной стороне в анализаторе с целью оценки по нему параметров модели речеобразующего тракта . При цифровой реализации предлагаемого устройства сигнал S(t) проходит блок 1, где дискредитируетс  с частотой f (обычно 6-20 кГц) и квантуетс  Полученна  последователь ность проходит через схему обtaзoвaни  оценки функции возбуждени  {.t) дл  случа  прохождени  E(t) через модель голосового тракта или E(t дл  случа  прохождени  E(t) через мо дель носового тракта. Рассмотрим (t). Переключатель 2 стоит в положении голосовой тракт. В вычитателе 3 образуетс  (t) - оценк у (t)S(t)-Z(t), а (t) - оценка Z(t) образуема  на выходе сумматора 31. Вычитание Z(t) необходимо дл  устранени  вли ни  отключенного носового тракта. Сигнал z(t) проходит линейный фильтр 4. Далее полученный на выходе фильтра сигнал x(t) проходит вычитатель 5 и линейный фильтр б цепи обратной св зи. Вычитатель 5 и линейный фильтр 6 выполн ют роль линейного предсказател . Точно такую же роль играют вычитатель 11 и линей ный фильтр 12.В вычитателе 10 образуетс  сигнал T(t) S(t) - y(t), гд устран етс  вли ние отключенного голосового тракта. Блоки 9 и 13 идентификации параметров на основе анализа соответственно сигналов y(t) и Z(t), а также l(t} и T(t) производ т оценки параметров линейных фильтров i., & и . Эти оценки управл ют параметрами линейных фильтров 4 и 6 (дл  d Hjb и линеных фильтров 8 и 12 (дл ). Новым  вл етс  второй дискриминатор 17. Его работа в простейшем случае : может быть основана на том, что непосредственно перед лицом говор щего став т специальный микрофон с двум  раздельными секци ми, направленными на нос и рот. Более интенсивный сигнал в одной из секций и определ ет положение переключател . Другое решение - включение избирательного фильтра в схему переключател  (такой случай изображен на чертеже), характеристика которого моделирует носовую полость ((фильтр, согласованный с линейной системой, образующий сигнал y(t) из E(t)). Превышение за интервал анализа уровнем сигнала заданного порога показывает, что E(t) про ходит в течение этого интервала через носовую область. Выходной сигнал дискриминатора 17 подаетс  на спаренные переключатели 2 и 7. Оценки векторов А, и 7 а так же выходные сигналы дискриминаторов 14 и 17, а также блоков 15 и 16 пода ютс  в блок 18 сопр жени  через блок 29 уплотнени  сигналов. Рассмотрим работу синтезатора на приемной стороне, параметры которого измен ютс  под воздействием соответствующих сигналов, принимаемых из канала. Функци  возбуждени  e(t), соответствующа  вокализованным участкам речи, генерируетс  блоком 20. Частот следовани  импульсов fg-j соответству ет частоте основного тона и может мен тьс  в требуемых пределах. функци  возбуждени  e(t) дл  нёвокализованных участков речи формируетс  генератором 19, на выходе которого по вл етс  случайный процесс с равномерным спектром. Переключатель 21 выбирает в соответствии с участком речи тип функции возбуждени  е (t) путем подключени  к формирователю речевого сигнала генераторов 19 или 20. После усилени  в блоке 22 функци  E(t) А e{t) подаетс  на переключатель 23. Он вьтолн ет роль м гкого неба, отключа  блоки , моделирующие голосовой тракт в момент произнесени  носовых звуков. Функци  E(t) с выхода сумматора 24 подаетс  на линейный фильтр 8, вектор параметров tp f ) которого подбираетс  так, чтобы корректировать требуемым образом сквозную характеристику., «здeлиpyющyю форму голосового тракта. Парготетры d и (i отражают положение артикул ционных органов, причем вектор (5 определ ет в некоторой мере характер коартикул ции и взаимодействие голосового и носового трактов. В другом положении переключател  23 (стрелка вниз) сигнал E(t) подаетс  на линейный фильтр образованный сумма гором 32 и фильтром с параметраи и У ( Т,, . . -Ifi, в петле обратной св зи (фильтр 28). В простейшем случае параметры f, посто нны, если считать, что форма носовой полости неизменна. На выходе сумматора 27 образуетс  речевой сигнал Sjt) Z(t) + y(t), где Z(t) сигнал на выходе линейного фильтра, моделирующего носовой тракт,а y(t) выходной сигнал фильтра 26. Параметрами генератора 20, положением переключателей 21 и 23, усилением блока 22, фильтров 26, 27 и 28 управл ют-соответственно переданные через блок 18 выходные сигналы блока 16, дискриминаторов 14 и 17, блока 15, блоков идентификации параметров 9 (оценки oL и pi) и 13 (оценка j). Указанные сигналы подаютс  в соответствующие блоки после их разделени  в блоке 30 разделени  сигналов . Предложенное устройство дл  ввода и.вывода речевых сообщений позвол ет существенно повысить качество системы при незначительном увеличении скорости передачи цифровой информации об оценках параметров модели речеобразующего тракта, что обеспечит более высокую степень идентификации говор щего. При использовании предложенного устройства в системах речевого общени  человека и ЭВМ значительно расшир ютс  возможности систем путем улучшени  характеристик идентификации дикторов или их верификации .

Claims (3)

  1. Формула изобретения.
    Устройство для ввода и вывода речевой информации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последовательно соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор, блок уплотнения сигналов, параллельно подключенный через блоки измерения интенсивности речевого сигнала и выделения основного тона к аналого-цифровому преобразователю, блок сопряжения, блок разделения сигналов, подключенный через второй линейный фильтр к первому сумматору, первый генератор, первый переключатель, подключенный ко второму генератору и блоку разделения сигналов, и усилитель, подключенный.к блоку разделения сигналов, отличают еес я тем, что, с целью улучшения качества вводимой и выводимой информации путем повышения степени идентификации сигналов, в устройство введены последовательно соединенные второй переключатель, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, второй вычитатель, третий вычитатель, третий линейный фильтр, первый блок идентификации параметров, подключенный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный’ к первому линейному фильтру, блоку уплотнения сигналов и второму вычие тателю, четвертый линейный фильтр, подключенный к первому вычитателю, четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку иденти.« фикации параметров, второй сумма*и тор, подключенный к третьему переключателю, и пятый линейный фильтр, подключенный ко второму дискриминатору, и последовательно соединенные четвертый переключатель, подключен15 ный к усилителю, блоку разделения сигналов и первому сумматору, третий сумматор, шестой линейный фильтр, подключенный к блоку разделения сигналов, четвертый сумматор, подклю20 ченный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделения сигналов, первому сумматору и второму линейному фильтру.
    ng Источники информации, принятые во внимание при экспертизе
    1. Шефер, Рабинер. Цифровое представление речевых сигналов. — ТИИЭР, т.6.3, » 4,1975. с.141-159.
  2. 2. Шредер. Вокодеры, анализ и синтез речи. - ТИИЭР, т. 54, № 5, 1966.
  3. 3. Flanagan I.L. Speech Analysis, Synthesis and Perception, 2-nd
    35 ed. Springer-VerIog. Serlin, 1972 (прототип).
    ВНИИПИ Заказ 9434/48
    Тираж 751 Подписное
    Филиал ППП ''Патент11,
    г. Ужгород, ул. Проектная, 4
SU772562176A 1977-12-25 1977-12-25 Устройство дл ввода и вывода речевой информации SU792247A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU772562176A SU792247A1 (ru) 1977-12-25 1977-12-25 Устройство дл ввода и вывода речевой информации

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU772562176A SU792247A1 (ru) 1977-12-25 1977-12-25 Устройство дл ввода и вывода речевой информации

Publications (1)

Publication Number Publication Date
SU792247A1 true SU792247A1 (ru) 1980-12-30

Family

ID=20741201

Family Applications (1)

Application Number Title Priority Date Filing Date
SU772562176A SU792247A1 (ru) 1977-12-25 1977-12-25 Устройство дл ввода и вывода речевой информации

Country Status (1)

Country Link
SU (1) SU792247A1 (ru)

Similar Documents

Publication Publication Date Title
Dudley Remaking speech
US7149682B2 (en) Voice converter with extraction and modification of attribute data
US6349277B1 (en) Method and system for analyzing voices
JP2738534B2 (ja) 異なる型の励起情報を有するディジタル音声符号器
KR960029798A (ko) 신호 특성 측정 방법 및 장치. 음성 신호의 음질 측정 방법 및 신호 성질 측정 방법
KR101840015B1 (ko) 스테레오 음악신호를 위한 반주신호 추출방법 및 장치
CA1326912C (en) Speech coding system
JP2019061135A (ja) 電子楽器、電子楽器の楽音発生方法、及びプログラム
SU792247A1 (ru) Устройство дл ввода и вывода речевой информации
US4845753A (en) Pitch detecting device
US2824906A (en) Transmission and reconstruction of artificial speech
SE438386B (sv) Sett och anordning for alstring av en artificiell talsignal
JP2841797B2 (ja) 音声分析・合成装置
Holmes Copy synthesis of female speech using the JSRU parallel formant synthesiser.
CN114121040B (zh) 用于借助听力设备评估语音信号的语音质量的方法
JP2615991B2 (ja) 線形予測型音声分析合成装置
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置
JP2650355B2 (ja) 音声分析合成装置
JP3368949B2 (ja) 音声分析合成装置
SU120658A1 (ru) Способ анализа и синтеза речи формантного или вокадерного типа
JPH0690638B2 (ja) 音声分析方式
Kelly Speech and vocoders
JPS59176782A (ja) デジタル音響装置
JPS5853357B2 (ja) 音声分析合成方式
JPH05204397A (ja) 音声分析合成装置