JPS6120094A

JPS6120094A - 音声認識合成装置

Info

Publication number: JPS6120094A
Application number: JP59140838A
Authority: JP
Inventors: 謙二松井
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1984-07-06
Filing date: 1984-07-06
Publication date: 1986-01-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、音声を認識および合成するＢ７も認識合成装
置に関するものである。

従来例の構成とその問題点近年、人間−機械系の入出力手段として音声が注１」を
集めており合手Φの音声認識装置−や音声合成装置が商
品化さ７’している。しかし、両者ともその価格が高く
、普及を遅らせる大きな要因となっている。音声合成器
の場合は、１チツプのＬＳＩ等の安価なものもあるが、
高品質な合成や、任意文章の合成等を目的とする場合は
、装置価格は非′７δに高くなる。−また、音声合成装
置や音声認識装置を組み込んだ機器の開発が盛んになる
につ几て、合成、認識装置の小型化が嘱望さ几ている。

現在、こｔＬらの要求に対して装置の小型化、低価格化
のための方法が研究されている。

以下、第１図、第２図を参照しながら従来の音７’ｔｌ
認識装置および合成装置について説明する。

第１図は音声認識装置の従来例を示したものである。同
図において、１は音声を電気信号に変換すえ）マイクロ
フＡン等からなる入力部、２は、上記入力部１からの電
気信号をディジタル化するために必要な低域フィルタや
プリエンファシス特性を含むフィルタ部及び増ｌＪ部、
３は上記フィルタ部２からの信号をディジタル化するＡ
／Ｄ変換部、４はＡ　／　Ｄ変換部３でディジタル化さ
ｎた７”Ｓ声信号から周波数分析等の手段によって音声
の特徴を抽出する特徴抽出部、６は特徴抽出部４によっ
て抽出さｎた音声の特徴を入力バタンとして一１侍的上
記憶しておく入力バタン記憶部、７は認識対象となる複
数個の音声の特徴を標準バタンとして予め記憶せしめて
おく標準バタン記憶部、６は入力バタン記憶部６あるい
は標準バタン記憶部７と−上記特徴抽出部４とを接続す
るモード切換スイッチであり、標準バタン記憶部７に音
声の特徴を予め記憶せしめる登録モードと入力バタン記
憶部に音声の特徴を記憶せしめる認識モードとを選択す
る手段である。８は−ｈ記大人カバタン記憶部６記憶さ
几たバタンと上記標準バタン記憶部７上記憶さｎた複数
の標準バタンとの類似度を８１ｑし、入力音声を特定の
単語あるいは単音節と認識する類似度計算部、９は上記
類似度計算部によって認識さルた単語あるいは単音節に
対応する信号を出力する出力部である。

上記のように構成さ庇た音声認識装置について、以下、
具体的に動作を説明する。

まず登録モード時には、モード切換スイッチ６をＡ側に
接続し、あらかじめ決めらｎｆ？：、順に単語または単
音節を発声して入力部１に入力する事に°よって、音声
の登録が為さ几る。即ち、入力された音声を入力部によ
り電気信号に変換し、この信号をフィルタ部２により所
望の周波数特性に変換し、この電気信号を上記Ａ／Ｄ変
換部によりディジタル化し、このディジタル化さ几た音
声信号から上記特徴抽用部４により音声の特徴を抽出し
て上記標準バタン記憶部子にこの音声の特徴を登録する
。

次に、認識モード時には、上記モード切換スイッチ６を
Ｂ側に接続し、登録モード時に登録さ扛た複数個の単語
または単音節の内から所望のものを上記入力部１に入力
すｎげ、上記類似度計算部８により入力バタンに最も類
似していると判定さ几た標準バタンに対応した信号が上
記出力部９から出力さｎる。

上記のＪ：うに構成さ几た音声認識装置では、特徴抽出
部が全体の価格に大きく影響する。

次に第２図の音声合成装置について説明する。

同図において、１０Ｆｉ電気信号を音声に変換するスピ
ーカー等からなる音声出力部、１１は低域フィルタやプ
リエンファシス特性等ヲ含むフィルタ部及び増中部、１
２は、合成さｎたディジタル信号を、アナログ化するＤ
／Ａ変換部、１３は合成用のパラメータから合成信号を
計算する合成演算部、１４は、基本的な音韻に対応する
合成用パラメータを保持するパラメータ記憶部、１６は
、合成しようとする音韻コードから上記パラメータ記憶
部１４を参照して合成用パラメータを泪算するパラメー
タ演算部、１６は、合成しようとする音韻コードを入力
するための合成コード入力部である。

上記のように構成された音声合成装置について以下、具
体的に動作を説明する。

合成コード入力部１６によって入力さ几た音韻コードは
、パラメ〜り演算部１６に入力さ庇る。パラメータ演算
部１５は、音韻コードをパラメータ記憶部１４を参照し
ながら合成用パラメータを作成する。このパラメータは
、合成演算部１３に入力されここで合成信号が計算さ几
る。合成さｎた信号は、Ｄ／Ａ変換部１２によってアナ
ログ化さｎｌ、フィルタ部１１によって所望の周波数特
性に変換さ７’した後、音声出力部１０により合成音が
出力さノする。

上記のように構成さ几た音声合成装置では、合成演算部
が全体の価格に大きく影響する。

以上のような音声認識装置及び合成装置を同一機器」二
に実現する場合、従来は、第１図と第２図の構成による
装置が必要であり、小型化、低価格化の要求に対する大
きな問題であった。

発明の目的本発明は、ハードウェア規模を増加させることなく、低
価格、小型の音声認識合成装置を構成する手段を提供す
るこ全目的とする。

発明の構成本発明は、認識装置の特徴抽出部および合成装置の合成
演算部を同一のディジタル信号処理用プロセッサで構成
し、かつ認識装置のフィルタ部と合成装置のフィルタ部
を共用することにより、低価格、小型の音声合成認識装
置を提供するものである。

実施例の説明以下、本発明の実施例について図面とともに説明する。

第３図は、本発明の一実施例における音声認識合成装置
の構成を示したものである。

同図において、１７は、音声を電気信号に変換したり、
電気信号を音声に変換する音声入出力部である。マイク
ロフォンやスピーカーは、基本的に同一の機構を有する
ので、この入出力部１７は、１つの電気−音響変換素子
で構成できる。１９は、低琥フィルタやプリエンファシ
ス特性等の特性を有するフィルタ部および州中部、２１
は、アナログ電気信号をディジタル化するＡ／Ｄ変換部
、２２は、ディジタル電気信号をアナログ化するＤ／Ａ
変換部、２６は、ディジタル信号処理用プロセッサから
成るディジタル信号処理部、２３は、ディジタル信号処
理部２６を特徴抽出部として働かせるだめの特徴抽出用
ＲＯＭ、２４は、ディジタル信号処理部２６を合成演算
部として働かせるだめの合成演算用ＲＯＭ、２７は、音
声合成時に、音韻コードを合成パラメータに変換したり
、認識時に、類似度計算を行うコントロール部、１８゜
２０．２６は認識動作と合成動作を切換るモード切換ス
イッチである。

上記のように構成された音声認識合成装置について、以
下、具体的に動作を説明する。

まず音声認識モード時には、モード切換スイッチ１８，
２０．２５をＡ側に接続する。音声信号は音声入出力部
１７に入力され、次にフィルタ部１９に入力される。こ
こでフィルタ部は、第４図に示すように増１１］部２８
、プリエンファシス部２９、低域フィルタ部３ｏから構
成される。ここで、州中部２８は、音声信号を、Ａ／Ｄ
変換部２１に入力するために必要な電圧レベルにまで増
巾するためのものであり、プリエンファシス部２９は、
音声生成過程における声門体積流波形の効果（約＝１２
　ｄＢｌｏｃｔａｖｅ　の傾斜でモデル化される）と、
口唇放射特性（約→６　ｄＢｌｏｃ　ｔ　ａｖｅの傾斜
でモデル化される）によって生ずるスペクトルの傾斜を
補償するために必要なもので約＋６　ｄＢｌｏｃ　ｔ　
ａ　ｖｅの傾斜を持つ。低域フィルタ部３ｏは、Ａ／Ｄ
変換を行うだめの折返しノイズ防止用のフィルタである
。フィルタ部１９の出力は、Ａ／Ｄ変換部２１によりデ
ィジタル化されディジタル信号処理部２６に入力される
。ディジタル信号処理部２６は、特徴抽出用ＲＯＭ２３
の命令に従って特徴抽出部として働く。ここでは、特徴
抽出部として汎用ディジタル信号処理ＬＳＩを例にとっ
て述べる。特徴抽出用ＲＯＭ２３は、音声の特徴抽出ア
ルゴリズムが命令として書かれており、例えば、ＬＰＣ
パラメータの抽出や、ケプストラムの計算、バンドパス
フィルターの計算等の特徴抽出動作を実行するためのも
のである。このようにして計算された音声の特徴抽出パ
ラメータは、コントロール部２７に送られ、音声認識の
ための類似度計算が行われる。コントロール部はＣＰＵ
とメモリ等から成るコンピュータシステム部であり、ス
イッチ１８゜２０．２５のコントロール等を行うととも
に、音声認識時には、あらかじめ登録しておいた音声の
標準パターンと、入力音声の特徴パラメータの間で類似
度計算を行い認識結果を出力する。

次に音声合成モード時には、モード切換スイッチ１５，
２０．２５をＢ側に出力する。まず合成しようとする音
韻コードをコントロール部２７に入力する。コントロー
ル部２７は、合成モード時ニハ、スイッチ１　Ｂ、２０
．２５のコントロールを行うとともに、入力された音韻
コードから合成パラメータを作成しディジタル信号処理
部２６に送る。この合成パラメータは例えば、ＬＰＣパ
ラメーターや、ホルマントパラメータ等である。ディジ
タル信号処理部２６では、合成演算用ＲＯＭ２４の命令
に従って、合成演算部として働く。この演算は、合成パ
ラメータがＬＰＧの場合は、ＬＰＣ合成器の演算であり
、ホルマントパラメータの場合は、ホルマント合成器の
演算となる。ディジタとなる。このアナログ信号は、フ
ィルタ部１９に入力される。合成モードの場合フィルタ
部１９は次のように働く。増巾部２８により出力用スピ
ーカ等を駆動するに足る電圧まで、合成信号を増申し、
プリエンファシス部２９は、音声生成過程の口唇放射特
性を模擬する働きをする。次に低域フィルタ部３Ｑは、
Ｄ／Ａ出力の信号のスムージングを行う。以上の動作に
より得られた合成音の信号は、音声入出力部１７によっ
て合成音となる。

以−Ｌのように本実施例によれば、第３図のハードウェ
ア構成をとることにより、はとんどのハードウェア資源
を認識合成の両モードで共用することができ、低価格、
小型の音声認識合成装置を構成できる。音声入出力部１
７についても、マイクとスピーカーは、基本的に同一の
構造の電気−音響変換機器であるので共用が可能である
。

発明の効果以−４−のように本発明は、音声認識合成装置において
、ディジタル信号処理部を特徴抽出機能と合成演算機能
を持たせ、さらにフィルタ部、音声入出力部を共用する
ことにより、装置を低価格、小型にできるものである。

また、フィルタ部の特性は、認識時には、折返し雑音防
止用低域フィルタと、声門と口唇からの放射特性を除去
するだめのプリエンファシスが必要であり、合成時にも
折返し雑音防止用低域フィルタと口唇放射特性を模擬す
るプリエンファシスと同等の特性が必要であるため、一
定の特性で共用できるものであり本装置の実用的効果は
大なるものがある。

【図面の簡単な説明】

第１図は従来の音声認識装置のブロック図、第２図は従
来の音声合成装置のブロック図、第３図は本発明におけ
る一実施例の音声認識合成装置のブロック図である。第
４図は、第３図のフィルタ部１９の構成を示したもので
ある。１７　・・・音声入出力部、１９・・・　フィルタ部、
２１・・・・Ａ／Ｄ変換部、２２　・・・・Ｄ／Ａ変換
部、２３・・・・・・特徴抽出用ＲＯＭ、２４・・・・
合成演算用ド切換スイッチ、２８・・・・・増巾部、２
９　・・プリエンファシス部、３ｏ・・・低域フィルタ
部。

Claims

【特許請求の範囲】

（１）音響−電気および電気−音響変換を行う音声入出
力部と、電気信号の周波数特性および振巾増巾特性を持
つフィルタ部と、アナログ信号をディジタル化するＡ／
Ｄ変換部と、ディジタル信号をアナログ化するＤ／Ａ変
換部と、命令用ＲＯＭを切換ることにより任意の機能を
実現できる汎用のディジタル信号処理部と、上記ディジ
タル信号処理部を音声認識のための特徴抽出部として働
かせる特徴抽出用ＲＯＭと、上記ディジタル信号処理部
を音声合成のための合成演算部として働かせる合成演算
用ＲＯＭと、音声認識時には、上記ディジタル信号処理
部から音声の特徴パターンを入力され類似度演算を行い
認識結果を得、音声合成時には、合成しようとする音声
パラメータを上記ディジタル信号処理部に入力するコン
トロール部と、認識時には、上記音声入出力部の出力を
上記フィルタ部の入力に接続し、合成時には、上記Ｄ／
Ａ変換部の出力を上記フィルタ部の入力に接続するフィ
ルタ部入力切換手段と、認識時には、上記フィルタ部出
力を上記Ａ／Ｄ変換部入力に接続し、合成時には、上記
フィルタ部出力を上記音声入出力部に接続するフィルタ
部出力切換手段と、認識時には、上記ディジタル信号処
理部に上記特徴抽出用ＲＯＭを接続し、合成時には、上
記ディジタル信号処理部に上記合成演算用ＲＯＭを接続
するＲＯＭ切換手段とを具備した音声認識合成装置。
（２）フィルタ部が低域特性と、プリエンファシス特性
と、増巾特性を有する特許請求の範囲第１項記載の音声
認識合成装置。