JPS6120094A - 音声認識合成装置 - Google Patents

音声認識合成装置

Info

Publication number
JPS6120094A
JPS6120094A JP59140838A JP14083884A JPS6120094A JP S6120094 A JPS6120094 A JP S6120094A JP 59140838 A JP59140838 A JP 59140838A JP 14083884 A JP14083884 A JP 14083884A JP S6120094 A JPS6120094 A JP S6120094A
Authority
JP
Japan
Prior art keywords
section
synthesis
input
output
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59140838A
Other languages
English (en)
Inventor
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59140838A priority Critical patent/JPS6120094A/ja
Publication of JPS6120094A publication Critical patent/JPS6120094A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声を認識および合成するB7も認識合成装
置に関するものである。
従来例の構成とその問題点 近年、人間−機械系の入出力手段として音声が注1」を
集めており合手Φの音声認識装置−や音声合成装置が商
品化さ7’している。しかし、両者ともその価格が高く
、普及を遅らせる大きな要因となっている。音声合成器
の場合は、1チツプのLSI等の安価なものもあるが、
高品質な合成や、任意文章の合成等を目的とする場合は
、装置価格は非′7δに高くなる。−また、音声合成装
置や音声認識装置を組み込んだ機器の開発が盛んになる
につ几て、合成、認識装置の小型化が嘱望さ几ている。
現在、こtLらの要求に対して装置の小型化、低価格化
のための方法が研究されている。
以下、第1図、第2図を参照しながら従来の音7’tl
認識装置および合成装置について説明する。
第1図は音声認識装置の従来例を示したものである。同
図において、1は音声を電気信号に変換すえ)マイクロ
フAン等からなる入力部、2は、上記入力部1からの電
気信号をディジタル化するために必要な低域フィルタや
プリエンファシス特性を含むフィルタ部及び増lJ部、
3は上記フィルタ部2からの信号をディジタル化するA
/D変換部、4はA / D変換部3でディジタル化さ
nた7”S声信号から周波数分析等の手段によって音声
の特徴を抽出する特徴抽出部、6は特徴抽出部4によっ
て抽出さnた音声の特徴を入力バタンとして一1侍的上
記憶しておく入力バタン記憶部、7は認識対象となる複
数個の音声の特徴を標準バタンとして予め記憶せしめて
おく標準バタン記憶部、6は入力バタン記憶部6あるい
は標準バタン記憶部7と−上記特徴抽出部4とを接続す
るモード切換スイッチであり、標準バタン記憶部7に音
声の特徴を予め記憶せしめる登録モードと入力バタン記
憶部に音声の特徴を記憶せしめる認識モードとを選択す
る手段である。8は−h記大人カバタン記憶部6記憶さ
几たバタンと上記標準バタン記憶部7上記憶さnた複数
の標準バタンとの類似度を81qし、入力音声を特定の
単語あるいは単音節と認識する類似度計算部、9は上記
類似度計算部によって認識さルた単語あるいは単音節に
対応する信号を出力する出力部である。
上記のように構成さ庇た音声認識装置について、以下、
具体的に動作を説明する。
まず登録モード時には、モード切換スイッチ6をA側に
接続し、あらかじめ決めらnf?:、順に単語または単
音節を発声して入力部1に入力する事に°よって、音声
の登録が為さ几る。即ち、入力された音声を入力部によ
り電気信号に変換し、この信号をフィルタ部2により所
望の周波数特性に変換し、この電気信号を上記A/D変
換部によりディジタル化し、このディジタル化さ几た音
声信号から上記特徴抽用部4により音声の特徴を抽出し
て上記標準バタン記憶部子にこの音声の特徴を登録する
次に、認識モード時には、上記モード切換スイッチ6を
B側に接続し、登録モード時に登録さ扛た複数個の単語
または単音節の内から所望のものを上記入力部1に入力
すnげ、上記類似度計算部8により入力バタンに最も類
似していると判定さ几た標準バタンに対応した信号が上
記出力部9から出力さnる。
上記のJ:うに構成さ几た音声認識装置では、特徴抽出
部が全体の価格に大きく影響する。
次に第2図の音声合成装置について説明する。
同図において、10Fi電気信号を音声に変換するスピ
ーカー等からなる音声出力部、11は低域フィルタやプ
リエンファシス特性等ヲ含むフィルタ部及び増中部、1
2は、合成さnたディジタル信号を、アナログ化するD
/A変換部、13は合成用のパラメータから合成信号を
計算する合成演算部、14は、基本的な音韻に対応する
合成用パラメータを保持するパラメータ記憶部、16は
、合成しようとする音韻コードから上記パラメータ記憶
部14を参照して合成用パラメータを泪算するパラメー
タ演算部、16は、合成しようとする音韻コードを入力
するための合成コード入力部である。
上記のように構成された音声合成装置について以下、具
体的に動作を説明する。
合成コード入力部16によって入力さ几た音韻コードは
、パラメ〜り演算部16に入力さ庇る。パラメータ演算
部15は、音韻コードをパラメータ記憶部14を参照し
ながら合成用パラメータを作成する。このパラメータは
、合成演算部13に入力されここで合成信号が計算さ几
る。合成さnた信号は、D/A変換部12によってアナ
ログ化さnl、フィルタ部11によって所望の周波数特
性に変換さ7’した後、音声出力部10により合成音が
出力さノする。
上記のように構成さ几た音声合成装置では、合成演算部
が全体の価格に大きく影響する。
以上のような音声認識装置及び合成装置を同一機器」二
に実現する場合、従来は、第1図と第2図の構成による
装置が必要であり、小型化、低価格化の要求に対する大
きな問題であった。
発明の目的 本発明は、ハードウェア規模を増加させることなく、低
価格、小型の音声認識合成装置を構成する手段を提供す
るこ全目的とする。
発明の構成 本発明は、認識装置の特徴抽出部および合成装置の合成
演算部を同一のディジタル信号処理用プロセッサで構成
し、かつ認識装置のフィルタ部と合成装置のフィルタ部
を共用することにより、低価格、小型の音声合成認識装
置を提供するものである。
実施例の説明 以下、本発明の実施例について図面とともに説明する。
第3図は、本発明の一実施例における音声認識合成装置
の構成を示したものである。
同図において、17は、音声を電気信号に変換したり、
電気信号を音声に変換する音声入出力部である。マイク
ロフォンやスピーカーは、基本的に同一の機構を有する
ので、この入出力部17は、1つの電気−音響変換素子
で構成できる。19は、低琥フィルタやプリエンファシ
ス特性等の特性を有するフィルタ部および州中部、21
は、アナログ電気信号をディジタル化するA/D変換部
、22は、ディジタル電気信号をアナログ化するD/A
変換部、26は、ディジタル信号処理用プロセッサから
成るディジタル信号処理部、23は、ディジタル信号処
理部26を特徴抽出部として働かせるだめの特徴抽出用
ROM、24は、ディジタル信号処理部26を合成演算
部として働かせるだめの合成演算用ROM、27は、音
声合成時に、音韻コードを合成パラメータに変換したり
、認識時に、類似度計算を行うコントロール部、18゜
20.26は認識動作と合成動作を切換るモード切換ス
イッチである。
上記のように構成された音声認識合成装置について、以
下、具体的に動作を説明する。
まず音声認識モード時には、モード切換スイッチ18,
20.25をA側に接続する。音声信号は音声入出力部
17に入力され、次にフィルタ部19に入力される。こ
こでフィルタ部は、第4図に示すように増11]部28
、プリエンファシス部29、低域フィルタ部3oから構
成される。ここで、州中部28は、音声信号を、A/D
変換部21に入力するために必要な電圧レベルにまで増
巾するためのものであり、プリエンファシス部29は、
音声生成過程における声門体積流波形の効果(約=12
 dBloctave の傾斜でモデル化される)と、
口唇放射特性(約→6 dBloc t aveの傾斜
でモデル化される)によって生ずるスペクトルの傾斜を
補償するために必要なもので約+6 dBloc t 
a veの傾斜を持つ。低域フィルタ部3oは、A/D
変換を行うだめの折返しノイズ防止用のフィルタである
。フィルタ部19の出力は、A/D変換部21によりデ
ィジタル化されディジタル信号処理部26に入力される
。ディジタル信号処理部26は、特徴抽出用ROM23
の命令に従って特徴抽出部として働く。ここでは、特徴
抽出部として汎用ディジタル信号処理LSIを例にとっ
て述べる。特徴抽出用ROM23は、音声の特徴抽出ア
ルゴリズムが命令として書かれており、例えば、LPC
パラメータの抽出や、ケプストラムの計算、バンドパス
フィルターの計算等の特徴抽出動作を実行するためのも
のである。このようにして計算された音声の特徴抽出パ
ラメータは、コントロール部27に送られ、音声認識の
ための類似度計算が行われる。コントロール部はCPU
とメモリ等から成るコンピュータシステム部であり、ス
イッチ18゜20.25のコントロール等を行うととも
に、音声認識時には、あらかじめ登録しておいた音声の
標準パターンと、入力音声の特徴パラメータの間で類似
度計算を行い認識結果を出力する。
次に音声合成モード時には、モード切換スイッチ15,
20.25をB側に出力する。まず合成しようとする音
韻コードをコントロール部27に入力する。コントロー
ル部27は、合成モード時ニハ、スイッチ1 B、20
.25のコントロールを行うとともに、入力された音韻
コードから合成パラメータを作成しディジタル信号処理
部26に送る。この合成パラメータは例えば、LPCパ
ラメーターや、ホルマントパラメータ等である。ディジ
タル信号処理部26では、合成演算用ROM24の命令
に従って、合成演算部として働く。この演算は、合成パ
ラメータがLPGの場合は、LPC合成器の演算であり
、ホルマントパラメータの場合は、ホルマント合成器の
演算となる。ディジタとなる。このアナログ信号は、フ
ィルタ部19に入力される。合成モードの場合フィルタ
部19は次のように働く。増巾部28により出力用スピ
ーカ等を駆動するに足る電圧まで、合成信号を増申し、
プリエンファシス部29は、音声生成過程の口唇放射特
性を模擬する働きをする。次に低域フィルタ部3Qは、
D/A出力の信号のスムージングを行う。以上の動作に
より得られた合成音の信号は、音声入出力部17によっ
て合成音となる。
以−Lのように本実施例によれば、第3図のハードウェ
ア構成をとることにより、はとんどのハードウェア資源
を認識合成の両モードで共用することができ、低価格、
小型の音声認識合成装置を構成できる。音声入出力部1
7についても、マイクとスピーカーは、基本的に同一の
構造の電気−音響変換機器であるので共用が可能である
発明の効果 以−4−のように本発明は、音声認識合成装置において
、ディジタル信号処理部を特徴抽出機能と合成演算機能
を持たせ、さらにフィルタ部、音声入出力部を共用する
ことにより、装置を低価格、小型にできるものである。
また、フィルタ部の特性は、認識時には、折返し雑音防
止用低域フィルタと、声門と口唇からの放射特性を除去
するだめのプリエンファシスが必要であり、合成時にも
折返し雑音防止用低域フィルタと口唇放射特性を模擬す
るプリエンファシスと同等の特性が必要であるため、一
定の特性で共用できるものであり本装置の実用的効果は
大なるものがある。
【図面の簡単な説明】
第1図は従来の音声認識装置のブロック図、第2図は従
来の音声合成装置のブロック図、第3図は本発明におけ
る一実施例の音声認識合成装置のブロック図である。第
4図は、第3図のフィルタ部19の構成を示したもので
ある。 17 ・・・音声入出力部、19・・・ フィルタ部、
21・・・・A/D変換部、22 ・・・・D/A変換
部、23・・・・・・特徴抽出用ROM、24・・・・
合成演算用ド切換スイッチ、28・・・・・増巾部、2
9 ・・プリエンファシス部、3o・・・低域フィルタ
部。

Claims (2)

    【特許請求の範囲】
  1. (1)音響−電気および電気−音響変換を行う音声入出
    力部と、電気信号の周波数特性および振巾増巾特性を持
    つフィルタ部と、アナログ信号をディジタル化するA/
    D変換部と、ディジタル信号をアナログ化するD/A変
    換部と、命令用ROMを切換ることにより任意の機能を
    実現できる汎用のディジタル信号処理部と、上記ディジ
    タル信号処理部を音声認識のための特徴抽出部として働
    かせる特徴抽出用ROMと、上記ディジタル信号処理部
    を音声合成のための合成演算部として働かせる合成演算
    用ROMと、音声認識時には、上記ディジタル信号処理
    部から音声の特徴パターンを入力され類似度演算を行い
    認識結果を得、音声合成時には、合成しようとする音声
    パラメータを上記ディジタル信号処理部に入力するコン
    トロール部と、認識時には、上記音声入出力部の出力を
    上記フィルタ部の入力に接続し、合成時には、上記D/
    A変換部の出力を上記フィルタ部の入力に接続するフィ
    ルタ部入力切換手段と、認識時には、上記フィルタ部出
    力を上記A/D変換部入力に接続し、合成時には、上記
    フィルタ部出力を上記音声入出力部に接続するフィルタ
    部出力切換手段と、認識時には、上記ディジタル信号処
    理部に上記特徴抽出用ROMを接続し、合成時には、上
    記ディジタル信号処理部に上記合成演算用ROMを接続
    するROM切換手段とを具備した音声認識合成装置。
  2. (2)フィルタ部が低域特性と、プリエンファシス特性
    と、増巾特性を有する特許請求の範囲第1項記載の音声
    認識合成装置。
JP59140838A 1984-07-06 1984-07-06 音声認識合成装置 Pending JPS6120094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59140838A JPS6120094A (ja) 1984-07-06 1984-07-06 音声認識合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59140838A JPS6120094A (ja) 1984-07-06 1984-07-06 音声認識合成装置

Publications (1)

Publication Number Publication Date
JPS6120094A true JPS6120094A (ja) 1986-01-28

Family

ID=15277887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59140838A Pending JPS6120094A (ja) 1984-07-06 1984-07-06 音声認識合成装置

Country Status (1)

Country Link
JP (1) JPS6120094A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63213896A (ja) * 1987-03-03 1988-09-06 株式会社日立製作所 音声処理装置
JPH0558530U (ja) * 1992-01-17 1993-08-03 株式会社三ツ葉電機製作所 車両用ウインドウオツシヤ装置における逆止弁構造

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5763467A (en) * 1980-10-03 1982-04-16 Seiko Instr & Electronics Ltd Voice inputting/outputting watch
JPS57188100A (en) * 1981-05-15 1982-11-18 Nippon Telegraph & Telephone Voice recognition/synthesization system
JPS57188097A (en) * 1981-05-14 1982-11-18 Tokyo Shibaura Electric Co Voice recognition response system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5763467A (en) * 1980-10-03 1982-04-16 Seiko Instr & Electronics Ltd Voice inputting/outputting watch
JPS57188097A (en) * 1981-05-14 1982-11-18 Tokyo Shibaura Electric Co Voice recognition response system
JPS57188100A (en) * 1981-05-15 1982-11-18 Nippon Telegraph & Telephone Voice recognition/synthesization system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63213896A (ja) * 1987-03-03 1988-09-06 株式会社日立製作所 音声処理装置
JPH0558530U (ja) * 1992-01-17 1993-08-03 株式会社三ツ葉電機製作所 車両用ウインドウオツシヤ装置における逆止弁構造

Similar Documents

Publication Publication Date Title
US7630878B2 (en) Speech recognition with language-dependent model vectors
JPH0361959B2 (ja)
Christiansen et al. Detecting and locating key words in continuous speech using linear predictive coding
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
JP3518898B2 (ja) 音声合成装置
JPS6120094A (ja) 音声認識合成装置
JPH0215080B2 (ja)
JP3247746B2 (ja) 耐雑音音韻モデルの作成方式
JPH07200554A (ja) 文章読み上げ装置
JPH04324499A (ja) 音声認識装置
JPH10333699A (ja) 音声認識および音声合成装置
JPH05224689A (ja) 音声合成装置
JP3008520B2 (ja) 標準パタン作成装置
JPS6295595A (ja) 音声応答方式
JPH01211799A (ja) 多言語を扱う音声の規則合成装置
Kinsner et al. A speech recognition system using linear predictive coding and dynamic time warping
JPS59176782A (ja) デジタル音響装置
JPH03123399A (ja) 音声認識装置
JPS63124099A (ja) スペクトル標準パタンの作成方法
JPH02248999A (ja) 音声認識方式
JPS60104892U (ja) 音声入力による楽音発生装置
JPS62150398A (ja) 音声規則合成装置
JPS6067998A (ja) 音声合成装置
JPH0562755B2 (ja)
JPH03257484A (ja) 簡易声帯障害者用音声合成装置