JPS6155697A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6155697A
JPS6155697A JP59177564A JP17756484A JPS6155697A JP S6155697 A JPS6155697 A JP S6155697A JP 59177564 A JP59177564 A JP 59177564A JP 17756484 A JP17756484 A JP 17756484A JP S6155697 A JPS6155697 A JP S6155697A
Authority
JP
Japan
Prior art keywords
standard pattern
output
input
standard
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59177564A
Other languages
English (en)
Inventor
裕 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP59177564A priority Critical patent/JPS6155697A/ja
Publication of JPS6155697A publication Critical patent/JPS6155697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、小型にして多入力である音声認識装置に関
す、る。
(従来の技術) 従来の音声認識装置は、第7図のように構成されており
、1は入力端子、2は周波数分析部、3はスペクトル変
換部、4は音声区間決定部、5゛は再サンプル部、6は
距離演算部、7は標準パターンメモリ、8は判定部、9
は認識結果出力端子である。入力端子lより入力された
音声は、周波数分析部2により周波数分析され、スペク
トル変換部3により音声パワーと話者の声帯音源特性の
正規化が行なわれる0次に、音声のパワーなどを用いて
、音声区間決定部4により音声区間の決定を行ない、再
サンプル部5によりスペクトル変換済データをNフレー
ムに線型伸縮し、時間正規化を行ない、入力音声パター
ンとする0次に、距離演算部6により、入力音声パター
ンと標準パターンに、 (K=l 、K )との距離演
算において、距離2  DKを入カバターンの時間標本
第n番目のmチャネル目の要素をA(m、 n )とし
、標準パターンにの時間標本点n番目のmチャネル目の
要素をSに(m、n)とした時に、 XWに(m、n) −−−−−−(1)(1)式により
計算し、判定部8によりに個の標準パターンの中でDK
を最小とする標準パターンのカテゴリを求め、認識結果
としている。
ここで、重みWに(m、n)の計算方法については数々
の方式があるが、この発明の目的でないので省略する。
(発明が解決しようとする問題点) しかしながら、従来の音声認識装置では、Sに(L r
l )8よびWに(m、 n )を標準パターンメモリ
7に持ち、距離演算部6より標準パターン番号にと要素
番号m、nを指定し、その値を得て(1)式によりDに
を計算していた。標準パターンメモリ7の容量は一例と
してIMBであり、従来の音声認m装置では音声1人力
に対し標準パターンメモリ7が1つ必要なため、装置の
大きさが大きくなるという欠点があった。
従って、この発明は装置の動作速度を低下させることな
く、小型にして多入力の音声認識装置を提供することを
目的とする。
(問題点を解決するための手段) 上記問題点を解決するために、この発明は、認識すべき
音声入力を固定長フレームに線型圧縮し時間軸正規化を
行ない入力音声パターンを出力する手段と、該入力音声
パターンと複数個の標準パターンとの距離値を演算する
距離演算手段と、前記距離値に基づき認識結果を出力す
る判定手段とを有する音声認識ユニットを複数個具備し
て複数の音声を認識する音声認識装置において、前記複
数個の標準パターンのすべての要素を順次出力してすべ
ての音声認識ユニットに供給する1つの標準パターンメ
モリ部と、個々の音声認識ユニットの距離演算手段内に
設けられ、前記標準パターンメモリ部からの出力に同期
して得られた距離値を該距離値に対応する標準パターン
に対応させて格納する記憶手段とを設けたことを特徴と
する音声認識装置にある。
(作用) この発明によれば、標準パターンメモリ部は複数の音声
認識ユニットに共通して唯−個設けられており、各音声
認識ユニット内の距離演算手段はこの標準パターンメモ
リ部から順次送出される出力に同期して距離値を計算す
る。そして、この距離値はこの距離値に対応する標準パ
ターンに対応させて記憶手段に格納される。この結果、
複数の音声認識ユニットに共通する唯一個の標準パター
ンメモリ部を設けることができる。
(実施例) 以下、この発明を一実施例に基づき図面を参照して詳細
に説明する。
第1図はこの発明の一実施例を示すブロック図であって
、−例として4人力の音声認識を行なう音声認識装置を
示している。ここで10.20.30゜40は音声認識
ユニットであり、それぞれ音声入力端子11.21.3
1.41から音声を入力し、認識結果出力F子18.2
8.38.48から認識結果を出力する。又、音声認識
ユニット10.20.30.40は標準パターンメモリ
部50に共通に接続される。
第2図はこの発明により音声認識ユニット10の内部を
詳細に説明したブロック図である。第2図で11は音声
入力端子であり、周波数分′折部12に接続される0周
波数分析部12の出力はスペクトル変換部13に接続さ
れ、スペクトル変換部13の出力は音声区間決定部14
と再サンプル15に接続される。
再サンプル部15の出力は距離演算部18に接続され、
又、距離演算部1Bへは外部の標準パターンメモリ部5
0からの出力が接続される。距離演算部1Bの出力は判
定部17に接続され、判定結果は判定結果出力端子18
から出力される。
第3図はこの発明による標準パターンメモリ部50を詳
細に説明したブロック図である。101はL+1進カウ
ンタであり、その出力はデコーダAlO2,デコーダB
 103とSに、Wにメモリ105の下位アドレスに接
続される。デコーダAlO2の出力は信号5TARTで
あり、距離演算部16で制御のために使われる。デコー
ダB103の出力は信号STOPであり、標準パターン
NOカウンタ104に12 Heされ、又、距離演算部
1Bで制御のために使われる。標準パターンNOカウン
タ104の出力は信号5TPNOであり、S、、WKメ
モリ105の上位アドレスと距離演算部1Bへ接続され
る。SK 、WKメモリ105の出力は信号データであ
り、距離演算部18へ接続される。クロック発生回路1
06からは標準パターンメモリ部50の各部と、距離演
算部16にクロックが供給される。
第4図はこの発明による距離演算部1Bを詳細に説明し
たブロック図である。201はアドレスカウンタであり
、その出力は入カバターンメモリ202のアドレス入力
に接続される。入カバターンメモリ202の出力は減算
器(SUB ) 203に接続される。減算器203の
もう一方の入力は標準パターンメモリ部50からのデー
タのうちのSにである。
減算器203の出力は絶対値回路(ABS ) 204
に接続され、絶対値回路204の出力は乗算器205に
接続される0乗算器205のもう一方の入力は標準パタ
ーンメモリ部50からのデータのうちのWKである0乗
算器205 (7)出力は加i機(AD[l ) 20
Gに接続される。加算機20Bの出力はレジスタ(R1
)207 に接続され、レジスタ207の出力は′加算
fi2osのもう一方の入力になる。又、レジスタ20
7の出力はレジスタ(R2)208に接続される。
レジスタ208の出力はテーブル210に接続される。
レジスタ(R3)209の入力は標準パターンメモリ部
50からの5TPNOであり、レジスタ209の出力は
テーブル210に接続される。チー゛プル210の出力
は判定部17に接続される。又、標準パターンメモリ部
50からの信号5TART%5TOP、クロックは距離
演算部16の各部に供給されている0周波数分析部12
、スペクトル変換部13、音声区間決定部14、再サン
プル部15、判定部17の構成は従来の音声認識装置と
同様であり、音声認識ユニット20゜30、40は音声
認識ユニット10と同様である。
第5図は第3図に示す標準パターンメモリ部50から出
力される信号のタイミング関係を表わすタイムチャート
である。以下、第5図を参照して前記実施例の動作を説
明する。
入力端子11より入力された音声は周波数分析部12に
より周波数分析され、スペクトル変換部13により音声
パワーと話者の声帯音源特性の正規化が行なわれる0次
に、音声のパワーなどを用いて音声区間決定部14によ
り音声区間の決定を行ない、再サンプル部15によりス
ペクトル変換法データをNフレームに線型伸縮し、時間
正規化を行ない、入力音声パターンとして距離演算部1
8内の入カバターンメモリ202に書き込むところまで
は従来の音声認識装置と同様である。
次に標準パターンメモリ部50について説明する。L+
l進カウンタ101はクロック(第5図(a))に同期
し、常にカウントアツプ動作をしている。ただし、L=
MXNである。L+1進カウンタ101の出力がOの時
、デコーダAlO2の出力5TARTは「1」となり(
第5図(b))、L+1進カウンタ101がLの時デコ
ーダB103の出力5TOPは「1」となる(第5図(
c))、5TOPが「1」の時には、標準パターンNO
カウンタ104がクロックに同期してカウントアツプさ
れる(第5図(e))、標準パターンNOカウンタ10
4は、標準パターン数をに1とするとに、進カウンタで
ある。−例としてに工は1024程度の値である。L+
1進カウンタ101の出力はSに、Wにメモリ105の
下位アドレスに、又、標準パターンNOカウンタ104
の出力はSに 、Wにメモリの上位アドレスに接続され
ているので、L+1進カウンタ101と標準パターンN
Oカウンタ104のカウントアツプに伴なって、すべて
の標準パターンのすべての要素がデータとして順に得ら
れることになる(第5図(d))。
次に距離演算部18の動作について説明する。まず、5
TOPかrlJの時にクロックに同期し、アドレスカウ
ンタ201とレジスタ207をゼロクリアする0次に、
すでに入カバターンメモリ201に入カバターンが書き
込まれていることを条件として、5TARTが「1」の
時にクロックに同期して、5TPNOKをレジスタ20
8にラッチする。この時、入カバターンメモリ202の
出力はアドレスOに対応した値Aにであり、データはに
番目の標準パターンのアドレスOに対応したSK 、W
Kとなっている1次に、減算器203によりAK−3,
を計算し、絶対値回路204によりl AK −3x 
 lを計算する0次に、データ中のWにの値とIAに一
3K lを乗算器205で乗じる0次゛に、レジスタ2
07の値とIAに一3K l・Wにを加算器206で加
え、クロックに同期してレジスタ207にラッチする。
アドレスカウンタ201をクロックに同期してカウント
アツプしながら以上の動作をL回繰返すことにより、レ
ジスタ207には(1)式のDKが求まることになる。
そして5TOPが「1」の時にクロックに同期しDにの
値をレジスタ20Bにラッチする。ここまでの動作でレ
ジスタ208には5TPNOKが、レジスタ208には
標準パターンにと入カバターンの距離りにが求まること
になる0次にテーブル210にDにを書き込む、テーブ
ル210は一次元の配列であり、Kを指定してその他を
書き込むことができる。第6図はテーブル210を図示
したものであり・DK%Dに+IIDK+2の3つの値
が書き込まれたところを表わしている。
以上の動作をに1繰返すことにより、Dに”’ D K
j−1をしてDo”’DK−1の順でD O”’ D 
Kl −1の値が求まり、距離演算部16の動作を終了
する。
次に、判定部17によりD O” D J−1の中で最
小値とその標準パターン番号を求め、その標準パターン
のカテゴリを認識結果として認識結果を出力端子18よ
り出力する所は従来の音声認識装置と同様である。
以上、この実施例を音声認識ユニット10のみについて
説明したが音声認識ユニット20.30.40について
も同様である。又、この実施例では4台の音声認識ユニ
ットで標準パターンメモリ部を共有したが、4台に限ら
ず任意の数の音声認識ユニットで標準パターンメモリ部
を共有することが可能である。
(発明の効果) この発明は以上説明したように、複数の音声認識ユニッ
トで1つの標準パターンメモリ部を共有している。不特
定話者単語音声認a装置では標準パターンの1パターン
のメモリ容量はIKB程度必要であり、標準パターン数
は1000程度になることもあり、全標準パターンの容
量はIMB程となる。従って、従来の音声認識装置では
32回線の場合32MBのメモリが必要となり、かなり
の量であるが、この発明の音声認識装置ではIMBでよ
いことになる。更に、標準パターンの先頭から順に距離
演算を行なっていくのではなく、音声入カバターンが入
カバターンメモリに書き込まれた直後から距離演算を行
なうので、認識時間が増加することはない0以上により
、この発明の音声認識装置は多回線の音声応答認識シス
テムに利用することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例のブロック図、第2図は第
1図に示される音声認識装置のブロック図、第3図は第
1図に示される標準パターンメモリ部のブロック図、第
4図は第2図に示される距離演算部のブロック図、ff
15図は第3に示される標準パターンメモリ部から出力
される信号のタイムチャート、第6図は第4図に示され
るテーブルの詳細を示す図、及び第7図は従来の音声認
識装置のブロック図である。 10、29.30.40−−−−一 音声認識ユニット
、11、21.31.41−−一−−音声入力端子、1
8、2B、 38.48−−−−一 判定結果出力端子
、50−−−−一 標準パターンメモリ部、101−−
−−− L+ 1進カウンタ、102−−−−−デコー
ダA、 103−−−−−デコーダB、 104−−−−一標準パターンンNOカウンタ、105
−−一−−Sに 、WKメモリ、toe−−−−−クロ
ック、 201−−−−−アドレスカウンタ、 202−−−−一人カパターンメモ1ハ203−−−−
一減算器(SUB ) 。 204−−−−一絶対値回路(ABS )、205−−
−−一乗算器、 208−−−m−加算器(ADD ) 。 20?−−−−−レジスタ(R1)、 20&−−−−−レジスタ(R2)、 209−一−−−レジスタ(R3)、 210−−−−−テーブル。 特  許  出  願  人 沖電気工業株式会社 特許出願代理人

Claims (1)

    【特許請求の範囲】
  1. 認識すべき音声入力を固定長フレームに線型圧縮し時間
    軸正規化を行ない入力音声パターンを出力する手段と、
    該入力音声パターンと複数個の標準パターンとの距離値
    を演算する距離演算手段と、前記距離値に基づき認識結
    果を出力する判定手段とを有する音声認識ユニットを複
    数個具備して複数の音声を認識する音声認識装置におい
    て、前記複数個の標準パターンのすべての要素を順次出
    力してすべての音声認識ユニットに供給する1つの標準
    パターンメモリ部と、個々の音声認識ユニットの距離演
    算手段内に設けられ、前記標準パターンメモリ部からの
    出力に同期して得られた距離値を該距離値に対応する標
    準パターンに対応させて格納する記憶手段とを設けたこ
    とを特徴とする音声認識装置。
JP59177564A 1984-08-28 1984-08-28 音声認識装置 Pending JPS6155697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59177564A JPS6155697A (ja) 1984-08-28 1984-08-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59177564A JPS6155697A (ja) 1984-08-28 1984-08-28 音声認識装置

Publications (1)

Publication Number Publication Date
JPS6155697A true JPS6155697A (ja) 1986-03-20

Family

ID=16033164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59177564A Pending JPS6155697A (ja) 1984-08-28 1984-08-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6155697A (ja)

Similar Documents

Publication Publication Date Title
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
JPH0361959B2 (ja)
CA1065490A (en) Emphasis controlled speech synthesizer
JPH0441356B2 (ja)
JPS5885499A (ja) 連続音声認識装置
CN113421571A (zh) 一种语音转换方法、装置、电子设备和存储介质
JPS6155697A (ja) 音声認識装置
JPS6144320B2 (ja)
JPS5968793A (ja) 音声合成装置
JPS63234299A (ja) 音声分析合成方式
JPS60164800A (ja) 音声認識装置
JPS59166999A (ja) 音声過渡点検出方法
JPS58200298A (ja) 音声分析装置
JPS58200299A (ja) 音声分析装置
Parfitt A high accuracy computer recognizer of speech for medical data input
JPS6120094A (ja) 音声認識合成装置
JPH04261590A (ja) 自動採譜装置
JPH0142000B2 (ja)
JPS61105599A (ja) 連続音声認識装置
JPS587200A (ja) 音声合成装置
JPS60129800A (ja) 音声認識方式
JPH02248999A (ja) 音声認識方式
JPS6265098A (ja) 音楽用ボコ−ダ
JPH0664477B2 (ja) 音声合成装置
JPS58116595A (ja) 単語音声認識装置