JPH0554119B2 - - Google Patents
Info
- Publication number
- JPH0554119B2 JPH0554119B2 JP58203015A JP20301583A JPH0554119B2 JP H0554119 B2 JPH0554119 B2 JP H0554119B2 JP 58203015 A JP58203015 A JP 58203015A JP 20301583 A JP20301583 A JP 20301583A JP H0554119 B2 JPH0554119 B2 JP H0554119B2
- Authority
- JP
- Japan
- Prior art keywords
- distance
- vector
- inter
- frame
- cumulative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Description
【発明の詳細な説明】
産業上の利用分野
本発明はパタンマツチング装置、特に標準パタ
ンと入力音声パタンとをマツチングすることによ
つて音声認識を行う装置におけるパタンマツチン
グ装置に関する。
ンと入力音声パタンとをマツチングすることによ
つて音声認識を行う装置におけるパタンマツチン
グ装置に関する。
従来例の構成とその問題点
従来のパタンマツチング装置において、簡単な
ものでは、標準パタンと入力音声パタンの線形時
間伸縮を行つた線形距離計算を行つているものが
あつたが、発話音声には、個人差だけでなく同一
話者でも、非線形な発生時間伸縮が生じるため
に、著しい認識率の低下の原因となつていた。
ものでは、標準パタンと入力音声パタンの線形時
間伸縮を行つた線形距離計算を行つているものが
あつたが、発話音声には、個人差だけでなく同一
話者でも、非線形な発生時間伸縮が生じるため
に、著しい認識率の低下の原因となつていた。
そこで認識率の改善を目的として非線形な伸縮
に対しても有効な距離計算が行えるDPマツチン
グ法を採用するマツチング装置があつたが、マツ
チングの構成が、入力音声の全区間(語頭から語
尾の区間)を各標準パタン毎にマツチングするも
のであつたために、本質的に実時間処理が不可能
であつた。また、DPマツチングを行う際のベク
トル間距離計算や累積距離計算を1つの演算装置
で行なつているものがほとんどであつたために、
標準パタン数が増加すると実用上の処理速度に問
題があつた。
に対しても有効な距離計算が行えるDPマツチン
グ法を採用するマツチング装置があつたが、マツ
チングの構成が、入力音声の全区間(語頭から語
尾の区間)を各標準パタン毎にマツチングするも
のであつたために、本質的に実時間処理が不可能
であつた。また、DPマツチングを行う際のベク
トル間距離計算や累積距離計算を1つの演算装置
で行なつているものがほとんどであつたために、
標準パタン数が増加すると実用上の処理速度に問
題があつた。
発明の目的
本発明は従来の問題点を解決し、実時間処理可
能でかつ処理速度の高速化を図つたパタンマツチ
ング装置を提供することを目的とする。
能でかつ処理速度の高速化を図つたパタンマツチ
ング装置を提供することを目的とする。
発明の構成
本発明は、標準パタン特徴ベクトルと入力音声
特徴ベクトルのベクトル間距離を計算するベクト
ル間距離計算手段と、ベクトル間距離計算手段に
より計算された現フレームのベクトル間距離と少
なくとも1フレーム前の累積距離とから現フレー
ムにおける累積距離を計算する累積距離計算手段
を備え、ベクトル間距離計算手段と累積距離計算
手段をパイプライン構成にするとともに、入力音
声特徴ベクトルの1フレーム毎に全標準パタンと
のベクトル間距離および累積距離を求め、かつ累
積距離の計算は、ベクトル間距離と累積距離の和
が最小となるものが新しい累積距離となるように
構成したパタンマツチング装置であり、処理速度
の向上と実時間処理を可能にしたものである。
特徴ベクトルのベクトル間距離を計算するベクト
ル間距離計算手段と、ベクトル間距離計算手段に
より計算された現フレームのベクトル間距離と少
なくとも1フレーム前の累積距離とから現フレー
ムにおける累積距離を計算する累積距離計算手段
を備え、ベクトル間距離計算手段と累積距離計算
手段をパイプライン構成にするとともに、入力音
声特徴ベクトルの1フレーム毎に全標準パタンと
のベクトル間距離および累積距離を求め、かつ累
積距離の計算は、ベクトル間距離と累積距離の和
が最小となるものが新しい累積距離となるように
構成したパタンマツチング装置であり、処理速度
の向上と実時間処理を可能にしたものである。
実施例の説明
第1図は本発明における一実施例のパタンマツ
チング装置を示している。本実施例において、入
力部は、入力音声を特徴ベクトルに変換する特徴
系列変換手段1からなる。記憶部は、標準パタン
を特徴ベクトル系列の形で記憶する標準パタンメ
モリ3、入力音声を特徴ベクトル系列の形で記憶
する入力音声ベクトルバツフア2、標準パタン特
徴ベクトルと入力音声特徴ベクトルのベクトル間
距離を標準パタンに対応して一時記憶するベクト
ル間距離バツフア5、ベクトル間距離を標準パタ
ンに対応して累積させた累積距離を一時記憶する
累積距離バツフア4からなる。演算部8は、標準
パタンの定められたフレームのベクトル{NXtj}
と入力音声ベクトル{Xtj}のベクトル間距離、
例えばコークリツド距離や市街距離を計算するベ
クトル間距離演算部8′と、入力音声ベクトル
{Xtj}の現フレームより前の累積距離に現在のベ
クトル間距離を加算する累積距離演算部8″であ
る。累積距離DN(i、j)を求める漸化式は、 DN(i、j)=min〔{DN(i−2、j
−1)+dN(i−1、j)、 DN(i−1、j−1)、DN
(i−1、j−2)}+dN(i、j)〕 で与えられDPパス8の形を取る。制御部は、
計算しようとする標準パタン(M)を標準パタンメモ
リ3から選択し、かつ各標準パタン(M)に対応した
DMバツフア4′およびdMバツフア5′をそれぞれ
累積距離バツフア4およびベクトル間距離バツフ
ア5から選択するメモリセレクタ6と、標準パタ
ン(M)とdMバツフア5′およびDMバツフア4′の処
理フレームアドレス(j)とさらに入力音声ベクトル
バツフア2の処理フレームアドレス(i)とを選択し
て逐次演算を実行させるアドレスセレクタ7から
なる。
チング装置を示している。本実施例において、入
力部は、入力音声を特徴ベクトルに変換する特徴
系列変換手段1からなる。記憶部は、標準パタン
を特徴ベクトル系列の形で記憶する標準パタンメ
モリ3、入力音声を特徴ベクトル系列の形で記憶
する入力音声ベクトルバツフア2、標準パタン特
徴ベクトルと入力音声特徴ベクトルのベクトル間
距離を標準パタンに対応して一時記憶するベクト
ル間距離バツフア5、ベクトル間距離を標準パタ
ンに対応して累積させた累積距離を一時記憶する
累積距離バツフア4からなる。演算部8は、標準
パタンの定められたフレームのベクトル{NXtj}
と入力音声ベクトル{Xtj}のベクトル間距離、
例えばコークリツド距離や市街距離を計算するベ
クトル間距離演算部8′と、入力音声ベクトル
{Xtj}の現フレームより前の累積距離に現在のベ
クトル間距離を加算する累積距離演算部8″であ
る。累積距離DN(i、j)を求める漸化式は、 DN(i、j)=min〔{DN(i−2、j
−1)+dN(i−1、j)、 DN(i−1、j−1)、DN
(i−1、j−2)}+dN(i、j)〕 で与えられDPパス8の形を取る。制御部は、
計算しようとする標準パタン(M)を標準パタンメモ
リ3から選択し、かつ各標準パタン(M)に対応した
DMバツフア4′およびdMバツフア5′をそれぞれ
累積距離バツフア4およびベクトル間距離バツフ
ア5から選択するメモリセレクタ6と、標準パタ
ン(M)とdMバツフア5′およびDMバツフア4′の処
理フレームアドレス(j)とさらに入力音声ベクトル
バツフア2の処理フレームアドレス(i)とを選択し
て逐次演算を実行させるアドレスセレクタ7から
なる。
前記実施例の動作原理を以下に第1図と第2図
を用いて説明する。
を用いて説明する。
入力音声は、特徴系列変換手段1によつて特徴
ベクトル{Xti}の形に変換されて、入力音声ベ
クトルバツフア2に逐次記憶される。入力音声ベ
クトル系列は、語頭から順次処理され、現在入力
音声ベクトルの(i)フレームがアドレスセレクタ7
によつて選択されると、次に標準パタンメモリ
3、累積距離バツフア4、ベクトル間距離バツフ
ア5から各々標準パタン(M)、DMバツフア4′、dM
バツフア5′が、メモリセレクタ6によつて選択
される。この場合に入力音声の(i)フレームに対応
して標準パタン(M)と対応したDMバツフア、dMバ
ツフアは標準パタンの総数(N)分だけ1番目から順
次選択される(|MN)。
ベクトル{Xti}の形に変換されて、入力音声ベ
クトルバツフア2に逐次記憶される。入力音声ベ
クトル系列は、語頭から順次処理され、現在入力
音声ベクトルの(i)フレームがアドレスセレクタ7
によつて選択されると、次に標準パタンメモリ
3、累積距離バツフア4、ベクトル間距離バツフ
ア5から各々標準パタン(M)、DMバツフア4′、dM
バツフア5′が、メモリセレクタ6によつて選択
される。この場合に入力音声の(i)フレームに対応
して標準パタン(M)と対応したDMバツフア、dMバ
ツフアは標準パタンの総数(N)分だけ1番目から順
次選択される(|MN)。
ここで、標準パタン(M)が選択されると、入力音
声の特徴ベクトル{Xti}のiフレームと標準パ
タンの特徴ベクトル{MXtj}のjフレームのベ
クトル間距離dM(i、j)は、アドレスセレクタ
7によつて1jjNの範囲で順次選択されて
ベクトル間距離演算部8′によつて計算され、dM
バツフアのdM(i、j)に記憶される。またベク
トル間距離の累積距離DM(i、j)も同様にアド
レスセレクタ7によつて1jjNの範囲で順
次選択されて累積距離演算部8″によつて計算さ
れ、DMバツフアのDM(i、j)に記憶される。
入力音声のiフレームまでと標準パタン(M)との距
離は、DM(i、jM)で与えられる。また距離計
算が1jjMの範囲で終了するとdMバツフア
とDMバツフアは入力音声の次のフレームの計算
のために、dM(i−1、j)=dM(i、j)、DM(i
−2、j)=DM(i−1、j)、DM(i−1、j)
=DM(i、j)なる置き換えを1jjMの範
囲でアドレスセレクタ7によつて行う。
声の特徴ベクトル{Xti}のiフレームと標準パ
タンの特徴ベクトル{MXtj}のjフレームのベ
クトル間距離dM(i、j)は、アドレスセレクタ
7によつて1jjNの範囲で順次選択されて
ベクトル間距離演算部8′によつて計算され、dM
バツフアのdM(i、j)に記憶される。またベク
トル間距離の累積距離DM(i、j)も同様にアド
レスセレクタ7によつて1jjNの範囲で順
次選択されて累積距離演算部8″によつて計算さ
れ、DMバツフアのDM(i、j)に記憶される。
入力音声のiフレームまでと標準パタン(M)との距
離は、DM(i、jM)で与えられる。また距離計
算が1jjMの範囲で終了するとdMバツフア
とDMバツフアは入力音声の次のフレームの計算
のために、dM(i−1、j)=dM(i、j)、DM(i
−2、j)=DM(i−1、j)、DM(i−1、j)
=DM(i、j)なる置き換えを1jjMの範
囲でアドレスセレクタ7によつて行う。
上記の操作を標準パタン総数(N)分だけ繰り返す
事によつて、入力音声のiフレームまでの範囲と
全標準パタンの距離を計算できるのでL=Such
M min{D(i、jM)}なるLによつて最小値を
与える標準パタンを決定することができる。
事によつて、入力音声のiフレームまでの範囲と
全標準パタンの距離を計算できるのでL=Such
M min{D(i、jM)}なるLによつて最小値を
与える標準パタンを決定することができる。
次にベクトル間距離演算部8′と累積距離演算
部8″の詳細な動作原理を第2図を用いて以下に
説明する。
部8″の詳細な動作原理を第2図を用いて以下に
説明する。
入力音声特徴ベクトル{Xti}と標準パタン特
徴ベクトル{MXtj}のベクトル間距離を市街距
離で定義しベクトルエレメント数を例えば7とす
ると両者のベクトル間距離は dM(i、j)=7 〓CH=1 |Xt(CH、i)−MXt(CH、j)| で計算される。これは第2図のベクトル間距離演
算部8′で示したように各エレメント対の減算を
行い絶対値を計算する7つの減算器8′aと減算
器の出力の総和を計算する加算器8′bによつて
構成する事が出来る。
徴ベクトル{MXtj}のベクトル間距離を市街距
離で定義しベクトルエレメント数を例えば7とす
ると両者のベクトル間距離は dM(i、j)=7 〓CH=1 |Xt(CH、i)−MXt(CH、j)| で計算される。これは第2図のベクトル間距離演
算部8′で示したように各エレメント対の減算を
行い絶対値を計算する7つの減算器8′aと減算
器の出力の総和を計算する加算器8′bによつて
構成する事が出来る。
入力音声ベクトル{Xti}のiフレームまでの
範囲と標準パタンベクトル{MXtj}のjフレー
ムまでの範囲のベクトル間距離の累積距離は、途
中計算経路(DPパス)を8のようにすると、 DM(i、j)=minDM(i−2、j−1)+dM
(i−1、j) DM(i−1、j−1) DM(i−1、j−2)+dM(i、j) 初期条件はDM(1、1)=dM(1、1)なる漸化
式で計算される。
範囲と標準パタンベクトル{MXtj}のjフレー
ムまでの範囲のベクトル間距離の累積距離は、途
中計算経路(DPパス)を8のようにすると、 DM(i、j)=minDM(i−2、j−1)+dM
(i−1、j) DM(i−1、j−1) DM(i−1、j−2)+dM(i、j) 初期条件はDM(1、1)=dM(1、1)なる漸化
式で計算される。
これは第2図の累積距離演算部8″で示したよ
うに、今までの計算によつて計算されまた、dM
バツフア5′とDMバツフア4′に一時的に記憶さ
れたベクトル間距離dM(i−1、j)と累積距離
DM(i−2、j−1)、DM(i−1、j−1)、DM
(i−1、j−2)をアドレスセレクタ7によつ
て引出し、またベクトル間距離dM(i、j)ベク
トル間距離演算部8′で計算終了した時点で、DM
(i−2、j−1)+dM(i−1、j)+dM(i、
j)DM(i−1、j−2)+dM(i−j)なる加算
を3つの加算器8″aによつて計算し、3つの加
算器の出力の最小値をminセレクタ8″bによつ
て検出することによつて累積距離DM(i、j)を
計算することができる。
うに、今までの計算によつて計算されまた、dM
バツフア5′とDMバツフア4′に一時的に記憶さ
れたベクトル間距離dM(i−1、j)と累積距離
DM(i−2、j−1)、DM(i−1、j−1)、DM
(i−1、j−2)をアドレスセレクタ7によつ
て引出し、またベクトル間距離dM(i、j)ベク
トル間距離演算部8′で計算終了した時点で、DM
(i−2、j−1)+dM(i−1、j)+dM(i、
j)DM(i−1、j−2)+dM(i−j)なる加算
を3つの加算器8″aによつて計算し、3つの加
算器の出力の最小値をminセレクタ8″bによつ
て検出することによつて累積距離DM(i、j)を
計算することができる。
上記のようなベクトル間距離演算部と累積距離
演算部およびベクトル間距離と累積距離を一時的
に記憶するdMバツフアとDMバツフアの構成をと
ることによつて、途中計算結果の記憶部の容量を
低減させかつ両演算部のパイプライン構成を実現
でき高速演算を実用化できる。
演算部およびベクトル間距離と累積距離を一時的
に記憶するdMバツフアとDMバツフアの構成をと
ることによつて、途中計算結果の記憶部の容量を
低減させかつ両演算部のパイプライン構成を実現
でき高速演算を実用化できる。
発明の効果
本発明のパタンマツチング装置は、入力音声の
特徴ベクトル{Xtj}のフレーム毎に、全標準パ
ターンベクトル{NXtj}(1jjN)〔N:辞
書種別jN:辞書フレーム長〕との距離計算を逐
次行うものであり、入力ベクトル{Xti}と標準
パターンベクトル{NXtj}のベクトル間距離dN
(i、j)とベクトル間距離の累積距離DN(i、
j)を計算する2つの演算装置を設け、また累積
距離途中計算結果を入力音声ベクトルのフレーム
毎に一時的に記憶するバツフアを設け、かつベク
トル間距離演算装置は、累積距離演算装置より、
標準パターン(N)のj軸を1フレーム先行計算する
パイプライン構成とすることによつて、入力音声
と標準パタンの距離計算に非線形演算を導入可能
としてマツチング精度を向上させ、かつ入力音声
をフレーム毎に逐次計算できるので連続音声など
の実時間処理も可能とし、パイプライン演算によ
つて高速処理が可能となつたものであり、その実
用的価値は高い。
特徴ベクトル{Xtj}のフレーム毎に、全標準パ
ターンベクトル{NXtj}(1jjN)〔N:辞
書種別jN:辞書フレーム長〕との距離計算を逐
次行うものであり、入力ベクトル{Xti}と標準
パターンベクトル{NXtj}のベクトル間距離dN
(i、j)とベクトル間距離の累積距離DN(i、
j)を計算する2つの演算装置を設け、また累積
距離途中計算結果を入力音声ベクトルのフレーム
毎に一時的に記憶するバツフアを設け、かつベク
トル間距離演算装置は、累積距離演算装置より、
標準パターン(N)のj軸を1フレーム先行計算する
パイプライン構成とすることによつて、入力音声
と標準パタンの距離計算に非線形演算を導入可能
としてマツチング精度を向上させ、かつ入力音声
をフレーム毎に逐次計算できるので連続音声など
の実時間処理も可能とし、パイプライン演算によ
つて高速処理が可能となつたものであり、その実
用的価値は高い。
第1図は本発明における一実施例のパタンマツ
チング装置のブロツク図、第2図は同実施例にお
けるベクトル間距離演算部と累積距離演算部の具
体例を示すブロツク図である。 1……特徴系列変換手段、2……入力音声ベク
トルバツフア、3……標準パタンメモリ、4……
累積距離バツフア、5……ベクトル間距離バツフ
ア、6……メモリセレクタ、7……アドレスセレ
クタ、8′……ベクトル間距離演算部、8″……累
積距離演算部。
チング装置のブロツク図、第2図は同実施例にお
けるベクトル間距離演算部と累積距離演算部の具
体例を示すブロツク図である。 1……特徴系列変換手段、2……入力音声ベク
トルバツフア、3……標準パタンメモリ、4……
累積距離バツフア、5……ベクトル間距離バツフ
ア、6……メモリセレクタ、7……アドレスセレ
クタ、8′……ベクトル間距離演算部、8″……累
積距離演算部。
Claims (1)
- 1 入力音声の特徴ベクトル系列{Xti;i=1、
2、3、…}を記憶する入力音声ベクトル記憶手
段と、複数(N、N1)の標準パターンの特徴
ベクトル系列{Yoj;j=1、2、…、Jo;1
nN}を記憶する辞書ベクトル記憶手段と、前
記入力音声の特徴ベクトル{Xti}毎に前記全標
準パターンのすべての特徴ベクトル系列とのベク
トル間距離を計算するベクトル間距離計算手段
と、前記ベクトル間距離計算手段により計算され
た現フレーム{i}のベクトル間距離と少なくと
も1フレーム前{i−1}までの累積距離とから
現フレーム{i}における前記標準パターンのす
べての特徴ベクトル系列との累積距離を計算する
累積距離計算手段と、フレーム毎に各標準パター
ンの全ベクトル系列に対する累積値を一時的に記
憶する累積距離記憶手段とを備え、前記入力音声
の1フレーム(i)が入力される毎にベクトル間距離
計算手段による計算値と前フレーム(i−1)ま
での前記累積距離記憶手段の全標準パターンの全
特徴ベクトルのフレーム(j;j=1、2、…、
Jo)の各累積値との和が最小値となる値で(i、
j)oの累積値を順次jフレーム(j=1、2、
…、Jo)について計算し、前記ベクトル距離計算
手段と前記累積距離計算手段をパイプライン構成
として順次累積距離記憶手段の内容を順次更新し
ていくことを特徴とするパタンマツチング装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58203015A JPS6095500A (ja) | 1983-10-28 | 1983-10-28 | パタンマツチング装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58203015A JPS6095500A (ja) | 1983-10-28 | 1983-10-28 | パタンマツチング装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6095500A JPS6095500A (ja) | 1985-05-28 |
| JPH0554119B2 true JPH0554119B2 (ja) | 1993-08-11 |
Family
ID=16466925
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58203015A Granted JPS6095500A (ja) | 1983-10-28 | 1983-10-28 | パタンマツチング装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6095500A (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5694400A (en) * | 1979-12-27 | 1981-07-30 | Fujitsu Ltd | Voice identifier |
-
1983
- 1983-10-28 JP JP58203015A patent/JPS6095500A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6095500A (ja) | 1985-05-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0466039B2 (ja) | ||
| JPS58115497A (ja) | 音声認識方法 | |
| US5164990A (en) | Method and apparatus for recognizing unknown spoken words and by feature extraction and comparison with reference words | |
| JPH01138597A (ja) | 連続音声認識方式 | |
| JPH0554119B2 (ja) | ||
| JPH0361956B2 (ja) | ||
| JPH02750B2 (ja) | ||
| JP2785939B2 (ja) | 連続音声認識装置 | |
| JPS6152478B2 (ja) | ||
| JP2518871B2 (ja) | パタン比較器 | |
| JPS60254372A (ja) | 積和演算装置 | |
| JPS6122350B2 (ja) | ||
| JPS62144200A (ja) | 連続音声認識装置 | |
| JPH0134399B2 (ja) | ||
| JP2992065B2 (ja) | 画像追尾装置 | |
| JPH0436400B2 (ja) | ||
| JPH0577080B2 (ja) | ||
| JPH0638195B2 (ja) | パタンマッチング装置 | |
| JP6061714B2 (ja) | 類似系列区間検出装置および類似系列区間検出プログラム | |
| JPH0247754B2 (ja) | ||
| JPH0247755B2 (ja) | ||
| JPS592954B2 (ja) | パタンルイジドケイサンソウチ | |
| JPH0311479B2 (ja) | ||
| JPS59200A (ja) | パタ−ンマツチング装置 | |
| JPS60201395A (ja) | 音声認識方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |