JPH0361955B2 - - Google Patents
Info
- Publication number
- JPH0361955B2 JPH0361955B2 JP57092824A JP9282482A JPH0361955B2 JP H0361955 B2 JPH0361955 B2 JP H0361955B2 JP 57092824 A JP57092824 A JP 57092824A JP 9282482 A JP9282482 A JP 9282482A JP H0361955 B2 JPH0361955 B2 JP H0361955B2
- Authority
- JP
- Japan
- Prior art keywords
- matching
- pattern
- time series
- series pattern
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】
(a) 発明の技術分野
本発明は音声認識方法に係り、特に音声の特徴
を表すベクトルの時系列で表されるパターンのマ
ツチング方法の改良に関する。
を表すベクトルの時系列で表されるパターンのマ
ツチング方法の改良に関する。
(b) 従来技術と問題点
一般にパターンのマツチングによつて、音声を
認識するためには、単語単位に音声の標準パター
ンを単語辞書としてメモリに登録しておき、入力
音声パターンと標準パターンとをマツチングさせ
ている。
認識するためには、単語単位に音声の標準パター
ンを単語辞書としてメモリに登録しておき、入力
音声パターンと標準パターンとをマツチングさせ
ている。
この場合、入力音声パターン及び標準パターン
は出来る限り、その単語の発音に関して時間軸上
において、正規化されていることが望ましい。
は出来る限り、その単語の発音に関して時間軸上
において、正規化されていることが望ましい。
ところが、1つの単語を発生する場合、単語音
声の継続時間長及び単語音声中の音韻の長さは、
一般に発音する人や発音する時の状況等によつて
変動する。
声の継続時間長及び単語音声中の音韻の長さは、
一般に発音する人や発音する時の状況等によつて
変動する。
この様に音声の特徴を表すベクトルの時系列で
表される長さの異なる2つのパターンのパターン
マツチング方法としては、動的計画法(DPマツ
チング)と識別関数法とが代表的な方法として知
られている。
表される長さの異なる2つのパターンのパターン
マツチング方法としては、動的計画法(DPマツ
チング)と識別関数法とが代表的な方法として知
られている。
しかし、動的計画法は時間軸の非線形な伸縮に
対する正規化には有効であるが、パラメーターの
確率的な変動に対処することは困難である。
対する正規化には有効であるが、パラメーターの
確率的な変動に対処することは困難である。
又、識別関数法はパラメータの確率的変動には
有効であるが、時間軸方向の正規化に問題がある
という欠点がある。
有効であるが、時間軸方向の正規化に問題がある
という欠点がある。
(c) 発明の目的
本発明の目的は上記欠点を除くため、動的計画
法と識別関数法とを組合わせ、両方法の長所を合
わせ持つたパターンマツチング装置を提供するこ
とにある。
法と識別関数法とを組合わせ、両方法の長所を合
わせ持つたパターンマツチング装置を提供するこ
とにある。
(d) 発明の構成
本発明の構成は、入力時系列パターンを動的計
画法によつて標準時系列パターンとマツチングす
る手段と、該マツチング手段のマツチングした結
果に基づき、入力時系列パターンを、該標準時系
列パターンと同じ系列の長さに変換する変換手段
とを設け、 該変換手段が変換した新たな入力時系列パター
ンと前記標準時系列パターンとの間で、パラメー
タの中心的な要素を重くする重み付けを用いた距
離計算を行つて、パターンマツチングを行うよう
にしたものである。
画法によつて標準時系列パターンとマツチングす
る手段と、該マツチング手段のマツチングした結
果に基づき、入力時系列パターンを、該標準時系
列パターンと同じ系列の長さに変換する変換手段
とを設け、 該変換手段が変換した新たな入力時系列パター
ンと前記標準時系列パターンとの間で、パラメー
タの中心的な要素を重くする重み付けを用いた距
離計算を行つて、パターンマツチングを行うよう
にしたものである。
(e) 発明の実施例
第1図は本発明の一実施例を説明するブロツク
図である。
図である。
音声の継続時間長を等時間単位の区分に分割
し、該区分の総てにおける該音声の特徴ベクトル
を、入力時系列パターンについては、ベクトルa→
1,a→2,a→3,……,a→Iとし、標準時系列パタ
ー
ンについては、ベクトルb→1,b→2,b→3,……,
b→Jとすると、メモリ1には入力時系列パターン
A={a→i}i=1〜Iが格納され、メモリ3には標準時
系
列パターンB={b→j}j=1〜Jが格納される。
し、該区分の総てにおける該音声の特徴ベクトル
を、入力時系列パターンについては、ベクトルa→
1,a→2,a→3,……,a→Iとし、標準時系列パタ
ー
ンについては、ベクトルb→1,b→2,b→3,……,
b→Jとすると、メモリ1には入力時系列パターン
A={a→i}i=1〜Iが格納され、メモリ3には標準時
系
列パターンB={b→j}j=1〜Jが格納される。
DPマツチング部2において、メモリ1及び3
より読出された入力時系列パターンA及び標準時
系列パターンBが動的計画法によりマツチングさ
れる。
より読出された入力時系列パターンA及び標準時
系列パターンBが動的計画法によりマツチングさ
れる。
動的計画法によるマツチングの詳細は「日本音
響学会誌」vol27、No.9、483〜490頁、1971年9
月に記載されているが、概略的には、2つの音声
パターンA,Bの夫々の継続時間長を等しい時間
単位に時刻1〜Iと時刻1〜Jに分割し、夫々を
平面上の縦軸及び横軸の目盛とし、各時刻におけ
る音声の特徴ベクトルを求める。
響学会誌」vol27、No.9、483〜490頁、1971年9
月に記載されているが、概略的には、2つの音声
パターンA,Bの夫々の継続時間長を等しい時間
単位に時刻1〜Iと時刻1〜Jに分割し、夫々を
平面上の縦軸及び横軸の目盛とし、各時刻におけ
る音声の特徴ベクトルを求める。
即ち、ベクトルa→1,a→2,a→3,……,a→I及
び
ベクトルb→1,b→2,b→3,……,b→Jを求めて2
つの音声パターンA,Bの間の距離が最小になる
ように最適経路10を得て、その時の最適経路1
0に沿つた累積距離としてマツチング距離を得る
ものである。
び
ベクトルb→1,b→2,b→3,……,b→Jを求めて2
つの音声パターンA,Bの間の距離が最小になる
ように最適経路10を得て、その時の最適経路1
0に沿つた累積距離としてマツチング距離を得る
ものである。
即ち、先ず距離g1,1=|a→i−b→i|とし、gi,j
は
第2図に示すgi-1,j,gi-1,j-1,gi,j-1の3点よりの
最小地にi,j点における音声パターンAとBの
対応するベクトル間の距離|a→i−b→i|を加える
ことにより求められる。このようにしてi,jを
遂次増加しながらgi,jを求めることにより、最終
的に音声パターンA,Bの間の最適なマツチング
距離としてgI,Jが求まり、又、この計算過程でマ
トリツクスの各格子点において、最適経路が直前
の3点の中のどれを通つたか、Pi,jに記憶させる
ことにより、最適なマツチング経路も同時に求め
られる。
は
第2図に示すgi-1,j,gi-1,j-1,gi,j-1の3点よりの
最小地にi,j点における音声パターンAとBの
対応するベクトル間の距離|a→i−b→i|を加える
ことにより求められる。このようにしてi,jを
遂次増加しながらgi,jを求めることにより、最終
的に音声パターンA,Bの間の最適なマツチング
距離としてgI,Jが求まり、又、この計算過程でマ
トリツクスの各格子点において、最適経路が直前
の3点の中のどれを通つたか、Pi,jに記憶させる
ことにより、最適なマツチング経路も同時に求め
られる。
マトリツクス4に得られた音声パターンA,B
間の最適マツチング距離gI,Jと最適経路PI,Jによ
り、入力時系列パターンAの間で、新たなマツチ
ング用パターンCを求めるため、変換部5におい
て、第3図のフローチヤートに示す如く、マトリ
ツクス4の点(I、J)からj=J、J−1、…
…,3,2,1と最適経路を遡りながら、jに対
応するベクトルaiを、又、対応するベクトルaiが
複数個ある時、それ等を平均したものをcjとする
ことにより、マツチング用パターンCを得る。
間の最適マツチング距離gI,Jと最適経路PI,Jによ
り、入力時系列パターンAの間で、新たなマツチ
ング用パターンCを求めるため、変換部5におい
て、第3図のフローチヤートに示す如く、マトリ
ツクス4の点(I、J)からj=J、J−1、…
…,3,2,1と最適経路を遡りながら、jに対
応するベクトルaiを、又、対応するベクトルaiが
複数個ある時、それ等を平均したものをcjとする
ことにより、マツチング用パターンCを得る。
ここでMはjに対応するベクトルaiが複数個あ
る時、平均化するための変数である。i=I、j
=J、M=0は出発点c→J=a→Iとなる。最適経路
Pi,jが第2図に示す如く、点(i−1、j)より、
点(i、j)に至る経路を通つた場合+、点(i
−1、j−1)より点(i、j)に至る経路を通
つた場合0、点(i、j−1)より点(i、j)
に至る経路を通つた場合−とすれば、Pi,jが+の
場合一つ前の格子点ではM=1となる。又、Pi,j
が0又は−の時はM=0である。
る時、平均化するための変数である。i=I、j
=J、M=0は出発点c→J=a→Iとなる。最適経路
Pi,jが第2図に示す如く、点(i−1、j)より、
点(i、j)に至る経路を通つた場合+、点(i
−1、j−1)より点(i、j)に至る経路を通
つた場合0、点(i、j−1)より点(i、j)
に至る経路を通つた場合−とすれば、Pi,jが+の
場合一つ前の格子点ではM=1となる。又、Pi,j
が0又は−の時はM=0である。
今出発点(I、J)より一つ遡つた場合、Pi,j
が0方向であつたとすると、i=i−1、j=j
−1、M=0であるから、c→J-1=a→I-1となり、−
の方向であつたとすると、c→J-1=a→Iであり、+の
方向であつたとすると、i=i−1、M=M+1
であるから、c→J=(a→I+a→I-1)/2となる。
が0方向であつたとすると、i=i−1、j=j
−1、M=0であるから、c→J-1=a→I-1となり、−
の方向であつたとすると、c→J-1=a→Iであり、+の
方向であつたとすると、i=i−1、M=M+1
であるから、c→J=(a→I+a→I-1)/2となる。
更に、Pi,jが+の方向に1点遡つたとすると、
i=i−1、M=M+1であるため、c→J={2
(a→I+a→I-1/2+a→I-2}/3=(a→I+a→
I-2)/3
となり、a→iが3個平均されることを示す。
i=i−1、M=M+1であるため、c→J={2
(a→I+a→I-1/2+a→I-2}/3=(a→I+a→
I-2)/3
となり、a→iが3個平均されることを示す。
変換部5において、上記の如く求められたマツ
チング用パターンC={c→j}j=1〜Jはメモリ6に格
納される、新たなマツチング用パターンCは演算
部7において、標準時系列パターンBとの間で距
離計算に重み付けをするため、重みW={w→j}j=1〜
Jを格納しているメモリ8より、重みを表すベク
トルw→1,w→2,……,w→Jを用いて距離Dが計算
され、最終的なマツチング距離が出力される。
チング用パターンC={c→j}j=1〜Jはメモリ6に格
納される、新たなマツチング用パターンCは演算
部7において、標準時系列パターンBとの間で距
離計算に重み付けをするため、重みW={w→j}j=1〜
Jを格納しているメモリ8より、重みを表すベク
トルw→1,w→2,……,w→Jを用いて距離Dが計算
され、最終的なマツチング距離が出力される。
距離Dは例えば、
但し、Nは音声パターンのベクトルの次元数で
ある。
ある。
重みWの一例としては、先ず或る単語に関する
多数回の発声パターンから、平均パターンを求め
てBとし、それに対して各一回一回の発声パター
ンをAとして、上記本発明の方法によりCを求め
る。これにより重みWjkを求める。
多数回の発声パターンから、平均パターンを求め
てBとし、それに対して各一回一回の発声パター
ンをAとして、上記本発明の方法によりCを求め
る。これにより重みWjkを求める。
但しCl jkはl回目の発声により求められた音声
パターンCの要素で、Lは重みを求めるための発
声した音声回数である。
パターンCの要素で、Lは重みを求めるための発
声した音声回数である。
上記の如き重み付けを行つて距離を計算するこ
とにより、パラメータの確率的な変動に対処し得
る動的計画法を利用したマツチングが実施出来
る。即ち、パラメータの中心的な要素を重くし、
比較的重要でない要素の重みを軽くして、距離計
算をするものである。
とにより、パラメータの確率的な変動に対処し得
る動的計画法を利用したマツチングが実施出来
る。即ち、パラメータの中心的な要素を重くし、
比較的重要でない要素の重みを軽くして、距離計
算をするものである。
(f) 発明の効果
以上説明した如く、本発明は距離計算の重みを
変えることが出来るため、時間軸の非線型な伸縮
に対する正規化に有効な動的計画法によるパター
ンマツチング方法に、パラメータの確率的な変動
に有効な識別関数法の長所を組合わせたパラメー
タマツチング方法を提供し得るので、パターンの
変動に有効に対処し得ると共に、標準パターンの
数を有効に減少せしめることが可能であり、その
効果は大なるものがある。
変えることが出来るため、時間軸の非線型な伸縮
に対する正規化に有効な動的計画法によるパター
ンマツチング方法に、パラメータの確率的な変動
に有効な識別関数法の長所を組合わせたパラメー
タマツチング方法を提供し得るので、パターンの
変動に有効に対処し得ると共に、標準パターンの
数を有効に減少せしめることが可能であり、その
効果は大なるものがある。
第1図は本発明の一実施例を説明するブロツク
図、第2図はマツチング経路の選択を説明する
図、第3図は新たなマツチング用パターンを求め
るた のフローチヤートである。 1,3,6,8はメモリ、2はDPマツチング
部、5は変換部、7は演算部である。
図、第2図はマツチング経路の選択を説明する
図、第3図は新たなマツチング用パターンを求め
るた のフローチヤートである。 1,3,6,8はメモリ、2はDPマツチング
部、5は変換部、7は演算部である。
Claims (1)
- 【特許請求の範囲】 1 入力時系列パターンを動的計画法によつて標
準時系列パターンとマツチングする手段と、 該マツチング手段のマツチングした結果に基づ
き、入力時系列パターンを、該標準時系列パター
ンと同じ時系列の長さに変換する変換手段と、 を設け、 該変換手段が変換した新たな入力時系列パター
ンと前記標準時系列パターンとの間で、パラメー
タの中心的な要素を重くする重み付けを用いた距
離計算を行つて、パターンマツチングを行うこと
を特徴とするパターンマツチング装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57092824A JPS58209794A (ja) | 1982-05-31 | 1982-05-31 | パターンマッチング装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57092824A JPS58209794A (ja) | 1982-05-31 | 1982-05-31 | パターンマッチング装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58209794A JPS58209794A (ja) | 1983-12-06 |
| JPH0361955B2 true JPH0361955B2 (ja) | 1991-09-24 |
Family
ID=14065176
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57092824A Granted JPS58209794A (ja) | 1982-05-31 | 1982-05-31 | パターンマッチング装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58209794A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101051463B (zh) * | 2006-04-06 | 2012-07-11 | 株式会社东芝 | 说话人认证的验证方法及装置 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5525091A (en) * | 1978-08-14 | 1980-02-22 | Nippon Electric Co | Voice characteristic pattern comparator |
-
1982
- 1982-05-31 JP JP57092824A patent/JPS58209794A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58209794A (ja) | 1983-12-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2692581B2 (ja) | 音響カテゴリ平均値計算装置及び適応化装置 | |
| JP2595495B2 (ja) | パタンマッチング装置 | |
| JPH0638199B2 (ja) | 音声認識装置 | |
| JPH0772900A (ja) | 音声合成の感情付与方法 | |
| JP2000503412A (ja) | 波形の合成 | |
| JPH08248994A (ja) | 声質変換音声合成装置 | |
| JPH0361955B2 (ja) | ||
| JP2951514B2 (ja) | 声質制御型音声合成装置 | |
| JP7079455B1 (ja) | 音響モデル学習装置、方法およびプログラム、並びに、音声合成装置、方法およびプログラム | |
| JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
| JP2804265B2 (ja) | 音声認識方式 | |
| JPH05197397A (ja) | 音声認識方法及びその装置 | |
| JPH024919B2 (ja) | ||
| JP3036706B2 (ja) | 音声認識方法 | |
| JP2001282273A (ja) | 音声情報処理装置とその方法と記憶媒体 | |
| JP3035318B2 (ja) | 音声合成装置 | |
| JP2650480B2 (ja) | 音声合成装置 | |
| JPH02248999A (ja) | 音声認識方式 | |
| JPS59195699A (ja) | 単語音声認識装置 | |
| JPH0247758B2 (ja) | ||
| JPH0320759B2 (ja) | ||
| JPS5972578A (ja) | パタ−ン比較装置 | |
| JPH0449718B2 (ja) | ||
| An et al. | A Study on Speech Recognition using DMS Model | |
| JPH03253900A (ja) | 音声認識装置 |