JPH07261790A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH07261790A
JPH07261790A JP6053973A JP5397394A JPH07261790A JP H07261790 A JPH07261790 A JP H07261790A JP 6053973 A JP6053973 A JP 6053973A JP 5397394 A JP5397394 A JP 5397394A JP H07261790 A JPH07261790 A JP H07261790A
Authority
JP
Japan
Prior art keywords
vector
feature vector
codebook
probability
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6053973A
Other languages
English (en)
Inventor
Junichi Nakabashi
順一 中橋
Hidekazu Tsuboka
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6053973A priority Critical patent/JPH07261790A/ja
Priority to US08/382,753 priority patent/US5692100A/en
Priority to CNB951032356A priority patent/CN1149533C/zh
Priority to KR1019950001865A priority patent/KR100366603B1/ko
Publication of JPH07261790A publication Critical patent/JPH07261790A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 認識性能を向上すること。 【構成】 コードブック記憶手段406と、コードブッ
クによって特徴ベクトル系列の各ベクトルを各ラベルに
対応した帰属度の組(帰属度ベクトル)に変換し、前記
特徴ベクトル系列を帰属度ベクトル系列に変換するファ
ジィベクトル量子化部405と、ラベルの発生確率(ラ
ベル発生確率)が状態毎に定義されたHMMを記憶する
HMM記憶手段407と、ラベル発生確率と前記帰属度
ベクトルにより前記特徴ベクトル系列の前記HMMから
の発生度合を算出する特徴ベクトル系列発生度合算出手
段501と、各コードベクトルを修正するコードブック
修正部408を備え、コードブック修正部408はコー
ドブックに対する特徴ベクトル系列の経路確率で重み付
けした量子化誤差の歪を最小にするように前記コードベ
クトルを修正する修正ベクトル算出部508を含みコー
ドベクトルを修正。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はパターン認識、特に時系
列標準モデルにヒドゥンマルコフモデル(HMM:Hidd
en Markov Model)を用いた音声認識における、ベクト
ル空間の有限個の代表点(以下、単にコードベクトルと
いう)を修正するための装置および入力特徴ベクトルを
正規化する装置に関する。
【0002】本発明は一般の時系列信号に適用可能なも
のであるが、説明の便宜のために、以下、従来の技術及
び本発明については、音声認識を例に説明する。
【0003】
【従来の技術】一般に、音声認識装置は、未知の音声信
号を定められた特徴ベクトルの系列に変換し、該特徴ベ
クトルと前もって記憶されている識別された参照モデル
とを比較するように構成されている。比較の結果とし
て、前記音声信号は、定められた認識基準に従って最も
よく適合する(尤度が最大となる)参照モデルとして識
別される。現在、最も性能の良いとされる参照モデル
は、統計的推定に基づく状態と状態遷移との集合を利用
したHMMであり、以下、参照モデルを代表してHMM
を用いる。
【0004】HMMに基づく音声認識では、尤度を算出
するために、以下の操作を行う。まず、未知の音声信号
は線形予測コーディング(LPC:Linear PredictiveC
oding)分析等の周知の方法を用いて特徴ベクトルの系列
(特徴ベクトル系列)に変換され、次に、該特徴ベクト
ルは、ベクトル間距離の最も近いコードベクトルを表す
ラベル(コードベクトルに付された番号または記号)に
変換され、前記特徴ベクトルの系列はラベルの系列(ラ
ベル系列)となり、予め作成され記憶されているHMM
が該ラベル系列を発生する確率(尤度)を算出し、尤度
が最大となるHMMを認識結果とする。
【0005】ここで、コードベクトルとは、特徴ベクト
ルの多次元空間において、予めLBGアルゴリズム等の
周知の方法を用いて作成した有限個の代表点を表すベク
トルであり、ラベルによって検索可能な形で記憶されて
いる。
【0006】次に、HMMについて説明する。HMM
は、各観測が有限個Mのラベルの中のどれかであるよう
な観測ラベル系列O=o1,o2,…,oTを評価するの
に用いられる。図1はこのようなHMMを説明するため
の図である。
【0007】図1では、状態数N=3、ラベルの有限個
数M=4を例としてある。状態1,2,3間の遷移は状
態遷移確率行列A=[aij]として表され、状態遷移確
率aijは状態iにいる場合には次に状態jに遷移を生ず
る確率である。HMMからラベルの発生する確率はラベ
ル発生確率行列B=[bij(k)]で表わされ、ラベル発
生確率bij(k)は状態iから状態jに遷移した場合にラ
ベルkを発生する確率である。HMMは、各語彙に対し
て1つずつ作成しておき、各HMMがラベル系列を発生
する確率(尤度)に基づいて該ラベル系列を分類するた
めに用いられる。
【0008】未知の音声信号の特徴ベクトル系列Y=y
1,y2, …,yt,…,yTに対して得られるラベル系
列をO=o1,o2,…,oT、HMMλが発生できる長
さTの任意の状態系列をS=s1,s2,…,sTとする
とき、HMMλがラベル系列Oを発生する確率(尤度)
は、(数1)のように示される。
【0009】
【数1】
【0010】以上は、特徴ベクトルytを唯一のラベル
tに変換する場合の説明であるが、M個のラベルのう
ち特徴ベクトルytに対して近傍のK個(ベクトル間距
離の近いものからK個に制限)のラベルの組ot1
t2,…,otKと、特徴ベクトルy tの該ラベルの組で
検索される各々のコードベクトルに対する特徴ベクトル
tの帰属度の組ut1,ut2,…,utKを用いて、ラベ
ルベクトルot=(ot1,ot2,…,otK)と帰属度ベ
クトルut=(ut1,ut2,…,utK)に変換するファ
ジィベクトル量子化と呼ばれる方法がある。該ファジィ
ベクトル量子化は、特徴ベクトル系列Yをラベルベクト
ル系列O=o1,o2,…,oTと帰属度ベクトル系列U
=u1,u2,…,uTに変換し、HMMλが前記特徴ベ
クトル系列を発生する確率(尤度)は、ラベル発生確率
imの変わりに特徴ベクトルの発生度合ω i(t)を用い
て、(数2)のように示される。
【0011】
【数2】
【0012】ここで、Kの取り得る値は1からMの整数
であり、計算量の削減の為に小さな値Kに制限される
(K=3が適当)。1の場合は前記唯一のラベルを発生
する場合に対応する。
【0013】上記のようにして得られる各HMMの尤度
(特徴ベクトル系列Yを各語彙のHMMが発生する確
率)を比較し、該尤度が最大のものを選択することによ
り認識は行われる。
【0014】例えば、語彙数Wの場合、未知の特徴ベク
トル系列Yに対するw番目の語彙のHMMλwの尤度を
L(Y|λw)とする場合、その認識結果wは(数3)
である。
【0015】
【数3】
【0016】従って、得られた尤度の相対的比較により
認識結果が求められる。図2は、コードブックの一構成
例を示すものであり、各行の1カラム目にラベルをそれ
以降にコードベクトルの値を格納する形、すなわち、ラ
ベルによってコードベクトルが検索可能な形で構成され
ている。
【0017】以上のような構成の音声認識装置のブロッ
ク図は図3に示す形となる。301は特徴抽出部であ
り、LPC分析等の周知の方法を用いて、未知の音声信
号を一定時間間隔毎に特徴ベクトルに変換し、特徴ベク
トルの系列Y=y1,y2, …,yt,…,yTを得る。
ここでTは、未知の音声信号に対する特徴ベクトル系列
Yの長さである。
【0018】302はコードブック記憶部であり、コー
ドベクトルをそれに付されたラベルによって検索可能な
形で記憶している。
【0019】303はファジィベクトル量子化部であ
り、前記特徴抽出部301で抽出された前記特徴ベクト
ルytと前記コードブック記憶部302に記憶されてい
るコードベクトルとのベクトル間距離の最も近い順にK
個のラベルと、特徴ベクトルy tの該ラベルの組で検索
される各々のコードベクトルに対する特徴ベクトルyt
の帰属度に置き換え、ラベルベクトルot=(ot1,o
t2,…,otK)と帰属度ベクトルut=(ut1,ut2
…,utK)に変換し、前記特徴ベクトルytの系列Yを
ラベルベクトル系列O=o1,o2,…,oTと帰属度ベ
クトル系列U=u1,u 2,…,uTに変換するものであ
る。
【0020】304はHMM記憶部であり、既に作成さ
れているHMMλw(w=1〜W)を認識すべき各語彙毎に
前記状態遷移確率行列Aと前記ラベル発生確率行列Bを
語彙数Wだけ記憶しておく。従って、w番目のHMM
は、λw={Aw,Bw}w=1〜Wと表される。
【0021】305は特徴ベクトル系列発生度合算出部
であり前記ファジィベクトル量子化部303で求められ
た前記ラベルベクトル系列Oと前記帰属度ベクトル系列
Uと前記HMM記憶部304に記憶されているw番目の
語彙のラベル発生確率行列B wを用いて、HMMλwに対
する特徴ベクトル系列の発生度合行列Ωw={ωw it}を
(数4)に従い算出するものである。
【0022】
【数4】
【0023】ここで、ラベル発生確率bitkは、時刻
tの特徴ベクトルytをファジィベクトル量子化したと
きのk番目のラベルotkがHMMの状態iから発生する
ラベル発生確率である。
【0024】306は尤度算出部であり、前記特徴ベク
トル系列発生度合算出部305で算出されたHMMλw
に対する前記特徴ベクトル系列発生度合行列Ωwと前記
HMM記憶部304に記憶されているHMMλwの状態
遷移確率行列Awを用い、尤度L(Y|λw)を算出する
ものである。
【0025】307は尤度記憶部であり、前記尤度算出
部306で算出された特徴ベクトル系列Yに対する各単
語HMMλwの尤度L(Y|λw)を比較のために記憶す
る。
【0026】308は比較判定部であり、前記尤度記憶
部307に記憶されている各HMMの尤度のうち最大値
を与えるHMMに対応する語彙を認識結果として判定す
るものである。
【0027】前記305から307は各語彙のHMMλ
wにつき一度ずつ行い、w=1〜Wまで繰り返され、その結
果を前記比較判定部308で評価する。
【0028】以上が、従来のコードブック、HMMを用
いた音声認識装置の構成である。以上のようなHMMを
用いた音声認識を行うためには、HMMの学習と呼ばれ
る、大量のHMM作成用音声データ(以後、HMMの学
習データと呼ぶ)を用いたHMMの作成手続きが必要で
ある。
【0029】HMMの学習データが、ある特定の一人の
話者で認識時も同一の話者が入力する場合を特定話者音
声認識と呼び、不特定多数の話者を用いてHMMの学習
を行い、認識時の話者は未知である場合を不特定話者音
声認識と呼ぶ。
【0030】
【発明が解決しようとする課題】特定話者音声認識の場
合は、性能はよいが一人の話者から膨大なHMMの学習
データを集める必要があり、実現性に乏しい。
【0031】不特定話者音声認識の場合は、HMMの学
習データの収集は容易であり、データが多ければ多いほ
ど、HMMの統計的信頼性が上がる。しかし、特定話者
の性能を超えることはなく、該HMMでは、認識性能の
極端に悪い特異な話者がいる。
【0032】また、HMMを音節や音韻のように単語よ
り小さい単位で記憶しておく場合には、学習用語彙と認
識用語彙の間に、文脈(音節、音韻等の並ぶ順序)の差
異の影響により性能の劣下が起こる。
【0033】また、認識時の周囲の環境が、学習用デー
タを収録した場合と違うときなども、その差異により性
能の劣化が起こる。
【0034】以上のように従来の音声認識では、学習時
と認識時の話者の差異及び文脈の差異により性能の劣下
が起きるという課題があった。
【0035】
【課題を解決するための手段】
(1)本課題を解決するために本発明は、修正用音声の
発声内容がシステム側に既知(どの様な単語を発声した
かが分かっている)場合に、特徴ベクトル空間の有限個
の代表点(コードベクトル)をそれに付されたラベルに
よって検索可能な形で記憶するコードブック記憶手段
と、該コードブックによって特徴ベクトル系列の各ベク
トルを各ラベルに対応した帰属度の組(帰属度ベクト
ル)に変換し、前記特徴ベクトル系列を帰属度ベクトル
系列に変換するファジィベクトル量子化手段と、前記ラ
ベルの発生確率(ラベル発生確率)と状態間の遷移確率
が状態毎に定義されたHMMを記憶するHMM記憶手段
と、前記ラベル発生確率と前記帰属度ベクトルにより前
記特徴ベクトル系列の前記HMMからの発生度合を算出
する特徴ベクトル系列発生度合算出手段と、前記特徴ベ
クトル系列発声度合と前記HMMの遷移確率からある時
刻にある状態に存在する確率(経路確率)を算出する経
路確率算出手段と、前記各コードベクトルを修正するコ
ードブック修正手段を備え、該コードブック修正手段は
前記コードブックに対する前記特徴ベクトル系列の前記
経路確率で重み付けした量子化誤差の歪を最小にするよ
うに前記コードベクトルを修正する修正ベクトル算出手
段を含み、前記コードベクトルを修正するように構成さ
れている。 (2)本課題を解決するために本発明は、修正用音声の
発声内容がシステム側に既知(どの様な単語を発声した
かが分かっている)場合に、 特徴ベクトル空間の有限
個の代表点(コードベクトル)をそれに付されたラベル
によって検索可能な形で記憶するコードブック記憶手段
と、該コードブックによって特徴ベクトル系列の各ベク
トルを各ラベルに対応した帰属度の組(帰属度ベクト
ル)に変換し、前記特徴ベクトル系列を帰属度ベクトル
系列に変換するファジィベクトル量子化手段と、前記ラ
ベルの発生確率(ラベル発生確率)と状態間の遷移確率
が状態毎に定義されたHMMを記憶するHMM記憶手段
と、前記ラベル発生確率と前記帰属度ベクトルにより前
記特徴ベクトル系列の前記HMMからの発生度合を算出
する特徴ベクトル系列発生度合算出手段と、前記特徴ベ
クトル系列発声度合と前記HMMの遷移確率からある時
刻にある状態に存在する確率(経路確率)を算出する経
路確率算出手段と、前記特徴ベクトルを修正する特徴ベ
クトル修正手段を備え、該特徴ベクトル修正手段は前記
コードブックに対する前記特徴ベクトル系列の前記経路
確率で重み付けした量子化誤差の歪を最小にするように
前記特徴ベクトルを修正する修正ベクトル算出手段を含
み、前記特徴ベクトルを修正するように構成されてい
る。
【0036】
【作用】
(1)本発明の効果は、修正用音声の発声内容がシステ
ム側に既知(どの様な単語を発声したかが分かってい
る)場合に、該音声に対応する経路確率を荷重係数とし
てコードブックに対する量子化誤差歪が最小になるよう
にコードベクトルの修正ベクトルを算出し、コードベク
トルを修正することにより、上記修正用音声に適したコ
ードベクトルを作成し、認識性能の向上を図ることであ
る。。 (2)本発明の効果は、修正用音声の発声内容がシステ
ム側に既知(どの様な単語を発声したかが分かってい
る)場合に、該音声に対応する経路確率を荷重係数とし
てコードブックに対する量子化誤差歪が最小になるよう
に特徴ベクトルの修正ベクトルを算出し、認識時に前記
修正ベクトルを用いて未知の入力音声の特徴ベクトル系
列を正規化することにより、認識性能の向上を図ること
である。
【0037】
【実施例】本発明は、HMMの学習時と認識時との間の
条件の差異の修正に対して適用可能であるが、以下、H
MMの学習用データを発声した話者と認識装置を使用す
る話者が違う場合に、その話者間の差異の修正を例に、
本発明を説明する。
【0038】また、特徴ベクトル系列発生度合算出式の
積和またはべき乗積の計算の制限範囲は1からコードブ
ックサイズに等しい値Mまでの整数値を取り得るが、計
算量の削減のために小さな値を用いる場合が多く、本実
施例では、該制限範囲をKという文字で表す。
【0039】図4は、本発明であるコードブック修正装
置の概要を表すブロック図である。401は修正用音声
記憶部であり、コードブックをその人用に修正したい話
者(以後、修正話者と呼ぶ)すなわち音声認識システム
を使用する話者が発声した内容既知(コードブック修正
装置に発声の内容が事前に分かっている)の音声S
r(以後、修正用音声と呼ぶ)を発声数R(r=1〜
R)記憶しており、以降のコードブックの修正に用いら
れる。該修正用音声は、発声内容が既知であればいかな
る単語、文章でも良い。
【0040】402は特徴抽出部であり、前記図3に示
した認識装置で用いる特徴抽出手法と同様の手法を用
い、修正用音声Srを一定時間間隔毎に特徴ベクトルの
系列Yr=y1 r,y2 r, …,yt r,…,yT rに変換す
る。ここでTrは、修正用音声Srを特徴ベクトル系列に
変換したときのデータのフレーム数である。
【0041】403は修正用特徴ベクトル記憶部であ
り、前記401に記憶されている修正用音声信号Sr
前記特徴抽出部402で特徴抽出した特徴ベクトル系列
rをr=1〜Rについて記憶している。
【0042】404はデータ制御部であり、現在R発声
のうち第r番目の発声を扱っているか、そのr番目の発
声内容は何かを用いて、以下の処理を制御する。ここ
で、word(r)とは、第r番目の発声内容(該発声内容の
HMMの番号w)を示す。
【0043】405はファジィベクトル量子化部であ
り、前記データ制御部404より送られた発声番号rを
用いて前記修正用特徴ベクトル記憶部403より特徴ベ
クトル系列Yrを読みだし、各時刻tの特徴ベクトルyt
rに対して、後述するコードブック記憶部406に記憶
されているC1〜CMのコードベクトルとのベクトル間距
離dr(t,m)の最も近い順に1位からK位のラベルと、特
徴ベクトルytの該ラベルの組で検索される各々のコー
ドベクトルに対する特徴ベクトルytの帰属度に置き換
え、距離ベクトルdt r=(dt1,dt2,…,dtK)とラ
ベルベクトルot r=(ot1,ot2,…,otK)と帰属度
ベクトルut r=(ut1,ut2,…,utK)に変換し、前
記特徴ベクトルyt rの系列Yrを距離ベクトル系列Dr
1 r,d2 r,…,dT rとラベルベクトル系列Or
1 r,o2 r,…,oT rと帰属度ベクトル系列Ur
1 r,u2 r,…,uT rに変換するものである。
【0044】406はコードブック記憶部であり、コー
ドベクトルCmをそれに付されたラベルmによって検索
可能な形で記憶しており、前記ファジィベクトル量子化
部405で、ベクトル量子化時に用いられる。
【0045】407はHMM記憶部であり、既に作成さ
れているHMMを認識すべき各語彙毎に前記図1に示し
たように状態遷移確率行列Aとラベル発生確率行列Bを
語彙数Wだけ記憶しておく。従って、w番目のHMMλ
wは、λw ={Aw,Bw}と表される。
【0046】408はコードブック修正部であり、前記
コードブック記憶部406におけるコードベクトルCm
の値を修正用音声と、前記HMM記憶部407に記憶さ
れている修正用音声の発声内容に対応するHMMから算
出される、ある時刻にHMMのある状態に存在する確率
(経路確率)を用い、前記コードブックに対する、前記
特徴ベクトル系列の前記経路確率で重み付けした量子化
誤差の歪が最小になるように、コードベクトル値を修正
し、修正した新しいコードベクトルC' mを前記コードブ
ック記憶部406に転送するものである。
【0047】409は修正収束判定部であり、修正用音
声を用いてコードベクトルを修正したときの収束状況を
判定するものであり、予め定められた収束条件を満足す
れば修正動作を終了し、満足しなければ満足するまで、
コードベクトルの修正を繰り返す。
【0048】本発明の特徴は前記コードブック修正部4
08の構成にあり、発声内容が既知であることを条件
に、該発声内容に対応するHMMから算出される経路確
率を用い、前記コードブックに対する、前記特徴ベクト
ル系列の前記経路確率で重み付けした量子化誤差の歪が
最小になるようにコードベクトルの修正を行うことであ
る。コードブック修正部の具体的な構成を示したブロッ
ク図を図5に示す。
【0049】各々の端子1〜9は前記図4と接続されて
おり、端子1、7は前記コードブック記憶部406と接
続されており、端子1はコードブックCを受信し、端子
7は修正後のコードブックC'を送信する。端子5、6
は前記HMM記憶部407と接続されており、端子5が
r番目の音声に対応するHMMの状態遷移確率行列A
word(r)を、端子6が同じくラベル発生確率行列B
word(r)を受信する。端子2、3、4は前記ファジィベ
クトル量子化部405と接続されており、r番目の音声
に対する距離ベクトル系列Drとラベルベクトル系列Or
と帰属度ベクトル系列U rを受信する。端子8は前記修
正収束判定部409と接続されており、収束の判定に用
いられる平均目的関数値Jを送信する。当然の事である
が、平均化をせずに、各目的値関数の加算値でもよい。
端子9は前記データ制御部404と接続しており、現在
の修正用音声データが第r番目であるかの情報を受信
し、r=Rとなったら、修正ベクトル△Cと平均目的関
数値Jを算出する。
【0050】上記のような情報のやり取りを行いなが
ら、前記コードブック修正部408すなわち図5は実行
される。
【0051】501は特徴ベクトル系列発生度合算出部
であり、端子2、3、4、6より受信した距離ベクトル
系列、ラベルベクトル系列、帰属度ベクトル系列、前記
ラベル発声確率行列をもとに帰属度とラベル発生確率か
ら特徴ベクトル発生度合ωi(t)を全ての時刻t、HMM
の全ての状態iについて算出し、特徴ベクトル発生度合
行列Ωを求める。
【0052】502は経路確率算出部であり、ある時刻
tにHMMのある状態iに存在する経路確率γi(t)を全
ての時刻t、HMMの全ての状態iについて算出し、経
路確率行列Γを求める。
【0053】503は修正ベクトル分母分子算出部であ
り、修正ベクトル算出式の分母および分子を算出する。
【0054】504は修正ベクトル分母分子記憶部であ
り、前記修正ベクトル分母分子算出部503で算出され
た修正ベクトル算出式の分母および分子の値を後述する
修正ベクトル算出部で用いるために記憶する。
【0055】505は目的関数値算出部であり、前記経
路確率γi(t)と前記帰属度ベクトルut rと前記距離ベク
トルdt rを用い、(数5)に従って、収束判定に用いら
れる目的関数値Jrを算出する。
【0056】
【数5】
【0057】506は目的関数値記憶部であり、前記目
的関数値算出部505から送られた目的関数値Jrの全
修正用単語分R個を記憶する。当然の事であるが、R個
すべて記憶せずに、累積することでもよい。
【0058】以上の動作を修正用音声R個に対して行っ
た(前記端子8からの信号がRになった)後、後述する
動作を行う。
【0059】507は修正ベクトル算出部であり、修正
ベクトル算出式に基づき、前記修正ベクトル分母分子記
憶部504に記憶されている修正ベクトルの分母および
分子より修正ベクトルの集合△Cを求める。
【0060】508は修正後コードベクトル算出部であ
り、前記端子1より受信した修正前のコードブックCの
コードベクトル値と前記修正ベクトル算出部507で求
めた修正ベクトルの集合△Cを用いて、修正後のコード
ブックC’のコードベクトル値を算出し、前記端子7よ
り前記コードベクトル記憶部406に送信する。
【0061】509は平均目的関数値算出部であり、前
記修正収束判定部409に前記端子8を通じて送信する
ために全目的関数値を平均して、平均目的関数値Jave
を算出する。
【0062】以上が、本発明におけるコードブック修正
部の構成であるが、この構成には大きく2つの場合が考
えられる。一方は、コードブックのコードベクトルを修
正するときに、修正前と後のコードベクトル間の修正ベ
クトルを各クラスタ毎に個別に求める方法、他方はその
修正ベクトルを全クラスタ共通に求める方法である。
【0063】まず、前者の修正ベクトルを各クラスタ毎
に個別に求める場合を、図6から図9のコードブックの
修正動作の実行を表すフローチャートを用いて説明す
る。
【0064】601で修正話者の発声内容既知の音声S
rが前記修正用音声記憶部401に記憶されているか確
認する。記憶されていれば次に進み、されていなければ
602に示すように修正用音声を発声し記憶する。60
3はその修正用音声Srを前記特徴抽出部402で周知
の特徴ベクトル抽出手段を用いて特徴ベクトルYrに変
換することに対応しており、r=1〜Rについて実行
し、604に示すようにそれらを前記修正用特徴ベクト
ル記憶部403に記憶する。
【0065】以下の動作は、修正が収束したと判断され
るまで繰り返し行われる。まず、605で修正ベクトル
の分母用および分子用のバッファをゼロクリアし、以降
の準備をする。606または607で修正用音声データ
の特徴ベクトル系列Yrを読み込み、608では、前記
ファジィベクトル量子化部405と前記コードベクトル
記憶部406においてファジィベクトル量子化を周知の
方法により実行し、前記帰属度ベクトル系列Urと前記
ラベルベクトル系列Orを算出する。
【0066】609すなわち図7では、前記特徴ベクト
ル系列発生度合算出部501における特徴ベクトル発生
度合ωi(t)の算出をt=1〜Tr,i=1〜Iについて
707で前記算出式(数4)に従い行う。
【0067】610では前記経路確率算出部502の経
路確率γi(t)を周知のフォワード・バックワードアルゴ
リズムを用いて算出する。周知の事ではあるが、最適経
路のみを考慮するビタビアルゴリズムでもよい。
【0068】611すなわち図8では、前記修正ベクト
ル分母分子算出部503の動作を、803でr番目の特
徴ベクトル系列Yrのフレーム長Trが終了するまで、ま
た806でそのr番目の発声内容に対応するHMMの状
態数Iが終了するまで全てのコードベクトルCm(m=
1〜M)に対して(809の条件を満足)、810で分
母については(数6)、分子については(数7)でそれ
ぞれ修正ベクトル算出式の分母および分子を算出する。
ただし、前記(数6)および(数7)はラベルmごとの
修正ベクトル算出式(数8)の分母および分子の式であ
る。
【0069】
【数6】
【0070】
【数7】
【0071】
【数8】
【0072】ここで、△Cm r _denomおよび△Cm r _numer
はr番目の単語、m番目のクラスタに対する修正ベクト
ル△Cmの算出式の各々分母および分子を表す。
【0073】全てのTr、Iが終了して(806、80
3の条件を満足)、この部分の計算を終了する。
【0074】612で最後の特徴ベクトル系列YRを選
択したかという条件が満たされるまで、すなわち全ての
特徴ベクトル系列Yr(r=1〜R)に対して608か
ら611の動作を繰り返し、全ての修正用音声に対する
コードベクトル毎の修正ベクトル算出式の分母および分
子を算出し終わると、613から615すなわち図9に
おいて修正ベクトルの集合△C={△C1,△C2,…,
△CM)の算出と修正後のコードブックC'={C1 ',C
2 ',…,CM ')の算出が行われる。
【0075】903に示すように全てのコードベクトル
に対して、前記修正ベクトル算出式の分母および分子を
用いて(数9)に従い613すなわち904で各クラス
タに対する前記修正ベクトル△Cmを求める。
【0076】
【数9】
【0077】前記修正ベクトルの集合△Cが求まれば、
後はそれを修正前の前記コードブックCのコードベクト
ルに加え(614すなわち905)、修正後のコードブ
ックC'を新しくコードブックCとして置き換える(6
15すなわち906)。
【0078】616で修正が予め定められた収束条件に
対して収束したかどうかを判定し、収束すると判断され
れば終了し、その時点でのコードブックを修正話者に対
するコードブックとする。また、収束していないと判断
された場合は605に戻り、収束するまで繰り返す。
【0079】次に、後者の場合すなわち修正ベクトルを
全クラスタ共通に求める場合を、図6、図7と図10、
図11のコードブックの修正動作の実行を表すフローチ
ャートを用いて説明する。
【0080】601で修正話者の発声内容既知の音声S
rが前記修正用音声記憶部401に記憶されているか確
認する。記憶されていれば次に進み、されていなければ
602に示すように修正用音声を発声し記憶する。60
3はその修正用音声Srを前記特徴抽出部402で周知
の特徴ベクトル抽出手段を用いて特徴ベクトルYrに変
換することに対応しており、r=1〜Rについて実行
し、604に示すようにそれらを前記修正用特徴ベクト
ル記憶部403に記憶する。
【0081】以下の動作は、修正が収束したと判断され
るまで繰り返し行われる。まず、605で修正ベクトル
の分母用および分子用のバッファをゼロクリアし、以降
の準備をする。606または607で修正用音声データ
の特徴ベクトル系列Yrを読み込み、608では、前記
ファジィベクトル量子化部405と前記コードベクトル
記憶部406においてファジィベクトル量子化を周知の
方法により実行し、前記距離ベクトル系列Drと前記帰
属度ベクトル系列Urと前記ラベルベクトル系列Orを算
出する。
【0082】609すなわち図7では、前記特徴ベクト
ル系列発生度合算出部501における特徴ベクトル発生
度合ωi(t)の算出をt=1〜Tr,i=1〜Iについて
707で前記算出式(数4)に従い行う。
【0083】610では前記経路確率算出部502の経
路確率γi(t)を周知のフォワード・バックワードアルゴ
リズムを用いて算出する。周知の事ではあるが、最適経
路のみを考慮するビタビアルゴリズムでもよい。
【0084】611すなわち図10では、前記修正ベク
トル分母分子算出部503の動作を、1003でr番目
の特徴ベクトルYrのフレーム長Trが終了するまで、ま
た1006でそのr番目の発声内容に対応するHMMの
状態数Iが終了するまで全てのコードベクトルCm(m
=1〜M)に対して(1009の条件を満足)、101
0で分母については(数10)、分子については(数1
1)で修正ベクトル算出式の分母および分子を算出す
る。ただし、前記(数10)および(数11)は全ラベ
ル共通の修正ベクトル算出式(数12)の分母および分
子の式である。
【0085】
【数10】
【0086】
【数11】
【0087】
【数12】
【0088】ここで、△Cr _denomおよび△Cr _numer
r番目の単語の全クラスタ共通の修正ベクトル△Cの算
出式の各々分母および分子を表す。
【0089】全てのTr、Iが終了して(1006、1
003の条件を満足)、この部分の計算を終了する。
【0090】612で最後の特徴ベクトル系列YRを選
択したかという条件が満たされるまで、すなわち全ての
特徴ベクトルYr(r=1〜R)に対して608から6
11の動作を繰り返し、全ての修正用音声に対する全コ
ードベクトル共通の修正ベクトル算出式の分母および分
子を算出し終わると、613から615すなわち図11
において共通修正ベクトル△Cの算出と修正後のコード
ブックC'={C1 ',C2 ',…,CM ')の算出が行われ
る。
【0091】前記修正ベクトル算出式の分母および分子
を用いて(数13)に従い613すなわち1101で全
クラスタ共通の前記修正ベクトル△Cを求める。
【0092】
【数13】
【0093】前記修正ベクトル△Cが求まれば、後はそ
れを修正前の前記コードブックCに加え(614すなわ
ち1105)、修正後のコードブックC'を新しくコー
ドブックCとして置き換える(615すなわち110
6)。
【0094】616で修正が予め定められた収束条件に
対して収束したかどうかを判定し、収束すると判断され
れば終了し、その時点でのコードブックを修正話者に対
するコードブックとする。また、収束していないと判断
された場合は605に戻り、収束するまで繰り返す。
【0095】上記実施例は、一度修正ベクトルと呼ばれ
る修正前後のコードブックの写像ベクトルを求めた後、
修正後のコードブックを求めているが、当然のことであ
るが、同様に前記コードブックに対する、前記修正用音
声の前記特徴ベクトル系列の前記経路確率で重み付けし
た量子化誤差の歪を最小にするように、直接修正後のコ
ードブックのコードベクトルを求めることも可能であ
る。
【0096】上記実施例で得られた修正後のコードブッ
クを前記従来例図3のような音声認識装置のコードブッ
ク記憶装置302の値と置き換えることのみで、音声認
識が実行できる。
【0097】上記のことも本発明の特徴であり、コード
ブックの変更を経路確率の重み付けを行った上で量子化
歪最小で実行しており、経路確率の小さい場合、即ちH
MMとの対応が悪い場合は、その部分を適応に使わない
ように抑制する。
【0098】上記実施例の場合は、修正ベクトル△Cを
コードベクトルCに加えるて更新することによりコード
ベクトルの修正を行ったが、修正ベクトル△Cをもとに
して得られた一定のベクトル△H(以後、正規化ベクト
ルと呼ぶ。)を入力話者の音声の特徴ベクトルytから
(数14)のように減じることにより、入力音声におけ
る話者による差異を除き、話者正規化できる。
【0099】
【数14】
【0100】この場合、コードベクトル値はそのまま
で、正規化ベクトルを記憶しておき、認識時に特徴ベク
トル系列の各フレームの特徴ベクトルからその正規化ベ
クトルを減じれば良い。図12は、そのような話者正規
化のための正規化ベクトル△H)を作成する装置に関す
るブロック図である。
【0101】1201は修正用音声記憶部であり、正規
化ベクトルを求めたい話者(以後、修正話者)すなわち
音声認識システムをし要する話者が発声した発声内容既
知(特徴ベクトル正規化装置に発生の内容が事前に分か
っている)の音声Sr(以後、修正用音声と呼ぶ)を発
生数R(r=1〜R)記憶しており、以降の修正に用い
られる。
【0102】1202は特徴抽出部であり、前記図3に
示した認識装置で用いる特徴抽出手法と同様の手法を用
い、修正用音声Srを一定時間間隔毎に特徴ベクトルの
系列Yr=y1 r,y2 r, …,yt r,…,yT rに変換す
る。ここでTrは、修正用音声Srを特徴ベクトル系列に
変換したときのデータのフレーム数である。
【0103】1203は修正用特徴ベクトル記憶部であ
り、前記1201に記憶されている修正用音声信号Sr
を前記特徴抽出部1202で特徴抽出した特徴ベクトル
系列Yrをr=1〜Rについて記憶している。
【0104】1204はデータ制御部であり、現在R発
声のうち第r番目の発声を扱っているのか、そのr番目
の発声内容は何かを用いて、以下の処理を制御する。こ
こで、word(r)とは、第r番目の発声内容(該発声内容
のHMMの番号w)を示す。
【0105】1205は正規化ベクトル記憶部であり、
前記特徴ベクトルを修正するための正規化ベクトルを記
憶するものである。
【0106】1206は特徴ベクトル正規化部であり、
前記正規化ベクトル記憶部1205に記憶されている正
規化ベクトル△Hを用いて、特徴ベクトルの各時刻tの
値y tを修正することにより修正後の特徴ベクトルを得
るものである。
【0107】1207はファジィベクトル量子化部であ
り、前記データ制御部1204より送られた発声番号r
を用いて前記修正用特徴ベクトル記憶部1203より特
徴ベクトル系列Yrを読みだし、各時刻tの特徴ベクト
ルyt rを、前記正規化ベクトル記憶部1205に記憶さ
れている正規化ベクトルを用いて前記特徴ベクトル正規
化部で特徴ベクトルの修正を行い、得られた修正後の特
徴ベクトルに対して、後述するコードブック記憶部12
08に記憶されているC1〜CMのコードベクトルとのベ
クトル間距離dr(t,m)の最も近い順に1位からK位のラ
ベルと、特徴ベクトルytの該ラベルの組で検索される
各々のコードベクトルに対する特徴ベクトルytの帰属
度に置き換え、距離ベクトルdt r=(dt1,dt2,…,
tK)とラベルベクトルot r=(ot1,ot2,…,
tK)と帰属度ベクトルut r=(ut1,ut2,…,
tK)に変換し、前記修正後の特徴ベクトルyt r’の系
列Yr’を距離ベクトル系列Dr=d1 r,d2 r,…,dT r
とラベルベクトル系列Or=o1 r,o2 r,…,oT rと帰
属度ベクトル系列Ur=u1 r,u2 r,…,uT rに変換す
るものである。ここで、Kは1からコードブックサイズ
Mを取り得るものであり、後述する特徴ベクトル発声度
合の算出の演算回数を制限するものである。
【0108】1208はコードブック記憶部であり、コ
ードベクトルCmをそれに付されたラベルmによって検
索可能な形で記憶しており、前記ファジィベクトル量子
化部1207で、ベクトル量子化時に用いられる。
【0109】1209はHMM記憶部であり、既に作成
されているHMMを認識すべき各語彙毎に前記図1に示
したように状態遷移確率行列Aとラベル発生確率行列B
を語彙数Wだけ記憶しておく。従って、w番目のHMM
は、λw ={Aw,Bw}と表される。
【0110】1210は正規化ベクトル調整部であり、
前記正規化ベクトル記憶部1205における正規化ベク
トル△Hの値を修正用音声と前記HMM記憶部1209
に記憶されている修正用音声の発声内容に対応するHM
Mを用いて、前記コードブックに対する、前記特徴ベク
トル系列の前記経路確率で重み付けした量子化誤差の歪
を最小になるように、正規化ベクトルを調整し、調整し
た新しい正規化ベクトル△H'を前記正規化ベクトル記
憶部1205に転送するものである。
【0111】1211は修正収束判定部であり、修正用
音声を用いて正規化ベクトルを修正したときの収束状況
を判定するものであり、予め定められた収束条件を満足
すれば修正動作を終了し、満足しなければ満足するま
で、逐次、正規化ベクトルを更新しながら同じ修正用音
声を用いて修正を繰り返す。
【0112】本発明の特徴は前記正規化ベクトル調整部
1210の構成にあり、発声内容が既知であることを条
件に、特徴ベクトルを正規化ベクトルにより修正した修
正後の特徴ベクトルに対する、前記コードブックに対す
る、前記特徴ベクトル系列の前記経路確率で重み付けし
た量子化誤差の歪を最小になるように正規化ベクトルを
調整することである。
【0113】正規化ベクトル調整部の具体的な構成を示
したブロック図を図13に示す。各々の端子1〜10は
前記図12と接続されており、端子1は前記コードベク
トル記憶部1208と接続され、コードブックCを受信
する。。端子5、6は前記HMM記憶部1209と接続
されており、端子5がr番目の音声に対応するHMMの
状態遷移確率行列Aword(r)を、端子6が同じくラベル
発生確率行列Bwor d(r)を受信する。端子2、3、4は
前記ファジィベクトル量子化部1207と接続されてお
り、r番目の音声に対する距離ベクトル系列Drとラベ
ルベクトル系列Orと帰属度ベクトル系列Urを受信す
る。端子7、10は前記正規化ベクトル記憶部1205
と接続されており、端子7は正規化ベクトル△Hを受信
し、端子10は修正後の正規化ベクトル△H’を送信す
る。端子8は前記修正収束判定部1211と接続されて
おり、収束の判定に用いられる平均目的関数値Jave
送信する。端子9は前記データ制御部1204と接続し
ており、現在の修正用音声データが第r番目であるかの
情報を受け取り、r=Rとなったら、正規化ベクトル△
Hと平均目的関数値Javeを算出する。
【0114】上記のような情報のやり取りを行いなが
ら、前記コードブック修正部1210すなわち前記図1
3は実行される。
【0115】1301は特徴ベクトル系列発生度合算出
部であり、端子2、3、4、6より受信した距離ベクト
ル系列、ラベルベクトル系列、帰属度ベクトル系列、前
記ラベル発生確率行列をもとに帰属度とラベル発生確率
から前記(数4)に示す特徴ベクトル発生度合ωi(t)を
全ての時刻t、HMMの全ての状態iについて算出し、
特徴ベクトル発生度合行列Ωを求める。
【0116】1302は経路確率算出部であり、ある時
刻tにHMMのある状態iに存在する経路確率γi(t)を
全ての時刻t、HMMの全ての状態iについて算出し、
経路確率行列Γを求める。
【0117】1303は修正ベクトル分母分子算出部で
あり、修正ベクトル算出式の分母および分子を算出す
る。
【0118】1304は修正ベクトル分母分子記憶部で
あり、前記修正ベクトル分母分子算出部1303で算出
された修正ベクトル算出式の分母および分子の値を後述
する修正ベクトル算出部で用いるために記憶する。
【0119】1305は目的関数値算出部であり、前記
経路確率γi(t)と前記帰属度ベクトルut rと前記距離ベ
クトルdt rを用い、前記(数5)に従って、収束判定に
用いられる目的関数値Jrを算出する。
【0120】1306は目的関数値記憶部であり、前記
目的関数値算出部1305から送られた目的関数値Jr
の全修正用単語分R個を記憶する。当然の事であるが、
R個すべて記憶せずに、累積することでもよい。
【0121】以上の動作を修正用音声R個に対して行っ
た(前記端子8からの信号がRになった)後、後述する
動作を行う。
【0122】1307は修正ベクトル算出部であり、修
正ベクトル算出式に基づき、前記修正ベクトル分母分子
記憶部1304に記憶されている修正ベクトルの分母分
子より修正ベクトル値△Cを求め、端子10より前記修
正ベクトル記憶部1205に送り出す。
【0123】1308は正規化ベクトル算出部であり、
前記修正ベクトル算出部で求められた修正ベクトル△C
と端子7で受信した修正前の正規化ベクトル△Hによ
り、新しい正規化ベクトル△H’を得ることができる。
【0124】1309は平均目的関数値算出部であり、
前記修正収束判定部1211に前記端子7を通じて送り
出すために前記目的関数値記憶部1306に記憶されて
いる全目的関数値を平均して、平均目的関数値Jave
算出する。
【0125】上記の特徴ベクトル正規化装置における修
正ベクトルの算出式は、前記(数10)(数11)(数
12)(数13)に対応する。
【0126】以上が、本発明のコードブック修正装置と
特徴ベクトル正規化装置の実施例であるが、以上の場
合、修正用音声はあらかじめ発声されたものとしていた
が、発声内容既知という観点から考えると、認識結果の
信頼性が高い場合は、該認識結果をその発声内容と考え
ることができ、音声認識システムを使用する話者が、事
前に修正用音声を発声する必要がない。
【0127】この場合、認識結果の信頼性は、その尤度
そのものが大きいときや第1候補と第2候補の尤度差が
大きいときは認識結果の信頼度が高く、そうでない場合
は認識結果の信頼性が低いと考えられるから、それぞれ
に適当に閾値を設けておき、その閾値を超えたときはコ
ードブックの修正を行い、そうでない場合は修正を行わ
ないというようにすれば発声内容が未知の場合でも認識
結果を発声内容とすることにより、コードブックの修正
が行える。
【0128】この場合ような音声認識装置のブロック図
を図14を用いて説明する。1401は特徴抽出部であ
り、LPC分析等の周知の方法を用いて、未知の音声信
号を一定時間間隔毎に特徴ベクトルに変換し、特徴ベク
トルの系列Y=y1,y2, …,yt,…,yTを得る。
ここでTは、未知の音声信号に対する特徴ベクトル系列
Yの長さである。
【0129】1402はコードブック記憶部であり、コ
ードベクトルをそれに付されたラベルによって検索可能
な形で記憶している。
【0130】1403はファジィベクトル量子化部であ
り、前記特徴抽出部1401で抽出された前記特徴ベク
トルytと前記コードブック記憶部1402に記憶され
ているコードベクトルとのベクトル間距離dr(t,m)の最
も近い順にK個のラベルと、特徴ベクトルytの該ラベ
ルの組で検索される各々のコードベクトルに対する特徴
ベクトルytの帰属度に置き換え、距離ベクトルdt
(dt1,dt2,…,dtK)とラベルベクトルot=(o
t1,ot2,…,otK)と帰属度ベクトルut=(u t1
t2,…,utK)に変換し、前記特徴ベクトルytの系
列Yを距離ベクトル系列D=d1,d2,…,dTとラベ
ルベクトル系列O=o1,o2,…,oTと帰属度ベクト
ル系列U=u1,u2,…,uTに変換するものである。
【0131】1404はHMM記憶部であり、既に作成
されているHMMλw(w=1〜W)を認識すべき各語彙毎
に前記状態遷移確率行列Aと前記ラベル発生確率行列B
を語彙数Wだけ記憶しておく。従って、w番目のHMM
は、λw={Aw,Bw}w=1〜W と表される。
【0132】1405は特徴ベクトル系列発生度合算出
部であり前記ファジィベクトル量子化部1403で求め
られた前記ラベルベクトル系列Oと前記帰属度ベクトル
系列Uと前記HMM記憶部1404に記憶されているw
番目の語彙のラベル発生確率行列Bwを用いて、HMM
λwに対する特徴ベクトル系列の発生度合行列Ωw={ω w
it}を前記(数4)に従い算出するものである。
【0133】ここで、ラベル発生確率bitkは、時刻
tの特徴ベクトルytをファジィベクトル量子化したと
きのk番目のラベルotkがHMMの状態iから発生する
ラベル発生確率である。
【0134】1406は尤度算出部であり、前記特徴ベ
クトル系列発生度合算出部1405で算出されたHMM
λwに対する前記特徴ベクトル系列発生度合行列Ωwと前
記HMM記憶部1404に記憶されているHMMλw
状態遷移確率行列Awを用い、尤度L(Y|λw)を算出
するものである。
【0135】1407は尤度記憶部であり、前記尤度算
出部1406で算出された特徴ベクトル系列Yに対する
各単語HMMλwの尤度L(Y|λw)を比較のために記
憶する。
【0136】1408は比較判定部であり、前記尤度記
憶部1407に記憶されている各HMMの尤度のうち最
大値を与えるHMMに対応する語彙を認識候補として判
定するものである。
【0137】前記1405から1407は各語彙のHM
Mλwにつき一度ずつ行い、w=1〜Wまで繰り返され、そ
の結果を前記比較判定部1408で評価する。
【0138】1409は認識候補信頼性算出部であり、
前記比較判定部1408で選ばれた認識候補の信頼性を
前記尤度記憶部1407に記憶されている該認識候補の
尤度等を用いて算出するものである。
【0139】1410はコードブック修正実行判定部で
あり、前記認識候補信頼度算出部1409より得られた
前記認識候補の信頼性が、予め定められた閾値以上であ
ればコードブック修正信号を後述するコードブック修正
部に送り、コードブックの修正を実行させる。
【0140】1411はコードブック修正部であり、前
記コードブック修正実行判定部からの前記コードブック
修正信号を受けて、前記コードブック記憶部1402に
記憶されている前記コードブックと前記ファジィベクト
ル量子化部1403で得られた前記距離ベクトル系列D
と前記ラベルベクトル系列Oと前記帰属度ベクトル系列
Uと前記経路確率を用いて、コードブックの修正を行
い、修正後のコードブックをコードブック記憶部に送る
ものである。
【0141】同様に、閾値を超えたときは正規化ベクト
ルの調整を行い、そうでない場合は調整を行わないとい
うようにすれば発声内容が未知の場合でも認識結果を発
声内容とすることにより、正規化ベクトルの修正が行え
る。
【0142】この場合ような音声認識装置のブロック図
を図15を用いて説明する。1501は特徴抽出部であ
り、LPC分析等の周知の方法を用いて、未知の音声信
号を一定時間間隔毎に特徴ベクトルに変換し、特徴ベク
トルの系列Y=y1,y2, …,yt,…,yTを得る。
ここでTは、未知の音声信号に対する特徴ベクトル系列
Yの長さである。
【0143】1502は正規化ベクトル記憶部であり、
前記特徴ベクトルを正規化するための正規化ベクトルを
記憶するものである。
【0144】1503は特徴ベクトル正規化部であり、
前記特徴ベクトルを前記正規化ベクトルのより正規化す
るものである。
【0145】1504はコードブック記憶部であり、コ
ードベクトルをそれに付されたラベルによって検索可能
な形で記憶している。
【0146】1505はファジィベクトル量子化部であ
り、前記特徴ベクトル正規化部で正規化された正規化後
の特徴ベクトルy'tと前記コードブック記憶部1504
に記憶されているコードベクトルとのベクトル間距離d
r(t,m)の最も近い順にK個のラベルと、正規化後の特徴
ベクトルy'tの該ラベルの組で検索される各々のコード
ベクトルに対する正規化後の特徴ベクトルy'tの帰属度
に置き換え、距離ベクトルdt=(dt1,dt2,…,d
tK)とラベルベクトルot=(ot1,ot2,…,otK
と帰属度ベクトルut=(ut1,ut2,…,utK)に変
換し、前記正規化後の特徴ベクトルy'tの系列Y'を距
離ベクトル系列D=d1,d2,…,dTとラベルベクト
ル系列O=o1,o2,…,oTと帰属度ベクトル系列U
=u1,u2,…,uTに変換するものである。
【0147】1506はHMM記憶部であり、既に作成
されているHMMλw(w=1〜W)を認識すべき各語彙毎
に前記状態遷移確率行列Aと前記ラベル発生確率行列B
を語彙数Wだけ記憶しておく。従って、w番目のHMM
は、λw={Aw,Bw}w=1〜W と表される。
【0148】1507は特徴ベクトル系列発生度合算出
部であり前記ファジィベクトル量子化部1505で求め
られた前記ラベルベクトル系列Oと前記帰属度ベクトル
系列Uと前記HMM記憶部1506に記憶されているw
番目の語彙のラベル発生確率行列Bwを用いて、HMM
λwに対する正規化後の特徴ベクトル系列の発生度合行
列Ωw={ωw it}を前記(数4)に従い算出するものであ
る。
【0149】ここで、ラベル発生確率bitkは、時刻
tの特徴ベクトルy'tをファジィベクトル量子化したと
きのk番目のラベルotkがHMMの状態iから発生する
ラベル発生確率である。
【0150】1508は尤度算出部であり、前記特徴ベ
クトル系列発生度合算出部1507で算出されたHMM
λwに対する前記特徴ベクトル系列発生度合行列Ωwと前
記HMM記憶部1506に記憶されているHMMλw
状態遷移確率行列Awを用い、尤度L(Y'|λw)を算
出するものである。
【0151】1509は尤度記憶部であり、前記尤度算
出部1508で算出された特徴ベクトル系列Yに対する
各単語HMMλwの尤度L(Y'|λw)を比較のために
記憶する。
【0152】1510は比較判定部であり、前記尤度記
憶部1509に記憶されている各HMMの尤度のうち最
大値を与えるHMMに対応する語彙を認識候補として判
定するものである。
【0153】前記1507から1509は各語彙のHM
Mλwにつき一度ずつ行い、w=1〜Wまで繰り返され、そ
の結果を前記比較判定部1510で評価する。
【0154】1511は認識候補信頼性算出部であり、
前記比較判定部1510で選ばれた認識候補の信頼性を
前記尤度記憶部1509に記憶されている該認識候補の
尤度等を用いて算出するものである。
【0155】1512は正規化ベクトル調整実行判定部
であり、前記認識候補信頼度算出部1511より得られ
た前記認識候補の信頼性が、予め定められた閾値以上で
あれば正規化ベクトル調整信号を後述する正規化ベクト
ル調整部に送り、正規化ベクトルの調整を実行させる。
【0156】1513は正規化ベクトル調整部であり、
前記正規化ベクトル調整実行判定部からの前記正規化ベ
クトル調整信号を受けて、前記正規化ベクトル記憶部1
502に記憶されている前記正規化ベクトルと前記ファ
ジィベクトル量子化部1505で得られた前記距離ベク
トル系列Dと前記ラベルベクトル系列Oと前記帰属度ベ
クトル系列Uと前記認識候補に対応するHMMとの前記
経路確率を用いて、正規化ベクトルの調整を行い、修正
後の正規化ベクトルを正規化ベクトル記憶部に送るもの
である。
【0157】
【発明の効果】
(1)本発明によれば、発声内容が既知の音声を用い、
該音声に対するHMMを用いて算出された経路確率で重
み付けした、前記コードブックに対する量子化誤差の歪
を最小にするように求めた修正ベクトルを用いてコード
ブックを修正することにより、HMM作成時と認識時に
おける環境の差異を修正し、環境の変化に強い音声認識
装置を構成することが可能となる。 (2)本発明によれば、発声内容が既知の音声を用い、
該音声に対するHMMを用いて算出された経路確率で重
み付けした、前記コードブックに対する量子化誤差の歪
を最小にするように求めた正規化ベクトルを用いて特徴
ベクトルを修正することにより、HMM作成時と認識時
における環境の差異を修正し、環境の変化に強い音声認
識装置を構成することが可能となる。
【図面の簡単な説明】
【図1】Hidden Markov Model(HMM)を説明するため
のHMMの構成図
【図2】コードブックの構成を説明する図
【図3】音声認識装置の従来例を説明するブロック図
【図4】本発明のコードブック修正装置の概要の一実施
例を説明するブロック図
【図5】本発明のコードブック修正装置の主要部である
コードブック修正部の一実施例を説明するブロック図
【図6】本発明の動作を説明するフローチャート図
【図7】図6における発生度合の算出式が前記(数4)
で表される場合の動作を説明するフローチャート図
【図8】図6における修正ベクトルが各クラスタ毎に求
められる場合の修正ベクトル分母分子の算出の動作を説
明するフローチャート図
【図9】図6における修正ベクトルが各クラスタ毎に求
められる場合の動作を説明するフローチャート図
【図10】図6における修正ベクトルが全クラスタ共通
に求められる場合の修正ベクトル分母分子の算出の動作
を説明するフローチャート図
【図11】図6における修正ベクトルが全クラスタ共通
に求められる場合の動作を説明するフローチャート図
【図12】本発明の特徴ベクトル正規化装置の概要の一
実施例を説明するブロック図
【図13】本発明の特徴ベクトル正規化装置の主要部で
ある修正ベクトル修正部の一実施例を説明するブロック
【図14】コードブック正規化手段を組み込んだ音声認
識装置の一実施例を説明するブロック図
【図15】正規化ベクトル調整手段を組み込んだ音声認
識装置の一実施例を説明するブロック図
【符号の説明】
401 修正用音声記憶部 402 特徴抽出部 403 修正用特徴ベクトル記憶部 404 データ制御部 405 ファジィベクトル量子化部 406 コードブック記憶部 407 HMM記憶部 408 コードブック修正部 409 修正収束判定部 501 特徴ベクトル系列発生度合算出部 502 経路確率算出部 503 修正ベクトル分母分子算出部 504 修正ベクトル分母分子記憶部 505 目的関数値算出部 506 目的関数値記憶部 507 修正ベクトル算出部 508 修正コードベクトル算出部 509 平均目的関数値算出部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】特徴ベクトル空間の有限個の代表点(コー
    ドベクトル)をそれに付されたラベルによって検索可能
    な形で記憶するコードブック記憶手段と、該コードブッ
    クによって特徴ベクトル系列の各ベクトルを各ラベルに
    対応した帰属度の組(帰属度ベクトル)に変換し、前記
    特徴ベクトル系列を帰属度ベクトル系列に変換するファ
    ジィベクトル量子化手段と、前記ラベルの発生確率(ラ
    ベル発生確率)と状態間の遷移確率が状態毎に定義され
    たHMMを記憶するHMM記憶手段と、前記ラベル発生
    確率と前記帰属度ベクトルにより前記特徴ベクトル系列
    の前記HMMからの発生度合を算出する特徴ベクトル系
    列発生度合算出手段と、前記特徴ベクトル系列発声度合
    と前記HMMの遷移確率からある時刻にある状態に存在
    する確率(経路確率)を算出する経路確率算出手段と、
    前記各コードベクトルを修正するコードブック修正手段
    を備え、該コードブック修正手段は前記コードブックに
    対する前記特徴ベクトル系列の前記経路確率で重み付け
    した量子化誤差の歪を最小にするように前記コードベク
    トルを修正する修正ベクトル算出手段を含み、前記コー
    ドベクトルを修正するように構成されていることを特徴
    とするコードブック修正装置。
  2. 【請求項2】修正ベクトル算出手段は、修正ベクトルの
    値をコードブックのコードベクトル毎に個別に算出する
    ことを特徴とする請求項1記載のコードブック修正装
    置。
  3. 【請求項3】修正ベクトル算出手段は、修正ベクトルの
    値をコードブックの全コードベクトルに共通に算出する
    ことを特徴とする請求項1記載のコードブック修正装
    置。
  4. 【請求項4】特徴ベクトル空間の有限個の代表点(コー
    ドベクトル)をそれに付されたラベルによって検索可能
    な形で記憶するコードブック記憶手段と、該コードブッ
    クによって特徴ベクトル系列の各ベクトルを各ラベルに
    対応した帰属度の組(帰属度ベクトル)に変換し、前記
    特徴ベクトル系列を帰属度ベクトル系列に変換するファ
    ジィベクトル量子化手段と、前記ラベルの発生確率(ラ
    ベル発生確率)と状態間の遷移確率が状態毎に定義され
    たHMMを記憶するHMM記憶手段と、前記ラベル発生
    確率と前記帰属度ベクトルにより前記特徴ベクトル系列
    の前記HMMからの発生度合を算出する特徴ベクトル系
    列発生度合算出手段と、前記特徴ベクトル系列発声度合
    と前記HMMの遷移確率からある時刻にある状態に存在
    する確率(経路確率)を算出する経路確率算出手段と、
    前記特徴ベクトルを修正する特徴ベクトル修正手段と、
    前記特徴ベクトルを修正するための正規化ベクトルを算
    出する正規化ベクトル調整手段を備え、該正規化ベクト
    ル調整手段は前記コードブックに対する前記特徴ベクト
    ル系列の前記経路確率で重み付けした量子化誤差の歪を
    最小にするように前記特徴ベクトルを修正する修正ベク
    トル算出手段を含み、前記特徴ベクトルを修正するよう
    に構成されていることを特徴とする特徴ベクトル正規化
    装置。
  5. 【請求項5】請求項1記載のコードブック修正装置は特
    徴ベクトル系列発生度合算出手段の算出の範囲を制限す
    ることを特徴とするコードブック修正装置。
  6. 【請求項6】請求項4記載の特徴ベクトル正規化装置は
    特徴ベクトル系列発生度合算出手段の算出の範囲を制限
    することを特徴とする特徴ベクトル正規化装置。
  7. 【請求項7】特徴ベクトル空間の有限個の代表点(コー
    ドベクトル)をそれに付されたラベルによって検索可能
    な形で記憶するコードブック記憶手段と、該コードブッ
    クによって特徴ベクトル系列の各ベクトルを各ラベルに
    対応した帰属度の組(帰属度ベクトル)に変換し、前記
    特徴ベクトル系列を帰属度ベクトル系列に変換するファ
    ジィベクトル量子化手段と、前記ラベルの発生確率(ラ
    ベル発生確率)と状態間の遷移確率が状態毎に定義され
    たHMMを記憶するHMM記憶手段と、前記ラベル発生
    確率と前記帰属度ベクトルにより前記特徴ベクトル系列
    の前記HMMからの発生度合を算出する特徴ベクトル系
    列発生度合算出手段と、前記特徴ベクトル系列発声度合
    と前記HMMの遷移確率からある時刻にある状態に存在
    する確率(経路確率)を算出する経路確率算出手段と、
    前記特徴ベクトル系列に対する前記各語彙のHMMの尤
    度を算出する尤度算出手段と、認識結果を判定する比較
    判定手段と、前記比較判定手段から得られた認識候補の
    信頼性を算出する認識候補信頼性算出手段と、前記認識
    候補の信頼性が一定閾値を超えていればコードブックの
    修正を実行する命令を出すコードブック修正実行判定手
    段と、前記各コードベクトルを修正するコードブック修
    正手段を備え、該コードブック修正手段は前記コードブ
    ックに対する前記特徴ベクトル系列の前記認識候補に対
    応するHMMの前記経路確率で重み付けした量子化誤差
    の歪を最小にするように前記コードベクトルを修正する
    修正ベクトル算出手段を含み、発声内容が予め未知の場
    合に認識候補を発声内容とすることにより前記コードベ
    クトルを修正するように構成されていることを特徴とす
    る音声認識装置。
  8. 【請求項8】特徴ベクトル空間の有限個の代表点(コー
    ドベクトル)をそれに付されたラベルによって検索可能
    な形で記憶するコードブック記憶手段と、該コードブッ
    クによって特徴ベクトル系列の各ベクトルを各ラベルに
    対応した帰属度の組(帰属度ベクトル)に変換し、前記
    特徴ベクトル系列を帰属度ベクトル系列に変換するファ
    ジィベクトル量子化手段と、前記ラベルの発生確率(ラ
    ベル発生確率)と状態間の遷移確率が状態毎に定義され
    たHMMを記憶するHMM記憶手段と、前記ラベル発生
    確率と前記帰属度ベクトルにより前記特徴ベクトル系列
    の前記HMMからの発生度合を算出する特徴ベクトル系
    列発生度合算出手段と、前記特徴ベクトル系列発声度合
    と前記HMMの遷移確率からある時刻にある状態に存在
    する確率(経路確率)を算出する経路確率算出手段と、
    前記特徴ベクトル系列に対する前記各語彙のHMMの尤
    度を算出する尤度算出手段と、認識結果を判定する比較
    判定手段と、前記比較判定手段から得られた認識候補の
    信頼性を算出する認識候補信頼性算出手段と、前記認識
    候補の信頼性が一定閾値を超えていればコードブックの
    修正を実行する命令を出すコードブック修正実行判定手
    段と、前記特徴ベクトルを修正する特徴ベクトル修正手
    段と、前記特徴ベクトルを修正するための正規化ベクト
    ルを算出する正規化ベクトル調整手段を備え、該正規化
    ベクトル調整手段は前記コードブックに対する前記特徴
    ベクトル系列の前記認識候補に対応するHMMの前記経
    路確率で重み付けした量子化誤差の歪を最小にするよう
    に前記特徴ベクトルを修正する修正ベクトル算出手段を
    含み、発声内容が予め未知の場合に認識候補を発声内容
    とすることにより前記特徴ベクトルを修正するように構
    成されていることを特徴とする音声認識装置。
JP6053973A 1899-12-30 1994-03-24 音声認識装置 Pending JPH07261790A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP6053973A JPH07261790A (ja) 1994-03-24 1994-03-24 音声認識装置
US08/382,753 US5692100A (en) 1994-02-02 1995-02-01 Vector quantizer
CNB951032356A CN1149533C (zh) 1899-12-30 1995-02-01 矢量量化器
KR1019950001865A KR100366603B1 (ko) 1994-02-02 1995-02-02 벡터양자화기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6053973A JPH07261790A (ja) 1994-03-24 1994-03-24 音声認識装置

Publications (1)

Publication Number Publication Date
JPH07261790A true JPH07261790A (ja) 1995-10-13

Family

ID=12957600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6053973A Pending JPH07261790A (ja) 1899-12-30 1994-03-24 音声認識装置

Country Status (1)

Country Link
JP (1) JPH07261790A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107221328A (zh) * 2017-05-25 2017-09-29 百度在线网络技术(北京)有限公司 修改源的定位方法及装置、计算机设备及可读介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107221328A (zh) * 2017-05-25 2017-09-29 百度在线网络技术(北京)有限公司 修改源的定位方法及装置、计算机设备及可读介质

Similar Documents

Publication Publication Date Title
US6260013B1 (en) Speech recognition system employing discriminatively trained models
US5793891A (en) Adaptive training method for pattern recognition
US6490555B1 (en) Discriminatively trained mixture models in continuous speech recognition
JP3053711B2 (ja) 音声認識装置およびそのトレーニング方法ならびに装置
WO1998040876A9 (en) Speech recognition system employing discriminatively trained models
JP2006038895A (ja) 音声処理装置および音声処理方法、プログラム、並びに記録媒体
JPH05257492A (ja) 音声認識方式
KR100366603B1 (ko) 벡터양자화기
JPH0962291A (ja) 記述長最小基準を用いたパターン適応化方式
JP2751856B2 (ja) 木構造を用いたパターン適応化方式
JPH1039893A (ja) ヒドン・マルコフ・モデルの学習方法
JPH1185186A (ja) 不特定話者音響モデル生成装置及び音声認識装置
JP3589044B2 (ja) 話者適応化装置
JPH07261790A (ja) 音声認識装置
JPH0895592A (ja) パターン認識方法
JPH07160288A (ja) 音声認識装置
KR100586045B1 (ko) 고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법
JP2005091504A (ja) 音声認識装置
JPH09160586A (ja) ヒドン・マルコフ・モデルの学習方法
JP3144203B2 (ja) ベクトル量子化装置
JPH0822296A (ja) パターン認識方法
JP3420908B2 (ja) ヒドン・マルコフ・モデルの学習方法
JPH10207485A (ja) 音声認識装置及び話者適応方法
JP3105708B2 (ja) 音声認識装置
JPH09179580A (ja) ヒドン・マルコフ・モデルの学習方法