JPH0713592A - 音声モデルの作成方法 - Google Patents

音声モデルの作成方法

Info

Publication number
JPH0713592A
JPH0713592A JP5156485A JP15648593A JPH0713592A JP H0713592 A JPH0713592 A JP H0713592A JP 5156485 A JP5156485 A JP 5156485A JP 15648593 A JP15648593 A JP 15648593A JP H0713592 A JPH0713592 A JP H0713592A
Authority
JP
Japan
Prior art keywords
unit
hmm
boundary
state
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5156485A
Other languages
English (en)
Inventor
Takayuki Imoto
貴之 井本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5156485A priority Critical patent/JPH0713592A/ja
Publication of JPH0713592A publication Critical patent/JPH0713592A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 連続発声音声データにおける音韻、音素、単
語などの単位の境界と、その各音声単位を表す単位HM
M(隠れマルコフモデル)の境界とのずれを小さくした
単位HMMを作成する。 【構成】 学習音声データに対し、どういう順でどれだ
けの長さで音声単位が出現するかをラベル付けし、また
その音声データの各音声単位に対応する単位HMMを初
期学習し、その単位HMMにおいて、これを前記ラベル
の出現順に連結し、その連結HMMが、音声データをど
のような状態遷移の過程で生成したと考えられるかの解
析を行い、音声データの単位境界とこれと対応する単位
HMMの境界との位置ずれを求め、その位置ずれを少く
するように、対応単位HMMの状態数、並びにそれを表
わす初期状態確率、終状態確率、状態遷移確率、出力確
率を操作する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、単語,音韻,あるい
は音素といった、音声を構成する要素とみなせる音声単
位を表す単位HMMを連結することによって、単語や連
続発声などのより大きな音響現象を表すHMMを合成
し、音声認識をしようとする場合に適した単位HMM
(音声モデル)を作成する方法に関するものである。
【0002】
【従来の技術】音声を構成する要素とみなせる単位を統
計的な生成源モデルとして表現するHMMを用いて音声
認識を行なうことが、近年活発に研究開発されている。
音声認識のためには、対象となる音声の性質を良く表し
たモデルを作成する必要がある。認識対象を、前後に無
音部を持つ単語や音韻などの孤立発声に限れば、認識し
ようとする発声内容と同じ内容のデータをもとに、この
データのもつ性質を表した、単語や音韻のモデルを作成
することができる。このためには、例えば論文「Rab
iner,L.R. and Juang,B.H.,
An Introduction to Hidden
Markov Models,IEEETransa
ctions on Acoustics,Speec
h, and Signal Processing,
Vol.3,No.1(1986)」(以下文献
〔1〕)で紹介しているバウム・ベルヒ再推定法を用い
ることができる。
【0003】連続的な発声を認識しようとする試みとし
ては、要素とみなせる音声単位に属するとみなせるデー
タを収集し、このデータに上記技術を適用することによ
り作成した各単位を統計的に表現するHMMを連結して
用いる方法がある。しかし、単に孤立発声を用いて作成
した単位HMMを連結するのみでは、連続発声中に存在
する調音結合などの現象を十分には表現できないため
に、高い認識率は得られない。この対策の1つとして、
例えば論文「丸山 活輝,花沢 利行,川端 豪,鹿野
清宏、HMM音韻連結学習を用いた英単語音声の認
識、電子情報通信学会技術研究報告、SP88−119
(1988)」(以下文献〔2〕)にあるように、各単
位を表すように作成したHMMを、連続的に発声した音
声データに付けたラベルの順に連結し、連結したものを
一つの大きなHMMとみなして、音声データの全体を使
って連結したHMMのパラメタを逐次的に更新してゆく
連結学習などの方法などがある。この方法によれば、連
続発声中にある調音結合などの現象を表現した単位HM
Mを作成することができる。
【0004】
【発明が解決しようとする課題】ところが、文献〔2〕
に代表される従来の連結学習法で作成した単位HMMを
連結してできる一つの大きなHMMが、連続的に発声し
た音声データをどのような過程をもって生成したと考え
られるのかを解析してみると、連結した個々の単位HM
Mの境界と、音声データ中のそれぞれが表しているはず
の音声単位の境界とが必ずしも一致せず、それらの位置
の間にずれが生じてしまうという現象が見られる。これ
は、従来の学習方法によっていては、各単位HMMが、
それぞれの音声単位を必ずしも最適に表し得ていないた
めであると考えることができる。要素とみなせる音声単
位ごとに単位HMMの学習を進め、これらを連結するこ
とによって単語や連続発声などのより大きな現象を表す
HMMを合成し、認識しようとする時に、このずれは認
識率低下の要因の1つとなる。
【0005】この発明の目的は、このような従来手法に
ある問題点を解消し、連続的に発声した音声を表そうと
する際に、各々の単位HMMの境界と、対応する音声単
位の境界との位置のずれを最小とする意味で最適な、単
位HMMを作成する音声モデルの作成方法を提供すると
ころにある。
【0006】
【課題を解決するための手段】この発明では、まずラベ
ル付けした学習音声データを用意し、その各々の音声単
位に対応するデータの区間に文献〔1〕のバウム・ベル
ヒ再推定法などを適用することによって、各々の音声単
位を表す単位HMMを作成する。この段階の各単位HM
Mを総称して「初期HMM」、初期HMM作成の過程を
「初期学習」と呼ぶことにする。この初期HMMを出発
点とし、以下の過程を必要に応じて逐次的に繰り返すこ
とによって、対象となる音声の性質をより良く表したH
MMになるよう、各単位HMMを表すパラメタを更新
し、最終的に対象となる音声を表した最適なHMMを得
る。
【0007】つまりこの発明では、予め設定しておい
た、適切な要素となる単位の出現順に、それぞれに対応
する単位HMMを音声データを示す発声文全体にわたっ
て連結することによって、この文全体を表すHMMを合
成し、発声文のどの部分が、この合成したHMMのどの
状態において生成される確率が最も大きいのかを調べ
る。この結果、音声データに付けられたラベルの境界、
つまり音声単位の境界と、対応する単位HMMの境界と
が一致していれば、それでパラメタ更新の過程を終え
る。もし一致していなければ、個々の単位HMMのパラ
メタを操作し、操作後の単位HMMを使って再度各単位
ごとにパラメタを更新する。これを、境界ずれが予め設
定した値よりも小さくなるか、あるいは予め設定した繰
り返し回数を越えるまで繰り返す。
【0008】
【作用】この発明では、単位HMMを一つに連結するこ
とによって合成したHMMが音声を生成する過程におい
て、音声データに付したラベルの境界と、そのラベルに
対応する単位を表しているはずの単位HMMの境界との
位置のずれが小さくなるように、逐次的にパラメタの更
新を繰り返す。従ってこの発明は、合成したHMMがあ
る音声を生成する過程において、連結した個々の単位H
MMに注目したとしても、それぞれの単位HMMが、や
はりそれぞれが表している単位に対応する音声を生成し
ているように、各単位HMMを構成できる方法になって
いる。
【0009】
【実施例】以下に、この発明の実施例を図面を参照しな
がら説明する。 (1)前提条件 最初に、本実施例全体に関わる前提条件について説明す
る。 要素とみなせる単位:要素とみなせる単位は全部でS種
類あるものとし、その集合をS={s1 ,…,sS }と
表す。要素とみなせる単位とは、例えば単語,音韻,音
素などであって、その集合Sに含まれる要素の連鎖とし
て、より長い音声現象を構文的に表現できるものとす
る。 音声データ:音声データは全部でW回の発声からなるも
のとし、第i番めの発声Oi を、長さTiの時系列のデ
ータとしてOi =〔o1 i 2 i …oTi i 〕と表す。 音声データへのラベル付け:予め音声データには、図1
に示すように、どの要素とみなせる単位s∈Sが、どの
時点t1 から、どの時点t2 まで、どのくらいの長さt
2 −t1 を持ち、どういう順序で出現するのかをラベル
付けしてあるものとする。ここにラベルとは、音声デー
タの始端時刻ts と、終端時刻te、およびts ないし
e の区間の音声データに対応する単位s∈Sの組
(s,ts ,te )のことである。ts ≦te なる任意
の時刻∀tにおけるデータot はts ないしte の区間
に属する、というものとし、またs(o)をデータoが
表す単位を与える関数であるとした時、ts ≦t≦te
なる任意の時刻∀tにおいてs(ot )=sである。 ラベルの系列:第i番めの発声Oi に対して、ラベルの
系列Li =〔l1 i 2 i …lLi i 〕が定義できるもの
とする。ここにラベルの系列とは、第i番めの発声にお
ける任意の∀p<∀qに対する2つのラベルlp i ,l
q i において、前者の終端te は後者の始端ts より前
か同一時刻であるという条件を満たすものである。 (2)記号,用語の定義 次に、以下の説明に現れるいくつかの記号,用語につい
て定義する。 単位si を表す単位HMMλi :単位si を表す単位H
MMをλi と表す。λiの状態数をNi とすると、λi
は図2に示すように、Ni 個の状態の集合{U1 i
…,UNi i }の間の遷移グラフとして、以下のパラメタ
(Πi ,Ti ,Ai ,Bi )によって規定することがで
きる。 初期状態Πi :番号kの状態Uk i が初期状態になる確
率をπk i とし、 終状態の集合Ti : 状態となり得る状態の集合をTi
とおく。 状態遷移確率Ai :番号kの状態Uk i から番号mの状
態Um i へと遷移できる シンボル出力確率分布Bi :番号kの状態Uk i におけ
るシンボル出力の確率分 x)の形、正規分布の混合f(x)=Σm Nμm,σ
m (x)の形、符号帳を使い各符号ごとの出現頻度の列
とした離散的な形など、シンボル出力確率分布b
k i(x)の表現には、いろいろな形のものを考えるこ
とができる。
【0010】任意の単位si について、s(ot )=s
i なるデータを使い、例えば論文〔1〕で紹介している
バウム・ベルヒ再推定法などを適用することによって、
対応するHMM、すなわちλi のパラメタを最適な値に
設定することができる。 HMMの連結:二つのHMMλ1 およびλ2 があると
き、例えば図3に示すように、第1番目のHMMλ1
終状態U4 1が第2番目のHMMλ2 の初期状態U1 2にな
るよう接続したモデルΛのことを、これら2つのHMM
の連結とよび、Λ=λ1 ×λ2 と表すことにする。この
連結の操作はHMMについて閉じている。すなわち、モ
デルΛもまたHMMである。またλ1 の終状態の集合か
らλ2 の初期状態の集合への写像を定義することによっ
て、この連結の操作は、モデルの初期状態あるいは終状
態が複数個ある場合に容易に拡張できる。 合成したモデルΛi :データOi について、図4に示す
ように、そのデータに付してあるラベルの出現順に対応
するHMMを連結して得られたHMM。例えばOi に付
されたラベルが、時系列の順に〔s1 i 2 i
Li i 〕であるときには、Λi =λ1 i ×λ2 i ×…×
λLi i 状態遷移を解析した結果U1 (O,λ):あるHMMλ
が、データOをどのような状態遷移を経て生成するのか
を解析した結果。例えば図5に示すように、データOを
構成する個々の点のデータot が、λのどの状態Ui
おいて生成されたのかを解析した結果としてU(O,
λ)=U(〔o1 …oT 〕,λ)=〔U1 …UN 〕のよ
うに求まる。この解析には、例えば文献〔1〕で紹介し
ているビタービ法などを用いることができる。 ラベルの境界:任意のラベルの始端時刻および終端時刻
のことをラベルの境界とよぶことにする。例えば図1に
おいて垂直な直線を引いた時刻がラベルの境界である。 HMMの境界:合成したHMMΛを構成している個々の
HMMλj1,…,λjLの境界部分、すなわち2つのHM
Mを連結する時に同じであるとみなした第1番目のHM
Mの終状態あるいは第2番目のHMMの初期状態におい
て生成したデータの現れた時刻。例えば図6中のt1
2 がHMMの境界である。 ラベルとHMMの境界のずれ:あるラベルの境界t
1 と、その前後のラベルに対応する両HMM間の境界t
2 とのずれt1 −t2 。もしt1 ≒t2 であるならばラ
ベルの境界とHMMの境界との間のずれはない、といえ
る。そうでないならば、ラベルとHMMとの境界間にず
れがある、といえる。 環境:あるラベルの前後にどのようなラベルがあるのか
を環境とよぶことにする。例えばあるラベルsm につ
き、あるデータのラベル系列のある部分ではskm
n となっており、またあるデータのラベル系列のある部
分ではsk'm'n'となっており、k≠k′∨n≠n′
であるとすると、これらはお互いに異なる環境にある、
とする。前後のラベルを考える他に、前のラベルだけ、
あるいは後ろのラベルだけを考える、というふうに環境
を定義することもできる。
【0011】例えば上の例でk=k′∧n≠n′である
ときに、前のラベルだけを考えるというふうに環境を定
義した場合は、上の2つのラベルは同じ環境にある、と
いうことになる。あるいは前後のラベルだけでなく、さ
らにその前、あるいはさらにその後のラベルまでを考え
て環境を定義することもできる。 (3)環境を考慮しない場合の手順 以下に、この実施例における、環境を考慮しない場合
の、単位HMM作成の手順について以下で説明する。以
下のような各ステップを逐次的に繰り返すことによっ
て、単位HMMのパラメタを更新してゆく。 ステップ0:全ての単位HMMλ1 ,…,λs につい
て、初期学習を行なう。各単位HMMλi について、そ
れが表している単位si と同じラベルを持つデータの区
間を集め、文献〔1〕のバウム・ベルヒ再推定法などを
適用することで初期学習を行なうことができる。 ステップ1:全てのデータOi について、そのデータに
付されたラベルの系列〔l1 i 2 i …〕,但しここで
1 i =(sj(i,1),ts1 i ,te1 i ),l2 i =(s
j(i,2),ts2 i ,te2 i )…〕の順に、それぞれのラベ
ルに対応する単位sj(i,1),sj(i,2),…を表すHMM
(λj 1 i ,(λj 2 i ,…をΛi =(λj 1 i
×(λj 2 i ×…のように連結し、HMMΛi を合成
する。 ステップ2:データOi をHMMΛi がどのような状態
遷移を経て生成するのかを解析する。 ステップ3:一部または全部のラベルについて、ラベル
と単位HMMとの境界のずれを評価する。 ステップ4:ラベル境界とHMM境界との位置のずれが
最も大きい単位HMM,あるいはずれの大きいものから
順に予め定めておいた数の単位HMM、あるいはずれが
一定値以上の単位HMMにつき、このずれを小さくする
ようにパラメタを操作する。この操作の具体的な方法に
ついては後で説明する。 ステップ5:文献〔1〕のバウム・ベルヒ再推定法など
を使って、ステップ0の初期学習と同様に、各単位を表
すデータを集め、各単位ごとに操作後の単位HMMのパ
ラメタを更新するか、あるいはラベルの出現順に連結し
たHMM全体につき単位HMMのパラメタを一括して更
新する。 ステップ6:全てのラベルにつき、ずれの最大のもの
が、予め設定しておいた値よりも大きいか、あるいは繰
り返し回数が予め設定しておいた値を越えていない場合
は再びステップ1から繰り返す。
【0012】以上の処理の流れを図11に示す。 (4)ラベル境界とHMM境界とのずれを小さくするよ
うHMMパラメタを操作する方法 前記ステップ4におけるずれを小さくする操作について
以下に説明する。ラベルの系列の途中における単位が…
(sk ,t0 ,t1 )(sm ,t1 ,t2 )(sn ,t
2 ,t3 )…であったとしよう。また、HMMの境界を
解析した結果、sm を表すHMMλm の始端がta ,終
端がtb にあったとしよう。 「始端位置について」 ta <t1 のとき(HMM境界がラベル境界よりも前に
ある):ot1を生成した状態がUi m (i≠1 ) である
とき、初期状態となり得る状態から状態U1 m を取り除
くことによりλm の状態を減らし、かつその取り除いた
状態U1 m から遷移できる全ての状態U(初期状態から
の遷移は2番目の状態U2 m に限らない)を初期状態と
なり得る状態に付け加えることによって、新たに初期状
態になり得る状態を定めかつ状態U1 m への遷移確率が
0よりも大きい遷移がある場合はこれを0とおく操作を
行なう。 t1 <ta のとき(ラベル境界がHMM境界よりも前に
ある):λm の状態数を1増やし、この状態からの遷移
確率およびその際のシンボル出力確率分布として、一つ
前のHMMλk の終りの状態遷移の値を設定する。初期
状態となり得る状態から状態U1 m を取り除き(状態U
1 m は例えば状態U2 m として残り)、かつ新たに増や
した状態を初期状態となり得る状態に付け加えることに
よって新たに初期状態となり得る状態を定める。 「終端位置について」 tb <t2 のとき(HMM境界がラベル境界よりも前に
ある):λm の状態数を1増やし、この状態への遷移確
率およびその際のシンボル出力確率分布として、一つ後
のHMMλn の始めの状態遷移の値を設定する。終状態
となり得る状態から状態UNm m を取り除き、かつ新たに
増やした状態を終状態となり得る状態に付け加えること
によって新たに終状態となり得る状態を定める。 t2 <tb のとき(ラベル境界がHMM境界よりも前に
ある):ot2を生成した状態がUi m (i≠Nm ) であ
るとき、終状態となる状態から状態UNm m を取り除いて
λm の状態数を1減らし、新たに終状態になり得る状態
を定め、かつ状態UNm m への遷移確率が0よりも大きい
遷移がある場合はこれを0とおく操作を行なう。
【0013】あるHMMλm につき複数のデータがある
場合に、以上の操作に続けて、さらに平均化の操作を行
なう。状態数を増やすという操作をすることになったデ
ータと、状態数を減らすという操作をすることになった
データが両方とも存在する場合は、データの個数とずれ
の大きさの積の大小でどちらの操作をするのか決める。
状態数を増やす操作をする場合、複数のデータそれぞれ
につき、上のようにして新たに設定すべき遷移確率とそ
の際のシンボル出力確率分布の値を求め、その全部の平
均を設定する。 (5)環境を考慮した場合の手順 同一のラベルを付けた音声区間であるとしても、その区
間の音響的な現象が前後の環境から大きな影響を受けて
いるために、環境の違いによって、それぞれの環境ごと
のデータの分布が、統計的に異なる複数の分布に従って
いるかもしれない。この本来統計的に異なる分布で表す
べきところを一つの分布で表そうとしていることが、ラ
ベル境界とHMM境界との間にずれの生じている原因で
ある場合に対処しながら逐次的にずれを小さくする方向
に単位HMMのパラメタを更新しようというのが、この
実施例で述べる環境を考慮した場合の手順である。
【0014】さて、以下にこの実施例における、環境を
考慮した場合の単位HMMのパラメタ作成の手順につい
て説明する。環境を考慮する場合のパラメタ作成の手順
は、全般において、先に説明した、環境を考慮しない場
合のパラメタ作成の手順と同じである。異なるのは、先
の実施例の手順におけるステップ4の、ずれが小さくな
るようにHMMのパラメタを操作する場合の操作の方法
である。
【0015】この操作の方法には、以下のように、さら
に大きく2通りの方法がある。 1.あるラベルにおいて、これを表すHMMを、環境ご
とに複数個用意する方向で操作する方法。 2.あるラベルにおいて、これを表すHMMの、初期状
態あるいは終状態になり得る状態の定義を操作する方
法。 (6)HMMを環境ごとに用意する方向で操作する方法 第1の方法は、具体的に以下のように進める。すなわ
ち、あるラベルについて、環境ごとにHMM境界とラベ
ル境界とのずれの大小を評価し、ずれが最も大きい環
境、あるいはずれが大きいものから予め定めておいた数
の環境につき、HMM境界とラベル境界位置の前後に応
じて、(3)で述べた方法と同一の方法によって、対応
する単位HMMの初期状態あるいは終状態の数を増や
す、あるいは減らす操作を行なう。例えば図7に示すよ
うに単位sm を表わす単位HMMλm のうち,〔…,s
k ,sm ,sn ,…〕であるような環境のものについて
終状態を一つ増やす。この際、(3)節において行なっ
たように、全ての環境におけるずれを平均するという操
作は行なわず、ある特定の環境におけるずれにのみ基づ
いてHMMを操作する。
【0016】こうして操作して作った新しいHMMは、
もはや同じラベルであったとしても、別の環境を表して
いるものではない。従って、こうして作った新しいHM
Mには、それに対応するラベルだけでなく、どのような
環境に対応したものであるのかも同時に記録しておく必
要がある。こうして作ったHMMを連結する時には、ラ
ベルの環境と矛盾しないような環境に対応しているHM
Mを用いる。
【0017】ある環境について初期状態あるいは終状態
を増やす方向で操作することになった場合、あらたに追
加する状態に係る以外のパラメタは他の環境のためのH
MMと共用することができる。例えば図8に示すよう
に、ある単位sm を表わす単位HMMについて、〔sk
−sm −sn 〕なる環境に対応した単位HMMλm'、上
記以外の環境に対応した単位HMMがλm であり、λm'
はλm に終状態として新たに状態U4 m'を付け加えたも
のであり、それ以外の状態を共有している場合は、それ
ぞれλm'のパラメタをΠm',Am',Bm'、λm のパラメ
タをΠm ,Am ,Bm とすると、これらパラメタ間に、 なる関係が成立つ。つまりλm とλm'とはパラメタを共
有している。また、ある環境について初期状態あるいは
終状態を減らす方向で操作することになった場合、削除
する状態以外の状態に係るパラメタは、他の環境のため
のHMMと共有することができる。 (7)HMMの初期あるいは終状態となりうる状態の定
義を操作する方法 第2の方法は、具体的に以下のように進める。すなわ
ち、あるラベルについて、環境ごとにHMM境界とラベ
ル境界とのずれの大小を評価し、ずれが最も大きい環
境、あるいはずれが大きいものから予め定めておいて数
の環境につき、HMM境界とラベル境界位置の前後に応
じて、(3)節で述べた方法と同一の方法によって、対
応するHMMの初期状態あるいは終状態の数を増やす、
あるいは減らす操作を行なうべきであるのかを評価す
る。
【0018】もし評価の結果が初期状態あるいは終状態
の数を増やす方向になった場合には、初期状態あるいは
終状態を追加するが、この際に、今まで初期状態あるい
は終状態として定義してあった状態が、操作の後も引続
き初期あるいは終状態として定義されており、結果とし
て、初期状態あるいは終状態になり得る状態の数が増え
ることになる。例えば図9に示すようにある単位sm
表わす単位HMMλmについて、〔sk −sm −sn
なる環境においては新たに終状態U4 m'を付け加えよう
と判断した場合は、それまでの終状態に加え、新しく付
け加えた状態のいずれもが新しいHMMλm においては
終状態になり得るものとして定義される。つまり終状態
になり得る状態の数が増加する。
【0019】逆に、もし評価の結果が初期状態あるいは
終状態の数を減らす方向になった場合には、その状態が
初期状態であればその状態から遷移する先の状態、その
状態が終状態であればその状態へと遷移する元の状態
を、それぞれ新たに初期状態あるいは終状態として定義
する。この場合も、結果として初期状態あるいは終状態
になり得る状態の数が増えることになる。例えば図10
に示すようにある単位s m を表わす単位HMMλm の終
状態がU3 m であり、〔sk −sm −sn 〕なる環境に
おいては状態数を減らし、U3 m を終状態として定義し
直すと判断した場合は、それまでの終状態に加え、あら
たに終状態として定義し直した状態のいずれもが新しい
HMMλm においては終状態になり得るものとして定義
され、終状態になり得る数が増える。
【0020】
【発明の効果】以上述べたようにこの発明によれば、単
位HMMを連結したHMMがあるデータを生成する時
に、HMM境界と、そのデータに付したラベル境界との
位置のずれが小さくなるように単位HMMが作成され、
実際の連続した音声に適した単位HMMが得られ、認識
率を向上させることができる。
【図面の簡単な説明】
【図1】音声データに付けられたラベルの例を示す波形
図。
【図2】HMMの例を示す図。
【図3】2つのHMMを結合する例を示す図。
【図4】ラベルの系列にしたがってHMMを連結するこ
とによって、データ全体を表すモデルを合成する例を示
す図。
【図5】あるデータをあるHMMがどのような状態遷移
を持って生成するのかを解析した例を示す図。
【図6】連結したHMMを構成する個々のHMM間の境
界の例を示す図。
【図7】ある環境のためのHMMを新たに作成する例を
示す図。
【図8】各環境を表す複数のHMM間で共有できるパラ
メタは共有する例を示す図。
【図9】状態を増やす方向で終状態を定義し直す例を示
す図。
【図10】状態をへらす方向で終状態を定義し直す例を
示す図。
【図11】この発明の実施例を示す流れ図。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 学習音声データに対し、要素とみなせる
    音声単位が、それぞれどういう順序で、かつどれだけの
    長さをもって出現するのかをラベル付けし、 前記学習音声データの各々の音声単位に対応する区間か
    ら、それぞれその音声単位を表す隠れマルコフ・モデル
    (以下「隠れマルコフ・モデル」は「HMM」と、「そ
    れぞれの要素とみなせる音声単位を表すHMM」は「単
    位HMM」と記す)を初期学習し、 その初期学習した単位HMMにおいて、前記音声データ
    に付けられたラベルの出現順に前記単位HMMを連結す
    ることによって合成したHMMが、前記音声データをど
    のような状態遷移の過程をもって生成したと考えられる
    のかを解析し、 前記音声データに付けられた隣接する前記音声単位の境
    界と、それぞれの前記音声単位に対応する前記単位HM
    Mの境界との位置のずれを求め、 前記単位HMMの状態数、並びにそれを表す変数(すな
    わち初期状態確率、終状態の集合、状態遷移確率、ない
    しシンボル出力確率の一部または全部)を、隣接する前
    記音声単位の境界と、それに対応する単位HMMの境界
    との位置のずれが少なくなるように操作することを特徴
    とする、音声モデルの作成方法。
JP5156485A 1993-06-28 1993-06-28 音声モデルの作成方法 Pending JPH0713592A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5156485A JPH0713592A (ja) 1993-06-28 1993-06-28 音声モデルの作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5156485A JPH0713592A (ja) 1993-06-28 1993-06-28 音声モデルの作成方法

Publications (1)

Publication Number Publication Date
JPH0713592A true JPH0713592A (ja) 1995-01-17

Family

ID=15628796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5156485A Pending JPH0713592A (ja) 1993-06-28 1993-06-28 音声モデルの作成方法

Country Status (1)

Country Link
JP (1) JPH0713592A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069A (ja) * 1996-06-13 1998-01-06 Arusoa Oushiyou:Kk 加工食品用バインダーおよびこれを用いる加工食品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069A (ja) * 1996-06-13 1998-01-06 Arusoa Oushiyou:Kk 加工食品用バインダーおよびこれを用いる加工食品

Similar Documents

Publication Publication Date Title
JP3667950B2 (ja) ピッチパターン生成方法
US7289958B2 (en) Automatic language independent triphone training using a phonetic table
JP2004279701A (ja) 音響モデル作成方法および音響モデル作成装置ならびに音声認識装置
CN110390928A (zh) 一种自动拓增语料的语音合成模型训练方法和系统
JPH05265483A (ja) 複数の出力を与える音声認識法
US6546369B1 (en) Text-based speech synthesis method containing synthetic speech comparisons and updates
CN114255736A (zh) 韵律标注方法及系统
Rosdi et al. Isolated malay speech recognition using Hidden Markov Models
KR102608344B1 (ko) 실시간 End-to-End 방식의 음성 인식 및 음성DNA 생성 시스템
JPH0713592A (ja) 音声モデルの作成方法
JP2982689B2 (ja) 情報量基準を用いた標準パターン作成方式
JP2003005785A (ja) 音源の分離方法および分離装置
Qin et al. HMM-based emotional speech synthesis using average emotion model
JP2017194510A (ja) 音響モデル学習装置、音声合成装置、これらの方法及びプログラム
Miguel et al. Augmented state space acoustic decoding for modeling local variability in speech.
Eide Automatic modeling of pronunciation variations
CN105719641B (zh) 用于波形拼接语音合成的选音方法和装置
Pitrelli et al. Expressive speech synthesis using American English ToBI: questions and contrastive emphasis
JPH0229799A (ja) 音素を単位とした音声認識装置
JP3532248B2 (ja) 学習音声パタンモデル使用音声認識装置
JP6618453B2 (ja) 音声合成のためのデータベースの生成装置、生成方法、音声合成装置及びプログラム
JP4580317B2 (ja) 音声合成装置および音声合成プログラム
JPH1097270A (ja) 音声認識装置
JP2912513B2 (ja) ヒドン・マルコフ・モデルの学習方法
JPH08241092A (ja) 音響モデルの話者適応化方法とその装置