JPH0713592A

JPH0713592A - 音声モデルの作成方法

Info

Publication number: JPH0713592A
Application number: JP5156485A
Authority: JP
Inventors: Takayuki Imoto; 貴之井本
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 1993-06-28
Filing date: 1993-06-28
Publication date: 1995-01-17

Abstract

(57)【要約】【目的】連続発声音声データにおける音韻、音素、単
語などの単位の境界と、その各音声単位を表す単位ＨＭ
Ｍ（隠れマルコフモデル）の境界とのずれを小さくした
単位ＨＭＭを作成する。【構成】学習音声データに対し、どういう順でどれだ
けの長さで音声単位が出現するかをラベル付けし、また
その音声データの各音声単位に対応する単位ＨＭＭを初
期学習し、その単位ＨＭＭにおいて、これを前記ラベル
の出現順に連結し、その連結ＨＭＭが、音声データをど
のような状態遷移の過程で生成したと考えられるかの解
析を行い、音声データの単位境界とこれと対応する単位
ＨＭＭの境界との位置ずれを求め、その位置ずれを少く
するように、対応単位ＨＭＭの状態数、並びにそれを表
わす初期状態確率、終状態確率、状態遷移確率、出力確
率を操作する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、単語，音韻，あるい
は音素といった、音声を構成する要素とみなせる音声単
位を表す単位ＨＭＭを連結することによって、単語や連
続発声などのより大きな音響現象を表すＨＭＭを合成
し、音声認識をしようとする場合に適した単位ＨＭＭ
（音声モデル）を作成する方法に関するものである。

【０００２】

【従来の技術】音声を構成する要素とみなせる単位を統
計的な生成源モデルとして表現するＨＭＭを用いて音声
認識を行なうことが、近年活発に研究開発されている。
音声認識のためには、対象となる音声の性質を良く表し
たモデルを作成する必要がある。認識対象を、前後に無
音部を持つ単語や音韻などの孤立発声に限れば、認識し
ようとする発声内容と同じ内容のデータをもとに、この
データのもつ性質を表した、単語や音韻のモデルを作成
することができる。このためには、例えば論文「Ｒａｂ
ｉｎｅｒ，Ｌ．Ｒ．ａｎｄＪｕａｎｇ，Ｂ．Ｈ．，
ＡｎＩｎｔｒｏｄｕｃｔｉｏｎｔｏＨｉｄｄｅｎ
ＭａｒｋｏｖＭｏｄｅｌｓ，ＩＥＥＥＴｒａｎｓａ
ｃｔｉｏｎｓｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃ
ｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，
Ｖｏｌ．３，Ｎｏ．１（１９８６）」（以下文献
〔１〕）で紹介しているバウム・ベルヒ再推定法を用い
ることができる。

【０００３】連続的な発声を認識しようとする試みとし
ては、要素とみなせる音声単位に属するとみなせるデー
タを収集し、このデータに上記技術を適用することによ
り作成した各単位を統計的に表現するＨＭＭを連結して
用いる方法がある。しかし、単に孤立発声を用いて作成
した単位ＨＭＭを連結するのみでは、連続発声中に存在
する調音結合などの現象を十分には表現できないため
に、高い認識率は得られない。この対策の１つとして、
例えば論文「丸山活輝，花沢利行，川端豪，鹿野
清宏、ＨＭＭ音韻連結学習を用いた英単語音声の認
識、電子情報通信学会技術研究報告、ＳＰ８８−１１９
（１９８８）」（以下文献〔２〕）にあるように、各単
位を表すように作成したＨＭＭを、連続的に発声した音
声データに付けたラベルの順に連結し、連結したものを
一つの大きなＨＭＭとみなして、音声データの全体を使
って連結したＨＭＭのパラメタを逐次的に更新してゆく
連結学習などの方法などがある。この方法によれば、連
続発声中にある調音結合などの現象を表現した単位ＨＭ
Ｍを作成することができる。

【０００４】

【発明が解決しようとする課題】ところが、文献〔２〕
に代表される従来の連結学習法で作成した単位ＨＭＭを
連結してできる一つの大きなＨＭＭが、連続的に発声し
た音声データをどのような過程をもって生成したと考え
られるのかを解析してみると、連結した個々の単位ＨＭ
Ｍの境界と、音声データ中のそれぞれが表しているはず
の音声単位の境界とが必ずしも一致せず、それらの位置
の間にずれが生じてしまうという現象が見られる。これ
は、従来の学習方法によっていては、各単位ＨＭＭが、
それぞれの音声単位を必ずしも最適に表し得ていないた
めであると考えることができる。要素とみなせる音声単
位ごとに単位ＨＭＭの学習を進め、これらを連結するこ
とによって単語や連続発声などのより大きな現象を表す
ＨＭＭを合成し、認識しようとする時に、このずれは認
識率低下の要因の１つとなる。

【０００５】この発明の目的は、このような従来手法に
ある問題点を解消し、連続的に発声した音声を表そうと
する際に、各々の単位ＨＭＭの境界と、対応する音声単
位の境界との位置のずれを最小とする意味で最適な、単
位ＨＭＭを作成する音声モデルの作成方法を提供すると
ころにある。

【０００６】

【課題を解決するための手段】この発明では、まずラベ
ル付けした学習音声データを用意し、その各々の音声単
位に対応するデータの区間に文献〔１〕のバウム・ベル
ヒ再推定法などを適用することによって、各々の音声単
位を表す単位ＨＭＭを作成する。この段階の各単位ＨＭ
Ｍを総称して「初期ＨＭＭ」、初期ＨＭＭ作成の過程を
「初期学習」と呼ぶことにする。この初期ＨＭＭを出発
点とし、以下の過程を必要に応じて逐次的に繰り返すこ
とによって、対象となる音声の性質をより良く表したＨ
ＭＭになるよう、各単位ＨＭＭを表すパラメタを更新
し、最終的に対象となる音声を表した最適なＨＭＭを得
る。

【０００７】つまりこの発明では、予め設定しておい
た、適切な要素となる単位の出現順に、それぞれに対応
する単位ＨＭＭを音声データを示す発声文全体にわたっ
て連結することによって、この文全体を表すＨＭＭを合
成し、発声文のどの部分が、この合成したＨＭＭのどの
状態において生成される確率が最も大きいのかを調べ
る。この結果、音声データに付けられたラベルの境界、
つまり音声単位の境界と、対応する単位ＨＭＭの境界と
が一致していれば、それでパラメタ更新の過程を終え
る。もし一致していなければ、個々の単位ＨＭＭのパラ
メタを操作し、操作後の単位ＨＭＭを使って再度各単位
ごとにパラメタを更新する。これを、境界ずれが予め設
定した値よりも小さくなるか、あるいは予め設定した繰
り返し回数を越えるまで繰り返す。

【０００８】

【作用】この発明では、単位ＨＭＭを一つに連結するこ
とによって合成したＨＭＭが音声を生成する過程におい
て、音声データに付したラベルの境界と、そのラベルに
対応する単位を表しているはずの単位ＨＭＭの境界との
位置のずれが小さくなるように、逐次的にパラメタの更
新を繰り返す。従ってこの発明は、合成したＨＭＭがあ
る音声を生成する過程において、連結した個々の単位Ｈ
ＭＭに注目したとしても、それぞれの単位ＨＭＭが、や
はりそれぞれが表している単位に対応する音声を生成し
ているように、各単位ＨＭＭを構成できる方法になって
いる。

【０００９】

【実施例】以下に、この発明の実施例を図面を参照しな
がら説明する。（１）前提条件最初に、本実施例全体に関わる前提条件について説明す
る。要素とみなせる単位：要素とみなせる単位は全部でＳ種
類あるものとし、その集合をＳ＝｛ｓ¹，…，ｓ^S｝と
表す。要素とみなせる単位とは、例えば単語，音韻，音
素などであって、その集合Ｓに含まれる要素の連鎖とし
て、より長い音声現象を構文的に表現できるものとす
る。音声データ：音声データは全部でＷ回の発声からなるも
のとし、第ｉ番めの発声Ｏⁱを、長さＴｉの時系列のデ
ータとしてＯⁱ＝〔ｏ₁ ⁱｏ₂ ⁱ…ｏ_Ti ⁱ〕と表す。音声データへのラベル付け：予め音声データには、図１
に示すように、どの要素とみなせる単位ｓ∈Ｓが、どの
時点ｔ₁から、どの時点ｔ₂まで、どのくらいの長さｔ
₂−ｔ₁を持ち、どういう順序で出現するのかをラベル
付けしてあるものとする。ここにラベルとは、音声デー
タの始端時刻ｔ_sと、終端時刻ｔ_e、およびｔ_sないし
ｔ_eの区間の音声データに対応する単位ｓ∈Ｓの組
（ｓ，ｔ_s，ｔ_e）のことである。ｔ_s≦ｔ_eなる任意
の時刻∀ｔにおけるデータｏ_tはｔ_sないしｔ_eの区間
に属する、というものとし、またｓ（ｏ）をデータｏが
表す単位を与える関数であるとした時、ｔ_s≦ｔ≦ｔ_e
なる任意の時刻∀ｔにおいてｓ（ｏ_t）＝ｓである。ラベルの系列：第ｉ番めの発声Ｏⁱに対して、ラベルの
系列Ｌⁱ＝〔ｌ₁ ⁱｌ₂ ⁱ…ｌ_Li ⁱ〕が定義できるもの
とする。ここにラベルの系列とは、第ｉ番めの発声にお
ける任意の∀ｐ＜∀ｑに対する２つのラベルｌ_p ⁱ，ｌ
_q ⁱにおいて、前者の終端ｔ_eは後者の始端ｔ_sより前
か同一時刻であるという条件を満たすものである。（２）記号，用語の定義次に、以下の説明に現れるいくつかの記号，用語につい
て定義する。単位ｓⁱを表す単位ＨＭＭλⁱ：単位ｓⁱを表す単位Ｈ
ＭＭをλⁱと表す。λⁱの状態数をＮⁱとすると、λⁱ
は図２に示すように、Ｎⁱ個の状態の集合｛Ｕ₁ ⁱ，
…，Ｕ_Ni ⁱ｝の間の遷移グラフとして、以下のパラメタ
（Πⁱ，Ｔⁱ，Ａⁱ，Ｂⁱ）によって規定することがで
きる。初期状態Πⁱ：番号ｋの状態Ｕ_k ⁱが初期状態になる確
率をπ_k ⁱとし、終状態の集合Ｔⁱ：状態となり得る状態の集合をＴⁱ
とおく。状態遷移確率Ａⁱ：番号ｋの状態Ｕ_k ⁱから番号ｍの状
態Ｕ_m ⁱへと遷移できるシンボル出力確率分布Ｂⁱ：番号ｋの状態Ｕ_k ⁱにおけ
るシンボル出力の確率分ｘ）の形、正規分布の混合ｆ（ｘ）＝Σ_mＮμ_m,σ
_m（ｘ）の形、符号帳を使い各符号ごとの出現頻度の列
とした離散的な形など、シンボル出力確率分布ｂ
_k ⁱ（ｘ）の表現には、いろいろな形のものを考えるこ
とができる。

【００１０】任意の単位ｓⁱについて、ｓ（ｏ_t）＝ｓ
ⁱなるデータを使い、例えば論文〔１〕で紹介している
バウム・ベルヒ再推定法などを適用することによって、
対応するＨＭＭ、すなわちλⁱのパラメタを最適な値に
設定することができる。ＨＭＭの連結：二つのＨＭＭλ¹およびλ²があると
き、例えば図３に示すように、第１番目のＨＭＭλ¹の
終状態Ｕ₄ ¹が第２番目のＨＭＭλ²の初期状態Ｕ₁ ²にな
るよう接続したモデルΛのことを、これら２つのＨＭＭ
の連結とよび、Λ＝λ¹×λ²と表すことにする。この
連結の操作はＨＭＭについて閉じている。すなわち、モ
デルΛもまたＨＭＭである。またλ¹の終状態の集合か
らλ²の初期状態の集合への写像を定義することによっ
て、この連結の操作は、モデルの初期状態あるいは終状
態が複数個ある場合に容易に拡張できる。合成したモデルΛⁱ：データＯⁱについて、図４に示す
ように、そのデータに付してあるラベルの出現順に対応
するＨＭＭを連結して得られたＨＭＭ。例えばＯⁱに付
されたラベルが、時系列の順に〔ｓ₁ ⁱｓ₂ ⁱ…
ｓ_Li ⁱ〕であるときには、Λⁱ＝λ₁ ⁱ×λ₂ ⁱ×…×
λ_Li ⁱ 状態遷移を解析した結果Ｕ¹（Ｏ，λ）：あるＨＭＭλ
が、データＯをどのような状態遷移を経て生成するのか
を解析した結果。例えば図５に示すように、データＯを
構成する個々の点のデータｏ_tが、λのどの状態Ｕ_iに
おいて生成されたのかを解析した結果としてＵ（Ｏ，
λ）＝Ｕ（〔ｏ₁…ｏ_T〕，λ）＝〔Ｕ₁…Ｕ_N〕のよ
うに求まる。この解析には、例えば文献〔１〕で紹介し
ているビタービ法などを用いることができる。ラベルの境界：任意のラベルの始端時刻および終端時刻
のことをラベルの境界とよぶことにする。例えば図１に
おいて垂直な直線を引いた時刻がラベルの境界である。ＨＭＭの境界：合成したＨＭＭΛを構成している個々の
ＨＭＭλ^j1，…，λ^jLの境界部分、すなわち２つのＨＭ
Ｍを連結する時に同じであるとみなした第１番目のＨＭ
Ｍの終状態あるいは第２番目のＨＭＭの初期状態におい
て生成したデータの現れた時刻。例えば図６中のｔ₁や
ｔ₂がＨＭＭの境界である。ラベルとＨＭＭの境界のずれ：あるラベルの境界ｔ
₁と、その前後のラベルに対応する両ＨＭＭ間の境界ｔ
₂とのずれｔ₁−ｔ₂。もしｔ₁≒ｔ₂であるならばラ
ベルの境界とＨＭＭの境界との間のずれはない、といえ
る。そうでないならば、ラベルとＨＭＭとの境界間にず
れがある、といえる。環境：あるラベルの前後にどのようなラベルがあるのか
を環境とよぶことにする。例えばあるラベルｓ^mにつ
き、あるデータのラベル系列のある部分ではｓ^kｓ^mｓ
ⁿとなっており、またあるデータのラベル系列のある部
分ではｓ^k'ｓ^m'ｓ^n'となっており、ｋ≠ｋ′∨ｎ≠ｎ′
であるとすると、これらはお互いに異なる環境にある、
とする。前後のラベルを考える他に、前のラベルだけ、
あるいは後ろのラベルだけを考える、というふうに環境
を定義することもできる。

【００１１】例えば上の例でｋ＝ｋ′∧ｎ≠ｎ′である
ときに、前のラベルだけを考えるというふうに環境を定
義した場合は、上の２つのラベルは同じ環境にある、と
いうことになる。あるいは前後のラベルだけでなく、さ
らにその前、あるいはさらにその後のラベルまでを考え
て環境を定義することもできる。（３）環境を考慮しない場合の手順以下に、この実施例における、環境を考慮しない場合
の、単位ＨＭＭ作成の手順について以下で説明する。以
下のような各ステップを逐次的に繰り返すことによっ
て、単位ＨＭＭのパラメタを更新してゆく。ステップ０：全ての単位ＨＭＭλ¹，…，λ^sについ
て、初期学習を行なう。各単位ＨＭＭλⁱについて、そ
れが表している単位ｓⁱと同じラベルを持つデータの区
間を集め、文献〔１〕のバウム・ベルヒ再推定法などを
適用することで初期学習を行なうことができる。ステップ１：全てのデータＯⁱについて、そのデータに
付されたラベルの系列〔ｌ₁ ⁱｌ₂ ⁱ…〕，但しここで
ｌ₁ ⁱ＝（ｓ^j(i,1)，ｔ_s1 ⁱ，ｔ_e1 ⁱ），ｌ₂ ⁱ＝（ｓ
^j(i,2)，ｔ_s2 ⁱ，ｔ_e2 ⁱ）…〕の順に、それぞれのラベ
ルに対応する単位ｓ^j(i,1)，ｓ^j(i,2)，…を表すＨＭＭ
（λ^j）₁ ⁱ，（λ^j）₂ ⁱ，…をΛⁱ＝（λ^j）₁ ⁱ
×（λ^j）₂ ⁱ×…のように連結し、ＨＭＭΛⁱを合成
する。ステップ２：データＯⁱをＨＭＭΛⁱがどのような状態
遷移を経て生成するのかを解析する。ステップ３：一部または全部のラベルについて、ラベル
と単位ＨＭＭとの境界のずれを評価する。ステップ４：ラベル境界とＨＭＭ境界との位置のずれが
最も大きい単位ＨＭＭ，あるいはずれの大きいものから
順に予め定めておいた数の単位ＨＭＭ、あるいはずれが
一定値以上の単位ＨＭＭにつき、このずれを小さくする
ようにパラメタを操作する。この操作の具体的な方法に
ついては後で説明する。ステップ５：文献〔１〕のバウム・ベルヒ再推定法など
を使って、ステップ０の初期学習と同様に、各単位を表
すデータを集め、各単位ごとに操作後の単位ＨＭＭのパ
ラメタを更新するか、あるいはラベルの出現順に連結し
たＨＭＭ全体につき単位ＨＭＭのパラメタを一括して更
新する。ステップ６：全てのラベルにつき、ずれの最大のもの
が、予め設定しておいた値よりも大きいか、あるいは繰
り返し回数が予め設定しておいた値を越えていない場合
は再びステップ１から繰り返す。

【００１２】以上の処理の流れを図１１に示す。（４）ラベル境界とＨＭＭ境界とのずれを小さくするよ
うＨＭＭパラメタを操作する方法前記ステップ４におけるずれを小さくする操作について
以下に説明する。ラベルの系列の途中における単位が…
（ｓ^k，ｔ₀，ｔ₁）（ｓ^m，ｔ₁，ｔ₂）（ｓⁿ，ｔ
₂，ｔ₃）…であったとしよう。また、ＨＭＭの境界を
解析した結果、ｓ^mを表すＨＭＭλ^mの始端がｔ_a，終
端がｔ_bにあったとしよう。「始端位置について」ｔ_a＜ｔ₁のとき（ＨＭＭ境界がラベル境界よりも前に
ある）：ｏ_t1を生成した状態がＵ_i ^m（ｉ≠1 ) である
とき、初期状態となり得る状態から状態Ｕ₁ ^mを取り除
くことによりλ^mの状態を減らし、かつその取り除いた
状態Ｕ₁ ^mから遷移できる全ての状態Ｕ（初期状態から
の遷移は２番目の状態Ｕ₂ ^mに限らない）を初期状態と
なり得る状態に付け加えることによって、新たに初期状
態になり得る状態を定めかつ状態Ｕ₁ ^mへの遷移確率が
０よりも大きい遷移がある場合はこれを０とおく操作を
行なう。ｔ₁＜ｔ_aのとき（ラベル境界がＨＭＭ境界よりも前に
ある）：λ^mの状態数を１増やし、この状態からの遷移
確率およびその際のシンボル出力確率分布として、一つ
前のＨＭＭλ^kの終りの状態遷移の値を設定する。初期
状態となり得る状態から状態Ｕ₁ ^mを取り除き（状態Ｕ
₁ ^mは例えば状態Ｕ₂ ^mとして残り）、かつ新たに増や
した状態を初期状態となり得る状態に付け加えることに
よって新たに初期状態となり得る状態を定める。「終端位置について」ｔ_b＜ｔ₂のとき（ＨＭＭ境界がラベル境界よりも前に
ある）：λ^mの状態数を１増やし、この状態への遷移確
率およびその際のシンボル出力確率分布として、一つ後
のＨＭＭλⁿの始めの状態遷移の値を設定する。終状態
となり得る状態から状態Ｕ_Nm ^mを取り除き、かつ新たに
増やした状態を終状態となり得る状態に付け加えること
によって新たに終状態となり得る状態を定める。ｔ₂＜ｔ_bのとき（ラベル境界がＨＭＭ境界よりも前に
ある）：ｏ_t2を生成した状態がＵ_i ^m（ｉ≠Ｎ_m) であ
るとき、終状態となる状態から状態Ｕ_Nm ^mを取り除いて
λ^mの状態数を１減らし、新たに終状態になり得る状態
を定め、かつ状態Ｕ_Nm ^mへの遷移確率が０よりも大きい
遷移がある場合はこれを０とおく操作を行なう。

【００１３】あるＨＭＭλ^mにつき複数のデータがある
場合に、以上の操作に続けて、さらに平均化の操作を行
なう。状態数を増やすという操作をすることになったデ
ータと、状態数を減らすという操作をすることになった
データが両方とも存在する場合は、データの個数とずれ
の大きさの積の大小でどちらの操作をするのか決める。
状態数を増やす操作をする場合、複数のデータそれぞれ
につき、上のようにして新たに設定すべき遷移確率とそ
の際のシンボル出力確率分布の値を求め、その全部の平
均を設定する。（５）環境を考慮した場合の手順同一のラベルを付けた音声区間であるとしても、その区
間の音響的な現象が前後の環境から大きな影響を受けて
いるために、環境の違いによって、それぞれの環境ごと
のデータの分布が、統計的に異なる複数の分布に従って
いるかもしれない。この本来統計的に異なる分布で表す
べきところを一つの分布で表そうとしていることが、ラ
ベル境界とＨＭＭ境界との間にずれの生じている原因で
ある場合に対処しながら逐次的にずれを小さくする方向
に単位ＨＭＭのパラメタを更新しようというのが、この
実施例で述べる環境を考慮した場合の手順である。

【００１４】さて、以下にこの実施例における、環境を
考慮した場合の単位ＨＭＭのパラメタ作成の手順につい
て説明する。環境を考慮する場合のパラメタ作成の手順
は、全般において、先に説明した、環境を考慮しない場
合のパラメタ作成の手順と同じである。異なるのは、先
の実施例の手順におけるステップ４の、ずれが小さくな
るようにＨＭＭのパラメタを操作する場合の操作の方法
である。

【００１５】この操作の方法には、以下のように、さら
に大きく２通りの方法がある。１．あるラベルにおいて、これを表すＨＭＭを、環境ご
とに複数個用意する方向で操作する方法。２．あるラベルにおいて、これを表すＨＭＭの、初期状
態あるいは終状態になり得る状態の定義を操作する方
法。（６）ＨＭＭを環境ごとに用意する方向で操作する方法第１の方法は、具体的に以下のように進める。すなわ
ち、あるラベルについて、環境ごとにＨＭＭ境界とラベ
ル境界とのずれの大小を評価し、ずれが最も大きい環
境、あるいはずれが大きいものから予め定めておいた数
の環境につき、ＨＭＭ境界とラベル境界位置の前後に応
じて、（３）で述べた方法と同一の方法によって、対応
する単位ＨＭＭの初期状態あるいは終状態の数を増や
す、あるいは減らす操作を行なう。例えば図７に示すよ
うに単位ｓ^mを表わす単位ＨＭＭλ^mのうち，〔…，ｓ
^k，ｓ^m，ｓⁿ，…〕であるような環境のものについて
終状態を一つ増やす。この際、（３）節において行なっ
たように、全ての環境におけるずれを平均するという操
作は行なわず、ある特定の環境におけるずれにのみ基づ
いてＨＭＭを操作する。

【００１６】こうして操作して作った新しいＨＭＭは、
もはや同じラベルであったとしても、別の環境を表して
いるものではない。従って、こうして作った新しいＨＭ
Ｍには、それに対応するラベルだけでなく、どのような
環境に対応したものであるのかも同時に記録しておく必
要がある。こうして作ったＨＭＭを連結する時には、ラ
ベルの環境と矛盾しないような環境に対応しているＨＭ
Ｍを用いる。

【００１７】ある環境について初期状態あるいは終状態
を増やす方向で操作することになった場合、あらたに追
加する状態に係る以外のパラメタは他の環境のためのＨ
ＭＭと共用することができる。例えば図８に示すよう
に、ある単位ｓ^mを表わす単位ＨＭＭについて、〔ｓ^k
−ｓ^m−ｓⁿ〕なる環境に対応した単位ＨＭＭλ^m'、上
記以外の環境に対応した単位ＨＭＭがλ^mであり、λ^m'
はλ^mに終状態として新たに状態Ｕ₄ ^m'を付け加えたも
のであり、それ以外の状態を共有している場合は、それ
ぞれλ^m'のパラメタをΠ^m'，Ａ^m'，Ｂ^m'、λ^mのパラメ
タをΠ^m，Ａ^m，Ｂ^mとすると、これらパラメタ間に、なる関係が成立つ。つまりλ^mとλ^m'とはパラメタを共
有している。また、ある環境について初期状態あるいは
終状態を減らす方向で操作することになった場合、削除
する状態以外の状態に係るパラメタは、他の環境のため
のＨＭＭと共有することができる。（７）ＨＭＭの初期あるいは終状態となりうる状態の定
義を操作する方法第２の方法は、具体的に以下のように進める。すなわ
ち、あるラベルについて、環境ごとにＨＭＭ境界とラベ
ル境界とのずれの大小を評価し、ずれが最も大きい環
境、あるいはずれが大きいものから予め定めておいて数
の環境につき、ＨＭＭ境界とラベル境界位置の前後に応
じて、（３）節で述べた方法と同一の方法によって、対
応するＨＭＭの初期状態あるいは終状態の数を増やす、
あるいは減らす操作を行なうべきであるのかを評価す
る。

【００１８】もし評価の結果が初期状態あるいは終状態
の数を増やす方向になった場合には、初期状態あるいは
終状態を追加するが、この際に、今まで初期状態あるい
は終状態として定義してあった状態が、操作の後も引続
き初期あるいは終状態として定義されており、結果とし
て、初期状態あるいは終状態になり得る状態の数が増え
ることになる。例えば図９に示すようにある単位ｓ^mを
表わす単位ＨＭＭλ^mについて、〔ｓ^k−ｓ^m−ｓⁿ〕
なる環境においては新たに終状態Ｕ₄ ^m'を付け加えよう
と判断した場合は、それまでの終状態に加え、新しく付
け加えた状態のいずれもが新しいＨＭＭλ^mにおいては
終状態になり得るものとして定義される。つまり終状態
になり得る状態の数が増加する。

【００１９】逆に、もし評価の結果が初期状態あるいは
終状態の数を減らす方向になった場合には、その状態が
初期状態であればその状態から遷移する先の状態、その
状態が終状態であればその状態へと遷移する元の状態
を、それぞれ新たに初期状態あるいは終状態として定義
する。この場合も、結果として初期状態あるいは終状態
になり得る状態の数が増えることになる。例えば図１０
に示すようにある単位ｓ ^mを表わす単位ＨＭＭλ^mの終
状態がＵ₃ ^mであり、〔ｓ^k−ｓ^m−ｓⁿ〕なる環境に
おいては状態数を減らし、Ｕ₃ ^mを終状態として定義し
直すと判断した場合は、それまでの終状態に加え、あら
たに終状態として定義し直した状態のいずれもが新しい
ＨＭＭλ^mにおいては終状態になり得るものとして定義
され、終状態になり得る数が増える。

【００２０】

【発明の効果】以上述べたようにこの発明によれば、単
位ＨＭＭを連結したＨＭＭがあるデータを生成する時
に、ＨＭＭ境界と、そのデータに付したラベル境界との
位置のずれが小さくなるように単位ＨＭＭが作成され、
実際の連続した音声に適した単位ＨＭＭが得られ、認識
率を向上させることができる。

【図面の簡単な説明】

【図１】音声データに付けられたラベルの例を示す波形
図。

【図２】ＨＭＭの例を示す図。

【図３】２つのＨＭＭを結合する例を示す図。

【図４】ラベルの系列にしたがってＨＭＭを連結するこ
とによって、データ全体を表すモデルを合成する例を示
す図。

【図５】あるデータをあるＨＭＭがどのような状態遷移
を持って生成するのかを解析した例を示す図。

【図６】連結したＨＭＭを構成する個々のＨＭＭ間の境
界の例を示す図。

【図７】ある環境のためのＨＭＭを新たに作成する例を
示す図。

【図８】各環境を表す複数のＨＭＭ間で共有できるパラ
メタは共有する例を示す図。

【図９】状態を増やす方向で終状態を定義し直す例を示
す図。

【図１０】状態をへらす方向で終状態を定義し直す例を
示す図。

【図１１】この発明の実施例を示す流れ図。

Claims

【特許請求の範囲】

【請求項１】学習音声データに対し、要素とみなせる
音声単位が、それぞれどういう順序で、かつどれだけの
長さをもって出現するのかをラベル付けし、前記学習音声データの各々の音声単位に対応する区間か
ら、それぞれその音声単位を表す隠れマルコフ・モデル
（以下「隠れマルコフ・モデル」は「ＨＭＭ」と、「そ
れぞれの要素とみなせる音声単位を表すＨＭＭ」は「単
位ＨＭＭ」と記す）を初期学習し、その初期学習した単位ＨＭＭにおいて、前記音声データ
に付けられたラベルの出現順に前記単位ＨＭＭを連結す
ることによって合成したＨＭＭが、前記音声データをど
のような状態遷移の過程をもって生成したと考えられる
のかを解析し、前記音声データに付けられた隣接する前記音声単位の境
界と、それぞれの前記音声単位に対応する前記単位ＨＭ
Ｍの境界との位置のずれを求め、前記単位ＨＭＭの状態数、並びにそれを表す変数（すな
わち初期状態確率、終状態の集合、状態遷移確率、ない
しシンボル出力確率の一部または全部）を、隣接する前
記音声単位の境界と、それに対応する単位ＨＭＭの境界
との位置のずれが少なくなるように操作することを特徴
とする、音声モデルの作成方法。