JP2013205807A - モデル学習装置、モデル製造方法、及びプログラム - Google Patents

モデル学習装置、モデル製造方法、及びプログラム Download PDF

Info

Publication number
JP2013205807A
JP2013205807A JP2012078036A JP2012078036A JP2013205807A JP 2013205807 A JP2013205807 A JP 2013205807A JP 2012078036 A JP2012078036 A JP 2012078036A JP 2012078036 A JP2012078036 A JP 2012078036A JP 2013205807 A JP2013205807 A JP 2013205807A
Authority
JP
Japan
Prior art keywords
covariance
logarithmic
matrices
rotation
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012078036A
Other languages
English (en)
Other versions
JP5612014B2 (ja
Inventor
Yusuke Shinohara
雄介 篠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012078036A priority Critical patent/JP5612014B2/ja
Priority to US13/852,198 priority patent/US20130262058A1/en
Publication of JP2013205807A publication Critical patent/JP2013205807A/ja
Application granted granted Critical
Publication of JP5612014B2 publication Critical patent/JP5612014B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】演算量を削減しつつ、認識性能を向上させることを可能とする。
【解決手段】実施形態のモデル学習装置は、変換部と、割当部と、更新部と、射影部と、を備える。変換部は、入力されたN(N≧1)個の共分散行列の各々を変換してN個の対数共分散ベクトルを得る。割当部は、N個の対数共分散ベクトルの各々を、N個の共分散行列から得られるK(1≦K≦N)個の回転行列のうち最も近い回転行列に割り当てる。更新部は、割り当てられたK’(1≦K’≦K)個の回転行列の各々について、当該回転行列に割り当てられた対数共分散ベクトルを特定し、特定した対数共分散ベクトルに基づいて当該回転行列を更新する。射影部は、N個の対数共分散ベクトルの各々を、更新されたK’個の回転行列及び更新されなかったK−K’個の回転行列のうち最も近い回転行列に射影する。
【選択図】図1

Description

本発明の実施形態は、モデル学習装置、モデル製造方法、及びプログラムに関する。
音声認識の音響モデルなどに使用されるガウス分布は、平均ベクトルと共分散行列とを含む。共分散行列をそのままの形、即ち、全共分散行列(full covariance matrices)の形で尤度評価に用いると演算量が膨大になるため、対角共分散行列(diagonal covariance matrices)を用いる方法がある。しかし、対角共分散行列では、変数間の相関を表現できないため、音声認識の精度の低下を招いてしまうおそれがある。
尤度評価の演算量を削減する別の方法として、セミタイド共分散行列(semi-tied covariance matrices)を用いる方法がある。セミタイド共分散行列は、共分散行列を固有値分解して得られる対角行列(固有値を対角成分に持つ行列)及び回転行列(固有ベクトルからなる行列)のうち、回転行列を共有したものである。つまり、セミタイド共分散行列を用いる場合、音響モデルを構成する各ガウス分布は、平均ベクトル、対角行列、及び回転行列のクラスを含む。そして、回転行列のクラス毎に代表となる回転行列を記憶しておくので、各ガウス分布は、自身の回転行列のクラスに対応する回転行列を参照する。これにより、尤度評価の演算量を削減しつつ、音声認識の精度の低下を抑えた音声認識を実現することが可能となる。
ここで、セミタイド共分散行列を用いる方法において、ガウス分布をいずれのクラスに割り当てるかを決定する方法として、ガウス分布が属するトライフォンの中心音素がいずれの音素であるかによって当該ガウス分布がいずれのクラスに属するかを決定する方法が知られている。この方法では、各音素について当該音素を中心音素とするトライフォンが特定され、特定されたトライフォンに含まれる全てのガウス分布で1つのクラスが形成され、クラスの代表の回転行列が共有される。
M.Gales,"Semi−Tied Covariance Matrices for Hidden Markov Models," IEEE Transactions on Speech and Audio Processing,Vol.7,No.3,May 1999.
しかしながら、上述した方法は、共分散行列を再現する上で最適でない。このため、再現後の共分散行列を用いたモデルでは、再現前の共分散行列を用いたモデルと比べ、認識性能が低下してしまうおそれがある。
本発明が解決しようとする課題は、演算量を削減しつつ、認識性能を向上させることを可能とするモデル学習装置、モデル製造方法、及びプログラムを提供することである。
実施形態のモデル学習装置は、変換部と、割当部と、更新部と、射影部と、を備える。変換部は、入力されたN(N≧1)個の共分散行列の各々を変換してN個の対数共分散ベクトルを得る。割当部は、前記N個の対数共分散ベクトルの各々を、前記N個の共分散行列から得られるK(1≦K≦N)個の回転行列のうち最も近い回転行列に割り当てる。更新部は、割り当てられたK’(1≦K’≦K)個の回転行列の各々について、当該回転行列に割り当てられた前記対数共分散ベクトルを特定し、特定した前記対数共分散ベクトルに基づいて当該回転行列を更新する。射影部は、前記N個の対数共分散ベクトルの各々を、更新されたK’個の回転行列及び更新されなかったK−K’個の回転行列のうち最も近い回転行列に射影する。
第1実施形態のモデル学習装置の例を示す構成図。 第1実施形態の共分散行列の例を示す図。 第1実施形態の対数共分散ベクトルの例を示す図。 対数共分散ベクトルの空間と部分空間との関係の例を示す図。 部分空間の例を示す図。 部分空間の例を示す図。 第1実施形態の割当部の割り当て結果の例を示す図。 第1実施形態の射影部の射影により共分散行列の各軸のスケーリングが調整される様子の例を示す図。 第1実施形態の射影部の射影の例を対数共分散ベクトルの空間で示す図。 第1実施形態の射影部の射影結果の例を特徴ベクトルの空間で示す図。 第1実施形態のモデル学習装置の処理例を示すフローチャート。 第1実施形態との比較例を示す図。 第1実施形態との比較例を示す図。 第1実施形態との比較例を示す図。 第1実施形態との比較例を示す図。 第2実施形態のモデル学習装置の例を示す構成図。 第2実施形態のモデル学習装置の処理例を示すフローチャート。
以下、添付図面を参照しながら、実施形態を詳細に説明する。
(第1実施形態)
第1実施形態では、音声認識や文字認識などの各種認識に用いるモデルに使用されるガウス分布に含まれる共分散行列を学習する例について説明する。
図1は、第1実施形態のモデル学習装置100の一例を示す構成図である。モデル学習装置100は、図1に示すように、変換部102と、ベクトル記憶部104と、回転行列記憶部106と、初期化部108と、割当部110と、インデックス記憶部112と、更新部114と、射影部116と、を備える。
変換部102、初期化部108、割当部110、更新部114、及び射影部116は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現できる。ベクトル記憶部104、回転行列記憶部106、及びインデックス記憶部112は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、RAM(Random Access Memory)、メモリカードなどの磁気的、光学的、又は電気的に記憶可能な記憶装置の少なくともいずれかにより実現できる。
変換部102には、モデル学習装置100の外部からN(N≧1)個の共分散行列Σ(詳細には、共分散行列{Σ,…,Σ})が入力される。共分散行列Σは、n(n≧2)行n列であるものとする。そして変換部102は、入力されたN個の共分散行列Σの各々を、対数共分散ベクトルξ(詳細には、対数共分散ベクトル{ξ,…,ξ})に変換する。具体的には、変換部102は、入力されたN個の共分散行列Σの各々を、対数共分散行列S(詳細には、対数共分散行列{S,…,S})に変換し、更に、n(n+1)/2次元の対数共分散ベクトルξ(詳細には、対数共分散ベクトル{ξ,…,ξ})に変換する。
詳細に説明すると、まず、変換部102は、共分散行列Σを対数関数で対数共分散行列S(=log(Σ))に変換する。例えば、変換部102は、共分散行列Σを、数式(1)に示すように、固有ベクトルからなる回転行列Uと固有値からなる対角行列Dとに固有値分解するとすると、対数関数の級数展開により、対数共分散行列Sを数式(2)に示すように計算する。
Figure 2013205807
Figure 2013205807
ここで、Tは、転置を示す。また、共分散行列Σの固有値をλ,…,λとおくと、log(D)は、数式(3)で表される。
Figure 2013205807
次に、変換部102は、行列ベクトル変換により、対数共分散行列Sを、数式(4)に示すように、対数共分散ベクトルξに変換する。
Figure 2013205807
ここで、行列ベクトル変換関数vec()は、n行n列の行列をn(n+1)/2次元のベクトルに変換する関数であり、例えば、p(p=1…n)行q(q=1…n)列の要素がxpqであるn行n列の行列Xを、数式(5)に示すように変換する。
Figure 2013205807
変換部102は、以上のようにして、N個の共分散行列Σをそれぞれ対数共分散ベクトルξに変換し、ベクトル記憶部104へ記憶(保存)する。
図2は、第1実施形態の変換部102に入力されるN個の共分散行列Σの一例を示す図である。図2に示す例では、N=8となっており、共分散行列120〜127は、それぞれバラバラな回転行列を有している。なお、図2に示す例では、共分散行列120〜127は、2行2列の行列であり、2次元(n=2)の特徴ベクトル空間で表されている。
図3は、第1実施形態の変換部102により変換されたN個の対数共分散ベクトルξの一例を示す図である。図3に示す例では、変換部102により図2の共分散行列120〜127から変換されたN(N=8)個の対数共分散ベクトルξが、対数共分散ベクトルξの空間にプロットされている。n=2の場合、実際の対数共分散ベクトルξの空間は3次元(n(n+1)/2次元)となるが、図3では模式的に2次元で表している。
図1に戻り、ベクトル記憶部104は、変換部102により変換されたN個の対数共分散ベクトルξ(詳細には、対数共分散ベクトル{ξ,…,ξ})を記憶する。
回転行列記憶部106は、K(1≦K≦N)個の回転行列U(詳細には、回転行列{U,…,U})を記憶する。回転行列Uは、n行n列であるものとする。ここで、回転行列Uのn本の列ベクトルをu,…,uとおき、回転行列Uを、数式(6)に示すように記載するものとする。更に、n本の列ベクトル各々に対して、数式(7)に示すように、n(n+1)/2次元のベクトルを定義するものとする。
Figure 2013205807
Figure 2013205807
但し、vec()は、前述の行列ベクトル変換関数であり、d=1…nである。
これにより、n(n+1)/2次元の対数共分散ベクトルξの空間に、a,…,aで張られるn次元の部分空間(以下、「回転行列Uで規定される部分空間」と称する場合がある)を定義することができる。
ここで、対数共分散ベクトルξは、対数共分散ベクトルξの空間においては回転行列Uで規定される部分空間上の全ての点において、共分散行列Σの回転行列が同一、即ち、回転行列Uになるという特別な性質を有する。
図4は、対数共分散ベクトルξの空間と部分空間との関係の一例を示す図である。前述したように、特徴ベクトルが2次元の場合、共分散行列Σは2行2列となり、対数共分散ベクトルξは3次元となる。この場合、回転行列Uで規定される部分空間は2次元となる。図4に示す例では、3次元の対数共分散ベクトルξの空間に、2次元の部分空間130が回転角θ=15°の回転行列Uで規定されるとともに、2次元の部分空間140が回転角θ=50°の回転行列Uで規定されている。なお,2行2列(n=2)の回転行列Uの値は、回転角によって決定される。
図5は、部分空間130の一例を示す図である。部分空間130では、第1軸(x軸)は、共分散行列Σの第1軸方向のスケーリングを表し、第2軸(y軸)は、共分散行列Σの第2軸方向のスケーリングを表す。より詳細には、第1軸の座標はlog(λ)となり、第2軸の座標はlog(λ)となる。λは、対角行列Dの1行1列成分、即ち、第1軸方向の分散の値であり、λは、対角行列Dの2行2列成分、即ち、第2軸方向の分散の値である。なお、対角行列Dは、前述したように、共分散行列Σを固有値分解することにより回転行列Uとともに得られる。
図5に示す例では、部分空間130上の全ての共分散行列Σの回転角がθ=15°となっており、部分空間130上の全ての共分散行列Σの回転行列が同一となっている。また、第1軸の右側にいくほど、共分散行列Σの第1軸のスケーリング(分散)が大きくなり、第1軸の左側にいくほど、共分散行列Σの第1軸のスケーリングが小さくなる。また、第2軸の上側にいくほど、共分散行列Σの第2軸のスケーリング(分散)が大きくなり、第2軸の下側にいくほど、共分散行列Σの第2軸のスケーリングが小さくなる。
図6は、部分空間140の一例を示す図である。第1軸及び第2軸の説明、並びに第1軸及び第2軸のスケーリングの変化は、図5と同様であるため、説明を省略する。図6に示す例では、部分空間140上の全ての共分散行列Σの回転角がθ=50°となっており、部分空間140上の全ての共分散行列Σの回転行列が同一となっている。
このような、対数共分散ベクトルξの空間においては回転行列Uで規定される部分空間上の全ての点において、共分散行列Σの回転行列Uが同一になるという対数共分散ベクトルξの特別な性質は、数式(8)で導かれる。
Figure 2013205807
つまり、対数共分散行列log(Σ)は、u の線形結合として表され、かつ当該線形結合の係数がlog(λ)になるという等式から、対数共分散ベクトルξの特別な性質が導かれる。
図1に戻り、初期化部108は、回転行列記憶部106に記憶されているK個の回転行列U(詳細には、回転行列{U,…,U})を初期化する。第1実施形態では、初期化部108は、モデル学習装置100の外部から入力されたN個の共分散行列Σを固有値分解して得られるN個の回転行列Uの中からK個の回転行列Uを無作為に選択し、選択したK個の回転行列Uを初期値として回転行列記憶部106に記憶(保存)する。
なお初期化部108は、変換部102により得られたN個の回転行列Uの中からK個の回転行列Uを選択してもよいし、N個の共分散行列Σを自身で固有値分解して得たN個の回転行列Uの中からK個の回転行列Uを選択してもよい。
割当部110は、ベクトル記憶部104に記憶されているN個の対数共分散ベクトルξ(詳細には、対数共分散ベクトル{ξ,…,ξ})の各々を、回転行列記憶部106に記憶されているK個の回転行列U(詳細には、回転行列{U,…,U})のうち最も近い回転行列に割り当てる。これにより、回転行列記憶部106に記憶されているK個の回転行列UのうちK’(1≦K’≦K)個の回転行列Uが割り当てられる。具体的には、割当部110は、回転行列記憶部106に記憶されているK個の回転行列Uで規定されるK個の部分空間を生成し、ベクトル記憶部104に記憶されているN個の対数共分散ベクトルξの各々を最も近い部分空間に割り当てる。そして割当部110は、N個の対数共分散ベクトルξ(詳細には、対数共分散ベクトル{ξ,…,ξ})の各々に割り当てた部分空間のインデックスr(詳細には、インデックス{r,…,r})をインデックス記憶部112に記憶(保存)する。なお、rは、1≦r≦Kである。
図7は、第1実施形態の割当部110の割り当て結果の一例を示す図である。図7に示す例では、図3に示す対数共分散ベクトルξの空間におけるN(N=8)個の対数共分散ベクトルξにK(K=2)個の部分空間を割り当てた結果を示している。K個の部分空間は、回転角θ=19°である2次元の部分空間150と回転角θ=62°である2次元の部分空間160とである。なお、図7では、対数共分散ベクトルξの空間は実際には3次元であるが2次元で表し、部分空間は実際には2次元であるが1次元(直線)で表している。
第1実施形態では、割当部110は、対数共分散ベクトルξの空間におけるN個の対数共分散ベクトルξの各々と部分空間とのユークリッド距離を計測し、対数共分散ベクトルξの各々を最も近い部分空間に割り当てるものとするが、これに限定されるものではない。ユークリッド距離の計測には、周知の方法を用いればよい。
例えば、n次元の部分空間が基底ベクトルv,…,vで張られる場合に行列V=(v,…,v)とおくと、射影行列P=VVが定義でき、ベクトルxから当該部分空間への正射影(垂線の足)は、x=Pxによって計算できるので、部分空間までの距離(垂線の長さ)は、||x−Px||で求められる。つまり、割当部110は、N個の対数共分散ベクトルξの各々からK個の回転行列各々へ正射影して(垂線を降ろして)最も近い回転行列を特定する。
対数共分散ベクトルの空間におけるユークリッド距離により共分散行列間の距離を測ることの妥当性は、例えば、Arsigny, Fillard, Pennec, and Ayache, “Log−Euclidean matrics for fast and simple calculus on diffusion tensors,” Magnetic Resonnance in Medicines, 56:411−421, 2006.で論じられている。
図1に戻り、インデックス記憶部112は、N個のインデックスr(詳細には、インデックス{r,…,r})を記憶する。例えば、インデックス記憶部112は、第i(i=1…N)番目の対数共分散ベクトルξが、第k(k=1…K)番目の回転行列Uで規定される部分空間に割り当てられている場合、第i番目のインデックスrの値としてkを記憶する。
更新部114は、割当部110により割り当てられたK’個の回転行列Uの各々について、当該回転行列Uに割り当てられた対数共分散ベクトルξを特定し、特定した対数共分散ベクトルξに基づいて(詳細には、特定した対数共分散ベクトルξを当該回転行列Uへ正射影した距離の二乗の和が減少するように)回転行列Uを更新する。具体的には、更新部114は、回転行列記憶部106に記憶されているK’個の回転行列Uの各々について、インデックス記憶部112に記憶されているN個のインデックスr(詳細には、インデックス{r,…,r})に基づいて当該回転行列Uで規定される部分空間に割り当てられた対数共分散ベクトルξを特定する。なお、特定する対数共分散ベクトルξは、単数の場合もあれば複数の場合もある。そして更新部114は、特定した対数共分散ベクトルξをベクトル記憶部104から読み出し、読み出した対数共分散ベクトルξから当該部分空間までの距離の二乗の和が減少するように、当該回転行列Uを更新する。
以下、第k番目の回転行列Uを例に取り、具体的な更新方法について説明する。
まず、更新部114は、インデックス記憶部112に記憶されているインデックスrに基づいて、回転行列Uで規定される部分空間に割り当てられた対数共分散ベクトル{ξ|r=k}を特定し、特定した対数共分散ベクトル{ξ|r=k}をベクトル記憶部104から読み出す。
次に、更新部114は、対数共分散ベクトル{ξ|r=k}から回転行列Uで規定される部分空間までの距離の二乗の和J(U)(数式(9)参照)の値が減少するように、回転行列Uを更新する。
Figure 2013205807
但し、ベクトルξi,⊥は、対数共分散ベクトルξから回転行列Uで規定される部分空間へと垂線を降ろしたときの足(perpendicular foot)を示す。
なお、目的関数J(U)の値を減少させるように回転行列Uを更新する方法としては、例えば、Edelman, Arias, and Smith, “The geometry of algorithms with orthogonality constraints,” SIAM J. Matrix Anal. Appl., Vol. 20, No. 2, pp. 303−353, 1998.に開示されている方法などを用いることができる。
具体的に説明すると、まず、更新部114は、数式(10)に示すように、目的関数J(U)の微分係数Fを計算する。
Figure 2013205807
次に、更新部114は、数式(11)〜(13)を用いて、回転行列Uを回転行列U’に更新する。
Figure 2013205807
Figure 2013205807
Figure 2013205807
但し、exp()は、行列の指数関数を示す。また、εは、ごく小さな正の実数であればよく、演算量や演算精度などとの関係で適切な値に決定すればよい。
更新部114は、数式(10)に示す微分係数Fの計算と数式(11)〜(13)に示す回転行列Uの更新とを交互に繰り返し実行することにより、目的関数J(U)の値を減少させることができる。
なお、第1実施形態のモデル学習装置100では、割当部110の処理と更新部114の処理とを交互に繰り返し実行することにより、K個の部分空間をN個の対数共分散ベクトルへ当てはめる。繰り返し回数は、予め定めておいてもよいし、所定条件を満たすまでとしてもよい。
射影部116は、N個の対数共分散ベクトルξの各々を、更新されたK’個の回転行列U’及び更新されなかったK−K’個の回転行列Uのうち最も近い回転行列に射影(詳細には、正射影)する。また射影部116は、N個の対数共分散ベクトルξの各々を射影する回転行列Uのインデックスrを取得するとともに、N個の対角行列Dを射影に基づいて(詳細には、正射影の結果を用いて)更新する。
具体的に説明すると、射影部116は、まず、割当部110と同じ手順で割り当てを行う。具体的には、射影部116は、回転行列記憶部106に記憶されている更新されたK’個の回転行列U’及び更新されなかったK−K’個の回転行列Uで規定されるK個の部分空間を生成する。そして射影部116は、ベクトル記憶部104に記憶されているN個の対数共分散ベクトルξ(詳細には、対数共分散ベクトル{ξ,…,ξ})の各々を最も近い部分空間に割り当て、割り当てた部分空間のインデックスr(詳細には、インデックス{r,…,r})を求める。そして射影部116は、各対数共分散ベクトルξから回転行列U’riで規定される部分空間に垂線を降ろし、当該垂線の足ξi,⊥を求める。
次に、射影部116は、求めた垂線の足ξi,⊥を数式(14)で表す場合の係数li,d(詳細には、li,1,…,li,n)を求め、求めた係数li,dの指数をとった値を対角成分にもつ対角行列D(数式(15)参照)を求める。
Figure 2013205807
Figure 2013205807
これにより、対角行列D(共分散行列Σの各軸のスケーリング)が適切に調整される。
図8は、第1実施形態の射影部116による射影により共分散行列Σの各軸のスケーリングが調整される様子の一例を示す図である。図8では、射影部116は、回転角θ=0°である部分空間165における共分散行列の集合から、共分散行列166を表す点Aに最も距離が近いもの、即ち、垂線の足(点E)を選択している。このため、共分散行列166が共分散行列167に変化し、各軸のスケーリングが変化している。このように対数共分散ベクトルξと更新後の部分空間(回転行列)との距離を測ることで、対数共分散ベクトルξをより適切な部分空間(回転行列)に割り当てることが可能となる。
そして射影部116は、以上のようにして求めたインデックスr(詳細には、インデックス{r,…,r})及び対角行列D(詳細には、対角行列{D,…,D})を出力する。
図9は、第1実施形態の射影部116による射影の一例を対数共分散ベクトルξの空間で示す図である。図9に示す例では、射影部116は、図7に示す対数共分散ベクトルξの空間におけるN(N=8)個の対数共分散ベクトルξの各々を、K(K=2)個の部分空間のうち最も近い部分空間に射影している。K個の部分空間は、図7同様、回転角θ=19°である2次元の部分空間150と回転角θ=62°である2次元の部分空間160とであるが、これらの部分空間は、更新部114による更新後のものである。この射影により、例えば、回転角θ=9°であった共分散行列123(図2参照)が回転角θ=19°の共分散行列173に置き換えられ、回転角θ=77°であった共分散行列127(図2参照)が回転角θ=62°の共分散行列177に置き換えられている。また、この射影により、図8で説明したように、対角行列Dの値も変化する。
モデル学習装置100は、回転行列記憶部106に記憶されている更新されたK’個の回転行列U’及び更新されなかったK−K’個の回転行列U、並びに射影部116により出力されたインデックスr(詳細には、インデックス{r,…,r})及び対角行列D(詳細には、対角行列{D,…,D})を出力する。
そして、モデル学習装置100が出力した回転行列、インデックスr、及び対角行列Dを用いると、N個の共分散行列Σのうち第i番目の共分散行列Σを、数式(16)に示すように近似することができる。つまり、共分散行列Σを固有値分解したときの回転行列Uを量子化することができる。
Figure 2013205807
図10は、第1実施形態の射影部116による射影結果の一例を特徴ベクトルの空間で示す図である。つまり、N個の対数共分散ベクトルξの各々を上述した変換の逆変換で共分散行列Σに戻した結果を示している。図10に示す例では、共分散行列120、123、124(図2参照)が回転角θ=19°の共分散行列170、173、174に置き換えられ、共分散行列121、122、125、126、127(図2参照)が回転角θ=62°の共分散行列171、172、175、176、177に置き換えられている。つまり、共分散行列170〜177の回転角はθ=19°又は62°のいずれかにそろえられている。
このように、第1実施形態では、共分散行列が置き換えられることにより、共分散行列の回転行列がそろえられ(共有化され)、セミタイド共分散行列に変換されるので、セミタイド共分散行列を用いた場合の尤度評価を低演算量で実行することが可能となり、高速な尤度演算が可能となる。また、置き換えられた共分散行列は、置き換え前の共分散行列(モデル学習装置100に入力された共分散行列)をよく近似しているため、オリジナルの尤度を高精度に近似した値を演算することが可能となる。
図11は、第1実施形態のモデル学習装置100で実行される処理の一例を示すフローチャートである。
まず、変換部102は、入力されたN個の共分散行列Σの各々を対数共分散ベクトルξに変換し、ベクトル記憶部104へ記憶する(ステップS100)。
続いて、初期化部108は、入力されたN個の共分散行列Σを固有値分解して得られるN個の回転行列Uの中からK個の回転行列Uを無作為に選択し、選択したK個の回転行列Uを初期値として回転行列記憶部106に記憶し、回転行列Uを初期化する(ステップS102)。
続いて、割当部110は、回転行列記憶部106に記憶されているK個の回転行列Uで規定されるK個の部分空間を生成し、ベクトル記憶部104に記憶されているN個の対数共分散ベクトルξの各々を最も近い部分空間に割り当て、割り当てた部分空間のインデックスrをインデックス記憶部112に記憶する(ステップS104)。
続いて、更新部114は、回転行列記憶部106に記憶されているK’個の回転行列Uの各々について、インデックス記憶部112に記憶されているN個のインデックスrに基づいて当該回転行列Uで規定される部分空間に割り当てられた対数共分散ベクトルξを特定し、特定した対数共分散ベクトルξから当該部分空間までの距離の二乗の和が減少するように、当該回転行列Uを更新する(ステップS106)。
割当部110及び更新部114は、繰り返し回数などの終了条件を満たすまでステップS104、S106の処理を繰り返す(ステップS108でNo)。
そして、終了条件を満たすと(ステップS108でYes)、射影部116は、回転行列記憶部106に記憶されている更新されたK’個の回転行列U’及び更新されなかったK−K’個の回転行列Uで規定されるK個の部分空間を生成し、対数共分散ベクトルξの各々を最も近い部分空間へ射影するとともに対角行列を求め、N個のインデックスr及びN個の対角行列Dを出力する(ステップS110)。
最後に、モデル学習装置100は、回転行列記憶部106に記憶されている更新されたK’個の回転行列U’及び更新されなかったK−K’個の回転行列U、並びに射影部116により出力されたインデックスr及び対角行列Dを出力する。
以上のように第1実施形態によれば、K個の部分空間をN個の対数共分散ベクトルに割り当てることによって、N個の共分散行列の回転行列をK個にそろえられ(共有化され)、セミタイド共分散行列に変換されるので、セミタイド共分散行列を用いた場合の尤度評価を低演算量で実行することが可能となり、高速な尤度演算が可能となる。
また、第1実施形態によれば、各共分散行列がいずれの回転行列を使うかを指定するクラス(インデックス)を対数共分散ベクトルに基づいて決定するため、元の共分散行列を高精度に再現でき、元の共分散行列の尤度を高精度に近似した値を演算することが可能となり、認識性能を向上させることが可能となる。
また、第1実施形態では、対数共分散ベクトルの各々を部分空間に割り当てる際に、対数共分散ベクトルから部分空間に垂線を降ろすことにより、最も近い部分空間を特定し、特定した部分空間に対数共分散ベクトルを割り当てる。このため第1実施形態によれば、回転行列の値の変更だけでなく対角行列(各軸のスケーリング)の値の変更も考慮して回転行列のクラスを選択するので、より適切な回転行列のクラスを選択することができる。これにより、元の共分散行列の再現性が更に高まり、認識性能を更に向上させることが可能となる。
ここで、第1実施形態のクラスの決定方法の優位性を、前述したM.Galesの文献に記載されている最尤基準でガウス分布をいずれのクラスに割り当てるかを決定する方法と比較して説明する。
図12〜15は、第1実施形態との比較例を示す図であり、最尤基準でクラス割り当てを決定する従来の決定方法の問題点の説明図である。
まず、共分散行列の第1軸方向の分散(λ)が7.6(つまり、標準偏差が7.6)、共分散行列の第2軸方向の分散(λ)が4.0であるとともに、K(K=2)個の回転行列があり、一方は回転角θ=0°であり、他方は回転角θ=30°であるという状況を考える。このような場合、最尤基準でクラス割り当てを決定する従来の決定方法では、与えられた特徴ベクトルセット180(ガウス分布)に対する尤度が高くなるような回転行列を選択する。
図12は、回転行列の回転角θが0°となる共分散行列181を示しており、第1軸方向の分散(λ)が7.6、第2軸方向の分散(λ)が4.0、回転角θが0°となっている。図13は、回転行列の回転角θが30°となる共分散行列182を示しており、第1軸方向の分散(λ)が7.6、第2軸方向の分散(λ)が4.0、回転角θが30°となっている。
図12と図13とを比べると、共分散行列181の方が特徴ベクトルセット180に対する尤度が高くなるため、最尤基準でクラス割り当てを決定する従来の決定方法では、特徴ベクトルセット180(ガウス分布)は、回転角θ=0°の回転行列のクラスに割り当てられる。
しかしながら、図14に示すように、回転行列の回転角θが30°であるが、第1軸方向の分散及び第2軸方向の分散を適切に調整した共分散行列183(第1軸方向の分散(λ)が7.8、第2軸方向の分散(λ)が2.0)の方が、特徴ベクトルセット180によりよくフィットする(尤度が高くなる)ことが分かる。
従って、この状況では、特徴ベクトルセット180(ガウス分布)を、回転角θ=30°の回転行列のクラスに割り当てる方がより適切であることがわかる。
最尤基準でクラス割り当てを決定する従来の決定方法では、対角行列(各軸の分散)を固定したまま、回転行列を取り換えて、尤度が最大になる回転行列を選択するため、上述のような状況では、適切なクラスを選択することができない。
更に、最尤基準でクラス割り当てを決定する従来の決定方法の問題点を、図15に示す対数共分散ベクトルの空間で説明する。図15に示す例では、対数共分散ベクトルξの空間に、部分空間190(部分空間#1)が回転角θ=0°の回転行列で規定されるとともに、部分空間191(部分空間#2)が回転角θ=30°の回転行列で規定されている。
点Aは、与えられた特徴ベクトルセット180の共分散行列を変換した対数共分散ベクトルを表す。ここで、最尤基準でクラス割り当てを決定する従来の決定方法では、共分散行列の第1軸方向の分散(λ)が7.6、共分散行列の第2軸方向の分散(λ)が4.0に固定されているということになるが、これは、部分空間内での座標値が(log(7.6),log(4.0))に固定されることを意味する。
このように座標値が固定されている状況では、点Aから部分空間190における座標値が(log(7.6),log(4.0))となる点Bまでの距離である距離ABと、点Aから部分空間191における座標値が(log(7.6),log(4.0))となる点Cまでの距離である距離ACとを、比較することにより、対数共分散ベクトルを部分空間に割り当てる。なお、距離ABや距離ACまでの距離は、概ね尤度と反比例するものと考えることができる。ここでは、図15に示すように、距離AB<距離ACであるため、最尤基準でクラス割り当てを決定する従来の決定方法では、対数共分散ベクトル(点A)は、部分空間190に割り当てられることになる。
しかし、座標値を調整することが可能ならば、部分空間191への点Aの垂線の足である点Dが存在することになり、図15に示すように、距離AB>距離ADとなるため、対数共分散ベクトル(点A)を部分空間191に割り当てることがより適切となる。
最尤基準でクラス割り当てを決定する従来の決定方法では、対角行列(各軸の分散)である座標値を固定したまま距離を比較することになるため、上述のような状況では、対数共分散ベクトルを適切な部分空間に割り当てることができず、適切なクラスを選択することができない。
これに対し、第1実施形態の方法では、対数共分散ベクトルから部分空間までの距離を計算する際に、対数共分散ベクトルから部分空間に垂線を降ろして距離を計算する。このため第1実施形態によれば、回転行列の値の変更だけでなく対角行列(各軸のスケーリング)の値の変更も考慮して回転行列のクラスを選択するので、上述のような問題は発生せず、より適切な回転行列のクラスを選択することができる。
なお第1実施形態のモデル学習装置100で学習した共分散行列(モデル)は、音声認識に用いる音響モデルや文字認識に用いるモデルとして使用することができる。音響モデルとしては、例えば、混合ガウス分布を出力分布とする隠れマルコフモデルなどが挙げられる。
(第2実施形態)
第2実施形態では、音響モデルを学習する例について説明する。以下では、第1実施形態との相違点の説明を主に行い、第1実施形態と同様の機能を有する構成要素については、第1実施形態と同様の名称・符号を付し、その説明を省略する。
図16は、第2実施形態のモデル学習装置200の一例を示す構成図である。モデル学習装置200は、図16に示すように、共分散行列記憶部204及び平均ベクトル記憶部206を含む音響モデル記憶部202と、特徴ベクトル記憶部208と、占有確率計算部210と、占有確率記憶部212と、ガウス分布計算部214と、学習部216とを、備える。なお、学習部216は、第1実施形態のモデル学習装置100に相当する。
音響モデル記憶部202(共分散行列記憶部204及び平均ベクトル記憶部206)、特徴ベクトル記憶部208、及び占有確率記憶部212は、例えば、HDD、SSD、RAM、メモリカードなどの磁気的、光学的、又は電気的に記憶可能な記憶装置の少なくともいずれかにより実現できる。占有確率計算部210及びガウス分布計算部214は、例えば、CPUなどの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現できる。
音響モデル記憶部202は、混合ガウス分布を出力分布とする隠れマルコフモデルによって表される音響モデルを記憶する。第2実施形態では、音響モデルをM(M≧1)個のガウス分布で表し、各ガウス分布は、平均ベクトルμ及び共分散行列Σを有するものとする。
共分散行列記憶部204は、M個の共分散行列Σ(詳細には、共分散行列{Σ,…,Σ})を記憶し、平均ベクトル記憶部206は、M個の平均ベクトルμ(詳細には、平均ベクトル{μ,…,μ})を記憶する。
特徴ベクトル記憶部208は、特徴ベクトルo(t)を記憶する。ここで、t=1…T(T≧1)とする。
占有確率計算部210は、特徴ベクトル記憶部208から第t番目の特徴ベクトルo(t)を取得するとともに、音響モデル記憶部202から第m(m=1…M)番目のガウス分布(平均ベクトルμ及び共分散行列Σ)を取得し、取得した特徴ベクトルo(t)が、取得したガウス分布を占有する占有確率γ(t)を計算する。そして占有確率計算部210は、計算した占有確率γ(t)を占有確率記憶部212に記憶する。占有確率計算部210は、例えば、フォワードバックワードアルゴリズムにより占有確率γ(t)を計算する。
フォワードバックワードアルゴリズムは公知技術であり、例えば、Rabiner, “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition,” Proceedings of the IEEE, Vol.77, No.2, pp.257−286, February 1989.に開示されている。
占有確率記憶部212は、占有確率γ(t)を記憶する。
ガウス分布計算部214は、特徴ベクトル記憶部208から第t番目の特徴ベクトルo(t)を取得するとともに、占有確率記憶部212から占有確率γ(t)を取得し、各ガウス分布(平均ベクトルμ及び共分散行列Σ)を計算し、音響モデル記憶部202の音響モデルを更新する。ガウス分布計算部214は、例えば、数式(17)を用いて、第m番目の平均ベクトルμを計算し、数式(18)を用いて、第m番目の共分散行列Σを計算する。なお、ガウス分布計算部214は、混合ガウス分布を用いる場合には、混合係数もあわせて更新する。
Figure 2013205807
Figure 2013205807
ガウス分布の計算も公知技術であり、例えば、前述したRabinerの文献に記載されている。
学習部216は、第1実施形態で説明した方法で共分散行列Σを学習する。具体的には、学習部216は、共分散行列記憶部204からM個の共分散行列Σを取得し、第1実施形態で説明した方法で学習して、K個の回転行列U’、M個のインデックスr、及びM個の対角行列Dを得る。そして学習部216は、K個の回転行列U’、M個のインデックスr、及びM個の対角行列Dで共分散行列記憶部204のM個の共分散行列Σを更新する。学習部216は、例えば、数式(19)を用いて、第m番目の共分散行列Σを更新する。
Figure 2013205807
図17は、第2実施形態のモデル学習装置200で実行される処理の一例を示すフローチャートである。
まず、占有確率計算部210は、T個の特徴ベクトルo(t)及びM個のガウス分布(M個の平均ベクトルμ及びM個の共分散行列Σ)を用いて、特徴ベクトルo(t)毎に当該特徴ベクトルo(t)がM個のガウス分布の各々を占有する占有確率γ(t)を計算する(ステップS200)。
続いて、ガウス分布計算部214は、T個の特徴ベクトル及びT×M個の占有確率を用いて、M個のガウス分布を計算し、M個の平均ベクトルμ及びM個の共分散行列Σを更新する(ステップS202)。
続いて、学習部216は、全ての共分散行列Σを学習する(ステップS204)。
占有確率計算部210、ガウス分布計算部214、及び学習部216は、繰り返し回数などの終了条件を満たすまでステップS200〜S204の処理を繰り返す(ステップS206でNo)。なお、ステップS200〜S204の処理を繰り返す間、学習部216は、回転行列を共有化しないため、ガウス分布計算部214は、全ての共分散行列Σを独立に計算する。
そして、終了条件を満たすと(ステップS206でYes)、学習部216は、共分散行列記憶部204において、学習により得た回転行列のインデックス(クラス)に従い、回転行列を共有化する(ステップS208)。つまり、学習部216は、共分散行列をセミタイド共分散行列に変換する。
最後に、モデル学習装置200は、音響モデル記憶部202に記憶されている音響モデル(共分散行列及び平均ベクトル)を出力する。
以上のように第2実施形態によれば、音響モデルを用いた尤度評価を低演算量で実行することが可能となり、高速な尤度演算が可能となるとともに、音声認識性能を向上させることが可能となる。
(ハードウェア構成)
上記各実施形態のモデル学習装置は、CPUなどの制御装置と、ROM(Read Only Memory)やRAM(Random Access Memory)などの記憶装置と、HDD(Hard Disk Drive)やSSD(Solid State Drive)などの外部記憶装置と、ディスプレイなどの表示装置と、マウスやキーボードなどの入力装置と、通信I/Fとを、備えており、通常のコンピュータを利用したハードウェア構成で実現できる。
上記各実施形態のモデル学習装置で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
また、上記各実施形態のモデル学習装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記各実施形態のモデル学習装置を、インターネット等のネットワーク経由で提供または配布するようにしてもよい。
また、上記各実施形態のモデル学習装置で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。
上記各実施形態のモデル学習装置で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、例えば、制御装置が外部記憶装置からプログラムを記憶装置上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
以上説明したとおり、上記各実施形態によれば、演算量を削減しつつ、認識性能を向上させることを可能とする。
なお本発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。
例えば、上記各実施形態のフローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更し、複数同時に実施し、あるいは実施毎に異なった順序で実施してもよい。
100、200 モデル学習装置
102 変換部
104 ベクトル記憶部
106 回転行列記憶部
108 初期化部
110 割当部
112 インデックス記憶部
114 更新部
116 射影部
202 音響モデル記憶部
204 共分散行列記憶部
206 平均ベクトル記憶部
208 特徴ベクトル記憶部
210 占有確率計算部
212 占有確率記憶部
214 ガウス分布計算部
216 学習部

Claims (8)

  1. 入力されたN(N≧1)個の共分散行列の各々を変換してN個の対数共分散ベクトルを得る変換部と、
    前記N個の対数共分散ベクトルの各々を、前記N個の共分散行列から得られるK(1≦K≦N)個の回転行列のうち最も近い回転行列に割り当てる割当部と、
    割り当てられたK’(1≦K’≦K)個の回転行列の各々について、当該回転行列に割り当てられた前記対数共分散ベクトルを特定し、特定した前記対数共分散ベクトルに基づいて当該回転行列を更新する更新部と、
    前記N個の対数共分散ベクトルの各々を、更新されたK’個の回転行列及び更新されなかったK−K’個の回転行列のうち最も近い回転行列に射影する射影部と、
    を備えるモデル学習装置。
  2. 前記変換部は、前記N個の共分散行列の各々を変換してN個の対数共分散行列を得、前記N個の対数共分散行列の各々を変換して前記N個の対数共分散ベクトルを得る請求項1に記載のモデル学習装置。
  3. 前記射影部は、前記N個の対数共分散ベクトルの各々を射影する回転行列のインデックスを取得するとともに、前記N個の共分散行列から得られるN個の対角行列を前記射影に基づいて更新する請求項1又は2に記載のモデル学習装置。
  4. 前記割当部は、前記N個の対数共分散ベクトルの各々から前記K個の回転行列各々へ正射影して最も近い回転行列を特定し、
    前記射影部は、前記N個の対数共分散ベクトルの各々を、前記K’個の回転行列及び前記K−K’個の回転行列のうち最も近い回転行列に正射影し、当該正射影の結果を用いて前記N個の対角行列を更新する請求項3に記載のモデル学習装置。
  5. 前記更新部は、割り当てられた前記K’個の回転行列の各々について、当該回転行列に割り当てられた前記対数共分散ベクトルを特定し、特定した前記対数共分散ベクトルを当該回転行列へ正射影した距離の二乗の和が減少するように、当該回転行列を更新する請求項4に記載のモデル学習装置。
  6. T(T≧1)個の特徴ベクトル、並びにN個のガウス分布それぞれを構成する平均ベクトル及び共分散行列を用いて、特徴ベクトル毎に当該特徴ベクトルが各ガウス分布を占有する占有確率を計算する占有確率計算部と、
    前記T個の特徴ベクトル及び前記T×N個の占有確率を用いて、前記N個のガウス分布を計算し、前記N個の平均ベクトル及び前記N個の共分散行列を更新するガウス分布計算部と、を更に備え、
    前記変換部は、更新された前記N個の共分散行列の各々を変換して前記N個の対数共分散ベクトルを得る請求項1〜5のいずれか1つに記載のモデル学習装置。
  7. 変換部が、入力されたN(N≧1)個の共分散行列の各々を変換してN個の対数共分散ベクトルを得る変換ステップと、
    割当部が、前記N個の対数共分散ベクトルの各々を、前記N個の共分散行列から得られるK(1≦K≦N)個の回転行列のうち最も近い回転行列に割り当てる割当ステップと、
    更新部が、割り当てられたK’(1≦K’≦K)個の回転行列の各々について、当該回転行列に割り当てられた前記対数共分散ベクトルを特定し、特定した前記対数共分散ベクトルに基づいて当該回転行列を更新する更新ステップと、
    射影部が、前記N個の対数共分散ベクトルの各々を、更新されたK’個の回転行列及び更新されなかったK−K’個の回転行列のうち最も近い回転行列に射影する射影ステップと、
    を含むモデル製造方法。
  8. 入力されたN(N≧1)個の共分散行列の各々を変換してN個の対数共分散ベクトルを得る変換ステップと、
    前記N個の対数共分散ベクトルの各々を、前記N個の共分散行列から得られるK(1≦K≦N)個の回転行列のうち最も近い回転行列に割り当てる割当ステップと、
    割り当てられたK’(1≦K’≦K)個の回転行列の各々について、当該回転行列に割り当てられた前記対数共分散ベクトルを特定し、特定した前記対数共分散ベクトルに基づいて当該回転行列を更新する更新ステップと、
    前記N個の対数共分散ベクトルの各々を、更新されたK’個の回転行列及び更新されなかったK−K’個の回転行列のうち最も近い回転行列に射影する射影ステップと、
    をコンピュータに実行させるためのプログラム。
JP2012078036A 2012-03-29 2012-03-29 モデル学習装置、モデル学習方法、及びプログラム Expired - Fee Related JP5612014B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012078036A JP5612014B2 (ja) 2012-03-29 2012-03-29 モデル学習装置、モデル学習方法、及びプログラム
US13/852,198 US20130262058A1 (en) 2012-03-29 2013-03-28 Model learning apparatus, model manufacturing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012078036A JP5612014B2 (ja) 2012-03-29 2012-03-29 モデル学習装置、モデル学習方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013205807A true JP2013205807A (ja) 2013-10-07
JP5612014B2 JP5612014B2 (ja) 2014-10-22

Family

ID=49236184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012078036A Expired - Fee Related JP5612014B2 (ja) 2012-03-29 2012-03-29 モデル学習装置、モデル学習方法、及びプログラム

Country Status (2)

Country Link
US (1) US20130262058A1 (ja)
JP (1) JP5612014B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210072844A (ko) * 2019-12-09 2021-06-18 재단법인 아산사회복지재단 양자 택일을 이용한 선호 순위 산출 방법 및 프로그램

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307961B (zh) * 2020-10-30 2024-02-20 魏运 混合光纤入侵信号的处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0354600A (ja) * 1989-05-09 1991-03-08 Texas Instr Inc <Ti> 不明人物の同一性検証方法
JPH05241589A (ja) * 1991-12-05 1993-09-21 Internatl Business Mach Corp <Ibm> 非ユーザ基準データから生成される話者依存的プロトタイプを有する音声コード化装置
JPH10307593A (ja) * 1997-03-14 1998-11-17 Lucent Technol Inc 話者認証用確率的マッチング方法
JP2003177785A (ja) * 2001-12-10 2003-06-27 Nec Corp 線形変換行列計算装置及び音声認識装置
JP2006201265A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd 音声認識装置
JP2007128050A (ja) * 2005-09-30 2007-05-24 Mitsubishi Electric Research Laboratories Inc オブジェクトのクラスのモデルの集合からオブジェクトのクラスの特定のモデルを選択する方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09297112A (ja) * 1996-03-08 1997-11-18 Mitsubishi Heavy Ind Ltd 構造パラメータ解析装置及び解析方法
US8706041B2 (en) * 2010-09-16 2014-04-22 Dynamic Invention Llc Multiple-input, multiple-output cognitive radio

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0354600A (ja) * 1989-05-09 1991-03-08 Texas Instr Inc <Ti> 不明人物の同一性検証方法
JPH05241589A (ja) * 1991-12-05 1993-09-21 Internatl Business Mach Corp <Ibm> 非ユーザ基準データから生成される話者依存的プロトタイプを有する音声コード化装置
JPH10307593A (ja) * 1997-03-14 1998-11-17 Lucent Technol Inc 話者認証用確率的マッチング方法
JP2003177785A (ja) * 2001-12-10 2003-06-27 Nec Corp 線形変換行列計算装置及び音声認識装置
JP2006201265A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd 音声認識装置
JP2007128050A (ja) * 2005-09-30 2007-05-24 Mitsubishi Electric Research Laboratories Inc オブジェクトのクラスのモデルの集合からオブジェクトのクラスの特定のモデルを選択する方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNJ201110010127; 篠原雄介他: '"リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮"' 日本音響学会2010年春季研究発表会講演論文集CD-ROM , 201003, pp.31-34 *
JPN6014020237; 篠原雄介他: '"リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮"' 日本音響学会2010年春季研究発表会講演論文集CD-ROM , 201003, pp.31-34 *
JPN6014020238; Yusuke SHINOHARA, et al.: '"COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION"' Proceedings of the 2010 IEEE International Conference on Acoustics Speech and Signal Processing (ICA , 201003, pp.4326-4329 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210072844A (ko) * 2019-12-09 2021-06-18 재단법인 아산사회복지재단 양자 택일을 이용한 선호 순위 산출 방법 및 프로그램
KR102729898B1 (ko) * 2019-12-09 2024-11-14 재단법인 아산사회복지재단 양자 택일을 이용한 선호 순위 산출 방법 및 프로그램

Also Published As

Publication number Publication date
JP5612014B2 (ja) 2014-10-22
US20130262058A1 (en) 2013-10-03

Similar Documents

Publication Publication Date Title
JP7315748B2 (ja) データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法
CN113766229B (zh) 一种编码方法、解码方法、装置、设备及可读存储介质
JP3949150B2 (ja) 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体
JP5214760B2 (ja) 学習装置、方法及びプログラム
JP5349407B2 (ja) 平均値シフト手順を使用してサンプルをクラスタリングするプログラム
JP6673226B2 (ja) 特徴変換装置、認識装置、特徴変換方法及びコンピュータ読み取り可能記録媒体
US20240232574A9 (en) Method and apparatus for predicting recipe property reflecting similarity between chemical materials
JP5612014B2 (ja) モデル学習装置、モデル学習方法、及びプログラム
KR102631980B1 (ko) 복수의 무방향 그래프들 처리 방법 및 장치
CN112766348A (zh) 一种基于对抗神经网络生成样本数据的方法以及装置
CN119203046B (zh) 元宇宙众包环境下多源非结构化文本服务的真值挖掘方法
US11526691B2 (en) Learning device, learning method, and storage medium
WO2020040007A1 (ja) 学習装置、学習方法及び学習プログラム
US20100088073A1 (en) Fast algorithm for convex optimization with application to density estimation and clustering
US20250181943A1 (en) Method and devices of an efficient gaussian mixture model (gmm) distribution based approximation of a data set in a computing environment
US20130238346A1 (en) Low complexity target vector identification
JP2014179064A (ja) 制御方策決定装置、制御方策決定方法、制御方策決定プログラム、及び制御システム
CN113780324A (zh) 数据处理方法、装置、电子设备及存储介质
JPH10289320A (ja) 候補テーブルを用いて分類を行うパターン認識装置および方法
US11989211B2 (en) Non-transitory computer-readable recording medium, data clustering method, and information processing apparatus
JP6409463B2 (ja) パターン認識装置、パターン学習装置、パターン学習方法およびパターン学習プログラム
CN114821173A (zh) 图像分类方法、装置、设备及存储介质
JP5410741B2 (ja) データ処理システム及びデータ処理プログラム
JP5659203B2 (ja) モデル学習装置、モデル作成方法及びモデル作成プログラム
JPH10301917A (ja) 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140805

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140903

LAPS Cancellation because of no payment of annual fees