JPS60202489A - 音声認識方法 - Google Patents
音声認識方法Info
- Publication number
- JPS60202489A JPS60202489A JP59058709A JP5870984A JPS60202489A JP S60202489 A JPS60202489 A JP S60202489A JP 59058709 A JP59058709 A JP 59058709A JP 5870984 A JP5870984 A JP 5870984A JP S60202489 A JPS60202489 A JP S60202489A
- Authority
- JP
- Japan
- Prior art keywords
- frames
- phoneme
- speech recognition
- recognition method
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声の内容を自動的に認識するだめの音声認識
方法に関するものである。
方法に関するものである。
従来例の構成とその問題点
近年、不特定話者、多数語を対象とする音声認識に対す
る研究開発が盛んになってきた。
る研究開発が盛んになってきた。
音素認識を行うことを特徴とする音声認識における従来
の音素判別は、井出他:「スペクトルの動的特徴による
子音認識の検討」1日本音響学会講論集、1981.6
.2−1−2に述べられている。そのフローチャートを
第1図に示す。
の音素判別は、井出他:「スペクトルの動的特徴による
子音認識の検討」1日本音響学会講論集、1981.6
.2−1−2に述べられている。そのフローチャートを
第1図に示す。
まず標準パターンの作成手順について述べる。
音声中の子音及び半母音を対象として10m5毎に29
チャネル帯域フィルタ群(Q=6 、中心周波数260
〜6300H2で晃オクターブ間隔)の出力を得る。さ
らに周波数軸に沿って連続する数帯域をまとめて6チヤ
ネルとする。この6テヤネルを1フレームとし、このフ
レームを連続して6フレーム取り出し、6X5=30次
元ベクトルとする。これを音素毎に集計し、音素iに対
する平均値をImi、共分散行列をXwiとし、逆行列
を町−1として、ImiとXwI−’を標準パターンと
して標準パターン格納部に予め入れておく。
チャネル帯域フィルタ群(Q=6 、中心周波数260
〜6300H2で晃オクターブ間隔)の出力を得る。さ
らに周波数軸に沿って連続する数帯域をまとめて6チヤ
ネルとする。この6テヤネルを1フレームとし、このフ
レームを連続して6フレーム取り出し、6X5=30次
元ベクトルとする。これを音素毎に集計し、音素iに対
する平均値をImi、共分散行列をXwiとし、逆行列
を町−1として、ImiとXwI−’を標準パターンと
して標準パターン格納部に予め入れておく。
次に入力された未知音声を音響分析して第1図の処理イ
に示すように29チヤネル帯域フイルタの出力た’j(
Jc″1,1+都、2.°・曲、xl、′シ9)を得、
次に処理口に示すように前記出力を数帯域毎にまとめて
6チヤネル&< (、Zl:1 、 JCl、’2 、
・・・・・・、 L、テロ )にし、処理ハに示すよう
に得られたスペクトルの連続する5 7 L/ −ム分
1t’4. JC’2 HL’5 、 j41 !’5
を計算し、処理二のように6X5=30次元ベクトルt
r、<、x、。
に示すように29チヤネル帯域フイルタの出力た’j(
Jc″1,1+都、2.°・曲、xl、′シ9)を得、
次に処理口に示すように前記出力を数帯域毎にまとめて
6チヤネル&< (、Zl:1 、 JCl、’2 、
・・・・・・、 L、テロ )にし、処理ハに示すよう
に得られたスペクトルの連続する5 7 L/ −ム分
1t’4. JC’2 HL’5 、 j41 !’5
を計算し、処理二のように6X5=30次元ベクトルt
r、<、x、。
”2+・・・・・・、Jl:3o)に変換する。さらに
このベクトルについて、前述した標準パターンを用いて
処理ホに示すようにベイズ判定による類似度割算を行う
。
このベクトルについて、前述した標準パターンを用いて
処理ホに示すようにベイズ判定による類似度割算を行う
。
音素iに対する類似度P、iは次式でめることかで ゛
きる。
きる。
このPiを音素毎にめ、最も類似度の高い音素をめるこ
とにより音素判別を行い(処理へ)その結果を音素認識
部に転送する。
とにより音素判別を行い(処理へ)その結果を音素認識
部に転送する。
この方法は、子音や半m音のようにスペクトルの時間変
化に特徴のある音素に対して、変化の動きを積極的にと
らえる考え方である。
化に特徴のある音素に対して、変化の動きを積極的にと
らえる考え方である。
第2図は半母音、拗音のスペクトル変化の例を示したも
のである。aは前記従来例と類似の場合を表わし、横軸
に時間をフレーム+、1を信で示す。また縦軸に隣接す
るスペクトルの距離をLPGケプ6 ゛ ストラム係数のユークリッド距離で示す。この距離曲線
はフレーム数13の間、あるいき値(TH)以下の小さ
い値で接続し、半母音、拗音が130m5の長い時間接
続していることを示す。しかし前記従来例では類似度計
算に必要な演算量が膨大になる理由から、○印で示す6
フレームのみ使用している。このため、半母音、拗音の
特徴を十分にとらえ切れず、判別の精度が悪い欠点があ
る。
のである。aは前記従来例と類似の場合を表わし、横軸
に時間をフレーム+、1を信で示す。また縦軸に隣接す
るスペクトルの距離をLPGケプ6 ゛ ストラム係数のユークリッド距離で示す。この距離曲線
はフレーム数13の間、あるいき値(TH)以下の小さ
い値で接続し、半母音、拗音が130m5の長い時間接
続していることを示す。しかし前記従来例では類似度計
算に必要な演算量が膨大になる理由から、○印で示す6
フレームのみ使用している。このため、半母音、拗音の
特徴を十分にとらえ切れず、判別の精度が悪い欠点があ
る。
この欠点を解消するために第2図すに示すように13個
のフレームを用いることが考えられる。
のフレームを用いることが考えられる。
第2図すは第2図aと同じ半母音、拗音についてフレー
ム数13を用いる場合を○印で示したものである。この
場合半母音、拗音の特徴を十分にとらえることが可能で
あるが、類似度計算のために膨大々演算量を必要とし、
装置にした場合に高価となる欠点があった。
ム数13を用いる場合を○印で示したものである。この
場合半母音、拗音の特徴を十分にとらえることが可能で
あるが、類似度計算のために膨大々演算量を必要とし、
装置にした場合に高価となる欠点があった。
発明の目的
本発明は前記欠点を解消し、音声の自動認識において、
音素又は音節の判別を高い判別精度で、かつ少ない演算
量で実現するための音声認識方法6 で 。
音素又は音節の判別を高い判別精度で、かつ少ない演算
量で実現するための音声認識方法6 で 。
を提供することを目的とする。
発明の構成
本発明は前記目的を達成するもので、多数話者の音声か
ら作成された標準パターンを予め用意しておき、入力未
知音声を連続するn個の一定時間区間(フレーム)に分
割し、前記各フレーム毎に音声を分析してスペクトル情
報をめ、前記n個のフレームより、連続しないフレーム
を少々くとも含むX個(n>X )のフレームを抽出し
、前記X個のフレームのスペクトル情報と前記標準パタ
ーンとの類似度を計算することにより音素又は音節の判
別を行うことを特徴とする音声認識方法を提供するもの
である。
ら作成された標準パターンを予め用意しておき、入力未
知音声を連続するn個の一定時間区間(フレーム)に分
割し、前記各フレーム毎に音声を分析してスペクトル情
報をめ、前記n個のフレームより、連続しないフレーム
を少々くとも含むX個(n>X )のフレームを抽出し
、前記X個のフレームのスペクトル情報と前記標準パタ
ーンとの類似度を計算することにより音素又は音節の判
別を行うことを特徴とする音声認識方法を提供するもの
である。
実施例の説明
以下に本発明の実施例を図面を用いて説明する。
第3図は本発明の音声認識方法を具現化する装置の一実
施例を示すブロック図である。
施例を示すブロック図である。
図にオイて1は音響分析部で、マイク等で入力すれた音
声の分析を行う。分析方法としては線形予測分析を行な
い、フレーム周期(1oms程i)毎にLPCケプスト
ラム係数を得る。
声の分析を行う。分析方法としては線形予測分析を行な
い、フレーム周期(1oms程i)毎にLPCケプスト
ラム係数を得る。
2は音素判別部で、音響分析部1で得たLPCケプスト
ラム係数によってフレーム毎の音素判別を行う。
ラム係数によってフレーム毎の音素判別を行う。
3は標準パターン格納部で、予め多数話者の音声によシ
音素毎にめた標準パターンを格納しておく。
音素毎にめた標準パターンを格納しておく。
4はセグメンテーション部で、音響分析部10分析出力
をもとに音声区間の検出と音素毎の境界決定(以下セグ
メンテーションと呼ぶ)を行う。
をもとに音声区間の検出と音素毎の境界決定(以下セグ
メンテーションと呼ぶ)を行う。
6は音素認識部で、セグメンテーション部4と音素判別
部2の結果をもとに1つの音素区間毎に何という音素で
あるかを決定する作業を行う。この結果として音素の系
列が完成する。
部2の結果をもとに1つの音素区間毎に何という音素で
あるかを決定する作業を行う。この結果として音素の系
列が完成する。
6は単語認識部で、前記音素系列を、同様に音素系列で
表記された単語辞書7と照合し、最も類似度の高い単語
を認識結果として出力する。
表記された単語辞書7と照合し、最も類似度の高い単語
を認識結果として出力する。
7は前述した単語辞書である。
次に半母音、拗音の認識方法を例に第4図のフローチャ
ートを用いてさらに詳細に説明する。本方法は半母音、
拗音に限らず、母音、鼻音、摩擦子音等のスペクトルの
時間変化のゆっくりした音素に対して効果のある方法で
ある。
ートを用いてさらに詳細に説明する。本方法は半母音、
拗音に限らず、母音、鼻音、摩擦子音等のスペクトルの
時間変化のゆっくりした音素に対して効果のある方法で
ある。
統計的距離尺度としてベイズ判定、マハラノビス距離等
があるが、本実施例ではマノ・マノビス距離で説明する
。又、スペクトル情報にはLPCケプヌトラム係数を用
いた場合について述べる。
があるが、本実施例ではマノ・マノビス距離で説明する
。又、スペクトル情報にはLPCケプヌトラム係数を用
いた場合について述べる。
あらかじめ多数話者の単語音声の6母音と半母音。
拗音の区間を決定しておく。この音声を用いて標準バタ
ンを作成する手順を説明する。各音素の始端から連続す
るnフレームそれぞれについてH次までのLPGケプス
トラム係数をめ、その中のm次(N2m)まで、すなわ
ちe + (C+’、 02’。
ンを作成する手順を説明する。各音素の始端から連続す
るnフレームそれぞれについてH次までのLPGケプス
トラム係数をめ、その中のm次(N2m)まで、すなわ
ちe + (C+’、 02’。
・・・・・・+ Cm )を抽出する。次に連続するn
フレームより、連続しないフレームを少なくとも含むよ
うに(本実施例では1フレ一ム間隔で)X個のフレーム
(X(n)を抽出(7、c?(C<、す、・・・・・、
QIIl/)を用いてベクトル(B(0,、C2,・・
・・・・CM)を作成する(M=XXm)。
フレームより、連続しないフレームを少なくとも含むよ
うに(本実施例では1フレ一ム間隔で)X個のフレーム
(X(n)を抽出(7、c?(C<、す、・・・・・、
QIIl/)を用いてベクトル(B(0,、C2,・・
・・・・CM)を作成する(M=XXm)。
こののによって各音素毎の平均値1m1(iは音素基)
9 。
9 。
と対象とする全音素に共通の共分散共列菌をめる。その
逆行列を−W−1とし、その(j、j’)要素をaij
7とすると、Oj に対する音素iの重み係数a ij
は でまる。又、音素iに対する平均距離(11をdi=I
mitVll−1mi(al でめる。
逆行列を−W−1とし、その(j、j’)要素をaij
7とすると、Oj に対する音素iの重み係数a ij
は でまる。又、音素iに対する平均距離(11をdi=I
mitVll−1mi(al でめる。
このaijおよびdi を標準バタンとして第3図の標
準バタン格納部3に入れておく。
準バタン格納部3に入れておく。
次に、第3図の音響分析部1に入力された未知音声を、
フレーム毎に線形予測分析し連続するnフレームそれぞ
れについてN次のLPCケブヌトラム係数をめ、そのな
かから第4図処理トに示すm次(N2m)までのLPC
iケプストラム係数lr、1(xlt、x2’、・−−
−、xm’)を抽出する。
フレーム毎に線形予測分析し連続するnフレームそれぞ
れについてN次のLPCケブヌトラム係数をめ、そのな
かから第4図処理トに示すm次(N2m)までのLPC
iケプストラム係数lr、1(xlt、x2’、・−−
−、xm’)を抽出する。
次に連続するnフレームより、連続し攻いフレー1゜
ムを少なくとも含むように(例えば本実施例では1フレ
一ム間隔で)X個のフレームを抽出し、処理チに示すよ
うにXフレーム分ハ、#≦、・・・・・・、/l’y(
計算する。
一ム間隔で)X個のフレームを抽出し、処理チに示すよ
うにXフレーム分ハ、#≦、・・・・・・、/l’y(
計算する。
さらに処理トと処理チの結果を用いて、処理りに示すよ
うにXXm=M次元ベクトルI’ (x、+ −” 2
+・・・・・・、xM)に変換する。
うにXXm=M次元ベクトルI’ (x、+ −” 2
+・・・・・・、xM)に変換する。
このμを用いて、標準パターン格納部3の標準パターン
によって次式で類似度/iをめる。
によって次式で類似度/iをめる。
〜
このliを入力音声の各フレーム毎にめ(処理ヌ)、類
似度最大となる音素を判別結果として(処理ル)音素認
識部6に転送する。音素認識部6はこの結果とセグメン
テーション部4の結果を ゛組合せて音素の時系列を作
成し、単語認識部6に送る。単語認識部6はあらかじめ
音素の時系列で表記されている単語辞書7を照合し、最
も類似度の高い単語名を堅識結果として出力する。
似度最大となる音素を判別結果として(処理ル)音素認
識部6に転送する。音素認識部6はこの結果とセグメン
テーション部4の結果を ゛組合せて音素の時系列を作
成し、単語認識部6に送る。単語認識部6はあらかじめ
音素の時系列で表記されている単語辞書7を照合し、最
も類似度の高い単語名を堅識結果として出力する。
11
第5図に具体例を示す
第6図aに半母音、拗音のスペクトル変化の例を示す。
横軸に時間をフレーム単位で示す。縦軸に隣接するスペ
クトルの距離をLPGケプストラム係数のユークリッド
距離で示す。この距離曲線は13フレーム中でいき値(
’l’Hで示す)を越えず、スペクトルの時間変化がゆ
っくりしていることを示す。ここで、いき値は目的とす
る音素(ここでは半母音、拗音)の認識率の最大値が得
られる値に設定する。このため、スペクトルの時間変化
をとらえるのに必ずしも全てのフレームを用いる必要は
ない。本実施例では一つおきに間びいて○印で示すフレ
ームの番号の計7個を使用する。この場合、音素の判別
に必要々LP(3ケプヌトラム係数ノベクトルは6X7
=42となる。標準パターン1個あたりの積と和の演算
量の比較を第1表に示す。
クトルの距離をLPGケプストラム係数のユークリッド
距離で示す。この距離曲線は13フレーム中でいき値(
’l’Hで示す)を越えず、スペクトルの時間変化がゆ
っくりしていることを示す。ここで、いき値は目的とす
る音素(ここでは半母音、拗音)の認識率の最大値が得
られる値に設定する。このため、スペクトルの時間変化
をとらえるのに必ずしも全てのフレームを用いる必要は
ない。本実施例では一つおきに間びいて○印で示すフレ
ームの番号の計7個を使用する。この場合、音素の判別
に必要々LP(3ケプヌトラム係数ノベクトルは6X7
=42となる。標準パターン1個あたりの積と和の演算
量の比較を第1表に示す。
第2図すに示した従来法と本実施例とについて、(1)
式によるベイズ判定と(−41式によるマハラノビス°
距離とに分けて示す。
式によるベイズ判定と(−41式によるマハラノビス°
距離とに分けて示す。
第1表
第1表かられかるように本実施例は、ベイズ判定では従
来法の約30%と大幅に減らすことができる。またマノ
・マノビス距離では従来法の半分に減らすことができる
。
来法の約30%と大幅に減らすことができる。またマノ
・マノビス距離では従来法の半分に減らすことができる
。
また第2図すに示した従来法と第6図aに示した本実施
例について、半母音、拗音の判別精度を比較した結果を
第2表に示す。
例について、半母音、拗音の判別精度を比較した結果を
第2表に示す。
第2表
13 ミ
すなわち、従来法に比較して本実施例は認識率。
バラツキを表わす標準偏差ともに向上する。その理由と
して、ゆりくシしたスペクトルの時間変化を、使用フレ
ームを間びくことによって大局的にとらえることにより
、効率良く特徴をとらえることができるためと考えられ
る。又、余分なスペクトル情報を除くことにより、話者
やコンテキスト等の変動要因によるバラツキを減らすこ
とができるためと考えられる。
して、ゆりくシしたスペクトルの時間変化を、使用フレ
ームを間びくことによって大局的にとらえることにより
、効率良く特徴をとらえることができるためと考えられ
る。又、余分なスペクトル情報を除くことにより、話者
やコンテキスト等の変動要因によるバラツキを減らすこ
とができるためと考えられる。
なお、本発明は連続しない複数のフレームのスペクトル
情報を音素又は音節の判別に使用することを特徴とし、
フレーム数13の場合を例にとると、音素又は音節の種
類によっては第6図す、cの方法も適用される。
情報を音素又は音節の判別に使用することを特徴とし、
フレーム数13の場合を例にとると、音素又は音節の種
類によっては第6図す、cの方法も適用される。
すなわち第5図すに示す曲線は子音/S/の隣接スルス
ペクトル距離をLPCケプヌトラム係数を用いて表わし
たもので、いき値(TH)を越えるフレーム1,2.3
とフレーム12.13は連続して使用し、いき値を越え
ない区間は間びいて使用する。この方法は子音/S/と
/h/のような、4 境界の動きと摩擦部のスペクトルに差のある音素や音節
に対して有効である。
ペクトル距離をLPCケプヌトラム係数を用いて表わし
たもので、いき値(TH)を越えるフレーム1,2.3
とフレーム12.13は連続して使用し、いき値を越え
ない区間は間びいて使用する。この方法は子音/S/と
/h/のような、4 境界の動きと摩擦部のスペクトルに差のある音素や音節
に対して有効である。
また第6図Cに示す曲線は子音/Z/の隣接するスペク
トル距離をLPCケプヌトラム係数を用いて表わしたも
ので、いき値を越えるフレーム1゜2.3.4は連続し
て使用し、いき値を越えない区間は間びいて使用する。
トル距離をLPCケプヌトラム係数を用いて表わしたも
ので、いき値を越えるフレーム1゜2.3.4は連続し
て使用し、いき値を越えない区間は間びいて使用する。
子音/Z/や/C/。
/に/のよう彦、破裂部の動きと摩擦部のスペクトルに
差のある音素や音節に対して有効である。
差のある音素や音節に対して有効である。
なお上記実施例ではいき値を越えた領域には連続フレー
ムを使用する場合について述べたが必ずしも連続である
必要はない。
ムを使用する場合について述べたが必ずしも連続である
必要はない。
また本発明スペクトル情報としては、線形予測分析、帯
域フィルタ群による分析、高速フーリエ変換(FFT)
分析のいずれによっても得ることができる。
域フィルタ群による分析、高速フーリエ変換(FFT)
分析のいずれによっても得ることができる。
さらに本発明の類似度計算は統計的距離尺度を用いて計
算するのが良く、統計的距離尺度としては、ベイズ判定
に基づく距離、マハラノピス距離1、騨形判別関数等が
より好適である。
算するのが良く、統計的距離尺度としては、ベイズ判定
に基づく距離、マハラノピス距離1、騨形判別関数等が
より好適である。
16
発明の効果
以上要するに本発明は、音声を連続するn個のフレーム
に分割し、この各フレーム毎に音声を分析してスペクト
ル情報をめ、前記n個のフレームの中から、連続しない
フレームを少々くとも含むX個のフレーム(X(n)を
抽出し、このX個のフレームのスペクトル情報を用いて
音素又は音節の判別を行うことを特徴として含む音声認
識方法を提供するものであり、 ■ 対象とする音素又は音節のスペクトルの時間変化の
特徴を効率良くとらえることにより、バラツキの少ない
、かつ高い鯵識性能を得ることができる。
に分割し、この各フレーム毎に音声を分析してスペクト
ル情報をめ、前記n個のフレームの中から、連続しない
フレームを少々くとも含むX個のフレーム(X(n)を
抽出し、このX個のフレームのスペクトル情報を用いて
音素又は音節の判別を行うことを特徴として含む音声認
識方法を提供するものであり、 ■ 対象とする音素又は音節のスペクトルの時間変化の
特徴を効率良くとらえることにより、バラツキの少ない
、かつ高い鯵識性能を得ることができる。
■ 音素又は音節の判別に必要な演算量を従来の]/!
〜14に減らすことができ、装置としての低価格化をは
かることができる。
〜14に減らすことができ、装置としての低価格化をは
かることができる。
等の利点を有する。
第1図は従来の音声し織方法における音素判別を説明す
るフローチャート、第2図は従来におけるフレーム抽出
法を説明する図、第3図は本発明の音声認識方法を具現
化する音声認識方法の一実施例を示すブロック図、第4
図は本発明の一実施例における音声認識方法の音素判別
を説明するフローチャート、第5図は本発明におけるフ
レーム抽出法を説明する図である。 1・、・・・音響分析部、2・・・・・・音素判別部、
3・・・・・・標準ハターン格納部、4・・・・・・セ
グメンテーション部、6・・・・・・音素認3%部、6
・・・・・・弔語し識部、7・・・・・・単語辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 2 図 1 第4歯 55図
るフローチャート、第2図は従来におけるフレーム抽出
法を説明する図、第3図は本発明の音声認識方法を具現
化する音声認識方法の一実施例を示すブロック図、第4
図は本発明の一実施例における音声認識方法の音素判別
を説明するフローチャート、第5図は本発明におけるフ
レーム抽出法を説明する図である。 1・、・・・音響分析部、2・・・・・・音素判別部、
3・・・・・・標準ハターン格納部、4・・・・・・セ
グメンテーション部、6・・・・・・音素認3%部、6
・・・・・・弔語し識部、7・・・・・・単語辞書。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 2 図 1 第4歯 55図
Claims (1)
- 【特許請求の範囲】 1)音声を連続するn個の一定時間区間(フレーム)に
分割し、前記各フレーム毎に音声を分析してスペクトル
情報をめ、前記n個のフレームより、連続しないフレー
ムを少なくとも含むX個のフレーム(X<n)を抽出し
、前記X個のフレームのスペクトル情報と予め多数話者
の音声から作成された標準パターンとの類似度を計算す
ることにより音素又は音節の判別を行うことを特徴とす
る音声認識方法。 2)n個のフレームからX個のフレームを抽出する際に
、スペクトル情報の時間的変化速度が閾値を越えない領
域は少々くとも不連続抽出としたことを特徴とする特許
請求の範囲第1項記載の音声認識方法。 3)スペクトル情報を、線形予測分析、帯域フィルタ群
、高速フーリエ変換分析のいずれかによって得ることを
特徴とする特許請求の範囲第1項記載の音声認識方法。 4)類似度計算を統計的距離尺度を用いて行うことを特
徴とする特許請求の範囲第1項記載の音声認識方法。 6)統計的距離尺度が、ベイズ判定に基づく距離。 マハラノビス距離、線形判別関数のいずれかであること
を特徴とする特許請求の範囲第4項記載の音声認識方法
。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59058709A JPS60202489A (ja) | 1984-03-27 | 1984-03-27 | 音声認識方法 |
| US07/501,386 US4991216A (en) | 1983-09-22 | 1990-03-23 | Method for speech recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59058709A JPS60202489A (ja) | 1984-03-27 | 1984-03-27 | 音声認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60202489A true JPS60202489A (ja) | 1985-10-12 |
| JPH0344317B2 JPH0344317B2 (ja) | 1991-07-05 |
Family
ID=13092022
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59058709A Granted JPS60202489A (ja) | 1983-09-22 | 1984-03-27 | 音声認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60202489A (ja) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS53128905A (en) * | 1977-04-15 | 1978-11-10 | Hiroya Fujisaki | Voice discrimination system |
| JPS58209800A (ja) * | 1982-05-31 | 1983-12-06 | 松下電器産業株式会社 | 音素判別方法 |
-
1984
- 1984-03-27 JP JP59058709A patent/JPS60202489A/ja active Granted
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS53128905A (en) * | 1977-04-15 | 1978-11-10 | Hiroya Fujisaki | Voice discrimination system |
| JPS58209800A (ja) * | 1982-05-31 | 1983-12-06 | 松下電器産業株式会社 | 音素判別方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0344317B2 (ja) | 1991-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7711123B2 (en) | Segmenting audio signals into auditory events | |
| EP1393300B1 (en) | Segmenting audio signals into auditory events | |
| EP2549475B1 (en) | Segmenting audio signals into auditory events | |
| Chapaneri | Spoken digits recognition using weighted MFCC and improved features for dynamic time warping | |
| CN109767756B (zh) | 一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法 | |
| EP1041540A1 (en) | Hierarchial subband linear predictive cepstral features for HMM-based speech recognition | |
| JPH08508107A (ja) | 話者認識のための方法および装置 | |
| JPS5972496A (ja) | 単音識別装置 | |
| Imtiaz et al. | Isolated word automatic speech recognition (ASR) system using MFCC, DTW & KNN | |
| CN112309404B (zh) | 机器语音的鉴别方法、装置、设备及存储介质 | |
| Riazati Seresht et al. | Spectro-temporal power spectrum features for noise robust ASR | |
| US5696878A (en) | Speaker normalization using constrained spectra shifts in auditory filter domain | |
| Kamble et al. | Emotion recognition for instantaneous Marathi spoken words | |
| Yavuz et al. | A phoneme-based approach for eliminating out-of-vocabulary problem of Turkish speech recognition using Hidden Markov Model. | |
| JPS60202489A (ja) | 音声認識方法 | |
| Bera et al. | Emotion recognition using combination of mfcc and lpcc with supply vector machine | |
| Nosan et al. | Enhanced Feature Extraction Based on Absolute Sort Delta Mean Algorithm and MFCC for Noise Robustness Speech Recognition. | |
| JP2658426B2 (ja) | 音声認識方法 | |
| JPH0323920B2 (ja) | ||
| JPS6136797A (ja) | 音声セグメンテ−シヨン法 | |
| JPS5958498A (ja) | 音声認識装置 | |
| JPH03120434A (ja) | 音声認識装置 | |
| JPS63292199A (ja) | 音声認識装置 | |
| JPS59214098A (ja) | 音声標準パタン作成方法 | |
| HK1175882B (en) | Segmenting audio signals into auditory events |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |