JPH0667695A - 音声認識方法および音声認識装置 - Google Patents
音声認識方法および音声認識装置Info
- Publication number
- JPH0667695A JPH0667695A JP3097893A JP9789391A JPH0667695A JP H0667695 A JPH0667695 A JP H0667695A JP 3097893 A JP3097893 A JP 3097893A JP 9789391 A JP9789391 A JP 9789391A JP H0667695 A JPH0667695 A JP H0667695A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice recognition
- processing means
- recognition
- recognition processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 単一の音声認識処理手段で発生する音声誤認
識をなくし、音声認識の認識度を向上させる。 【構成】 入力した音声信号を所定の区間で切り出す音
声切出し手段(1)と、切り出された音声信号をパター
ンマッチング処理する第1の音声認識処理手段(2)
と、音声信号を母音で認識する第2の音声認識処理手段
(3)および上記音声認識処理手段の一方での認識結果
を他方で認識処理する統合音声認識処理手段(4)を備
える。
識をなくし、音声認識の認識度を向上させる。 【構成】 入力した音声信号を所定の区間で切り出す音
声切出し手段(1)と、切り出された音声信号をパター
ンマッチング処理する第1の音声認識処理手段(2)
と、音声信号を母音で認識する第2の音声認識処理手段
(3)および上記音声認識処理手段の一方での認識結果
を他方で認識処理する統合音声認識処理手段(4)を備
える。
Description
【0001】
【産業上の利用分野】本発明は音声認識方法およびその
装置に係り、特にパターンマッチングだけでは解決でき
ない誤認識を減少させることのできる音声認識方法と音
声認識装置に関する。
装置に係り、特にパターンマッチングだけでは解決でき
ない誤認識を減少させることのできる音声認識方法と音
声認識装置に関する。
【0002】
【従来の技術】人間の言葉を機械に認識させる音声認識
は、予め識別する必要のある単語パターンを音声単語標
準パターンとして入力音声パターンとして登録してお
き、認識の際に、入力された未知の単語のパターンと上
記音声単語標準パターンとを比較照合して、両者間の距
離を計算し、最小となる音声パターンを認識単語とする
パターンマッチングの手法が使われる。すなわち、マタ
ーンマッチングの手法は、入力された音声信号を音声分
析し、その音声パターンの特徴を表すパラメータに変換
する。この音声分析には、帯域フィルタ分析,線径予測
分析,ケプストラム分析などの手法が用いられる。パタ
ーンマッチングの過程では、入力パターンと標準パター
ンとの間のパターンの変動に対応できることが必要であ
る。音声パターンは、発音の仕方,前後の音との繋がり
具合い等により、その時間的軸が変動する。時間軸の変
動は、全体が一定の比率で伸縮するのではなく、非直線
に変化する。この変動に対処する方法として,所謂時間
軸の正規化にはDP(Dynamic Program
ing)マッチングという手法が最も良く知られてい
る。このDPマッチング手法は、標準パターンと入力パ
ターンの一方の時間軸を他方のパターンに最も適合する
ように非線形に歪ませ、対応する時点のベクトル間の距
離を累積した値を2つのパターンの間の距離として求め
る最適化手法である。なお、上記従来技術を開示したも
のとして、特開平2−108936号公報,あるいは
「日本音響学会誌」Vol.42,No.9,1986
(第725頁〜第730頁)がある。
は、予め識別する必要のある単語パターンを音声単語標
準パターンとして入力音声パターンとして登録してお
き、認識の際に、入力された未知の単語のパターンと上
記音声単語標準パターンとを比較照合して、両者間の距
離を計算し、最小となる音声パターンを認識単語とする
パターンマッチングの手法が使われる。すなわち、マタ
ーンマッチングの手法は、入力された音声信号を音声分
析し、その音声パターンの特徴を表すパラメータに変換
する。この音声分析には、帯域フィルタ分析,線径予測
分析,ケプストラム分析などの手法が用いられる。パタ
ーンマッチングの過程では、入力パターンと標準パター
ンとの間のパターンの変動に対応できることが必要であ
る。音声パターンは、発音の仕方,前後の音との繋がり
具合い等により、その時間的軸が変動する。時間軸の変
動は、全体が一定の比率で伸縮するのではなく、非直線
に変化する。この変動に対処する方法として,所謂時間
軸の正規化にはDP(Dynamic Program
ing)マッチングという手法が最も良く知られてい
る。このDPマッチング手法は、標準パターンと入力パ
ターンの一方の時間軸を他方のパターンに最も適合する
ように非線形に歪ませ、対応する時点のベクトル間の距
離を累積した値を2つのパターンの間の距離として求め
る最適化手法である。なお、上記従来技術を開示したも
のとして、特開平2−108936号公報,あるいは
「日本音響学会誌」Vol.42,No.9,1986
(第725頁〜第730頁)がある。
【0003】
【発明が解決しようとする課題】音声単語には互いに近
似した音声パターンをもつものが多い。上記従来の技術
の手法では、入力音声に近いパターンが数多く存在する
場合に、上記2つのパターン間の距離が最も近い登録パ
ターンが正しい入力単語であるとは限らず、誤認識が生
じるという問題がある。本発明の目的は、上記従来技術
の問題を解消し、例えば第2候補以下の単語に正しい入
力単語がある場合でも、これを識別して正確な音声認識
を行わせることを可能とした音声認識方法とその装置を
提供することにある。
似した音声パターンをもつものが多い。上記従来の技術
の手法では、入力音声に近いパターンが数多く存在する
場合に、上記2つのパターン間の距離が最も近い登録パ
ターンが正しい入力単語であるとは限らず、誤認識が生
じるという問題がある。本発明の目的は、上記従来技術
の問題を解消し、例えば第2候補以下の単語に正しい入
力単語がある場合でも、これを識別して正確な音声認識
を行わせることを可能とした音声認識方法とその装置を
提供することにある。
【0004】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、音声認識処理として母音認識と単語認識
とを用い、それぞれの認識結果をもとに1つの正しい入
力単語を認識するようにしたものである。すなわち、本
発明は、入力した音声信号を所定の区間で切り出し、切
り出された音声信号をパターンマッチング処理またはそ
の母音認識処理のいずれか一方で認識処理し、この認識
処理結果を他方の認識処理によって絞り込むことを特徴
とし、その装置構成として、入力した音声信号を所定の
区間で切り出す音声切出し手段(1)と、切り出された
音声信号を予め発声者によって登録された音声単語標準
パターンと入力音声パターンとの距離を計算し、その結
果に基づいて音声入力単語を認識する第1の音声認識処
理手段(2)と、切り出された音声信号を周波数分析し
て得られる第1ないし第3ホルマントのうち隣接する第
1および第2ホルマント周波数,ならびに第2および第
3ホルマント周波数の対数差情報を特徴パラメーターと
して抽出して母音を認識する第2の音声認識処理手段
(3)と、第1の音声認識処理手段と第2の音声認識処
理手段の一方の処理による認識結果を他方によって絞り
込む統合音声認識処理手段(4)とから構成したことを
特徴とする。
に、本発明は、音声認識処理として母音認識と単語認識
とを用い、それぞれの認識結果をもとに1つの正しい入
力単語を認識するようにしたものである。すなわち、本
発明は、入力した音声信号を所定の区間で切り出し、切
り出された音声信号をパターンマッチング処理またはそ
の母音認識処理のいずれか一方で認識処理し、この認識
処理結果を他方の認識処理によって絞り込むことを特徴
とし、その装置構成として、入力した音声信号を所定の
区間で切り出す音声切出し手段(1)と、切り出された
音声信号を予め発声者によって登録された音声単語標準
パターンと入力音声パターンとの距離を計算し、その結
果に基づいて音声入力単語を認識する第1の音声認識処
理手段(2)と、切り出された音声信号を周波数分析し
て得られる第1ないし第3ホルマントのうち隣接する第
1および第2ホルマント周波数,ならびに第2および第
3ホルマント周波数の対数差情報を特徴パラメーターと
して抽出して母音を認識する第2の音声認識処理手段
(3)と、第1の音声認識処理手段と第2の音声認識処
理手段の一方の処理による認識結果を他方によって絞り
込む統合音声認識処理手段(4)とから構成したことを
特徴とする。
【0005】
【作用】前記したように、通常、単語認識にはパターン
認識法(DPマッチングやHMM−Hidden Ma
rkov Model)が用いられるが、登録単語と入
力された音声パターンの距離dがある程度以上離れてい
ると、候補がいくつも存在する。このときの、例えば第
1の音声認識処理としてのDPマッチングで複数の単語
候補が抽出された場合に、そのしぼり込みにフォルマン
ト周波数相互間の対数比を用いる第2の音声認識処理と
しての母音認識処理を用いる。なお、単語候補のしぼり
込みは、母音をもとに単語をしぼり込む母音認識処理を
施したものにパターンマッチング処理を施すようにして
もよい。上記の各認識処理は、第1と第2のみに限ら
ず、2以上のさらに他の形式の音声認識処理を施すよう
にすることもできる。これら2つ以上の音声認識処理
は、並列処理用のプロセッサを用いることで実時間処理
が実現できる。このとき、母音認識部の処理には、特開
平2−108936号公報に開示されたような話者に存
在しない母音認識方法を用いるのが望ましい。この母音
認識は、フォルマント周波数相互間の対数比を用いる方
法であり、少ない計算量で認識効果が大きい音声認識方
法である。
認識法(DPマッチングやHMM−Hidden Ma
rkov Model)が用いられるが、登録単語と入
力された音声パターンの距離dがある程度以上離れてい
ると、候補がいくつも存在する。このときの、例えば第
1の音声認識処理としてのDPマッチングで複数の単語
候補が抽出された場合に、そのしぼり込みにフォルマン
ト周波数相互間の対数比を用いる第2の音声認識処理と
しての母音認識処理を用いる。なお、単語候補のしぼり
込みは、母音をもとに単語をしぼり込む母音認識処理を
施したものにパターンマッチング処理を施すようにして
もよい。上記の各認識処理は、第1と第2のみに限ら
ず、2以上のさらに他の形式の音声認識処理を施すよう
にすることもできる。これら2つ以上の音声認識処理
は、並列処理用のプロセッサを用いることで実時間処理
が実現できる。このとき、母音認識部の処理には、特開
平2−108936号公報に開示されたような話者に存
在しない母音認識方法を用いるのが望ましい。この母音
認識は、フォルマント周波数相互間の対数比を用いる方
法であり、少ない計算量で認識効果が大きい音声認識方
法である。
【0006】
【実施例】以下、本発明の実施例につき、図面を参照し
て詳細に説明する。図1は本発明の音声認識方法を適用
する音声認識装置の基本構成を説明するブロツク図であ
って、1は入力した音声信号を所定の閾値を参照して単
語単位で切り出す音声切出し手段、2はDPマッチング
で入力音声に音声認識を施す第1の音声認識処理手段、
3は母音認識により入力音声に音声認識を施す第2の音
声認識処理手段、4は第1の音声認識処理手段2と第2
の音声認識処理手段3の音声認識処理結果から単語候補
を絞り込む統合音声認識処理手段である。同図におい
て、音声切出し手段1で切り出された単語信号は、第1
の音声認識処理手段2と第2の音声認識処理手段3とに
並列に供給される。第1の音声認識処理手段2では、D
Pマッチング法やHMM法による波形分析で生成された
音声パターンを、予め登録されている単語の音声パター
ンと比較照合する。この比較照合の結果は統合音声認識
処理手段4に渡される。一方、第2の音声認識処理手段
3ではフォルマント周波数相互間の対数比を用いた話者
に依存しない母音認識法等で母音認識処理を施し、その
結果を統合音声認識処理手段4に渡す。
て詳細に説明する。図1は本発明の音声認識方法を適用
する音声認識装置の基本構成を説明するブロツク図であ
って、1は入力した音声信号を所定の閾値を参照して単
語単位で切り出す音声切出し手段、2はDPマッチング
で入力音声に音声認識を施す第1の音声認識処理手段、
3は母音認識により入力音声に音声認識を施す第2の音
声認識処理手段、4は第1の音声認識処理手段2と第2
の音声認識処理手段3の音声認識処理結果から単語候補
を絞り込む統合音声認識処理手段である。同図におい
て、音声切出し手段1で切り出された単語信号は、第1
の音声認識処理手段2と第2の音声認識処理手段3とに
並列に供給される。第1の音声認識処理手段2では、D
Pマッチング法やHMM法による波形分析で生成された
音声パターンを、予め登録されている単語の音声パター
ンと比較照合する。この比較照合の結果は統合音声認識
処理手段4に渡される。一方、第2の音声認識処理手段
3ではフォルマント周波数相互間の対数比を用いた話者
に依存しない母音認識法等で母音認識処理を施し、その
結果を統合音声認識処理手段4に渡す。
【0007】図2は第1の音声認識処理手段の概略構成
を説明するブロツク図であって、音声切出し手段1で切
り出された音声パターンを距離評価部18において標準
パターン登録部17に登録されている標準パターンとの
間で距離評価し、その結果から候補単語を比較推定部1
8で照合して候補単語を抽出する。
を説明するブロツク図であって、音声切出し手段1で切
り出された音声パターンを距離評価部18において標準
パターン登録部17に登録されている標準パターンとの
間で距離評価し、その結果から候補単語を比較推定部1
8で照合して候補単語を抽出する。
【0008】図3は第2の音声認識処理手段の概略構成
を説明するブロツク図であって、音声切出し手段1で切
り出された音声パターンを周波数分析部20でその一定
周期(例えば、16kHz)毎にサンプリングして周波
数分析を行う。ホルマント抽出部21は、分析された,
例えば5kHz以下のスペクトルピークを抽出し、第
1,第2,第3ホルマント周波数f1 ,f2 ,f3 を得
る。パラメータ抽出部22では、対数軸スケールにて第
1ホルマント周波数f1 と第2ホルマント周波数f2 の
差、並びに第2ホルマント周波数f2 と第3ホルマント
周波数f3 の差を特徴とするパラメータとして抽出す
る。音声判別部23は、母音”a,i,u,e,o”に
対応する第1,第2パラメータの基準値を予め具備し、
特徴パラメータ抽出部22で得られた第1パラメータl
og(f1 /f2 )をもとに入力音声を”a”および”
o”と”u”および”e”と”i”の三つに分類し、そ
の後第2パラメータlog(f2 /f3 )をもとに”
a”および”o”並びに”u”および”e”を分離して
母音を判別する。
を説明するブロツク図であって、音声切出し手段1で切
り出された音声パターンを周波数分析部20でその一定
周期(例えば、16kHz)毎にサンプリングして周波
数分析を行う。ホルマント抽出部21は、分析された,
例えば5kHz以下のスペクトルピークを抽出し、第
1,第2,第3ホルマント周波数f1 ,f2 ,f3 を得
る。パラメータ抽出部22では、対数軸スケールにて第
1ホルマント周波数f1 と第2ホルマント周波数f2 の
差、並びに第2ホルマント周波数f2 と第3ホルマント
周波数f3 の差を特徴とするパラメータとして抽出す
る。音声判別部23は、母音”a,i,u,e,o”に
対応する第1,第2パラメータの基準値を予め具備し、
特徴パラメータ抽出部22で得られた第1パラメータl
og(f1 /f2 )をもとに入力音声を”a”および”
o”と”u”および”e”と”i”の三つに分類し、そ
の後第2パラメータlog(f2 /f3 )をもとに”
a”および”o”並びに”u”および”e”を分離して
母音を判別する。
【0009】図4は本発明による音声認識装置の1実施
例の構成を説明するブロツク図であって、10は入力音
声分析部で、11はマイクロフオン、12は入力音声の
増幅,不要周波数成分除去,自動利得調整等の機能を備
えた信号調整装置、13は多数のバンドパスフィルター
からなる周波数解析部、14はマルチプレクサ、15は
A/Dコンバーターである。また、符号1〜5は前記図
1における符号1〜5と同様の部分である。同図におい
て、マイクロフォン11から入力された音声は信号調整
装置12で所定の信号調整を施され、周波数解析部13
に与えられる。周波数分析部13は入力信号を多数(例
えば、n=15)の周波数帯域(チャンネル)に分割し
て当該入力信号を構成する周波数を分析する周波数解析
を行なう。周波数解析部13で解析された各周波数帯域
成分はマルチプレクサ14で並列→直列変換されてA/
Dコンバーター15においてデジタル形に変換される。
A/D変換された信号は音声切出し手段1で、例えば所
定の閾値を越えるレベルの信号の継続周期で切り出さ
れ、DPマッチング手段2と母音認識手段3に与えられ
る。DPマッチング手段2では、標準パターン登録部1
7に予め登録されている音声パターンとの比較をDPマ
ッチングで実行し、入力信号パターンと登録信号パター
ンとの間の距離を計算し、該距離が小さいもの順に並
べ、候補単語Wnとその候補単語パターンと入力信号パ
ターンとの距離dnを統合音声認識処理手段3に渡す。
例の構成を説明するブロツク図であって、10は入力音
声分析部で、11はマイクロフオン、12は入力音声の
増幅,不要周波数成分除去,自動利得調整等の機能を備
えた信号調整装置、13は多数のバンドパスフィルター
からなる周波数解析部、14はマルチプレクサ、15は
A/Dコンバーターである。また、符号1〜5は前記図
1における符号1〜5と同様の部分である。同図におい
て、マイクロフォン11から入力された音声は信号調整
装置12で所定の信号調整を施され、周波数解析部13
に与えられる。周波数分析部13は入力信号を多数(例
えば、n=15)の周波数帯域(チャンネル)に分割し
て当該入力信号を構成する周波数を分析する周波数解析
を行なう。周波数解析部13で解析された各周波数帯域
成分はマルチプレクサ14で並列→直列変換されてA/
Dコンバーター15においてデジタル形に変換される。
A/D変換された信号は音声切出し手段1で、例えば所
定の閾値を越えるレベルの信号の継続周期で切り出さ
れ、DPマッチング手段2と母音認識手段3に与えられ
る。DPマッチング手段2では、標準パターン登録部1
7に予め登録されている音声パターンとの比較をDPマ
ッチングで実行し、入力信号パターンと登録信号パター
ンとの間の距離を計算し、該距離が小さいもの順に並
べ、候補単語Wnとその候補単語パターンと入力信号パ
ターンとの距離dnを統合音声認識処理手段3に渡す。
【0010】一方、母音認識手段3では、ホルマント周
波数の対数比をもとに母音列を抽出し、これを統合音声
認識処理手段3に渡す。統合音声認識処理手段3は、D
Pマッチング手段2と母音認識手段3とからそれぞれ渡
された候補単語Wnとその候補単語パターンと入力信号
パターンとの距離dnおよび母音列とから候補単語を絞
り込んで正しい単語を抽出する。抽出された単語は認識
結果として表示装置等の認識出力手段5に出力される。
上記DPマッチング手段2,母音認識手段3および統合
音声認識処理手段3を並列処理プロセッサで構成するこ
とにより、リアルタイムの処理を可能とすることができ
る。なお、上記実施例においては、DPマッチング処理
と母音認識処理とを並列に実行するようにしているが、
これらの処理を時系列で実行するようにしてもよいこと
は言うまでもない。
波数の対数比をもとに母音列を抽出し、これを統合音声
認識処理手段3に渡す。統合音声認識処理手段3は、D
Pマッチング手段2と母音認識手段3とからそれぞれ渡
された候補単語Wnとその候補単語パターンと入力信号
パターンとの距離dnおよび母音列とから候補単語を絞
り込んで正しい単語を抽出する。抽出された単語は認識
結果として表示装置等の認識出力手段5に出力される。
上記DPマッチング手段2,母音認識手段3および統合
音声認識処理手段3を並列処理プロセッサで構成するこ
とにより、リアルタイムの処理を可能とすることができ
る。なお、上記実施例においては、DPマッチング処理
と母音認識処理とを並列に実行するようにしているが、
これらの処理を時系列で実行するようにしてもよいこと
は言うまでもない。
【0011】図5は統合音声認識処理手段での音声認識
処理アルゴリズムの一例を説明するフローチヤートであ
って、まずDPマッチング手段2から渡された第1の単
語候補W1 の距離d1 を見て(ステップ−1)、それが
一定値Th1 より小さい時は認識単語をW1 とする。ま
たそれが一定値Th2 より大きいときは認識不可として
処理を終える。そして、第1の単語候補W1 の距離d1
が一定値Th1 とTh2 の中間にあるときは、母音認識
手段3から送られた母音列を判断に使用する。このとき
第1の単語候補W1 と第2の単語候補W2の距離の差d
2 −d1 を計算し(ステップ−3)、もし一定値Th3
より大きいときは認識不可として処理を終える。上記距
離の差d2 −d1 が一定値Th3 より小さい時は、母音
列と比較して一致したときのみその単語候補を認識単語
W2とする(ステップ−4)。また、一致しなければ、
nをカウントアップして(ステップ−5)ステップ−3
に戻り次の単語候補W3 に対して上記と同様の処理を実
行し、ステップ−4で一致の判断がなされば単語候補W
3 を認識単語とする。不一致の場合はまたn=n+1と
して上記と同様の処理を施し、候補単語から認識単語を
捜す。以上のようにして、単語候補を決定する。
処理アルゴリズムの一例を説明するフローチヤートであ
って、まずDPマッチング手段2から渡された第1の単
語候補W1 の距離d1 を見て(ステップ−1)、それが
一定値Th1 より小さい時は認識単語をW1 とする。ま
たそれが一定値Th2 より大きいときは認識不可として
処理を終える。そして、第1の単語候補W1 の距離d1
が一定値Th1 とTh2 の中間にあるときは、母音認識
手段3から送られた母音列を判断に使用する。このとき
第1の単語候補W1 と第2の単語候補W2の距離の差d
2 −d1 を計算し(ステップ−3)、もし一定値Th3
より大きいときは認識不可として処理を終える。上記距
離の差d2 −d1 が一定値Th3 より小さい時は、母音
列と比較して一致したときのみその単語候補を認識単語
W2とする(ステップ−4)。また、一致しなければ、
nをカウントアップして(ステップ−5)ステップ−3
に戻り次の単語候補W3 に対して上記と同様の処理を実
行し、ステップ−4で一致の判断がなされば単語候補W
3 を認識単語とする。不一致の場合はまたn=n+1と
して上記と同様の処理を施し、候補単語から認識単語を
捜す。以上のようにして、単語候補を決定する。
【0012】
【発明の効果】以上説明したように、本発明によれば、
パターンマッチング手法のみでは第2の単語候補以下に
正しい単語がある場合に発生する誤認識をなくし、入力
された単語に相当する正しい単語を認識するこができる
音声認識方法およびその装置を提供できる。
パターンマッチング手法のみでは第2の単語候補以下に
正しい単語がある場合に発生する誤認識をなくし、入力
された単語に相当する正しい単語を認識するこができる
音声認識方法およびその装置を提供できる。
【図1】 本発明の音声認識方法を適用する音声認識装
置の基本構成を説明するブロツク図である。
置の基本構成を説明するブロツク図である。
【図2】 第1の音声認識処理手段の概略構成を説明す
るブロツク図である。
るブロツク図である。
【図3】 第2の音声認識処理手段の概略構成を説明す
るブロツク図である。
るブロツク図である。
【図4】 本発明による音声認識装置の1実施例の構成
を説明するブロツク図である。
を説明するブロツク図である。
1・・・・音声切出し手段、2・・・・第1の音声認識
処理手段、3・・・・第2の音声認識処理手段、4・・
・・統合音声認識処理手段、17・・・・標準パターン
登録部。
処理手段、3・・・・第2の音声認識処理手段、4・・
・・統合音声認識処理手段、17・・・・標準パターン
登録部。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成5年8月11日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】 本発明の音声認識方法を適用する音声認識装
置の基本構成を説明するブロック図である。
置の基本構成を説明するブロック図である。
【図2】 第1の音声認識処理手段の概略構成を説明す
るブロック図である。
るブロック図である。
【図3】 第2の音声認識処理手段の概略構成を説明す
るブロック図である。
るブロック図である。
【図4】 本発明による音声認識装置の1実施例の構成
を説明するブロック図である。
を説明するブロック図である。
【図5】 統合音声認識処理手段での音声認識アルゴリ
ズムの一例を説明するフローチャートである。
ズムの一例を説明するフローチャートである。
【符号の説明】 1・・・・音声切出し手段、2・・・・第1の音声認識
処理手段、3・・・・第2の音声認識処理手段、4・・
・・統合音声認識処理手段、17・・・・標準パターン
登録部。
処理手段、3・・・・第2の音声認識処理手段、4・・
・・統合音声認識処理手段、17・・・・標準パターン
登録部。
Claims (2)
- 【請求項1】 入力音声を分析し、予め登録されている
標準パターンと照合することにより上記入力音声を認識
する音声認識方法において、入力した音声信号を所定の
区間で切り出し、切り出された音声信号をパターンマッ
チング処理またはその母音認識処理のいずれか一方で認
識処理し、この認識処理結果を他方の認識処理によって
絞り込むことを特徴とする音声認識方法。 - 【請求項2】 入力音声を分析し、予め登録されている
標準パターンと照合することにより上記入力音声を認識
する音声認識装置において、入力した音声信号を所定の
区間で切り出す音声切出し手段と、切り出された音声信
号を予め発声者によって登録された音声単語標準パター
ンと入力音声パターンとの距離を計算し、その結果に基
づいて音声入力単語を認識する第1の音声認識処理手段
と、切り出された音声信号を周波数分析して得られる第
1ないし第3ホルマントのうち隣接する第1および第2
ホルマント周波数,ならびに第2および第3ホルマント
周波数の対数差情報を特徴パラメーターとして抽出して
母音を認識する第2の音声認識処理手段と、第1の音声
認識処理手段と第2の音声認識処理手段の一方の処理に
よる認識結果を他方によって絞り込む統合音声認識処理
手段とから構成したことを特徴とする音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3097893A JPH0667695A (ja) | 1991-04-04 | 1991-04-04 | 音声認識方法および音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3097893A JPH0667695A (ja) | 1991-04-04 | 1991-04-04 | 音声認識方法および音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0667695A true JPH0667695A (ja) | 1994-03-11 |
Family
ID=14204435
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3097893A Pending JPH0667695A (ja) | 1991-04-04 | 1991-04-04 | 音声認識方法および音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0667695A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6767311B2 (en) | 2000-11-07 | 2004-07-27 | Honda Giken Kogyo Kabushiki Kaisha | Vehicle starting clutch control device |
-
1991
- 1991-04-04 JP JP3097893A patent/JPH0667695A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6767311B2 (en) | 2000-11-07 | 2004-07-27 | Honda Giken Kogyo Kabushiki Kaisha | Vehicle starting clutch control device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5025471A (en) | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns | |
| US4783802A (en) | Learning system of dictionary for speech recognition | |
| US10573300B2 (en) | Method and apparatus for automatic speech recognition | |
| JPH0352640B2 (ja) | ||
| JPS62217295A (ja) | 音声認識方式 | |
| CN106875943A (zh) | 一种用于大数据分析的语音识别系统 | |
| US4509186A (en) | Method and apparatus for speech message recognition | |
| JPH04362699A (ja) | 音声認識方法及び装置 | |
| US5159637A (en) | Speech word recognizing apparatus using information indicative of the relative significance of speech features | |
| JP2996019B2 (ja) | 音声認識装置 | |
| US5727121A (en) | Sound processing apparatus capable of correct and efficient extraction of significant section data | |
| CN119400204A (zh) | 人声相似度检测方法、系统及存储介质 | |
| KR100391123B1 (ko) | 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템 | |
| JPH0667695A (ja) | 音声認識方法および音声認識装置 | |
| US5425127A (en) | Speech recognition method | |
| JPS60114900A (ja) | 有音・無音判定法 | |
| EP0886854B1 (en) | User independent, real-time speech recognition system and method | |
| JP3063855B2 (ja) | 音声認識におけるマッチング距離値の極小値探索方法 | |
| JP3049711B2 (ja) | 音声処理装置 | |
| JPH09160585A (ja) | 音声認識装置および音声認識方法 | |
| Elghonemy et al. | Speaker independent isolated Arabic word recognition system | |
| JP3063856B2 (ja) | 音声認識におけるマッチング距離値の極小値探索方法 | |
| JPH02232698A (ja) | 音声認識装置 | |
| JPH0887292A (ja) | 単語音声認識装置 | |
| JPS6411960B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |