JPH05119792A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH05119792A JPH05119792A JP3281245A JP28124591A JPH05119792A JP H05119792 A JPH05119792 A JP H05119792A JP 3281245 A JP3281245 A JP 3281245A JP 28124591 A JP28124591 A JP 28124591A JP H05119792 A JPH05119792 A JP H05119792A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- urgency
- pattern
- registered
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】
【目的】 平常時の音声認識性能を損なわずに緊急時の
音声認識性能を向上させる音声認識装置を提供する。 【構成】 入力音声から緊急性を検出する緊急性検出手
段1を設け、入力音声を分析して入力音声パターンを生
成する入力音声パターン生成手段2を設け、予め登録さ
れた複数の登録音声標準パターンを記憶する登録音声標
準パターン記憶手段5を設け、入力音声パターンと登録
音声標準パターンとのマッチングを行うことによりこれ
らの各登録音声標準パターンに対する入力音声パターン
のパターン間距離を求めるマッチング手段3を設け、パ
ターン間距離に基づいて認識結果を判定する認識判定手
段4を設け、緊急性検出手段1にて検出された入力音声
の緊急性に対応して音声認識処理を行うようにした。
音声認識性能を向上させる音声認識装置を提供する。 【構成】 入力音声から緊急性を検出する緊急性検出手
段1を設け、入力音声を分析して入力音声パターンを生
成する入力音声パターン生成手段2を設け、予め登録さ
れた複数の登録音声標準パターンを記憶する登録音声標
準パターン記憶手段5を設け、入力音声パターンと登録
音声標準パターンとのマッチングを行うことによりこれ
らの各登録音声標準パターンに対する入力音声パターン
のパターン間距離を求めるマッチング手段3を設け、パ
ターン間距離に基づいて認識結果を判定する認識判定手
段4を設け、緊急性検出手段1にて検出された入力音声
の緊急性に対応して音声認識処理を行うようにした。
Description
【0001】
【産業上の利用分野】本発明は、発声の緊急性を検出し
てその緊急性に応じて認識処理を変更する技術に係り、
特に音声による指示の内で緊急停止等の緊急性のある指
示が含まれる音声認識アプリケーション(機械、車両、
及び、これらのシミュレーションシステム、ゲーム等)
に利用される音声認識装置に関する。
てその緊急性に応じて認識処理を変更する技術に係り、
特に音声による指示の内で緊急停止等の緊急性のある指
示が含まれる音声認識アプリケーション(機械、車両、
及び、これらのシミュレーションシステム、ゲーム等)
に利用される音声認識装置に関する。
【0002】
【従来の技術】音声認識装置の実用化において、発声変
動がしばしば問題になっている。この発声変動の周知の
ものとしては、例えば、音声の経時変化、騒音下の発声
変動(ロンバード効果)、発声様式(孤立発声の単語と
連続発声中の単語)の違いによる変動、発声時の話者の
感情の違いによる変動等がある。このような発声変動に
より登録時の音声と実際の認識時の音声とに違いが生
じ、音声認識処理を行う上で問題となっている。
動がしばしば問題になっている。この発声変動の周知の
ものとしては、例えば、音声の経時変化、騒音下の発声
変動(ロンバード効果)、発声様式(孤立発声の単語と
連続発声中の単語)の違いによる変動、発声時の話者の
感情の違いによる変動等がある。このような発声変動に
より登録時の音声と実際の認識時の音声とに違いが生
じ、音声認識処理を行う上で問題となっている。
【0003】そこで、音声による指示のうちで緊急停止
等の緊急性のある指示とそうでない平常時のみの指示と
が混在する音声認識アプリケーションを考えてみると、
緊急性のある音声指示は緊急時に行われるため、平常時
に登録された音声に対して大きくなったり、高くなった
り、速くなったりする。したがって、緊急時の音声指示
は平常時の音声指示より認識率が低くなってしまう。
等の緊急性のある指示とそうでない平常時のみの指示と
が混在する音声認識アプリケーションを考えてみると、
緊急性のある音声指示は緊急時に行われるため、平常時
に登録された音声に対して大きくなったり、高くなった
り、速くなったりする。したがって、緊急時の音声指示
は平常時の音声指示より認識率が低くなってしまう。
【0004】また、緊急時と平常時とでは認識対象とな
る候補はそれぞれ異なると考えられているが、従来の音
声認識装置にあっては、入力音声に緊急性があるか否か
を判断する機能がないので、緊急時と平常時とで認識対
象となる候補を変更したり、いずれかの候補を認識し易
くしたり、又は、いずれかの候補を認識し難くすること
ができなかった。
る候補はそれぞれ異なると考えられているが、従来の音
声認識装置にあっては、入力音声に緊急性があるか否か
を判断する機能がないので、緊急時と平常時とで認識対
象となる候補を変更したり、いずれかの候補を認識し易
くしたり、又は、いずれかの候補を認識し難くすること
ができなかった。
【0005】そして、緊急時には、誤認識とリジェクト
とは同様の結果しかもたらさない場合が多いので、リジ
ェクトを中止し、正答率=正答数/試行数を上げる必要
がある。しかし、従来の音声認識装置では、パターンマ
ッチングの第一位の候補の信頼性が低い場合、リジェク
トを行い、正答率を下げても、認識率=正答数/(試行
数−リジェクト数)を上げるようにしているため、緊急
時に対応して正答率を上げることはできなかった。
とは同様の結果しかもたらさない場合が多いので、リジ
ェクトを中止し、正答率=正答数/試行数を上げる必要
がある。しかし、従来の音声認識装置では、パターンマ
ッチングの第一位の候補の信頼性が低い場合、リジェク
トを行い、正答率を下げても、認識率=正答数/(試行
数−リジェクト数)を上げるようにしているため、緊急
時に対応して正答率を上げることはできなかった。
【0006】さらに、緊急性のある音声指示に対しては
特に正確な認識が要求されるため、従来にあっては、特
に、平常時と緊急時とを混在させて使用する場合、緊急
性のある音声指示には音声認識は適さないというのが一
般的な常識となっていた。
特に正確な認識が要求されるため、従来にあっては、特
に、平常時と緊急時とを混在させて使用する場合、緊急
性のある音声指示には音声認識は適さないというのが一
般的な常識となっていた。
【0007】このような問題点を解決し、緊急性のある
音声の認識率を高めた従来技術として、例えば、特公平
2−30039号公報に開示された「音声認識装置」が
ある。これは、入力音声パターンと、重要性(緊急性)
の高い特定登録音声パターン及びその他の重要性の低い
登録音声パターンとの間で類似度を求め、重要性の高い
特定登録音声パターンと入力音声パターンとの類似度に
重み付けを行うことにより、重要性の高い音声に対する
認識率を高めたものである。
音声の認識率を高めた従来技術として、例えば、特公平
2−30039号公報に開示された「音声認識装置」が
ある。これは、入力音声パターンと、重要性(緊急性)
の高い特定登録音声パターン及びその他の重要性の低い
登録音声パターンとの間で類似度を求め、重要性の高い
特定登録音声パターンと入力音声パターンとの類似度に
重み付けを行うことにより、重要性の高い音声に対する
認識率を高めたものである。
【0008】
【発明が解決しようとする課題】しかしながら、重要性
の高い音声が一位候補に選ばれ易くなった分、その他の
音声は一位候補に選ばれ難くなり、重要性の高くない平
常の音声指示に対する認識率が低くなる。また、重要性
のある音声指示の数は、通常、その他の音声指示より少
ないので、ほぼ全単語に対する認識率も低くなることに
なる。さらに、緊急時と平常時との区別がないので、上
述したような問題点が、常に存在することになる。
の高い音声が一位候補に選ばれ易くなった分、その他の
音声は一位候補に選ばれ難くなり、重要性の高くない平
常の音声指示に対する認識率が低くなる。また、重要性
のある音声指示の数は、通常、その他の音声指示より少
ないので、ほぼ全単語に対する認識率も低くなることに
なる。さらに、緊急時と平常時との区別がないので、上
述したような問題点が、常に存在することになる。
【0009】
【課題を解決するための手段】請求項1記載の発明で
は、入力音声から緊急性を検出する緊急性検出手段を設
け、前記入力音声を分析して入力音声パターンを生成す
る入力音声パターン生成手段を設け、予め登録された複
数の登録音声標準パターンを記憶する登録音声標準パタ
ーン記憶手段を設け、前記入力音声パターンと前記登録
音声標準パターンとのマッチングを行うことによりこれ
らの各登録音声標準パターンに対する前記入力音声パタ
ーンのパターン間距離を求めるマッチング手段を設け、
前記パターン間距離に基づいて認識結果を判定する認識
判定手段を設けた。
は、入力音声から緊急性を検出する緊急性検出手段を設
け、前記入力音声を分析して入力音声パターンを生成す
る入力音声パターン生成手段を設け、予め登録された複
数の登録音声標準パターンを記憶する登録音声標準パタ
ーン記憶手段を設け、前記入力音声パターンと前記登録
音声標準パターンとのマッチングを行うことによりこれ
らの各登録音声標準パターンに対する前記入力音声パタ
ーンのパターン間距離を求めるマッチング手段を設け、
前記パターン間距離に基づいて認識結果を判定する認識
判定手段を設けた。
【0010】請求項2記載の発明では、請求項1記載の
発明において、入力音声パターン生成手段は、緊急性検
出手段により検出された緊急性に対応して入力音声パタ
ーンを補正する。
発明において、入力音声パターン生成手段は、緊急性検
出手段により検出された緊急性に対応して入力音声パタ
ーンを補正する。
【0011】請求項3記載の発明では、請求項1記載の
発明において、登録音声標準パターン記憶手段は、登録
された各々の登録音声標準パターンに緊急性があるか否
かの緊急性情報を併せて記憶し、マッチング手段は、緊
急性検出手段により検出された緊急性と前記登録音声標
準パターン記憶手段に記憶された前記緊急性情報とに対
応してマッチングを行う。
発明において、登録音声標準パターン記憶手段は、登録
された各々の登録音声標準パターンに緊急性があるか否
かの緊急性情報を併せて記憶し、マッチング手段は、緊
急性検出手段により検出された緊急性と前記登録音声標
準パターン記憶手段に記憶された前記緊急性情報とに対
応してマッチングを行う。
【0012】請求項4記載の発明では、請求項1記載の
発明において、認識判定手段は、緊急性検出手段により
検出された緊急性に対応してリジェクト条件を変更させ
て認識結果を判定する。
発明において、認識判定手段は、緊急性検出手段により
検出された緊急性に対応してリジェクト条件を変更させ
て認識結果を判定する。
【0013】請求項5記載の発明では、請求項1,2,
3又は4記載の発明において、緊急性検出手段は、緊急
性を示すパラメータとして音声のパワーを検出する。
3又は4記載の発明において、緊急性検出手段は、緊急
性を示すパラメータとして音声のパワーを検出する。
【0014】請求項6記載の発明では、請求項1,2,
3又は4記載の発明において、緊急性検出手段は、緊急
性を示すパラメータとして音声のピッチを検出する。
3又は4記載の発明において、緊急性検出手段は、緊急
性を示すパラメータとして音声のピッチを検出する。
【0015】請求項7記載の発明では、請求項1,2,
3又は4記載の発明において、緊急性検出手段は、緊急
性を示すパラメータとして音声の発声速度を検出する。
3又は4記載の発明において、緊急性検出手段は、緊急
性を示すパラメータとして音声の発声速度を検出する。
【0016】請求項8記載の発明では、請求項1,2,
3,4,5,6又は7記載の発明において、緊急性検出
手段は、緊急性を示すパラメータとして音声のパワーと
音声のピッチと音声の発声速度とを含む複数のパラメー
タを併用する。
3,4,5,6又は7記載の発明において、緊急性検出
手段は、緊急性を示すパラメータとして音声のパワーと
音声のピッチと音声の発声速度とを含む複数のパラメー
タを併用する。
【0017】
【作用】請求項1記載の発明においては、緊急性検出手
段にて検出された入力音声の緊急性に対応して音声認識
処理を行うことによって、入力音声パターンを補正して
緊急時の発声変動による認識率の低下を防止することが
可能となり、しかも、緊急性のある音声を緊急時に認識
し易くすることが可能となり、さらに、緊急時にリジェ
クトを少なくして正答率を上げることが可能となり、こ
れにより、平常時の音声認識性能を損なわずに緊急時の
音声認識性能を向上させることが可能となる。
段にて検出された入力音声の緊急性に対応して音声認識
処理を行うことによって、入力音声パターンを補正して
緊急時の発声変動による認識率の低下を防止することが
可能となり、しかも、緊急性のある音声を緊急時に認識
し易くすることが可能となり、さらに、緊急時にリジェ
クトを少なくして正答率を上げることが可能となり、こ
れにより、平常時の音声認識性能を損なわずに緊急時の
音声認識性能を向上させることが可能となる。
【0018】請求項2記載の発明においては、緊急性検
出手段により入力音声の緊急性を検出し、入力音声の緊
急性に対応して入力音声パターンの補正を行うことによ
って、緊急時の発声変動による認識率の低下を防止する
ことが可能となり、これにより、平常時の音声認識性能
を損なわずに緊急時の音声認識性能を向上させることが
可能となる。
出手段により入力音声の緊急性を検出し、入力音声の緊
急性に対応して入力音声パターンの補正を行うことによ
って、緊急時の発声変動による認識率の低下を防止する
ことが可能となり、これにより、平常時の音声認識性能
を損なわずに緊急時の音声認識性能を向上させることが
可能となる。
【0019】請求項3記載の発明においては、緊急性検
出手段にて検出された入力音声の緊急性と、登録音声標
準パターン記憶手段に記憶された各々の登録音声標準パ
ターンの緊急性情報とに対応してマッチング手段にてパ
ターン間距離を求めることによって、緊急性のある入力
音声を緊急時に認識し易くすることが可能となり、これ
により、平常時の音声認識性能を損なわずに緊急時の音
声認識性能を向上させることが可能となる。
出手段にて検出された入力音声の緊急性と、登録音声標
準パターン記憶手段に記憶された各々の登録音声標準パ
ターンの緊急性情報とに対応してマッチング手段にてパ
ターン間距離を求めることによって、緊急性のある入力
音声を緊急時に認識し易くすることが可能となり、これ
により、平常時の音声認識性能を損なわずに緊急時の音
声認識性能を向上させることが可能となる。
【0020】請求項4記載の発明においては、入力音声
の緊急性に対応して認識結果のリジェクトの条件を変更
させることによって、緊急時にリジェクトを少なくして
正答率を上げることが可能となり、これにより、平常時
の音声認識性能を損なわずに緊急時の音声認識性能を向
上させることが可能となる。
の緊急性に対応して認識結果のリジェクトの条件を変更
させることによって、緊急時にリジェクトを少なくして
正答率を上げることが可能となり、これにより、平常時
の音声認識性能を損なわずに緊急時の音声認識性能を向
上させることが可能となる。
【0021】請求項5記載の発明においては、音声のパ
ワーを検出することにより、緊急性を的確に捉えること
が可能となる。
ワーを検出することにより、緊急性を的確に捉えること
が可能となる。
【0022】請求項6記載の発明においては、音声のピ
ッチを検出することにより、緊急性を的確に捉えること
が可能となる。
ッチを検出することにより、緊急性を的確に捉えること
が可能となる。
【0023】請求項7記載の発明においては、音声の発
声速度を検出することにより、緊急性を的確に捉えるこ
とが可能となる。
声速度を検出することにより、緊急性を的確に捉えるこ
とが可能となる。
【0024】請求項8記載の発明においては、音声のパ
ワーと音声のピッチと音声の発声速度とを含む複数のパ
ラメータを併用することにより、パラメータが1つの場
合に比べて緊急性をより一層的確に捉えることが可能と
なる。
ワーと音声のピッチと音声の発声速度とを含む複数のパ
ラメータを併用することにより、パラメータが1つの場
合に比べて緊急性をより一層的確に捉えることが可能と
なる。
【0025】
【実施例】本発明の第一の実施例を図1に基づいて説明
する。まず、本実施例の全体構成の概略を図1に基づい
て述べる。音声が入力される図示しないマイクロフォン
の出力側には、緊急性検出手段としての緊急性検出部1
と、入力音声パターン生成手段としての入力音声パター
ン生成部2とが並列に接続されている。この入力音声パ
ターン生成部2の出力側には、マッチング手段としての
マッチング部3、認識判定手段としての認識判定部4が
順次直列に接続されている。また、前記マッチング部3
には、登録音声標準パターン記憶手段としての登録音声
標準パターン記憶部5が接続されている。さらに、前記
緊急性検出部1の出力側は、前記入力音声パターン生成
部2と、前記マッチング部3と、前記認識判定部4とに
並列に接続されている。すなわち、AB間と、AC間
と、AD間とが接続された状態になっている。
する。まず、本実施例の全体構成の概略を図1に基づい
て述べる。音声が入力される図示しないマイクロフォン
の出力側には、緊急性検出手段としての緊急性検出部1
と、入力音声パターン生成手段としての入力音声パター
ン生成部2とが並列に接続されている。この入力音声パ
ターン生成部2の出力側には、マッチング手段としての
マッチング部3、認識判定手段としての認識判定部4が
順次直列に接続されている。また、前記マッチング部3
には、登録音声標準パターン記憶手段としての登録音声
標準パターン記憶部5が接続されている。さらに、前記
緊急性検出部1の出力側は、前記入力音声パターン生成
部2と、前記マッチング部3と、前記認識判定部4とに
並列に接続されている。すなわち、AB間と、AC間
と、AD間とが接続された状態になっている。
【0026】このような構成において、まず、本実施例
で行われる音声認識処理の概略を説明する。緊急性検出
部1にてマイクロフォンから入力された入力音声から緊
急性を検出し、同時に入力音声パターン生成部2にて入
力音声を分析して入力音声パターンを生成する。この入
力音声パターンと登録音声標準パターン記憶部5に予め
登録された複数の登録音声標準パターンとの間でマッチ
ング部3にてマッチングを行うことにより、これらの各
登録音声標準パターンに対する入力音声パターンのパタ
ーン間距離を求める。そして、認識判定部4にてパター
ン間距離に基づいて認識結果を判定する。
で行われる音声認識処理の概略を説明する。緊急性検出
部1にてマイクロフォンから入力された入力音声から緊
急性を検出し、同時に入力音声パターン生成部2にて入
力音声を分析して入力音声パターンを生成する。この入
力音声パターンと登録音声標準パターン記憶部5に予め
登録された複数の登録音声標準パターンとの間でマッチ
ング部3にてマッチングを行うことにより、これらの各
登録音声標準パターンに対する入力音声パターンのパタ
ーン間距離を求める。そして、認識判定部4にてパター
ン間距離に基づいて認識結果を判定する。
【0027】次に、上述した音声認識処理について具体
的に説明する。まず、緊急性検出部1では、マイクロフ
ォンから入力された入力音声から緊急性を検出する。こ
こに、緊急時の入力音声は、平常の音声に対して、大き
くなったり、高くなったり、速くなったりするので、そ
れぞれ、音声のパワー、音声のピッチ、音声の発声速度
を検出することによって、入力音声に緊急性があるか否
かを検出することが可能である。本実施例では緊急性を
示すパラメータとして音声のパワーを用いる。すなわ
ち、1つの入力音声の平均パワーが一定の閾値以上であ
る場合を緊急性あり、それ以外の場合を緊急性なしとす
る。これにより、緊急性を的確に捉えることが可能とな
る。
的に説明する。まず、緊急性検出部1では、マイクロフ
ォンから入力された入力音声から緊急性を検出する。こ
こに、緊急時の入力音声は、平常の音声に対して、大き
くなったり、高くなったり、速くなったりするので、そ
れぞれ、音声のパワー、音声のピッチ、音声の発声速度
を検出することによって、入力音声に緊急性があるか否
かを検出することが可能である。本実施例では緊急性を
示すパラメータとして音声のパワーを用いる。すなわ
ち、1つの入力音声の平均パワーが一定の閾値以上であ
る場合を緊急性あり、それ以外の場合を緊急性なしとす
る。これにより、緊急性を的確に捉えることが可能とな
る。
【0028】また、入力音声パターン生成部2では、入
力された入力音声に対して音声区間検出処理と音響分析
処理とを行い、音声区間中の音響分析データから入力音
声パターンを生成する。すなわち、周知の処理方法を用
いて、音声区間検出処理は音声のパワーと閾値とを比較
することにより行い、音響分析処理はLPCケプストラ
ム分析により行う。これにより、入力音声パターンのパ
ラメータはLPCケプストラムと音声のパワーとにな
る。但し、緊急性検出部1にて緊急性が検出された場
合、周知の補正方法を用いて入力音声パターンの補正を
行う。すなわち、大声で発声された音声(緊急時の音
声)は、平常時の音声と比べてレベルだけでなく周波数
軸上でも歪を生じることが周知となっており、騒音下で
の発声変動(ロンバード効果)がこれに該当する。この
ような発声変動に起因する入力音声パターンの歪を周知
の補正方法を用いて補正する。
力された入力音声に対して音声区間検出処理と音響分析
処理とを行い、音声区間中の音響分析データから入力音
声パターンを生成する。すなわち、周知の処理方法を用
いて、音声区間検出処理は音声のパワーと閾値とを比較
することにより行い、音響分析処理はLPCケプストラ
ム分析により行う。これにより、入力音声パターンのパ
ラメータはLPCケプストラムと音声のパワーとにな
る。但し、緊急性検出部1にて緊急性が検出された場
合、周知の補正方法を用いて入力音声パターンの補正を
行う。すなわち、大声で発声された音声(緊急時の音
声)は、平常時の音声と比べてレベルだけでなく周波数
軸上でも歪を生じることが周知となっており、騒音下で
の発声変動(ロンバード効果)がこれに該当する。この
ような発声変動に起因する入力音声パターンの歪を周知
の補正方法を用いて補正する。
【0029】なお、上述の音声区間検出処理と音響分析
処理とに用いた周知の処理方法については、例えば、
「ディジタル音声処理」、古井著、東海大学出版会等に
記載されている。また、上述の騒音下での発声変動に対
する周知の補正方法については、例えば、「雑音下での
発声変形に対するホルマント移動による補正法の性能評
価」、滝沢他著、音響学会講演論文集、1−8−9、平
成2年9月に記載されている。
処理とに用いた周知の処理方法については、例えば、
「ディジタル音声処理」、古井著、東海大学出版会等に
記載されている。また、上述の騒音下での発声変動に対
する周知の補正方法については、例えば、「雑音下での
発声変形に対するホルマント移動による補正法の性能評
価」、滝沢他著、音響学会講演論文集、1−8−9、平
成2年9月に記載されている。
【0030】一方、登録音声標準パターン記憶部5に
は、予め登録された複数の登録音声標準パターンを記憶
すると共に、これらの登録音声標準パターンの各々に緊
急性があるか否かの緊急性情報を併せて記憶しておく。
但し、登録音声標準パターンのパラメータは、入力音声
パターンのパラメータと同様にLPCケプストラムと音
声のパワーとである。ここに、登録音声標準パターン記
憶部5に記憶された単語セットと各々の単語の緊急性情
報との一例を表1に示す。
は、予め登録された複数の登録音声標準パターンを記憶
すると共に、これらの登録音声標準パターンの各々に緊
急性があるか否かの緊急性情報を併せて記憶しておく。
但し、登録音声標準パターンのパラメータは、入力音声
パターンのパラメータと同様にLPCケプストラムと音
声のパワーとである。ここに、登録音声標準パターン記
憶部5に記憶された単語セットと各々の単語の緊急性情
報との一例を表1に示す。
【0031】
【表1】
【0032】表1に示すように、緊急性が1である停
止、右、左の単語は緊急性があり得て、その他の緊急性
が0である前進、後退、加速、減速の単語は緊急性があ
り得ないように設定されている。なお、表1に示す例で
は、緊急性があるか無いかが1か0の2値で表現されて
いるが、連続量(0から1までの実数)で表現しても同
様に実施可能である。この場合には、緊急性をさらに正
確に検出することが可能となる。
止、右、左の単語は緊急性があり得て、その他の緊急性
が0である前進、後退、加速、減速の単語は緊急性があ
り得ないように設定されている。なお、表1に示す例で
は、緊急性があるか無いかが1か0の2値で表現されて
いるが、連続量(0から1までの実数)で表現しても同
様に実施可能である。この場合には、緊急性をさらに正
確に検出することが可能となる。
【0033】そして、マッチング部3では、入力音声パ
ターン生成部2により得られた入力音声パターンと、登
録音声標準パターン記憶部5に記憶された登録音声標準
パターンとの間で周知のDP(ダイナミックプログラミ
ング)マッチングを行い、各登録音声標準パターンと入
力音声パターンとの間のパターン間距離を求める。但
し、緊急性検出部1で緊急性が検出された場合、登録音
声標準パターン記憶部5に記憶された複数の登録音声標
準パターンの内、緊急性があり得ることを示している登
録音声標準パターンに関しては、入力音声パターンとの
間のパターン間距離が小さくなるように1より小さい定
数を乗じてパターン間距離を補正する。
ターン生成部2により得られた入力音声パターンと、登
録音声標準パターン記憶部5に記憶された登録音声標準
パターンとの間で周知のDP(ダイナミックプログラミ
ング)マッチングを行い、各登録音声標準パターンと入
力音声パターンとの間のパターン間距離を求める。但
し、緊急性検出部1で緊急性が検出された場合、登録音
声標準パターン記憶部5に記憶された複数の登録音声標
準パターンの内、緊急性があり得ることを示している登
録音声標準パターンに関しては、入力音声パターンとの
間のパターン間距離が小さくなるように1より小さい定
数を乗じてパターン間距離を補正する。
【0034】さらに、認識判定部4では、マッチング部
3で得られたパターン間距離を用いて認識結果を判定す
る。すなわち、最小のパターン間距離と2番目に小さい
パターン間距離との比が1より大きいリジェクト閾値以
上の場合には、最小のパターン間距離を与えた登録音声
標準パターンの音声を認識結果とし、それ以外の場合に
はリジェクトする。但し、緊急性検出部1で緊急性が検
出された場合には、リジェクト閾値を小さくするか、1
に等しくして緊急性のある音声を認識し易くする。
3で得られたパターン間距離を用いて認識結果を判定す
る。すなわち、最小のパターン間距離と2番目に小さい
パターン間距離との比が1より大きいリジェクト閾値以
上の場合には、最小のパターン間距離を与えた登録音声
標準パターンの音声を認識結果とし、それ以外の場合に
はリジェクトする。但し、緊急性検出部1で緊急性が検
出された場合には、リジェクト閾値を小さくするか、1
に等しくして緊急性のある音声を認識し易くする。
【0035】上述したように、緊急性検出部1にて検出
された入力音声の緊急性に対応して音声認識処理を行う
ことによって、入力音声パターンを補正して緊急時の発
声変動による認識率の低下を防止することが可能とな
り、しかも、緊急性のある音声を緊急時に認識し易くす
ることが可能となり、さらに、緊急時にリジェクトを少
なくして正答率を上げることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
された入力音声の緊急性に対応して音声認識処理を行う
ことによって、入力音声パターンを補正して緊急時の発
声変動による認識率の低下を防止することが可能とな
り、しかも、緊急性のある音声を緊急時に認識し易くす
ることが可能となり、さらに、緊急時にリジェクトを少
なくして正答率を上げることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
【0036】なお、本実施例では、緊急性を示すパラメ
ータとして音声のパワーを用いたが、上述の音声のピッ
チや音声の発声速度を用いても同様に実施可能である。
ここに、緊急性を示すパラメータとして、音声のピッチ
を用いる場合には、1つの音声のピッチの平均値が一定
の閾値以上であれば緊急性あり、それ以外であれば緊急
性なしとする。この場合、音声のピッチの抽出には、周
知のケプストラム分析による方法が用いられる。このよ
うに、音声のピッチを用いても緊急性を的確に捉えるこ
とが可能となる。
ータとして音声のパワーを用いたが、上述の音声のピッ
チや音声の発声速度を用いても同様に実施可能である。
ここに、緊急性を示すパラメータとして、音声のピッチ
を用いる場合には、1つの音声のピッチの平均値が一定
の閾値以上であれば緊急性あり、それ以外であれば緊急
性なしとする。この場合、音声のピッチの抽出には、周
知のケプストラム分析による方法が用いられる。このよ
うに、音声のピッチを用いても緊急性を的確に捉えるこ
とが可能となる。
【0037】また、緊急性を示すパラメータとして、音
声の発声速度を用いる場合には、音声の発声速度が一定
の閾値以上であれば緊急性あり、それ以外であれば緊急
性なしとする。この場合、音声の発声速度は単位時間当
りのパワーのピークとディップとから求めることが可能
である。このように、音声の発声速度を用いても緊急性
を的確に捉えることが可能となる。但し、緊急性を示す
パラメータとして、発声速度を用いる場合、マッチング
部3のマッチングのパスの制限を変えることによって
も、緊急性のある入力音声の認識を良好なものにするこ
とが可能となる。
声の発声速度を用いる場合には、音声の発声速度が一定
の閾値以上であれば緊急性あり、それ以外であれば緊急
性なしとする。この場合、音声の発声速度は単位時間当
りのパワーのピークとディップとから求めることが可能
である。このように、音声の発声速度を用いても緊急性
を的確に捉えることが可能となる。但し、緊急性を示す
パラメータとして、発声速度を用いる場合、マッチング
部3のマッチングのパスの制限を変えることによって
も、緊急性のある入力音声の認識を良好なものにするこ
とが可能となる。
【0038】さらに、上述の音声のパワーと、音声のピ
ッチと、音声の発声速度との緊急性を示すパラメータ、
或いは、その他のパラメータを重み付けした後に加算す
ることにより併用することも可能である。このように複
数のパラメータを併用すれば、パラメータが1つの場合
に比べて緊急性をより一層的確に捉えることが可能とな
る。
ッチと、音声の発声速度との緊急性を示すパラメータ、
或いは、その他のパラメータを重み付けした後に加算す
ることにより併用することも可能である。このように複
数のパラメータを併用すれば、パラメータが1つの場合
に比べて緊急性をより一層的確に捉えることが可能とな
る。
【0039】次に、本発明の第二の実施例を図2に基づ
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図2に示すように、緊急性検出部1の出
力側は、入力音声パターン生成部2に接続されている。
また、その接続状態は、AB間のみが接続されており、
図1に示した第一の実施例のようにAC間、AD間が接
続されていない状態になっている。
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図2に示すように、緊急性検出部1の出
力側は、入力音声パターン生成部2に接続されている。
また、その接続状態は、AB間のみが接続されており、
図1に示した第一の実施例のようにAC間、AD間が接
続されていない状態になっている。
【0040】このような構成において、本実施例で行わ
れる音声認識処理を図2に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、図示しないマイクロフォンから入力
された入力音声から緊急性を検出する。すなわち、1つ
の入力音声の平均パワーが一定の閾値以上である場合を
緊急性あり、それ以外の場合を緊急性なしとする。ま
た、入力音声パターン生成部2では、入力音声パターン
のパラメータとしてLPCケプストラムと音声のパワー
とを用い、入力音声に対して音声区間検出処理と音響分
析処理とを行うことにより、音声区間中の音響分析デー
タから入力音声パターンを生成する。但し、緊急性検出
部1にて緊急性が検出された場合、入力音声パターンの
補正を行う。一方、登録音声標準パターン記憶部5に
は、予め登録された複数の登録音声標準パターンを記憶
しておく。この登録音声標準パターンのパラメータは、
入力音声パターンのパラメータと同様にLPCケプスト
ラムと音声のパワーとである。そして、マッチング部3
により、入力音声パターン生成部2にて得られた入力音
声パターンと、登録音声標準パターン記憶部5に記憶さ
れた登録音声標準パターンとの間で周知のDPマッチン
グを行い、各登録音声標準パターンと入力音声パターン
との間のパターン間距離を求める。さらに、認識判定部
4によりマッチング部3で得られたパターン間距離を用
いて認識結果を判定する。すなわち、最小のパターン間
距離を与えた登録音声標準パターンの音声を認識結果と
し、それ以外の音声をリジェクトする。
れる音声認識処理を図2に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、図示しないマイクロフォンから入力
された入力音声から緊急性を検出する。すなわち、1つ
の入力音声の平均パワーが一定の閾値以上である場合を
緊急性あり、それ以外の場合を緊急性なしとする。ま
た、入力音声パターン生成部2では、入力音声パターン
のパラメータとしてLPCケプストラムと音声のパワー
とを用い、入力音声に対して音声区間検出処理と音響分
析処理とを行うことにより、音声区間中の音響分析デー
タから入力音声パターンを生成する。但し、緊急性検出
部1にて緊急性が検出された場合、入力音声パターンの
補正を行う。一方、登録音声標準パターン記憶部5に
は、予め登録された複数の登録音声標準パターンを記憶
しておく。この登録音声標準パターンのパラメータは、
入力音声パターンのパラメータと同様にLPCケプスト
ラムと音声のパワーとである。そして、マッチング部3
により、入力音声パターン生成部2にて得られた入力音
声パターンと、登録音声標準パターン記憶部5に記憶さ
れた登録音声標準パターンとの間で周知のDPマッチン
グを行い、各登録音声標準パターンと入力音声パターン
との間のパターン間距離を求める。さらに、認識判定部
4によりマッチング部3で得られたパターン間距離を用
いて認識結果を判定する。すなわち、最小のパターン間
距離を与えた登録音声標準パターンの音声を認識結果と
し、それ以外の音声をリジェクトする。
【0041】上述したように、入力音声の緊急性に対応
して入力音声パターンの補正を行うことによって、緊急
時の発声変動による認識率の低下を防止することが可能
となり、これにより、平常時の音声認識性能を損なわず
に緊急時の音声認識性能を向上させることが可能とな
る。
して入力音声パターンの補正を行うことによって、緊急
時の発声変動による認識率の低下を防止することが可能
となり、これにより、平常時の音声認識性能を損なわず
に緊急時の音声認識性能を向上させることが可能とな
る。
【0042】なお、本実施例では、緊急性検出部1の緊
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
【0043】次に、本発明の第三の実施例を図3に基づ
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図3に示すように、緊急性検出部1の出
力側は、マッチング部3に接続されている。また、その
接続状態は、AC間が接続されており、図1に示した第
一の実施例のようにAB間、AD間が接続されていない
状態になっている。
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図3に示すように、緊急性検出部1の出
力側は、マッチング部3に接続されている。また、その
接続状態は、AC間が接続されており、図1に示した第
一の実施例のようにAB間、AD間が接続されていない
状態になっている。
【0044】このような構成において、本実施例で行わ
れる音声認識処理を図3に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、マイクロフォンから入力された入力
音声から緊急性を検出する。すなわち、1つの入力音声
の平均パワーが一定の閾値以上である場合を緊急性あ
り、それ以外の場合を緊急性なしとする。また、入力音
声パターン生成部2では、入力音声パターンのパラメー
タとしてLPCケプストラムと音声のパワーとを用い
て、入力音声に対して音声区間検出処理と音響分析処理
とを行うことにより、音声区間中の音響分析データから
入力音声パターンを生成する。一方、登録音声標準パタ
ーン記憶部5には、予め登録された複数の登録音声標準
パターンを記憶すると共に、これらの登録音声標準パタ
ーンの各々に緊急性があるか否かの緊急性情報を併せて
記憶しておく。この登録音声標準パターンのパラメータ
は、入力音声パターンのパラメータと同様にLPCケプ
ストラムと音声のパワーとである。そして、マッチング
部3により、入力音声パターン生成部2にて得られた入
力音声パターンと、登録音声標準パターン記憶部5に記
憶された登録音声標準パターンとの間で周知のDPマッ
チングを行い、各登録音声標準パターンと入力音声パタ
ーンとの間のパターン間距離を求める。但し、緊急性検
出部1で緊急性が検出された場合、登録音声標準パター
ン記憶部5に記憶された複数の登録音声標準パターンの
内、緊急性があり得ることを示している登録音声標準パ
ターンに関しては、入力音声パターンとの間のパターン
間距離が小さくなるように1より小さい定数を乗じてパ
ターン間距離を補正する。これにより、緊急性のある入
力音声を認識し易くさせる。さらに、認識判定部4によ
りマッチング部3で得られたパターン間距離を用いて認
識結果を判定する。すなわち、最小のパターン間距離を
与えた登録音声標準パターンの音声を認識結果とし、そ
れ以外の音声をリジェクトする。
れる音声認識処理を図3に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、マイクロフォンから入力された入力
音声から緊急性を検出する。すなわち、1つの入力音声
の平均パワーが一定の閾値以上である場合を緊急性あ
り、それ以外の場合を緊急性なしとする。また、入力音
声パターン生成部2では、入力音声パターンのパラメー
タとしてLPCケプストラムと音声のパワーとを用い
て、入力音声に対して音声区間検出処理と音響分析処理
とを行うことにより、音声区間中の音響分析データから
入力音声パターンを生成する。一方、登録音声標準パタ
ーン記憶部5には、予め登録された複数の登録音声標準
パターンを記憶すると共に、これらの登録音声標準パタ
ーンの各々に緊急性があるか否かの緊急性情報を併せて
記憶しておく。この登録音声標準パターンのパラメータ
は、入力音声パターンのパラメータと同様にLPCケプ
ストラムと音声のパワーとである。そして、マッチング
部3により、入力音声パターン生成部2にて得られた入
力音声パターンと、登録音声標準パターン記憶部5に記
憶された登録音声標準パターンとの間で周知のDPマッ
チングを行い、各登録音声標準パターンと入力音声パタ
ーンとの間のパターン間距離を求める。但し、緊急性検
出部1で緊急性が検出された場合、登録音声標準パター
ン記憶部5に記憶された複数の登録音声標準パターンの
内、緊急性があり得ることを示している登録音声標準パ
ターンに関しては、入力音声パターンとの間のパターン
間距離が小さくなるように1より小さい定数を乗じてパ
ターン間距離を補正する。これにより、緊急性のある入
力音声を認識し易くさせる。さらに、認識判定部4によ
りマッチング部3で得られたパターン間距離を用いて認
識結果を判定する。すなわち、最小のパターン間距離を
与えた登録音声標準パターンの音声を認識結果とし、そ
れ以外の音声をリジェクトする。
【0045】上述したように、入力音声の緊急性と各々
の登録音声標準パターンの緊急性情報とに対応してパタ
ーン間距離を求めているため、緊急性のある入力音声を
緊急時に認識し易くすることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
の登録音声標準パターンの緊急性情報とに対応してパタ
ーン間距離を求めているため、緊急性のある入力音声を
緊急時に認識し易くすることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
【0046】なお、本実施例では、緊急性検出部1の緊
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
【0047】次に、本発明の第四の実施例を図4に基づ
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図4に示すように、緊急性検出部1の出
力側は、認識判定部4に接続されている。また、その接
続状態は、AD間が接続されており、図1に示した第一
の実施例のようにAB間、AC間が接続されていない状
態になっている。
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図4に示すように、緊急性検出部1の出
力側は、認識判定部4に接続されている。また、その接
続状態は、AD間が接続されており、図1に示した第一
の実施例のようにAB間、AC間が接続されていない状
態になっている。
【0048】このような構成において、本実施例で行わ
れる音声認識処理を図4に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、マイクロフォンから入力された入力
音声から緊急性を検出する。すなわち、1つの入力音声
の平均パワーが一定の閾値以上である場合を緊急性あ
り、それ以外の場合を緊急性なしとする。また、入力音
声パターン生成部2では、入力音声パターンのパラメー
タとしてLPCケプストラムと音声のパワーとを用い
て、入力音声に対して音声区間検出処理と音響分析処理
とを行うことにより、音声区間中の音響分析データから
入力音声パターンを生成する。一方、登録音声標準パタ
ーン記憶部5には、予め登録された複数の登録音声標準
パターンを記憶しておく。この登録音声標準パターンの
パラメータは、入力音声パターンのパラメータと同様に
LPCケプストラムと音声のパワーとである。そして、
マッチング部3により、入力音声パターン生成部2にて
得られた入力音声パターンと、登録音声標準パターン記
憶部5に記憶された登録音声標準パターンとの間で周知
のDPマッチングを行い、各登録音声標準パターンと入
力音声パターンとの間のパターン間距離を求める。さら
に、認識判定部4によりマッチング部3で得られたパタ
ーン間距離を用いて認識結果を判定する。すなわち、最
小のパターン間距離を与えた登録音声標準パターンの音
声を認識結果とし、それ以外の音声をリジェクトする。
但し、緊急性検出部1で緊急性が検出された場合には、
リジェクト閾値を小さくするか、1に等しくして緊急性
のある入力音声がリジェクトされ難くすることにより、
緊急時の入力音声の認識率を向上させることが可能とな
る。
れる音声認識処理を図4に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、マイクロフォンから入力された入力
音声から緊急性を検出する。すなわち、1つの入力音声
の平均パワーが一定の閾値以上である場合を緊急性あ
り、それ以外の場合を緊急性なしとする。また、入力音
声パターン生成部2では、入力音声パターンのパラメー
タとしてLPCケプストラムと音声のパワーとを用い
て、入力音声に対して音声区間検出処理と音響分析処理
とを行うことにより、音声区間中の音響分析データから
入力音声パターンを生成する。一方、登録音声標準パタ
ーン記憶部5には、予め登録された複数の登録音声標準
パターンを記憶しておく。この登録音声標準パターンの
パラメータは、入力音声パターンのパラメータと同様に
LPCケプストラムと音声のパワーとである。そして、
マッチング部3により、入力音声パターン生成部2にて
得られた入力音声パターンと、登録音声標準パターン記
憶部5に記憶された登録音声標準パターンとの間で周知
のDPマッチングを行い、各登録音声標準パターンと入
力音声パターンとの間のパターン間距離を求める。さら
に、認識判定部4によりマッチング部3で得られたパタ
ーン間距離を用いて認識結果を判定する。すなわち、最
小のパターン間距離を与えた登録音声標準パターンの音
声を認識結果とし、それ以外の音声をリジェクトする。
但し、緊急性検出部1で緊急性が検出された場合には、
リジェクト閾値を小さくするか、1に等しくして緊急性
のある入力音声がリジェクトされ難くすることにより、
緊急時の入力音声の認識率を向上させることが可能とな
る。
【0049】上述したように、入力音声の緊急性に対応
して認識判定部4のリジェクトの条件を変更させること
によって、緊急時にリジェクトを少なくして正答率を上
げることが可能となり、これにより、平常時の音声認識
性能を損なわずに緊急時の音声認識性能を向上させるこ
とが可能となる。
して認識判定部4のリジェクトの条件を変更させること
によって、緊急時にリジェクトを少なくして正答率を上
げることが可能となり、これにより、平常時の音声認識
性能を損なわずに緊急時の音声認識性能を向上させるこ
とが可能となる。
【0050】なお、本実施例では、緊急性検出部1の緊
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
【0051】
【発明の効果】請求項1記載の発明は、入力音声から緊
急性を検出する緊急性検出手段を設け、前記入力音声を
分析して入力音声パターンを生成する入力音声パターン
生成手段を設け、予め登録された複数の登録音声標準パ
ターンを記憶する登録音声標準パターン記憶手段を設
け、前記入力音声パターンと前記登録音声標準パターン
とのマッチングを行うことによりこれらの各登録音声標
準パターンに対する前記入力音声パターンのパターン間
距離を求めるマッチング手段を設け、前記パターン間距
離に基づいて認識結果を判定する認識判定手段を設けた
ので、緊急性検出手段にて検出された入力音声の緊急性
に対応して音声認識処理を行うことによって、入力音声
パターンを補正して緊急時の発声変動による認識率の低
下を防止することが可能となり、しかも、緊急性のある
音声を緊急時に認識し易くすることが可能となり、さら
に、緊急時にリジェクトを少なくして正答率を上げるこ
とが可能となり、これにより、平常時の音声認識性能を
損なわずに緊急時の音声認識性能を向上させることがで
きるものである。
急性を検出する緊急性検出手段を設け、前記入力音声を
分析して入力音声パターンを生成する入力音声パターン
生成手段を設け、予め登録された複数の登録音声標準パ
ターンを記憶する登録音声標準パターン記憶手段を設
け、前記入力音声パターンと前記登録音声標準パターン
とのマッチングを行うことによりこれらの各登録音声標
準パターンに対する前記入力音声パターンのパターン間
距離を求めるマッチング手段を設け、前記パターン間距
離に基づいて認識結果を判定する認識判定手段を設けた
ので、緊急性検出手段にて検出された入力音声の緊急性
に対応して音声認識処理を行うことによって、入力音声
パターンを補正して緊急時の発声変動による認識率の低
下を防止することが可能となり、しかも、緊急性のある
音声を緊急時に認識し易くすることが可能となり、さら
に、緊急時にリジェクトを少なくして正答率を上げるこ
とが可能となり、これにより、平常時の音声認識性能を
損なわずに緊急時の音声認識性能を向上させることがで
きるものである。
【0052】請求項2記載の発明は、請求項1記載の発
明において、入力音声パターン生成手段は、緊急性検出
手段により検出された緊急性に対応して入力音声パター
ンを補正するので、緊急時の発声変動による認識率の低
下を防止することができ、これにより、平常時の音声認
識性能を損なわずに緊急時の音声認識性能を向上させる
ことができるものである。
明において、入力音声パターン生成手段は、緊急性検出
手段により検出された緊急性に対応して入力音声パター
ンを補正するので、緊急時の発声変動による認識率の低
下を防止することができ、これにより、平常時の音声認
識性能を損なわずに緊急時の音声認識性能を向上させる
ことができるものである。
【0053】請求項3記載の発明は、請求項1記載の発
明において、登録音声標準パターン記憶手段は、登録さ
れた各々の登録音声標準パターンに緊急性があるか否か
の緊急性情報を併せて記憶し、マッチング手段は、緊急
性検出手段により検出された緊急性と前記登録音声標準
パターン記憶手段に記憶された前記緊急性情報とに対応
してマッチングを行うので、入力音声の緊急性と各々の
登録音声標準パターンの緊急性情報とに対応してマッチ
ング手段にてパターン間距離を求めることによって、緊
急性のある入力音声を緊急時に認識し易くすることがで
き、これにより、平常時の音声認識性能を損なわずに緊
急時の音声認識性能を向上させることができるものであ
る。
明において、登録音声標準パターン記憶手段は、登録さ
れた各々の登録音声標準パターンに緊急性があるか否か
の緊急性情報を併せて記憶し、マッチング手段は、緊急
性検出手段により検出された緊急性と前記登録音声標準
パターン記憶手段に記憶された前記緊急性情報とに対応
してマッチングを行うので、入力音声の緊急性と各々の
登録音声標準パターンの緊急性情報とに対応してマッチ
ング手段にてパターン間距離を求めることによって、緊
急性のある入力音声を緊急時に認識し易くすることがで
き、これにより、平常時の音声認識性能を損なわずに緊
急時の音声認識性能を向上させることができるものであ
る。
【0054】請求項4記載の発明は、請求項1記載の発
明において、認識判定手段は、緊急性検出手段により検
出された緊急性に対応してリジェクト条件を変更させて
認識結果を判定するので、緊急時にリジェクトを少なく
して正答率を上げることができ、これにより、平常時の
音声認識性能を損なわずに緊急時の音声認識性能を向上
させることができるものである。
明において、認識判定手段は、緊急性検出手段により検
出された緊急性に対応してリジェクト条件を変更させて
認識結果を判定するので、緊急時にリジェクトを少なく
して正答率を上げることができ、これにより、平常時の
音声認識性能を損なわずに緊急時の音声認識性能を向上
させることができるものである。
【0055】請求項5記載の発明は、請求項1,2,3
又は4記載の発明において、緊急性検出手段は、緊急性
を示すパラメータとして音声のパワーを検出するので、
緊急性を的確に捉えることができるものである。
又は4記載の発明において、緊急性検出手段は、緊急性
を示すパラメータとして音声のパワーを検出するので、
緊急性を的確に捉えることができるものである。
【0056】請求項6記載の発明は、請求項1,2,3
又は4記載の発明において、緊急性検出手段は、緊急性
を示すパラメータとして音声のピッチを検出するので、
緊急性を的確に捉えることができるものである。
又は4記載の発明において、緊急性検出手段は、緊急性
を示すパラメータとして音声のピッチを検出するので、
緊急性を的確に捉えることができるものである。
【0057】請求項7記載の発明は、請求項1,2,3
又は4記載の発明において、緊急性検出手段は、緊急性
を示すパラメータとして音声の発声速度を検出するの
で、緊急性を的確に捉えることができるものである。
又は4記載の発明において、緊急性検出手段は、緊急性
を示すパラメータとして音声の発声速度を検出するの
で、緊急性を的確に捉えることができるものである。
【0058】請求項8記載の発明は、請求項1,2,
3,4,5,6又は7記載の発明において、緊急性検出
手段は、緊急性を示すパラメータとして音声のパワーと
音声のピッチと音声の発声速度とを含む複数のパラメー
タを併用するので、パラメータが1つの場合に比べて緊
急性をより一層的確に捉えることができるものである。
3,4,5,6又は7記載の発明において、緊急性検出
手段は、緊急性を示すパラメータとして音声のパワーと
音声のピッチと音声の発声速度とを含む複数のパラメー
タを併用するので、パラメータが1つの場合に比べて緊
急性をより一層的確に捉えることができるものである。
【図1】本発明の第一の実施例を示すブロック回路図で
ある。
ある。
【図2】本発明の第二の実施例を示すブロック回路図で
ある。
ある。
【図3】本発明の第三の実施例を示すブロック回路図で
ある。
ある。
【図4】本発明の第四の実施例を示すブロック回路図で
ある。
ある。
1 緊急性検出手段 2 入力音声パターン生成手段 3 マッチング手段 4 認識判定手段 5 登録音声標準パターン記憶手段
Claims (8)
- 【請求項1】 入力音声から緊急性を検出する緊急性検
出手段と、前記入力音声を分析して入力音声パターンを
生成する入力音声パターン生成手段と、予め登録された
複数の登録音声標準パターンを記憶する登録音声標準パ
ターン記憶手段と、前記入力音声パターンと前記登録音
声標準パターンとのマッチングを行うことによりこれら
の各登録音声標準パターンに対する前記入力音声パター
ンのパターン間距離を求めるマッチング手段と、前記パ
ターン間距離に基づいて認識結果を判定する認識判定手
段とよりなることを特徴とする音声認識装置。 - 【請求項2】 入力音声パターン生成手段は、緊急性検
出手段により検出された緊急性に対応して入力音声パタ
ーンを補正することを特徴とする請求項1記載の音声認
識装置。 - 【請求項3】 登録音声標準パターン記憶手段は、登録
された各々の登録音声標準パターンに緊急性があるか否
かの緊急性情報を併せて記憶し、マッチング手段は、緊
急性検出手段により検出された緊急性と前記登録音声標
準パターン記憶手段に記憶された前記緊急性情報とに対
応してマッチングを行うことを特徴とする請求項1記載
の音声認識装置。 - 【請求項4】 認識判定手段は、緊急性検出手段により
検出された緊急性に対応してリジェクト条件を変更させ
て認識結果を判定することを特徴とする請求項1記載の
音声認識装置。 - 【請求項5】 緊急性検出手段は、緊急性を示すパラメ
ータとして音声のパワーを検出することを特徴とする請
求項1,2,3又は4記載の音声認識装置。 - 【請求項6】 緊急性検出手段は、緊急性を示すパラメ
ータとして音声のピッチを検出することを特徴とする請
求項1,2,3又は4記載の音声認識装置。 - 【請求項7】 緊急性検出手段は、緊急性を示すパラメ
ータとして音声の発声速度を検出することを特徴とする
請求項1,2,3又は4記載の音声認識装置。 - 【請求項8】 緊急性検出手段は、緊急性を示すパラメ
ータとして音声のパワーと音声のピッチと音声の発声速
度とを含む複数のパラメータを併用することを特徴とす
る請求項1,2,3,4,5,6又は7記載の音声認識
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03281245A JP3119510B2 (ja) | 1991-10-28 | 1991-10-28 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03281245A JP3119510B2 (ja) | 1991-10-28 | 1991-10-28 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH05119792A true JPH05119792A (ja) | 1993-05-18 |
| JP3119510B2 JP3119510B2 (ja) | 2000-12-25 |
Family
ID=17636384
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP03281245A Expired - Fee Related JP3119510B2 (ja) | 1991-10-28 | 1991-10-28 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3119510B2 (ja) |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001287599A (ja) * | 2000-04-07 | 2001-10-16 | Kenwood Corp | 無線通信機 |
| JP2006138994A (ja) * | 2004-11-11 | 2006-06-01 | Nissan Motor Co Ltd | 音声認識装置 |
| JP2010204637A (ja) * | 2009-02-03 | 2010-09-16 | Denso Corp | 音声認識装置、音声認識方法、及びナビゲーション装置 |
| US9020820B2 (en) | 2011-06-30 | 2015-04-28 | Fujitsu Limited | State detecting apparatus, communication apparatus, and storage medium storing state detecting program |
| US9230538B2 (en) | 2011-04-08 | 2016-01-05 | Mitsubishi Electric Corporation | Voice recognition device and navigation device |
| JP2019078463A (ja) * | 2017-10-25 | 2019-05-23 | 株式会社パロマ | 加熱調理器 |
| WO2019107170A1 (ja) * | 2017-11-29 | 2019-06-06 | 日本電信電話株式会社 | 緊急度推定装置、緊急度推定方法、プログラム |
| JP2020138314A (ja) * | 2019-02-26 | 2020-09-03 | 株式会社Preferred Networks | 制御装置、システム及び制御方法 |
| WO2020174930A1 (ja) * | 2019-02-26 | 2020-09-03 | 株式会社Preferred Networks | 制御装置、システム及び制御方法 |
| JP2021521569A (ja) * | 2018-04-13 | 2021-08-26 | ディワートオキン ゲゼルシャフト ミット ベシュレンクテル ハフツング | モバイルドライブ用コントローラ、およびモバイルドライブを制御するための方法 |
| JP2024021190A (ja) * | 2022-08-03 | 2024-02-16 | 株式会社Jvcケンウッド | 音声コマンド受付装置、および音声コマンド受付方法 |
-
1991
- 1991-10-28 JP JP03281245A patent/JP3119510B2/ja not_active Expired - Fee Related
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001287599A (ja) * | 2000-04-07 | 2001-10-16 | Kenwood Corp | 無線通信機 |
| JP2006138994A (ja) * | 2004-11-11 | 2006-06-01 | Nissan Motor Co Ltd | 音声認識装置 |
| JP2010204637A (ja) * | 2009-02-03 | 2010-09-16 | Denso Corp | 音声認識装置、音声認識方法、及びナビゲーション装置 |
| US9230538B2 (en) | 2011-04-08 | 2016-01-05 | Mitsubishi Electric Corporation | Voice recognition device and navigation device |
| US9020820B2 (en) | 2011-06-30 | 2015-04-28 | Fujitsu Limited | State detecting apparatus, communication apparatus, and storage medium storing state detecting program |
| JP2019078463A (ja) * | 2017-10-25 | 2019-05-23 | 株式会社パロマ | 加熱調理器 |
| WO2019107170A1 (ja) * | 2017-11-29 | 2019-06-06 | 日本電信電話株式会社 | 緊急度推定装置、緊急度推定方法、プログラム |
| JPWO2019107170A1 (ja) * | 2017-11-29 | 2020-11-26 | 日本電信電話株式会社 | 緊急度推定装置、緊急度推定方法、プログラム |
| US11495245B2 (en) | 2017-11-29 | 2022-11-08 | Nippon Telegraph And Telephone Corporation | Urgency level estimation apparatus, urgency level estimation method, and program |
| JP2021521569A (ja) * | 2018-04-13 | 2021-08-26 | ディワートオキン ゲゼルシャフト ミット ベシュレンクテル ハフツング | モバイルドライブ用コントローラ、およびモバイルドライブを制御するための方法 |
| JP2020138314A (ja) * | 2019-02-26 | 2020-09-03 | 株式会社Preferred Networks | 制御装置、システム及び制御方法 |
| WO2020174930A1 (ja) * | 2019-02-26 | 2020-09-03 | 株式会社Preferred Networks | 制御装置、システム及び制御方法 |
| JP2024021190A (ja) * | 2022-08-03 | 2024-02-16 | 株式会社Jvcケンウッド | 音声コマンド受付装置、および音声コマンド受付方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3119510B2 (ja) | 2000-12-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0691022B1 (en) | Speech recognition with pause detection | |
| EP2486562B1 (en) | Method for the detection of speech segments | |
| US8374869B2 (en) | Utterance verification method and apparatus for isolated word N-best recognition result | |
| US6134527A (en) | Method of testing a vocabulary word being enrolled in a speech recognition system | |
| US5621849A (en) | Voice recognizing method and apparatus | |
| JP2021162685A (ja) | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム | |
| JPH05119792A (ja) | 音声認識装置 | |
| JPH01296299A (ja) | 音声認識装置 | |
| US5033089A (en) | Methods for forming reference voice patterns, and methods for comparing voice patterns | |
| JP3069531B2 (ja) | 音声認識方法 | |
| US6823304B2 (en) | Speech recognition apparatus and method performing speech recognition with feature parameter preceding lead voiced sound as feature parameter of lead consonant | |
| JP2003330491A (ja) | 音声認識装置および音声認識方法ならびにプログラム | |
| JPH1185190A (ja) | 音声認識装置及び音声認識方法 | |
| JP2996019B2 (ja) | 音声認識装置 | |
| JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
| JP3091537B2 (ja) | 音声パターン作成方法 | |
| JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
| JP3112037B2 (ja) | 音声認識装置 | |
| JP3114757B2 (ja) | 音声認識装置 | |
| JP3075250B2 (ja) | 話者認識方法及び装置 | |
| JP2666296B2 (ja) | 音声認識装置 | |
| JP4391031B2 (ja) | 音声認識装置 | |
| JPH1097269A (ja) | 音声検出装置及び方法 | |
| JP3026855B2 (ja) | 音声認識装置 | |
| JPH05249987A (ja) | 音声検出方法および音声検出装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071013 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081013 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081013 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091013 Year of fee payment: 9 |
|
| LAPS | Cancellation because of no payment of annual fees |