JPH11119793A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH11119793A JPH11119793A JP9283324A JP28332497A JPH11119793A JP H11119793 A JPH11119793 A JP H11119793A JP 9283324 A JP9283324 A JP 9283324A JP 28332497 A JP28332497 A JP 28332497A JP H11119793 A JPH11119793 A JP H11119793A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- speech
- perplexity
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 入力された音声を認識し文字列などとして出
力する音声認識装置において、内部で用いられるビーム
サーチ法の枝刈りのための閾値や、目標アクティブパス
数を、自動的に設定することを目標とする。 【解決手段】 本発明の音声認識装置は、音声入力手段
と、音声認識手段と、標準パターンの辞書を記憶してい
る記憶手段とを具備し、かつ、記憶手段に記憶されてい
る辞書を読み出して、認識タスクの複雑さを表わすパラ
メータであるパープレキシティを検出するパープレキシ
ティ検出手段と、前記パープレキシティ検出手段におい
て検出されたパープレキシティより、前記音声認識手段
で行うビームサーチ法による枝刈りの閾値を決定する閾
値設定手段と、を具備することを特徴とする。
力する音声認識装置において、内部で用いられるビーム
サーチ法の枝刈りのための閾値や、目標アクティブパス
数を、自動的に設定することを目標とする。 【解決手段】 本発明の音声認識装置は、音声入力手段
と、音声認識手段と、標準パターンの辞書を記憶してい
る記憶手段とを具備し、かつ、記憶手段に記憶されてい
る辞書を読み出して、認識タスクの複雑さを表わすパラ
メータであるパープレキシティを検出するパープレキシ
ティ検出手段と、前記パープレキシティ検出手段におい
て検出されたパープレキシティより、前記音声認識手段
で行うビームサーチ法による枝刈りの閾値を決定する閾
値設定手段と、を具備することを特徴とする。
Description
【0001】
【発明の属する技術分野】本発明は、人が発声した単語
などの音声を入力信号とし、その音声を標準パターンと
比較して最も似たパターンを探索することにより認識
し、結果を文字列などとして出力するような音声認識装
置に関するものである。
などの音声を入力信号とし、その音声を標準パターンと
比較して最も似たパターンを探索することにより認識
し、結果を文字列などとして出力するような音声認識装
置に関するものである。
【0002】
【従来の技術】従来の技術について、図6を参照しなが
ら説明する。
ら説明する。
【0003】従来の音声認識装置は、入力された音声を
認識して結果を出力する音声認識装置601であって、
音声入力手段602と、記憶手段603と、音声認識手
段604と、閾値設定手段605とを具備している。
認識して結果を出力する音声認識装置601であって、
音声入力手段602と、記憶手段603と、音声認識手
段604と、閾値設定手段605とを具備している。
【0004】音声入力手段602は、時間波形から音声
区間を検出し、検出された音声区間をフレーム分割し、
フレーム分割された音声を認識のためにパラメータ化す
る。
区間を検出し、検出された音声区間をフレーム分割し、
フレーム分割された音声を認識のためにパラメータ化す
る。
【0005】記憶手段603は、パラメータ化された音
声の標準パターンを、あらかじめ辞書として記憶してい
る。
声の標準パターンを、あらかじめ辞書として記憶してい
る。
【0006】音声認識手段604は、音声入力手段にお
いてパラメータ化された信号と、辞書から読み出した標
準パターンとを、DPマッチング法などにより、認識結
果を文字列などとして出力する。ここで、前記音声認識
手段604においては、演算量を削減するために、前記
DPマッチング法などに、ビームサーチ法を組み合わせ
て音声認識を行う。
いてパラメータ化された信号と、辞書から読み出した標
準パターンとを、DPマッチング法などにより、認識結
果を文字列などとして出力する。ここで、前記音声認識
手段604においては、演算量を削減するために、前記
DPマッチング法などに、ビームサーチ法を組み合わせ
て音声認識を行う。
【0007】閾値設定手段605は、前記音声認識手段
で行うビームサーチ法による枝刈りの閾値αを、音声認
識手段604に送るものである。
で行うビームサーチ法による枝刈りの閾値αを、音声認
識手段604に送るものである。
【0008】音声認識手段604は、パラメータ化され
た入力音声と標準パターンとを先頭フレームから比較し
累積尤度を計算して行くという、最適パス探索問題を解
くものである。音声認識手段604で行われるビームサ
ーチ法による枝刈りとは、前記最適パス探索問題におい
て、先頭フレームから計算して行くそれぞれのパスのう
ち、累積尤度の低いものについては途中で計算を止める
という手法のことである。これは音声認識手段における
演算量を軽減するために行われる。また、これは、フレ
ームが進むに連れて増えて行く枝を刈り取るような作業
であるので、枝刈りと呼ばれる。
た入力音声と標準パターンとを先頭フレームから比較し
累積尤度を計算して行くという、最適パス探索問題を解
くものである。音声認識手段604で行われるビームサ
ーチ法による枝刈りとは、前記最適パス探索問題におい
て、先頭フレームから計算して行くそれぞれのパスのう
ち、累積尤度の低いものについては途中で計算を止める
という手法のことである。これは音声認識手段における
演算量を軽減するために行われる。また、これは、フレ
ームが進むに連れて増えて行く枝を刈り取るような作業
であるので、枝刈りと呼ばれる。
【0009】ここで、枝刈りを行うには、刈るべきパス
の累積尤度の閾値が必要であるが、従来の音声認識装置
601においては、外部から閾値を与えるか、あるい
は、外部から残すべきパスの本数を与える必要があっ
た。この残すべきパスの本数を目標アクティブパス数と
呼ぶ。
の累積尤度の閾値が必要であるが、従来の音声認識装置
601においては、外部から閾値を与えるか、あるい
は、外部から残すべきパスの本数を与える必要があっ
た。この残すべきパスの本数を目標アクティブパス数と
呼ぶ。
【0010】以上のような構成の音声認識装置601に
より、入力された音声を認識し、その結果を文字列など
として出力することが可能となる。
より、入力された音声を認識し、その結果を文字列など
として出力することが可能となる。
【0011】
【発明が解決しようとする課題】従来の音声認識装置に
おいてはビームサーチ法による枝刈りの閾値を設定する
際に、外部から累積尤度の閾値を与えたり、あるいは、
外部から目標アクティブパス数を与える必要があった。
おいてはビームサーチ法による枝刈りの閾値を設定する
際に、外部から累積尤度の閾値を与えたり、あるいは、
外部から目標アクティブパス数を与える必要があった。
【0012】しかしながら、累積尤度の閾値や、目標ア
クティブパス数は、認識タスクの語彙数、辞書に登録さ
れている語彙の類似度、標準パターンの精度などに依存
する。よって、枝刈りのための累積尤度の閾値や目標ア
クティブパス数を設定するには、認識タスクごとに、そ
れらと認識率の関係について、あらかじめ調べておかな
ければならない。これは、非常に手間のかかる作業であ
った。
クティブパス数は、認識タスクの語彙数、辞書に登録さ
れている語彙の類似度、標準パターンの精度などに依存
する。よって、枝刈りのための累積尤度の閾値や目標ア
クティブパス数を設定するには、認識タスクごとに、そ
れらと認識率の関係について、あらかじめ調べておかな
ければならない。これは、非常に手間のかかる作業であ
った。
【0013】本発明は上記の課題に鑑みてなされたもの
であり、枝刈りのための累積尤度の閾値や目標アクティ
ブパス数を自動的に設定することを目的とする。
であり、枝刈りのための累積尤度の閾値や目標アクティ
ブパス数を自動的に設定することを目的とする。
【0014】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明の音声認識装置は、入力された音声を認識
して認識結果を出力する音声認識装置であって、音声を
入力し、前記音声の時間波形から音声区間を検出し、検
出された音声区間をフレーム分割し、フレーム分割され
た音声を認識のためのパラメータに変換する音声入力手
段と、あらかじめ用意された音声の標準パターンを辞書
として記憶している記憶手段と、音声入力手段において
パラメータに変換された信号と、辞書から読み出した標
準パターンとを、ビームサーチ法を用いながら比較し、
認識結果を出力する音声認識手段と、前記記憶手段に記
憶された辞書を読み出して、前記音声認識手段で行う認
識タスクの複雑さを表すパープレキシティを検出するパ
ープレキシティ検出手段と、前記パープレキシティ検出
手段において検出されたパープレキシティより、前記音
声認識手段で行うビームサーチ法による枝刈りの閾値を
決定する閾値設定手段と、を具備することを特徴とす
る。
めに、本発明の音声認識装置は、入力された音声を認識
して認識結果を出力する音声認識装置であって、音声を
入力し、前記音声の時間波形から音声区間を検出し、検
出された音声区間をフレーム分割し、フレーム分割され
た音声を認識のためのパラメータに変換する音声入力手
段と、あらかじめ用意された音声の標準パターンを辞書
として記憶している記憶手段と、音声入力手段において
パラメータに変換された信号と、辞書から読み出した標
準パターンとを、ビームサーチ法を用いながら比較し、
認識結果を出力する音声認識手段と、前記記憶手段に記
憶された辞書を読み出して、前記音声認識手段で行う認
識タスクの複雑さを表すパープレキシティを検出するパ
ープレキシティ検出手段と、前記パープレキシティ検出
手段において検出されたパープレキシティより、前記音
声認識手段で行うビームサーチ法による枝刈りの閾値を
決定する閾値設定手段と、を具備することを特徴とす
る。
【0015】また、本発明の音声認識装置は、入力され
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記音声認識
手段より現在処理しているフレーム番号が入力され、ま
た、前記記憶手段に記憶された辞書を読み出して、前記
音声認識手段で行う認識タスクの、あるフレーム区間の
複雑さを表すパープレキシティを検出する区間パープレ
キシティ検出手段と、前記区間パープレキシティ検出手
段において検出されたパープレキシティより、前記音声
認識手段で行うビームサーチ法による枝刈りの閾値を決
定する閾値設定手段と、を具備することを特徴とする。
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記音声認識
手段より現在処理しているフレーム番号が入力され、ま
た、前記記憶手段に記憶された辞書を読み出して、前記
音声認識手段で行う認識タスクの、あるフレーム区間の
複雑さを表すパープレキシティを検出する区間パープレ
キシティ検出手段と、前記区間パープレキシティ検出手
段において検出されたパープレキシティより、前記音声
認識手段で行うビームサーチ法による枝刈りの閾値を決
定する閾値設定手段と、を具備することを特徴とする。
【0016】また、本発明の音声認識装置は、入力され
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記記憶手段
に記憶された辞書を読み出して、前記音声認識手段で行
う認識タスクの複雑さを表すパープレキシティを検出す
るパープレキシティ検出手段と、前記音声認識手段にお
いて実際にアクティブなパスの本数を検出する実アクテ
ィブパス数検出手段と、前記パープレキシティ検出手段
から出力されたパープレキシティと、前記実アクティブ
パス数検出手段から出力されたアクティブなパスの本数
とが入力され、前記ビームサーチ法における枝刈りの閾
値を決定し、前記枝刈りの閾値を前記音声認識手段に出
力する、閾値設定手段と、を具備することを特徴とす
る。
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記記憶手段
に記憶された辞書を読み出して、前記音声認識手段で行
う認識タスクの複雑さを表すパープレキシティを検出す
るパープレキシティ検出手段と、前記音声認識手段にお
いて実際にアクティブなパスの本数を検出する実アクテ
ィブパス数検出手段と、前記パープレキシティ検出手段
から出力されたパープレキシティと、前記実アクティブ
パス数検出手段から出力されたアクティブなパスの本数
とが入力され、前記ビームサーチ法における枝刈りの閾
値を決定し、前記枝刈りの閾値を前記音声認識手段に出
力する、閾値設定手段と、を具備することを特徴とす
る。
【0017】また、本発明の音声認識装置は、入力され
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記記憶手段
に記憶された辞書を読み出して、前記音声認識手段で行
う認識タスクの複雑さを表すパープレキシティを検出す
るパープレキシティ検出手段と、前記音声認識手段より
現在処理しているフレーム番号が入力され、前記記憶手
段に記憶された辞書を読み出して、前記認識タスクの前
記フレーム番号における計算アクティブパス数を計算す
るアクティブパス数計算手段と、前記パープレキシティ
検出手段から出力されたパープレキシティと、前記アク
ティブパス数計算手段から出力された計算アクティブパ
ス数とが入力され、前記音声認識装置でのビームサーチ
法における目標アクティブパス数を決定し、出力する、
目標アクティブパス数設定手段と、前記音声認識装置に
おける実際のアクティブパス数を検出する実アクティブ
パス数検出手段と、前記目標アクティブパス数設定手段
から出力された目標アクティブパス数と、実アクティブ
パス数検出手段から出力されたアクティブパス数が入力
され、アクティブパス数が目標アクティブパス数を上回
っている場合には、枝刈りの閾値を更新して、前記音声
認識装置に新たな枝刈りの閾値を出力する閾値設定手段
と、を具備することを特徴とする。
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記記憶手段
に記憶された辞書を読み出して、前記音声認識手段で行
う認識タスクの複雑さを表すパープレキシティを検出す
るパープレキシティ検出手段と、前記音声認識手段より
現在処理しているフレーム番号が入力され、前記記憶手
段に記憶された辞書を読み出して、前記認識タスクの前
記フレーム番号における計算アクティブパス数を計算す
るアクティブパス数計算手段と、前記パープレキシティ
検出手段から出力されたパープレキシティと、前記アク
ティブパス数計算手段から出力された計算アクティブパ
ス数とが入力され、前記音声認識装置でのビームサーチ
法における目標アクティブパス数を決定し、出力する、
目標アクティブパス数設定手段と、前記音声認識装置に
おける実際のアクティブパス数を検出する実アクティブ
パス数検出手段と、前記目標アクティブパス数設定手段
から出力された目標アクティブパス数と、実アクティブ
パス数検出手段から出力されたアクティブパス数が入力
され、アクティブパス数が目標アクティブパス数を上回
っている場合には、枝刈りの閾値を更新して、前記音声
認識装置に新たな枝刈りの閾値を出力する閾値設定手段
と、を具備することを特徴とする。
【0018】また、本発明の音声認識装置は、入力され
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記記憶手段
に記憶された辞書を読み出して、前記音声認識手段で行
う認識タスクの複雑さを表すパープレキシティを検出す
るパープレキシティ検出手段と、前記音声認識手段より
現在処理しているフレーム番号が入力され、前記記憶手
段に記憶された辞書を読み出して、前記認識タスクの前
記フレーム番号における計算アクティブパス数を計算す
るアクティブパス数計算手段と、前記パープレキシティ
検出手段から出力されたパープレキシティと、前記アク
ティブパス数計算手段から出力された計算アクティブパ
ス数とが入力され、前記音声認識装置でのビームサーチ
法における適確な目標アクティブパス数を決定して、前
記音声認識手段に対して前記目標アクティブパス数を出
力する、目標アクティブパス数設定手段と、前記音声認
識手段における実際のアクティブなパスの本数を検出す
る実アクティブパス数検出手段と、前記実アクティブパ
ス数検出手段から出力されるアクティブパス数と、前記
目標アクティブパス数とが入力され、前記アクティブな
パスの本数が前記目標アクティブパス数よりも大きい場
合には、閾値の更新命令を出力する比較手段と、前記音
声認識手段において、あるフレームで計算される、アク
ティブパスの累積尤度の平均値および分散値を検出す
る、平均値分散値検出手段と、前記平均値分散値検出手
段から出力される平均値および分散値と、前記比較手段
から出力される閾値の更新命令が入力された場合に、前
記音声認識手段の枝刈りの閾値を更新する閾値設定手段
と、を具備することを特徴とする。
た音声を認識して認識結果を出力する音声認識装置であ
って、音声を入力し、前記音声の時間波形から音声区間
を検出し、検出された音声区間をフレーム分割し、フレ
ーム分割された音声を認識のためにパラメータ化する音
声入力手段と、あらかじめ用意された音声の標準パター
ンを辞書として記憶している記憶手段と、音声入力手段
においてパラメータ化された信号と、辞書から読み出し
た標準パターンとを、ビームサーチ法を用いながら比較
し、認識結果を出力する音声認識手段と、前記記憶手段
に記憶された辞書を読み出して、前記音声認識手段で行
う認識タスクの複雑さを表すパープレキシティを検出す
るパープレキシティ検出手段と、前記音声認識手段より
現在処理しているフレーム番号が入力され、前記記憶手
段に記憶された辞書を読み出して、前記認識タスクの前
記フレーム番号における計算アクティブパス数を計算す
るアクティブパス数計算手段と、前記パープレキシティ
検出手段から出力されたパープレキシティと、前記アク
ティブパス数計算手段から出力された計算アクティブパ
ス数とが入力され、前記音声認識装置でのビームサーチ
法における適確な目標アクティブパス数を決定して、前
記音声認識手段に対して前記目標アクティブパス数を出
力する、目標アクティブパス数設定手段と、前記音声認
識手段における実際のアクティブなパスの本数を検出す
る実アクティブパス数検出手段と、前記実アクティブパ
ス数検出手段から出力されるアクティブパス数と、前記
目標アクティブパス数とが入力され、前記アクティブな
パスの本数が前記目標アクティブパス数よりも大きい場
合には、閾値の更新命令を出力する比較手段と、前記音
声認識手段において、あるフレームで計算される、アク
ティブパスの累積尤度の平均値および分散値を検出す
る、平均値分散値検出手段と、前記平均値分散値検出手
段から出力される平均値および分散値と、前記比較手段
から出力される閾値の更新命令が入力された場合に、前
記音声認識手段の枝刈りの閾値を更新する閾値設定手段
と、を具備することを特徴とする。
【0019】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図1から図5を参照しながら説明を行う。
て、図1から図5を参照しながら説明を行う。
【0020】(実施の形態1)本発明の実施の形態1に
ついて、図1を参照しながら説明する。
ついて、図1を参照しながら説明する。
【0021】実施の形態1の音声認識装置101は、音
声入力手段102と、記憶手段103と、音声認識手段
104と、パープレキシティ検出手段105と、第1の
閾値設定手段106とを具備している。
声入力手段102と、記憶手段103と、音声認識手段
104と、パープレキシティ検出手段105と、第1の
閾値設定手段106とを具備している。
【0022】音声入力手段102は、時間波形から音声
区間を検出し、検出された音声区間をフレーム分割し、
フレーム分割された音声を認識のためにパラメータ化す
る。
区間を検出し、検出された音声区間をフレーム分割し、
フレーム分割された音声を認識のためにパラメータ化す
る。
【0023】記憶手段103は、あらかじめ用意された
音声の標準パターンを辞書として記憶している。
音声の標準パターンを辞書として記憶している。
【0024】音声認識手段104は、音声入力手段にお
いてパラメータ化された信号と、辞書から読み出した標
準パターンとを、ビームサーチ法を用いながら比較し、
認識結果を文字列などとして出力する。
いてパラメータ化された信号と、辞書から読み出した標
準パターンとを、ビームサーチ法を用いながら比較し、
認識結果を文字列などとして出力する。
【0025】パープレキシティ検出手段105は、記憶
手段103に格納されている辞書を読み出して、認識タ
スクの複雑さを表わすパラメータであるパープレキシテ
ィFを検出する。ここで、パープレキシティFとは、定
数である。前記パープレキシティ検出手段105は、認
識タスク全体のパープレキシティ、あるいは、認識タス
クの初期フレーム部分のパープレキシティを検出するも
のとする。
手段103に格納されている辞書を読み出して、認識タ
スクの複雑さを表わすパラメータであるパープレキシテ
ィFを検出する。ここで、パープレキシティFとは、定
数である。前記パープレキシティ検出手段105は、認
識タスク全体のパープレキシティ、あるいは、認識タス
クの初期フレーム部分のパープレキシティを検出するも
のとする。
【0026】第1の閾値設定手段106は、前記パープ
レキシティ検出手段105において検出されたパープレ
キシティより、前記音声認識手段104で行うビームサ
ーチ法による枝刈りの閾値αを決定する。パープレキシ
ティは、認識タスクの複雑さを表わすパラメータである
から、パープレキシティが大きい場合には累積尤度の閾
値αは小さく、逆に、パープレキシティが小さい場合に
は累積尤度の閾値αは大きくすれば良い。
レキシティ検出手段105において検出されたパープレ
キシティより、前記音声認識手段104で行うビームサ
ーチ法による枝刈りの閾値αを決定する。パープレキシ
ティは、認識タスクの複雑さを表わすパラメータである
から、パープレキシティが大きい場合には累積尤度の閾
値αは小さく、逆に、パープレキシティが小さい場合に
は累積尤度の閾値αは大きくすれば良い。
【0027】また、多くの認識タスクにおいて、初期フ
レーム部分でのパープレキシティが、全体のパープレキ
シティに比べて大きいという傾向がある。よって、前記
パープレキシティ検出手段105においては、特に認識
タスクの初期フレーム部分のパープレキシティを検出し
て枝刈りの閾値を設定すると、枝刈りの閾値を狭く設定
し過ぎて最適パスをも刈り取ってしまうという危険性が
軽減される。
レーム部分でのパープレキシティが、全体のパープレキ
シティに比べて大きいという傾向がある。よって、前記
パープレキシティ検出手段105においては、特に認識
タスクの初期フレーム部分のパープレキシティを検出し
て枝刈りの閾値を設定すると、枝刈りの閾値を狭く設定
し過ぎて最適パスをも刈り取ってしまうという危険性が
軽減される。
【0028】以上の構成により、本発明の音声認識装置
は、認識タスクのパープレキシティFを用いて、枝刈り
の閾値αを自動的に設定することが可能となる。
は、認識タスクのパープレキシティFを用いて、枝刈り
の閾値αを自動的に設定することが可能となる。
【0029】(実施の形態2)本発明の実施の形態2に
ついて、図2を参照しながら説明する。
ついて、図2を参照しながら説明する。
【0030】実施の形態2の音声認識装置201は、音
声入力手段202と、記憶手段203と、音声認識手段
204と、区間パープレキシティ検出手段205と、第
2の閾値設定手段206とを具備している。
声入力手段202と、記憶手段203と、音声認識手段
204と、区間パープレキシティ検出手段205と、第
2の閾値設定手段206とを具備している。
【0031】実施の形態2の構成は、実施の形態1の構
成とほとんど同じであるが、異なるのは、パープレキシ
ティ検出手段105の代わりに、区間パープレキシティ
検出手段205を具備していることである。
成とほとんど同じであるが、異なるのは、パープレキシ
ティ検出手段105の代わりに、区間パープレキシティ
検出手段205を具備していることである。
【0032】区間パープレキシティ検出手段205は、
前記音声認識手段より現在処理しているフレーム番号t
が入力され、また、記憶手段203に格納されている辞
書を読み出す。ここで、認識タスクの辞書を参照しなが
ら、ある限られた区間、例えば、初期フレーム部分、中
間フレーム部分、後期フレーム部分など、のパープレキ
シティFbを検出する。
前記音声認識手段より現在処理しているフレーム番号t
が入力され、また、記憶手段203に格納されている辞
書を読み出す。ここで、認識タスクの辞書を参照しなが
ら、ある限られた区間、例えば、初期フレーム部分、中
間フレーム部分、後期フレーム部分など、のパープレキ
シティFbを検出する。
【0033】一般的に、パープレキシティは、辞書に登
録されている語彙の初期フレーム部分、中間フレーム部
分、後期フレーム部分などによって変化する。
録されている語彙の初期フレーム部分、中間フレーム部
分、後期フレーム部分などによって変化する。
【0034】本発明の区間パープレキシティ検出手段に
よれば、例えば、入力音声の初期、中間、後期の各区間
に対応したパープレキシティFbを検出し、枝刈りの閾
値をそれぞれ設定することが可能となる。これにより、
ビームサーチ法において、不要なパスの累積尤度を計算
するという冗長性や、残すべきパスを刈り取ってしまう
危険性が、改善される。
よれば、例えば、入力音声の初期、中間、後期の各区間
に対応したパープレキシティFbを検出し、枝刈りの閾
値をそれぞれ設定することが可能となる。これにより、
ビームサーチ法において、不要なパスの累積尤度を計算
するという冗長性や、残すべきパスを刈り取ってしまう
危険性が、改善される。
【0035】(実施の形態3)本発明の実施の形態3の
音声認識装置301について、図3を参照しながら説明
する。
音声認識装置301について、図3を参照しながら説明
する。
【0036】音声入力手段302と、記憶手段303
と、音声認識手段304と、パープレキシティ検出手段
305とは、前記実施の形態1と同じである。実施の形
態3が前記実施の形態と異なるのは、実アクティブパス
数検出手段306と、第3の閾値設定手段307と、を
具備していることである。
と、音声認識手段304と、パープレキシティ検出手段
305とは、前記実施の形態1と同じである。実施の形
態3が前記実施の形態と異なるのは、実アクティブパス
数検出手段306と、第3の閾値設定手段307と、を
具備していることである。
【0037】実アクティブパス数検出手段306は、前
記音声認識手段304で行われるビームサーチ法におけ
るアクティブなパスの本数n(t)を、各フレーム毎に
検出し、第3の閾値設定手段307に送る。
記音声認識手段304で行われるビームサーチ法におけ
るアクティブなパスの本数n(t)を、各フレーム毎に
検出し、第3の閾値設定手段307に送る。
【0038】閾値設定手段307は、前記パープレキシ
ティ検出手段305から出力されたパープレキシティF
と、前記実アクティブパス数検出手段306から出力さ
れたアクティブパス数n(t)とが入力され、前記音声
認識装置304でのビームサーチ法におけるアクティブ
パスの枝刈りの閾値α(t)を決定する。
ティ検出手段305から出力されたパープレキシティF
と、前記実アクティブパス数検出手段306から出力さ
れたアクティブパス数n(t)とが入力され、前記音声
認識装置304でのビームサーチ法におけるアクティブ
パスの枝刈りの閾値α(t)を決定する。
【0039】本実施の形態の音声認識装置301は、枝
刈りの閾値α(t)の設定にあたって、パープレキシテ
ィFおよびアクティブパス数n(t)を用いるのが特徴
である。これにより、パープレキシティFのみで枝刈り
の閾値を設定する場合に比べて、枝刈りの閾値α(t)
をさらに適確な値に自動設定することが可能となる。つ
まり、実際に処理中のアクティブパス数n(t)が分か
らないために、枝刈りが不十分で不要なパスの計算を残
してしまうという冗長性や、枝刈りをし過ぎて最適パス
をも刈り取ってしまうという危険性が軽減される。
刈りの閾値α(t)の設定にあたって、パープレキシテ
ィFおよびアクティブパス数n(t)を用いるのが特徴
である。これにより、パープレキシティFのみで枝刈り
の閾値を設定する場合に比べて、枝刈りの閾値α(t)
をさらに適確な値に自動設定することが可能となる。つ
まり、実際に処理中のアクティブパス数n(t)が分か
らないために、枝刈りが不十分で不要なパスの計算を残
してしまうという冗長性や、枝刈りをし過ぎて最適パス
をも刈り取ってしまうという危険性が軽減される。
【0040】(実施の形態4)本発明の実施の形態4の
音声認識装置401について、図4を参照しながら説明
する。
音声認識装置401について、図4を参照しながら説明
する。
【0041】音声入力手段402と、記憶手段403
と、音声認識手段404と、パープレキシティ検出手段
405と、実アクティブパス数検出手段408は、前記
実施の形態3のそれらと同じである。実施の形態4の音
声認識装置401は、さらに、前記記憶手段403に接
続されたアクティブパス数計算手段406と、目標アク
ティブパス数設定手段407と、第4の第4の閾値設定
手段409、を具備している。
と、音声認識手段404と、パープレキシティ検出手段
405と、実アクティブパス数検出手段408は、前記
実施の形態3のそれらと同じである。実施の形態4の音
声認識装置401は、さらに、前記記憶手段403に接
続されたアクティブパス数計算手段406と、目標アク
ティブパス数設定手段407と、第4の第4の閾値設定
手段409、を具備している。
【0042】アクティブパス数計算手段406は、前記
音声認識手段404より現在処理しているフレーム番号
tが入力され、かつ、前記記憶手段403に格納された
標準パターンを読み出す。ここでは、もし、前記音声認
識手段404で枝刈りを行わないとした場合に、前記フ
レーム番号tにおいて、累積尤度の計算が必要となるア
クティブパス数M(t)を算出する。
音声認識手段404より現在処理しているフレーム番号
tが入力され、かつ、前記記憶手段403に格納された
標準パターンを読み出す。ここでは、もし、前記音声認
識手段404で枝刈りを行わないとした場合に、前記フ
レーム番号tにおいて、累積尤度の計算が必要となるア
クティブパス数M(t)を算出する。
【0043】目標アクティブパス数設定手段407は、
前記パープレキシティ検出手段405から出力されたパ
ープレキシティFと、前記アクティブパス数計算手段4
06から出力された計算アクティブパス数M(t)とが
入力され、現在の認識タスクに適した目標アクティブパ
ス数N(t)を設定し、第4の閾値設定手段409に対
して出力する。ここで、パープレキシティFは定数、計
算アクティブパス数Mは各フレーム毎に変化する値であ
る。
前記パープレキシティ検出手段405から出力されたパ
ープレキシティFと、前記アクティブパス数計算手段4
06から出力された計算アクティブパス数M(t)とが
入力され、現在の認識タスクに適した目標アクティブパ
ス数N(t)を設定し、第4の閾値設定手段409に対
して出力する。ここで、パープレキシティFは定数、計
算アクティブパス数Mは各フレーム毎に変化する値であ
る。
【0044】第4の閾値設定手段409は、前記実アク
ティブパス数検出手段408から出力された実際のアク
ティブパス数n(t)と、前記目標アクティブパス数設
定手段407から出力された目標アクティブパス数N
(t)とが入力され、実際のアクティブパス数n(t)
が目標アクティブパス数N(t)よりも多い場合には、
枝刈りの閾値α(t)を更新する。
ティブパス数検出手段408から出力された実際のアク
ティブパス数n(t)と、前記目標アクティブパス数設
定手段407から出力された目標アクティブパス数N
(t)とが入力され、実際のアクティブパス数n(t)
が目標アクティブパス数N(t)よりも多い場合には、
枝刈りの閾値α(t)を更新する。
【0045】本発明によれば、枝刈りの閾値α(t)を
設定する際に、認識タスクのパープレキシティFと、認
識タスクの標準パターンの辞書から計算した計算アクテ
ィブパス数M(t)とを用いて目標アクティブパス数N
(t)を設定し、その目標アクティブパス数N(t)と
実際のアクティブパス数n(t)を各フレーム毎に比較
しながら枝刈りの閾値α(t)を更新して行くので、よ
り適確な閾値を自動的に設定することが可能となる。
設定する際に、認識タスクのパープレキシティFと、認
識タスクの標準パターンの辞書から計算した計算アクテ
ィブパス数M(t)とを用いて目標アクティブパス数N
(t)を設定し、その目標アクティブパス数N(t)と
実際のアクティブパス数n(t)を各フレーム毎に比較
しながら枝刈りの閾値α(t)を更新して行くので、よ
り適確な閾値を自動的に設定することが可能となる。
【0046】これにより、ビームサーチ法において、枝
刈りが不十分で不要なパスの計算をしてしまうという冗
長性や、枝刈りをし過ぎて最適パスをも刈り取ってしま
うという危険性が軽減される。
刈りが不十分で不要なパスの計算をしてしまうという冗
長性や、枝刈りをし過ぎて最適パスをも刈り取ってしま
うという危険性が軽減される。
【0047】(実施の形態5)本発明の実施の形態5の
音声認識装置501について、図5を参照しながら説明
する。
音声認識装置501について、図5を参照しながら説明
する。
【0048】音声入力手段502と、記憶手段503
と、音声認識手段504と、パープレキシティ検出手段
505と、アクティブパス数計算手段506と、目標ア
クティブパス数設定手段507と、実アクティブパス検
出手段508は、前記実施の形態4のそれらと同じであ
る。
と、音声認識手段504と、パープレキシティ検出手段
505と、アクティブパス数計算手段506と、目標ア
クティブパス数設定手段507と、実アクティブパス検
出手段508は、前記実施の形態4のそれらと同じであ
る。
【0049】実施の形態5の音声認識装置501は、さ
らに、前記実アクティブパス数検出手段508から出力
される実際のアクティブパス数n(t)と、前記目標ア
クティブパス数設定手段507から出力される目標アク
ティブパス数N(t)が入力される、比較手段509
と、前記音声認識手段504において、あるフレームで
計算される、全アクティブパスの累積尤度のばらつき具
合を表わす、累積尤度の平均値A(t)および分散値B
(t)を検出する、平均値分散値検出手段510と、前
記比較器509において、前記実際のアクティブパス数
n(t)が前記目標アクティブパス数N(t)を上回っ
た場合に出力される閾値更新命令と、前記平均値分散値
検出手段510から出力される累積尤度の平均値A
(t)および分散値B(t)とが入力される、第5の閾
値設定手段511と、を具備している。
らに、前記実アクティブパス数検出手段508から出力
される実際のアクティブパス数n(t)と、前記目標ア
クティブパス数設定手段507から出力される目標アク
ティブパス数N(t)が入力される、比較手段509
と、前記音声認識手段504において、あるフレームで
計算される、全アクティブパスの累積尤度のばらつき具
合を表わす、累積尤度の平均値A(t)および分散値B
(t)を検出する、平均値分散値検出手段510と、前
記比較器509において、前記実際のアクティブパス数
n(t)が前記目標アクティブパス数N(t)を上回っ
た場合に出力される閾値更新命令と、前記平均値分散値
検出手段510から出力される累積尤度の平均値A
(t)および分散値B(t)とが入力される、第5の閾
値設定手段511と、を具備している。
【0050】前記平均値分散値検出手段510は、各フ
レーム毎に、音声認識手段504で計算されるアクティ
ブパスの累積尤度の平均値A(t)および分散値B
(t)を検出し、第5の閾値設定手段511に出力す
る。
レーム毎に、音声認識手段504で計算されるアクティ
ブパスの累積尤度の平均値A(t)および分散値B
(t)を検出し、第5の閾値設定手段511に出力す
る。
【0051】前記第5の閾値設定手段511は、前記比
較手段509から閾値更新命令を受け、前記平均値分散
値検出手段510から出力された、アクティブパスの累
積尤度の平均値A(t)および分散値B(t)、およ
び、現在の閾値とによって、新たな閾値α(t)を設定
し、前記音声認識手段504に送る。
較手段509から閾値更新命令を受け、前記平均値分散
値検出手段510から出力された、アクティブパスの累
積尤度の平均値A(t)および分散値B(t)、およ
び、現在の閾値とによって、新たな閾値α(t)を設定
し、前記音声認識手段504に送る。
【0052】本発明によれば、認識タスクのパープレキ
シティFと計算アクティブパス数M(t)から計算した
目標アクティブパス数N(t)と、アクティブパスの累
積尤度の平均値A(t)と、分散値B(t)と、を用い
て、枝刈りの閾値α(t)を求めるので、前記実施の形
態に比べてさらに適確な閾値を自動的に設定することが
可能となる。
シティFと計算アクティブパス数M(t)から計算した
目標アクティブパス数N(t)と、アクティブパスの累
積尤度の平均値A(t)と、分散値B(t)と、を用い
て、枝刈りの閾値α(t)を求めるので、前記実施の形
態に比べてさらに適確な閾値を自動的に設定することが
可能となる。
【0053】これにより、ビームサーチ法において、枝
刈りが不十分で不要なパスの計算をしてしまうという冗
長性や、枝刈りをし過ぎて最適パスをも刈り取ってしま
うという危険性が軽減される。
刈りが不十分で不要なパスの計算をしてしまうという冗
長性や、枝刈りをし過ぎて最適パスをも刈り取ってしま
うという危険性が軽減される。
【0054】
【発明の効果】以上のように本発明によれば、枝刈りの
ための累積尤度の閾値や目標アクティブパス数を自動的
に設定することが可能になるという効果が得られる。
ための累積尤度の閾値や目標アクティブパス数を自動的
に設定することが可能になるという効果が得られる。
【図1】本発明の実施の形態1の音声認識装置を表わす
ブロック図
ブロック図
【図2】本発明の実施の形態2の音声認識装置を表わす
ブロック図
ブロック図
【図3】本発明の実施の形態3の音声認識装置を表わす
ブロック図
ブロック図
【図4】本発明の実施の形態4の音声認識装置を表わす
ブロック図
ブロック図
【図5】本発明の実施の形態5の音声認識装置を表わす
ブロック図
ブロック図
【図6】従来の技術の音声認識装置を表わすブロック図
101 音声認識装置 102 音声入力手段 103 記憶手段 104 音声認識手段 105 パープレキシティ検出手段 106 第1の閾値設定手段 201 音声認識装置 202 音声入力手段 203 記憶手段 204 音声認識手段 205 区間パープレキシティ検出手段 206 第2の閾値設定手段 301 音声認識装置 302 音声入力手段 303 記憶手段 304 音声認識手段 305 パープレキシティ検出手段 306 実アクティブパス数検出手段 307 第3の閾値設定手段 401 音声認識装置 402 音声入力手段 403 記憶手段 404 音声認識手段 405 パープレキシティ検出手段 406 アクティブパス数計算手段 407 目標アクティブパス数設定手段 408 実アクティブパス数検出手段 409 第4の閾値設定手段 501 音声認識装置 502 音声入力手段 503 記憶手段 504 音声認識手段 505 パープレキシティ検出手段 506 アクティブパス数計算手段 507 目標アクティブパス数設定手段 508 実アクティブパス数検出手段 509 比較手段 510 平均値分散値検出手段 511 第5の閾値設定手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中藤 良久 大阪府門真市大字門真1006番地 松下電器 産業株式会社内
Claims (6)
- 【請求項1】 入力された音声を認識して認識結果を出
力する音声認識装置であって、 音声を入力し、前記音声の時間波形から音声区間を検出
し、検出された音声区間をフレーム分割し、フレーム分
割された音声を認識のためのパラメータに変換する音声
入力手段と、 あらかじめ用意された音声の標準パターンを辞書として
記憶している記憶手段と、 音声入力手段においてパラメータに変換された信号と、
辞書から読み出した標準パターンとを、ビームサーチ法
を用いながら比較し、認識結果を出力する音声認識手段
と、 前記記憶手段に記憶された辞書を読み出して、前記音声
認識手段で行う認識タスクの複雑さを表すパープレキシ
ティを検出するパープレキシティ検出手段と、 前記パープレキシティ検出手段において検出されたパー
プレキシティより、前記音声認識手段で行うビームサー
チ法による枝刈りの閾値を決定する閾値設定手段と、を
具備することを特徴とする音声認識装置。 - 【請求項2】 前記パープレキシティ検出手段は、前記
入力された音声の初期フレーム部分のパープレキシティ
を検出することを特徴とする請求項1記載の音声認識装
置。 - 【請求項3】 入力された音声を認識して認識結果を出
力する音声認識装置であって、 音声を入力し、前記音声の時間波形から音声区間を検出
し、検出された音声区間をフレーム分割し、フレーム分
割された音声を認識のためにパラメータ化する音声入力
手段と、 あらかじめ用意された音声の標準パターンを辞書として
記憶している記憶手段と、 音声入力手段においてパラメータ化された信号と、辞書
から読み出した標準パターンとを、ビームサーチ法を用
いながら比較し、認識結果を出力する音声認識手段と、 前記音声認識手段より現在処理しているフレーム番号が
入力され、また、前記記憶手段に記憶された辞書を読み
出して、前記音声認識手段で行う認識タスクの、あるフ
レーム区間の複雑さを表すパープレキシティを検出する
区間パープレキシティ検出手段と、 前記区間パープレキシティ検出手段において検出された
パープレキシティより、前記音声認識手段で行うビーム
サーチ法による枝刈りの閾値を決定する閾値設定手段
と、を具備することを特徴とする音声認識装置。 - 【請求項4】 入力された音声を認識して認識結果を出
力する音声認識装置であって、 音声を入力し、前記音声の時間波形から音声区間を検出
し、検出された音声区間をフレーム分割し、フレーム分
割された音声を認識のためにパラメータ化する音声入力
手段と、 あらかじめ用意された音声の標準パターンを辞書として
記憶している記憶手段と、 音声入力手段においてパラメータ化された信号と、辞書
から読み出した標準パターンとを、ビームサーチ法を用
いながら比較し、認識結果を出力する音声認識手段と、 前記記憶手段に記憶された辞書を読み出して、前記音声
認識手段で行う認識タスクの複雑さを表すパープレキシ
ティを検出するパープレキシティ検出手段と、 前記音声認識手段において実際にアクティブなパスの本
数を検出する実アクティブパス数検出手段と、 前記パープレキシティ検出手段から出力されたパープレ
キシティと、前記実アクティブパス数検出手段から出力
されたアクティブなパスの本数とが入力され、前記ビー
ムサーチ法における枝刈りの閾値を決定し、前記枝刈り
の閾値を前記音声認識手段に出力する、閾値設定手段
と、を具備することを特徴とする音声認識装置。 - 【請求項5】 入力された音声を認識して認識結果を出
力する音声認識装置であって、 音声を入力し、前記音声の時間波形から音声区間を検出
し、検出された音声区間をフレーム分割し、フレーム分
割された音声を認識のためにパラメータ化する音声入力
手段と、 あらかじめ用意された音声の標準パターンを辞書として
記憶している記憶手段と、 音声入力手段においてパラメータ化された信号と、辞書
から読み出した標準パターンとを、ビームサーチ法を用
いながら比較し、認識結果を出力する音声認識手段と、 前記記憶手段に記憶された辞書を読み出して、前記音声
認識手段で行う認識タスクの複雑さを表すパープレキシ
ティを検出するパープレキシティ検出手段と、 前記音声認識手段より現在処理しているフレーム番号が
入力され、前記記憶手段に記憶された辞書を読み出し
て、前記認識タスクの前記フレーム番号における計算ア
クティブパス数を計算するアクティブパス数計算手段
と、 前記パープレキシティ検出手段から出力されたパープレ
キシティと、前記アクティブパス数計算手段から出力さ
れた計算アクティブパス数とが入力され、前記音声認識
装置でのビームサーチ法における目標アクティブパス数
を決定し、出力する、目標アクティブパス数設定手段
と、 前記音声認識装置における実際のアクティブパス数を検
出する実アクティブパス数検出手段と、 前記目標アクティブパス数設定手段から出力された目標
アクティブパス数と、実アクティブパス数検出手段から
出力されたアクティブパス数が入力され、アクティブパ
ス数が目標アクティブパス数を上回っている場合には、
枝刈りの閾値を更新して、前記音声認識装置に新たな枝
刈りの閾値を出力する閾値設定手段と、を具備すること
を特徴とする音声認識装置。 - 【請求項6】 入力された音声を認識して認識結果を出
力する音声認識装置であって、 音声を入力し、前記音声の時間波形から音声区間を検出
し、検出された音声区間をフレーム分割し、フレーム分
割された音声を認識のためにパラメータ化する音声入力
手段と、 あらかじめ用意された音声の標準パターンを辞書として
記憶している記憶手段と、 音声入力手段においてパラメータ化された信号と、辞書
から読み出した標準パターンとを、ビームサーチ法を用
いながら比較し、認識結果を出力する音声認識手段と、 前記記憶手段に記憶された辞書を読み出して、前記音声
認識手段で行う認識タスクの複雑さを表すパープレキシ
ティを検出するパープレキシティ検出手段と、 前記音声認識手段より現在処理しているフレーム番号が
入力され、前記記憶手段に記憶された辞書を読み出し
て、前記認識タスクの前記フレーム番号における計算ア
クティブパス数を計算するアクティブパス数計算手段
と、 前記パープレキシティ検出手段から出力されたパープレ
キシティと、前記アクティブパス数計算手段から出力さ
れた計算アクティブパス数とが入力され、前記音声認識
装置でのビームサーチ法における適確な目標アクティブ
パス数を決定して、前記音声認識手段に対して前記目標
アクティブパス数を出力する、目標アクティブパス数設
定手段と、 前記音声認識手段における実際のアクティブなパスの本
数を検出する実アクティブパス数検出手段と、 前記実アクティブパス数検出手段から出力されるアクテ
ィブパス数と、前記目標アクティブパス数とが入力さ
れ、前記アクティブなパスの本数が前記目標アクティブ
パス数よりも大きい場合には、閾値の更新命令を出力す
る比較手段と、 前記音声認識手段において、あるフレームで計算され
る、アクティブパスの累積尤度の平均値および分散値を
検出する、平均値分散値検出手段と、 前記平均値分散値検出手段から出力される平均値および
分散値と、前記比較手段から出力される閾値の更新命令
が入力された場合に、前記音声認識手段の枝刈りの閾値
を更新する閾値設定手段と、を具備することを特徴とす
る音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9283324A JPH11119793A (ja) | 1997-10-16 | 1997-10-16 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9283324A JPH11119793A (ja) | 1997-10-16 | 1997-10-16 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11119793A true JPH11119793A (ja) | 1999-04-30 |
Family
ID=17664002
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9283324A Pending JPH11119793A (ja) | 1997-10-16 | 1997-10-16 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11119793A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014089246A (ja) * | 2012-10-29 | 2014-05-15 | Kddi Corp | パターン認識方法および装置ならびにパターン認識プログラムおよびその記録媒体 |
-
1997
- 1997-10-16 JP JP9283324A patent/JPH11119793A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014089246A (ja) * | 2012-10-29 | 2014-05-15 | Kddi Corp | パターン認識方法および装置ならびにパターン認識プログラムおよびその記録媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1355295B1 (en) | Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded | |
| US20030200086A1 (en) | Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded | |
| KR20010034367A (ko) | 음성 인식에서 무음을 사용한 시스템 | |
| JPH04255900A (ja) | 音声認識装置 | |
| EP1376537B1 (en) | Apparatus, method, and computer-readable recording medium for recognition of keywords from spontaneous speech | |
| JP3069531B2 (ja) | 音声認識方法 | |
| JPH11119793A (ja) | 音声認識装置 | |
| EP0177854B1 (en) | Keyword recognition system using template-concatenation model | |
| WO1987004294A1 (en) | Frame comparison method for word recognition in high noise environments | |
| JP3031081B2 (ja) | 音声認識装置 | |
| JP3357752B2 (ja) | パターンマッチング装置 | |
| JPH05303391A (ja) | 音声認識装置 | |
| JPH0997095A (ja) | 音声認識装置 | |
| JPH0242238B2 (ja) | ||
| JPH09212190A (ja) | 音声認識装置及び文認識装置 | |
| JPH05210396A (ja) | 音声認識装置 | |
| KR0128669B1 (ko) | 음성 신호의 실시간 음성부 검출 방법 | |
| KR19990005663A (ko) | Hmm 음성 인식 장치 및 방법 | |
| JPH0449719B2 (ja) | ||
| JPH045400B2 (ja) | ||
| JPH06100919B2 (ja) | 音声認識装置 | |
| EP0551374A1 (en) | Boundary relaxation for speech pattern recognition | |
| JPH02198499A (ja) | 音声認識装置の辞書の自動更新システム | |
| JPS62294297A (ja) | 音声入力装置 | |
| JPS6027000A (ja) | パタンマツチング方法 |