JPH0484197A

JPH0484197A - 連続音声認識装置

Info

Publication number: JPH0484197A
Application number: JP2200530A
Authority: JP
Inventors: Atsushi Horioka; 篤史堀岡
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1990-07-26
Filing date: 1990-07-26
Publication date: 1992-03-17
Anticipated expiration: 2014-07-19
Also published as: JP2921059B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音響信頼度と接続信頼度に可変にそれぞれ重み
付けした線形結合で表される評価値を用いて認識結果を
得る連続音声認識装置に関するものであム従来の技術近爪　音声認識技術の発達とともに　連続音声認識装置
が種々の分野で実用化されようとしており、実用化する
ために（上　認識装置を実用する上での種々の問題点を
解決する必要がある。この実用上の問題点の１つく　入
力連続音声中に不明瞭に発声された部分が存在する場合
、この部分を誤認識してしま（＼　誤った認識文を出力
してしまうという点かあム従来の連続音声認識装置でζよ　上記問題点を解決する
ために　最高の音響信頼度で認識された素片を単に接続
して文単位の認識結果を得るのではなく、認識された素
片の音響信頼度と接続信頼度の線形結合として評価関数
を設定してこの評価値が最高のものを認識結果とするの
で、素片の音響信頼度が低くても前後の素片との文法上
のつながり（接続信頼度）が高ければ評価値が高くなり
、入力連続音声中に不明瞭に発声され・た部分が存在し
ても正しく認識できるようになる。

以下、第３＠　第４医　第５図を参照しなが収上述した
ような従来の連続音声認識装置で素片を単語としたもの
を例として説明を行う。

第３図Ｃ表　　従来の連続音声認識装置のブロック諷　
第４図はワードラチス生成のフローチャート、第５図は
接続部における処理を示したフローチャートである。第
３図において、　１は信号入力端子、２は分析部　４は
特徴パラメータ保管孔　５は照合部　６はワードラチス
保管服　８は予測部　９は接続部　１０は認識結果出力
端子、　１２はスイッチであム　以上のように構成され
た音声認識装置について以下その動作について説明する
。

最初に標準音声登録時については第３１図を参照しなが
ら説明すも　まず、スイッチ１２を分析部の出力が特徴
パラメータ保管部に入力されるように操作し　信号入力
端子１から単語単位で入力された標準音声を分析部２に
入力し　フレームごとの特徴パラメータを算出し　特徴
パラメータ保管部４に登録する。そして、標準音声を入
力して上記の処理を認識すべき全単語について繰り返し
登録を終了する。

次に認識時については第３図と第４図とを参照しながら
説明する。まずスイッチ１２を分析部の出力が照合部に
入力されるように操作し　登録時と同様に信号入力端子
１より認識すべき信号を入力しく処理２１）、分析部２
でフレームごとの特徴パラメータを算出する（処理２２
）。次に照合部５において標準音声と入力信号との照合
を行う。

まず、フレーム番号＝１、単語番号＝１とし　初期化を
行う（処理２３．２４）。そして、フレーム番号のフレ
ームを始端として単語番号番目の認識すべき単語との照
合を行い（処理２７）、判定閾値以上の類似度を示した
場合（処理２８）、この時の単語を認識素片候補　類似
度を音響信頼度とし　認識の始端と終端とともにワード
ラチス保管部に出力する（処理２９）。この後、単語番
号に１を加算して（処理３０）次の認識すべき単語につ
いての処理に移も　以上の処理が認識すべき単語すべて
について終了したとき（処理２６）、フレーム番号に１
を加算して（処理３１）次のフレームを始端として同様
の処理を行う。以上の処理がすべてのフレーム　すべて
の認識すべき単語について終了したならば（処理２５）
、照合部５での処理を終了すム　この処理によりワード
ラチスとして入力連続音声中に存在する可能性のある認
識単語候補名とその始端位！　終端位置　音響信頼度が
記録されてワードラチス保管部６に出力されもまた　予測部８は接続部９から入力された認識単語候補
に後続可能な単語を文法または統計情報などを用いて求
取　次単語候補としてその接続信頼度（確率などで表現
する）とともに接続部９に出力するように動作すム次に接続部９の処理については第３図と第５図を参照し
ながら説明する。

上記接続部ではワードラチス保管部６より入力された認
識単語候補名を接続して複数の認識結果候補を生成し　
これらのう敷　最高の評価値を持つものを認識結果とＬ
　認識結果出力端子８に出力する。認識結果候補を求め
るには　まず、認識途中結果を空文字列としく処理１）
、認識途中結果内の最後尾の認識単語候補の終端位置で
ある認識途中結果終端位置を０　（フレーム番号）とし
て（処理２）初期化を行う。次に認識途中結果終端位置−ｇａｐ≦始端位置≦認識途中結
果終端位置＋ｇａｐ　　　（式ｌ、１）の始端位置の条
件をみたす（後続可能な）認識単語候補が存在するなら
ば（処理４）、その認識単語候補名を認識途中結果内の
文字列の最後尾に接続する（処理５）。ここでｇａｐは
照合部での処理における始端位置と終端位置の検出誤差
に対応するための定数であム　その後、下記の式２によ
って、認識途中結果終端位置の更新を行う（処理６）。

認識途中結果終端位置＝認識途中結果終端位置＋（認識単語候補の終端位置−
認識単語候補の始端位置）　　　（式２）そして、処理
３４で接続した認識単語候補が文頭から１番目であると
すると、接続部４は文頭からｉ−１番目の認識単語候補
を予測部に送り、次単語候補（文頭からｉ番目の単語に
なり得る単語候補）とその接続信頼度を予測部から得る
（処理７）。そして、これらを使って下記の式３によっ
て評価値を更新する（処理９）。このとき、単語列（Ｗ
ｌ、　　Ｗ２．　　、　、　、　Ｗｉ）から構成される
認識途中結果の評価関数ｈ（Ｗｉ）は以下のように表さ
れも十β・ｆ　（Ｗｉ−１，Ｗｉ）（式３）ただしｈ　　（ＷＯ）　　＝０である。

ここでｇ（Ｗｉ）は単語Ｗｉの音響信頼度、　ｆ　（Ｗ
ｉ−１，Ｗｉ）は単語Ｗｉ−１から単語ｗ１への接続信
頼度、α、βは重み（定数）である。その後、処理４か
ら処理９を処理４での条件が満たされなくなるまで繰り
返す。その後、入力音声フレーム長−ｇａｐ≦認識途中結果終端位置≦
入力音声フレーム長＋ｇａｐ（式１，２）なる条件で認識途中結果終端位置を判定しく処理１０）
、この条件が満たされたならば　このときの認識途中結
果を認識結果候補としてその評価値とともに保存する（
処理１３）。以上の認識途中結果を求める手続きを接続
部９に入力されるワードラチス全体について行（＼　存
在し得るだけの認識結果候補をもと礁　それらの中で最
高の評価値を持つ認識結果候補を認識結果として認識結
果出力端子１１より出力すも発明が解決しようとする纒題しかしなか技　上記のような構成では　音響信頼度と接
続信頼度にかける重み（式３におけるαとβ）が固定で
あるために　両信頼度が評価値に効率よく反映されずミ
　信頼度の導入が認識率の向上に全く関与しないという
課題を有していたまた　上記のような構成でＣヨ　　入
力音声中に息継ぎなどの無音区間が存在した場合　認識
素片候補が接続できないために認識結果が出力されなか
ったり、無音区間の存在をあらかじめ想定して式１．１
におけるｇａｐの値を大きくした場合には膨大な数の認
識結果候補を出力してしま（（結局は正しい認識結果を
出力しないという課題を有していｔら本発明ｉ：Ｌ　　素片接続における次素片予測の情報量
または入力音声中の無音時間またはその両者に応じて音
響信頼度と接続信頼度にかける重み（式３におけるαと
β）を変化させ、それぞれの信頼度が忠実に認識率の向
上につながる連続音声認識装置を提供するこ、とを目的
とすも課題を解決するための手段この目的を達成するために　第１の発明に係る連続音声
認識装置は　入力信号のフレームごとの特徴パラメータ
を検出する分析部と、分析部の圧力と標準信号の素片ご
との特徴パラメータとを照合して認識素片候補とその音
響信頼度を出力する照合部と、接続部より入力された認
識途中結果より予測される次素片候補とその接続信頼度
とその予測される次素片候補の情報量を出力する予測部
と、照合部の出力である認識素片候補を接続して認識結
果を出力するとともに認識途中結果を予測部に出力する
接続部とから構成される。

第２の発明に係る連続音声認識装置（よ　入力信号のフ
レームごとの特徴パラメータを検出する分析部と、入力
信号の無音区間を検出する検出部と、分析部の出力と標
準信号の素片ごとの特徴パラメータとを照合して認識素
片候補とその音響信頼度を出力する照合部と、接続部よ
り入力された認識途中結果より予測される次素片候補と
その接続信頼度とを出力する予測部と、上記照合部の出
力である認識素片候補を接続して認識結果を出力すると
ともに認識途中結果を予測部に出力する接続部とから構
成される。

第３の発明に係る連続音声認識装置は　入力信号のフレ
ームごとの特徴パラメータを検出する分析部と、入力信
号の無音区間を検出する検出部と、分析部の出力と標準
信号の素片ごとの特徴パラメータとを照合して認識素片
候補とその音響信頼度を出力する照合部と、接続部より
入力された認識途中結果より予測される次素片候補とそ
の接続信頼度とその次素片候補の情報量とを出力する予
測部と、照合部の出力である認識素片候補を接続して認
識結果を出力するとともに認識途中結果を予測部に出力
する接続部とから構成される。

作用第１の発明の連続音声認識装置（訳　分析部で入力信号
のフレームごとの特徴パラメータを検出し照合部で分析
部の出力と標準信号の素片ごとの特徴パラメータとを照
合して認識素片候補とその音響信頼度を出力し　予測部
で接続部より入力された認識途中結果より予測される次
素片候補とその接続信頼度とその予測される次素片候補
の情報量とを接続部に出力し　接続部で照合部より入力
された音響信頼度と、予測部より入力された接続信頼度
とを予測部より入力された次素片候補の情報量に応じて
それぞれ重み付けした線形結合で表される評価値を用い
て認識素片候補を接続して認識結果を得るとともに認識
途中結果を予測部に出力する。

第２の発明の連続音声認識装置（よ　分析部で入力信号
のフレームごとの特徴パラメータを検出し検出部で上記
入力信号の無音区間を検出し　照合部で分析部の出力と
標準信号の素片ごとの特徴パラメータとを照合して認識
素片候補とその音響信頼度を出力し　予測部で接続部よ
り入力された認識途中結果より予測される次素片候補と
その接続信頼度とを接続部に出力し　接続部で照合部よ
り入力された音響信頼度と、予測部より入力された接続
信頼度とを検出部より入力された無音区間の時間長に応
じてそれぞれ重み付けした線形結合で表される評価値を
用いて認識素片候補を接続して認識結果を得る七ともに
認識途中結果を予測部に出力す４第３の発明の連続音声認識装置は　分析部で入力信号の
フレームごとの特徴パラメータを検出上検出部で上記入
力信号の無音区間を検出し　照合部で分析部の出力と標
準信号の素片ごとの特徴パラメータとを照合して認識素
片候補とその音響信頼度を出力し　予測部で接続部より
入力された認識途中結果より予測される次素片候補とそ
の接続信頼度とその次素片候補の情報量とを接続部に出
力し　接続部で照合部より入力された音響信頼度と、予
測部より入力された上記接続信頼度とを予測部より入力
された次素片候補の情報量と検出部より入力された無音
区間の時間長とに応じてそれぞれ重み付けした線形結合
で表される評価値を用いて認識素片候補を接続して認識
結果を得るとともに認識途中結果を予測部に出力する。

実施例以下、第１、第２および第３の発明の実施例について第
１皿　第２母　第１表を参照しながら説明すも下記実施例（よ　請求項３に記載されている連続音声認
識装置について説明している力交　本実施例内容におけ
る評価値算出処理では次素片候補の情報量、または無音
区間の時間長を入力に使用しない場合でも有効であるの
で、請求項１記載の発明および請求項２記載の発明の実
施例と兼ねて記載する。

第１図は本発明の一実施例における単語を素片とした連
続音声認識装置のブロック図である。　■は信号入力端
子、　２は分析部　３は検出部　４は特徴パラメータ保
管服　５は照合部　６はワードラチス保管巳　７は重み
付は部（１）、　８は予測部　９は接続部　１０は重み
付は部（２）、　１１は認識結果出力端子、　１２はス
イッチである。以上のように構成された音声認識装置に
ついて以下その動作について説明すもまず標準信号登録時にζよ　スイッチ１１を分析部の出
力が特徴パラメータ保管部に入力されるように操作し　
信号入力端子１から入力された標準信号を分析部２に入
力し　フレームごとにＬＰＣケプストラムなどの特徴パ
ラメータを算出し　特徴パラメータ保管部４に入力すも
　標準信号を入力して上記の処理を認識すべき全単語に
ついて繰り返し　登録を終了す４また実施例で（表　予測部８には認識すべき全単語（前
単語）と、次単語候補としてその単語に後続可能な認識
されるべき単語と、あらかじめ統計的に求めておいた接
続確率（前単語が出現した後にそれぞれの次単語候補が
出現する確率）をこの接続信頼度として登録しておく。

また次単語候補の情報量として実施例ではバープレキシ
ティｅ　（Ｗｉ）を使用し　下記の式Ｏで算出して予測
部８に登録してお（。

た場合で、ｐ　（Ｗｉ−１，Ｗｉ）は単語Ｗｉ−１に後
続する単語Ｗｉの接続信頼度であム　この登録の例を第
１表に示す。

第１表これはＷｉ−１を前単飄Ｗｉを次単語候補としてみそして上記予測部８は接続部９より認識単語候補が入力
されると、その認識単語候補に後続可能な単語とその接
続確率とパープレキシティをそれぞれ次単語候補と持続
確率と次単語候補の情報量として接続部９に出力するよ
うに動作する。

次に認識時については第１図と第４図とを参照しながら
説明すも　まずスイッチ１２を分析部の出力が照合部に
入力されるように操作し　登録時と同様に信号入力端子
１より認識すべき信号を入力しく処理２１）、分析部２
でフレームごとの特徴パラメータを算出する（処理２２
）。次に照合部５において標準音声と入力信号との照合
を行う。

まず、フレーム番号−１、単語番号＝１とし　初期化を
行う（処理２３、２４）。そして、フレーム番号のフレ
ームを始端として単語番号番目の認識すべき単語との照
合を行い（処理２７）、判定閾値以上の類似度を示した
場合（処理２８）、この時の単語を認識結果候補　類似
度を音響信頼度とし　認識の始端と終端とともにワード
ラチス保管部に出力する（処理２９）。この後、単語番
号に１を加算して（処理３０）次の認識すべき単語につ
いての処理に移４　以上の処理が認識すべき単語すべて
について終了したとき（処理２６）、フレーム番号に１
を加算して（処理３１）次のフレームを始端として同様
の処理を行う。以上の処理がすべてのフレーム　すべて
の認識すべき単語について終了したならば（処理２５）
、照合部５での処理を終了すム　この処理によりワード
ラチスとして入力連続音声中に存在する可能性のある認
識単語候補名とその始端位置　終端位置　音響信頼度が
記録されてワードラチス保管部６に出力されも　上記の
ワードラチス生成方法は従来例と同様のものであ４　ま
た上記入力信号は検出部にも入力され　フレームごとに
入力信号のパワーが計算され　−足間値以下の場合には
このフレームでは無音であると判断す４　無音フレーム
の連続を無音区間とし　その開始位置　終了位置を１組
として接続部９に出力する。

次に接続部９の処理については第１図と第２図を参照し
ながら説明する。

上記接続部ではワードラチス保管部６より入力された認
識単語候補名を接続して複数の認識結果候補を生成し　
これらのう板　最高の評価値を持つものを認識結果とＬ
ｌ　　認識結果出力端子８に出力すも　認識結果候補を
求めるに（戴　ます、認識途中結果を空文字列としく処
理１）、認識途中結果内の最後尾の認識単語候補の終端
位置である認識途中結果終端位置を０（フレーム番号）
として（処理２）初期化を行ｔ、Ｘ、検出部より無音区
間の開始位置　終了位置といった無音区間の位置情報を
入力する（処理３）。次へ認識途中結果終端位置−ｇａｐ≦始端位置≦認識途中結
果終端位置＋ｇａｐ　　　　　　　（式１，１）の始端
位置の条件をみたす（後続可能な）認識単語候補が存在
するならば（処理４）、その認識単語候補名を認識途中
結果内の文字列の最後尾に接続する（処理５）。ここで
ｇａｐは照合部での処理における始端位置と終端位置の
検出誤差に対応するための定数である。ただし式１を満
たす認識単語候補が存在せず（処理４）、かつ、入力音
声フレーム長−ｇａｐ≦認識途中結果終端位置≦入力音
声フレーム長＋ｇａｐ（式１，２）が満たされない場合で（処理１０）、認識途中結果終端位置＝ｇａｐ≦無音区間の開始位置≦
認識途中結果終端位置＋ｇａｐ（式１，３）を満たす場合（処理１１）は無音区間が存在すると判断
Ｌ　認識途中結果終端位置を無音区間の時間長だけ延長
して（処理１２）再び処理４にもどる。式１．　３を満
たさない場合（処理１１）は後続可能な単語が存在しな
いたべ　それまでの認識途中結果が誤っていると判断し
て処理を打ち切る。

この方法により発声者の息継ぎなどによる入力音声中の
無音区間が存在した場合でもｇａｐの値を変更すること
なく処理が行えることになる。

処理４で後続可能な次単語候補が存在した時（表認識途
中結果内の文字列の最後尾に次単語候補名を接続しく処
理５）、下記の式２によって認識途中結果終端位置の更
新を行う　（処理６）。

認識途中結果終端位置＝認識途中結果終端位置＋（認識
単語候補の終端位置−認識単語候補の始端位置）　　　
　　　　　　　　　　　　　　（式２）そして、処理５
で接続した認識単語候補が文頭から１番目であるとする
と、接続部４は文頭から１−１番目の認識単語候補を予
測部に送り、次単語候補（文頭から１番目の単語になり
得る単語候補）とその接続信頼度とを予測部から得る（
処理７）。

また予測部より文頭からｉ−１番目の認識単語候補から
みた次単語候補Ｃ１番目の単語候補）の情報量を得も　
そして、これらを使って下記の式３によって評価値を更
新する（処理７）。このとき、単語列（Ｗｌ、　　Ｗ２
．　　、　、　、　Ｗｉ）から構成される認識途中結果
の評価関数ｈ　（Ｗｉ）は以下のように表されも＋　ｂ−ｆ　　（Ｗｉ−１，Ｗｉ）（式３）ただし　ｈ　（ＷＯ）　＝　　Ｏ。

ａ”ｌ”　　・ｒ　　・ｅ　　（Ｗｉ）。

ｂｃｌ：δ／　（τ　・　ｅ　（Ｗｉ））であもここでｇ　（Ｗｉ）はワードラチス保管部６が重み付は
部（１）７に出力する単語Ｗｉの音響信頼度であり、重
み付は部（１）７で重みａがつけられて接続部９に入力
されも　またｆ　　（Ｗｉ−１，Ｗｉ）は予測部８が重
み付は部（２）１０に出力する単語Ｗｉ−１から単語Ｗ
ｉへの接続信頼度であり、重み付は部（２）１０で重み
ｂがつけられて接続部９に入力されも　音響信頼度の重
みａは予測部８から入力される次単語候補の情報員に比
例させ、接続信頼度の重みｂは予測部８から入力される
次単語候補の情報量に反比例する関数とする。またτは
認識単語候補Ｗｉ立直前無音区間が存在した場合の無音
区間の時間長（無音区間の終了位置−無音区間の開始位
置）である力丈　無音区間が存在しない場合に（τ−０
）はｂが無限大になってしまわないように最小値を設け
ておく。なおγ、　δは定数（固定）である。この方法
により、次単語候補の情報量が大きいときには音響的信
頼度が優先され小さいときには接続信頼度が優先される
。よって不明瞭に発声されがちな一連の単語列（このよ
うな単語列は次単語候補の情報量が小さく、無音区間は
存在しにくい傾向にある）が入力されて、音響信頼度が
低い場合でも接続信頼度を優先して評価値を上げること
ができるた敷　認識率を向上することができる。その後
、処理４から処理９までを処理４の条件が満たされなく
なるまで繰り返す。

その後、式１，２が満たされたならば（処理１０）この
ときの認識途中結果を認識結果候補としてその評価値と
ともに保存する（処理１３）。以上の認識途中結果を求
める手続きを接続部９に入力されるワードラチス全体に
ついて行（Ｘ、存在し得るだけの認識結果候補をもと取
　それらの中で最高の評価値を持つ認識結果候補を認識
結果として認識結果出力端子１１より出力する。

以上のように　本実施例は請求項３に記載の発明につい
てである力丈　評価値算出処理では無音区間の時間長を
使用しない場合（請求項１に記載）、または次素片候補
の情報量を使用しない場合（請求項２に記載）でも有効
である。

発明の効果第１の発明の連続音声認識装置（よ　次素片候補の情報
量に応じて音響信頼度と接続信頼度にかける重みを変化
させるために　両信頼度を評価値に効率よく反映させる
ことができ、認識率の向上につなげることができム　す
なわ板　入力信号の音響信頼度が低い場合でも次素片候
補の情報量が小さければ接続信頼度を優先して評価値を
上げることができるた嵌　正しい認識結果が得ることが
できるようになる。

第２の発明の連続音声認識装置（よ　入力音声中の無音
区間の時間長に応じて音響信頼度と接続信頼度にかける
重みを変化させるために　両信頼度を評価値に効率よく
反映させることができ、ｇ忍識率の向上につなげること
ができも　すなわ板　入力信号の音響信頼度が低い場合
でも無音区間が存在しなければ接続信頼度を優先して評
価値を上げることができるた敦　正しい認識結果が得る
ことができる。

また　入力音声中に息継ぎなどの無音区間が存在した場
合は認識結果候補を大幅に増やすことなく認識素片候補
を接続できるた数　認識結果が出力されなかったりする
ことがなくなる。

第３の発明の連続音声認識装置ζよ　次素片候補の情報
量と入力音声中の無音区間の時間長とに応じて音響信頼
度と接続信頼度にかける重みを変化させるために　第１
、第２の発明の効果が得られるだけでなく、次素片候補
の情報量と無音区間の時間長が比例するといった入力信
号である音声の特徴を取り入れているのて　入力信号の
品質を高めることにより認識率を向上させることができ
る。

【図面の簡単な説明】

第１図は本発明の一実施例における音声認識装置のブロ
ック皿　第２図は本発明の一実施例における接続部にお
ける処理のフローチャート、第３図は従来例における音
声認識装置のブロック医第４図は従来例におけるワード
ラチス生成フローチャート、第５図は従来例における接
続部における処理のフローチャートである。１・・、入力端子、　２・・・分析訊　３・・・検出訊
　４・・・特徴パラメータ保管撤　５・・・照合縁　６
・・・ワードラチス保管ｓ、７・・・重み付は部（１）
、８・・・予測訊　９・・・接続部　１０・・・重み付
は部（２）、　１１・・・出力端子、　１２・・・スイ
ッチ。代理人の氏名　弁理士　粟野重孝　はか１基端　１　図／１２図樟靴信町／ｆ（認Ｎｂ結ｆ峡補９し）第図／前図

Claims

【特許請求の範囲】

（１）入力信号の単位時間（以下、フレーム）ごとの特
徴パラメータを検出する分析部と、上記分析部の出力と
標準信号の一定時間（以下、素片）ごとの特徴パラメー
タとを照合して認識素片候補とその類似度（以下、音響
信頼度）を出力する照合部と、上記照合部の出力である
上記認識素片候補を接続して認識結果を出力するととも
に認識途中結果を予測部に出力する接続部と、上記接続
部より入力された上記認識途中結果より予測される次素
片候補とその素片が出現する信頼度（以下、接続信頼度
）とその予測される次素片候補の情報量とを上記接続部
に出力する上記予測部とを具備し、上記接続部では、上
記照合部より入力された上記音響信頼度と、上記予測部
より入力された上記接続信頼度とを上記予測部より入力
された上記次素片候補の情報量に応じてそれぞれ重み付
けした線形結合で表される評価値を用いて上記認識素片
候補を接続して連続音声認識結果を得ることを特徴とす
る連続音声認識装置。
（２）入力信号のフレームごとの特徴パラメータを検出
する分析部と、上記入力信号の無音区間を検出する検出
部と、上記分析部の出力と標準信号の素片ごとの特徴パ
ラメータとを照合して認識素片候補とその音響信頼度を
出力する照合部と、上記照合部の出力である上記認識素
片候補を接続して認識結果を出力するとともに認識途中
結果を予測部に出力する接続部と、上記接続部より入力
された上記認識途中結果より予測される次素片候補とそ
の接続信頼度とを上記接続部に出力する上記予測部と具
備し、上記接続部では、上記照合部より入力された上記
音響信頼度と、上記予測部より入力された上記接続信頼
度とを上記検出部より入力された無音区間の時間長に応
じてそれぞれ重み付けした線形結合で表される評価値を
用いて上記認識素片候補を接続して連続音声認識結果を
得ることを特徴とする連続音声認識装置。
（３）入力信号のフレームごとの特徴パラメータを検出
する分析部と、上記入力信号の無音区間を検出する検出
部と、上記分析部の出力と標準信号の素片ごとの特徴パ
ラメータとを照合して認識素片候補とその音響信頼度を
出力する照合部と、上記照合部の出力である上記認識素
片候補を接続して認識結果を出力するとともに認識途中
結果を予測部に出力する接続部と、上記接続部より入力
された上記認識途中結果より予測される次素片候補とそ
の接続信頼度とその次素片候補の情報量とを上記接続部
に出力する上記予測部とを具備し、上記接続部では、上
記照合部より入力された上記音響信頼度と、上記予測部
より入力された上記接続信頼度とを上記予測部より入力
された上記次素片候補の情報量と上記検出部より入力さ
れた無音区間の時間長とに応じてそれぞれ重み付けした
線形結合で表される評価値を用いて上記認識素片候補を
接続して連続音声認識結果を得ることを特徴とする連続
音声認識装置。