JPH0484197A - 連続音声認識装置 - Google Patents

連続音声認識装置

Info

Publication number
JPH0484197A
JPH0484197A JP2200530A JP20053090A JPH0484197A JP H0484197 A JPH0484197 A JP H0484197A JP 2200530 A JP2200530 A JP 2200530A JP 20053090 A JP20053090 A JP 20053090A JP H0484197 A JPH0484197 A JP H0484197A
Authority
JP
Japan
Prior art keywords
recognition
unit
section
input
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2200530A
Other languages
English (en)
Other versions
JP2921059B2 (ja
Inventor
Atsushi Horioka
篤史 堀岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2200530A priority Critical patent/JP2921059B2/ja
Publication of JPH0484197A publication Critical patent/JPH0484197A/ja
Application granted granted Critical
Publication of JP2921059B2 publication Critical patent/JP2921059B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音響信頼度と接続信頼度に可変にそれぞれ重み
付けした線形結合で表される評価値を用いて認識結果を
得る連続音声認識装置に関するものであム 従来の技術 近爪 音声認識技術の発達とともに 連続音声認識装置
が種々の分野で実用化されようとしており、実用化する
ために(上 認識装置を実用する上での種々の問題点を
解決する必要がある。この実用上の問題点の1つく 入
力連続音声中に不明瞭に発声された部分が存在する場合
、この部分を誤認識してしま(\ 誤った認識文を出力
してしまうという点かあム 従来の連続音声認識装置でζよ 上記問題点を解決する
ために 最高の音響信頼度で認識された素片を単に接続
して文単位の認識結果を得るのではなく、認識された素
片の音響信頼度と接続信頼度の線形結合として評価関数
を設定してこの評価値が最高のものを認識結果とするの
で、素片の音響信頼度が低くても前後の素片との文法上
のつながり(接続信頼度)が高ければ評価値が高くなり
、入力連続音声中に不明瞭に発声され・た部分が存在し
ても正しく認識できるようになる。
以下、第3@ 第4医 第5図を参照しなが収上述した
ような従来の連続音声認識装置で素片を単語としたもの
を例として説明を行う。
第3図C表  従来の連続音声認識装置のブロック諷 
第4図はワードラチス生成のフローチャート、第5図は
接続部における処理を示したフローチャートである。第
3図において、 1は信号入力端子、2は分析部 4は
特徴パラメータ保管孔 5は照合部 6はワードラチス
保管服 8は予測部 9は接続部 10は認識結果出力
端子、 12はスイッチであム 以上のように構成され
た音声認識装置について以下その動作について説明する
最初に標準音声登録時については第31図を参照しなが
ら説明すも まず、スイッチ12を分析部の出力が特徴
パラメータ保管部に入力されるように操作し 信号入力
端子1から単語単位で入力された標準音声を分析部2に
入力し フレームごとの特徴パラメータを算出し 特徴
パラメータ保管部4に登録する。そして、標準音声を入
力して上記の処理を認識すべき全単語について繰り返し
登録を終了する。
次に認識時については第3図と第4図とを参照しながら
説明する。まずスイッチ12を分析部の出力が照合部に
入力されるように操作し 登録時と同様に信号入力端子
1より認識すべき信号を入力しく処理21)、分析部2
でフレームごとの特徴パラメータを算出する(処理22
)。次に照合部5において標準音声と入力信号との照合
を行う。
まず、フレーム番号=1、単語番号=1とし 初期化を
行う(処理23.24)。そして、フレーム番号のフレ
ームを始端として単語番号番目の認識すべき単語との照
合を行い(処理27)、判定閾値以上の類似度を示した
場合(処理28)、この時の単語を認識素片候補 類似
度を音響信頼度とし 認識の始端と終端とともにワード
ラチス保管部に出力する(処理29)。この後、単語番
号に1を加算して(処理30)次の認識すべき単語につ
いての処理に移も 以上の処理が認識すべき単語すべて
について終了したとき(処理26)、フレーム番号に1
を加算して(処理31)次のフレームを始端として同様
の処理を行う。以上の処理がすべてのフレーム すべて
の認識すべき単語について終了したならば(処理25)
、照合部5での処理を終了すム この処理によりワード
ラチスとして入力連続音声中に存在する可能性のある認
識単語候補名とその始端位! 終端位置 音響信頼度が
記録されてワードラチス保管部6に出力されも また 予測部8は接続部9から入力された認識単語候補
に後続可能な単語を文法または統計情報などを用いて求
取 次単語候補としてその接続信頼度(確率などで表現
する)とともに接続部9に出力するように動作すム 次に接続部9の処理については第3図と第5図を参照し
ながら説明する。
上記接続部ではワードラチス保管部6より入力された認
識単語候補名を接続して複数の認識結果候補を生成し 
これらのう敷 最高の評価値を持つものを認識結果とL
 認識結果出力端子8に出力する。認識結果候補を求め
るには まず、認識途中結果を空文字列としく処理1)
、認識途中結果内の最後尾の認識単語候補の終端位置で
ある認識途中結果終端位置を0 (フレーム番号)とし
て(処理2)初期化を行う。次に 認識途中結果終端位置−gap≦始端位置≦認識途中結
果終端位置+gap   (式l、1)の始端位置の条
件をみたす(後続可能な)認識単語候補が存在するなら
ば(処理4)、その認識単語候補名を認識途中結果内の
文字列の最後尾に接続する(処理5)。ここでgapは
照合部での処理における始端位置と終端位置の検出誤差
に対応するための定数であム その後、下記の式2によ
って、認識途中結果終端位置の更新を行う(処理6)。
認識途中結果終端位置 =認識途中結果終端位置+(認識単語候補の終端位置−
認識単語候補の始端位置)   (式2)そして、処理
34で接続した認識単語候補が文頭から1番目であると
すると、接続部4は文頭からi−1番目の認識単語候補
を予測部に送り、次単語候補(文頭からi番目の単語に
なり得る単語候補)とその接続信頼度を予測部から得る
(処理7)。そして、これらを使って下記の式3によっ
て評価値を更新する(処理9)。このとき、単語列(W
l、  W2.  、 、 、 Wi)から構成される
認識途中結果の評価関数h(Wi)は以下のように表さ
れも 十β・f (Wi−1,Wi) (式3) ただし h  (WO)  = 0である。
ここでg(Wi)は単語Wiの音響信頼度、 f (W
i−1,Wi)は単語Wi−1から単語w1への接続信
頼度、α、βは重み(定数)である。その後、処理4か
ら処理9を処理4での条件が満たされなくなるまで繰り
返す。その後、 入力音声フレーム長−gap≦認識途中結果終端位置≦
入力音声フレーム長+gap (式1,2) なる条件で認識途中結果終端位置を判定しく処理10)
、この条件が満たされたならば このときの認識途中結
果を認識結果候補としてその評価値とともに保存する(
処理13)。以上の認識途中結果を求める手続きを接続
部9に入力されるワードラチス全体について行(\ 存
在し得るだけの認識結果候補をもと礁 それらの中で最
高の評価値を持つ認識結果候補を認識結果として認識結
果出力端子11より出力すも 発明が解決しようとする纒題 しかしなか技 上記のような構成では 音響信頼度と接
続信頼度にかける重み(式3におけるαとβ)が固定で
あるために 両信頼度が評価値に効率よく反映されずミ
 信頼度の導入が認識率の向上に全く関与しないという
課題を有していたまた 上記のような構成でCヨ  入
力音声中に息継ぎなどの無音区間が存在した場合 認識
素片候補が接続できないために認識結果が出力されなか
ったり、無音区間の存在をあらかじめ想定して式1.1
におけるgapの値を大きくした場合には膨大な数の認
識結果候補を出力してしま((結局は正しい認識結果を
出力しないという課題を有していtら 本発明i:L  素片接続における次素片予測の情報量
または入力音声中の無音時間またはその両者に応じて音
響信頼度と接続信頼度にかける重み(式3におけるαと
β)を変化させ、それぞれの信頼度が忠実に認識率の向
上につながる連続音声認識装置を提供するこ、とを目的
とすも 課題を解決するための手段 この目的を達成するために 第1の発明に係る連続音声
認識装置は 入力信号のフレームごとの特徴パラメータ
を検出する分析部と、分析部の圧力と標準信号の素片ご
との特徴パラメータとを照合して認識素片候補とその音
響信頼度を出力する照合部と、接続部より入力された認
識途中結果より予測される次素片候補とその接続信頼度
とその予測される次素片候補の情報量を出力する予測部
と、照合部の出力である認識素片候補を接続して認識結
果を出力するとともに認識途中結果を予測部に出力する
接続部とから構成される。
第2の発明に係る連続音声認識装置(よ 入力信号のフ
レームごとの特徴パラメータを検出する分析部と、入力
信号の無音区間を検出する検出部と、分析部の出力と標
準信号の素片ごとの特徴パラメータとを照合して認識素
片候補とその音響信頼度を出力する照合部と、接続部よ
り入力された認識途中結果より予測される次素片候補と
その接続信頼度とを出力する予測部と、上記照合部の出
力である認識素片候補を接続して認識結果を出力すると
ともに認識途中結果を予測部に出力する接続部とから構
成される。
第3の発明に係る連続音声認識装置は 入力信号のフレ
ームごとの特徴パラメータを検出する分析部と、入力信
号の無音区間を検出する検出部と、分析部の出力と標準
信号の素片ごとの特徴パラメータとを照合して認識素片
候補とその音響信頼度を出力する照合部と、接続部より
入力された認識途中結果より予測される次素片候補とそ
の接続信頼度とその次素片候補の情報量とを出力する予
測部と、照合部の出力である認識素片候補を接続して認
識結果を出力するとともに認識途中結果を予測部に出力
する接続部とから構成される。
作用 第1の発明の連続音声認識装置(訳 分析部で入力信号
のフレームごとの特徴パラメータを検出し照合部で分析
部の出力と標準信号の素片ごとの特徴パラメータとを照
合して認識素片候補とその音響信頼度を出力し 予測部
で接続部より入力された認識途中結果より予測される次
素片候補とその接続信頼度とその予測される次素片候補
の情報量とを接続部に出力し 接続部で照合部より入力
された音響信頼度と、予測部より入力された接続信頼度
とを予測部より入力された次素片候補の情報量に応じて
それぞれ重み付けした線形結合で表される評価値を用い
て認識素片候補を接続して認識結果を得るとともに認識
途中結果を予測部に出力する。
第2の発明の連続音声認識装置(よ 分析部で入力信号
のフレームごとの特徴パラメータを検出し検出部で上記
入力信号の無音区間を検出し 照合部で分析部の出力と
標準信号の素片ごとの特徴パラメータとを照合して認識
素片候補とその音響信頼度を出力し 予測部で接続部よ
り入力された認識途中結果より予測される次素片候補と
その接続信頼度とを接続部に出力し 接続部で照合部よ
り入力された音響信頼度と、予測部より入力された接続
信頼度とを検出部より入力された無音区間の時間長に応
じてそれぞれ重み付けした線形結合で表される評価値を
用いて認識素片候補を接続して認識結果を得る七ともに
認識途中結果を予測部に出力す4 第3の発明の連続音声認識装置は 分析部で入力信号の
フレームごとの特徴パラメータを検出上検出部で上記入
力信号の無音区間を検出し 照合部で分析部の出力と標
準信号の素片ごとの特徴パラメータとを照合して認識素
片候補とその音響信頼度を出力し 予測部で接続部より
入力された認識途中結果より予測される次素片候補とそ
の接続信頼度とその次素片候補の情報量とを接続部に出
力し 接続部で照合部より入力された音響信頼度と、予
測部より入力された上記接続信頼度とを予測部より入力
された次素片候補の情報量と検出部より入力された無音
区間の時間長とに応じてそれぞれ重み付けした線形結合
で表される評価値を用いて認識素片候補を接続して認識
結果を得るとともに認識途中結果を予測部に出力する。
実施例 以下、第1、第2および第3の発明の実施例について第
1皿 第2母 第1表を参照しながら説明すも 下記実施例(よ 請求項3に記載されている連続音声認
識装置について説明している力交 本実施例内容におけ
る評価値算出処理では次素片候補の情報量、または無音
区間の時間長を入力に使用しない場合でも有効であるの
で、請求項1記載の発明および請求項2記載の発明の実
施例と兼ねて記載する。
第1図は本発明の一実施例における単語を素片とした連
続音声認識装置のブロック図である。 ■は信号入力端
子、 2は分析部 3は検出部 4は特徴パラメータ保
管服 5は照合部 6はワードラチス保管巳 7は重み
付は部(1)、 8は予測部 9は接続部 10は重み
付は部(2)、 11は認識結果出力端子、 12はス
イッチである。以上のように構成された音声認識装置に
ついて以下その動作について説明すも まず標準信号登録時にζよ スイッチ11を分析部の出
力が特徴パラメータ保管部に入力されるように操作し 
信号入力端子1から入力された標準信号を分析部2に入
力し フレームごとにLPCケプストラムなどの特徴パ
ラメータを算出し 特徴パラメータ保管部4に入力すも
 標準信号を入力して上記の処理を認識すべき全単語に
ついて繰り返し 登録を終了す4 また実施例で(表 予測部8には認識すべき全単語(前
単語)と、次単語候補としてその単語に後続可能な認識
されるべき単語と、あらかじめ統計的に求めておいた接
続確率(前単語が出現した後にそれぞれの次単語候補が
出現する確率)をこの接続信頼度として登録しておく。
また次単語候補の情報量として実施例ではバープレキシ
ティe (Wi)を使用し 下記の式Oで算出して予測
部8に登録してお(。
た場合で、p (Wi−1,Wi)は単語Wi−1に後
続する単語Wiの接続信頼度であム この登録の例を第
1表に示す。
第1表 これはWi−1を前単飄 Wiを次単語候補としてみ そして上記予測部8は接続部9より認識単語候補が入力
されると、その認識単語候補に後続可能な単語とその接
続確率とパープレキシティをそれぞれ次単語候補と持続
確率と次単語候補の情報量として接続部9に出力するよ
うに動作する。
次に認識時については第1図と第4図とを参照しながら
説明すも まずスイッチ12を分析部の出力が照合部に
入力されるように操作し 登録時と同様に信号入力端子
1より認識すべき信号を入力しく処理21)、分析部2
でフレームごとの特徴パラメータを算出する(処理22
)。次に照合部5において標準音声と入力信号との照合
を行う。
まず、フレーム番号−1、単語番号=1とし 初期化を
行う(処理23、24)。そして、フレーム番号のフレ
ームを始端として単語番号番目の認識すべき単語との照
合を行い(処理27)、判定閾値以上の類似度を示した
場合(処理28)、この時の単語を認識結果候補 類似
度を音響信頼度とし 認識の始端と終端とともにワード
ラチス保管部に出力する(処理29)。この後、単語番
号に1を加算して(処理30)次の認識すべき単語につ
いての処理に移4 以上の処理が認識すべき単語すべて
について終了したとき(処理26)、フレーム番号に1
を加算して(処理31)次のフレームを始端として同様
の処理を行う。以上の処理がすべてのフレーム すべて
の認識すべき単語について終了したならば(処理25)
、照合部5での処理を終了すム この処理によりワード
ラチスとして入力連続音声中に存在する可能性のある認
識単語候補名とその始端位置 終端位置 音響信頼度が
記録されてワードラチス保管部6に出力されも 上記の
ワードラチス生成方法は従来例と同様のものであ4 ま
た上記入力信号は検出部にも入力され フレームごとに
入力信号のパワーが計算され −足間値以下の場合には
このフレームでは無音であると判断す4 無音フレーム
の連続を無音区間とし その開始位置 終了位置を1組
として接続部9に出力する。
次に接続部9の処理については第1図と第2図を参照し
ながら説明する。
上記接続部ではワードラチス保管部6より入力された認
識単語候補名を接続して複数の認識結果候補を生成し 
これらのう板 最高の評価値を持つものを認識結果とL
l  認識結果出力端子8に出力すも 認識結果候補を
求めるに(戴 ます、認識途中結果を空文字列としく処
理1)、認識途中結果内の最後尾の認識単語候補の終端
位置である認識途中結果終端位置を0(フレーム番号)
として(処理2)初期化を行t、X、検出部より無音区
間の開始位置 終了位置といった無音区間の位置情報を
入力する(処理3)。次へ 認識途中結果終端位置−gap≦始端位置≦認識途中結
果終端位置+gap       (式1,1)の始端
位置の条件をみたす(後続可能な)認識単語候補が存在
するならば(処理4)、その認識単語候補名を認識途中
結果内の文字列の最後尾に接続する(処理5)。ここで
gapは照合部での処理における始端位置と終端位置の
検出誤差に対応するための定数である。ただし式1を満
たす認識単語候補が存在せず(処理4)、かつ、入力音
声フレーム長−gap≦認識途中結果終端位置≦入力音
声フレーム長+gap (式1,2) が満たされない場合で(処理10)、 認識途中結果終端位置=gap≦無音区間の開始位置≦
認識途中結果終端位置+gap (式1,3) を満たす場合(処理11)は無音区間が存在すると判断
L 認識途中結果終端位置を無音区間の時間長だけ延長
して(処理12)再び処理4にもどる。式1. 3を満
たさない場合(処理11)は後続可能な単語が存在しな
いたべ それまでの認識途中結果が誤っていると判断し
て処理を打ち切る。
この方法により発声者の息継ぎなどによる入力音声中の
無音区間が存在した場合でもgapの値を変更すること
なく処理が行えることになる。
処理4で後続可能な次単語候補が存在した時(表認識途
中結果内の文字列の最後尾に次単語候補名を接続しく処
理5)、下記の式2によって認識途中結果終端位置の更
新を行う (処理6)。
認識途中結果終端位置=認識途中結果終端位置+(認識
単語候補の終端位置−認識単語候補の始端位置)   
              (式2)そして、処理5
で接続した認識単語候補が文頭から1番目であるとする
と、接続部4は文頭から1−1番目の認識単語候補を予
測部に送り、次単語候補(文頭から1番目の単語になり
得る単語候補)とその接続信頼度とを予測部から得る(
処理7)。
また予測部より文頭からi−1番目の認識単語候補から
みた次単語候補C1番目の単語候補)の情報量を得も 
そして、これらを使って下記の式3によって評価値を更
新する(処理7)。このとき、単語列(Wl、  W2
.  、 、 、 Wi)から構成される認識途中結果
の評価関数h (Wi)は以下のように表されも + b−f  (Wi−1,Wi) (式3) ただし h (WO) =  O。
a”l”  ・r  ・e  (Wi)。
bcl:δ/ (τ ・ e (Wi))であも ここでg (Wi)はワードラチス保管部6が重み付は
部(1)7に出力する単語Wiの音響信頼度であり、重
み付は部(1)7で重みaがつけられて接続部9に入力
されも またf  (Wi−1,Wi)は予測部8が重
み付は部(2)10に出力する単語Wi−1から単語W
iへの接続信頼度であり、重み付は部(2)10で重み
bがつけられて接続部9に入力されも 音響信頼度の重
みaは予測部8から入力される次単語候補の情報員に比
例させ、接続信頼度の重みbは予測部8から入力される
次単語候補の情報量に反比例する関数とする。またτは
認識単語候補Wi立直前無音区間が存在した場合の無音
区間の時間長(無音区間の終了位置−無音区間の開始位
置)である力丈 無音区間が存在しない場合に(τ−0
)はbが無限大になってしまわないように最小値を設け
ておく。なおγ、 δは定数(固定)である。この方法
により、次単語候補の情報量が大きいときには音響的信
頼度が優先され小さいときには接続信頼度が優先される
。よって不明瞭に発声されがちな一連の単語列(このよ
うな単語列は次単語候補の情報量が小さく、無音区間は
存在しにくい傾向にある)が入力されて、音響信頼度が
低い場合でも接続信頼度を優先して評価値を上げること
ができるた敷 認識率を向上することができる。その後
、処理4から処理9までを処理4の条件が満たされなく
なるまで繰り返す。
その後、式1,2が満たされたならば(処理10)この
ときの認識途中結果を認識結果候補としてその評価値と
ともに保存する(処理13)。以上の認識途中結果を求
める手続きを接続部9に入力されるワードラチス全体に
ついて行(X、存在し得るだけの認識結果候補をもと取
 それらの中で最高の評価値を持つ認識結果候補を認識
結果として認識結果出力端子11より出力する。
以上のように 本実施例は請求項3に記載の発明につい
てである力丈 評価値算出処理では無音区間の時間長を
使用しない場合(請求項1に記載)、または次素片候補
の情報量を使用しない場合(請求項2に記載)でも有効
である。
発明の効果 第1の発明の連続音声認識装置(よ 次素片候補の情報
量に応じて音響信頼度と接続信頼度にかける重みを変化
させるために 両信頼度を評価値に効率よく反映させる
ことができ、認識率の向上につなげることができム す
なわ板 入力信号の音響信頼度が低い場合でも次素片候
補の情報量が小さければ接続信頼度を優先して評価値を
上げることができるた嵌 正しい認識結果が得ることが
できるようになる。
第2の発明の連続音声認識装置(よ 入力音声中の無音
区間の時間長に応じて音響信頼度と接続信頼度にかける
重みを変化させるために 両信頼度を評価値に効率よく
反映させることができ、g忍識率の向上につなげること
ができも すなわ板 入力信号の音響信頼度が低い場合
でも無音区間が存在しなければ接続信頼度を優先して評
価値を上げることができるた敦 正しい認識結果が得る
ことができる。
また 入力音声中に息継ぎなどの無音区間が存在した場
合は認識結果候補を大幅に増やすことなく認識素片候補
を接続できるた数 認識結果が出力されなかったりする
ことがなくなる。
第3の発明の連続音声認識装置ζよ 次素片候補の情報
量と入力音声中の無音区間の時間長とに応じて音響信頼
度と接続信頼度にかける重みを変化させるために 第1
、第2の発明の効果が得られるだけでなく、次素片候補
の情報量と無音区間の時間長が比例するといった入力信
号である音声の特徴を取り入れているのて 入力信号の
品質を高めることにより認識率を向上させることができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック皿 第2図は本発明の一実施例における接続部にお
ける処理のフローチャート、第3図は従来例における音
声認識装置のブロック医第4図は従来例におけるワード
ラチス生成フローチャート、第5図は従来例における接
続部における処理のフローチャートである。 1・・、入力端子、 2・・・分析訊 3・・・検出訊
 4・・・特徴パラメータ保管撤 5・・・照合縁 6
・・・ワードラチス保管s、7・・・重み付は部(1)
、8・・・予測訊 9・・・接続部 10・・・重み付
は部(2)、 11・・・出力端子、 12・・・スイ
ッチ。 代理人の氏名 弁理士 粟野重孝 はか1基端 1 図 / 12図 樟靴信町 /f (認Nb結f峡補9し) 第 図 / 前 図

Claims (3)

    【特許請求の範囲】
  1. (1)入力信号の単位時間(以下、フレーム)ごとの特
    徴パラメータを検出する分析部と、上記分析部の出力と
    標準信号の一定時間(以下、素片)ごとの特徴パラメー
    タとを照合して認識素片候補とその類似度(以下、音響
    信頼度)を出力する照合部と、上記照合部の出力である
    上記認識素片候補を接続して認識結果を出力するととも
    に認識途中結果を予測部に出力する接続部と、上記接続
    部より入力された上記認識途中結果より予測される次素
    片候補とその素片が出現する信頼度(以下、接続信頼度
    )とその予測される次素片候補の情報量とを上記接続部
    に出力する上記予測部とを具備し、上記接続部では、上
    記照合部より入力された上記音響信頼度と、上記予測部
    より入力された上記接続信頼度とを上記予測部より入力
    された上記次素片候補の情報量に応じてそれぞれ重み付
    けした線形結合で表される評価値を用いて上記認識素片
    候補を接続して連続音声認識結果を得ることを特徴とす
    る連続音声認識装置。
  2. (2)入力信号のフレームごとの特徴パラメータを検出
    する分析部と、上記入力信号の無音区間を検出する検出
    部と、上記分析部の出力と標準信号の素片ごとの特徴パ
    ラメータとを照合して認識素片候補とその音響信頼度を
    出力する照合部と、上記照合部の出力である上記認識素
    片候補を接続して認識結果を出力するとともに認識途中
    結果を予測部に出力する接続部と、上記接続部より入力
    された上記認識途中結果より予測される次素片候補とそ
    の接続信頼度とを上記接続部に出力する上記予測部と具
    備し、上記接続部では、上記照合部より入力された上記
    音響信頼度と、上記予測部より入力された上記接続信頼
    度とを上記検出部より入力された無音区間の時間長に応
    じてそれぞれ重み付けした線形結合で表される評価値を
    用いて上記認識素片候補を接続して連続音声認識結果を
    得ることを特徴とする連続音声認識装置。
  3. (3)入力信号のフレームごとの特徴パラメータを検出
    する分析部と、上記入力信号の無音区間を検出する検出
    部と、上記分析部の出力と標準信号の素片ごとの特徴パ
    ラメータとを照合して認識素片候補とその音響信頼度を
    出力する照合部と、上記照合部の出力である上記認識素
    片候補を接続して認識結果を出力するとともに認識途中
    結果を予測部に出力する接続部と、上記接続部より入力
    された上記認識途中結果より予測される次素片候補とそ
    の接続信頼度とその次素片候補の情報量とを上記接続部
    に出力する上記予測部とを具備し、上記接続部では、上
    記照合部より入力された上記音響信頼度と、上記予測部
    より入力された上記接続信頼度とを上記予測部より入力
    された上記次素片候補の情報量と上記検出部より入力さ
    れた無音区間の時間長とに応じてそれぞれ重み付けした
    線形結合で表される評価値を用いて上記認識素片候補を
    接続して連続音声認識結果を得ることを特徴とする連続
    音声認識装置。
JP2200530A 1990-07-26 1990-07-26 連続音声認識装置 Expired - Fee Related JP2921059B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2200530A JP2921059B2 (ja) 1990-07-26 1990-07-26 連続音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2200530A JP2921059B2 (ja) 1990-07-26 1990-07-26 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPH0484197A true JPH0484197A (ja) 1992-03-17
JP2921059B2 JP2921059B2 (ja) 1999-07-19

Family

ID=16425841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2200530A Expired - Fee Related JP2921059B2 (ja) 1990-07-26 1990-07-26 連続音声認識装置

Country Status (1)

Country Link
JP (1) JP2921059B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008113457A (ja) * 2001-03-15 2008-05-15 Robert Bosch Gmbh 多数のバスのサイクルタイムを同期させる方法と装置及び対応するバスシステム
US8145486B2 (en) 2007-01-17 2012-03-27 Kabushiki Kaisha Toshiba Indexing apparatus, indexing method, and computer program product
US8200061B2 (en) 2007-09-12 2012-06-12 Kabushiki Kaisha Toshiba Signal processing apparatus and method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160144A (ja) 2019-03-25 2020-10-01 株式会社Subaru 音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008113457A (ja) * 2001-03-15 2008-05-15 Robert Bosch Gmbh 多数のバスのサイクルタイムを同期させる方法と装置及び対応するバスシステム
JP2008178091A (ja) * 2001-03-15 2008-07-31 Robert Bosch Gmbh 複数のバスのグローバルタイムの同期化方法と装置,および係る方法と装置に対応するバスシステム
US8145486B2 (en) 2007-01-17 2012-03-27 Kabushiki Kaisha Toshiba Indexing apparatus, indexing method, and computer program product
US8200061B2 (en) 2007-09-12 2012-06-12 Kabushiki Kaisha Toshiba Signal processing apparatus and method thereof

Also Published As

Publication number Publication date
JP2921059B2 (ja) 1999-07-19

Similar Documents

Publication Publication Date Title
Huang et al. Microsoft Windows highly intelligent speech recognizer: Whisper
JP3114468B2 (ja) 音声認識方法
JP3434838B2 (ja) ワードスポッティング法
US20220343895A1 (en) User-defined keyword spotting
US20060009965A1 (en) Method and apparatus for distribution-based language model adaptation
JP2000029495A (ja) ニュ―ラルネットワ―クとマルコフモデル認識技術を用いた音声認識の方法及び装置
RU2393549C2 (ru) Способ и устройство для распознавания речи
JPH0876785A (ja) 音声認識装置
JPH04362699A (ja) 音声認識方法及び装置
TW202129628A (zh) 細粒度解碼之語音辨識系統
Boite et al. A new approach towards keyword spotting.
JP2002358097A (ja) 音声認識装置
JP3876703B2 (ja) 音声認識のための話者学習装置及び方法
JP2996019B2 (ja) 音声認識装置
JPH0484197A (ja) 連続音声認識装置
JP3039634B2 (ja) 音声認識装置
JPH01204099A (ja) 音声認識装置
JP4391179B2 (ja) 話者認識システム及び方法
JPH07230293A (ja) 音声認識装置
JP4236502B2 (ja) 音声認識装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JP3357752B2 (ja) パターンマッチング装置
JP3285047B2 (ja) 不特定話者用音声認識装置
JPS6147999A (ja) 音声認識装置
JP3291073B2 (ja) 音声認識方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees