JPH09106296A - 音声認識装置及び方法 - Google Patents

音声認識装置及び方法

Info

Publication number
JPH09106296A
JPH09106296A JP8201536A JP20153696A JPH09106296A JP H09106296 A JPH09106296 A JP H09106296A JP 8201536 A JP8201536 A JP 8201536A JP 20153696 A JP20153696 A JP 20153696A JP H09106296 A JPH09106296 A JP H09106296A
Authority
JP
Japan
Prior art keywords
recognition
word
voice
speech
recognizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8201536A
Other languages
English (en)
Inventor
Paul Wesley Cohrs
ウェスレイ コーズ ポール
Mitra P Deldar
ピー.デルダー ミトラ
Donald Marion Keen
マリオン キーン ドナルド
Ellen Anne Keen
アン キーン エレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH09106296A publication Critical patent/JPH09106296A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 音声認識装置及び方法の改善。 【解決手段】 電気通信装置10が、音声語に基づいて
少なくとも1個の語を含む句を認識するための音声認識
装置14と、格納された複数の認識基準部類のうちの1
個の認識基準部類から少なくとも1個の認識基準を選択
するための選択モジュール26と、ここで前記格納され
た認識基準部類の各々は、与えられた音声語を認識する
対応確率に連関し、選択モジュールに応動して、最も近
接した一致状態にある音声モデルに対応する類似性測定
基準が選択された認識基準を満足するかどうかを定める
ための比較モジュール及び選択された認識基準が満足さ
れる場合に音声語を最も近接した一致状態にある音声モ
デルに対応する句として認識するための認識モジュール
を内蔵するディジタル信号処理装置30とからなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識の分野に
関し、例えば、連続音声におけるコマンドの検出に関す
る。
【0002】
【従来の技術】人の音声(ボイス)に応動するコマンド
検出システムは、広範囲の消費者製品にとってきわめて
望ましいシステムである。例えば電気通信装置におい
て、開閉、送受信、音量調整、押しボタンダイヤル操
作、音声認識装置の調整、及び留守番電話応答装置機能
の実行のような一般的な動作は、可聴周波(オーディ
オ)入力チャネルをモニタして、「話者から音声で発出
される語」(音声語)のうちの、特定のコマンドを意味
する音声語(コマンド語)が入力に現れた場合に適切な
措置をとることによって、実行される。
【0003】システムが認識すべき各コマンドについ
て、例えば技術的に周知の、テンプレートすなわち「隠
されたマルコフモデル」(HMMモデル)のような統計
的モデルが設けられる。この統計的モデルによって、あ
る与えられた入力セグメントがコマンド音声語を含む可
能性(尤(ゆう)度)が定義される。
【0004】従来のコマンド検出システムはその動作中
に、現観察対象の入力におけるコマンド語の自己識別性
(アイデンティティ)及び所在位置についての推量又は
仮説を連続的に生成する。各仮説は、それぞれのコマン
ドモデルに対して点検され、それぞれの「ゆう度」につ
いての得点が生成される。得点は、例えば従来のビタビ
(Viterbi)採点法によって決定される。もし得
点がしきい値Tを超える場合、仮説は容認されたものと
考えられ、これに連関する措置が実行される。そうでな
い場合には、この仮説は拒否される。
【0005】正しい仮説又は正しくない仮説についての
得点の確率分布は、話者、変換器、及び音響的環境を含
む種々の関与部分に依存する。固定のしきい値Tは通
常、最大数の使用者に対して、予期される動作状態の全
範囲にわたって、正しくない警告の率を受容可能な低さ
に確保するのに十分な高さに設定される。残念ながら、
ユーザの音声特性及び周囲条件が広範に変動するため、
選択されたしきい値が或るユーザに対してはよく機能
し、別のユーザに対してはそれほどよく機能しないこと
が一般的である。
【0006】
【発明が解決しようとする課題】しきい値を超える確率
が常に低いユーザは、システムから無視される。ユーザ
が頻繁に拒否される問題に対処する1つの手法は、しき
い値のレベルを下げることである。しかし、しきい値の
セット値が低すぎると、結果として平均的ユーザに対し
て、正しくないポジティブ仮説の数が受容不可能なほど
高くなる。
【0007】
【課題を解決するための手段】本発明によれば、従来の
技術における上記の欠点が、種々の用途のうちで、コマ
ンドの検出及び孤立した語の検出に適した可変認識基準
音声認識手法によって回避される。
【0008】複数の認識基準部類又は複数の認識基準の
セットのうちから1個の認識基準又は1個の認識基準の
セットがユーザによって手動で選択される。音声語と1
個以上の音声モデルとの比較の各々に対する類似性測定
基準を定めるために、音声語が1個以上の音声モデルと
比較される。
【0009】これら1個以上の類似性測定基準に基づい
て、音声語に最も近接した一致状態にある音声モデルが
決定される。音声語に最も近接した一致状態にある音声
に対応する類似性測定基準が分析されて、この類似性測
定基準が、選択された認識基準を満足するかどうかが定
められる。
【0010】認識基準の或るものは認識しきい値を増加
させ、別の或るものは認識しきい値を減少させる。本発
明の一実施例によれば、本発明の音声認識システム及び
方法を用いたデバイスのユーザは、音声語に適用される
認識基準のセットの選択能力を与えられる。例えば、選
択手段は機能オプション又は切り換えの設定についての
選択を含む。認識基準のセットの選択は、ユーザ、コマ
ンド、及びコマンドファミリの個々について、又はこれ
らの組み合わせについて行われる。
【0011】本発明の新規性についての種々の特徴を、
本発明の開示の一部を構成する特許請求の範囲に示す。
本発明及びその動作の利点、並びにその使用目的につい
てのよりよい理解を得るために、以下に本発明のいくつ
かの実施例について図面を参照して説明する。
【0012】
【発明の実施の形態】説明を分かりやすくするために、
本発明の実施例においては、個々別々の機能ブロック
(プロセッサ、と名付ける機能ブロックを含む)から構
成されるものとして述べる。これらの機能ブロックによ
って表される機能は、ソフトウエアを実行できる能力を
有するハードウエアを含むがこれに限られない共用又は
専用のハードウエアを用いて実現される。
【0013】例として図1に示す複数のプロセッサの機
能は、例えばディジタル信号処理装置(DSP)のよう
な、単一の共用プロセッサとして実現される。しかし、
本説明で用いる用語「プロセッサ」は、ソフトウエアを
実行できる能力を有するハードウエアだけを意味するも
のではない。
【0014】図1は、本発明の一実施例で、音声認識機
能を用いる留守番電話応答デバイスに関するものであ
る。しかし、本発明は、音声により操作される制御イン
タフェース機能が望まれるようなどのデバイスにも同等
に適用可能である。
【0015】例えば、本発明に基づく音声認識について
の選択可能な多しきい値認識基準を用いる手法は、従来
の家庭及びビジネス電話機、コードレス及びセルラ(携
帯)電話機、個人用データ編成機、ファクシミリ装置、
パーソナルコンピュータのようなコンピュータ、並びに
コンピュータ端末の制御にまで拡張することが容易であ
る。
【0016】いかなる場合でも、図1に示すように、電
気通信装置としてのデバイス10は、ユーザからの入力
音声を受信するマイクロホン12と、音声認識システム
14と、デバイス10の種々の機能を実行する構成要素
の動作を指揮するためのデバイス制御プロセッサ16と
を有する。
【0017】図示の実施例においては、デバイス10は
留守番電話応答装置として構成されており、これらの構
成要素は、オーディオプロセッサ18と、スピーカ20
と、メッセージ記憶装置22と、電話回線(図示しな
い)を介して電話発信側当事者(呼者)との間でオーデ
ィオ信号の送受を行うための回線インタフェース24と
を有する。
【0018】オーディオプロセッサ18は、技術的には
従来のもので、デバイス制御プロセッサ16の制御の下
に種々の機能を実行する。例えば、オーディオプロセッ
サ18は、マイクロホン12及び回線インタフェース2
4からオーディオ入力信号を受信する。これらの信号は
各々、特定の電話システム要件の要求に応じて処理さ
れ、アナログ又はディジタルのうちの適切なフォーマッ
トでメッセージ記憶装置22に格納される。
【0019】オーディオプロセッサ18は更に、例えば
出メッセージを表すオーディオ出力信号又は呼者から受
信されたメッセージを、回線インタフェース24又はス
ピーカ20へそれぞれ送る。更に、オーディオプロセッ
サ18は、例えばデバイス制御プロセッサ16から受信
された音声プロンプトのようなメッセージを、オーディ
オ信号に符号化してスピーカ20へ送る。
【0020】デバイス制御プロセッサ16も又、従来の
設計のものである。上記のように、デバイス制御プロセ
ッサ16は、電話についての呼処理と、デバイスすなわ
ち留守電話応答装置10の全体的動作とを制御する。デ
バイス制御プロセッサ16が、音声認識システム14及
びオーディオプロセッサ18から入力を受信し、音声認
識システム14及びオーディオプロセッサ18に対して
制御命令を発する。
【0021】デバイス制御プロセッサ16は又、認識基
準選択スイッチ26から入力を受信する。認識基準選択
スイッチ26が、後に更に詳しく述べる仕方で、ユーザ
による多数の認識基準のうちからの認識基準の選択を可
能にして、音声認識システム14の性能を改善する。デ
バイス制御プロセッサ16は、ユーザによる選択の入力
に応動して、下で述べるように適切な命令を送って音声
認識システム14の動作モードを変更する。
【0022】更に図1を参照すると、音声認識システム
14が、次の構成要素を有することがわかる。
【0023】すなわち、これらの構成要素は、マイクロ
ホン12によって拾われたオーディオ信号をディジタル
サンプル(標本)ストリームに変換するための、アナロ
グからディジタルへの(アナログ/ディジタル)変換器
(A/D変換器)28と、A/D変換器28によって生
成されたディジタル信号標本を処理する、AT&TDS
P16Aのようなディジタル信号処理装置30とからな
る。
【0024】これらの構成要素は更にはディジタル信号
処理装置30によって実行されるプログラム命令を内蔵
するROM32と、仮の計算結果が格納されるRAM3
4と、「隠されたマルコフモデル」(HMM)パラメー
タメモリ36とからなる。
【0025】HMMパラメータメモリ36は、例えばE
EPROM、ROM、フラッシュRAM、電池バックア
ップ付きのRAM、等のような不揮発性メモリで、本実
施例においては、認識すべき句(フレーズ)についての
少なくとも2個の「隠されたマルコフモデル」(HM
M)パラメータセットを内蔵する。当業者であればすぐ
に分かるように、1個以上のデバイス28、30、3
2、34、及び36は物理的に、同じ電子チップ上に位
置する。
【0026】音声認識システム14が、デバイス制御プ
ロセッサ16からの、ユーザによって発動されたデバイ
ス制御動作で現在未決のものがないことを示す信号によ
って、コマンド検出モードに置かれる。
【0027】このモードにおいて、音声認識システム1
4が、HMMパラメータメモリ36に格納された1個以
上の「隠されたマルコフモデル」(HMM)パラメータ
セットに対応するコマンド句が存在するかどうかについ
て、A/D変換器28から入来する音声語を点検する。
【0028】言い換えれば、コマンド検出モードにおい
て、音声認識システム14が、例えば「メッセージ再
生」、「出メッセージを記録する」、「次のメッセー
ジ」、「巻き戻し」、等のコマンド句に対応するHMM
パラメータメモリ36内のHMMパラメータセットを用
いる。もちろん当業者には、HMMモデルが、用いられ
るモデルの単なる例示に過ぎないこと、又適したモデル
ならどれでも利用できることがすぐに理解されよう。
【0029】もしこのようなコマンド句の存在が音声認
識システム14によって確認された場合、ユーザからの
音声語がコマンドとして受け入れられる。そうでない場
合には、音声語は拒否される。もし仮説が受け入れられ
た場合、特定のコマンド句が検出されたことを示す信号
が音声認識システム14からデバイス制御プロセッサ1
6へ送られる。
【0030】それからデバイス制御プロセッサ16が、
このコマンドに連関する動作を発動する。もし音声語が
拒否された場合、デバイス制御プロセッサ16へはメッ
セージは何も送られない。受け入れられたコマンドに応
動して行われるデバイス制御プロセッサ16の動作は、
従来の技術範囲内の動作である。
【0031】次に図2に、音声認識システム14のディ
ジタル信号処理装置30によって行われる処理のブロッ
ク流れ図を示す。各ブロックは、ROM32に格納され
ているプログラムのサブルーチンとして一般に実現され
る個々の処理機能を表す。音声の認識に係わる4個の基
礎ステップとして、特徴抽出、時間測定、パターン類似
性測定、及び決断戦略のステップがある。現音声認識シ
ステムにおいては、種々の手法を用いてこれらの基礎ス
テップが実行される。各手法には、それぞれの性能とコ
ストとの組み合わせとしての特徴がある。
【0032】一般的な音声認識戦略は、入来する音声デ
ータを連続的に「走査」し、動的プログラミングを行
い、話された音声語と格納されている参考パターンとの
間の類似性測定値、すなわち「距離」を計算し、音声語
が認識されたと宣言するに十分なほどに、類似性測定値
が予想値に最も近接した一致状態にあるかどうかを定め
ることである。
【0033】更に図2を参照すると、A/D変換器28
によって供給される音声サンプルが従来の音声特徴抽出
器40によって処理されて、一般に100〜200ベク
トル/秒のレートで音声特徴ベクトルのストリームが生
成されることが分かる。音声の認識に有用な時間変動パ
ラメータによって音声信号を表すために種々の信号処理
手法が存在する。
【0034】適切な信号処理変形の例として、直接スペ
クトル測定(帯域フィルタ群又は分散フーリエ変形によ
って定まる)、ケプストラム、及び線形予測モデルの適
切なパラメータセットがある(文献(J.D.Markel and
A.H.Gray,Jr., "Linear Prediction of Speech",Spring
er-Verlag, New York,(1976)参照)。
【0035】図2の実施例において、各ベクトルは、音
声エネルギー、データ音声エネルギー、ケプストラム係
数、及びデルタケプストラム係数に関する10〜30個
の音声特徴構成要素を含む。特徴ベクトルのストリーム
は、音声に内蔵されている音声語の始点及び終点を定め
る従来の終点検出器42によって処理される。終点検出
器42の出力は、音声ベクトルの有限シーケンスからな
り、ベクトルの各シーケンスは単一の音声語に対応す
る。
【0036】特徴抽出/終点検出の後、次の基本認識ス
テップは、格納されている参考値と、音声語から抽出さ
れた時間正規化されたパラメータとの間の類似性測定値
の計算である。この目的のため、仮説設定器43が終点
検出器42によって出力された音声ベクトルのシーケン
スを受信して、これらシーケンスの言語的内容に関して
仮説を生成する。
【0037】この仮説生成の際、仮説設定器43は句に
対して、HMMモデルとHMM背景モデルとを用いる。
これらHMMモデルのパラメータは句モデルパラメータ
ブロック44に示すように格納され、HMM背景モデル
のパラメータは背景モデルパラメータブロック45に示
すように格納されている。用語「背景」は、無音、騒
音、又はその他コマンド句の1つではない音声を意味す
る。物理的には、これらのモデルは全て図1のHMMパ
ラメータメモリに位置する。
【0038】仮説設定器43は2種類の仮説を生成す
る。第1の種類の仮説(背景仮説と称する)は、「音声
特徴ベクトルシーケンスが背景だけからなる」という仮
説である。第2の種類の仮説(句仮説と称する)は、
「音声特徴ベクトルシーケンスがコマンド語からなり、
おそらくその後又は前に背景が付く」という仮説であ
る。
【0039】これら2種類の仮説の各々について仮説設
定器43が、ビタビ復号化又は採点手順のような従来
の、動的プログラミング最適化手順を適用する。この手
順によって、その種類についての最も可能性のある仮説
と、対応するその仮説の推定された可能性(ゆう度)の
数値(又は得点値)とが定められる。
【0040】加えて、上記の動的プログラミング最適化
手順は、句仮説についていくつかの追加パラメータ(一
致パラメータと称する)を生成する。第1の一致パラメ
ータは、最も可能性のある句仮説についての予期される
「句の長さ」(句長)と、最も可能性のある句仮説に対
応する音声語について仮説設定器によって定められる句
長との間の差を形成することによって生成される。
【0041】第2の一致パラメータは、最も可能性のあ
る仮説の予期される「HMM状態の長さ」(HMM状態
長)と、仮説設定器43によって定められるHMM状態
長との間の差の絶対値の平均を形成することによって生
成される。第3の一致パラメータは、最良の句仮説と2
番目に最良の句仮説との、最も可能性のある仮説につい
ての可能性(ゆう度)得点値の差を形成することによっ
て生成される。
【0042】当業者にすぐに分かるように、一致パラメ
ータの生成に用いられるデータは、例えばHMM及びビ
タビ採点法を用いる従来の音声認識プロセスの一部とし
て入手可能である。
【0043】仮説設定器43の出力は、最も可能性のあ
る句仮説と、これに対応する得点、すなわち句仮説ゆう
度推定値の対数と背景仮説ゆう度推定値の対数との差
と、一致パラメータとからなる。検証器46が仮説設定
器43の出力を受信して、一致パラメータの各々が、対
応する予め定められた範囲内にあるかどうかを点検す
る。
【0044】検証器46は、第1の一致パラメータが例
えば−1/2〜1の範囲内にあるかどうかを点検し、第
2の一致パラメータが例えば100msの範囲内にある
かどうかを点検し、又第3の一致パラメータが最良の仮
説得点の10%以内にあるかどうかを点検する(これら
の範囲は特定の動作環境に合わせて変えられる)。
【0045】もし一致パラメータが予め定められた範囲
内にある場合、検証器46はその仮説とその仮説の得点
とを決定器47に送る。もし一致パラメータが予め定め
られた範囲内にない場合には、その仮説は拒否される。
【0046】決定器47が、最も可能性のある句仮説を
受け入れるか又は拒否するかを定める。もしその句仮説
が決定器47によって受け入れられた場合、その仮説は
図1のデバイス制御プロセッサ16に報告される。決定
器47が決定を行う方法を図3のブロック流れ図によっ
て説明する。
【0047】図3の流れ図は、仮説を設けられたコマン
ド句と、対応するその得点とが受信されたブロック50
から始まる。本発明の簡単化した一実施例によれば、プ
ロセスはブロック52に進み、ここでしきい値Tがメモ
リ(RAM34又はROM32)に格納されている複数
の固定値T1、T2、T3、T4、及びT5のうちの1
つに設定される。
【0048】T3は、通常状態において平均的ユーザに
ついてよく機能するように従来の仕方で選択されたデフ
ォルト値である。T2及びT1の値は、正しくないポジ
ティブ警告の数が増加するという潜在的な不利益を代償
として、ポジティブ認識の「ゆう度」を増加させる(デ
フォルト設定に比べてそれぞれ例えば確率を20%及び
40%高くする)ように選択される。
【0049】一方、T4及びT5の値は、検出できない
コマンドの数が増加するという潜在的な不利益を代償と
して、ポジティブ認識の「ゆう度」を減少させる(デフ
ォルト設定に比べてそれぞれ例えば確率を−15%及び
−30%低くする)ように選択される。
【0050】選択された認識基準に対応する値が、Ts
に設定され、得られた仮説得点と比較される(ブロック
54)。もし得点がTsを超える場合、仮説は受け入れ
られる(ブロック56)。もし得点がTsよりも低い場
合には、仮説は拒否される(ブロック58)。それか
ら、ブロック60に示すように、受け入れ/拒否の決定
が出力され、デバイス制御プロセッサによって従来の仕
方で用いられる。
【0051】本発明の更に高度な内容の実施例において
は、ブロック52で示す動作中に、複数の認識基準セッ
トのうちからしきい値のセット又は認識基準のセットが
選択される。このような基準セットを用いることによっ
て、(実際に選択される基準セットによって左右される
が)コマンドが認識される度合いが、デフォルトの基準
セットに比べて多少増加する。
【0052】この点に関して、HMM語認識が、格納さ
れている語モデルの各々について未知の入力語パターン
を生成する可能性(ゆう度)を計算することによって達
成されることを注記したい。この場合、この入力語は、
ゆう度が最大であるモデルとして認識される。
【0053】モデルの精度は、音声語の終点の位置、音
声語の長さ及び各状態におけるフレームの数のような基
準値に影響される。これらの基準は各々、ユーザによる
選択の入力に基づいて個別に調整される。
【0054】この調整は、平均的ユーザにとってはより
頻繁に正しくない認識結果がでるという不利益点を代償
にして、認識確率(ゆう度)が増加するように、又より
少数の一部のユーザにとってはより高い精度で、認識確
率が減少するように、行われる。各基準についてのデフ
ォルト値は、通常の環境条件において平均的ユーザに最
良の結果をもたらすように従来の仕方で最適化されて、
ユーザによる選択の入力がない場合に用いられる。
【0055】追加例として、電気通信装置がコードレス
電話機として構成される場合には、音声認識システム1
4が、ユーザがダイヤル操作手順を発動したことを示す
デバイス制御プロセッサ16からの信号によって、コマ
ンド検索モードからダイヤル操作モードに切り換えられ
る。このダイヤル操作手順は、キーパッドボタンを押す
か又はコマンド語(例えば「ダイヤル」)を発語するこ
とによって発動され、これによってダイヤル動作が呼び
出される。
【0056】このモードにおいては、音声認識システム
14が、上記のコマンド検出モードにおけるコマンド句
の代わりに、名前からなる句(名前句)のHMMモデル
を用いる。この場合、各名前句は対応する電話番号に連
関する。このような名前句HMMとそれに連関する電話
番号とがメモリ(RAM)34に格納される。
【0057】もし名前句の音声語が音声認識システム1
4によって受け入れられた場合、名前句の認識が受け入
れられたことを示すメッセージがデバイス制御プロセッ
サ16に送られる。するとデバイス制御プロセッサ16
が、認識された名前句に連関する電話番号をダイヤルし
て名前が正しく認識されたことをユーザに通知する。
【0058】しかしもし音声認識システム14が音声語
を拒否した場合には、音声語が拒否されたことを示すメ
ッセージが音声認識システム14からデバイス制御プロ
セッサ16に送られる。するとデバイス制御プロセッサ
16が、音声語の繰り返しを促すプロンプトをユーザに
流す。これらの通知とプロンプトとは一般に、それぞれ
に特徴的なトーンとそれに続く適切な音声メッセージの
可聴再生との組み合わせによって行われる。
【0059】以上の説明は、本発明の一実施例に関する
もので、この技術分野の当業者であれば、本発明の種々
の変形例を考え得るが、それらはいずれも本発明の技術
的範囲に包含される。尚、特許請求の範囲に記載した参
照番号は発明の容易な理解のためで、その技術的範囲を
制限するよう解釈されるべきではない。
【0060】
【発明の効果】以上述べたごとく本発明によれば、音声
認識のための本発明の方法及び装置において、複数の認
識基準部類から1個の認識基準又は1個の認識基準のセ
ットがユーザによって手動で選択されるように構成した
ので、ユーザは、より高い音声認識精度を有する、ユー
ザにとって最良の結果が得られる認識基準部類を選択す
ることができ、電気通信システムにおける音声認識装置
の能力が改善される。
【図面の簡単な説明】
【図1】本発明に基づく、ユーザによる選択が可能な多
基準の音声認識を利用するために構成された例示デバイ
スのブロック図である。
【図2】図1の例示デバイスについて制御インタフェー
ス処理を行わせるための音声認識の実行状態を示すブロ
ック流れ図である。
【図3】本発明の一実施例に基づき認識基準のセットが
ユーザによって手動で選択されるプロセスを示すブロッ
ク流れ図である。
【符号の説明】
10 電気通信装置としてのデバイス(留守番電話応答
装置) 12 マイクロホン 14 音声認識システム 16 デバイス制御プロセッサ 18 オーディオプロセッサ 20 スピーカ 22 メッセージ記憶装置 24 回線インタフェース 26 認識基準選択スイッチ 28 アナログ/ディジタル変換器(A/D変換器) 30 ディジタル信号処理装置 32 ROM 34 RAM 36 「隠されたマルコフモデル」(HMM)パラメー
タメモリ 40 音声特徴抽出器 42 終点検出器 43 仮説設定器 44 句モデルパラメータブロック 45 背景モデルパラメータブロック 46 検証器 47 決定器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ミトラ ピー.デルダー アメリカ合衆国,46256 インディアナ, ハミルトン,インディアナポリス,リッジ サイド ロード 12324 (72)発明者 ドナルド マリオン キーン アメリカ合衆国,46240 インディアナ, マリオン,インディアナポリス,シークォ イア コート 8012 (72)発明者 エレン アン キーン アメリカ合衆国,46240 インディアナ, マリオン,インディアナポリス,シークォ イア コート 8012

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 音声語に基づいて、少なくとも1個の語
    を含む句を認識するための音声認識装置14であって、 該音声認識装置が、 格納された複数の認識基準部類のうちの1個の認識基準
    部類から少なくとも1個の認識基準を選択するための選
    択モジュール26と、ここで前記格納された認識基準部
    類の各々は、与えられた音声語を認識する対応確率に連
    関し、 前記選択モジュールに応動して、最も近接した一致状態
    にある音声モデルに対応する類似性測定基準が前記選択
    された認識基準を満足するかどうかを定めるための比較
    モジュール43と、 前記選択された認識基準が満足される場合に、前記音声
    語を、前記最も近接した一致状態にある音声モデルに対
    応する句として認識するための認識モジュール47と、
    からなることを特徴とする、音声認識装置。
  2. 【請求項2】 音声モデルが1個以上の予め定められた
    語を表すことを特徴とする請求項1の装置。
  3. 【請求項3】 予め定められた語が利用デバイスに対す
    るコマンド語からなることを特徴とする請求項2の装
    置。
  4. 【請求項4】 前記装置が更に、利用デバイスからなる
    ことを特徴とする請求項2の装置。
  5. 【請求項5】 前記利用デバイスが電話機であることを
    特徴とする請求項4の装置。
  6. 【請求項6】 前記利用デバイスが留守番電話応答機で
    あることを特徴とする請求項4の装置。
  7. 【請求項7】 前記認識基準の各々がしきい値からな
    り、 前記比較モジュールが、前記最も近接した一致状態にあ
    る音声モデルに対応する類似性測定基準を、選択された
    認識基準のセットと比較するように作動することを特徴
    とする請求項2の装置。
  8. 【請求項8】 前記格納された複数の認識基準部類が、
    通常状態において平均的ユーザについて最適化されたデ
    フォルト部類からなり、少なくとも1個の認識基準部類
    が前記デフォルト部類よりも大きい認識確率を有し、少
    なくとも1個の認識基準部類が前記デフォルト部類より
    も小さい認識確率を有し、 前記選択モジュールをユーザが操作することによって前
    記認識基準部類のうちの1個の選択が行われることを特
    徴とする請求項7の装置。
  9. 【請求項9】 マイクロホン12を有する電気通信装置
    10であって、 該電気通信装置が、 音声語に基づいて、少なくとも1個の語を含む句を認識
    するための音声認識装置14からなり、 該音声認識装置が、 格納された複数の認識基準部類のうちの1個の認識基準
    部類から少なくとも1個の認識基準を選択するための選
    択モジュール26と、ここで前記格納された認識基準部
    類の各々は、与えられた音声語を認識する対応確率に連
    関し、 前記選択モジュールに応動して、最も近接した一致状態
    にある音声モデルに対応する類似性測定基準が前記選択
    された認識基準を満足するかどうかを定めるための比較
    モジュール43と、 前記音声認識装置による音声語の認識に応動するデバイ
    ス制御回路16と、からなることを特徴とする電気通信
    装置。
  10. 【請求項10】 前記デバイス制御回路16が、音声語
    の認識に対応して電話機を作動させる電話回路であるこ
    とを特徴とする請求項9の装置。
  11. 【請求項11】 前記装置が更に、 ラジオトランシーバと、 前記電話回路によって供給される制御信号に応動してマ
    イクロホンと電話回路とを前記ラジオトランシーバにイ
    ンタフェースするためのオーディオプロセッサと、から
    なることを特徴とする請求項10の装置。
  12. 【請求項12】 前記デバイス制御回路が、音声語の認
    識に応動して、格納されたメッセージを可聴状態で再生
    するための留守番電話応答装置であることを特徴とする
    請求項9の装置。
  13. 【請求項13】 音声語に基づいて、少なくとも1個の
    語を含む句を認識する音声認識方法であって、 前記音声語と1個以上の音声モデルとの比較の各々に対
    する類似性測定基準を定めるために、前記音声語を1個
    以上の音声モデルと比較するステップと、 第1の決定ステップとして、前記比較ステップにおいて
    得られた前記1個以上の類似性測定基準に基づいて、ど
    の音声モデルが前記音声語に最も近接した一致状態にあ
    るかを決定するステップと、 格納された複数の認識基準部類のうちの1個の認識基準
    部類から少なくとも1個の認識基準を選択するステップ
    と、ここで前記格納された認識基準部類の各々は、与え
    られた音声語を認識する対応確率に連関し、 第2の決定ステップとして、前記音声語に最も近接した
    一致状態にある音声に対応する類似性測定基準が前記選
    択された認識基準を満足するかどうかを定めるステップ
    と、 前記選択された認識基準が満足される場合に、前記音声
    語を、前記最も近接した一致状態にある音声モデルに対
    応する句として認識するステップと、からなることを特
    徴とする音声認識方法。
JP8201536A 1995-07-31 1996-07-31 音声認識装置及び方法 Pending JPH09106296A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US50968195A 1995-07-31 1995-07-31
US509681 1995-07-31

Publications (1)

Publication Number Publication Date
JPH09106296A true JPH09106296A (ja) 1997-04-22

Family

ID=24027660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8201536A Pending JPH09106296A (ja) 1995-07-31 1996-07-31 音声認識装置及び方法

Country Status (6)

Country Link
US (1) US5960393A (ja)
EP (1) EP0757342B1 (ja)
JP (1) JPH09106296A (ja)
CA (1) CA2180392C (ja)
DE (1) DE69614789T2 (ja)
TW (1) TW299437B (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
US7099855B1 (en) * 2000-01-13 2006-08-29 International Business Machines Corporation System and method for electronic communication management
US7389230B1 (en) 2003-04-22 2008-06-17 International Business Machines Corporation System and method for classification of voice signals
US7644057B2 (en) 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
US9584665B2 (en) 2000-06-21 2017-02-28 International Business Machines Corporation System and method for optimizing timing of responses to customer communications
US9699129B1 (en) 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
US10055501B2 (en) 2003-05-06 2018-08-21 International Business Machines Corporation Web-based customer service interface

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3761937B2 (ja) * 1995-09-18 2006-03-29 キヤノン株式会社 パターン認識方法及び装置及びコンピュータ制御装置
US6167252A (en) * 1996-08-27 2000-12-26 Nec Electronics, Inc. Security for a mobile or personal communications device having an identification code
DE19635754A1 (de) * 1996-09-03 1998-03-05 Siemens Ag Sprachverarbeitungssystem und Verfahren zur Sprachverarbeitung
KR19990087167A (ko) * 1996-12-24 1999-12-15 롤페스 요하네스 게라투스 알베르투스 음성 인식 시스템 훈련 방법 및 그 방법을실행하는 장치,특히, 휴대용 전화 장치
FI972723A0 (fi) * 1997-06-24 1997-06-24 Nokia Mobile Phones Ltd Mobila kommunikationsanordningar
GB9822931D0 (en) * 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
US6374221B1 (en) * 1999-06-22 2002-04-16 Lucent Technologies Inc. Automatic retraining of a speech recognizer while using reliable transcripts
CN1141698C (zh) * 1999-10-29 2004-03-10 松下电器产业株式会社 对输入语音进行语音识别的音程标准化装置
JP4520619B2 (ja) * 1999-10-29 2010-08-11 パナソニック株式会社 音声認識入力音声の音程正規化装置
US6594630B1 (en) * 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
FR2802690A1 (fr) * 1999-12-17 2001-06-22 Thomson Multimedia Sa Procede et dispositif de reconnaissance vocale, dispositif de telecommande associe
US8290768B1 (en) 2000-06-21 2012-10-16 International Business Machines Corporation System and method for determining a set of attributes based on content of communications
KR100349656B1 (ko) * 2000-12-20 2002-08-24 한국전자통신연구원 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JP2003108187A (ja) * 2001-09-28 2003-04-11 Fujitsu Ltd 類似性評価方法及び類似性評価プログラム
US7013276B2 (en) * 2001-10-05 2006-03-14 Comverse, Inc. Method of assessing degree of acoustic confusability, and system therefor
EP1575031A3 (en) * 2002-05-15 2010-08-11 Pioneer Corporation Voice recognition apparatus
KR20040044257A (ko) * 2002-11-20 2004-05-28 (주)지에스텔레텍 화자인식을 이용한 통신단말기용 보안방법 및 그 장치
US8495002B2 (en) 2003-05-06 2013-07-23 International Business Machines Corporation Software tool for training and testing a knowledge base
US7986974B2 (en) * 2003-05-23 2011-07-26 General Motors Llc Context specific speaker adaptation user interface
GB0327416D0 (en) * 2003-11-26 2003-12-31 Ibm Directory dialler name recognition
AT414283B (de) * 2003-12-16 2006-11-15 Siemens Ag Oesterreich Verfahren zur optimierung von spracherkennungsprozessen
US7065343B2 (en) * 2004-01-30 2006-06-20 Lucent Technologies Inc. Method and system for synchronization of network-based voicemail and multimedia mail
US7580837B2 (en) * 2004-08-12 2009-08-25 At&T Intellectual Property I, L.P. System and method for targeted tuning module of a speech recognition system
US7669614B2 (en) * 2006-08-21 2010-03-02 Dan Cohen Systems and methods for installation inspection in pipeline rehabilitation
US20090063148A1 (en) * 2007-03-01 2009-03-05 Christopher Nelson Straut Calibration of word spots system, method, and computer program product
US8725512B2 (en) * 2007-03-13 2014-05-13 Nuance Communications, Inc. Method and system having hypothesis type variable thresholds
US20120015731A1 (en) * 2009-03-18 2012-01-19 Inxile Entertainment, Inc. Gaming voice reaction system
CN110160633B (zh) * 2019-04-30 2021-10-08 百度在线网络技术(北京)有限公司 一种多声音区域的音频隔离度检测方法及装置
KR20210017392A (ko) * 2019-08-08 2021-02-17 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5834498A (ja) * 1981-08-26 1983-02-28 株式会社東芝 音声認識方式
JPS5965899A (ja) * 1982-10-08 1984-04-14 トヨタ自動車株式会社 車両用音声認識方式
JPS6173200A (ja) * 1984-09-18 1986-04-15 株式会社リコー 音声認識装置
JPS6344699A (ja) * 1986-08-11 1988-02-25 日本電信電話株式会社 音声認識装置
JPS63169699A (ja) * 1987-01-07 1988-07-13 日本電信電話株式会社 音声認識装置
JPS63306499A (ja) * 1987-06-08 1988-12-14 株式会社リコー 不特定話者音声認識装置
EP0311414A2 (en) * 1987-10-08 1989-04-12 Nec Corporation Voice controlled dialer having memories for full-digit dialing for any users and abbreviated dialing for authorized users
JPH0197044A (ja) * 1987-10-08 1989-04-14 Nec Corp 音声ダイヤル装置
JPH01108837A (ja) * 1987-10-21 1989-04-26 Nec Corp 音声ダイヤル装置
JPH02135499A (ja) * 1988-11-17 1990-05-24 Oki Electric Ind Co Ltd 音声認識リジェクト閾値設定方式
JPH0567038B2 (ja) * 1985-04-16 1993-09-24 Hitachi Ltd
JPH05257493A (ja) * 1992-03-13 1993-10-08 Toshiba Corp 音声認識装置
JPH05316188A (ja) * 1992-05-12 1993-11-26 Sharp Corp コードレス電話機
JPH0653015A (ja) * 1992-07-28 1994-02-25 Toto Ltd ワンタッチ式アナログ情報入力装置および該装置に用いる可変抵抗器
JPH075890A (ja) * 1993-06-16 1995-01-10 Nippon Telegr & Teleph Corp <Ntt> 音声対話装置
JPH08235316A (ja) * 1995-02-27 1996-09-13 Fujitsu Ltd 文字認識装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4297528A (en) * 1979-09-10 1981-10-27 Interstate Electronics Corp. Training circuit for audio signal recognition computer
US4319085A (en) * 1980-04-08 1982-03-09 Threshold Technology Inc. Speech recognition apparatus and method
US4394538A (en) * 1981-03-04 1983-07-19 Threshold Technology, Inc. Speech recognition system and method
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore
US4870686A (en) * 1987-10-19 1989-09-26 Motorola, Inc. Method for entering digit sequences by voice command
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
US5187735A (en) * 1990-05-01 1993-02-16 Tele Guia Talking Yellow Pages, Inc. Integrated voice-mail based voice and information processing system
US5365574A (en) * 1990-05-15 1994-11-15 Vcs Industries, Inc. Telephone network voice recognition and verification using selectively-adjustable signal thresholds
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US5199077A (en) * 1991-09-19 1993-03-30 Xerox Corporation Wordspotting for voice editing and indexing
GB9223066D0 (en) * 1992-11-04 1992-12-16 Secr Defence Children's speech training aid
TW323364B (ja) * 1993-11-24 1997-12-21 At & T Corp
US5684924A (en) * 1995-05-19 1997-11-04 Kurzweil Applied Intelligence, Inc. User adaptable speech recognition system
US5842161A (en) * 1996-06-25 1998-11-24 Lucent Technologies Inc. Telecommunications instrument employing variable criteria speech recognition

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5834498A (ja) * 1981-08-26 1983-02-28 株式会社東芝 音声認識方式
JPS5965899A (ja) * 1982-10-08 1984-04-14 トヨタ自動車株式会社 車両用音声認識方式
JPS6173200A (ja) * 1984-09-18 1986-04-15 株式会社リコー 音声認識装置
JPH0567038B2 (ja) * 1985-04-16 1993-09-24 Hitachi Ltd
JPS6344699A (ja) * 1986-08-11 1988-02-25 日本電信電話株式会社 音声認識装置
JPS63169699A (ja) * 1987-01-07 1988-07-13 日本電信電話株式会社 音声認識装置
JPS63306499A (ja) * 1987-06-08 1988-12-14 株式会社リコー 不特定話者音声認識装置
EP0311414A2 (en) * 1987-10-08 1989-04-12 Nec Corporation Voice controlled dialer having memories for full-digit dialing for any users and abbreviated dialing for authorized users
JPH0197044A (ja) * 1987-10-08 1989-04-14 Nec Corp 音声ダイヤル装置
US4853953A (en) * 1987-10-08 1989-08-01 Nec Corporation Voice controlled dialer with separate memories for any users and authorized users
JPH01108837A (ja) * 1987-10-21 1989-04-26 Nec Corp 音声ダイヤル装置
JPH02135499A (ja) * 1988-11-17 1990-05-24 Oki Electric Ind Co Ltd 音声認識リジェクト閾値設定方式
JPH05257493A (ja) * 1992-03-13 1993-10-08 Toshiba Corp 音声認識装置
JPH05316188A (ja) * 1992-05-12 1993-11-26 Sharp Corp コードレス電話機
JPH0653015A (ja) * 1992-07-28 1994-02-25 Toto Ltd ワンタッチ式アナログ情報入力装置および該装置に用いる可変抵抗器
JPH075890A (ja) * 1993-06-16 1995-01-10 Nippon Telegr & Teleph Corp <Ntt> 音声対話装置
JPH08235316A (ja) * 1995-02-27 1996-09-13 Fujitsu Ltd 文字認識装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099855B1 (en) * 2000-01-13 2006-08-29 International Business Machines Corporation System and method for electronic communication management
US9584665B2 (en) 2000-06-21 2017-02-28 International Business Machines Corporation System and method for optimizing timing of responses to customer communications
US9699129B1 (en) 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
US7644057B2 (en) 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
US7389230B1 (en) 2003-04-22 2008-06-17 International Business Machines Corporation System and method for classification of voice signals
US10055501B2 (en) 2003-05-06 2018-08-21 International Business Machines Corporation Web-based customer service interface

Also Published As

Publication number Publication date
EP0757342A3 (en) 1998-06-17
DE69614789D1 (de) 2001-10-04
TW299437B (ja) 1997-03-01
CA2180392C (en) 2001-02-13
CA2180392A1 (en) 1997-02-01
DE69614789T2 (de) 2002-05-29
US5960393A (en) 1999-09-28
EP0757342B1 (en) 2001-08-29
EP0757342A2 (en) 1997-02-05

Similar Documents

Publication Publication Date Title
JPH09106296A (ja) 音声認識装置及び方法
JP3363630B2 (ja) 音声認識方法
US6324509B1 (en) Method and apparatus for accurate endpointing of speech in the presence of noise
US5842161A (en) Telecommunications instrument employing variable criteria speech recognition
US6697782B1 (en) Method in the recognition of speech and a wireless communication device to be controlled by speech
US7941313B2 (en) System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US20040199388A1 (en) Method and apparatus for verbal entry of digits or commands
US20030012347A1 (en) Method for the training or adaptation of a speech recognition device
CN1639768B (zh) 自动语音识别方法及装置
JP4643011B2 (ja) 音声認識除去方式
US7110948B1 (en) Method and a system for voice dialling
US7177806B2 (en) Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
US20030163309A1 (en) Speech dialogue system
JP3285704B2 (ja) 音声対話のための音声認識方法及び装置
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
JP2000122678A (ja) 音声認識機器制御装置
WO2002069324A1 (en) Detection of inconsistent training data in a voice recognition system
Krasinski et al. Automatic speech recognition for network call routing

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040621