JPH0556517B2 - - Google Patents

Info

Publication number
JPH0556517B2
JPH0556517B2 JP61064512A JP6451286A JPH0556517B2 JP H0556517 B2 JPH0556517 B2 JP H0556517B2 JP 61064512 A JP61064512 A JP 61064512A JP 6451286 A JP6451286 A JP 6451286A JP H0556517 B2 JPH0556517 B2 JP H0556517B2
Authority
JP
Japan
Prior art keywords
phoneme
continuous
matching
section
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61064512A
Other languages
English (en)
Other versions
JPS62220998A (ja
Inventor
Ryuichi Oka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP61064512A priority Critical patent/JPS62220998A/ja
Priority to US07/027,447 priority patent/US4975962A/en
Priority to GB8706368A priority patent/GB2188181B/en
Publication of JPS62220998A publication Critical patent/JPS62220998A/ja
Publication of JPH0556517B2 publication Critical patent/JPH0556517B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、人が発声した音声を自動的に認識
し、その認識結果を例えば活字によつて表わす等
の用途に供される音声認識装置、殊にその認識単
位が単語より小さな音素等である音声認識装置に
関する。
[従来の技術] 従来のこの種の装置における音声認識の方式と
しては、単語を認識単位として標準パターンを作
成し、それをダイナミツクプログラミング(動的
計画法、以下、DPと略称する)等を用いて、入
力パターンと整合をとることにより音声認識をす
る方法が広く用いられてきた。
[発明が解決しようとする問題点] この従来型のパターン整合方式では、標準パタ
ーンとして採用する単位が単語程度の大きなもの
であり、かつ単語の種類が百程度以下の少数であ
る場合には、高い識別率を与えてきた。しかし、
音素や音素片などのように認識単位が単語より小
さなもの(この場合、単語より短い区間で標準パ
ターンが作成される)に対しては、このパターン
整合方式は有効性を十分発揮しなかつた。この原
因は、標準パターンのパターンの長さが短いの
で、その前後の音素環境によつて種々の変形を受
ける音素の標準パターンの作成が困難であり、か
つ入力パターンとの整合も正しく行わないためで
あつた。
しかし、認識すべき単語の種類が実際には千種
類以上の多数であり、かつ連続音声でもある音声
認識系の構成のためには単語より小さな音素や音
素片を認識単位として用いなければならないこと
は明白である。
本発明は、以上の問題点に鑑み、パターン整合
方式の枠組の中で、単語より小さな音素または音
素片を認識単位とすることを可能にする音声認識
装置を提供することを目的とする。
[問題点を解決するための手段] 本目的を達成するため、本発明は音声入力を電
気信号に変換する音声入力部と、音声入力部の出
力波形を分析する分析部と、標準パターンをあら
かじめ記憶する標準パターン記憶部と、分析部で
分析された入力パターンと標準パターンとの距離
を計算し、計算結果に応じて入力音声の音素名や
単語名を含む語彙を識別する音声認識部と、音声
認識部の識別結果を外部に出力する出力部とから
成る音声認識装置において、標準パターン記憶部
が少なくとも、音素または音素片を表わす特徴パ
ラメータ系列の複数個のつながりによつて作成さ
れた標準パターンを記憶しており、音声認識部
が、標準パターンと入力パターンとの整合を連続
ダイナミツクプログラミングによる整合方式によ
つて実行し、各標準パターンについての整合値と
音素または音素片の記号列で表わされた整合履歴
を表わすパラメータとを各入力フレーム毎に有す
る連続DP値を出力する連続DP部と、整合履歴を
表わすパラメータと前記連続DP値を用いて、時
刻を同じくしている同一音素または音素片記号に
よるその時刻の同定回数を累積し、各時刻におけ
る各音素または音素片カテゴリーの累積値を最大
とするものから、その時刻の識別候補を定める部
分整合演算部とを具備したことを特徴とする。
[実施例] 以下、図面を参照して本発明の実施例を詳細に
説明する。
第1図は本発明実施例の音声認識装置の概略構
成を示す。
本図において、マイクロフオン等の音声入力部
1によつて入力された音声波形Aはアナログデジ
タル変換器、FFT(高速フエーリエ変換器)やバ
ンドパスフイルタ等から成る分析部2により分析
されて、スペクトル等の特徴パラメータ(以下、
入力パターンと称する)Bとなる。一方、パター
ンマツチングアルゴリズム連続DPを行う連続DP
部3で用いる標準パターンとして、単語より小さ
いが音素よりは大きい/vcv/や/cvc/(但し
c:子音、v:母音)程度の識別単位の標準パタ
ーンCが予め記憶部4に登録・記憶されており、
この標準パターンCと入力パターンBとを連続
DP部3によつてマツチングする。
連続DP部3によるマツチングの結果Dは部分
整合演算部5において集計・判定され、その判定
結果Eが外部のプリンタ等の出力部6へと出力さ
れる。
本実施例の音声認識系は上述のごとく連続DP
と深く関係しているので、まず連続DPについて
説明する。
連続DPの適用において入力音声の分析部2か
らの出力Bは、 {f(t,x):1≦t<∞,1≦x≦L} …(1) なる式で表現される。ここで、t=1,2,…と
し、tの間隔は分析フレーム間隔(分析の行われ
る間隔)であり、例えば8〜10msecである。ま
た、xはスペクトル等のパラメータ次数である。
すなわち、Xは例えば分析部2がバンドパス・フ
イルタであるとすると、各バンドの番号を表わ
し、Lは既述の所から通常10乃至20である。この
時、上述のf(t,x)はt時刻のバンド番号x
のパワー乃至大きさを示していることになる。
次に、記憶部4に登録・記憶され連続DPに用
いられる標準パターンを {Z(τ,x):1≦τ≦T,1≦x≦L} …(2) とする。このとき、連続DPの式は、標準パター
ンCと入力パターンBのフレーム間距離を d(t,τ)=1/LLX=1 (Q)f(t,x)−Z(τ,x)(Q) …(3) と定めるとき、累積距離p(t,τ)を与える次
の式として表現される。
P(t,1)=3・d(t,1) …(a) P(t,2)=minP(t−2,1)+2・
d(t−1,2)+d(t,2) P(t−1,1)+3・d(t,2) P(t,1)+3・d(t,2)…(b) …(c) …(d) P(t,τ)=min P(t,τ)=min (3≦τ≦Τ)P(t−2,τ−1)+2・d(t−1
,τ)+d(t,τ) P(t−1,τ−1)+3・d(t,τ) P(t−1,τ−1)+3・d(t,τ) P(t−1,τ−2)+3・d(t,τ−1)+3・d
(t,τ)…(e) …(f) …(g) ここで、P(t,τ)の初期条件としては、 P(−1,τ)=P(0,τ)=∞,(1≦τ≦Τ) で与えられる。連続DPの出力値D(t)は、 D(t)=P(t,Τ)/3・Τ …(5) として定められ、このD(t)が最適整合値を意味し
ている。
連続音声の認識において、連続DPのみを用い
る場合には、通常上式(5)のD(t)の時間的な局所的
最低値を見出し、その時刻とその最低値を与える
認識単位名を出力としてきた。この際、従来では
標準パターンを作成した認識単位の大きさは単語
程度の大きさのものが用いられてきた。しかし、
先にも述べたように、大語彙・不特定話者・連続
音声認識系を構成するには認識の基本単位を単語
より小さくする必要があるが、単語より小さな単
位の標準パターンを用いる場合に、従来DPによ
る音声認識方法では高い識別率を与えない。この
理由も先に述べたごとく、識別の基本単位が小さ
くなると、それを表わす標準パターンの長さが短
くなり、前後にある音韻のパターンによつて大き
く変化するので、標準パターンが定まらなくな
り、かつマツチングも精度よく行われないためで
ある。そのため、従来では、音素のような小さな
単位の認識を行うのに、パターンマツチング的手
法を用いることの有効性が疑われてきた。
こうした状況において、本発明を成立させる前
提として、本発明者は以下のような特別の知見を
得ることに努力した。
即ち、大きな識別単位の標準パターンは小さな
識別単位の標準パターンより調音による音韻の変
動をよく表わすことができる。これは大きな識別
単位の標準パターンの利点をであるが、大きな識
別単位をとるほど識別の判定は単位的に荒くな
る。これは、大きな識別単位をパターンマツチン
グの単位にとる場合、部分的に正しく整合してい
ると思われる部分だけを取り出すということが行
われないためである。したがつて、まず連続DP
を用いて、その連続DPによる整合は比較的大き
な識別単位で行ない、その結果の集計と判定はよ
り小さな識別単位で行なうことができれば、大き
なマツチング単位をもつことの長所を生かし、そ
の弱点(小さな識別単位を出力としないこと)を
補う理想的なマツチング方式のものになるはずで
ある。
以上の知見に基づき、発明者は以下にのべる新
しい音声認識方式である「連続DPを用いた部分
整合方式」を発見した。本発明に係る「連続DP
を用いた部分整合方式」の概念説明図を第2図に
示す。
第2図においてのは連続DPのための標準パ
ターンの一例であり、本発明の方式では音素(ま
たは音素片)のカテゴリーを有するパターンが複
数個連結したもので構成される。第2図では標準
パターンとして3個の音素片A,B,Cで構成さ
れるものが示してある。この例のように3つの音
素片から連続DPの標準パターン {Z(τ,x):1≦τ≦Τ,1≦x≦L} が構成されているときは、Z(τ,x)は Z(τ,x)=z1(τ,x) 1≦τ≦τ1のとき z2(τ−τ1,x) τ1+1≦τ≦τ1+τ2のとき z2(τ−τ1,x) τ1+1≦τ≦τ1+τ2のとき z3(τ−τ1−τ2,x)τ1+τ2+1≦τ≦τ1+τ2
τ3のとき…(6) となる。ここで、 {zi(τ,x):1≦τ≦τi,1≦x≦L},i=
1,2,3 …(7) はそれぞれ音素片のパターンである。
ただし、式(6)の標準パターンは個別に作成され
た音素または音素片の標準パターンというものを
連結して作成するのではない。連続DPにかかる
標準パターンは、1)単語等の中で音素や音素片
の微視的カテゴリーのものが連続して巨視的カテ
ゴリーのパターンとなつているものを、巨視的単
位のサンプルとして切り出し、2)それについて
音素または音素片のカテゴリーでその区切り点
(τ1,τ2,τ3等)を指定し、3)これらの巨視的
単位のサンプルを平均化操作する、ことで作成す
る。これにより、音素または音素片の標準パター
ンは式(6)の巨視的標準パターンの中に存在する形
で表現されることになる。
次に、連続DPによる上述の標準パターンを入
力パターンとのマツチング時において、入力パタ
ーンの各フレーム時刻がいかなる音素(または音
素片)に対応させられているかを示す整合履歴の
パラメータを考えるとする。この整合履歴パラメ
ータによつて大きな単位の連続DPのための標準
パターンであつても、その整合の様子をより小さ
な単位によつて調べることが可能となる。この整
合履歴を表わすパラメータは以下の式で定められ
る。
いま、σ(τ)を音素(または音素片)カテゴ
リーのラベル番号として、 σ(τ)=k,if{Z(τ,x):1≦x≦L}∈SK (8) と定める。ここで、{Z(τ,x):1≦x≦L}
は連続DPで用いる標準パターン(巨視的カテゴ
リー)の1フレーム部分とし、SKはk番目の音
素(または音素片)のパターン(微視的カテゴリ
ー)とする。次に、入力パターンについて、連続
DPによる標準パターンとの整合の履歴を考えよ
う。この整合の履歴は変数E(t,τ,α)で表
すものとする。変数E(t,τ,α)は連続DP値
P(t,τ)に付属しているものである。それは、
連続DP値P(t,τ)を定めている入力フレーム
区間の各フレームに、巨視的標準パターンを構成
している音素または音素片のラベル番号で番号づ
けを行つたのであるとする。言い換えると、E
(t,τ,α),α=1,2,…,N,は入力フレ
ーム区間の音素または音素片による同定履歴であ
る。ここでのパラメータNについての説明は後述
する。変数E(t,τ,α)は連続DPの式(a)〜(g)
に対応して以下の漸化式で定まる。
E(t,1,1)k…if{Z(1,x):1≦x≦L
)〓SK E(t,1,α)=0(2≦α≦N) (a) E(t,2,1)=E(t,2,2)=σ(2) E(t,2,1)=E(t,2,2)=σ(2) E(t,2,α)=E(t−2,1,α−2)(3≦α
≦N)if(b) E(t,2,1)=σ(2) E(t,2,1)=σ(2) E(t,2,α)=E(t−1,1,α−1)(2≦α
≦N)if(c) E(t,2,α)=E(t,1,α)(1≦α≦N
)if(d) E(t,τ,1)=E(t,τ,2)=σ(τ) E(t,τ,α)=E(t−2,τ−1,α−2) (3≦α≦N) (3≦τ≦Τ) if(e) E(t,τ,1)=σ(τ) E(t,τ,α)=E(t−1,τ−1,α−1) (2≦α≦N) (3≦τ≦Τ) if(f) E(t,τ,1)=σ(τ) E(t,τ,α)=E(t−1,τ−2,α−1) (2≦α≦N) (3≦τ≦Τ)if(g) (9) ここで、E(t,τ,α)の初期条件を E(−1,τ,α)=E(0,τ,α)=0, (1≦τ≦Τ),(1≦α≦N) (10) とする。また、αは時刻tを基準にして、それよ
りα時間前の入力フレーム時刻を示し、α=1が
tに対応し、α=mがt−m+1に対応するもの
とする。このとき、式(9)のE(t,τ,α)の時
刻t、パラータτにおいて、その時刻より過去の
入力との整合履歴を表すことは明らかである。い
ま、例として、式(4)の(f)に対応する式(9)の部分
(if(f)で表される式)を考えてみよう。式(4)で(f)
の場合、最適マツチングパスは(t−1,τ−
1)から(t,τ)へと移るものである。このと
き(t,τ)のτに対応する音素(または音素
片)カテゴリーはσ(τ)であるので、α=1の
整合履歴はE(t,τ,1)=σ(τ)として定ま
る。それより過去の履歴E(t,τ,α)(2≦α
≦N)は(t−1,τ−1)における履歴E(t
−1,τ−1,α−1)(2≦α≦N)を引き継
ぐとすればよい。これらのことが、式(9)の(f)で示
されている。また、Nはこのαの上限を意味し、
その値は巨視的標準パターン長の最大のものの
高々2倍でよい。なぜなら、連続DPの定義より、
標準パターンの2倍以上の長さの過去の入力フレ
ームとはマツチングの対象とはならないためであ
る。
式(9)で定まる{E(t,Τ,α),1≦α≦N}
が第2図ので示される音素ラベルの系列であ
る。第2図のでは、時刻tの進行によつて形成
される音素ラベルの様子が示されている。
なお、変数E(t,τ,α)は上記のように連
続DPの変数P(t,τ)に付随するもので、連続
DP値P(t,τ)を形成するに用いられた入力フ
レーム区間の音素または音素片記号列が{E(t,
τ,α),1αN}によつて表される。従つ
て、αはこの記号列中の番号を示すパラメータで
ある。
さて、連続DPのための標パターンの総数がM
であるとすると、連続DP部3の連続DPの出力は {Di(t):i=1,2,…,M} …(11) となり、また整合履歴のパラメータも {Ei(t,τ,α):1≦τ≦Ti,1≦α≦N,
i=1,2,…,M} …(12) となる。そのとき、第2図ので示され各音素
(または音素片)カテゴリーが示す尤度(認識す
るためのもつともらしさ)をG(t,α,k)と
すると(kは音素(または音素片)のカテゴリー
番号、このG(t,α,k)は、 G(t,1,k)=Mi=1 Ii(t)・δ(k−Ei(t,Ti,1)) …(13) G(t,2,k)=G(t−1,1,k)+Mi=1 Ii(t)・δ(k−Ei(t,Ti,2)) … G(t,α,k)=G(t−1,α−1,k)+Mi=1 Ii(t)・δ(k−Ei(t,Ti,α)) … G(t,N,k)=G(t−1,N−1,k)+Mi=1 Ii(t)・δ(k−Ei(t,Ti,N)) として定める。ここで、 Ii(t)=1:Di(t)≦hのとき 0:その他のとき …(14) であり、 δ(x)=1:x=0 0:x≠0 である。
上式(13)は各フレームでの整合履歴の結果を音
素片カテゴリー別に累積してゆくことを意味して
いる。尤度G(t,α,k)はそのカテゴリーご
との累積の個数で定義されている。時刻tにおけ
る尤度は、t+N−1時刻までの履歴の生成を待
ち、tからt+N−1までの履歴パラメータで定
められる。このとき、Nは遅延の程度を表わす
が、これは連続DPの最大の標準パターン長に依
存するので通常80程度となる。従つて、G(t,
N,k)は時刻t−N+1における音素ラベル番
号kの尤度の値を示す。G(t,N,k)が時刻
と共にどのように変化するかは、例えば、第2図
ので示されている。音素ラベルAが番号kに対
応するとき、第2図のでの“A”の部分がそれ
を表すことになる。
以上により、部分整合演算部5において入力音
声の時刻t−N+1におけるフレーム特徴を音素
(または音素片)カテゴリーで認識するとしたと
きは、第1位の候補は、 k1 *(t−N+1)=Arg{max kG(t,N,k)}
…(15) で与えられ、第2位の候補は、 k2 *(t−N+1)=Arg{max k≠k1*G(t,N,k)

…(16) で与えられ、第j番目の候補は、 kj*(t−N+1)=Arg{max k≠k1* G k2*,k*j-1

(t,N,k)} …(17) で与えられる。
通常は、部分整合演算部5からk1 *(t−N+
1)を認識の結果とした第1図の出力部6へ出力
することになる。
[発明の効果] 以上説明したように、本発明によれば、 連続DPにかける標準パターンを比較的大き
な識別単位にとることによつて、音素または音
素片の変動を十分表わすことにし、 そのもとで連続DPパターンマツチングを行
ない、 そのパターンマツチングの結果の集計・判定
に当つては、大きな識別単位のマツチングにお
いて、正しく整合していると考えられる部分だ
けをとり出し、 その結果として小さな識別単位(音素や音素
片のカテゴリー)を出力とすることを可能なら
しめることができる。
従つて、本発明によれば、従来のパターンマツ
チング方式で極めて困難とされていた単語より小
さな単位を基本的認識単位とすることが可能とな
り、大語彙の連続音声認識システムの設計に大き
な道を開くことができる。
【図面の簡単な説明】
第1図は本発明実施例の音声認識装置の構成を
示すブロツク図、第2図は本発明に係る連続DP
を用いた部分整合方式の概念説明図である。 1……音声入力部、2……分析部、3……連結
DP部、4……標準パターン記憶部、5……部分
整合演算部、6……出力部。

Claims (1)

  1. 【特許請求の範囲】 1 a 音声入力を電気信号に変換する音声入力
    部と、該音声入力部の出力波形を分析する分析
    部と、標準パターンをあらかじめ記憶する標準
    パターン記憶部と、前記分析部で分析された入
    力パターンと前記標準パターンとの距離を計算
    し、該計算結果に応じて前記入力音声の音素名
    や単語名を含む語彙を識別する音声認識部と、
    該音声認識部の識別結果を外部に出力する出力
    部とから成る音声認識装置において、 b 前記標準パターン記憶部が少なくとも、音素
    または音素片を表わす特徴パラメータ系列が複
    数個のつながりによつて作成された標準パター
    ンを記憶しており、 c 前記音声認識部が、 c−1 前記標準パターンと前記入力パターンと
    の整合を連続ダイナミツクプログラミングによ
    る整合方式によつて実行し、 各前記標準パターンについての整合値と音素
    または音素片の記号列で表わされた整合履歴を
    表わすパラメータとを各入力フレーム毎に有す
    る連続DP値を出力する連続DP部と、 c−2 前記整合履歴を表わすパラメータと前記
    連続DP値を用いて、時刻を同じくしている同
    一音素または音素片記号を累積し、 各前記時刻における各音素または音素片カテ
    ゴリーの累積値を最大とするものから、その時
    刻の識別候補を定める部分整合演算部とを具備
    したことを特徴とする音声認識装置。
JP61064512A 1986-03-22 1986-03-22 音声認識装置 Granted JPS62220998A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61064512A JPS62220998A (ja) 1986-03-22 1986-03-22 音声認識装置
US07/027,447 US4975962A (en) 1986-03-22 1987-03-18 Phoneme labelling of frame by accumulating evidence obtained from spotting results of microscopic units
GB8706368A GB2188181B (en) 1986-03-22 1987-03-18 Phonemic recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61064512A JPS62220998A (ja) 1986-03-22 1986-03-22 音声認識装置

Publications (2)

Publication Number Publication Date
JPS62220998A JPS62220998A (ja) 1987-09-29
JPH0556517B2 true JPH0556517B2 (ja) 1993-08-19

Family

ID=13260330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61064512A Granted JPS62220998A (ja) 1986-03-22 1986-03-22 音声認識装置

Country Status (3)

Country Link
US (1) US4975962A (ja)
JP (1) JPS62220998A (ja)
GB (1) GB2188181B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01102599A (ja) * 1987-10-12 1989-04-20 Internatl Business Mach Corp <Ibm> 音声認識方法
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
JP2980420B2 (ja) * 1991-07-26 1999-11-22 富士通株式会社 動的計画法照合装置
US5475798A (en) * 1992-01-06 1995-12-12 Handlos, L.L.C. Speech-to-text translator
US5386492A (en) * 1992-06-29 1995-01-31 Kurzweil Applied Intelligence, Inc. Speech recognition system utilizing vocabulary model preselection
US5682464A (en) * 1992-06-29 1997-10-28 Kurzweil Applied Intelligence, Inc. Word model candidate preselection for speech recognition using precomputed matrix of thresholded distance values
JP3004883B2 (ja) * 1994-10-18 2000-01-31 ケイディディ株式会社 終話検出方法及び装置並びに連続音声認識方法及び装置
JP2980026B2 (ja) * 1996-05-30 1999-11-22 日本電気株式会社 音声認識装置
US7398208B2 (en) * 2001-10-11 2008-07-08 Siemens Atkiengesellschaft Method for producing reference segments describing voice modules and method for modeling voice units of a spoken test model
US7143033B2 (en) * 2002-04-03 2006-11-28 The United States Of America As Represented By The Secretary Of The Navy Automatic multi-language phonetic transcribing system
JP5336788B2 (ja) * 2008-08-13 2013-11-06 Kddi株式会社 音声認識装置およびプログラム
US8615221B1 (en) 2012-12-06 2013-12-24 Google Inc. System and method for selection of notification techniques in an electronic device
US9037455B1 (en) * 2014-01-08 2015-05-19 Google Inc. Limiting notification interruptions

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
JPS5782896A (en) * 1980-11-12 1982-05-24 Hitachi Ltd Continuous voice recognition system
US4489434A (en) * 1981-10-05 1984-12-18 Exxon Corporation Speech recognition method and apparatus
US4454586A (en) * 1981-11-19 1984-06-12 At&T Bell Laboratories Method and apparatus for generating speech pattern templates
JPS58145998A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声過渡点検出方法
JPS5945583A (ja) * 1982-09-06 1984-03-14 Nec Corp パタンマッチング装置
US4567606A (en) * 1982-11-03 1986-01-28 International Telephone And Telegraph Corporation Data processing apparatus and method for use in speech recognition
US4723290A (en) * 1983-05-16 1988-02-02 Kabushiki Kaisha Toshiba Speech recognition apparatus
FR2554623B1 (fr) * 1983-11-08 1986-08-14 Texas Instruments France Procede d'analyse de la parole independant du locuteur

Also Published As

Publication number Publication date
GB8706368D0 (en) 1987-04-23
JPS62220998A (ja) 1987-09-29
GB2188181A (en) 1987-09-23
US4975962A (en) 1990-12-04
GB2188181B (en) 1989-11-15

Similar Documents

Publication Publication Date Title
JPH0355838B2 (ja)
JP3299408B2 (ja) 動的特徴を使用した音声認識方法及び装置
JPH0556517B2 (ja)
JPH05265483A (ja) 複数の出力を与える音声認識法
Rosdi et al. Isolated malay speech recognition using Hidden Markov Models
JPS61179499A (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JP2943445B2 (ja) 音声認識方法
Fotinea et al. Emotion in speech: Towards an integration of linguistic, paralinguistic, and psychological analysis
JP2943473B2 (ja) 音声認識方法
JPH09212190A (ja) 音声認識装置及び文認識装置
JPH08211891A (ja) ヒドン・マルコフ・モデルの学習方法
JPH0635494A (ja) 音声認識装置
JPH08110797A (ja) パターンマッチング装置
JPH0713587A (ja) 隠れマルコフモデル連結学習方法
JPH07146696A (ja) 音声認識における単語テンプレートの自動作成方法
JPH0573087A (ja) 音声認識方法
JPH0469959B2 (ja)
Vigier et al. Disambiguation of the e-set for connected-alphadigit recognition.
JPH01126694A (ja) 音声認識装置における音韻記号の付加方式
JPH04220699A (ja) 音声認識方法
Kunzmann et al. An experimental environment for the generation and verification of word hypotheses in continuous speech
JPS6346499A (ja) 大語▲い▼単語音声認識方式
KR20000040573A (ko) 화자독립 고립단어 음성인식기의 오인식 방지장치 및 방법
Koo et al. A Recognition Time Reduction Algorithm for Large-Vocabulary Speech Recognition
JPH0246957B2 (ja)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term