JPH03120600A - 連続音声認識装置 - Google Patents
連続音声認識装置Info
- Publication number
- JPH03120600A JPH03120600A JP1259359A JP25935989A JPH03120600A JP H03120600 A JPH03120600 A JP H03120600A JP 1259359 A JP1259359 A JP 1259359A JP 25935989 A JP25935989 A JP 25935989A JP H03120600 A JPH03120600 A JP H03120600A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- spotting
- neural network
- series
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims 2
- 238000012795 verification Methods 0.000 abstract description 6
- 238000007476 Maximum Likelihood Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明はニューラルネットワークによる連続音声認識
方式に関し、特に、ニューラルネットワークを用いた音
声認識装置において、連続的に発声された音声を認識す
るようなニューラルネットワークによる連続音声認識方
式に関する。
方式に関し、特に、ニューラルネットワークを用いた音
声認識装置において、連続的に発声された音声を認識す
るようなニューラルネットワークによる連続音声認識方
式に関する。
[従来の技術および発明が解決しようとする課題]従来
、連続的に発声された音声の認識を行なう場合には、ま
ず連続音声中の音韻のセグメントテーシジンを行、ない
、次にセグメントテーシジンーされた音声を認識する方
法が一般的に採用されている。また、従来の方式では、
高精度の音韻のセグメントチージョン方式と、音韻認識
方式とを確立することが難しく、認識された音韻は曖昧
な「音韻ラティス」の形式で一旦出力された後、辞書な
どの情報からトップダウン的に発声内容の同定を行なう
のが通常である。
、連続的に発声された音声の認識を行なう場合には、ま
ず連続音声中の音韻のセグメントテーシジンを行、ない
、次にセグメントテーシジンーされた音声を認識する方
法が一般的に採用されている。また、従来の方式では、
高精度の音韻のセグメントチージョン方式と、音韻認識
方式とを確立することが難しく、認識された音韻は曖昧
な「音韻ラティス」の形式で一旦出力された後、辞書な
どの情報からトップダウン的に発声内容の同定を行なう
のが通常である。
しかしながら、このような方式では、認識システムが複
雑になるばかりではなく、高精度な連続音声認識システ
ムを構築することが困難であるという問題点があった。
雑になるばかりではなく、高精度な連続音声認識システ
ムを構築することが困難であるという問題点があった。
それゆえに、この発明の主たる目的は、ニューラルネッ
トワークを用いた音韻スポツティング技術により得られ
た連続音声中の音韻スポツティング結果と、拡張LRパ
ーザによって予測された音韻とを動的計画法rDyna
mLc Time−Wraping Matchi
ngJによって統合し、高精度な連続音声認識システム
を構築できるようなニューラルネットワークによる連続
音声認識方式を提供することである。
トワークを用いた音韻スポツティング技術により得られ
た連続音声中の音韻スポツティング結果と、拡張LRパ
ーザによって予測された音韻とを動的計画法rDyna
mLc Time−Wraping Matchi
ngJによって統合し、高精度な連続音声認識システム
を構築できるようなニューラルネットワークによる連続
音声認識方式を提供することである。
[課題を解決するための手段]
この発明はニー−ラルネットワークによる連続音声認識
方式であって、連続的に発声された入力音声を分析する
分析手段と、分析された音声を特徴パラメータの時系列
に変換する変換手段と、特徴パラメータ時系列を一定の
時間領域にわたって正規化する正規化手段と、正規化さ
れた特徴パラメータを用いて、ニューラルネットワーク
によって連続音声中の音韻をスポツティングする手段と
を備えて構成され、構文解析法を用いて連続音声中の音
韻を予測し、予測音韻とニューラルネットワークによる
音韻スポツティング結果とを音声の時間正規化能力を持
つ動的計画法によってマツチングを行なうものである。
方式であって、連続的に発声された入力音声を分析する
分析手段と、分析された音声を特徴パラメータの時系列
に変換する変換手段と、特徴パラメータ時系列を一定の
時間領域にわたって正規化する正規化手段と、正規化さ
れた特徴パラメータを用いて、ニューラルネットワーク
によって連続音声中の音韻をスポツティングする手段と
を備えて構成され、構文解析法を用いて連続音声中の音
韻を予測し、予測音韻とニューラルネットワークによる
音韻スポツティング結果とを音声の時間正規化能力を持
つ動的計画法によってマツチングを行なうものである。
[作用]
この発明にかかるニューラルネットワークによる連続音
声認識方式は、ニューラルネットワークの一種である時
間遅れ神経回路網(TDNN: Time−Delay
Neural Netw。
声認識方式は、ニューラルネットワークの一種である時
間遅れ神経回路網(TDNN: Time−Delay
Neural Netw。
rk)[11による音韻スポツティング方法と、構文解
析法の一種である拡張LR構文解析法とを用いて音韻を
予測し、予測音韻とTDNNによる音韻認識結果とを動
的計画法によって統合し、高精度で連続音声を認識する
。
析法の一種である拡張LR構文解析法とを用いて音韻を
予測し、予測音韻とTDNNによる音韻認識結果とを動
的計画法によって統合し、高精度で連続音声を認識する
。
[発明の実施例]
第1図はこの発明の一実施例における時間遅れ神経回路
網を示すブロック図である。第1図を参照して、入力層
11には連続音声が入力され、この連続音声は中間層と
してのサブネットワーク12ないし20に与えられる。
網を示すブロック図である。第1図を参照して、入力層
11には連続音声が入力され、この連続音声は中間層と
してのサブネットワーク12ないし20に与えられる。
これらのサブネットワーク12〜20のうち、サブネッ
トワーク12〜17および19は日本語の全音韻の24
種類Cb+ dlgo p* LlkIm+ ’
n+ NI S、Sh、 h、 z、 ch、
ts、 r、 w、 y、 a、 i。
トワーク12〜17および19は日本語の全音韻の24
種類Cb+ dlgo p* LlkIm+ ’
n+ NI S、Sh、 h、 z、 ch、
ts、 r、 w、 y、 a、 i。
us e+ o、Q (無音))をスポツティング
する。
する。
すなわち、サブネットワーク12は3つの音韻す、d、
gを識別し、ネットワーク13はp、t。
gを識別し、ネットワーク13はp、t。
kを識別し、サブネットワーク14はm、 n、 N
を識別し、サブネットワーク15はs、sh、h。
を識別し、サブネットワーク15はs、sh、h。
2を識別し、サブネットワーク16はch、tsを識別
し、サブネットワーク17はr、w、yを識別し、サブ
ネットワーク19はa、t、u、e。
し、サブネットワーク17はr、w、yを識別し、サブ
ネットワーク19はa、t、u、e。
0を識別する。サブネットワーク18はサブネットワー
ク12〜17までの6つの音韻グループ間を識別し、サ
ブネットワーク20は音声であるかあるいは無音である
かを識別する。
ク12〜17までの6つの音韻グループ間を識別し、サ
ブネットワーク20は音声であるかあるいは無音である
かを識別する。
これらのサブネットワーク12〜20は統合ネットワー
ク21によって統合され、スポツティングされた24音
韻は出力層22に出力される。なお、ネットワークの学
習は、誤差逆伝搬法(Error Back−Pr
opagation)[2]に従って行なわれる。この
方法は評価関数である誤差を特徴空間において、局所的
に最急降下法に基づいて逐次減少させていく方法である
。
ク21によって統合され、スポツティングされた24音
韻は出力層22に出力される。なお、ネットワークの学
習は、誤差逆伝搬法(Error Back−Pr
opagation)[2]に従って行なわれる。この
方法は評価関数である誤差を特徴空間において、局所的
に最急降下法に基づいて逐次減少させていく方法である
。
第2図はこの発明の一実施例における連続音声中の音韻
をスポツティングする方法を説明するための図である。
をスポツティングする方法を説明するための図である。
第2図を参照して、入力データとして入力音声11aが
与えられる。第2図においては、縦軸が周波数を表わし
、横軸が時間を表わしている。入力音声11aは第1図
に示したニューラルネットワークの入力層11に与えら
れ、音韻のスポツティングは第1図のネットワークを1
フレームずつ時間方向に走査することによって行なわれ
る。1フレームシフトするごとに、24音韻のうちのい
ずれかの音韻スポツティング結果が出力層22から出力
される。なお、第1図に示したネットワークのうちの中
間層12〜21は省略している。この第2図に示した方
法は、従来の方法のように音韻のセグメントテーシ目ン
を必要としない極めて簡易で優れた方法である。
与えられる。第2図においては、縦軸が周波数を表わし
、横軸が時間を表わしている。入力音声11aは第1図
に示したニューラルネットワークの入力層11に与えら
れ、音韻のスポツティングは第1図のネットワークを1
フレームずつ時間方向に走査することによって行なわれ
る。1フレームシフトするごとに、24音韻のうちのい
ずれかの音韻スポツティング結果が出力層22から出力
される。なお、第1図に示したネットワークのうちの中
間層12〜21は省略している。この第2図に示した方
法は、従来の方法のように音韻のセグメントテーシ目ン
を必要としない極めて簡易で優れた方法である。
第3図はTDNN−LR法の認識システムの構成を示す
ブロック図である。第3図を参照して、入力された音声
1は周波数分析され、FFT出力のような特徴パラメー
タの時系列の形式にされて時間遅れ神経回路網2に与え
られる。時間遅れ神経回路網2は第1図で説明したよう
に、24音韻のスポツティング結果を出力する。
ブロック図である。第3図を参照して、入力された音声
1は周波数分析され、FFT出力のような特徴パラメー
タの時系列の形式にされて時間遅れ神経回路網2に与え
られる。時間遅れ神経回路網2は第1図で説明したよう
に、24音韻のスポツティング結果を出力する。
一方、文脈自由文法格納部4には文脈自由文法が格納さ
れていて、この文脈自由文法に従ってLRテーブル生成
器5によってLR子テーブルが生成される。LRパーザ
7はLR子テーブルを参照しながら文法上杵される音韻
系列を予測する。予測音韻格納部8は予測された音韻系
列を予め格納しており、音韻検証部3は予測音韻格納部
8に格納されている予測された音韻系列と、時間遅れ神
経回路網2で得られた音韻のスポツティング結果とをD
TWマツチングを用いて検証を行なう。検証された音韻
系列のうち、最大尤度をとる系列を認識結果として、認
識結果出力部9に出力する。
れていて、この文脈自由文法に従ってLRテーブル生成
器5によってLR子テーブルが生成される。LRパーザ
7はLR子テーブルを参照しながら文法上杵される音韻
系列を予測する。予測音韻格納部8は予測された音韻系
列を予め格納しており、音韻検証部3は予測音韻格納部
8に格納されている予測された音韻系列と、時間遅れ神
経回路網2で得られた音韻のスポツティング結果とをD
TWマツチングを用いて検証を行なう。検証された音韻
系列のうち、最大尤度をとる系列を認識結果として、認
識結果出力部9に出力する。
ここで、LRパーザ7による音韻予測法について簡単に
説明する。LRパーザ7は文脈自由文法の中で、LR文
法という限定された文法から生成される文法を解析する
。このパーザは入力信号を受付けながらバックトラック
なしに決定的に構文を解析できる。LRパーザ7は動作
衣゛と行先表という2Fl類の表を見ながら解析を行な
う。動作衣は次にパーザが行なう動作を示す表であり、
行先表は次にパーザがとる状態を示す表である。パーザ
の動作には、次の4種類がある。
説明する。LRパーザ7は文脈自由文法の中で、LR文
法という限定された文法から生成される文法を解析する
。このパーザは入力信号を受付けながらバックトラック
なしに決定的に構文を解析できる。LRパーザ7は動作
衣゛と行先表という2Fl類の表を見ながら解析を行な
う。動作衣は次にパーザが行なう動作を示す表であり、
行先表は次にパーザがとる状態を示す表である。パーザ
の動作には、次の4種類がある。
■ 移動(shift)
■ 還元(reduce)
■ 受理(accept)
■ 誤り (error)
■移動はパーザの状態をスタックに積む動作でであり、
■還元はスタック上の記号を文法規則に従ってまとめる
ものである。■受理は入力文章がLRパーザで解析でき
たことを示し、■誤りは解析できなかったことを示す。
■還元はスタック上の記号を文法規則に従ってまとめる
ものである。■受理は入力文章がLRパーザで解析でき
たことを示し、■誤りは解析できなかったことを示す。
次に、解析の手順を示す。
「定義」
S:パーザの状態
a:文法記号(非終端、終端記号)
入力ポインタ:現在処理中の入力記号列を示す。
状態スタック:パーザの状態を保存する。
GOTO(s、a):状態Sと文法記号aから次の状態
を求める。
を求める。
ACTION (s、a):状態Sと文法記号aからパ
ーザの動作を求める。
ーザの動作を求める。
「アルゴリズム」
■ 初期化:入力ポインタを入力記号列の先頭に位置づ
ける。状態スタックに0をブツシュする。
ける。状態スタックに0をブツシュする。
■ 現在の状態Sと入力ポインタの示す記号aからAC
TION (s、a)を調べる。
TION (s、a)を調べる。
■ ACTION (s、a)−shi f t”なら
ばGOTO(s、a)を状態スタックにブツシュし、入
力ポインタを1つ進める。
ばGOTO(s、a)を状態スタックにブツシュし、入
力ポインタを1つ進める。
■ACTION(s、a) 霞’reduce。
n”ならば、n番目の文法規則の右辺にある文法記号の
数だけスタックの状態をポツプする。スタック最上段の
状態をS′とすると、S′とn番目の文法規則左辺にあ
る文法規則Aから、次の状態GOTO(!!’ 、A)
を求め、スタックにブツシュする。
数だけスタックの状態をポツプする。スタック最上段の
状態をS′とすると、S′とn番目の文法規則左辺にあ
る文法規則Aから、次の状態GOTO(!!’ 、A)
を求め、スタックにブツシュする。
■ ACTION (s、a)−accept”ならば
解析終了。
解析終了。
■ ACTION (s、a)m e r ro r
ならば解析失敗。
ならば解析失敗。
■ ■に戻る。
拡張LRパーザは、LRパーザでは対処できなかった曖
昧な構文を解析できるようにしたものである。拡張LR
パーザでは、動作衣に複数の項目を記述する。パーザが
この複数の項目の表を調べた場合には並列動作を行なう
。このようにして決定的に構文の解゛析を行なう。
昧な構文を解析できるようにしたものである。拡張LR
パーザでは、動作衣に複数の項目を記述する。パーザが
この複数の項目の表を調べた場合には並列動作を行なう
。このようにして決定的に構文の解゛析を行なう。
第4図は音韻スポツティング結果の一例を示す図である
。この第4図に示した例は、「会議に」と発声した場合
であり、入力音声のスベクトログラムllbと音韻スポ
ツティング結果22aとを示す。入力音声と音韻スポツ
ティング結果には、結果の妥当性を検証するために、予
め視察により音韻ラベルが付与されている。第4図にお
いて、黒い四角は出力が活性化したことを表わしている
。
。この第4図に示した例は、「会議に」と発声した場合
であり、入力音声のスベクトログラムllbと音韻スポ
ツティング結果22aとを示す。入力音声と音韻スポツ
ティング結果には、結果の妥当性を検証するために、予
め視察により音韻ラベルが付与されている。第4図にお
いて、黒い四角は出力が活性化したことを表わしている
。
第5図は第3図に示した音韻認識結果検証部3における
動作を示すための図であり、音韻スポツティング結果2
2とDPマツチングパス31とLRパーザによって予測
された音韻の系列32とを示している。第5図では、/
kaigini/と発声された入力音声が、予測音韻の
系列32と音韻スポツティング結果22との間でDPマ
ツチングパス31によって整合されていることがわかる
。
動作を示すための図であり、音韻スポツティング結果2
2とDPマツチングパス31とLRパーザによって予測
された音韻の系列32とを示している。第5図では、/
kaigini/と発声された入力音声が、予測音韻の
系列32と音韻スポツティング結果22との間でDPマ
ツチングパス31によって整合されていることがわかる
。
[発明の効果]
以上のように、この発明によれば、時間遅れニューラル
ネットワーク(TDNN)による簡易で高精度な音韻ス
ポツティング方法と、拡張LRパーザによって予測され
た音韻系列とを動的計画法(DTW)を用いてマツチン
グを行なうようにしたので、高精度で高速に連続音声を
認識することが可能になる。
ネットワーク(TDNN)による簡易で高精度な音韻ス
ポツティング方法と、拡張LRパーザによって予測され
た音韻系列とを動的計画法(DTW)を用いてマツチン
グを行なうようにしたので、高精度で高速に連続音声を
認識することが可能になる。
第1図はこの発明の一実施例に用いられる時間遅れ神経
回路網を示すブロック図である。第2図は連続音声中の
音韻をスポツティングする方法を示す図である。第3図
はTDNN−LR法による認識システムの構成を示すブ
ロック図である。第4図はこの発明の一実施例による音
韻スポツティング結果の一例を示す図である。第5図は
第3図に示した音韻認識結果検証部における動作を示す
図である。 図において、1は入力音声データ、2は音韻スポツティ
ング部、3は音韻認識結果検証部、4は文脈自由文法格
納部、5はLR子テーブル成器、6はLRテーブル、7
は(Rパーザ、8は予測音韻格納部、9は認識結果出力
部、11は入力層、12〜20は中間層としてのネット
ワーク、21は統合ネットワーク、22は出力層を示す
。 第3図 手 続 補 正 書 C7jカ 6、補正の対象 平成2年3月1日 図面 7、補正の内容 (1) 図面の第4図および第5図の浄書を別 紙の通り (内容に変更なし)。 2、発明の名称 以上 ニューラルネットワークによる連続音声認識方式3、補
正をする者 名 称 株式会社エイ・ティ・アール自動翻訳電話研究所代表者 搏 松 明 4、代 理 人 住 所 大阪市北区南森町2丁目1番29号 住友銀行南森町ビル 5、補正命令の日付
回路網を示すブロック図である。第2図は連続音声中の
音韻をスポツティングする方法を示す図である。第3図
はTDNN−LR法による認識システムの構成を示すブ
ロック図である。第4図はこの発明の一実施例による音
韻スポツティング結果の一例を示す図である。第5図は
第3図に示した音韻認識結果検証部における動作を示す
図である。 図において、1は入力音声データ、2は音韻スポツティ
ング部、3は音韻認識結果検証部、4は文脈自由文法格
納部、5はLR子テーブル成器、6はLRテーブル、7
は(Rパーザ、8は予測音韻格納部、9は認識結果出力
部、11は入力層、12〜20は中間層としてのネット
ワーク、21は統合ネットワーク、22は出力層を示す
。 第3図 手 続 補 正 書 C7jカ 6、補正の対象 平成2年3月1日 図面 7、補正の内容 (1) 図面の第4図および第5図の浄書を別 紙の通り (内容に変更なし)。 2、発明の名称 以上 ニューラルネットワークによる連続音声認識方式3、補
正をする者 名 称 株式会社エイ・ティ・アール自動翻訳電話研究所代表者 搏 松 明 4、代 理 人 住 所 大阪市北区南森町2丁目1番29号 住友銀行南森町ビル 5、補正命令の日付
Claims (1)
- 【特許請求の範囲】 連続的に発声された入力音声を分析する分析手段、 前記分析手段によって分析された音声を特徴パラメータ
の時系列に変換する変換手段、 前記変換手段によって変換された特徴パラメータ時系列
を一定の時間領域にわたって正規化する正規化手段、お
よび 前記正規化手段によって正規化された特徴パラメータを
用いて、ニューラルネットワークによって連続音声中の
音韻をスポッティングする手段を備え、 構文解析法を用いて連続音声中の音韻を予測し、予測音
韻とニューラルネットワークによる音韻スポッティング
結果とを音声の時間正規化能力を持つ動的計画法によっ
てマッチングを行なうことを特徴とする、ニューラルネ
ットワークによる連続音声認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1259359A JPH0642159B2 (ja) | 1989-10-03 | 1989-10-03 | 連続音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1259359A JPH0642159B2 (ja) | 1989-10-03 | 1989-10-03 | 連続音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03120600A true JPH03120600A (ja) | 1991-05-22 |
| JPH0642159B2 JPH0642159B2 (ja) | 1994-06-01 |
Family
ID=17333021
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1259359A Expired - Fee Related JPH0642159B2 (ja) | 1989-10-03 | 1989-10-03 | 連続音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0642159B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017027044A (ja) * | 2015-07-24 | 2017-02-02 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 音響点数を計算する装置及び方法、音声を認識する装置及び方法並びに電子装置 |
| CN107578774A (zh) * | 2016-07-05 | 2018-01-12 | 恩智浦有限公司 | 用于促进对时间序列模式的检测的方法和系统 |
-
1989
- 1989-10-03 JP JP1259359A patent/JPH0642159B2/ja not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017027044A (ja) * | 2015-07-24 | 2017-02-02 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 音響点数を計算する装置及び方法、音声を認識する装置及び方法並びに電子装置 |
| CN107578774A (zh) * | 2016-07-05 | 2018-01-12 | 恩智浦有限公司 | 用于促进对时间序列模式的检测的方法和系统 |
| CN107578774B (zh) * | 2016-07-05 | 2023-07-14 | 恩智浦有限公司 | 用于促进对时间序列模式的检测的方法和系统 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0642159B2 (ja) | 1994-06-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Juang et al. | Automatic recognition and understanding of spoken language-a first step toward natural human-machine communication | |
| JP4301102B2 (ja) | 音声処理装置および音声処理方法、プログラム、並びに記録媒体 | |
| JP3716870B2 (ja) | 音声認識装置および音声認識方法 | |
| KR100312920B1 (ko) | 연결된음성인식의방법및장치 | |
| JPH08278794A (ja) | 音声認識装置および音声認識方法並びに音声翻訳装置 | |
| EP0769184B1 (en) | Speech recognition methods and apparatus on the basis of the modelling of new words | |
| Furui | 50 years of progress in speech and speaker recognition | |
| Hanazawa et al. | ATR HMM-LR continuous speech recognition system | |
| US20210225366A1 (en) | Speech recognition system with fine-grained decoding | |
| WO2004047075A1 (ja) | 音声処理装置および方法、記録媒体並びにプログラム | |
| Rabiner et al. | Historical perspective of the field of ASR/NLU | |
| Ney et al. | Dynamic programming search strategies: From digit strings to large vocabulary word graphs | |
| JP3039634B2 (ja) | 音声認識装置 | |
| JPH03120600A (ja) | 連続音声認識装置 | |
| Barnard et al. | Real-world speech recognition with neural networks | |
| Cerisara et al. | Multi-band automatic speech recognition | |
| Nakagawa | Speaker-independent continuous-speech recognition by phoneme-based word spotting and time-synchronous context-free parsing | |
| JP3027557B2 (ja) | 音声認識方法及び装置、並びに音声認識処理プログラムを記録した記録媒体 | |
| KR100673834B1 (ko) | 문맥 요구형 화자 독립 인증 시스템 및 방법 | |
| JPH1097275A (ja) | 大語彙音声認識装置 | |
| Brenner et al. | Word recognition in continuous speech using a phonological based two-network matching parser and a synthesis based prediction | |
| Wu et al. | Application of simultaneous decoding algorithms to automatic transcription of known and unknown words | |
| De Mori | Automatic speech recognition | |
| Zue et al. | Spoken language input | |
| Çömez | Large vocabulary continuous speech recognition for Turkish using HTK |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |