JPS607498A - 単語音声認識装置とその方法 - Google Patents
単語音声認識装置とその方法Info
- Publication number
- JPS607498A JPS607498A JP11505483A JP11505483A JPS607498A JP S607498 A JPS607498 A JP S607498A JP 11505483 A JP11505483 A JP 11505483A JP 11505483 A JP11505483 A JP 11505483A JP S607498 A JPS607498 A JP S607498A
- Authority
- JP
- Japan
- Prior art keywords
- word
- phoneme
- voice input
- creating
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
発明の技術分野
本発明は音声認識装置に関するものであり、よシ特定的
には単語を音声入力し認識する装置であって、認識の対
象とする単語についての音声入力登録を事前に全ての認
識対象語について行う必要のない音声認識装置に関する
。
には単語を音声入力し認識する装置であって、認識の対
象とする単語についての音声入力登録を事前に全ての認
識対象語について行う必要のない音声認識装置に関する
。
技術の背景及び従来技術と問題点
在来の単語音声認識装置としては、一般に全単語登録形
特定話者認識装置及び不特定話者認識装置とがある。前
者は話者を特定し予め認識対象語の全てについて音声入
力し登録しておく方式を採るものである。この方式の装
置は認識率も良く認識対象語も多く設定できるのである
が、事前に全認識対象語について音声登録をしなければ
ならないので例えば1ooo語を越える認識対象単語て
にっ“ いて利用者が音声登録する場合、利用者の登録
の負担が大きくなシすぎるという問題点がある。
特定話者認識装置及び不特定話者認識装置とがある。前
者は話者を特定し予め認識対象語の全てについて音声入
力し登録しておく方式を採るものである。この方式の装
置は認識率も良く認識対象語も多く設定できるのである
が、事前に全認識対象語について音声登録をしなければ
ならないので例えば1ooo語を越える認識対象単語て
にっ“ いて利用者が音声登録する場合、利用者の登録
の負担が大きくなシすぎるという問題点がある。
一方後者は話者を特定せず、利用者が事前に音声登録す
ることは必要としない利点があるが、一般に装置におけ
る認識が難しくなシ設備及び応答性等の制約から認識対
象語が例えば数十個程度に制限されているという問題点
及び認識対象語を自由に変更することができないという
問題点を有している。
ることは必要としない利点があるが、一般に装置におけ
る認識が難しくなシ設備及び応答性等の制約から認識対
象語が例えば数十個程度に制限されているという問題点
及び認識対象語を自由に変更することができないという
問題点を有している。
発明の目的
本発明の目的は、上記従来技術の問題点を解決し、最小
限の音声登録で数多くの単語を認識することができる単
語音声認識装置全提供することにある。また本発明の目
的は容易に認識対象語を変更することができる音声認識
装置を提供することにある。
限の音声登録で数多くの単語を認識することができる単
語音声認識装置全提供することにある。また本発明の目
的は容易に認識対象語を変更することができる音声認識
装置を提供することにある。
本発明の上記目的は、在来方式の如く音声認識の際音素
のセグメンテーシいンを行うという方法を採らず、登録
の際音素のセグメンテーションを行っておき、このよう
にセグメンテーションが行なわれた音素辞書を用いて単
語音声入力の認識を行うという着想にもとづいて達成さ
れる。
のセグメンテーシいンを行うという方法を採らず、登録
の際音素のセグメンテーションを行っておき、このよう
にセグメンテーションが行なわれた音素辞書を用いて単
語音声入力の認識を行うという着想にもとづいて達成さ
れる。
発明の構成
本発明においては、音声入力を受け入れ、該音声入力を
並列に設けられ中心周波数の異なる複数の帯域濾波器を
通し整流した複数チャネルの音声データの信号、及び該
複数の音声データ信号から1つのノfワー信号全発生す
る音声入力手段、認識すべき単語とは独立した関係にあ
る登録語についての音声入力を前記音声入力部に印加し
、登録語についての音声入力のz4ワー信号の時間的変
化にもとづき登録語についての音声入力の複数の音声デ
ータ信号から音声辞書を作成するラベル付手段、認識す
べき単語に・ついての音声入力を前記音声入力部に印加
し、前記音声入力部の出力としてのパワー信号及び複数
の音声データ信号から認識単語の音声入力についての音
素データを作成し、予め得られた前記音素辞書の音素と
近似度の高いものについて音素ラティスデータを作成す
る音素ラティス作成手段、及び、該音素ラティスデータ
を予め記憶されている認識対象語と照合し類似度の最も
高い単語全抽出するラベル照合手段を具備する単語音声
認識装置が提供される。
並列に設けられ中心周波数の異なる複数の帯域濾波器を
通し整流した複数チャネルの音声データの信号、及び該
複数の音声データ信号から1つのノfワー信号全発生す
る音声入力手段、認識すべき単語とは独立した関係にあ
る登録語についての音声入力を前記音声入力部に印加し
、登録語についての音声入力のz4ワー信号の時間的変
化にもとづき登録語についての音声入力の複数の音声デ
ータ信号から音声辞書を作成するラベル付手段、認識す
べき単語に・ついての音声入力を前記音声入力部に印加
し、前記音声入力部の出力としてのパワー信号及び複数
の音声データ信号から認識単語の音声入力についての音
素データを作成し、予め得られた前記音素辞書の音素と
近似度の高いものについて音素ラティスデータを作成す
る音素ラティス作成手段、及び、該音素ラティスデータ
を予め記憶されている認識対象語と照合し類似度の最も
高い単語全抽出するラベル照合手段を具備する単語音声
認識装置が提供される。
また本発明においては、認識すべき単語とは独立した登
録語について音声入力し該音声入力にもとづき予め音素
辞書を作成する段階、認識すべき単語を音声入力し該音
声入力にもとづき音素データを作成し、前記音素辞書と
照合して音素ラティスを作成する段階、及び該音素ラテ
ィスと認識対象語を比較照合し最も類似度の高い単語を
抽出する段階、を有する単語音声認識方法が提供される
。
録語について音声入力し該音声入力にもとづき予め音素
辞書を作成する段階、認識すべき単語を音声入力し該音
声入力にもとづき音素データを作成し、前記音素辞書と
照合して音素ラティスを作成する段階、及び該音素ラテ
ィスと認識対象語を比較照合し最も類似度の高い単語を
抽出する段階、を有する単語音声認識方法が提供される
。
発明の実施例
本発明の一実施例について添付図面を参照して下記に述
べる。
べる。
第1図は本発明にもとづく音声認識装置の構成図を示す
。当該音声認識装置は、音声を入力するためのマイクロ
フォン1、該マイクロフォンからの信号を受け入れ入力
信号処理を行う音声入力部2、該音声入力部2の出力信
号S2と登録語記憶部8からの信号S8とにもとづき音
素辞書を作成し、音素辞書記憶部6に記憶するラベル付
部5を有している。また音声認識装置は、認識すべき音
声入力があったとき、音声入力部2からの信号S2を音
素辞書記憶部6の音素辞書データを参照して音素ラティ
スを作成する音素ラティス作成部3、該音素ラティスと
認識対象単語記憶部7の認識対象単語とを照合し該当す
る単語を作成するラベル照合部4、及び認識された単語
の表示若しくは登録すべき語の表示又はその低利用者と
の間のマン・マシン・コミュニケーション用のディスプ
レー9、キーが一ド(図示せず)を有している。
。当該音声認識装置は、音声を入力するためのマイクロ
フォン1、該マイクロフォンからの信号を受け入れ入力
信号処理を行う音声入力部2、該音声入力部2の出力信
号S2と登録語記憶部8からの信号S8とにもとづき音
素辞書を作成し、音素辞書記憶部6に記憶するラベル付
部5を有している。また音声認識装置は、認識すべき音
声入力があったとき、音声入力部2からの信号S2を音
素辞書記憶部6の音素辞書データを参照して音素ラティ
スを作成する音素ラティス作成部3、該音素ラティスと
認識対象単語記憶部7の認識対象単語とを照合し該当す
る単語を作成するラベル照合部4、及び認識された単語
の表示若しくは登録すべき語の表示又はその低利用者と
の間のマン・マシン・コミュニケーション用のディスプ
レー9、キーが一ド(図示せず)を有している。
第2図に音声入力部2の内部回路図を示す。第2図にお
いて、フィルタチャネル回路211〜21nと該回路2
11〜21nの出力の総和をとる加算器22が図示され
ている。また回路211〜21nのうちの回路211に
ついての詳細全第3図に示す。第3図示おいて、BPF
Iは中心周波数f1の帯域済波器、Dはダイオード、R
Vi抵抗器、Cはキャノやシタを示す。他の回路212
〜2inも第3図の回路構成と同様であるが、イW域濾
波器の中心周波数は/1とは異なシそれぞれf2〜/n
’″Cある。
いて、フィルタチャネル回路211〜21nと該回路2
11〜21nの出力の総和をとる加算器22が図示され
ている。また回路211〜21nのうちの回路211に
ついての詳細全第3図に示す。第3図示おいて、BPF
Iは中心周波数f1の帯域済波器、Dはダイオード、R
Vi抵抗器、Cはキャノやシタを示す。他の回路212
〜2inも第3図の回路構成と同様であるが、イW域濾
波器の中心周波数は/1とは異なシそれぞれf2〜/n
’″Cある。
第2図及び第3図の回路から明らかなように、音声入力
部2にマイクロフォン1からの音声入力(交流)が入力
されると、各チャネル毎帯域濾波され、ダイオードDで
整流され、この直流がRC時定数回路によシ平滑されて
さらにそれらがディジタライプ231〜23nを通して
ディジタル信号に変換され、各チャネルの出力データ信
号SDI〜SDnとなる。他方信号SDI〜SDnが加
算器22に印加されるとその出力はパワーを表わす(S
PwR)。S晶爪もディジタライザ24を介してディ
ジタル員の(im号となっている。尚、音声入力部2の
出力信号S2は信号S D 1〜SDn % 5PWR
ぎ総称したものである。
部2にマイクロフォン1からの音声入力(交流)が入力
されると、各チャネル毎帯域濾波され、ダイオードDで
整流され、この直流がRC時定数回路によシ平滑されて
さらにそれらがディジタライプ231〜23nを通して
ディジタル信号に変換され、各チャネルの出力データ信
号SDI〜SDnとなる。他方信号SDI〜SDnが加
算器22に印加されるとその出力はパワーを表わす(S
PwR)。S晶爪もディジタライザ24を介してディ
ジタル員の(im号となっている。尚、音声入力部2の
出力信号S2は信号S D 1〜SDn % 5PWR
ぎ総称したものである。
以下第1図装置の動作について説明する。当該装置R:
を用いて音声認識を行う形態は、登録フェーズと認識
フェーズに大別される。
を用いて音声認識を行う形態は、登録フェーズと認識
フェーズに大別される。
先ず登録7エーズの動作について述べる。利用者(話者
)を特定し、以下特定された利用者について下記の如く
行う。登録フェーズでは後述する音素のセグメンテーシ
ョンを行ない音素辞書を作成するが、音素辞書作成のだ
めの音声登録語は事前に定められておシ、登録語記憶部
8に格納されている。
)を特定し、以下特定された利用者について下記の如く
行う。登録フェーズでは後述する音素のセグメンテーシ
ョンを行ない音素辞書を作成するが、音素辞書作成のだ
めの音声登録語は事前に定められておシ、登録語記憶部
8に格納されている。
登録語記憶部8から音声登録語、例えばr AGA(ア
ガ)」ラブイスプレー9に表示し、利用者に発声を指示
する。利用者は上記音声登録Kをマイクロフォン1に向
って発声する。マイクロフォンlの音声入力信号Slが
音声入力部2に印加され、それぞれのチャネルデータS
DI〜SDn及びノ4ワ−8PWRが得られる。これら
の信号が82としてラベル付部5に印加される。/?ク
ワ−PWRは第4図(4)に図示の如き特性曲線として
示される。第4図(4)において横軸tは時間を表わす
。
ガ)」ラブイスプレー9に表示し、利用者に発声を指示
する。利用者は上記音声登録Kをマイクロフォン1に向
って発声する。マイクロフォンlの音声入力信号Slが
音声入力部2に印加され、それぞれのチャネルデータS
DI〜SDn及びノ4ワ−8PWRが得られる。これら
の信号が82としてラベル付部5に印加される。/?ク
ワ−PWRは第4図(4)に図示の如き特性曲線として
示される。第4図(4)において横軸tは時間を表わす
。
ラベル付部5では、時間tについて一定の時間間隔Δt
で、これ子フレームと呼ぶ、等間隔で隣シ合うノfワー
の変化dSPWR’(z求める(第4図(B))。
で、これ子フレームと呼ぶ、等間隔で隣シ合うノfワー
の変化dSPWR’(z求める(第4図(B))。
このようにして得られた・やワー変化d S PWRと
単語rAGAJの記号列にもとづいてフレーム毎の音素
、第4図(C)の例示においてrAJrGJのラベルを
付ける。ここではパワー変化のピーク値と単語の記号列
とのつじつまが合うようにラベル付けを行なう。このよ
うに音素ラベル付けを行なったら(第4図(C) )
、各フレームについて第5図の形態の音素辞書として音
素辞書記憶部6に記憶する。
単語rAGAJの記号列にもとづいてフレーム毎の音素
、第4図(C)の例示においてrAJrGJのラベルを
付ける。ここではパワー変化のピーク値と単語の記号列
とのつじつまが合うようにラベル付けを行なう。このよ
うに音素ラベル付けを行なったら(第4図(C) )
、各フレームについて第5図の形態の音素辞書として音
素辞書記憶部6に記憶する。
第5図に図示の音素辞書について詳述する。第5図にお
いてrSE LBLJは音素ラベルを表わしておシ、こ
の時の音素はそれぞれのフレームについて母音「A(ア
)」、濁音子音ガギグ等の頭部「G」がある。またrs
E DATJは音素データを示しておシ、成るフレーム
についてノ千ワー変化があった1つの音素rAJについ
てチャネルデータSDI〜SDnのうち該当するデータ
1DAT1としているもので「特徴」を表わすデータで
ある。
いてrSE LBLJは音素ラベルを表わしておシ、こ
の時の音素はそれぞれのフレームについて母音「A(ア
)」、濁音子音ガギグ等の頭部「G」がある。またrs
E DATJは音素データを示しておシ、成るフレーム
についてノ千ワー変化があった1つの音素rAJについ
てチャネルデータSDI〜SDnのうち該当するデータ
1DAT1としているもので「特徴」を表わすデータで
ある。
以上の如く「AGA」について音素辞書が作成されたら
次の登録語についても同様にして音素辞書を作成してい
く。ここで音声登録語は認識すべき対象単語と等価では
なく、むしろ独立した関係にあシ、認識対象単語全認識
する上で必要となる音素辞書作成のために必要な数でよ
い。すなわち一定量の音素辞書が作成されるだけの音声
登録語があフ、認識対象単語が増加しても、音声登録音
さらに行う必要はない。
次の登録語についても同様にして音素辞書を作成してい
く。ここで音声登録語は認識すべき対象単語と等価では
なく、むしろ独立した関係にあシ、認識対象単語全認識
する上で必要となる音素辞書作成のために必要な数でよ
い。すなわち一定量の音素辞書が作成されるだけの音声
登録語があフ、認識対象単語が増加しても、音声登録音
さらに行う必要はない。
また上記の如き音素辞書作成時点で、予め判っている音
声登録語についての記号列とつじつまが合わないような
ラベル付けとなった場合には、ディスプレー9を介して
、利用者に再発声をうながし、音声登録処理ヲ<シ返し
て音素辞書作成を確実化する。
声登録語についての記号列とつじつまが合わないような
ラベル付けとなった場合には、ディスプレー9を介して
、利用者に再発声をうながし、音声登録処理ヲ<シ返し
て音素辞書作成を確実化する。
次いで上記音素辞tを用いて実際に音声認識を行つ認識
フェーズついて述べる。
フェーズついて述べる。
認識すべき音声入力がマイクロフォン1に印加されその
出力信号・Slについてのノぐワーが第6図の如く得ら
れたとする。音声入力部2の出力信号S2、第6図の5
pNvR2含むもの、が音素ラティス作成部3に印加さ
れる。音素ラティス作成部3において、第6図のパワー
信号についてフレーム毎(Δt)音素データ全作シ出し
、予め得られている音素辞書と距離計算を行なう。そし
て距離の小さい音素から順に整理した音素ラティス表(
第7図1)を作成する。第7図において横方向が時間、
すなわちフレーム数、縦方向が距離dの小さい順に並べ
た音素とその距mを示している。例えば第7図左端列に
おけるフレーム1について、音素「O」。
出力信号・Slについてのノぐワーが第6図の如く得ら
れたとする。音声入力部2の出力信号S2、第6図の5
pNvR2含むもの、が音素ラティス作成部3に印加さ
れる。音素ラティス作成部3において、第6図のパワー
信号についてフレーム毎(Δt)音素データ全作シ出し
、予め得られている音素辞書と距離計算を行なう。そし
て距離の小さい音素から順に整理した音素ラティス表(
第7図1)を作成する。第7図において横方向が時間、
すなわちフレーム数、縦方向が距離dの小さい順に並べ
た音素とその距mを示している。例えば第7図左端列に
おけるフレーム1について、音素「O」。
距離=50、音素「A」、距離=52、音素roJ距離
=53、音素「A」、距離=70の音素ラティスが得ら
れていることを示している。
=53、音素「A」、距離=70の音素ラティスが得ら
れていることを示している。
このようにして得られた音素ラティス表と認識対象単語
記憶部7に記憶されている対象単語の文字列との比較照
合全ラベル照合部4で行う。認識対象語記憶部7には認
識の対象とすべき全ての単語が記憶されている。またこ
れらの単語の1つ1つには第8図に図示の如き整合窓W
I NDWが設けられている。第8図に例示の単語f−
00SAKAJについて述べると各音素rOJ 、 r
OJ 、 rsJ 、 rAJ 。
記憶部7に記憶されている対象単語の文字列との比較照
合全ラベル照合部4で行う。認識対象語記憶部7には認
識の対象とすべき全ての単語が記憶されている。またこ
れらの単語の1つ1つには第8図に図示の如き整合窓W
I NDWが設けられている。第8図に例示の単語f−
00SAKAJについて述べると各音素rOJ 、 r
OJ 、 rsJ 、 rAJ 。
rKJ 、 rAJごと比較照合すべきフレーム帯域が
設けられておシ、(斜線部は比較照合の範囲外)適切な
フレーム範囲について照合を行ない認識率向上の寄与と
効率アップを図るようにしている。
設けられておシ、(斜線部は比較照合の範囲外)適切な
フレーム範囲について照合を行ない認識率向上の寄与と
効率アップを図るようにしている。
成る音素ラティス素(第10図)について、上記第8図
のroosAKAJについて整合窓をかけてroosA
KAJの文字列の文字に一致する音素ラベルの最小距離
をそのフレームの距離とし、全フレームについて距離(
d)と音素ラベル(SE、LBL)’i言1算する(第
9図参照)。次いでこれらの距離の総和をとり、フレー
ム数nで除した値Σd l /nを、認識対象単語文字
列と入力音声による音素ラティスの距離とする。
のroosAKAJについて整合窓をかけてroosA
KAJの文字列の文字に一致する音素ラベルの最小距離
をそのフレームの距離とし、全フレームについて距離(
d)と音素ラベル(SE、LBL)’i言1算する(第
9図参照)。次いでこれらの距離の総和をとり、フレー
ム数nで除した値Σd l /nを、認識対象単語文字
列と入力音声による音素ラティスの距離とする。
全ての認識対象単語文字列について上記距離計算を行な
い、距離の最小のものを最も近似度の高いものとして抽
出し、認識単語S4としてディスプレー9に表示する。
い、距離の最小のものを最も近似度の高いものとして抽
出し、認識単語S4としてディスプレー9に表示する。
この例示ではroO8AI(A(大阪)」が認識単語で
ある。
ある。
上記認識単語が所望の場合には利用者にキーが一ド等で
その旨指示し、そうでない場合には再試行をする。
その旨指示し、そうでない場合には再試行をする。
発明の効果
以上述べたように本発明によれば、認識対象語について
音声登録をするのではなく、音素辞書作成のための登録
語について必要な数だけ音声登録をすればよく、音素辞
書は認識対象語数が増加してもそのまま使用できるから
、適切な叡の音声登録で数多くの単面全認識することが
できる。
音声登録をするのではなく、音素辞書作成のための登録
語について必要な数だけ音声登録をすればよく、音素辞
書は認識対象語数が増加してもそのまま使用できるから
、適切な叡の音声登録で数多くの単面全認識することが
できる。
また本発明によれば認識対象語について音声登録をする
のではなく、認識対象語は独立しており、認識対象語の
増減又は変更が容易にできるという効果全奏する。
のではなく、認識対象語は独立しており、認識対象語の
増減又は変更が容易にできるという効果全奏する。
第1図は本発明の一実施例としての音声認識装置の)4
成図、 第2図は第1固装厘7における音声入力部の回路図、 第3図は2.2図回路の一実施例としての詳細な回路図
、 第4図体)は第2図回路の出力としてのパワー特性図、 第4図(B)は第4図(4)についてのフレーム毎の・
臂ワー変化特性図、 第4ul(c)は第4関(B)にもとづいて得られる刊
素データを示す図、 第5図は第4図(C)にもとづく音素辞書の一例?示す
図、 第6図は認識すべき音声入力のパワー特性図、第7図は
第6図に図示のデータから・得たVi素ラうィス表を示
す図、 第8図は整合窓の一例を示す図、 第9図は給10図に示す音素ラティスデータを第8図の
整合窓をかけて得られた音素データ透水す図、 第10図は成る認識すべき音声入力についての音素ラテ
ィス表を示す図、である。 (符号の説明) 1・・・マイクロフォン、2・・・音声入方部、3・・
・音素ラティス作成部、4・・・ラベル照合部、5・・
・ラベル付部、6・・・音素辞書記憶部、7・・・認識
対象単語記憶部、8・・・登録語記憶部、9・・・ディ
スル−。 特許出願人 富士通株式会社 特許出願代理人 弁理士 η′ 木 朗 弁理士 西 舘 和 之 弁理士 内 1) 幸 男 弁理士 山 口 昭 之 第4図 (A) 第5図 率6図
成図、 第2図は第1固装厘7における音声入力部の回路図、 第3図は2.2図回路の一実施例としての詳細な回路図
、 第4図体)は第2図回路の出力としてのパワー特性図、 第4図(B)は第4図(4)についてのフレーム毎の・
臂ワー変化特性図、 第4ul(c)は第4関(B)にもとづいて得られる刊
素データを示す図、 第5図は第4図(C)にもとづく音素辞書の一例?示す
図、 第6図は認識すべき音声入力のパワー特性図、第7図は
第6図に図示のデータから・得たVi素ラうィス表を示
す図、 第8図は整合窓の一例を示す図、 第9図は給10図に示す音素ラティスデータを第8図の
整合窓をかけて得られた音素データ透水す図、 第10図は成る認識すべき音声入力についての音素ラテ
ィス表を示す図、である。 (符号の説明) 1・・・マイクロフォン、2・・・音声入方部、3・・
・音素ラティス作成部、4・・・ラベル照合部、5・・
・ラベル付部、6・・・音素辞書記憶部、7・・・認識
対象単語記憶部、8・・・登録語記憶部、9・・・ディ
スル−。 特許出願人 富士通株式会社 特許出願代理人 弁理士 η′ 木 朗 弁理士 西 舘 和 之 弁理士 内 1) 幸 男 弁理士 山 口 昭 之 第4図 (A) 第5図 率6図
Claims (1)
- 【特許請求の範囲】 1、音声入力全党は入れ、該音声入力を並列に設けられ
中心周波数の異なる複数の帯域濾波器を通し整流した複
数チャネルの音声データ化分、及び該複数の音声データ
信号から1つのノクワー信号全発生する音声入力手段、
認識すべき単語とは独立した関係にある登録語について
の音声入力を前記音声入力部に印加し、登録語について
の音声入力のノ4ワー信号の時間的変化にもとづき登録
語についての音声入力の複数の音声データ信号から音素
辞書を作成するラベル付手段、 認識すべき単語についての音声入力部に印加し、前記音
声入力部の出力としてのノ千ワー信号及び複数の音声デ
ータ信号から認識単語の音声入力についての音素データ
を作成し;予め得られた前記音素辞書の音素と障似度の
高いものについて音素ラティスデータを作成する音素ラ
ティス作成手段及び、 該音素ラティスデータを予め記憶されている認識対象語
と照合し類似度の最も高い単語を抽出するラベル照合手
段、 全具備する単語音声認識装置。 2、認識すべき単語とは独立した登録語について音声入
力し該音声入力にもとづき予め音素辞書を作成する段階
、認識すべき単語を音声入力し該音声入力にもとづき音
素r−夕を作成し前記音素辞書と照合して音素ラティス
を作成する段階、及び、該音素ラティスと認識対象語を
比較照合し最も類似度の高い単語を抽出する段階、を有
する単語音声認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11505483A JPS607498A (ja) | 1983-06-28 | 1983-06-28 | 単語音声認識装置とその方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11505483A JPS607498A (ja) | 1983-06-28 | 1983-06-28 | 単語音声認識装置とその方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS607498A true JPS607498A (ja) | 1985-01-16 |
Family
ID=14653032
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11505483A Pending JPS607498A (ja) | 1983-06-28 | 1983-06-28 | 単語音声認識装置とその方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS607498A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0288082A (ja) * | 1988-09-27 | 1990-03-28 | Shiraishi:Kk | 圧気作業用加湿ユニット付き混合ガス呼吸装置 |
| US7225134B2 (en) | 2000-06-20 | 2007-05-29 | Sharp Kabushiki Kaisha | Speech input communication system, user terminal and center system |
-
1983
- 1983-06-28 JP JP11505483A patent/JPS607498A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0288082A (ja) * | 1988-09-27 | 1990-03-28 | Shiraishi:Kk | 圧気作業用加湿ユニット付き混合ガス呼吸装置 |
| US7225134B2 (en) | 2000-06-20 | 2007-05-29 | Sharp Kabushiki Kaisha | Speech input communication system, user terminal and center system |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10074363B2 (en) | Method and apparatus for keyword speech recognition | |
| JPH0394299A (ja) | 音声認識方法と音声認識装置訓練方法 | |
| US10014007B2 (en) | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system | |
| JPH0556517B2 (ja) | ||
| JPS607498A (ja) | 単語音声認識装置とその方法 | |
| CN112331219A (zh) | 语音处理方法和装置 | |
| CN112241467A (zh) | 一种音频查重的方法和装置 | |
| CA2191377A1 (en) | A time-varying feature space preprocessing procedure for telephone based speech recognition | |
| JPH0534679B2 (ja) | ||
| JPS5934595A (ja) | 音声認識処理方式 | |
| JPS6315296A (ja) | 音声認識装置 | |
| JPH05158493A (ja) | 音声認識装置 | |
| JPH09319395A (ja) | 離散単語音声認識システムにおける音声データ学習装置 | |
| JPH0640274B2 (ja) | 音声認識装置 | |
| JPS62255999A (ja) | 単語音声認識装置 | |
| Niimi et al. | Speaker adaptation of a code book of vector quantization | |
| JPH0469959B2 (ja) | ||
| JPH0119599B2 (ja) | ||
| JPS63155195A (ja) | 音声認識装置 | |
| JPS6346499A (ja) | 大語▲い▼単語音声認識方式 | |
| JP2000242292A (ja) | 音声認識方法、この方法を実施する装置およびこの方法を実行するプログラムを記憶した記憶媒体 | |
| JPS62160499A (ja) | 音声認識装置 | |
| JPS6287993A (ja) | 音声認識装置 | |
| JPS63218999A (ja) | 音声認識装置 | |
| JPS6061800A (ja) | 音声認識方式 |