JPH01996A - ベクトル量子化を用いた音声認識方式 - Google Patents
ベクトル量子化を用いた音声認識方式Info
- Publication number
- JPH01996A JPH01996A JP62-156959A JP15695987A JPH01996A JP H01996 A JPH01996 A JP H01996A JP 15695987 A JP15695987 A JP 15695987A JP H01996 A JPH01996 A JP H01996A
- Authority
- JP
- Japan
- Prior art keywords
- vector quantization
- codebook
- recognition
- speech recognition
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 title claims description 34
- 238000000034 method Methods 0.000 title claims description 21
- 230000005236 sound signal Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002966 varnish Substances 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野層]
この発明はベクトル量子化を用いた音声認識方式に関し
、特に、ベクトル量子化を用いたテンプレートマツチン
グによる音声認識方式に関する。
、特に、ベクトル量子化を用いたテンプレートマツチン
グによる音声認識方式に関する。
[従来の技術および発明が解決しようとする問題点]
自動翻訳電話では、入力として音声が用いられるが、入
力された音声を認識する必要がある。音声認識として、
従来よりベクトル量子化を用いる手法が考えられている
。従来のベクトル量子化を用いた音声認識では、計算量
およびメモリの増加を抑えて認識性能を向上させるべく
、ベクトル量子化に用いるスペクトル歪み尺度の改良が
行なわれ、種々の特徴の組合わせの複合スペクトル歪み
尺度が提案されている。この方法では、スペクトル歪み
尺度に多種の特徴間を混在させ、それらの・間の依存関
係を拘束条件として用い、より認識性能の良い空間へ特
徴を写像するところに意味があった。しかし、この方法
では、次に述べるような大な2つの問題点があった。
力された音声を認識する必要がある。音声認識として、
従来よりベクトル量子化を用いる手法が考えられている
。従来のベクトル量子化を用いた音声認識では、計算量
およびメモリの増加を抑えて認識性能を向上させるべく
、ベクトル量子化に用いるスペクトル歪み尺度の改良が
行なわれ、種々の特徴の組合わせの複合スペクトル歪み
尺度が提案されている。この方法では、スペクトル歪み
尺度に多種の特徴間を混在させ、それらの・間の依存関
係を拘束条件として用い、より認識性能の良い空間へ特
徴を写像するところに意味があった。しかし、この方法
では、次に述べるような大な2つの問題点があった。
■ 各特徴間間の依存関係がベクトル量子化のコードブ
ック内で統計的に妥当性を持つためには、非常に多くの
ラーニングサンプルとこのための膨大な計算時間が必要
である。
ック内で統計的に妥当性を持つためには、非常に多くの
ラーニングサンプルとこのための膨大な計算時間が必要
である。
■ コードブックサイズで見た場合、各特徴に必要なコ
ードブックサイズは特徴間の依存関係を拘束条件にする
ことで減少する。しかし、それでも全体のコードブック
サイズは各特徴に必要なコードブックサイズの積になっ
て、非常に大きくなってしまい、膨大なメモリが必要で
あった。
ードブックサイズは特徴間の依存関係を拘束条件にする
ことで減少する。しかし、それでも全体のコードブック
サイズは各特徴に必要なコードブックサイズの積になっ
て、非常に大きくなってしまい、膨大なメモリが必要で
あった。
それゆえに、この発明の主たる目的は、ベクトル量子化
として各特徴ごとに別々にコードブ・ンクを生成し、別
々のベクトル量子化を行なう七ノ(レートベクトル量子
化を用いることにより、従来の問題点を解消し得るベク
トル量子化を用いた音声認識方式を提供することである
。
として各特徴ごとに別々にコードブ・ンクを生成し、別
々のベクトル量子化を行なう七ノ(レートベクトル量子
化を用いることにより、従来の問題点を解消し得るベク
トル量子化を用いた音声認識方式を提供することである
。
[問題点を解決するための手段]
この発明は、入力音声をベクトル量子化し、ベクトル量
子化によるコード列として格納されている標準パターン
と照合することにより認識を行なう音声認識方式であっ
て、入力音声の特徴の種類に応じて複数のコードブック
を有し、各コードブックについてベクトル量子化を行な
い、求められた複数のコード列を用いて認識を行なうよ
うに構成したものである。
子化によるコード列として格納されている標準パターン
と照合することにより認識を行なう音声認識方式であっ
て、入力音声の特徴の種類に応じて複数のコードブック
を有し、各コードブックについてベクトル量子化を行な
い、求められた複数のコード列を用いて認識を行なうよ
うに構成したものである。
[作用]
この発明に係るベクトル量子化を用いた音声認識方式で
は、入力音声の特徴の種類に応じたコードブックについ
てベクトル量子化を行なうことにより、コードブックサ
イズは各特徴に必要なコードブックサイズの和となり、
全体のコードブックサイズを軽減できる。
は、入力音声の特徴の種類に応じたコードブックについ
てベクトル量子化を行なうことにより、コードブックサ
イズは各特徴に必要なコードブックサイズの和となり、
全体のコードブックサイズを軽減できる。
[発明の実施例]
次に、図面を参照して、この発明の実施例についてより
具体的に説明する。
具体的に説明する。
第1図はこの発明の音声認識装置の概略ブロック図であ
る。
る。
第1図において、音声認識装置はアンプ1とローパスフ
ィルタ2とA/D変換器3と処理装置4とから構成され
る。アンプ1は入力された音声信号を増幅するものであ
り、ローパスフィルタ2は増幅された音声信号から折返
し雑音を除去するものである。A/D変換器3は音声信
号を12kH2のサンプリング信号により、16ビツト
のディジタル信号に変換するものである。処理装置4は
コンピュータ5と磁気ディスク6と端末類7とプリンタ
8とを含む。コンピュータ5はA/D変換器3から入力
された音声のディジタル信号に基づいて音声認識を行な
うものである。
ィルタ2とA/D変換器3と処理装置4とから構成され
る。アンプ1は入力された音声信号を増幅するものであ
り、ローパスフィルタ2は増幅された音声信号から折返
し雑音を除去するものである。A/D変換器3は音声信
号を12kH2のサンプリング信号により、16ビツト
のディジタル信号に変換するものである。処理装置4は
コンピュータ5と磁気ディスク6と端末類7とプリンタ
8とを含む。コンピュータ5はA/D変換器3から入力
された音声のディジタル信号に基づいて音声認識を行な
うものである。
第2図はこの発明の一実施例の音声信号の入力から認識
結果を出力するまでの全体の流れを示すフロー図であり
、第3図はセパレートベクトル量子化の動作を説明する
ためのフロー図であり、第4図はマツチング動作を説明
するためのフロー図である。
結果を出力するまでの全体の流れを示すフロー図であり
、第3図はセパレートベクトル量子化の動作を説明する
ためのフロー図であり、第4図はマツチング動作を説明
するためのフロー図である。
次に、第1図ないし第4図を参照して、この発明の一実
施例の動作について説明する。入力された音声信号はア
ンプ1で増幅され、ローパスフィルタ2によって折返し
雑音が除去された後、第2図に示すステップ(図示では
SPと略称する)SPlにおいて、A/D変換器3が入
力された音声信号を16ビツトのディジタル信号に変換
する。
施例の動作について説明する。入力された音声信号はア
ンプ1で増幅され、ローパスフィルタ2によって折返し
雑音が除去された後、第2図に示すステップ(図示では
SPと略称する)SPlにおいて、A/D変換器3が入
力された音声信号を16ビツトのディジタル信号に変換
する。
処理装置4のコンピュータ5はステップSP2において
、ディジタル信号に変換された音声の特徴抽出を行なう
。この特徴抽出では、たとえば線形予測分析(LPG分
析)などの手法を用いて行なわれる。
、ディジタル信号に変換された音声の特徴抽出を行なう
。この特徴抽出では、たとえば線形予測分析(LPG分
析)などの手法を用いて行なわれる。
ステップSP3において、抽出された音声の特徴がセパ
レートコードブックを参照して、七ノくレートベクトル
量子化される。セパレートコードブックはステップSP
4において、特定話者認識の場合は個人用として、不特
定話者の場合は全話者共通のコードブックとして予め準
備されている。
レートコードブックを参照して、七ノくレートベクトル
量子化される。セパレートコードブックはステップSP
4において、特定話者認識の場合は個人用として、不特
定話者の場合は全話者共通のコードブックとして予め準
備されている。
セパレートベクトル量子化により生成された特徴ごとの
コード列はステップSP5において、既にステップSP
6でコード列として磁気ディスク6に格納されている標
準パターンと照合され、DOuble 5plit法
によるマツチングが行なわれ、そのマツチング距離がス
テップSP7における結果判定部7に送られる。なお、
ステ・ツブSP6における標準パターンは、不特定話者
認識の場合は予め使用者が認識単語を発声することによ
り作成し、不特定話者認識の場合は、多数の話者が発声
した音声データベースを分析して、代表/くターンをマ
ルチテンプレートとして作成され、磁気ディスク6に格
納されている。ステップSP7における結果判定部では
、認識候補に対して、結果が適切かどうかの判断を行な
い、認識結果を出力する。
コード列はステップSP5において、既にステップSP
6でコード列として磁気ディスク6に格納されている標
準パターンと照合され、DOuble 5plit法
によるマツチングが行なわれ、そのマツチング距離がス
テップSP7における結果判定部7に送られる。なお、
ステ・ツブSP6における標準パターンは、不特定話者
認識の場合は予め使用者が認識単語を発声することによ
り作成し、不特定話者認識の場合は、多数の話者が発声
した音声データベースを分析して、代表/くターンをマ
ルチテンプレートとして作成され、磁気ディスク6に格
納されている。ステップSP7における結果判定部では
、認識候補に対して、結果が適切かどうかの判断を行な
い、認識結果を出力する。
次に、第3図を参照して、前述の第2図に示した特徴抽
出およびセパレートベクトル量子化の動作についてより
詳細に説明する。特徴抽出では、ステップ5P11にお
いて、16ビツトのディジタル信号に変換された音声信
号に対して、14次の自己相関分析によるLPG分析を
行ない、人力音声の特徴であるパワーと自己相関係数、
LPCケプストラム係数を抽出する。ステップ5P12
において、パワーのコードブック生成であるか否かを判
別し、パワーのコードブック生成であれば、ステップ5
P13において、入力音声のパワーをスカラー量子化す
る。スカラー量子化では、不拘−m子化の手法を用い、
パワーコードを生成し、ステップ5P14において、生
成したパワーコードブックを磁気ディスク6に格納する
。
出およびセパレートベクトル量子化の動作についてより
詳細に説明する。特徴抽出では、ステップ5P11にお
いて、16ビツトのディジタル信号に変換された音声信
号に対して、14次の自己相関分析によるLPG分析を
行ない、人力音声の特徴であるパワーと自己相関係数、
LPCケプストラム係数を抽出する。ステップ5P12
において、パワーのコードブック生成であるか否かを判
別し、パワーのコードブック生成であれば、ステップ5
P13において、入力音声のパワーをスカラー量子化す
る。スカラー量子化では、不拘−m子化の手法を用い、
パワーコードを生成し、ステップ5P14において、生
成したパワーコードブックを磁気ディスク6に格納する
。
パワーコードブックの生成でないとき、すなわち、量子
化時には、ステップ5P14におけるパワーコードブッ
クを用いて、5P15において量子化を行ない、パワー
に関するコード列を出力する。
化時には、ステップ5P14におけるパワーコードブッ
クを用いて、5P15において量子化を行ない、パワー
に関するコード列を出力する。
一方、ステップ5P16において、LPG相関係数およ
びLPCケプストラム係数のコードブック生成であるこ
とが判別されると、ステップ5P17において、LBG
アルゴリズムにより、WLR尺度に基づいてコードブッ
クが生成され、ステップ5P18において生成されたコ
ードブックが磁気ディスク6に格納される。ここで、L
BGアルゴリズムについては、Linde、Buzo。
びLPCケプストラム係数のコードブック生成であるこ
とが判別されると、ステップ5P17において、LBG
アルゴリズムにより、WLR尺度に基づいてコードブッ
クが生成され、ステップ5P18において生成されたコ
ードブックが磁気ディスク6に格納される。ここで、L
BGアルゴリズムについては、Linde、Buzo。
Gray:”An algorithm forV
ector Quantization Desi
gn” IEEE C0M−28(1980−01
)に記載されている。また、WLR尺度は、音声の特徴
を強調する尺度であり、単語音声の認識において高い性
能を示すものであり、村山、鹿野による“ピークに重み
をおいたLPGスペクトルマツチング尺度“電子通信学
会論文(A)J64−A5 (1981−05)に記載
されている。
ector Quantization Desi
gn” IEEE C0M−28(1980−01
)に記載されている。また、WLR尺度は、音声の特徴
を強調する尺度であり、単語音声の認識において高い性
能を示すものであり、村山、鹿野による“ピークに重み
をおいたLPGスペクトルマツチング尺度“電子通信学
会論文(A)J64−A5 (1981−05)に記載
されている。
なお、LPC相関係数およびLPCケプストラム係数の
コードブック生成でないとき、すなわち、量子化時には
入力音声の自己相関係数とLPCケプストラム係数に対
し、ステップ5P18におけるスペクトルコードブック
を用いて、ステップ5P19においてベクトル量子化を
行ない、スペクトル情報に関するコード列を出力する。
コードブック生成でないとき、すなわち、量子化時には
入力音声の自己相関係数とLPCケプストラム係数に対
し、ステップ5P18におけるスペクトルコードブック
を用いて、ステップ5P19においてベクトル量子化を
行ない、スペクトル情報に関するコード列を出力する。
ここで、コードブック生成、量子化に用いたスペクトル
歪み尺度は次のものである。
歪み尺度は次のものである。
d −P/P’ + P’ /P−2・・・(1
)ower d −Σ (C(n)−C’ (n)) (R(
n)−R’ (n))spectrum ・・・(2) d :パワー項の歪み尺度 ower d ニスベクトル歪み尺度 spectrum R(n) :コードブックのn次の自己相関係数
R’(n):人力のn次の自己相関係数C(n)
:コードブックのn次のLPCケプストラム係数 C’(n):入力のn次の LPCケプストラム係数 前述したように、標準パターン作成時には、このコード
列を標準パターンとして格納し、認識時には標準パター
ンのコード列とのマツチングを行なう。
)ower d −Σ (C(n)−C’ (n)) (R(
n)−R’ (n))spectrum ・・・(2) d :パワー項の歪み尺度 ower d ニスベクトル歪み尺度 spectrum R(n) :コードブックのn次の自己相関係数
R’(n):人力のn次の自己相関係数C(n)
:コードブックのn次のLPCケプストラム係数 C’(n):入力のn次の LPCケプストラム係数 前述したように、標準パターン作成時には、このコード
列を標準パターンとして格納し、認識時には標準パター
ンのコード列とのマツチングを行なう。
次に、第4図を参照して、マツチング方法について説明
する。セパレートベクトル量子化により、パワーとスペ
クトルとを別々にベクトル量子化して生成されたコード
列と、コード列として格納されている標準パターンとに
基づいて、ステップ5P21において、Double
5plit法によるマツチングが行なわれる。ステッ
プ5P22における標準パターンには、セパレートベク
トル量子化によりコード化されたパワーおよびスペクト
ルの標準パターンが格納されている。そして、ステップ
5P21におけるマツチングにおいては、コード間の距
離はステ、ツブ5P23において予め距離マトリクスを
作成しておき、この表びきを行なうことで行なわれる。
する。セパレートベクトル量子化により、パワーとスペ
クトルとを別々にベクトル量子化して生成されたコード
列と、コード列として格納されている標準パターンとに
基づいて、ステップ5P21において、Double
5plit法によるマツチングが行なわれる。ステッ
プ5P22における標準パターンには、セパレートベク
トル量子化によりコード化されたパワーおよびスペクト
ルの標準パターンが格納されている。そして、ステップ
5P21におけるマツチングにおいては、コード間の距
離はステ、ツブ5P23において予め距離マトリクスを
作成しておき、この表びきを行なうことで行なわれる。
このようにして、順番に標準パターンとマツチングして
求めた入力音声と標準パターンとの距離がステップ5P
24において出力される。
求めた入力音声と標準パターンとの距離がステップ5P
24において出力される。
ここで、上述のマツチング方法について説明すする。従
来のマツチングでは、入力の標準パターンの1つの特徴
列あるいはコード列であったが、セパレートベクトル量
子化では、一般に複数のコード列により構成される。こ
の実施例では、パワーコード列とスペクトルコード列の
2系列のマツチング手法を用いている。パワーとスペク
トルの両方の情報を考えた場合の距離尺度として、PW
LR尺度がある。これは次の第(3)式で示されるもの
である。
来のマツチングでは、入力の標準パターンの1つの特徴
列あるいはコード列であったが、セパレートベクトル量
子化では、一般に複数のコード列により構成される。こ
の実施例では、パワーコード列とスペクトルコード列の
2系列のマツチング手法を用いている。パワーとスペク
トルの両方の情報を考えた場合の距離尺度として、PW
LR尺度がある。これは次の第(3)式で示されるもの
である。
dPWLI?−Σ(C(n)−C’ (n))(R(n
)−R’ (n))+ a・(P/P’ + P’ /
P−2) −(3)a讃0,01 従来のDouble 5plit法によるコード列の
マツチングでは、前述のようにすべての空間がベクトル
量子化され、有限個の点で代表されていることを利用し
て、予めすべての代表点間の距離を求めて距離マトリク
スに格納しておく。したがって、 d、wLR(t、j) −Dt(A(t)、B(j))
DL(A(1)、B(j)) 一Σ(CK (n)−CL(n))(RK(n)−RL
(n))+ a−(PK/PL+ PL/PK−2)A
(j)は、入力音声のiフレーム目のコード番号 B (j)は、標準ハターンのjフレーム目のコード番
号 DL (K、L)は、コードに、L間の距離を距離マト
リクスから表びきで求めたもの に、 Lは、A (j) 、 B (j)のコード
番号しかし、セパレートベクトル量子化では、2つの系
列を有するので次のような距離を求める。
)−R’ (n))+ a・(P/P’ + P’ /
P−2) −(3)a讃0,01 従来のDouble 5plit法によるコード列の
マツチングでは、前述のようにすべての空間がベクトル
量子化され、有限個の点で代表されていることを利用し
て、予めすべての代表点間の距離を求めて距離マトリク
スに格納しておく。したがって、 d、wLR(t、j) −Dt(A(t)、B(j))
DL(A(1)、B(j)) 一Σ(CK (n)−CL(n))(RK(n)−RL
(n))+ a−(PK/PL+ PL/PK−2)A
(j)は、入力音声のiフレーム目のコード番号 B (j)は、標準ハターンのjフレーム目のコード番
号 DL (K、L)は、コードに、L間の距離を距離マト
リクスから表びきで求めたもの に、 Lは、A (j) 、 B (j)のコード
番号しかし、セパレートベクトル量子化では、2つの系
列を有するので次のような距離を求める。
d[p][νLR](1,j)
−DL (A (1)、B (ms
peat 5pect 5pect” ” D
Lpower (Apower (1)”power
(j))ここで、 DL (A (1)、 B (j
))Sp(let 5pcct 5pect
−Σ(CK (n)−CL (n))(Rx (n)−
RL(n戸DL (A (1)、B
(j))power power
power−P /P + P L、
/P 、 −2に’ L’ に、Lは、A (1)、B (j)のコー
ド5pect 5pcct 番号 K /、ビは、A (1)、B (j)のpo
wer powerコード番号 である。これは、PWLR尺度の第1項と第2項とを別
にコード化して距離を計算し、和を求めたものである。
peat 5pect 5pect” ” D
Lpower (Apower (1)”power
(j))ここで、 DL (A (1)、 B (j
))Sp(let 5pcct 5pect
−Σ(CK (n)−CL (n))(Rx (n)−
RL(n戸DL (A (1)、B
(j))power power
power−P /P + P L、
/P 、 −2に’ L’ に、Lは、A (1)、B (j)のコー
ド5pect 5pcct 番号 K /、ビは、A (1)、B (j)のpo
wer powerコード番号 である。これは、PWLR尺度の第1項と第2項とを別
にコード化して距離を計算し、和を求めたものである。
この局部距離の尺度を用いてDP(dynamic
programming:動的計画法)マツチングによ
り距離を求める。これによって、非常に高性能なベクト
ル量子化を用いた音声認識を実現することができる。
programming:動的計画法)マツチングによ
り距離を求める。これによって、非常に高性能なベクト
ル量子化を用いた音声認識を実現することができる。
[発明の効果]
以上のように、この発明によれば、入力音声の特徴の種
類に応じて複数のコードブックを有し、各コードブック
についてベクトル量子化を行ない、求められた複数のコ
ード列を用いて認識を行なうようにしたので、各特徴の
依存項を無視でき、ラーニングサンプルも少なくてすみ
、計算量を減少できる。ただし、セパレートすることに
より、別のベクトル量子化系を構成するので、この分だ
け計算量が多少増加するが、ラーニングサンプルが少な
いので、十分計算量を減少できる。また、コードブック
サイズはセバートベクトル量子化では、各特徴に必要な
コードブックサイズの和になるので、全体のコードブッ
クサイズを激減することができる。
類に応じて複数のコードブックを有し、各コードブック
についてベクトル量子化を行ない、求められた複数のコ
ード列を用いて認識を行なうようにしたので、各特徴の
依存項を無視でき、ラーニングサンプルも少なくてすみ
、計算量を減少できる。ただし、セパレートすることに
より、別のベクトル量子化系を構成するので、この分だ
け計算量が多少増加するが、ラーニングサンプルが少な
いので、十分計算量を減少できる。また、コードブック
サイズはセバートベクトル量子化では、各特徴に必要な
コードブックサイズの和になるので、全体のコードブッ
クサイズを激減することができる。
第1図はこの発明の音声認識装置の概略ブロック図であ
る。第2図はDouble 5plit法による音声
認識の全体の流れを示すフロー図である。第3図はセパ
レートベクトル量子化の動作を説明するためのフロー図
である。第4図はマツチング動作を説明するためのフロ
ー図である。 図において、1はアンプ、2はローパスフィルタ、3は
A/D変換機、4は処理装置、5はコンピュータ、6は
磁気ディスク、7は端末類、8はプリンタを示す。 −JI Im*°**−−−−−*+−−hm*−−“
°°°°°°°゛°゛°°°°゛°°°゛°°°二第2
図 農歴堕 第3図 入力 音声 第4図 スペクトル パワー コード列 コードT/l+ 認識結果 手続補正内 昭和62年8月13日
る。第2図はDouble 5plit法による音声
認識の全体の流れを示すフロー図である。第3図はセパ
レートベクトル量子化の動作を説明するためのフロー図
である。第4図はマツチング動作を説明するためのフロ
ー図である。 図において、1はアンプ、2はローパスフィルタ、3は
A/D変換機、4は処理装置、5はコンピュータ、6は
磁気ディスク、7は端末類、8はプリンタを示す。 −JI Im*°**−−−−−*+−−hm*−−“
°°°°°°°゛°゛°°°°゛°°°゛°°°二第2
図 農歴堕 第3図 入力 音声 第4図 スペクトル パワー コード列 コードT/l+ 認識結果 手続補正内 昭和62年8月13日
Claims (1)
- 【特許請求の範囲】 入力音声をベクトル量子化し、ベクトル量子化による符
号列として格納されている標準パターンと照合すること
により認識を行なう音声認識方式において、 前記入力音声の特徴の種類に応じて、複数のコードブッ
クを有し、各コードブックについてベクトル量子化を行
ない、求められた複数の符号列を用いて認識を行なうよ
うにしたことを特徴とする、ベクトル量子化を用いた音
声認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62156959A JPH067344B2 (ja) | 1987-06-24 | 1987-06-24 | ベクトル量子化を用いた音声認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62156959A JPH067344B2 (ja) | 1987-06-24 | 1987-06-24 | ベクトル量子化を用いた音声認識方式 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPS64996A JPS64996A (en) | 1989-01-05 |
| JPH01996A true JPH01996A (ja) | 1989-01-05 |
| JPH067344B2 JPH067344B2 (ja) | 1994-01-26 |
Family
ID=15639057
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62156959A Expired - Fee Related JPH067344B2 (ja) | 1987-06-24 | 1987-06-24 | ベクトル量子化を用いた音声認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH067344B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9443167B2 (en) | 2013-08-02 | 2016-09-13 | Emotient, Inc. | Filter and shutter based on image emotion content |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01239600A (ja) * | 1988-03-22 | 1989-09-25 | Nippon Telegr & Teleph Corp <Ntt> | セグメント符号化方法 |
| JP4925569B2 (ja) * | 2004-07-08 | 2012-04-25 | ローム株式会社 | 有機エレクトロルミネッセント素子 |
| KR100784957B1 (ko) * | 2006-04-24 | 2007-12-11 | 주식회사 케이티앤지 | 수삼의 비중 측정 방법 및 측정 장치 |
| KR100805889B1 (ko) * | 2006-06-14 | 2008-02-25 | 배재대학교 산학협력단 | 죽절초의 조기 결실을 위한 번식방법 |
| KR100788789B1 (ko) * | 2006-08-29 | 2007-12-27 | 고려대학교 산학협력단 | 포름알데히드 노출 여부 진단용 바이오 마커 단백질 |
| KR100799334B1 (ko) * | 2006-10-18 | 2008-01-30 | 한국철도기술연구원 | 철도차량 차축압입부위의 결함 탐상장치 |
| KR100849954B1 (ko) * | 2006-12-29 | 2008-08-01 | 인제대학교 산학협력단 | Katp 채널의 과발현 검출을 위한 프라이머 세트, 이를포함하는 검출 키트 및 동정 방법 |
| KR100846836B1 (ko) * | 2007-01-15 | 2008-07-17 | 한스바이오메드 주식회사 | 골재생촉진 조성물 |
| KR100852496B1 (ko) * | 2007-01-24 | 2008-08-18 | 한양대학교 산학협력단 | 산소 플라즈마와 급속 열처리를 이용한 산화 티타늄광촉매의 제조방법 |
| KR100840487B1 (ko) * | 2007-02-08 | 2008-06-20 | 주식회사 동원에프앤비 | 저온 초고압 처리에 의한 약용식물의 가공방법 |
| KR100858605B1 (ko) * | 2007-03-09 | 2008-09-17 | 김평원 | 퍼지기반 보정을 이용한 메타 평가 시스템 |
| KR100833470B1 (ko) * | 2007-05-02 | 2008-06-02 | 연세대학교 산학협력단 | 식물의 엽록체 및 미토콘드리아 발달에 관여하는NbBTF3유전자 |
| CN104849496B (zh) * | 2015-04-27 | 2018-04-24 | 哈尔滨工业大学深圳研究生院 | 一种基于电晕放电原理的高冲击加速度检测方法及传感器 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57177198A (en) * | 1981-04-24 | 1982-10-30 | Fujitsu Ltd | Recognizing treating device for sound |
| JPS5999500A (ja) * | 1982-11-29 | 1984-06-08 | 日本電信電話株式会社 | 音声認識方法 |
-
1987
- 1987-06-24 JP JP62156959A patent/JPH067344B2/ja not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9443167B2 (en) | 2013-08-02 | 2016-09-13 | Emotient, Inc. | Filter and shutter based on image emotion content |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP4266306B1 (en) | Processing a speech signal | |
| JPH01997A (ja) | ベクトル量子化を用いた音声認識方式 | |
| Kelly et al. | Deep neural network based forensic automatic speaker recognition in VOCALISE using x-vectors | |
| JPH01996A (ja) | ベクトル量子化を用いた音声認識方式 | |
| JPH067345B2 (ja) | ベクトル量子化を用いた音声認識方式 | |
| JPH05188994A (ja) | 騒音抑圧装置 | |
| JPH01998A (ja) | スペクトログラムの正規化方法 | |
| JPH067344B2 (ja) | ベクトル量子化を用いた音声認識方式 | |
| JP6189818B2 (ja) | 音響特徴量変換装置、音響モデル適応装置、音響特徴量変換方法、音響モデル適応方法、およびプログラム | |
| JP2709386B2 (ja) | スペクトログラムの正規化方法 | |
| CN117672176A (zh) | 基于语音自监督学习表征的重读可控语音合成方法及装置 | |
| CN118298803B (zh) | 语音克隆方法 | |
| JP2003036097A (ja) | 情報検出装置及び方法、並びに情報検索装置及び方法 | |
| CN116092475B (zh) | 一种基于上下文感知扩散模型的口吃语音编辑方法和系统 | |
| JPH10254473A (ja) | 音声変換方法及び音声変換装置 | |
| JP2709926B2 (ja) | 声質変換方法 | |
| Ghanty et al. | On recognition of spoken Bengali numerals | |
| CN115148214A (zh) | 音频压缩方法、解压缩方法及其计算机设备和存储介质 | |
| Li | Speech recognition of mandarin monosyllables | |
| Raghudathesh et al. | Review of toolkit to build automatic speech recognition models | |
| JPS5999500A (ja) | 音声認識方法 | |
| Bedyakin et al. | Language ID Prediction from Speech Using Self-Attentive Pooling and 1D-Convolutions | |
| JP2880508B2 (ja) | 音声の規則合成装置 | |
| US20250390682A1 (en) | Hierarchical Audio Generators and Codecs for Enhanced Audio Generation | |
| JPH01211799A (ja) | 多言語を扱う音声の規則合成装置 |