JPS59172694A - 音声標準パタン作成方式 - Google Patents
音声標準パタン作成方式Info
- Publication number
- JPS59172694A JPS59172694A JP58047624A JP4762483A JPS59172694A JP S59172694 A JPS59172694 A JP S59172694A JP 58047624 A JP58047624 A JP 58047624A JP 4762483 A JP4762483 A JP 4762483A JP S59172694 A JPS59172694 A JP S59172694A
- Authority
- JP
- Japan
- Prior art keywords
- standard
- syllable
- similarity
- audio data
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は音声処理装置において標準バタンとして使用さ
れる音声標準バタンを作成する方式に係り、特に特定音
節を含む音声データから該音節の標準バタンを作成する
とき、該音節と同一音節を含む多数の音声データ及び該
音節と該音節を含まない多数の音声データとの異種バタ
ン間の類似度を求め、同一音節を含む音声データとは類
似度が大きく、同一音節を含まない音声データとは類似
度が小さい音節標準バタン候補を区切ってこれを音節標
準バタンとしたものである。
れる音声標準バタンを作成する方式に係り、特に特定音
節を含む音声データから該音節の標準バタンを作成する
とき、該音節と同一音節を含む多数の音声データ及び該
音節と該音節を含まない多数の音声データとの異種バタ
ン間の類似度を求め、同一音節を含む音声データとは類
似度が大きく、同一音節を含まない音声データとは類似
度が小さい音節標準バタン候補を区切ってこれを音節標
準バタンとしたものである。
〔技術の背景及び問題点〕
例えば音声認識装置の如き音声処理装置では。
未知入力音声がどのような音声であるかということを認
識することが必要になる。この場合、未知入力音声を別
に格納しである既知の標準バタンと比較して、もつとも
類似している標準バタンを識別することにより未知入力
音声を認識することができる。
識することが必要になる。この場合、未知入力音声を別
に格納しである既知の標準バタンと比較して、もつとも
類似している標準バタンを識別することにより未知入力
音声を認識することができる。
この場合、標準バタンか不正確のものでは未知入力音声
に対する識別精度が低下し、音声認識装置としては問題
が存在する。
に対する識別精度が低下し、音声認識装置としては問題
が存在する。
認識すべき対象が特定話者の場合には、この特定話者に
より発生された音声にもとづく登録バタンを作成するこ
とにより識別精度を向上することができる。
より発生された音声にもとづく登録バタンを作成するこ
とにより識別精度を向上することができる。
しかるに未知入力音声が特定話者に限定されない、不特
定対数の者を対象にする音声認識装置では1wt別精度
の高い認識結果を得ることのできる標準バタンを簡単に
生成することができず、したがって特定話者方式の場合
に比較して不特定話者に対する音声認識は識別精度が低
いという問題がある。
定対数の者を対象にする音声認識装置では1wt別精度
の高い認識結果を得ることのできる標準バタンを簡単に
生成することができず、したがって特定話者方式の場合
に比較して不特定話者に対する音声認識は識別精度が低
いという問題がある。
本発明の目的は、このような問題点を改善するために、
標準バタンを作成するときに、特定音節を含む比較用の
バタングループと、特定音節を含まない比較用のバタン
グループを使用して、複数の比較用のバタンを用意し、
標準バタンを抽出するときにこれらの比較用バタンと比
較することにより、同一の音節でも種々のタイプの状態
の下でのもつとも一致度の太きいものを得るようにした
音声標準バタン作成方式を提供することである。
標準バタンを作成するときに、特定音節を含む比較用の
バタングループと、特定音節を含まない比較用のバタン
グループを使用して、複数の比較用のバタンを用意し、
標準バタンを抽出するときにこれらの比較用バタンと比
較することにより、同一の音節でも種々のタイプの状態
の下でのもつとも一致度の太きいものを得るようにした
音声標準バタン作成方式を提供することである。
この目的を達成するために1本発明の音声標準バタン作
成方式では、未知入力音声の認識を予め登録されたcv
、vcv等の音節バタン照合に基づき行う音声認識シス
テムにおいて、特定音節標準バタン候補と同一音節を含
む複数の音声データを保持する第1音声データ格納部と
、特定標準バタン候補と同一音節を含まない複数の音声
データを保持する第2音声データ格納部と、音節の類似
度を演算する類似度演算手段を設け、上記類似度演算手
段によシ特定音節標準バタン候補と、上記第1音声デー
タ格納部及び第2音声データ格納部からそれぞれ出力し
た音声データとの類似度を求め。
成方式では、未知入力音声の認識を予め登録されたcv
、vcv等の音節バタン照合に基づき行う音声認識シス
テムにおいて、特定音節標準バタン候補と同一音節を含
む複数の音声データを保持する第1音声データ格納部と
、特定標準バタン候補と同一音節を含まない複数の音声
データを保持する第2音声データ格納部と、音節の類似
度を演算する類似度演算手段を設け、上記類似度演算手
段によシ特定音節標準バタン候補と、上記第1音声デー
タ格納部及び第2音声データ格納部からそれぞれ出力し
た音声データとの類似度を求め。
第1音声データ格納部から出力した音声データとの類似
度分布と第2音声データ格納部から出力された音声デー
タとの類似度分布との隔たりがもつとも大きくなるよう
に上言己音節標準バタン候補を区切りこれを上記特定音
節の標準バタンとすることにより特定音節を含む音声デ
ータから該音節標準バタンを得るようにしたことを特徴
とする。
度分布と第2音声データ格納部から出力された音声デー
タとの類似度分布との隔たりがもつとも大きくなるよう
に上言己音節標準バタン候補を区切りこれを上記特定音
節の標準バタンとすることにより特定音節を含む音声デ
ータから該音節標準バタンを得るようにしたことを特徴
とする。
本発明を一実施例にもとづき詳述するに先立ち本発明を
概略説明する。例えば「KAJという音節の標準バタン
を作成するときl rKAJと発声してもよく、また
[KAJを含む言葉9例えば[AKAsAKAJと発声
してこれよシ抽出してもよい。このとき A十KA+8A+KAと分離して発声をとられるCV音
節方式や。
概略説明する。例えば「KAJという音節の標準バタン
を作成するときl rKAJと発声してもよく、また
[KAJを含む言葉9例えば[AKAsAKAJと発声
してこれよシ抽出してもよい。このとき A十KA+8A+KAと分離して発声をとられるCV音
節方式や。
AKA+ASA十AKA という形でとられるVCV
音節方式が ある。ここで■は母音(Vowel) 、 Cは子音(
Conso−nait )を示す。
音節方式が ある。ここで■は母音(Vowel) 、 Cは子音(
Conso−nait )を示す。
本発明では例えば[K AJの標準バタンを作成すると
きl rKAJを含む種にの音節を多数入力する。
きl rKAJを含む種にの音節を多数入力する。
例えば[AKAj 「IKAj 「UKAJ [BKA
j 「0KAJ等の音節や「KA」そのものを複数の人
により多数入力し、それらの特徴を抽出し、これを「K
A」を含む第1比較グループとして格納しておく。また
[KAJを含まない9例えば「A8AJ jIsEJ
[U8El 「EsEJ [O8J [TABIJ l
”TUTEj・・・・・・をこれまた複数の人により多
数入力し、それらの特徴を抽出してこれを[KAJを含
まない第2比較グループとして格納しておく。それから
標準)くタン候補として[KAJを含む音節を入力する
。
j 「0KAJ等の音節や「KA」そのものを複数の人
により多数入力し、それらの特徴を抽出し、これを「K
A」を含む第1比較グループとして格納しておく。また
[KAJを含まない9例えば「A8AJ jIsEJ
[U8El 「EsEJ [O8J [TABIJ l
”TUTEj・・・・・・をこれまた複数の人により多
数入力し、それらの特徴を抽出してこれを[KAJを含
まない第2比較グループとして格納しておく。それから
標準)くタン候補として[KAJを含む音節を入力する
。
いま、標準バタン候補の特徴が第1図(イ)に示すもの
であり、上記第1比較グループの1つの音節の特徴が第
1図(ロ)に示すものとしたとき、いずれにも「KAj
が含まれているので、「KA」の部分については類似度
が非常に大きくなる。それで標準バタン候補の特徴を始
点TSoから終点TEOまでのLだけの区間切り出して
、これを第1グループの1つと比較する。このとき第1
図(ロ)に示す如く。
であり、上記第1比較グループの1つの音節の特徴が第
1図(ロ)に示すものとしたとき、いずれにも「KAj
が含まれているので、「KA」の部分については類似度
が非常に大きくなる。それで標準バタン候補の特徴を始
点TSoから終点TEOまでのLだけの区間切り出して
、これを第1グループの1つと比較する。このとき第1
図(ロ)に示す如く。
始点tsoから終点teOまでのLOの区間を抽出して
比較を行うことになるが、ダイナミックプログラミング
の手法等による伸縮を行ってもよく、比較を短時間で行
うためにL = Loの固定長(rKAjの長さの経験
則によ妙法める)として比較してもよい。
比較を行うことになるが、ダイナミックプログラミング
の手法等による伸縮を行ってもよく、比較を短時間で行
うためにL = Loの固定長(rKAjの長さの経験
則によ妙法める)として比較してもよい。
(実際は後述する如(、Lの長さは限定されず。
すべての範囲で比較する。)以下の記述は説明簡略のた
めに固定長として比較を行う例について説明する。
めに固定長として比較を行う例について説明する。
このT 86 % Teoのバタンともつとも一致した
第1図(ロ)の比較音節におけるある区分の類似度をM
Oとし2次に標準バタン候補のT Sl−Te、のバタ
ンともつとも一致した比較音節の類似度をMlとする。
第1図(ロ)の比較音節におけるある区分の類似度をM
Oとし2次に標準バタン候補のT Sl−Te、のバタ
ンともつとも一致した比較音節の類似度をMlとする。
このようにして標準バタン候補の始点と終点を順次移動
させて得られた各バタンに対して得られた上記類似度M
O,M、・・・・・・のうち、もつとも大きな類似度鳥
の部分が、第1図において斜線部として示す区分に相当
することになる。そしてこの区分は。
させて得られた各バタンに対して得られた上記類似度M
O,M、・・・・・・のうち、もつとも大きな類似度鳥
の部分が、第1図において斜線部として示す区分に相当
することになる。そしてこの区分は。
標準バタン候補とこの比較音節に共通に存在する1−K
AJの部分と判定することができる。
AJの部分と判定することができる。
このようにして標準バタン候補と第1比較グループの各
音節とを比較することによシ各音節毎に最大の類似度M
mO+ Mm+・・・・・・が得られることになる。
音節とを比較することによシ各音節毎に最大の類似度M
mO+ Mm+・・・・・・が得られることになる。
次に標準パタン候補と、第2比較グループの各音節とを
比較して、同様に類似度を求める。この場合、 [K
AJについては共通部分が存在しないので、当然類似度
は小さくなシ、屯し、類似度を距離で表現する場合には
、その距離は大きくなる。
比較して、同様に類似度を求める。この場合、 [K
AJについては共通部分が存在しないので、当然類似度
は小さくなシ、屯し、類似度を距離で表現する場合には
、その距離は大きくなる。
したがって、標準バタン候補のうち、第1比較グループ
とは類似度が大きく(つまり距離が小さ−)第2比較グ
ループとは類似度が小さい(つまシ距離が大きい)区分
を切り出せば、それが標準バタンとしては最適なものと
なる。
とは類似度が大きく(つまり距離が小さ−)第2比較グ
ループとは類似度が小さい(つまシ距離が大きい)区分
を切り出せば、それが標準バタンとしては最適なものと
なる。
本発明の一実施例を第2図〜第7図にもとづき説明する
。
。
第2図は本発明の一実施例構成図、第3図は標準バタン
用フレーム列、第4図は標準バタンと比較用バタンの比
較状態説明図、第5図及び第6図は本発明の動作説明フ
ローチャート、第7図は類似度分布状態説明図である。
用フレーム列、第4図は標準バタンと比較用バタンの比
較状態説明図、第5図及び第6図は本発明の動作説明フ
ローチャート、第7図は類似度分布状態説明図である。
図中、1はパラメータ抽出部、2は比較用バタン選択部
、6は比較用バタン同種グループ格納部。
、6は比較用バタン同種グループ格納部。
4は比較用バタン異種グループ格納部、5は標準バタン
候補選択部、6は類似度計算部、7は類似度分布計算部
、8はバッタチャリヤ距離計算部。
候補選択部、6は類似度計算部、7は類似度分布計算部
、8はバッタチャリヤ距離計算部。
9は最適標準バタン判定部である。
ここで比較用バタン同種グループ格納部(以下人格納部
という)3は2作成すべき標準パタ/と同じ音節を含む
音声の特徴が格納されるものでるり9例えば「KAJの
標準バタンを作成する場合には+ rKAJを含む[
AKAJ [IKAJ・・・・・・「KA、J等の音声
が複数の話者によシ入力されたときに抽出された特徴パ
ラメータが格納されている。
という)3は2作成すべき標準パタ/と同じ音節を含む
音声の特徴が格納されるものでるり9例えば「KAJの
標準バタンを作成する場合には+ rKAJを含む[
AKAJ [IKAJ・・・・・・「KA、J等の音声
が複数の話者によシ入力されたときに抽出された特徴パ
ラメータが格納されている。
また比較用バタン異種グループ格納部(以下B格納部と
いう)4は2作成すべき標準バタンと同じ音節を含まな
い音声の特徴が格納されるものでめり+ [KAJの
標準バタンを作成する場合には。
いう)4は2作成すべき標準バタンと同じ音節を含まな
い音声の特徴が格納されるものでめり+ [KAJの
標準バタンを作成する場合には。
[AsAJ [l5Ej 「TABIj・・・・・・等
の音声が複数の話者により入力されたときに抽出された
特徴パラメータが格納されている。ここでA格納部3と
B格納部4は別個の記憶装置を使用してもよく、同一記
憶装置の異なる記憶領域を使用してもよい。
の音声が複数の話者により入力されたときに抽出された
特徴パラメータが格納されている。ここでA格納部3と
B格納部4は別個の記憶装置を使用してもよく、同一記
憶装置の異なる記憶領域を使用してもよい。
以下本発明における第2図の回路の動作について具体的
に詳述する。
に詳述する。
(1) 音節CnVnの標準パタンを求めるに先立ち
。
。
このCnVゎを含む多数の音声を複数の話者によシ入力
してパラメータ抽出部1によシ特徴パラメータを抽出し
、比較用バタン選択部2を経由してA格納部3にこれら
の特徴パラメータを格納する。次にCnVllを含まな
い多数の音声をこれまた複数の話者により入力してパラ
メータ抽出部1により特徴パラメータを抽出し、同様に
してB格納部4に格納する。ここでA格納部6に格納さ
れたグループをAグループとし、B格納部4に格納され
たグループをBグループという。
してパラメータ抽出部1によシ特徴パラメータを抽出し
、比較用バタン選択部2を経由してA格納部3にこれら
の特徴パラメータを格納する。次にCnVllを含まな
い多数の音声をこれまた複数の話者により入力してパラ
メータ抽出部1により特徴パラメータを抽出し、同様に
してB格納部4に格納する。ここでA格納部6に格納さ
れたグループをAグループとし、B格納部4に格納され
たグループをBグループという。
(2) 次に音節CおVnを含む音節を標準バタン候
補として入力し、これをパラメータ抽出部1で特徴抽出
して得られた。第3図に示す如き標準バタン用フレーム
列(特徴パラメータの時系列)を比較用バタン選択部2
を経由して標準バタン候補選択部5に保持させる。この
標準バタン用フレーム列に始点Xと終点yを定め、全て
のXとyの組み合わせについて下記の如く上記Aグルー
プとBグループに属する比較用バタンと標準パタ/の最
大類似度を求める。この際、一般に比較用バタンの方が
標準パタンよりも短かいので、第4図に示す如く、上記
始点Xと終点yによシ抽出した標準パタンを比較用バタ
ンに沿ってフレーム毎にシフトさせ1部分部分の類似度
を求め、その最大値(すなわち距離の最小のところ)を
もって比較用パタンの類似度とする。ここで標準パタン
Xxyと比較用バタンX−Yの類似度をr8とし。
補として入力し、これをパラメータ抽出部1で特徴抽出
して得られた。第3図に示す如き標準バタン用フレーム
列(特徴パラメータの時系列)を比較用バタン選択部2
を経由して標準バタン候補選択部5に保持させる。この
標準バタン用フレーム列に始点Xと終点yを定め、全て
のXとyの組み合わせについて下記の如く上記Aグルー
プとBグループに属する比較用バタンと標準パタ/の最
大類似度を求める。この際、一般に比較用バタンの方が
標準パタンよりも短かいので、第4図に示す如く、上記
始点Xと終点yによシ抽出した標準パタンを比較用バタ
ンに沿ってフレーム毎にシフトさせ1部分部分の類似度
を求め、その最大値(すなわち距離の最小のところ)を
もって比較用パタンの類似度とする。ここで標準パタン
Xxyと比較用バタンX−Yの類似度をr8とし。
R= MAX(r4) (i =0 、1 、2・−・
・)をこの比較用パタンの類似度とする。
・)をこの比較用パタンの類似度とする。
但) このために第5図のフローチャートで示す如<、
msババタ用フレーム列におけるサーチ範囲x = X
、〜xz + Y = Y+〜y2を指定して、標準バ
タン候補選択部5にてまずx = x□+ Y = X
sの標準パタンを切り出し、これをAグループの比較バ
タンと類似度計算部乙において類似度を計算する。次に
Bグループの比較バタンと類似度を同様にして計算する
。これにより第7図に示す如く9人グループにおける類
似度の分布個数とBグループにおける類似度の分布個数
が類似度分布計算部6において求めることができる。そ
してこれにより、同じく類似度分布計算部6において人
グループ、Bグループの平均分散を推定、つまシ各分布
を正規分布と仮定した場合の平均値μ及び標準偏差σを
求めることができる。
msババタ用フレーム列におけるサーチ範囲x = X
、〜xz + Y = Y+〜y2を指定して、標準バ
タン候補選択部5にてまずx = x□+ Y = X
sの標準パタンを切り出し、これをAグループの比較バ
タンと類似度計算部乙において類似度を計算する。次に
Bグループの比較バタンと類似度を同様にして計算する
。これにより第7図に示す如く9人グループにおける類
似度の分布個数とBグループにおける類似度の分布個数
が類似度分布計算部6において求めることができる。そ
してこれにより、同じく類似度分布計算部6において人
グループ、Bグループの平均分散を推定、つまシ各分布
を正規分布と仮定した場合の平均値μ及び標準偏差σを
求めることができる。
(4) そしてこの人グループの平均値をμm、Bグ
ループの平均値をμ、としたとき2次式によりバッタチ
ャリヤ(Bhattacharyya )の距離へを求
める。
ループの平均値をμ、としたとき2次式によりバッタチ
ャリヤ(Bhattacharyya )の距離へを求
める。
そしてこれを上記指定した範囲のすべてにおいて求め、
Dlが最大となる( x + y )の組合せをもって
C,V、に対する最良の標準バタンフレーム列とする。
Dlが最大となる( x + y )の組合せをもって
C,V、に対する最良の標準バタンフレーム列とする。
(4ど なお、実際のBグループの分布は、必らずしも
正規分布をなすものとは限らず、第8図に示す如く1人
グループに近い状態の分布B、、B2.B3・・・・・
・と9人グループから遠い状態の分布BB 、 131
+11Bll+2・・・・・・のような分布を成す場合
もある。これは「KAJの標準パタンを求めるときにB
グループとして「8AJ 、 「NAJ・・・・・・
というように例えば母音が類似したものについてはB、
、B、・・・・・・の如き状態となりl rGIj
、 rDOJ・・・・・・ というようなものについて
はBll I Bll+1・・・・・・の如き状態とな
る。したがって、第8図のような場合に、Aグループに
もつとも近い集団B、 、 B、・・・・・・を正規分
布とみなしてDi+を計算して最良の標準パタンを求め
るものとする。
正規分布をなすものとは限らず、第8図に示す如く1人
グループに近い状態の分布B、、B2.B3・・・・・
・と9人グループから遠い状態の分布BB 、 131
+11Bll+2・・・・・・のような分布を成す場合
もある。これは「KAJの標準パタンを求めるときにB
グループとして「8AJ 、 「NAJ・・・・・・
というように例えば母音が類似したものについてはB、
、B、・・・・・・の如き状態となりl rGIj
、 rDOJ・・・・・・ というようなものについて
はBll I Bll+1・・・・・・の如き状態とな
る。したがって、第8図のような場合に、Aグループに
もつとも近い集団B、 、 B、・・・・・・を正規分
布とみなしてDi+を計算して最良の標準パタンを求め
るものとする。
またこのとき各集団Bl、B2・・・・・・とAグルー
プとのバッタチャリヤの距離DB、 、 D、2・・・
・・・を求め、その調和平均 をもってBグループのDlと定めることもできる。
プとのバッタチャリヤの距離DB、 、 D、2・・・
・・・を求め、その調和平均 をもってBグループのDlと定めることもできる。
なお、上記標準バタンは1回の入力音声より切出しても
よいし、複数の入力音声より標準バタンを切出してもよ
い。
よいし、複数の入力音声より標準バタンを切出してもよ
い。
それから本発明は、不特定話者認識に対する標準バタン
の抽出のみに限定されるものではなく。
の抽出のみに限定されるものではなく。
特定話者を対象とした登録バタンを作成するときでも勿
論適用できるものである。
論適用できるものである。
勿論バタンの切出しを効率的にするために簡単な特徴を
つかんでその近くを重点的に類似度を求めるというよう
な、あらかじめ既知のガイドを与えて、検出速度を早め
ることもできる。
つかんでその近くを重点的に類似度を求めるというよう
な、あらかじめ既知のガイドを与えて、検出速度を早め
ることもできる。
本発明によれば、複数の話者にもとづき多数の比較用デ
ータを用意して、これにもとづき最適の標準バタンを自
動的に抽出することができるので。
ータを用意して、これにもとづき最適の標準バタンを自
動的に抽出することができるので。
認識精度の高い結果を得ることができる標準バタンを非
常に簡単に求めることが可能となる。
常に簡単に求めることが可能となる。
第1図轢本発明の概略説明図、第2図は本発明の一実施
例構成図、第3図は標準バタン用フレーム列、第4図は
標準バタンと比較用バタンの比較状態説明図、第5図及
び第6図は本発明の動作説明7目−チャード、第7図及
び第8図は類似度分布状態説明図である。 図中、1はパラメータ抽出部、2線比較用バタン選択部
、3は比較用バタン同種グループ格納部。 4は比較用バタン異種グループ格納部、5は標準バタン
候補選択部、6は類似度計算部、7は類似度分布計算部
、8はバッタチャリヤ距離計算部。 9社最適標準バタン判定部である。 特許出願人 藤 崎 博 也(外1名)代理人弁理士
山 谷 晧 榮 答7図 イI!l廖〈(A) 第8(2]
例構成図、第3図は標準バタン用フレーム列、第4図は
標準バタンと比較用バタンの比較状態説明図、第5図及
び第6図は本発明の動作説明7目−チャード、第7図及
び第8図は類似度分布状態説明図である。 図中、1はパラメータ抽出部、2線比較用バタン選択部
、3は比較用バタン同種グループ格納部。 4は比較用バタン異種グループ格納部、5は標準バタン
候補選択部、6は類似度計算部、7は類似度分布計算部
、8はバッタチャリヤ距離計算部。 9社最適標準バタン判定部である。 特許出願人 藤 崎 博 也(外1名)代理人弁理士
山 谷 晧 榮 答7図 イI!l廖〈(A) 第8(2]
Claims (5)
- (1) 未知入力音声の認識を予め登録されたC■。 ■C■等の音節バタン照合に基づき行う音声認識システ
ムにおいて、特定音節標準バタン候補と同一音節を含む
複数の音声データを保持する第1音声データ格納部と、
特定標準バタン候補と同一音節を含まない複数の音声デ
ータを保持する第2音声データ格納部と、音節の類似度
を演算する類似度演算手段を設け、上記類似度演算手段
により特定音節標準バタン候補と、上記第1音声データ
格納部及び第2音声データ格納部からそれぞれ出力した
音声データとの類似度を求め、第1音声データ格納部か
ら出力した音声データとの類似度分布と第2音声データ
格納部から出力された音声データとの類似度分布との隔
たりがもつとも大きくなるように上記音節標準バタン候
補を区切りこれを上記特定音節の標準バタンとすること
により特定音節を含む音声データから該音節標準バタン
を得るようにしたことを特徴とする音声標準バタン作成
方式。 - (2) 上記隔たりの指標として、各分布を正規分布
と仮定した場合の平均値、標準偏差に基づく値を用いる
ようにしたことを特徴とする特許請求の範囲第1項記載
の音声標準バタン作成方式。 - (3) 上記隔たシの指標としてBhattacha
rrya の距離とすることを特徴とする特許請求の範
囲第1項記載の音声標準バタン作成方式。 - (4) 上記隔たりの指標を求めるときに異種バタン
間類似度の分布を複数の類からなる正規分布とみなし、
隔たりの少ない類の分布のみについて平均値、標準偏差
に基づく値を用いたり、あるいはBhattachar
rya の距離を求めるようにしたことを特徴とする特
許請求の範囲第1項記載の音声標準バタン作成方式。 - (5)上記隔たりの指標を求めるため、上記異種バタン
間類似度の分布を複数の類からなる正規分布とみなし、
それぞれの類の分布について上記13hattacha
rrya の距離を求め、該距離の少ない類のその平均
値乃至調和平均値、又は該距離の調和平均値を上記指標
とすることを特徴とする特許請求の範囲第1項記載の音
声標準バタン作成方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58047624A JPS59172694A (ja) | 1983-03-22 | 1983-03-22 | 音声標準パタン作成方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58047624A JPS59172694A (ja) | 1983-03-22 | 1983-03-22 | 音声標準パタン作成方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59172694A true JPS59172694A (ja) | 1984-09-29 |
| JPH0130160B2 JPH0130160B2 (ja) | 1989-06-16 |
Family
ID=12780365
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58047624A Granted JPS59172694A (ja) | 1983-03-22 | 1983-03-22 | 音声標準パタン作成方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59172694A (ja) |
-
1983
- 1983-03-22 JP JP58047624A patent/JPS59172694A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0130160B2 (ja) | 1989-06-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Etman et al. | Language and dialect identification: A survey | |
| US5218668A (en) | Keyword recognition system and method using template concantenation model | |
| US5018201A (en) | Speech recognition dividing words into two portions for preliminary selection | |
| Sethu et al. | Speaker normalisation for speech-based emotion detection | |
| JPS59121100A (ja) | 連続音声認識装置 | |
| Sharma et al. | Speech recognition in Kannada using HTK and julius: a comparative study | |
| Kalinli | Analysis of Multi-Lingual Emotion Recognition Using Auditory Attention Features. | |
| Kalinli | Automatic Phoneme Segmentation Using Auditory Attention Features. | |
| JPS59172694A (ja) | 音声標準パタン作成方式 | |
| JPH0774960B2 (ja) | テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム | |
| JP2943445B2 (ja) | 音声認識方法 | |
| KR100304665B1 (ko) | 피치 웨이브 특성을 이용한 음성 인식 장치 및 그 방법 | |
| Jančovič et al. | Automatic detection of bird species from audio field recordings using HMM-based modelling of frequency tracks | |
| JP2943473B2 (ja) | 音声認識方法 | |
| JP3277522B2 (ja) | 音声認識方法 | |
| JPH0619497A (ja) | 音声認識方法 | |
| JP3291073B2 (ja) | 音声認識方式 | |
| JP2529207B2 (ja) | 音韻認識装置 | |
| JPS60147797A (ja) | 音声認識装置 | |
| JPH0554116B2 (ja) | ||
| JPH11190997A (ja) | 音声認識のための標準パターン作成方法およびその方法を実施するための標準パターン作成用の制御プログラムの記録媒体、ならびにその方法を用いた標準パターン作成装置 | |
| Wang et al. | Automatic segmentation and alignment of continuous speech based on the temporal decomposition model | |
| JP3430265B2 (ja) | 日本語音声認識方法 | |
| JPH0473694A (ja) | 日本語音声認識方法 | |
| JPH0632006B2 (ja) | 音声認識装置 |