JPH01260499A - 子音認識法 - Google Patents
子音認識法Info
- Publication number
- JPH01260499A JPH01260499A JP63089829A JP8982988A JPH01260499A JP H01260499 A JPH01260499 A JP H01260499A JP 63089829 A JP63089829 A JP 63089829A JP 8982988 A JP8982988 A JP 8982988A JP H01260499 A JPH01260499 A JP H01260499A
- Authority
- JP
- Japan
- Prior art keywords
- consonant
- power
- phoneme
- discriminant
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音素認識を行なうことを特徴とする音素認識方
法における子音の認識法に関するものである。
法における子音の認識法に関するものである。
従来の技術
最近、子音の認識法は音声認識の分野で盛んに利用され
るようになってきた。この子音認識法は、例、t、ば「
音声スペクトルの概略形とその動特性を利用した単語音
声認識システム」(日本音響学会誌34巻3号197B
)に記載されている構成が知られている。
るようになってきた。この子音認識法は、例、t、ば「
音声スペクトルの概略形とその動特性を利用した単語音
声認識システム」(日本音響学会誌34巻3号197B
)に記載されている構成が知られている。
以下、第13図及び第14図を参照して従来の子音認識
法について説明する。
法について説明する。
まず最初に入力音声を音素単位に分けて音素の1組合わ
せとして認識しく音素認識と呼ぶ)音素単位で表記され
た単語辞書との類似度を求めて認識結果を出力する従来
の単語認識装置の機能ブロック図を第13図に示す。ま
ず、あらかじめ多数話者の音声を1フレーム(1フレー
ムは10rns・Cとする)毎に音響分析部1によって
フィルタ・バンクを用いて分析し、得られたスペクトル
情報をもとに特徴抽出部2によって特徴パラメータを求
める。この特徴パラメータから5母音や子音の音素グル
ープ毎に標準パターンを作成して標準パターン登録部3
に登録しておく。実際に認識を行なう場合においては、
特徴抽出部2によって求められた特徴パラメータを用い
てセグメンテーション部4において子音のセグメンテー
ションを行なう。
せとして認識しく音素認識と呼ぶ)音素単位で表記され
た単語辞書との類似度を求めて認識結果を出力する従来
の単語認識装置の機能ブロック図を第13図に示す。ま
ず、あらかじめ多数話者の音声を1フレーム(1フレー
ムは10rns・Cとする)毎に音響分析部1によって
フィルタ・バンクを用いて分析し、得られたスペクトル
情報をもとに特徴抽出部2によって特徴パラメータを求
める。この特徴パラメータから5母音や子音の音素グル
ープ毎に標準パターンを作成して標準パターン登録部3
に登録しておく。実際に認識を行なう場合においては、
特徴抽出部2によって求められた特徴パラメータを用い
てセグメンテーション部4において子音のセグメンテー
ションを行なう。
この結果をもとに、音素判別部5において、標準パター
ン登錬部3の標準パターンと照合することによって音素
を決定する。最後に、この結果作成した音素の時系列を
単語認識部6に送り、同様に音素の時系列で表現された
単語辞書7と最も類似度の大きい項目に該当する単語を
認識結果として出力する。
ン登錬部3の標準パターンと照合することによって音素
を決定する。最後に、この結果作成した音素の時系列を
単語認識部6に送り、同様に音素の時系列で表現された
単語辞書7と最も類似度の大きい項目に該当する単語を
認識結果として出力する。
ここで、セグメンテーションは第14図のように全域パ
ワーの時間的変化8の形が凹状の形をしている時(これ
をデイツプと呼ぶ)、パワーが極小値を示すフレームを
01 とし、nl の前後のフレームでパワーの時間に
よる変化速度9(これをパワーの差分値と呼ぶ)が負お
よび正の極大値を示すフレームをn2.n3とする。ま
た、あるフレームnにおける差分値をWD(n)とする
と、wo (n )、 wo(n 3 )
がノW D (n 2 )≦θW W D (n 3 )≦θW の条件を満足する時、n2〜n3までの区間を子音区間
とする。ここで、Owは子音の付加を防ぐためのいき値
である。
ワーの時間的変化8の形が凹状の形をしている時(これ
をデイツプと呼ぶ)、パワーが極小値を示すフレームを
01 とし、nl の前後のフレームでパワーの時間に
よる変化速度9(これをパワーの差分値と呼ぶ)が負お
よび正の極大値を示すフレームをn2.n3とする。ま
た、あるフレームnにおける差分値をWD(n)とする
と、wo (n )、 wo(n 3 )
がノW D (n 2 )≦θW W D (n 3 )≦θW の条件を満足する時、n2〜n3までの区間を子音区間
とする。ここで、Owは子音の付加を防ぐためのいき値
である。
つぎに、この子音区間に対してフレーム毎に音素の特徴
を示す特徴パラメータを求め、あらかし用意されている
各音素の標準パターンと比較してフレーム毎に子音分類
を行なう。この結果を子音分類ツリーに適用して、条件
の一致したものに子音を分類する。
を示す特徴パラメータを求め、あらかし用意されている
各音素の標準パターンと比較してフレーム毎に子音分類
を行なう。この結果を子音分類ツリーに適用して、条件
の一致したものに子音を分類する。
発明が解決しようとする課題
しかし、以上のような構成では、最初にパワーディップ
を用いて語中子音のセグメンテーションを行ない、つぎ
にフレーム毎に子音分類を行なう。
を用いて語中子音のセグメンテーションを行ない、つぎ
にフレーム毎に子音分類を行なう。
そして、最後にフレーム毎の子音分類の結果を子音分類
ツリーにあてはめて、条件の一致したものに子音を分類
するために非常にアルゴリズムも複雑で手間のかかると
いう課題があった。また、パワー情報として全域パワー
だけを使用しているために子音のセグメンテーション精
度も悪いという課題もあった。
ツリーにあてはめて、条件の一致したものに子音を分類
するために非常にアルゴリズムも複雑で手間のかかると
いう課題があった。また、パワー情報として全域パワー
だけを使用しているために子音のセグメンテーション精
度も悪いという課題もあった。
本発明は従来技術の以上のような課題を解決するもので
、入力音声の子音の大分類と認識をきわめて簡単に精度
良く行なうことを目的とするものである。
、入力音声の子音の大分類と認識をきわめて簡単に精度
良く行なうことを目的とするものである。
課題を解決するための手段
本発明は、入力音声スペクトルの低域パワーと高域パワ
ーのデイツプの大きさを後続母音別の判別図に適用し4
つの子音群といくつかの中間領域に分類することによっ
て上記目的を達成するものである。
ーのデイツプの大きさを後続母音別の判別図に適用し4
つの子音群といくつかの中間領域に分類することによっ
て上記目的を達成するものである。
作 用
本発明は上記構成により、低域パワーと高域パワーのデ
イツプの大きさを後続母音別の判別図に適用することに
よって、子音の大分類が簡単に精度良く行なえ、しかも
認識率を向上させることができる。
イツプの大きさを後続母音別の判別図に適用することに
よって、子音の大分類が簡単に精度良く行なえ、しかも
認識率を向上させることができる。
実施例
以下、図面を参照しながら本発明の実施例について説明
する。
する。
本実施例では、音素/p/、/l/、/に/、/c/。
/b/、/d/、/m/、/n/、/s/、/h/を無
音破裂音(/p/、/l/、/に/、/c/)、有音破
裂音(/b/。
音破裂音(/p/、/l/、/に/、/c/)、有音破
裂音(/b/。
/d/’t、鼻音(/rn/ 、 /n/ ) 、無声
摩擦音(/、/。
摩擦音(/、/。
/h/)の4つの音素群と、各音素群の境界付近は中間
領域として子音を大分類認識する場合の例を説明する。
領域として子音を大分類認識する場合の例を説明する。
以下、図面を参照しながら本発明の実施例について説明
する。
する。
第1図は本発明の一実施例における子音認識法を具現化
する機能ブロック図である。第1図において、10はパ
ワーディップ検出部、11はパワーディップの大きさ抽
出部で、パワーディップ検出部10により検出されたデ
イツプの大きさを求める。12はフレーム毎の母音認識
部で、パワーディップ検出部10により検出されたデイ
ツプの終端からフレーム毎に母音認識を行なう。13は
後続母音認識部で、フレーム毎の母音認識部12により
得られたフレーム毎の母音認識結果から後続母音の認識
を行なう。14は判別図選択部で、後続母音認識部13
で認識した後続母音用の判別図を後続母音別判別図格納
部15から選択する。
する機能ブロック図である。第1図において、10はパ
ワーディップ検出部、11はパワーディップの大きさ抽
出部で、パワーディップ検出部10により検出されたデ
イツプの大きさを求める。12はフレーム毎の母音認識
部で、パワーディップ検出部10により検出されたデイ
ツプの終端からフレーム毎に母音認識を行なう。13は
後続母音認識部で、フレーム毎の母音認識部12により
得られたフレーム毎の母音認識結果から後続母音の認識
を行なう。14は判別図選択部で、後続母音認識部13
で認識した後続母音用の判別図を後続母音別判別図格納
部15から選択する。
16は大分類判定部で、判別図選択部14で選択された
判別図を用いて子音の大分類の判定を行なう。標準パタ
ーン選択部17では、大分類判定部16の大分類の結果
から必要な標準パターンを標準パターン格納部18から
取り出して子音認識部19で標準パターンとマツチング
を行ない子音の認識を行なう。
判別図を用いて子音の大分類の判定を行なう。標準パタ
ーン選択部17では、大分類判定部16の大分類の結果
から必要な標準パターンを標準パターン格納部18から
取り出して子音認識部19で標準パターンとマツチング
を行ない子音の認識を行なう。
以上のような構成において、以下その動作を説明する。
本発明では、特徴パラメータとして低域パワー・高域パ
ワーを使用する。有声子音は高域パワーに、無声子音は
低域パワーにパワーディップが現われやすい。
ワーを使用する。有声子音は高域パワーに、無声子音は
低域パワーにパワーディップが現われやすい。
したがって、低域・高域パワーを併用することによりす
べての子音に対応出来るようになる。また、パワーディ
ップの大きさは後続母音の影響をを受けるので、後続母
音別に判別図を作成すると精度が向上する。
べての子音に対応出来るようになる。また、パワーディ
ップの大きさは後続母音の影響をを受けるので、後続母
音別に判別図を作成すると精度が向上する。
次に具体的に説明をすると、まず最初に低域パワーと高
域パワーからパワーディップを検出しデイツプの大きさ
を求める。このパワーディップの大きさの求め方を第2
図(a)、 (b)で説明する。図において高域パワー
の時間的変化速度21が正の極大値になるフレームをn
l %低域パワーの時間的変化速度23が正の極大値に
なるフレームをn2とする。この各フレームにおける変
化速度の大きさをWD (n 1) 、WD (n 2
)とする。低域パワーディップの大きさPLと高域パ
ワーディップの大きさPHを PH= WD (nl ) PL=WD(n2) のように定義をする。
域パワーからパワーディップを検出しデイツプの大きさ
を求める。このパワーディップの大きさの求め方を第2
図(a)、 (b)で説明する。図において高域パワー
の時間的変化速度21が正の極大値になるフレームをn
l %低域パワーの時間的変化速度23が正の極大値に
なるフレームをn2とする。この各フレームにおける変
化速度の大きさをWD (n 1) 、WD (n 2
)とする。低域パワーディップの大きさPLと高域パ
ワーディップの大きさPHを PH= WD (nl ) PL=WD(n2) のように定義をする。
このデイツプの大きさを用いて、無声破裂音(/p/、
/l/、/に/、/c/)、有声破裂音(/b/。
/l/、/に/、/c/)、有声破裂音(/b/。
/d/)、鼻音C/m/、/、/>、無声摩擦音C/m
/。
/。
/h/)の場合のPLとPHの分布を調べると第3図〜
第6図のようになる。図において横軸がPL縦軸がPH
で図中の数字は音素の出現個数を表わしている。図から
明らかなように破裂性を示す音素はPL、PHともに大
きく、とくに無声破裂音はPLが大きく、有声破裂音は
PHが大きい。また、破裂性を示さない音素はPL、P
Hとも小さいが、有声子音か無声子音かによって第5図
、第6図のように分かれる。
第6図のようになる。図において横軸がPL縦軸がPH
で図中の数字は音素の出現個数を表わしている。図から
明らかなように破裂性を示す音素はPL、PHともに大
きく、とくに無声破裂音はPLが大きく、有声破裂音は
PHが大きい。また、破裂性を示さない音素はPL、P
Hとも小さいが、有声子音か無声子音かによって第5図
、第6図のように分かれる。
したがって、低域と高域のパワーディップの大きさを使
用することによって子音の大分類を行なうことが出来る
。各音素群に対して、PL −PHをパラメータとして
分散共分散、平均値からなる標準パターンを作成し、あ
らかじめ各入力に対して最も類似度の高い音素群に判別
を行なう判別図を作成する。この判別図を用いて子音を
4つの音素群に大分類をすると判別図の境界付近で誤分
類ができる。この例の場合(/p/、/i/、/に/、
/c/)が(/b/、/d/)に約7%、(/b/、/
4/)が(、’p/、/l/、/に/、/c/) に
約8.3%程度誤まって分類される。このままでは、判
別図で大分類を誤まると誤まった音素群で標準パターン
とマツチングを行なうので正しく認識が出来なくなる。
用することによって子音の大分類を行なうことが出来る
。各音素群に対して、PL −PHをパラメータとして
分散共分散、平均値からなる標準パターンを作成し、あ
らかじめ各入力に対して最も類似度の高い音素群に判別
を行なう判別図を作成する。この判別図を用いて子音を
4つの音素群に大分類をすると判別図の境界付近で誤分
類ができる。この例の場合(/p/、/i/、/に/、
/c/)が(/b/、/d/)に約7%、(/b/、/
4/)が(、’p/、/l/、/に/、/c/) に
約8.3%程度誤まって分類される。このままでは、判
別図で大分類を誤まると誤まった音素群で標準パターン
とマツチングを行なうので正しく認識が出来なくなる。
そこで、音素群の境界付近に中間領域を設定し、この中
間領域に分類された子音は隣接する音素群の両方の標準
パターンとマツチングを行ない子音の認識を行なうこと
によって認識率を向上させる。
間領域に分類された子音は隣接する音素群の両方の標準
パターンとマツチングを行ない子音の認識を行なうこと
によって認識率を向上させる。
第7図に判別図の例を示す。図において横軸が低域、縦
軸が高域パワーディップの大きさである。
軸が高域パワーディップの大きさである。
実線で4つの領域に区切ったのが中間減額のない場合の
判別境界である。点線で囲んだI−4の領域が中間領域
である。子音区間のパワーディップの大きさがこの中間
領域に入った場合は、隣接する音素群の音素標準パター
ンとマツチングを行なう。中間領域Iは(/p/、/l
/、/に/、/c/、/b/。
判別境界である。点線で囲んだI−4の領域が中間領域
である。子音区間のパワーディップの大きさがこの中間
領域に入った場合は、隣接する音素群の音素標準パター
ンとマツチングを行なう。中間領域Iは(/p/、/l
/、/に/、/c/、/b/。
/d/)、1は(/p/ 、/l/ 、/に/ 、/c
/ 、/s/ 。
/ 、/s/ 。
/h/) 、 Itは(/b/、/d/、/、/、/h
/)、 IVは(/b/、/c+/、/m/、/n/)
、V は (/m/、/、/。
/)、 IVは(/b/、/c+/、/m/、/n/)
、V は (/m/、/、/。
/3/、/h/)の音素標準パターンとマツチングを行
なう。中間領域以外の4つの音素群lζ対しては、それ
ぞれの音素群の標準パターンとマツチングを行なう。
なう。中間領域以外の4つの音素群lζ対しては、それ
ぞれの音素群の標準パターンとマツチングを行なう。
また、後続母音別にパワーディップの大きさを調べてみ
ると同じ子音でもデイツプの大きさが違うことがわかる
。そこで、子音セグメンテーション精度を向上させるた
めに後続母音情報を利用し、後続母音別に子音の大分類
を行なう。例として音素/ r /の場合の後続母音別
のパワーの時間的変化パターンを第8図〜第12図に示
す。第8図は/、a/、第9図は/rl/、第10図は
/、u/、 第11図は/、6/、第12図は/「0
/の場合を示す。
ると同じ子音でもデイツプの大きさが違うことがわかる
。そこで、子音セグメンテーション精度を向上させるた
めに後続母音情報を利用し、後続母音別に子音の大分類
を行なう。例として音素/ r /の場合の後続母音別
のパワーの時間的変化パターンを第8図〜第12図に示
す。第8図は/、a/、第9図は/rl/、第10図は
/、u/、 第11図は/、6/、第12図は/「0
/の場合を示す。
図において横軸が時間、縦軸がパワーの大きさ、実線が
パワーの時間的変化、点線がパワーの時間的変化速度、
PLが低域パワー、PHが高域パワーの動きを示す。ま
た第3図から順に後続母音が/a/、/I/、/、/、
/、s/、10/になっている。デイツプの大きさを後
続母音別に見ると、/U/。
パワーの時間的変化、点線がパワーの時間的変化速度、
PLが低域パワー、PHが高域パワーの動きを示す。ま
た第3図から順に後続母音が/a/、/I/、/、/、
/、s/、10/になっている。デイツプの大きさを後
続母音別に見ると、/U/。
10/(第10図、第12図)の時の高域パワーディッ
プの大きさが他の後続母音(/a/、/I/。
プの大きさが他の後続母音(/a/、/I/。
/e/)よりも小さいことがわかる。これは、母音によ
ってパワーが少しずつ違うために子音から母音へのパワ
ーの時間的変化速度に差が出てくるためである。/「/
以外の子音についても同様にパワーの時間的変化を調べ
てみると、後続母音によってパワーディップの大きさが
違うことがわかる。
ってパワーが少しずつ違うために子音から母音へのパワ
ーの時間的変化速度に差が出てくるためである。/「/
以外の子音についても同様にパワーの時間的変化を調べ
てみると、後続母音によってパワーディップの大きさが
違うことがわかる。
したがって、低域と高域のパワーディップの大きさを使
用し後続母音別に子音の大分類を行なえば精度が向上す
る。後続母音の認識は、入力音声データと、あらかじめ
多くのデータから作成した5母音の標準パターンとの類
似度計算によりフレームごとに認識している。第2図(
0)にフレーム毎の第1位と2位の母音認識結果を示す
。簡単に後続母音を判定するために、例えば子音区間候
補の後5フレームにおける母音認識結果を使用し、第1
位に認識された場合2点、第2位で認識された場合1点
として、5フレームの中で各母音別に集計し最も点数の
高い音素を認識結果とする。(第2図では/e/が最も
点数が高い) 以上述べた方法により、特徴パラメータである低域パワ
ーと高域パワーディップの大きさを、あらかじめ多くの
音声データからサンプルを求め4つの各音素群に判別す
る判別図を作成する。この判別図の各音素群の境界に中
間領域を設定し、この中間領域に入った場合には、隣接
する両方の音素群の標準パターンとマツチングを行ない
子音の認識を行なう。またフレーム毎の母音認識結果か
ら後続母音の判定を行ない、その母音用の判別図を適用
する。
用し後続母音別に子音の大分類を行なえば精度が向上す
る。後続母音の認識は、入力音声データと、あらかじめ
多くのデータから作成した5母音の標準パターンとの類
似度計算によりフレームごとに認識している。第2図(
0)にフレーム毎の第1位と2位の母音認識結果を示す
。簡単に後続母音を判定するために、例えば子音区間候
補の後5フレームにおける母音認識結果を使用し、第1
位に認識された場合2点、第2位で認識された場合1点
として、5フレームの中で各母音別に集計し最も点数の
高い音素を認識結果とする。(第2図では/e/が最も
点数が高い) 以上述べた方法により、特徴パラメータである低域パワ
ーと高域パワーディップの大きさを、あらかじめ多くの
音声データからサンプルを求め4つの各音素群に判別す
る判別図を作成する。この判別図の各音素群の境界に中
間領域を設定し、この中間領域に入った場合には、隣接
する両方の音素群の標準パターンとマツチングを行ない
子音の認識を行なう。またフレーム毎の母音認識結果か
ら後続母音の判定を行ない、その母音用の判別図を適用
する。
発明の効果
以上のように本発明は低域パワーディップと高域パワー
ディップの大きさを判別図に適用し4つの音素群と中間
領域に分類し、認識の対象となる音素標準パターンとマ
ツチングすることにより精度良く子音の認識を行なうこ
とが出来る。これは、パラメータとして低域パワーと高
域パワーを併用しているので、高域パワーにパワーディ
ップのあられれやすい有声子音と低減パワーにパワーデ
ィップのあられれやすい無声子音の両方に対して有効に
作用しているためである。判別図の中に中間領域を設定
しこの領域に判別された子音については隣接する音素群
の両方の音素標準パターンと認識することによって、判
別図の境界付近で誤まって分類される子音の認識率を向
上させることができるようになった。また、後続母音別
に判別図を作成しているのでより精度の高い判別図の作
成ができる。以上述べたように、本発明の方法を用いる
ことにより子音の認識を精度良く行なえるようになり、
その効果も大きい。
ディップの大きさを判別図に適用し4つの音素群と中間
領域に分類し、認識の対象となる音素標準パターンとマ
ツチングすることにより精度良く子音の認識を行なうこ
とが出来る。これは、パラメータとして低域パワーと高
域パワーを併用しているので、高域パワーにパワーディ
ップのあられれやすい有声子音と低減パワーにパワーデ
ィップのあられれやすい無声子音の両方に対して有効に
作用しているためである。判別図の中に中間領域を設定
しこの領域に判別された子音については隣接する音素群
の両方の音素標準パターンと認識することによって、判
別図の境界付近で誤まって分類される子音の認識率を向
上させることができるようになった。また、後続母音別
に判別図を作成しているのでより精度の高い判別図の作
成ができる。以上述べたように、本発明の方法を用いる
ことにより子音の認識を精度良く行なえるようになり、
その効果も大きい。
第1図は、本発明の一実施例における子音認識法を具現
化する機能のブロック図、第2図は、本実施例のパワー
ディップの説明図、第3図〜第7図は本実施例における
無声破裂音・有声破裂音・鼻音・無声摩擦音のパワーデ
ィップの分布図、第8図〜第12図は、本実施例におけ
る/r a/ 、 /r +/。 /、u/、/、e/、/ro/とそれぞれ語中で発声し
たパワーの時間的変化と変化速度を示した図、第13図
は従来の単語認識システムのブロック図、第14図は従
来の子音セグメンテーション法の説明図である。 10・・・・・・パワーディップ検出部、11・・・・
・・パワーディップの大きさ抽出部、12・・・・・・
フレーム毎の母音認識部、13・・・・・・後続母音認
識部、14・・・・・・判別図選択部、15・・・・・
・後続母音側判別図格納部、16・・・・・・大分類判
定部、17・・・・・・標準パターン選択部、18・・
・・・・標準パターン格納部、19・・・・・・子音認
識部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第7図 PL→ 第8図 第91m 第10図 第110 第12図
化する機能のブロック図、第2図は、本実施例のパワー
ディップの説明図、第3図〜第7図は本実施例における
無声破裂音・有声破裂音・鼻音・無声摩擦音のパワーデ
ィップの分布図、第8図〜第12図は、本実施例におけ
る/r a/ 、 /r +/。 /、u/、/、e/、/ro/とそれぞれ語中で発声し
たパワーの時間的変化と変化速度を示した図、第13図
は従来の単語認識システムのブロック図、第14図は従
来の子音セグメンテーション法の説明図である。 10・・・・・・パワーディップ検出部、11・・・・
・・パワーディップの大きさ抽出部、12・・・・・・
フレーム毎の母音認識部、13・・・・・・後続母音認
識部、14・・・・・・判別図選択部、15・・・・・
・後続母音側判別図格納部、16・・・・・・大分類判
定部、17・・・・・・標準パターン選択部、18・・
・・・・標準パターン格納部、19・・・・・・子音認
識部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第7図 PL→ 第8図 第91m 第10図 第110 第12図
Claims (4)
- (1)音素認識を行なうことを特徴とする音声認識方法
において、音声スペクトルの低域パワーと高域パワーを
求めそれぞれの時間的変化によって生じるパワーディッ
プの大きさを抽出し、これらを後続母音別にあらかじめ
作成してある判別図に適用することによって子音をいく
つかの子音群と中間領域に分類し、子音群に対しては各
子音群の音素標準パターンとマッチングを行ない、中間
領域に対しては隣接する子音群の両方の音素標準パター
ンとマッチングを行なうことを特徴とする子音認識法。 - (2)パワーディップの大きさとして、パワーが子音か
ら後続母音へと変化する時の時間的変化速度の大きさを
パワーディップの大きさとして抽出することを特徴とす
る請求項1記載の子音認識法。 - (3)判別図の作成方法としては、あらかじめ多くのデ
ータに基づき各子音群に現われたパワーディップの大き
さから分布を求め、あらかじめ予想される入力データす
べてに対して判別結果を判別図として表現して使用する
ことを特徴とする請求項1記載の子音認識法。 - (4)判別図の境界付近には中間領域を設定し判別図に
よる誤まりを減少させることを特徴とする請求項1記載
の子音認識法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63089829A JPH01260499A (ja) | 1988-04-12 | 1988-04-12 | 子音認識法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63089829A JPH01260499A (ja) | 1988-04-12 | 1988-04-12 | 子音認識法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01260499A true JPH01260499A (ja) | 1989-10-17 |
Family
ID=13981647
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63089829A Pending JPH01260499A (ja) | 1988-04-12 | 1988-04-12 | 子音認識法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01260499A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007219188A (ja) * | 2006-02-17 | 2007-08-30 | Kyushu Univ | 子音加工装置、音声情報伝達装置及び子音加工方法 |
-
1988
- 1988-04-12 JP JP63089829A patent/JPH01260499A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007219188A (ja) * | 2006-02-17 | 2007-08-30 | Kyushu Univ | 子音加工装置、音声情報伝達装置及び子音加工方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS6336676B2 (ja) | ||
| JPH02195400A (ja) | 音声認識装置 | |
| JPS5972496A (ja) | 単音識別装置 | |
| CN101292283A (zh) | 声音判别系统、声音判别方法以及声音判别用程序 | |
| Kalinli | Automatic Phoneme Segmentation Using Auditory Attention Features. | |
| EP0109140B1 (en) | Recognition of continuous speech | |
| JPH01260499A (ja) | 子音認識法 | |
| JPH01260500A (ja) | 子音認識法 | |
| JPH0283595A (ja) | 音声認識方法 | |
| JP2744622B2 (ja) | 破裂子音識別方式 | |
| JPH0316040B2 (ja) | ||
| JPH0283599A (ja) | 子音認識方法 | |
| JPS63220297A (ja) | 子音のセグメンテ−シヨン・分類法 | |
| Abdelatty Ali et al. | An acoustic-phonetic feature-based system for the automatic recognition of fricative consonants | |
| Kim et al. | Achieving real-time lip-synch via SVM-based phoneme classification and lip shape refinement | |
| JPS63161499A (ja) | 音声認識装置 | |
| Mengistu et al. | Text independent amharic language dialect recognition using neuro-fuzzy gaussian membership function | |
| Elghonemy et al. | Speaker independent isolated Arabic word recognition system | |
| JPS6363920B2 (ja) | ||
| Zahorian et al. | Dynamic spectral shape features for speaker-independent automatic recognition of stop consonants | |
| Suchato | Classification of stop consonant place of articulation: Combining acoustic attributes | |
| JPH0120440B2 (ja) | ||
| JPS6068396A (ja) | 音素分類方法 | |
| JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
| JPH026079B2 (ja) |