JPS5852693A - 単音節音声認識方式 - Google Patents
単音節音声認識方式Info
- Publication number
- JPS5852693A JPS5852693A JP56150369A JP15036981A JPS5852693A JP S5852693 A JPS5852693 A JP S5852693A JP 56150369 A JP56150369 A JP 56150369A JP 15036981 A JP15036981 A JP 15036981A JP S5852693 A JPS5852693 A JP S5852693A
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- matching
- unit
- semi
- vowels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、単音節音声認識方式、特に音声信号の周波数
分析結果にもとづいて特徴音を抽出して認識処理を行な
う音声認識方式において、入力音声の特徴蓋の定常性を
利用して抽出された標本点に対応した母音特徴量によっ
て認識対象候補単音節を選び出し、未知入力音声との二
次照合をとるにあたって半母音を認識対象に含めること
によって、認識率全向上させるようにした単音節音声認
識方式に関するものである。
分析結果にもとづいて特徴音を抽出して認識処理を行な
う音声認識方式において、入力音声の特徴蓋の定常性を
利用して抽出された標本点に対応した母音特徴量によっ
て認識対象候補単音節を選び出し、未知入力音声との二
次照合をとるにあたって半母音を認識対象に含めること
によって、認識率全向上させるようにした単音節音声認
識方式に関するものである。
音声認識方式においては、音声信号の周波数分析結果を
利用して各音素の特徴を有効に表わしているパラメータ
を抽出し、該抽出されたパラメータと登録単語(単音節
を含む)に対応した予め登録されている音素のパラメー
タと照合して未知入力音声の認識を行なうようにされる
。即ち上記パラメータとして例えば第1ホルマント周波
数および第2ホルマント周波数などをサンプリングして
、このパラメータを使用するようにされる。しかし、上
記照合にあたってサンプリング点を犬にとり、より精密
な照合を行なおうとすると、上記照合処理に要する時間
が犬となる。
利用して各音素の特徴を有効に表わしているパラメータ
を抽出し、該抽出されたパラメータと登録単語(単音節
を含む)に対応した予め登録されている音素のパラメー
タと照合して未知入力音声の認識を行なうようにされる
。即ち上記パラメータとして例えば第1ホルマント周波
数および第2ホルマント周波数などをサンプリングして
、このパラメータを使用するようにされる。しかし、上
記照合にあたってサンプリング点を犬にとり、より精密
な照合を行なおうとすると、上記照合処理に要する時間
が犬となる。
このため、上記パラメータが時間的に急変する区間とな
だらかに変化する区間とが存在することに着目し、前者
区間において密にサンプリングし、後者区間において粗
にサンプリングすることによって、即ち不均一なサンプ
リング点でサンプリングすることによって、より少ない
標本数のもとて認識率を高める方式が考慮されている(
特願昭52−43972号)。
だらかに変化する区間とが存在することに着目し、前者
区間において密にサンプリングし、後者区間において粗
にサンプリングすることによって、即ち不均一なサンプ
リング点でサンプリングすることによって、より少ない
標本数のもとて認識率を高める方式が考慮されている(
特願昭52−43972号)。
この方式に対し、上記パラメータが時間的になだらかに
変化する点即ち定常性をもつ点がいわば母音に対応する
音節に対応していることを利用し、予め認識対象候補を
しぼった上で、より詳細な照合処理を行なうようにして
処理速度を向上させるようにした方式が提案されている
(特願昭53−53967号)。
変化する点即ち定常性をもつ点がいわば母音に対応する
音節に対応していることを利用し、予め認識対象候補を
しぼった上で、より詳細な照合処理を行なうようにして
処理速度を向上させるようにした方式が提案されている
(特願昭53−53967号)。
しかし、後者の方式を採用した場合、多くの実験・試行
を繰返1〜で考察した結果、「ヤ」、「ユ」、「ヨ」、
「ワ」などの半母音については、母音基準特徴量の抽出
誤シが生じやすいことが判明した。第1図は半母音につ
いての特徴音の特性を説明するだめの説明図を示す。図
中、Flは第1ホルマント周波数についての特徴音、F
2は第2ホルマント周波数についての特徴音を表わす。
を繰返1〜で考察した結果、「ヤ」、「ユ」、「ヨ」、
「ワ」などの半母音については、母音基準特徴量の抽出
誤シが生じやすいことが判明した。第1図は半母音につ
いての特徴音の特性を説明するだめの説明図を示す。図
中、Flは第1ホルマント周波数についての特徴音、F
2は第2ホルマント周波数についての特徴音を表わす。
例えば、半母音「ヤ」について、これを長く伸ばして発
音した場合にば、第1図図示の如く、通常の母音と同様
特徴量の定常部が表われ問題とならないが、短く発音し
た場合、定常部が表われる以前に音声が打切られること
となり、例えば第1図図示の1A時点とtB時点とでは
特徴音が異なるので、抽出すべき特徴音が一定せず、そ
のため認識誤シを生じさせることがある。換言すれば、
半母音には明確な母音定常部がない場合があシ、安定し
た母音基準特徴量の抽出が困難であるという問題が存す
る。
音した場合にば、第1図図示の如く、通常の母音と同様
特徴量の定常部が表われ問題とならないが、短く発音し
た場合、定常部が表われる以前に音声が打切られること
となり、例えば第1図図示の1A時点とtB時点とでは
特徴音が異なるので、抽出すべき特徴音が一定せず、そ
のため認識誤シを生じさせることがある。換言すれば、
半母音には明確な母音定常部がない場合があシ、安定し
た母音基準特徴量の抽出が困難であるという問題が存す
る。
本発明はこの点を解決し、上記後者の方式を改良発展さ
せて、音声認識率を向上させることを目的としている。
せて、音声認識率を向上させることを目的としている。
そのため、本発明の単音節音声認識方式は、音声信号の
周波数分析結果を利用して当該音声信号の特徴量全抽出
し該特徴音に対応して未知入力音声の認Rを行なう単音
節音声認識方式において、認識対象候補単音節を決定す
る第−次照合部と、該第−次照合部が決定した上記認識
対象候補単音節に対して上記未知入力音声との二次照合
をとる第二次照合部と全そなえ、上記第−次照合部は上
記抽出される特徴音の定常性を利用して単音節中の母音
部分に対応した標本点を抽出し、該標本点に対応した母
音特徴量をもってあらかじめ単音節毎に登録されている
母音基準特徴量と照合するよう構成され、上記第−次照
合部における一次照合においては照合対象から半母音を
除き、上記第二次照合部における二次照合において半母
音を認識対象に含めるようにしたことを特徴としている
。以下図面を参照しつつ説明する。
周波数分析結果を利用して当該音声信号の特徴量全抽出
し該特徴音に対応して未知入力音声の認Rを行なう単音
節音声認識方式において、認識対象候補単音節を決定す
る第−次照合部と、該第−次照合部が決定した上記認識
対象候補単音節に対して上記未知入力音声との二次照合
をとる第二次照合部と全そなえ、上記第−次照合部は上
記抽出される特徴音の定常性を利用して単音節中の母音
部分に対応した標本点を抽出し、該標本点に対応した母
音特徴量をもってあらかじめ単音節毎に登録されている
母音基準特徴量と照合するよう構成され、上記第−次照
合部における一次照合においては照合対象から半母音を
除き、上記第二次照合部における二次照合において半母
音を認識対象に含めるようにしたことを特徴としている
。以下図面を参照しつつ説明する。
第2図は本発明の一実施例構成を示す。図中、1は抽出
された特徴音、2は帯域フィルタ群であって入力音声t
Nチャンネル例えば15チヤンネルの周波数信号Pi(
t)1. F2(’) +・・・・・・+ PN(’)
に分解するもの、3はパラメータ抽出回路であって入力
音声即ち単音節音声の特徴音(パラメータ)例えば第1
ホルマント周波数に相当するモーメン) Mlや第2ホ
ルマント周波数に相当するモーメントM2や更には低域
電力や高域電力などを抽出するもの、4はサンプリング
時刻決定回路であって図示特徴量1に関連して示される
如き不均一サンプリング点To + ’ri +・・・
を決定するものを表わす。また5は不均一サンプリング
回路であって上記特徴量1に示すサンプリング点Tol
T1+・・・、Ta、・・・に対応して特徴量をサンプ
リングして時系列情報を得るもの、6は一次照合を行な
う第−次照合部、7は母音定常部抽出回路であって上記
特徴量1に示すタイミングTαに対応した標本点とそれ
に対応した母音特徴量を抽出するもの、8および9は夫
々切換回路であって登録音声に対応した情報を登録する
登録モードと未知入力音声を認識する認識モードと全切
換えるもの、10は母音定常部パラメータ登録部であっ
て半母音を除く各登録単音節に対応した母音基準特徴量
を格納するもの、11は母音定常部照合・候補選定部で
あって認識モード時に上述の母音特徴量にもとづいて認
識対象候補単音節を選定するものを表わす。更に12は
二次照合を行なう第二次照合部、13はパラメータ時系
列登録部であって各登録単音節毎に上述のサンプリング
点TOITII・・・、Ta・・・に対応した特徴量を
時系列に格納するもの、14は候補選択回路であって上
述の候補選定部11によって選ばれた候補単音節(複数
個)に対応している基準特徴量(パラメータ)時系列情
報を以下のパラメータ時系列照合判定部17に導くもの
、15は半母音パラメータ登録部であって半母音に関す
る単音節毎に各サンプリング点に対応した特徴量を時系
列に格納しているもの、16は半母音選択回路であって
半母音に関するパラメータ時系列情報を次のパラメータ
時系列照合判定部17に導くもの、17はパラメータ時
系列照合判定部であって認識モード時に未知入力音声の
特徴量(パラメータ)時系列情報と上記候補単音節また
は半母音のそれとの照合をとるもの、18は出力回路で
あって認識されたカテゴリ名を出力するものを表わす。
された特徴音、2は帯域フィルタ群であって入力音声t
Nチャンネル例えば15チヤンネルの周波数信号Pi(
t)1. F2(’) +・・・・・・+ PN(’)
に分解するもの、3はパラメータ抽出回路であって入力
音声即ち単音節音声の特徴音(パラメータ)例えば第1
ホルマント周波数に相当するモーメン) Mlや第2ホ
ルマント周波数に相当するモーメントM2や更には低域
電力や高域電力などを抽出するもの、4はサンプリング
時刻決定回路であって図示特徴量1に関連して示される
如き不均一サンプリング点To + ’ri +・・・
を決定するものを表わす。また5は不均一サンプリング
回路であって上記特徴量1に示すサンプリング点Tol
T1+・・・、Ta、・・・に対応して特徴量をサンプ
リングして時系列情報を得るもの、6は一次照合を行な
う第−次照合部、7は母音定常部抽出回路であって上記
特徴量1に示すタイミングTαに対応した標本点とそれ
に対応した母音特徴量を抽出するもの、8および9は夫
々切換回路であって登録音声に対応した情報を登録する
登録モードと未知入力音声を認識する認識モードと全切
換えるもの、10は母音定常部パラメータ登録部であっ
て半母音を除く各登録単音節に対応した母音基準特徴量
を格納するもの、11は母音定常部照合・候補選定部で
あって認識モード時に上述の母音特徴量にもとづいて認
識対象候補単音節を選定するものを表わす。更に12は
二次照合を行なう第二次照合部、13はパラメータ時系
列登録部であって各登録単音節毎に上述のサンプリング
点TOITII・・・、Ta・・・に対応した特徴量を
時系列に格納するもの、14は候補選択回路であって上
述の候補選定部11によって選ばれた候補単音節(複数
個)に対応している基準特徴量(パラメータ)時系列情
報を以下のパラメータ時系列照合判定部17に導くもの
、15は半母音パラメータ登録部であって半母音に関す
る単音節毎に各サンプリング点に対応した特徴量を時系
列に格納しているもの、16は半母音選択回路であって
半母音に関するパラメータ時系列情報を次のパラメータ
時系列照合判定部17に導くもの、17はパラメータ時
系列照合判定部であって認識モード時に未知入力音声の
特徴量(パラメータ)時系列情報と上記候補単音節また
は半母音のそれとの照合をとるもの、18は出力回路で
あって認識されたカテゴリ名を出力するものを表わす。
パラメータ抽出回N3は、公知の如く、一定周期のクロ
ック令パルスが発生する毎に ()°=1.2) (
1)に示す演算に対応して第1ホルマント周波数および
第2ホルマント周波数などに対応した特徴量を計算し、
その結果を図示しないレジスタに記憶する。なお、上記
第(1)式において、PL(tル)は例えばlQmse
c毎の時点tnにおいてサンプリングされた第を番目の
フィルタの出力、Wりはその荷重、Ftはその中心周波
数を表わしている。そして上記荷重Wijは上記i M
、 、 M2が第1および第2ホルマント周波数に一致
するよう実験的に決定されるものと考えてよい。
ック令パルスが発生する毎に ()°=1.2) (
1)に示す演算に対応して第1ホルマント周波数および
第2ホルマント周波数などに対応した特徴量を計算し、
その結果を図示しないレジスタに記憶する。なお、上記
第(1)式において、PL(tル)は例えばlQmse
c毎の時点tnにおいてサンプリングされた第を番目の
フィルタの出力、Wりはその荷重、Ftはその中心周波
数を表わしている。そして上記荷重Wijは上記i M
、 、 M2が第1および第2ホルマント周波数に一致
するよう実験的に決定されるものと考えてよい。
ザンブリング時刻決定回路4は、
で定義される累積変動量AV(trL)の演算を、上記
第(1)式に示す特*量M1.M2 ’f7演算する周
期で実行してゆき、上記不均一サンプリング点tnkを
決定する。即ち、上記累積変動ftAVIttL)が予
め定められた閾値を超えたか否かを監視し、該閾値を超
えた時点inkを第に番目の不均一サンプリング点とし
て決定する。
第(1)式に示す特*量M1.M2 ’f7演算する周
期で実行してゆき、上記不均一サンプリング点tnkを
決定する。即ち、上記累積変動ftAVIttL)が予
め定められた閾値を超えたか否かを監視し、該閾値を超
えた時点inkを第に番目の不均一サンプリング点とし
て決定する。
匁お上記第(2)式において、V (tル)はフィルタ
の出力変動量であ)、次式で定義される。
の出力変動量であ)、次式で定義される。
(3)
上記によって、累積変動量AV(f!W)は成る不均一
サンプリング点が発生した以後においてパラメータの変
化を累積していったものであることが判る。そして該累
積変動量AV(t1′L)が成る閾値を超えると次の不
均一なサンプリング点が決定されその時点で先の累積変
動量AV(trL)はリセットされることが判る。この
結果上記不均一サンプリング点To 、Tx +・・・
、Ta、・・・はパラメータの変化が急激である区間で
密に現われ、変化が定常的である区間で粗に現われるこ
とが判る。
サンプリング点が発生した以後においてパラメータの変
化を累積していったものであることが判る。そして該累
積変動量AV(t1′L)が成る閾値を超えると次の不
均一なサンプリング点が決定されその時点で先の累積変
動量AV(trL)はリセットされることが判る。この
結果上記不均一サンプリング点To 、Tx +・・・
、Ta、・・・はパラメータの変化が急激である区間で
密に現われ、変化が定常的である区間で粗に現われるこ
とが判る。
不均一サンプリング回路5は、上記不均一サンプリング
点毎に上記抽出された特徴量M1.M2をサンプリング
して、登録モード時には第1図図示のパラメータ時系列
登録部13に格納し、また認識モード時にはパラメータ
時系列照合判定部17に入力する。
点毎に上記抽出された特徴量M1.M2をサンプリング
して、登録モード時には第1図図示のパラメータ時系列
登録部13に格納し、また認識モード時にはパラメータ
時系列照合判定部17に入力する。
母音定常部抽出回路部7は、(i)不均一サンプリング
点To 、’rl +・・・が決定されてゆく間におけ
る上記累積回数全カウントしてゆき、(ii)該カウン
ト値を重みWとしたとき該重みWの最大の不均一サンプ
リング点(特徴I:1の場合、サンプリング点T。
点To 、’rl +・・・が決定されてゆく間におけ
る上記累積回数全カウントしてゆき、(ii)該カウン
ト値を重みWとしたとき該重みWの最大の不均一サンプ
リング点(特徴I:1の場合、サンプリング点T。
)を決定する。即ち標本点を決定する。そして当該標本
点に対応して得られた母音特徴量を、登録モード時には
母音定常部パラメータ登録部10に、また認識モード時
には母音定常部照合・候補選定部】1に供給する。
点に対応して得られた母音特徴量を、登録モード時には
母音定常部パラメータ登録部10に、また認識モード時
には母音定常部照合・候補選定部】1に供給する。
)・ 未知入力音声である単音節音Pを認識する認識モ
ードにおいては、次のように処理される。なおこの時に
」夕いては、例えば半母音全除く登録単音節に対応した
特徴を時系列情報が第2図図示の登録部13に格納され
ており、また半母音を除く登録・単音節に対応した母音
詩歌1【が第2図図示の登録部10に格納されている。
ードにおいては、次のように処理される。なおこの時に
」夕いては、例えば半母音全除く登録単音節に対応した
特徴を時系列情報が第2図図示の登録部13に格納され
ており、また半母音を除く登録・単音節に対応した母音
詩歌1【が第2図図示の登録部10に格納されている。
そして半母音に関する単音節に対応した特徴門時系列情
報は、第2図図示の半母音パラメータ登録部15に格納
されている。
報は、第2図図示の半母音パラメータ登録部15に格納
されている。
(1)入力された未知入力音声に対応して、帯域フィル
タ群2、パラメータ抽出回路3、ザンブリング時刻決定
回路4、不均一サンプリング回路部5を介して、上述の
如く、不均一サンプリング点To +T11・・・に対
応した特徴量がパラメータ時系列照合判定部17に供給
される。
タ群2、パラメータ抽出回路3、ザンブリング時刻決定
回路4、不均一サンプリング回路部5を介して、上述の
如く、不均一サンプリング点To +T11・・・に対
応した特徴量がパラメータ時系列照合判定部17に供給
される。
(2)一方、母音定常部抽出回路部7によって、上述の
如く、抽出された標本点Tαに対応した母音特徴量が母
音定常部照合・候補選定部11に供給される。
如く、抽出された標本点Tαに対応した母音特徴量が母
音定常部照合・候補選定部11に供給される。
(3) このとき、図示省略した制御部の制御のもと
に、登録単音節に対応した母音基準特徴量が図示登録部
10から、各登録単音節毎に図示照合・候補選定部11
に順次読出される。
に、登録単音節に対応した母音基準特徴量が図示登録部
10から、各登録単音節毎に図示照合・候補選定部11
に順次読出される。
(4)該照合・候補選定部11は、上記読出された母音
基準特徴量と上記母音定常部抽出回路部7から供給され
た母音特徴量とを順次照合してゆく。そして照合がとれ
た複数の単音節を候補単音節として選定し、候補選択回
路14に通知する。
基準特徴量と上記母音定常部抽出回路部7から供給され
た母音特徴量とを順次照合してゆく。そして照合がとれ
た複数の単音節を候補単音節として選定し、候補選択回
路14に通知する。
(5)次いで、上記選択された候補単音節に1−ぼられ
た上での詳細な即ち2次照合処理に入ってゆく。即ち、
図示省略した制御部はパラメータ時系列登録部13に対
して続出しをかける。該読出しによって登録部13から
各登録単音節毎に時系列情報が出力されてくるが、この
とき候補選択回路部14は上記処理(4)において選択
された候補単音節に対応する基準時系列情報のみを選別
した上でパラメータ時系列照合判定部]7に伝送する。
た上での詳細な即ち2次照合処理に入ってゆく。即ち、
図示省略した制御部はパラメータ時系列登録部13に対
して続出しをかける。該読出しによって登録部13から
各登録単音節毎に時系列情報が出力されてくるが、この
とき候補選択回路部14は上記処理(4)において選択
された候補単音節に対応する基準時系列情報のみを選別
した上でパラメータ時系列照合判定部]7に伝送する。
(6)続いて制御部(図示省略)は、半母音パラメータ
登録部15に対して読出しをかけるように制御し、該読
出1−によって出力された半母音に関する単音節に対応
する基準時系列情報を、牛Itl音選択回路]6を介し
てパラメータ時系列照合判定部17に伝送する。
登録部15に対して読出しをかけるように制御し、該読
出1−によって出力された半母音に関する単音節に対応
する基準時系列情報を、牛Itl音選択回路]6を介し
てパラメータ時系列照合判定部17に伝送する。
(7)判定部17では、先に不均一サンプリング回路部
5から未知入力音声に対応した特?I!1.量時系列情
報が人力されている。そして該情報と上記処理(5)お
よび(6)において伝送された上記基準時系列情報との
照合をとる。該照合処理に当っては、例えば公知のダイ
ナミック・プログラミングを用いた処理をとるようにさ
れる。
5から未知入力音声に対応した特?I!1.量時系列情
報が人力されている。そして該情報と上記処理(5)お
よび(6)において伝送された上記基準時系列情報との
照合をとる。該照合処理に当っては、例えば公知のダイ
ナミック・プログラミングを用いた処理をとるようにさ
れる。
(8)そして、もつともよく照合のとれた登録単音節を
もって上記未知入力音声が当該登録単音節1に属するも
のとされて、出力回路18に認識結果としてセットされ
る。
もって上記未知入力音声が当該登録単音節1に属するも
のとされて、出力回路18に認識結果としてセットされ
る。
上記の如く処理すれば、半母音単音節については第二次
亜合部12において常に詳細な照合処理が行なわれるこ
ととなり、半母音が明確な母音定常部を持たないことに
よる認R誤シを防止することができる。
亜合部12において常に詳細な照合処理が行なわれるこ
ととなり、半母音が明確な母音定常部を持たないことに
よる認R誤シを防止することができる。
第3図は本発明の他の一実施例構成を示す。図中、符号
2ないし12.14.17.18は第2図に対応し、1
9は半母音候補設定部であって第−火照合部6における
照合結果に無関係に半母音に関する単音節を強制的に認
識対象候補とするもの、また13′は半母音に関する単
音節を含む登録単音節毎にその特徴fitを時系列に格
納したパラメータ時系列登録部を表わす。
2ないし12.14.17.18は第2図に対応し、1
9は半母音候補設定部であって第−火照合部6における
照合結果に無関係に半母音に関する単音節を強制的に認
識対象候補とするもの、また13′は半母音に関する単
音節を含む登録単音節毎にその特徴fitを時系列に格
納したパラメータ時系列登録部を表わす。
第3図図示の実施例においては、第2図図示の実施例の
場合と異なり、第二次照合部」2において通常の母音を
含む単音節と半母音に関する単音節との基準時系列情報
が区別されることなく、パラメータ時系列登録部13′
に登録され格納され不。
場合と異なり、第二次照合部」2において通常の母音を
含む単音節と半母音に関する単音節との基準時系列情報
が区別されることなく、パラメータ時系列登録部13′
に登録され格納され不。
第−次亜合部6において、第2図を用いて説明した実施
例の場合と同様、認識モード時には、母音定常部照合・
候補選定部11は、母音定常部パラメータ登録部10か
ら順次読出されノこ半母音を除く登録単音節に対応した
母音基準特徴量と、母音定常部抽出回路7から供給され
た母音性微量とを順次照合17、照合がとれた複数の畦
音節を候補単音節として選定する。そして、本実施例に
おいては上記選定結果′f、第二次照次亜12に通知す
る前に、半母音候補設定部19に通知する。半母音候補
設定部19は、上記母音定常部照合・候補選定部11に
よって選定された候補η1音節IC1”tj?だに無条
件に「ヤ」、「ユ」、「ヨ」、「ワ」なとの半母音に関
する単音節を追加して、全体を認識対象候補として第二
次照合部12の候補選択回路14に通知する。このよう
にすわば、候補選択回路14は通常の母音を含む単音節
と半母音に関する単音節とを意識して区別することなく
、シかも半母音単音節に関しては必ず詳細な照合処理を
行iうよう選択することとなる。
例の場合と同様、認識モード時には、母音定常部照合・
候補選定部11は、母音定常部パラメータ登録部10か
ら順次読出されノこ半母音を除く登録単音節に対応した
母音基準特徴量と、母音定常部抽出回路7から供給され
た母音性微量とを順次照合17、照合がとれた複数の畦
音節を候補単音節として選定する。そして、本実施例に
おいては上記選定結果′f、第二次照次亜12に通知す
る前に、半母音候補設定部19に通知する。半母音候補
設定部19は、上記母音定常部照合・候補選定部11に
よって選定された候補η1音節IC1”tj?だに無条
件に「ヤ」、「ユ」、「ヨ」、「ワ」なとの半母音に関
する単音節を追加して、全体を認識対象候補として第二
次照合部12の候補選択回路14に通知する。このよう
にすわば、候補選択回路14は通常の母音を含む単音節
と半母音に関する単音節とを意識して区別することなく
、シかも半母音単音節に関しては必ず詳細な照合処理を
行iうよう選択することとなる。
、1以上説明した如く、本発明によれば、明確な母音定
常部が存在しないことのある半母音については、必ず詳
細な二次照合の対象とされることになるので、音声認識
率を一段と向上させることが可能となるC
常部が存在しないことのある半母音については、必ず詳
細な二次照合の対象とされることになるので、音声認識
率を一段と向上させることが可能となるC
第1図は半母音についての特徴値の特性全説明するため
の説明図、第2図は本発明の一実施例構成、第3図は本
発明の他の一実施例構成を表わす。 図中、1は抽出さバた特徴量、6は第−次亜合部、7は
母音定常部抽出回路、10は母音定常部パラメータ登録
部、11は母音定常部照合中候補選定部、12は第二次
照合部、13はパラメータ時系列登録部、】4は候補選
択回路、15は半母音パラメータ登録部、16は半母音
選択回路、17はパラメータ時系列照合判定部、19は
半母音候補設定部を表わす。 特許出願人 富士通株式会社 代理人 弁理士 森H」 寛 才1巳 B1A1
の説明図、第2図は本発明の一実施例構成、第3図は本
発明の他の一実施例構成を表わす。 図中、1は抽出さバた特徴量、6は第−次亜合部、7は
母音定常部抽出回路、10は母音定常部パラメータ登録
部、11は母音定常部照合中候補選定部、12は第二次
照合部、13はパラメータ時系列登録部、】4は候補選
択回路、15は半母音パラメータ登録部、16は半母音
選択回路、17はパラメータ時系列照合判定部、19は
半母音候補設定部を表わす。 特許出願人 富士通株式会社 代理人 弁理士 森H」 寛 才1巳 B1A1
Claims (1)
- 【特許請求の範囲】 (1)音声信号の周波数分析結果を利用して当該音声信
号の特徴音を抽出し該特徴音に対応して未知入力音声の
認識を行なう単音節音声認識方式において、認識対象候
補単音節を決定する第−次照合部と、該第−次照合部が
決定17た上記認識対象候補単音節に対して上記未知入
力音声との二次照合をとる第二次照合部とをそなえ、上
記第−次照合部は上記抽出される特徴1:の定常性を利
用して単音節中の母音部分に対応した標本点を抽出し、
該標本点に対応した母音特徴量をもってあらかじめ単音
節毎に登録されている母音基準特徴量と照合するよう構
成され、上記第−次照合部における一次照合においては
照合対象から半母音を除き、上記第二次照合部における
二次照合において半母音を認識対象に含めるようにした
ことを特徴とする単音節音声認識方式。 (2)上記第二次照合部は上記第−次照合部が決定した
認識対象候補単音節と半母音とに対して上記未知入力音
声との二次照合をとるようにしたことを特徴とする特許
請求の範囲第(1)項記載の単音節音声認識方式。 (8)上記第−次照合部は上記−次照合の照合結果いか
んにかかわらず半母音を上記認識対象候補単音節に含め
るようにしたことを特徴とする特許請求の範囲第(り項
記載の単音節音声認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56150369A JPS5852693A (ja) | 1981-09-22 | 1981-09-22 | 単音節音声認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56150369A JPS5852693A (ja) | 1981-09-22 | 1981-09-22 | 単音節音声認識方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5852693A true JPS5852693A (ja) | 1983-03-28 |
| JPH0115078B2 JPH0115078B2 (ja) | 1989-03-15 |
Family
ID=15495482
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56150369A Granted JPS5852693A (ja) | 1981-09-22 | 1981-09-22 | 単音節音声認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5852693A (ja) |
-
1981
- 1981-09-22 JP JP56150369A patent/JPS5852693A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0115078B2 (ja) | 1989-03-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4054749A (en) | Method for verifying identity or difference by voice | |
| JPS5972496A (ja) | 単音識別装置 | |
| JPH0312319B2 (ja) | ||
| JPS6123560B2 (ja) | ||
| JPS6129519B2 (ja) | ||
| JPS5852693A (ja) | 単音節音声認識方式 | |
| JPS6129518B2 (ja) | ||
| US20240144934A1 (en) | Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium | |
| JPH0262879B2 (ja) | ||
| JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
| JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
| JPS6131476B2 (ja) | ||
| JPS5936759B2 (ja) | 音声認識方法 | |
| JPS61273599A (ja) | 音声認識装置 | |
| JPS59111697A (ja) | 音声認識方式 | |
| JPS5926796A (ja) | 音声認識装置 | |
| Barney et al. | New artificial larynx | |
| Peterson et al. | Identification of Filtered Vowels | |
| Lehiste | Acoustical Clues to Word Boundaries | |
| JPS6236699A (ja) | 音声識別装置 | |
| JPS59124392A (ja) | 音声認識方式 | |
| JPS595294A (ja) | 音声認識装置 | |
| JPS59124390A (ja) | 候補削減音声認識方式 | |
| JPS59189397A (ja) | 音声認識処理方式 | |
| JPS6375800A (ja) | 音声認識装置 |