JPS6310437B2 - - Google Patents
Info
- Publication number
- JPS6310437B2 JPS6310437B2 JP56035710A JP3571081A JPS6310437B2 JP S6310437 B2 JPS6310437 B2 JP S6310437B2 JP 56035710 A JP56035710 A JP 56035710A JP 3571081 A JP3571081 A JP 3571081A JP S6310437 B2 JPS6310437 B2 JP S6310437B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- word
- beginning
- section
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000034 method Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 210000002105 tongue Anatomy 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 210000000088 lip Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
Description
【発明の詳細な説明】
本発明は音声の語頭検出方式に関するものであ
る。具体的には例えば入力信号パターン系列の電
力値に基づく音声区間の切り出しおよび音声区間
の系列に対してパターンに基づく音韻分類を行な
つた後に、音声区間の音韻系列の並びによつて音
声の語頭検出を行なうことにより、音声の語頭に
発生する雑音(外界雑音、唇、歯、舌、唾による
雑音)を除去し、かつ語頭の無声子音の確保を図
り、音声の語頭検出精度を向上させ、音声認識装
置における認識率の改善を図ることを目的とする
ものである。
る。具体的には例えば入力信号パターン系列の電
力値に基づく音声区間の切り出しおよび音声区間
の系列に対してパターンに基づく音韻分類を行な
つた後に、音声区間の音韻系列の並びによつて音
声の語頭検出を行なうことにより、音声の語頭に
発生する雑音(外界雑音、唇、歯、舌、唾による
雑音)を除去し、かつ語頭の無声子音の確保を図
り、音声の語頭検出精度を向上させ、音声認識装
置における認識率の改善を図ることを目的とする
ものである。
今、入力信号パターン系列は式(1)のように特徴
ベクトルの系列として表わされているものとす
る。
ベクトルの系列として表わされているものとす
る。
X1,X2,……,XN ……(1)
各々のXi,i=1,……,Nはそれぞれm次元
のベクトルであつて、 Xi=(xi1,……,xin) と表わされる。ここで、特徴ベクトルとしては、
例えばmチヤンネルのバンドパスフイルタの出力
x1(t),……,xj(t),……,xn(t)を時間標
本化したものと考えることができる。
のベクトルであつて、 Xi=(xi1,……,xin) と表わされる。ここで、特徴ベクトルとしては、
例えばmチヤンネルのバンドパスフイルタの出力
x1(t),……,xj(t),……,xn(t)を時間標
本化したものと考えることができる。
また、特徴ベクトルで表わされる信号の区間
(時間標本化区間)をフレームと表現している。
(時間標本化区間)をフレームと表現している。
信号パターン系列の電力値系列は、式(2)で示さ
れる各フレームの電力値の系列であり、 PW1,PW2,……,PWN ……(2) 式(1)で表わされる信号パターン系列がフイルタ
バンクによつて得られる場合にはベクトルXiの電
力値は、 PWi=(n 〓j=1 xij 2)1/2 あるいは PWi=n 〓j=1 |xij| ……(3) と定義される。
れる各フレームの電力値の系列であり、 PW1,PW2,……,PWN ……(2) 式(1)で表わされる信号パターン系列がフイルタ
バンクによつて得られる場合にはベクトルXiの電
力値は、 PWi=(n 〓j=1 xij 2)1/2 あるいは PWi=n 〓j=1 |xij| ……(3) と定義される。
ただし、Xi=(xi1,……,xin)である。
従来の音声信号パターン系列の語頭検出方式
は、そのほとんどのものが式(3)で示したような入
力信号パターン系列の電力値のみに基づいてお
り、第1図に示すように、入力信号パターン系列
の電力値PWが、はじめて音声信号の最小電力値
PVMiN以上となるフレームが一定フレーム長L
1以上連続する場合を語頭とし、この語頭以後の
系列において、該電力値PWが、はじめて音声信
号の最小電力値PVMiN以下となるフレームが一
定フレーム長L2以上連続する場合を語尾とし
て、入力信号パターン系列の音声区間Vを検出し
ていた。
は、そのほとんどのものが式(3)で示したような入
力信号パターン系列の電力値のみに基づいてお
り、第1図に示すように、入力信号パターン系列
の電力値PWが、はじめて音声信号の最小電力値
PVMiN以上となるフレームが一定フレーム長L
1以上連続する場合を語頭とし、この語頭以後の
系列において、該電力値PWが、はじめて音声信
号の最小電力値PVMiN以下となるフレームが一
定フレーム長L2以上連続する場合を語尾とし
て、入力信号パターン系列の音声区間Vを検出し
ていた。
さらに音声の語頭の無声子音を確保することを
目的とするものでは、第2図に示すように、音声
区間の切り出しを2つの電力値レベルQ1,Q2に
よつて行なうものがあり、入力信号パターン系列
の電力値PWが、はじめて閾値Q2以上となるフレ
ームが一定フレーム長L1′以上連続する場合を
語頭候補とし、語頭候補の直前で、該電力値PW
が閾値Q1と交わる時点を語頭としていた。
目的とするものでは、第2図に示すように、音声
区間の切り出しを2つの電力値レベルQ1,Q2に
よつて行なうものがあり、入力信号パターン系列
の電力値PWが、はじめて閾値Q2以上となるフレ
ームが一定フレーム長L1′以上連続する場合を
語頭候補とし、語頭候補の直前で、該電力値PW
が閾値Q1と交わる時点を語頭としていた。
このような、信号パターン系列の電力値のレベ
ルと発生区間長にのみ基づく語頭検出方式におい
ては、音声の発声時点に生じる雑音(外界の騒音
振動音あるいは音声の発声の準備に伴う、歯、
唇、舌などがぶつかる音や唾による雑音)を語頭
として検出する場合があり、このような雑音を除
去するために電力値の閾値レベルを上げるか発生
区間長を長く設定すると音声の語頭の無声子音を
確保することが不可能となり、語頭の検出精度は
きわめて低いものとなる。
ルと発生区間長にのみ基づく語頭検出方式におい
ては、音声の発声時点に生じる雑音(外界の騒音
振動音あるいは音声の発声の準備に伴う、歯、
唇、舌などがぶつかる音や唾による雑音)を語頭
として検出する場合があり、このような雑音を除
去するために電力値の閾値レベルを上げるか発生
区間長を長く設定すると音声の語頭の無声子音を
確保することが不可能となり、語頭の検出精度は
きわめて低いものとなる。
このため従来の音声認識装置は、正確な音声区
間の切り出しができず、認識率は低いものであつ
た。
間の切り出しができず、認識率は低いものであつ
た。
上述したように音声パターン系列の語頭検出
を、信号パターン系列の電力値のみに基づいて行
なうと、音声の発声時点における雑音と無声子音
の判別が困難となり検出精度が低減する。そこで
式(1)で示される信号パターン系列がフイルタ・バ
ンクによつて得られる場合には、各フレームのパ
ターンに基づく周波数情報を用いることが考えら
れる。
を、信号パターン系列の電力値のみに基づいて行
なうと、音声の発声時点における雑音と無声子音
の判別が困難となり検出精度が低減する。そこで
式(1)で示される信号パターン系列がフイルタ・バ
ンクによつて得られる場合には、各フレームのパ
ターンに基づく周波数情報を用いることが考えら
れる。
本発明はこの点に着目したもので、以下にその
実施例と共に説明する。
実施例と共に説明する。
式(2)で示した電力値系列以外に、式(4)で表わさ
れる低域偏り値系列、 PL1,PL2,………,PLN (4) および、式(5)で表わされる電力偏り値系列、 PD1,PD2,………,PDN (5) を使用するものとする。するとフイルタ・バンク
がmチヤンネルで構成され、中心周波数wcoが、 wc1<wc2<………<wcj<………<wcn である場合には、前記特徴ベクトルXiの低域偏り
値は、 PLi=k 〓j=1 |xij| (6) k<m/2 で定義され、前記特徴ベクトルXの電力偏り値
は、式(3)で定義される電力値PWiを用いて、 PDi=j such that min{j|j 〓j=1 |xij|>PWi/2} と定義される。
れる低域偏り値系列、 PL1,PL2,………,PLN (4) および、式(5)で表わされる電力偏り値系列、 PD1,PD2,………,PDN (5) を使用するものとする。するとフイルタ・バンク
がmチヤンネルで構成され、中心周波数wcoが、 wc1<wc2<………<wcj<………<wcn である場合には、前記特徴ベクトルXiの低域偏り
値は、 PLi=k 〓j=1 |xij| (6) k<m/2 で定義され、前記特徴ベクトルXの電力偏り値
は、式(3)で定義される電力値PWiを用いて、 PDi=j such that min{j|j 〓j=1 |xij|>PWi/2} と定義される。
つまり式(3)で示した電力値以外に、周波数情報
として式(6)で示した低域偏り値、および式(7)で示
した電力偏り値の3つのパラメータに基づいて音
声パターン系列の語頭検出を行なうものとする。
として式(6)で示した低域偏り値、および式(7)で示
した電力偏り値の3つのパラメータに基づいて音
声パターン系列の語頭検出を行なうものとする。
また音声パターン系列の各フレームの大まかな
音韻分類は、該電力値、低域偏り値、電力偏り値
の3つのパラメータによつて行なうことができ
る。ここで大まかな音韻分類とは有声音、無声子
音、無音に分類することを示す。有声音は母音
(|a|,|i|,|u|,|e|,|o|)、有声子
音(|m|,|n|,|b|,|g|,|d|,|r
|,|Z|)、半母音(|z|,|w|)および撥
音(|x|,うん音)であり、無声子音は(|c
|,|s|,|h|,|p|,|t|,|k|)およ
び促音(|Q|、つまり音)であり、無音は音韻
が発声されていない状態である。
音韻分類は、該電力値、低域偏り値、電力偏り値
の3つのパラメータによつて行なうことができ
る。ここで大まかな音韻分類とは有声音、無声子
音、無音に分類することを示す。有声音は母音
(|a|,|i|,|u|,|e|,|o|)、有声子
音(|m|,|n|,|b|,|g|,|d|,|r
|,|Z|)、半母音(|z|,|w|)および撥
音(|x|,うん音)であり、無声子音は(|c
|,|s|,|h|,|p|,|t|,|k|)およ
び促音(|Q|、つまり音)であり、無音は音韻
が発声されていない状態である。
第4図に、音声パターン系列の各フレームにお
ける、大まかな音韻分類と、電力値PW、電力偏
り値PDおよびおよび低域偏り値PLとの対応関係
を示す。同図においてフイルタ・バンクは第3図
に示したような中心周波数と帯域幅をもつ20チヤ
ンネルのフイルタ・バンクを用い、低域偏り値
PLは、式(6)においてK=3(低域3チヤンネル分
の和)としたものである。同図aは、低域偏り値
PL≦0.05×電力値PWの場合の大まかな音韻分類
を示し、同図bは低域偏り値PL>0.05×電力値
PWの場合を示す。
ける、大まかな音韻分類と、電力値PW、電力偏
り値PDおよびおよび低域偏り値PLとの対応関係
を示す。同図においてフイルタ・バンクは第3図
に示したような中心周波数と帯域幅をもつ20チヤ
ンネルのフイルタ・バンクを用い、低域偏り値
PLは、式(6)においてK=3(低域3チヤンネル分
の和)としたものである。同図aは、低域偏り値
PL≦0.05×電力値PWの場合の大まかな音韻分類
を示し、同図bは低域偏り値PL>0.05×電力値
PWの場合を示す。
そこで音声パターン系列の語頭検出を、はじめ
は信号パターン系列の電力値に基づく音声区間の
切出しを行ない、次はその音声区間の信号パター
ン系列の各フレームを電力値PWi、低域偏り値
PLi、電力偏り値PDiに基づいて大まかな音韻分
類を行ない、最後に音韻系列のならびにもとづい
て行なうものとする。上記のような語頭検出を行
なうと日本語音声の音韻のならびにおける特性と
音声の発声時点における雑音の周波数および発生
区間の特性によつてより精度の高い語頭検出を行
なうことができる。
は信号パターン系列の電力値に基づく音声区間の
切出しを行ない、次はその音声区間の信号パター
ン系列の各フレームを電力値PWi、低域偏り値
PLi、電力偏り値PDiに基づいて大まかな音韻分
類を行ない、最後に音韻系列のならびにもとづい
て行なうものとする。上記のような語頭検出を行
なうと日本語音声の音韻のならびにおける特性と
音声の発声時点における雑音の周波数および発生
区間の特性によつてより精度の高い語頭検出を行
なうことができる。
日本語音声の音韻のならびにおける特性は、音
節が、母音、子音+母音、子音+半母音+母音で
構成されており子音だけが独立することがないこ
とである。また音声の発生時点における雑音の特
性は、パルス性の雑音であるため発生区間が孤立
していることであり、大まかな音韻分類にもとづ
くと、孤立した短い無声子音区間(一部有声音も
含む)と考えられる。つまり語頭の無声子音は、
音韻系列においてはじめて一定長以上有声子音が
連続する区間(母音)の前に連続する無声子音区
間で検出され、音声の発生時点における雑音は、
その連続有声子音区間とは孤立した一定長以下の
無声子音区間(一部有声音も含む)で検出され
る。
節が、母音、子音+母音、子音+半母音+母音で
構成されており子音だけが独立することがないこ
とである。また音声の発生時点における雑音の特
性は、パルス性の雑音であるため発生区間が孤立
していることであり、大まかな音韻分類にもとづ
くと、孤立した短い無声子音区間(一部有声音も
含む)と考えられる。つまり語頭の無声子音は、
音韻系列においてはじめて一定長以上有声子音が
連続する区間(母音)の前に連続する無声子音区
間で検出され、音声の発生時点における雑音は、
その連続有声子音区間とは孤立した一定長以下の
無声子音区間(一部有声音も含む)で検出され
る。
音声区間の音韻系列における語頭検出方式を第
5図にて説明する。同図は音韻系列のならびを示
したものであり、Hは音声区間切出しの始端フレ
ームを示し、■は有声音フレーム、□/は無声子音
フレーム、□は無音フレームを示している。
5図にて説明する。同図は音韻系列のならびを示
したものであり、Hは音声区間切出しの始端フレ
ームを示し、■は有声音フレーム、□/は無声子音
フレーム、□は無音フレームを示している。
まず始端フレームH以後に始めて一定長L3以
上有声音フレームの連続する区間を検出し、その
先頭フレームipを検出する(音節における母音、
半母音、有声子音の検出)。第5図aのようにフ
レームHとフレームipの間に無音フレームのない
場合には、フレームHを語頭WHとする(雑音と
なる孤立フレームが存在しない)。フレームHと
フレームipの間に無音フレームが存在する場合
は、フレームipに最も隣接した無音フレームの直
後のフレームを語頭候補フレームWH1とする
(母音、半母音の直前の無声子音を確保)。第5図
bのようにフレームHとフレームWH1の間に一
定長L4以上の孤立した非無音フレーム(有声音
あるいは無声子音フレーム)が無に場合には、フ
レームWH1を語頭WHとする(音声の発声時点
の雑音除去)。第5図cのようにフレームHとフ
レームWH1の間に一定長L4以上の孤立した非
無音フレームが存在する場合は、フレームWH1
に最も隣接した該非無音フレームの先頭フレーム
を語頭WHとする(語頭の無声子音および有声子
音の確保)。
上有声音フレームの連続する区間を検出し、その
先頭フレームipを検出する(音節における母音、
半母音、有声子音の検出)。第5図aのようにフ
レームHとフレームipの間に無音フレームのない
場合には、フレームHを語頭WHとする(雑音と
なる孤立フレームが存在しない)。フレームHと
フレームipの間に無音フレームが存在する場合
は、フレームipに最も隣接した無音フレームの直
後のフレームを語頭候補フレームWH1とする
(母音、半母音の直前の無声子音を確保)。第5図
bのようにフレームHとフレームWH1の間に一
定長L4以上の孤立した非無音フレーム(有声音
あるいは無声子音フレーム)が無に場合には、フ
レームWH1を語頭WHとする(音声の発声時点
の雑音除去)。第5図cのようにフレームHとフ
レームWH1の間に一定長L4以上の孤立した非
無音フレームが存在する場合は、フレームWH1
に最も隣接した該非無音フレームの先頭フレーム
を語頭WHとする(語頭の無声子音および有声子
音の確保)。
第6図は本発明の語頭検出方式を実現するため
の装置の具体構成を示すものである。同図におい
て、入力部1はフイルタ・バンク13、標本化器
14からなり、パラメータ計算部2は電力値計算
器15、低域偏り値計算器16、電力偏り値計算
器17からなり、音声区間切出し部3は電力値判
別部18、電力値系列カウント器19からなり、
音韻分類部4は音韻大分類器20、音韻系列カウ
ント器21、音韻レジスタA22、音韻レジスタ
B23、出力ゲート25から構成されている。1
2はマイクロホン、24は音韻検出部、26は出
力端子である。
の装置の具体構成を示すものである。同図におい
て、入力部1はフイルタ・バンク13、標本化器
14からなり、パラメータ計算部2は電力値計算
器15、低域偏り値計算器16、電力偏り値計算
器17からなり、音声区間切出し部3は電力値判
別部18、電力値系列カウント器19からなり、
音韻分類部4は音韻大分類器20、音韻系列カウ
ント器21、音韻レジスタA22、音韻レジスタ
B23、出力ゲート25から構成されている。1
2はマイクロホン、24は音韻検出部、26は出
力端子である。
次に動作を説明する。マイクロホン12から入
力された入力音声信号は、フイルタ・バンク13
および標本化器14を介して、信号パラメータ系
列としてパラメータ計算部2に入力される。パラ
メータ計算部2では、電力値計算器15によつて
パターン系列の電力値を計算し、音声区間切出部
および低域偏り値計算器16、電力偏り値計算器
17に入力される。低域偏り値計算器16および
電力偏り値計算器17は音声区間切出し部から音
声区間信号e1が出力されていると、パターンおよ
び電力値から低域偏り値および電力偏り値を計算
し、音韻分類部へ出力する。音声区間切出し部で
は、電力値を電力値判定器18によつて一定の閾
値レベル以上か否を判定し、一定の閾値レベル以
上のフレームは電力値系列カウント器19によつ
てカウントを行ない、一定長のフレーム数連続す
る場合には、音声区間信号e1を出力する。音韻分
類部4では、音声区間検出部3から音声区間信号
e1が出力されていると、音韻大分類器20は、パ
ラメータ計算部2から出力される電力値、低域偏
り値、電力偏り値から、各フレームの大まかな、
有声音か無声子音あるいは無音かの音韻分類を行
ない、音韻系列カウント器21および音韻レジス
A22へ出力を行なう。音韻系列カウンタ21
は、はじめて有声子音フレームが一定長L3以上
連続することを検出すると、音韻レジスタA22
の内容を音韻レジスタB23に並列転送する。語
頭検出部24は、音韻レジスタB23の音韻系列
のならびによつて語頭を検出し、音韻レジスタB
23の内容を、語頭から出力ゲート25を介し
て、出力音韻系列26として出力を行い、音韻レ
ジスタB23の内容を出力し終ると、音韻レジス
タA22は遂次更新されているため、音韻レジス
タB23の内容に連続するフレームから音韻レジ
スタA22の内容を出力ゲート25を介して、出
力音韻系列として出力端子26から出力される。
力された入力音声信号は、フイルタ・バンク13
および標本化器14を介して、信号パラメータ系
列としてパラメータ計算部2に入力される。パラ
メータ計算部2では、電力値計算器15によつて
パターン系列の電力値を計算し、音声区間切出部
および低域偏り値計算器16、電力偏り値計算器
17に入力される。低域偏り値計算器16および
電力偏り値計算器17は音声区間切出し部から音
声区間信号e1が出力されていると、パターンおよ
び電力値から低域偏り値および電力偏り値を計算
し、音韻分類部へ出力する。音声区間切出し部で
は、電力値を電力値判定器18によつて一定の閾
値レベル以上か否を判定し、一定の閾値レベル以
上のフレームは電力値系列カウント器19によつ
てカウントを行ない、一定長のフレーム数連続す
る場合には、音声区間信号e1を出力する。音韻分
類部4では、音声区間検出部3から音声区間信号
e1が出力されていると、音韻大分類器20は、パ
ラメータ計算部2から出力される電力値、低域偏
り値、電力偏り値から、各フレームの大まかな、
有声音か無声子音あるいは無音かの音韻分類を行
ない、音韻系列カウント器21および音韻レジス
A22へ出力を行なう。音韻系列カウンタ21
は、はじめて有声子音フレームが一定長L3以上
連続することを検出すると、音韻レジスタA22
の内容を音韻レジスタB23に並列転送する。語
頭検出部24は、音韻レジスタB23の音韻系列
のならびによつて語頭を検出し、音韻レジスタB
23の内容を、語頭から出力ゲート25を介し
て、出力音韻系列26として出力を行い、音韻レ
ジスタB23の内容を出力し終ると、音韻レジス
タA22は遂次更新されているため、音韻レジス
タB23の内容に連続するフレームから音韻レジ
スタA22の内容を出力ゲート25を介して、出
力音韻系列として出力端子26から出力される。
以上の説明から明らかなように本発明は入力信
号パターン系列の電力値に基づく音声区間の切り
出しを行ない、さらにこの音声区間の信号パター
ン系列の各フレームを、パターンから求まる低域
偏り値および電力偏り値とこの電力値に基づいて
大まかな音韻分類を行なつた後に、音声区間の音
韻系列のならびに基づいて語頭検出を行なうこと
により、音声の発声時における雑音を除去し、か
つ音声の語頭の無声子音の確保を図り、音声の語
頭検出精度を向上させることができ、音声認識装
置の認識率の改善を図ることができる。
号パターン系列の電力値に基づく音声区間の切り
出しを行ない、さらにこの音声区間の信号パター
ン系列の各フレームを、パターンから求まる低域
偏り値および電力偏り値とこの電力値に基づいて
大まかな音韻分類を行なつた後に、音声区間の音
韻系列のならびに基づいて語頭検出を行なうこと
により、音声の発声時における雑音を除去し、か
つ音声の語頭の無声子音の確保を図り、音声の語
頭検出精度を向上させることができ、音声認識装
置の認識率の改善を図ることができる。
第1図および第2図はそれぞれ音声区間を切り
出す操作を示す波形図、第3図は本発明による音
声の語頭検出方式を適用した音声信号パターン系
列を作成するフイルタ・バンクの周波数特性図、
第4図a,bは信号パターン系列の各フレームの
大まかな音韻分類と、パターンの電力値、低域偏
り値および電力偏り値との対応関係を示す図、第
5図a,b,cはそれぞれ音声区間の音韻系列か
ら音声の語頭を検出する操作の過程説明図、第6
図は本発明を適用した音声の語頭検出装置のブロ
ツク図である。 1……入力部、2……パラメータ計算部、3…
…音声区間切出し部、4……音韻分類部。
出す操作を示す波形図、第3図は本発明による音
声の語頭検出方式を適用した音声信号パターン系
列を作成するフイルタ・バンクの周波数特性図、
第4図a,bは信号パターン系列の各フレームの
大まかな音韻分類と、パターンの電力値、低域偏
り値および電力偏り値との対応関係を示す図、第
5図a,b,cはそれぞれ音声区間の音韻系列か
ら音声の語頭を検出する操作の過程説明図、第6
図は本発明を適用した音声の語頭検出装置のブロ
ツク図である。 1……入力部、2……パラメータ計算部、3…
…音声区間切出し部、4……音韻分類部。
Claims (1)
- 1 一定長連続した入力信号パターン系列の電力
値が初めて閾値として定めた電力値以上となる開
始区間と、その開始区間以降に初めて、一定長連
続した前記パターン系列の電力値が閾値として定
めた電力値以下となる終了区間を検出して音声区
間の切り出しを行ない、前記音声区間の各々のフ
レームに対して、各フレームのパターンに基づ
き、有声音(母音、有声子音)、無声子音、無音
の分類を行ない、前記音声区間の語頭検出を、そ
の音声区間の始端と、初めて、有声音フレームが
連続する区間に、無音フレームが無い場合には、
その始端を語頭とし、無音フレームが有る場合に
は、前記連続有声音フレーム区間に最も隣接した
無音フレームの直後のフレームを語頭候補とし、
前記始端と語頭候補との間に、連続する非無音
(有声音あるいは無声子音)フレーム区間が無い
場合には、前記語頭候補を語頭とし、前記連続非
無音フレーム区間が有る場合には、前記語頭候補
に最も隣接した前記連続非無音フレーム区間の先
頭フレームを語頭とすることを特徴とする音声の
語頭検出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56035710A JPS57148799A (en) | 1981-03-11 | 1981-03-11 | Voice leader detection system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56035710A JPS57148799A (en) | 1981-03-11 | 1981-03-11 | Voice leader detection system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57148799A JPS57148799A (en) | 1982-09-14 |
| JPS6310437B2 true JPS6310437B2 (ja) | 1988-03-07 |
Family
ID=12449411
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56035710A Granted JPS57148799A (en) | 1981-03-11 | 1981-03-11 | Voice leader detection system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57148799A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5678732B2 (ja) * | 2011-03-07 | 2015-03-04 | 富士通株式会社 | 分析装置、分析プログラムおよび分析方法 |
-
1981
- 1981-03-11 JP JP56035710A patent/JPS57148799A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57148799A (en) | 1982-09-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3180655B2 (ja) | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 | |
| JPS6147440B2 (ja) | ||
| JPS6336676B2 (ja) | ||
| JPH0449952B2 (ja) | ||
| JPS6310437B2 (ja) | ||
| JPH067357B2 (ja) | 音声認識装置 | |
| Shetty et al. | Speech Signal Segmentation using Zero Crossing Rate and Short-Time Energy for Speech Synthesis | |
| JPS60129796A (ja) | 音声入力装置 | |
| JP2006010739A (ja) | 音声認識装置 | |
| JPH07295588A (ja) | 発話速度推定方法 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPS5925240B2 (ja) | 音声区間の語頭検出方式 | |
| Elghonemy et al. | Speaker independent isolated Arabic word recognition system | |
| JPH034918B2 (ja) | ||
| JP3049711B2 (ja) | 音声処理装置 | |
| Seman et al. | Evaluating endpoint detection algorithms for isolated word from Malay parliamentary speech | |
| JP2760096B2 (ja) | 音声認識方式 | |
| JPS63217399A (ja) | 音声区間検出装置 | |
| JPS59149400A (ja) | 音声入力装置 | |
| JPH0567040B2 (ja) | ||
| JPH0289098A (ja) | 音節パターン切り出し装置 | |
| JPH0567039B2 (ja) | ||
| JPH0554117B2 (ja) | ||
| JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
| JPH0376475B2 (ja) |