JPS63799B2 - - Google Patents
Info
- Publication number
- JPS63799B2 JPS63799B2 JP57172898A JP17289882A JPS63799B2 JP S63799 B2 JPS63799 B2 JP S63799B2 JP 57172898 A JP57172898 A JP 57172898A JP 17289882 A JP17289882 A JP 17289882A JP S63799 B2 JPS63799 B2 JP S63799B2
- Authority
- JP
- Japan
- Prior art keywords
- silent
- section
- speech
- input
- duration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Description
【発明の詳細な説明】
本発明は音声入力装置に関し、更に詳しくは、
入力音声の発声速度に応じて文節境界の判定基準
を変更し得る音声入力装置に関する。
入力音声の発声速度に応じて文節境界の判定基準
を変更し得る音声入力装置に関する。
一般に、音声入力装置おいては、入力音声の認
識を行うために文節の境界を検出する必要がある
が、この文節の境界は、通常、文節と文節との間
に存在する無音区間(ポーズ)を検出することに
よつて行われる。ところで、音声中に現れる無音
区間を大別すれば、上述の文節間無音区間の他
に、破裂音の前に存在する無音区間と、促音を発
声する際に生じる無音区間とがある。これらの無
音区間の長さは、文節間無音区間が最も長く、次
いで促音発声時無音区間、そして破裂音前無音区
間が最も短い。
識を行うために文節の境界を検出する必要がある
が、この文節の境界は、通常、文節と文節との間
に存在する無音区間(ポーズ)を検出することに
よつて行われる。ところで、音声中に現れる無音
区間を大別すれば、上述の文節間無音区間の他
に、破裂音の前に存在する無音区間と、促音を発
声する際に生じる無音区間とがある。これらの無
音区間の長さは、文節間無音区間が最も長く、次
いで促音発声時無音区間、そして破裂音前無音区
間が最も短い。
従来の音声入力装置においては、無音区間を検
出したとき、その長さが一定のしきい値未満であ
れば促音発声時無音区間又は破裂音前無音区間と
判定し、しきい値以上なら文節間無音区間として
文節境界とみなしていた。ところが、入力音声の
発声速度が異なれば、上述の各無音区間の長さも
当然異なり、一定のしきい値によつて文節間無音
区間を判別するには限度があつて、音声認識の誤
り等の原因となつていた。
出したとき、その長さが一定のしきい値未満であ
れば促音発声時無音区間又は破裂音前無音区間と
判定し、しきい値以上なら文節間無音区間として
文節境界とみなしていた。ところが、入力音声の
発声速度が異なれば、上述の各無音区間の長さも
当然異なり、一定のしきい値によつて文節間無音
区間を判別するには限度があつて、音声認識の誤
り等の原因となつていた。
本発明は上記に鑑みなされたもので、入力音声
の発声速度に適応して文節間無音区間検出の為の
しきい値を変化し得る音声入力装置の提供を目的
としている。
の発声速度に適応して文節間無音区間検出の為の
しきい値を変化し得る音声入力装置の提供を目的
としている。
本発明の特徴とするところは、入力音声に含ま
れる母音の継続時間長からその入力音声の発声速
度を推定して、その推定に基づいて文節間無音区
間長のしきい値を算出することにある。
れる母音の継続時間長からその入力音声の発声速
度を推定して、その推定に基づいて文節間無音区
間長のしきい値を算出することにある。
以下、図面に基づいて本発明実施例の説明を行
う。
う。
第1図は本発明実施例の音声入力装置の全体構
成を示すブロツク図、第2図はその文節境界の検
出に係る部分の詳細構成を示すブロツク図であ
る。
成を示すブロツク図、第2図はその文節境界の検
出に係る部分の詳細構成を示すブロツク図であ
る。
第1図において、入力された音声は、まず音声
分析部1において、入力時刻tに関して、パワー
P(t)、スペクトルy(t)、スペクトル変化
y′(t)等の特徴パラメータが抽出される。次い
で発声速度検出部2において、その特徴パラメー
タから後述する如く平均発声速度が推定され、文
節境界検出部3ではその推定発声速度に基づいて
算出されるしきい値θと入力音声内の無音区間長
とを比較して、無音区間長がしきい値θを越えて
いる場合に限り、その無音区間を文節境界とみな
してその旨を出力する。そして文節毎に区切られ
た音声は音節区間検出部4、音節認識部5を経て
認識され、認識結果が出力される。
分析部1において、入力時刻tに関して、パワー
P(t)、スペクトルy(t)、スペクトル変化
y′(t)等の特徴パラメータが抽出される。次い
で発声速度検出部2において、その特徴パラメー
タから後述する如く平均発声速度が推定され、文
節境界検出部3ではその推定発声速度に基づいて
算出されるしきい値θと入力音声内の無音区間長
とを比較して、無音区間長がしきい値θを越えて
いる場合に限り、その無音区間を文節境界とみな
してその旨を出力する。そして文節毎に区切られ
た音声は音節区間検出部4、音節認識部5を経て
認識され、認識結果が出力される。
第2図において、音声分析部1で抽出されたス
ペクトルy(t)およびスペクトル変化y′(t)
は、発声速度検出部2の定常部検出部21に入力
され、定常部検出部21においては、所定の時間
巾W内の中心時刻t0におけるスペクトル変化
y′(t0)がその時間巾W内での時刻t0を除く他のス
ペクトル変化y′(t)の最小値よりも小さい場合
においてのみ、その時刻t0を入力音声定常部の中
心点として検出し、その定常部の中心点として検
出された時刻t0におけるスペクトルy(t0)との
スペクトル間距離が所定の値未満である連続した
音声区間の始点tbと終点teを検出して、その区間
を定常部と判定してその区間長L(t0)=te−tbを
出力して、t0におけるスペクトルy(t0)ととも
にマツチング部22に供給する。マツチング部2
2では、定常部中心点として検出されたt0、t1、
……、tn、……の各時刻におけるスペクトルy
(t0)、y(t1)、……、y(tn)、……を日本語の5
母音標準パターン24のスペクトルと比較し、そ
のスペクトル間距離が所定の値未満であるときに
限り、その定常部が母音の定常部であると判定
し、その継続時間長L(tn)を出力する。発声速
度推定部23は、入力音声内の母音の継続時間長
とみなされた各L(tn)を入力して平均化して入
力音声内の母音の平均継続時間長を算出し、あ
らかじめ入力されて記憶している第3図に示す母
音継続時間長−発声速度対応表25を用いて、母
音平均継続時間長を平均発声速度に換算して
出力する。一方、音声分析部1で抽出されたパワ
ーP(t)は、文節境界検出部3の無音区間検出
部31に導入され、入力音声の無音区間が検出さ
れる。無音区間検出部31は、検出した無音区間
の始点時刻tpとその無音区間の継続時間長lpを出
力する。文節境界判定部32は、上述の入力音声
の平均発声速度を入力して、次の式によつて文
節間無音区間のしきい値θを算出し、無音区間検
出部31から出力された無音区間継続時間長lpと
比較する。
ペクトルy(t)およびスペクトル変化y′(t)
は、発声速度検出部2の定常部検出部21に入力
され、定常部検出部21においては、所定の時間
巾W内の中心時刻t0におけるスペクトル変化
y′(t0)がその時間巾W内での時刻t0を除く他のス
ペクトル変化y′(t)の最小値よりも小さい場合
においてのみ、その時刻t0を入力音声定常部の中
心点として検出し、その定常部の中心点として検
出された時刻t0におけるスペクトルy(t0)との
スペクトル間距離が所定の値未満である連続した
音声区間の始点tbと終点teを検出して、その区間
を定常部と判定してその区間長L(t0)=te−tbを
出力して、t0におけるスペクトルy(t0)ととも
にマツチング部22に供給する。マツチング部2
2では、定常部中心点として検出されたt0、t1、
……、tn、……の各時刻におけるスペクトルy
(t0)、y(t1)、……、y(tn)、……を日本語の5
母音標準パターン24のスペクトルと比較し、そ
のスペクトル間距離が所定の値未満であるときに
限り、その定常部が母音の定常部であると判定
し、その継続時間長L(tn)を出力する。発声速
度推定部23は、入力音声内の母音の継続時間長
とみなされた各L(tn)を入力して平均化して入
力音声内の母音の平均継続時間長を算出し、あ
らかじめ入力されて記憶している第3図に示す母
音継続時間長−発声速度対応表25を用いて、母
音平均継続時間長を平均発声速度に換算して
出力する。一方、音声分析部1で抽出されたパワ
ーP(t)は、文節境界検出部3の無音区間検出
部31に導入され、入力音声の無音区間が検出さ
れる。無音区間検出部31は、検出した無音区間
の始点時刻tpとその無音区間の継続時間長lpを出
力する。文節境界判定部32は、上述の入力音声
の平均発声速度を入力して、次の式によつて文
節間無音区間のしきい値θを算出し、無音区間検
出部31から出力された無音区間継続時間長lpと
比較する。
θ=k/(ただしkは定数)
そして、lp>θが成立すれば、その無音区間は
文節間無音区間であると判定し、その無音区間の
中心点時刻tp+lp/2を文節境界として出力す
る。
文節間無音区間であると判定し、その無音区間の
中心点時刻tp+lp/2を文節境界として出力す
る。
以上説明したように、本発明によれば、入力さ
れた音声の母音継続時間長を検出することによつ
て、その入力音声の発声速度を推定し、その発声
速度に基づいて文節間無音区間長のしきい値が最
適な値に設定される為、入力音声の発声速度の相
違に拘わらず、正確に文節境界を検出することが
できる。
れた音声の母音継続時間長を検出することによつ
て、その入力音声の発声速度を推定し、その発声
速度に基づいて文節間無音区間長のしきい値が最
適な値に設定される為、入力音声の発声速度の相
違に拘わらず、正確に文節境界を検出することが
できる。
第1図は本発明実施例の全体構成を示すブロツ
ク図、第2図はその要部詳細構成を示すブロツク
図、第3図はその発声速度推定部に記憶された母
音継続時間長−発声速度対応表を示すグラフであ
る。 1……音声分析部、2……音声速度検出部、3
……文節境界検出部、4……音節区間検出部、5
……音節認識部、21……定常部検出部、22…
…マツチング部、23……発声速度推定部、31
……無音区間検出部、32……文節境界判定部。
ク図、第2図はその要部詳細構成を示すブロツク
図、第3図はその発声速度推定部に記憶された母
音継続時間長−発声速度対応表を示すグラフであ
る。 1……音声分析部、2……音声速度検出部、3
……文節境界検出部、4……音節区間検出部、5
……音節認識部、21……定常部検出部、22…
…マツチング部、23……発声速度推定部、31
……無音区間検出部、32……文節境界判定部。
Claims (1)
- 1 入力された音声中に含まれる母音の継続時間
長を検出する手段と、その母音継続時間長より入
力音声の発声速度を推定する手段と、その発声速
度に基づいて入力音声の文節間無音区間長のしき
い値を算出する手段と、入力音声の無音区間を検
出する手段を備え、検出された無音区間の長さが
上記しきい値を越えたとき、その無音区間を文節
境界と判定するよう構成された音声入力装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57172898A JPS5961900A (ja) | 1982-09-30 | 1982-09-30 | 音声入力装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57172898A JPS5961900A (ja) | 1982-09-30 | 1982-09-30 | 音声入力装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5961900A JPS5961900A (ja) | 1984-04-09 |
| JPS63799B2 true JPS63799B2 (ja) | 1988-01-08 |
Family
ID=15950378
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57172898A Granted JPS5961900A (ja) | 1982-09-30 | 1982-09-30 | 音声入力装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5961900A (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0752357B2 (ja) * | 1987-09-11 | 1995-06-05 | 日本電信電話株式会社 | 音声データ蓄積装置 |
| CN109478405A (zh) * | 2016-07-22 | 2019-03-15 | 索尼公司 | 信息处理设备、信息处理方法以及程序 |
-
1982
- 1982-09-30 JP JP57172898A patent/JPS5961900A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5961900A (ja) | 1984-04-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100719650B1 (ko) | 잡음 신호에서 음성의 엔드포인팅 방법 | |
| JPH08115093A (ja) | 終話検出方法及び装置並びに連続音声認識方法及び装置 | |
| JP3611223B2 (ja) | 音声認識装置及び方法 | |
| JP3069531B2 (ja) | 音声認識方法 | |
| JPS63799B2 (ja) | ||
| JP2000163099A (ja) | 雑音除去装置、音声認識装置および記憶媒体 | |
| JPS5912185B2 (ja) | 有声無声判定装置 | |
| JP3428805B2 (ja) | 音声認識のための音声区間始端補正方法及び装置並びに音声認識方法 | |
| JP3360978B2 (ja) | 音声認識装置 | |
| KR100350003B1 (ko) | 음성신호로부터워드를결정하는시스템 | |
| JP3588929B2 (ja) | 音声認識装置 | |
| JP2006010739A (ja) | 音声認識装置 | |
| KR100449912B1 (ko) | 음성인식시스템의 핵심어 검출을 위한 후처리방법 | |
| JPH0217118B2 (ja) | ||
| JPH11305788A (ja) | 有声音の定常区間判定方法とセグメンテーション装置 | |
| JPH03114100A (ja) | 音声区間検出装置 | |
| JP2004510209A (ja) | 発声された番号シーケンスの分析方法及び装置 | |
| KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
| JP2664785B2 (ja) | 音声認識装置 | |
| JP3049711B2 (ja) | 音声処理装置 | |
| JP2534242B2 (ja) | パタ―ン比較方法 | |
| JPH0558552B2 (ja) | ||
| JPH07225592A (ja) | 有音区間検出装置 | |
| JP3901425B2 (ja) | 音声検出装置 | |
| JPH09230884A (ja) | 文音声変換方法ならびに文音声変換装置における息継ぎ位置決定方法 |