JPS5995597A - 音声特徴パラメ−タ作成方式 - Google Patents
音声特徴パラメ−タ作成方式Info
- Publication number
- JPS5995597A JPS5995597A JP57207179A JP20717982A JPS5995597A JP S5995597 A JPS5995597 A JP S5995597A JP 57207179 A JP57207179 A JP 57207179A JP 20717982 A JP20717982 A JP 20717982A JP S5995597 A JPS5995597 A JP S5995597A
- Authority
- JP
- Japan
- Prior art keywords
- frames
- section
- frame
- speech
- normalization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 claims description 12
- 238000010606 normalization Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008602 contraction Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
本発明は音声認識装置等において用いられる特徴パラメ
ータの作成方式に関し、更に詳細には特徴ベクトルの時
系列の長さの正規化に改良を加えたものである。
ータの作成方式に関し、更に詳細には特徴ベクトルの時
系列の長さの正規化に改良を加えたものである。
〈従来技術〉
従来、特徴ベクトルの時系列を正規化する場合には全体
を線形に伸縮させる方法が一般にとられている。
を線形に伸縮させる方法が一般にとられている。
しかし、単音節音声を認識する場合、入力音声から抽出
された特徴ベクトルの時系列の前端部に出現する子音及
び子音から母音へのわたりといわれる部分に他の音節と
区別される情報が多く含まれており、従来の如く線形に
伸縮すると、その部分の情報が太き《損われてしまう問
題点があった。
された特徴ベクトルの時系列の前端部に出現する子音及
び子音から母音へのわたりといわれる部分に他の音節と
区別される情報が多く含まれており、従来の如く線形に
伸縮すると、その部分の情報が太き《損われてしまう問
題点があった。
この事は、また単音節音声だけでなく、アルファベット
等の音節長の短かい音声の場合にも同様の問題が生じる
。
等の音節長の短かい音声の場合にも同様の問題が生じる
。
く目的〉
本発明は、このような従来の問題点を除去した音声特徴
パラメータ作成方式を提供することを目的として成され
たもので、本発明は入力音声が音声区間抽出部及び特徴
パラメータ抽出部を通って特徴ベクトルの時系列となっ
たものに対して,全体の長さを圧縮または伸長して時間
軸を正規化する場合、特徴ベクトルの時系列の前端の複
数フレームをそのまま取り入れ、後方を伸縮させて、前
端部に重みを持たせるようにして、認識率の向上を図る
ことが出来るようにしたものである。
パラメータ作成方式を提供することを目的として成され
たもので、本発明は入力音声が音声区間抽出部及び特徴
パラメータ抽出部を通って特徴ベクトルの時系列となっ
たものに対して,全体の長さを圧縮または伸長して時間
軸を正規化する場合、特徴ベクトルの時系列の前端の複
数フレームをそのまま取り入れ、後方を伸縮させて、前
端部に重みを持たせるようにして、認識率の向上を図る
ことが出来るようにしたものである。
〈実施例〉
以下、本発明の詳細な説明する。
第1図は本発明の音声特徴パラメータ作成方式の適用可
能な音声認識装置の一例を示すブロック図である。
能な音声認識装置の一例を示すブロック図である。
第1図において、発声された入力音声はマイクロホン等
の検出器1により電気信号に変換される。
の検出器1により電気信号に変換される。
この検出器1は、人の可聴周波数である20数Hz〜1
5KHz程度の周波数を検出することが出来、特に人の
会話音声領域の周波数を歪なく検出し得るものが好まし
い。この検出器1の出力側には増幅器2が接続される。
5KHz程度の周波数を検出することが出来、特に人の
会話音声領域の周波数を歪なく検出し得るものが好まし
い。この検出器1の出力側には増幅器2が接続される。
この増幅器2は前記の音声周波数を歪なく増″幅し得る
ものが好ましい。この増幅器2の出力側に音声区間抽出
部3が接続され、この音声区間抽出部3により音声の識
別開始タイミングと識別終了タイミングが与えられ、こ
の音声区間内の音声信号が次段の特徴パラメータ抽出部
4に与えられる。
ものが好ましい。この増幅器2の出力側に音声区間抽出
部3が接続され、この音声区間抽出部3により音声の識
別開始タイミングと識別終了タイミングが与えられ、こ
の音声区間内の音声信号が次段の特徴パラメータ抽出部
4に与えられる。
特徴パラメータ抽出部4は例えば互に籾通過帯域を異な
らせた複数個の帯域フィルタと各帯域フィルタの出力を
ホールドするサンプルホールド回路と、このサンプルホ
ールド回路の出力を順次10ミリ程度の間隔でサンプリ
ングするアナログスイッチと、このアナログスイッチの
出力を例えば12ビツトのデジタル信号に変換して特徴
パラメータP1を出力するA/D変換器と、このA/D
変換器の出力を対数変換する対数化部より構成されてい
る。
らせた複数個の帯域フィルタと各帯域フィルタの出力を
ホールドするサンプルホールド回路と、このサンプルホ
ールド回路の出力を順次10ミリ程度の間隔でサンプリ
ングするアナログスイッチと、このアナログスイッチの
出力を例えば12ビツトのデジタル信号に変換して特徴
パラメータP1を出力するA/D変換器と、このA/D
変換器の出力を対数変換する対数化部より構成されてい
る。
また上記特徴パラメータ抽出部4により抽出された対数
変換された特徴パラメータが次段のパワー正規化部5及
び時間軸正規化部6を通って正規化され、この正規化さ
れた特徴パラメータと標準パターンメモリ7に記憶され
た標準特徴パラメータトカマッチング部8により比較さ
れて入力音声が認識され、その結果が出力部1oに出力
されるように構成されている。
変換された特徴パラメータが次段のパワー正規化部5及
び時間軸正規化部6を通って正規化され、この正規化さ
れた特徴パラメータと標準パターンメモリ7に記憶され
た標準特徴パラメータトカマッチング部8により比較さ
れて入力音声が認識され、その結果が出力部1oに出力
されるように構成されている。
上記時間軸正規化部6は上記特徴パラメータ抽出部4に
より抽出された複数フレームの特徴パラメータを固定フ
レーム数に変換するように動作し、例えばマイクロプロ
セッサにより第2図に示す如き正規化処理動作を実行す
るように構成されている。
より抽出された複数フレームの特徴パラメータを固定フ
レーム数に変換するように動作し、例えばマイクロプロ
セッサにより第2図に示す如き正規化処理動作を実行す
るように構成されている。
即ち、今音声区間抽出部2により区切られた音声区間が
Mフレームあったとする(ステップn1〜n3)。また
各フレームにおける特徴ベクトルをト(1)で表わし、
正規化された特徴ベクトルをlb (i)で表わし、正
規化前のフレーム番号を工、正規化後のフレーム番号を
J、正規化フレーム数をNとすると1次の如き過程(第
2図参照)により正規化処理が実行される。
Mフレームあったとする(ステップn1〜n3)。また
各フレームにおける特徴ベクトルをト(1)で表わし、
正規化された特徴ベクトルをlb (i)で表わし、正
規化前のフレーム番号を工、正規化後のフレーム番号を
J、正規化フレーム数をNとすると1次の如き過程(第
2図参照)により正規化処理が実行される。
(i)M>Nの場合
第にフレームまでは無条件に採用する(−n4〜n8の
繰返し〕。
繰返し〕。
残りの(M−K)フレームを(N−K)個の区間に分け
る(n4〜n7.n9の繰返し)。
る(n4〜n7.n9の繰返し)。
(it) M < Nの場合
第にフレームまでは無条件に採用する(n4〜n6.n
lO,n+2.nllの繰返し)。
lO,n+2.nllの繰返し)。
残りの(M−K )フレームを(N −K ’)個の区
間に分ける(n4〜06.nlO,n12.n13の繰
返し〕。
間に分ける(n4〜06.nlO,n12.n13の繰
返し〕。
(fii) M = Nの場合
全てのフレームを無条件に採用する(n4〜n5゜nl
O,n、11の繰返し)。
O,n、11の繰返し)。
上記の如き処理によりN個の区間の前にあるいはに′個
についての各フレームを無条件に採用し、後(N−K)
あるいはCN−に’;個については各区間の先頭フレー
ムを各特徴ベクトルとして採用することニ方り、全体と
してMフレームをNフレームに伸縮することが出来る。
についての各フレームを無条件に採用し、後(N−K)
あるいはCN−に’;個については各区間の先頭フレー
ムを各特徴ベクトルとして採用することニ方り、全体と
してMフレームをNフレームに伸縮することが出来る。
例えば第3図の例では音声区間が35フレームの時にに
−8として24フレームに正規化した様子を示しており
、Flは元のフレーム番号、F2は伸縮時のフレーム番
号を示している。またフレー4番W中のX印のフレーム
は採用しないフレームを示している。
−8として24フレームに正規化した様子を示しており
、Flは元のフレーム番号、F2は伸縮時のフレーム番
号を示している。またフレー4番W中のX印のフレーム
は採用しないフレームを示している。
また第4図の例では音声区間が16フレームの時にに′
−8として24フレームに正規化した様子を示しており
、上記第3図と同様F1は元のフレーム番号、F2は伸
縮時のフレーム番号を示し、またフレーム番号中のX印
のフレームは採用しなイフレームであり、このように2
4フレームより少ないフレーム数の場合には同一フレー
ムが2度以上採用される場合が生じる。
−8として24フレームに正規化した様子を示しており
、上記第3図と同様F1は元のフレーム番号、F2は伸
縮時のフレーム番号を示し、またフレーム番号中のX印
のフレームは採用しなイフレームであり、このように2
4フレームより少ないフレーム数の場合には同一フレー
ムが2度以上採用される場合が生じる。
第5図は単音節[KAJの波形における正規化処理の様
子を図示したものである。
子を図示したものである。
同図において、波形aは単音節「K A Jの波形例を
示し、この波形の例により前端部の変化が大きく、後方
は定常的になっている。
示し、この波形の例により前端部の変化が大きく、後方
は定常的になっている。
従来の正規化の方法では前端の情報量の多い所を失なっ
ていたが、本発明の実施例によればフレームF1からフ
レームF2への変換の例からも明らかなように情報量の
少ない定常的な部分のフレームを除くことになる。
ていたが、本発明の実施例によればフレームF1からフ
レームF2への変換の例からも明らかなように情報量の
少ない定常的な部分のフレームを除くことになる。
〈効果〉
以上の如く、本発明によれば入力音声か音声区間抽出部
及び特徴パラメータ抽出部を通って特徴ベクトルの時系
列となったものに対して、全体の長さを圧縮イたは伸長
して時間軸を正規化する場合、特徴ベクトルの時系列の
前端の複数フレームをそのまま取り入れ、後方を伸縮さ
せて、前端部に重みを持たせるようにしているため、情
報量の多い部分を失うことなく正規化することが出来、
その結果認識率の向上を図ることか可能となる。
及び特徴パラメータ抽出部を通って特徴ベクトルの時系
列となったものに対して、全体の長さを圧縮イたは伸長
して時間軸を正規化する場合、特徴ベクトルの時系列の
前端の複数フレームをそのまま取り入れ、後方を伸縮さ
せて、前端部に重みを持たせるようにしているため、情
報量の多い部分を失うことなく正規化することが出来、
その結果認識率の向上を図ることか可能となる。
第1図は本発明の音声特徴パラメータ作成方式の適用可
能な音声認識装置の構成を示すブロック図、第2図は本
発明方式の処理過程を示すフロー図 第3図及び第4図
はフレームの正規化例を示す図、第5図は音声波形及び
その分析フレームの正規化の説明に供する図である。 3・・・音声区間抽出部、4・・・特徴、soラメータ
tII]出部、6・・・時間軸正規化部、Fl・・・正
規化前フレーム番号、F2・・・正規化後フレーム番号
。 代理人 弁理士 福 士 愛 彦(他2名)5
能な音声認識装置の構成を示すブロック図、第2図は本
発明方式の処理過程を示すフロー図 第3図及び第4図
はフレームの正規化例を示す図、第5図は音声波形及び
その分析フレームの正規化の説明に供する図である。 3・・・音声区間抽出部、4・・・特徴、soラメータ
tII]出部、6・・・時間軸正規化部、Fl・・・正
規化前フレーム番号、F2・・・正規化後フレーム番号
。 代理人 弁理士 福 士 愛 彦(他2名)5
Claims (1)
- 1、入力音声から抽出された特徴ベクトルの時系列に対
して全体の長さを圧縮または伸長して時間軸を正規化す
る際、上記特徴ベクトルの時系列の前端部分はそのまま
採用し、後方部分を伸縮させて前端部に重みをもたせる
ように成したことを特徴とする特許
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57207179A JPS5995597A (ja) | 1982-11-25 | 1982-11-25 | 音声特徴パラメ−タ作成方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57207179A JPS5995597A (ja) | 1982-11-25 | 1982-11-25 | 音声特徴パラメ−タ作成方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5995597A true JPS5995597A (ja) | 1984-06-01 |
Family
ID=16535545
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57207179A Pending JPS5995597A (ja) | 1982-11-25 | 1982-11-25 | 音声特徴パラメ−タ作成方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5995597A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07190542A (ja) * | 1993-12-28 | 1995-07-28 | Rinnai Corp | 吸収式冷凍装置の吸収液ポンプ |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS4895109A (ja) * | 1972-03-14 | 1973-12-06 | ||
| JPS5584996A (en) * | 1978-12-22 | 1980-06-26 | Fujitsu Ltd | Tone recognition system |
| JPS5665198A (en) * | 1979-10-31 | 1981-06-02 | Tokyo Shibaura Electric Co | Singallsyllable identifier |
| JPS5752096A (en) * | 1980-09-16 | 1982-03-27 | Oki Electric Ind Co Ltd | Voide recognizing system |
-
1982
- 1982-11-25 JP JP57207179A patent/JPS5995597A/ja active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS4895109A (ja) * | 1972-03-14 | 1973-12-06 | ||
| JPS5584996A (en) * | 1978-12-22 | 1980-06-26 | Fujitsu Ltd | Tone recognition system |
| JPS5665198A (en) * | 1979-10-31 | 1981-06-02 | Tokyo Shibaura Electric Co | Singallsyllable identifier |
| JPS5752096A (en) * | 1980-09-16 | 1982-03-27 | Oki Electric Ind Co Ltd | Voide recognizing system |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07190542A (ja) * | 1993-12-28 | 1995-07-28 | Rinnai Corp | 吸収式冷凍装置の吸収液ポンプ |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8326610B2 (en) | Producing phonitos based on feature vectors | |
| JPS6147440B2 (ja) | ||
| JPS58130393A (ja) | 音声認識装置 | |
| JPS5972496A (ja) | 単音識別装置 | |
| JPH0582599B2 (ja) | ||
| JP3266124B2 (ja) | アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置 | |
| JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
| JPS58108590A (ja) | 音声認識装置 | |
| JPS63221397A (ja) | 単音節音声認識装置 | |
| CN85100180B (zh) | 一种利用计算机对汉语语音进行识别的装置 | |
| JP4007628B2 (ja) | 音声ピッチの周期の正規化を行う音声合成装置 | |
| JPS62299899A (ja) | よう音・直音言い分け評価方式 | |
| JPH03120434A (ja) | 音声認識装置 | |
| JPH0558556B2 (ja) | ||
| JPS62238599A (ja) | 音声区間検出方法 | |
| JPS63223696A (ja) | 音声パタ−ン作成方式 | |
| JPS6257000A (ja) | 音声認識装置 | |
| JPS61124998A (ja) | 音声分析装置 | |
| JPS6031196A (ja) | 音声パタ−ン作成装置 | |
| JPH0567036B2 (ja) | ||
| JPS62164100A (ja) | 声帯特徴抽出装置 | |
| JPS60254200A (ja) | 音声基本周波数抽出装置 | |
| JPH03239299A (ja) | 摩擦子音識別方式 | |
| JPS60143400A (ja) | 音声認識装置 | |
| JPS62115498A (ja) | 無声破裂子音識別方式 |