JPS5876894A - 単音節認識装置 - Google Patents
単音節認識装置Info
- Publication number
- JPS5876894A JPS5876894A JP56174115A JP17411581A JPS5876894A JP S5876894 A JPS5876894 A JP S5876894A JP 56174115 A JP56174115 A JP 56174115A JP 17411581 A JP17411581 A JP 17411581A JP S5876894 A JPS5876894 A JP S5876894A
- Authority
- JP
- Japan
- Prior art keywords
- consonant
- vowel
- bangs
- standard
- bang
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 5
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は区切って発声された日本語のホな文字略に対応
する単音節を認識する音声胤識装置の改良に関する。
する単音節を認識する音声胤識装置の改良に関する。
従来、区切って発声された単音節をfg識する方法とし
てバタンマツチングを用いる方法があり大。
てバタンマツチングを用いる方法があり大。
代表的な方法としては、以下のような方法がある。
通常、日本語の単音節は、轢とんどが子音上母音の形を
しているため、両者を分けて認識する手法が用−られる
。まず、入力された音声を分析して得られた音声バタン
の子音部と母音部を切り出す。
しているため、両者を分けて認識する手法が用−られる
。まず、入力された音声を分析して得られた音声バタン
の子音部と母音部を切り出す。
母音部の音声バタン、すなわち母音バタンを、あらかじ
め登録1れてぃ(る母音標準バタンとバタンマツチング
して母音カテゴリを決定する。
め登録1れてぃ(る母音標準バタンとバタンマツチング
して母音カテゴリを決定する。
つぎに、子音バタンとあらbじめ登録されている子音標
準バタンとをバタンマツチングして、子音カテゴリを決
定し、単音節の認識結果を決定する。
準バタンとをバタンマツチングして、子音カテゴリを決
定し、単音節の認識結果を決定する。
母音部は一般に安定したバタンか得られるため、切)出
す方法及びバタンマツチングの方法は、あまり法及びバ
タンマツチングの方法は1.さまざまな変形がある・ たとえば、1つの方法として、音声の始端ふらある定t
pたフレーム数の音声バタンを切り出しこれを子音バタ
ンとする方法が考えられる。この方法は、定tzたフレ
ーム数のパタ″ン同士を比較するため、時間軸を伸縮さ
せる必要はない。このため少な一計算量で認識すること
ができる。
す方法及びバタンマツチングの方法は、あまり法及びバ
タンマツチングの方法は1.さまざまな変形がある・ たとえば、1つの方法として、音声の始端ふらある定t
pたフレーム数の音声バタンを切り出しこれを子音バタ
ンとする方法が考えられる。この方法は、定tzたフレ
ーム数のパタ″ン同士を比較するため、時間軸を伸縮さ
せる必要はない。このため少な一計算量で認識すること
ができる。
しかし、子音の時間長は、それぞれの発声またはカテゴ
リの違いにより大吉〈異な°ることがある。
リの違いにより大吉〈異な°ることがある。
この時のフレーム数を時間長の長−子音の長さに合わせ
ると標準バタン記憶のために多くのメモリ量を必要とす
ることとなる。また、この方法では時間長の短い子音同
士の比較の場合、長いフレーム数で比較する丸め特徴が
、うすめられるおそれがある。一方、時間長の短い子音
の長さにフレーム数を合せると長い時間長の子音が認識
しにくくなると―う欠点もある。
ると標準バタン記憶のために多くのメモリ量を必要とす
ることとなる。また、この方法では時間長の短い子音同
士の比較の場合、長いフレーム数で比較する丸め特徴が
、うすめられるおそれがある。一方、時間長の短い子音
の長さにフレーム数を合せると長い時間長の子音が認識
しにくくなると―う欠点もある。
2番目の方法として、子音の長さに合せて子音部を切抄
出し、子音バタンと子音標準バタンをダイナミック・プ
ログラミング法を用いて時間軸を非線形に伸縮させてマ
ツチングする方法が考えられる。この方法を用いれば、
長さの異なるバタン同士を、きめmi<マッンングする
ことができる〇しかし、このダイナミック・ブリグラミ
ング法は、かなシの計算量を必要とする。また、単語認
識の場合と異′&す、単音節認識の場合は、時間軸の非
線形伸縮の効果は少ないと考えられるので、必らずしも
最適な方法とは言えない。
出し、子音バタンと子音標準バタンをダイナミック・プ
ログラミング法を用いて時間軸を非線形に伸縮させてマ
ツチングする方法が考えられる。この方法を用いれば、
長さの異なるバタン同士を、きめmi<マッンングする
ことができる〇しかし、このダイナミック・ブリグラミ
ング法は、かなシの計算量を必要とする。また、単語認
識の場合と異′&す、単音節認識の場合は、時間軸の非
線形伸縮の効果は少ないと考えられるので、必らずしも
最適な方法とは言えない。
本発明の目的は単音節の認識を、少ない標準バタンメモ
リ量及び少ない計算量で行ない、高−認識性能を得るこ
とにある。この目的を達成するために1本発明による単
音節認識装置は、区切って発声され九単音節をバタン化
し、音声バタンとする分析部と、前記音声バタンより子
音部分と母音部分を切り出し、子音バタン及び母音バタ
ンとする音声切り出し部と、あらかじめ発声された単音
節の子音バタン及び母音バタンを、それぞれ子音標準バ
タン、母音標準バタンとして記憶しておく標準バタンメ
モリ部と、入力された母音バタンと前記母音標準バタン
をマツチングし母音カテゴリを決定する母、パ音マツチ
ング部逅、入力された子音バタンと前記子音標準バタン
をマツチングする際に両者の時間長が異なる場合、短い
方の子音バタンの後に母音バタンを付加してマツチング
する子音マツチング部とを有して構成される。
リ量及び少ない計算量で行ない、高−認識性能を得るこ
とにある。この目的を達成するために1本発明による単
音節認識装置は、区切って発声され九単音節をバタン化
し、音声バタンとする分析部と、前記音声バタンより子
音部分と母音部分を切り出し、子音バタン及び母音バタ
ンとする音声切り出し部と、あらかじめ発声された単音
節の子音バタン及び母音バタンを、それぞれ子音標準バ
タン、母音標準バタンとして記憶しておく標準バタンメ
モリ部と、入力された母音バタンと前記母音標準バタン
をマツチングし母音カテゴリを決定する母、パ音マツチ
ング部逅、入力された子音バタンと前記子音標準バタン
をマツチングする際に両者の時間長が異なる場合、短い
方の子音バタンの後に母音バタンを付加してマツチング
する子音マツチング部とを有して構成される。
以下、本発明による一実施例について、図と共に説明す
る。第1図は本発明による一実施例全体の構tを示すブ
ロック図である。!イク賞7オン1より入力された音声
は、分析部2で分析され、音声バタンPとして出力され
る。音声バタンPよシ音声切抄出し部3において子音バ
タンC及び母音バタンVが、切シ出される・標準パ゛タ
ン登録時には、これらのバタンか、それぞれ子音標準バ
タンメモリ4と母音標準バタンメモリ5の中に保持され
る。認識時には、まず母音バタンVを母音マツチング部
6におψで、母音標準バタン■Rとマ、チングをとる。
る。第1図は本発明による一実施例全体の構tを示すブ
ロック図である。!イク賞7オン1より入力された音声
は、分析部2で分析され、音声バタンPとして出力され
る。音声バタンPよシ音声切抄出し部3において子音バ
タンC及び母音バタンVが、切シ出される・標準パ゛タ
ン登録時には、これらのバタンか、それぞれ子音標準バ
タンメモリ4と母音標準バタンメモリ5の中に保持され
る。認識時には、まず母音バタンVを母音マツチング部
6におψで、母音標準バタン■Rとマ、チングをとる。
このマツチング方法は母音バタンどうしの距離を求めれ
ばよ≠。これによk)/a/、 /i、/: /lシ/
e/; 10/等の母音カテゴリを認識し結果を母音カ
テゴリVCとして出力する。子音マツチング117では
子音部のマツチングを行ない、認識結果を/kl/v’
等の子音カテゴリCCとして出力する。子音マツチング
部7の動作原理を説明する。第2図は子音マツチング部
7の動作例を説明するた恰の概念図である。入力された
子音バタン11(図は5フレームのバタンの例である)
と子音標準Iタン12 (図は8フレームのバタンの例
である)の間の距離を求めるとする。それぞれの音声パ
ターンは右方向を時間方向とするベクトルの時系列であ
る。音声の始端から5フレーム目までは、矢印13で示
すように入力された子音バタンと子音標準バタンの同じ
位置のフレームどうしを比較し距離を求める。5フレー
ム目以降は、子音標準バタン12を人力された音声の1
フレ一ム分の母音バタン15と矢印14で示すように対
応させ距離を求める。子音バタンの後部は通常母音バタ
ンと、はば連続しておシ、母音バタンは時間的にほぼ一
定である。このため、短いはうの子音バタンのあとに母
音バタンを連続させることによシ、もとのバタンを再現
させることができる。
ばよ≠。これによk)/a/、 /i、/: /lシ/
e/; 10/等の母音カテゴリを認識し結果を母音カ
テゴリVCとして出力する。子音マツチング117では
子音部のマツチングを行ない、認識結果を/kl/v’
等の子音カテゴリCCとして出力する。子音マツチング
部7の動作原理を説明する。第2図は子音マツチング部
7の動作例を説明するた恰の概念図である。入力された
子音バタン11(図は5フレームのバタンの例である)
と子音標準Iタン12 (図は8フレームのバタンの例
である)の間の距離を求めるとする。それぞれの音声パ
ターンは右方向を時間方向とするベクトルの時系列であ
る。音声の始端から5フレーム目までは、矢印13で示
すように入力された子音バタンと子音標準バタンの同じ
位置のフレームどうしを比較し距離を求める。5フレー
ム目以降は、子音標準バタン12を人力された音声の1
フレ一ム分の母音バタン15と矢印14で示すように対
応させ距離を求める。子音バタンの後部は通常母音バタ
ンと、はば連続しておシ、母音バタンは時間的にほぼ一
定である。このため、短いはうの子音バタンのあとに母
音バタンを連続させることによシ、もとのバタンを再現
させることができる。
この方法により長さの異なるバタン同士も簡単にマツチ
ングさせることができる。また、標準バタンとしては子
音部と母音部のバタンを分けて必要なだけ記憶していれ
ばよいため、標準バタンのメモリ量も少なくてすむ。こ
こに示した例は入力された子音バタンのほうが、子音標
準バタンより短い場合を示したが、逆の場合でも両方を
入れかえるだけで、以上の手順と全く同じことを行なえ
ばよい・ 第3図は子音マツチング部70回路の具体的な構成例を
示すブロック図である。入力された音声の子音バタンC
は子音バッファ21に母音バタンVは母音バッファ22
に保持される。まえ、子音標準バタンCRは、子音標準
バタンバッファ23に母音標準バタンVBは母音標準バ
タンバッファ24に保持される。入力バタンフレームカ
ウンタ25は子音バッフ 721 Kフレームアドレス
lAt−出力する。このアドレスにしたがってフレーム
ごとの子音パターンCFが子音バッフ721より出力さ
れる。同様に標準バタン7レームカウンタ26は子as
sパタンバッファ23にフレームアドレスされる。この
入力バタン7レームカウンタ25及びl1lsバタン7
レームカウンタ26は同期シて1よりカウントアツプし
、それぞれのフレーム数に等しい値となったら、等しい
値となったほうのカウンタのカウントが止まる。データ
セレクタ27及び28は、7レームカウンタがカウント
を続けて−る聞は子音バタンCF及び子音標準バタ′/
cRFを選択し、距離計算部29に出力する。距離計算
部29では、フレームごとの2つのバタン間の距離が計
算される。このフレームごとの距離はアキμレータ30
で1バタン分の距離が積算される。
ングさせることができる。また、標準バタンとしては子
音部と母音部のバタンを分けて必要なだけ記憶していれ
ばよいため、標準バタンのメモリ量も少なくてすむ。こ
こに示した例は入力された子音バタンのほうが、子音標
準バタンより短い場合を示したが、逆の場合でも両方を
入れかえるだけで、以上の手順と全く同じことを行なえ
ばよい・ 第3図は子音マツチング部70回路の具体的な構成例を
示すブロック図である。入力された音声の子音バタンC
は子音バッファ21に母音バタンVは母音バッファ22
に保持される。まえ、子音標準バタンCRは、子音標準
バタンバッファ23に母音標準バタンVBは母音標準バ
タンバッファ24に保持される。入力バタンフレームカ
ウンタ25は子音バッフ 721 Kフレームアドレス
lAt−出力する。このアドレスにしたがってフレーム
ごとの子音パターンCFが子音バッフ721より出力さ
れる。同様に標準バタン7レームカウンタ26は子as
sパタンバッファ23にフレームアドレスされる。この
入力バタン7レームカウンタ25及びl1lsバタン7
レームカウンタ26は同期シて1よりカウントアツプし
、それぞれのフレーム数に等しい値となったら、等しい
値となったほうのカウンタのカウントが止まる。データ
セレクタ27及び28は、7レームカウンタがカウント
を続けて−る聞は子音バタンCF及び子音標準バタ′/
cRFを選択し、距離計算部29に出力する。距離計算
部29では、フレームごとの2つのバタン間の距離が計
算される。このフレームごとの距離はアキμレータ30
で1バタン分の距離が積算される。
子音バタンのフレーム数が子音標準バタンより小さい場
合について説明する。入力バタン7レームカウンタ25
の値が子音バタンのフレーム数まで達してカウントが止
まると、データセレクタ27によ転母音バタンバッファ
22からの母音フレームデータVFが選択され、距離計
算部29に出力される。標準バタンフレームカウンタ2
6の値が子音標準バタンの7レ一人数まで達すると両メ
タン間の距離が求まったことKなり、距離積算値dが7
キユムレー、夕3oより出力される・以上は入力された
子音バタンのフレーム数のほうが、小さい場合であるが
、逆圧子音標準バタンのフレーム数が小さい場合も同様
に動作する。子音゛標準バタンCHPのうしろには母音
標準バタンVRFが付加される。この距離積算値dは標
準バタンのカテゴリごとに最小値計算部31に入力され
る。ここでは全子音カテゴリにおける最小値を計算し、
最小値をとる子音カテゴリCCが認識結果として出力さ
れる。
合について説明する。入力バタン7レームカウンタ25
の値が子音バタンのフレーム数まで達してカウントが止
まると、データセレクタ27によ転母音バタンバッファ
22からの母音フレームデータVFが選択され、距離計
算部29に出力される。標準バタンフレームカウンタ2
6の値が子音標準バタンの7レ一人数まで達すると両メ
タン間の距離が求まったことKなり、距離積算値dが7
キユムレー、夕3oより出力される・以上は入力された
子音バタンのフレーム数のほうが、小さい場合であるが
、逆圧子音標準バタンのフレーム数が小さい場合も同様
に動作する。子音゛標準バタンCHPのうしろには母音
標準バタンVRFが付加される。この距離積算値dは標
準バタンのカテゴリごとに最小値計算部31に入力され
る。ここでは全子音カテゴリにおける最小値を計算し、
最小値をとる子音カテゴリCCが認識結果として出力さ
れる。
以上、述べてきた実施例は、説明の便宜上選択した、は
んの−例であって本発明はこの実施例のみに限定される
ものではない。
んの−例であって本発明はこの実施例のみに限定される
ものではない。
第1図は本発明の一実施例について示したブロック図で
、第2図は子音マツチング部の動作例を示す説明するた
めの概念図、第3図は子音マツチング部の具体的な回路
の一例を示すブロック図である。
、第2図は子音マツチング部の動作例を示す説明するた
めの概念図、第3図は子音マツチング部の具体的な回路
の一例を示すブロック図である。
Claims (1)
- 区切って発声された単音節をバタン化し、音声バタンと
する分線部と前記音声パダンよ染子音部分と母音部分を
切抄出し、子音バタン及び母音バタンとする音声切抄出
し部と、あら春じめ発声された単音節の子音バタン及び
母音バタンを、それぞれ子音標準バタン、母音標準バタ
ンとして記憶しておく標準バタンメモリ部と、入力され
た母音バタンと、前記母音標準バタンを!、ツチンダし
、母音カテゴリを決定する母音マツチング部と、入力さ
れた子音バタンと前記子音標準バタンをマツチングする
際に両者の時間長が異なる場合、短い方の子音バタンの
後に母音バタンを付加してマツチングする子音マツチン
グ部とを有し〜そ成ることを特徴とする単音節認識装置
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56174115A JPS5876894A (ja) | 1981-10-30 | 1981-10-30 | 単音節認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56174115A JPS5876894A (ja) | 1981-10-30 | 1981-10-30 | 単音節認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5876894A true JPS5876894A (ja) | 1983-05-10 |
| JPH0160160B2 JPH0160160B2 (ja) | 1989-12-21 |
Family
ID=15972896
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56174115A Granted JPS5876894A (ja) | 1981-10-30 | 1981-10-30 | 単音節認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5876894A (ja) |
-
1981
- 1981-10-30 JP JP56174115A patent/JPS5876894A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0160160B2 (ja) | 1989-12-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0109190B1 (en) | Monosyllable recognition apparatus | |
| JPS62239231A (ja) | 口唇画像入力による音声認識方法 | |
| JPS62235998A (ja) | 音節識別方式 | |
| JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
| JP3104661B2 (ja) | 日本語文章作成装置 | |
| US4783809A (en) | Automatic speech recognizer for real time operation | |
| JPS6316766B2 (ja) | ||
| US4790017A (en) | Speech processing feature generation arrangement | |
| JPS5876894A (ja) | 単音節認識装置 | |
| JPH09179578A (ja) | 単音節認識装置 | |
| JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
| JP3039453B2 (ja) | 音声認識装置 | |
| JP3503862B2 (ja) | 音声認識方法及び音声認識プログラムを格納した記録媒体 | |
| JP3009709B2 (ja) | 日本語音声認識方法 | |
| JP2615649B2 (ja) | 単語音声認識装置 | |
| JPS61165797A (ja) | 音声認識装置 | |
| JPH04271397A (ja) | 音声認識装置 | |
| JP2707552B2 (ja) | 単語音声認識装置 | |
| JP2001159896A (ja) | 音声認識機能を利用した簡易文字入力方法 | |
| JPH0554678B2 (ja) | ||
| JPH0415960B2 (ja) | ||
| JPS6312000A (ja) | 音声認識装置 | |
| JPS61143797A (ja) | 音声認識装置 | |
| JPH0119596B2 (ja) | ||
| JPH07302098A (ja) | 単語音声認識装置 |