JPH04365100A - 音声認識に使用する子音の認識方法 - Google Patents
音声認識に使用する子音の認識方法Info
- Publication number
- JPH04365100A JPH04365100A JP3167837A JP16783791A JPH04365100A JP H04365100 A JPH04365100 A JP H04365100A JP 3167837 A JP3167837 A JP 3167837A JP 16783791 A JP16783791 A JP 16783791A JP H04365100 A JPH04365100 A JP H04365100A
- Authority
- JP
- Japan
- Prior art keywords
- consonant
- vowel
- input
- consonants
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 16
- 230000002123 temporal effect Effects 0.000 claims description 3
- 101100328887 Caenorhabditis elegans col-34 gene Proteins 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 2
- RRLHMJHRFMHVNM-BQVXCWBNSA-N [(2s,3r,6r)-6-[5-[5-hydroxy-3-(4-hydroxyphenyl)-4-oxochromen-7-yl]oxypentoxy]-2-methyl-3,6-dihydro-2h-pyran-3-yl] acetate Chemical compound C1=C[C@@H](OC(C)=O)[C@H](C)O[C@H]1OCCCCCOC1=CC(O)=C2C(=O)C(C=3C=CC(O)=CC=3)=COC2=C1 RRLHMJHRFMHVNM-BQVXCWBNSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】この発明は、音声認識に使用する
子音の認識方法に関する。
子音の認識方法に関する。
【0002】
【従来の技術】日本語は、子音と母音とが組み合わされ
て音声を特定している。したがって、子音と母音とを識
別することによって、音声を認識できる。このため、入
力された音声を、子音と母音とに分離し、これを別々に
識別して音声を認識している。母音と子音とに分離され
た音声信号は、バンドパスフィルターを使用し、あるい
は、コンピュータを使用してフーリエ級数に分解して識
別できる。
て音声を特定している。したがって、子音と母音とを識
別することによって、音声を認識できる。このため、入
力された音声を、子音と母音とに分離し、これを別々に
識別して音声を認識している。母音と子音とに分離され
た音声信号は、バンドパスフィルターを使用し、あるい
は、コンピュータを使用してフーリエ級数に分解して識
別できる。
【0003】
【発明が解決しようとする課題】母音は、比較的簡単に
認識できる。それは、母音が、一定の音量で一定時間連
続し、しかも、種類が少ないことが理由である。しかし
ながら、子音の識別精度を高くすることは極めて難しく
、このことが全体の認識率を高くするのを困難にしてい
る。子音は、母音に比較して波形の振幅が極めて小さく
、しかも時間的にも瞬時の出来事であり、さらに困った
ことに、レベル調整が難しい性質がある。
認識できる。それは、母音が、一定の音量で一定時間連
続し、しかも、種類が少ないことが理由である。しかし
ながら、子音の識別精度を高くすることは極めて難しく
、このことが全体の認識率を高くするのを困難にしてい
る。子音は、母音に比較して波形の振幅が極めて小さく
、しかも時間的にも瞬時の出来事であり、さらに困った
ことに、レベル調整が難しい性質がある。
【0004】入力される音声を認識するときに、入力レ
ベルを最適値に調整することは、認識精度を高くするた
めに大切なことである。それは、入力レベルが大きすぎ
ても小さすぎても、識別能力が低下するからである。入
力レベルが大きすぎると、入力信号がオバーフローして
、識別誤差の原因となる。反対に入力レベルが小さいと
S/N比が低下して、雑音による識別誤差を生ずる。
ベルを最適値に調整することは、認識精度を高くするた
めに大切なことである。それは、入力レベルが大きすぎ
ても小さすぎても、識別能力が低下するからである。入
力レベルが大きすぎると、入力信号がオバーフローして
、識別誤差の原因となる。反対に入力レベルが小さいと
S/N比が低下して、雑音による識別誤差を生ずる。
【0005】母音は入力レベルを最適な状態に調整でき
る。母音は比較的長い時間連続するので、ALC(自動
レベルコントロール回路)で、レベルコントロールする
のに時間的な余裕がある。これに対して、子音は音のな
い状態から入力され一瞬のうちに終るので、レベル調整
が極めて難しく、入力レベルによる識別誤差を解消する
のが難しい欠点がある。
る。母音は比較的長い時間連続するので、ALC(自動
レベルコントロール回路)で、レベルコントロールする
のに時間的な余裕がある。これに対して、子音は音のな
い状態から入力され一瞬のうちに終るので、レベル調整
が極めて難しく、入力レベルによる識別誤差を解消する
のが難しい欠点がある。
【0006】この発明は、この欠点を解決することを目
的に開発されたもので、この発明の重要な目的は、子音
の識別を簡単にして高精度にできる音声認識に使用する
子音の認識方法を提供するにある。
的に開発されたもので、この発明の重要な目的は、子音
の識別を簡単にして高精度にできる音声認識に使用する
子音の認識方法を提供するにある。
【0007】
【課題を解決するための手段】この発明の音声認識に使
用する子音の認識方法は、前述の目的を達成するために
、入力された音声信号を記憶手段に記憶し、記憶した音
声を時間的に逆に識別することを特徴としている。
用する子音の認識方法は、前述の目的を達成するために
、入力された音声信号を記憶手段に記憶し、記憶した音
声を時間的に逆に識別することを特徴としている。
【0008】
【実施例】以下、この発明の実施例を図面に基づいて説
明する。但し、以下に示す実施例は、この発明の技術思
想を具体化する為の方法を例示すものであって、この発
明の方法は、処理方法やこれに使用する部材を下記のも
のに特定するものでない。この発明の方法は、特許請求
の範囲に於て、種々の変更を加えることができる。
明する。但し、以下に示す実施例は、この発明の技術思
想を具体化する為の方法を例示すものであって、この発
明の方法は、処理方法やこれに使用する部材を下記のも
のに特定するものでない。この発明の方法は、特許請求
の範囲に於て、種々の変更を加えることができる。
【0009】この発明の子音の認識方法に使用する装置
を図1に示している。この識別装置は、マイク1と、マ
イクアンプ2と、A/Dコンバータ3と、RAM4と、
読出回路5と、演算回路6とを備えている。
を図1に示している。この識別装置は、マイク1と、マ
イクアンプ2と、A/Dコンバータ3と、RAM4と、
読出回路5と、演算回路6とを備えている。
【0010】マイク1は、入力される音声信号を電気信
号に変換する全てのマイク1、例えば、コンデンサーマ
イクや、ダイナミックマイク等が使用できる。
号に変換する全てのマイク1、例えば、コンデンサーマ
イクや、ダイナミックマイク等が使用できる。
【0011】マイクアンプ2は、マイク1から入力され
る低レベルの信号を、数ボルトの出力に増幅する。
る低レベルの信号を、数ボルトの出力に増幅する。
【0012】A/Dコンバータ3は、マイクアンプ2か
ら入力されるアナログ信号をデジタル信号に変換する。
ら入力されるアナログ信号をデジタル信号に変換する。
【0013】RAM4は、デジタル量に変換された音声
信号を一時的に記憶する記憶手段で、演算回路6からの
リセット信号でリセットされる。
信号を一時的に記憶する記憶手段で、演算回路6からの
リセット信号でリセットされる。
【0014】読出回路5は、RAM4に記憶された音声
を逆に読み出しするもので、読み出したデジタル信号を
演算回路6に入力する。
を逆に読み出しするもので、読み出したデジタル信号を
演算回路6に入力する。
【0015】演算回路6は、読出回路5から入力される
信号をフーリエ級数に分解し、分解した周波数成分によ
って母音と子音とに分解し、さらに、母音と子音とが何
であるかを識別する。演算回路6は、分解されたフーリ
エ級数のパターンを記憶するメモリを備えている。メモ
リに記憶するパターンと、分解したフーリエ級数とを比
較して、入力された信号を母音と子音とに分離し、さら
に、母音と子音とが何の音であるかを認識する。演算回
路6は、マイクロコンピュータのCPUとメモリとを組
み合わせた回路が使用できる。
信号をフーリエ級数に分解し、分解した周波数成分によ
って母音と子音とに分解し、さらに、母音と子音とが何
であるかを識別する。演算回路6は、分解されたフーリ
エ級数のパターンを記憶するメモリを備えている。メモ
リに記憶するパターンと、分解したフーリエ級数とを比
較して、入力された信号を母音と子音とに分離し、さら
に、母音と子音とが何の音であるかを認識する。演算回
路6は、マイクロコンピュータのCPUとメモリとを組
み合わせた回路が使用できる。
【0016】図2に示す装置は、複数のバンドパスフィ
ルター7を並列に接続して、入力信号の周波数成分を分
析している。バンドパスフィルター7は、通過周波数が
音声帯域にあって、異なる周波数に設計されている。バ
ンドパスフィルター7の数を多くするにしたがって、音
声の識別能力が高くなるので、通常は、8〜30のバン
ドパスフィルター7を並列に接続する。このようにバン
ドパスフィルター7で入力信号を周波数分析する装置は
、簡単に周波数分析できる特長がある。
ルター7を並列に接続して、入力信号の周波数成分を分
析している。バンドパスフィルター7は、通過周波数が
音声帯域にあって、異なる周波数に設計されている。バ
ンドパスフィルター7の数を多くするにしたがって、音
声の識別能力が高くなるので、通常は、8〜30のバン
ドパスフィルター7を並列に接続する。このようにバン
ドパスフィルター7で入力信号を周波数分析する装置は
、簡単に周波数分析できる特長がある。
【0017】バンドパスフィルター7には、アナログフ
ィルターと、デジタルフィルターとが使用できる。アナ
ログフィルターのバンドパスフィルター7を使用する場
合、図2に示すように、バンドパスフィルター7と読出
回路5との間に、デジタル量をアナログ量に変換するD
/Aコンバータ8を接続する。
ィルターと、デジタルフィルターとが使用できる。アナ
ログフィルターのバンドパスフィルター7を使用する場
合、図2に示すように、バンドパスフィルター7と読出
回路5との間に、デジタル量をアナログ量に変換するD
/Aコンバータ8を接続する。
【0018】バンドパスフィルター7の出力は演算回路
6に入力される。演算回路6は、各バンドパスフィルタ
ー7から入力される信号レベルから、母音と子音とを分
離し、分離した母音と子音とがどの音であるかを識別す
る。この演算回路6は、図1に示す演算回路6と同じよ
うにして、周波数分析された結果を、記憶するパターン
に比較して、音の種類を特定する。
6に入力される。演算回路6は、各バンドパスフィルタ
ー7から入力される信号レベルから、母音と子音とを分
離し、分離した母音と子音とがどの音であるかを識別す
る。この演算回路6は、図1に示す演算回路6と同じよ
うにして、周波数分析された結果を、記憶するパターン
に比較して、音の種類を特定する。
【0019】図1と図2とに示す演算回路6は、RAM
4のリセット回路9を備えている。リセット回路9は、
入力された信号を処理した後、認識を終了した部分に記
憶される信号をリセットする。RAMのリセットさせた
部分には、次々と入力される音声信号を再び記憶して、
読出回路5に出力する。
4のリセット回路9を備えている。リセット回路9は、
入力された信号を処理した後、認識を終了した部分に記
憶される信号をリセットする。RAMのリセットさせた
部分には、次々と入力される音声信号を再び記憶して、
読出回路5に出力する。
【0020】図1と図2とに示す装置は、次の工程で、
入力された音声信号を識別する。 ■ マイク1から入力された音声信号を、A/Dコン
バータ3でデジタル量に変換して、RAM4に記憶させ
る。RAM4は、1音または1単語の音声を記憶する。 1音の音声をRAM4に記憶させる場合、マイク1に向
かって1音ずつ区切って発音する。1単語の音声をRA
M4に記憶させる場合、1単語単位に区切って発声する
。
入力された音声信号を識別する。 ■ マイク1から入力された音声信号を、A/Dコン
バータ3でデジタル量に変換して、RAM4に記憶させ
る。RAM4は、1音または1単語の音声を記憶する。 1音の音声をRAM4に記憶させる場合、マイク1に向
かって1音ずつ区切って発音する。1単語の音声をRA
M4に記憶させる場合、1単語単位に区切って発声する
。
【0021】ただ、RAM4に複数の単語を記憶させる
ことも可能であるのはいうまでもない。複数の単語をR
AM4に記憶させる場合、発声音がなくなった状態をト
リガーとして、入力音声を識別する。
ことも可能であるのはいうまでもない。複数の単語をR
AM4に記憶させる場合、発声音がなくなった状態をト
リガーとして、入力音声を識別する。
【0022】■ 読出回路5は、RAM4に記憶され
た音声信号を、時間的に逆に、すなわち、後からRAM
4に入力された信号を先に読み出し、先にRAM4に入
力した信号を後で読み出す。すなわち、時間を逆にして
読み出す。例えば、「か」の音は、図3に示すように、
子音「K」の後の母音「A」の音がある。したがって、
逆に読み出すと「A」の音に続いて「K」の音が読み出
される。
た音声信号を、時間的に逆に、すなわち、後からRAM
4に入力された信号を先に読み出し、先にRAM4に入
力した信号を後で読み出す。すなわち、時間を逆にして
読み出す。例えば、「か」の音は、図3に示すように、
子音「K」の後の母音「A」の音がある。したがって、
逆に読み出すと「A」の音に続いて「K」の音が読み出
される。
【0023】■ 時間を逆に読み出した信号は、母音
の「A」に続いて、子音の「K」の音が入力される。母
音である「A」の音は、比較的長い時間連続するので、
レベル(Vk)を最適値に調整して周波数に分析する。 「A」に続いて入力される「K」の音は、「A」の音を
参考にしてレベル(Va)を最適に調整して、周波数分
析する。周波数分析は、図1に示す装置は、コンピュー
タの演算回路6で、図2に示す装置は、複数のバンドパ
スフィルター7で処理する。
の「A」に続いて、子音の「K」の音が入力される。母
音である「A」の音は、比較的長い時間連続するので、
レベル(Vk)を最適値に調整して周波数に分析する。 「A」に続いて入力される「K」の音は、「A」の音を
参考にしてレベル(Va)を最適に調整して、周波数分
析する。周波数分析は、図1に示す装置は、コンピュー
タの演算回路6で、図2に示す装置は、複数のバンドパ
スフィルター7で処理する。
【0024】■ 周波数分析された結果は、演算回路
6に記憶されるパターンに比較され、母音と子音とが何
であるかを特定する。逆に読み出しして母音と子音とに
分離された「A」と「K」の音を認識する技術は、すで
に行われている全ての方法、あるいは、これから開発さ
れる方法が利用できる。
6に記憶されるパターンに比較され、母音と子音とが何
であるかを特定する。逆に読み出しして母音と子音とに
分離された「A」と「K」の音を認識する技術は、すで
に行われている全ての方法、あるいは、これから開発さ
れる方法が利用できる。
【0025】■ 演算回路6が、周波数分析結果を演
算処理して音を認識した後、RAM4を読み出した音を
記憶する部分をリセットする。ただ、演算回路6が演算
処理している間も、RAM4は音声信号を順番に記憶し
ている。
算処理して音を認識した後、RAM4を読み出した音を
記憶する部分をリセットする。ただ、演算回路6が演算
処理している間も、RAM4は音声信号を順番に記憶し
ている。
【0026】
【発明の効果】この発明の音声認識に使用する子音の認
識方法は、子音の後に母音がくる日本語の性質を有効に
利用して、子音の識別能力を高くしている。すなわち、
この発明の方法は、入力された音声信号を記憶し、記憶
した音声を時間的に逆に認識するので、子音は母音に続
いて入力されることになる。このため、図3において、
子音のレベル(Vk)を、母音のレベル(Va)に基づ
いて最適値に調整することができる。母音は子音に比較
すると長い時間連続する波形であるから、入力レベルの
調整も可能である。レベルを最適に調整することによっ
て、子音を高い認識率でより正確に識別できる特長があ
る。
識方法は、子音の後に母音がくる日本語の性質を有効に
利用して、子音の識別能力を高くしている。すなわち、
この発明の方法は、入力された音声信号を記憶し、記憶
した音声を時間的に逆に認識するので、子音は母音に続
いて入力されることになる。このため、図3において、
子音のレベル(Vk)を、母音のレベル(Va)に基づ
いて最適値に調整することができる。母音は子音に比較
すると長い時間連続する波形であるから、入力レベルの
調整も可能である。レベルを最適に調整することによっ
て、子音を高い認識率でより正確に識別できる特長があ
る。
【0027】さらに、この発明の音声認識に使用する子
音の認識方法は、母音に連続して子音が入力されので、
母音から子音に変わった直後から子音を識別することが
できる。このため、発声時間の短い子音を、全体に渡っ
て正確に識別することが可能となる。発声時間が非常に
短い子音は、識別する時間を可能な限り長くすることが
大切である。例えば、子音をフィルターで周波数に分解
する場合、フィルターには検出時間に遅れがあるので、
可能な限り長い時間入力して周波数に分析する必要があ
る。また、子音をコンピューターで演算してフーリエ級
数に分解する場合は、分析を開始する時間と、分析でき
る波形の時間的な長さとが分析結果に影響を与える。正
確にフーリエ級数に分解するためには、子音の開始点を
正確に検出し、また、可能な限り長い時間測定する必要
がある。
音の認識方法は、母音に連続して子音が入力されので、
母音から子音に変わった直後から子音を識別することが
できる。このため、発声時間の短い子音を、全体に渡っ
て正確に識別することが可能となる。発声時間が非常に
短い子音は、識別する時間を可能な限り長くすることが
大切である。例えば、子音をフィルターで周波数に分解
する場合、フィルターには検出時間に遅れがあるので、
可能な限り長い時間入力して周波数に分析する必要があ
る。また、子音をコンピューターで演算してフーリエ級
数に分解する場合は、分析を開始する時間と、分析でき
る波形の時間的な長さとが分析結果に影響を与える。正
確にフーリエ級数に分解するためには、子音の開始点を
正確に検出し、また、可能な限り長い時間測定する必要
がある。
【0028】さらにまた、この発明は、母音に含まれる
ピークを参考にして子音をより正確に識別することも可
能である。母音は図3に示すように、一定の周期(T)
で繰り返すピークを含んでいる。これに対して、子音も
母音のピーク(t)に近似する周期のピークを含んでい
る。このため、母音のピーク周期を検出して、子音のピ
ーク周期を測定することができる。子音のピークは、母
音のピークに比較して数が少ないので、単独ではとらえ
難くいが、母音のピークを参考にしてピークを検知する
ことによって、より正確にピーク周期を検出できる。ピ
ークの状態は各子音に独得のもので、これを識別するこ
とによって、子音を正確に特定することができる。
ピークを参考にして子音をより正確に識別することも可
能である。母音は図3に示すように、一定の周期(T)
で繰り返すピークを含んでいる。これに対して、子音も
母音のピーク(t)に近似する周期のピークを含んでい
る。このため、母音のピーク周期を検出して、子音のピ
ーク周期を測定することができる。子音のピークは、母
音のピークに比較して数が少ないので、単独ではとらえ
難くいが、母音のピークを参考にしてピークを検知する
ことによって、より正確にピーク周期を検出できる。ピ
ークの状態は各子音に独得のもので、これを識別するこ
とによって、子音を正確に特定することができる。
【0029】このように、この発明の音声認識に使用す
る子音の認識方法は、子音のレベルを最適に調整し、ま
た、子音の開始時間と認識時間とを長くし、さらに子音
のピークの周期を正確に測定することによって、簡単な
装置を使用して、子音の識別能率を改善できる特長があ
る。
る子音の認識方法は、子音のレベルを最適に調整し、ま
た、子音の開始時間と認識時間とを長くし、さらに子音
のピークの周期を正確に測定することによって、簡単な
装置を使用して、子音の識別能率を改善できる特長があ
る。
【図1】この発明に使用する装置の一例を示すブロック
線図
線図
【図2】この発明に使用する装置の他の具体例を示すブ
ロック線図
ロック線図
【図3】子音の後に母音がくる音声波形の一例を示すグ
ラフ
ラフ
1……マイク
2……マイクアンプ
3……A/Dコンバータ
4……RAM
5……読出回路
6……演算回路
7……バンドパスフィルター
8……D/Aコンバータ
9……リセット回路
Claims (1)
- 【請求項1】 入力された音声信号を記憶手段に記憶
し、記憶した音声を時間的に逆に識別することを特徴と
する音声認識に使用する子音の認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3167837A JPH04365100A (ja) | 1991-06-11 | 1991-06-11 | 音声認識に使用する子音の認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3167837A JPH04365100A (ja) | 1991-06-11 | 1991-06-11 | 音声認識に使用する子音の認識方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04365100A true JPH04365100A (ja) | 1992-12-17 |
Family
ID=15857004
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3167837A Pending JPH04365100A (ja) | 1991-06-11 | 1991-06-11 | 音声認識に使用する子音の認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04365100A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007322758A (ja) * | 2006-06-01 | 2007-12-13 | Nissan Motor Co Ltd | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 |
-
1991
- 1991-06-11 JP JP3167837A patent/JPH04365100A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007322758A (ja) * | 2006-06-01 | 2007-12-13 | Nissan Motor Co Ltd | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0077194B1 (en) | Speech recognition system | |
| JPH0222398B2 (ja) | ||
| US4829572A (en) | Speech recognition system | |
| JPH04365100A (ja) | 音声認識に使用する子音の認識方法 | |
| JPH0449952B2 (ja) | ||
| JP2666296B2 (ja) | 音声認識装置 | |
| KR100262602B1 (ko) | 시간별 가중치에 의한 음성신호 검출방법 | |
| JPS6227798A (ja) | 音声認識装置 | |
| JPS59224900A (ja) | 音声認識方法 | |
| JPH0731506B2 (ja) | 音声認識方法 | |
| JPH04211299A (ja) | 単音節音声認識装置 | |
| JPH0376471B2 (ja) | ||
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JPH03288199A (ja) | 音声認識装置 | |
| JP3049711B2 (ja) | 音声処理装置 | |
| JPS61273599A (ja) | 音声認識装置 | |
| JPH0567039B2 (ja) | ||
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JPH02278295A (ja) | 音声パターン登録方式及び音声認識装置 | |
| JPS62238598A (ja) | 音声認識装置 | |
| JPH0412478B2 (ja) | ||
| JP2599974B2 (ja) | 音声検出方式 | |
| JPS61190398A (ja) | 破裂子音認識方式 | |
| JPH02232698A (ja) | 音声認識装置 | |
| JPH02205898A (ja) | 音声認識装置 |