JPH0262879B2 - - Google Patents

Info

Publication number
JPH0262879B2
JPH0262879B2 JP57107871A JP10787182A JPH0262879B2 JP H0262879 B2 JPH0262879 B2 JP H0262879B2 JP 57107871 A JP57107871 A JP 57107871A JP 10787182 A JP10787182 A JP 10787182A JP H0262879 B2 JPH0262879 B2 JP H0262879B2
Authority
JP
Japan
Prior art keywords
recognition
circuit
pattern
preliminary
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57107871A
Other languages
English (en)
Other versions
JPS58224398A (ja
Inventor
Kyoshi Tajima
Masayuki Iida
Hiroki Oonishi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP57107871A priority Critical patent/JPS58224398A/ja
Priority to US06/490,302 priority patent/US4720864A/en
Publication of JPS58224398A publication Critical patent/JPS58224398A/ja
Publication of JPH0262879B2 publication Critical patent/JPH0262879B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (イ) 産業上の利用分野 本発明は、音声を認識する音声認識装置に関す
る。
(ロ) 従来の技術 音声を認識して何等かの機器を制御せんとした
場合、その殆どが認識動作に該当する応答時間が
常に問題になつて来る。応答時間を早めるには高
速動作の可能なCPUやメモリ或いはその周辺回
路を用いるのが一般に考えられる事であるが、シ
ステム全体が高価になる上に、それ程の高速化が
果されない。
ここで現存する音声認識動作を第1図に示す。
認識すべき音声が入力される音声入力期間I1、そ
の入力音声の終了を意味する無音期間N1、入力
音声の認識を行う認識期間R1を一つのサイクル
とし、この認識サイクルI1,N1,R1に連続して
次の音声認識サイクルI2,N2,R2が始まる。従
つて音声入力期間I、無音期間N、認識期間Rを
直列的に持つ限り、上述した如く認識動作の高速
化には限度がある。
このような点に鑑みて、本発明等は凝似連続認
識システムと呼ぶ高速化を図つた認識装置を提案
した(特願昭57−74932号)。これは第2図に示す
如く、音声の入力I1,I2,I3…とその入力音声の
認識R1,R2,R3…とを個別のプロセツサを用い
て並列的に行わしめんとするものである。
ところがこの第2図からも明らかな如く、一般
に音声の入力I1,I2,I3…動作時間と認識R1
R2,R3…動作時間とを比較した場合、認識R1
R2,R3…動作時間の方が長く、結果的に入力動
作を担当するプロセツサ側に待ち時間Tが生じて
しまい、これが時間的な無駄となる。この現象は
線形マツチングに依る認識の場合は認識時間が短
かつたのでそれ程問題とならなかつたが、認識率
の向上の為に開発されたDPマツチング法等を用
いて認識する場合、相当な時間が掛り、この待ち
時間Tの無駄が大きくなる。
(ハ) 発明が解決しようとする課題 本発明はこのような新たな問題点に着目して為
されたものであつて、上述の如く並列的に装備さ
れた両プロセツサ間の待ち時間を短縮でき、これ
によつて、時間的な無駄の削減を図つた音声認識
装置を提供するものである。
(ニ) 課題を解決するための手段 本発明の音声認識装置は、第1のプロセツサ部
で音声認識の取り込み動作及び予備比較認識動作
を行わせると共に、第2のプロセツサ部で本格比
較認識動作を行わせるものであつて、第1のプロ
セツサ部での予備的な比較認識処理時間を第2の
プロセツサ部での本格的な比較認識処理時間より
短時間で行うと共に、上記第1のプロセツサ部で
の音声信号取り込み動作及び予備比較認識動作に
要する時間と、上記第2のプロセツサ部での本格
比較認識動作に要する時間とを略等しく設定した
ものである。
(ホ) 作用 本発明の音声認識装置は、第1のプロセツサ部
での予備的な比較認識処理時間を第2のプロセツ
サ部での本格的な比較認識処理時間より短時間で
行うと共に、上記第1のプロセツサ部での音声信
号取り込み動作及び予備比較認識動作に要する時
間と上記第2のプロセツサ部での本格比較認識動
作に要する時間とを略等しく設定しているので、
第1のプロセツサから連続的に順次得られる音声
の取り込み/予備比較認識処理の結果に対して、
第2のプロセツサでは略待ち時間無しに本格比較
認識処理が実行できる。
(ヘ) 実施例 第3図は本発明装置の具体的な構成を示すブロ
ツク図であつて、1は音声を電気的な音声信号に
変換するマイクロフオン、2はこのマイクロフオ
ン1からの音声信号の特徴を抽出する特徴抽出回
路であつて、例えば特開昭54−145407号公報に記
載されているような帯域フイルター群を用いた周
波数スペクトルパラメータの抽出手法が使用で
き、このパラメータ時系列からなる音声の特徴パ
ターンが出力される。なお、この特徴パターンと
しては、上述のパラメータ時系列を特定サンプル
数に正規化したものが一般的に用いられる。3は
この特徴抽出回路2から得られる入力音声の特徴
パターンを記憶する第1のバツフアメモリであ
る。4はこの特徴パターンを予備的に比較認識す
る為の参照パターンが多数貯えられている第1の
参照パターンメモリである。ここで貯えられてい
る参照パターンは比較対象である入力音声の特徴
パターンと同形式のパターンであつて、時系列サ
ンプル数が正規化された周波数スペクトルパラメ
ータ列からなる。5は入力音声の特徴パターンと
多数の参照パターンとを比較認識して予備的な認
識動作を行う第1の認識回路である。ここで云う
予備認識動作とは、第1の参照パターンメモリ4
に貯えられている多数の参照パターンのうちから
入力音声の特徴パターンに最も類似した特定のパ
ターンを選び出すのではなく、比較的類似してい
る複数個のパターンを選び出すもので、比較的そ
の認識時間が短い線形マツチング法等が採用され
る。6はこの第1の認識回路5での認識の結果、
選び出された入力音声の特徴パターンに比較的類
似している参照パターンの参照パターンメモリ4
に於ける番地を記憶する第1の番地メモリであ
る。7は上記音声抽出回路2での特徴抽出動作や
抽出した特徴パターンのバツフアメモリ3への取
り込み、入力音声の無音の状態から音声の終端を
検出する検出動作、或いは第1の認識回路5で予
備認識動作とかを司どる第1のCPUで、これ等
のマイクロフオン1〜第1のCPU7で第1のプ
ロセツサP1が構成されている。
また、10は上記第1のプロセツサP1のバツ
フアメモリ3に貯えられた入力音声の特徴パター
ンが転送記憶される第2のバツフアメモリ、11
は入力音声を本格的に認識する為の参照パターン
が貯えられている第2の参照パターンメモリであ
り、この参照パターンとしては、上記第1のプロ
セツサP1で用いるものと同じものであつてよい。
しかしながら、第2のプロセツサP2で精度の高
い比較認識処理を行う為に、この第2の参照パタ
ーンメモリの参照パターンのサンプル数を第1の
それより多くして、精度の高い参照パターンを用
意することもできる。12はこの第2の参照パタ
ーン11内の参照パターンのうち第1のプロセツ
サP1に於ける予備比較認識の結果予備的に選択
された第1の番地メモリ6にある複数の参照パタ
ーンの番地が転送記憶される第2の番地メモリで
ある。13はこの第2の番地メモリ12で指定さ
れた参照パターンと第2のバツフアメモリ10に
貯えられた入力音声の特徴パターンとの本格的な
比較認識動作をする第2の認識回路で、多少その
認識動作に時間が掛るが、厳密な認識動作が行わ
れるDP法(ダイナミツクプログラミング法)等
を用いて認識動作を行う。14はこの第2の認識
回路13で認識動作の結果、特定された音声を外
部回路に出力する出力ポート出ある。15はこれ
等の第2の認識回路13での認識動作や出力ポー
ト14での出力動作を司どる第2のCPUで、こ
れ等の第2のバツフアメモリ10〜第2のCPU
15から第2のプロセツサP2が構成されている。
次にこの第3図で示した本発明装置に於ける動
作について第4図を参照しつつ説明する。
第4図の音声入力期間Iは、通常、200msec〜
1500msecであり、これは、単語音声認識に於け
る一般的な時間範囲である。また、無音期間N
は、通常、200msecであり、これは、音声中の中
断、例えば、「トツトリ」と発声した時の促音
「ツ」での中断時間が、150mseo程度であるので、
これを音声の終了とみなさないために、この中断
時間より、30%以上長い値、200msecが適切であ
る。さらに、予備比較認識期間SRは、本実施例
の如く、線形マツチングを用いて、認識語を64語
とした場合には、ハードの処理速度にも依存する
が、約300msecは必要であろう。
一方、本格比較認識期間MRは、本実施例の如
く、DPマツチングを用いて、認識語を20語(上
記64語が予備選択された結果)とした場合には、
ハードの処理速度にも依存するが、約600msecが
必要であろう。
先ず、第1のプロセツサP1に於て、マイクロ
フオン1から入力された音声は、特徴抽出回路2
に順次取り込まれて行くが、その入力音声I1が途
切れてから一定の無音期間N1が続くと第1の
CPU7は入力音声I1の終端を検出してそれまでに
特徴抽出回路2に取り込まれた入力音声の特徴パ
ターンを該特徴抽出回路2で抽出し、第1のバツ
フアメモリ3に貯える。一方、第1の認識回路5
は第1の参照パターンメモリ4に貯えられている
参照パターンと第1のバツフアメモリ3に貯えら
れた特徴パターンとの予備比較認識SR1を行い、
特徴パターンと比較的類している参照パターンの
いくつかを選択し、その選択した参照パターンの
パターンメモリ4は於る番地を第1の番地メモリ
6に記憶せしめる。この第1の認識回路5に依る
予備比較認識SR1動作は先にも述べた如く、必ず
しも厳密な認識動作は必要としないので、その認
識動作が比較的短時間に遂行される線形マツチン
グ法が採用される。尚、この第1のプロセツサ
P1に於ける全ての動作の制御は第1のCPU7に
依つて司どられる。
この予備認識SR1動作が完了すると、第2のプ
ロセツサP2に於ては、第1の番地メモリ6に導
入された予備認識SR1結果である番地情報が第2
のプロセツサP2の第2の番地メモリ12に転送
され、その番地情報に基づいて、参照パターンが
貯えられている第2の参照パターンメモリ11の
うち予備認識SR1で選択したブロツクパターンの
みを第2の認識回路13に読み出し、該認識回路
13で予め第1のバツフアメモリ3から第2のバ
ツフアメモリ10に転送されている入力音声の特
徴パターンとの本格的な比較認識MR1動作は、
参照パターンと特徴パターンとの厳密な比較認識
が遂行され、その為に例えばDP法が採用されて
いる。先にも述べた如く、この本格的比較認識
MR1動作は本来であれば第1のプロセツサP1
於ける予備認識SR1に比して時間が掛るのである
が、この認識回路13で特徴パターンと比較され
る参照パターンは第1のプロセツサP1に於て予
め選択されてその数が少くなつているので、参照
パターンメモリ11に貯えられている全ての参照
パターンとの比較をする場合に比してその認識に
要する時間は短く、結果的に第4図に示すように
第1のプロセツサP1に於ける入力音声取り込み
期間Iと予備比較認識SR並びに無音期間Nの合
計期間と略等しくなる。但し、この関係は、音声
ものものの長さや人間の発声時間に依存するとこ
ろがあるので、不確定な要因を含んだ比較的大ざ
ざつばな程度で略等しい関係と言わざるを得な
い。
例えば、短い音声の入力の場合(I=
200msec)は、第1のプロセツサP1の処理時間
(I+N+SR)は、700msec程度となり、第2の
プロセツサの処理時間MR2のそれ(600msec)と
は勿論略等しい。
しかし、長い音声の入力の場合(I=
1500msec)は、第1のプロセツサP1の処理時
間(I+N+SR)は、200msec程度となり、第
2プロセツサP2のそれとは、完全に等しいと言
えないが、略等しい範囲と見做して問題はない。
即ち、長い入力時間の音声を対象とした場合に
上記両時間関係が等しくなるように設定するより
も、短い入力時間の音声を対象とした場合の上記
両時間関係が等しくなるように設定しておけば、
より高速処理が必要となる短時間入力音声の連続
入力に対して、有効に連続認識が行える。
一方、これと並行して第1のプロセツサP1
於ては、予備認識SR1が終了すると、次の入力音
声の取り込みI2が開始される。上述したようにこ
の取り込みI2動作とその後の無音期間N2及び予
備認識SR2とが先行する入力音声の第2のプロセ
ツサP2に於ける本格認識MR1期間と略等しい。
従つて第1のプロセツサP1に於ける2番目の入
力音声の取り込みI2及び予備認識SR2が完了した
時点で第2のプロセツサP2も1番目の入力音声
に対する本格認識動作MR1を完了しており、両
プロセツサP1,P2は全くの待ち時間なしに夫々
次の音声に対する所定の動作、即ち第1のプロセ
ツサP1は3番目に入力音声の取り込み動作I3を、
又第2のプロセツサP2は2番目の入力音声の本
格認識動作MR2に移行する。
尚、上述の実施例では、予備的な比較認識処理
として、線形マツチング法、本格的な比較認識処
理として、DPマツチング法を夫々説明したが、
本発明はこれらに限定されるものでなく、予備的
なそれは本格的なそれより認識精度は低くても短
時間の処理で参照パターンのある程度の絞り込み
が可能な手法が使用できる。例えば、予備的比較
認識処理としては、音声パワーの極大点、極小点
のみを用いる方法(特開昭56−55995号)等が使
用でき、更に、本格的な比較認識処理としては、
認識関数を用いる方法(書籍「音声認識」117〜
118頁、新美著、共立出版、昭和54年10月10日発
行)等が使用できる。
(ト) 発明の効果 本発明は、以上の説明から明らかな如く、入力
音声に対する認識動作を予備認識と本格認識とに
2分すると共に独立して動作する2個のプロセツ
サを用意し、入力音声の取り込み動作と予備認識
動作とを一方のプロセツサで実行し、本格認識動
作を他方のプロセツサで実行せしめているので、
多少は入力音声の時間長に左右されるが、両プロ
セツサでの各々の実行時間を略等しく設定でき
る。従つて、入力音声の時間長によつては、両プ
ロセツサに於ける待時間を完全に皆無にできない
までも、夫々のプロセツサで無駄な空き時間を有
効に削減することが可能となり、結果的に音声認
識動作の高速化を果し得る。
【図面の簡単な説明】
第1図、第2図は夫々現存する音声認識装置の
動作を示す模式図、第3図は本発明装置の構成を
示すブロツク図、第4図は本発明に依る音声認識
動作を示す模式図である。 P1,P2…プロセツサ、3,10…バツフアメ
モリ、4,11…参照パターンメモリ、5,13
…認識回路、6,12…番地メモリ、7,15…
CPU。

Claims (1)

  1. 【特許請求の範囲】 1 音声を電気的な音声信号に変換するマイクロ
    フオンと、該音声信号を取り込んでその特徴を抽
    出する特徴抽出回路と、この特徴抽出回路で抽出
    された特徴パターンを予備的に比較認識する為の
    参照パターンが貯えられている第1の参照パター
    ンメモリと、この参照パターンと特徴パターンと
    の予備的な比較認識を行う第1の認識回路と、上
    記特徴パターン及び予備比較認識結果を貯えるバ
    ツフアメモリと、これ等の特徴抽出動作並びに予
    備比較認識動作を司どる第1のCPUと、から成
    る第1のプロセツサ部、及び 上記特徴パターンと本格的に比較認識される参
    照パターンが貯えられている第2の参照パターン
    メモリと、該第2の参照パターンメモリの参照パ
    ターンのうち上記第1のプロセツサで予備的に認
    識された参照パターンと特徴パターンとの本格的
    な比較認識を行う第2の認識回路と、この第2の
    認識回路での認識結果を外部回路に出力するI/
    Oポートと、この本格比較認識動作並びにI/O
    ポート動作を司どる第2のCPUと、から成る第
    2のプロセツサ部に依つて構成され、 第1のプロセツサ部の第1の認識回路での予備
    的な比較認識処理時間を第2のプロセツサ部の第
    2の認識回路での本格的な比較認識処理時間より
    短時間で行うと共に、上記第1のプロセツサ部で
    の音声信号取り込み動作及び予備比較認識動作に
    要する時間と、上記第2のプロセツサ部での本格
    比較認識動作に要する時間とを略等しく設定した
    事を特徴とする音声認識装置。
JP57107871A 1982-05-04 1982-06-22 音声認識装置 Granted JPS58224398A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP57107871A JPS58224398A (ja) 1982-06-22 1982-06-22 音声認識装置
US06/490,302 US4720864A (en) 1982-05-04 1983-05-02 Speech recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57107871A JPS58224398A (ja) 1982-06-22 1982-06-22 音声認識装置

Publications (2)

Publication Number Publication Date
JPS58224398A JPS58224398A (ja) 1983-12-26
JPH0262879B2 true JPH0262879B2 (ja) 1990-12-26

Family

ID=14470194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57107871A Granted JPS58224398A (ja) 1982-05-04 1982-06-22 音声認識装置

Country Status (1)

Country Link
JP (1) JPS58224398A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61121167A (ja) * 1984-11-19 1986-06-09 Fujitsu Ltd 区切り発声に基づく音声ワ−ドプロセツサ
JPS6350895A (ja) * 1986-08-21 1988-03-03 日本電信電話株式会社 音声照合並列プロセツサ方式
JPS63168541U (ja) * 1987-04-17 1988-11-02

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56168697A (en) * 1980-05-30 1981-12-24 Dainippon Printing Co Ltd Voice recognizing device
JPS576900A (en) * 1980-06-16 1982-01-13 Nippon Telegraph & Telephone Voice pattern recognition system

Also Published As

Publication number Publication date
JPS58224398A (ja) 1983-12-26

Similar Documents

Publication Publication Date Title
US4811399A (en) Apparatus and method for automatic speech recognition
JPS6123560B2 (ja)
JPH0262879B2 (ja)
JP2996019B2 (ja) 音声認識装置
US4868879A (en) Apparatus and method for recognizing speech
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS5915999A (ja) 単音節認識装置
JPH06309443A (ja) 個人認識に指紋と音声を融合させた方式
JPS6344699A (ja) 音声認識装置
JPH041918B2 (ja)
JP2547541B2 (ja) 単音節音声認識装置
JPS6312000A (ja) 音声認識装置
JPH07302098A (ja) 単語音声認識装置
JPS60170900A (ja) 音節音声標準パタン登録方式
JPS61235899A (ja) 音声認識装置
JPH0313599B2 (ja)
JPS59176791A (ja) 音声登録方式
JPS60203993A (ja) 音声認識方法
JPH0339797A (ja) 単語音声認識装置用パターンマッチング方式
JPS61170799A (ja) 音声認識方法
JPS5852693A (ja) 単音節音声認識方式
JPS63247798A (ja) 音声区間検出装置