JPH02275497A

JPH02275497A - 音声認識装置

Info

Publication number: JPH02275497A
Application number: JP1096706A
Authority: JP
Inventors: Shoichi Kamei; 亀井　正一
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1989-04-17
Filing date: 1989-04-17
Publication date: 1990-11-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（イ）産業上の利用分野本発明は音声認識して目的の電気機器を制御し得るよう
になした音声認識装置に関する。

（ロ）　従来の技術近年、音声認識装置に於ける音声認識率の向上に伴い、
音声制御できる電子機器、例えばオートダイヤルできる
電話機が実用化されつつある（特開昭６２−８１１５２
号）。

例えば、音声認識オートダイヤル電話機の場合、その音
声認識装置としては、第１ステツプでダイヤル先名称（
個人名、会社名等）を音声認識し、第２ステツプで指令
音声（ダイヤル、キャンセル停）を音声認識する２段階
認識処理方式を採用したものが最も現実的である。

即ち、２段階認識処理は、話者が発声したダイヤル先名
称を認識した結果で直ちにダイヤル先の１話番号をダイ
ヤルするのではなく、この認識結果を表示、あるいは合
成音声出力で話者に確認させ、誤認識が無い時に、音声
によるダイヤル指令を与えるので、音声の誤認識による
ダイヤル誤りを未然に貼止できる。

このような２段階認識処理を行なうパタンマツチング手
法の音声認識装置は、第１ステツプではそのステップに
しか要求されない語の音声、例えば複数のダイヤル先名
称の音声、を認識するために、これ等ダイヤル先名称の
音声の標準パタン群（第１のグループ）を用い、第２ス
テツプでは複数の指令音声を認識するために、これ等指
令音声の標準パタン群（第２グループ）を用いる事にな
る。

これ等第１グループ、第２グループの標準パタンを分類
しないで、１つのグループとして、上述の第１、第２の
両ステップの音声認識処理に同様に用いる事もできるが
、この場合には、各ステップの音声認識の為のパタンマ
ツチング（入力音声のパタンと、標準パタンとの誤差計
算）処理量が大きくなり、しかも誤認識発生の確率を増
す事になるので、これを回避するために、上述の如く標
準音声パタンはステップ毎の認識処理に対応してグルー
プ分けきれている。

（ハ）発明が解決しようとする課題上述の如く、多段階ステップで音声認識処理を行なう従
来の音声認識装置に於ては、例えばオートダイヤル電話
機に於いては、第１ステツプで話者が発声したダイヤル
先名称の認識結果が誤認識であった場合、次の第２ステ
ツプで話者が発声した指令音声１キヤンセル」を認識さ
せ、この認識が正しく行なわれることを条件に第１ステ
ツプにもどしてから、ダイヤル先名称を再発声してこれ
の認識を行なわせる必要がある。このような音声の再入
力のための手順は、非常に煩雑であり、音声入力する話
者への負担が大きくなる欠点があった。

本発明は断る欠点を解消すべくなされたものであり、第
１ステツプに誤認識があった場合、第２ステツプから第
１ステツプへもどる事なく、第２ステツプでも第１ステ
ツプの再度の音声認識処理を可能とした音声認識装置を
実現するものである。

（ニ）課題を解決するための手段本発明の音声認識装置は、少なくとも２グループに分類
された標準パタンをグループ別に格納した標準パタン記
憶手段と、最新の入力音声の入力パタンを記憶しておく
入力パタン記憶手段と、第１グループの上記標準パタン
記憶手段の各標準パタンと上記入力パタン記憶手段の入
力音声パタンとをパタンマツチングにより比較して類似
度計算を行う第１段マツチング手段と、第２グループの
上記標準パタン記憶手段の各標準パタンと上記入力パタ
ン記憶手段の入力音声パタンとをパタンマツチングによ
り比較して類似度計算を行う第２段マツチング手段と、
上記第１段マツチング手段で認識した音声を報知する報
知手段、上記第２段マツチング処理で得られる最大類似
度値が所定の閾値より小さい場合に、この時の入力パタ
ン記憶手段の入力パタンを保存した状態で、第２マツチ
ング手段のマツチング処理から上記第１段マツチング手
段のマツチング処理に差し戻す制御を司る制御手段を備
えてなるものである。

（ホ）作用本発明の音声認識装置は、各段マツチング処理で認識で
きる入力計重がそれぞれ制限きれている少なくとも２段
のマツチング処理が行える装置であり、第１段マツチン
グで認識した音声が誤認識であると判った時に、該誤認
識音声を再入力することにより、次の２段マツチング処
理で得られる最大類似度値が所定の閾値より小さくなる
ので、この時の入力パタン記憶手段の入力パタンを保存
した状態で、第２段マツチング処理から前段の第１段マ
ツプ・ング処理に自動的に戻すことができる。

（へ）実施例第１図に本発明の音声、認識装置の構成を示す。

同図の本発明装置は、音声を入力する入力部（１）と、
入力音声から特徴パラメータを抽出する前処理部（２）
と予め作成しである２種類のグループの標準パタンで、
第一の入力音声との間でマツチングを行なう標準パタン
（５）と、第二の入力音声との間でマツチングを行なう
標準パタン（６）と、これらの標準パタンと前処理部（
２）によって特徴抽出された入力パタンとの間で距離（
誤差と等しく類似度とは逆数的関係にある）計算を行な
って、最小距離のパタンを！５識結果として出力する識
別部（４）を基本構成としている。

更に同図実施例構成を以下に詳述する。

まず、第一の音声が入力部（１）に入力されると入力さ
れた音声は前処理部（２）で特徴パラメータが抽出され
、標準パタン（５）との距離計算が識別部（４）で行な
われ、認識結果が結果格納部（７）に格納される。そこ
で制御部（９）は音声指令のための第二の音声入力待ち
状態にし、第二の音声が入力部（１）に入力されると前
処理部（２）で特徴パラメータが抽出された後、入力パ
タン格納部（３）にその特徴パタンか格納される。そし
て、標準パタン（６）との距離計算が識別部（４）で行
なわれ、その時のマツチング距離が距離比較部（８）で
、予め定められたしきい値と比較きれる。即ち、距離が
小さい程、類似度は大きい事になる。従って、この距離
が所定のしきい値より大きい場合（類似度が所定の値よ
り小さい場合〉には、制御部（９）に対して認識結果無
効信号を出し、それを受は取った制御部（９）は結果格
納部（７）に対して消去信号を出して、第一の入力音声
に対する認識結果を消去する。さらに、入力パタン格納
部（３）に対して入力パタン出力信号を出し、識別部（
４）において標準パタン（５）との間で距離計算を行な
い、その結果を結果格納部（７）に格納する。

一方、しきい値より小さい場合（類似度が所定の値より
大きい場合）には第二の音声の認識結果が制御部（９）
に送られ、それに対応した制御信号を出力する。

次に、本発明の音声認識装置をオートダイヤルＴ話機に
採用した場合の一例を以下に示す。

まず、第１標準パタンメモリ（５）の第１グループ標準
パタンとして下記茨の多数のダイヤル先名称、第２Ｎ４
準パタンメモリ（６）の第２グループ標準パタンとして
下記表の２語の音声指令を月意しておく。

表：標準パタン化された音声なお、上表の音声指令の１ソウシユツ」は［送出コ（ダ
イヤル先名称に対応したダイヤルを送出する）、「コウ
ホ、は［候補］（認識結果の次候補を出力する）を示し
ている。

まず、発声者が第１ステツプで、第一の音声（相手先、
即ちダイヤル先名称）「サンヨウ」を発声し、上記第１
標準パタンメモリ（５）の第１グループ標準パタンを用
いて認識処理（距離計算）した結果が１マツシタ」と間
違った場合、次のステップで第二の音声（音声指令）１
候補」を発声し、上記第２標準パタンメモリ（６）の第
１グループ標準パタンを用いて認識処理して次候補を出
力すればよいわけであるが、目的の１サンヨウ、が下位
候補からなかなか出てこない場合がある。そのような場
合に例えば、従来装置のように１キヤンセル、等の指示
語によって第１ステツプにもどして第一の音声入力待ち
状態にし、再度ダイヤル先名称を発声するのは面倒であ
る。

本発明に於いては、上記第２ステツプでの音声指令入力
待ちの状態でいきなり１サンヨウ、と発声すると、この
入力音声のパタンか入力パタン格納部（３〉に格納され
た状態で、この入力パタンと第２グループ標準パタンの
［送出コ、［候補コのパタンとの間で夫々マツチングを
行なうが、そのマ／ナング距離があらかじめ定められた
値より大きくなるので、対象とする標準パタンを第２標
準パタンメモリ（６）の第２グループ標準パタンから’
＄ｌｊＭ準パタンメモリ（５）の第２　Ｉｌ準パタンに
切り替えて、再度マツチングを行ない、その結果を出力
する。この場合、音声指令のための対象語は２語だけな
ので、しきい値をきびしく（）Ｊｌさく）シておけばよ
い。

（ト）発明の効果本発明の音声認識装置によれば、認識対象語によって標
準パタンをグループ分けすることで、認識の時のしきい
値をきびしくしても高性能な認識率を得ることができる
。また、語鵞の選択のための認識と音声指令のための認
識という２段階制御を行なう場合に、異なる標準パタン
のどちらとマツチングをとるかを予め選択するための音
声指令を行なう必要がないので使用者の負担が軽減でき
る。

【図面の簡単な説明】

第１図は本発明の音声認識装置のブロンク図である。（１）・・・入力部、（２）・・・前処理部、（３・・
・入力パタン格納部、（４）・・・識別部、（５・・・
第１標準パタンメモリ、（６・・・第２標準パタンメモリ、（７・・・結果格納部、（８）・・・距離比較部、（９
）・・・制御部。

Claims

【特許請求の範囲】

（１）入力音声パタンと予じめ用意された多数の標準音
声パタンとを比較して最も類似した標準パタンの音声を
入力音声と認識する音声認識装置に於て、少なくとも２グループに分類された標準パタンをグルー
プ別に格納した標準パタン記憶手段と、最新の入力音声
の入力パタンを記憶しておく入力パタン記憶手段と、第
１グループの上記標準パタン記憶手段の各標準パタンと
上記入力パタン記憶手段の入力音声パタンとをパタンマ
ッチングにより比較して類似度計算を行う第１段マッチ
ング手段と、第２グループの上記標準パタン記憶手段の
各標準パタンと上記入力パタン記憶手段の入力音声パタ
ンとをパタンマッチングにより比較して類似度計算を行
う第２段マッチング手段と、上記第１段マッチング手段
で認識した音声を報知する報知手段、上記第２段マッチ
ング処理で得られる最大類似度値が所定の閾値より小さ
い場合に、この時の入力パタン記憶手段の入力パタンを
保存した状態で、第２段マッチング手段のマッチング処
理から上記第１段マッチング手段のマッチング処理に差
し戻す制御を司る制御手段を備えてなる音声認識装置。