JPH0410080B2

JPH0410080B2 -

Info

Publication number: JPH0410080B2
Application number: JP13826784A
Authority: JP
Priority date: 1984-07-04
Filing date: 1984-07-04
Publication date: 1992-02-24
Also published as: JPS6117198A

Description

【発明の詳細な説明】産業上の利用分野本発明は入力する音声をパターン認識するのに
用いられる音声認識装置に関するものである。

従来技術従来、種々の音声認識装置が提供されており、
中でも認識させようとする特定話者の入力パター
ンを予め音声認識装置内部に登録しておく特定話
者単語音声認識方式が一般的に用いられている。

こうした特定話者単語音声認識方式は、騒音が
少ない等の環境のよい状態では90数パーセントの
認識率が達成でき、通常のデータ入力や事務処理
用としてほぼ実用化の域に到達したものとされて
いる。

この発明が解決すべき問題点しかしながら、従来の音声認識装置は汎用とし
ての設計思想が濃く、100Hzから7KHzの全域をカ
バーする16チヤンネル程度の周波数帯域フイルタ
により、入力音声の周波数帯域毎の音声パワーの
サンプリングを行つている。

したがつて、様々な話者の様々な入力語の音声
パターンの特徴抽出に対応できるという利点があ
るものの、音声パターンの特徴抽出の際に不必要
な帯域のパワーをサンプリングしてしまうという
欠点があつた。

このため、現状の汎用性を重視した音声認識装
置では音声パターン内に冗長周波数帯の情報が入
るのを防ぐことは難しく、この情報が音声パター
ンの特徴を弱めるため制御用として使う為には充
分なレベルの認識率が得られず信頼性に乏しかつ
た。

発明の目的そこで、本発明は前記のような従来の音声認識
装置の不充分な点を改良して音声パターンの認識
率を高め、機器の制御信号入力用としても充分信
頼性の高い音声認識装置を提供することを目的と
する。

発明の構成本発明による音声認識装置は多周波数帯域フイ
ルタを備えた音声認識部と入力語の特徴を最もよ
く抽出する周波数帯のみに合つた帯域フイルタを
備えた音声認識部とを比較器に並列接続し、両者
の認識語のコード番号が一致し、かつ両者の一致
度スコアがあるしきい値を超えた時のみ認識する
よう構成された点に特徴がある。

実施例以下、図示する本発明の実施例により説明す
る。第１図に実施例のブロツク図を示したが、音
声認識装置は多周波数帯域フイルタ方式音声認識
部Ａと特定周波数帯域フイルタ方式音声認識部
Ｂ、及び比較器１３とで構成されている。

特定周波数帯域フイルタ方式音声認識部Ｂには
多周波数帯域音声分析機２と特定周波数帯域フイ
ルタ４，５，６が備えられており、これらのブロ
ツクに入力音声１が並列に入力される。

ここで、特定周波数帯域フイルタ４，５，６は
第２図に示した様に各々500Hz、1500Hz、2500Hz
を中心周波数とする帯域フイルタであり、入力音
声１を各帯域毎に濾波して次のブロツクへ出力す
る。これらの各中心周波数を持つた特定周波数帯
域フイルタ４，５，６を設けたのは、入力音声の
特徴を最もよく抽出する人間の音声の共振周波数
近傍の音のパワーを検出するものである。

一般に、人間の音帯により発振させられた音声
は喉や口蓋、舌、歯、唇などで変調を受け、他人
に認識できる言葉として発せられる。この変調
（エンベロツプ）の特徴が言葉の特徴であり、例
えば喉を17cmの円筒で近似すれば共振周波数は
500Hz、1500Hz、2500Hzとなり、この共振周波数
とそのパワーが言葉の特徴を示す。

多周波数帯域音声分析機２は入力する入力音声
１を多周波数帯域フイルタによつて分析し、次段
の特定周波数帯域算出・フイルタ制御部３に出力
する。この特定周波数帯域算出・フイルタ制御部
３は多周波数帯域音声分析機２で分析された入力
音声１を演算処理して音声の特徴を最もよく抽出
する周波数とその変動幅を算出し、特定周波数帯
域フイルタ４，５，６の中心周波数とバンド幅を
制御する。

すなわち、多周波数帯域音声分析機２及び特定
周波数算出・フイルタ制御部３は口蓋、舌、歯、
唇等の個人差で変動する共振周波数を多周波数帯
域フイルタを備えた音声分析機のフイルタ毎の時
系列波形のエンベロツプに着目することにより最
も音声を特徴づける周波数がどの帯域にずれた
か、又どの程度の変動幅をもつかを決定し、調整
することができる。

この決定の具体的方法としては、時系列的に得
られたエンベロツプの空間的分布を求め、この分
布の２次と３次あるいは４次の中央モーメントを
計算し、これらのモーメントの最大値を与える周
波数が最も音声パターンを特徴づける周波数（特
定周波数）であり２次の中央モーメントが変動幅
である。

これら特定周波数帯域フイルタ４，５，６の出
力は次段に接続されたマルチプレクサ７に入力さ
れて多重化処理され、さらにＡ／Ｄ変換器８に出
力される。Ａ／Ｄ変換器８ではマルチプレクサ７
からの入力信号がＡ／Ｄ変換処理されて、次段の
バウンダリデイテクタ・コード圧縮部９に出力さ
れる。

このバウンダリデイテクタ・コード圧縮部９内
では音声の始まりと終了を検出すると共に、Ａ／
Ｄ変換器８からの膨大なビツトアレイが圧縮さ
れ、適当な大きさの音声パターンに生成される。
こうして生成されるバウンダリデイテクタ・コー
ド圧縮部９の出力信号はモード切換スイツチ１０
により択一的に登録音声パターンメモリ１１又は
照合部１２に出力される。この中で、登録音声パ
ターンメモリ１１は話者の音声パターン登録時に
照合データとして使用する登録音声パターンを記
録する。

照合部１２では入力音声パターンと登録音声パ
ターンメモリ１１から読み込まれる登録音声パタ
ーンとが動的計画法等を用いて照合され、登録音
声パターンの中で入力音声パターンと一致度の高
いパターンが検索され、その検索結果が比較器１
３に出力される。

一方、多周波数帯域フイルタ方式音声認識部Ａ
の入力端には複数個の多周波数帯域フイルタ１５
が設けられている。この多周波数帯域フイルタ１
５は100Hzから7KHzの全域をカバーする16チヤン
ネル程度の周波数帯域フイルタ群で構成され、入
力音声１の各周波数帯域毎の音声パワーのサンプ
リングを行なう。

多周波数帯域フイルタ１５から後段の処理ブロ
ツクは特定周波数帯域フイルタ方式音声認識部Ｂ
と同様の機能を有するマルチプレクタ７′、Ａ／
Ｄ変換器８′、バウンダリデイテクタ・コード圧
縮部９′、モード切換スイツチ１０′、登録音声パ
ターンメモリ１１′及び照合部１２′とで構成され
る。

作用以上の構成において、本装置の音声認識動作時
には、入力音声１は多周波数帯域フイルタ１５、
多周波数帯域音声分析機２及び特定周波数帯域フ
イルタ４，５，６へ入力される。多周波数帯域音
声分析機２に入力された入力音声１は多数の周波
数帯域に分割され、特定周波数帯域算出・フイル
タ制御部３にて最も音声パターンの特徴を抽出で
きる周波数とその周波数の変動幅が計算される。
こうして算出された特定周波数帯域算出・フイル
タ制御部３の出力は特定周波数帯域フイルタ４，
５，６に入力されて、これらフイルタ４，５，６
の中心周波数とバンド幅が制御される。

特定周波数帯域フイルタ４，５，６を通過した
音声のアナログ信号はマルチプレクサ７とＡ／Ｄ
変換器８を経てデイジタル信号に変換される。

Ａ／Ｄ変換器８から出力される膨大なビツト・
アレイはバウンダリデイテクタ・コード圧縮部９
において語の始めと終りが検出されると同時に適
当な大きさのビツトパターンに圧縮される。こう
して圧縮されたパターンはモード切換スイツチ１
０により登録モードのときは登録音声パターンメ
モリ１１へ、認識モードのときは照合部１２へ送
られる。

ここで、認識モードのときには照合部１２内で
入力するパターンと、予め登録音声パターンメモ
リ１１内に登録されたパターンとの比較が行なわ
れその照合結果が比較器１３に出力される。

一方、多周波数帯域フイルタ１５に入力された
入力音声は各フイルタ１５の周波数帯域毎の音声
パワーのサンプリングがなされた後、さらに特定
周波数帯域フイルタ方式音声認識部Ｂと同様に処
理されて照合部１２′の照合結果が比較器１３に
出力される。

こうして多周波数帯域フイルタ方式音声認識部
Ａの照合部１２′で照合された結果と、特定周波
数帯域フイルタ方式音声認識部Ｂの照合部１２で
照合された結果は比較部１３内で比較される。こ
の比較作業で認識語コードが等しく、一致度のス
コアが両者ともあるしきい値を超えている場合に
認識結果１４が出力される。

発明の効果本発明による音声認識装置の実施例は以上の通
りであり、次に述べる効果を挙げることができ
る。

音声パターンの認識率を高め、機器の制御信号
入力用としても充分信頼性の高い音声認識装置を
提供することができる。

【図面の簡単な説明】

第１図は本発明の実施例を示すブロツク図、第
２図は特定周波数帯域フイルタの帯域を示す周波
数特性図である。１……入力音声、２……多周波数帯域音声分析
機、３……特定周波数帯域算出・フイルタ制御
部、４，５，６……特定周波数帯域フイルタ、
７，７′……マルチプレクサ、８，８′……Ａ／Ｄ
変換器、９，９′……バウンダリデイテクタ・コ
ード圧縮部、１０，１０′……モード切換スイツ
チ、１１，１１′……登録音声パターンメモリ、
１２，１２′……照合部、１３…比較器、１４…
…認識結果、１５……多周波数帯域フイルタ。

Claims

【特許請求の範囲】１入力音声の全周波数帯域を複数の帯域毎に分
割してカバーする多周波数帯域フイルタを有し、
このフイルタで分割された帯域毎に音声スペクト
ラムのサンプリングを行なつて入力音声のパター
ン認識を行なう多周波数帯域フイルタ方式音声認
識部と、入力音声の周波数帯域の中で入力音声の特徴を
最もよく抽出する特定の周波数帯域のみをカバー
する所定数の特定周波数帯域フイルタを有し、こ
の特定周波数帯域の音声スペクトラムのサンプリ
ングを行なつて入力音声の認識を行なう特定周波
数帯域フイルタ方式音声認識部と、前記多周波数帯域フイルタ方式音声認識部と、
前記特定周波数帯域フイルタ方式音声認識部とか
らの認識結果とを比較し、両者の認識した語のコ
ードが一致し、かつ一致度のスコアが所定のしき
い値を越えた時に認識した語のコードを出力する
比較器とを備えてなる音声認識装置。