JPH0410080B2 - - Google Patents

Info

Publication number
JPH0410080B2
JPH0410080B2 JP13826784A JP13826784A JPH0410080B2 JP H0410080 B2 JPH0410080 B2 JP H0410080B2 JP 13826784 A JP13826784 A JP 13826784A JP 13826784 A JP13826784 A JP 13826784A JP H0410080 B2 JPH0410080 B2 JP H0410080B2
Authority
JP
Japan
Prior art keywords
frequency band
speech
input
speech recognition
specific frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP13826784A
Other languages
English (en)
Other versions
JPS6117198A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP13826784A priority Critical patent/JPS6117198A/ja
Publication of JPS6117198A publication Critical patent/JPS6117198A/ja
Publication of JPH0410080B2 publication Critical patent/JPH0410080B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は入力する音声をパターン認識するのに
用いられる音声認識装置に関するものである。
従来技術 従来、種々の音声認識装置が提供されており、
中でも認識させようとする特定話者の入力パター
ンを予め音声認識装置内部に登録しておく特定話
者単語音声認識方式が一般的に用いられている。
こうした特定話者単語音声認識方式は、騒音が
少ない等の環境のよい状態では90数パーセントの
認識率が達成でき、通常のデータ入力や事務処理
用としてほぼ実用化の域に到達したものとされて
いる。
この発明が解決すべき問題点 しかしながら、従来の音声認識装置は汎用とし
ての設計思想が濃く、100Hzから7KHzの全域をカ
バーする16チヤンネル程度の周波数帯域フイルタ
により、入力音声の周波数帯域毎の音声パワーの
サンプリングを行つている。
したがつて、様々な話者の様々な入力語の音声
パターンの特徴抽出に対応できるという利点があ
るものの、音声パターンの特徴抽出の際に不必要
な帯域のパワーをサンプリングしてしまうという
欠点があつた。
このため、現状の汎用性を重視した音声認識装
置では音声パターン内に冗長周波数帯の情報が入
るのを防ぐことは難しく、この情報が音声パター
ンの特徴を弱めるため制御用として使う為には充
分なレベルの認識率が得られず信頼性に乏しかつ
た。
発明の目的 そこで、本発明は前記のような従来の音声認識
装置の不充分な点を改良して音声パターンの認識
率を高め、機器の制御信号入力用としても充分信
頼性の高い音声認識装置を提供することを目的と
する。
発明の構成 本発明による音声認識装置は多周波数帯域フイ
ルタを備えた音声認識部と入力語の特徴を最もよ
く抽出する周波数帯のみに合つた帯域フイルタを
備えた音声認識部とを比較器に並列接続し、両者
の認識語のコード番号が一致し、かつ両者の一致
度スコアがあるしきい値を超えた時のみ認識する
よう構成された点に特徴がある。
実施例 以下、図示する本発明の実施例により説明す
る。第1図に実施例のブロツク図を示したが、音
声認識装置は多周波数帯域フイルタ方式音声認識
部Aと特定周波数帯域フイルタ方式音声認識部
B、及び比較器13とで構成されている。
特定周波数帯域フイルタ方式音声認識部Bには
多周波数帯域音声分析機2と特定周波数帯域フイ
ルタ4,5,6が備えられており、これらのブロ
ツクに入力音声1が並列に入力される。
ここで、特定周波数帯域フイルタ4,5,6は
第2図に示した様に各々500Hz、1500Hz、2500Hz
を中心周波数とする帯域フイルタであり、入力音
声1を各帯域毎に濾波して次のブロツクへ出力す
る。これらの各中心周波数を持つた特定周波数帯
域フイルタ4,5,6を設けたのは、入力音声の
特徴を最もよく抽出する人間の音声の共振周波数
近傍の音のパワーを検出するものである。
一般に、人間の音帯により発振させられた音声
は喉や口蓋、舌、歯、唇などで変調を受け、他人
に認識できる言葉として発せられる。この変調
(エンベロツプ)の特徴が言葉の特徴であり、例
えば喉を17cmの円筒で近似すれば共振周波数は
500Hz、1500Hz、2500Hzとなり、この共振周波数
とそのパワーが言葉の特徴を示す。
多周波数帯域音声分析機2は入力する入力音声
1を多周波数帯域フイルタによつて分析し、次段
の特定周波数帯域算出・フイルタ制御部3に出力
する。この特定周波数帯域算出・フイルタ制御部
3は多周波数帯域音声分析機2で分析された入力
音声1を演算処理して音声の特徴を最もよく抽出
する周波数とその変動幅を算出し、特定周波数帯
域フイルタ4,5,6の中心周波数とバンド幅を
制御する。
すなわち、多周波数帯域音声分析機2及び特定
周波数算出・フイルタ制御部3は口蓋、舌、歯、
唇等の個人差で変動する共振周波数を多周波数帯
域フイルタを備えた音声分析機のフイルタ毎の時
系列波形のエンベロツプに着目することにより最
も音声を特徴づける周波数がどの帯域にずれた
か、又どの程度の変動幅をもつかを決定し、調整
することができる。
この決定の具体的方法としては、時系列的に得
られたエンベロツプの空間的分布を求め、この分
布の2次と3次あるいは4次の中央モーメントを
計算し、これらのモーメントの最大値を与える周
波数が最も音声パターンを特徴づける周波数(特
定周波数)であり2次の中央モーメントが変動幅
である。
これら特定周波数帯域フイルタ4,5,6の出
力は次段に接続されたマルチプレクサ7に入力さ
れて多重化処理され、さらにA/D変換器8に出
力される。A/D変換器8ではマルチプレクサ7
からの入力信号がA/D変換処理されて、次段の
バウンダリデイテクタ・コード圧縮部9に出力さ
れる。
このバウンダリデイテクタ・コード圧縮部9内
では音声の始まりと終了を検出すると共に、A/
D変換器8からの膨大なビツトアレイが圧縮さ
れ、適当な大きさの音声パターンに生成される。
こうして生成されるバウンダリデイテクタ・コー
ド圧縮部9の出力信号はモード切換スイツチ10
により択一的に登録音声パターンメモリ11又は
照合部12に出力される。この中で、登録音声パ
ターンメモリ11は話者の音声パターン登録時に
照合データとして使用する登録音声パターンを記
録する。
照合部12では入力音声パターンと登録音声パ
ターンメモリ11から読み込まれる登録音声パタ
ーンとが動的計画法等を用いて照合され、登録音
声パターンの中で入力音声パターンと一致度の高
いパターンが検索され、その検索結果が比較器1
3に出力される。
一方、多周波数帯域フイルタ方式音声認識部A
の入力端には複数個の多周波数帯域フイルタ15
が設けられている。この多周波数帯域フイルタ1
5は100Hzから7KHzの全域をカバーする16チヤン
ネル程度の周波数帯域フイルタ群で構成され、入
力音声1の各周波数帯域毎の音声パワーのサンプ
リングを行なう。
多周波数帯域フイルタ15から後段の処理ブロ
ツクは特定周波数帯域フイルタ方式音声認識部B
と同様の機能を有するマルチプレクタ7′、A/
D変換器8′、バウンダリデイテクタ・コード圧
縮部9′、モード切換スイツチ10′、登録音声パ
ターンメモリ11′及び照合部12′とで構成され
る。
作 用 以上の構成において、本装置の音声認識動作時
には、入力音声1は多周波数帯域フイルタ15、
多周波数帯域音声分析機2及び特定周波数帯域フ
イルタ4,5,6へ入力される。多周波数帯域音
声分析機2に入力された入力音声1は多数の周波
数帯域に分割され、特定周波数帯域算出・フイル
タ制御部3にて最も音声パターンの特徴を抽出で
きる周波数とその周波数の変動幅が計算される。
こうして算出された特定周波数帯域算出・フイル
タ制御部3の出力は特定周波数帯域フイルタ4,
5,6に入力されて、これらフイルタ4,5,6
の中心周波数とバンド幅が制御される。
特定周波数帯域フイルタ4,5,6を通過した
音声のアナログ信号はマルチプレクサ7とA/D
変換器8を経てデイジタル信号に変換される。
A/D変換器8から出力される膨大なビツト・
アレイはバウンダリデイテクタ・コード圧縮部9
において語の始めと終りが検出されると同時に適
当な大きさのビツトパターンに圧縮される。こう
して圧縮されたパターンはモード切換スイツチ1
0により登録モードのときは登録音声パターンメ
モリ11へ、認識モードのときは照合部12へ送
られる。
ここで、認識モードのときには照合部12内で
入力するパターンと、予め登録音声パターンメモ
リ11内に登録されたパターンとの比較が行なわ
れその照合結果が比較器13に出力される。
一方、多周波数帯域フイルタ15に入力された
入力音声は各フイルタ15の周波数帯域毎の音声
パワーのサンプリングがなされた後、さらに特定
周波数帯域フイルタ方式音声認識部Bと同様に処
理されて照合部12′の照合結果が比較器13に
出力される。
こうして多周波数帯域フイルタ方式音声認識部
Aの照合部12′で照合された結果と、特定周波
数帯域フイルタ方式音声認識部Bの照合部12で
照合された結果は比較部13内で比較される。こ
の比較作業で認識語コードが等しく、一致度のス
コアが両者ともあるしきい値を超えている場合に
認識結果14が出力される。
発明の効果 本発明による音声認識装置の実施例は以上の通
りであり、次に述べる効果を挙げることができ
る。
音声パターンの認識率を高め、機器の制御信号
入力用としても充分信頼性の高い音声認識装置を
提供することができる。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロツク図、第
2図は特定周波数帯域フイルタの帯域を示す周波
数特性図である。 1……入力音声、2……多周波数帯域音声分析
機、3……特定周波数帯域算出・フイルタ制御
部、4,5,6……特定周波数帯域フイルタ、
7,7′……マルチプレクサ、8,8′……A/D
変換器、9,9′……バウンダリデイテクタ・コ
ード圧縮部、10,10′……モード切換スイツ
チ、11,11′……登録音声パターンメモリ、
12,12′……照合部、13…比較器、14…
…認識結果、15……多周波数帯域フイルタ。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声の全周波数帯域を複数の帯域毎に分
    割してカバーする多周波数帯域フイルタを有し、
    このフイルタで分割された帯域毎に音声スペクト
    ラムのサンプリングを行なつて入力音声のパター
    ン認識を行なう多周波数帯域フイルタ方式音声認
    識部と、 入力音声の周波数帯域の中で入力音声の特徴を
    最もよく抽出する特定の周波数帯域のみをカバー
    する所定数の特定周波数帯域フイルタを有し、こ
    の特定周波数帯域の音声スペクトラムのサンプリ
    ングを行なつて入力音声の認識を行なう特定周波
    数帯域フイルタ方式音声認識部と、 前記多周波数帯域フイルタ方式音声認識部と、
    前記特定周波数帯域フイルタ方式音声認識部とか
    らの認識結果とを比較し、両者の認識した語のコ
    ードが一致し、かつ一致度のスコアが所定のしき
    い値を越えた時に認識した語のコードを出力する
    比較器とを備えてなる音声認識装置。
JP13826784A 1984-07-04 1984-07-04 音声認識装置 Granted JPS6117198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13826784A JPS6117198A (ja) 1984-07-04 1984-07-04 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13826784A JPS6117198A (ja) 1984-07-04 1984-07-04 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6117198A JPS6117198A (ja) 1986-01-25
JPH0410080B2 true JPH0410080B2 (ja) 1992-02-24

Family

ID=15217931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13826784A Granted JPS6117198A (ja) 1984-07-04 1984-07-04 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6117198A (ja)

Also Published As

Publication number Publication date
JPS6117198A (ja) 1986-01-25

Similar Documents

Publication Publication Date Title
US4633499A (en) Speech recognition system
KR950011963B1 (ko) 음성처리장치, 그 장치를 이용한 셀룰러 무선단말장치 및 음성처리방법
EP0737351B1 (en) Method and system for detecting and generating transient conditions in auditory signals
US4827519A (en) Voice recognition system using voice power patterns
WO1990011593A1 (en) Method and apparatus for speech analysis
JPH0410080B2 (ja)
RU2107950C1 (ru) Способ идентификации личности по фонограммам произвольной устной речи
JPS6226480B2 (ja)
JP3512398B2 (ja) 音声処理装置
JPS6334477B2 (ja)
JP2806048B2 (ja) 自動採譜装置
JP2557497B2 (ja) 男女声の識別方法
JPS6315298A (ja) パタ−ン作成方式
JPS6159397A (ja) 音声入力再生装置
JPS59211098A (ja) 音声認識装置
JP2886879B2 (ja) 音声認識方法
JP2844592B2 (ja) 離散単語音声認識装置
JPH02127700A (ja) 音声応答装置
JPS6229798B2 (ja)
Reitboeck et al. Speaker-identification with real time formant extraction
JPS63106800A (ja) 音響分析器
JPS61273599A (ja) 音声認識装置
JPS61198300A (ja) 音声の標準化の方法および装置
JPH02212899A (ja) 音声認識方式
JPS6194096A (ja) 音声認識装置