JPH07219596A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH07219596A
JPH07219596A JP6008256A JP825694A JPH07219596A JP H07219596 A JPH07219596 A JP H07219596A JP 6008256 A JP6008256 A JP 6008256A JP 825694 A JP825694 A JP 825694A JP H07219596 A JPH07219596 A JP H07219596A
Authority
JP
Japan
Prior art keywords
voice
signal
filter
divided
dividing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6008256A
Other languages
English (en)
Inventor
Kazuaki Obara
和昭 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6008256A priority Critical patent/JPH07219596A/ja
Publication of JPH07219596A publication Critical patent/JPH07219596A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 大きな雑音環境下でも認識率の低下の少な
く、さまざまな環境で使えることを可能にする音声認識
装置を提供すること。 【構成】 音声を異なる中心周波数を持つ複数の周波数
帯域に分割する手段102と、前記分割して得られた各
信号波形に含まれる相関性の大小を求める手段103
と、複数の周波数帯域に分割する手段102によって得
られた各信号波形のパワー成分を検出する手段104
と、分割された各信号波形に含まれる同期周波数成分を
前記パワー成分を用いて正規化する手段105と、正規
化された同期信号成分を加算する手段106を備えたこ
とを特徴とする音声認識装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識装置に関し、更
に詳しくは大きな騒音下でも認識性能を損ねることなく
利用することの出来る音声認識装置に関するものであ
る。
【0002】
【従来の技術】従来の音声認識装置としては、図4に示
された様な構成が一般的に用いられてきている。図4に
おいて、401は音声を入力するためのマイク、402
は401のマイクで入力された音声の特徴量を取り出す
ための特徴抽出器、403は402の特徴抽出器で取り
出した音声の特徴量を用いて入力された音声を認識する
ための識別部である。以上のように構成された従来の音
声認識装置について、以下その動作を説明する。図4に
おいて、音声を入力するためのマイク401で入力され
た音声は特徴抽出器402に入力され音声の特徴量が抽
出される。この音声の特徴量の抽出にはこれまで公知の
フィルタ分析、DFT(Discrete FourierTransform)分
析、LPC(Linear Predictive Coding)分析等が用い
られている。音声特徴抽出器402で求められた音声の
特徴量は識別部403に入力され公知のDTW(Dinamic
Time Warping)、HMM(Hidden Markoff Model)、NN
(Neural Network)等の様々な音声パターンの識別方法に
よってされた入力された音声の認識を行う。
【0003】
【発明が解決しようとする課題】以上のように構成され
た従来の構成の音声認識装置において、公知のフィルタ
分析、DFT(Discrete Fourier Transform)分析、L
PC(Linear Predictive Coding)分析等を用いる特徴
抽出器402では、大きな騒音下での音声の特徴分析が
的確に行われなくなり認識性能が低下してしまうといっ
た問題があった。
【0004】本発明はかかる点に鑑み、大きな騒音下で
も高い認識率が得られる音声認識装置を提供することを
目的とする。
【0005】
【課題を解決するための手段】本発明は、音声を異なる
中心周波数を持つ複数の周波数帯域に分割する手段と、
前記分割された音声信号の各信号波形の相関性の大小を
求める手段と、前記分割された音声信号の各信号波形の
パワー成分を検出する手段と、前記分割された音声信号
の各信号波形の相関性の大小を前記パワー成分を用いて
正規化する手段と、前記正規化された相関性の大小を加
算する手段と、前記加算された信号を用いて入力音声の
識別を行う識別部を備えたことを特徴とする音声認識装
置である。
【0006】
【作用】本発明は前記した構成により、大きな騒音のあ
る環境でも音声認識装置の認識率を低下することなく利
用することができ、音声認識装置の利用環境を大きく広
げることができる。
【0007】
【実施例】図1は本発明の第1の実施例における音声認
識装置の構成図を示すもので101は音声を入力するた
めのマイク、102は音声を異なる中心周波数を持つ複
数の周波数帯域に分割するためのフィルタバンク、10
3はフィルタによって周波数分析された音声信号の各信
号波形の自己相関を求めるための自己相関器、104は
フィルタによって周波数分析された音声信号波形のパワ
ー成分を求めるパワー検出回路、105は自己相関器1
03の出力を前記パワー検出器104で求めた各フィル
タ出力のパワーを用いて正規化するための除算器、10
6は除算器105で正規化された各フィルタの自己相関
の値を加え合わせるための加算器、106は加算器10
5で求めた音声特徴量を用いて音声認識をするための識
別部である。
【0008】以上のように構成された従来の音声認識装
置について、以下その動作を説明する。図1において、
音声を入力するためのマイク101によって入力された
音声は、フィルタバンク102に入力され、異なる中心
周波数を持つ複数の周波数帯域を有する音声周波数帯域
に分割される。この帯域フィルタバンクの中心周波数は
音声信号帯域を対数的に等間隔に分割することによって
設定しており、音声情報の重要な成分を受け持つ低域の
周波数成分は細かく、高域の周波数成分は大まかに分析
する事によって効率的に音声の周波数分析を行ってい
る。このフィルタバンク102で分析された音声信号
は、自己相関器103とパワー検出器104に入力さ
れ、各フィルタ出力に含まれる各帯域成分の周期性検出
とフィルタに含まれるパワーの検出が行われる。その後
パワー成分で正規化するために除算器105に入力され
自己相関器103の出力はフィルタ出力のパワーに応じ
て正規化される。正規化された各自己相関器出力は加算
器106へと入力され各フィルタの正規化された自己相
関値が加え合わされる。識別部107では加え合わされ
た自己相関の値をを用いて、公知の音声パターンの識別
方法であるDTW(DinamicTime Warping)によって、入
力された音声の認識を行う。音声パターンの識別方法と
してはHMM(Hidden Markoff Model)、NN(Neural Ne
twork)等の様々な音声パターンの識別方法をDTWの代
わりに用いることが出来る。
【0009】図2に上記に示した本発明を用いた音声認
識装置の雑音環境下での音声認識率を、従来の認識装置
を用いたときの認識率と比較した結果を示している。図
2の縦軸は音声認識率、横軸は音声が発話される環境の
雑音の大きさをしめすS/N比を示している。従来の認識
装置としては、良く用いられている音声分析手法である
DFT(Discrete Fourier Transform)を用いた音声認
識装置の結果を示している。この図より明らかなよう
に、従来の手法では雑音が高くなる(S/N比が低くな
る)と認識率が大きく低下してくるのに対して、本発明
の音声認識装置では、雑音が大きくなってきても認識率
の低下は少なく、良好な認識性能が維持できていること
がわかる。
【0010】以上のように本実施例によれば、大きな雑
音環境下においても認識率の低下が少ない優れた音声認
識装置を得ることが出来、音声認識装置を大きな雑音が
ある環境でも利用することを可能にするなど、その実用
的な価値は非常に大きい。
【0011】図3は本発明の第2の実施例における音声
認識装置の構成図を示すものである。301は音声を入
力するためのマイク、302は音声を異なる中心周波数
を持つ複数の周波数帯域に分割するためのフィルタバン
ク、303はフィルタによって周波数分析された音声信
号の各信号波形を各フィルタの中心周波数の逆数により
決定される遅延量だけフィルタ出力信号を遅延させるた
めの遅延回路、304は遅延回路303により遅延され
た信号と、遅延しないフィルタ出力信号との掛け算をす
るための乗算器、305は乗算器304の出力をフィル
タ毎に設定した積分時間だけ積分するための積分回路、
306はフィルタ出力信号の自乗を計算するための2乗
回路、307は2乗器306の出力をフィルタ毎に設定
した積分時間だけ積分するための積分回路、308は積
分回路306の出力を積分回路307で除算する事によ
って乗算器304の出力を、各フィルタ出力のパワーを
用いて正規化するための除算器、309は各フィルタ出
力につながる除算器308の出力を加算する加算器、3
10は309の出力である音声特徴量を用いて音声認識
をするための識別部である。
【0012】以上のように構成された従来の音声認識装
置について、以下その動作を説明する。図3において、
音声を入力するためのマイク301によって入力された
音声は、異なる中心周波数を持つ複数のフィルタ302
により異なる周波数帯域を有する複数の音声周波数帯域
に分割される。この帯域フィルタ302の中心周波数は
第一の実施例と同様に、音声信号帯域を対数的に等間隔
に分割することによって設定しており、音声情報の低次
のフォルマント等の重要な成分を受け持つ低域の周波数
成分は細かく、高域の周波数成分は大まかに分析する事
によって効率的に音声の周波数分析を行っている。この
フィルタバンク302で分析された音声信号は、前記フ
ィルタによって周波数分析された音声信号の各信号波形
を各フィルタの中心周波数の逆数により決定される遅延
量(例えばフィルタの中心周波数が200Hzの時の遅延量
は5msに設定)だけフィルタ出力信号を遅延させるため
の遅延回路303に入力され遅延された後、遅延しない
フィルタ出力信号との積を求めるために乗算器304に
入力された後、各フィルタ毎に設定される積分時間を持
つ積分器305に入力される。積分器305の出力は、
遅延した信号(遅延回路303の出力)と遅延しない信
号の相関が高ければ出力値は大きくなり、逆に相関が低
ければ出力は低くなる。積分器305の出力は、2乗回
路306の出力(フィルタ出力のパワー)を積分器30
7により積分したものの出力用いて除算器308によっ
て除算される。この演算によってフィルタ出力に含まれ
る中心周波数成分を、フィルタに含まれるパワーを用い
て正規化した量として求めている。除算器308ー1〜
308ーNの出力は加算器309で加算され識別部31
0へと入力される。識別部310では入力された音声特
徴量を用いて、公知のDTW(Dinamic Time Warping)、
HMM(Hidden Markoff Model)、NN(Neural Network)
等の様々な音声パターンの識別方法によって、入力され
た音声の認識を行う。
【0013】以上のように本実施例によれば、複数のフ
ィルタによって周波数分析された音声信号の各信号波形
の自己相関を求める必要がなく、より簡易な構成でフィ
ルタ出力の相関性の大小を求めることができ、大きな雑
音環境下においても認識率の低下が少ない優れた音声認
識装置を得ることが出来、音声認識装置を大きな雑音が
ある環境でも利用することが可能なり、その実用的な価
値は非常に大きい。
【0014】
【発明の効果】以上説明したように、本発明によれば、
大きな雑音環境下でも認識率の低下の少ない音声認識装
置を得ることが出来、音声認識装置をさまざまな環境で
使えることを可能にすることができその実用的価値には
大なるものがある。
【図面の簡単な説明】
【図1】本発明における第1の実施例の音声認識装置の
構成図
【図2】本発明における第1の実施例を用いたの音声認
識装置の性能説明図
【図3】本発明における第2の実施例の音声認識装置の
構成図
【図4】従来の音声認識装置の構成図
【符号の説明】
101 入力マイク 102 フィルタバンク 103 自己相関器 104 パワー検出回路 105 除算器 106 加算器 107 識別器 301 マイク 302 フィルタバンク 303 遅延回路 304 乗算器 305 積分器 306 2乗回路 307 積分器 308 加算器 309 除算器 310 識別部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】音声を異なる中心周波数を持つフィルタに
    よって複数の周波数帯域に分割する手段と、前記分割し
    て得られた各フィルタ出力波形に含まれる時間方向の相
    関性の大小を求める手段と、前記複数の周波数帯域に分
    割する手段によって得られた各信号波形のパワー成分を
    検出する手段と、前記分割された各信号波形の相関の大
    小性を前記パワー成分を用いて正規化する手段と、前記
    複数の周波数帯域の正規化された信号を加算する手段
    と、前記加算された信号成分を用いて入力音声の識別を
    行う識別部を備えたことを特徴とする音声認識装置。
  2. 【請求項2】フィルタによって分割された各信号波形に
    含まれる相関性の大小を求める手段と、前記分割された
    音声信号の各信号波形のパワー成分を検出する手段が、
    前記複数の周波数帯域に分割する手段によって分割され
    た信号波形の自己相関を用いて求めることを特徴とする
    請求項1記載の音声認識装置。
  3. 【請求項3】フィルタによって分割された各信号波形に
    含まれる相関性の大小を求める手段が、前記複数のフィ
    ルタによって分割された音声信号と、各々のフィルタの
    中心周波数によって決定される遅延量だけ前記複数のフ
    ィルタによって分割された音声信号を遅延した信号を乗
    算する手段と、前記乗算する手段の出力を積分する手段
    とを用いて求めることを特徴とする請求項1記載の音声
    認識装置。
  4. 【請求項4】音声を複数の周波数帯域に分割するための
    フィルタの中心周波数が、音声信号帯域を対数的に等間
    隔に分割することによって設定された事を特徴とする請
    求項1記載の音声認識装置。
JP6008256A 1994-01-28 1994-01-28 音声認識装置 Pending JPH07219596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6008256A JPH07219596A (ja) 1994-01-28 1994-01-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6008256A JPH07219596A (ja) 1994-01-28 1994-01-28 音声認識装置

Publications (1)

Publication Number Publication Date
JPH07219596A true JPH07219596A (ja) 1995-08-18

Family

ID=11688069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6008256A Pending JPH07219596A (ja) 1994-01-28 1994-01-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPH07219596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009047871A1 (ja) * 2007-10-12 2009-04-16 Fujitsu Limited エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009047871A1 (ja) * 2007-10-12 2009-04-16 Fujitsu Limited エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体
WO2009047858A1 (ja) * 2007-10-12 2009-04-16 Fujitsu Limited エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体
US8340963B2 (en) 2007-10-12 2012-12-25 Fujitsu Limited Echo suppressing system, echo suppressing method, recording medium, echo suppressor, sound output device, audio system, navigation system and mobile object

Similar Documents

Publication Publication Date Title
JP4177755B2 (ja) 発話特徴抽出システム
US5583961A (en) Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
EP0737351B1 (en) Method and system for detecting and generating transient conditions in auditory signals
Kamble et al. Novel energy separation based instantaneous frequency features for spoof speech detection
US20090067647A1 (en) Mixed audio separation apparatus
CN106548786A (zh) 一种音频数据的检测方法及系统
Magre et al. A comparative study on feature extraction techniques in speech recognition
Singh et al. Linear Prediction Residual based Short-term Cepstral Features for Replay Attacks Detection.
Maazouzi et al. MFCC and similarity measurements for speaker identification systems
EP1293961B1 (en) A signal processing method to analyse transients of a speech signal
JPH07219596A (ja) 音声認識装置
Jana et al. Replay attack detection for speaker verification using different features level fusion system
RU2174714C2 (ru) Способ выделения основного тона
KR19990001828A (ko) 스펙트럼의 동적영역 정규화에 의한 음성 특징 추출 장치 및 방법
JPH04100099A (ja) 音声検出装置
JP4537821B2 (ja) オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体
KR100526110B1 (ko) 화자인식시스템의 화자 특징벡터 생성방법 및 시스템
Tu et al. Computational auditory scene analysis based voice activity detection
JP2001109494A (ja) 音声識別装置及び方法
Ghaemmaghami et al. Speech endpoint detection using gradient based edge detection techniques
JP2880683B2 (ja) 雑音抑制装置
Bonifaco et al. Comparative analysis of filipino-based rhinolalia aperta speech using mel frequency cepstral analysis and Perceptual Linear Prediction
JPH0558551B2 (ja)
JP3019603B2 (ja) 音声の基本周波数の抽出装置
KR100539176B1 (ko) 음악적 특징 추출 방법 및 장치