JPH0410080B2 - - Google Patents
Info
- Publication number
- JPH0410080B2 JPH0410080B2 JP13826784A JP13826784A JPH0410080B2 JP H0410080 B2 JPH0410080 B2 JP H0410080B2 JP 13826784 A JP13826784 A JP 13826784A JP 13826784 A JP13826784 A JP 13826784A JP H0410080 B2 JPH0410080 B2 JP H0410080B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency band
- speech
- input
- speech recognition
- specific frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 239000000284 extract Substances 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000003909 pattern recognition Methods 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 claims 2
- 238000004364 calculation method Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 210000003254 palate Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Description
【発明の詳細な説明】
産業上の利用分野
本発明は入力する音声をパターン認識するのに
用いられる音声認識装置に関するものである。
用いられる音声認識装置に関するものである。
従来技術
従来、種々の音声認識装置が提供されており、
中でも認識させようとする特定話者の入力パター
ンを予め音声認識装置内部に登録しておく特定話
者単語音声認識方式が一般的に用いられている。
中でも認識させようとする特定話者の入力パター
ンを予め音声認識装置内部に登録しておく特定話
者単語音声認識方式が一般的に用いられている。
こうした特定話者単語音声認識方式は、騒音が
少ない等の環境のよい状態では90数パーセントの
認識率が達成でき、通常のデータ入力や事務処理
用としてほぼ実用化の域に到達したものとされて
いる。
少ない等の環境のよい状態では90数パーセントの
認識率が達成でき、通常のデータ入力や事務処理
用としてほぼ実用化の域に到達したものとされて
いる。
この発明が解決すべき問題点
しかしながら、従来の音声認識装置は汎用とし
ての設計思想が濃く、100Hzから7KHzの全域をカ
バーする16チヤンネル程度の周波数帯域フイルタ
により、入力音声の周波数帯域毎の音声パワーの
サンプリングを行つている。
ての設計思想が濃く、100Hzから7KHzの全域をカ
バーする16チヤンネル程度の周波数帯域フイルタ
により、入力音声の周波数帯域毎の音声パワーの
サンプリングを行つている。
したがつて、様々な話者の様々な入力語の音声
パターンの特徴抽出に対応できるという利点があ
るものの、音声パターンの特徴抽出の際に不必要
な帯域のパワーをサンプリングしてしまうという
欠点があつた。
パターンの特徴抽出に対応できるという利点があ
るものの、音声パターンの特徴抽出の際に不必要
な帯域のパワーをサンプリングしてしまうという
欠点があつた。
このため、現状の汎用性を重視した音声認識装
置では音声パターン内に冗長周波数帯の情報が入
るのを防ぐことは難しく、この情報が音声パター
ンの特徴を弱めるため制御用として使う為には充
分なレベルの認識率が得られず信頼性に乏しかつ
た。
置では音声パターン内に冗長周波数帯の情報が入
るのを防ぐことは難しく、この情報が音声パター
ンの特徴を弱めるため制御用として使う為には充
分なレベルの認識率が得られず信頼性に乏しかつ
た。
発明の目的
そこで、本発明は前記のような従来の音声認識
装置の不充分な点を改良して音声パターンの認識
率を高め、機器の制御信号入力用としても充分信
頼性の高い音声認識装置を提供することを目的と
する。
装置の不充分な点を改良して音声パターンの認識
率を高め、機器の制御信号入力用としても充分信
頼性の高い音声認識装置を提供することを目的と
する。
発明の構成
本発明による音声認識装置は多周波数帯域フイ
ルタを備えた音声認識部と入力語の特徴を最もよ
く抽出する周波数帯のみに合つた帯域フイルタを
備えた音声認識部とを比較器に並列接続し、両者
の認識語のコード番号が一致し、かつ両者の一致
度スコアがあるしきい値を超えた時のみ認識する
よう構成された点に特徴がある。
ルタを備えた音声認識部と入力語の特徴を最もよ
く抽出する周波数帯のみに合つた帯域フイルタを
備えた音声認識部とを比較器に並列接続し、両者
の認識語のコード番号が一致し、かつ両者の一致
度スコアがあるしきい値を超えた時のみ認識する
よう構成された点に特徴がある。
実施例
以下、図示する本発明の実施例により説明す
る。第1図に実施例のブロツク図を示したが、音
声認識装置は多周波数帯域フイルタ方式音声認識
部Aと特定周波数帯域フイルタ方式音声認識部
B、及び比較器13とで構成されている。
る。第1図に実施例のブロツク図を示したが、音
声認識装置は多周波数帯域フイルタ方式音声認識
部Aと特定周波数帯域フイルタ方式音声認識部
B、及び比較器13とで構成されている。
特定周波数帯域フイルタ方式音声認識部Bには
多周波数帯域音声分析機2と特定周波数帯域フイ
ルタ4,5,6が備えられており、これらのブロ
ツクに入力音声1が並列に入力される。
多周波数帯域音声分析機2と特定周波数帯域フイ
ルタ4,5,6が備えられており、これらのブロ
ツクに入力音声1が並列に入力される。
ここで、特定周波数帯域フイルタ4,5,6は
第2図に示した様に各々500Hz、1500Hz、2500Hz
を中心周波数とする帯域フイルタであり、入力音
声1を各帯域毎に濾波して次のブロツクへ出力す
る。これらの各中心周波数を持つた特定周波数帯
域フイルタ4,5,6を設けたのは、入力音声の
特徴を最もよく抽出する人間の音声の共振周波数
近傍の音のパワーを検出するものである。
第2図に示した様に各々500Hz、1500Hz、2500Hz
を中心周波数とする帯域フイルタであり、入力音
声1を各帯域毎に濾波して次のブロツクへ出力す
る。これらの各中心周波数を持つた特定周波数帯
域フイルタ4,5,6を設けたのは、入力音声の
特徴を最もよく抽出する人間の音声の共振周波数
近傍の音のパワーを検出するものである。
一般に、人間の音帯により発振させられた音声
は喉や口蓋、舌、歯、唇などで変調を受け、他人
に認識できる言葉として発せられる。この変調
(エンベロツプ)の特徴が言葉の特徴であり、例
えば喉を17cmの円筒で近似すれば共振周波数は
500Hz、1500Hz、2500Hzとなり、この共振周波数
とそのパワーが言葉の特徴を示す。
は喉や口蓋、舌、歯、唇などで変調を受け、他人
に認識できる言葉として発せられる。この変調
(エンベロツプ)の特徴が言葉の特徴であり、例
えば喉を17cmの円筒で近似すれば共振周波数は
500Hz、1500Hz、2500Hzとなり、この共振周波数
とそのパワーが言葉の特徴を示す。
多周波数帯域音声分析機2は入力する入力音声
1を多周波数帯域フイルタによつて分析し、次段
の特定周波数帯域算出・フイルタ制御部3に出力
する。この特定周波数帯域算出・フイルタ制御部
3は多周波数帯域音声分析機2で分析された入力
音声1を演算処理して音声の特徴を最もよく抽出
する周波数とその変動幅を算出し、特定周波数帯
域フイルタ4,5,6の中心周波数とバンド幅を
制御する。
1を多周波数帯域フイルタによつて分析し、次段
の特定周波数帯域算出・フイルタ制御部3に出力
する。この特定周波数帯域算出・フイルタ制御部
3は多周波数帯域音声分析機2で分析された入力
音声1を演算処理して音声の特徴を最もよく抽出
する周波数とその変動幅を算出し、特定周波数帯
域フイルタ4,5,6の中心周波数とバンド幅を
制御する。
すなわち、多周波数帯域音声分析機2及び特定
周波数算出・フイルタ制御部3は口蓋、舌、歯、
唇等の個人差で変動する共振周波数を多周波数帯
域フイルタを備えた音声分析機のフイルタ毎の時
系列波形のエンベロツプに着目することにより最
も音声を特徴づける周波数がどの帯域にずれた
か、又どの程度の変動幅をもつかを決定し、調整
することができる。
周波数算出・フイルタ制御部3は口蓋、舌、歯、
唇等の個人差で変動する共振周波数を多周波数帯
域フイルタを備えた音声分析機のフイルタ毎の時
系列波形のエンベロツプに着目することにより最
も音声を特徴づける周波数がどの帯域にずれた
か、又どの程度の変動幅をもつかを決定し、調整
することができる。
この決定の具体的方法としては、時系列的に得
られたエンベロツプの空間的分布を求め、この分
布の2次と3次あるいは4次の中央モーメントを
計算し、これらのモーメントの最大値を与える周
波数が最も音声パターンを特徴づける周波数(特
定周波数)であり2次の中央モーメントが変動幅
である。
られたエンベロツプの空間的分布を求め、この分
布の2次と3次あるいは4次の中央モーメントを
計算し、これらのモーメントの最大値を与える周
波数が最も音声パターンを特徴づける周波数(特
定周波数)であり2次の中央モーメントが変動幅
である。
これら特定周波数帯域フイルタ4,5,6の出
力は次段に接続されたマルチプレクサ7に入力さ
れて多重化処理され、さらにA/D変換器8に出
力される。A/D変換器8ではマルチプレクサ7
からの入力信号がA/D変換処理されて、次段の
バウンダリデイテクタ・コード圧縮部9に出力さ
れる。
力は次段に接続されたマルチプレクサ7に入力さ
れて多重化処理され、さらにA/D変換器8に出
力される。A/D変換器8ではマルチプレクサ7
からの入力信号がA/D変換処理されて、次段の
バウンダリデイテクタ・コード圧縮部9に出力さ
れる。
このバウンダリデイテクタ・コード圧縮部9内
では音声の始まりと終了を検出すると共に、A/
D変換器8からの膨大なビツトアレイが圧縮さ
れ、適当な大きさの音声パターンに生成される。
こうして生成されるバウンダリデイテクタ・コー
ド圧縮部9の出力信号はモード切換スイツチ10
により択一的に登録音声パターンメモリ11又は
照合部12に出力される。この中で、登録音声パ
ターンメモリ11は話者の音声パターン登録時に
照合データとして使用する登録音声パターンを記
録する。
では音声の始まりと終了を検出すると共に、A/
D変換器8からの膨大なビツトアレイが圧縮さ
れ、適当な大きさの音声パターンに生成される。
こうして生成されるバウンダリデイテクタ・コー
ド圧縮部9の出力信号はモード切換スイツチ10
により択一的に登録音声パターンメモリ11又は
照合部12に出力される。この中で、登録音声パ
ターンメモリ11は話者の音声パターン登録時に
照合データとして使用する登録音声パターンを記
録する。
照合部12では入力音声パターンと登録音声パ
ターンメモリ11から読み込まれる登録音声パタ
ーンとが動的計画法等を用いて照合され、登録音
声パターンの中で入力音声パターンと一致度の高
いパターンが検索され、その検索結果が比較器1
3に出力される。
ターンメモリ11から読み込まれる登録音声パタ
ーンとが動的計画法等を用いて照合され、登録音
声パターンの中で入力音声パターンと一致度の高
いパターンが検索され、その検索結果が比較器1
3に出力される。
一方、多周波数帯域フイルタ方式音声認識部A
の入力端には複数個の多周波数帯域フイルタ15
が設けられている。この多周波数帯域フイルタ1
5は100Hzから7KHzの全域をカバーする16チヤン
ネル程度の周波数帯域フイルタ群で構成され、入
力音声1の各周波数帯域毎の音声パワーのサンプ
リングを行なう。
の入力端には複数個の多周波数帯域フイルタ15
が設けられている。この多周波数帯域フイルタ1
5は100Hzから7KHzの全域をカバーする16チヤン
ネル程度の周波数帯域フイルタ群で構成され、入
力音声1の各周波数帯域毎の音声パワーのサンプ
リングを行なう。
多周波数帯域フイルタ15から後段の処理ブロ
ツクは特定周波数帯域フイルタ方式音声認識部B
と同様の機能を有するマルチプレクタ7′、A/
D変換器8′、バウンダリデイテクタ・コード圧
縮部9′、モード切換スイツチ10′、登録音声パ
ターンメモリ11′及び照合部12′とで構成され
る。
ツクは特定周波数帯域フイルタ方式音声認識部B
と同様の機能を有するマルチプレクタ7′、A/
D変換器8′、バウンダリデイテクタ・コード圧
縮部9′、モード切換スイツチ10′、登録音声パ
ターンメモリ11′及び照合部12′とで構成され
る。
作 用
以上の構成において、本装置の音声認識動作時
には、入力音声1は多周波数帯域フイルタ15、
多周波数帯域音声分析機2及び特定周波数帯域フ
イルタ4,5,6へ入力される。多周波数帯域音
声分析機2に入力された入力音声1は多数の周波
数帯域に分割され、特定周波数帯域算出・フイル
タ制御部3にて最も音声パターンの特徴を抽出で
きる周波数とその周波数の変動幅が計算される。
こうして算出された特定周波数帯域算出・フイル
タ制御部3の出力は特定周波数帯域フイルタ4,
5,6に入力されて、これらフイルタ4,5,6
の中心周波数とバンド幅が制御される。
には、入力音声1は多周波数帯域フイルタ15、
多周波数帯域音声分析機2及び特定周波数帯域フ
イルタ4,5,6へ入力される。多周波数帯域音
声分析機2に入力された入力音声1は多数の周波
数帯域に分割され、特定周波数帯域算出・フイル
タ制御部3にて最も音声パターンの特徴を抽出で
きる周波数とその周波数の変動幅が計算される。
こうして算出された特定周波数帯域算出・フイル
タ制御部3の出力は特定周波数帯域フイルタ4,
5,6に入力されて、これらフイルタ4,5,6
の中心周波数とバンド幅が制御される。
特定周波数帯域フイルタ4,5,6を通過した
音声のアナログ信号はマルチプレクサ7とA/D
変換器8を経てデイジタル信号に変換される。
音声のアナログ信号はマルチプレクサ7とA/D
変換器8を経てデイジタル信号に変換される。
A/D変換器8から出力される膨大なビツト・
アレイはバウンダリデイテクタ・コード圧縮部9
において語の始めと終りが検出されると同時に適
当な大きさのビツトパターンに圧縮される。こう
して圧縮されたパターンはモード切換スイツチ1
0により登録モードのときは登録音声パターンメ
モリ11へ、認識モードのときは照合部12へ送
られる。
アレイはバウンダリデイテクタ・コード圧縮部9
において語の始めと終りが検出されると同時に適
当な大きさのビツトパターンに圧縮される。こう
して圧縮されたパターンはモード切換スイツチ1
0により登録モードのときは登録音声パターンメ
モリ11へ、認識モードのときは照合部12へ送
られる。
ここで、認識モードのときには照合部12内で
入力するパターンと、予め登録音声パターンメモ
リ11内に登録されたパターンとの比較が行なわ
れその照合結果が比較器13に出力される。
入力するパターンと、予め登録音声パターンメモ
リ11内に登録されたパターンとの比較が行なわ
れその照合結果が比較器13に出力される。
一方、多周波数帯域フイルタ15に入力された
入力音声は各フイルタ15の周波数帯域毎の音声
パワーのサンプリングがなされた後、さらに特定
周波数帯域フイルタ方式音声認識部Bと同様に処
理されて照合部12′の照合結果が比較器13に
出力される。
入力音声は各フイルタ15の周波数帯域毎の音声
パワーのサンプリングがなされた後、さらに特定
周波数帯域フイルタ方式音声認識部Bと同様に処
理されて照合部12′の照合結果が比較器13に
出力される。
こうして多周波数帯域フイルタ方式音声認識部
Aの照合部12′で照合された結果と、特定周波
数帯域フイルタ方式音声認識部Bの照合部12で
照合された結果は比較部13内で比較される。こ
の比較作業で認識語コードが等しく、一致度のス
コアが両者ともあるしきい値を超えている場合に
認識結果14が出力される。
Aの照合部12′で照合された結果と、特定周波
数帯域フイルタ方式音声認識部Bの照合部12で
照合された結果は比較部13内で比較される。こ
の比較作業で認識語コードが等しく、一致度のス
コアが両者ともあるしきい値を超えている場合に
認識結果14が出力される。
発明の効果
本発明による音声認識装置の実施例は以上の通
りであり、次に述べる効果を挙げることができ
る。
りであり、次に述べる効果を挙げることができ
る。
音声パターンの認識率を高め、機器の制御信号
入力用としても充分信頼性の高い音声認識装置を
提供することができる。
入力用としても充分信頼性の高い音声認識装置を
提供することができる。
第1図は本発明の実施例を示すブロツク図、第
2図は特定周波数帯域フイルタの帯域を示す周波
数特性図である。 1……入力音声、2……多周波数帯域音声分析
機、3……特定周波数帯域算出・フイルタ制御
部、4,5,6……特定周波数帯域フイルタ、
7,7′……マルチプレクサ、8,8′……A/D
変換器、9,9′……バウンダリデイテクタ・コ
ード圧縮部、10,10′……モード切換スイツ
チ、11,11′……登録音声パターンメモリ、
12,12′……照合部、13…比較器、14…
…認識結果、15……多周波数帯域フイルタ。
2図は特定周波数帯域フイルタの帯域を示す周波
数特性図である。 1……入力音声、2……多周波数帯域音声分析
機、3……特定周波数帯域算出・フイルタ制御
部、4,5,6……特定周波数帯域フイルタ、
7,7′……マルチプレクサ、8,8′……A/D
変換器、9,9′……バウンダリデイテクタ・コ
ード圧縮部、10,10′……モード切換スイツ
チ、11,11′……登録音声パターンメモリ、
12,12′……照合部、13…比較器、14…
…認識結果、15……多周波数帯域フイルタ。
Claims (1)
- 【特許請求の範囲】 1 入力音声の全周波数帯域を複数の帯域毎に分
割してカバーする多周波数帯域フイルタを有し、
このフイルタで分割された帯域毎に音声スペクト
ラムのサンプリングを行なつて入力音声のパター
ン認識を行なう多周波数帯域フイルタ方式音声認
識部と、 入力音声の周波数帯域の中で入力音声の特徴を
最もよく抽出する特定の周波数帯域のみをカバー
する所定数の特定周波数帯域フイルタを有し、こ
の特定周波数帯域の音声スペクトラムのサンプリ
ングを行なつて入力音声の認識を行なう特定周波
数帯域フイルタ方式音声認識部と、 前記多周波数帯域フイルタ方式音声認識部と、
前記特定周波数帯域フイルタ方式音声認識部とか
らの認識結果とを比較し、両者の認識した語のコ
ードが一致し、かつ一致度のスコアが所定のしき
い値を越えた時に認識した語のコードを出力する
比較器とを備えてなる音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13826784A JPS6117198A (ja) | 1984-07-04 | 1984-07-04 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13826784A JPS6117198A (ja) | 1984-07-04 | 1984-07-04 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6117198A JPS6117198A (ja) | 1986-01-25 |
| JPH0410080B2 true JPH0410080B2 (ja) | 1992-02-24 |
Family
ID=15217931
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP13826784A Granted JPS6117198A (ja) | 1984-07-04 | 1984-07-04 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6117198A (ja) |
-
1984
- 1984-07-04 JP JP13826784A patent/JPS6117198A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6117198A (ja) | 1986-01-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4633499A (en) | Speech recognition system | |
| KR950011963B1 (ko) | 음성처리장치, 그 장치를 이용한 셀룰러 무선단말장치 및 음성처리방법 | |
| EP0737351B1 (en) | Method and system for detecting and generating transient conditions in auditory signals | |
| US4827519A (en) | Voice recognition system using voice power patterns | |
| WO1990011593A1 (en) | Method and apparatus for speech analysis | |
| JPH0410080B2 (ja) | ||
| RU2107950C1 (ru) | Способ идентификации личности по фонограммам произвольной устной речи | |
| JPS6226480B2 (ja) | ||
| JP3512398B2 (ja) | 音声処理装置 | |
| JPS6334477B2 (ja) | ||
| JP2806048B2 (ja) | 自動採譜装置 | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JPS6315298A (ja) | パタ−ン作成方式 | |
| JPS6159397A (ja) | 音声入力再生装置 | |
| JPS59211098A (ja) | 音声認識装置 | |
| JP2886879B2 (ja) | 音声認識方法 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JPH02127700A (ja) | 音声応答装置 | |
| JPS6229798B2 (ja) | ||
| Reitboeck et al. | Speaker-identification with real time formant extraction | |
| JPS63106800A (ja) | 音響分析器 | |
| JPS61273599A (ja) | 音声認識装置 | |
| JPS61198300A (ja) | 音声の標準化の方法および装置 | |
| JPH02212899A (ja) | 音声認識方式 | |
| JPS6194096A (ja) | 音声認識装置 |