JPH0449717B2 - - Google Patents
Info
- Publication number
- JPH0449717B2 JPH0449717B2 JP58091122A JP9112283A JPH0449717B2 JP H0449717 B2 JPH0449717 B2 JP H0449717B2 JP 58091122 A JP58091122 A JP 58091122A JP 9112283 A JP9112283 A JP 9112283A JP H0449717 B2 JPH0449717 B2 JP H0449717B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- standard
- category
- representative
- standard pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000004364 calculation method Methods 0.000 claims abstract description 90
- 238000012795 verification Methods 0.000 claims description 56
- 238000012935 Averaging Methods 0.000 claims description 23
- 238000003909 pattern recognition Methods 0.000 claims description 19
- 239000013598 vector Substances 0.000 description 56
- 238000000605 extraction Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、入力信号から得られる特徴パターン
系列と標準パターンとを比較して、特徴パターン
系列に最も近い標準パターンを識別して該当する
カテゴリコードを出力するパターン認識装置に関
するものである。
系列と標準パターンとを比較して、特徴パターン
系列に最も近い標準パターンを識別して該当する
カテゴリコードを出力するパターン認識装置に関
するものである。
従来例の構成とその問題点
近年、人間−機械系の入力手段を目的したパタ
ーン認識装置の開発が盛んである。例えば、人間
によつて最も自然な情報発生手段である音声に関
して、音声のパターンを識別することにより、人
間−機械系の入力手段を実現することへの期待は
非常に大きく、従来から種々な提案がなされてい
る。
ーン認識装置の開発が盛んである。例えば、人間
によつて最も自然な情報発生手段である音声に関
して、音声のパターンを識別することにより、人
間−機械系の入力手段を実現することへの期待は
非常に大きく、従来から種々な提案がなされてい
る。
以下に従来の音声パターン認識装置について説
明する。第1図は、従来の音声パターン認識装置
の構成図を示すものであり、1は特徴抽出部、2
は標準パターン記憶部、3は計算部、4は平均
部、5は識別部である。
明する。第1図は、従来の音声パターン認識装置
の構成図を示すものであり、1は特徴抽出部、2
は標準パターン記憶部、3は計算部、4は平均
部、5は識別部である。
以上の様に構成された従来の音声パターン認識
装置について、以下その動作を説明する。
装置について、以下その動作を説明する。
入力信号は、特徴抽出部1において特徴パター
ンの時系列に変換され、計算部3において標準パ
ターン記憶部2で記憶されている各カテゴリ毎複
数個の標準パターンとマツチング計算される。平
均部4では、各カテゴリ毎に得られる前記マツチ
ング計算結果のうち、前記特徴パターンとの距離
の近いものK個の平均値を計算する。識別部5で
は、前記平均部4の結果のうち、距離の平均値が
最も近い前記標準パターン群に対応するカテゴリ
コードを識別結果として出力する。
ンの時系列に変換され、計算部3において標準パ
ターン記憶部2で記憶されている各カテゴリ毎複
数個の標準パターンとマツチング計算される。平
均部4では、各カテゴリ毎に得られる前記マツチ
ング計算結果のうち、前記特徴パターンとの距離
の近いものK個の平均値を計算する。識別部5で
は、前記平均部4の結果のうち、距離の平均値が
最も近い前記標準パターン群に対応するカテゴリ
コードを識別結果として出力する。
しかしながら、前記の様な構成では、各カテゴ
リ毎の標準パターン数Nの増加及び、前記平均部
4で平均する距離の個数Kの増加に伴ない、前記
特徴パターンに対する識別率は最善されるが、識
別に要する時間がかかりすぎるという問題を有し
ていた。すなわち、各カテゴリ毎に1つの標準パ
ターンしか持たない場合(N=1、K=1)に比
べて、N倍のマツチング計算と、1回の平均計算
を行う必要があつた。
リ毎の標準パターン数Nの増加及び、前記平均部
4で平均する距離の個数Kの増加に伴ない、前記
特徴パターンに対する識別率は最善されるが、識
別に要する時間がかかりすぎるという問題を有し
ていた。すなわち、各カテゴリ毎に1つの標準パ
ターンしか持たない場合(N=1、K=1)に比
べて、N倍のマツチング計算と、1回の平均計算
を行う必要があつた。
更に、カテゴリ数Mが増加すると、識別に要す
る時間は、前記の更にM倍に増加するという問題
も有していた。
る時間は、前記の更にM倍に増加するという問題
も有していた。
発明の目的
本発明は、上記の様な従来の問題点を解決する
もので、各カテゴリ毎に複数個の標準パターンと
照合することで得られる識別率の改善効果を失う
ことなく、また、標準パターンの記憶容量を増す
ことなく、識別に要する時間を短縮することを目
的とするものである。
もので、各カテゴリ毎に複数個の標準パターンと
照合することで得られる識別率の改善効果を失う
ことなく、また、標準パターンの記憶容量を増す
ことなく、識別に要する時間を短縮することを目
的とするものである。
発明の構成
本発明は、各カテゴリ毎の複数個の標準パター
ンを代表する代表標準パターンを記憶する代表標
準パターン記憶手段と、入力信号の特徴パターン
と代表標準パターンとのマツチング計算を行う前
照合計算手段と、前照合計算手段の結果のうち距
離の近いものj個の代表標準パターンに対応する
カテゴリコード及び付帯する距離を出力する前照
合手段を備えたパターン認識装置であり、カテゴ
リ毎の複数個の標準パターンのうち代表標準パタ
ーンと入力信号の特徴パターンとの照合を予め行
つて、複数個の標準パターンとのマツチング計算
を行うカテゴリの数を減少させることにより、各
カテゴリ毎に複数個の標準パターンと照合するこ
とで得られる識別率の改善効果を維持しつつ、ま
た、標準パターンの記憶容量を増すことなく、識
別に要する時間を短縮できるものである。
ンを代表する代表標準パターンを記憶する代表標
準パターン記憶手段と、入力信号の特徴パターン
と代表標準パターンとのマツチング計算を行う前
照合計算手段と、前照合計算手段の結果のうち距
離の近いものj個の代表標準パターンに対応する
カテゴリコード及び付帯する距離を出力する前照
合手段を備えたパターン認識装置であり、カテゴ
リ毎の複数個の標準パターンのうち代表標準パタ
ーンと入力信号の特徴パターンとの照合を予め行
つて、複数個の標準パターンとのマツチング計算
を行うカテゴリの数を減少させることにより、各
カテゴリ毎に複数個の標準パターンと照合するこ
とで得られる識別率の改善効果を維持しつつ、ま
た、標準パターンの記憶容量を増すことなく、識
別に要する時間を短縮できるものである。
また本発明は、各カテゴリ毎の複数個の標準パ
ターンを代表する代表標準パターンを記憶する代
表標準パターン記憶手段と、入力信号の特徴パタ
ーンと代表標準パターンとのマツチング計算を行
う前照合計算手段と、前照合計算手段の結果のう
ち最小距離が予め定めた閾値よりも小さい時は最
小距離を与える代表標準パターンに対応するカテ
ゴリコードを識別結果として出力し、前記最小距
離が前記閾値よりも大きい場合は距離の最小のも
のj個(j2)の代表標準パターンに対応する
カテゴリコード及び付帯する距離を出力する前照
合手段と、前照合手段の出力が1つのカテゴリコ
ードのみの場合はカテゴリコードをそのまま識別
結果として出力し、複数個のカテゴリコードと付
帯する距離の場合は該当するカテゴリ毎に代表標
準パターン以外の標準パターン群と入力信号の特
徴パターンのマツチング計算を行わせる為の信号
を出力するゲート手段を備えたパターン認識装置
であり、カテゴリ毎の複数個の標準パターンのう
ち代表標準パターンと入力信号の特徴パターンと
の照合を予め行つて、複数個の標準パターンとの
マツチング計算を行うカテゴリの数を減少させる
ことにより、各カテゴリ毎に複数個の標準パター
ンと照合することで得られる識別率の改善効果を
維持しつつ、また、標準パターンの記憶容量を増
すことなく、識別に要する時間を短縮できるもの
である。
ターンを代表する代表標準パターンを記憶する代
表標準パターン記憶手段と、入力信号の特徴パタ
ーンと代表標準パターンとのマツチング計算を行
う前照合計算手段と、前照合計算手段の結果のう
ち最小距離が予め定めた閾値よりも小さい時は最
小距離を与える代表標準パターンに対応するカテ
ゴリコードを識別結果として出力し、前記最小距
離が前記閾値よりも大きい場合は距離の最小のも
のj個(j2)の代表標準パターンに対応する
カテゴリコード及び付帯する距離を出力する前照
合手段と、前照合手段の出力が1つのカテゴリコ
ードのみの場合はカテゴリコードをそのまま識別
結果として出力し、複数個のカテゴリコードと付
帯する距離の場合は該当するカテゴリ毎に代表標
準パターン以外の標準パターン群と入力信号の特
徴パターンのマツチング計算を行わせる為の信号
を出力するゲート手段を備えたパターン認識装置
であり、カテゴリ毎の複数個の標準パターンのう
ち代表標準パターンと入力信号の特徴パターンと
の照合を予め行つて、複数個の標準パターンとの
マツチング計算を行うカテゴリの数を減少させる
ことにより、各カテゴリ毎に複数個の標準パター
ンと照合することで得られる識別率の改善効果を
維持しつつ、また、標準パターンの記憶容量を増
すことなく、識別に要する時間を短縮できるもの
である。
実施例の説明
第2図は、本発明における音声パターン認識装
置の第1の実施例の構成図を示すものである。
置の第1の実施例の構成図を示すものである。
第2図において、11は特徴抽出部、12は代
表標準パターン記憶部、13は標準パターン記憶
部、14は前照合計算部、15は前照合部、16
は計算部、17は平均部、18は識別部である。
表標準パターン記憶部、13は標準パターン記憶
部、14は前照合計算部、15は前照合部、16
は計算部、17は平均部、18は識別部である。
以上のように構成された本実施例の音声パター
ン認識装置について、以下その動作を説明する。
ン認識装置について、以下その動作を説明する。
入力信号(音声)は特徴抽出部11において、
周波数分析され、400Hzから5KHzまでを対数軸上
で等分割された16ケの周波数帯域のそれぞれの電
力を表わす16次元ベクトルの時系列Ai=(ai1、
ai2、ai3、…、ai16)に変換され、前照合計算部1
4で、代表標準パターン記憶部12で記憶されて
いる代表標準パターンとマツチング計算される。
ところで、代表標準パターン記憶部12で記憶さ
れている代表標準パターンとは、各カテゴリ毎の
複数個の標準パターン(16次元ベクトルの時系
列)を代表する標準パターン(16次元ベクトルの
時系列)であつて、例えば10ケのカテゴリについ
て、各カテゴリ毎に7ケの標準パターン(16次元
ベクトルの時系列)を持つ場合には7ケの標準パ
ターン(16次元ベクトルの時系列)の中で残りの
6ケの標準パターンとの距離が最も平均的な1つ
の標準パターン(16次元ベクトルの時系列)(例
えば、各標準パターンについて、1標準パターン
がもつ他の標準パターンとの距離の最大値のう
ち、それらの最小値を与える標準パターンを選ぶ
(ミニーマツクス法)が代表標準パターンm=
(m 1、m 2、…、m 16)(m=1、2、…、10;カ
テ
ゴリ番号)となる。代表標準パターン記憶部12
では、カテゴリ数だけ、すなわち10ケの前記代表
標準パターンm(m=1、2、…、10)が記憶
されている。前照合計算部14では、代表標準パ
ターン記憶部12で記憶されている前記代表標準
パターンm(m=1、2、…、10)と、特徴抽
出部11で得られた特徴パターン(16次元ベクト
ルの時系列)Aiについて、動的計画法を用いて市
街距離を計算する。前照合部15では、10個の代
表標準パターンm(m=1、2、…、10)に対
しての前照合計算部14で得られた市街距離l1、
l2、…、l10のうち、距離の近いもの5ケについ
て、それらを与える代表標準パターンに対応した
カテゴリコード及び付帯する市街距離を出力す
る。計算部16では、10ケのカテゴリについて、
標準パターン記憶部13で記憶されている各カテ
ゴリ6ケずつの標準パターン(16次元ベクトルの
時系列)のうち、前照合部15で得られた5ケの
カテゴリコードに対応したそれぞれ6ケの標準パ
ターン(16次元ベクトルの時系列)と、特徴抽出
部11で得られた特徴パターン(16次元ベクトル
の時系列)Aiについて、動的計画法を用いて市街
距離を計算する。ところで、標準パターン記憶部
13で記憶されている標準パターンとは、各カテ
ゴリ毎の複数個の標準パターン(16次元ベクトル
の時系列)のうち、前記代表パターン(16次元ベ
クトルの時系列)を除いた残りの6ケの標準パタ
ーン(16次元ベクトルの時系列)Bm 1、Bm 2、…、
Bm 6(m=1、2、…、10)である。すなわち、各
カテゴリについて、標準パターンは、1つの代表
標準パターンmと6ケの標準パターンBm o(n=
1、2、…、6)の合計7ケの標準パターンが存
在する。標準パターン記憶部13では、各カテゴ
リについて、すなわち10ケのカテゴリについて、
6ケの前記標準パターン(16次元ベクトルの時系
列)Bm o(n=1、2、…、6;m=1、2、10)
が記憶されている。平均部17では、前照合部1
5で得られた5ケのカテゴリについて、前照合計
算部14で得られた市街距離(前照合部15より
入力されたもの)と、同一カテゴリについて計算
部16で得られた6ケの市街距離の相加平均Lm
を求めて、各カテゴリに対応した標準パターン群
と前記特徴パターン(16次元ベクトルの時系列)
との平均距離とする。識別部18では、前照合部
15で得られた5ケのカテゴリに対応した標準パ
ターン群について、平均部17で求めた5ケの平
均距離の最も近い標準パターン群に対応するカテ
ゴリコードを識別して、識別結果として出力す
る。
周波数分析され、400Hzから5KHzまでを対数軸上
で等分割された16ケの周波数帯域のそれぞれの電
力を表わす16次元ベクトルの時系列Ai=(ai1、
ai2、ai3、…、ai16)に変換され、前照合計算部1
4で、代表標準パターン記憶部12で記憶されて
いる代表標準パターンとマツチング計算される。
ところで、代表標準パターン記憶部12で記憶さ
れている代表標準パターンとは、各カテゴリ毎の
複数個の標準パターン(16次元ベクトルの時系
列)を代表する標準パターン(16次元ベクトルの
時系列)であつて、例えば10ケのカテゴリについ
て、各カテゴリ毎に7ケの標準パターン(16次元
ベクトルの時系列)を持つ場合には7ケの標準パ
ターン(16次元ベクトルの時系列)の中で残りの
6ケの標準パターンとの距離が最も平均的な1つ
の標準パターン(16次元ベクトルの時系列)(例
えば、各標準パターンについて、1標準パターン
がもつ他の標準パターンとの距離の最大値のう
ち、それらの最小値を与える標準パターンを選ぶ
(ミニーマツクス法)が代表標準パターンm=
(m 1、m 2、…、m 16)(m=1、2、…、10;カ
テ
ゴリ番号)となる。代表標準パターン記憶部12
では、カテゴリ数だけ、すなわち10ケの前記代表
標準パターンm(m=1、2、…、10)が記憶
されている。前照合計算部14では、代表標準パ
ターン記憶部12で記憶されている前記代表標準
パターンm(m=1、2、…、10)と、特徴抽
出部11で得られた特徴パターン(16次元ベクト
ルの時系列)Aiについて、動的計画法を用いて市
街距離を計算する。前照合部15では、10個の代
表標準パターンm(m=1、2、…、10)に対
しての前照合計算部14で得られた市街距離l1、
l2、…、l10のうち、距離の近いもの5ケについ
て、それらを与える代表標準パターンに対応した
カテゴリコード及び付帯する市街距離を出力す
る。計算部16では、10ケのカテゴリについて、
標準パターン記憶部13で記憶されている各カテ
ゴリ6ケずつの標準パターン(16次元ベクトルの
時系列)のうち、前照合部15で得られた5ケの
カテゴリコードに対応したそれぞれ6ケの標準パ
ターン(16次元ベクトルの時系列)と、特徴抽出
部11で得られた特徴パターン(16次元ベクトル
の時系列)Aiについて、動的計画法を用いて市街
距離を計算する。ところで、標準パターン記憶部
13で記憶されている標準パターンとは、各カテ
ゴリ毎の複数個の標準パターン(16次元ベクトル
の時系列)のうち、前記代表パターン(16次元ベ
クトルの時系列)を除いた残りの6ケの標準パタ
ーン(16次元ベクトルの時系列)Bm 1、Bm 2、…、
Bm 6(m=1、2、…、10)である。すなわち、各
カテゴリについて、標準パターンは、1つの代表
標準パターンmと6ケの標準パターンBm o(n=
1、2、…、6)の合計7ケの標準パターンが存
在する。標準パターン記憶部13では、各カテゴ
リについて、すなわち10ケのカテゴリについて、
6ケの前記標準パターン(16次元ベクトルの時系
列)Bm o(n=1、2、…、6;m=1、2、10)
が記憶されている。平均部17では、前照合部1
5で得られた5ケのカテゴリについて、前照合計
算部14で得られた市街距離(前照合部15より
入力されたもの)と、同一カテゴリについて計算
部16で得られた6ケの市街距離の相加平均Lm
を求めて、各カテゴリに対応した標準パターン群
と前記特徴パターン(16次元ベクトルの時系列)
との平均距離とする。識別部18では、前照合部
15で得られた5ケのカテゴリに対応した標準パ
ターン群について、平均部17で求めた5ケの平
均距離の最も近い標準パターン群に対応するカテ
ゴリコードを識別して、識別結果として出力す
る。
以上の第1の実施例の動作をフローチヤートに
表わすと第3図の様になる。同図において、20
は第4図の入力信号を表し、21は第2図の特徴
抽出部11の動作、22は第2図の前照合計算部
14の動作、24は第2図の前照合部15の動
作、26は第2図の計算部16の動作、27は第
2図の平均部17の動作、28〜29は第2図の
識別部18の動作を表している。同図において、
例えば、カテゴリとして“0”〜“9”までの数
字音声が割当てられている場合に、入力音声とし
て“ゼロ”が入力されると、21で特徴抽出して
入力特徴パターンが生成され、入力特徴パターン
とカテゴリ“0”〜“9”に対応した代表標準パ
ターン(例えば、前記ミニーマツクス法で選択さ
れる)とのマツチング計算が22でなされ、24
で距離の近いもの5ケについて、それぞれ対応す
るカテゴリ例えば“0”、“3”、“6”、“7”、
“9”を識別する。そして、26で5ケのカテゴ
リ“0”、“3”、“6”、“7”、“9”に対応した
標
準パターン群とのマツチング計算を行い、5ケの
カテゴリ“0”、“3”、“6”、“7”、“9”の各
々
について、5ケの各カテゴリが対応する標準パタ
ーン群と入力特徴パターンとの平均距離を27で
求める。28では、前記平均距離の最小値を与え
るカテゴリ例えば“0”を識別し、カテゴリコー
ド“0”を出力する。以上の様な手順で入力音声
が識別される。
表わすと第3図の様になる。同図において、20
は第4図の入力信号を表し、21は第2図の特徴
抽出部11の動作、22は第2図の前照合計算部
14の動作、24は第2図の前照合部15の動
作、26は第2図の計算部16の動作、27は第
2図の平均部17の動作、28〜29は第2図の
識別部18の動作を表している。同図において、
例えば、カテゴリとして“0”〜“9”までの数
字音声が割当てられている場合に、入力音声とし
て“ゼロ”が入力されると、21で特徴抽出して
入力特徴パターンが生成され、入力特徴パターン
とカテゴリ“0”〜“9”に対応した代表標準パ
ターン(例えば、前記ミニーマツクス法で選択さ
れる)とのマツチング計算が22でなされ、24
で距離の近いもの5ケについて、それぞれ対応す
るカテゴリ例えば“0”、“3”、“6”、“7”、
“9”を識別する。そして、26で5ケのカテゴ
リ“0”、“3”、“6”、“7”、“9”に対応した
標
準パターン群とのマツチング計算を行い、5ケの
カテゴリ“0”、“3”、“6”、“7”、“9”の各
々
について、5ケの各カテゴリが対応する標準パタ
ーン群と入力特徴パターンとの平均距離を27で
求める。28では、前記平均距離の最小値を与え
るカテゴリ例えば“0”を識別し、カテゴリコー
ド“0”を出力する。以上の様な手順で入力音声
が識別される。
第4図は、第2図で示された本発明の第1の実
施例の機能別ブロツクを具体的な回路ブロツクで
表わしたものである。
施例の機能別ブロツクを具体的な回路ブロツクで
表わしたものである。
第4図において、11は特徴抽出部で、第2図
で示された特徴抽出部11に対応する。110は
マイク、111はアンプである。1120〜11
215は帯域フイルタ(B.P.F.)で、400Hzから
5KHzまで約1/4オクターブ間隔で中心周波数が並
んでいる。112は前記B.P.F.1120〜112
15で構成されるB.P.F.バンクである。113は
平滑部、114はマルチプレクサ、115はA/
D変換器である。以上の要素により特徴抽出部1
1は構成される。
で示された特徴抽出部11に対応する。110は
マイク、111はアンプである。1120〜11
215は帯域フイルタ(B.P.F.)で、400Hzから
5KHzまで約1/4オクターブ間隔で中心周波数が並
んでいる。112は前記B.P.F.1120〜112
15で構成されるB.P.F.バンクである。113は
平滑部、114はマルチプレクサ、115はA/
D変換器である。以上の要素により特徴抽出部1
1は構成される。
12はROMで構成される代表標準パターン記
憶部で、第2図で示された代表標準パターン記憶
部12に対応する。13はROMで構成される標
準パターン記憶部で、第2図で示された標準パタ
ーン記憶部13に対応する。
憶部で、第2図で示された代表標準パターン記憶
部12に対応する。13はROMで構成される標
準パターン記憶部で、第2図で示された標準パタ
ーン記憶部13に対応する。
14は前照合計算部で、第2図で示された前照
合計算部14に対応する。140はRAMアレー
より成る入力バツフア、141は信号処理LSI
(松下電器製MN1263)、142は制御部であり、
これらの要素により前照合計算部14は構成され
る。
合計算部14に対応する。140はRAMアレー
より成る入力バツフア、141は信号処理LSI
(松下電器製MN1263)、142は制御部であり、
これらの要素により前照合計算部14は構成され
る。
15は前照合部で、第2図で示された前照合部
15に対応する。150は制御部、151は
RAMアレー、152はコンパレータ、153は
カウンタであり、これらの要素により前照合部1
5は構成される。
15に対応する。150は制御部、151は
RAMアレー、152はコンパレータ、153は
カウンタであり、これらの要素により前照合部1
5は構成される。
16は計算部で、第2図で示された計算部16
に対応する。160は制御部、161は信号処理
LSI(松下電器製MN1263)であり、これらの要
素により計算部16は構成される。
に対応する。160は制御部、161は信号処理
LSI(松下電器製MN1263)であり、これらの要
素により計算部16は構成される。
17は平均部で、第2図で示された平均部17
に対応する。170は制御部、171はRAMア
レー、172は加算器、173は除算器であつ
て、これらの要素により平均部17は構成され
る。
に対応する。170は制御部、171はRAMア
レー、172は加算器、173は除算器であつ
て、これらの要素により平均部17は構成され
る。
18は識別部で、第2図で示された識別部18
に対応する。180は制御部、181はRAMア
レー、182はコンパレータであつて、これらの
要素により識別部18は構成される。
に対応する。180は制御部、181はRAMア
レー、182はコンパレータであつて、これらの
要素により識別部18は構成される。
以上の様に構成された第1の実施例のパターン
認識装置について、以下その動作を説明する。
認識装置について、以下その動作を説明する。
入力音声(入力パターン)はマイク110で電
器信号に変換され、A/D変換器115において
A/D変換された後で良好な信号電力対量子化雑
音電力比(量子化SN比)を得るように適当なレ
ベルまで、アンプ111で増幅される。増幅され
た前記電気信号は、B.P.F.バンク112で、各B.
P.F.に対応した周波数帯域をもつ帯域信号に分割
される。次に平滑部113で、前記帯域信号電力
をそれぞれに比例した電圧(各チヤンネル電圧)
に変換される。そして、マルチプレクサ114
で、時間的に並列に与えられる前記各チヤネル電
圧のそれぞれが、一定時間間隔でサンプリングさ
れて時間的に直列な出力となり、A/D変換器1
15でデイジタル量に変換され、前記入力音声
(入力パターン)に対応した16次元ベクトルの時
系列(特徴パターン、以下、特徴パターンと呼
ぶ); A=A1、A2、…、Ai、…、AI) ……(1) ただしAi=(ai1、ai2、ai3、…、ai16) ……(1)′ が生成される。(以下、ある時刻iのことを第i
フレームと呼ぶ)この様にして生成されて前記特
徴パターンAは、以下で示す如く、前照合計算部
14で、代表標準パターンと記憶部12で記憶さ
れている代表標準パターンとマツチング計算され
る。ところで、代表標準パターン記憶部12で記
憶されている代表標準パターンとは、各カテゴリ
毎の複数個の標準パターン(16次元ベクトルの時
系列)を代表する標準パターン(16次元ベクトル
の時系列)であつて、例えば10ケのカテゴリにつ
いて、各カテゴリ毎に7ケの標準パターン(16次
元ベクトルの時系列)を持つ場合には7ケの標準
パターン(16次元ベクトルの時系列)の中で残り
の6ケの標準パターンとの距離が最も平均的に近
い1つの標準パターン(16次元ベクトルの時系
列)(例えば、各標準パターンについて、1標準
パターンがもつ他の標準パターンとの距離の最大
値のうち、それらの最小値を与える標準パターン
を選ぶ(ミニーマツクス法))が代表標準パター
ンm=(m 1、m 2、…、m 16)(m=1、2、…、
10;カテゴリ番号)となる。
器信号に変換され、A/D変換器115において
A/D変換された後で良好な信号電力対量子化雑
音電力比(量子化SN比)を得るように適当なレ
ベルまで、アンプ111で増幅される。増幅され
た前記電気信号は、B.P.F.バンク112で、各B.
P.F.に対応した周波数帯域をもつ帯域信号に分割
される。次に平滑部113で、前記帯域信号電力
をそれぞれに比例した電圧(各チヤンネル電圧)
に変換される。そして、マルチプレクサ114
で、時間的に並列に与えられる前記各チヤネル電
圧のそれぞれが、一定時間間隔でサンプリングさ
れて時間的に直列な出力となり、A/D変換器1
15でデイジタル量に変換され、前記入力音声
(入力パターン)に対応した16次元ベクトルの時
系列(特徴パターン、以下、特徴パターンと呼
ぶ); A=A1、A2、…、Ai、…、AI) ……(1) ただしAi=(ai1、ai2、ai3、…、ai16) ……(1)′ が生成される。(以下、ある時刻iのことを第i
フレームと呼ぶ)この様にして生成されて前記特
徴パターンAは、以下で示す如く、前照合計算部
14で、代表標準パターンと記憶部12で記憶さ
れている代表標準パターンとマツチング計算され
る。ところで、代表標準パターン記憶部12で記
憶されている代表標準パターンとは、各カテゴリ
毎の複数個の標準パターン(16次元ベクトルの時
系列)を代表する標準パターン(16次元ベクトル
の時系列)であつて、例えば10ケのカテゴリにつ
いて、各カテゴリ毎に7ケの標準パターン(16次
元ベクトルの時系列)を持つ場合には7ケの標準
パターン(16次元ベクトルの時系列)の中で残り
の6ケの標準パターンとの距離が最も平均的に近
い1つの標準パターン(16次元ベクトルの時系
列)(例えば、各標準パターンについて、1標準
パターンがもつ他の標準パターンとの距離の最大
値のうち、それらの最小値を与える標準パターン
を選ぶ(ミニーマツクス法))が代表標準パター
ンm=(m 1、m 2、…、m 16)(m=1、2、…、
10;カテゴリ番号)となる。
代表標準パターン記憶部12では、カテゴリ数
だけ、すなわち10ケの前記代表標準パターンm
(m=1、2、…、10)と対応するカテゴリコー
ドが記憶されている。
だけ、すなわち10ケの前記代表標準パターンm
(m=1、2、…、10)と対応するカテゴリコー
ドが記憶されている。
また、標準パターン記憶部13では、各カテゴ
リに対する6ケの標準パターンBm 1、Bm 2、…、Bm 6
が記憶されている。
リに対する6ケの標準パターンBm 1、Bm 2、…、Bm 6
が記憶されている。
さて、前記特徴パターンAは、前照合計算部1
4の入力バツフア140に一時的に保持される。
4の入力バツフア140に一時的に保持される。
制御部142は、141で示された信号処理
LSI(MN1263)上で、前記特徴パターンAと前
記代表標準パターンmに関する両者のパターン
間距離: ln=‖A−m‖(m=1、2、3、…、10)
……(2) =g(I、Jn)/I+Jn ……(3) ただし g(O、O)=d(O、O) ……(4) g(x、y)=mind(x、y)+g(x、y+1) 2d(x、y)+g(x−1、y−1) d(x、y)+g(x−1、y) ……(5) d(x、y)=16 〓R=1 |aik−m jk| ……(6) aik:前記特徴パターンAの第iフレーム目の第
k番目のB.P.F.出力電力値m jk :前記標準パターンmの第jフレーム目の第
k番目のベクトル要素(第kチヤネル目の要
素) I/Jn・y−2<x<I/Jn・y+2 ……(7) I:前記特徴パターンの総フレーム数 Jn:前記代表標準パターンの総フレーム数 を計算する。
LSI(MN1263)上で、前記特徴パターンAと前
記代表標準パターンmに関する両者のパターン
間距離: ln=‖A−m‖(m=1、2、3、…、10)
……(2) =g(I、Jn)/I+Jn ……(3) ただし g(O、O)=d(O、O) ……(4) g(x、y)=mind(x、y)+g(x、y+1) 2d(x、y)+g(x−1、y−1) d(x、y)+g(x−1、y) ……(5) d(x、y)=16 〓R=1 |aik−m jk| ……(6) aik:前記特徴パターンAの第iフレーム目の第
k番目のB.P.F.出力電力値m jk :前記標準パターンmの第jフレーム目の第
k番目のベクトル要素(第kチヤネル目の要
素) I/Jn・y−2<x<I/Jn・y+2 ……(7) I:前記特徴パターンの総フレーム数 Jn:前記代表標準パターンの総フレーム数 を計算する。
前照合部15では、先ず、10ケの前記代表標準
パターンn(m=1、2、3、…、10)に対し
て前記前照合部14で得らてた距離l1、l2、…、
l10をRAMアレー151で一時的に保持する。制
御部150は、先ず、カウンタ153の内容qを
クリアしてq=Oとし、前記RAMアレー151
で保持されている距離l1、l2、…、l10を順次コン
パレータ152上で比較して最小距離を求め、前
記代表標準パターン記憶部12で記憶されている
10ケの代表標準パターンのうち、前記最小距離を
与える代表標準パターンと同じカテゴリの6ケの
標準パターンBm 1 、m 2、…、m 6を標準パターン記
憶部13から読み出して計算部(D.S.P.)16に
送出すると同時に、その最小距離を平均部17の
RAMアレー171に送出し、最小距離が保時さ
れている前記RAMアレー151の番地の内容
を、例えば(FFFF)16でクリアして(ここで
(…)16は16進数であることを示す)、カウンタ1
53の内容qをカウントアツプしてq=q+1と
する。制御部150は、以下同様にして、カウン
タ153の内容qがq=5となるまで、コンパレ
ータ152上で前記RAMアレー151で保持さ
れている距離の最小値を求め、前記代表標準パタ
ーン記憶部12で記憶されている10ケの代表標準
パターンのうち、前記最小距離を与える代表標準
パターンと同じカテゴリの6ケの標準パターン
Bm 1、Bm 2、…、Bm 6を標準パターン記憶部13から
読み出して計算部(D.S.P.)16に送出すると同
時に、その最小距離を平均部17のRAMアレー
171に送出し、最小距離が保持されている前記
RAMアレー151の番地の内容をクリアして、
カウンタ153の内容qをカウントアツプすると
いう動作をくり返す。
パターンn(m=1、2、3、…、10)に対し
て前記前照合部14で得らてた距離l1、l2、…、
l10をRAMアレー151で一時的に保持する。制
御部150は、先ず、カウンタ153の内容qを
クリアしてq=Oとし、前記RAMアレー151
で保持されている距離l1、l2、…、l10を順次コン
パレータ152上で比較して最小距離を求め、前
記代表標準パターン記憶部12で記憶されている
10ケの代表標準パターンのうち、前記最小距離を
与える代表標準パターンと同じカテゴリの6ケの
標準パターンBm 1 、m 2、…、m 6を標準パターン記
憶部13から読み出して計算部(D.S.P.)16に
送出すると同時に、その最小距離を平均部17の
RAMアレー171に送出し、最小距離が保時さ
れている前記RAMアレー151の番地の内容
を、例えば(FFFF)16でクリアして(ここで
(…)16は16進数であることを示す)、カウンタ1
53の内容qをカウントアツプしてq=q+1と
する。制御部150は、以下同様にして、カウン
タ153の内容qがq=5となるまで、コンパレ
ータ152上で前記RAMアレー151で保持さ
れている距離の最小値を求め、前記代表標準パタ
ーン記憶部12で記憶されている10ケの代表標準
パターンのうち、前記最小距離を与える代表標準
パターンと同じカテゴリの6ケの標準パターン
Bm 1、Bm 2、…、Bm 6を標準パターン記憶部13から
読み出して計算部(D.S.P.)16に送出すると同
時に、その最小距離を平均部17のRAMアレー
171に送出し、最小距離が保持されている前記
RAMアレー151の番地の内容をクリアして、
カウンタ153の内容qをカウントアツプすると
いう動作をくり返す。
計算部16では、制御部160は、161で示
された信号処理LSI(MN1263)上で、前記前照
合部より送られてきた5ケのカテゴリに関して、
各カテゴリあたり6ケの標準パターンと、前記
RAMアレー141で保持されている前記特徴パ
ターンについて、前記式(2)〜式(7)で示される前記
パターン間距離を求め、前記RAMアレー171
に送出する。
された信号処理LSI(MN1263)上で、前記前照
合部より送られてきた5ケのカテゴリに関して、
各カテゴリあたり6ケの標準パターンと、前記
RAMアレー141で保持されている前記特徴パ
ターンについて、前記式(2)〜式(7)で示される前記
パターン間距離を求め、前記RAMアレー171
に送出する。
ところで、標準パターン記憶部12で記憶され
ている標準パターンとは、各カテゴリ毎の複数個
の標準パターン(16次元ベクトルの時系列)のう
ち、前記代表標準パターン(16次元ベクトルの時
系列)を除いた残るの6ケの標準パターン(16次
元ベクトルの時系列)Bm 1、Bm 2、…、Bm 6(m=1、
2、…、10)である。すなわち、各カテゴリにつ
いて、標準パターンは、1つの代表標準パターン
Bmと6ケの標準パターンBm o(n=1、2、…、
6)の合計7ケの標準パターンが存在する。標準
パターン記憶部12では、各カテゴリについて、
すなわち10ケのカテゴリについて、6ケの前記標
準パターン(16次元ベクトルの時系列)Bm o(n=
1、2、…、6;m=1、2、10)が記憶されて
いる。
ている標準パターンとは、各カテゴリ毎の複数個
の標準パターン(16次元ベクトルの時系列)のう
ち、前記代表標準パターン(16次元ベクトルの時
系列)を除いた残るの6ケの標準パターン(16次
元ベクトルの時系列)Bm 1、Bm 2、…、Bm 6(m=1、
2、…、10)である。すなわち、各カテゴリにつ
いて、標準パターンは、1つの代表標準パターン
Bmと6ケの標準パターンBm o(n=1、2、…、
6)の合計7ケの標準パターンが存在する。標準
パターン記憶部12では、各カテゴリについて、
すなわち10ケのカテゴリについて、6ケの前記標
準パターン(16次元ベクトルの時系列)Bm o(n=
1、2、…、6;m=1、2、10)が記憶されて
いる。
さて、平均部17では、制御部170は、前記
特徴パターンとの距離の近い5ケのカテゴリに関
して、前記前照合部15及び前記計算部16から
送られてきて、前記RAMアレー171に保持さ
れている各カテゴリあたり7ケの距離(前記前照
合部15からは1ケ、前記計算部16からは6ケ
の距離が与えられる)に関して、加算器172で
和を求め、除算器173で前記和を7で割つて各
カテゴリの標準パターンと前記特徴パターンとの
相加平均距離Lmを求め、識別部18のRAMアレ
ー181に5ケの前記相加平均と、対応するカテ
ゴリコードを送出する。
特徴パターンとの距離の近い5ケのカテゴリに関
して、前記前照合部15及び前記計算部16から
送られてきて、前記RAMアレー171に保持さ
れている各カテゴリあたり7ケの距離(前記前照
合部15からは1ケ、前記計算部16からは6ケ
の距離が与えられる)に関して、加算器172で
和を求め、除算器173で前記和を7で割つて各
カテゴリの標準パターンと前記特徴パターンとの
相加平均距離Lmを求め、識別部18のRAMアレ
ー181に5ケの前記相加平均と、対応するカテ
ゴリコードを送出する。
識別部18では、制御部180は、前記平均部
17から送られてきてRAMアレー181で保持
されている。5ケのカテゴリに対応する5ケの前
記相加平均距離に関して、コンパレータ182に
おいて順次比較し、前記RAMアレー181で保
持されている前記カテゴリコードのうち、前記相
加平均距離の最小値に対応するカテゴリコードを
識別結果として出力する。
17から送られてきてRAMアレー181で保持
されている。5ケのカテゴリに対応する5ケの前
記相加平均距離に関して、コンパレータ182に
おいて順次比較し、前記RAMアレー181で保
持されている前記カテゴリコードのうち、前記相
加平均距離の最小値に対応するカテゴリコードを
識別結果として出力する。
以上のように、本実施例によれば、代表標準パ
ターン記憶部12、前照合計算部14、前照合部
15を設けて、各カテゴリ毎7ケの標準パターン
のうち、先ず、それらを代表する各カテゴリ毎1
つの代表標準パターンと入力信号の特徴パターン
とのマツチング計算を行い、入力信号の特徴パタ
ーンとの距離が近いもの5ケの代表標準パターン
がそれぞれ該当するカテゴリを、10ケのカテゴリ
の中から5ケ選択し、標準パターン群とのマツチ
ング計算の量を半減することにより、各カテゴリ
毎に複数個の標準パターンと照合することで得ら
れる識別率の改善効果を維持しつつ、また、標準
パターンの記憶容量を増すことなく、識別に要す
る時間を短縮することができる。
ターン記憶部12、前照合計算部14、前照合部
15を設けて、各カテゴリ毎7ケの標準パターン
のうち、先ず、それらを代表する各カテゴリ毎1
つの代表標準パターンと入力信号の特徴パターン
とのマツチング計算を行い、入力信号の特徴パタ
ーンとの距離が近いもの5ケの代表標準パターン
がそれぞれ該当するカテゴリを、10ケのカテゴリ
の中から5ケ選択し、標準パターン群とのマツチ
ング計算の量を半減することにより、各カテゴリ
毎に複数個の標準パターンと照合することで得ら
れる識別率の改善効果を維持しつつ、また、標準
パターンの記憶容量を増すことなく、識別に要す
る時間を短縮することができる。
すなわち、本実施例において、カテゴリとして
“0”〜“9”までの数字音声が割当てられ、標
準パターンを1カテゴリあたり7ケもつ場合、1
入力音声あたりの平均フレーム数は約16フレーム
(フレーム周期は25.6msecであるので、前記1入
力音声の平均時間長は25.6msec×16410msec)
であり、第6図で示された前記前照合部14以下
前記識別部18までの処理は、前記入力音声の1
フレームに対して約0.25msec要するので、前記
従来例の場合は、0.25msec×16(フレーム)×7
(標準パターン)×10(カテゴリ)280msec要す
るのに対し、本実施例の場合には、0.25msec×
16フレーム×(10(代表標準パターン)+6(標準パ
ターン)×5(カテゴリ)160msecとなり、従来
例の処理時間を約57%に短縮できる。また、本実
施例での識別率は95%以上を維持しており、実用
上支障のない識別率を得ている。
“0”〜“9”までの数字音声が割当てられ、標
準パターンを1カテゴリあたり7ケもつ場合、1
入力音声あたりの平均フレーム数は約16フレーム
(フレーム周期は25.6msecであるので、前記1入
力音声の平均時間長は25.6msec×16410msec)
であり、第6図で示された前記前照合部14以下
前記識別部18までの処理は、前記入力音声の1
フレームに対して約0.25msec要するので、前記
従来例の場合は、0.25msec×16(フレーム)×7
(標準パターン)×10(カテゴリ)280msec要す
るのに対し、本実施例の場合には、0.25msec×
16フレーム×(10(代表標準パターン)+6(標準パ
ターン)×5(カテゴリ)160msecとなり、従来
例の処理時間を約57%に短縮できる。また、本実
施例での識別率は95%以上を維持しており、実用
上支障のない識別率を得ている。
なお、本実施例においては、入力信号は音声で
あるとしたが、入力信号は音声に限らず、例え
ば、手書文字入力であつても良い。また、入力信
号の特徴パターンとして、400Hz〜5KHz帯域につ
いて周波数分析して16次元ベクトル表現を用いた
が、周波数帯域幅、ベクトルの次数は任意で良
く、更に、周波数分析以外の方法として、自己相
関係数、零交叉数など入力信号の特徴を表現しう
るパラメータであれば良い。更には、入力信号の
特徴パターンと標準パターンのマツチング計算に
動的計画法を用いたが、線形マツチングを用いて
も良くまた、距離尺度としては、市街距離以外
の、ユークリツド距離、マハラノビスの距離等、
両者の距離を表現するあらゆる距離尺度を適用し
うる。
あるとしたが、入力信号は音声に限らず、例え
ば、手書文字入力であつても良い。また、入力信
号の特徴パターンとして、400Hz〜5KHz帯域につ
いて周波数分析して16次元ベクトル表現を用いた
が、周波数帯域幅、ベクトルの次数は任意で良
く、更に、周波数分析以外の方法として、自己相
関係数、零交叉数など入力信号の特徴を表現しう
るパラメータであれば良い。更には、入力信号の
特徴パターンと標準パターンのマツチング計算に
動的計画法を用いたが、線形マツチングを用いて
も良くまた、距離尺度としては、市街距離以外
の、ユークリツド距離、マハラノビスの距離等、
両者の距離を表現するあらゆる距離尺度を適用し
うる。
第5図は、本発明における音声パターン認識装
置の第2の実施例構成図を示すものである。
置の第2の実施例構成図を示すものである。
第5図において、11は特徴抽出部、12は代
表標準パターン記憶部、13は標準パターン記憶
部、14は前照合計算部、15は前照合部、16
は計算部、17は平均部、18は識別部、19は
ゲート部である。
表標準パターン記憶部、13は標準パターン記憶
部、14は前照合計算部、15は前照合部、16
は計算部、17は平均部、18は識別部、19は
ゲート部である。
以上のように構成された本実施例の音声パター
ン認識装置について、以下その動作を説明する。
ン認識装置について、以下その動作を説明する。
入力信号(音声)は、特徴抽出部11におい
て、周波数分析され、400Hzから5KHzまでを対数
軸上で等分割された16ケの周波数帯域のそれぞれ
の電力を表わす16次元ベクトルの時系列Ai=ai1、
ai2、ai3、…、ai16)に変換され、前照合計算部1
4で、代表標準パターン記憶部12で記憶されて
いる代表標準パターンとマツチング計算される。
ところで、代表標準パターン記憶部12で記憶さ
れている代表標準パターンとは、各カテゴリ毎の
複数個の標準パターン(16次元ベクトルの時系
列)を代表する標準パターン(16次元ベクトルの
時系列)であつて、例えば10ケのカテゴリについ
て、各カテゴリ毎に7ケの標準パターン(16次元
ベクトルの時系列)を持つ場合には、7ケの標準
パターン(16次元ベクトルの時系列)の中で、残
りの6ケの標準パターンとの距離が最も平均的な
1つの標準パターン(16次元ベクトルの時系列)
(例えば、前記ミニーマツクス法により選択され
る)が代表標準パターンm=(m 1、m 2、…、m 16
)
(m=1、2、…、10;カテゴリ番号)となる。
代表標準パターン記憶部12では、カテゴリ数だ
け、すなわち10ケの前記代表標準パターンm
(m=1、2、…、10)が記憶されている。前照
合計算部14では、代表標準パターン記憶部で記
憶されている前記代表標準パターンm(m=1、
2、…、10)と、特徴抽出部11で得らてた特徴
パターン(16次元ベクトルの時系列)Aiについ
て、動的計画法を用いて市街距離を計算する。前
照合部15では、10ケの代表標準パターンm
(m=1、2、…、10)に対して前照合計算部1
4で得られた市街距離l1、l2、…、l10について、
それらの最小値lnioが予め定められた閾値Lより
も小さければ、最小距離を与える代表標準パター
ンに対応したカテゴリコードのみを出力し、市街
距離ln(m=1、2、…、10)の最小値lnioが閾値
Lよりも大きいか等しい場合には、距離の近いも
の5ケについて、それらを与える代表標準パター
ンに対応したカテゴリコード及び付帯する市街距
離を出力する。ゲート部19では、前照合部15
の出力が、1つのカテゴリコードのみの場合は、
そのままカテゴリコードを識別結果として出力
し、5ケのカテゴリコードと付帯する距離の場合
は、計算部16において、標準パターン記憶部1
3で記憶されている標準パターンのうち、5ケの
カテゴリコードに対応した標準パターン(16次元
ベクトルの時系列)とのマツチング計算を行わせ
る為の信号を出力する。ところで、標準パターン
記憶部13で記憶されている標準パターンとは、
各カテゴリ毎の複数個の標準パターン(16次元ベ
クトルの時系列)のうち、前記代表標準パターン
(16次元ベクトルの時系列)を除いた残りの6ケ
の標準パターン(16次元ベクトルの時系列)Bm 1、
Bm 2、…、Bm 6(m=1、2、…、10)である。す
なわち、各カテゴリについて、標準パターンは、
1つの代表標準パターンmと6ケの標準パター
ンBm o(n=1、2、…、6)の合計7個の標準パ
ターンが存在する。標準パターン記憶部13で
は、各カテゴリについて、すなわち10ケのカテゴ
リについて、6ケの前記標準パターン(16次元ベ
クトルの時系列)Bm o(n=1、2、…、10)が記
憶されている。計算部16では、ゲート部19よ
り、計算駆動信号が入力された場合のみ、10ケの
カテゴリについて標準パターン記憶部12で記憶
されている各カテゴリ6ケずつの標準パターン
(16次元ベクトルの時系列)のうち、前照合部1
5で得られた5ケのカテゴリコードに対応したそ
れぞれ6ケの標準パターン(16次元ベクトルの時
系列)と、特徴抽出部11で得られた特徴パター
ン(16次元ベクトルの時系列)Aiについて、動的
計画法を用いて市街距離を計算する。平均部17
では、前照合部15で得られた5ケのカテゴリに
ついて、各カテゴリの代表標準パターン(16次元
ベクトルの時系列)と前記特徴パターン(16次元
ベクトルの時系列)Aiとの市街距離(前照合部1
5より入力されたもの)と、同一カテゴリについ
て、計算部16で得られた6ケの市街距離のう
ち、距離の小さいもの3ケの相加平均Lmを求め
て、各カテゴリに対応した標準パターン群と前記
特徴パターン(16次元ベクトルの時系列)との平
均距離とする。識別部18では、前照合部15で
得られた5ケのカテゴリに対応した標準パターン
群について、平均部17で求めた5ケの平均距離
の最も近い標準パターン群に対応するカテゴリコ
ードを識別して、識別結果として出力する。
て、周波数分析され、400Hzから5KHzまでを対数
軸上で等分割された16ケの周波数帯域のそれぞれ
の電力を表わす16次元ベクトルの時系列Ai=ai1、
ai2、ai3、…、ai16)に変換され、前照合計算部1
4で、代表標準パターン記憶部12で記憶されて
いる代表標準パターンとマツチング計算される。
ところで、代表標準パターン記憶部12で記憶さ
れている代表標準パターンとは、各カテゴリ毎の
複数個の標準パターン(16次元ベクトルの時系
列)を代表する標準パターン(16次元ベクトルの
時系列)であつて、例えば10ケのカテゴリについ
て、各カテゴリ毎に7ケの標準パターン(16次元
ベクトルの時系列)を持つ場合には、7ケの標準
パターン(16次元ベクトルの時系列)の中で、残
りの6ケの標準パターンとの距離が最も平均的な
1つの標準パターン(16次元ベクトルの時系列)
(例えば、前記ミニーマツクス法により選択され
る)が代表標準パターンm=(m 1、m 2、…、m 16
)
(m=1、2、…、10;カテゴリ番号)となる。
代表標準パターン記憶部12では、カテゴリ数だ
け、すなわち10ケの前記代表標準パターンm
(m=1、2、…、10)が記憶されている。前照
合計算部14では、代表標準パターン記憶部で記
憶されている前記代表標準パターンm(m=1、
2、…、10)と、特徴抽出部11で得らてた特徴
パターン(16次元ベクトルの時系列)Aiについ
て、動的計画法を用いて市街距離を計算する。前
照合部15では、10ケの代表標準パターンm
(m=1、2、…、10)に対して前照合計算部1
4で得られた市街距離l1、l2、…、l10について、
それらの最小値lnioが予め定められた閾値Lより
も小さければ、最小距離を与える代表標準パター
ンに対応したカテゴリコードのみを出力し、市街
距離ln(m=1、2、…、10)の最小値lnioが閾値
Lよりも大きいか等しい場合には、距離の近いも
の5ケについて、それらを与える代表標準パター
ンに対応したカテゴリコード及び付帯する市街距
離を出力する。ゲート部19では、前照合部15
の出力が、1つのカテゴリコードのみの場合は、
そのままカテゴリコードを識別結果として出力
し、5ケのカテゴリコードと付帯する距離の場合
は、計算部16において、標準パターン記憶部1
3で記憶されている標準パターンのうち、5ケの
カテゴリコードに対応した標準パターン(16次元
ベクトルの時系列)とのマツチング計算を行わせ
る為の信号を出力する。ところで、標準パターン
記憶部13で記憶されている標準パターンとは、
各カテゴリ毎の複数個の標準パターン(16次元ベ
クトルの時系列)のうち、前記代表標準パターン
(16次元ベクトルの時系列)を除いた残りの6ケ
の標準パターン(16次元ベクトルの時系列)Bm 1、
Bm 2、…、Bm 6(m=1、2、…、10)である。す
なわち、各カテゴリについて、標準パターンは、
1つの代表標準パターンmと6ケの標準パター
ンBm o(n=1、2、…、6)の合計7個の標準パ
ターンが存在する。標準パターン記憶部13で
は、各カテゴリについて、すなわち10ケのカテゴ
リについて、6ケの前記標準パターン(16次元ベ
クトルの時系列)Bm o(n=1、2、…、10)が記
憶されている。計算部16では、ゲート部19よ
り、計算駆動信号が入力された場合のみ、10ケの
カテゴリについて標準パターン記憶部12で記憶
されている各カテゴリ6ケずつの標準パターン
(16次元ベクトルの時系列)のうち、前照合部1
5で得られた5ケのカテゴリコードに対応したそ
れぞれ6ケの標準パターン(16次元ベクトルの時
系列)と、特徴抽出部11で得られた特徴パター
ン(16次元ベクトルの時系列)Aiについて、動的
計画法を用いて市街距離を計算する。平均部17
では、前照合部15で得られた5ケのカテゴリに
ついて、各カテゴリの代表標準パターン(16次元
ベクトルの時系列)と前記特徴パターン(16次元
ベクトルの時系列)Aiとの市街距離(前照合部1
5より入力されたもの)と、同一カテゴリについ
て、計算部16で得られた6ケの市街距離のう
ち、距離の小さいもの3ケの相加平均Lmを求め
て、各カテゴリに対応した標準パターン群と前記
特徴パターン(16次元ベクトルの時系列)との平
均距離とする。識別部18では、前照合部15で
得られた5ケのカテゴリに対応した標準パターン
群について、平均部17で求めた5ケの平均距離
の最も近い標準パターン群に対応するカテゴリコ
ードを識別して、識別結果として出力する。
以上の第2の実施例の動作をフローチヤートに
表わすと第6図の様になる。同図において、20
は第5図の入力信号を表し、21は第5図の特徴
抽出部11の動作、22は第5図の前照合計算部
14の動作、23〜25は第5図の前照合部15
の動作、26は第5図の計算部16の動作、27
は第5図の平均部17の動作、28〜29は第5
図の識別部18の動作、30は第5図のゲート部
19の動作を表している。同図において、例えば
カテゴリとして“0”〜“9”までの数字音声が
割当てられている場合に、入力音声として“ゼ
ロ”が入力されると、21で特徴抽出して入力特
徴パターンが生成され、入力特徴パターンとカテ
ゴリ“0”〜“9”に対応した代表標準パターン
(例えば、前記ミニーマツクス法で選択される)
とのマツチング計算が22でなされ、23で最小
距離と閾値との比較を行い、最小距離が閾値より
も小さい時には、25で最小距離を与えるカテゴ
リを識別し、最小距離が閾値より大きいか又は等
しい時には、24で距離の近いもの5ケについ
て、それぞれ対応するカテゴリ、例えば、“0”、
“3”、“6”、“7”、“9”を識別する。そして、
30において、第5図のゲート部19への入力で
あるカテゴリコードが1つか又はそれよりも多い
(5ケ)かを判断し、1つだけの場合はそのまま
識別結果として29で出力するが、5ケの場合に
は、26で5ケのカテゴリ“0”、“3”、“6”、
“7”、“9”に対応した標準パターン群とのマツ
チング計算を行い、5ケのカテゴリ“0”、“3”、
“6”、“7”、“9”の各々について、距離の近い
もの3ケずつを平均して、5ケの各カテゴリが対
応する標準パターン群と入力特徴パターンとの平
均距離を27で求める。28では、前記平均距離
の最小値を与えるカテゴリ例えば“0”を識別
し、カテゴリゴード“0”を出力する。以上の様
な手順で入力音声が識別される。
表わすと第6図の様になる。同図において、20
は第5図の入力信号を表し、21は第5図の特徴
抽出部11の動作、22は第5図の前照合計算部
14の動作、23〜25は第5図の前照合部15
の動作、26は第5図の計算部16の動作、27
は第5図の平均部17の動作、28〜29は第5
図の識別部18の動作、30は第5図のゲート部
19の動作を表している。同図において、例えば
カテゴリとして“0”〜“9”までの数字音声が
割当てられている場合に、入力音声として“ゼ
ロ”が入力されると、21で特徴抽出して入力特
徴パターンが生成され、入力特徴パターンとカテ
ゴリ“0”〜“9”に対応した代表標準パターン
(例えば、前記ミニーマツクス法で選択される)
とのマツチング計算が22でなされ、23で最小
距離と閾値との比較を行い、最小距離が閾値より
も小さい時には、25で最小距離を与えるカテゴ
リを識別し、最小距離が閾値より大きいか又は等
しい時には、24で距離の近いもの5ケについ
て、それぞれ対応するカテゴリ、例えば、“0”、
“3”、“6”、“7”、“9”を識別する。そして、
30において、第5図のゲート部19への入力で
あるカテゴリコードが1つか又はそれよりも多い
(5ケ)かを判断し、1つだけの場合はそのまま
識別結果として29で出力するが、5ケの場合に
は、26で5ケのカテゴリ“0”、“3”、“6”、
“7”、“9”に対応した標準パターン群とのマツ
チング計算を行い、5ケのカテゴリ“0”、“3”、
“6”、“7”、“9”の各々について、距離の近い
もの3ケずつを平均して、5ケの各カテゴリが対
応する標準パターン群と入力特徴パターンとの平
均距離を27で求める。28では、前記平均距離
の最小値を与えるカテゴリ例えば“0”を識別
し、カテゴリゴード“0”を出力する。以上の様
な手順で入力音声が識別される。
第7図は、第5図で示された本発明の第2の実
施例の機能別ブロツクを具体的な回路ブロツクで
表わしたものである。
施例の機能別ブロツクを具体的な回路ブロツクで
表わしたものである。
第7図において、11は特徴抽出部で、第5図
で示された特徴抽出部11に対応する。110は
マイク、111はアンプである。1120〜11
215は帯域フイルタ(B.P.F.)で、400Hzから
5KHzまで約1/4オクターブ間隔で中心周波数が並
んでいる。112は前記B.P.F.1120〜112
15で構成されるB.P.F.バンクである。113は
平滑部、114はマルチプレクサ、115はA/
D変換器である。以上の要素により特徴抽出部1
1は構成される。
で示された特徴抽出部11に対応する。110は
マイク、111はアンプである。1120〜11
215は帯域フイルタ(B.P.F.)で、400Hzから
5KHzまで約1/4オクターブ間隔で中心周波数が並
んでいる。112は前記B.P.F.1120〜112
15で構成されるB.P.F.バンクである。113は
平滑部、114はマルチプレクサ、115はA/
D変換器である。以上の要素により特徴抽出部1
1は構成される。
12はROMで構成される代表標準パターン記
憶部で、第5図で示された代表標準パターン記憶
部12に対応する。13はROMで構成される標
準パターン記憶部、第5図で示された標準パター
ン記憶部13に対応する。
憶部で、第5図で示された代表標準パターン記憶
部12に対応する。13はROMで構成される標
準パターン記憶部、第5図で示された標準パター
ン記憶部13に対応する。
14は前照合計算部で、第5図で示された前照
合計算部14に対応する。140はRAMアレー
より成る入力バツフア、141は信号処理LSI
(松下電器製MN1263)、142は制御部であり、
これらの要素により前照合計算部14は構成され
る。
合計算部14に対応する。140はRAMアレー
より成る入力バツフア、141は信号処理LSI
(松下電器製MN1263)、142は制御部であり、
これらの要素により前照合計算部14は構成され
る。
15は前照合部で、第5図で示された前照合部
15に対応する。150は制御部、151は
RAMアレー、152はコンパレータ、153は
カウンタであり、これらの要素により前照合部1
5は構成される。
15に対応する。150は制御部、151は
RAMアレー、152はコンパレータ、153は
カウンタであり、これらの要素により前照合部1
5は構成される。
19はゲート部で、第5図で示されたゲート部
19に対応する。190は制御部、191は論理
ゲートであり、これらの要素によりゲート部19
は構成される。
19に対応する。190は制御部、191は論理
ゲートであり、これらの要素によりゲート部19
は構成される。
17は平均部で、第5図で示された平均部17
に対応する。170は制御部、171はRAMア
レー、172は加算器、173は除算器であつ
て、これらの要素により平均部17は構成され
る。
に対応する。170は制御部、171はRAMア
レー、172は加算器、173は除算器であつ
て、これらの要素により平均部17は構成され
る。
18は識別部で、第5図で示された識別部18
に対応する。180は制御部、181はRAMア
レー、182はコンパレータであつて、これらの
要素により識別部18は構成される。
に対応する。180は制御部、181はRAMア
レー、182はコンパレータであつて、これらの
要素により識別部18は構成される。
以上の様に構成された第2の実施例のパターン
認識装置について、以下その動作を説明する。
認識装置について、以下その動作を説明する。
入力音声(入力パターン)はマイク110で電
気信号に変換され、A/D変換器115において
A/D変換された後で良好な信号電力対量子化雑
音電力比(電子化SN比)を得るように適当なレ
ベルまで、アンプ111で増幅される。増幅され
た前記電気信号は、B.P.F.バンク112で、各B.
P.F.に対応した周波数帯域をもつ帯域信号に分割
される。次に平滑部113で、前記帯域信号電力
のそれぞれに比例した電圧(各チヤネル電圧)に
変換される。そして、マルチプレクサ114で、
時間的に並列に与えられる前記各チヤネル電圧の
それぞれが、一定時間間隔でサンプリングされて
時間的に直列な出力となり、A/D変換器115
でデイジタル量に変換されて、前記入力音声(入
力パターン)に対応した16次元ベクトルの時系列
(特徴パターン、以下、特徴パターンと呼ぶ): A=A1、A2、…、Ai、…、AI) ……(1) ただし Ai=(ai1、ai2、ai3、…、ai16) ……(1) が生成される。(以下、ある時刻iのことを第i
フレームと呼ぶ)この様にして生成された前記特
徴パターンAは、以下で示す如く、前照合計算部
14で、代表標準パターン記憶部12で記憶され
ている代表標準パターンとマツチング計算され
る。ところで、代表標準パターン記憶部12で記
憶されている代表標準パターンとは、各カテゴリ
毎の複数個の標準パターン(16次元ベクトルの時
系列)を代表する標準パターン(16次元ベクトル
の時系列)であつて、例えば10ケのカテゴリにつ
いて、各カテゴリ毎に7ケの標準パターン(16次
元ベクトルの時系列)を持つ場合には7ケの標準
パターン(16次元ベクトルの時系列)の中で残り
の6ケの標準パターンとの距離が最も平均的に近
い1つの標準パターン(16次元ベクトルの時系
列)(例えば、各標準パターンについて、1標準
パターンがもつ他の標準パターンとの距離の最大
値のうち、それらの最小値を与える標準パターン
を選ぶ(ミニーマツクス法))が代表標準パター
ンm=(m 1、m 2、…、m 16)(m=1、2、…、
10;カテゴリ番号)となる。
気信号に変換され、A/D変換器115において
A/D変換された後で良好な信号電力対量子化雑
音電力比(電子化SN比)を得るように適当なレ
ベルまで、アンプ111で増幅される。増幅され
た前記電気信号は、B.P.F.バンク112で、各B.
P.F.に対応した周波数帯域をもつ帯域信号に分割
される。次に平滑部113で、前記帯域信号電力
のそれぞれに比例した電圧(各チヤネル電圧)に
変換される。そして、マルチプレクサ114で、
時間的に並列に与えられる前記各チヤネル電圧の
それぞれが、一定時間間隔でサンプリングされて
時間的に直列な出力となり、A/D変換器115
でデイジタル量に変換されて、前記入力音声(入
力パターン)に対応した16次元ベクトルの時系列
(特徴パターン、以下、特徴パターンと呼ぶ): A=A1、A2、…、Ai、…、AI) ……(1) ただし Ai=(ai1、ai2、ai3、…、ai16) ……(1) が生成される。(以下、ある時刻iのことを第i
フレームと呼ぶ)この様にして生成された前記特
徴パターンAは、以下で示す如く、前照合計算部
14で、代表標準パターン記憶部12で記憶され
ている代表標準パターンとマツチング計算され
る。ところで、代表標準パターン記憶部12で記
憶されている代表標準パターンとは、各カテゴリ
毎の複数個の標準パターン(16次元ベクトルの時
系列)を代表する標準パターン(16次元ベクトル
の時系列)であつて、例えば10ケのカテゴリにつ
いて、各カテゴリ毎に7ケの標準パターン(16次
元ベクトルの時系列)を持つ場合には7ケの標準
パターン(16次元ベクトルの時系列)の中で残り
の6ケの標準パターンとの距離が最も平均的に近
い1つの標準パターン(16次元ベクトルの時系
列)(例えば、各標準パターンについて、1標準
パターンがもつ他の標準パターンとの距離の最大
値のうち、それらの最小値を与える標準パターン
を選ぶ(ミニーマツクス法))が代表標準パター
ンm=(m 1、m 2、…、m 16)(m=1、2、…、
10;カテゴリ番号)となる。
代表標準パターン記憶部12では、カテゴリ数
だけ、すなわち10ケの前記代表標準パターンm
(m=1、2、…、10)と対応するカテゴリコー
ドが記憶されている。
だけ、すなわち10ケの前記代表標準パターンm
(m=1、2、…、10)と対応するカテゴリコー
ドが記憶されている。
また、標準パターン記憶部13では、各カテゴ
リに対する6ケの標準パターンBm 1、Bm 2、…、Bm 6
が記憶されている。
リに対する6ケの標準パターンBm 1、Bm 2、…、Bm 6
が記憶されている。
さて、前記特徴パターンAは、前照合計算部1
4の入力バツフア140に一時的に保持される。
制御部142は、141で示された信号処理LSI
(MN1263)上で、前記特徴パターンAと前記代
表標準パターンmに関する両者のパターン間距
離: ln=‖A−m‖(m=1、2、3、…、10)
……(2) =g(I、Jn)/I+Jn ……(3) ただし g(O、O)=d(O、O) ……(4) g(x、y)=min〓 | | | 〓d(x、y)+g(x、y−1) 2d(x、y)+g(x−1、y−1) d(x、y)+g(x−1、y)〓 | | | 〓 ……(5) d(x、y)=16 〓R=1 |aik−m jk| ……(6) aik:前記特徴パターンAの第iフレーム目の第
k番目のB.P.F.出力電力値m jk :前記標準パターンBmの第jフレーム目の第
k番目のベクトル要素(第kチヤンネル目の要
素) I/Jn・y−2<x<I/Jn・y+2 ……(7) I:前記特徴パターンの総フレーム数 Jn:前記代表標準パターンの総フレーム数 をマイクロプログラムにより計算する。
4の入力バツフア140に一時的に保持される。
制御部142は、141で示された信号処理LSI
(MN1263)上で、前記特徴パターンAと前記代
表標準パターンmに関する両者のパターン間距
離: ln=‖A−m‖(m=1、2、3、…、10)
……(2) =g(I、Jn)/I+Jn ……(3) ただし g(O、O)=d(O、O) ……(4) g(x、y)=min〓 | | | 〓d(x、y)+g(x、y−1) 2d(x、y)+g(x−1、y−1) d(x、y)+g(x−1、y)〓 | | | 〓 ……(5) d(x、y)=16 〓R=1 |aik−m jk| ……(6) aik:前記特徴パターンAの第iフレーム目の第
k番目のB.P.F.出力電力値m jk :前記標準パターンBmの第jフレーム目の第
k番目のベクトル要素(第kチヤンネル目の要
素) I/Jn・y−2<x<I/Jn・y+2 ……(7) I:前記特徴パターンの総フレーム数 Jn:前記代表標準パターンの総フレーム数 をマイクロプログラムにより計算する。
前照合部15では、先ず、10ケの前記代表標準
パターンm(m=1、2、3、…、10)に対し
て前記前照合部14で得られた距離l1、l2、…、
l10をRAMアレー151で一時的に保持する。制
御部150は、先ず、カウンタ153の内容qを
クリアしてq=Oとし、前記RAMアレー151
で保持されている距離l1、l2、…、l10を順次コン
パレータ152上で比較して最小距離を求め、次
に、その最小距離lnioと予め定められた閾値Lと
をコンパレータ152上で比較して、 lnio<L ……(8) であれば、最小距離を与える代表標準パターンに
対応したカテゴリコードのみを出力する。一方、
前記最小距離lnioと前記閾値Lとの間で、 lnioL ……(9) であれば、前記代表標準パターン記憶部12で記
憶されている10ケの代表標準パターンのうち、前
記最小距離を与える代表標準パターンと同じカテ
ゴリの6ケの標準パターンBm 1、Bm 2、…、Bm 6を標
準パターン記憶部13から読み出して計算部
(D.S.P.)16に送出すると同時に、その最小距
離を平均部17のRAMアレー171に送出し、
最小距離が保持されている前記RAMアレーの番
地の内容を、例えば(FFFF)16でクリアして(こ
こで(…)16は16進数であることを示す)、カウン
タ153で内容qをカウントアツプしてq=q+
1とする。制御部150は、以下同様にして、カ
ウンタ153の内容qがq=5となるまで、コン
パレータ152上で前記RAMアレー151で保
持されている距離の最小値を求め、前記代表標準
パターン記憶部12で記憶されている10ケの代表
標準パターンのうち、前記最小距離を与える代表
標準パターンのうち、前記最小距離を与える代表
標準パターンと同じカテゴリの6ケの標準パター
ンBm 1、Bm 2、…、Bm 6を標準パターン記憶部13か
ら読み出して計算部(D.S.P.)16に送出すると
同時に、その最小距離を平均部17のRAMアレ
ー171に送出し、最小距離が保持されている前
記RAMアレーの番地の内容をクリアして、カウ
ンタ153の内容qをカウントアツプするという
動作をくり返す。
パターンm(m=1、2、3、…、10)に対し
て前記前照合部14で得られた距離l1、l2、…、
l10をRAMアレー151で一時的に保持する。制
御部150は、先ず、カウンタ153の内容qを
クリアしてq=Oとし、前記RAMアレー151
で保持されている距離l1、l2、…、l10を順次コン
パレータ152上で比較して最小距離を求め、次
に、その最小距離lnioと予め定められた閾値Lと
をコンパレータ152上で比較して、 lnio<L ……(8) であれば、最小距離を与える代表標準パターンに
対応したカテゴリコードのみを出力する。一方、
前記最小距離lnioと前記閾値Lとの間で、 lnioL ……(9) であれば、前記代表標準パターン記憶部12で記
憶されている10ケの代表標準パターンのうち、前
記最小距離を与える代表標準パターンと同じカテ
ゴリの6ケの標準パターンBm 1、Bm 2、…、Bm 6を標
準パターン記憶部13から読み出して計算部
(D.S.P.)16に送出すると同時に、その最小距
離を平均部17のRAMアレー171に送出し、
最小距離が保持されている前記RAMアレーの番
地の内容を、例えば(FFFF)16でクリアして(こ
こで(…)16は16進数であることを示す)、カウン
タ153で内容qをカウントアツプしてq=q+
1とする。制御部150は、以下同様にして、カ
ウンタ153の内容qがq=5となるまで、コン
パレータ152上で前記RAMアレー151で保
持されている距離の最小値を求め、前記代表標準
パターン記憶部12で記憶されている10ケの代表
標準パターンのうち、前記最小距離を与える代表
標準パターンのうち、前記最小距離を与える代表
標準パターンと同じカテゴリの6ケの標準パター
ンBm 1、Bm 2、…、Bm 6を標準パターン記憶部13か
ら読み出して計算部(D.S.P.)16に送出すると
同時に、その最小距離を平均部17のRAMアレ
ー171に送出し、最小距離が保持されている前
記RAMアレーの番地の内容をクリアして、カウ
ンタ153の内容qをカウントアツプするという
動作をくり返す。
ゲート部19では、制御部190は、前記前照
合部15からの入力が1つのカテゴリコードの場
合は、論理ゲート191をオンすることにより、
本実施例で示されるパターン認識装置の出力バス
を開いて前記前照合部15からの唯一のカテゴリ
コードを識別結果として出力する。一方、5ケの
カテゴリコードと付帯する距離及び5ケのカテゴ
リコードのそれぞれに対応する6ケの前記標準パ
ターンBm 1、Bm 2、…、Bm 6である場合には、計算部
16を駆動する為の信号(駆動信号)を、計算部
16の制御部160に送出する。
合部15からの入力が1つのカテゴリコードの場
合は、論理ゲート191をオンすることにより、
本実施例で示されるパターン認識装置の出力バス
を開いて前記前照合部15からの唯一のカテゴリ
コードを識別結果として出力する。一方、5ケの
カテゴリコードと付帯する距離及び5ケのカテゴ
リコードのそれぞれに対応する6ケの前記標準パ
ターンBm 1、Bm 2、…、Bm 6である場合には、計算部
16を駆動する為の信号(駆動信号)を、計算部
16の制御部160に送出する。
計算部16では、制御部160は、前記ゲート
部から、前記駆動信号を受けた場合に、161で
示された信号距離LSI(MN1263)で、前記前照
合部より送られてきた、5ケのカテゴリに関して
各カテゴリあたり6ケの標準パターンと、前記
RAMアレー141で保持されている前記特徴パ
ターンについて、前記式(2)〜式(7)で示される前記
パターン間距離を求め、前記RAMアレー171
に送出する。
部から、前記駆動信号を受けた場合に、161で
示された信号距離LSI(MN1263)で、前記前照
合部より送られてきた、5ケのカテゴリに関して
各カテゴリあたり6ケの標準パターンと、前記
RAMアレー141で保持されている前記特徴パ
ターンについて、前記式(2)〜式(7)で示される前記
パターン間距離を求め、前記RAMアレー171
に送出する。
ところで、標準パターン記憶部12で記憶され
ている標準パターンとは、各カテゴリ毎の複数個
の標準パターン(16次元ベクトルの時系列)のう
ち、前記代表標準パターン(16次元ベクトルの時
系列)を除いた残りの6ケの標準パターン(16次
元ベクトルの時系列)Bm 1、Bm 2、…、Bm 6(m=1、
2、…、10)である。すなわち、各カテゴリにつ
いて、標準パターンは、1つの代表標準パターン
Bmと6ケの標準パターンBm o(n=1、2、…、
6)の合計7個の標準パターンが存在する。標準
パターン記憶部12では、各カテゴリについて、
すなわち10ケのカテゴリについて、6ケの前記標
準パターン(16次元ベクトルの時系列)Bm o(n=
1、2、…、6:m=1、2、10)が記憶されて
いる。
ている標準パターンとは、各カテゴリ毎の複数個
の標準パターン(16次元ベクトルの時系列)のう
ち、前記代表標準パターン(16次元ベクトルの時
系列)を除いた残りの6ケの標準パターン(16次
元ベクトルの時系列)Bm 1、Bm 2、…、Bm 6(m=1、
2、…、10)である。すなわち、各カテゴリにつ
いて、標準パターンは、1つの代表標準パターン
Bmと6ケの標準パターンBm o(n=1、2、…、
6)の合計7個の標準パターンが存在する。標準
パターン記憶部12では、各カテゴリについて、
すなわち10ケのカテゴリについて、6ケの前記標
準パターン(16次元ベクトルの時系列)Bm o(n=
1、2、…、6:m=1、2、10)が記憶されて
いる。
さて、平均部17では、制御部170は、前記
特徴パターンとの距離の近い5ケのカテゴリに関
して、前記前照合部15及び前記計算部16から
送られてきて、前記RAMアレー171に保持さ
れている各カテゴリあたり7ケの距離(前記前照
合部15からは1ケ、前記計算部16からは6ケ
の距離が与えられる)に関して、加算器172で
和を求め、除算器173で前記和を7で割つて各
カテゴリの標準パターンと前記特徴パターンとの
相加平均部Lmを求め、識別部18のRAMアレー
181に5ケの前記相加平均部と、対応するカテ
ゴリコードを送出する。
特徴パターンとの距離の近い5ケのカテゴリに関
して、前記前照合部15及び前記計算部16から
送られてきて、前記RAMアレー171に保持さ
れている各カテゴリあたり7ケの距離(前記前照
合部15からは1ケ、前記計算部16からは6ケ
の距離が与えられる)に関して、加算器172で
和を求め、除算器173で前記和を7で割つて各
カテゴリの標準パターンと前記特徴パターンとの
相加平均部Lmを求め、識別部18のRAMアレー
181に5ケの前記相加平均部と、対応するカテ
ゴリコードを送出する。
識別部18では、制御部180は、前記平均部
17から送られてきたRAMアレー181で保持
されている。5ケのカテゴリに対応する5ケの前
記相加平均距離に関して、コンパレータ182に
おいて順次比較し、前記RAMアレー181で保
持されている前記カテゴリコードのうち、前記相
加平均距離の最小値に対応すカテゴリコードを識
別結果として出力する。
17から送られてきたRAMアレー181で保持
されている。5ケのカテゴリに対応する5ケの前
記相加平均距離に関して、コンパレータ182に
おいて順次比較し、前記RAMアレー181で保
持されている前記カテゴリコードのうち、前記相
加平均距離の最小値に対応すカテゴリコードを識
別結果として出力する。
以上のように、本実施例によれば、代表標準パ
ターン記憶部12、前照合計算部14、前照合部
15、ゲート部19を設けて、各カテゴリ毎7ケ
の標準パターンのうち、先ず、それらを代表する
各カテゴリ毎に1つの代表標準パターンと入力信
号の特徴パターンとのマツチング計算を行い、得
られた最小の市街距離が予め定めた閾値よりも小
さければ、最小の市街距離を与える代表標準パタ
ーンに対応するカテゴリを識別して以降の計算を
打切り、得られた最小の市街距離が前記閾値より
も大きいか等しい場合には、入力信号の特徴パタ
ーンとの距離が近いもの5ケの代表標準パターン
がそれぞれ該当するカテゴリを、10ケのカテゴリ
の中から5ケ選択し、標準パターン群とのマツチ
ング計算を量を半減することにより、各カテゴリ
毎に複数個の標準パターンと照合することで得ら
れる識別率の改善効果を維持しつつ、また、標準
パターンの記憶容量を増すことなく、識別に要す
る時間を短縮することができる。
ターン記憶部12、前照合計算部14、前照合部
15、ゲート部19を設けて、各カテゴリ毎7ケ
の標準パターンのうち、先ず、それらを代表する
各カテゴリ毎に1つの代表標準パターンと入力信
号の特徴パターンとのマツチング計算を行い、得
られた最小の市街距離が予め定めた閾値よりも小
さければ、最小の市街距離を与える代表標準パタ
ーンに対応するカテゴリを識別して以降の計算を
打切り、得られた最小の市街距離が前記閾値より
も大きいか等しい場合には、入力信号の特徴パタ
ーンとの距離が近いもの5ケの代表標準パターン
がそれぞれ該当するカテゴリを、10ケのカテゴリ
の中から5ケ選択し、標準パターン群とのマツチ
ング計算を量を半減することにより、各カテゴリ
毎に複数個の標準パターンと照合することで得ら
れる識別率の改善効果を維持しつつ、また、標準
パターンの記憶容量を増すことなく、識別に要す
る時間を短縮することができる。
すなわち、本実施例において、カテゴリとして
“0”〜“9”までの数字音声が割当てられ、標
準パターンを1カテゴリあたり7ケもつ場合、1
入力音声あたりの平均フレーム数は約16フレーム
(フレーム周期は25.6msecであるので、前期1入
力音声の平均時間長は25.6msec×16410msec)
であり、第7図で示された前記前照合部14以下
前記識別部18、ゲート部19までの処理は前記
入力音声の1フレームに対して約0.25msec要す
るので、前記従来例の場合は、0.25msec×16フ
レーム×7(標準パターン)×10(カテゴリ)280
msec要するのに対し、本実施例の場合は、(前記
ゲート部19において前記前照合14からのカテ
ゴリコードをそのまま識別結果とする場合が約50
%であるので)0.25msec×16フレーム×{10(代
表標準パターン)×(6(標準パターン)×5(カテ
ゴリ))×0.5}100msecとなり、従来例の処理
時間を約35%に短縮できる。また、本実施例の識
別率は95%以上を維持しており、実用上支障のな
い識別率を得ている。
“0”〜“9”までの数字音声が割当てられ、標
準パターンを1カテゴリあたり7ケもつ場合、1
入力音声あたりの平均フレーム数は約16フレーム
(フレーム周期は25.6msecであるので、前期1入
力音声の平均時間長は25.6msec×16410msec)
であり、第7図で示された前記前照合部14以下
前記識別部18、ゲート部19までの処理は前記
入力音声の1フレームに対して約0.25msec要す
るので、前記従来例の場合は、0.25msec×16フ
レーム×7(標準パターン)×10(カテゴリ)280
msec要するのに対し、本実施例の場合は、(前記
ゲート部19において前記前照合14からのカテ
ゴリコードをそのまま識別結果とする場合が約50
%であるので)0.25msec×16フレーム×{10(代
表標準パターン)×(6(標準パターン)×5(カテ
ゴリ))×0.5}100msecとなり、従来例の処理
時間を約35%に短縮できる。また、本実施例の識
別率は95%以上を維持しており、実用上支障のな
い識別率を得ている。
なお、本実施例においては、入力信号は音声で
あるとしたが、入力信号は音声に限らず、例えば
手書文字入力であつても良い。また、入力信号の
特徴パターンとして、400Hz〜5KHz帯域について
周波数分析して16次元スペクトル表現を用いた
が、周波数帯域幅、ベクトルの次数の任意で良
く、更に、周波数分析以外の方法として、自己相
関係数、零交叉数など入力信号の特徴を表現しう
るパラメータであれば良い。更には、入力信号の
特徴パターンのマツチング計算に動的計画法を用
いたが、線形マツチングを用いても良く、また、
距離尺度としては、市街距離以外の、ユークリツ
ド距離、アハラノビスの距離等、両者の距離を表
現するあらゆる距離尺度を適用しうる。
あるとしたが、入力信号は音声に限らず、例えば
手書文字入力であつても良い。また、入力信号の
特徴パターンとして、400Hz〜5KHz帯域について
周波数分析して16次元スペクトル表現を用いた
が、周波数帯域幅、ベクトルの次数の任意で良
く、更に、周波数分析以外の方法として、自己相
関係数、零交叉数など入力信号の特徴を表現しう
るパラメータであれば良い。更には、入力信号の
特徴パターンのマツチング計算に動的計画法を用
いたが、線形マツチングを用いても良く、また、
距離尺度としては、市街距離以外の、ユークリツ
ド距離、アハラノビスの距離等、両者の距離を表
現するあらゆる距離尺度を適用しうる。
発明の効果
本発明のパターン認識装置は、代表標準パター
ン記憶部、前照合計算部、前照合部を設けること
により、各カテゴリ毎の複数個の標準パターンの
うち、先ず、それらを代表する各カテゴリ毎1つ
の代表標準パターンと入力信号の特徴パターンと
のマツチング計算を行い、入力信号の特徴パター
ンと代表標準パターンとの距離の近いもの数ケに
ついて、それぞれ該当する候補カテゴリを予め選
択し、それらに対応する標準パターン群とのマツ
チング計算を行うことにより、前記特徴パターン
と標準パターン群とのマツチング計算を減少させ
て、各カテゴリ毎に複数個の標準パターンと照合
することで得られる識別率の改善効果を維持しつ
つ、また、標準パターンの記憶容量を増すことな
く、識別に要する時間を短縮することができ、そ
の実用的効果は大きい。
ン記憶部、前照合計算部、前照合部を設けること
により、各カテゴリ毎の複数個の標準パターンの
うち、先ず、それらを代表する各カテゴリ毎1つ
の代表標準パターンと入力信号の特徴パターンと
のマツチング計算を行い、入力信号の特徴パター
ンと代表標準パターンとの距離の近いもの数ケに
ついて、それぞれ該当する候補カテゴリを予め選
択し、それらに対応する標準パターン群とのマツ
チング計算を行うことにより、前記特徴パターン
と標準パターン群とのマツチング計算を減少させ
て、各カテゴリ毎に複数個の標準パターンと照合
することで得られる識別率の改善効果を維持しつ
つ、また、標準パターンの記憶容量を増すことな
く、識別に要する時間を短縮することができ、そ
の実用的効果は大きい。
また、本発明のパターン認識装置は、代表標準
パターン記憶部、前照合計算部、前照合部、ゲー
ト部を設けることにより、各カテゴリ毎の複数個
の標準パターンのうち、先ず、それらを代表する
各カテゴリ毎1つの代表標準パターンと入力信号
の特徴パターンとのマツチング計算を行い、得ら
れた結果(両者間の距離)の最小値が予め定めた
閾値よりも小さければ、最小値を与える代表標準
パターンに対応するカテゴリを識別して以降の計
算を打切り、得られた最小値が前記閾値よりも大
きいか等しい場合には、入力信号の特徴パターン
と代表標準パターンとの距離が近いもの数個につ
いて、それぞれ該当する候補カテゴリを予め選択
し、それらに対応する標準パターン群とのマツチ
ング計算を行うことにより、前記特徴パターンと
標準パターン群とのマツチング計算量を減少させ
て、各カテゴリ毎に複数個の標準パターンと照合
することで得られる識別率の改善効果を維持しつ
つ、また、標準パターンの記憶容量を増すことな
く、識別に要する時間を短縮することができ、そ
の実用的効果は大きい。
パターン記憶部、前照合計算部、前照合部、ゲー
ト部を設けることにより、各カテゴリ毎の複数個
の標準パターンのうち、先ず、それらを代表する
各カテゴリ毎1つの代表標準パターンと入力信号
の特徴パターンとのマツチング計算を行い、得ら
れた結果(両者間の距離)の最小値が予め定めた
閾値よりも小さければ、最小値を与える代表標準
パターンに対応するカテゴリを識別して以降の計
算を打切り、得られた最小値が前記閾値よりも大
きいか等しい場合には、入力信号の特徴パターン
と代表標準パターンとの距離が近いもの数個につ
いて、それぞれ該当する候補カテゴリを予め選択
し、それらに対応する標準パターン群とのマツチ
ング計算を行うことにより、前記特徴パターンと
標準パターン群とのマツチング計算量を減少させ
て、各カテゴリ毎に複数個の標準パターンと照合
することで得られる識別率の改善効果を維持しつ
つ、また、標準パターンの記憶容量を増すことな
く、識別に要する時間を短縮することができ、そ
の実用的効果は大きい。
第1図は従来の音声パターン認識装置の構成を
示すブロツク図、第2図、第3図、第4図はそれ
ぞれ本発明のパターン認識装置の一実施例の構成
を示すブロツク図、フローチヤート及び回路ブロ
ツク図、第5図、第6図、第7図はそれぞれ本発
明のパターン認識装置の他の実施例の構成を示す
ブロツク図、フローチヤート及び回路ブロツク図
である。 11……特徴抽出部、12……代表標準パター
ン記憶部、13……標準パターン記憶部、14…
…前照合計算部、15……前照合部、16……計
算部、17……平均部、18……識別部、19…
…ゲート部。
示すブロツク図、第2図、第3図、第4図はそれ
ぞれ本発明のパターン認識装置の一実施例の構成
を示すブロツク図、フローチヤート及び回路ブロ
ツク図、第5図、第6図、第7図はそれぞれ本発
明のパターン認識装置の他の実施例の構成を示す
ブロツク図、フローチヤート及び回路ブロツク図
である。 11……特徴抽出部、12……代表標準パター
ン記憶部、13……標準パターン記憶部、14…
…前照合計算部、15……前照合部、16……計
算部、17……平均部、18……識別部、19…
…ゲート部。
Claims (1)
- 【特許請求の範囲】 1 入力信号を特徴パターンの時系列Ai(i=1、
2、…、I)に変換する特徴抽出手段と、1カテ
ゴリm(m=1、2、…、M)に対する複数個の
標準パターンのうち代表値となる標準パターン
Bm(m=1、2、…、M)を記憶する代表標準
パターン記憶手段と、各カテゴリ毎の複数個の標
準パターンのうち前記代表標準パターンm以外
の標準パターン:m 1、m 2、…、m Nを記憶する標
準パターン記憶手段と、前記特徴パターンAiと前
記代表標準パターンm(m=1、2、…、M)
とのマツチング計算を行う前照合計算手段と、前
照合計算手段で得られた結果のうち前記特徴パタ
ーンAiと前記代表標準パターンm(m=1、2、
…、M)との距離の最小のものj個(j2)の
該当するカテゴリコードと付帯する距離を出力す
る前照合手段と、前記標準パターン記憶手段で記
憶されている標準パターン群のうち、前記前照合
手段から出力された複数個のカテゴリコードに対
応した標準パターン群のみと前記特徴パターンAi
とのマツチング計算を行う計算手段と、前記前照
合手段で得られた複数個のカテゴリコードについ
て、各カテゴリ毎に、前記計算手段で得られた前
記標準パターン群Bm o(n=1、2、…、N)と前
記特徴パターンAiとの距離及び前記前照合計算手
段で得られた代表標準パターンmと前記特徴パ
ターンAiとの距離のうち距離の最小のものk個の
平均を求める平均手段と、前記平均手段で得られ
た結果に基づいて前記特徴パターンに最も近い代
表標準パターン及び標準パターン群に該当するカ
テゴリコードを出力する識別手段とを備えたこと
を特徴とするパターン認識装置。 2 入力信号を特徴パターン時系列Ai(i=1、
2、…、I)に変換する特徴抽出手段と、1カテ
ゴリm(m=1、2、…、M)に対する複数個の
標準パターンのうち代表値となる標準パターン
Bm(m=1、2、…、M)を記憶する代表標準
パターン記憶手段と、各カテゴリ毎の複数個の標
準パターンのうち前記代表標準パターンm以外
の標準パターン;m 1、m 2、…、m Nを記憶する標
準パターン記憶手段と、前記特徴パターンAiと前
記代表標準パターンm(m=1、2、…、M)
とのマツチング計算を行う前照合計算手段と、前
照合計算手段で得られた結果のうち距離の最小の
ものと予め定められた距離の閾値を比較し、最小
距離が閾値よりも小さい場合は最小距離を与える
代表標準パターンの該当するカテゴリコードのみ
を出力し、最小距離が閾値よりも大きい場合は、
距離の最小のものj個(j2)の該当するカテ
ゴリコードと付帯する距離を出力する前照合手段
と、前記前照合手段の出力が1つのカテゴリコー
ドのみの場合はカテゴリコードをそのまま識別結
果として出力し、複数個のカテゴリコードと付帯
する距離の場合は前記標準パターン記憶手段に記
憶されている標準パターン群と前記特徴パターン
とのマツチング計算を行わせる為の信号を出力す
るゲート手段と、前記ゲート手段より信号が入力
された場合のみ、前記標準パターン記憶手段で記
憶されている標準パターン群のうち、前記前照合
手段から出力された複数個のカテゴリコードに対
応した標準パターン群のみと前記特徴パターンAi
とのマツチング計算を行う計算手段と、前記前照
合手段で得られた複数個のカテゴリコードについ
て、各カテゴリ毎に、前記計算手段で得られた前
記標準パターン群Bm o(n=1、2、…、N)と前
記特徴パターンAiとの距離及び前記前照合計算手
段で得られた代表標準パターンmと前記特徴パ
ターンAiとの距離のうち距離の最小のものk個の
平均を求める平均手段と、前記平均手段で得られ
た結果に基づいて前記特徴パターンに最も近い代
表標準パターン及び標準パターン群に該当するカ
テゴリコードを出力する識別手段とを備えたこと
を特徴とするパターン認識装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58091122A JPS59216284A (ja) | 1983-05-23 | 1983-05-23 | パタ−ン認識装置 |
| US06/611,734 US4715004A (en) | 1983-05-23 | 1984-05-18 | Pattern recognition system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58091122A JPS59216284A (ja) | 1983-05-23 | 1983-05-23 | パタ−ン認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59216284A JPS59216284A (ja) | 1984-12-06 |
| JPH0449717B2 true JPH0449717B2 (ja) | 1992-08-12 |
Family
ID=14017718
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58091122A Granted JPS59216284A (ja) | 1983-05-23 | 1983-05-23 | パタ−ン認識装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US4715004A (ja) |
| JP (1) | JPS59216284A (ja) |
Families Citing this family (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA1245363A (en) * | 1985-03-20 | 1988-11-22 | Tetsu Taguchi | Pattern matching vocoder |
| JPH0738114B2 (ja) * | 1985-07-03 | 1995-04-26 | 日本電気株式会社 | フオルマント型パタンマツチングボコ−ダ |
| US5774851A (en) * | 1985-08-15 | 1998-06-30 | Canon Kabushiki Kaisha | Speech recognition apparatus utilizing utterance length information |
| US4941178A (en) * | 1986-04-01 | 1990-07-10 | Gte Laboratories Incorporated | Speech recognition using preclassification and spectral normalization |
| JPH0760318B2 (ja) * | 1986-09-29 | 1995-06-28 | 株式会社東芝 | 連続音声認識方式 |
| JPS6391699A (ja) * | 1986-10-03 | 1988-04-22 | 株式会社リコー | 音声認識方式 |
| US4998280A (en) * | 1986-12-12 | 1991-03-05 | Hitachi, Ltd. | Speech recognition apparatus capable of discriminating between similar acoustic features of speech |
| JP2815579B2 (ja) * | 1987-03-10 | 1998-10-27 | 富士通株式会社 | 音声認識における単語候補削減装置 |
| US5027408A (en) * | 1987-04-09 | 1991-06-25 | Kroeker John P | Speech-recognition circuitry employing phoneme estimation |
| US5146503A (en) * | 1987-08-28 | 1992-09-08 | British Telecommunications Public Limited Company | Speech recognition |
| US5140668A (en) * | 1987-11-10 | 1992-08-18 | Nec Corporation | Phoneme recognition utilizing relative positions of reference phoneme patterns and input vectors in a feature space |
| US5159637A (en) * | 1988-07-27 | 1992-10-27 | Fujitsu Limited | Speech word recognizing apparatus using information indicative of the relative significance of speech features |
| US5179624A (en) * | 1988-09-07 | 1993-01-12 | Hitachi, Ltd. | Speech recognition apparatus using neural network and fuzzy logic |
| JP2764277B2 (ja) * | 1988-09-07 | 1998-06-11 | 株式会社日立製作所 | 音声認識装置 |
| JPH02232696A (ja) * | 1989-03-06 | 1990-09-14 | Toshiba Corp | 音声認識装置 |
| US5168524A (en) * | 1989-08-17 | 1992-12-01 | Eliza Corporation | Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation |
| US5136654A (en) * | 1989-10-19 | 1992-08-04 | Kurzweil Applied Intelligence, Inc. | Vocabulary partitioned speech recognition apparatus |
| US5369727A (en) * | 1991-05-16 | 1994-11-29 | Matsushita Electric Industrial Co., Ltd. | Method of speech recognition with correlation of similarities |
| FR2689292A1 (fr) * | 1992-03-27 | 1993-10-01 | Lorraine Laminage | Procédé et système de reconnaissance vocale à réseau neuronal. |
| US5682464A (en) * | 1992-06-29 | 1997-10-28 | Kurzweil Applied Intelligence, Inc. | Word model candidate preselection for speech recognition using precomputed matrix of thresholded distance values |
| US5386492A (en) * | 1992-06-29 | 1995-01-31 | Kurzweil Applied Intelligence, Inc. | Speech recognition system utilizing vocabulary model preselection |
| US5522011A (en) * | 1993-09-27 | 1996-05-28 | International Business Machines Corporation | Speech coding apparatus and method using classification rules |
| US6208959B1 (en) | 1997-12-15 | 2001-03-27 | Telefonaktibolaget Lm Ericsson (Publ) | Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel |
| US7618323B2 (en) * | 2003-02-26 | 2009-11-17 | Wms Gaming Inc. | Gaming machine system having a gesture-sensing mechanism |
| US20040166936A1 (en) * | 2003-02-26 | 2004-08-26 | Rothschild Wayne H. | Gaming machine system having an acoustic-sensing mechanism |
| US8280169B2 (en) * | 2005-12-21 | 2012-10-02 | Michael Linderman | Recordation of handwriting and hand movement using electromyography |
| WO2007127258A2 (en) | 2006-04-27 | 2007-11-08 | Wms Gaming Inc. | Wagering game with multi-point gesture sensing device |
| US8959459B2 (en) | 2011-06-15 | 2015-02-17 | Wms Gaming Inc. | Gesture sensing enhancement system for a wagering game |
| US9086732B2 (en) | 2012-05-03 | 2015-07-21 | Wms Gaming Inc. | Gesture fusion |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU7529981A (en) * | 1980-09-19 | 1982-03-25 | Hitachi Limited | Language analysis by pattern recognition |
| JPS5844500A (ja) * | 1981-09-11 | 1983-03-15 | シャープ株式会社 | 音声認識方式 |
-
1983
- 1983-05-23 JP JP58091122A patent/JPS59216284A/ja active Granted
-
1984
- 1984-05-18 US US06/611,734 patent/US4715004A/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| US4715004A (en) | 1987-12-22 |
| JPS59216284A (ja) | 1984-12-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0449717B2 (ja) | ||
| US5056150A (en) | Method and apparatus for real time speech recognition with and without speaker dependency | |
| US4601054A (en) | Pattern distance calculating equipment | |
| JPH1083194A (ja) | 話し手照合システムのための2段階群選択方法 | |
| JPS58130393A (ja) | 音声認識装置 | |
| US5794190A (en) | Speech pattern recognition using pattern recognizers and classifiers | |
| Phan et al. | Multi-view audio and music classification | |
| JPH05232999A (ja) | 音声符号化方法及び装置 | |
| JPH06161496A (ja) | 家電製品のリモコン命令語を認識するための音声認識システム | |
| Wen et al. | Robust audio anti-spoofing with fusion-reconstruction learning on multi-order spectrograms | |
| US5101434A (en) | Voice recognition using segmented time encoded speech | |
| JPS63259687A (ja) | 音声信号認識方法およびその方法を実施する装置 | |
| Badran et al. | Speaker recognition using artificial neural networks based on vowel phonemes | |
| JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
| JP3394506B2 (ja) | 音声判別装置及び音声判別方法 | |
| Lashkari et al. | NMF-based cepstral features for speech emotion recognition | |
| JPH0738114B2 (ja) | フオルマント型パタンマツチングボコ−ダ | |
| JP2989231B2 (ja) | 音声認識装置 | |
| Pham | Genetic learning of multi-attribute interactions in speaker verification | |
| Qi et al. | The use of fuzzy membership in network training for isolated word recognition | |
| JP2602271B2 (ja) | 連続音声中の子音識別方式 | |
| JPH01186999A (ja) | 話者照合方法 | |
| JPWO1988001090A1 (ja) | 音声認識 | |
| JPH01185599A (ja) | 音声認識装置 | |
| JPS58176698A (ja) | パターンマッチング装置 |