JPH0570840B2 - - Google Patents

Info

Publication number
JPH0570840B2
JPH0570840B2 JP59222417A JP22241784A JPH0570840B2 JP H0570840 B2 JPH0570840 B2 JP H0570840B2 JP 59222417 A JP59222417 A JP 59222417A JP 22241784 A JP22241784 A JP 22241784A JP H0570840 B2 JPH0570840 B2 JP H0570840B2
Authority
JP
Japan
Prior art keywords
section
noise
distance
pattern
pattern memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59222417A
Other languages
English (en)
Other versions
JPS61100878A (ja
Inventor
Masao Watari
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59222417A priority Critical patent/JPS61100878A/ja
Publication of JPS61100878A publication Critical patent/JPS61100878A/ja
Publication of JPH0570840B2 publication Critical patent/JPH0570840B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声や文字などのパタンを認識する装
置に関し、特に雑音による影響を除去し耐雑音性
の高いパタン認識装置に関する。
(従来技術とその問題点) 音声や文字などのパタンを認識する手段として
従来から種々の方法が試みられている。それらの
中で比較的簡単でかつ有効な方法としてパタンマ
ツチング法がある。パタンマツチング法では認識
対象を特徴ベクトルの系列で表現し標準パタンと
して記憶させておき、認識しようとするパタン
(入力パタンと呼ぶ)と比較し最も近いすなわち
距離の小さい標準パタンを選択し、その標準パタ
ンの属するカテゴリを認識結果として出力する。
一方、認識装置を実際に使用する場合には、パ
タンに雑音が付加されることが多くあり認識率を
低下させる原因となつていた。雑音を除去して認
識する方法が昭和57年3月発行の日本音響学会講
演論文集3−4−6「単語認識の雑音処理に関す
る一実験」(以下文献1とする)に記載されてい
る。この方法はノイズサブトラクシヨン法と呼ば
れ、概要は以下に示すようである。
今、認識対象を音声とした場合、パタンはスペ
クトルの時系列で表現できる。騒音環境下で観測
したスペクトルX(ω)は音声スペクトルS(ω)
に雑音スペクトルN(ω)が付加したものと考え
ることができるため、音声のない部分で雑音スペ
クトルN(ω)を推定し、観測したスペクトルX
(ω)より雑音スペクトルN^(ω)を差し引くこと
により音声スペクトルS^(ω)推定している。
S^(ω)=X(ω)−N^(ω) ……(1) しかし、ノイズサブトラクシヨン法では雑音は
音声のある時間内は定常であるとして一定値を差
し引いているため、定常な雑音に対しては有効で
あるが非定常な雑音に対しては効果がない。
以上述べたように従来方法では非定常な雑音が
付加した場合その雑音を推定することはできず雑
音を除去することができない。このため同一カテ
ゴリのパタンでも距離が大きくなり誤認識となり
認識率が低くなる欠点があつた。
(発明の目的) 本発明の目的は、非定常な雑音が付加された部
分にマスクを掛け、雑音が付加された部分のパタ
ン間の距離は使用しないことにより前記欠点を解
決し、非定常な雑音が付加した場合でも認識率の
低下しないパタン認識装置を提供することがあ
る。
(発明の構成) 本発明によれば、入力パタンの特徴パタンを得
る特徴抽出部と、該特徴抽出部出力を一時記憶す
る入力パタンメモリと、標準パタンを記憶する標
準パタンメモリと、雑音が付加された区間を検出
する雑音検出部と、入力パタンと標準パタンの距
離を計算する距離計算部と、前記雑音検出部で検
出された雑音区間の距離をゼロとする距離マスク
部と、前記距離マスク部の出力を累積する距離累
積部と、前記距離累積部の出力から認識結果を判
定する判定部を持つことを特徴とするパタン認識
装置が得られる。
(本発明の原理) 次に本発明の原理について説明する。入力パタ
ンAと第nカテゴリの標準パタンBnを A=a1,a2,……,aI ……(2) Bn=b1 n,b2 n,……,bI n ……(3) とすれば、入力パタンAと標準パタンBnとの距
離は D(A,Bn)=1/IIi=1 d(ai,bi n) ……(4) で与えられる。ここでd(ai,bi n)はaiベクトル
とbi nベクトルとの間の距離で例えば d(ai,bi n)=kR=1 |aik−bn ik| ……(5) ただし ai=(ai1,……,aik,……,aik) なるチエビシエフ距離を用いることが考えられ
る。パタンマツチングによる認識では入力パタン
Aに最も近い標準パタンBnを捜すことである。
すなわち、認識結果は n^=argmnin D(A,Bn) ……(6) で求められる。ここでargmxin yはすべてのxに
対してyが最小となる時のxであることを示す。
ところで、非定常な雑音が付加されたパタンは
第2図に示すように雑音が付加された区間におい
て元パタンより大きく変形している。このため雑
音が付加された区間の距離は異常に大きくなり、
本来小さな値となる正答の標準パタンとの距離D
(A,Bn)が大きくなり、誤認識となつていた。
本発明では、特徴ベクトルの変化等で雑音付加
区間を検出し、その区間の特徴ベクトルに関する
距離を使用せず、雑音のない区間のみで距離を求
め認識を行う。すなわち、雑音のない区間は1を
雑音が付加された区間を0とするマスク系列 M=m1,m2,……,mi,……,mI ……(7) ただしmi=1or0とする。
を各パタンについて求め、入力パタンAと標準パ
タンBnとの距離は Dr(A,Bn)=1/IrIi=1 ma i・mbn i・d(ai,bn i
……(8) ただし IrII=1 ma i・mbn i ……(9) で計算される。認識結果は n^=argmin Dr(A,Bn) ……(10) となる。このようにして求められたDr(A,Bn
には雑音の影響が除去されているため耐雑音性の
良い認識装置が実現される。
(実施例 1) 次に本発明の実施例を図面を用いて説明する。
第1の実施例は第1図に示すように特徴抽出部
1、雑音検出部2、入力パタンメモリ3、標準パ
タンメモリ4、距離計算部5、距離マスク部6、
距離累積部7、判定部8より構成される。
始めに入力された音声は特徴抽出部1にて例え
ばスペクトラムパラメータのような特徴を抽出し
特徴ベクトルへ変換され、時間軸の正規化を行つ
て入力パタンメモリ3へ記憶される。ここで時間
軸の正規化とはパタンごとの時間方向の長さを一
定になるように伸縮させることであり、伸縮の方
法は線形に行う方法、特徴ベクトルの変化が均一
になる方法などがある。このような特徴抽出部1
には、共立出版社の54年10月出版の「音声認識」
(以下文献2とする)の第113頁の図4,7に記載
されている前処理部、特徴抽出部、時間正規化部
を使用することができる。
雑音検出部2は特徴ベクトルを監視し、その変
化が急激でかつ短い区間である場合に雑音が付加
されたと見なしマスク系列miをゼロとし入力パ
タンメモリ部3へ記憶させる。雑音検出部2はよ
く知られたマイクロプロセツサにより構成するこ
とができ第3図のように構成され、第4図に示す
フローチヤートに従つて動作する。すなわち、特
徴ベクトルの変化分Δi=|ai−ai-1|を監視し Δis>THかつΔie>THかつ ie−is<TL ……〓 なる時mis,……mie=0とする。ここで変化分に
対する閾値をTH、その時間間隔をTLとする。
標準パタンメモリ4には、あらかじめ同様な特
徴抽出、雑音検出を行い各カテゴリのパタンBn
および雑音区間を示すマスク系列mbnを記憶させ
ておく。
距離計算部5は(5)式による特徴ベクトル間の距
離を求める部分であり、第5図に示すように減算
器51、絶対値回路52、加算器53、アキユム
レータ54より構成され、入力パタンメモリ3よ
りaiベクトル、標準パタンメモリよりbi nベクトル
を読み出し、アキユムレータ54にd(ai,bi n
が求められる。
距離マスク部6は第6図に示すように選択回路
61とOR回路62より構成される。OR回路6
2へは入力パタンメモリ部3と標準パタンメモリ
部4より読み出されたマスク系列mi aとmi bnが入
力され、その出力により距離計算部5の出力d
(ai,bi n)か0かを選択し出力する。すなわちOR
回路62の出力が1の場合はd(ai,bi n)が出力
され、OR回路62の出力が0の場合は0を出力
する。このようにして、距離マスク部6ではmi
・mi bn・d(ai,bi n)を計算していることにな
る。
距離累積部7は第7図に示すように加算器71
とアキユムレータ72により距離mi a,mi bn・d
(ai,bn i)の累積が計算され、加算器73とアキ
ユムレータ74により加算長Ir=Ii=1 mi a・mi bn
求められ、割算器75により距離Dr(A,Bn)が
求められる。
判定部8は標準パタンのカテゴリnを順次標準
パタンメモリ部へ出力し、入力パタンとの距離
Dr(A,Bn)を受け取り、その最小値を計算し、
最小値が得られたカテゴリn^を出力する。
(実施例 2) 次に本発明の第2の実施例を図面を用いて説明
する。第1の実施例ではパタンの長さ(特徴ベク
トルの数)は一定となるように特徴抽出部で時間
正規化を行つていた。しかし、音声などは個々に
微妙な伸縮があるため、各標準パタンとの間で最
もよく合う伸縮を求めつつパタン間の距離を求め
るDPマツチング法が知られている。この詳細は
1983年11月7日発行の日経エレクロニクスの第
171頁から第208頁の「連続発声した単語音声を効
率的に認識する2段DPマツチング」(以下文献3
とする)に記載されている。その概略は次のとお
りである。
標準パタンBnの時間軸jを入力パタンの時間
軸iに写像する関数(時間正規化関数)をi=j
(i)とした時、時間正規化されたパタン間距離
Dd(A,Bn)は、 Dd(A,Bn)=1/IminIi=1 d(i,j) ……(13) j=j(i) なる最小化問題の解として得られる。この最小
化問題は以下の漸化式を順次計算することによつ
て求められる。
初期条件 g(0,0)=0とし g(i,j)=d(i,j)+ming(i-1,j) g(i-2,j) g(i-3,j) ……(14) なる漸化式をj−rij+rなる範囲で計算
し入力パタンの終端Iと標準パタンの終端Jnなる
点のg(I,Jo)が求めるDd(A,Bn)となる。
第2の実施例はこのDPマツチングによる時間
正規化を組込んだ装置であり、第8図に示すよう
に構成される。第2の実施例は第1の実施例にお
ける特徴注出部1と累積距離部7を除き同様の部
分を持つ。特徴抽出部1は第1の実施例の特徴抽
出部1より時間正規化部を除いた部分より構成さ
れ、パタンの特徴ベクトルが求められる。累積距
離部7は漸化式計算部721,DPマツチング制
御部722,Gメモリ部723より構成され、距
離マスク部6より得られる雑音除去された距離
ma i・mbn j・d(ai,bn j)を用いてDPマツチング法
により時間正規化距離Dd(A,Bn)を求める。こ
の漸化式計算部721,DPマツチング制御部7
22,Gメモリ部723は文献3の図11に記載
されている機能機能、機能をそれぞれ使用
することができる。
以上、本発明を実施例にもとづいて説明したが
これらの記載は本発明の権利範囲を限定するもの
ではない。特に本実施例では特徴ベクトル間の距
離を(5)式に示したチエビシエフ距離を用いたが、
ユークリツド距離 d(ai,bi n)=KK=1 (aik−bn ik2 ……(15) や、内積 d(ai,bi n)=−KK=1 aik・bn ik ……(16) を用いることができる。また、DPマツチング法
は文献3に記載されている各種の方式を用いるこ
とができる。これらの自明な変更は本発明の権利
範囲に属するものである。
(発明の効果) 以上説明したように本発明のパタン認識装置で
は、非定常な雑音が付加された区間の距離はゼロ
として雑音のない区間のみの距離の累積値で認識
する。これによつて、雑音の影響が除去され、雑
音付加による認識率の低下を防ぐことが可能とな
る。
【図面の簡単な説明】
第1図は本発明の第1の実施例を示すブロツク
図、第2図は本発明の原理を説明するための図、
第3図、第5図、第6図、第7図はそれぞれ第1
図の実施例の一部詳細構成を示すブロツク図、第
4図は雑音検出部のフローチヤート、第8図は第
2の実施例を示すブロツク図である。 図において、1は特徴抽出部、2は雑音検出
部、3は入力パタンメモリ部、4は標準パタンメ
モリ部、5は距離計算部、6は距離マスク部、7
は累積距離部、8は判定部である。

Claims (1)

    【特許請求の範囲】
  1. 1 入力パタンの特徴パタンを得る特徴抽出部
    と、該特徴抽出部出力を一時記憶する入力パタン
    メモリと、標準パタンを記憶する標準パタンメモ
    リと前記入力パタンに雑音が付加された区間を検
    出する雑音検出部と、入力パタンと標準パタンの
    距離を計算する距離計算部と、前記雑音検出部で
    検出された雑音区間の距離をゼロとする距離マス
    ク部と、前記距離マスク部の出力を累積する距離
    累積部と、前記距離累積部の出力から認識結果を
    判定する判定部を持つことを特徴とするパタン認
    識装置。
JP59222417A 1984-10-23 1984-10-23 パタン認識装置 Granted JPS61100878A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59222417A JPS61100878A (ja) 1984-10-23 1984-10-23 パタン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59222417A JPS61100878A (ja) 1984-10-23 1984-10-23 パタン認識装置

Publications (2)

Publication Number Publication Date
JPS61100878A JPS61100878A (ja) 1986-05-19
JPH0570840B2 true JPH0570840B2 (ja) 1993-10-05

Family

ID=16782057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59222417A Granted JPS61100878A (ja) 1984-10-23 1984-10-23 パタン認識装置

Country Status (1)

Country Link
JP (1) JPS61100878A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109147798B (zh) * 2018-07-27 2023-06-09 北京三快在线科技有限公司 语音识别方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
JPS61100878A (ja) 1986-05-19

Similar Documents

Publication Publication Date Title
US5023912A (en) Pattern recognition system using posterior probabilities
US4918732A (en) Frame comparison method for word recognition in high noise environments
JP3451146B2 (ja) スペクトルサブトラクションを用いた雑音除去システムおよび方法
JPS634200B2 (ja)
HK184795A (en) Voice signal processing device
JPWO2003107326A1 (ja) 音声認識方法及びその装置
US5974381A (en) Method and system for efficiently avoiding partial matching in voice recognition
JPH0570840B2 (ja)
CA1301338C (en) Frame comparison method for word recognition in high noise environments
JPH0792989A (ja) 音声認識方法
JPH10124084A (ja) 音声処理装置
JPH0247758B2 (ja)
JPS6129897A (ja) パタ−ン比較装置
KR100269217B1 (ko) 유사 체인코드를 후처리로 이용한 음성검출시스템 및 그 방법
JPH0311478B2 (ja)
JPS5975298A (ja) 音声認識方法
JPS60159798A (ja) 音声認識装置
JPH0320759B2 (ja)
JPH01241600A (ja) 音声認識装置
JPS63236094A (ja) 音声認識方法
JPH0668679B2 (ja) パタンマッチング装置
JPH01138596A (ja) 音声認識装置
JPS59204895A (ja) 音声認識装置
JPH045400B2 (ja)
JPH0568717B2 (ja)