JPS5879300A - パタ−ン距離計算方式 - Google Patents

パタ−ン距離計算方式

Info

Publication number
JPS5879300A
JPS5879300A JP56178055A JP17805581A JPS5879300A JP S5879300 A JPS5879300 A JP S5879300A JP 56178055 A JP56178055 A JP 56178055A JP 17805581 A JP17805581 A JP 17805581A JP S5879300 A JPS5879300 A JP S5879300A
Authority
JP
Japan
Prior art keywords
pattern
distance
feature vector
standard
deviation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56178055A
Other languages
English (en)
Inventor
誠夫 亘理
千葉 成美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56178055A priority Critical patent/JPS5879300A/ja
Publication of JPS5879300A publication Critical patent/JPS5879300A/ja
Priority to US06/757,929 priority patent/US4601054A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本**は、41黴ペタトルの時系列で与えられる入カバ
ターンと、前もって記憶されている特徴ベタトにの時系
列て与えられる標準パターンとの間の距離の計算方式K
mlする。
例えば、単語音声W*装置の場合、共立出版株式会社出
版の「音声認識」の第111頁の図4,6に示されてい
るように、音声分析部、標準バターツメモリ部、パター
ンマツチング部より構成きれて−る・音声分析部では、
例えばフィルタパンクによるスペクトル分析が行われ、
それと同時に音声区間の検出が行われ、特徴ベクトルの
時系列が得られる。−万、使用者は使用する単語を前も
って発声し、音声分析部より得らnる特徴ベクトルの時
系列t−榎準パターンとして標準パターンメモ11Iへ
記憶させる。認識をする音声は音声分析部にて特徴ベク
トルの時系列となり、入力バター/としてパターンマツ
チング部へ送られる。パターンマツチング部では前もっ
て記憶rしである各種の単@0標準パターンと入力バタ
ー/とをマツチンダさせ、最もよくマツチングした標準
パターンの ′単W管W!識結果とする。
パターンマツチングは例えば前記の共立出販株式会社出
j[O「音声認識JOgl@1買よ11第111頁オで
に示されて−る時間正規化マツチング法にて行われる。
ll準パターンO彎間軸に対して非線形な伸縮を行I/
&、入カバターンの特徴ペタトルとの間で距離!計算し
、その和tIll似度とする。ζOII似It最小にす
るような伸縮管動的計画法にて求めるこ(!−ができる
。こ0Ill似度は特徴ベクトル間O距離を基に計算さ
れる。
この特徴ベタトルA■Cm<*a(−%aa)とB■(
bいb !11 ”’s bn )との間の距離計算方
式には、(η式に示すチェビシェフ距離% (L (3
11式に示すニータリーラド距離、(4式に示す希閤距
離郷が用いられてI友・ 一’75.音声には発声ごとの黴少な変動があり1こO
変動を許容し1g識率を向上させる友めくけ、1つの単
@に対して複数個の標準パターン1持つ1法、また複数
個のパターンより平均パターンを求め、それ全代表とし
て標準パターンきす6方法がありた。
しかし、前者の方法は標準パターンの数が増え。
r憶量が増える欠点があるe′fた、後者の方法は標準
パターンの数は増えないが、変fi!力・(−するため
、各標準パターンより一足近傍内金その単層と判定する
。このため似ている単語が他にあるとW14認識しやす
くなる欠点を持つ。
本発明の目的は、標準パターンの特徴ベクトルの変動範
囲をl差ベクトルの時系列として与え。
音声の発声ごとO変Sを許容できるm準パターンと入カ
バターンとの間の距噴計算万式を提供するξとKある。
本発明によるパターン距離計算方式は%標準パターンの
変動範囲を与える偏差ベクトルの系列全設定し、入カバ
ターンOある時点11(D特徴ペタ) 、st l”(
@”、s”、−・、s+”)ト1lilパターンOT。
72       m @t   tl    電暑 、+、   t!る時点
t201111I黴ベクトルB  (b、 b b、 
h  a b  )との間の距離!、前記**ペタ)#
B  (b、eb。
−・、b”)の変動範囲を与え為偏差ベタ) A−W’
 ”(v: ’h w: ”、 −’* w’ ” )
!: *前記特徴ペタト、 A% 1(−1、−1−1
−1)と、前節特徴ベクトルBt1(b:”、b:”b
 −t b:”)t!u”ctt算t ToMf、テ1
bha次に本発明について音声認識の場合O1l施例を
用いて詳IIIAK説明する0発声し良音声は音声分析
sKより音声分析堪れ、また音声区間が検出され、特徴
ベタ)A10時系列が得られる・ 入カバターンの41像ベクトルの時系列管(A  @ 
A  @ ””h A ”* −h A”)  ””’
(5)竜@  ’tt   を宜−1t ただしム  −(皇、sag th  e  麿n )
とし W皐メターンの特徴ベタトルO時系列をCB、B
、−1B ” @ ”m社′)−憎りffシB”−(b
:”、bs”5−1i、1 >とし、標準パターンO変
動範囲管示す偏差ペタ)ルO時系列鷺 (W’@W”%−1W”%t−・、y eb ) 、、
・・・・CηただしW” ’ −(★1,2、WX″、
・・・、ぺ1)とする、この時、入カバターンの時刻t
1と標準パターンの時刻12における特徴ベクトル間の
距離DI(8χ(9λ(10)式にて計算する。
Daf、(A”i”、W12)     −・・・・・
・・(8)・・・・・・−(10) 但し% f、は距離間数1示す。
前記に示す計算方式は、第1図に示すような距離dll
−用いておりシbI  よりW、/、の範囲でセdl−
0と逢っている0例えば、音声をフィルタノ(/りにて
分析し得られるfiI徴ベクトルtibn個の周波数に
、おけるスペクトラムの強さで表gArれる。
#I2図に示すベクトルAはλカッζターヅの特徴ペタ
トルであり、ベクトルBは標準)(ターンめ特徴  ・
ベクトルであり、斜!1部分Fi槓早パ〜−/Q変動薄
−である、入カバターンの特徴ベタ)AI&と標準パタ
ーンの特徴ベクトルB/−の距離は、矢印で表わしであ
るよう忙斜@部分の端よりベクトル人までの距離の和で
与えられる。
第3図は、前記+81. +9)% (10) 、式に
示した計算万式管実行する装置の一実施例を示すプロブ
4図である。この装置費は、入カバターンメモリ1%橿
準パターンメモリ2.偏差ベクトルメモリ3、減算器4
、加減IE器5.選択器6.減算617.アキ轟ムレー
タ8.制御部9より構成される。減算器4は入カバター
ンメモリlと標準パターンメモリ2よ?、1次元づつそ
れぞれal、bl管読み出し減算を行う、その結果al
−bit7111減算1llsへ出力する。加減算器!
Sは減算器4の出力の値が負の時は加算、それ以外の時
は減算1−.減算14の出力と側御ベクトルメモリ3よ
り読み出された値w」コの間で行う、すなわちai−b
l<0の時はwi+(a I −b I )を実行し5
at−bi≧00時はwl−(aI−bl)?実行する
。これはwi−1al−bll  t−計算しているこ
とrcなる。さらに選択器6は入力が負の時は加減算器
5の出力をそのまま選択aSの出力きし、一方入力が正
の時は−に’口を選択器6の出方とする。。
減算器7はアキ1^レータ8の値ACCと選択器60出
力との間で減算管行い、ACCへ格納する。
すなわちwi−1ai−bit< OO時ACC−(w
l−1ai−bIl)■ACe+(laI−bll−v
i) *計算し、 wl−1ai−bl≧be時ACC
O値は変化しない、制御部9は初めにアキ藤ムレータ8
tタリャしてその後、各メモ91.2.3より1次元づ
つ読み出し、その計算結果をアキ、ムレータへセットす
るように各メモ91.2,3とア今、ムレータ9を制御
する。
このようにして、各メモリ1.2.3よりn次元読み出
した時アキ1^レータ8に、 前記(8) 、 (9)
(10)式で示した距離りの値が得られる。
このように標準パターンの変動範囲を示す偏差ベクトル
の時系列管設定することにより1標準パターンに巾を持
たせ、音声の発声ごとの変動を許容でき認識率を向上さ
せることができる。従来、変動を許容するため複数個の
標準パターン!持ってnN5b本発明O距離術算方式も
用いれば、1つの標準パターンで同等c″認識率が得ら
れ、標準パターンの個数も滅すことができる。
また1本発明のパターン距離計算方式は、前記偏差ペタ
トルを特定話者〇−声ごとの変動軸at示す量とするこ
とにより、轡定話者用管声i*g*装置に適用で璽るば
かりでなく、偏差ペタトルを音声の個人差による変動範
!!會示す量とすれば不特定話者用音声認識装置に適用
できる0名らに、偏差ベタトル會話者の経年変化を含め
た発声ごとの変動範St示す量とすれば話者管識別する
話者認識装置に適用できる。
さもに1本発明の実施例I!かいて(Ill、 (s)
t (10)式に示したj1Mll#f、は前記(1)
式のチェビシェフ距離を基にした関数、であったが、こ
01!に:(2式のエータリッド距sr基tc L、 
* Ql)m (+2)、 cts)式1c 示す−、
1その平方根であるα4)%αIs)、(131)式に
示すf、%(4)式tj!KL&(16)、(17)%
(18)式に示すf40距離閤数を用いることもできる
D、陶f、(ムt1、B”、!”)    ”−−””
1)D、−工 d、 、M       ++−・−(
12)(11 −・−・−(13) ・・・・・・・−(1g) また、偏差ペタトルの求める方法は1例えば複数個O標
準パターンよりその平均値と標準偏差を求め、平均1i
It4I微ベクトルn 9Mとし、標準偏差の定数倍!
偏差ベクトルwi 2とTゐ、さらに、複数個の標準パ
ターンよりその中心値と量大値、最小値!求め、中心値
全特徴ベクトルBIffとし、(最大値−最小値)の定
数倍t−m差ベクトルwt″とする方法もある。
前記の実施例において特徴ペタトルはフィルタパンクに
よるスペクトラム!用いているが、他に自己相関係数、
ケプストラム、iw形予測係数などの特徴ペタトルに本
発明のパターン距離計算方式管適用できることは明白で
ある。tた、パターンとして音声を対象として説明した
が1文字I!Ilなども特徴ペタトルの系列の距離計算
を使用しており、。
本発明のパターン距離計算方式を適用できることは明白
である・ 以上、本発明會実施例に%とづいて説明しfctX%こ
れらの記載は不発明の−1を限定する本のではない。
【図面の簡単な説明】
第111は本発明の一実施例に用いた距離関数を示す図
である。第2図は、音声分析用フィルタパンクより得ら
°れる特徴ベクトルの距離を示す図で、各次元における
距離!矢印にて示しである。第3図は2本発明の計算方
式管実現する装置〇一実施例を示すプaνり図である。 図にお−て、1は入カバターンメモ号、2は標。 準バI−ンメモl、3は偏差ベクトルメ毫り、4は減算
器、Sは加減算器、6は選択器、7け減算器1口はアキ
鼻ムν一夕である。 、<r、’7゛ 手樟補正書偵釦 58.2.−3 昭和  年  月  日 特許庁長官 殿 1、事件の表示   昭和56年特 許 願第1780
55号3、補正をする者 事件との関係       出 願 人東京都港区芝五
丁目33番1号 (423)   日本電気株式会社 代表者 関本忠弘 4、代理人 〒108  東京都港区芝五丁目37番8号 住友三田
ビル日本電気株式会社内 (6591)  弁理士 内 原   晋5、補正の対
象 明細書の発明の詳細な説明の― 6、補正の内容 1)明細書第4頁第10行目に「変数」とあるのを「変
動」と補正する。 2)明細書第6頁第20行目に「博聞」とあるのを「範
囲」と補正する。 3)明細書第7員第15軒目と第16行自と第17行目
と第18行目にrwiJとあるのを4ケ所共にrwi/
2Jと補正する。 4)明細書第8貞第4行目と第5行目にrwiJとある
のを4ケ所共に「Wε/2」と補正する。 代理人 弁理士 内 原   責

Claims (1)

  1. 【特許請求の範囲】 特徴ベタトルO系列で与えられる入力パターンと、前も
    って記憶されている特徴ベクトルO系列で与えられる標
    準パターンと0間の距離の計算方式において、標準パタ
    ーンの特徴ベクトルの変動間@lt与える偏差ペタトル
    の系列を設定し、前記入カバターンのある時点tWO@
    徴ペタトルムt1(畠tζ麿:’b−%べ1)と、標準
    パターンのある時点t 2t)08へI ) ルB” 
    CbF”*bi”h −s bQ”) ト(1)間の距
    離!、前記特徴ベクトルB”(bt%b”、−%b l
     t )lffi、fi 4り変11111!lIt与、t Al1差へ/ ) 
    ”W”M’s W!−會オ  ゛ ”s v  )と、前記特徴ベクトルA”(a”ta”
    * ””hfi                  
              11畠 ) と、前記特徴ベクト
    ルB ” ”(b ” ”h b ’ ”%−1btl
    )1 fi                       
          %1    ffi        fi
    O関数として計算するパターン距離計算方式。
JP56178055A 1981-11-06 1981-11-06 パタ−ン距離計算方式 Pending JPS5879300A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP56178055A JPS5879300A (ja) 1981-11-06 1981-11-06 パタ−ン距離計算方式
US06/757,929 US4601054A (en) 1981-11-06 1985-07-23 Pattern distance calculating equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56178055A JPS5879300A (ja) 1981-11-06 1981-11-06 パタ−ン距離計算方式

Publications (1)

Publication Number Publication Date
JPS5879300A true JPS5879300A (ja) 1983-05-13

Family

ID=16041807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56178055A Pending JPS5879300A (ja) 1981-11-06 1981-11-06 パタ−ン距離計算方式

Country Status (2)

Country Link
US (1) US4601054A (ja)
JP (1) JPS5879300A (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59192A (ja) * 1982-06-25 1984-01-05 株式会社東芝 個人照合装置
JPS6024597A (ja) * 1983-07-21 1985-02-07 日本電気株式会社 音声登録方式
US5131043A (en) * 1983-09-05 1992-07-14 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for speech recognition wherein decisions are made based on phonemes
US4991216A (en) * 1983-09-22 1991-02-05 Matsushita Electric Industrial Co., Ltd. Method for speech recognition
JPS60179797A (ja) * 1983-10-27 1985-09-13 日本電気株式会社 パタンマツチング装置
US4956865A (en) * 1985-01-30 1990-09-11 Northern Telecom Limited Speech recognition
US4799262A (en) * 1985-06-27 1989-01-17 Kurzweil Applied Intelligence, Inc. Speech recognition
US4802224A (en) * 1985-09-26 1989-01-31 Nippon Telegraph And Telephone Corporation Reference speech pattern generating method
US4918732A (en) * 1986-01-06 1990-04-17 Motorola, Inc. Frame comparison method for word recognition in high noise environments
DE3711342A1 (de) * 1987-04-03 1988-10-20 Philips Patentverwaltung Verfahren zum erkennen zusammenhaengend gesprochener woerter
US5027408A (en) * 1987-04-09 1991-06-25 Kroeker John P Speech-recognition circuitry employing phoneme estimation
US4916743A (en) * 1987-04-30 1990-04-10 Oki Electric Industry Co., Ltd. Pattern matching system
DE3819178A1 (de) * 1987-06-04 1988-12-22 Ricoh Kk Spracherkennungsverfahren und -einrichtung
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
US4926488A (en) * 1987-07-09 1990-05-15 International Business Machines Corporation Normalization of speech by adaptive labelling
US5140668A (en) * 1987-11-10 1992-08-18 Nec Corporation Phoneme recognition utilizing relative positions of reference phoneme patterns and input vectors in a feature space
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
WO1990001198A1 (fr) * 1988-07-20 1990-02-08 Fujitsu Limited Dispositif de reconnaissance de caracteres
US5168524A (en) * 1989-08-17 1992-12-01 Eliza Corporation Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation
US5136654A (en) * 1989-10-19 1992-08-04 Kurzweil Applied Intelligence, Inc. Vocabulary partitioned speech recognition apparatus
JP2570448B2 (ja) * 1989-12-28 1997-01-08 日本電気株式会社 標準パターン学習方法
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
US5271088A (en) * 1991-05-13 1993-12-14 Itt Corporation Automated sorting of voice messages through speaker spotting
US5189709A (en) * 1991-08-26 1993-02-23 The United States Of America As Represented By The United States National Aeronautics And Space Administration Dynamic pattern matcher using incomplete data
EP0555024B1 (en) * 1992-02-07 2000-05-17 Canon Kabushiki Kaisha Method and apparatus for pattern recognition
US5887069A (en) * 1992-03-10 1999-03-23 Hitachi, Ltd. Sign recognition apparatus and method and sign translation system using same
US5682464A (en) * 1992-06-29 1997-10-28 Kurzweil Applied Intelligence, Inc. Word model candidate preselection for speech recognition using precomputed matrix of thresholded distance values
US5367702A (en) * 1993-01-04 1994-11-22 Texas Instruments Incorporated System and method for approximating nonlinear functions
US5659764A (en) * 1993-02-25 1997-08-19 Hitachi, Ltd. Sign language generation apparatus and sign language translation apparatus
US5572604A (en) * 1993-11-22 1996-11-05 Lucent Technologies Inc. Method for pattern recognition using prototype transformations and hierarchical filtering
TW323364B (ja) * 1993-11-24 1997-12-21 At & T Corp
US5414755A (en) * 1994-08-10 1995-05-09 Itt Corporation System and method for passive voice verification in a telephone network
US7006969B2 (en) * 2000-11-02 2006-02-28 At&T Corp. System and method of pattern recognition in very high-dimensional space
US7369993B1 (en) 2000-11-02 2008-05-06 At&T Corp. System and method of pattern recognition in very high-dimensional space
US20040098412A1 (en) * 2002-11-19 2004-05-20 International Business Machines Corporation System and method for clustering a set of records

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3700815A (en) * 1971-04-20 1972-10-24 Bell Telephone Labor Inc Automatic speaker verification by non-linear time alignment of acoustic parameters
DE2844156A1 (de) * 1978-10-10 1980-04-24 Philips Patentverwaltung Verfahren zum verifizieren eines sprechers
JPS5722295A (en) * 1980-07-15 1982-02-05 Nippon Electric Co Speaker recognizing system

Also Published As

Publication number Publication date
US4601054A (en) 1986-07-15

Similar Documents

Publication Publication Date Title
JPS5879300A (ja) パタ−ン距離計算方式
EP0144689B1 (en) Pattern matching system
JPS6024994B2 (ja) パタ−ン類似度計算方式
US4513436A (en) Speech recognition system
JPS62169199A (ja) 音声認識装置
US4916743A (en) Pattern matching system
JPS5936758B2 (ja) 音声認識方法
JPS59161782A (ja) パタ−ン・マツチング方法
JPH0228160B2 (ja)
JPS6014300A (ja) 音声の特徴抽出方法
JPS58149099A (ja) パタ−ン認識方式
JPH10313500A (ja) 音源ゾーン検出方法、その装置、およびそのプログラム記録媒体
JPS6057397A (ja) 正規化方法
JPH041916B2 (ja)
JPS5972498A (ja) パタ−ン比較装置
JPH0251519B2 (ja)
JPS58176698A (ja) パターンマッチング装置
JPS613200A (ja) 音声認識装置
JPS5990900A (ja) パタ−ンマツチング回路
JPS61230199A (ja) 音声認識方法
JPS62111295A (ja) 音声認識装置
JPS58181096A (ja) 音声分析合成方式
JPH021318B2 (ja)
JPH0449720B2 (ja)
JPS58147797A (ja) 音声認識装置