JPH041916B2 - - Google Patents

Info

Publication number
JPH041916B2
JPH041916B2 JP57085771A JP8577182A JPH041916B2 JP H041916 B2 JPH041916 B2 JP H041916B2 JP 57085771 A JP57085771 A JP 57085771A JP 8577182 A JP8577182 A JP 8577182A JP H041916 B2 JPH041916 B2 JP H041916B2
Authority
JP
Japan
Prior art keywords
speech
voice
similarity
recognized
fij
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57085771A
Other languages
English (en)
Other versions
JPS58202499A (ja
Inventor
Masanori Myatake
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP57085771A priority Critical patent/JPS58202499A/ja
Publication of JPS58202499A publication Critical patent/JPS58202499A/ja
Publication of JPH041916B2 publication Critical patent/JPH041916B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声を認識する事のできる音声認識装
置に関する。
一般に、同一話者であつても発声の毎に発声時
間が異なるばかりか、アクセントにも多少の変動
があり、更に、話者が異なれば、上述の変動に個
人差が加わる事が知られている。従つて、これ等
の音声の変動成分を統計的手法を用いる事に依つ
て補なう事が提案され、近年では、この様な統計
的手法を導入して認識率の向上を目ざした音声認
識装置が開発されつつある。
この種従来の音声認識装置の構成を第1図に示
す。同図に於いて、1は音声を電気的な音声信号
に変換するマイクロフオンである。2は該マイク
ロフオン1に依つて得られる音声信号から音声の
特徴パラメータを抽出するパラメータ抽出回路で
あり、一つの認識音声の音声信号について音声帯
域(100Hz〜4KHz)を8分割した8個の周波数ス
ペクトル値が16サンプル配列する行列構成の特徴
パラメータ〔xij〕、(i=1、……、8;j=1、
……、16)が出力される。3は関数メモリであ
り、特定多数nの認識音声について予じめ複数話
者から抽出した特徴パラメータ(o) 〔wij〕に基づき、
これ等が正規分布を為すとして導出した話者の相
違に関する特徴パラメータの値の分布関係(o) 〔fij〕
が複数の認識音声毎に貯えられている。この認識
音声を5つの母音(ア、イ、ウ、エ、オ)とした
場合、関数メモリ3の第1乃至第5関数メモリ3
1,〜,35に夫々ア、イ、ウ、エ、オ順に(1) 〔fij〕、〜、(5) 〔fij〕が格納されている。4は確率
計算回路であり、上記関数メモリ3の各分布関数(o) 〔fij〕、n=1、2、3、4、5に基づいて上記
パラメータ抽出回路2から得られる入力音声の特
徴パラメータ(o) 〔xij〕の5つの母音に対する存在確
率 〔(o) fij(xij)〕、n=1、2、3、4、5を導出し
て、これ等を出力する。5はこれ等の存在確率
(o) fij(xij)〕を貯える確率メモリであり、その第
1乃至第5確率メモリ51,〜,55の夫々に
(o) fij(xij)〕、n=1、2、3、4、5が貯えられ
る。6は認識音声決定回路であり、上記確率メモ
リ5の各存在確率〔(o) fij(xij)〕の成分の和、即ち d(n)=8i=1 16j=1 (o) fij(xij) n=1、2、3、4、5 を求めて、d(n)が最大となる時のnを検出す
る事に依つて、この時の入力音声が第n番目の認
識音声と決定される。即ち、n=4なら(エ)である
と決定される。
第2図は、上記関数メモリ3に貯えられた5つ
の母音に対する1KHzの周波数(i=I)の特定
サンプル(j=J)の周波数スペクトル値の存在
確率を示した分布関数(o) fIJ(xIJ)を図示したもの
である。同図に基づいて、x〓IJなる入力音声の特
徴パラメータの周波数スペクトル値に注目してみ
ると、このx〓IJと母音(イ)、(エ)、(オ)の各平均値-(2
)
xIJ-(4) xIJ-(5) xIJの夫々との誤差が等しくなつているが、
上述の関数メモリ3と確率計算回路4とに依つ
て、夫々の確率(2) fIJ(x〓IJ)、(4) fIJ(x〓IJ)、(5) fIJ(x〓IJ)を
求めると、同図から明らかな如く、(4) fIJ(x〓IJ)が
最大であつて、母音(エ)に属する確率が最も高い事
がわかる。この様に、第1図の如き従来装置に於
いては、音声の特徴パラメータである周波数スペ
クトル値の分布の度合いを加味した認識処理を行
なう事に依つて、多少とも認識率の向上が為され
ている。
しかしながら、第2図に於いて、今x¨IJなる周
波数スペクトル値に注目してみると、このx¨IJ
母音(ア)に属し、その確率(1) fIJ(x〓IJ)が前述のx〓IJ
母音(エ)に属する確率(4) fIJ(x〓IJ)と等しくなつてい
るが、実際には、x¨IJが母音(ア)以外の母音(イ)、(ウ
)、
(エ)、(オ)に属する確率がほとんど無いのに比べて、
IJが母音(エ)以外の母音(イ)、(オ)に属する確率が

分にある事がわかる。この様に音声を識別するの
に重要なx¨IJが母音(ア)に属する確率(1) fIJ(x¨IJ)と音
声を識別するのに重要でないx〓IJが母音(エ)に属す
る確率(4) fIJ(x〓IJ)とを同等に取り扱う事、即ち、
各認識音声個別の分布関数に依る確率を直接類似
度の得点として取り扱う事、には不都合があり、
この不都合に依つて、従来の音声認識装置では、
認識率の大巾な向上を期待する事はできなかつ
た。
本発明は上述の不都合を解消する事を目的とし
て為されたものであり、以下に詳述する。
第3図に本発明の音声認識装置の一実施例を示
す。同図に於いて、1、及び2は第1図と同様に
マイクロフオン、及びパラメータ抽出回路を示し
ており、マイクロフオン1に入力された音声の特
徴パラメータの周波数スペクトル値〔xij〕がパ
ラメータ抽出回路2に依つて得られる。
斯る本発明実施例装置が第1図の従来装置と異
なる所は、各母音(ア,イ,ウ,エ,オ)の周波
数スペクトル値〔wij〕の分布関数(o) 〔fij〕(以後n
=1,2,3,4,5,とする)、を貯えた関数
メモリ3の代りに、特定の分布関数(o) 〔fij〕に基づ
いて算出した存在確率と他の分布関数(o) 〔fij〕に基
づいて算出した存在確率との相対的な比率(o) 〔gij〕、を、該特定の分布関数(o) 〔fij〕に重み付け
した形の重み付け分布関数〔(o) gij・(o) fij〕、n=1,
2,3,4,5を夫々第1及び第5重み付け関数
メモリ71〜75に格納してなる重み付け関数メ
モリ7を備えた点にある。該重み付け関数メモリ
7を備えた点にある。該重み付け関数メモリ7に
貯えられた重み付け分布関数〔(o) gij・(o) fij〕n=1,
2,3,4,5は具体的には次の如くして算出さ
れる。即ち、各母音(ア,イ,ウ,エ,オ)の周
波数スペクトル値の分布関数(o) 〔fij〕に基づいて、
これ等各分布関数を最大とする周波数スペクトル
値の各平均値-(1) xij,〜,-(o) xijに於ける確率〔(1) fij (-(o) xij)〕、〜、〔(5) fij(-(o) xij)〕、n=1,2,3,4,
5を計算し、更に、これ等存在確率間の相対的な
比率 n=1,2,3,4,5 を算出し、これ等の比率(o) gijを重み付け係数そし
て上記各分布関数(o) fijに乗じる事に依つて、重み
付け分布関数(o) gij・(o) fijが得られる。8は類似度計
算回路であり、上記重み付け関数メモリ7の各重
み付け分布関数〔(o) gij・(o) fij〕に基づいて上記パラ
メータ抽出回路2から得られる入力音声の特徴パ
ラメータ〔xij〕の5つの母音(ア,イ,ウ,エ,
オ)に対する類似度としての重み付け存在確率
(o) gij・(o) fij(-(1) xij)〕、を導出して出力する。9はこ
れ等類似度としての値〔(o) gij・(o) fij(xij)〕、を貯え
る類似度メモリであり、その各第1乃至第5類似
度メモリ91,〜,95に各値〔(o) gij・(o) fij(xij)〕、
n=1,2,3,4,5が貯えられる。6′は第
1図の従来装置と同様に動作する認識音声決定回
路であり、上記類似度メモリ9の各類似度〔(o) gi
j・(o) fij(xij)〕の成分の和、即ち d(n)=8i=1 16j=1 (o) gij・(o) fij(xij) n=1,2,3,4,5 を求めて、d′(n)が最大となる時のnを検出す
る事に依つて、この時の入力音声が第n番目の認
識音声と決定される。即ち、n=2なら(イ)である
と決定される。
斯る構成の音声認識装置は類似度計算回路8に
於いて、その重み付け関数メモリ7に予じめ格納
されている重み付け分布関数〔(o) gij・(o) fij〕に依つ
て、入力音声の特徴パラメータに対する各認識音
声毎の存在確率に重み付けを行なうものである。
例えば第2図の周波数スペクトル値x〓IJに注目し
てみると、このx〓IJが母音(エ)に属する存在確率(4) fIJ
(x〓IJ)については、この母音(エ)の周波数スペクト
ル値の平均値−(4) xIJにおける各母音(ア,イ,ウ,
エ,オ)の存在確率(o) fIJ-(4) xIJ)、n=1、2、3、
4、5の値の比率が約0:0:0:7:3となつ
ているので、この母音(エ)に於ける存在確率の比率
(4) gIJは約70%となる。これに対して周波数スペク
トル値x¨IJの場合は、同図から明らかな如く母音
(ア)に於ける存在確率の比率(1) gIJは約100%となる。
従つて、類似度計算回路8に依つて、このx〓IJ
母音(エ)に対する類似度{0.7(4) fIJ(x〓IJ)}及びx¨IJの母
音(ア)に対する類似度{1.0(1) fIJ(x¨IJ)}が得られ、各
認識音声の特徴パラメータの存在確率が重なり合
つて認識音声の識別があいまいとなる存在確率に
低い重み付けが為される。この様に有効な重み付
けが為されて得られた類似度に基づいて、認識音
声決定回路6′に依り、入力音声との類似度が最
も高い認識音声が決定される。
以上の説明に於いては、音声の特徴パラメータ
として、周波数スペクトル値を例示したが、音声
波形の自己相関係数、フオルマント周波数を使用
しても良い。また説明の簡略化の為に認識音声と
して5つの母音を取り扱つたが、特定多数の認識
音声、例えば50音を対象とする認識処理も可能で
ある。
本発明の音声認識装置は以上の説明から明らか
な如く、複数の同一認識音声の特徴パラメータx
の分布関数を求めておき、この特定の分布関数f
に、該分布関数fに基づいて算出した存在確率と
他の分布関数fに基づいて算出した存在確率との
相対的な比率gを重み付けしてなる重み付け分布
関数g・fを貯えた重み付け関数メモリを備え、
該メモリの分布関数g・fに基づき、類似度計算
回路に依つて、入力音声の特徴パラメータに対す
る各認識音声毎の重み付けされた類似度を得るも
のであるので、各認識音声の特徴パラメータの存
在確率の内、認識音声を識別する為の重要度が低
いものにはその存在確率に対する重みづけを小さ
くする事ができる。従つて、認識音声を識別する
為の重要度が高い認識音声の存在確率を用いて入
力音声を認識する事が可能となり、特定話者ばか
りか不特定話者に対してもその音声の変動成分を
充分補い、認識率の向上を計る事ができる。
【図面の簡単な説明】
第1図は従来の音声認識装置の構成を示すブロ
ツク図、第2図は音声の周波数スペクトル値の存
在確率を示す分布関数曲線図、第3図は本発明の
音声認識装置の一実施例を示すブロツク図、を示
している。 2……パラメータ抽出回路、6′……認識音声
決定回路、7……重み付け関数メモリ、8……類
似度計算回路、9……類似度メモリ。

Claims (1)

    【特許請求の範囲】
  1. 1 入力された音声からその音声の特徴パラメー
    タxを抽出するパラメータ抽出回路と、特定多数
    の認識音声毎に、複数の同一認識音声の特徴パラ
    メータxの分布関数fを予じめ求めておき、この
    特定の認識音声の分布関数fに、該分布関数fに
    基づいて算出した存在確率と他の認識音声の分布
    関数fに基づいて算出した存在確率との相対的な
    比率gを重み付け計算して得られる重み付け分布
    関数g・fを予じめ記憶した重み付け関数メモリ
    と、該関数メモリの各音声の重み付け分布関数
    g・fに基づき、上記パラメータ抽出回路から得
    られる入力音声の特徴パラメータxが示す各認識
    音声に対する重み付けされた存在確率g・f(x)
    を類似度として算出する類似度計算回路とからな
    り、該類似度計算回路から得られる類似度が最大
    となる認識音声をこの時の入力音声と認識する事
    を特徴とした音声認識装置。
JP57085771A 1982-05-20 1982-05-20 音声認識装置 Granted JPS58202499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57085771A JPS58202499A (ja) 1982-05-20 1982-05-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57085771A JPS58202499A (ja) 1982-05-20 1982-05-20 音声認識装置

Publications (2)

Publication Number Publication Date
JPS58202499A JPS58202499A (ja) 1983-11-25
JPH041916B2 true JPH041916B2 (ja) 1992-01-14

Family

ID=13868132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57085771A Granted JPS58202499A (ja) 1982-05-20 1982-05-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPS58202499A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017018196A2 (pt) 2015-02-26 2018-04-17 Park Suhjun ?dispositivo de distribuição, válvula, aparelho de contenção tendo o mesmo, aparelho de movimento de conteúdo e aparelho de conteúdo?
KR20170091524A (ko) 2016-02-01 2017-08-09 박서준 통과 장치, 밸브, 이를 구비하는 수용 기구, 내용물 이동 기구 및 내용물 기구

Also Published As

Publication number Publication date
JPS58202499A (ja) 1983-11-25

Similar Documents

Publication Publication Date Title
US5097509A (en) Rejection method for speech recognition
JPS63225300A (ja) パタ−ン認識装置
WO2017108097A1 (en) Localization algorithm for sound sources with known statistics
JP6501259B2 (ja) 音声処理装置及び音声処理方法
JPH01296299A (ja) 音声認識装置
GB2237135A (en) Speaker recognition
JP7841064B2 (ja) ダイアログ検出器
JPH041916B2 (ja)
JPH021318B2 (ja)
JP2992324B2 (ja) 音声区間検出方法
JPH06110488A (ja) 音声検出方法および音声検出装置
JPH0373880B2 (ja)
US6301562B1 (en) Speech recognition using both time encoding and HMM in parallel
JP2991288B2 (ja) 話者認識装置
JP3100180B2 (ja) 音声認識方法
JPH0311478B2 (ja)
JP2744622B2 (ja) 破裂子音識別方式
MacKinnon et al. Realtime recognition of unvoiced fricatives in continuous speech to aid the deaf
CA2013263C (en) Rejection method for speech recognition
JPS6148897A (ja) 音声認識装置
JPS6336678B2 (ja)
JPH0311479B2 (ja)
JPH0562759B2 (ja)
JPS62113197A (ja) 音声認識装置
JPH0546558B2 (ja)