JPH0228876B2 - - Google Patents

Info

Publication number
JPH0228876B2
JPH0228876B2 JP56145869A JP14586981A JPH0228876B2 JP H0228876 B2 JPH0228876 B2 JP H0228876B2 JP 56145869 A JP56145869 A JP 56145869A JP 14586981 A JP14586981 A JP 14586981A JP H0228876 B2 JPH0228876 B2 JP H0228876B2
Authority
JP
Japan
Prior art keywords
pattern
degree
dissimilarity
standard pattern
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56145869A
Other languages
English (en)
Other versions
JPS5848099A (ja
Inventor
Hiroaki Sekoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56145869A priority Critical patent/JPS5848099A/ja
Publication of JPS5848099A publication Critical patent/JPS5848099A/ja
Publication of JPH0228876B2 publication Critical patent/JPH0228876B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声認識システムや話者確認システム
の主要技術たる音声パタン一致検定方法に関し、
特に連続して入力される音声中より所定の単位音
声パタンを正確に検出する方式に関する。
音声認識や話者確認の技術が社会に有益である
ことは“新美康永著、共立出版株式会社昭和54年
10月発行の「音声認識」なる著書に述べられてい
る。音声認識や話者確認の手法は各種提案されて
いるが、“音声研究会資料S78―20(昭和56年6
月)に「連続DPを用いた連続単語認識」と題し
て発表された論文”(以下文献(1)と呼ぶ)に記載
されている「連続DPマツチング法」は、小量の
計算で比較的安定に所定の単位音声パタン(単語
あるいは単音節等)を一致検出する優れた方法と
なつている。この方法では連続した入力パタン中
を標準的な単位音声パタン(標準パタン)で効率
良く走査して各時刻における相異度を算出し、相
異度が所定の閾値より低下した場合に一致が検出
されたとしている。
しかしこの従来技術には、閾値を高めに設定す
ると所定の単位音声パタン以外でも一致検出をす
るという誤検出を生じ、逆に閾値を低めに設定す
ると所定の単位音声パタンが実際に発生した時に
も見逃してしまうという誤不検出を生じる。一般
に連続音声中の単位音声と標準パタンとの間の相
異度は、発声の速さや強度の具合あるいは前後に
連続する音声の影響を受けて変化し一定ではな
い。このため普遍的な閾値は決定不可能である。
近似的に閾値を定めて固定してしまうと、上記の
ような誤検出や誤不検出が多発することは避けら
れない。
本発明の目的は従来技術の有する上記欠点を改
善して誤検出と誤不検出の少ない音声パタン一致
検定方法を実現し、それによつて高性能な音声認
識装置や話者確認装置を実現提供することを目的
としたものである。
本発明による音声パタン一致検定方法は、連続
音声パタン中の各時刻で標準パタンとの間の相異
度を算出するための相異度計算部を備え、標準パ
タンとして、検出の対象となる単位音声パタンに
対応して検出標準パタンと、これと異なつた音声
パタンである抑制標準パタンとを有し、これら標
準パタンと前記連続音声パタンとの間で、前記相
異度計算部によつて相異度を算出し、検出標準パ
タンとの間の相異度が所定の閾値より小さく、か
つ検出標準パタンに対応する相異度が抑制標準パ
タンに対応する相異度より小な時刻において単位
音声パタンが検出されたと判定することを特徴と
する。
以下に図面と数式を引用して実施例に基づいて
本発明の原理を説明する。
音声パタンは各時刻の音声的特徴を示すベクト
ルの時系列として表現される。
A=〓12……〓i…… (1) いま例としてこの音声パタンAの中の“山形”
(/yamagata/)という単語を検出する問題を
考える。
このため、検出標準パタンとして/
yamagata/という単語の音声パタン B=〓12……〓i……〓J (2) を用意する。この検出標準パタンで上記の音声パ
タンを走査し/yamagata/と言う部分を検出す
るのである。
入力パタンAの時刻i=lを終端とする部分パ
タンと標準パタンとの相異度を次のように定義す
る。
D(l,B)=1/Jmm〔jj=1 d(i(j),j)〕 (3) i=i(j) ここに、d(i,j)はベクトル〓iとベクトル
jとの距離である。関数i=i(j)は単調増加
関数であつてi(J)=lと言う終端条件を満足す
るが始端i(1)=mに関しては1≦m<lと言う弱
い制約が課せられるだけである。この定義は音声
認識研究に最近広く利用されているDPマツチン
グ法の考えに準拠したもので、より正確には、
“日本音響学会講演論文集3―2―18(昭和54年6
月)のに「端点フリーDPマツチングを用いた連
続単語音声認識」と題して発表された論文”(以
下文献(2)と呼ぶ)に記載された満点フリーDPマ
ツチング法における距離の定義に等しい。
前記文献(1)に記載された原理と同様に、(3)式の
計算は各時刻lにおいて g(l,1)=d(l,1) (4) g(l,j)=min 〔g(l−2,j−1)+d(l,j) g(l−1,j−1)+d(l,j) g(l−1,j−2)+d(l,j−1) +d(l,j) (5) j=2,3,……J なる動的計画法(DP)の漸化式計算を行なうこ
とによつて達成され、 D(l,B)=g(l,J)/J (6) と相異度が算出される。
この方法によると、各時刻lにおいて、その時
刻l以前の部分パタンと標準パタンとの相異度を
能率良く得ることができる。(部分パタンの始点
mは(5)式のDP計算によつて自然に最適な時刻に
定まる。) 以上述べた相異度計算によつて各時刻lにおい
て得られる相異度D(l,B)が第1図に示すご
とく変化したとする。図の横軸は時刻lを示し、
それに沿つて入力パタンAに対応する発声の内容
が例示されている。縦軸は相異度を示している。
いま閾値Θと相異度D(l,B)を比較して、D
(l,B)<Θなら/yamagata/と言う単語が検
出されたとし、D(l,B)≧Θならば検出されて
いないと判定するという方法をとるとする。な
お、前記文献(1)では単語認識を目的としているの
で単語ごとに標準パタンを用意しておき、単語ご
とに相異度を算出して、それらの最小値を求めて
認識を行なつているが、同文献の(13)式に見ら
れるように、この最小値を固定の閾値λと比較し
て上記と同様な判定を行なつている。
第1図に示した閾値Θによつて判定を行なうと
参照数字2と3で示した/yamagata/の部分は
正確に検出できる。
しかし、参照数字1で示した/yanagawa/の
部分まで誤まつて検出されてしまうという不都合
が生じる。そこで、同図のΘ′なる閾値で判定を
することにすると、/yanagawa/の部分で誤検
出を生じることは無いが、参照数字3で示した/
yamagata/の部分が検出されないと言う状態が
発生する。
閾値Θを慎重に選定することによつて、このよ
うな2種の誤りは低減することができるが、絶無
にすることは困難である。前記文献(1)の表2に
“ghost”、“消えたもの”と示してあるのがこれら
の誤りに対応するものである。
本発明では検出標準パタンBの他に抑制標準パ
タン B′=〓′1〓′2……〓′j……〓′J′ (7) を使用して上記の誤りを大幅に低減する。すなわ
ち、検出標準パタンBを使用して、(4)、(5)、(6)式
によつて入力パタンA中を走査するのと同様に抑
制標準パタンB′に関しても(4)、(5)、(6)式に計算
して相異度D(l,B′)を算出する。具体的な例
としてはB′として/yamagata/と類似した/
yanagata/を用意しておく。
かくして一致検出の判定基準を次のように変更
する。
すなわち、 D(l,B)<Θ (8) で、かつ D(l,B)<D(l,B′) (9) なるときに限つて一致が検出されたと判定するこ
とにする。
かくすると第2図のような効果が期待できる。
すなわち、参照数字1で示した/yanagawa/の
部分において、検出標準パタンとの相異度D(l,
B)が閾値Θより小となつても(すなわち(8)式の
条件が満足されても)、抑制標準パタンに関する
相異度D(l,B′)の方がD(l,B)より小で
ある(すなわち(9)式の条件が満足されない)ため
に誤検出は発生しない。このような抑制標準パタ
ンの働きによつて誤検出の発生が抑制されるので
閾値Θを大きく設定できる。その結果、参照数字
3で示した相異度D(l,B)があまり小さくな
らない部分も正確に検出できることになる。
第3図は以上述べた音声パタン一致検定方式を
実行するための装置構成を例示するブロツク図で
ある。マイクロホン10より力される音声信号は
例えばチヤネルフイルタ群より構成される分析部
20によつて周波数分析され、分析結果はベクト
ル〓lの時系列としてバツフア30に入力される。
検出標準パタン記憶部40には検出標準パタン
Bがまた抑制標準パタン記憶部50には抑制標準
パタンB′がそれぞれあらかじめ記憶されている。
第1マツチング部60と第2マツチング部70は
各時刻lにおいて(4)、(5)、(6)式の相異度計算を行
なつてD1=D(l,B)とD2=D(l,B′)とを
それぞれ算出する。相互検定部80ではこれら相
異度D1、D2が比較されD1<D2の時に限つてパル
ス信号P1が発生される。すなわち(9)式の検定が
行なわれる。閾値検定部90では相異度D1が閾
値Θと比較されD1<Θの時にかぎつてパルス信
号P2が発生される。
ANDゲート100では上記2個のパルス信号
の論理積が計算され一致信号Pとして出力され
る。それゆえ、(8)、(9)式がともに満足された時に
のみ一致信号Pとしてパルスが出力されることに
なる。かくして本方法を実行する装置構成が明ら
かにされた。
以上述べた原理は100パーセント確実に動作す
るものではない。すなわち、第2図の参照数字1
で示した部分で相異度の大小が逆転して、誤検出
が発生してしまうことも皆無ではない。しか
し、/yamagata/と異なつた音声パタンによつ
て、D(l,B)D(l,B′)となるのとD
(l,B)<D(l,B′)となるのが等確率である
としても誤検出は1/2に低減されることになる。
以上本発明の原理を実施例に基づいて説明した
がこれらの記載は本発明の権利範囲を限定するも
のではない。
特に、実施例では抑制標準パタンを1個のみと
したが複数個の標準パタンを用いてもよい。大ま
かに推定して、一般にn個の抑制標準パタンを使
用すると誤検出の確率は1/(n+1)に低減で
きると言える。また、DPの漸化式として(5)式と
は異なつたものを使用してもよい。
【図面の簡単な説明】
第1図と第2図は本発明の実施例における動作
説明図である。第3図は本発明の方法を実行する
ための装置構成例を示す図である。 10…マイクロホン、20…分析部、30…バ
ツフア、40…検出標準パタン記憶部、50…抑
制標準パタン記憶部、60…第1マツチング部、
70…第2マツチング部、80…相互検定部、9
0…閾値検定部、100…ANDゲート。

Claims (1)

  1. 【特許請求の範囲】 1 連続的に発声された入力音声パタンの各時刻
    で、その時刻以前の入力音声パタンの部分パタン
    と検出すべき単位音声パタンに対応する検出標準
    パタンとの相違度を算出することにより前記単位
    音声パタンが入力されたか否かを判定する音声パ
    タン一致検出方法において、 前記検出標準パタンに対応させて前記単位音声
    パタンとは異なる音声パタンである抑制標準パタ
    ンを前もつて記憶させておき、 前記検出標準パタンと前記部分パタンとの相異
    度を算出する処理に加えて、前記抑制標準パタン
    と前記部分パタンとの相違度を算出し、 検出標準パタンに対応する相異度が所定の閾値
    よりも小で、かつ検出標準パタンに対応する相異
    度が抑制標準パタンに対応する相異度よりも小な
    時刻において単位音声パタンが検出されたと判定
    することを特徴とする音声パタン一致検定方法。
JP56145869A 1981-09-16 1981-09-16 音声パタン一致検定方法 Granted JPS5848099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56145869A JPS5848099A (ja) 1981-09-16 1981-09-16 音声パタン一致検定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56145869A JPS5848099A (ja) 1981-09-16 1981-09-16 音声パタン一致検定方法

Publications (2)

Publication Number Publication Date
JPS5848099A JPS5848099A (ja) 1983-03-19
JPH0228876B2 true JPH0228876B2 (ja) 1990-06-26

Family

ID=15394929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56145869A Granted JPS5848099A (ja) 1981-09-16 1981-09-16 音声パタン一致検定方法

Country Status (1)

Country Link
JP (1) JPS5848099A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5876893A (ja) * 1981-10-30 1983-05-10 日本電気株式会社 音声認識装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5823097A (ja) * 1981-08-03 1983-02-10 日本電信電話株式会社 音声認識装置

Also Published As

Publication number Publication date
JPS5848099A (ja) 1983-03-19

Similar Documents

Publication Publication Date Title
US4918732A (en) Frame comparison method for word recognition in high noise environments
US20080059181A1 (en) Audio-visual codebook dependent cepstral normalization
Liu et al. Environment normalization for robust speech recognition using direct cepstral comparison
EP0459215A1 (en) Voice/noise splitting apparatus
JP3069531B2 (ja) 音声認識方法
US5806031A (en) Method and recognizer for recognizing tonal acoustic sound signals
JPH04318900A (ja) 多方向同時収音式音声認識方法
CA1301338C (en) Frame comparison method for word recognition in high noise environments
JP3437492B2 (ja) 音声認識方法及び装置
JPH0228876B2 (ja)
JPH0797279B2 (ja) 音声認識装置
US5765124A (en) Time-varying feature space preprocessing procedure for telephone based speech recognition
JP2940835B2 (ja) ピッチ周波数差分特徴量抽出法
JP3106543B2 (ja) 音声信号処理装置
JPH04369698A (ja) 音声認識方式
JP3112037B2 (ja) 音声認識装置
Pattanayak et al. Significance of single frequency filter for the development of children's KWS system.
JP3100180B2 (ja) 音声認識方法
JPH0567040B2 (ja)
JP2757356B2 (ja) 単語音声認識方法および装置
JP3020999B2 (ja) パターン登録方法
JPS6039700A (ja) 音声区間検出方法
JPH0242238B2 (ja)
Wu et al. Overlapped speech recognition from a jointly learned multi-channel neural speech extraction and representation
JPS59170894A (ja) 音声区間の切り出し方式