JPS6078494A - パタンマツチング装置 - Google Patents

パタンマツチング装置

Info

Publication number
JPS6078494A
JPS6078494A JP58186480A JP18648083A JPS6078494A JP S6078494 A JPS6078494 A JP S6078494A JP 58186480 A JP58186480 A JP 58186480A JP 18648083 A JP18648083 A JP 18648083A JP S6078494 A JPS6078494 A JP S6078494A
Authority
JP
Japan
Prior art keywords
vowel
center
silent
matching
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58186480A
Other languages
English (en)
Other versions
JPH0554117B2 (ja
Inventor
三船 義照
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58186480A priority Critical patent/JPS6078494A/ja
Publication of JPS6078494A publication Critical patent/JPS6078494A/ja
Publication of JPH0554117B2 publication Critical patent/JPH0554117B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、日本iit!最小発声単位であるCV音節も
しくはV1CV2””節を前もって登録しておき、登録
した話者が発声し/こ、単語や文節傷・よび文章を認識
する登録型の連続1°?声認識装置等におけるv1Cv
2(母音−1’ f’t−I:J:音)音14′Iのバ
タンマツチング装置に関する。。
従来例の構成とその問題点 従来の連続音声1.J識装置等におけるv1Cv2音節
のマツチング方式ににL1人力音声の@接した母音定常
部中心間の1111四にv1C■2音節標準パタ/をマ
ツチングする方式であり、辞鳶数の低減等を考慮しない
初期の・ものでは、707部分にすべての子音(無声摩
擦f−j’t / 8 // C//h/ 、無声破裂
子音/p//l//に/、有声摩擦子音/2/、有声破
裂子音/b//d//(J/、半母音/Z//W/、鼻
子音/m//n/、破擦子γ7’ / r / ) を
含んだ状態でマツチングを行うものであった。しかしこ
のよう・な方式では、辞書数が多くなる事や、無音区間
を含みやすい、破裂性の子音では無音区間の/こめに誤
認識を生じ認識率が低下する原因となった。そこで辞書
数の低減と認識率の改善を目指す方式においては、例え
ばほとんど前に無音区間が含まれる無声破裂子音(/p
//l//に/)については、v1CV2標準パタンは
登録しないでおいて、無音区間の検出を入力音声に対し
て別処理を行い、例えば無音区間終了からCV標準バタ
ンマツチングを行う方法があった。しかしこのような方
式においても、無声破裂子音の場合でなくても、v1C
■2標準バタン作成時の発声状態によって無声区間が含
まれる場合もあり必ずしも最良の方式ではなく認識率の
改善のだめには、やはり限界があった。
発明の目的 本発明は前記従来の問題点を解消し、波列性の子音等を
含むVCV間における音節認識率を改善したバタンマツ
チング装置を提供することを目的とする。
発明の構成 本発す」は、入力i’i” J ’・ヲ・q!J徴ベク
トル(Xt□)と電力値(pt□)の11.5系列に変
換したパラメータによって、電力値系列のレベル判定と
!#!J徴ベクトル(Xt工)のフレームmのfU、音
識別結果から、母音定常部中心(iV、、、 、V2.
・・・・・・、□VN)を検出し、また隣接した母音定
常布中心間(〔、■]、□vj+i〕)−の範囲におい
て、前のIU: i’f中心の電力値pt(、v・)l
 ] と後の母音中心の電力値pt(□V、十i)に対する比
率によって無音区間[1ssn、1sER)l を検出
し、この処理をlυ)゛11定部中心の範囲を7ノトシ
て全区間についてス+((75区間([1SS1 、1
sE1 〕[1SS2,1sE2]・・・・・・[15
5M、iSEMIlを検出する。またv1cv24′、
;+Hytしぐタンについても前の母音定常部中心(i
Vr、lと後の初音定常部中心11VB)ノミ力値(P
tiVFl、fPt、VBIIc対し チー 定比率倍
したレベルと、前もって定めたレベルの3つのレベルの
最大レベル無音区間([1SSV、1SEV月の検出を
行う。ぞして人力音声の@接した初音定常部中心(□V
j、1vj1.)の範囲トv1C■2標準バタンドパタ
ンマツチングを行う際に、入力音声側および標準バタン
側双方について、無N区間が検出されている場合には、
無音区間を除いた範囲でバタンマツチングを行うことに
よって、破裂性の子音/p//l//に/、/b//d
//q/、/r/を含むv1C■2区間における音節認
識率を改善するものである。
ただし実際の連続音声認識装置等に対する応用としては
、入力音声11111の母音定常部中心(1V、。
、vj+1) の範囲では、無音区間が検出された」場
合は無音区間終了から後の母音定常部中心(i v3−
+、1)1では、破裂音(/p//l//に/等)のC
V音節標準バタンとマツチングし、無音区間が無い場合
には破砕子音を含まない■、Cv2音節標準・ぐタンと
マツチングし、この際■1C■2音節標準ノぐタン(+
1!lでは、無音区間を圧縮したものを使用することに
よって辞書数低減と認識率の改善を同時に行える。
実施例の説明 本発明の実施例について以下に説明する。
第1図は、本発明における一実施例を示しており、入力
部は、Δ/D変換器1、電力系列変換手段2、特徴系列
変換Jtli3からなる。4は入力音声の電力系列に、
1.9で長い無音を検出して音声区間を検出する音声区
間検出手段である。5は汗声区間検出手段4に、1.っ
て切り出される音声区間において電力系列に4にって短
い無音を検出して無音区間を検出する無1°制本間検出
手段である。6は入力音声のピーク箱、力を・検出する
ピーク電力検出手段6aと特徴ベクトル系列のベクトル
毎に母音識別を行う/U音識別り段6bからなり、ピー
ク電力の前後のフレーl、に、1;−ける母音識別結果
の同一母音中心から、旬j′?定常部中心を検出するP
J音定常部中心検出部である。
7は入力H3−声を!1!J漱ベクトルの形でCV音節
7aもしくは、V1C■21“?°節7bの単位で記憶
する標準バタン記憶部であり、■1C■2音節標準パタ
ンでCに破裂子音p、t、にはa−tぜないようにする
8は平均発声長(Ll 167レ一ム分だけ、母音認識
結果の系列を記1.ホするLU音系列記憶部旦aと特徴
ベクトルの系列を記憶する特徴系列記憶部8b′−から
なる、記憶部である。9は特徴系列記憶部8bにおける
特徴ベクトルの、系列が、語頭4aもしくは無音区間終
了5bから直後の母音定常部中心6Cまでの区間の場合
には、Cv標準パタン7aとバタンマツチングを行い、
平均発声長[L116フレーム以内の母音定常部中心6
C−母音定常部中心6Cの区間の場合には、v1C■2
標準パタン7bとバタンマツチングを行うバタンマツチ
ング手段である。
10は音声区間検出手段4、無音区間検出手段5、母音
定常部中心検出部6、記憶部8および、バタンマツチン
グ手段9を全体的に制御して、入力音声の母音定常部中
心毎に、語頭や無音区間の情報を使用して、CV音節と
v1Cv2音節とのバタンマツチング結果を接続して、
CV音節のストリンゲスとして認識結果を出力する総合
制御手段である。
第2図はバタンマツチング手段を説明するだめの構成図
である。
バタンマツチング手段9は、距離1−tN部9a。
■I C”2 ’a準バタン圧ai□i ts39 b
 、 V1CV2標準バタン無音区間検出部9C,lニ
ジ成る。無音区間が、隣接するGJ音定常部中心間に存
在しない入力音声については、先に述べ/Cようにv1
C■2標準バタンとバタンマツチングを行う。乙の場合
に第2図に示したように、′8漱系列記憶部8bK記憶
さ、/した、入力音声のl:、J、 7’5定常部中心
(i■ρと母音定常部中心(、V、、1)の範囲を、標
準バタン記憶部7の■1Cv2音節標準パタン7bとの
距離計算を、バタンマツチング手段9によって行う。こ
の際に、バタンマツチング手段9においては、v1CV
2標準バタン無音区間険出部9cによってv1C■2標
準バタン内の無ン)区間を検出し、無音区間が存在しな
い場合は、その−:L71、ノv1C■2イエ;I;v
(lτバタント距離割算手段9aに、1.って距π目1
算を行い、無音区間が存在する場合に1(Jl、■1C
v2標準バタン圧縮部9 bによっ−C、J’![: 
tri’区間を圧縮した標準バタンを作成し、距離W1
!;)一手段9aによって距離計算を行う。V、1CV
2標準パタンにおける無音区間は純粋な破裂音でなくと
も破裂性子音/b////d////q/−に特に現わ
れやすく、他の子音の場合においても、登録話者の発声
いかんによっては、生じる場合がある。この無音区間の
検出方法は第3図に示すように、前の母音中心(、VF
)の電力値P、(1VF)と後の母音中心(ivB)の
電力値Pt(ivB)を一定比率(C)倍したもの(P
θ1−Pt(、vF)×C1Pθ2 = P t (、
VB ) x C)と前もって定められ/こ閾値(pc
)の3つのレベルのうちの最大値のレベルを閾値(Pθ
−max(Pθ1.Pθ2.Pθ3))としてその閾値
以下の区間を無音区間として検出する。
第4図は、本発明の具体的な実施例としての連続音声認
識装置の動作W、理を示しており、図において、11は
入力音声が、/ヒバリが空に/と発声された場合を示し
ており、語頭4a〜語尾4bは、音声区間検出手段4に
よって検出される。母音定常部中心検出部6は入力音声
に対して語頭4aから順次、ピーク電力検出手段6aに
よって一定の閾値以上となる電力系列が一定フレーム長
以上連続しさらに母音識別手段6bによって識別された
母音が同一種類で一定フレーム長以」二連続する場合に
、そのJυ1゛1系列の中心とじ−C検出する〔□V1
゜□v2.・・・・・・、□v6] < IJ: i:
f−系列が2種類連続する場合は2重母音とし2てhノ
zの中心を検出する)。
そして母音定常部中心が検出さJzる4JJに、その前
の母音定常部中心との間に無);?区間が存在するか否
かを、無音区間(0ユ出「段5によって検出して、無音
区間開始、終」−[1SS1 5a、1SE1 6b:
][1SS2 5a、jsE2 5b:] として検出
する。/U音定常部中心(□■ )が検出されると、+
、V、1から乎均発声長+Llフレーム16手前に、語
頭4aもしくは、無音1メ間、終了5b (isEl 
、1sE2)が検出されている4、らp、r、語頭もし
くはス1!(音区間終了から(□v、1′?tでの区間
に対してCV標準バタン7aとバタンマツチング手段9
によってマツチングを行ない認識#l’l果とする。+
iV、lから平均発声長Lフレーl、161′=前に語
頭も力((音区間も検出されないなら11;J: 、平
均発声長(L)ンレーノ、16手前丑で含寸れる、1υ
1゛?定常部中心(□v、−p)から処理中の母音定常
j11X中心f、V、itでをVCVマツチング区間1
4として、1u音定常部中心のすべての組合せ(C1V
H−p 、i”]”〔]1VF−p+1’、v、・・・
・・・Civj −1’ t■j月の区間に対して特徴
系列記憶部8bと■C■標準パターン了すとの距離を、
バタンマツチング手段9によって計算し、最適なマンナ
ング範囲とVCV認識結果を決定する。さらに音声区間
検出手段4によって、発声語′ヒバリが空に711の語
尾4bが検出されると、総合制御手段10は、最終母音
定常部中心13fiV7)から語頭4a方向に母音定常
部中心をバックトレースする。つまり(iv7)では(
1V61が最適区間で認識結果は[ANi]、同様に(
iv61はf、V51で[ORA] 、 t ives
 )では無音区間終了(j、SE)が最適範囲で認識結
果は〔SO〕、(1■3)u (1V2) テ[ARi
 )、 (iv、2)Tハ(t”i ) −cCiBA
)、(、vl)では語頭4aが最適範囲で[Hi]が認
識された17とすると、総合制御手段10は認識結果1
6とシテ、HiBARi GA 5ORANiを出力す
る。
発明の効果 本発明は、入力音声を特徴ベクトル(Xti)と電力値
Pt1 の11.′l系列に変換したパラメータによっ
て、入力音声のGJ高定常中心と無音区間を検出し、入
力音声側で、無i′1区間の検出されていない隣接した
母音定?;;部中心間にV1Cv2標準パタンをマツチ
ングさせる場合に、v1Cv2標準パタンについても前
のN1゛1中心+ivr、+と後の母音中心(iVB)
の電力値I P【i” Fl + (” t l” B
 I K /JE比率をJJI)けたレベルと前もりて
定めたレベルのうちの最大値のレベルを用いて無音区間
を検出し、無音区間が存在する場合には、無音区間を圧
縮し7’iH,V1CV2標準パタンに」:って、マツ
チングを行って認識することにJ7りて、破裂性の子音
(/b// d// q// r/) 竹4)7JJ’
” Cv区間における音節認識率を改善するものである
【図面の簡単な説明】
第1図は本発明に、1.・ける一実施例のバタンマツチ
ング手段のブロック図、第2図は同実施例におけるバタ
ンマツチング手段の構成を示す図、第3図は同実施例に
おける■1C■2標準パタンの無音区間検出方法と無音
区間圧縮の概念図、第4図は同実M!1例の動作ろ一説
jJlするための図である。 2・・・・・電力系列液i!′!”’J”段、3・・・
・特徴系列変換手段、4・・・・・・1巧;・17間検
出手段、5・・・・・・無音区間検出手段、6・・・・
hJj昌jZ常部中心検出部、了・・・・・・標準バタ
ン記憶部、8・・・・・記憶部、9・・・・・・バタン
マツチング手段、1

Claims (1)

    【特許請求の範囲】
  1. 入力音声を特徴ベクトルの時系列(Xt、)(i=1.
    2.・・・・・・、N)に変換する特徴ベクトル系列変
    換手段と、入力音声を電力値の時系列(Pt11(i=
    1.2.・・・・・・、N)に変換する電力値系列変換
    手段と、前記電力値系列(pt、)のレベル検出と前記
    特徴ベクトル(Xt 、 )のフレーム毎の句す識別結
    果から母音定常部中心を検出する母音定常部中心検出手
    段とより成り、入力音声の隣接した母音定常部中心の範
    囲と、前もって登録したV1Cv2(vl:母音、C:
    子音、■2:母音)標準バタンをマツチングする際に、
    入力音声およびv1C■2標準バタンの母音定常部中心
    間の範囲内に、無音区間が存在するか否かを、前記電力
    値系列(pt□1のレベル判定によって検出しておき、
    無音区間が存在する場合には、無音区間を除いた範囲に
    ついてバタンマツチングを行う事を特徴とするバタンマ
    ツチング装置。
JP58186480A 1983-10-05 1983-10-05 パタンマツチング装置 Granted JPS6078494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58186480A JPS6078494A (ja) 1983-10-05 1983-10-05 パタンマツチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58186480A JPS6078494A (ja) 1983-10-05 1983-10-05 パタンマツチング装置

Publications (2)

Publication Number Publication Date
JPS6078494A true JPS6078494A (ja) 1985-05-04
JPH0554117B2 JPH0554117B2 (ja) 1993-08-11

Family

ID=16189215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58186480A Granted JPS6078494A (ja) 1983-10-05 1983-10-05 パタンマツチング装置

Country Status (1)

Country Link
JP (1) JPS6078494A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56138798A (en) * 1980-03-31 1981-10-29 Nippon Electric Co High speed voice recognition device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56138798A (en) * 1980-03-31 1981-10-29 Nippon Electric Co High speed voice recognition device

Also Published As

Publication number Publication date
JPH0554117B2 (ja) 1993-08-11

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS6138479B2 (ja)
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPS6078494A (ja) パタンマツチング装置
Thathong et al. Classification of Thai consonant naming using Thai tone.
JP2943445B2 (ja) 音声認識方法
JPS63217399A (ja) 音声区間検出装置
JP3110025B2 (ja) 発声変形検出装置
JP2979912B2 (ja) 音声認識装置
Kalinli et al. Continuous speech recognition using attention shift decoding with soft decision.
Kobayashi et al. Word boundary detection by pitch contours in an artificial language
JP2766393B2 (ja) 音声認識方式
JPH0455518B2 (ja)
JPS63161499A (ja) 音声認識装置
JPS6027433B2 (ja) 日本語情報入力装置
JPH05303391A (ja) 音声認識装置
JPH0449716B2 (ja)
JPS61149997A (ja) 音声認識装置
JPS59180598A (ja) 音声入力方式
Kaur et al. Automatic marking of Punjabi syllables boundaries in a sound file
JPS6312000A (ja) 音声認識装置
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPH0235500A (ja) 音声認識方式
JPS62218997A (ja) 単語音声認識装置
JPH0449953B2 (ja)