JPS60182498A - 音節標準パタンを用いた音声認識処理方式 - Google Patents

音節標準パタンを用いた音声認識処理方式

Info

Publication number
JPS60182498A
JPS60182498A JP59038414A JP3841484A JPS60182498A JP S60182498 A JPS60182498 A JP S60182498A JP 59038414 A JP59038414 A JP 59038414A JP 3841484 A JP3841484 A JP 3841484A JP S60182498 A JPS60182498 A JP S60182498A
Authority
JP
Japan
Prior art keywords
syllable
probability
standard
word
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59038414A
Other languages
English (en)
Other versions
JPH0331278B2 (ja
Inventor
藤崎 博也
広瀬 啓吉
智博 井上
光則 郡
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59038414A priority Critical patent/JPS60182498A/ja
Publication of JPS60182498A publication Critical patent/JPS60182498A/ja
Publication of JPH0331278B2 publication Critical patent/JPH0331278B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (A)発明の技術分野 本発明は、音節標準バタンを用いた音声認識処理方式、
特に各音節標準バタンと入力バタンを構成する音節との
距離計算を行うと共に、上記音節標準バタンに該当する
ものである確率(事後確率)を得るようにし、その結果
得られた所の入力バタンについての音節確率時系列情報
にもとづいて。
単語辞書の内容との照合を効率よく行うようにした音声
認識処理方式に関するものである。
(B)技術の背景と問題点 音声自動認識の究極的な目標は9語党・文型等に何らの
制約も課することなく、任意の内容の音声を言語記号に
正しく変換しうろことであり、これには音素を認識の単
位とすることが必要となる。
しかしながら、音素の特徴は、調音結合によっC大きく
変動するため、現在のところすべての音素を正確に認識
し得る手法は知られていない。
一方、給電を限定すれば、単語を認識単位とすることに
よってこの問題をほとんど回避することができ、高い認
識率を達成し得る方式がすでに実用化されている。しか
しながら後者の欠点は、対象となる給電が大きくなると
、記t9容量・演算時間の両面での要求が過大となるこ
とである。音素または単語を単位とするこれらの方式の
問題点をある程度回避するには、音節またはそれと類似
のものを暴本的華位とすることが考えられる。特に日本
語では、他の言語と比べて基本となる音節の数がかなり
少ないという利点がある。
音節を認識の単位とする場合、未知入力音声を既知の音
節標準バタンと比較して、標準バタンを識別することに
より未知入力音声を認識することができる。この場合、
音節標準バタンか不正確なものでは未知入力音声に対す
る識別精度が低下する。このため、音節標準バタンをど
のようにして作成するかということは重要な問題となる
一般に音節標準バタンとして望まれる性質は。
音節標準バタンと同じ音節の入力に対して距離が小さく
、異なる音節の入力に対して距離が大きくなることであ
る。このような音節標準バタンを作成する方法としては
次のような手順に基づく方法を2本発明者等は先に提案
している。即ち、fil 用意した音声試料の中から1
つを選んで音節標準バタン候補とする。このとき、この
音節標準バタン候補と同一の音節のバタン群をA群とす
る。
例えば/KE/の音節標準バタンを作成するとき。
/K E/を含む音節バタン群/へKE/、/IKE/
、/UKE/、/EKE/、10KE/等がA群となる
。他方、/KE/を含まない音節バタン群をB群とする
。例えば、/KE/を含まない音節バタン群/ASA/
、/ISE/、/USE/、/ESE/、10SE/、
/TAB I/、/TUTE/等がB群となる。B群は
複数の音節から成っているのでその1つ1つをBi群と
する。
(2)音節標準パワに候補に対して、始点、終点。
パワーの重み係数を仮に設定し、A群およびBi群の各
バタンとの距離を計算する。これにより。
第1図に示すようにA群とBi群との距離分布が得られ
る。これらが第1図に示すように正規分布をなずものと
仮定すると、各分布の平均および標準偏差が得られ、こ
れらの値から各分布の確率密度を次式のよ・)に計算す
ることができる。
A群とB群の分布の重なりを表す評価指標をPeとする
と、Peは次式によって与えられる。
P、、dχ□(3) ここでtは次式で与えられる。
p (x l A) ・PA −Σp(xlB; ) 
・Psr−0(41(3)始点、終点、パワーの重み係
数のすべての組み合わせに対して、評価指標Peを計算
し、Peの最小値を与える組み合わせをめる。
(4)以上の手順を、その音節のすべての標準バタン候
補に対して行い、評価指標Peの最小値を与える標準バ
タン候補を選択して音節標準バタンとする。
このように標準バタン毎に最適化を行って標準バタンを
作成するのでA群、B群の分布が最もよく分離している
標準バタンを得ることができる。
例えば2以上のようにして作成された音節標準バタンを
認識の単位とする従来の音声認、織方式を。
第2図に示す。図中、1は特徴抽出部、2ば距離計算部
、3は音節標準バタン登録部、4は判別部である。この
従来方式によれは、未知入力音声の特定部分が特徴抽出
部1に供給されると、抽出部は特徴を抽出して距離計算
部2に送る。音節標準バタン登録部3には、すべての音
節標準バタンか登録されており3距離計算部2において
、前記特徴のバタンと登録部3に登録されている全部の
音節標準バタンとの間の距離を個々に計算する。その計
算結果は1判別部4に送られる。判別部4では距離の最
も小さい音節標準バタンか入力バタンに相当しているも
のと判別し9判別結果を出力する。すなわち、距離の大
小によってのみ音節の判別を行っている。
以上の手順を、未知人力音声の音節を単位として連続的
に行えば未知入力音声を認識することができる。
しかし、この従来の音声認識方式のみでは次のような欠
点がある。すなわち、前述したような音節標準バタンの
作成の方法では、他のバタンとの距離が全体的に小さい
もの、あるいは全体的に大きいものが生ずることがあり
、このため単純に距離の大小だけによって音節の判別を
行うと、距離の全体的に小さい方に判別結果が偏り、誤
識別が多くなる。−例を第3図に基づいて説明する。第
3図(alは/K E/の最適音節標準バタンに対する
A−B群の分布である。第3図fblは/S U/の最
適音節標準バタンに対するA−B群の分布である。
ある入力バタン/SU/がある場合に、/KE/の音節
標準バタンとの距^IIがxlで、/SU/の音節標準
バタンとの距離がx2である場合に、第3図(δ)の分
布を見れば明らかなように、距離がxlのとき/K E
/である確率はほぼ0であり、また第3図(blの分布
を見れば明らかなように、距離が。
x2のとき/S U/である確率はほぼ1であることが
わかり、正確に判別することができる。しかし、単純に
距離を比較した場合には+ X l 〈x2であるから
入力バタン/S U/は/ K F、 /であると誤っ
て判別されることとなる。
この点を解決するために成る種の対策を講することが必
要であり、また当該対策をとった場合においてデータ処
理量が適正な範囲におさまることが望まれる。
(C)発明の目的と構成 本発明は上記の対策をとった音声認識処理方式を提供す
ることを目的とし、入力バタン上の音節と上記音節標準
バタンiとの距離が計算されたとき、当該入力バタン上
の音節がその音節標準バタン1である確率を表す事後確
率を用い、単語辞書の内容と照合するようにした音声認
識処理方式を提供することを目的としている。そしてそ
のため。
本発明の音節標4!バタンを用いた音声認識処理方式は
、音節標準バタンか登録される音節標準バタン登録部。
上記音節標準バタンを作成する際に抽出される確率パラ
メータを格納する確率パラメータ格納部。
入力バタンと上記音節標準バタン登録部に登録されてい
る各音節標準バタンとの間の距離を計算する距離計算部
該距離計算部によって計算された上記距離と上記確率パ
ラメータ格納部に格納されている確率パラメータとから
、上記人力バタンか上記距離の計算された音節標準バタ
ンである確率を表す事後確率を上記個々の距離について
計算する事後確率計算部。
該事後確率計算部において上記入力バタンを構成する各
音節候補について得られた確率ラティスをデータ圧縮し
て、当該入力バタンを構成する音節確率時系列情報を得
るデータ圧縮部5標準単語についての音節情報が格納さ
れている単語辞書部。
および上記人力バタンから抽出された音節確率時系列情
報と上記単語辞書部から読み出された標準単語について
の音節情報との照合を行う単語マツチング処理部。
をそなえ、上記単語マツチング処理部は。
上記単語辞書部に格納されている各単語における音節系
列と対応する音節についての上記音節確率時系列情報中
の確率から得られる先度と上記単語辞書部に格納されて
いる当該各単語における少なくとも音節系列と対応する
音節についての上記音節確率時系列情報中の出現時間間
隔から得られる先度と から総合先度をめ、単語照合を行うことを特徴としてい
る。以下図面を参照しつつ説明する。
(D)発明の実施例 第4図fat (blは入力バタン上の音節が成る音節
標準バタンIである確率を表す事後確率について説明す
る説明図、第5図は本発明の音声認識処理方式の一実施
例を示すブロック図、第6図ta)は本願にいう確率ラ
ティスを表す説明図、第6図(blは当816u率ラテ
ィスから抽出されたシラブル・パラメータを表す説明図
、第7図は本発明に用いられる単語辞書部の内容を説明
する説明図、第8図は第5図図示の単語マツチング処理
部における処理を説明するための説明図、第9図は本発
明を通用した場合の認識率を説明する説明図を示す。
本発明の音声認識処理方式の場合には、第3図(alや
第3図(b1図示の如きA−8分布が上述の音節標準バ
タンを作成したときに得られていることを利用し1本発
明にいう事後確率を入力バタンに対する認識モード時に
簡単に得られるようにしている。即ち事後確率は+11
. (21式で定義されるp (xIA)、p (x 
iB i)を用いて次式で表される。
第4図(alおよび(b)に−例として、A−B群の分
布と、そのときの事後確率P(^lx)をそれぞれ示す
。第4図(b)において距離がx3より大きい場合には
、入力バタンか第4図ta+の音節標準バタンである確
率は0であり、距離がX、より小さくなるに従って確率
は増大する。したがって、第4図fb)の事後確率に基
づいて入力バタンの判別を行えば。
少なくとも距離がx3より大きい場合には、第4図(a
)の標準バタンであるとするような誤った判別をされる
おそれはなくなる。このため未知人力音声の認識率が非
常に高くなる。
第5図図示の一実施例ブロック図において、5は音節標
準バタン作成モード時の入力音声に対する特徴抽出部で
あって入力音声から特徴パラメータを抽出するもの、6
はセグメンテーション部であって上記(31,+41式
に示した如き評価指標Peを用いて音節標イ1ζバタン
を抽出するもの、7は音節標準バタン登録部であって上
述の如く抽出された複数個の音節標準バタンか格納され
るもの、8は確率パラメータ格納部であって各音節標準
バタンに対応して上記(1)式、(2)式に関連するp
 (x l A)やp (x l Bi)を得るための
データや上記(5)式に関連するパラメータP (A)
 とP(Bi) とNなどが格納されるもの、9ば入力
バタンに対する認識モート時の入力音声に対する特徴抽
出部であって入力バタンから特徴パラメータを時系列に
抽出するもの。
10は距離計算部であって後述する如く音節連続1合を
行って入力バタン上の各フレーム毎に音節標準バタンと
の距h]計算を行うもの、11ば事後確率計算部であっ
て上記(5)式に対応する事後確率を逐次計算して本発
明にいう確率ラティスを得るもの、12はデータ圧縮部
であって上記確率ラティスから例えば第6図(b1図示
の如きシラブル・パラメータ(本発明にいう音節確率時
系列情報の1実施例)を得るもの、13ば単語辞書部で
あって各標準単語についての音節情報が格納されている
もの、14は単語マツチング処理部を表している。
上記音節標準バタン登録部7においては上述した如き形
で得られた各音節標準バタンか登録されており、また確
率パラメータ格納部8においては各音節標準バタンに対
応した形でL記(1)式や(2)式に示ずp(×1^)
とIll (x l Bi)とを得るに必要なパラメー
タや上記(5)式に関連するパラメータP (A)とP
(Bi)とNとなどが登録されている。この状態の下で
、未知入力バタンか例えば16KH2精度、12ビット
でザンブリングされ、プリエンファシスの後に20m5
ecのハミング窓で切り出され、15次のLP(Jプス
I・ラム係数に変換される。ケプストラム0次項は、パ
ワー成分として利用される。フレーム間陥は5 m5e
cとなっている。
図示実施例において、入力バタンは音節毎にセグメンテ
ーションすることなく入力バタン全体にわたって、距離
計算部10において、各フレーム時点で、音節標準バタ
ンとの距離が計算される。
この状態を音節連続照合と呼んでいる。各フレーム毎に
行われる距離計算は次の如き式にしたかって行われる。
D(X、に、S) −ΣΣ(Xl、3.J−3IJ)2
・ω8J−(6)更に上記(6)式においてω、4は次
の如く与えられる。
上述の如く連続照合が行われ距離計算が行われるとき、
事後確率計算部11において上記(5)式に示した如き
事後確率が計算される。当該事後確率は、入力バタンの
音節Xが成る1つの音節標準バタンに対応する上述のA
群に属する確率を表している。
このような事後確率が計算されると、事後確率計算部1
1においては、第6図(a)図示の如き確率ラティスが
抽出される。即ち、今人カバタンが/ ta ka m
a tsu /であったとしたとき、入力バタンの始点
から。
〔I〕 約200m5ec近傍において、 (1)音節
標準バタン/pa/に対して値IO,IJ程度の確率を
もち、(ii)音節標準バタン/La/に対して値r 
O,3J程度のるを率をもち、(iii)音節標イ1(
バタン/ka/に対して値r O,1j程度のモイ「率
をもつ音節が存在していること。
(II) 約500m5ec近傍において、 (1)音
節標準バタン/ka/に対して値r O,6J程度の確
率をもち、(ii)音節標準バタン/sa/に対して埴
rO,08J程度の確率をもつ音節が存在していること
(III) 約750m5ec近傍におい一〇 (1)
音節標準バタン/ma/に対して値ro、08J程度の
U(l:率をもち、(ii)音節標準バタン/ra/に
対して値IO,05J程度の確率をもつ音節が存在して
いること。
(IV) 約1000 m5ec近傍において、 (1
)音節標準バタン/lsu/に対して値I−0,9J程
度の偵「率をもち、(ii)音節標準バタン/su/に
対して値r 0.4 J程度の確率をもつ音節が存在し
Cいること。
が確率ラティス上に示される形となる。なお第6図(a
lにおいて各音節標準バタンに対する確率が時間を横軸
として誤差関数的になっているのは各時点毎の確率をプ
ロットしたとき誤差関数的なものとなっていることによ
る。
第6図(a1図示の如き確率ラティスが抽出されると、
当該確率ラティスを利用して、入力バタンか属する単語
を認識することができる。即ら、今。
認識対象の単語として第7図図示の如く地名を表す単語
が存在し3.#語辞書部13上に格納されているものと
するとき、上記入力バタンの確率ラティスにもとづいて
(i) /ka/−/、sa/−/ma/ /lsu 
/である確率 (ii) /ka/−/ra/ /lsu /である確
率(iii ) / ta/ /ka/ / tsu 
/である確率の如く、第5図図示の単語マツチング処理
部14においてそれぞれの確率を計算して、所望の単語
認識を行えば足りる。しかし、第6図fa1図示の確率
ラティスの場合には、入力バタンの全時点における確率
値が盛り込まれていて、辞書照合の対象としては冗長性
が大で処理量を増大させる原因となる。このために、第
5図図示実施例の場合には。
データ圧縮部12において、第6図ta+図示の如き確
率ラティスから第6図(b1図示の如き音節確率時系列
情報にデータ圧縮を行うようにしている。第6図(b1
図示の場合には、第6図(a1図示の確率ラティスにお
いて、各可能性のある音節標準バタンに対しての確率の
ピーク点の時点と確率値とのみを抽出し、他の情報を切
り捨てるようにしている。
第6図fb)図示の如きデータ圧縮された情報を1本明
細書において、シラブル・パラメータとりんでいる。
第5図図実施例において、i語辞書部13上には第7図
図示の如き形で各単語が登録され”ζいる。そして、第
5図図示の単語マツチング処理部14は、上記シラブル
・パラメータを用いて5図示の場合には合計9つの時点
についての確率4算処理を行って、単語認識を行うよう
にする。上記単語辞書部の内容と上記シラブル・ノ々ラ
メークとを用いて卑語認識を行う態様は任意に考えるこ
とができるが、最も簡単には1例えば単語/ka/ −
/sa/ /ma/ /lsu /に対して、上記シラ
フ′ル・パラメータにおける第1音節が、/ka/であ
る確率と第2音節が/sa/である確率と第3音節が/
ma/である確率と第4音節が/lsu/である確率と
の相乗平均値を調べるようにすればよ0゜当該態様は、
当該態様にもとづ(尤度La として次の如く定められ
いるものと対応すると考えてよし)。
L a −(II P i ) ’ −(81しかしこ
の態様のみにもとづく評価を行う場合には、辞書内の単
語/la/−/ka/ /ma/ /lsu /に対す
る先度(本来認識されるべき単語に対する尤度)が、上
記第6図(b1図示のシラブル・バラメークの場合に値
IO,71jであるのに対して9次の如き場合が生じる
。即ぢ、辞書内の単語/↓a/−/ka/ /lsu 
/に対して上記尤度が埴ro、76jとなり、また辞書
内の単語/ tsu /に対して上記先度が値rO,9
0Jとなることか生じる。このために、上記単語/ls
u/が最尤度をもつ単語として非所望に詞1されてしま
うことか生しる。
このような誤認識を生しるのは9例えは上記単語/la
/ /ka/ /lsu/につU)で言えしよ、当該単
語におりる音節系列中の音節/lsu/’が非所望に遅
れて現れている点を無視したことも1つの原因である。
また上記単語/lsu/についても同様なことが言える
。むしろこのような場合にはマイナス評価を行うべきで
ある。1411ら時間間隔の要素を考慮して評価すべき
である。これは、第1番目の音節が上記シラブル・パラ
メータ上で現れた後に第(i÷1)番目の音節が上記シ
ラブル・ノくラメータ上で現れたとしても極端に早く現
れた場合や。
極端に遅く現れた場合には、多少マイナス評価を行うべ
きであることを意味している。
このために、第8図図示の如き評価関数E(t)を考え
E(0)=0かつE(oo)=OかつE(TS)=1な
る条件を満足すべきものとする。但し、’rsは第(i
+1)番目の音節が現れるであろう標準時間間隔であり
、実際には発話速度のバラツキを考慮して、第8図図示
の如く。
E (t)=t/TB (t<T、において)−1(T
R< t < ”rs /”rnにおいて)このような
評価関数E (t)を考慮した態様は。
当該態様にもとづく先度し、として次の如く定めている
ものに対応すると考えてよい。
当該(10)式にて示す尤度Lbを上記尤度L8と一緒
に考慮して、総合尤度りとして α β L = L a−Lb−’(11) (但し、α、β、二重み) を定義し、当該総合尤度りのより高い単語を最尤度をも
つ単語として抽出することにより、更に優れた認識率を
得ることが可能となる。なお本発明の主張するところは
3本実施例に挙げた総合先度及び各個別尤度の関数に限
られないことは当然である。
第9図は2本発明を適用した場合の正答認識率を説明す
る説明図を示している。図示においては。
認識対象の単語数がn個存在しているとしたときの認識
率をプ四ノドしたものである。実験に当たっては1女性
話者1名がアナウンス・ブース内で。
日本語68音節および12拗音の480音節について、
C■音節については4回ずつ、VCV音節については3
回ずつ発声した計1520サンプルを用意し、上記音節
標準バタンを作成した。そして。
日本の都市名を1000隼語分用意して、単語辞書部に
登録した。該登録に当たって、認識対象単語数がn個と
は、上記1000単語の中からn個を抽出して単語辞書
部に登録したことを意味している。認識シミュレーショ
ンにおいては、100都市名を各2回ずつ3モ一ラ/秒
で発声した200サンプルを用意した。
第9図図示曲VAAは上記(8)式による先度り、のみ
を用いて行った認識率を表し1曲線Bは上記(11)式
による総合尤度りを用いて行った認識率を表している。
図から判る如く2曲線Bの場合に。
認識率が大幅に向上していることが判る。
(E )発明の詳細 な説明した如く1本発明によれば、認識モード時に効率
的に圧縮された音節確率時系列情報を得て、単語辞書中
の音節系列情報を有効に利用した照合を行うことにより
、処理量を大幅に増大せしめることなく適確な単語認識
を行うことが可能となる。
【図面の簡単な説明】
第1図はA群およびB1群の距離分布を示す図。 第2図は従来の音声認識方式を示ずブr+/り図。 第3図は従来の音声認識方式の欠点を説明するだめのA
−B群の距離分布を示す図、第4図(al tb+は入
カバクン上の音節が成る音節標準パタンlである確率を
表す事後確率について説明する説明図。 第5図は本発明の音声認識処理方式の一実施例を示すブ
ロック図、第6図(a+は本願にいう僅率うケイスを表
す説明図、第6図(blは当該確率ラティスから抽出さ
れたシラブル・パラメータを表す説明図、第7図は本発
明に用いられる単語辞賓部の内容を説明する説明図、第
8図は第5121図示の単語マツチング処理部における
処理を説明するための説明図、第9図は本発明を適用し
た場合の認識率を説明する説明図を示す。 図中、5は特徴抽出部、6はセグメンテーソヨン部、7
は音節標準バタン登録部、8は6亀率パラメ一タ格納部
、9は特徴抽出部、10は距離計算部、11は事後確率
計算部、12はデータ圧縮部13は単語辞書部、14は
単語マツチング処理部を表す。 特許出願人 藤 崎 博 也(外1名)代理人弁理士 
森 1) 寛(外1名)了巨 i# ヱ 隼1 目 第2凪 1 エ 第40 や− − 才G図 27図 千8m す9 (2) 一嬰詐げ−を象ψ話跋(九)

Claims (1)

  1. 【特許請求の範囲】 音節標準バタンか登録される音節標準バタン登録部。 上記音節標準バタンを作成する際に抽出される確率パラ
    メータを格納する確率パラメータ格納部。 入力バタンと上記音節標準バタン登録部に登録されてい
    る各音節標準バタンとの間の距離を計算する距離計算部
    。 該距離計算部によって計算された上記距離と上記確率パ
    ラメータ格納部に格納されている確率パラメータとから
    、上記入力バタンか上記距離の言1算された音節標準バ
    タンである確率を表す事後確率を上記価々の距離につい
    て計算する事後確率計算部。 該事後確率計算部において上記入力バタンを構成する各
    音節候補について得られた確率ラティスをデータ圧縮し
    て、当該入力バタンを構成する音節確率時系列情報を得
    るデータ圧縮部。 標準単語についての音節情報が格納されている単語辞書
    部。 および上記入力バタンから抽出された音節確率時系列情
    報と上記単語辞書部から読み出された標準単語について
    の音節情報との照合を行う単語マツチング処理部。 をそなえ、」二記単語マツチング処理部は。 上記単語辞書部に格納されている各単語における音節系
    列と対応する音節についての上記音節確率時系列情報中
    の確率から得られる先度と上記単語辞書部に格納されて
    いる当該各j1語における少なくとも音節系列と対応す
    る音節についての上記音節確率時系列情報中の出現時間
    間隔から得られる尤度と から総合尤度をめ、単語照合を行うことを特徴とする音
    節標準バタンを用いた音声認識処理方式。
JP59038414A 1984-02-29 1984-02-29 音節標準パタンを用いた音声認識処理方式 Granted JPS60182498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59038414A JPS60182498A (ja) 1984-02-29 1984-02-29 音節標準パタンを用いた音声認識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59038414A JPS60182498A (ja) 1984-02-29 1984-02-29 音節標準パタンを用いた音声認識処理方式

Publications (2)

Publication Number Publication Date
JPS60182498A true JPS60182498A (ja) 1985-09-18
JPH0331278B2 JPH0331278B2 (ja) 1991-05-02

Family

ID=12524641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59038414A Granted JPS60182498A (ja) 1984-02-29 1984-02-29 音節標準パタンを用いた音声認識処理方式

Country Status (1)

Country Link
JP (1) JPS60182498A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56111897A (en) * 1980-02-08 1981-09-03 Fujitsu Ltd Ward unit voice recognizing system utilizing monoosylable voice recogniton
JPS5938412A (ja) * 1982-08-24 1984-03-02 Ishikawajima Constr Material Co Ltd 水門
JPS5938413A (ja) * 1982-08-24 1984-03-02 Asahi Giken Kk 水面浮遊油の回収方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56111897A (en) * 1980-02-08 1981-09-03 Fujitsu Ltd Ward unit voice recognizing system utilizing monoosylable voice recogniton
JPS5938412A (ja) * 1982-08-24 1984-03-02 Ishikawajima Constr Material Co Ltd 水門
JPS5938413A (ja) * 1982-08-24 1984-03-02 Asahi Giken Kk 水面浮遊油の回収方法及び装置

Also Published As

Publication number Publication date
JPH0331278B2 (ja) 1991-05-02

Similar Documents

Publication Publication Date Title
White et al. Speech recognition experiments with linear predication, bandpass filtering, and dynamic programming
JP2527168B2 (ja) 音響信号から導かれた電気信号を区分する方法及び装置
CN102056026B (zh) 音视频同步检测方法及其系统、语音检测方法及其系统
US5692097A (en) Voice recognition method for recognizing a word in speech
CN103943107A (zh) 一种基于决策层融合的音视频关键词识别方法
CN111883176B (zh) 端到端的智能语音朗读评测方法
CN110265035A (zh) 一种基于深度学习的说话人识别方法
CN111091840A (zh) 一种建立性别识别模型的方法及性别识别方法
CN116312552A (zh) 一种视频说话人日志方法及系统
KR102429656B1 (ko) 화자 인식을 위한 음성인식기 기반 풀링 기법의 화자 임베딩 추출 방법 및 시스템, 그리고 이를 위한 기록매체
JPH0250198A (ja) 音声認識システム
CN120358390B (zh) 基于多模态的新闻拆条控制方法及系统
JPS60182498A (ja) 音節標準パタンを用いた音声認識処理方式
CN116266454A (zh) 多方言语音识别方法、装置、计算机设备和存储介质
CN112951212A (zh) 一种多个说话人的语音转折点检测方法及装置
JPS60182496A (ja) 音節標準パタンを用いた音声認識処理方式
CN113948093B (zh) 一种基于无监督场景适应的说话人识别方法及系统
JPH10261083A (ja) 個人同定装置及び個人同定方法
JP2000099090A (ja) 記号列を用いた話者認識方法
JPH0331277B2 (ja)
US5956677A (en) Speech recognizer having a speech data memory storing speech data and a reference pattern memory storing partial symbol trains of words for recognition
JP3058569B2 (ja) 話者照合方法及び装置
JPH06324699A (ja) 連続音声認識装置
KR20050043472A (ko) 고유음성 화자적응을 이용한 재귀적 화자적응 음성인식시스템 및 방법
JPS5898794A (ja) パタンマツチング装置