JPS5960499A - 単語音声認識方式 - Google Patents

単語音声認識方式

Info

Publication number
JPS5960499A
JPS5960499A JP57171571A JP17157182A JPS5960499A JP S5960499 A JPS5960499 A JP S5960499A JP 57171571 A JP57171571 A JP 57171571A JP 17157182 A JP17157182 A JP 17157182A JP S5960499 A JPS5960499 A JP S5960499A
Authority
JP
Japan
Prior art keywords
time series
parameter time
input
parameter
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57171571A
Other languages
English (en)
Other versions
JPH0115079B2 (ja
Inventor
佐藤 泰雄
杉田 忠靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57171571A priority Critical patent/JPS5960499A/ja
Publication of JPS5960499A publication Critical patent/JPS5960499A/ja
Publication of JPH0115079B2 publication Critical patent/JPH0115079B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A1発明の技術分野 本発明は単語音声認識方式、特に未知入力単語音声につ
いての入力特徴パラメータ時系列から。
種々の単語長に対応して効率よく認識できるように、複
数の区間分割による複数の入力縮小パラメータ時系列を
生成し、登録単語長に応じた時系列長をもつ登録縮小パ
ラメータ時系列と、上記複数の入力縮小パラメータ時系
列の中の同じ時系列長をもつものとを逐次照合して、認
識対象候補単語を選び出すようにした単語音声認識方式
に関するものである。
B、従来技術と問題点 音声認識システムにおいては、音声信号の周波数分析結
果を利用して各音素の特徴を表わす特徴パラメータを抽
出し、該抽出された特徴パラメrりと登録単語に対応し
た予め登録されている特徴パラメータと照合して未知入
力音声の認識を行なうようにされる。即ち上記特徴パラ
メータとして例えば第1ホルマント周波数および第2ホ
ルマント周波数寿どをサンプリングしてこのパラメータ
を使用するようにされる。しかし、上記照合に当ってデ
ータ処理量が大となり、認識カテゴリ数が大となるにつ
れて上記照合処理に要する時間が大となる。
そこで、特願昭52−43972号、特願昭53−53
966号、特願昭53−53967号、特願昭53−5
3965号等にみられるように、より少ない数の照合す
べき特徴量のもとで認識率を高める方式が。
種々提案されている。
特に2本発明者らは、特願昭55−62059号によっ
て、比較的簡単なアルゴリズムの下で、効率よく認識対
象単語候補を決定する方式を提案している。該方式は、
入力音声についての入力特徴パラメータ時系列を少数の
区間に区分し、各区間毎にパラメータ値を平均化した平
均値からなる縮小特徴パラメータ時系列を抽出し、当該
縮小特徴パラメータ時系列によって認識対象候補単語を
選び出し、該候補単語に対して照合をとるようにして処
理速度を大幅に向上するようにしたものである。
この方式によれば、照合し候補を決定するための演算に
当って2例えば5個というようなあらかじめ定められた
少ない個数の平均値パラメータ相互の演算で足り、演算
時間が大幅に短縮される。
一般に認識対象となる単語には、単語長の長いものと短
いものとが混在している。単語の長さに無関係に照合す
べきパラメータ数があらかじめ決定されている上記従来
の方式は、処理の簡便さからみると、1つの長所をもつ
と考えられるが、どのような単語についても認識精度を
一定以上に保つことを考えれば、単語長に応じて照合す
べきパラメータ数、すなわち登録パラメータ時系列長を
変えることができれば、更に効率的な認識が可能になる
と考えられる。
C0発明の目的と構成 本発明は上記の点圧着目して、上記従来の方式を改良・
全点させ、認識率を低下させることなく、処理速度の向
上および登録辞書のメモリ量の節減を可能にすることを
目的としている。そのため2本発明は、入力音声に対し
て複数の単語長を仮定して、数種の長さの入力縮小パラ
メータ時系列を求め、照合の際、登録単語長に応じたパ
ラメータ時系列でもって照合するようにしたものである
。すなわち2本発明の単語音声認識方式は、未知入力単
語音声の音声信号を分析し、当該音声信号から抽出され
た入力特徴パラメータ時系列をもどに、所定の区分によ
り分割された各区間内のパラメータ値を平均した値また
は区間境界値からなる入力縮小パラメータ時系列を生成
するよう構成され、該入力縮小パラメータ時系列と、予
め登録されている登録縮小パラメータ時系列とを照合し
て、未知入力単語音声の認識を行う単語音声認識方式に
おいて、上記未知入力単語音声の始端から終端までの上
記区間分割についての区分数を複数個あらかじめ定め、
該区分数の異なる各区間分割に対応するパラメータ時系
列長の異なる複数種類の入力縮小パラメータ時系列を、
当該入力特徴パラメータ時系列から生成するよう構成さ
れ、あらかじめ登録単語毎に定められたパラメータ時系
列長を有する登録縮小パラメータ時系列と、上記複数種
類の入力縮小パラメータ時系列のうち照合する登録単語
と同じパラメータ時系列長を有する入力縮小パラメり時
系列とを照合することによって、認識対象候補単語を決
定するようにしたことを特徴としている。以下図面を参
照しつつ説明する。
D1発明の実施例 第1図は登録単語とパラメータ時系列長との関係を説明
するための説明図、第2図は本発明における縮小パラメ
ータ時系列を生成する処理例を説明するための説明図、
第3図は本発明における縮小パラメータ時系列を生成す
る他の処理例を説明するための説明図、第4図は本発明
の一実施例構成、第5図は上記第3図に対応した処理例
における区間決定を行う処理についてフローチャートの
形で表わした説明図を示す。
例えば、登録単語が地名であるとすると、第1図図示の
如く、登録単語には「北海道」のように単語長が比較的
長いものや、「津」のように短いもの、また「東京」の
ように平均的なもの等1種々存在する。一般に、長い単
語のものほど、短い単語のものに比べて、多くの特徴変
化を含んでいると考えられる。本発明におりては、入力
音声についての入力特徴パラメータ時系列から、より少
ない数の入力縮小パラメータ時系列を生成して。
それでもって、あらかじめ同一の手法で抽出され登録さ
れている登録縮小パラメータ時系列と照合することを前
提としているが、多くの特徴変化を含む長い単語のもの
は、パラメータ時系列長の大きいもので照合し、短い単
語のものは、パラメータ時系列長の小さいもので照合し
たほうが、認識精度と処理速度とのバランスの点から望
しいと言うことができる。従って、第1図に示す如く、
登録単語長に応じて1例えば「北海道」については登録
のパラメータ時系列長が“5”、「津」については3″
というように、あらかじめパラメータ時系列長が定めら
れ、その時系夕は長に対応した登録縮小パラメータ時系
列が登録される。
しかし、未知入力単語音声から求める入力縮小パラメー
タ時系列については、いくらの時系列長にすればよいか
は、不明であり、照合の際、同じ時系列長のもので照合
する必要があるので2本発明においては、後に詳述す′
る如く、入力縮小パラメータ時系列について、あらかじ
め定められたすべての時系列長のものを用意するように
される。
パラメータ時系列長が与えられているときの縮小パラメ
ータ時系列の生成は9例えば次のように行われる。
第2図図示の如く2時点ToからTEまでの間に。
サンプリングされた特徴パラメータPが存在するものと
するとき1例えばパラメータ時系列長Nfとして“5”
のものが必要である場合に9時点T。から1’!+まで
の時間を5つに等分し9時点TE15,2T。
/ 5 p  3 TE / 5 y  4 TE /
 5 + Ty;−を決定する。そして1時点゛I゛。
ないしTE15までの間の各特徴パラメータ値を平均し
9時点TE15ないし2T、15までの間の各特徴パラ
メータ値を平均し、・・・・・・時点4TE15ないし
T、までの間の各特徴パラメータ値を平均し、5個の平
均値パラメータよりなる縮小パラメータ時系列を抽出す
るようにする。
また2時間を等分するのではなく、第3図図示の如く、
特徴パラメータの累積変動量を等分することによって、
定められたパラメータ時系列長の縮小パラメータ時系列
を生成するようにしてもよい。
第3図に示す例の場合、第2図に示す例において゛時間
軸上で等間隔に区分されるのに対して、特徴パラメータ
の変化率が比較的大きい箇所での区間間隔を小に選ぶよ
うにしている。即ち、特徴パラメータPが第2図図示の
如くあるものとするとき、このパラメータPの変動量を
累積した値即ち累積変動量を第3図図示の如く時間を横
軸にとって描く。このように描かれた図形について、累
積変動量の最大値TAVを5等分した値−!−TAV。
・・・・・・どなる時点’rlt ’r2t・・・・・
・TEを抽出し1時点T。
からT1までの間の第2図図示の各特徴パラメータ値を
平均し2時点TlからT2までの間の第2図図示の各特
徴パラメータ値を平均し、・・・・・・2時点T4から
TEまでの間の第2図図示の各特徴パラメータ値を平均
し、5個の平均値パラメータよりなる縮小パラメータ時
系列を抽出するようにする。パラメータ時系列長が9例
えば3゛の縮小パラメータ時系列を求める場合には、勿
論3個の区間に分割し。
それぞれの区間の平均値パラメータよりなる縮小パラメ
ータ時系列を抽出するようにする。
上記縮小パラメータ時系列の平均値パラメータについて
は9例えば特願昭55−62059号に示されているよ
うにして演算されるが9周知となっているので、詳細な
説明は省略する。
なお、上記特徴パラメータ値を平均する代わりに、簡略
化して1区間境界値からなる縮小バラメ−夕時系列を抽
出するようにしてもよい。
第4図は本発明の一実施例構成を示す。図中の符号1は
帯域フィルタ群、2はパラメータ抽出回路、3はパラメ
ータ平均区間決定回路、  4tj:パラメータ平均回
路、5は切替回路、6は登録単語縮小パラメータ時系列
登録部、7−1ないし7−nは各パラメータ時系列長N
1−Nn毎の入力縮小パラメータ時系列バッファ、8は
縮小パラメータ時系列照合部、9は候補単語判定部を表
わす。
“□ 入力音声信号が帯域フィルタ群1に入力され。
パラメータ抽出回路2によって入力音声信号に対応した
入力特徴パラメータが抽出される、パラメータ平均区間
決定回路3は9例えばパラメータ時系列長としてN、か
らNnまでn種類定められている塾とすると、各パラメ
ータ時系列長N7毎に、第2図に示した例で言えば9時
点TIを抽出した上で、T。
ないしTgまでの間をN1等分した時点Tg /Nf 
、 2 TE/Nl 、 3 TE 7Nf、・・・・
・・、TEをそれぞれ決定する。
なお第3図図示の時点’r11 T2・・・・・・につ
いては第5図を参照して後述する。上記時点にもとづい
て区間が決定されると、パラメータ平均回路4は入力特
徴パラメータにもとづいて各区間毎にパラメータ値の平
均値を演算する。
パラメータ平均区間決定回路3およびパラメータ平均回
路4を、パラメータ時系列長N、−Nnに対応して、そ
れぞれn個設けて、並列的に処理するようにしてもよい
し、1個の回路を繰り返し使用することにより、直列的
に処理するようにしてもよい。
切替回路5は、登録モードと、認識モードにおける各入
力縮小パラメータ時系列バッファ7−1〜7−nとを切
替える回路である。登録モードの場合、登録する単語の
単語長はわかっているので。
予め適当なパラメータ時系列長N7を単語毎に定めてお
くことができる。従って、パラメータ平均回路4によっ
て、その適当なパラメータ時系列長N7をもつ縮小パラ
メータ時系列を抽出し、登録単語縮小パラメータ時系列
登録部6に登録単語の文字コードとともに登録する。
認識モードの場合、入力音声の単語長は不明である。従
って、上述の如く、すべてのパラメータ時系列長N1〜
N、についての縮小パラメータ時系列をパラメータ平均
回路4によって抽出するようにし、切替回路已を経由し
て、それぞれ大刀縮小パラメータ時系列バッファ7−1
ないし7−Hに結果を導いて格納する。
縮小パラメータ時系列照合部8は、認識モード、時に、
登録単語縮小パラメータ時系列登録部6か−1〜7−n
のうちから、登録縮小パラメータ時系列の時系列長と一
致するものを選択し、そこに格納された入力縮小パラメ
ータ時系列と照合する。
未知入力単語Xと、登録単語炉との距離D (X:。
s’>は。
で与えられる。
ここで、Nは炉のパラメータ時系列長、 KNは未知入
力単語音声から抽出されたパラメータのうち時系列長が
Nのパラメータである。また、上式においてd(ザ、6
1)は。
入力縮小パラメータ時系列および登録縮小パラメータ時
系列釦対応するものである。
候補単語判定部9は、縮小パラメータ時系列照合部8が
演算で求めた上記距離りにもとづいて。
登録単語が認識対象候補単語として適当であるかどうか
を判別するものである。こうして判別された候補単語名
が候補単語判定部9から出力されることになる。
上記第3図に示す時点T1 j ’r21・・・・・・
を決定する場合、第4図図示のパラメータ平均区間決定
回路3は第5図にフローチャートの形で示す如き処理を
行なうものと考′えてよい。即ち、パラメータ時系列長
がNfであるものを抽出する場合9次のように処理する
(1)  パラメータ抽出回路2によって抽出されたパ
ラメータにもとづいて第3図に示す如き累積変動量TA
Vを抽出する。
(2)そして累積変動量TAVO値をNf等分した値D
TAVを決定する。
(3)  そして最初に時点T1を求めるべくJ=1と
しておき、レジスタAVHに上記値DTAvをセットし
、計時スタート・レジスタT S (J)に値T(1)
をセットする。
(4)以下順次特徴パラメータの累積値A V (1)
がレジスタAVHの内容と等しいか大となるときまで、
特徴パラメータ値を累算してゆく。
(5)  累積値A V (1)がレジスタAVHの内
容と等しいか大となると、そのときのタイミング1T(
1)が時点T、用レジスタTE(1)Icセットされ、
上記レジスタTS(J+1)に値T(1+1)をセット
し、レジスタAVHに値(A V H+ DTAV )
をセットし1次の時点T2を求めるべくJ=2とする。
(6)以下同様に累積値A V (1)がレジスタAV
Hの内容と等しいか大となるまで、特徴パラメータ値を
累算してゆく。即ち2時点’r2t T3 p T4を
求めてゆく。
(7)そして累積回路lが値Nに達すると、即ち累算処
理が第3図図示時点TEに対応する特徴パラメータの累
算に達すると、その時点で時点TEが決定される。
E1発明の詳細 な説明した如く2本発明によれば、効率のよい単語音声
認識が可能になる。
一般的に、認識率を向上させようとすると処理速度が犠
牲になり、処理速度をあげようとすると認識率が劣化す
ることになるが1本発明によれば。
各登録単語に最も適当なパラメータ時系列長を選ぶこと
ができるので、従来方式に比べて、認識率を低下させる
ことなく、処理速度を向上させることができる。また、
登録辞書のメモリ容量も節減することが可能となる。
【図面の簡単な説明】
第1図は登録単語とパラメータ時系列長との関係を説明
するための説明図、第2図は本発明における縮小パラメ
ータ時系列を生成する処理例を説明するための説明図、
第3図は本発明における縮小パラメータ時系列を生成す
る他の処理例を説明するための説明図、第4図は本発明
の一実施例構成、第5図は上記第3図に対応した処理例
における区間決定を行う処理についてフローチャートの
形で表わした説明図を示す。 図中、3はパラメータ平均区間決定回路、4はパラメー
タ平均回路、6は登録単語縮小パラメータ時系列登録部
、7−1ないし7−nは入力縮小パラメータ時系列バッ
ファ、8け縮小パラメータ時系列照合部を表わす。 特許出願人 富士通株式会社 代理人弁理士 森 1)寛(外1名) 63

Claims (1)

  1. 【特許請求の範囲】 未知入力単語音声の音声信号を分析し、当該音声信号か
    ら抽出された入力特徴パラメータ時系列をもとに、所定
    の区分により分割された各区間内のパラメータ値を平均
    した値または区間境界値からなる入力縮小パラメータ時
    系列を生成するよう構成され、該入力縮小パラメータ時
    系列と、予め登録されている登録縮小パラメータ時系列
    とを照合して、未知入力単語音声の認識を行う単語音声
    認識方式において、上記未知入力単語音声の始端から終
    端までの上記区間分割についての区分数を複数個あらか
    じめ定め、該区分数の異なる各区間分割に対応するパラ
    メータ時系列長の異なる複数種類の入力縮小パラメータ
    時系列を、当該入力特徴パラメータ時系列から生成する
    よう構成され。 あらかじめ登録単語毎に定められたパラメータ時系列長
    を有する登録縮小パラメータ時系列と、上記複数種類の
    入力縮小パラメータ時系列のうち照合する登録単語と同
    じパラメータ時系列長を有する入力縮小パラメータ時系
    列とを照合することによって、認識対象候補単語を決定
    するようにしたことを特徴とする単語音声認識方式。
JP57171571A 1982-09-30 1982-09-30 単語音声認識方式 Granted JPS5960499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57171571A JPS5960499A (ja) 1982-09-30 1982-09-30 単語音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57171571A JPS5960499A (ja) 1982-09-30 1982-09-30 単語音声認識方式

Publications (2)

Publication Number Publication Date
JPS5960499A true JPS5960499A (ja) 1984-04-06
JPH0115079B2 JPH0115079B2 (ja) 1989-03-15

Family

ID=15925610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57171571A Granted JPS5960499A (ja) 1982-09-30 1982-09-30 単語音声認識方式

Country Status (1)

Country Link
JP (1) JPS5960499A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385798A (ja) * 1986-09-30 1988-04-16 松下電器産業株式会社 パタ−ン比較装置
JPH0741149A (ja) * 1993-06-15 1995-02-10 Nec Corp 電子部品供給装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6385798A (ja) * 1986-09-30 1988-04-16 松下電器産業株式会社 パタ−ン比較装置
JPH0741149A (ja) * 1993-06-15 1995-02-10 Nec Corp 電子部品供給装置

Also Published As

Publication number Publication date
JPH0115079B2 (ja) 1989-03-15

Similar Documents

Publication Publication Date Title
US9424839B2 (en) Speech recognition system that selects a probable recognition resulting candidate
US5987409A (en) Method of and apparatus for deriving a plurality of sequences of words from a speech signal
JP4408490B2 (ja) データベース照会を実行する方法及びその装置
JP2014174693A (ja) パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法
JPS5960499A (ja) 単語音声認識方式
JPS6123560B2 (ja)
US20030110032A1 (en) Fast search in speech recognition
CN115985326B (zh) 语音识别方法、装置、电子设备和存储介质
JPS61148497A (ja) 標準パタン作成装置
JPH05323989A (ja) 音声認識方式
JP4024614B2 (ja) 言語モデル生成方法、装置およびプログラム、テキスト分析装置およびプログラム
JPS58159599A (ja) 単音節音声認識方式
JPS62144200A (ja) 連続音声認識装置
JPS6347797A (ja) 単語音声予備選択方式
JPS62201498A (ja) 音声認識方法
JPH07121665A (ja) 文字認識辞書の構成方法及び検索方法
JPH0224699A (ja) 音声認識装置
CN117555998A (zh) 冰箱的人机交互方法
JPH08297670A (ja) 品詞推定方法および装置
JPS6177899A (ja) 標準パタ−ン作成法
JPS58159598A (ja) 単音節音声認識方式
JPH03214198A (ja) ワードスポッティング音声認識方法
JPH01209499A (ja) パターン照合方式
JPS6131878B2 (ja)
JPS5855996A (ja) 単音節音声認識システム