JPS6364100A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6364100A JPS6364100A JP20897886A JP20897886A JPS6364100A JP S6364100 A JPS6364100 A JP S6364100A JP 20897886 A JP20897886 A JP 20897886A JP 20897886 A JP20897886 A JP 20897886A JP S6364100 A JPS6364100 A JP S6364100A
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- spectrum
- relative value
- similarity
- normalized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003595 spectral effect Effects 0.000 claims description 95
- 238000001228 spectrum Methods 0.000 claims description 59
- 238000004364 calculation method Methods 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 2
- 210000001260 vocal cord Anatomy 0.000 claims description 2
- 238000000034 method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
この発明は音声語1A装置、特にマッチンク技イ1を用
いたg声認識装置に関するものである。
いたg声認識装置に関するものである。
(従来の技術)
音声認識を行う 一般的な技術として以上に述へるスペ
クトルマツチング技術がある。先ず、この発明の説明2
先、+1−ら、第5図及び第6図を用いて従来提案され
ているスペクトルマツチング技術を用いた音声認識装置
につき筒中な説明を行う。
クトルマツチング技術がある。先ず、この発明の説明2
先、+1−ら、第5図及び第6図を用いて従来提案され
ているスペクトルマツチング技術を用いた音声認識装置
につき筒中な説明を行う。
第5図は従来の87”認A装置を示すブロック図、第6
図はスペクトルマツチング技術の説明図である。
図はスペクトルマツチング技術の説明図である。
A/D変換された入力音7r+信号Diは周波数分析部
10へ人力される。周波数分析部10はこの人力信号−
Dlに対し人力中心周波数の異なる(中心周波数の番号
付けを以後チャネルと称す)バンドパスフィルタによる
周波数分析及び対数変換を行った周波数スペクトルD2
を所定の時間間隔(以後フレームと称する)@に算出し
く第6図(A))、スペクトル正規化部+1及び音声区
間検出部12へ:B力する。
10へ人力される。周波数分析部10はこの人力信号−
Dlに対し人力中心周波数の異なる(中心周波数の番号
付けを以後チャネルと称す)バンドパスフィルタによる
周波数分析及び対数変換を行った周波数スペクトルD2
を所定の時間間隔(以後フレームと称する)@に算出し
く第6図(A))、スペクトル正規化部+1及び音声区
間検出部12へ:B力する。
音声区間検出部12は周波数スペクトルD2の値の大き
さなどから始端時刻と1′!端時回とを決定し始端時刻
信号D3及び終端時刻信号D4をスペクトル正規化部I
Iへ出力する。
さなどから始端時刻と1′!端時回とを決定し始端時刻
信号D3及び終端時刻信号D4をスペクトル正規化部I
Iへ出力する。
スペクトル正規化rISllは周波数スペクトルD2か
らスペクトルの最小自乗近似直線を減じ正規化スペクト
ル(第6図(、〜)及び(B))とする処理を始端時刻
から終端時刻まで行い正規化スペクトルパタンD5とし
てスペクトル類似度計算部13へ出力する。
らスペクトルの最小自乗近似直線を減じ正規化スペクト
ル(第6図(、〜)及び(B))とする処理を始端時刻
から終端時刻まで行い正規化スペクトルパタンD5とし
てスペクトル類似度計算部13へ出力する。
ト記処理を所定の時間間隔(フレーム)11)に音声始
端時刻からγ↑声終端時刻まで縁り返し行う。
端時刻からγ↑声終端時刻まで縁り返し行う。
次にスペクトル類似度計算部13は正規化スペクトルパ
タンD5と、rめスペクトル標準パタン記憶部I4に格
納して用層:され゛ている全ての標準パタンとの類似度
を算出し、各認識対象カテゴリに対するスペクトル類似
度D6を゛PHI定部15へ出力する。
タンD5と、rめスペクトル標準パタン記憶部I4に格
納して用層:され゛ている全ての標準パタンとの類似度
を算出し、各認識対象カテゴリに対するスペクトル類似
度D6を゛PHI定部15へ出力する。
判定部15は全ての標準パタンの中で最大の類似度を与
える標準パタンか屈するカテゴリ名を認識結果として出
力する。
える標準パタンか屈するカテゴリ名を認識結果として出
力する。
以上述べた音声認識装置におけるスペクトルマツチング
技術によりば、スペクトル正規化を行うことにより話者
の相違により発生する声帯音源特性の相違を吸収するこ
とが出来、不特定話者が発声する音声の認識に対してh
゛効である。
技術によりば、スペクトル正規化を行うことにより話者
の相違により発生する声帯音源特性の相違を吸収するこ
とが出来、不特定話者が発声する音声の認識に対してh
゛効である。
(発明が解決しようとする問題点)
このスペクトルマツチング技術は入力音声パタン全体の
スペクトル形状を抽出し、スペクトル標準パタンとの類
似度計算を行うものである。
スペクトル形状を抽出し、スペクトル標準パタンとの類
似度計算を行うものである。
従ってパタン全体のスペクトル形状か類似したカテゴリ
、例えば「イイエ」と「レイ」を考えると、母音「イ」
と4斤「工」のホルマント周波数の出現位置は同−音】
tj内においては明らかな相違かあるが、発声時刻及び
発声話者が変動する場合を考えると両母音のホルマント
周波数の出現位置の分布はオーバーラツプする部分があ
るため、正規化スペクトル情報(例えばホルマント周波
数)か出現するチャネル上の絶対位置の標べ(的な値で
あるところのスペクトル標準パタンと類似度計算を行っ
た場合に両者を正確に識別γ!1定することか困難とな
る場合がある。即ち、同一>f戸内におけるスペクトル
の相対的な関係を表わ丁特勺(例えば「イ」である部分
と、[工」である部分の一1]対的関係を表わす特徴量
)が欠落していることにより認識性能の低ドを招くとい
う問題+、i7、があった。
、例えば「イイエ」と「レイ」を考えると、母音「イ」
と4斤「工」のホルマント周波数の出現位置は同−音】
tj内においては明らかな相違かあるが、発声時刻及び
発声話者が変動する場合を考えると両母音のホルマント
周波数の出現位置の分布はオーバーラツプする部分があ
るため、正規化スペクトル情報(例えばホルマント周波
数)か出現するチャネル上の絶対位置の標べ(的な値で
あるところのスペクトル標準パタンと類似度計算を行っ
た場合に両者を正確に識別γ!1定することか困難とな
る場合がある。即ち、同一>f戸内におけるスペクトル
の相対的な関係を表わ丁特勺(例えば「イ」である部分
と、[工」である部分の一1]対的関係を表わす特徴量
)が欠落していることにより認識性能の低ドを招くとい
う問題+、i7、があった。
この発明は上述した問題点を除去するために成されたも
のであり、従ってこの発明の目的は入力音声の正規化ス
ペクトルの相対的大きさを周波数帯域毎に算出し、こわ
により得られた値を特徴として追加し、この特徴を標準
パタンとの類似度演算に使用する構成とすることにより
、認識性能の優れた音声認識装置を提供することにある
。
のであり、従ってこの発明の目的は入力音声の正規化ス
ペクトルの相対的大きさを周波数帯域毎に算出し、こわ
により得られた値を特徴として追加し、この特徴を標準
パタンとの類似度演算に使用する構成とすることにより
、認識性能の優れた音声認識装置を提供することにある
。
(問題点を解決するための手段)
この目的の達成を夕するため、この発明による音声認識
装置によれば、 a)f声区間における正規化スペクトルの相対値をスペ
クトル相対値パタンとして各チャネル毎に算出するスペ
クトル相対値計算部と、 b)スペクトル相対値標準パタンをチめ格納したスペク
トル相対値標準パタン記憶部と、 C)このスペクトル相対値パタンと、スペクトル相対値
標準パタンとの類似度計算を行い各認識対象カテゴリに
対するスペクトル相対値類似度を算出するスペクトル相
対値類似度計算部とを設ける。
装置によれば、 a)f声区間における正規化スペクトルの相対値をスペ
クトル相対値パタンとして各チャネル毎に算出するスペ
クトル相対値計算部と、 b)スペクトル相対値標準パタンをチめ格納したスペク
トル相対値標準パタン記憶部と、 C)このスペクトル相対値パタンと、スペクトル相対値
標準パタンとの類似度計算を行い各認識対象カテゴリに
対するスペクトル相対値類似度を算出するスペクトル相
対値類似度計算部とを設ける。
d)そして、さらに、このスペクトル類似度とスペクト
ル相対値類似度の両者を参照することにより各認識対象
カテゴリ毎に総合類似度を計算し、この総合類似度が全
ての認識対象カテゴリの中で最大となるカテゴリ名を認
識結果として出力するように構成した判定部を具えてい
る。
ル相対値類似度の両者を参照することにより各認識対象
カテゴリ毎に総合類似度を計算し、この総合類似度が全
ての認識対象カテゴリの中で最大となるカテゴリ名を認
識結果として出力するように構成した判定部を具えてい
る。
この発明の実施に当っては、好ましくはこのスペクトル
相対値工4算部には正規化スペクトル平均値算出手段と
、スペクトル相対値算出手段とを設けるのが良い。
相対値工4算部には正規化スペクトル平均値算出手段と
、スペクトル相対値算出手段とを設けるのが良い。
この正規化スペクトル平均値算出手段は、音声始端フレ
ームから音声終端フレームまでにおける同一番目のチャ
ネルについて正規化スペクトル平均値を求めるための算
出機能を有するのが好適である。
ームから音声終端フレームまでにおける同一番目のチャ
ネルについて正規化スペクトル平均値を求めるための算
出機能を有するのが好適である。
さらに、スペクトル相対値算出f段は、当該チャネルに
おける正規化スペクトルから前記正規化スペクトル平均
値を減算してスペクトル相対値を得る処理を音声始端フ
レームから音声終端フレームまでの全フレームに対して
実行する機能を有するのが好適である。
おける正規化スペクトルから前記正規化スペクトル平均
値を減算してスペクトル相対値を得る処理を音声始端フ
レームから音声終端フレームまでの全フレームに対して
実行する機能を有するのが好適である。
そして、これら両算田手段を繰り返し動作させて、周波
数分析された全てのチャネルに対して前記スペクトル相
対値を求めて前記スペクトル相対値を得ることによって
スペクトル相対値パタンを出力するように構成する。
数分析された全てのチャネルに対して前記スペクトル相
対値を求めて前記スペクトル相対値を得ることによって
スペクトル相対値パタンを出力するように構成する。
(作用)
このように、この発明の音声認識装置によれば、従来の
識別判定に用いられているスペクトル類似度の他に、同
一4声区間内における正規化スペクトルの相対値を特徴
量として周波数帯域毎に算出し、この相対値に関するス
ペクトル相対値類似度を加えた総合類似度で識別判定を
行うので、正確かつ安定な認識か可能となる。
識別判定に用いられているスペクトル類似度の他に、同
一4声区間内における正規化スペクトルの相対値を特徴
量として周波数帯域毎に算出し、この相対値に関するス
ペクトル相対値類似度を加えた総合類似度で識別判定を
行うので、正確かつ安定な認識か可能となる。
(実施例)
以下、図面を参照してこの発明の音声認識装置の一実施
例につき説明する。
例につき説明する。
第1図はこの発明の一実施例を示す機能ブロック図、第
2図(A)はこの発明の一生要部を構成するスペクトル
相対値計算部の〜例を示す機能ブロック[:AI、第2
図(B)は第2図(A)のスペクトル相対値計算部の動
作手順を説明するための流れ図である。第1図及び第2
図(A)及び(13)を用いてこの発明の音声認識装置
及びその動作説明を行うが、第1図において第5図に示
した構成成分に対応する構成成分については同一符号を
付して示し、その詳細な説明は、特に相違する場合を除
き省略する。
2図(A)はこの発明の一生要部を構成するスペクトル
相対値計算部の〜例を示す機能ブロック[:AI、第2
図(B)は第2図(A)のスペクトル相対値計算部の動
作手順を説明するための流れ図である。第1図及び第2
図(A)及び(13)を用いてこの発明の音声認識装置
及びその動作説明を行うが、第1図において第5図に示
した構成成分に対応する構成成分については同一符号を
付して示し、その詳細な説明は、特に相違する場合を除
き省略する。
この発明の実施例の音声認識装置によれば、第5図に示
した従来提案されている構成成分の他に、発声音の特徴
であるスペクトル相対値を抽出するスペクトル相対値計
算部16と、スペクトル相対値標準パタンを予め読み出
し自在に記憶させであるスペクトル相対値標準パタン記
憶部17と、スペクトル相対値パタン及びスペクトル相
対(i標準パタンの類似度を計算するスペクトル相対値
類似度計算部18とを設けると共に、判定部を総合類似
度で認識判定出来る判定部19として構成している。
した従来提案されている構成成分の他に、発声音の特徴
であるスペクトル相対値を抽出するスペクトル相対値計
算部16と、スペクトル相対値標準パタンを予め読み出
し自在に記憶させであるスペクトル相対値標準パタン記
憶部17と、スペクトル相対値パタン及びスペクトル相
対(i標準パタンの類似度を計算するスペクトル相対値
類似度計算部18とを設けると共に、判定部を総合類似
度で認識判定出来る判定部19として構成している。
このスペクトル相対値計算部16には、音声区間検出部
12から始端時刻信号D3及び終端時刻イ言号D4を供
給すると共に、スペクトル正規化i%llから正規化ス
ペクトルパタンD5を供給する。このスペクトル相対値
計算部16は第2図(11)の説明の項で後述するf法
によりスペクトル相対値パタンD8を算出し、スペクト
ル相対値類似度計算部18へ出力する。
12から始端時刻信号D3及び終端時刻イ言号D4を供
給すると共に、スペクトル正規化i%llから正規化ス
ペクトルパタンD5を供給する。このスペクトル相対値
計算部16は第2図(11)の説明の項で後述するf法
によりスペクトル相対値パタンD8を算出し、スペクト
ル相対値類似度計算部18へ出力する。
このスペクトル相対値類似度計算部18はスペクトル相
対値パタンD8と、pめスペクトル相対値標準パタン記
憶部17に記憶されている全てのスペクトル相対値標準
パタンD9との類似度を計算し、各認識対象カテゴリに
対するスペクトル相対値類似度010を判定部19へ出
力する。
対値パタンD8と、pめスペクトル相対値標準パタン記
憶部17に記憶されている全てのスペクトル相対値標準
パタンD9との類似度を計算し、各認識対象カテゴリに
対するスペクトル相対値類似度010を判定部19へ出
力する。
この゛r11定部19は認識対象カテゴリ毎にスペクト
ル類似度上6と、スペクトル相対値類似度DIOとの両
者を参照して最大の総合類似度を求めて認識結果Dll
を出力するか、この実力6例では両者D6&びDIOの
総和を算出し、この類似度総和値か全ての認識対象カテ
ゴリの中で最大となるカテゴリ名を認識結果DI+ と
して出力する。
ル類似度上6と、スペクトル相対値類似度DIOとの両
者を参照して最大の総合類似度を求めて認識結果Dll
を出力するか、この実力6例では両者D6&びDIOの
総和を算出し、この類似度総和値か全ての認識対象カテ
ゴリの中で最大となるカテゴリ名を認識結果DI+ と
して出力する。
次に、第2図(^)及び (B)の機能ブロック図及び
動作の流れ図によりスペクトル相対値計算部16の動作
説明を詳細に行う。
動作の流れ図によりスペクトル相対値計算部16の動作
説明を詳細に行う。
スペクトル相対値計算部I6は第2図(A)に示すよう
にこの実施例では正規化スペクトル相対値算出手段20
及びスペクトル相対値算出手段21を具えている。そし
・て、こわら)段20及び21による処理手順につき第
2図(B)を参照して以下説明する。
にこの実施例では正規化スペクトル相対値算出手段20
及びスペクトル相対値算出手段21を具えている。そし
・て、こわら)段20及び21による処理手順につき第
2図(B)を参照して以下説明する。
尚、以下の説明において、処理ステップをSで表わす。
又、以rの説明において、周波数分析帯域数(チャネル
の数)をCHNNO1音声始端フレーム番号をSFR,
音声終端フレーム番号をEFR1正規化スペクトルを5
PEC(i、j)(但し、1はチャネル番号及びjはフ
レーム番号)、スペクトル相対値をR3PEC(i、j
)(但し、lはチャネル番号及びjはフレーム番号)と
定義する。
の数)をCHNNO1音声始端フレーム番号をSFR,
音声終端フレーム番号をEFR1正規化スペクトルを5
PEC(i、j)(但し、1はチャネル番号及びjはフ
レーム番号)、スペクトル相対値をR3PEC(i、j
)(但し、lはチャネル番号及びjはフレーム番号)と
定義する。
工 「 イスベクトル互均イを出−2
先ず、スペクトル相対値算出を行うチャネル番号iを1
に初期設定する(Sl)。
に初期設定する(Sl)。
これは人力する各フレームの正規化スペクトル毎に行わ
わる。
わる。
次に、正規化スペクトル手均値の算出を行う(Sl)。
この正規化スペクトル正規化値は次式(1)Σ 5PE
C(i、j)の演算処理と、(EFR−5FR+ 1)
のJ=5FR 演算処理とを行った後、(1)式から正規化スペクトル
平均値AVSPECを求める演算処理を行えばよい。或
は又、テーブルRAM等を用いて正規化スペクトルート
均値AVSPECを読み出す方法であってもよい。
C(i、j)の演算処理と、(EFR−5FR+ 1)
のJ=5FR 演算処理とを行った後、(1)式から正規化スペクトル
平均値AVSPECを求める演算処理を行えばよい。或
は又、テーブルRAM等を用いて正規化スペクトルート
均値AVSPECを読み出す方法であってもよい。
−(−y スペクトル相文・イ貞T11l−15」ツよ
先ず、スペクトル相対値算出を行うフレーム番号JをS
FRに初期設定する(S3)。
先ず、スペクトル相対値算出を行うフレーム番号JをS
FRに初期設定する(S3)。
次に、該チャネル及び該フレームにおけるスペクトル相
対値を次式(2) %式%) に従って算出1−る(S4)。
対値を次式(2) %式%) に従って算出1−る(S4)。
次に、次のフレームについて同様な処理を実行するため
、先ずフレーム番号Jに1を加算しくS5)、Jの値か
F記の条件 j>EFR(EFR:音声終端フレーム番号)すなわち
、汗声終端フレーム番号EFRより大であるかの条件を
満足するか否かを判定する(S6)。この条件を満足し
ない場合には、未処理のフレームの同一チャネル番号に
対してステップ84及びS5を繰り返し実行する。この
条件を満足する場合には、当該チャネルにおけるスペク
トル相対値の算出処理を終Yする。
、先ずフレーム番号Jに1を加算しくS5)、Jの値か
F記の条件 j>EFR(EFR:音声終端フレーム番号)すなわち
、汗声終端フレーム番号EFRより大であるかの条件を
満足するか否かを判定する(S6)。この条件を満足し
ない場合には、未処理のフレームの同一チャネル番号に
対してステップ84及びS5を繰り返し実行する。この
条件を満足する場合には、当該チャネルにおけるスペク
トル相対値の算出処理を終Yする。
次に、各フレームの次のチャネルについて同様な処理を
実行するためチャネル番号直に1を加算しくS7)、i
の値かド記の条件 i > CHN N O(CHN N O: f vネ
ル数)を満足するか否かをf!11定する(S8)。
実行するためチャネル番号直に1を加算しくS7)、i
の値かド記の条件 i > CHN N O(CHN N O: f vネ
ル数)を満足するか否かをf!11定する(S8)。
この条件を満足しない場合には残りの未処理のチャネル
番号についてステップ32〜S7の処理を繰り返し実行
する。この条件を満足する場合には、この入力音声に対
するスペクトル相対値の算出処理を終rする。
番号についてステップ32〜S7の処理を繰り返し実行
する。この条件を満足する場合には、この入力音声に対
するスペクトル相対値の算出処理を終rする。
^生輿Ω盈旦
第3図(A>は発声音「イイエ」及び第3し](B)は
発声呂「レイ」の正規化スペクトルを横軸にフレーム番
号及び縦軸にチャネル番号を取って表わした図である。
発声呂「レイ」の正規化スペクトルを横軸にフレーム番
号及び縦軸にチャネル番号を取って表わした図である。
A Cの濃い部分か正規化出力値が大であることを表し
ている。
ている。
これら図に示す正規化スペクトルの場合には、第3図(
A)に斜線で示した領域Aでスペクトル相対値が大とな
っており、同様に斜線で示した領域Bでスペクトル相対
値が小さくなっている。第3図(B)に斜線で示した領
域Cにおいてスペクトル相対値は大となっており、同様
に斜線で示した領域りでスペクトル相対値は小となって
いる。従ってスペクトル相対値計算部16から出力され
るスペクトル相対値パタンD8と、スペクトル相対値標
準パタンD9との間の類似度であるところのスペクトル
相対値類似度DIOは両者の間で明白な相違がある。
A)に斜線で示した領域Aでスペクトル相対値が大とな
っており、同様に斜線で示した領域Bでスペクトル相対
値が小さくなっている。第3図(B)に斜線で示した領
域Cにおいてスペクトル相対値は大となっており、同様
に斜線で示した領域りでスペクトル相対値は小となって
いる。従ってスペクトル相対値計算部16から出力され
るスペクトル相対値パタンD8と、スペクトル相対値標
準パタンD9との間の類似度であるところのスペクトル
相対値類似度DIOは両者の間で明白な相違がある。
第4図は判定部19における発声音の音声パタンと、こ
の発声音に類似する音声の標準パタンとの総合類似度を
説明する図であり、第4図(A)は第3図(A)の音声
パタンを有する発声音「イイエ」のカテゴリ名「イイエ
」及びカテゴリ名「レイ」に対する総合類似度を表わし
、第41J ([1)は第3図(B)の音声パタンを存
する発声音「レイ」のカテゴリ名「rイエ」及びカテゴ
リ名「レイ」に対する総合類似度を表わしている。尚、
図中「]はスペクトル相対値類似度DIOを表わし、2
はスペクトル類似度D6をそれぞれ表わしている。
の発声音に類似する音声の標準パタンとの総合類似度を
説明する図であり、第4図(A)は第3図(A)の音声
パタンを有する発声音「イイエ」のカテゴリ名「イイエ
」及びカテゴリ名「レイ」に対する総合類似度を表わし
、第41J ([1)は第3図(B)の音声パタンを存
する発声音「レイ」のカテゴリ名「rイエ」及びカテゴ
リ名「レイ」に対する総合類似度を表わしている。尚、
図中「]はスペクトル相対値類似度DIOを表わし、2
はスペクトル類似度D6をそれぞれ表わしている。
これら図から理解出来るように発声音「イイエ」及び「
レイ」のそれぞれの特徴量であるスペクトル相対値類似
度が対比されるへき「レイ」及び「イイエ」の標準パタ
ンのスペクトル相対値類似度よりも大きいため、「イイ
エ」及び「レイ」の発声音の音声パタンと標準パタンと
てスペクトル類似度に差が無くても、スペクトル類似度
との併用により正確な認識処理を行うことが出来る。
レイ」のそれぞれの特徴量であるスペクトル相対値類似
度が対比されるへき「レイ」及び「イイエ」の標準パタ
ンのスペクトル相対値類似度よりも大きいため、「イイ
エ」及び「レイ」の発声音の音声パタンと標準パタンと
てスペクトル類似度に差が無くても、スペクトル類似度
との併用により正確な認識処理を行うことが出来る。
この発明は卜述した実施例にのみ限定されるものではな
く、多くの変形又は変更を行い1゛Iること明らかであ
る。例えば、スペクトル相対値計算部16の各機能ト段
は何ら実施例で説明したものに限定されるものではない
。又、これら機能り段て行われる動作f順も計速した実
施例に限定されるものではない。
く、多くの変形又は変更を行い1゛Iること明らかであ
る。例えば、スペクトル相対値計算部16の各機能ト段
は何ら実施例で説明したものに限定されるものではない
。又、これら機能り段て行われる動作f順も計速した実
施例に限定されるものではない。
さらに、スペクトル相対値類似度計算部18及びスペク
トル相対値標準パタン記憶部17については詳細な説明
を省略したか、これらはスペクトル相対値計算部13及
びスペクトル標準パタン記憶部14と同様にして構成出
来る。
トル相対値標準パタン記憶部17については詳細な説明
を省略したか、これらはスペクトル相対値計算部13及
びスペクトル標準パタン記憶部14と同様にして構成出
来る。
又、第1図に示し・た音声認識装置の動作はメモ!ハ;
L制御部、その他の通常の電r−回路等を用いて構成し
たマイクロコンピュータ−等によってソフト的に処理す
ることか出来る。
L制御部、その他の通常の電r−回路等を用いて構成し
たマイクロコンピュータ−等によってソフト的に処理す
ることか出来る。
(発明の効果)
」二連した説明から明らがなように、この発明の音声認
識装置では、IF規化スペクトル類似度とスペクトル相
対値類似度を用いて認識#11定を行う構成としたので
、入力音声内におけるスペクトル相対値を加味した正確
かつ安定な認識が可能となり認識性能の優れた>’fj
”認識装置の実現が可能となる。
識装置では、IF規化スペクトル類似度とスペクトル相
対値類似度を用いて認識#11定を行う構成としたので
、入力音声内におけるスペクトル相対値を加味した正確
かつ安定な認識が可能となり認識性能の優れた>’fj
”認識装置の実現が可能となる。
第1図はこの発明の&メb認識装置の一実施例を示−4
−R能ブロック図、 第2しI(、V)は第1[ネ1の音声認識装置のスペク
トル相対値計算部の一実施例を示す機能ブロック図、 第2し1(B)はこの発明のスペクトル相対値パタン抽
出の処理F順を示す動作の流れし1、第3図(A)及び
(B)はこの発明の説明に供−「る発声音「イイエ」及
び「レイ」の正規化スペクトルをそれぞれ示す図、 第4図はこの発明におけるスペクトル相対値類似度の認
識への貢献を説明するための、標準パタンに対する総合
類似度の説明図、 第5図は従来の音声認識装置を示す機能ブロック図、 第6図はスペクトルマツチング技術の説明図である。 lO・・・周波数分析部、+1・・・スペクトル正規化
部12・・・音声区間検出部 13・・・スペクトル類似度計算部 14・・・スペクトル標準パタン記憶部I6・・・スペ
クトル相対値計算部 17・・・スペクトル梠対値標準パタン記憶部+ 8−
−・スペクトル相対値類似度計算部19・・・判定部 20・・・正規化スペクトル平均値算出手段2 + ・
・・スペクトル相対値算出手段。 占」 又Rクトル沌+ +7 jJパ゛タン?士二り重77
、f、%のf、九と、コ第2図 ロ スベ7ト1し槌iゴA1h大、1 又ソ入シ − マ・ソーニー>7’ 版、(Q の
1もヨ目Σ。 第6 図
−R能ブロック図、 第2しI(、V)は第1[ネ1の音声認識装置のスペク
トル相対値計算部の一実施例を示す機能ブロック図、 第2し1(B)はこの発明のスペクトル相対値パタン抽
出の処理F順を示す動作の流れし1、第3図(A)及び
(B)はこの発明の説明に供−「る発声音「イイエ」及
び「レイ」の正規化スペクトルをそれぞれ示す図、 第4図はこの発明におけるスペクトル相対値類似度の認
識への貢献を説明するための、標準パタンに対する総合
類似度の説明図、 第5図は従来の音声認識装置を示す機能ブロック図、 第6図はスペクトルマツチング技術の説明図である。 lO・・・周波数分析部、+1・・・スペクトル正規化
部12・・・音声区間検出部 13・・・スペクトル類似度計算部 14・・・スペクトル標準パタン記憶部I6・・・スペ
クトル相対値計算部 17・・・スペクトル梠対値標準パタン記憶部+ 8−
−・スペクトル相対値類似度計算部19・・・判定部 20・・・正規化スペクトル平均値算出手段2 + ・
・・スペクトル相対値算出手段。 占」 又Rクトル沌+ +7 jJパ゛タン?士二り重77
、f、%のf、九と、コ第2図 ロ スベ7ト1し槌iゴA1h大、1 又ソ入シ − マ・ソーニー>7’ 版、(Q の
1もヨ目Σ。 第6 図
Claims (2)
- (1)入力音声に対し複数のチャネルによる周波数分析
、対数変換を行い周波数スペクトルを抽出する周波数分
析部と、 前記周波数スペクトルに基づいて音声区間を検出する音
声区間検出部と、 前記周波数スペクトル及び音声区間に基づいて前記周波
数スペクトルに対して声帯音源特性の正規化を行った正
規化スペクトルパタンを算出するスペクトル正規化部と
、 スペクトル標準パタンを予め格納したスペクトル標準パ
タン記憶部と、 前記正規化スペクトルパタン及びスペクトル標準パタン
の類似度計算を行い各認識対象カテゴリに対するスペク
トル類似度を算出するスペクトル類似度計算部と、 全ての認識対象カテゴリの中で最大の類似度を与えるカ
テゴリ名を認識結果として出力する判定部と を具える音声認識装置において、 a)音声区間内における正規化スペクトルの相対値をス
ペクトル相対値パタンとして各チャネル毎に算出するス
ペクトル相対値計算部と、 b)スペクトル相対値標準パタンを予め格納したスペク
トル相対値標準パタン記憶部と、 c)前記スペクトル相対値パタンと、スペクトル相対値
標準パタンとの類似度計算を行い各認識対象カテゴリに
対するスペクトル相対値類似度を算出するスペクトル相
対値類似度計算部と を具え、 d)前記判定部における最大の類似度を、前記スペクト
ル類似度とスペクトル相対値類似度の両者を参照するこ
とにより各認識対象カテゴリ毎に算出された総合類似度
のうちの最大の総合類似度とした ことを特徴とする音声認識装置。 - (2)前記スペクトル相対値計算部は音声始端フレーム
から音声終端フレームまでにおける同一番目のチャネル
について正規化スペクトル平均値を求めるための正規化
スペクトル平均値算出手段と、 当該チャネルにおける正規化スペクトルから前記正規化
スペクトル平均値を減算してスペクトル相対値を得る処
理を音声始端フレームから音声終端フレームまでの全フ
レームに対して実行するスペクトル相対値算出手段と を具え、周波数分析された全てのチャネルに対して前記
スペクトル平均値を求めて前記スペクトル相対値を得る
ことによってスペクトル相対値パタンを出力することを
特徴とする特許請求の範囲第1項に記載の音声認識装置
。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP20897886A JPS6364100A (ja) | 1986-09-05 | 1986-09-05 | 音声認識装置 |
| US07/084,107 US4882755A (en) | 1986-08-21 | 1987-08-11 | Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP20897886A JPS6364100A (ja) | 1986-09-05 | 1986-09-05 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6364100A true JPS6364100A (ja) | 1988-03-22 |
| JPH0558560B2 JPH0558560B2 (ja) | 1993-08-26 |
Family
ID=16565308
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP20897886A Granted JPS6364100A (ja) | 1986-08-21 | 1986-09-05 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6364100A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008176752A (ja) * | 2007-01-22 | 2008-07-31 | National Institute Of Information & Communication Technology | 系列データ間の類似性検査方法及び装置 |
-
1986
- 1986-09-05 JP JP20897886A patent/JPS6364100A/ja active Granted
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008176752A (ja) * | 2007-01-22 | 2008-07-31 | National Institute Of Information & Communication Technology | 系列データ間の類似性検査方法及び装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0558560B2 (ja) | 1993-08-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS58130393A (ja) | 音声認識装置 | |
| US4882755A (en) | Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature | |
| JPH05249990A (ja) | パターンマッチング方法およびパターン認識装置 | |
| US4856067A (en) | Speech recognition system wherein the consonantal characteristics of input utterances are extracted | |
| JPS6364100A (ja) | 音声認識装置 | |
| JPH0465399B2 (ja) | ||
| JPS6350897A (ja) | 音声認識装置 | |
| JPS61180297A (ja) | 話者照合装置 | |
| JP2002108392A (ja) | 音声認証装置、音声認証方法、及び音声認証処理プログラムを記憶した記憶媒体 | |
| JPS6350900A (ja) | 音声認識装置 | |
| JPS6370296A (ja) | 単語登録方法 | |
| JPS60172098A (ja) | 単音節音声認識装置 | |
| JPS62255999A (ja) | 単語音声認識装置 | |
| JPS61121093A (ja) | 音声認識装置 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JPH0651793A (ja) | 音声認識装置 | |
| JPH0558556B2 (ja) | ||
| JPS63223696A (ja) | 音声パタ−ン作成方式 | |
| JPS6350898A (ja) | 音声認識装置 | |
| JPS625298A (ja) | 音声認識装置 | |
| JPS63212997A (ja) | 音声認識装置 | |
| JPS63218999A (ja) | 音声認識装置 | |
| JPS625299A (ja) | 音声認識装置 | |
| JPH0564800B2 (ja) | ||
| JPS58139199A (ja) | 音声自動認識装置 |