JPS60143400A

JPS60143400A - 音声認識装置

Info

Publication number: JPS60143400A
Application number: JP58251222A
Authority: JP
Inventors: 別所　由実; 入路　友明; 高井　紀代; 一宏津賀
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1983-12-29
Filing date: 1983-12-29
Publication date: 1985-07-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、子音部の認識を必要とする音声認識装置に関
するものである。

従来例の構成とその問題点現在、特定話者認識装置や限定語粟認識装置に関しては
、高認識率を示すものが開発されてわ・す、市販されて
いるものもある。これらの装置の技術としては、あらか
じめ入力され分析された標準音声分析データから抽出し
た特徴パラメータと、入力音声分析データから抽出した
特徴パラメータを比較することにより、母音部を中心に
認識を行うものである。

しかしながら、音声認識装置の利用分野をより広げてい
くだめには、特定話者認識装置、限定語粟認識装置にお
いても、より高認識率を示す装置を開発すること、また
不特定話者認識装置や多数語認識装置の開発が必要であ
る。そのために（ｄ、母音または調音状態の明らかに異
なる子音間の認識だけではなく、調音状態の似ている子
音群の群内の認識が要求される。

以下図面を参照し力から、従来の音声認識装置のブロッ
ク図である。１は音声信号入力端子、２は特徴抽出部、
３はセグメンテーション部、４は認識部、５は認識結果
出力端子である。

以上のように構成された音声認識装置について、以下に
その動作を説明する。

捷ず、端子１に入力された音声信号を特徴抽出部２で分
析し、特徴パラメータを抽出する。たとえば、線形予測
分析（、Ｌ　Ｐ　Ｃ分析）を分析方法として用い、次数
１２次、フレーム周期１０　ｍ５ｅｃ　。

フレーム長３０　ｍ５ｅｃという条件で分析すれば、特
徴パラメータとして、単位時間ごとの１２個の予測係数
と基本周波数とＲＭＳ値が抽出される。次に、セグメン
テーション部３において抽出された特徴パラメータを時
系列上で検討することにより、音声分析データを音韻ま
たは音節単位で区切る。

そして最後に・、認識部４（（おいてあらかじめ分析さ
れた標準音声の特徴パラメータと入力音声の特徴パラメ
ータを照合することにより、音韻または音節単位の認識
を行い、認識結果を出力する、。

しかしながら、上記の従来の構成では、分析方法として
ＬＰＣ分析分法を用いているために、時間分解能に限度
があること、寸だ周波数分解能に関しても子音群内の識
別を行うに（は問題かあること等の欠点がある。このこ
とにより、子音部及び子音部から母音定常部に至る部分
の分析に誤差か生じやすく、子音部の認識が困難である
という問題点を有していたう発明の目的本発明は上記従来の問題点を解消するもので、母音部及
び調音状態の明らかに異なる子音間の認識だけでなく、
調音状態の似ている子音群の群内の認識をも可能にする
ことができる音声認識装置を提供するものである。

発明の構成本発明は、特徴抽出部と、セグメンテーション部と、母
音及び子音群間の認識部と、重心周波数算出部と、重心
周波数検討部と、子音群内の認識部を備えた音声認識装
置であり、分析の際に帯域フィルタを周波数軸上で多数
使用することにより母音及び子音群間の認識を行い、そ
の後、子音部と認識された部分に対して、子音部とその
子音の後続母音定常部の各々について特定周波数帯域で
のエネルギーの重心となる周波数をめ、子音部と後続母
音定常部の重心周波数の差を検討することにより子音群
間の認識するものであり、以上の処理により子音認識を
可能にするものである。

実施例の説明第２図は、本発明の実施例における音声認識装置のブロ
ック図である。１は音声信号入力端子、２は特徴抽出部
、３はセグメンテーション部、５は認識結果出力端子、
６は母音及び調音状態の異った子音間の認識部、７は後
続母音認識部、８は重心周波数を算出する際に、後続母
音の種類に応じて対象となる周波数帯域を決定する周波
数帯域決定部、９は子音及び後続母音定常部の重心周波
数を８で決定された周波数帯域内で算出する重心周波数
算出部、１０は算出した重心周波数に対する検討部、１
１は調音状態の似ている子音群内の認識部である。

以上のように構成された本実施例の音声認識装置につい
て、以下その動作を説明する。

寸ず端子１に入力された音声信号を特徴抽出部２で分析
し、特徴パラメータを抽出する。この際　ゝのフィルタ
には帯域フィルタを多数個使用する。

たとえば、フィルタは、０．８ｋｌ（ｚ〜４．９ｋｌＩ
ｌの帯域で、オクターブごとに２４個、計６ｏ個の２次
一段の双一次変換フィルタとし、Ｑ値は２０である。以
上のフィルタで分析された結果より、特徴パラメータを
抽出する。特徴パラメータは、単位時間ととの、ＲＭＳ
値、ゼロクロス値、帯域スペクトルパワー値高周波数帯
域のパワーと低周波数帯域のパワーの比値である。次に
セグメンテーション部３において以上の特徴パラメータ
より音韻単位でセグメンテーションを行い、認識部６で
旬音及Ｏ・子音群間の認識を行う。

上記の母音、子音群間の認識結果より、子音と認識され
たデータに関し、以下の処理を行う。寸ず後続母音認識
部７で後続母音定常部の特徴パラメータより後続母音を
認識し、次に後続母音の第２ホルマントから第４ホルマ
ントに相当する周波数帯域を決定し、決定した周波数帯
域内で単位時間ごとに後続母音定常部と子音部のエネル
ギーの重心となる周波数を算出する。この際、以下の等
式を満たすｆＧを重心周波数と定義する。

但し、ｆｓ、ｆＬは周波数帯域の両端を示し、ｆｓ＜ｆ
Ｌ　である。またＰ（ｆ）は周波数ｆにおけるスペクト
ルパワー値である。

以上の処理は子音群内の認識を行うために、最も情報量
を多く含む周波数帯域が後続母音の第２ホルマントから
第４ホルマントに相当する帯域であるという理論の上に
成りたっている。次に、重心周波数算出部９において後
続母音定常部の重心周波数に対する子音部の重心周波数
の比を算出し、比値により認識部１１において子音群内
の認識を行う。たとえば、上記フィルタを使用して以上
の処理を行った場合、鼻子音群に対しては、比値が０．
９　以上の場合は／ｎ／、０．９未満の場合は／ｍ／と
認識する。

以上の本実施例によれば、分析方法として、帯域フィル
タを多数個使用して分析を行い、分析された音声データ
に対し単位時間ごとにエネルギーの重心となる周波数を
め、子音部と後続母音定常部の重心周波数の比値を検討
することにより、母音や子音群間の認識だけでなく、子
音群間の認識も行うことができる。

なお、本実施例では後続母音定常部の重心周波数に対す
る子音部の重心周波数の比値を用いたか、重心周波数の
差値を用いてもよい１、才だ子音の種類によっては、重
心周波数値そのものを用いても子音認識できる場合もあ
ることから、場合に応じて以上の値を使い分けをする処
理でもよい。

発明の効果本発明は、単位時間ごとに子音の後続母音定常部と子音
部に対して各々のエネルギーの重心となる周波数をめ、
各々の重心周波数を比較することにより母音及び子音群
間の認識だけでなく子音群内の認識をも可能にすること
ができるものである。さらに、重心周波数を算出する際
に、後続母音の種類に応じて対象となる周波数帯域を決
定し、決定した周波数帯域内で重心周波数を算出するこ
とにより、子音群内の認識の誤認識を防ぐという効￥を
得ることができる優れた音声認識装置を実現するもので
ある。

【図面の簡単な説明】

第１図は従来の音声認識装置のブロック図、第２図は本
発明の一実施例における音声認識装置のブロック図であ
る。１・・　音声信号入力端子、２　特徴抽出部、３　セグ
メンテーション部、４　・・・・認識部、５−　認識結
果出力端子、６・　−母音、子音群間の認識部、７・・
後続母音認識部、８　・・周波数帯域決定部、９−・・
・・重心周波数算出部、１０中重心周波数検討部、１１
−　・子音群内の認識部。

Claims

【特許請求の範囲】

（１）入力された音声信号に対し周波数分析を行い、音
声信号の特徴パラメータを抽出する特徴抽出部と、上記
特徴抽出部の出力である特徴パラメータを用い、分析デ
ータを以下の認識処理単位で区切るセグメンテーション
部と、上記セグメンテーションで区切られた１区間ごと
に母音及び調音状態の似ている子音の集合間の識別を行
う母音及び子音群間の認識部と、単位時間ごとに子音の
後続母音定常部と子音部に対して、おのおのエネルギー
の重心となる周波数をめる重心周波数算出部と、上記重
心周波数算出部の出力である重心周波数の差を算出する
重心周波数算出部と、算出結果を用いて子音部の群内の
識別を行う子音群内の認識部とを具備することを特徴と
する音声認識装置。
（２）重心周波数を算出する前に、子音の後続母音の種
類に応じて、対象となる周波数帯域を決定し、決定した
周波数帯域内で、重心周波数を算出することを特徴とす
る特許請求の範囲第１項記載の音声認識装置。