JPS60143400A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60143400A
JPS60143400A JP58251222A JP25122283A JPS60143400A JP S60143400 A JPS60143400 A JP S60143400A JP 58251222 A JP58251222 A JP 58251222A JP 25122283 A JP25122283 A JP 25122283A JP S60143400 A JPS60143400 A JP S60143400A
Authority
JP
Japan
Prior art keywords
consonant
frequency
unit
vowel
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58251222A
Other languages
English (en)
Inventor
別所 由実
入路 友明
高井 紀代
一宏 津賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58251222A priority Critical patent/JPS60143400A/ja
Publication of JPS60143400A publication Critical patent/JPS60143400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、子音部の認識を必要とする音声認識装置に関
するものである。
従来例の構成とその問題点 現在、特定話者認識装置や限定語粟認識装置に関しては
、高認識率を示すものが開発されてわ・す、市販されて
いるものもある。これらの装置の技術としては、あらか
じめ入力され分析された標準音声分析データから抽出し
た特徴パラメータと、入力音声分析データから抽出した
特徴パラメータを比較することにより、母音部を中心に
認識を行うものである。
しかしながら、音声認識装置の利用分野をより広げてい
くだめには、特定話者認識装置、限定語粟認識装置にお
いても、より高認識率を示す装置を開発すること、また
不特定話者認識装置や多数語認識装置の開発が必要であ
る。そのために(d、母音または調音状態の明らかに異
なる子音間の認識だけではなく、調音状態の似ている子
音群の群内の認識が要求される。
以下図面を参照し力から、従来の音声認識装置のブロッ
ク図である。1は音声信号入力端子、2は特徴抽出部、
3はセグメンテーション部、4は認識部、5は認識結果
出力端子である。
以上のように構成された音声認識装置について、以下に
その動作を説明する。
捷ず、端子1に入力された音声信号を特徴抽出部2で分
析し、特徴パラメータを抽出する。たとえば、線形予測
分析(、L P C分析)を分析方法として用い、次数
12次、フレーム周期10 m5ec 。
フレーム長30 m5ecという条件で分析すれば、特
徴パラメータとして、単位時間ごとの12個の予測係数
と基本周波数とRMS値が抽出される。次に、セグメン
テーション部3において抽出された特徴パラメータを時
系列上で検討することにより、音声分析データを音韻ま
たは音節単位で区切る。
そして最後に・、認識部4((おいてあらかじめ分析さ
れた標準音声の特徴パラメータと入力音声の特徴パラメ
ータを照合することにより、音韻または音節単位の認識
を行い、認識結果を出力する、。
しかしながら、上記の従来の構成では、分析方法として
LPC分析分法を用いているために、時間分解能に限度
があること、寸だ周波数分解能に関しても子音群内の識
別を行うに(は問題かあること等の欠点がある。このこ
とにより、子音部及び子音部から母音定常部に至る部分
の分析に誤差か生じやすく、子音部の認識が困難である
という問題点を有していたう 発明の目的 本発明は上記従来の問題点を解消するもので、母音部及
び調音状態の明らかに異なる子音間の認識だけでなく、
調音状態の似ている子音群の群内の認識をも可能にする
ことができる音声認識装置を提供するものである。
発明の構成 本発明は、特徴抽出部と、セグメンテーション部と、母
音及び子音群間の認識部と、重心周波数算出部と、重心
周波数検討部と、子音群内の認識部を備えた音声認識装
置であり、分析の際に帯域フィルタを周波数軸上で多数
使用することにより母音及び子音群間の認識を行い、そ
の後、子音部と認識された部分に対して、子音部とその
子音の後続母音定常部の各々について特定周波数帯域で
のエネルギーの重心となる周波数をめ、子音部と後続母
音定常部の重心周波数の差を検討することにより子音群
間の認識するものであり、以上の処理により子音認識を
可能にするものである。
実施例の説明 第2図は、本発明の実施例における音声認識装置のブロ
ック図である。1は音声信号入力端子、2は特徴抽出部
、3はセグメンテーション部、5は認識結果出力端子、
6は母音及び調音状態の異った子音間の認識部、7は後
続母音認識部、8は重心周波数を算出する際に、後続母
音の種類に応じて対象となる周波数帯域を決定する周波
数帯域決定部、9は子音及び後続母音定常部の重心周波
数を8で決定された周波数帯域内で算出する重心周波数
算出部、10は算出した重心周波数に対する検討部、1
1は調音状態の似ている子音群内の認識部である。
以上のように構成された本実施例の音声認識装置につい
て、以下その動作を説明する。
寸ず端子1に入力された音声信号を特徴抽出部2で分析
し、特徴パラメータを抽出する。この際 ゝのフィルタ
には帯域フィルタを多数個使用する。
たとえば、フィルタは、0.8kl(z〜4.9klI
lの帯域で、オクターブごとに24個、計6o個の2次
一段の双一次変換フィルタとし、Q値は20である。以
上のフィルタで分析された結果より、特徴パラメータを
抽出する。特徴パラメータは、単位時間ととの、RMS
値、ゼロクロス値、帯域スペクトルパワー値高周波数帯
域のパワーと低周波数帯域のパワーの比値である。次に
セグメンテーション部3において以上の特徴パラメータ
より音韻単位でセグメンテーションを行い、認識部6で
旬音及O・子音群間の認識を行う。
上記の母音、子音群間の認識結果より、子音と認識され
たデータに関し、以下の処理を行う。寸ず後続母音認識
部7で後続母音定常部の特徴パラメータより後続母音を
認識し、次に後続母音の第2ホルマントから第4ホルマ
ントに相当する周波数帯域を決定し、決定した周波数帯
域内で単位時間ごとに後続母音定常部と子音部のエネル
ギーの重心となる周波数を算出する。この際、以下の等
式を満たすfGを重心周波数と定義する。
但し、fs、fLは周波数帯域の両端を示し、fs<f
L である。またP(f)は周波数fにおけるスペクト
ルパワー値である。
以上の処理は子音群内の認識を行うために、最も情報量
を多く含む周波数帯域が後続母音の第2ホルマントから
第4ホルマントに相当する帯域であるという理論の上に
成りたっている。次に、重心周波数算出部9において後
続母音定常部の重心周波数に対する子音部の重心周波数
の比を算出し、比値により認識部11において子音群内
の認識を行う。たとえば、上記フィルタを使用して以上
の処理を行った場合、鼻子音群に対しては、比値が0.
9 以上の場合は/n/、0.9未満の場合は/m/と
認識する。
以上の本実施例によれば、分析方法として、帯域フィル
タを多数個使用して分析を行い、分析された音声データ
に対し単位時間ごとにエネルギーの重心となる周波数を
め、子音部と後続母音定常部の重心周波数の比値を検討
することにより、母音や子音群間の認識だけでなく、子
音群間の認識も行うことができる。
なお、本実施例では後続母音定常部の重心周波数に対す
る子音部の重心周波数の比値を用いたか、重心周波数の
差値を用いてもよい1、才だ子音の種類によっては、重
心周波数値そのものを用いても子音認識できる場合もあ
ることから、場合に応じて以上の値を使い分けをする処
理でもよい。
発明の効果 本発明は、単位時間ごとに子音の後続母音定常部と子音
部に対して各々のエネルギーの重心となる周波数をめ、
各々の重心周波数を比較することにより母音及び子音群
間の認識だけでなく子音群内の認識をも可能にすること
ができるものである。さらに、重心周波数を算出する際
に、後続母音の種類に応じて対象となる周波数帯域を決
定し、決定した周波数帯域内で重心周波数を算出するこ
とにより、子音群内の認識の誤認識を防ぐという効¥を
得ることができる優れた音声認識装置を実現するもので
ある。
【図面の簡単な説明】
第1図は従来の音声認識装置のブロック図、第2図は本
発明の一実施例における音声認識装置のブロック図であ
る。 1・・ 音声信号入力端子、2 特徴抽出部、3 セグ
メンテーション部、4 ・・・・認識部、5− 認識結
果出力端子、6・ −母音、子音群間の認識部、7・・
後続母音認識部、8 ・・周波数帯域決定部、9−・・
・・重心周波数算出部、10中重心周波数検討部、11
− ・子音群内の認識部。

Claims (2)

    【特許請求の範囲】
  1. (1)入力された音声信号に対し周波数分析を行い、音
    声信号の特徴パラメータを抽出する特徴抽出部と、上記
    特徴抽出部の出力である特徴パラメータを用い、分析デ
    ータを以下の認識処理単位で区切るセグメンテーション
    部と、上記セグメンテーションで区切られた1区間ごと
    に母音及び調音状態の似ている子音の集合間の識別を行
    う母音及び子音群間の認識部と、単位時間ごとに子音の
    後続母音定常部と子音部に対して、おのおのエネルギー
    の重心となる周波数をめる重心周波数算出部と、上記重
    心周波数算出部の出力である重心周波数の差を算出する
    重心周波数算出部と、算出結果を用いて子音部の群内の
    識別を行う子音群内の認識部とを具備することを特徴と
    する音声認識装置。
  2. (2)重心周波数を算出する前に、子音の後続母音の種
    類に応じて、対象となる周波数帯域を決定し、決定した
    周波数帯域内で、重心周波数を算出することを特徴とす
    る特許請求の範囲第1項記載の音声認識装置。
JP58251222A 1983-12-29 1983-12-29 音声認識装置 Pending JPS60143400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58251222A JPS60143400A (ja) 1983-12-29 1983-12-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58251222A JPS60143400A (ja) 1983-12-29 1983-12-29 音声認識装置

Publications (1)

Publication Number Publication Date
JPS60143400A true JPS60143400A (ja) 1985-07-29

Family

ID=17219516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58251222A Pending JPS60143400A (ja) 1983-12-29 1983-12-29 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60143400A (ja)

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
Kopec et al. Speech analysis homomorphic prediction
JPS59226400A (ja) 音声認識装置
JPS5972496A (ja) 単音識別装置
JPS60143400A (ja) 音声認識装置
Jabbar et al. Stable implementation of voice activity detector using zero-phase zero frequency resonator on FPGA
JP2744622B2 (ja) 破裂子音識別方式
JPS6293000A (ja) 音声認識方法
Undhad et al. Exploiting speech source information for vowel landmark detection for low resource language
JPS60168198A (ja) ホルマント抽出装置
JPH02124600A (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS6310440B2 (ja)
JPH026078B2 (ja)
JPS62145298A (ja) 音声認識装置
JPS61249099A (ja) 音声認識装置
WO2005055199A1 (en) Speech processing apparatus and method
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPH026079B2 (ja)
JPS59111700A (ja) 語頭子音のセグメンテ−シヨン法
Millar Time domain acoustic parameters for speech recognition.
JPS61180300A (ja) 音声認識装置
JPS63212999A (ja) 音声認識装置
JPS6237797B2 (ja)
Fatema et al. Features Extraction from Speech for Emotion Recognition