JPH04121794A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPH04121794A
JPH04121794A JP24341290A JP24341290A JPH04121794A JP H04121794 A JPH04121794 A JP H04121794A JP 24341290 A JP24341290 A JP 24341290A JP 24341290 A JP24341290 A JP 24341290A JP H04121794 A JPH04121794 A JP H04121794A
Authority
JP
Japan
Prior art keywords
frames
time series
difference values
series pattern
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24341290A
Other languages
English (en)
Inventor
Kazuhiko Okashita
和彦 岡下
Shingo Nishimura
新吾 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sekisui Chemical Co Ltd
Original Assignee
Sekisui Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sekisui Chemical Co Ltd filed Critical Sekisui Chemical Co Ltd
Priority to JP24341290A priority Critical patent/JPH04121794A/ja
Publication of JPH04121794A publication Critical patent/JPH04121794A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、電気錠、ICカード等のオンライン端末等て
入力音声からその単語を認識するに好適な音声認識方法
に関する。
[従来の技術] 従来、特開平1−260490号公報に記載の如くの音
声認識方法が提案されている。この音声認識方法は、入
力音声の特徴パラメータを所定長のフレーム単位て算出
し、フレーム内の特徴パラメータの差分値を求め、該差
分値の時系列パターンを作成し、この差分値の時系列パ
ターンと各音声の標準パターンとの類似度を統計的距離
尺度によって算出し、音声認識を行なうものである。
[発明か解決しようとする課題] 黙しながら、従来技術ては、入力音声の全フレームの特
徴パラメータを、それらフレームのパワーの大小にかか
わらずそのまま用いて、音声認識を行なっている。
然るに、パワーの小なるフレームの情報は、伝送系の歪
や定常雑音の影響を受は易いものであるため、類似度判
定の信頼度か低い。
また、パワーの小なるフレーム間の差分値は、周波数領
域て差分をとるものであるため、パワーの大なるフレー
ム間の差分値におけると同等に扱われるものとなり、認
識率への影響は大きい。
即ち、従来技術ては、類似度判定の信頼度か低いパワー
の小なるフレームの情報が、大きな影響度て認識率に影
響する結果、高い認識率の確保に困難かある。
本発明は、定常的なスペクトル歪に強く、高い認識率を
確保てきる音声認識方法を提供することを目的とする。
[課趙を解決するための手段] 請求項1に記載の本発明は、入力音声の特徴パラメータ
を所定長のフレーム単位て算出し、各フレームのパワー
の実効値か任意のしきい値より小なるとき、当該フレー
ムの特徴パラメータを除外した後、フレーム間の特徴パ
ラメータの差分値を求め、該差分値の時系列パターンを
作成し、この差分値の時系列パターンと各音声の標準パ
ターンとの類似度を統計的距離尺度によって算出し、音
声認識を行なうようにしだものである。
請求項2に記載の本発明は、入力音声の特徴パラメータ
を所定長のフレーム単位で算出し、各フレームのパワー
の実効値か任意のしきい値より小なるとき、当該フレー
ムの特徴パラメータの影響が少なくなるように重み付け
を行なった後、フレーム間の特徴パラメータの差分値を
求め、該差分値の時系列パターンを作成し、この差分値
の時系列パターンと各音声の標準パターンとの類似度を
統計的距離尺度によって算出し、音声認識を行なうよう
にしたものである。
[作用] 本発明によれば、伝送系の歪や定常雑音の影響を受は易
く、類似度判定の信頼度か低いパワーの小なるフレーム
の特徴パラメータを、除外、又は影響か少なくなるよう
に重み付けした後、フレーム間の特徴パラメータの差分
値を求め、この差分値に基づいて音声認識を行なうこと
となる。
即ち、パワーの大小にかかわらず全フレーム間の差分値
を用いるものに比して、伝送系の歪みや定常雑音の影響
を消去した音声認識を行なうこととなる。従って、定常
的なスペクトル歪に強く、高い認識率を確保てきる音声
認識方法を得ることがてきる。
[実施例] 第1図は本発明の一実施例に係る音声認識システムを示
す模式図である。
音声認識システム10は、音声入力部11、特徴抽出部
12、パワー判定部13、差分値作成部14、時系列パ
ターン作成部15、辞書部(標準パターン格納部)16
、類似度算出部17、判定部18を有して構成される。
以下、音声認識システム10を用いた辞書作成手順、認
識手順について説明する。
(A)音声入力部11にて、音声試料を取り入れる。
このとき、認識単語を47都道府県名、特定話者を1名
とした。
TB)辞書作成 ■各認識単語の既知入力音声波形を、特徴抽出部12に
おいて、16チヤンネルのバンドパスフィルタに通し、
1フレーム(12,8m5ec)毎に周波数特性を得る
■パワー制定部13において、実験的に決めたしきい値
θと各フレームの周波数特性のパワーの実効値を比較し
、パワーの実効値かしきい値θより小なるフレームの特
徴パラメータを除外する。
■差分値作成部14において、フレーム間の特徴パラメ
ータの差分値を求め、時系列パターン作成部15におい
て、該差分値の時系列パターンを作成する0時系列パタ
ーン作成部15て作成した差分値の時系列パターンを辞
書部16に格納し、辞書とする。
(C)認識 ■各認識単語の未知入力音声波形に定常雑音を付加した
ものを、特徴抽出部12において、16チヤンネルのバ
ンドパスフィルタに通し、1フレーム(12,8m5e
c)毎に周波数特性を得る。
■パワー判定部13において、実験的に決めたしきい値
θと各フレームの周波数特性のパワーの実効値を比較し
、パワーの実効値がしきい値θより小なるフレームの特
徴パラメータを除外する。
■差分値作成部14において、フレーム間の差分値を求
め、時系列パターン作成部15において、該差分値の時
系列パターンを作成する。
■類似度算出部17において、上記■で作成した差分値
の時系列パターンと、辞書部16に格納しである各音声
の標準パターンとの類似度を統計的距離尺度によって算
出する。
■判定部18において、上記■の結果、類似度か最も高
いものを認識結果とする。
然るに、従来方式と、上記音声認識システム10による
本発明方式の実験結果について説明する。
(従来方式) 実験:特徴パラメータ(バントパスフィルタの出力)の
フレーム間差分値を用い、統計的距離尺度により計算し
たとき。
尚、特定話者を1名、認識単語を47都道府県名とした
結果:認識率は93.2%てあった。
(本発明方式) 実験:パワーの小なる特徴パラメータ(バントパスフィ
ルタの出力)を除外し、入力にフレーム間差分値を用い
、統計的距離尺度により認識したとき。
尚、特定話者を1名、認識単語を47都道府県名とした
結果:認識率は95.3%てあった。
尚、本発明の実施において、辞書作成段階、及び認識段
1i1(上述の(B)の■の段階、及び(C)の■の段
階)て、パワーの小さいフレームの特徴パラメータを除
外することなく、当該フレームの特徴パラメータの影響
か少なくなるように重み付けを行なうものてあっても良
い。
上記音声認識システム10によれば、以下の如くの作用
かある。
上記実施例によれば、伝送系の歪や定常雑音の影響を受
は易く、類似度判定の信頼度か低いパワーの小なるフレ
ームの特徴パラメータを、除外、又は影響が少なくなる
ように重み付けした後、フレーム間の特徴パラメータの
差分値を求め、この差分値に基づいて音声認識を行なう
こととなる。
即ち、パワーの大小にかかわらず全フレーム間の差分値
を用いるものに比して、伝送系の歪みゃ定常雑音の影響
を消去した音声認識を行なうこととなる。従って、定常
的なスペクトル歪に強く、高い認識率を確保できる音声
認識方法を得ることがてきる。
[発明の効果] 以上のように本発明によれば、定常的なスペクトル歪に
強く、高い認識率を確保できる音声認識方法を得ること
かてきる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る音声認識システムを示
す模式図である。 10・・・音声認識システム、 11・・・音声入力部、 12・・・特徴抽出部、 13・・・パワー判定部、 14・・・差分値作成部、 15・・・時系列パターン作成部、 16・・・辞書部、 17・・・類似度算出部、 18・・・判定部。 特許出願人 積水化学工業株式会社 代表者 廣 1) 馨

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声の特徴パラメータを所定長のフレーム単
    位で算出し、各フレームのパワーの実効値が任意のしき
    い値より小なるとき、当該フレームの特徴パラメータを
    除外した後、フレーム間の特徴パラメータの差分値を求
    め、該差分値の時系列パターンを作成し、この差分値の
    時系列パターンと各音声の標準パターンとの類似度を統
    計的距離尺度によって算出し、音声認識を行なう音声認
    識方法。
  2. (2)入力音声の特徴パラメータを所定長のフレーム単
    位で算出し、各フレームのパワーの実効値が任意のしき
    い値より小なるとき、当該フレームの特徴パラメータの
    影響が少なくなるように重み付けを行なった後、フレー
    ム間の特徴パラメータの差分値を求め、該差分値の時系
    列パターンを作成し、この差分値の時系列パターンと各
    音声の標準パターンとの類似度を統計的距離尺度によっ
    て算出し、音声認識を行なう音声認識方法。
JP24341290A 1990-09-12 1990-09-12 音声認識方法 Pending JPH04121794A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24341290A JPH04121794A (ja) 1990-09-12 1990-09-12 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24341290A JPH04121794A (ja) 1990-09-12 1990-09-12 音声認識方法

Publications (1)

Publication Number Publication Date
JPH04121794A true JPH04121794A (ja) 1992-04-22

Family

ID=17103483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24341290A Pending JPH04121794A (ja) 1990-09-12 1990-09-12 音声認識方法

Country Status (1)

Country Link
JP (1) JPH04121794A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675962A (ja) * 1992-05-01 1994-03-18 Internatl Business Mach Corp <Ibm> 空マルチメディアデータオブジェクトの自動検出/処理方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675962A (ja) * 1992-05-01 1994-03-18 Internatl Business Mach Corp <Ibm> 空マルチメディアデータオブジェクトの自動検出/処理方法及び装置

Similar Documents

Publication Publication Date Title
CN112053695A (zh) 声纹识别方法、装置、电子设备及存储介质
EP0240329A2 (en) Noise compensation in speech recognition
KR100463657B1 (ko) 음성구간 검출 장치 및 방법
Singh et al. Novel feature extraction algorithm using DWT and temporal statistical techniques for word dependent speaker’s recognition
JPH04121794A (ja) 音声認識方法
CN113948088A (zh) 基于波形模拟的语音识别方法及装置
JP2968976B2 (ja) 音声認識装置
CN115862636B (zh) 一种基于语音识别技术的互联网人机验证方法
JPH03122699A (ja) 雑音除去装置及び該装置を用いた音声認識装置
JPH03230200A (ja) 音声認識方法
Coy et al. Soft harmonic masks for recognising speech in the presence of a competing speaker.
JPH04121799A (ja) 音声認識方法
JPH04163600A (ja) 話者認識方法
JPH0465399B2 (ja)
JPH0415699A (ja) 話者認識システム
JPS62211698A (ja) 音声区間検出方法
Lobdell et al. Human speech perception and feature extraction.
CN113113052A (zh) 一种离散点的语音基音识别装置及计算机存储介质
Zão et al. Noise robust speaker verification based on the MFCC and pH features fusion and multicondition training
CN113571054A (zh) 语音识别信号预处理方法、装置、设备及计算机存储介质
JPH04163599A (ja) 話者認識方法
JPH02302799A (ja) 音声認識方式
JPH03230255A (ja) 音声認識方法
JPH0558560B2 (ja)
JPS59181396A (ja) 再照合音声認識方式