JPS607496A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS607496A
JPS607496A JP58117712A JP11771283A JPS607496A JP S607496 A JPS607496 A JP S607496A JP 58117712 A JP58117712 A JP 58117712A JP 11771283 A JP11771283 A JP 11771283A JP S607496 A JPS607496 A JP S607496A
Authority
JP
Japan
Prior art keywords
speech
similarity
phoneme
unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58117712A
Other languages
English (en)
Other versions
JPH024920B2 (ja
Inventor
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58117712A priority Critical patent/JPS607496A/ja
Publication of JPS607496A publication Critical patent/JPS607496A/ja
Publication of JPH024920B2 publication Critical patent/JPH024920B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に関するものである。
従来例の構成とその問題点 音声認識装置は、人間の音声命令によって対象の機2:
(の動作を制御することを目的とする命令入力装置の一
種であり、■操作上のFJI+練を要さない、0手足が
ふさがっている、あるいは手足が届がない場合でも操作
できる、■視覚が介在する操fWとの競合が少ない、等
の長所が生かせる諸方面での利用が合成し始めている。
従来の音声認識装置に用いられている認識方式は、主に
環境雑音が少なく信号対雑音比が晶い状態における最適
構成をとっている。従って、この構成に基づく音声認識
装置rtを雑音模境−「で使用すると、相当な詔織率の
低下を招くことが多い。例えば無声摩擦子i、特に/s
/や/f/などは信号パワーが弱く、信号そのものが定
常ランダム雑音の性質を持っている。今、入力音声に重
畳した雑斤が前記無声摩擦子片に類似した性質を持つ々
イi砕であるとすると、音声区間切り出しの1祭、tl
A頭あるいは、ft尾に存在するこれら無声摩擦子音が
欠落したり、語中に存在するこれら無声摩擦子音が音声
弔位内無音あるいは音声Qt位間無音であると誤’l’
lJ定されることがある。この様な欠落・誤判定を伴っ
た状1.r3で音声10γ社゛!準パターンとの類似度
評価を行うと、仮に前記摩擦子音以外の区間(例えばエ
ネルギーの大きな母音区間)での斤l′!1、あるいは
音響伏励が全く同一であっても、吟声単位全体としての
類(以度は低下せざるを得す、これが誤認識を招く結果
となることが多い。
発明の目的 本発明は上記従来の欠点を解消するもので、雑音による
特定のi rrt+の劣化、あるいは特定の汗饗ゝ特徴
量の劣化がもたらす音声単位全体としての詔誠率低下の
影響を軽減できる音声認識装置dを提供することを目的
とする。
発明の構成 上記目的を達成するため、第1の発明は、入力音声の音
韻を任意の短時間区間毎に識別して音・韻系列を出力す
る音韻識別手段と、認識しようとする音声単位が有する
と予想される標準的な音韻系列が予め登録された音声単
位標準パターンと、各音韻間の類似性を表わす音韻類似
度行列と、前記音韻識別手段から出力?れる音・韻系列
とDiJ記斤声単位fliA準パターンと前記音韻類似
度行列とを用いて入力音声の音韻性と前記音声単位に4
準パターンの音韻性との間の類似度を011記短時間区
間の音韻毎に表現する音声単位音韻比較行列と、この音
声単位音韻比較行列によって表わされるところの音韻類
似性を音声単位毎にめる音声単位類似度計算手段とを備
え、予め音韻別に雑音の強度・特性に応じた複数組の重
み付は係数を用意しておき、入力音声に重畳する雑音の
強度及び特性を検出する雑音検出手段から得られる情報
に基づいて、適宜!?!r定の重み付は係数の徂を選択
し、11J記蛭声it位類似度計算手段により+JiJ
記重み付は係数を用いて音声単位毎に音韻類似度を計算
する構成としたものである。
また第2の発明は、入力音声を任αの4λj時間区間4
ifに音響分析してそのf響特徴系列を出力する音響分
析手段と、訝識しようとする音声単位が有すると予想8
れる標準的な音響特徴系列が予め笠帰マΣれた音声単位
標準パターンと、1JiJ記音禅分析手段から出力され
る音響特徴系列と前6己Vf声単位煙準パターンとを用
いて入力音声と斉声弔位標準パターンとの間の)4似度
をMiJ記短時短時間区間力音声イびに表現する音声単
位6145比較行列と、この音声単位音響比較行列によ
って表わされるとζろのFf %類似度を音声単位毎に
める?l声屯位ハ゛(傾度計算手段とを備え、予め音響
f# & in別に雑斤の強度・特性に応じたり数組の
重みflけ係数を月1代しておき、入力音声に重畳する
雑音の強度及び特性を検出するflr音検出手段から得
られる情報に基づいて、適宜特定の重み付は係数の11
を選択し、前記音声単位類似度計算手段により前記市み
付は係数を用いて音声単位毎に音響類似度を計算する構
成としたものである。
実施例の説明 以下、第1の発明の一実施例について、図面に基づいて
説明する。第1図は音声認識装置のブロック図で、本実
施例では、音声単位が屯語であるとして説明する。また
特許請求の範囲の項に記載された「任意の短時間区間」
なる表現を「セグメント」と11?ひかえて説明する。
第1図において、(1)は雑音検出手段、(2)は音韻
識別手段であり、入力音声はこの音韻識別手段(2)で
分析され、f韻系列(3)のかたちに抽象化される。(
4)は各種M 1ift間の音響的類収性を行列の各要
素に対応させて表現した音1tlJ類似度行列、(5)
は音声認識の対象となっている単語毎にその音韻の系列
を予め記述した単語標準パターンである。(6)は音韻
系列(3)と音韻類似度行夕旧4)と単語標準パターン
(5)との王者で決定きれるところの、単語全長にわた
ってのセグメント毎の単語音韻比較行列であり、これは
、4識対象単語それぞれに用意された前記単袷瞭串パタ
ーン(5)のひとつひとつに対応して、このパターンと
同数だけ生成される。Q(語類似度計・脚半1々(7)
は、前記の操作で得られた小数の単3rr音韻比較行列
のそれぞれについて、セグメント毎の音韻力1似性を単
語全長にわたって総合評価し、最後に判定手放(8)で
入力音声と最も類似性の高い単語4M準パターンを選択
し、これに対応する単語を判定結果として出力する。一
方、雑音検出手段(1)は、入力音声に重畳する雑音の
強度・特性を検出し、これに応じて711攻組の重み付
は係数(9)の中から最適だ一組をj8択する。選ばれ
た重み付は係ν(は単語類似度計算手段(7)に入力さ
れる。
以下、定常ランダム雑音下で/san/ (rサン」)
という音声を;も識しようとする場合を例にとり、重み
付は係数の役割について説明する。+4’t;に述べた
ように、音++tl /s/は無声摩擦子音であり、付
加きれた定常ランダム雑音下ために、音声区間切り出し
の1余に容易に欠落することが考えられる。即ちその場
合には、単語標準パターンとして登録さicている/s
an/と、入力音声から得られたfl I′+t4系列
/an/とが照合されねばならない。ところで、/a/
および/n/のf4的特徴は、定常ランダム雑音とは大
きく異なり、一般にエネルギーも大きいため、付加雑音
による切出し欠落や待機量抽出の間必:いは生じにくい
。tJI]ちこの例に於いては、/san/と/an/
との照合の際に、/S/の有無による差異よりも、/a
n/が双方共に存在するという同一性の方がI射々41
音性の観点から信顆性が品いといえる。逆にuli(4
4仁音の場合には、/8/の検出も容易であるので、こ
れに対する屯み付は係に(を増加させておく。1口番識
対象単語中に/:tn/(rオン」)という単語が存在
する場合を想定すると、/a/と/l/との行1ill
 jGが比較的小さいため、/an/と/:zn/とを
誤認訣する恐れがある。このような混同を避けるために
は/S/の有無が重要になり、/S/の鍬み付は係数を
増加させておくことが有効でろる。Is 1図の重み付
は係数(9)はこのような耐雑汗姓の観点からみた音t
ll別信頼性を表現したものであり、単語全長にわたる
類似度計算の際に、セグメント毎にこれを釣用するもの
である。ここで、重み付は係数(9)は音t111性に
依存するものであるから、適用にあたっては予め当該セ
グメントのMt’dl性が明らかである必要がある。現
実的には、単語標準パターン(5)あるいは入力音声の
音韻系列(3)の王者のうち、よりケ(P、音が少ない
と判断される系列の音韻に基づいて+iiJ記重み付は
係数を適用すればよい。重み(NJけ係L(設定の一方
法は、rt知音声を付加雑音と共に認識装置トtに入力
し、セグメント毎に識別された結果を原音声から視察で
めた音韻系列と比較し、装置による識別誤差の大きなも
の程、雑音に対する耐性が弱いと考えて小さな重み付は
係数を与えるものである。
このように、雑音に適応した音韻別型み付け係数を単語
類似度計算の際に採用することにより、雑音重畳時の音
声区間切り出し誤差、音韻職別誤差に起因する単語認識
率の低下を軽減することができる。
次に第2の発明の一実施例について、第2図に基づいて
説明する。第2の発明の第1の発明との主な蜜いは、音
声の抽象化にあたり音韻分析しで音韻系列化するのでな
く、昔痺的特微量で入力音声を表現しようとするもので
ある。このため第1図中で音韻に関係した部分が全て廿
響I11に関する表現、すなわち音溝分析手段0Q及び
廿婦特徴系列Uυならびに単語音響比較行列0功に代わ
り、かつ音韻類似度行列(4)に相当するものは存在し
ないが、それ以外の基本構成は同じである。このように
第1の発明では音韻別に重み付は係数を与えたのに対し
、第2の発明では何らかの音響尺度を判断法準に重み付
は係数を与えることになる。この第2の発明の場合も、
第1の発明と同様の効果をイ、1)ることかできる。
発明の詳細 な説明したように第1及び第2の発明によれば、l(L
音に適応した音韻別型み付は係数を単語頌似度計算の際
に採用することにより、雑音型骨時の音声区間切り出し
誤差、音1徂識別誤差に起因する単語認識率の低下を軽
減することができる。
【図面の簡単な説明】
第1図は第1の発明の一実施例における跨座認識装置4
の全体構成図、第2図は第2の発明の一実施例における
音声認識装置の全体構成図1である。 (1)・・・雑音検出手段、(2)・・・音韻識別子1
投、に3)・・・跨1111系列、(4)・・・音韻類
似度行列、(5)・・・単語押l(ζパターン、(fi
l・・・単語音韻比較行列、(7)・・・’l’ Wt
j 4A葭度劇・n手段、(8)・・・判定手段、(9
)・・・重み付目係数、(1(ト・・音響分析手段、(
11)・・・音響特徴系列、(1カ・・・単語音韻比較
行列 代理人 森 本 義 弘

Claims (1)

  1. 【特許請求の範囲】 1、 入力音声の音韻を任意の短時間区間毎に識別して
    音韻系列を出力する音韻識別手段と、認識しようとする
    音声単位が有すると予想される標準的な音韻系列が予め
    登録された音声単位標準パターンと、各音韻間の類似性
    を表わす音韻類似度行列と、前記音韻識別手段から出力
    される音韻系列と前記音声単位標準パターンと前記音韻
    類似度行列とを用いて入力音声の音韻性と1前記音声単
    位I51$パターンの音韻性との間の類似度を前記短時
    間区間の音韻毎に表現する音声単位音韻比較行列と、こ
    の音声単位音韻比較行列によって表わされるところの音
    韻類似性を音声単位毎にめる音声単位類似度計算手段と
    を備え、予め音韻別に雑、音の強度・特性に応じた良数
    組の重み付は係数を用意しておき、入力音声に重畳する
    什、音の強度及び特性を検出する雑音検出手段から得ら
    れる情報に基づいて、A;π宜特定のn↑み付は係数の
    組を選M<シ、前記音声単位類似度計算手段により前記
    重み付は係数を用いて音声単位毎に音韻類似度をW1算
    する構成とした音声認識装置1イ。 2、 入力に声を任意の短時間区間4σに音響分イバし
    てその音響特徴系列を出力する音響分析手段と、認識し
    ようとする音声単位が有すると予想される(λQζ的な
    音響特徴系列が予め登録された音声!11位倒1小パタ
    ーンと、+iil記音品記音手分析手段力される音響特
    徴系列と[J11記汁声単位標準パターンとを用いて入
    力音声と台声単位漂準パターンとの間の力゛1以反を前
    記短時間区間の入力音声毎に表現する音声単位音%l比
    較行列と、この音声単位音響比較行列によって表わされ
    るところの音響類似度を11f声単位毎にめる音声単位
    類似度計算手段とを備え、予め音響特徴系列に雑音の強
    度・特性に応じた複数組の重み付は係数を用意しておき
    、入力音声に重畳する雑音の一強度及び・特性を検出す
    る雑音検出手段から得られる情報に基づいて、適宜特定
    の重み付は係数の組を選択し、前記音声単位類似度計算
    手段により111ノ記重み付は係数を用いて音声単位毎
    に音1.+、l、す4′I似度を計算する構成とした音
    声認識装置。
JP58117712A 1983-06-28 1983-06-28 音声認識装置 Granted JPS607496A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58117712A JPS607496A (ja) 1983-06-28 1983-06-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58117712A JPS607496A (ja) 1983-06-28 1983-06-28 音声認識装置

Publications (2)

Publication Number Publication Date
JPS607496A true JPS607496A (ja) 1985-01-16
JPH024920B2 JPH024920B2 (ja) 1990-01-30

Family

ID=14718435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58117712A Granted JPS607496A (ja) 1983-06-28 1983-06-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPS607496A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61143070A (ja) * 1985-11-29 1986-06-30 帝人株式会社 人工腎臓の熱滅菌方法
JPS61143072A (ja) * 1985-11-29 1986-06-30 帝人株式会社 人工腎臓の熱滅菌方法
JPS61143071A (ja) * 1985-11-29 1986-06-30 帝人株式会社 人工腎臓の熱滅菌方法
JPS6343669A (ja) * 1986-08-08 1988-02-24 帝人株式会社 血液処理器の製造方法
JPH0426900A (ja) * 1990-05-22 1992-01-30 Nec Corp 音声認識装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61143070A (ja) * 1985-11-29 1986-06-30 帝人株式会社 人工腎臓の熱滅菌方法
JPS61143072A (ja) * 1985-11-29 1986-06-30 帝人株式会社 人工腎臓の熱滅菌方法
JPS61143071A (ja) * 1985-11-29 1986-06-30 帝人株式会社 人工腎臓の熱滅菌方法
JPS6343669A (ja) * 1986-08-08 1988-02-24 帝人株式会社 血液処理器の製造方法
JPH0426900A (ja) * 1990-05-22 1992-01-30 Nec Corp 音声認識装置

Also Published As

Publication number Publication date
JPH024920B2 (ja) 1990-01-30

Similar Documents

Publication Publication Date Title
US20240428778A1 (en) Method and System for a Parametric Speech Synthesis
Nasib et al. A real time speech to text conversion technique for bengali language
US20030187651A1 (en) Voice synthesis system combining recorded voice with synthesized voice
JPS607496A (ja) 音声認識装置
JP3523382B2 (ja) 音声認識装置及び音声認識方法
Meftah et al. A comparative study of different speech features for arabic phonemes classification
JP2966002B2 (ja) 音声認識装置
Othman et al. Jawi character speech-to-text engine using linear predictive and neural network for effective reading
Cheng et al. Comparative performance study of several pitch detection algorithms
JP2017126004A (ja) 音声評価装置、方法、及びプログラム
Medress et al. A system for the recognition of spoken connected word sequences
Hong et al. Automatic Miscue Detection Using RNN Based Models with Data Augmentation.
Cook et al. Advanced acoustic techniques in automatic speech understanding
KR100236962B1 (ko) 음소별 화자 종속 변이음 모델링 방법
Ezeiza et al. Combining mel frequency cepstral coefficients and fractal dimensions for automatic speech recognition
Seman et al. Hybrid methods of Brandt’s generalised likelihood ratio and short-term energy for Malay word speech segmentation
JPH02124600A (ja) 音声認識装置
Blomberg et al. Speech recognition based on a text-to-speech synthesis system.
JPH06102895A (ja) 音声認識モデル学習装置
JPS6148897A (ja) 音声認識装置
JPS6069700A (ja) 音声認識装置
Kaur et al. Automatic marking of Punjabi syllables boundaries in a sound file
Duchateau et al. Evaluation of phone lattice based speech decoding
Law An efficient first pass of a two-stage approach for automatic language identification of telephone speech
JPS59168496A (ja) 音声認識方法