JPH03180897A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03180897A
JPH03180897A JP1320918A JP32091889A JPH03180897A JP H03180897 A JPH03180897 A JP H03180897A JP 1320918 A JP1320918 A JP 1320918A JP 32091889 A JP32091889 A JP 32091889A JP H03180897 A JPH03180897 A JP H03180897A
Authority
JP
Japan
Prior art keywords
pattern
voice
similarity
patterns
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1320918A
Other languages
English (en)
Inventor
Nobuo Hagimoto
萩本 信男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP1320918A priority Critical patent/JPH03180897A/ja
Publication of JPH03180897A publication Critical patent/JPH03180897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、使用者が発生した音声パターンを予め登録し
ておいた複数の音声パターン(標準パターン)と比較し
て単語音声を認識する音声認識装置に関する。
[発明の概要] 音声の登録パターンを格納するエリアを持ち。
予め認識させる音声単語に対応する音声パターンを格納
し、前記登録パターンエリア内の音声登録パターンと入
力された音声パターンのパターンマツチングを行なうこ
とで、入力パターンに対応する音声単語の認識を行なう
音声認識装置において、登録された音声パターンA1と
入力された音声パターンAJ (i=  1.2.  
・・・・・・eNt  j=  1.2.  ・・・・
・・、N)相互の類似度S(i。
j )を算出し、これが閾値STHを上回ったときに、
そのときの音声式カバターンの組合せを使用者に知らせ
る表示部と、使用者が変更するパターンを指定するため
の入力部を有し、標準パターン相互の類似度が一定値以
下になるように音声パターンを使用者が選べるように構
成された音声認識装置。
[従来の技術] 単語音声認識装置の認識において、一般には、使用者が
発生した音声パターンと予め登録しておいた複数の音声
パターン(標準パターン)のマツチング処理を次々と行
なう。認識結果では、マツチングの際に求めた類似度(
または距離)が入力音声パターンに対して大きい(小さ
い)音声パターンが選ばれる。誤認識の原因としては環
境雑音1発生法度の違い、話者の変動、等があり、問題
となる。その中の一つとして、登録した複数の音声パタ
ーン間の類似度(距M)が酷似していることによるもの
がある。
[発明が解決しようとする課題] 従来のシステムでは、登録する単語に任意のものが使用
でき、入力音声パターンに一番近いものを認識結果とす
るというものが多く、登録パターン間の類似度の違いで
起こる誤認識については対策が施されていない。
[発明の目的] 本発明の目的は、上記の問題点を解決するために、登録
した複数の音声パターン間の類似度(距離)を求めて、
誤認識を起こすと判定し得る音声パターンの組合わせを
使用者に知らせ、音声パターンの再登録を促す機能を実
現するための音声認識装置を提供することである。
[課題を解決するための手段] 上記目的を達成するために、本発明による、音声の登録
パターンを格納するエリアを持ち、予め認識させる音声
単語に対応する音声パターンを格納し、前記登録パター
ンエリア内の音声登録パターンと入力された音声パター
ンのパターンマツチングを行なうことによって、入力パ
ターンに対応する音声単語の認識を行なう音声認識装置
は、登録された第1の音声パターンと第2の音声パター
ンの類似度(距離)を算出する第1の手段と、該第1の
手段により算出された値と所定値を比較する第2の手段
と、上記第2の手段の比較結果に応じて、上記類似度の
方が大きいとき、そのことを報知する手段とを含むこと
を要旨とする。
[作用] 登録した標準パターン間の類似度または(距M)を評価
し、その結果を使用者にフィードバックし、誤認識の起
こりにくい音声パターンの組合わせで、標準パターンを
構成できるようにする。
[実施例] 以下に、図面を参照しながら、実施例を用いて本発明を
一層詳細に説明するが、それらは例示に過ぎず、本発明
の枠を越えることなしにいろいろな変形や改良があり得
ることは勿論である。
第1図は本発明による音声認識装置の構成を示すブロッ
ク図で、図中、1 はマイクロフォン、2 は特徴抽出
部、3 は中央処理ユニット(CPU )、 4はRO
M 、 5はRAM 、 6はパターンメモリ、7 は
キーマトリックス、8はデータ表示装置を示す。
第1図に示すように、音声はマイク l で電気信号に
変換され、CPU 3.プログラムROM4、RAM 
5 で構成されるマイコン部に制御される特徴抽出部2
で特徴が抽出され、パターンメモリ 6 に格納される
特徴抽出部2は、第7図に示すように、マイク、AGC
増幅器、高域強調回路、複数の帯域通過フィルタ(BP
F )と複数の整流器と複数の平滑回路とからなるフィ
ルタバンクと A/Dコンバータからなる。
マイク 1 から入力された音声はAGC増幅器で増幅
され、一定値以内に振幅制限された後、高域強調回路に
より音声の高域における出力低下を補正する。次に第6
図に示すような特性を持つフィルタパンクに入力され、
各フィルタの出力は整流器1〜n 、平滑回路 1〜n
でそれぞれ整流、平滑化されてA/D コンバータの各
チャンネルへ入力される。
以下上記実施例の動作を説明する。
キーマトリックス 7で登録モードが指定されている間
はマイクロコンピュータ部は上記と同じ動作をし、シス
テムの最大登録単語数N以下の数だけパターンが入力さ
れる。パターンメモリ6 には、登録時の音声に対応し
たパターンの格納される領域があり、音声パターンAI
(i==1.・・・・・・、N)に対応しており、これ
をそれぞれM、(i  =  1.・・・・・・、N)
と定義する。
MlのパターンとM」のパターンの類似度をS(i、j
  )とし、全ての ltJ  の組合わせについて類
似度S を求める。したがってマイクロコンピュータ部
はパターンメモリ 6 に格納しであるパターン間の類
似度を求めていくが、その手続きは以下のようである。
1)S(11j )  (i =  1.2. ・・・
・・1 N。
J  ”  ly 2e・・・・・・、N)を求める。
2)S(i、j )〉STHなる lyJ  の組合せ
を記憶し、表示する。 STHは予め設定した類似度の
閾値である。
類似度と距離は双対の関係にあって、パターンA とパ
ター>B の類似度が大きいとき、距離は小さくなり、
類似度が小さいとき、距離は大きくなる。類似度とは、
 DP マツチングで求めたパターンAとパターンB 
の累積距離の逆数を意味する。
(類似度)=(累積距離)−1 DP マツチング、累積距離の考え方は以下の文献に記
載されている。
Fliroaki、5AKOE and 5eibi 
CHIBA著“Dynamic Programmin
gA1goritha+ 0ptiIIlizatio
nfor 5poken Word Recognit
ion”IEEE TRANSACTION ON A
COUSTIC3,5PEECH,ANDSTGNAL
 PROCESSING、 Vol、 ASSP−26
,No、 l。
Feb、 1978. PP、 43〜49閾値STH
を上回った ltJ  の組合せを表示部8 において
表示して、使用者にどの登録パターン同士の類似度が大
きいのかを知らせる。
使用者はこ\で、表示部8 に表示された数字の組合せ
のうち、変更しなければならないパターンの番号(k 
とする)をキーマトリックス 7で指定すると、マイク
ロコンピュータ部はマイクロフォン 1 から入力され
る変更パターンを特徴抽出部2 を経てパターンメモリ
 6 のメモリエリアM11に格納する。
メモリエリアMkに新しいパターンが入力されると、マ
イクロコンピュータ部は上記と同様な類似度S の計算
を以下のように行なう。
3)S(k、j  )(j  =  1921・・・・
・・N)を求める。
4)S(k、j)>5tI4なる k、j の組合せを
記憶し、表示する。
こ\で、メモリエリアMkに入力されたパターンが、以
前に格納してあったパターンと較べて、他のパターンと
の類似度が十分小さければ、4)の処理の閾値STHを
上回らなくなるので、1′i。
2)の処理を再び繰り返しても、データ表示装置8 に
出力される数字(コード)の組合せの中には k は含
まれないことになる。
以上の処理の手続きを使用者とシステムの間で繰り返す
ことで、最終的にパターンメモリ 6 に格納されるパ
ターン間の類似度S(x、j )のどの組合せについて
も閾値STHを上回ることはなくなる。したがって、作
成されたlR11Iパタ一ン間の類似度の隔たりに一定
の基準(ST)I)を与えることができるので、登録パ
ターンの類似度が酷似していることによる誤認識を防止
することができる。
以上の処理を第2図および第3図を用いて、具体例をも
って詳しく説明する。
第2図はN=10 のときの類似度の組合せを表にした
ものである。 5(xtj )=S(j、x)なので、
 1+J  全での組合せについて5(ITJ)を求め
る必要はなく、第2図の組合せでよい。 S(i、1)
(i=1、・・・・・・、10)は自分自身についての
類似度であるので、  S(i+j  )(j  = 
 L・・・・・・10)のうちで最大となり、 STH
を越えていなければならない(ST□はS(i、i )
から決められるから)。
第3図にパターンメモリエリアM、(i==1、・・・
・・・ 10)に数字を l から 10 まで読み上
げた音声パターンが格納されであるものとする。こ)で
、前述の類似度を求める方法で計算を行なうと1M1(
イチ)と M?(シチ)の類似度が大きくて S(L、
7 )> 5T)lとなったとする。この時点でパター
ンの変更を行なわずに+ A =”イチ′″と発声し、
音声認識を行なわせると、Ml(イチ)とM?(シチ)
の類似度は大きいので、本来は S(A、1 )がS(
A、1 )・・・・・・ S(A、10 )のうちで最
大になり、第4図に概念的に示すように、Mlのパター
ンに対応する認識コードが返されるはずが、S(A、7
 )と判定されてしまうことがある。
そこで、このようなことを防止するために、第3図にお
いて、 S(1,7)> STHと、第↓図のデータ表
示装置8 で出力されたとき、使用者が先に説明した手
、続きでM7のパターンを゛′ナナ”に変更したとする
と、MlとM7のパターンの類似度が小さくなるので、
S(A。
1 )、 S(A、 7 )の比較の結果はS(A。
1 )の方が大きくなり、誤し&識しにく賢なる。
第5図は上記マイクロコンピュータ部の動作をフローチ
ャートで示す。図中、Nは登録語数。
S(i、j )は i 番目のパターンと j 番目の
パターンの類似度、STHはS(i、j )に対する類
似度、MIlは第に番目の音声格納エリアを表わす。こ
の動作に入る以前にN個の音声パターンがパターンメモ
リ Mkに格納されているものとする。
[発明の効果] 以上説明した通り、本発明によれば、従来の音声認識装
置で用いられているマツチングアルゴリズムはそのま\
で、マツチングを標準パターンに適用すれば、本発明が
構成でき、したがって、比較的容易に現行のシステムに
本機能を追加し、コストを安く、認識率を上げることが
できるという利点が得られる。
【図面の簡単な説明】
第1図は本発明による音声認識装置の構成を示すブロッ
ク図、第2図はN=10 のときのパターンメモリ間の
類似度を示す図、第3図はi2録パターンの変更例を示
す図、第4図は認識コード判定の概念図、第5図はマイ
クロコンピュータ部の動作を示すフローチャート、第9
図は特徴油出部の構成を示すブロック図、第6図は第7
図に示すフィルタバンクの周波数特性図である。 1・・・・・・・・・マイクロフォン、2・・・・・・
・・・特徴抽出部。 3・・・・・・・・・中央処理ユニット(CPU )、
4・・・・・・・・・ ROM  、5・・・・・・・
・・ RAM  、6・・・・・・・・・パターンメモ
リ、7・・・・・・・・・キーマトリックス、8・・・
・・・・・・データ表示装置。

Claims (1)

  1. 【特許請求の範囲】 音声の登録パターンを格納するエリアを持ち、予め認識
    させる音声単語に対応する音声パターンを格納し、前記
    登録パターンエリア内の音声登録パターンと入力された
    音声パターンのパターンマッチングを行なうことによっ
    て、入力パターンに対応する音声単語の認識を行なう音
    声認識装置において、 登録された第1の音声パターンと第2の音声パターンの
    類似度(距離)を算出する第1の手段、該第1の手段に
    より算出された値と所定値を比較する第2の手段、およ
    び 上記第2の手段の比較結果に応じて、上記類似度の方が
    大きいとき、そのことを報知する手段を含むことを特徴
    とする音声認識装置。
JP1320918A 1989-12-11 1989-12-11 音声認識装置 Pending JPH03180897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1320918A JPH03180897A (ja) 1989-12-11 1989-12-11 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1320918A JPH03180897A (ja) 1989-12-11 1989-12-11 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03180897A true JPH03180897A (ja) 1991-08-06

Family

ID=18126728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1320918A Pending JPH03180897A (ja) 1989-12-11 1989-12-11 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03180897A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100476337B1 (ko) * 1997-12-31 2005-06-13 엘지전자 주식회사 음성인식기의유사단어인식방법
KR100482313B1 (ko) * 1996-12-30 2005-07-21 엘지전자 주식회사 이중유사도비교를통한음성인식방법
JP2015022411A (ja) * 2013-07-17 2015-02-02 東芝テック株式会社 認識辞書評価装置及び認識辞書評価プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100482313B1 (ko) * 1996-12-30 2005-07-21 엘지전자 주식회사 이중유사도비교를통한음성인식방법
KR100476337B1 (ko) * 1997-12-31 2005-06-13 엘지전자 주식회사 음성인식기의유사단어인식방법
JP2015022411A (ja) * 2013-07-17 2015-02-02 東芝テック株式会社 認識辞書評価装置及び認識辞書評価プログラム
US9619836B2 (en) 2013-07-17 2017-04-11 Toshiba Tec Kabushiki Kaisha Recognition dictionary evaluation apparatus and recognition dictionary evaluation method

Similar Documents

Publication Publication Date Title
KR20210050884A (ko) 화자 인식을 위한 등록 방법 및 장치
US11416593B2 (en) Electronic device, control method for electronic device, and control program for electronic device
JPH03180897A (ja) 音声認識装置
JPS63186298A (ja) 単語音声認識装置
JP2589300B2 (ja) 単語音声認識装置
KR102033218B1 (ko) 음성 인식 방법 및 그 장치
CN110880322B (zh) 监控设备的控制方法及声控装置
JP2004294803A (ja) 音声認識装置
JPH05210397A (ja) 音声認識装置
JP2989231B2 (ja) 音声認識装置
JPH02300800A (ja) 音声認識装置
JPS60118892A (ja) 音声認識装置
JP2975808B2 (ja) 音声認識装置
JPH0119158B2 (ja)
JPS59212900A (ja) 音声認識装置
JPS58159598A (ja) 単音節音声認識方式
KR20000040572A (ko) 상관관계를 이용한 후처리 음성인식 방법
JPS59111698A (ja) 音声認識方式
JP3011984B2 (ja) パターン照合方法
JPH02275497A (ja) 音声認識装置
JPS63118796A (ja) 音声認識装置
JPS5946696A (ja) 音声認識方式
JPH04199199A (ja) 音声認識装置
JPH04306700A (ja) 音声認識装置
JPS5883900A (ja) 音声識別装置