JPS5823097A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5823097A
JPS5823097A JP12163181A JP12163181A JPS5823097A JP S5823097 A JPS5823097 A JP S5823097A JP 12163181 A JP12163181 A JP 12163181A JP 12163181 A JP12163181 A JP 12163181A JP S5823097 A JPS5823097 A JP S5823097A
Authority
JP
Japan
Prior art keywords
voice
speech
section
input
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12163181A
Other languages
English (en)
Inventor
直樹 石井
良平 中津
小島 順治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP12163181A priority Critical patent/JPS5823097A/ja
Publication of JPS5823097A publication Critical patent/JPS5823097A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は音声で入力された単語、音節等を紹鐵する音
声iIa!識装置に関するものである。
音声で入力された数字、地名等の単語もしくは音節等を
認識する音声認識装置は荷物の区分け、端末からのデー
タ入力尋の分野で実用に供されている。従来の音声認識
装置の構成を第1図に示す。
第1図において入力端子1よ多入力された祈声は音声分
析部2において帯域制限された後、A/D変換によりデ
ィジタル音声に変換され、パワー情報等を用いて音声区
間の抽出が行われる、その抽出された音声区間では特徴
パラメータが計算され、入力音声は%徴パラメータに変
換される。MU部3では標準パターン記憶部4にI記憶
された標準パターンと分析部2で特徴パラメータに変換
された入力音声との照合が行われ、入力音声と各標準パ
ターンとの距離(もしくは類似度またはそれに相当する
t)が計算される。すべての標準パターンとの距離が計
算され、その最小の距離(類似度の場合は厳大の類似度
)をもつ標準パターンに対応する単語が認識結果として
出力端子5から出力される。なお以後の観明は距離につ
いて行うが、類似度の場合は最小値を最大値に読みかえ
ることによシ適用できる。
従来この種の音声認識装置では認識対象の単語の標準パ
ターンのみを標準パターン記憶部4に記憶しておくのが
通常であった。しかしながら音声認識装置の利用者は必
ずしもagt&対象の単鎖のみを正しく入力してくれる
とは限らない。時にはせきばらい、くシやみ等や“え−
と”、“あの−”等の音声が入力されるのは避けられな
い。また背抜で話し声や靴音、ドアの開閉の音などがす
る場合はこれらもひろってしまうことも起りうる。更に
は電話回線を通して音声を入力する場合、状況によって
ビジートーン、リングバックトーン等が入力されること
も起シうる。これらの音声もしくは音が入力されると、
これらの音声屯しくけ音が内置されているいずれかの標
準パターンに近いと判定されて出力端子5から出力され
ると、望ましくない結果が出力されることになる。した
がって例えば音声で計算機にデータを投入しようとする
場合や音声によシ銀行業務、座席予約等のサービスを受
けようとする場合、重大な支障をき九す仁とになる。
このような事態を避けるため従来とられてきた方法に棄
却という出力を許すことがある。これはしきい(mDを
もうけておき、1繊結果に付随して得られる距離値dが
Dよシ大きけれは棄却と判定することにより上記のよう
な認識誤り金防ごうというものである。しかしながらこ
のような方法をとっても認識対象の音声に似た音声もし
くFi祈が入力された場合、認識誤りが生じるのは避け
られない。
第2図はこの様子を示した図であり、音声の特徴パラメ
ータを空間上の点として模式的に示したものである。4
@域6は“はい”という認識対象の単鎖の分布、点7は
その標準パターンの点である。
正しい発声を棄却しないためにはしきい値りは領域6を
おおうに足る大きさにする必要がある。このとき点7を
中心とした半径りの球8の内部の点は“はい”と認識さ
れる。領域9は“たに1というM一対象外の音声の分布
を示し、これは穎塚8と重なっており、点10はその1
つの発声データの位置を示し、前記重な多部分にある。
この場合点10は1はい″と誤って認識されてしまうこ
とになる。このような事態は認識方法のいかんにかかわ
らず従来の音声111g誠装置では避けられない問題点
であった。
この発明はこの欠点を除去するために、棄却すべき音声
もしくは音に対応した標準パターンをあらかじめ作成し
て内蔵しておき、認識結果が上記棄却用の標準パターン
になった場合は、棄却を出力することを特徴とした音声
認識装置で、その目的は入力されることが避けられず、
従来の装置では誤って認識されやすいため重大な支障が
生じた音声もしくは音を正しく棄却することにある。
第3図はこの発明の実施例を示し、第1図と対応する部
分には同一符号を付けであるが、この発明では標準パタ
ーン記憶部4に認識対象の単結に対応した標準パターン
を記憶する記憶[41の他に、棄却すべき音声もしくは
音に対応した伸率パターンの記憶部42が設けられる。
この装置の動作は第1図に示した音声認識装置の場合と
殆んど同一である。たりしこの発明装置で祉−識部3で
入力音声と、記憶部41に記憶しであるwt識対象の単
鎖の標準パターンとの照合を行う他に、記憶N42に記
憶しである棄却すべき音声もしくは音の標準パターンと
も照合を行い、これらの中で最小の距離を持つ標準パタ
ーンを求める。更に求めた標準パターンが記憶部41に
記憶しである標準パターンであれば、第1図に示した装
置と全く同じ処理をして結果を出力する。もし最小距離
をもつ[4パターンとして記憶部42にbピ憶しである
標準パターンが選ばれた場合は棄却として結果を出力端
子5に出力する。
第4図はこの発明装置が有効に動作することの原理を図
示したものであシ、第2図と対応する部分には同一符号
を付けである。棄却すべき音声頓たに”に対して用意し
た標準パターンの空間上の点11と発声データの点lO
とが比較され、この点10は標準パターン11と最も距
離が近いのでこの点10の音声に対しては棄却という正
常な出力が得られる。
以上説明したように、この発明の#cTijtは棄却す
べき音声もしくは音の標準パターンを用意しておき、入
力音声が棄却すべき音声もしくは音の憚準パターンと最
も近いと判定された場合には棄却という出力を出すため
、せきばらい、くシやみ、ビジートーン、リングバック
トーン婢音声紹誠装置への入力が避けられない音声もし
くは音を正しく棄却し、望ましくない耐織結釆が得られ
ることを避けられる利点がある。
4、図面の簡単なりil、E94 第1図は従来の音声g繊装置の構成を示すブロック図、
第2図は従来の音声認識装置において棄却すべき語が誤
って認識される例を示しだ図、第3図はこの発明装置の
一実施例の構成を示すブロック図、!4図はこの発明を
用いると棄却すべき時が正しく棄却されることを示す図
である。
l二人力端子、2:分析部、3:餡瞳部、4:標準パタ
ーン記憶部、41:認鍼対象飴の標準パターン記憶部、
42:棄却すべき入力O4J準パLンH己憶部、5:出
力端子、6:Mk対象の飴“はい″の分布、7:“はい
”の4s準パターン、8:”はい”とV、陳される入力
の範囲、9:棄却すべき胎”たに″の分布、10:“た
に”の特定の発声の位置、11:”だに”の標準パター
ン。
%許出1人  日本電信’NU話公社 代理人 草野 車 71 図 オ 2 図 オ 3 図 42

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声を分析し、%徴パラメータを抽出する音
    声分析部と、標準パターンを記憶しておく標準パターン
    記憶部と、入力音声から前記音声分析部において抽出さ
    れた特徴パラメータと、前記標準パターン記憶部に記憶
    されている椰準ノ(ターンとの照合を行う音声ktk部
    とから構成され、前記標準パターン記憶部において、認
    識すべき音声の標準パターンと共に東却すべき音声、も
    しくは肯の標準パターンを記憶しておくことを%黴とす
    る音声認識装置。
JP12163181A 1981-08-03 1981-08-03 音声認識装置 Pending JPS5823097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12163181A JPS5823097A (ja) 1981-08-03 1981-08-03 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12163181A JPS5823097A (ja) 1981-08-03 1981-08-03 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5823097A true JPS5823097A (ja) 1983-02-10

Family

ID=14816038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12163181A Pending JPS5823097A (ja) 1981-08-03 1981-08-03 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5823097A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5830800A (ja) * 1981-08-17 1983-02-23 トヨタ自動車株式会社 車両用音声認識方式
JPS5848099A (ja) * 1981-09-16 1983-03-19 日本電気株式会社 音声パタン一致検定方法
JPS5876893A (ja) * 1981-10-30 1983-05-10 日本電気株式会社 音声認識装置
JPS59178587A (ja) * 1983-03-30 1984-10-09 Nec Corp 話者確認システム
JPS59218499A (ja) * 1983-05-26 1984-12-08 富士電機株式会社 音声誤認識防止方法
JPS61179499A (ja) * 1984-09-28 1986-08-12 インタ−ナシヨナル・スタンダ−ド・エレクトリツク・コ−ポレイシヨン テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置
JP2001083989A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56121100A (en) * 1980-02-29 1981-09-22 Nissan Motor Voice identification driving device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56121100A (en) * 1980-02-29 1981-09-22 Nissan Motor Voice identification driving device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5830800A (ja) * 1981-08-17 1983-02-23 トヨタ自動車株式会社 車両用音声認識方式
JPS5848099A (ja) * 1981-09-16 1983-03-19 日本電気株式会社 音声パタン一致検定方法
JPS5876893A (ja) * 1981-10-30 1983-05-10 日本電気株式会社 音声認識装置
JPS59178587A (ja) * 1983-03-30 1984-10-09 Nec Corp 話者確認システム
JPS59218499A (ja) * 1983-05-26 1984-12-08 富士電機株式会社 音声誤認識防止方法
JPS61179499A (ja) * 1984-09-28 1986-08-12 インタ−ナシヨナル・スタンダ−ド・エレクトリツク・コ−ポレイシヨン テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置
JP2001083989A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置

Similar Documents

Publication Publication Date Title
US4400828A (en) Word recognizer
DE69324988T2 (de) Überprüfung des Sprechers
JP3080388B2 (ja) 不明人物の同一性検証方法
US5664058A (en) Method of training a speaker-dependent speech recognizer with automated supervision of training sufficiency
EP0109190B1 (en) Monosyllable recognition apparatus
JPS5876893A (ja) 音声認識装置
CA2133787C (en) Method of accomodating for carbon/electret telephone set variability in automatic speaker verification
JPS5823097A (ja) 音声認識装置
US5101434A (en) Voice recognition using segmented time encoded speech
JPH07104952B2 (ja) パターンマッチング装置
JPH0432900A (ja) 音声認識装置
JPS593491A (ja) 音声認識装置
KR100339525B1 (ko) 1,2단계중심어인식방법을이용한생활정보안내장치
JPS58102999A (ja) 音声認識装置
JPS63121099A (ja) 音声認識装置
JPS60208800A (ja) 単語音声認識装置
JPH05216493A (ja) オペレータ支援型音声認識装置
JPH0459637B2 (ja)
JPS59125799A (ja) 音声認識装置
JPS58105299A (ja) アルフアベツト音声認識装置
Thomson et al. Automatic speech recognition in the Spanish telephone network.
JPS5952300A (ja) 電話入力音声認識方式
JPS6173200A (ja) 音声認識装置
JPS58152299A (ja) 音声入力制御装置
JPH03274598A (ja) 音声認識装置