JPH0362279B2 - - Google Patents

Info

Publication number
JPH0362279B2
JPH0362279B2 JP58119044A JP11904483A JPH0362279B2 JP H0362279 B2 JPH0362279 B2 JP H0362279B2 JP 58119044 A JP58119044 A JP 58119044A JP 11904483 A JP11904483 A JP 11904483A JP H0362279 B2 JPH0362279 B2 JP H0362279B2
Authority
JP
Japan
Prior art keywords
dictionary
matching distance
input
recognition
outputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58119044A
Other languages
English (en)
Other versions
JPS6011897A (ja
Inventor
Takahiro Sakuraba
Sumiko Sugihara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58119044A priority Critical patent/JPS6011897A/ja
Publication of JPS6011897A publication Critical patent/JPS6011897A/ja
Publication of JPH0362279B2 publication Critical patent/JPH0362279B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (イ) 発明の技術分野 本発明は、音声認識装置に係わり、特にマルチ
テンプレート方式に改良を加えた音声認識装置に
関する。
(ロ) 技術の背景 従来の音声認識装置には、使用者の音声を登録
し、その登録した音声と入力した音声とを照合し
て最も似ているものを認識結果として出力する特
定話者音声認識装置がある。
この型式の音声認識装置には、1つの語に複数
の辞書を用意するマルチテンプレート方式のもの
や、これに学習処理を導入して上記方式を更に発
展させたものがあるが、この後者の方式になるも
のであつても、その辞書登録における発声の態様
や、発生される語の性質に対する分析がいまだ十
分でなく、その結果として、用意しなければなら
ない辞書容量はなお多くにならざるを得ないのみ
ならず、そのために認識時間が長くなる等更に改
善すべき余地が残されている。
(ハ) 従来技術と問題点 上述の特定話者音声認識装置の初期において
は、1つの語に1つの辞書を用意する場合に生ず
る誤認識を回避せんとして発声のばらつきに対処
する辞書、即ち1つの語に複数の辞書を用意する
いわゆるマルチテンプレート方式の音声認識装置
が開発された。この装置においては、各語毎にそ
の語を発生した場合に生じ得る各種音声を十分に
登録している場合にはその効果を期待出来る。し
かし、実際には、音声登録を続けて行なう場合が
多く、その登録の際の発声が同様なものになり易
いため、マルチテンプレート化の効果は稀釈化さ
れてしまう。
そこで、登録が終了したら、入力音声と対応す
る語の辞書の照合距離の近いものについて特定比
率で入力音声と登録音声とを合成して得た学習音
声をその語の登録音声として再登録を行なうとい
う学習処理を行ない、徐々に発声の異なる辞書に
する手段を採用している。
このようにして、すべて語に複数の辞書を持た
せても、その登録の際に同様な発声になる音声が
登録される場合には、依然として上述したと同様
マルチテンプレート化の効果を発揮出来ない。
又、語によつては発声し易くばらつきの出にく
いものや、類似語がなく誤認識しにくいものがあ
る。このような語について上述のようなマルチテ
ンプレート化を行なう必要性は乏しい。
(ニ) 発明の目的 本発明は上述したような従来装置の有する欠点
に鑑みて創案されたもので、その目的は必要な辞
書数の大幅な削減をなして認識時間の短縮化を図
つた音声認識装置を提供するたことちある。
(ニ) 発明の構成 そして、この目的は、マルチテンプレート方式
の辞書を有し、その辞書内容を学習処理により更
新する音声認識装置において、前記辞書の辞書内
容の各々と入力音声パラメータとの照合からその
最短照合距離を出力する最短照合距離出力手段
と、次候補対応の語に対応する辞書内容と入力音
声パラメータとの照合を行なつてその認識結果、
及び当該辞書内容との間の照合距離情報を出力す
る出力手段と、次候補要求入力を入力する入力手
段と、該入力手段に応答して前記最短照合距離の
辞書内容に照合距離が近い照合距離の語であつて
異なる語についての処理を前記出力手段に生ぜし
める制御手段と、前記出力手段による異なる語に
ついての処理において前記出力手段から出力され
る照合距離と、前記最短照合距離との差が予め決
められた基定値より小さいとき、信号を出力する
検出手段と、前記信号の発生まで前記各手段の動
作を継続させ、その発生で前記入力音声パラメー
タを前記辞書に追加登録させる登録手段とを設け
ることによつて、達成される。
(ヘ) 発明の実施例 以下、添付図面を参照して本発明の実施例を説
明する。
添付図面は本発明の一実施例を示す。1は使用
者Uから発生された音声を受音するマイクロホン
で、2はマイクロホン1に接続された音声特徴抽
出部である。3は音声特徴抽出部2から出力され
た入力音声パラメータを格納する入力音声パラメ
ータバツフアである。入力音声パラメータバツフ
ア3の出力は登録学習制御部4へ接続されると共
に、パラメータ照合部5へ接続され、そこへの入
力音声パラメータは登録学習制御部4の制御の下
にある登録パラメータ辞書部6から出力される登
録音声パラメータとパラメータ照合部5で照合さ
れ、登録音声パラメータ毎に照合距離を認識制御
部7へ与えるように構成されている。又、登録音
声パラメータ辞書部6の登録音声パラメータ出力
は登録学習制御部4へ接続され、登録学習制御部
4は後述するような学習処理結果の学習音声パラ
メータ又は入力音声パラメータを登録音声パラメ
ータ辞書部6に再登録又は追加登録するように構
成されている。
認識制御部7はパラメータ照合部5から照合距
離を受けて最も照合距離の近い辞書を認識結果の
辞書とし、その辞書情報を認識辞書情報として線
8上に送出すると共に、上記最も照合距離の近い
辞書が何語であるかを示す情報を登録学習制御部
4の制御の下にある辞書デイレクトリ部9から得
て認識結果を線10上に送出し、且つその時の照
合距離を照合距離情報として線11上に発生する
ように構成されている。
12は線11上の照合距離情報を受けてその順
次の照合距離間の関係が予め決められた関係、例
えばそれら照合距離間の差が基定値よりも小さい
関係にあるとき、線13上に辞書追加要求信号を
発生する辞書追加制御部である。
線8及び13は登録学習制御部4へ接続されて
いる。
14は登録学習制御部4からの上述したような
学習音声パラメータ又は入力音声パラメータを格
納するバツフアである。
又、15は登録学習制御部4及び認識制御部7
へ接続され、装置に登録モード,学習モード,又
は認識モードを設定し、又後述するような誤認識
時に次候補のための要求信号を発生する操作パネ
ルである。
次に、上述した構成の本発明装置の動作を説明
する。
本発明を実施する装置には、登録モード,学習
モード,又は認識モードがあつて、装置は先ず、
使用者Uによる操作パネル15の装置により登録
モードに設定される。
この登録モードにおいて、使用者Uが登録すべ
き語をマイクロホン1へ向けて順次に発声する。
マイクロホン1から入力された音声は音声特徴抽
出部2で認識用音声パラメータに変換され、その
入力音声パラメータは入力音声パラメータバツフ
ア3に格納される。格納された入力音声パラメー
タは登録学習制御部4の制御により登録音声パラ
メータ辞書部6に登録されると共に、その登録さ
れた辞書と対応する辞書デイレクトリ部9に登録
語の識別情報が登録される。
このような処理が登録したいすべての語につい
て行なわれる。
その終了後、使用者Uは操作パネル15から学
習モードを設定し、再び登録モードの場合と同様
にして音声を入力させる。その入力された音声は
音声特徴抽出部2に与えられ、そこで音声パラメ
ータの抽出処理が行なわれる。抽出された入力音
声パラメータは入力音声パラメータバツフア3に
格納される。
この入力音声パラメータバツフア3の入力音声
パラメータは、登録学習制御部4の制御の下に登
録音声パラメータ辞書部6に登録されているすべ
ての登録音声パラメータと順番にパラメータ照合
部5で照合され、その照合完了の都度照合距離を
認識制御部7へ送る。
これらの照合が終了すると、認識制御部7で
は、照合距離の最も近い辞書を認識結果の辞書と
すると共に、その辞書が何語であるかを辞書デイ
レクトリ部9から得てその認識結果を線10上に
送出する。これと同時的に、認識制御部7から線
8上に認識辞書情報を、又線11上に照合距離情
報を発生する。
線11上の照合距離情報を受けた辞書追加制御
部12は照合距離情報が示す照合距離の間の比
較、即ち1位の認識結果における照合距離と2位
の認識結果における照合距離との比較を行ない、
その差が予め決められた基定値よりも小さければ
誤認識する可能性が高いとして辞書追加要求信号
を発生することとなる。
上述のようにして、線10を経て出力される認
識結果を使用者Uがチエツクし、その認識結果が
誤認識のものである場合には、使用者Uは操作パ
ネル15より認識のための次候補を要求する。認
識制御部7が次候補要求を受け取ると、次に照合
距離が近い別の語を新認識結果として、認識制御
部7から線10上に出力する。又、そのときの照
合距離情報を線11上に、又認識辞書情報を線8
上に送出する。
辞書追加制御部12は第1位の候補の照合距離
と新認識結果の照合距離とを比較し、その差が基
定値より小さければ辞書追加要求信号を線13上
に送出する。この場合に、線13上に信号があれ
ば、入力音声パラメータバツフア3の入力音声パ
ラメータを登録学習制御部4を介してそのまま学
習音声パラメータバツフア14に格納するが、逆
の場合には、線8上の認識辞書情報にも応答する
登録学習制御部4が従来と同様に、入力音声パラ
メータと認識辞書の登録音声パラメータとを特定
の比率で合成して学習音声パラメータを作成し、
これを学習音声パラメータバツフア14に格納す
る。
このような過程を繰り返し又は繰り返せずし
て、認識結果に正解が出たならば、使用者Uは次
の語の学習に入るため、次の語をマイクロホン1
から入力させる。登録学習制御部4は次の語が入
力された来たことに応答して学習音声パラメータ
の登録音声パラメータ辞書部6への登録処理に入
る。辞書追加要求が出ていない場合には、学習音
声パラメータバツフア14の学習音声パラメータ
を登録音声パラメータ辞書部6の認識辞書に再登
録する。又、辞書追加要求が出ている場合には、
バツフア14に格納された入力音声パラメータを
登録音声パラメータ辞書部6の空辞書に登録し且
つその語の識別情報を上記空辞書に対応する辞書
デイレクトリ部9に登録する。
このようにして、照合距離の近いものについて
のみマルチテンプレート化が行なわれる。
なお、照合距離間の接近度はそれぞれの語乃至
語群に最適乃至これに準じて設定されるのがよ
い。
(ト) 発明の効果 以上述べたように、本発明によれば、認識結果
に正解が出るまでの認識結果の照合距離相互間に
予め決められた関係が発生するまで従来と同様の
学習処理を行ない、この発生に応答して入力音声
パラメータの辞書への追加登録を行なうので、語
認識しやすい類似語のある語や発声のばらつきに
より他の語と照合距離が近くなる語だけがマルチ
テンプレート化されるようになる。従つて、辞書
容量の大幅な削減が可能になり、これにより照合
時間の短縮、ひいては認識時間を短くすることが
出来る等の効果が得られる。
【図面の簡単な説明】
添付図面は本発明の一実施例を示す。 図中、1はマイクロホン、2は音声特徴抽出
部、3は入力音声パラメータバツフア、4は登録
学習制御部、5はパラメータ照合部、6は登録音
声パラメータ辞書部、7は認識制御部、9は辞書
デイレクトリ部、12は辞書追加制御部、14は
学習音声パラメータバツフア、15は操作パネル
である。

Claims (1)

  1. 【特許請求の範囲】 1 マルチテンプレート方式の辞書を有し、その
    辞書内容を学習処理により更新する音声認識装置
    において、 前記辞書の辞書内容の各々と入力音声パラメー
    タとの照合からその最短照合距離を出力する最短
    照合距離出力手段と、 次候補対応の語に対応する辞書内容と入力音声
    パラメータとの照合を行なつてその認識結果、及
    び当該辞書内容との間の照合距離情報を出力する
    出力手段と、 次候補要求入力を入力する入力手段と、 該入力手段に応答して前記最短照合距離の辞書
    内容に照合距離が近い照合距離の語であつて異な
    る語についての処理を前記出力手段に生ぜしめる
    制御手段と、 前記出力手段による異なる語についての処理に
    おいて前記出力手段から出力される照合距離と、
    前記最短照合距離との差が予め決められた基定値
    より小さいとき、信号を出力する検出手段と、 前記信号の発生まで前記各手段の動作を継続さ
    せ、その発生で前記入力音声パラメータを前記辞
    書に追加登録させる登録手段とを設けることを特
    徴とする音声認識装置。
JP58119044A 1983-06-30 1983-06-30 音声認識装置 Granted JPS6011897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58119044A JPS6011897A (ja) 1983-06-30 1983-06-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58119044A JPS6011897A (ja) 1983-06-30 1983-06-30 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6011897A JPS6011897A (ja) 1985-01-22
JPH0362279B2 true JPH0362279B2 (ja) 1991-09-25

Family

ID=14751536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58119044A Granted JPS6011897A (ja) 1983-06-30 1983-06-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6011897A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4941495B2 (ja) * 2009-03-31 2012-05-30 日本電気株式会社 ユーザ辞書作成システム、方法、及び、プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS608898A (ja) * 1983-06-29 1985-01-17 富士通株式会社 音声認識装置

Also Published As

Publication number Publication date
JPS6011897A (ja) 1985-01-22

Similar Documents

Publication Publication Date Title
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US7529678B2 (en) Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system
US20020152068A1 (en) New language context dependent data labeling
JPH10504404A (ja) 音声認識のための方法および装置
JP2010197644A (ja) 音声認識システム
JP6397641B2 (ja) 自動通訳装置及び方法
JP2002215184A (ja) 音声認識装置、及びプログラム
KR102253015B1 (ko) 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치 및 그 방법
JPH0362279B2 (ja)
CN119864019A (zh) 一种数据的生成方法及装置
JP3378547B2 (ja) 音声認識方法及び装置
JP2813209B2 (ja) 大語彙音声認識装置
JPH0736481A (ja) 補完音声認識装置
JP2006184371A (ja) 音声認識装置および音声認識方法
JP6991409B2 (ja) 情報処理装置、プログラム及び情報処理方法
JPH03217900A (ja) テキスト音声合成装置
JPS608898A (ja) 音声認識装置
KR100212448B1 (ko) 무제한 음성 명령어 인식기의 인식 성능 및 처리 속도 개선 방법
JP2603920B2 (ja) 音声認識装置
JP2001067096A (ja) 音声認識結果評価装置および記録媒体
JP2004309654A (ja) 音声認識装置
KR930000809B1 (ko) 언어번역 시스템