JPH0331274B2 - - Google Patents
Info
- Publication number
- JPH0331274B2 JPH0331274B2 JP58168795A JP16879583A JPH0331274B2 JP H0331274 B2 JPH0331274 B2 JP H0331274B2 JP 58168795 A JP58168795 A JP 58168795A JP 16879583 A JP16879583 A JP 16879583A JP H0331274 B2 JPH0331274 B2 JP H0331274B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- input
- standard feature
- feature pattern
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】
(A) 発明の技術分野
本発明は音声認識装置、特に、標準特徴パター
ンの修正または追加に際し、他の辞書項目の標準
特徴パターンとの類似性にもとづいて、既登録標
準特徴パターンまたは新たに登録する標準特徴パ
ターンの妥当性を判断し、辞書の品質を向上させ
ることができるようにした音声認識装置に関する
ものである。
ンの修正または追加に際し、他の辞書項目の標準
特徴パターンとの類似性にもとづいて、既登録標
準特徴パターンまたは新たに登録する標準特徴パ
ターンの妥当性を判断し、辞書の品質を向上させ
ることができるようにした音声認識装置に関する
ものである。
(B) 従来技術と問題点
一般に音声認識において、認識率を向上させる
ためには、音声情報からどのような特徴パラメー
タを抽出し照合に用いるかが重要であるが、その
システムで定められた特徴抽出により、各項目を
代表する標準特徴パラメータとして、いかに最適
なものを辞書に用意するかについても重要であ
る。特徴の抽出のし方や照合のし方が、いかに優
れていても、辞書中に登録される標準特徴パター
ンに、雑音付加パターン、不明瞭発声パターン等
の不良標準特徴パターンた、例えば「a」を登録
すべきときに「i」と発声してしまう等の発声誤
りによる誤り標準特徴パターンが多ければ、認識
率は向上しない。
ためには、音声情報からどのような特徴パラメー
タを抽出し照合に用いるかが重要であるが、その
システムで定められた特徴抽出により、各項目を
代表する標準特徴パラメータとして、いかに最適
なものを辞書に用意するかについても重要であ
る。特徴の抽出のし方や照合のし方が、いかに優
れていても、辞書中に登録される標準特徴パター
ンに、雑音付加パターン、不明瞭発声パターン等
の不良標準特徴パターンた、例えば「a」を登録
すべきときに「i」と発声してしまう等の発声誤
りによる誤り標準特徴パターンが多ければ、認識
率は向上しない。
標準特徴パターンは、辞書中にデイジタル情報
で記憶され、その数が多く、機械部品のように目
にみえるわけではなく、またすべての標準特徴パ
ターンが一律に使用されるわけではないので、一
旦登録されてしまうと、上記不良標準特徴パター
ン、誤り標準特徴パターン等の検出は容易ではな
い。
で記憶され、その数が多く、機械部品のように目
にみえるわけではなく、またすべての標準特徴パ
ターンが一律に使用されるわけではないので、一
旦登録されてしまうと、上記不良標準特徴パター
ン、誤り標準特徴パターン等の検出は容易ではな
い。
従来、一旦登録した標準特徴パターンはすべて
正しいものとして扱い、認識誤りが生じた場合、
認識させようとする入力音声が悪いか、または認
識の限界であつて、止む得ないものとされるのが
一般的であつた。また、誤認識を生じさせた入力
音声から抽出された入力特徴パターンと、既に登
録されている標準特徴パターンとのいわゆる平均
化により、辞書の品質を改良していく学習方式等
も提案されているが、このとき学習のための入力
音声が悪いと、かえつて辞書の品質を劣化させる
ことになるという問題があつた。
正しいものとして扱い、認識誤りが生じた場合、
認識させようとする入力音声が悪いか、または認
識の限界であつて、止む得ないものとされるのが
一般的であつた。また、誤認識を生じさせた入力
音声から抽出された入力特徴パターンと、既に登
録されている標準特徴パターンとのいわゆる平均
化により、辞書の品質を改良していく学習方式等
も提案されているが、このとき学習のための入力
音声が悪いと、かえつて辞書の品質を劣化させる
ことになるという問題があつた。
(C) 発明の目的と構成
本発明は上記問題点の解決を図り、登録モード
ないし練習モード等において、発声誤りや雑音等
による不良特徴パターンの登録を防止し、辞書の
品質を向上させて、音声認識率を向上させること
ができるようにすることを目的としている。その
ため、本発明の音声認識装置は、未知入力音声を
音響分析して得られる入力特徴パターンと、予め
辞書中の各項目に対応して格納された標準特徴パ
ターンとの照合によつて音声認識を行う音声認識
装置において、標準特徴パターンの追加/修正に
際して入力した音声から抽出した入力特徴パター
ンと、該入力特徴パターンと異なる辞書項目中の
最も類似する標準特徴パターンとの類似度が、当
該入力特徴パターンと同じ辞書項目に属する標準
特徴パターンと、上記最も類似する標準特徴パタ
ーンとの類似度よりも、所定の値以上大きいか否
かを判定するパターン追加判定部と、上記類似度
の差が所定の値よりも小さい場合に当該入力特徴
パターンを標準特徴パターンの追加/修正に用い
るパターン修正追加部と、上記類似度の差が所定
の値よりも大きい場合に上記2種の辞書項目の標
準特徴パターンを再登録する再登録部とをそなえ
たことを特徴としている。
ないし練習モード等において、発声誤りや雑音等
による不良特徴パターンの登録を防止し、辞書の
品質を向上させて、音声認識率を向上させること
ができるようにすることを目的としている。その
ため、本発明の音声認識装置は、未知入力音声を
音響分析して得られる入力特徴パターンと、予め
辞書中の各項目に対応して格納された標準特徴パ
ターンとの照合によつて音声認識を行う音声認識
装置において、標準特徴パターンの追加/修正に
際して入力した音声から抽出した入力特徴パター
ンと、該入力特徴パターンと異なる辞書項目中の
最も類似する標準特徴パターンとの類似度が、当
該入力特徴パターンと同じ辞書項目に属する標準
特徴パターンと、上記最も類似する標準特徴パタ
ーンとの類似度よりも、所定の値以上大きいか否
かを判定するパターン追加判定部と、上記類似度
の差が所定の値よりも小さい場合に当該入力特徴
パターンを標準特徴パターンの追加/修正に用い
るパターン修正追加部と、上記類似度の差が所定
の値よりも大きい場合に上記2種の辞書項目の標
準特徴パターンを再登録する再登録部とをそなえ
たことを特徴としている。
もう1つの本発明である音声認識装置は、未知
入力音声を音響分析して得られる入力特徴パター
ンと、予め辞書中の各項目に対応して格納された
標準特徴パターンとの照合によつて音声認識を行
う音声認識装置において、標準特徴パターンの追
加/修正に際して入力した音声について仮の認識
を行い認識誤りを検出する誤り検出部と、認識誤
りを生じさせた入力特徴パターンと誤認識結果と
なつた辞書項目との類似度が所定の値より大きい
か否かを判定するパターン追加判定部と、該パタ
ーン追加判定部により上記類似度が所定の値より
も小さいと判定された場合に当該入力特徴パター
ンに関連する標準特徴パターンの修正または追加
を行うパターン修正追加部とをそなえたことを特
徴としている。以下図面を参照しつつ説明する。
入力音声を音響分析して得られる入力特徴パター
ンと、予め辞書中の各項目に対応して格納された
標準特徴パターンとの照合によつて音声認識を行
う音声認識装置において、標準特徴パターンの追
加/修正に際して入力した音声について仮の認識
を行い認識誤りを検出する誤り検出部と、認識誤
りを生じさせた入力特徴パターンと誤認識結果と
なつた辞書項目との類似度が所定の値より大きい
か否かを判定するパターン追加判定部と、該パタ
ーン追加判定部により上記類似度が所定の値より
も小さいと判定された場合に当該入力特徴パター
ンに関連する標準特徴パターンの修正または追加
を行うパターン修正追加部とをそなえたことを特
徴としている。以下図面を参照しつつ説明する。
(D) 発明の実施例
第1図は音声パターンの分布と標準特徴パター
ンとの関係を説明するための図を示す。
ンとの関係を説明するための図を示す。
第1図において、A,B,Cの実線で囲まれた
部分は、パターン空間における実際の音声パター
ンの分布を示し、A1およびA2は単語A(単音節を
含む。以下同様。)に対する登録された標準特徴
パターン、B1ないしB2は単語Bに対する標準特
徴パターン、C1は単語Cに対する標準特徴パタ
ーンを表わしている。図示Cのように、1つの単
語項目について、1つの標準特徴パターンでカバ
ーする場合もあるが、通常、図示A,Bのよう
に、1つの項目について複数の標準特徴パターン
を用意し、認識すべき音声パターンの分布範囲を
カバーするのが普通である。例えば、未知入力音
声の入力特徴パターンXが抽出されると、その入
力特徴パターンXと各標準特徴パターンA1,A2,
B1……とのマツチング距離の演算を行い、距離
の小さい標準特徴パターンの属する項目を認識結
果とする。
部分は、パターン空間における実際の音声パター
ンの分布を示し、A1およびA2は単語A(単音節を
含む。以下同様。)に対する登録された標準特徴
パターン、B1ないしB2は単語Bに対する標準特
徴パターン、C1は単語Cに対する標準特徴パタ
ーンを表わしている。図示Cのように、1つの単
語項目について、1つの標準特徴パターンでカバ
ーする場合もあるが、通常、図示A,Bのよう
に、1つの項目について複数の標準特徴パターン
を用意し、認識すべき音声パターンの分布範囲を
カバーするのが普通である。例えば、未知入力音
声の入力特徴パターンXが抽出されると、その入
力特徴パターンXと各標準特徴パターンA1,A2,
B1……とのマツチング距離の演算を行い、距離
の小さい標準特徴パターンの属する項目を認識結
果とする。
第2図および第3図は本発明による処理概要を
説明するための図、第4図は本発明の一実施例構
成を示す。
説明するための図、第4図は本発明の一実施例構
成を示す。
第1図の説明からわかるように、もし、辞書に
登録された標準特徴パターンの中に、音声パター
ンの分布から外れた不良標準特徴パターンや誤り
標準特徴パターンがあれば、認識率は劣化するこ
ととなる。本発明は、このような妥当でない標準
特徴パターンの登録を次のように防止する。
登録された標準特徴パターンの中に、音声パター
ンの分布から外れた不良標準特徴パターンや誤り
標準特徴パターンがあれば、認識率は劣化するこ
ととなる。本発明は、このような妥当でない標準
特徴パターンの登録を次のように防止する。
例えば、第2図図示の如く、辞書項目各「渋
谷」について、標準特徴パターンA1が登録され、
辞書項目名「日比谷」について、標準特徴パター
ンB1が既に登録されていたとする。この状態で、
さらに「渋谷」の標準特徴パターンの修正または
追加のため、項目名「渋谷」についての発声が入
力され、その入力特徴パターンがA2であつたと
する。まず、項目名「渋谷」以外の辞書項目の中
で、入力特徴パターンA2に最も類似する標準特
徴パターンが捜し出される。これが例えば項目名
「日比谷」の標準特徴パターンB1であつたとする
と、次に各特徴パターンA1,A2,B1の妥当性を
チエツクするために、標準特徴パターンA1およ
びB1の類似度と、標準特徴パターンB1および入
力特徴パターンA2の類似度との差が演算される。
もし、パターンB1およびA2の類似度が、パター
ンA1およびB1の類似度よりも、所定の閾値以上
大きい場合には、パターンA1,B1およびA2のう
ち、少なくともそれかが、正常な音声パターン分
布から外れている可能性が大きい。従つて、この
ような場合には、項目名「渋谷」および「日比比
谷」について、再発声を依頼し、標準特徴パター
ンA1およびB1の登録をやり直す。この再登録に
よつて、発声誤り等の最初の登録時における登録
ミスがあれば、訂正されることとなる。なお、上
記類似度の比較にあたつて用いられる閾値は、シ
ステムで予め一律に定めてもよいが、対比される
各2種の辞書項目に対して、予め音韻の共通性等
を考慮し、適当に定めておくことが望ましい。
谷」について、標準特徴パターンA1が登録され、
辞書項目名「日比谷」について、標準特徴パター
ンB1が既に登録されていたとする。この状態で、
さらに「渋谷」の標準特徴パターンの修正または
追加のため、項目名「渋谷」についての発声が入
力され、その入力特徴パターンがA2であつたと
する。まず、項目名「渋谷」以外の辞書項目の中
で、入力特徴パターンA2に最も類似する標準特
徴パターンが捜し出される。これが例えば項目名
「日比谷」の標準特徴パターンB1であつたとする
と、次に各特徴パターンA1,A2,B1の妥当性を
チエツクするために、標準特徴パターンA1およ
びB1の類似度と、標準特徴パターンB1および入
力特徴パターンA2の類似度との差が演算される。
もし、パターンB1およびA2の類似度が、パター
ンA1およびB1の類似度よりも、所定の閾値以上
大きい場合には、パターンA1,B1およびA2のう
ち、少なくともそれかが、正常な音声パターン分
布から外れている可能性が大きい。従つて、この
ような場合には、項目名「渋谷」および「日比比
谷」について、再発声を依頼し、標準特徴パター
ンA1およびB1の登録をやり直す。この再登録に
よつて、発声誤り等の最初の登録時における登録
ミスがあれば、訂正されることとなる。なお、上
記類似度の比較にあたつて用いられる閾値は、シ
ステムで予め一律に定めてもよいが、対比される
各2種の辞書項目に対して、予め音韻の共通性等
を考慮し、適当に定めておくことが望ましい。
特に再登録の場合、また不良標準特徴パターン
等が登録されないようにするために、例えば次の
ように再登録する標準特徴パターンを決定すれば
よい。1つの辞書項目の1標準特徴パターンの登
録に対して、複数回の発声を入力する。そして、
例えば第3図イないしハで説明するように、平均
的パターンの選別などを行う。
等が登録されないようにするために、例えば次の
ように再登録する標準特徴パターンを決定すれば
よい。1つの辞書項目の1標準特徴パターンの登
録に対して、複数回の発声を入力する。そして、
例えば第3図イないしハで説明するように、平均
的パターンの選別などを行う。
例えば、4回の発声からそれぞれ抽出した入力
特徴パターンが、P1,P2,P3,P4であつたとす
る。第3図イ図示の場合、パターン空間におい
て、パターンP1,P2,P3,P4の重心を概略演算
し、その重心に最も近いパターンP3を登録すべ
き標準特徴パターンとして選出している。第3図
ロ図示の場合、4つの特徴パターンP1,P2,P3,
P4の平均値を求め、その平均的パターンPnを標
準特徴パターンとして登録する。また、第3図ハ
図示の場合、他のパターンから大きく離れたパタ
ーンP2を除去し、残りのパターンP1,P3,P4の
平均的パターンP′nを求めて登録している。この
ように複数回の発声から1つの標準特徴パターン
を選出または作成することによつて、再登録され
る標準特徴パターンは、良好なものとなる。
特徴パターンが、P1,P2,P3,P4であつたとす
る。第3図イ図示の場合、パターン空間におい
て、パターンP1,P2,P3,P4の重心を概略演算
し、その重心に最も近いパターンP3を登録すべ
き標準特徴パターンとして選出している。第3図
ロ図示の場合、4つの特徴パターンP1,P2,P3,
P4の平均値を求め、その平均的パターンPnを標
準特徴パターンとして登録する。また、第3図ハ
図示の場合、他のパターンから大きく離れたパタ
ーンP2を除去し、残りのパターンP1,P3,P4の
平均的パターンP′nを求めて登録している。この
ように複数回の発声から1つの標準特徴パターン
を選出または作成することによつて、再登録され
る標準特徴パターンは、良好なものとなる。
第4図は本発明の一実施例構成を示すブロツク
図であつて、図中、符号1はマイクロホン、2は
音響分析部、3はパターン抽出部、4は切替部、
5はパターン追加判定部、6はパターン修正追加
部、7は辞書部、8は再登録部、9は表示部、1
0は照合判定部を表わす。
図であつて、図中、符号1はマイクロホン、2は
音響分析部、3はパターン抽出部、4は切替部、
5はパターン追加判定部、6はパターン修正追加
部、7は辞書部、8は再登録部、9は表示部、1
0は照合判定部を表わす。
マイクロホン1から入力された音声信号は、音
響分析部2において周波数分析される。音響分析
部2は、例えば帯域フイルタ群、パラメータ抽出
回路等を有しており、入力音声の特徴量(パラメ
ータ)、例えば第1ホルマント周波数に相当する
モーメントM1や、第2ホルマント周波数に相当
するモーメントM2や、さらには、低域電力や高
域電力などを抽出し、これらの特徴量に関するサ
ンプル点を決定して、特徴量の時系列情報を得
る。
響分析部2において周波数分析される。音響分析
部2は、例えば帯域フイルタ群、パラメータ抽出
回路等を有しており、入力音声の特徴量(パラメ
ータ)、例えば第1ホルマント周波数に相当する
モーメントM1や、第2ホルマント周波数に相当
するモーメントM2や、さらには、低域電力や高
域電力などを抽出し、これらの特徴量に関するサ
ンプル点を決定して、特徴量の時系列情報を得
る。
音響分析部2において得られたパラメータ時系
列情報は、パターン抽出部3に入力される。パタ
ーン抽出部3は、このパラメータ時系列情報か
ら、入力音声の特徴を表わす入力特徴パターンを
抽出する。切替部4は、パターン情報の登録また
は照合を、例えばキーボードからの切替指示によ
り、切替えるものである。
列情報は、パターン抽出部3に入力される。パタ
ーン抽出部3は、このパラメータ時系列情報か
ら、入力音声の特徴を表わす入力特徴パターンを
抽出する。切替部4は、パターン情報の登録また
は照合を、例えばキーボードからの切替指示によ
り、切替えるものである。
パターン追加判定部5は、例えば各辞書項目に
対して、少なくとも1パターン宛の登録が終了し
た後、さらに標準特徴パターンの修正または追加
をする際に起動されるものである。パターン追加
判定部5は、パターン抽出部3が抽出した追加な
いし修正用の入力特徴パターンに関して、第2図
を参照して説明したような、妥当性のチエツクを
行う。当該入力特徴パターンとの類似度との関連
において、既登録標準特徴パターンが妥当なもの
であると判断されると、当該入力特徴パターン
が、パターン修正追加部6へ引き渡される。パタ
ーン修正追加部6は、引き渡された入力特徴パタ
ーンと既登録の同種項目の標準特徴パターンとの
いわゆる平均化操作により、標準特徴パターンの
修正を行つたり、新規標準特徴パターンとして追
加登録する処理を実行する。
対して、少なくとも1パターン宛の登録が終了し
た後、さらに標準特徴パターンの修正または追加
をする際に起動されるものである。パターン追加
判定部5は、パターン抽出部3が抽出した追加な
いし修正用の入力特徴パターンに関して、第2図
を参照して説明したような、妥当性のチエツクを
行う。当該入力特徴パターンとの類似度との関連
において、既登録標準特徴パターンが妥当なもの
であると判断されると、当該入力特徴パターン
が、パターン修正追加部6へ引き渡される。パタ
ーン修正追加部6は、引き渡された入力特徴パタ
ーンと既登録の同種項目の標準特徴パターンとの
いわゆる平均化操作により、標準特徴パターンの
修正を行つたり、新規標準特徴パターンとして追
加登録する処理を実行する。
パターン追加判定部5における判定で、既登録
標準特徴パターンが正しくない可能性があると判
断された場合、再登録部8が呼び出される。再登
録部8は、例えばCRTデイスプレイ等の表示部
9へ、疑いのある辞書項目名を表示し、登録音声
の再入力を指示する。例えば複数回の発声から、
それぞれ再登録のための入力特徴パターンが、パ
ターン抽出部3によつて抽出されると、再登録部
8は、例えば第3図で説明したような処理を実行
して、再登録すべき標準特徴パターンを決定し、
パターン修正追加部6を経由して、辞書部7へ再
登録する。辞書部7は、例えば磁気デイスク装置
等の外部記憶装置であつて、認識対象の項目名と
標準特徴パターンとを対応させて記憶し、保持す
る。
標準特徴パターンが正しくない可能性があると判
断された場合、再登録部8が呼び出される。再登
録部8は、例えばCRTデイスプレイ等の表示部
9へ、疑いのある辞書項目名を表示し、登録音声
の再入力を指示する。例えば複数回の発声から、
それぞれ再登録のための入力特徴パターンが、パ
ターン抽出部3によつて抽出されると、再登録部
8は、例えば第3図で説明したような処理を実行
して、再登録すべき標準特徴パターンを決定し、
パターン修正追加部6を経由して、辞書部7へ再
登録する。辞書部7は、例えば磁気デイスク装置
等の外部記憶装置であつて、認識対象の項目名と
標準特徴パターンとを対応させて記憶し、保持す
る。
未知入力音声について認識を行う場合、パター
ン抽出部3の出力は、照合判定部10に供給され
る。照合判定部10は、辞書部7の内容を順次読
み出し、入力特徴パターンと標準特徴パターンと
を、例えば周知のダイナミツク・プログラミング
(DP)、マツチング等により照合し、認識結果を
出力する。
ン抽出部3の出力は、照合判定部10に供給され
る。照合判定部10は、辞書部7の内容を順次読
み出し、入力特徴パターンと標準特徴パターンと
を、例えば周知のダイナミツク・プログラミング
(DP)、マツチング等により照合し、認識結果を
出力する。
第5図は第2の本発明の処理概要を説明するた
めの図、第6図は第2の本発明の一実施例構成を
示す。
めの図、第6図は第2の本発明の一実施例構成を
示す。
例えば、第5図図示の如く、辞書項目「渋谷」
について標準特徴パターンA1が登録されており、
辞書項目「日比谷」について標準特徴パターン
B1,B2が登録されていたとする。登録モードま
たは練習モード等において、例えばパターンA2
に対応する音声「シブヤ」が入力されると、項目
「日比谷」と誤認識されることとなる。このとき
従来、パターンA2を項目「渋谷」に追加登録し
たり、既登録の標準特徴パターンA1とのいわゆ
る平均化操作をしたりすることが、一般に行われ
ている。しかし、必ずしもパターンA2の基礎と
なつた音声「シブヤ」が正しく発声されたもので
あるとは、断言できない。もし、発声誤り等があ
つた場合、パターンA2を標準特徴パターンに反
映させると、かえつて辞書の品質は劣化する。本
発明の場合、パターンA2と既登録の標準特徴パ
ターンとの類似性を考慮することにより、次のよ
うにパターンA2の妥当性をチエツクする。
について標準特徴パターンA1が登録されており、
辞書項目「日比谷」について標準特徴パターン
B1,B2が登録されていたとする。登録モードま
たは練習モード等において、例えばパターンA2
に対応する音声「シブヤ」が入力されると、項目
「日比谷」と誤認識されることとなる。このとき
従来、パターンA2を項目「渋谷」に追加登録し
たり、既登録の標準特徴パターンA1とのいわゆ
る平均化操作をしたりすることが、一般に行われ
ている。しかし、必ずしもパターンA2の基礎と
なつた音声「シブヤ」が正しく発声されたもので
あるとは、断言できない。もし、発声誤り等があ
つた場合、パターンA2を標準特徴パターンに反
映させると、かえつて辞書の品質は劣化する。本
発明の場合、パターンA2と既登録の標準特徴パ
ターンとの類似性を考慮することにより、次のよ
うにパターンA2の妥当性をチエツクする。
まず、入力特徴パターンA2にいつて、仮の認
識を行う。認識誤りが生じた場合、入力特徴パタ
ーンA2と、誤認識の結果となつた辞書項目、例
えば「日比谷」との類似度を計算する。類似度と
しては、例えば辞書項目「日比谷」に含まれる標
準特徴パターンB1,B2との平均距離または最小
距離などを用いる。この類似度が、各辞書項目に
対して予め定められた閾値よりも大きい場合、す
なわち上記平均距離または最小距離が、所定の値
よりも小さい場合には、パターンA2が誤りであ
る可能性が大きいと判断できるので、パターン
A2を標準特徴パターンの追加または修正に利用
することなく、棄却する。このようにして、発声
誤り等による音声の特徴パターンが辞書に反映さ
れるのを防止する。
識を行う。認識誤りが生じた場合、入力特徴パタ
ーンA2と、誤認識の結果となつた辞書項目、例
えば「日比谷」との類似度を計算する。類似度と
しては、例えば辞書項目「日比谷」に含まれる標
準特徴パターンB1,B2との平均距離または最小
距離などを用いる。この類似度が、各辞書項目に
対して予め定められた閾値よりも大きい場合、す
なわち上記平均距離または最小距離が、所定の値
よりも小さい場合には、パターンA2が誤りであ
る可能性が大きいと判断できるので、パターン
A2を標準特徴パターンの追加または修正に利用
することなく、棄却する。このようにして、発声
誤り等による音声の特徴パターンが辞書に反映さ
れるのを防止する。
第6図は第2の本発明の一実施構成を示すブロ
ツク図であつて、図中、符号1ないし7,10は
第4図に対応し、11は誤り検出部、12はキー
ボードを表わす。
ツク図であつて、図中、符号1ないし7,10は
第4図に対応し、11は誤り検出部、12はキー
ボードを表わす。
登録モードまたは練習モード等において、マイ
クロホン1から音声が入力されると、音響分析さ
れ、パターン抽出部3によつて特徴パターンが抽
出される。この入力特徴パターンは、切替部4を
経由して、誤り検出部11に通知されるととも
に、照合判定部10にも供給される。照合判定部
10は、通常の認識と同様に辞書部7から標準特
徴パターンを順次読み出し、仮の認識を行う。こ
の認識結果は、図示省略したデイスプレイ等に表
示される。誤り検出部11は、この表示に対し、
例えばキーボード12から入力される誤り指示を
検出する。誤り指示がなく、認識結果が正しい場
合には、従来と同様な処理が続行される。
クロホン1から音声が入力されると、音響分析さ
れ、パターン抽出部3によつて特徴パターンが抽
出される。この入力特徴パターンは、切替部4を
経由して、誤り検出部11に通知されるととも
に、照合判定部10にも供給される。照合判定部
10は、通常の認識と同様に辞書部7から標準特
徴パターンを順次読み出し、仮の認識を行う。こ
の認識結果は、図示省略したデイスプレイ等に表
示される。誤り検出部11は、この表示に対し、
例えばキーボード12から入力される誤り指示を
検出する。誤り指示がなく、認識結果が正しい場
合には、従来と同様な処理が続行される。
誤り指示が検出された場合、パターン追加判定
部5へ、誤つて認識された項目名と、入力特徴パ
ターンが通知される。パターン追加判定部5は、
第5図を参照して説明したように、入力特徴パタ
ーンと、誤つて認識結果とされた辞書項目との類
似度を演算し、所定の閾値と比較して、当該入力
特徴パターンについての妥当性をチエツクする。
上記類似度が所定の閾値よりも大きいと判定され
た場合には、当該入力特徴パターンは、不良であ
る可能性が大きいので、辞書部7に追加したり、
既存の標準特徴パターンと平均化操作して修正し
たりすることを中止する。上記類似度が所定の閾
値よりも小さい場合にのみ、パターン修正追加部
6は、辞書部7への当該入力特徴パターンの追加
登録みたは既存の標準特徴パターンとの平均化操
作等による修正を行う。
部5へ、誤つて認識された項目名と、入力特徴パ
ターンが通知される。パターン追加判定部5は、
第5図を参照して説明したように、入力特徴パタ
ーンと、誤つて認識結果とされた辞書項目との類
似度を演算し、所定の閾値と比較して、当該入力
特徴パターンについての妥当性をチエツクする。
上記類似度が所定の閾値よりも大きいと判定され
た場合には、当該入力特徴パターンは、不良であ
る可能性が大きいので、辞書部7に追加したり、
既存の標準特徴パターンと平均化操作して修正し
たりすることを中止する。上記類似度が所定の閾
値よりも小さい場合にのみ、パターン修正追加部
6は、辞書部7への当該入力特徴パターンの追加
登録みたは既存の標準特徴パターンとの平均化操
作等による修正を行う。
(E) 発明の効果
以上説明した如く、本発明によれば、例えば発
声誤り等による妥当でない音声のパターンが、辞
書中に入り込むことが防止され、辞書の品質が向
上するので、認識率が向上する。
声誤り等による妥当でない音声のパターンが、辞
書中に入り込むことが防止され、辞書の品質が向
上するので、認識率が向上する。
第1図は音声パターンの分布と標準特徴パター
ンとの関係を説明するための図、第2図および第
3図は本発明による処理概要を説明するための
図、第4図は本発明の一実施例構成、第5図は第
2の本発明の処理概要を説明するための図、第6
図は第2の本発明の一実施例構成を示す。 図中、1はマイクロンホン、2は音響分析部、
3はパターン抽出部、4は切替部、5はパターン
追加判定部、6はパターン修正追加部、7は辞書
部、8は再登録部、10は照合判定部、11は誤
り検出部を表わす。
ンとの関係を説明するための図、第2図および第
3図は本発明による処理概要を説明するための
図、第4図は本発明の一実施例構成、第5図は第
2の本発明の処理概要を説明するための図、第6
図は第2の本発明の一実施例構成を示す。 図中、1はマイクロンホン、2は音響分析部、
3はパターン抽出部、4は切替部、5はパターン
追加判定部、6はパターン修正追加部、7は辞書
部、8は再登録部、10は照合判定部、11は誤
り検出部を表わす。
Claims (1)
- 【特許請求の範囲】 1 未知入力音声を音響分析して得られる入力特
徴パターンと、予め辞書中の各項目に対応して格
納された標準特徴パターンとの照合によつて音声
認識を行う音声認識装置において、 標準特徴パターンの追加/修正に際して入力し
た音声から抽出した入力特徴パターンと、該入力
特徴パターンと異なる辞書項目中の最も類似する
標準特徴パターンとの類似度が、当該入力特徴パ
ターンと同じ辞書項目に属する標準特徴パターン
と、上記最も類似する標準特徴パターンとの類似
度よりも、所定の値以上大きいか否かを判定する
パターン追加判定部と、 上記類似度の差が所定の値よりも小さい場合に
当該入力特徴パターンを標準特徴パターンの追
加/修正に用いるパターン修正追加部と、 上記類似度の差が所定の値よりも大きい場合に
上記2種の辞書項目の標準特徴パターンを再登録
する再登録部と をそなえたことを特徴とする音声認識装置。 2 上記再登録部は、各辞書項目に対して複数回
の発声を入力し、それらの入力特徴パターンの重
心に最も近いパターンを標準特徴パターンとして
登録することを特徴とする特許請求の範囲第1項
記載の音声認識装置。 3 上記再登録部は、各辞書項目に対して複数回
の発声を入力し、それらの入力特徴パターンの平
均的パターンを標準特徴パターンとして登録する
ことを特徴とする特許請求の範囲第1項記載の音
声認識装置。 4 上記再登録部は、各辞書項目に対して複数回
の発声を入力し、それらの入力特徴パターンの中
で他のパターンから大きく離れたパターンを除い
たものの平均的パターンを標準特徴パターンとし
て登録することを特徴とする特許請求の範囲第1
項記載の音声認識装置。 5 未知入力音声を音響分析して得られる入力特
徴パターンと、予め辞書中の各項目に対応して格
納された標準特徴パターンとの照合によつて音声
認識を行う音声認識装置において、 標準特徴パターンの追加/修正に際して入力し
た音声について仮の認識を行い認識誤りを検出す
る誤り検出部と、 認識誤りを生じさせた入力特徴パターンと誤認
識結果となつた辞書項目との類似度が所定の値よ
り大きいか否かを判定するパターン追加判定部と 該パターン追加判定部により上記類似度が所定
の値よりも小さいと判定された場合に当該入力特
徴パターンに関連する標準特徴パターンの修正ま
たは追加を行うパターン修正追加部と をそなえたことを特徴とする音声認識装置。 6 上記類似度として辞書項目中の標準特徴パタ
ーンとの平均距離または最小距離を用いることを
特徴とする特許請求の範囲第5項記載の音声認識
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16879583A JPS6060696A (ja) | 1983-09-13 | 1983-09-13 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16879583A JPS6060696A (ja) | 1983-09-13 | 1983-09-13 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6060696A JPS6060696A (ja) | 1985-04-08 |
| JPH0331274B2 true JPH0331274B2 (ja) | 1991-05-02 |
Family
ID=15874612
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP16879583A Granted JPS6060696A (ja) | 1983-09-13 | 1983-09-13 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6060696A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0241170B1 (en) * | 1986-03-28 | 1992-05-27 | AT&T Corp. | Adaptive speech feature signal generation arrangement |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5681899A (en) * | 1979-12-07 | 1981-07-04 | Sanyo Electric Co | Voice indentifier |
| JPS57129497A (en) * | 1981-02-03 | 1982-08-11 | Sanyo Electric Co | Voice register |
| JPS59133599A (ja) * | 1983-01-20 | 1984-07-31 | 三洋電機株式会社 | 音声認識装置 |
-
1983
- 1983-09-13 JP JP16879583A patent/JPS6060696A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6060696A (ja) | 1985-04-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5093963B2 (ja) | 置換コマンドを有する音声認識方法 | |
| US4802231A (en) | Pattern recognition error reduction system | |
| US9792912B2 (en) | Method for verifying the identity of a speaker, system therefore and computer readable medium | |
| US6134527A (en) | Method of testing a vocabulary word being enrolled in a speech recognition system | |
| US4694493A (en) | Speaker verification system | |
| US6496800B1 (en) | Speaker verification system and method using spoken continuous, random length digit string | |
| KR19980086697A (ko) | 음성 인식 시스템에서의 화자 인식 방법 및 장치 | |
| JP2002533789A (ja) | 自動音声認識システムにおけるnベストリストに用いる知識ベース戦略 | |
| CN111091837A (zh) | 一种基于在线学习的时变声纹认证方法及系统 | |
| JPS62232691A (ja) | 音声認識装置 | |
| GB2196460A (en) | Voice recognition | |
| US7490043B2 (en) | System and method for speaker verification using short utterance enrollments | |
| JPH03167600A (ja) | 音声認識装置 | |
| JPH0331274B2 (ja) | ||
| JPS6332394B2 (ja) | ||
| JP2838848B2 (ja) | 標準パターン登録方式 | |
| JP2000214879A (ja) | 音声認識装置の適応化方法 | |
| US4783808A (en) | Connected word recognition enrollment method | |
| JPS6059395A (ja) | 音声標準特徴パタ−ン作成処理方式 | |
| JPH0257320B2 (ja) | ||
| JP2001175276A (ja) | 音声認識装置及び記録媒体 | |
| JPH0331275B2 (ja) | ||
| JPH11249688A (ja) | 音声認識装置およびその方法 | |
| JPH03118600A (ja) | 音声認識装置 | |
| JP2712586B2 (ja) | 単語音声認識装置用パターンマッチング方式 |