JPS602998A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS602998A JPS602998A JP58110683A JP11068383A JPS602998A JP S602998 A JPS602998 A JP S602998A JP 58110683 A JP58110683 A JP 58110683A JP 11068383 A JP11068383 A JP 11068383A JP S602998 A JPS602998 A JP S602998A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- dictionaries
- dictionary
- voice
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分針〕
本発明は、音声認識システムにおける話者適応方式に関
し、特に、複数の音声辞書の中から特定話者ごとに最適
の音声辞書を選択するための音声辞書構成方式に関する
0 〔技術の背景〕 一般に、音声認識システムでは、たとえば数百語以上の
多数の填語の認識を、何らの事前学習もなしで行なうこ
とは、現状ではなお認識率の点で問題がある。他方、多
数の単語を全て事前に発声して登録する方式は、認識精
度の点ですぐれているが、話者の負担が大きくなpすぎ
、実用的ではない。したがって、事前発声データはなる
べく少量にして話者に適した辞書を作成する手法が必要
である。
し、特に、複数の音声辞書の中から特定話者ごとに最適
の音声辞書を選択するための音声辞書構成方式に関する
0 〔技術の背景〕 一般に、音声認識システムでは、たとえば数百語以上の
多数の填語の認識を、何らの事前学習もなしで行なうこ
とは、現状ではなお認識率の点で問題がある。他方、多
数の単語を全て事前に発声して登録する方式は、認識精
度の点ですぐれているが、話者の負担が大きくなpすぎ
、実用的ではない。したがって、事前発声データはなる
べく少量にして話者に適した辞書を作成する手法が必要
である。
その1つの手法として、予めI意した複数の辞書、たと
えば他の複数の話者が発声した音声にもとづいてそれぞ
れ作成した辞書から話者に最適な辞書を1つだけ選択す
る方式が考えられるが、話者に適した辞書の存在を保証
するためには、かなカ多数の辞書を用意しなければなら
ないという問題がある。
えば他の複数の話者が発声した音声にもとづいてそれぞ
れ作成した辞書から話者に最適な辞書を1つだけ選択す
る方式が考えられるが、話者に適した辞書の存在を保証
するためには、かなカ多数の辞書を用意しなければなら
ないという問題がある。
本発明の目的は、音声認識システムを話者ごとに最適化
して認識精度を扁める話者適応方式において、事前学習
に対する話者の負担を少なくしてかつ最適の音声辞書を
容易に構成することができる手段を提供することにある
。
して認識精度を扁める話者適応方式において、事前学習
に対する話者の負担を少なくしてかつ最適の音声辞書を
容易に構成することができる手段を提供することにある
。
一般に、与えられた複数の音声辞書のうち、入力話者に
最適な辞゛1誉を唯1個選択して用いたとしても、もと
の音声辞書の数が少なければ、入力話者によってはあt
b適した辞書が移転せず、したがって高認識率が得られ
ない場合がある。このような場合、複数の辞書の情報を
用いることにより、そのいずれの辞書を単独で使用した
場合よりも認識率を高くすることが可能である0 本発明は、この点に着目してなされたものであシ、少な
い数のサンプル音声データを辞書として用いた認識結果
によシ主の音声辞書の選択を行ない、比較的類似度の高
い音声辞書を複数個に絞って使用し、あるいはさらにそ
れから新たな辞書を作成することにより上記目的を達成
している。
最適な辞゛1誉を唯1個選択して用いたとしても、もと
の音声辞書の数が少なければ、入力話者によってはあt
b適した辞書が移転せず、したがって高認識率が得られ
ない場合がある。このような場合、複数の辞書の情報を
用いることにより、そのいずれの辞書を単独で使用した
場合よりも認識率を高くすることが可能である0 本発明は、この点に着目してなされたものであシ、少な
い数のサンプル音声データを辞書として用いた認識結果
によシ主の音声辞書の選択を行ない、比較的類似度の高
い音声辞書を複数個に絞って使用し、あるいはさらにそ
れから新たな辞書を作成することにより上記目的を達成
している。
本発明の構成は、それによシ
(1) 複数の音声辞書をそなえた音声認識システムに
おいて、該複数の音声辞書のそれぞれごとに作成された
同じカテゴリ群からなるサンダル音声データ群と、該サ
ンプル音声データ群と認識対象の特定話者の音声データ
との間で類似度を計算する手段と、高い類似度を示した
上位複数のす、ングル音声データ群に対応する複数の音
声辞書のみを選嶽する手段とをそなえ、該選択された複
数の音声辞書を上記特定話者に対する音声辞書として使
用することを特徴とする。
おいて、該複数の音声辞書のそれぞれごとに作成された
同じカテゴリ群からなるサンダル音声データ群と、該サ
ンプル音声データ群と認識対象の特定話者の音声データ
との間で類似度を計算する手段と、高い類似度を示した
上位複数のす、ングル音声データ群に対応する複数の音
声辞書のみを選嶽する手段とをそなえ、該選択された複
数の音声辞書を上記特定話者に対する音声辞書として使
用することを特徴とする。
12)複数の音声辞書をそなえた音声認識システムに、
おいて、該複数の音声辞書のそれぞれごとに作成された
同じカテゴリ群からなるサンプル音声データ群と、該サ
ンダル音声データ群と特定話者の音声データとの間で類
似度を計算する手段と、高い類似度を示した上位複数の
サンプル音声データ群に対応す為複数の音声辞書のみを
選択する手段と、該選択された複数の音声辞書を平均化
して新しい音声辞書を作成する手段・とをそなえ、該複
数の選択された音声辞書を平均化して作成された音声辞
書を、上記特定話者に対する音声辞書として使用するこ
とを特徴とするものである。
おいて、該複数の音声辞書のそれぞれごとに作成された
同じカテゴリ群からなるサンプル音声データ群と、該サ
ンダル音声データ群と特定話者の音声データとの間で類
似度を計算する手段と、高い類似度を示した上位複数の
サンプル音声データ群に対応す為複数の音声辞書のみを
選択する手段と、該選択された複数の音声辞書を平均化
して新しい音声辞書を作成する手段・とをそなえ、該複
数の選択された音声辞書を平均化して作成された音声辞
書を、上記特定話者に対する音声辞書として使用するこ
とを特徴とするものである。
以下に、本発明の詳細を実施例にしたがって説−明する
。
。
一般には、他人の辞書を用いた場合は自身の辞書を用い
た場合に比べてIga識率がかなり下がるが、学習によ
シ改善を図ることができる0 他人の辞書の一部を自身の辞書と゛置き換えて新しい辞
書とした場合、使用している特徴量に個人差を表わす情
報が多く含まれていれば、認識率は、その置換量に応じ
て、例えば第1図の実線のグラフlのような変化を示す
。
た場合に比べてIga識率がかなり下がるが、学習によ
シ改善を図ることができる0 他人の辞書の一部を自身の辞書と゛置き換えて新しい辞
書とした場合、使用している特徴量に個人差を表わす情
報が多く含まれていれば、認識率は、その置換量に応じ
て、例えば第1図の実線のグラフlのような変化を示す
。
すなわち、他人の辞書のうち少量を自身の辞書と置き換
えた場合には、認識率がかえって低下する傾向を示す0
この現象は、特徴量に個人情報が多く含まれている場合
には、他人の発声した同一の革語よフ、自身の発声した
別の牟語の方が類似性が高くなることにより起こるもの
である。この場合、 ■ 辞書の中で自身のデータと他人やデータとはあらが
↓め区別できるので、自身のデータに対して非類似性に
関する閾値を設定し、認識時点でこの閾値を超える自身
の辞書データを採用しないことにより、第1図の破線の
グラフ2のように、大体置換量に比例した認識率の増加
をみることができる。
えた場合には、認識率がかえって低下する傾向を示す0
この現象は、特徴量に個人情報が多く含まれている場合
には、他人の発声した同一の革語よフ、自身の発声した
別の牟語の方が類似性が高くなることにより起こるもの
である。この場合、 ■ 辞書の中で自身のデータと他人やデータとはあらが
↓め区別できるので、自身のデータに対して非類似性に
関する閾値を設定し、認識時点でこの閾値を超える自身
の辞書データを採用しないことにより、第1図の破線の
グラフ2のように、大体置換量に比例した認識率の増加
をみることができる。
■ また、予め多数の話者の辞書(多数対象と少数語粂
すなわちサンプル嗟案の2組:少数対案は多数対案の一
部としてもよい)を用意しておき、利用者は、上記サン
プル語案を発声して、その対案の範囲内で認識を行なう
。その結果、認識率が最も高かったサンプル語粂の話者
による多数対案の辞書を使用することにすれば、単に1
人の辞書を用意して全ての利用者がその辞書を使用する
場合にくらべて、平均認識率を高くすることができる0 ■ ■で認識率の最も高い辞書を1つ使用するかわυに
、認識率の高い辞tt−複数個使用する方法がある。
すなわちサンプル嗟案の2組:少数対案は多数対案の一
部としてもよい)を用意しておき、利用者は、上記サン
プル語案を発声して、その対案の範囲内で認識を行なう
。その結果、認識率が最も高かったサンプル語粂の話者
による多数対案の辞書を使用することにすれば、単に1
人の辞書を用意して全ての利用者がその辞書を使用する
場合にくらべて、平均認識率を高くすることができる0 ■ ■で認識率の最も高い辞書を1つ使用するかわυに
、認識率の高い辞tt−複数個使用する方法がある。
複数辞書の使用法としては、従来、マルチテングレート
方式、平均ノJ?タン方式がよく用いられている〇 マルチテンプレート方式は、複数の辞書を単に平面的に
配列し、ひとまとめにして1つの辞書とするものである
。1つのカテゴリに複数(話者の人数)のデータが存在
することになフ、認識時点では、それら全てのデータの
中から最もよく似たデータを探す処理が行なわれる0 次に平均t44タン方は、同一のカテゴリ内の複数のデ
ータにおいて、対応する特徴ごとに特徴値を平均し、新
しい1つのデータとするものでおる0音声の場合にi、
時間長の変動がある為、一般には時間方向での対応付け
を行なった後、平均するO本実施例では、時間方向は単
語長を16等分するという形で時間長の正規化を行なっ
ているので、平均操作は簡単に行なうことができる。
方式、平均ノJ?タン方式がよく用いられている〇 マルチテンプレート方式は、複数の辞書を単に平面的に
配列し、ひとまとめにして1つの辞書とするものである
。1つのカテゴリに複数(話者の人数)のデータが存在
することになフ、認識時点では、それら全てのデータの
中から最もよく似たデータを探す処理が行なわれる0 次に平均t44タン方は、同一のカテゴリ内の複数のデ
ータにおいて、対応する特徴ごとに特徴値を平均し、新
しい1つのデータとするものでおる0音声の場合にi、
時間長の変動がある為、一般には時間方向での対応付け
を行なった後、平均するO本実施例では、時間方向は単
語長を16等分するという形で時間長の正規化を行なっ
ているので、平均操作は簡単に行なうことができる。
第2図は、マルチテングレート方式と平均/9タン方式
の効果を比較したものである。
の効果を比較したものである。
第2図は、40人のテスト対象話者のそれぞれについて
40個の辞書(語数200語)から類似度の高い上位1
、3 、5 、10個の辞書を選択した場合を横軸に
とフ、縦軸には話者40人の平均認識率を示したもので
ある。グラフ3がマルチテングレートの場合、グラフ4
が平均バタン辞書の場合を示す0図から明らかなように
、平均パタン方式が′マルチテンプレート方式よりも優
れていることがわかる0これは、平均/ぐタン方式の場
合、個々の辞書に含まれる各個人情報部分が、平均化に
より希釈され、その反対に有効な特徴情報部分は強調さ
れることによるものである。他方、マルチテンプレート
方式の場合には、このような効果を生じさせることがで
きない。
40個の辞書(語数200語)から類似度の高い上位1
、3 、5 、10個の辞書を選択した場合を横軸に
とフ、縦軸には話者40人の平均認識率を示したもので
ある。グラフ3がマルチテングレートの場合、グラフ4
が平均バタン辞書の場合を示す0図から明らかなように
、平均パタン方式が′マルチテンプレート方式よりも優
れていることがわかる0これは、平均/ぐタン方式の場
合、個々の辞書に含まれる各個人情報部分が、平均化に
より希釈され、その反対に有効な特徴情報部分は強調さ
れることによるものである。他方、マルチテンプレート
方式の場合には、このような効果を生じさせることがで
きない。
第3図は、平均パタン方式の効果をさらに明確にするた
めの典型例のデータを示す。図は、100個の辞書(2
00語)から類似度の上位20個の辞書を選択したもの
を類似度順に横軸に配列し、これに対して5人の入力話
者A、B、C,D、Eの認識率を縦軸にとったものセあ
る′0各大入力者について、下方向に伸びる実線グラフ
が、上位20個の辞書のそれぞれを単一辞書として扱っ
たときの認識率を表わし、また上方向に伸びる点線グラ
フが上位3個、5個、 10個の辞書を平均したときの
認識率を表わす。
めの典型例のデータを示す。図は、100個の辞書(2
00語)から類似度の上位20個の辞書を選択したもの
を類似度順に横軸に配列し、これに対して5人の入力話
者A、B、C,D、Eの認識率を縦軸にとったものセあ
る′0各大入力者について、下方向に伸びる実線グラフ
が、上位20個の辞書のそれぞれを単一辞書として扱っ
たときの認識率を表わし、また上方向に伸びる点線グラ
フが上位3個、5個、 10個の辞書を平均したときの
認識率を表わす。
■ 事前発声なしで認識を行なう為には、不特定話者用
辞書を用意する必要がある。特定の1人の辞書を不特定
話者用辞書として用いることは前述したように高い認識
率を得ることができない0ここでは与えられた複数の辞
書を平均して不特定話者用とする場合を考える0 あらかじめ20人分の辞書(1000語!りが登録され
ているものとする0 また、上記とは別の入力話者加入について、1000語
粂を対象に次の5種類の辞書で認識を行なった場合の認
識率データを第4図に示す0■ 用意されている20個
の辞書を平均した不特定話者用辞書 ■ 50語のサンゾル辞書で認識を行ない、認識率の高
い10個のサンプル辞書に対応する主の辞書(1000
語紮)金子均した平均辞書■ 100語のサンプル辞書
で認識を行ない、認識率の高い10個のサンプル辞書に
対応する主の辞−1:(1000語案)金子均した平均
辞誉@200語のサンゾル辞書で認識を行ない、認識率
の高い10個のサンプル辞書に対応する主の辞書(10
00語索)金子均した平均辞書■ 入力話者自身の発声
で登録された1000語粟の個人辞書 なお第4図のグラフは、入力話者20人分の平均認識率
を表わしている。
辞書を用意する必要がある。特定の1人の辞書を不特定
話者用辞書として用いることは前述したように高い認識
率を得ることができない0ここでは与えられた複数の辞
書を平均して不特定話者用とする場合を考える0 あらかじめ20人分の辞書(1000語!りが登録され
ているものとする0 また、上記とは別の入力話者加入について、1000語
粂を対象に次の5種類の辞書で認識を行なった場合の認
識率データを第4図に示す0■ 用意されている20個
の辞書を平均した不特定話者用辞書 ■ 50語のサンゾル辞書で認識を行ない、認識率の高
い10個のサンプル辞書に対応する主の辞書(1000
語紮)金子均した平均辞書■ 100語のサンプル辞書
で認識を行ない、認識率の高い10個のサンプル辞書に
対応する主の辞−1:(1000語案)金子均した平均
辞誉@200語のサンゾル辞書で認識を行ない、認識率
の高い10個のサンプル辞書に対応する主の辞書(10
00語索)金子均した平均辞書■ 入力話者自身の発声
で登録された1000語粟の個人辞書 なお第4図のグラフは、入力話者20人分の平均認識率
を表わしている。
■、■、■のよう−に少数語案のサンプル辞書で学習し
、複数の主辞書の選択を行なってそれから平均辞書を作
成する方法によシ、■および■を結ぶ破線5が示す事前
発声語数に比例して向上する個人辞書の認識率をさらに
上回るところの、特性6で示す効果を上げることができ
る。
、複数の主辞書の選択を行なってそれから平均辞書を作
成する方法によシ、■および■を結ぶ破線5が示す事前
発声語数に比例して向上する個人辞書の認識率をさらに
上回るところの、特性6で示す効果を上げることができ
る。
第5図は上述した関係を総括したグラフである。
次に、本発明による音声認識システムの1実施例の構成
を、上述した@にもとづく音声辞書構成方式の場合を例
にして説明する。
を、上述した@にもとづく音声辞書構成方式の場合を例
にして説明する。
第6図はその構成図であシ、7は入力部、8は認識部、
9はサンプル辞書群ファイル、10は認識結果保持部、
11は選択部、 12は主辞書群ファイル、13は平均
辞書作成部、 14は平均辞書格納部、15はモード切
替スイッチ、16は出力部を表わす。
9はサンプル辞書群ファイル、10は認識結果保持部、
11は選択部、 12は主辞書群ファイル、13は平均
辞書作成部、 14は平均辞書格納部、15はモード切
替スイッチ、16は出力部を表わす。
本実施例システムは、辞書構成モードと、認識処理モー
ドとの2つのモードで動作する〇まず、モード切替スイ
ッチ15をサンプル辞書群ファイル9側に設定し、辞書
構成モードにする0ここで利用者は、学習用の少数の単
語(100語)を発声する0この学習用発声にもとづく
音声データは、入力部7から人力され、認識部8で認識
される0このとき使用される辞書は、サンダル辞書群フ
ァイル9中のものであるO サンプル辞書群ファイル9には、複数(20人)の話者
によって発声されたサンプル辞−t(20個)があり、
かつ全てのサングル辞書は同一のカテコ゛り群(100
語粱語案らなり、このカテコ″1ノ群には上記学習用の
少数拳語が全て含まれている0このカテゴリ群は、後述
する主辞書群ファイル12と同一あるいはその一部であ
ってもよいし、無関係であっても工い0 認識結果保持部10は、上記サンプル辞書群ファイル9
中の各サンプル辞書ごとに認識結果を保持する。
ドとの2つのモードで動作する〇まず、モード切替スイ
ッチ15をサンプル辞書群ファイル9側に設定し、辞書
構成モードにする0ここで利用者は、学習用の少数の単
語(100語)を発声する0この学習用発声にもとづく
音声データは、入力部7から人力され、認識部8で認識
される0このとき使用される辞書は、サンダル辞書群フ
ァイル9中のものであるO サンプル辞書群ファイル9には、複数(20人)の話者
によって発声されたサンプル辞−t(20個)があり、
かつ全てのサングル辞書は同一のカテコ゛り群(100
語粱語案らなり、このカテコ″1ノ群には上記学習用の
少数拳語が全て含まれている0このカテゴリ群は、後述
する主辞書群ファイル12と同一あるいはその一部であ
ってもよいし、無関係であっても工い0 認識結果保持部10は、上記サンプル辞書群ファイル9
中の各サンプル辞書ごとに認識結果を保持する。
選択部11は、サンプル辞書群ファイル9中のサンプル
辞書のうち、認識率が高かったサンプル辞書を選択する
。
辞書のうち、認識率が高かったサンプル辞書を選択する
。
主辞書群ファイ゛ルnには、サンプル辞書群ファイル9
のサンプル辞書データを発声し7’c複数の話者による
認識対象11.語群(1ooo語粟)を発声登録した辞
書が格納されている。
のサンプル辞書データを発声し7’c複数の話者による
認識対象11.語群(1ooo語粟)を発声登録した辞
書が格納されている。
平均辞書作成部13は、選択部11で選択された複数の
サンプル辞書と同一の発声者による主辞荀・を主辞書群
ファイル12からとり出し、それらの辞書を平均した1
つの辞書を作成するO作成された平均辞書は、平均辞書
格納部14に格納される0ここでモード切替スイッチ1
5を、平均辞書格納部14側に設定変更し、認識処理モ
ードにする。牙U用時点では、人力部7から入力された
音声カニ、認識部8において、平均辞書格納部14に格
納されている辞書を用いて認識され、その結果が出力部
16から出力される0 なお、平均バタン方式の代シにマルチテンプレート方式
をとる場合には、主辞書群から選択した複数の辞書をそ
のまま認識処理用辞書とすればよい0〔発明の効果〕 以上述べたように、本発明によればあら25≧しめ用意
された複数の辞書から、話者に応じてそれらのいづれよ
りも認識率の高い辞書を作成することができるので、対
象語案を全て発声することなく、迅速かつ容易に高精度
の辞書を作成することlxできる0
サンプル辞書と同一の発声者による主辞荀・を主辞書群
ファイル12からとり出し、それらの辞書を平均した1
つの辞書を作成するO作成された平均辞書は、平均辞書
格納部14に格納される0ここでモード切替スイッチ1
5を、平均辞書格納部14側に設定変更し、認識処理モ
ードにする。牙U用時点では、人力部7から入力された
音声カニ、認識部8において、平均辞書格納部14に格
納されている辞書を用いて認識され、その結果が出力部
16から出力される0 なお、平均バタン方式の代シにマルチテンプレート方式
をとる場合には、主辞書群から選択した複数の辞書をそ
のまま認識処理用辞書とすればよい0〔発明の効果〕 以上述べたように、本発明によればあら25≧しめ用意
された複数の辞書から、話者に応じてそれらのいづれよ
りも認識率の高い辞書を作成することができるので、対
象語案を全て発声することなく、迅速かつ容易に高精度
の辞書を作成することlxできる0
第1図は他人の辞書に対する学習効果の説明図、第2図
はマルチテングレート辞書と平均/ぐタン辞書につい′
ての選択辞書数の効果の説明図、第3図は選択対象辞書
の類似度順位の効果の説明図、第4図は不特定話者用辞
書についての学習効果の説明図“、第5図は第1図から
第4図までを総括した説明図、第6図は本発明の1実施
例システムの構成図である0 図中、7は入力部、8は認識部、9はサンダル辞書群フ
ァイル、10は認識結果保持部、11は選択部、νは主
辞書群ファイル、13は平均辞書作成部、14は平均辞
書格納部、15はモード切替スイッチ、16は出力部を
表わす。 特許出願人 富士通株式会社 代理人弁理士 長径用 文 廣 (外1名) 第 i 唱 1%) 認。 ジ 遅F+・トーーーーーーーーータ;船ジく度噛イヱーー
ーーーーーー“−・イ1c←−一瓜班肇
はマルチテングレート辞書と平均/ぐタン辞書につい′
ての選択辞書数の効果の説明図、第3図は選択対象辞書
の類似度順位の効果の説明図、第4図は不特定話者用辞
書についての学習効果の説明図“、第5図は第1図から
第4図までを総括した説明図、第6図は本発明の1実施
例システムの構成図である0 図中、7は入力部、8は認識部、9はサンダル辞書群フ
ァイル、10は認識結果保持部、11は選択部、νは主
辞書群ファイル、13は平均辞書作成部、14は平均辞
書格納部、15はモード切替スイッチ、16は出力部を
表わす。 特許出願人 富士通株式会社 代理人弁理士 長径用 文 廣 (外1名) 第 i 唱 1%) 認。 ジ 遅F+・トーーーーーーーーータ;船ジく度噛イヱーー
ーーーーーー“−・イ1c←−一瓜班肇
Claims (2)
- (1)複数の音声辞書をそなえた音声認識システムにお
いて、該複数の音声辞書のそれぞれごとに作成された同
じ力゛テゴリ群からなるサンプル音声データ群と、該サ
ンプル音声データ群と認識対象の特定話者の音声データ
との間で類似度を計算する手段と、高い類似度を示した
上位複数のサンプル音声データ群に対応する複数の音声
辞書のみを選択する手段とをそなえ、該選択された複数
の音声辞書を上記特定話者に対する音声辞書として使用
することを特徴とする音声辞書構成方式。 - (2)複数の音声辞書をそなえた音声認識システムにお
いて、該複数の音声辞書のそれぞれごとに作成された同
じカディリ群からなるサンダル音声データ群と、該サン
ダル音声データ群と特定話者の音声データとの間で類似
度を計算する手段と、高い類似度を示した上位複数のサ
ンダル音声データ群に対応する複数の音声辞書のみを選
択する手段と、該選択された複数の音声辞書を平均化し
て新しい音声辞書を作成する手段とをそなえ、該複数の
選択された音声辞書を平均化して作成された音声辞書を
、上記特定話者に対する音声辞書として使用することを
特徴とする音声辞書構成方式0
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58110683A JPS602998A (ja) | 1983-06-20 | 1983-06-20 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58110683A JPS602998A (ja) | 1983-06-20 | 1983-06-20 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS602998A true JPS602998A (ja) | 1985-01-09 |
| JPH0430598B2 JPH0430598B2 (ja) | 1992-05-22 |
Family
ID=14541797
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58110683A Granted JPS602998A (ja) | 1983-06-20 | 1983-06-20 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS602998A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023139769A1 (ja) * | 2022-01-21 | 2023-07-27 | ファナック株式会社 | 文法調整装置、及びコンピュータが読み取り可能な記憶媒体 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS56119199A (en) * | 1980-02-26 | 1981-09-18 | Sanyo Electric Co | Voice identifying device |
| JPS57104193A (en) * | 1980-12-19 | 1982-06-29 | Matsushita Electric Industrial Co Ltd | Voice recognizer |
| JPS59192299A (ja) * | 1983-04-15 | 1984-10-31 | 松下電器産業株式会社 | 音声認識方法 |
| JPS59201100A (ja) * | 1983-04-30 | 1984-11-14 | 富士通株式会社 | 音声標準パタン登録方法 |
-
1983
- 1983-06-20 JP JP58110683A patent/JPS602998A/ja active Granted
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS56119199A (en) * | 1980-02-26 | 1981-09-18 | Sanyo Electric Co | Voice identifying device |
| JPS57104193A (en) * | 1980-12-19 | 1982-06-29 | Matsushita Electric Industrial Co Ltd | Voice recognizer |
| JPS59192299A (ja) * | 1983-04-15 | 1984-10-31 | 松下電器産業株式会社 | 音声認識方法 |
| JPS59201100A (ja) * | 1983-04-30 | 1984-11-14 | 富士通株式会社 | 音声標準パタン登録方法 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023139769A1 (ja) * | 2022-01-21 | 2023-07-27 | ファナック株式会社 | 文法調整装置、及びコンピュータが読み取り可能な記憶媒体 |
| JPWO2023139769A1 (ja) * | 2022-01-21 | 2023-07-27 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0430598B2 (ja) | 1992-05-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1395803B1 (en) | Background learning of speaker voices | |
| US20070150279A1 (en) | Word matching with context sensitive character to sound correlating | |
| US20020196911A1 (en) | Methods and apparatus for conversational name dialing systems | |
| DE112021000292B4 (de) | Computerimplementiertes verfahren und rechenvorrichtung | |
| EP2192575A1 (en) | Speech recognition based on a multilingual acoustic model | |
| CA2180392A1 (en) | User Selectable Multiple Threshold Criteria for Voice Recognition | |
| US6868381B1 (en) | Method and apparatus providing hypothesis driven speech modelling for use in speech recognition | |
| Christensen et al. | Automatic selection of speakers for improved acoustic modelling: Recognition of disordered speech with sparse data | |
| Park et al. | Towards understanding speaker discrimination abilities in humans and machines for text-independent short utterances of different speech styles | |
| JP5454469B2 (ja) | 音声認識辞書作成支援装置,処理プログラム,および処理方法 | |
| Bocchieri et al. | Discriminative feature selection for speech recognition | |
| JPH08106296A (ja) | 単語認識システム | |
| JP3525082B2 (ja) | 統計モデル作成方法 | |
| JPH10173644A (ja) | 本人認証方法 | |
| CN114999438B (zh) | 音频播放方法及装置 | |
| JPS602998A (ja) | 音声認識装置 | |
| Imperl et al. | Clustering of triphones using phoneme similarity estimation for the definition of a multilingual set of triphones | |
| JP4163979B2 (ja) | 話者認証装置 | |
| JPH02232696A (ja) | 音声認識装置 | |
| JP3446666B2 (ja) | 音声認識用音響モデルの話者適応装置及び方法 | |
| Kumaran et al. | Attention shift decoding for conversational speech recognition. | |
| JP3100208B2 (ja) | 音声認識装置 | |
| JPH02300800A (ja) | 音声認識装置 | |
| JP2002196789A (ja) | 音声対話装置 | |
| JP3841342B2 (ja) | 音声認識装置および音声認識プログラム |