JPH11143487A - 音声文字変換方法と音声文字変換装置 - Google Patents
音声文字変換方法と音声文字変換装置Info
- Publication number
- JPH11143487A JPH11143487A JP9308252A JP30825297A JPH11143487A JP H11143487 A JPH11143487 A JP H11143487A JP 9308252 A JP9308252 A JP 9308252A JP 30825297 A JP30825297 A JP 30825297A JP H11143487 A JPH11143487 A JP H11143487A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- confirmed
- determined
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 17
- 238000006243 chemical reaction Methods 0.000 claims abstract description 27
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 239000006200 vaporizer Substances 0.000 description 12
- 238000003066 decision tree Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Abstract
字データに変換することが可能な変換する音声文字変換
技術を提供すること。 【解決手段】 入力された音声を複数のセグメントに分
割して各セグメントに対して1以上の音素を割り当てる
音素認識手段(3) と、前記音素に基づいて1以上の単語
を決定する文字列変換手段(4) と、記憶部(51)に格納さ
れた前記単語の1つを確定単語としてモニター(52)に表
示するとともに確定単語以外の単語を表示の次候補とす
る確定単語選択手段(6) とが備えられている。
Description
号を認識して、文字データに変換する音声文字変換技術
に関する。
ィス・オートメーション、ホームオートメーションが進
むとともに、数多くの機械が職場や家庭に導入されてい
るが、これらの機械へ命令を伝達する入力インタフェー
スとして、キーボードやマウスなどのポインティングデ
ィバイスが主に利用されている。しかしながら、キーボ
ードを通じての命令の入力は、キーボード操作が不得手
のものにとって、非常にわずらわしく、入力エラーがつ
きまとう。より、ユーザーフレンドリーなインターフェ
ースとしてアイコンやイラストを用いたグラフィックイ
ンターフェースがあり、そこでは、マウス等を用いて表
示されるメニューから所望の命令を選択する。この場
合、命令の数が少なければよいが、命令がある程度の数
となれば、メニューの階層が深くなり、所望の命令にた
どり着くのに多くの時間を要することになる。このよう
な欠点を解消すべく音声認識を用いた音声入力方式が登
場し始めている。音声認識のもつ利点は、入力に熟練を
要しないことや、目や手を用いないので他の作業を行っ
ている間に入力が行えることなどがあり、その期待は大
きい。
音声認識の技術は高い信頼性をもって確立しているとは
言えず、しばしば誤認識が生じる。特に、不特定話者連
続音声認識では、話し手のくせなどにより同じような誤
認識が続いたり、同じ言葉を意識して口調を変えながら
発音しなければ正しく認識されないということが頻繁に
生じる。本発明の目的は、同じ言葉を何度も繰り返すこ
となく正しい文字データに変換することが可能な変換す
る音声文字変換方法と音声文字変換装置を提供すること
である。
め、本発明による音声文字変換方法は、入力された音声
を複数のセグメントに分割して音素認識し、各セグメン
トに対して1以上の音素を割り当て、この音素に基づい
て決定された1以上の単語を記憶部に格納し、格納され
た単語の1つを確定単語として出力するとともに前記確
定単語以外の単語を次候補とすることを特徴とする。
手法を用いて割り当てられた音素に対して1以上の単語
を対応付けて記憶部に格納し、1以上の単語から選択さ
れた1つの単語を確定単語として制御コマンドとすると
ともに、確定単語以外の単語を表示次候補とし、確定単
語が正しくない場合は表示次候補が確定単語として繰り
上げられる。確定単語が正しいものかどうかをチェック
するためには、例えば、確定単語をモニターに表示して
オペレータの判断を仰ぐことができるし、確定単語を音
声出力してオペレータの判断を仰ぐことも可能である。
いずれにしても、例えば、最初の確定単語が正しくなけ
れば、なんらかの次候補の表示のためのコマンドを送る
ことにより次候補が次の確定単語として出力されるの
で、正しい音声認識を求めてオペレータが何度も同じ言
葉を繰り返しても、誤まっている同じ単語を繰り返して
出力するということは回避できる。
しい方法として、例えば、前記音素に基づいて決定され
た単語には音素適合確率値をもって前記記憶部に格納さ
れ、高い確率値をもった単語から順に確定単語とするこ
とが提案される。音素に対応する単語には音素適合確率
値がリンクされているので、その確率値の高い順に単語
を表示していくことにより、同じ文字データが繰り返さ
れるというエラーがなくなるだけでなく、少ない選択回
数で正しい変換文字データに遭遇する可能性が高くな
る。
所定時間以内に同じ音声が入力された場合次候補を確定
単語として出力する、例えばモニターに表示するような
方式を採用することが提案される。この場合、所定時間
以内の同じ音声の入力が先に確定単語に代えて次候補を
確定単語として出力するためのトリガーとなっているの
で、音声文字変換が正しくない場合でも、繰り返し発音
することで、順次異なる単語が確定単語として出力され
ていくので、繰り返し発音が同じ誤変換を繰り返すとい
う従来生じていたようなストレスをオペレータに与える
ことはなくなる。
ば、予め最も認識されやすい音声を次候補の出力コマン
ドとして設定しておき、出力された単語が誤って認識さ
れていた場合、その次候補出力コマンドとしての音声を
発音することで次候補を順次表示させることも可能であ
る。
声文字変換装置は、入力された音声を複数のセグメント
に分割して各セグメントに対して1以上の音素を割り当
てる音素認識手段と、前記音素に基づいて1以上の単語
を決定する文字列変換手段と、前記決定された単語を格
納する記憶部と、前記格納された単語の1つを確定単語
として出力するとともに前記確定単語以外の単語を表示
の次候補とする確定単語選択手段とを備えている。
られた音素に対して1以上の単語を対応付けて記憶部に
格納し、確定単語選択手段が選択された1つの単語を確
定単語として出力して制御コマンドとして用いられると
ともに、出力された確定単語以外の単語を先の確定単語
の次候補として準備しておく。なんらかの次候補の確定
単語としての出力のためのコマンドを受け取ると、次候
補が先の確定単語に代えて出力されるので、正しい音声
認識を求めてオペレータが何度も同じ言葉を繰り返して
も、誤まっている同じ単語を繰り返して表示するという
ことは回避できる。もちろん、確定単語のチェックのた
めには、確定単語をモニターに表示することなどが提案
される。
案された方法で述べたように、単語適合確率値をもって
記憶部に格納された単語に対して、確定単語選択手段が
高い確率値をもった単語から順に確定単語として選択す
ることにより、その確率値の高い順に単語が出力される
ことになるので、同じ文字データが繰り返されるという
エラーがなくなるだけでなく、少ない選択回数で正しい
変換文字データに遭遇する可能性が高くなる。
一であるかどうかを判定する入力音声評価手段が備えら
れ、所定時間以内に同じ音声が入力されたと判定された
場合、前記確定単語選択手段は前記次候補を確定単語と
して出力する(例えばモニターに表示する)構成を採用
するならば、音声文字変換が正しくない場合でも、繰り
返し発音することで、順次異なる単語は表示されていく
ので、繰り返し発音が同じ誤変換を繰り返すというスト
レスをオペレータに与えることはなくなる。本発明によ
るその他の特徴及び利点は、以下図面を用いた実施例の
説明により明らかになるだろう。
技術を用いた音声コマンド入力システムの機能ブロック
図が示されている。このシステムでは、オペレータがコ
マンドを発声することにより、プラント現場に配置され
た監視カメラが操作される。例えば、オペレータが「L
NG気化器1号」と発声すると、監視カメラがLNG気
化器1号に照準をあわせるべく作動して、モニターにL
NG気化器1号の様子を表示するのである。
声をアナログ音声信号に変換するマイク1、マイク1か
ら送られてきたアナログ音声信号をデジタル音声信号に
変換するA/D変換部2、音声信号を分析処理して発音
記号に似たような音素に置き換えていく音素認識手段
3、辞書ファイル41にアクセスしながら音素列に適当
な単語を割り当てていく文字列変換手段4、割り当てら
れた単語を一時的に格納する記憶部51、記憶部51に
格納された単語から最適なものを確定単語として選択す
る確定単語選択手段6が備えられている。さらに、確定
単語選択手段6によって確定単語として選択された単語
はモニター52に表示されるとともに、監視カメラ制御
手段7にも引き渡される。監視カメラ制御手段7を構成
するコマンド認識部71は、監視カメラ制御手段7に引
き渡された確定単語からコマンド辞書ファイル72にア
クセスして対応する制御コマンドを引き出し、この制御
コマンドはドライバー73によって監視カメラ74の駆
動モータを作動する制御信号に変換される。
認識アルゴリズムを用いたものであり、デジタル音声信
号から経時的な音声スペクトルを分析してその特徴パラ
メータを抽出する音響特徴抽出部31と、この特徴パラ
メータから音韻コードを生成する音韻コード変換部32
と、音韻コードに対応する音素を与える音素変換部33
とを備えている。音素変換部33で、音韻コードに対応
する音素を選択する際、一義的に音素が決定される場合
(つまり音素適合確率値が1)を除いて、複数の音素が
その音素適合確率値付きで選択される。文字列変換手段
4は、この音素適合確率値の高いものから順次組み合わ
せて制御コマンドとしての1つ以上の単語を生成し、記
憶部51に格納する。その際、生成された単語には属性
値として単語適合確率値がリンクされる。単語適合確率
値は、例えば、その単語の元となった音素の音素適合確
率値を乗算して簡単に得ることができる。確定単語選択
手段6は、ある音声に対して複数の単語が存在する時に
はまず最も高い単語適合確率値をもった単語を確定単語
として、モニター52に表示するとともに、これをカメ
ラ制御手段7に送り込み、監視カメラの操作をスタート
させる。
語がオペレータが発音したものと異なる場合、この確定
単語を取り消して正しい単語が認識されるようにしなけ
ればならないが、例えば、誤認識の原因がオペレータの
発音の癖などであれば、再度オペレータが再度正しい制
御コマンドを発音しても、必ずしも正しく音声認識され
るとは限らない。このため、本発明では、誤認識した場
合のために、先に決定された確定単語以外の単語、つま
り2番目に高い単語適合確率値をもった単語が次候補と
して用意されているので、この次候補を確定単語とすれ
ばよい。このような確定単語の入れ替えを正しい確定単
語が出力されるまで、順次やっていけばよいのである。
するトリガーとして、所定時間(例えば2秒)以内にオ
ペレータが再度同じ制御コマンドを繰り返すこと、つま
りこのシステムに同じ音声信号が入力されることを利用
しており、そのために、入力音声評価手段8が備えられ
ている。この入力音声評価手段8は、A/D変換部2か
ら入力された音声信号を所定時間前に入力された音声信
号と比較して、2つの信号が一致した場合単語替えコマ
ンドを確定単語選択手段に出力する。単語替えコマンド
を受け取った確定単語選択手段6は、次候補の単語を確
定単語とし、さらに次に高い単語適合確率をもつ単語を
次候補とする。もちろん、所定時間経過後にオペレータ
によって発音された音声は新たに音声認識される。
気化器1号」と発声したことを例にとって、この音声コ
マンド入力システムの作用を説明する。マイク1から入
力された音声はゲインコントロールされた後、16kH
zサンプリングと16ビット量子化でデジタル信号化さ
れる。さらに、約6.6ミリ秒のフレーム毎に20チャ
ンネルのフィルターバンクなどを用いて23の音響特徴
パラメータ表現に変換される。この音響特徴パラメータ
は、2段階の決定木からなる音韻エンコーダによって音
韻コードに変換される。
定木では、約6.6ミリ秒の各フレームの特徴量とし
て、そのフレームの23の音響特徴量と、その前後のフ
レームの音響特徴量との関係から導かれる161の特徴
量を合わせた計184の特徴量を入力ベクトルとして用
いる。この第1段の決定木の出力は、次の段階でセグメ
ンテーションを行うための0番から8番までの9クラス
である。この9クラスをセグメントクラスと呼ぶ。第2
段の決定木では、特徴量として、そのセグメントのセグ
メントクラスや、そのセグメントを構成するフレームの
音響特徴量の平均などの特徴量と、その前後のセグメン
トの特徴量との関係から導かれる特徴量を合わせた計2
82の特徴量を入力ベクトルとして用いる。この第2段
の決定木の出力は、音素よりさらに小さい単位である約
1800種類の音韻コードである。
対して複数の音素を確率付きで割り当てた音韻コードフ
ァイルを参照しながら、音素適合確率付きで音韻コード
/音素変換される。各セグメント毎に所定の確率値以上
をもつ1つ以上の音素が選択される。この音素リスト
は、文法を参照しながら単語に変換されていくが、その
際例えば、”LPG”という単語には単語適合確率値=
0.64が与えられ、”LNG”という単語には、単語
適合確率値=0.36が与えられている。このように、
変換された単語は、記憶部51に格納される。
された単語は、確定単語選択手段6によって、その確率
値が大きいものを組み合わせて最も確からしいものから
順に確定単語、次候補とする。この例では、最も確率値
が大きかった”LPG気化器1号”が最初の確定単語で
あり、”LNG気化器1号”が次候補で、”LPG気化
器2号”がこれに続く。よって、モニター52には、図
3に示すように”LPG気化器1号”が表示され、監視
カメラ74はLPG気化器1号を撮影すべく作動し始め
る。
「LNG気化器1号」であり、この結果は誤認識である
ので、オペレータは1秒後に再度「LNG気化器1号」
と発音する。入力音声評価手段8は、誤認識のための再
入力を意味する所定時間、ここでは2秒以内での同じ音
声信号の入力を確認し、新たな音声認識処理をせずに或
いは新たな音声認識処理をしたとしてもその結果は無視
して、確定単語選択手段6に作用して、次候補である”
LNG気化器1号”を確定単語として、モニター52に
表示し、その結果、監視カメラ74はLNG気化器1号
を撮影すべく作動を変更する。今度は正しい制御コマン
ドが送られたことになるので、必要の場合、オペレータ
は、少なくとも2秒の経過を待って、次の制御コマンド
を送るべく発音する。
ガーとして同じ内容をもう1度発音することにしたが、
その他の方法、例えば、予め最も認識されやすい音声を
次候補の表示コマンドとして設定しておき、表示された
単語が誤って認識されていた場合、その次候補表示コマ
ンドとしての音声を発音することで次候補を順次表示さ
せることも可能である。
単語はモニター52に表示される構成に代えて、確定単
語を音声で出力することで、オペレータのチェックを受
けるようにしてもよい。
って音声認識されることを避けるため、1度行った音声
認識での結果で得られる他の言葉を次候補として利用す
ることである。この主旨から外れない限り、音声認識方
法としてその他の公知の方法を用いることも本発明の枠
内に入るものである。
マンド入力システムの機能ブロック図
ニター画面の様子を示す説明図
Claims (8)
- 【請求項1】 入力された音声を複数のセグメントに分
割して音素認識し、各セグメントに対して1以上の音素
を割り当て、この音素に基づいて決定された1以上の単
語を記憶部に格納し、格納された単語の1つを確定単語
として出力するとともに前記確定単語以外の単語を次候
補とすることを特徴とする音声文字変換方法。 - 【請求項2】 前記確定単語はモニターに表示させるた
めにモニターに出力されることを特徴とする請求項1に
記載の音声文字変換方法。 - 【請求項3】 前記音素に基づいて決定された単語は音
素適合確率値をもって前記記憶部に格納され、高い確率
値をもった単語から順に確定単語とすることを特徴とす
る請求項1又は2に記載の音声文字変換方法。 - 【請求項4】 所定時間以内に同じ音声が入力された場
合、前記次候補を確定単語として出力することを特徴と
する請求項1〜3のいずれか1項に記載の音声文字変換
方法。 - 【請求項5】 入力された音声を複数のセグメントに分
割して各セグメントに対して1以上の音素を割り当てる
音素認識手段と、前記音素に基づいて1以上の単語を決
定する文字列変換手段と、前記決定された単語を格納す
る記憶部と、前記格納された単語の1つを確定単語とし
て出力するとともに前記確定単語以外の単語を表示の次
候補とする確定単語選択手段とを備えている音声文字変
換装置。 - 【請求項6】 前記確定単語の確認のために前記確定単
語を表示するモニターが備えられていることを特徴とす
る請求項5に記載の音声文字変換装置。 - 【請求項7】 前記音素に基づいて決定された単語は単
語適合確率値をもって前記記憶部に格納され、前記確定
単語選択手段は高い確率値をもった単語から順に確定単
語として選択することを特徴とする請求項5又は6に記
載の音声文字変換装置。 - 【請求項8】 所定時間以内に入力された音声が同一で
あるかどうかを判定する入力音声評価手段が備えられて
おり、所定時間以内に同じ音声が入力されたと判定され
た場合、前記確定単語選択手段は前記次候補を確定単語
として出力することを特徴とする請求項5〜7のいずれ
か1項に記載の音声文字変換装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9308252A JPH11143487A (ja) | 1997-11-11 | 1997-11-11 | 音声文字変換方法と音声文字変換装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9308252A JPH11143487A (ja) | 1997-11-11 | 1997-11-11 | 音声文字変換方法と音声文字変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11143487A true JPH11143487A (ja) | 1999-05-28 |
Family
ID=17978779
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9308252A Pending JPH11143487A (ja) | 1997-11-11 | 1997-11-11 | 音声文字変換方法と音声文字変換装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11143487A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002344957A (ja) * | 2001-05-11 | 2002-11-29 | Hitachi Kokusai Electric Inc | 画像監視装置 |
| US11153472B2 (en) | 2005-10-17 | 2021-10-19 | Cutting Edge Vision, LLC | Automatic upload of pictures from a camera |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61231629A (ja) * | 1985-04-08 | 1986-10-15 | Hitachi Ltd | 音声入力装置 |
| JPH02230225A (ja) * | 1989-03-03 | 1990-09-12 | Nec Corp | カメラ制御方式 |
| JPH03148750A (ja) * | 1989-11-06 | 1991-06-25 | Fujitsu Ltd | 音声ワープロ |
| JPH04134397A (ja) * | 1990-09-26 | 1992-05-08 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
| JPH07120253B2 (ja) * | 1985-02-06 | 1995-12-20 | 株式会社日立製作所 | 音声による文章入力装置 |
| JPH08190398A (ja) * | 1995-01-10 | 1996-07-23 | Sony Corp | 音声認識装置 |
| JPH0983997A (ja) * | 1995-09-12 | 1997-03-28 | Osaka Gas Co Ltd | 操作装置 |
| JP2686085B2 (ja) * | 1987-12-17 | 1997-12-08 | 三洋電機株式会社 | 音声認識システム |
| JPH1039892A (ja) * | 1996-07-24 | 1998-02-13 | Denso Corp | 音声認識方法及び音声認識装置 |
-
1997
- 1997-11-11 JP JP9308252A patent/JPH11143487A/ja active Pending
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07120253B2 (ja) * | 1985-02-06 | 1995-12-20 | 株式会社日立製作所 | 音声による文章入力装置 |
| JPS61231629A (ja) * | 1985-04-08 | 1986-10-15 | Hitachi Ltd | 音声入力装置 |
| JP2686085B2 (ja) * | 1987-12-17 | 1997-12-08 | 三洋電機株式会社 | 音声認識システム |
| JPH02230225A (ja) * | 1989-03-03 | 1990-09-12 | Nec Corp | カメラ制御方式 |
| JPH03148750A (ja) * | 1989-11-06 | 1991-06-25 | Fujitsu Ltd | 音声ワープロ |
| JPH04134397A (ja) * | 1990-09-26 | 1992-05-08 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
| JPH08190398A (ja) * | 1995-01-10 | 1996-07-23 | Sony Corp | 音声認識装置 |
| JPH0983997A (ja) * | 1995-09-12 | 1997-03-28 | Osaka Gas Co Ltd | 操作装置 |
| JPH1039892A (ja) * | 1996-07-24 | 1998-02-13 | Denso Corp | 音声認識方法及び音声認識装置 |
Non-Patent Citations (6)
| Title |
|---|
| 古井, ディジタル音声処理, JPN4006004383, 25 September 1985 (1985-09-25), JP, pages 160 - 161, ISSN: 0000719825 * |
| 古井, ディジタル音声処理, JPNX007029609, 23 September 1985 (1985-09-23), JP, pages 160 - 161, ISSN: 0000859925 * |
| 新美, 情報科学講座 E・19・3 音声認識, JPN4007000036, 10 October 1979 (1979-10-10), JP, pages 90 - 92, ISSN: 0000807868 * |
| 新美, 情報科学講座 E・19・3 音声認識, JPNX007029608, 10 October 1979 (1979-10-10), JP, pages 90 - 92, ISSN: 0000859924 * |
| 田村他: "ニューラルネットを用いた音声処理", テレビジョン学会誌, vol. 43, no. 9, JPN4007000035, 20 September 1998 (1998-09-20), JP, pages 935 - 943, ISSN: 0000807867 * |
| 田村他: "ニューラルネットを用いた音声処理", テレビジョン学会誌, vol. 43, no. 9, JPNX007029607, 20 September 1998 (1998-09-20), JP, pages 935 - 943, ISSN: 0000859923 * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002344957A (ja) * | 2001-05-11 | 2002-11-29 | Hitachi Kokusai Electric Inc | 画像監視装置 |
| US11153472B2 (en) | 2005-10-17 | 2021-10-19 | Cutting Edge Vision, LLC | Automatic upload of pictures from a camera |
| US11818458B2 (en) | 2005-10-17 | 2023-11-14 | Cutting Edge Vision, LLC | Camera touchpad |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4657736B2 (ja) | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 | |
| EP0965978B1 (en) | Non-interactive enrollment in speech recognition | |
| US8433573B2 (en) | Prosody modification device, prosody modification method, and recording medium storing prosody modification program | |
| US5615296A (en) | Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors | |
| US6934682B2 (en) | Processing speech recognition errors in an embedded speech recognition system | |
| US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
| CN100524459C (zh) | 用于语音识别的方法和系统 | |
| US20030154080A1 (en) | Method and apparatus for modification of audio input to a data processing system | |
| JPH0423799B2 (ja) | ||
| JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
| JPH07114395A (ja) | 音声認識用データ圧縮 | |
| WO2006054724A1 (ja) | 音声認識装置及び方法ならびにプログラム | |
| NO309750B1 (no) | Talegjenkjenning | |
| EP1701338B1 (en) | Speech recognition method | |
| JP2003022089A (ja) | オーディオ専用インターフェースにおけるボイス・スペリング | |
| JPH06214587A (ja) | 事前指定ワードスポッティングサブシステム及び事前ワードスポッティング方法 | |
| JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
| JPH06110494A (ja) | 発音学習装置 | |
| JPH11161464A (ja) | 日本語文章作成装置 | |
| US20040006469A1 (en) | Apparatus and method for updating lexicon | |
| WO2006083020A1 (ja) | 抽出された音声データを用いて応答音声を生成する音声認識システム | |
| US7752045B2 (en) | Systems and methods for comparing speech elements | |
| JPH11143487A (ja) | 音声文字変換方法と音声文字変換装置 | |
| JP3254977B2 (ja) | 音声認識方法及び音声認識装置 | |
| US20070129945A1 (en) | Voice quality control for high quality speech reconstruction |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040312 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060228 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060307 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060428 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070105 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070607 |