JPS61294500A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS61294500A JPS61294500A JP60136384A JP13638485A JPS61294500A JP S61294500 A JPS61294500 A JP S61294500A JP 60136384 A JP60136384 A JP 60136384A JP 13638485 A JP13638485 A JP 13638485A JP S61294500 A JPS61294500 A JP S61294500A
- Authority
- JP
- Japan
- Prior art keywords
- section
- information
- speech
- recognition
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
本発明は入力された音声の音声区間を判定し。
予め登録された特徴標準パターンとの類似度計算を行な
い、得られた結果を外部の処理装置へ転送するようにし
た音声認識装置に関するものである口〈従来技術〉 従来の音声認識装置では、外部処理装置に出力する情報
が認識結果(第8位まで)のみが・それに加えて各認識
結果に対しての距離を用イt: モ。
い、得られた結果を外部の処理装置へ転送するようにし
た音声認識装置に関するものである口〈従来技術〉 従来の音声認識装置では、外部処理装置に出力する情報
が認識結果(第8位まで)のみが・それに加えて各認識
結果に対しての距離を用イt: モ。
しかなかった、認識率が比較的高い離散発声の単語入力
などの場合では、この方法でも充分実用に耐えるが、単
音節や連続単語を扱おうとすると。
などの場合では、この方法でも充分実用に耐えるが、単
音節や連続単語を扱おうとすると。
これらの認識情報だけでは実用的ではない。
く目 的〉
本発明は、従来外部処理装置に出力していた情報に加え
て1判定した音声区間の韻律情報を出力することにより
、外部装置を含めた全体的な認識系としての認識性能を
高めることを目的としている。
て1判定した音声区間の韻律情報を出力することにより
、外部装置を含めた全体的な認識系としての認識性能を
高めることを目的としている。
〈実施例〉
以下図にもとづいて本発明の詳細な説明する。
第1図は本発明に係る音声認識装置のブロック構成図で
ある。図において、lは音声入力用のマイクロフォン、
2は音声帯域だけを増幅するアンプ、3は音声区間を抽
出する音声区間抽出部、4は音声区間の韻律情報(たと
えば、音声区間の時量情報)を抽出する韻律情報抽出部
、5は予め貯えられている標準パターンとマツチングを
行なうマツチング部、6は標準i<ターンを貯える標準
ノRターンメモリ、7は前記音声区間抽出部3.韻律情
報抽出部4.マツチング部5並びに外部処理装置(図示
せず)との情報のやり取りを行なうインターフェース部
8をコントロールする中央処理部(CPU)である。
ある。図において、lは音声入力用のマイクロフォン、
2は音声帯域だけを増幅するアンプ、3は音声区間を抽
出する音声区間抽出部、4は音声区間の韻律情報(たと
えば、音声区間の時量情報)を抽出する韻律情報抽出部
、5は予め貯えられている標準パターンとマツチングを
行なうマツチング部、6は標準i<ターンを貯える標準
ノRターンメモリ、7は前記音声区間抽出部3.韻律情
報抽出部4.マツチング部5並びに外部処理装置(図示
せず)との情報のやり取りを行なうインターフェース部
8をコントロールする中央処理部(CPU)である。
今・入力者がマイクロフォンlに向って音声を発声する
と、その音声はマイクロフォンIからアンプ2に転送さ
れて音声区間だけ増幅され、音声区間抽出部3にてパワ
ーなどの情報から音節区間(単語区間)が抽出される。
と、その音声はマイクロフォンIからアンプ2に転送さ
れて音声区間だけ増幅され、音声区間抽出部3にてパワ
ーなどの情報から音節区間(単語区間)が抽出される。
さらに、韻律情報抽出部4において音声の時間情報など
の韻律情報が抽出され、この抽出された区間の特徴量と
標準パターンメモリ6に予め貯えられている標準パター
ンとがマツチング部5でパターンマツチされる。
の韻律情報が抽出され、この抽出された区間の特徴量と
標準パターンメモリ6に予め貯えられている標準パター
ンとがマツチング部5でパターンマツチされる。
こうして認識された候補は、第8位まで認識距離ととも
に外部インターフェース部8から外部の処理装置(図示
せず)へ出力される。このとき、音声区間抽出部3と韻
律情報抽出部4から得られた音声区間の韻律情報も出力
される。
に外部インターフェース部8から外部の処理装置(図示
せず)へ出力される。このとき、音声区間抽出部3と韻
律情報抽出部4から得られた音声区間の韻律情報も出力
される。
第2図は「あれ」を入力例として、パワーによって音節
を抽出したときの概念図、第3図は外部処理装置への転
送情報例であり、ここでは音声区間の韻律情報として音
声区間の時間情報すなわち各音声区間の始端時間と終端
時間の情報を得て出力するようにしている。
を抽出したときの概念図、第3図は外部処理装置への転
送情報例であり、ここでは音声区間の韻律情報として音
声区間の時間情報すなわち各音声区間の始端時間と終端
時間の情報を得て出力するようにしている。
この例では、音声区間候補■の第1認識結果には音節「
て」がきている。しかし時間情報をみると音声区間候補
■は、前の区間候補とつながっていることが分かる。し
たがって、外部処理装置側で、無声破裂音(バタカ行な
ど)の音節の前には必ず無音区間が来るという情報をも
っていれば。
て」がきている。しかし時間情報をみると音声区間候補
■は、前の区間候補とつながっていることが分かる。し
たがって、外部処理装置側で、無声破裂音(バタカ行な
ど)の音節の前には必ず無音区間が来るという情報をも
っていれば。
この第1候補の「て」は無音区間がないため誤りである
と判断でき、それ以降の処理から除くことができる。
と判断でき、それ以降の処理から除くことができる。
また、この例では区間候補■と区間候補■に時間的に競
合する区間候補■を出力している。これは、音節などを
単位として認識する場合には、音声区間の判定誤りは致
命的な誤りとなるため、複数の音声区間候補を出力する
ことが有効となる。
合する区間候補■を出力している。これは、音節などを
単位として認識する場合には、音声区間の判定誤りは致
命的な誤りとなるため、複数の音声区間候補を出力する
ことが有効となる。
このような複数個の区間候補を出力するには1例のよう
に時間情報を出力しなければ実現できない。
に時間情報を出力しなければ実現できない。
このような複数個の区間候補が競合する場合には外部処
理装置のほうで辞書照合などの後処理を行なって、最終
的な認識結果を得ることになる。
理装置のほうで辞書照合などの後処理を行なって、最終
的な認識結果を得ることになる。
このように、出力情報に音声区間の時間情報を伺加する
ことにより以下の利点が生じる。
ことにより以下の利点が生じる。
■ 外部の処理装置側で、認識候補のふるい落としが可
能となる。
能となる。
イ)音節単位の認識の場合、無声破裂音(か行、た行、
ば行など)の前番こは必ず無音区間が入る。マツチング
ではこれらのことを考慮しないので、無音区聞かない場
合でも無声破裂音の認識結果をだす場合がある。これに
対し時間情報を用いると、先の音節の音声区間と今回の
音声区間が連続している場合には認識結果から無声破裂
音を除去することができる。
ば行など)の前番こは必ず無音区間が入る。マツチング
ではこれらのことを考慮しないので、無音区聞かない場
合でも無声破裂音の認識結果をだす場合がある。これに
対し時間情報を用いると、先の音節の音声区間と今回の
音声区間が連続している場合には認識結果から無声破裂
音を除去することができる。
口)単語単位の認識の場合、入力する単語によっては、
長さが著しく異なる場合があるO例えば数字の「5(ご
)」と野菜名「桜島大根(さくらじまだいこん)」が同
時に認識対象になっている場合、その単語の継続長は、
著しく異なっている。単なるマツチングのみであるとこ
れらの単語を相互に誤る可能性がある。
長さが著しく異なる場合があるO例えば数字の「5(ご
)」と野菜名「桜島大根(さくらじまだいこん)」が同
時に認識対象になっている場合、その単語の継続長は、
著しく異なっている。単なるマツチングのみであるとこ
れらの単語を相互に誤る可能性がある。
しかし時間情報を用いると、「5」を発声されて−マッ
チングで「桜島大根」に認識されたとしても、外部の処
理装置があらかじめその単語の継続長の情報をもってい
ると「桜島大根」は「5」のように短いはずはないと判
定でき、候補から除くことができる。「桜島大根」は5
00ms以下になることはなく。
チングで「桜島大根」に認識されたとしても、外部の処
理装置があらかじめその単語の継続長の情報をもってい
ると「桜島大根」は「5」のように短いはずはないと判
定でき、候補から除くことができる。「桜島大根」は5
00ms以下になることはなく。
500m5以下の単語の候補からは、「桜島大根」をの
ぞけばよい。
ぞけばよい。
■ 複数候補を出力して競合の処理を外部処理装置で行
なうことができる。
なうことができる。
イ)音節を単位として認識する場合には、音声区間を正
しく抽出することが重要になるが。
しく抽出することが重要になるが。
実際に音声区間を一意に決定することは容易ではない。
そこで同一時17号区間を共有する候補を複数出力する
ことにより外部処理装置で最終決定を行なう。この場合
には1時開情報を外部処理装置にだしてやらないと競合
候補かどうかがわからない。
ことにより外部処理装置で最終決定を行なう。この場合
には1時開情報を外部処理装置にだしてやらないと競合
候補かどうかがわからない。
く効 果〉
以上の様に本発明の音声認識装置は認識結果とその認識
距離情報の他に音声区間の韻律情報を得て、これらの情
報分外部処理装置へ出力できるものであるから、外部装
置を含めた全体的な認識系としての認識性能を高めるこ
とができる。
距離情報の他に音声区間の韻律情報を得て、これらの情
報分外部処理装置へ出力できるものであるから、外部装
置を含めた全体的な認識系としての認識性能を高めるこ
とができる。
第1図は本発明装置のブロック構成図、第2図はパワー
によって音節を抽出したときの概念図。 第3図は転送情報例を示す図である。 ■はマイクロフォン、2はアンプ、3は音声区間抽出部
、4は韻律情報抽出部、5はマツチング部、6はパター
ンメモリ、7はCPU、8は外部インターフェース 代理人 弁理士 福 士 愛 彦(他2名)第1図
によって音節を抽出したときの概念図。 第3図は転送情報例を示す図である。 ■はマイクロフォン、2はアンプ、3は音声区間抽出部
、4は韻律情報抽出部、5はマツチング部、6はパター
ンメモリ、7はCPU、8は外部インターフェース 代理人 弁理士 福 士 愛 彦(他2名)第1図
Claims (1)
- 【特許請求の範囲】 1、入力された音声の音声区間を判定し、予め登録され
た特徴標準パターンとの類似度計算を行ない、認識結果
とその認識距離情報の他に音声区間の韻律情報を得て、
これらの情報を外部処理装置へ出力できるようにしたこ
とを特徴とする音声認識装置。 2、前記韻律情報は音声区間の時間情報であることを特
徴とする特許請求の範囲第1項に記載の音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60136384A JPS61294500A (ja) | 1985-06-21 | 1985-06-21 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60136384A JPS61294500A (ja) | 1985-06-21 | 1985-06-21 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS61294500A true JPS61294500A (ja) | 1986-12-25 |
Family
ID=15173891
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60136384A Pending JPS61294500A (ja) | 1985-06-21 | 1985-06-21 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61294500A (ja) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58136097A (ja) * | 1982-02-08 | 1983-08-12 | 株式会社京三製作所 | 認識パタ−ン照合方式 |
-
1985
- 1985-06-21 JP JP60136384A patent/JPS61294500A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58136097A (ja) * | 1982-02-08 | 1983-08-12 | 株式会社京三製作所 | 認識パタ−ン照合方式 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS58130393A (ja) | 音声認識装置 | |
| JPS62232691A (ja) | 音声認識装置 | |
| JPS61294500A (ja) | 音声認識装置 | |
| JPS63165900A (ja) | 会話音声認識方式 | |
| JPS58108590A (ja) | 音声認識装置 | |
| JP2615643B2 (ja) | 単語音声認識装置 | |
| JPH0194398A (ja) | 音声標準パターンの作成方法 | |
| JP2707552B2 (ja) | 単語音声認識装置 | |
| JP2615649B2 (ja) | 単語音声認識装置 | |
| JPS58176699A (ja) | 音声標準パタ−ン登録方式 | |
| JPS6027433B2 (ja) | 日本語情報入力装置 | |
| JPS6275700A (ja) | 音声認識方式 | |
| JPS62217297A (ja) | 単語音声認識装置 | |
| JPS59195300A (ja) | 音声認識装置 | |
| JPS6312000A (ja) | 音声認識装置 | |
| JPS6257000A (ja) | 音声認識装置 | |
| JPS62226196A (ja) | 標準パタン逐次学習方式 | |
| JPS61261798A (ja) | 音声認識装置 | |
| JPH11175087A (ja) | 単語音声認識の文字列マッチング法 | |
| JPH0558556B2 (ja) | ||
| JPS63191199A (ja) | 有声破裂子音識別装置 | |
| JPS63125998A (ja) | 音声入出力装置 | |
| JPS62218997A (ja) | 単語音声認識装置 | |
| JPS6061800A (ja) | 音声認識方式 | |
| JPH11175085A (ja) | 単語音声認識方法及び音声認識用単語辞書 |