JPH02717B2 - - Google Patents

Info

Publication number
JPH02717B2
JPH02717B2 JP13964283A JP13964283A JPH02717B2 JP H02717 B2 JPH02717 B2 JP H02717B2 JP 13964283 A JP13964283 A JP 13964283A JP 13964283 A JP13964283 A JP 13964283A JP H02717 B2 JPH02717 B2 JP H02717B2
Authority
JP
Japan
Prior art keywords
difference signal
input
frequency component
voiced
differential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP13964283A
Other languages
English (en)
Other versions
JPS6031195A (ja
Inventor
Hiroyoshi Yuasa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP13964283A priority Critical patent/JPS6031195A/ja
Publication of JPS6031195A publication Critical patent/JPS6031195A/ja
Publication of JPH02717B2 publication Critical patent/JPH02717B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】
〔技術分野〕 本発明は電子機器を音声メツセージによつて操
作するための音声メツセージ識別方式に関するも
のである。 〔背景技術〕 従来、帯域フイルタによつて抽出した音声の周
波数分析によるスペクトルパターンを変換行列等
によつて変換し、音声の特徴パターンを記号ない
しはパラメータによつて抽出し、このパターンで
音声を識別する方式において、簡単化、ローコス
ト化のために、音声の有声音、無声音の差異、お
よび、ホルマント軌跡に対応するマイクロ的な特
徴パターンを形成し、音声メツセージを識別する
方式を検討した。 第1図は本発明に関連する先願(特願昭58−
67261号)の構成を示すブロツク図である。同図
の音声メツセージ識別装置は、音響分析部A、パ
ターン変換部B、単語識別部Cに大別できる。 音響分析部Aは、マイク1にて検出した音声の
増幅、周波数成分の高域強調(等価回路)、直流
分除去を行なう前置調整アンプ2の出力を周波数
分析部3で、周波数スペクトル成分に展開し、対
数変換部4で、周波数スペクトルのパターンを対
数尺度に変換する。第2図に従来例の音響分析部
Aの実施例を示した。第2図では、音声の周波数
分析を6個のフイルタバンク(V、UV、VL、
VH、VB、VF)で行なつた。ここで、各フイル
タバンクの周波数帯域について説明すると、Vは
有声音Vのパワーの集中する帯域(およそ0〜
1KHz)、UVは無音声UVのパワーの集中する帯
域(およそ5〜10KHz)、VLは狭顎音VLの第一
ホルマントの集中する帯域(およそ0〜0.4K
Hz)、VHは広顎音VHの第一ホルマントの集中す
る帯域(およそ0.4〜0.8KHz)、VBは後舌音VBの
第二ホルマントの集中する帯域(およそ0.8〜
1.8KHz)、VFは前舌音VFの第二ホルマントの集
中する帯域(およそ1.8〜3.2KHz)をそれぞれ抽
出するものである。第3図a,bは、各フイルタ
バンクVL、VH、VB、VFの周波数特性を示し
ており、同図aは横軸の周波数を均等目盛として
描いてあり、同図bは横軸の周波数を対数目盛と
して描いてある。なお第3図において、APは後
述する調整アンプ2bの特性を示している。 前置調整アンプ2は、第2図のブロツク図に示
すように、マイク1にて検出した音声信号の増幅
を行なうプリアンプ2aと、このプリアンプ2a
の出力に接続され、ゲインおよびオフセツト値の
調整を行なう調整アンプ2bと、レベル調整器2
cとを有している。レベル調整器2cでは、フイ
ルタバンクV、UVに供給する信号のパワーと他
のフイルタバンクに供給する信号のパワーとのバ
ランスをとつている。次に、V/UVバランス調
整器3aではフイルタバンクVの入力とフイルタ
バンクUの入力とのバランスをとる。他のフイル
タバンクについては、VB/VLバランス調整器
3bを中点に調整し、VH/VLバランス調整器
3cで、フイルタバンクVHとフイルタバンク
VLの入力バランスをとり、VF/VBバランス調
整器3dでフイルタバンクVFとフイルタバンク
VBのバランスをとる。さらにVB/VLバランス
調整器3bで、フイルタバンクVBとフイルタバ
ンクVHまたはVLのバランスをとる。 各フイルタバンクの出力はマルチプレクサ3e
にて時分割的に順次切り換えられて、対数変換部
4に入力される。対数変換部4では、入力パワー
を対数スケールに変換する。対数変換器4の出力
はA/Dコンバータ4aに入力されて、8ビツト
の2進数にデジタル化される。なお各フイルタを
デイジタルフイルタで構成する場合には、A/D
コンバータ4aは、調整アンプ2bの次段に来る
ものである。 A/Dコンバータ4aの出力は、パターン変換
部Bの差信号ベクトル変換部5に入力されて、各
フイルタバンク出力の差信号よりなる差信号ベク
トルが抽出される。第4図は差信号ベクトル変換
部5の構成例を示している。同図aに示すよう
に、差信号ベクトルは、2つのフイルタ出力の差
をとつて、平均化(積分)したものである。すな
わち10msecのサンプリング周期で、フイルタバ
ンク出力をA/Dコンバータ4aによつてデイジ
タル化した場合に、1サンプル前の差信号に係数
器5aにて係数αを掛けたものと、現サンプルの
差信号との和レジスタ5bに記憶したものが、現
サンプルの差信号ベクトル成分となる。係数α
は、およそ0.6〜0.8である。差信号ベクトル変換
部5を第4図bに示したように簡略化して図示
し、前記先願におけるパターン変換部Bの実施例
を示したものが第5図である。 第5図に示すように、差信号ベクトル変換部5
ではUV/V差信号、Veap/Viu差信号、Va/Vep
差信号、Ve/Vp差信号、およびVi/Vu差信号の
合計5成分の差信号ベクトルが抽出される。ま
ず、UV/V差信号は、有音声と無音声の識別に
用いられるものであり、フイルタバンクUVとフ
イルタバンクVとの出力の差信号である。次に、
Veap/Viu差信号は母音のe、a、oとi、uと
を識別するために用いられるものであり、フイル
タバンクVHとフイルタバンクVLとの出力の差
信号である。またVa/Vep差信号は、母音のaと
e、oとを識別するために用いられるものであ
り、フイルタバンクVBとフイルタバンクVLと
の出力の差信号である。Ve/Vp差信号は、母音
のeとoとを識別するために用いられるものであ
り、フイルタバンクVFとフイルタバンクVBと
の出力の差信号である。さらに、Vi/Vu差信号
は、母音のiとuとを識別するために用いられる
ものであり、フイルタバンクVFとフイルタバン
クVHとの出力の差信号である。各差信号のう
ち、Veap/Viu差信号とVa/Vep差信号は母音の第
1ホルマントの特徴を抽出しているものであり、
また、Ve/Vp差信号とVi/Vu差信号は母音の第
2ホルマントの特徴を抽出しているものである。 上述のようにして作成されたUV/V差信号
は、V、UV、S判定部18に入力されて、有声
音Vの区間と、無声音UVの区間、および無音S
の区間の判定に用いられる。V、UV、S判定部
18は、UV/V差信号を所定の基準値Rv、Ru
(Rv<O<Ru)と比較して、UV/V差信号が基
準値Rvよりも小さい場合には有声音Vと判定し、
基準値Ruよりも大きい場合には無声音Uと判定
し、基準値RuとRvとの間であれば無音Sと判定
する。始端終端検知部6は、音声入力が有声音V
または無声音Uと判断された場合には、音声区間
であると判断し、音声入力が無音Sと判断された
場合には、無音区間であると判断される。 次にフイルタバンクVF、VB、VH、VLの出
力の差信号ベクトルは、記号ベクトル変換部7に
入力される。記号ベクトル変換器は、各差信号
Veap/Viu、Va/Veo、Ve/Vp、Vi/Vuを成分と
する4次元の差信号ベクトルに、変換行列
〔Tm〕を乗算して、音声入力中に含まれる各母
音i、e、a、o、uの短時間平均パワーVi
Ve、Va、Vp、Vu、並びに広顎有声音、狭顎有声
音、前舌有声音、後舌有声音、母音aとoの中間
的な有声音の各短時間平均パワーVh、Vl、Vf、
Vb、Vwを算出するものである。記号ベクトル変
換部7における変換行列〔Tm〕の成分の一例を
示せば、次式のようになる。 しかして記号ベクトル変換部7の出力は最大値
判定部8aに入力されて、各成分Vi、Ve、Va
Vp、Vu、Vh、Vl、Vf、Vb、Vwのうち最大の成
分がどれであるかを判定される。記号出力部8b
は、V、UV、S判定部18において、音声入力
が無音または無声音と判定された場合には、それ
ぞれS、UVの記号を出力する。また、V、UV、
S判定部18において、音声入力が有声音と判定
された場合には、記号出力部8bは最大値判定部
8aにおいて最大の成分と判定された有声音の記
号を出力する。ただし、各有声音Vi、Ve、Va
Vp、Vu、Vf、Vb、Vh、Vl、Vwのうち、最大の
成分が所定の基準値に達しないような場合には、
上記各有声音のいずれにも該当しない有声音Vn
の記号を出力する。したがつて、記号出力部8b
からは、S、UV、Vi、Ve、Va、Vp、Vu、Vh
Vl、Vf、Vb、Vw、Vnの13種類の記号のうちいず
れか1つが出力されることになる。 記号出力部8bから出力される各記号の時系列
は、整形処理部9aに入力されて、整形処理され
る。すなわち、整形処理部9aでは、同じ記号の
繰返しを一つの記号とその継続時間とのリストに
直し、さらに継続時間が、ある設定値より少ない
ものは、前後の記号が同じ場合には、これらを一
つのリストにし、前後の記号が異なる場合には、
前の記号に含めるようにして、継続時間の短いも
のは省略する。 整形処理部9aの出力は、時間軸線型正規化処
理部9bに入力される。時間軸線型正規化処理部
9bは、各リストの継続時間の合計が200(あるい
は1000)といつた一定値になるように、継続時間
を正規化する。これは、全サンプル値200(あるい
は1000)と継続時間との比率をそれぞれの継続時
間に掛け合わせると良い。 以上のプロセスで、入力された音声メツセージ
に対する音声パターンが、作成できる。 この音声パターンは、登録モードでは、標準パ
ターン記憶部10に登録される。認識モードで
は、相関計算部12で、標準パターンと照合する
が、まず予備選択部11で一次識別して、照合対
象を限定しておく。予備選択部11は、無声音
UVの個数、有声音Vの個数、やや長い無音の区
間(例えば破音の前など)を示すポーズPの個数
や、記号の数、継続時間の合計等で照合対象を限
定する。相関計算部12は、第1表に示したよう
な相関テーブル13で、入力パターンと標準パタ
ーンとの対応を、相関が最も大きくなるように
(距離が最も近くなるように)DPマツチング法に
よつて動的に照合する。
〔発明の目的〕
本発明は上述のような点に鑑みて為されたもの
であり、同一の単語に対する音声パターンの声の
出し方による差を小さくすると共に、音声のパワ
ーが小さい場合でも記号化をより確実に行なえる
ようにし、また子音や無声音の後に続く母音の記
号化を確実に行ない得るようにした音声メツセー
ジ識別方式を提供することを目的とするものであ
る。 〔発明の開示〕 第8図は本発明の一実施例のブロツク図であ
る。同図において、音響分析部Aと単語識別部B
とについては、第1図に示す従来例と同一の構成
であり、パターン変換部Cの構成が異なつてい
る。まず第8図において、16は微分ベクトル変
換部であり、差信号ベクトル変換部5から出力さ
れる差信号成分の微分信号を算出するものであ
る。17は差信号強調部であり、微分ベクトル変
換部5によつて算出された微分信号を元の差信号
に加算して差信号の立上り、立下りのエツジを強
調するものである。18はオフセツト計算部であ
り、微分ベクトル変換部16から出力される微分
信号の正負の符号とその絶対値とに応じたオフセ
ツト値を算出するものである。さらに19はオフ
セツト補償部であり、オフセツト計算部18によ
つて計算されたオフセツト値を元の差信号に加算
するものである。このオフセツト補償部19とオ
フセツト計算部18とによりオフセツト処理部D
を構成している。第9図の回路図は、差信号ベク
トル変換部5と、微分ベクトル変換部16と、差
信号強調部17との機能を実現する具体回路の構
成を示している。同図の回路の動作を説明する
と、まず現時点の差信号がレジスタtoに記憶さ
れ、一つ前の差信号がレジスタto-1に記憶され、
このレジスタtoとレジスタto-1の差動平均(差の
変動の短時間平均パワー)を微分ベクトル成分と
して形成し、この微分ベクトル成分とレジスタ
to-1あるいは、レジスタtoの内容との和の短時間
平均パワーを強調差信号ベクトル成分とする方式
である。 微分ベクトル変換部16の出力は、オフセツト
計算部18に入力されて、オフセツト値を計算さ
れる。このオフセツト値は上述のようにオフセツ
ト補償部19にて元の差信号に加算されるもので
あるが、等価的には記号ベクトル変換部7におけ
る行列計算式を次式のように変更することによつ
てオフセツト補償を行なうことができる。ただ
し、次式において、Of1,Of2,Of3,Of4はオフ
セツト値を示している。 第10図および第11図は、それぞれ第6図お
よび第7図の差信号波形の微分波形を示してお
り、この図では、微分波形そのものの短時間平均
パワーを積分計算する前の形を示している。第1
2図および第13図は、差信号強調部17の出力
である強調差信号ベクトルの波形と、記号化パタ
ーンとを示したもので、第8図のオフセツト補償
部19が無い場合の記号化パターンを示してい
る。 第6図および第7図の波形図と、第12図およ
び第13図の波形図とを比較すると、第12図お
よび第13図の強調差信号ベクトルの波形の立上
り、立下りのエツジが強調され、オーバーシユー
トしており、さらに波形の凹凸が明確になつてい
ることがわかる。 ところで日本語の音節は、子音(Consonant)
と母音(Vowel)との結合よりなるCV音節(子
音+母音)が多く、口を閉じた状態から開く状態
へ向かうときに、音節として認識されるので、特
に、図示の差信号の立上がり時にエツジを強調し
て、重みをつけることが有効と思われ、微分ベク
トル成分がこの重みづけになつている。 第14図および第15図と、第16図および第
17図とは、相異なる男性の被験者2名について
音声メツセージ「動作開始」を発声させた場合の
強調差信号の波形と、その記号化パターンとを示
している。この測定例においては、強調差信号ベ
クトルの短時間平均化の時定数を第13図の場合
よりも長く設定してある。第15図および第17
図におけるV1、V2、V3、V4などは有声音の区
間を示しており、例えばV1の区間では、Vl
Vn、Vp、Va、Vp、Vnの各有音声の記号化パタ
ーンが得られたことを示している。また記号Fは
無声音UVのうち摩擦音(Friction Sound)が得
られたことを示している。この測定例において
は、「dousa」の「s」と、「Kaisi」の「s」と
がそれぞれ無声摩擦音Fとして検出されている。
さらに記号Pは、無声破裂音「K」の前の休止期
間(ポーズ)を意味している。この第15図およ
び第17図の記号化パターンを見れば、“dousa
Kaisi”の母音系列o、(u)、a、a、i、iが
話者によらず検出されていることがわかる。 第18図乃至第21図は相異なる女性2名と相
異なる男性2名の被験者について、、日本語の5
母音「イエアオウ」を発声させた場合の強調差信
号の波形と、その記号化パターンとを示してい
る。上記各図を見れば、5母音「イエアオウ」の
記号化が話者によらず一様に行なわれていること
が把握できる。 以上のように微分波形成分による差信号強調を
施すことによつて、差信号の立上り、立下りのエ
ツジを強調することができ、子音の後に続く母音
の記号化を話者によらず良好に行ない得るもので
ある。ところで、第8図のオフセツト処理部D
は、ダイナミツク(動的)なオフセツト補償を行
なうもで、オフセツト計算部18で、微分ベクト
ル成分が正の場合には、正のオフセツトをオフセ
ツト補償部19で強調差信号ベクトル(または、
差信号ベクトル)に加えることによつてオフセツ
ト補償された差信号ベクトルを形成し、云わば差
信号の零点が負側にオフセツト分移動したように
動作させ、微分ベクトル成分が負の場合には、負
のオフセツトを強調差信号ベクトルに加えること
によつて元のオフセツト無しの状態にもどすこと
になる。しかし上述のCV音節のように、子音か
ら母音への変化、すなわち顎の開きの狭い状態か
ら広い状態への変化を検出する場合には、母音の
第1ホルマントに対応する差信号ベクトル
(Veap/Viu、Va/Vep)の立上りを強調すること
が有効であると云える。一方、母音の第2ホルマ
ントに対応する差信号ベクトル(Ve/Vp、Vi
Vu)の場合、上述のCV音節では前舌の状態から
後舌の状態への変化を強調したいので、差信号ベ
クトルの微分ベクトル成分が負の場合には負のオ
フセツトを、オフセツト補償部19で強調差信号
ベクトル(又は、差信号ベクトル)に加えて、微
分ベクトル成分が正の場合には正のオフセツトを
強調差信号ベクトル(又は、差信号ベクトル)に
加えてオフセツトを元にもどすことによつて、前
舌、後舌に対応した音声の記号化が確実になると
云える。すなわちオフセツト補償部19は、式
のオフセツト値O1〜Of4を、強調差信号ベクトル
(又は、差信号ベクトル)に与えることになる。
そしてこの場合には、オフセツト補償の差信号ベ
クトルが、音声記号に対して、正しく正負、ある
いはHigh/Lowに分かれることによつて記号化処
理を、第22図のように逐次判別(分岐限定)し
てゆくことにより、式のような線型変換演算を
行なうよりも簡単かつ高速に記号化を行なうこと
が可能になり、より簡易な音声入力装置に応用で
きるものである。第22図のような逐次判別処理
は、上述の記号ベクトル変換部7と最大値判定部
8aとの機能を簡単に実現するものであり、マイ
クロコンピユータの逐次判別処理プログラムによ
つて実現することができる。同図のフローチヤー
トにあつては、まず第1段階としてVeap/Viu
信号が高レベルHであるか、中レベルMである
か、低レベルLであるかによつて、3グループに
分けている。そして、第2段階では、まず第1段
階がHのときは、Va/Veo差信号がHならば、
記号aを出力し、Mならば記号hを出力し、Lな
らば第3段階に移り、Ve/Vp差信号を調べて、
Hならばeを出力し、Mならばwを出力し、Lな
らばoを出力する。一方、第1段階がMの場合、
第2段階では、Ve/Vp差信号がHならばfを出
力し、Mならばmを出力し、Lならばbを出力す
る。さらに第1段階がLの場合、第2段階では
Vi/Vu差信号がHならばiを出力し、Mならば
lを出力し、Lならばuを出力する。 〔発明の効果〕 本発明は叙上のように構成されており、音声入
力の高周波成分および低周波成分の短時間平均パ
ワーをそれぞれ取り出す一対のフイルタの差信号
出力を入力とし、有声音と無声音と無音とを判別
する比較手段と、音声入力から相異なる周波数領
域の短時間平均パワーを取り出す複数組のフイル
タ対の各差信号出力の大小関係に応じて日本語の
5母音と、その他の有声音との各符号のうちいず
れか1つの符号を割り当てる有声音分析手段を設
けて、比較手段の出力のうち、有声音の符号を上
記有声音分析手段から出力される符号に置換し
て、無音、無声音、および5母音とその他の有声
音の符号の時系列からなる入力パターンを形成
し、複数種の音声メツセージを標準的に発声した
ときに形成される各入力パターンを標準パターン
として予め登録し、パターンに最も近似する標準
パターンを入力メツセージとして識別する音声メ
ツセージ識別方式において、各フイルタ対の差信
号出力の微分信号を算出する微分ベクトル変換部
と、前記微分信号を元の差信号に加算して差信号
の立上り、立下りのエツジを強調する差信号強調
部とを設けたものであるから、差信号の立上りと
立下りを強調することができ、記号化が確実にな
るという利点があり、特に子音と母音との結合よ
りなる音節の場合には、実施例の説明において述
べたように第1ホルマントに対応する差信号に
は、狭顎状態から広顎状態に変化する際の立上り
時に正の重みを加えることができ、また第2ホル
マントに対応する差信号には、前舌状態から後舌
状態に変化する際の立ち下り時に負の重みを加え
ることができ、話者の相違や話し方の相違があつ
ても記号化を良好に行ない得るという利点があ
る。さらに、併合発明にあつては、各フイルタ対
の差信号出力の微分信号を算出する微分ベクトル
変換部と、前記微分信号の正負の符号とその絶対
値とに応じたオフセツト値を算出するオフセツト
計算部と、前記オフセツト値を元の差信号に加算
するオフセツト補償部とを設けたものであるか
ら、立ち上がつた差信号には正のオフセツト値を
加え、立ち下がつた差信号には負のオフセツト値
を加えることによつて、オフセツト補償後の差信
号ベクトルが、音声信号に対して正しく正負に分
かれることにより、これによつて音声の記号化を
話者の相違や話し方の相違によらずに良好に行な
うことができ、特に子音と母音との結合よりなる
音節の場合には、実施例の説明において述べたよ
うに、第1ホルマントに対応する差信号には、狭
顎状態から広顎状態に移行する際の立上り時に正
のオフセツトを加えて立下がり時には元にもどし
第2ホルマントに対応する差信号には、前舌状態
から後舌状態に移行する際の立下り時に負のオフ
セツトを与えて立上り時には元にもどすことがで
き、したがつて子音の後に続く母音の特徴抽出を
良好に行なうことができるという利点がある。
【図面の簡単な説明】
第1図は従来例のブロツク図、第2図は同上に
用いる音響分析部の構成を示すブロツク図、第3
図a,bは同上に用いるフイルタバンクの特性を
示す図、第4図a,bは同上に用いる差信号ベク
トル変換部の構成を示す概略回路図、第5図は同
上に用いるパターン変換部、第6図および第7図
は同上の動作説明図、第8図は本発明の一実施例
のブロツク図、第9図は同上に用いる差信号強調
処理部の概略回路図、第10図乃至第21図は同
上の動作説明図、第22図は同上に用いる逐次判
別処理を示すフローチヤートである。 3は周波数分析部、5は差信号ベクトル変換
部、7は記号ベクトル変換部、16は微分ベクト
ル変換部、17は差信号強調部、18はオフセツ
ト計算部、19はオフセツト補償部である。

Claims (1)

  1. 【特許請求の範囲】 1 音声入力の高周波成分および低周波成分の短
    時間平均パワーをそれぞれ取り出す一対のフイル
    タの差信号出力を入力とし、高周波成分の方が強
    いときには無声音の符号を、低周波成分の方が強
    いときには有声音の符号を、高周波成分と低周波
    成分とが略同じときには無音の符号を出力する比
    較手段を設け、音声入力から相異なる周波数領域
    の短時間平均パワーを取り出す複数組のフイルタ
    対の各差信号出力の大小関係に応じて日本語の5
    母音と、その他の有声音との各符号のうちいずれ
    か1つの符号を割り当てる有声音分析手段を設け
    て、比較手段の出力のうち、有声音の符号を上記
    有声音分析手段から出力される符号に置換して、
    無音、無声音、および5母音とその他の有声音の
    符号の時系列からなる入力パターンを形成し、複
    数種の音声メツセージを標準的に発声したときに
    形成される各入力パターンを標準パターンとして
    予め登録し、入力パターンに最も近似する標準パ
    ターンを入力メツセージとして識別する音声メツ
    セージ識別方式において、各フイルタ対の差信号
    出力の微分信号を算出する微分ベクトル変換部
    と、前記微分信号を元の差信号に加算して差信号
    の立上り、立下りのエツジを強調する差信号強調
    部とを設けて成ることを特徴とする音声メツセー
    ジ識別方式。 2 音声入力の高周波成分および低周波成分の短
    時間平均パワーをそれぞれ取り出す一対のフイル
    タの差信号出力を入力とし、高周波成分の方が強
    いときには無声音の符号を、低周波成分の方が強
    いときには有声音の符号を、高周波成分と低周波
    成分とが略同じときには無音の符号を出力する比
    較手段を設け、音声入力から相異なる周波数領域
    に短時間平均パワーを取り出す複数組のフイルタ
    対の各差信号出力の大小関係に応じて日本語の5
    母音と、その他の有声音との各符号のうちいずれ
    か1つの符号を割り当てる有声音分析手段を設け
    て、比較手段の出力のうち、有声音の符号を上記
    有声音分析手段から出力される符号に置換して、
    無音、無声音、および5母音とその他の有声音の
    符号の時系列からなる入力パターンを形成し、複
    数種の音声メツセージを標準的に発声したときに
    形成される各入力パターンを標準パターンとして
    予め登録し、入力パターンに最も近似する標準パ
    ターンを入力メツセージとして識別する音声メツ
    セージ識別方式において、各フイルタ対の差信号
    出力の微分信号を算出する微分ベクトル変換部
    と、前記微分信号の正負の符号とその絶対値とに
    応じたオフセツト値を算出するオフセツト計算部
    と、前記オフセツト値を元の差信号に加算するオ
    フセツト補償部とを設けて成ることを特徴とする
    音声メツセージ識別方式。
JP13964283A 1983-07-30 1983-07-30 音声メツセ−ジ識別方式 Granted JPS6031195A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13964283A JPS6031195A (ja) 1983-07-30 1983-07-30 音声メツセ−ジ識別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13964283A JPS6031195A (ja) 1983-07-30 1983-07-30 音声メツセ−ジ識別方式

Publications (2)

Publication Number Publication Date
JPS6031195A JPS6031195A (ja) 1985-02-16
JPH02717B2 true JPH02717B2 (ja) 1990-01-09

Family

ID=15250029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13964283A Granted JPS6031195A (ja) 1983-07-30 1983-07-30 音声メツセ−ジ識別方式

Country Status (1)

Country Link
JP (1) JPS6031195A (ja)

Also Published As

Publication number Publication date
JPS6031195A (ja) 1985-02-16

Similar Documents

Publication Publication Date Title
EP0219109B1 (en) Method of analyzing input speech and speech analysis apparatus therefor
JPS6147440B2 (ja)
JPS6247320B2 (ja)
JP2001166789A (ja) 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置
WO1990011593A1 (en) Method and apparatus for speech analysis
Hasija et al. Recognition of children Punjabi speech using tonal non-tonal classifier
JP3354252B2 (ja) 音声認識装置
JPH0229232B2 (ja)
JPH02717B2 (ja)
JPS5972500A (ja) 音声認識方式
JPS6331798B2 (ja)
JP3921416B2 (ja) 音声合成装置及び音声明瞭化方法
JPH02720B2 (ja)
JPS6245560B2 (ja)
JPS60250399A (ja) 音声メツセ−ジ識別方式
JPH10333695A (ja) 音声変換装置
JPH0230520B2 (ja) Onseimetsuseejishikibetsuhoshiki
JPH0251520B2 (ja)
JPS60250398A (ja) 音声メツセ−ジ識別方式
JP4882152B2 (ja) 話速検出方法および音声信号処理装置
JPS60241099A (ja) 音声メツセ−ジ識別方式
JPH0124320B2 (ja)
Sullivan et al. Multi‐microphone cross‐correlation based processing for robust speech recognition
Obara et al. Speaker‐independent speech recognition using an auditory model front end incorporating the spectro‐temporal masking effect
Zakarauskas et al. Multiple speaker localization using envelope time delays