JPS6031195A - 音声メツセ−ジ識別方式 - Google Patents
音声メツセ−ジ識別方式Info
- Publication number
- JPS6031195A JPS6031195A JP13964283A JP13964283A JPS6031195A JP S6031195 A JPS6031195 A JP S6031195A JP 13964283 A JP13964283 A JP 13964283A JP 13964283 A JP13964283 A JP 13964283A JP S6031195 A JPS6031195 A JP S6031195A
- Authority
- JP
- Japan
- Prior art keywords
- difference signal
- input
- frequency component
- voiced
- codes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims description 56
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 9
- 230000000630 rising effect Effects 0.000 claims description 7
- 235000014121 butter Nutrition 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔技術分野〕
本発明は電子機器を音声メツセージによって操作するた
めの音声メ・リセージ識別方式に関するものである。
めの音声メ・リセージ識別方式に関するものである。
従来、帯域フィルタによって抽出した音声の同波数分析
によるスペクトルパターンを変換行列等によって変換し
、音声の特徴パターンを記号ないしはノ〜ラメータによ
って抽出し、このパターンで音声を識別する方式におい
て、簡単化、ローコスト化のために、音声の有声音、無
声音の差異、および、ホルマシト軌跡に対応するマクロ
的な特徴パターンを形成し、音声メツセージを識別する
方式を検討した。
によるスペクトルパターンを変換行列等によって変換し
、音声の特徴パターンを記号ないしはノ〜ラメータによ
って抽出し、このパターンで音声を識別する方式におい
て、簡単化、ローコスト化のために、音声の有声音、無
声音の差異、および、ホルマシト軌跡に対応するマクロ
的な特徴パターンを形成し、音声メツセージを識別する
方式を検討した。
第1図は本発明に関連する先願(特願昭58−6726
1号)の構成を示すブロック図である。
1号)の構成を示すブロック図である。
同図の音声メツセージ識別装置は、音響分析部A、パタ
ーン変換部B、単語識別部Cに大別できる音響分析部へ
け、マイク+1) Vcて検出した音声の増幅、同波数
成分の高域強胴(等価回路)、直流分除去を行なう前置
調整アシづ(2)の出力を周波数分析部(8)で、周波
数スペクトル成分に展開し、対数変換部(4)で、同波
数スペクトルのパターンを対数尺度に変換する。第2図
に従来例の音響分析部への実施例を示した。第2図では
、音声の同波数分析を6個のフィルタバンク(7%UV
、VL。
ーン変換部B、単語識別部Cに大別できる音響分析部へ
け、マイク+1) Vcて検出した音声の増幅、同波数
成分の高域強胴(等価回路)、直流分除去を行なう前置
調整アシづ(2)の出力を周波数分析部(8)で、周波
数スペクトル成分に展開し、対数変換部(4)で、同波
数スペクトルのパターンを対数尺度に変換する。第2図
に従来例の音響分析部への実施例を示した。第2図では
、音声の同波数分析を6個のフィルタバンク(7%UV
、VL。
VH,VB、VF)で行なった。ここで、各フィルタバ
ンクの周波数帯域について説明すると、■は有声音(ト
)のJ3ワーの集中する帯域(およそ0〜IKHz)、
UVは無声音(UV)のパワーノ集中する帯域(およそ
5〜10KHz)、VLけ狭顎音(VL)の第一ホシマ
シトの集中する帯域(およそ0〜0.4 K Hz )
、VHけ広顎音(VH) O第一* L ?シトの集中
する帯域(およそ0.4〜0.8 KHz )、VBH
後舌音(VB)の第二ホルマシトの集中する帯域(およ
そ0.8〜1.8KHz)、VFけ前舌音(VF)の第
二ホn、マシトの集中する帯域(およそ1゜8〜3.2
K Hz )をそれぞれ抽出するものである。
ンクの周波数帯域について説明すると、■は有声音(ト
)のJ3ワーの集中する帯域(およそ0〜IKHz)、
UVは無声音(UV)のパワーノ集中する帯域(およそ
5〜10KHz)、VLけ狭顎音(VL)の第一ホシマ
シトの集中する帯域(およそ0〜0.4 K Hz )
、VHけ広顎音(VH) O第一* L ?シトの集中
する帯域(およそ0.4〜0.8 KHz )、VBH
後舌音(VB)の第二ホルマシトの集中する帯域(およ
そ0.8〜1.8KHz)、VFけ前舌音(VF)の第
二ホn、マシトの集中する帯域(およそ1゜8〜3.2
K Hz )をそれぞれ抽出するものである。
第3図(a) (b) H1各”)(FL+タバ:、り
vl、、VH%VB、VFの周波数特性を示しており、
同図(a)は横軸の同波数を均等目盛として描いてあり
、同図(b)は横軸の周波数を対数目盛として描いであ
る。)な・お第3図において、APIi後述する調整ア
シづ(2b)の特性を示している。
vl、、VH%VB、VFの周波数特性を示しており、
同図(a)は横軸の同波数を均等目盛として描いてあり
、同図(b)は横軸の周波数を対数目盛として描いであ
る。)な・お第3図において、APIi後述する調整ア
シづ(2b)の特性を示している。
前置調整ア−7j 121は、第2図のブロック図に示
すように、マイク+11にて検出した音声信号の増幅を
行なうつりアシづ(2a)と、このプリアシづ(2a)
の出力に接続され、ゲイ−Jおよびオフセット値の調整
を行なう調整アシづ(2b)と、レベル調整器(2c)
とを有している。レベル調整器(脚では、フィルタバシ
クV、、UVK供給する信号のパワーと他のつイ1しタ
バシクに供給する信号のバリーとりバラシスをとってい
る。次に、V/UVバランス調整器(3a)ではフィル
タバンクVの入力とフィルタバンクUの入力とのバラン
スをとる。他のフィルタバンクについては、VB/VL
バラシス調整器(3b)を中点に調整し、VH/VLバ
ランス調整器(3C)で、フィルタバンクVHとフィル
タバンクVLの入力バランスをとり、VF/VBバラン
ス調整!(3d)でフィルタバンクVFとフィルタバン
クvBのバラシスをとる。さらにVB/VLバランス調
整器(3b)で、フィルタバンクVBとフィルタバンク
V HまたけVLのバうシスをとる。
すように、マイク+11にて検出した音声信号の増幅を
行なうつりアシづ(2a)と、このプリアシづ(2a)
の出力に接続され、ゲイ−Jおよびオフセット値の調整
を行なう調整アシづ(2b)と、レベル調整器(2c)
とを有している。レベル調整器(脚では、フィルタバシ
クV、、UVK供給する信号のパワーと他のつイ1しタ
バシクに供給する信号のバリーとりバラシスをとってい
る。次に、V/UVバランス調整器(3a)ではフィル
タバンクVの入力とフィルタバンクUの入力とのバラン
スをとる。他のフィルタバンクについては、VB/VL
バラシス調整器(3b)を中点に調整し、VH/VLバ
ランス調整器(3C)で、フィルタバンクVHとフィル
タバンクVLの入力バランスをとり、VF/VBバラン
ス調整!(3d)でフィルタバンクVFとフィルタバン
クvBのバラシスをとる。さらにVB/VLバランス調
整器(3b)で、フィルタバンクVBとフィルタバンク
V HまたけVLのバうシスをとる。
各フィルタバンクの出力はマシ予づレクサ(3e)にて
時分割的に順次切り換えられて、対数変換部(4)に入
力される。対数変換部(4)では、入力J\クワ一対数
スケールに変換する。対数変換器(4)の出力はA/D
コンバータ(4m)に入力されて、8ヒ奉リドの2進数
にデジタル化される。なお各フィルタをディジタルフイ
船夕で構成する場合には、A/DコシバータC4a)V
i、關整アシづ(2b)の次段に来るものである。
時分割的に順次切り換えられて、対数変換部(4)に入
力される。対数変換部(4)では、入力J\クワ一対数
スケールに変換する。対数変換器(4)の出力はA/D
コンバータ(4m)に入力されて、8ヒ奉リドの2進数
にデジタル化される。なお各フィルタをディジタルフイ
船夕で構成する場合には、A/DコシバータC4a)V
i、關整アシづ(2b)の次段に来るものである。
A/Dコシバータ(4a)の出力は、バターシ変換部B
の差信号ベクトル変換部(5)に入力されて、各フィル
タバンク出力の差信号よりなる差信号ベクトルが抽出さ
れる。第4図は差信号ベクトル変換部(5)の構成例を
示している。同図(a)に示すように、差信号ベクトル
は、2つのフィルタ出力の差をとって、平均化(積分)
したものである。すなわちl Om5ecの寸−Jつり
:7り同期で、フィルタバンク出力をA/Dコシバータ
(4a)によってディジタル化した場合に、1寸シづル
前の差信号に係数器(5a)にて係数αを掛けたものと
、現サンつルの差信号との和をレジスタ(5b)に記憶
したものが、現サンプルの差信号ベクトル成分となる。
の差信号ベクトル変換部(5)に入力されて、各フィル
タバンク出力の差信号よりなる差信号ベクトルが抽出さ
れる。第4図は差信号ベクトル変換部(5)の構成例を
示している。同図(a)に示すように、差信号ベクトル
は、2つのフィルタ出力の差をとって、平均化(積分)
したものである。すなわちl Om5ecの寸−Jつり
:7り同期で、フィルタバンク出力をA/Dコシバータ
(4a)によってディジタル化した場合に、1寸シづル
前の差信号に係数器(5a)にて係数αを掛けたものと
、現サンつルの差信号との和をレジスタ(5b)に記憶
したものが、現サンプルの差信号ベクトル成分となる。
係数αは、およそ0.6〜0.8である。差信号ベクト
ル変換811(51を第4図(b)に示したように簡略
化して図示し、前記先願におけるバターシ変換部Bの実
施例を示したものが第5図である。
ル変換811(51を第4図(b)に示したように簡略
化して図示し、前記先願におけるバターシ変換部Bの実
施例を示したものが第5図である。
第5図に示すように、差信号ベクトル変換部(5)でV
iU V / V差信号、Veao/Viu差43号、
Va/VeO差イa号、Ve/Vo差信号、およびVi
/V11差信号の合計5成分の差信号ベクトルが抽出さ
れる。
iU V / V差信号、Veao/Viu差43号、
Va/VeO差イa号、Ve/Vo差信号、およびVi
/V11差信号の合計5成分の差信号ベクトルが抽出さ
れる。
まず、口V/V差侶号は、有声音と無声音の識別に用い
られるものであり、フィルタバンクUVとフィルタバン
クVとの出力の差信号である。次に、Veao/ Vi
u差信号は母音のe、 a、0とi、 uとを識別する
ために用いられるものであり、フィルタバンクV Hと
フィルタバンクVLとの出力の差信号である。またVa
/Veo差信号は、母音のaとe、oとを識別するため
に用いられるものであり、フィルタバンクVBとフィル
タバンクvLとの出力の差信号である。Ve/Vo 差
信号は、母音のeと0とを識別するために用いられるも
のであり、フィルタバンクVFとフィルタバンクvBと
の出力の差信号である。さらに、Vi/Vu差信号は、
母音のiとUとを識別するために用いられるものであり
、フィルタバンクVFとフイ1しタバシクVHとの出力
の差信号である。各差信号のうち、Veao / Vi
u差信号とva/Veo差信号は母音の第1ホルマシト
の特徴を抽出しているものであり、また、Ve / V
o差信号とVi/Vu差信号は母音の第2ホルマシトの
特徴を・抽出しているものである上述のようにして作成
されたUV/V差信号は、V、OV%S判定部:18)
に入力されて、有声音(ト)の区間と、無声音(UV)
の区間、および無音(S)の区間の判定に用いられる。
られるものであり、フィルタバンクUVとフィルタバン
クVとの出力の差信号である。次に、Veao/ Vi
u差信号は母音のe、 a、0とi、 uとを識別する
ために用いられるものであり、フィルタバンクV Hと
フィルタバンクVLとの出力の差信号である。またVa
/Veo差信号は、母音のaとe、oとを識別するため
に用いられるものであり、フィルタバンクVBとフィル
タバンクvLとの出力の差信号である。Ve/Vo 差
信号は、母音のeと0とを識別するために用いられるも
のであり、フィルタバンクVFとフィルタバンクvBと
の出力の差信号である。さらに、Vi/Vu差信号は、
母音のiとUとを識別するために用いられるものであり
、フィルタバンクVFとフイ1しタバシクVHとの出力
の差信号である。各差信号のうち、Veao / Vi
u差信号とva/Veo差信号は母音の第1ホルマシト
の特徴を抽出しているものであり、また、Ve / V
o差信号とVi/Vu差信号は母音の第2ホルマシトの
特徴を・抽出しているものである上述のようにして作成
されたUV/V差信号は、V、OV%S判定部:18)
に入力されて、有声音(ト)の区間と、無声音(UV)
の区間、および無音(S)の区間の判定に用いられる。
V、UV、5判定部α81#i、UV/V差信号を所定
の基準値Rv、1u(Rv<0<Ru)と比較して、U
V/V差信号が基準値RVよりも小さい場合には有声音
(ト)と判定し、!1.m値Ruよりも大きい場合には
無声音(U)と判定し、基準値RuとRvとの間であれ
ば無音(S)と判定する。始端終端検知部(6)は、音
声久方が有声音間または無声音(財)と判断された場合
には、音声区間であると判断し、音声入力が無音(S)
と判断された場合には、無音区間であると判断される次
にフィルタバンクVF%VB、VH1VLの出力の差信
号ベクトルは、記号ベクトル変換部(7)に入力される
。記号ベクトル変換部は、各差信号Veao/ Viu
、 ValVeO%Ve / VO% Vi / Vu
を成分とすゐ4次元の差信号ペクト1I7Vc1変換行
列(T m )を乗算して、音声久方中に含まれる各母
音t、a、a、O,uの短時間平均パr) −Vl、V
e・Va、VO・Vu、並びに広顎有声音、狭顎有声音
、前古有声音、復古有声音、母音aと0の中間的な有声
音の各短時間平均パワーvh、V7.Vf、Vl)、v
wを算出するものである。記号ベクトル変換部(7)に
おける変換行列〔Tm〕の成分の一例を示せば、次式の
ようになる。
の基準値Rv、1u(Rv<0<Ru)と比較して、U
V/V差信号が基準値RVよりも小さい場合には有声音
(ト)と判定し、!1.m値Ruよりも大きい場合には
無声音(U)と判定し、基準値RuとRvとの間であれ
ば無音(S)と判定する。始端終端検知部(6)は、音
声久方が有声音間または無声音(財)と判断された場合
には、音声区間であると判断し、音声入力が無音(S)
と判断された場合には、無音区間であると判断される次
にフィルタバンクVF%VB、VH1VLの出力の差信
号ベクトルは、記号ベクトル変換部(7)に入力される
。記号ベクトル変換部は、各差信号Veao/ Viu
、 ValVeO%Ve / VO% Vi / Vu
を成分とすゐ4次元の差信号ペクト1I7Vc1変換行
列(T m )を乗算して、音声久方中に含まれる各母
音t、a、a、O,uの短時間平均パr) −Vl、V
e・Va、VO・Vu、並びに広顎有声音、狭顎有声音
、前古有声音、復古有声音、母音aと0の中間的な有声
音の各短時間平均パワーvh、V7.Vf、Vl)、v
wを算出するものである。記号ベクトル変換部(7)に
おける変換行列〔Tm〕の成分の一例を示せば、次式の
ようになる。
しかして記号ベクトル変換部(7)の出力は最大値判定
部(8a)K入力されて、各成分vl 、”e s v
asVo、 Vu、 Vh、 Vz、 Vf、 vb、
vW (Dうち最大の成分がどれであるかを判定される
。記号出力部(8b)は、V、UV、S判定部−におい
て、音声入力が無音または無声音と判定された場合には
、それぞれS、UVの記号を出力する。また、V、UV
lS判定部1I81において、音声入力が有声音と判定
された場合VC¥1、記号出力部(8b)は最大値判定
部(8a)において最大の成分と判定された有声音の記
号を出力する。ただし、各有声音Vi、Ve、Va、v
O−vu % Vf % vb % Vh s Vl
s Vw17) ウち、最大の成分が所定の基準値に達
しないような場合には、上記各有声音のいずれにも該当
しない有声音Vm I7)記号を出力する。したがって
、記号出力I!(1(8b)カラH1S、UV、Vi、
ve、va、vo、Vu、 Vll、 Vt、 Vf、
Vb%VW% Vmの13種類の記号のうちいずれか
1つが出力されることになる。
部(8a)K入力されて、各成分vl 、”e s v
asVo、 Vu、 Vh、 Vz、 Vf、 vb、
vW (Dうち最大の成分がどれであるかを判定される
。記号出力部(8b)は、V、UV、S判定部−におい
て、音声入力が無音または無声音と判定された場合には
、それぞれS、UVの記号を出力する。また、V、UV
lS判定部1I81において、音声入力が有声音と判定
された場合VC¥1、記号出力部(8b)は最大値判定
部(8a)において最大の成分と判定された有声音の記
号を出力する。ただし、各有声音Vi、Ve、Va、v
O−vu % Vf % vb % Vh s Vl
s Vw17) ウち、最大の成分が所定の基準値に達
しないような場合には、上記各有声音のいずれにも該当
しない有声音Vm I7)記号を出力する。したがって
、記号出力I!(1(8b)カラH1S、UV、Vi、
ve、va、vo、Vu、 Vll、 Vt、 Vf、
Vb%VW% Vmの13種類の記号のうちいずれか
1つが出力されることになる。
記号出力部(8b)から出力される各記号の時系列は、
整形処理部(9a)に入力されて、整形処理される。す
なわち、整形処理部(9a)では、同じ記号の繰返しを
一つの記号とその継続時間とのリストに直し、さらに継
続時間が、ある設定値より少ないものは、前後の記号が
同じ場合には、これらを一つのリストにし、前後の記号
が異なる場合には、前の記号に含めるようにして、継続
時間の短いものけ省略する。
整形処理部(9a)に入力されて、整形処理される。す
なわち、整形処理部(9a)では、同じ記号の繰返しを
一つの記号とその継続時間とのリストに直し、さらに継
続時間が、ある設定値より少ないものは、前後の記号が
同じ場合には、これらを一つのリストにし、前後の記号
が異なる場合には、前の記号に含めるようにして、継続
時間の短いものけ省略する。
整形処理部(9a)の出力は、時間軸線゛型正規化処理
部(9b)VC入力される。時間軸線型正規化処理部(
9b)は、各リストの継続時間の合計が200(あるい
は1000)といった一定値になるように、継続時間を
正規化する。これは、全リフづル値200(あるいは1
000)と継続時間との比率をそり。
部(9b)VC入力される。時間軸線型正規化処理部(
9b)は、各リストの継続時間の合計が200(あるい
は1000)といった一定値になるように、継続時間を
正規化する。これは、全リフづル値200(あるいは1
000)と継続時間との比率をそり。
ぞれの継続時間に掛は合わせると良い。
以−ヒのづDセスで、入力された音声メツセージに対す
るぼ声J〜ターシが、作成できる。
るぼ声J〜ターシが、作成できる。
この音声ノsター−Jは、登録上−ドでは、標鴎バター
ニア記憶M UQIに登録される。認識モードでは、相
関計算部1121で、棚趨パターyと照合するが、まず
予備選択バB・II+で一次識別して、照合対象を限定
しておく。予イf1m選択部用は、無声音(UV)の個
数、有声音(V)の個数、やや長い無音の区間(例えば
破裂音の曲など)を示すポーズ(P)の個数や、記号の
改、継続時1−11の合計等で照合対象を限定する。
ニア記憶M UQIに登録される。認識モードでは、相
関計算部1121で、棚趨パターyと照合するが、まず
予備選択バB・II+で一次識別して、照合対象を限定
しておく。予イf1m選択部用は、無声音(UV)の個
数、有声音(V)の個数、やや長い無音の区間(例えば
破裂音の曲など)を示すポーズ(P)の個数や、記号の
改、継続時1−11の合計等で照合対象を限定する。
相関計算)Wζ・1りは、第1表に示したような相関テ
ープToi131で、入カバターンと棟部パターンとの
対応を、相関か最も大きくなるように(距離が最も近く
なるように)DPマツチ:7ジ法によって動的に照合す
る。
ープToi131で、入カバターンと棟部パターンとの
対応を、相関か最も大きくなるように(距離が最も近く
なるように)DPマツチ:7ジ法によって動的に照合す
る。
第1表において、横の欄および縦の欄はそれぞ7″I標
準パターンの符号および入力パターンの符号に対応して
おり、例第2ば標準パターンの符号がaであって、しか
も入カバターンの符号もaであるときには、相関チーづ
ル崗の出力け2となり、近似度が高いことを示すもので
ある。また標準パターンの符8−かUVであり、入力パ
ターンの符号がaであるときには、相関チーづル霞の出
力#i−2となり、近似度が低いことを示すものである
。したがって相関計算部ll2)においては、相関テー
ブル(1講からの出力を順次加算するだけの演算操作に
より、入力パターンと標準パターンとのパターン全体と
しての近似度を容易に計算することができるものである
。
準パターンの符号および入力パターンの符号に対応して
おり、例第2ば標準パターンの符号がaであって、しか
も入カバターンの符号もaであるときには、相関チーづ
ル崗の出力け2となり、近似度が高いことを示すもので
ある。また標準パターンの符8−かUVであり、入力パ
ターンの符号がaであるときには、相関チーづル霞の出
力#i−2となり、近似度が低いことを示すものである
。したがって相関計算部ll2)においては、相関テー
ブル(1講からの出力を順次加算するだけの演算操作に
より、入力パターンと標準パターンとのパターン全体と
しての近似度を容易に計算することができるものである
。
有意差検定部(141は、相関の最も近い〕〜ターンが
ある設定値より近く、さらに2番目に近いものより、あ
る設定値以上離れている場合に、この最も近いパターン
と入力パターシが同じとみなし、他の場合には認識不良
としてリジェクトする。認識結果は識別結果出力部06
)より出力する。
ある設定値より近く、さらに2番目に近いものより、あ
る設定値以上離れている場合に、この最も近いパターン
と入力パターシが同じとみなし、他の場合には認識不良
としてリジェクトする。認識結果は識別結果出力部06
)より出力する。
第6図および第7図は、上述したような先順の装置にお
ける各差信号波形と、この差信号波形を記号化した音声
パターンとを示したものである。
ける各差信号波形と、この差信号波形を記号化した音声
パターンとを示したものである。
同図において、SYMは記号化パターンを示しており、
また差信号波形はUV/V差信号をU/V、Veao/
Viu差信号をa / i 、 Va/Veo差信号を
a / e、 Ve/ V□差信号をe / o 、
Vl / Vu差信号をi / uと略記した。第6図
は、5母音「イエアオウ」を発声した場合の差信号波形
であシ、第7図は「動作開始」を発声した場合の差信号
波形である。しかるにかかる先願の装置にあっては、声
の出し方によっては、差信号の零点のずれが生じるとい
う問題があった。また音声の入力パワーの大きさによっ
て、差信号の振幅も変化するため小さな声の場合の記号
化が困難になるという問題があった。さらにまた、第7
図のような子音や無声音に続く母音の記号化が不確実に
なり、母音系列の異なる単語の音声パターンが同一にな
って識別できなくなるという問題があった。
また差信号波形はUV/V差信号をU/V、Veao/
Viu差信号をa / i 、 Va/Veo差信号を
a / e、 Ve/ V□差信号をe / o 、
Vl / Vu差信号をi / uと略記した。第6図
は、5母音「イエアオウ」を発声した場合の差信号波形
であシ、第7図は「動作開始」を発声した場合の差信号
波形である。しかるにかかる先願の装置にあっては、声
の出し方によっては、差信号の零点のずれが生じるとい
う問題があった。また音声の入力パワーの大きさによっ
て、差信号の振幅も変化するため小さな声の場合の記号
化が困難になるという問題があった。さらにまた、第7
図のような子音や無声音に続く母音の記号化が不確実に
なり、母音系列の異なる単語の音声パターンが同一にな
って識別できなくなるという問題があった。
本発明は上述のような点に鑑みて為されたものであり、
同一の単語に対する音声パターンの声の出し力による差
を小さくすると共に、音声のJ(19−が小さい場合で
も記号化をより確実に行なえるようにし、また子音や無
声音の後に続く母音の記号化を確実に行ない得るように
した音声メツセージ識別方式を提供することを目的とす
るものである。
同一の単語に対する音声パターンの声の出し力による差
を小さくすると共に、音声のJ(19−が小さい場合で
も記号化をより確実に行なえるようにし、また子音や無
声音の後に続く母音の記号化を確実に行ない得るように
した音声メツセージ識別方式を提供することを目的とす
るものである。
第8図は本発明の一実施例のづロック図である。同図に
おいて、音響分析部Aと単語識別部Bとについては、第
1図に示す従来例と同一の構成であり、パターン変換部
Cの構成が異なっている。
おいて、音響分析部Aと単語識別部Bとについては、第
1図に示す従来例と同一の構成であり、パターン変換部
Cの構成が異なっている。
まず@8図において、Hけ微分ベクトル変換部であり、
差信号ベクトル変換部(5)から出力される差信号成分
の微分信号を算出するものである。(lηけ差信号強調
部であり、微分ベクトル変換部([t)によって算出さ
れた微分信号を元の差信号に加算して差信号の立上り、
立下りのエツジを強調するものである。+lはオフセッ
ト計算部嬌であり、微分ベクトル変換部(11から出力
される微分信号の正負の符号とその絶対値とに応じたオ
フセ・シト値を算出するものである。さらにα鴫はオフ
セット補償部であり、オフセット計算部381によって
計算されたオフセット値を元の差信号に加算するもので
ある。
差信号ベクトル変換部(5)から出力される差信号成分
の微分信号を算出するものである。(lηけ差信号強調
部であり、微分ベクトル変換部([t)によって算出さ
れた微分信号を元の差信号に加算して差信号の立上り、
立下りのエツジを強調するものである。+lはオフセッ
ト計算部嬌であり、微分ベクトル変換部(11から出力
される微分信号の正負の符号とその絶対値とに応じたオ
フセ・シト値を算出するものである。さらにα鴫はオフ
セット補償部であり、オフセット計算部381によって
計算されたオフセット値を元の差信号に加算するもので
ある。
このオつtット補償部Hとオフセット計算部jl檜とに
よりオフ七ット処理部りを構成している。第9図の回路
図は、差信号ベクトル変換部(61と、微分ベクトル変
換部(11と、差信号強調部071との機能を実現する
具体回路の構成を示している。同図の回路の動作を説明
すると、まず現時点の差信号がレジスタ(tn”lに記
憶され、一つ前の差信号がしジスク(tn−1)に記憶
され、このレジスタ(tn)とレジスタ(tn−1)の
差動平均c差の変動の短時間平均パワー)を微分ペクト
L成分として形成し、この微分ベクトル成分としジスタ
(tn−1)あるいは、レジスタ(tn)の内容との和
の短時間平均パワーを強調差信号ベクトル成分とする方
式である微分ベクトル変換部tJd!の出力は、オフセ
ット計算部崗に入力されて、オフセット値を計算される
。このオフセット値は上述のようにオフセット処理部(
1鴫にて元の差信号に加算されるものであるが、等価的
VC#″i記号ベクトル変換部+71 Kおける行列計
算式を次式のように変更することによってオフセット補
償を行なうことができる。ただし、次式において、Of
+、Oft、Ofm、Of4 はオフセット値を示して
いる。
よりオフ七ット処理部りを構成している。第9図の回路
図は、差信号ベクトル変換部(61と、微分ベクトル変
換部(11と、差信号強調部071との機能を実現する
具体回路の構成を示している。同図の回路の動作を説明
すると、まず現時点の差信号がレジスタ(tn”lに記
憶され、一つ前の差信号がしジスク(tn−1)に記憶
され、このレジスタ(tn)とレジスタ(tn−1)の
差動平均c差の変動の短時間平均パワー)を微分ペクト
L成分として形成し、この微分ベクトル成分としジスタ
(tn−1)あるいは、レジスタ(tn)の内容との和
の短時間平均パワーを強調差信号ベクトル成分とする方
式である微分ベクトル変換部tJd!の出力は、オフセ
ット計算部崗に入力されて、オフセット値を計算される
。このオフセット値は上述のようにオフセット処理部(
1鴫にて元の差信号に加算されるものであるが、等価的
VC#″i記号ベクトル変換部+71 Kおける行列計
算式を次式のように変更することによってオフセット補
償を行なうことができる。ただし、次式において、Of
+、Oft、Ofm、Of4 はオフセット値を示して
いる。
第10図および第11図は、それぞれ第6図および第7
図の差信号波形の微分波形を示してお如、この図では、
微分波形そのものの短時間平均パワーを積分計算する前
の形を示している。1g12図および第13図は、差信
号強調部aηの出力である強調差信号ベクトルの波形と
、記号化パターンとを示したもので、第8図のオフセッ
ト補償部α(至)が無い場合の記号化パターンを示して
いる。
図の差信号波形の微分波形を示してお如、この図では、
微分波形そのものの短時間平均パワーを積分計算する前
の形を示している。1g12図および第13図は、差信
号強調部aηの出力である強調差信号ベクトルの波形と
、記号化パターンとを示したもので、第8図のオフセッ
ト補償部α(至)が無い場合の記号化パターンを示して
いる。
@6図および第7図の波形図と、第12図および@13
図の波形図とを比較すると、@12図および第13図の
強調差信号ベクトルの波形の立上り、立下りのエツジが
強調され、オーバーシュートしており、さらに波形の凹
凸が明確になっていることがわかる。
図の波形図とを比較すると、@12図および第13図の
強調差信号ベクトルの波形の立上り、立下りのエツジが
強調され、オーバーシュートしており、さらに波形の凹
凸が明確になっていることがわかる。
ところで日本語の音節は、子音(Con5onant
)と母音(Vowe l )との結合よりなるCV音節
(・子音+母音)が多く、口を閉じた状態から囲く状態
へ向かうときに、音節として認識されるので、特に、図
示の差信号の立上がシ時に工I!Jジを強調して、重み
をつけることが有効と思われ、微分ベクトル取分がこの
重みづけになっている。
)と母音(Vowe l )との結合よりなるCV音節
(・子音+母音)が多く、口を閉じた状態から囲く状態
へ向かうときに、音節として認識されるので、特に、図
示の差信号の立上がシ時に工I!Jジを強調して、重み
をつけることが有効と思われ、微分ベクトル取分がこの
重みづけになっている。
@14図および第15図と、第16図および第17図と
は、相異なる男性の被験者2名について音声メ・シセー
ジ「動作開始」を発声させた場合の強調差信号の波形と
、その記号化パターンとを示している。この測定例にお
いては、強調差信号ベクトルの短時間平均化の時定数を
@13図の場合よりも長く設定しである。第15図およ
び第17図におけるVl、V2、v3、v4などは有声
音の区間を示しており、例えばvlの区間では、vt、
■111 s ”Q s VEi 、 vo % Vt
n の各有声音の記号化ssターンが得られ之ことを示
している。また記号Fは無声音UVのうち摩擦f (F
r1ction 5ound )が得られたことを示し
ている。この測定例においては、[dousa Jのr
lsJと、rKaムsiJの「S」とがそれぞれ無声摩
擦音Fとして検出されている。さらに記号PI/′i、
無声破裂音rKJO前の休止期間(ポーズ)を意味して
いる。この第15図および第17図の記号化パターンを
見れば、Idousa Kaisl ’の母音系列o
、(u)、a、a% i、iが話者によらず検出されて
いることがわかる。
は、相異なる男性の被験者2名について音声メ・シセー
ジ「動作開始」を発声させた場合の強調差信号の波形と
、その記号化パターンとを示している。この測定例にお
いては、強調差信号ベクトルの短時間平均化の時定数を
@13図の場合よりも長く設定しである。第15図およ
び第17図におけるVl、V2、v3、v4などは有声
音の区間を示しており、例えばvlの区間では、vt、
■111 s ”Q s VEi 、 vo % Vt
n の各有声音の記号化ssターンが得られ之ことを示
している。また記号Fは無声音UVのうち摩擦f (F
r1ction 5ound )が得られたことを示し
ている。この測定例においては、[dousa Jのr
lsJと、rKaムsiJの「S」とがそれぞれ無声摩
擦音Fとして検出されている。さらに記号PI/′i、
無声破裂音rKJO前の休止期間(ポーズ)を意味して
いる。この第15図および第17図の記号化パターンを
見れば、Idousa Kaisl ’の母音系列o
、(u)、a、a% i、iが話者によらず検出されて
いることがわかる。
@18図乃至第21図は相異なる女性2名と相異なる男
性2名の被験者について、日本語の5母音「イエアオつ
」を発声させた場合の強調差信号の波形と、その記号化
パターンとを示している。
性2名の被験者について、日本語の5母音「イエアオつ
」を発声させた場合の強調差信号の波形と、その記号化
パターンとを示している。
上記各図を見れば、5母音「イエアオつ」の記号化が話
者によらず一様に行なわれていることが把握できる。
者によらず一様に行なわれていることが把握できる。
以上のように微分波形成分による差信号強調を施すこと
によって、差信号の立上り、立下りのエツジを強調する
ことができ、子音の後に続く母音の記号化を話者によら
ず良好に行ない得るものである。ところで、第8図のオ
フセット処理部りけ、ダイナミック(動的)なオフセッ
ト補償を行なうもので、オフセット処理部珀で、微分ベ
クトル成分が正の場合には、正のオフセットをオフセッ
ト補償部(11で強調差信号ベクトル(tたは、差信号
ペクトL)K加えることによってオフt=J)補償され
た差信号ベクトルを形成し、云わば差信号の零点が負l
111Vcオフtラド分移動したように動作させ、微分
ベクトル成分が負の場合には、負のオフセットを強調差
信号ベクトルに加えることによって元のオフセット無し
の状態にもどすことになる。しかして上述のCv音節の
ように、子音から母音への変化、すなわち顎の開きの狭
い状態から広い状態への変化を検出する場合には、母音
の第1ホルマントに対応する差信号ベクトル(Veao
/Viu s Va/ Veo )の立上りを強調する
ことが有効であると云える。一方、母音の第2ホ1しマ
ントに対応する差信号ベクトル(V6/Vo 、 Vi
/Vu )の場合、上述のCv音節では前古の状態から
復古の状態への変化を強調したいので、差信号ベクトル
の微分ベクトル成分が負の場合には負のオフセ・リドを
、オフt・ソト補償部(+功で強調差信号ベクトル(又
は、差信号ベクトル)K加えて、微分ベクトル成分が正
の場合には正のオフセットを強調差信号ベクトル(又は
、差信号ベクトル)に加えてオつtットを元にもどすこ
とによって、前古、復古に対応した音声の記号化が確実
になると云える。
によって、差信号の立上り、立下りのエツジを強調する
ことができ、子音の後に続く母音の記号化を話者によら
ず良好に行ない得るものである。ところで、第8図のオ
フセット処理部りけ、ダイナミック(動的)なオフセッ
ト補償を行なうもので、オフセット処理部珀で、微分ベ
クトル成分が正の場合には、正のオフセットをオフセッ
ト補償部(11で強調差信号ベクトル(tたは、差信号
ペクトL)K加えることによってオフt=J)補償され
た差信号ベクトルを形成し、云わば差信号の零点が負l
111Vcオフtラド分移動したように動作させ、微分
ベクトル成分が負の場合には、負のオフセットを強調差
信号ベクトルに加えることによって元のオフセット無し
の状態にもどすことになる。しかして上述のCv音節の
ように、子音から母音への変化、すなわち顎の開きの狭
い状態から広い状態への変化を検出する場合には、母音
の第1ホルマントに対応する差信号ベクトル(Veao
/Viu s Va/ Veo )の立上りを強調する
ことが有効であると云える。一方、母音の第2ホ1しマ
ントに対応する差信号ベクトル(V6/Vo 、 Vi
/Vu )の場合、上述のCv音節では前古の状態から
復古の状態への変化を強調したいので、差信号ベクトル
の微分ベクトル成分が負の場合には負のオフセ・リドを
、オフt・ソト補償部(+功で強調差信号ベクトル(又
は、差信号ベクトル)K加えて、微分ベクトル成分が正
の場合には正のオフセットを強調差信号ベクトル(又は
、差信号ベクトル)に加えてオつtットを元にもどすこ
とによって、前古、復古に対応した音声の記号化が確実
になると云える。
すなわちオフセ・リド補償部α噂は、式■のオフセット
値OfI〜Of4を、強調差信号ベクトル(又は、差信
号ペクトll7)に与えることになる。そしてこの場合
には、オフセット補償の差信号ベクトルが、音声記号に
対して、正しく正負、あるいはHigh/Lowに分か
れることによって記号化処理を、第22図のようlこ逐
次判別(分岐限定)してゆくことにより、式■のような
線型変換演算を行なうよシも簡単かつ高速に記号化を行
なうことが可能になり、より簡易な音声入力装置に応用
できるものである。第22図のような逐次判別処理は、
上述の記号ベクトル変換部(7)と最大値判定部(8a
)との機能を簡単VC実現するものであ如、マイクロコ
シ上ュータの逐次判別処理つロジラムによって実現す、
bことができる。同図の70−チャートにあっては、ま
ず第1段階としてVeao/Vlu差信号が高レベルH
であるか、中レベルMである力為、低しベルLであるか
によって、3クルーづに分けてhる。そして、@2段階
では、まず第1段階がHのときけ、Va/Veo差信号
がHならば、記号aを出力し、Mならば記5+hを出力
し、Lならば@3段階に移り、V6 / VO差信号を
調べて、Hならばeを出力し、MならばWを出力し、L
ならばOを出力する。一方、第1段階がMの場合、@2
段階では、V6 / V() 差信号がHならばfを出
力し、Mならばmを出力し、Lならばbを出力する。さ
らに第1段階がLの場合、第2段階でけVi/Vu差信
号がHならばIを出力し、Mならばtを出力し、Lなら
ばUを出力する。
値OfI〜Of4を、強調差信号ベクトル(又は、差信
号ペクトll7)に与えることになる。そしてこの場合
には、オフセット補償の差信号ベクトルが、音声記号に
対して、正しく正負、あるいはHigh/Lowに分か
れることによって記号化処理を、第22図のようlこ逐
次判別(分岐限定)してゆくことにより、式■のような
線型変換演算を行なうよシも簡単かつ高速に記号化を行
なうことが可能になり、より簡易な音声入力装置に応用
できるものである。第22図のような逐次判別処理は、
上述の記号ベクトル変換部(7)と最大値判定部(8a
)との機能を簡単VC実現するものであ如、マイクロコ
シ上ュータの逐次判別処理つロジラムによって実現す、
bことができる。同図の70−チャートにあっては、ま
ず第1段階としてVeao/Vlu差信号が高レベルH
であるか、中レベルMである力為、低しベルLであるか
によって、3クルーづに分けてhる。そして、@2段階
では、まず第1段階がHのときけ、Va/Veo差信号
がHならば、記号aを出力し、Mならば記5+hを出力
し、Lならば@3段階に移り、V6 / VO差信号を
調べて、Hならばeを出力し、MならばWを出力し、L
ならばOを出力する。一方、第1段階がMの場合、@2
段階では、V6 / V() 差信号がHならばfを出
力し、Mならばmを出力し、Lならばbを出力する。さ
らに第1段階がLの場合、第2段階でけVi/Vu差信
号がHならばIを出力し、Mならばtを出力し、Lなら
ばUを出力する。
本発明は斜上のように構成されており、音声入力の高同
波成分および低置波成分の短時間平均パワーをそれぞれ
取り出す一対のフィルタの差信号出力を入力とし、有声
音と無声音と無音とを判別する比較手段と、音声入力か
ら相異なる周波数領域の短時間平均パワーを取υ出す複
数組のフィルタ対の各差信号出力の大小関係に応じて日
本語の5母音と、その他の有声音との各符号のうちいず
れか1つの符号を割り当てる有声音分析手段を設けて、
比較手段の出力のうち、有声音の符号を上記有声音分析
手段から出力される符号に置換して、無音、無声音、お
よび5母音とその他の有声音の符号の時系列からなる入
力パターンを形成し、複数種の音声メ・リヒージを標準
的に発声したときに形成される各入力パターンを標準パ
ターンとして予め登録し、入カバターンに最も近似する
標準パターンを入力メツセージとして識別する音声メツ
セージ識別方式において、各フィルタ対の差信号出力の
微分信号を算出する微分ベクトル変換部と、前記微分信
号を元の差信号に加算して差信号の立上り、立下りの工
IJ Nを強調する差信号強調部とを設けたものである
から、差信号の立上りと立下りを強調することができ、
記号化が確実になるという利点があり、特に子音と母音
との結合よりなる背筋の場合には、実施例の説明におい
て述べたように第1ホルマシトに対応する差信号には、
狭顎状態から広顎状態に変化する際の立上如時に正の重
みを加えることができ、また@2ホルマシトに対応する
差信号には、舶舌状態から復古状態に変化する際の立ち
下り時に負の重みを加えることができ、話者の相違や話
し方の相違があっても記号化を良好に行ない得るという
利点がある。
波成分および低置波成分の短時間平均パワーをそれぞれ
取り出す一対のフィルタの差信号出力を入力とし、有声
音と無声音と無音とを判別する比較手段と、音声入力か
ら相異なる周波数領域の短時間平均パワーを取υ出す複
数組のフィルタ対の各差信号出力の大小関係に応じて日
本語の5母音と、その他の有声音との各符号のうちいず
れか1つの符号を割り当てる有声音分析手段を設けて、
比較手段の出力のうち、有声音の符号を上記有声音分析
手段から出力される符号に置換して、無音、無声音、お
よび5母音とその他の有声音の符号の時系列からなる入
力パターンを形成し、複数種の音声メ・リヒージを標準
的に発声したときに形成される各入力パターンを標準パ
ターンとして予め登録し、入カバターンに最も近似する
標準パターンを入力メツセージとして識別する音声メツ
セージ識別方式において、各フィルタ対の差信号出力の
微分信号を算出する微分ベクトル変換部と、前記微分信
号を元の差信号に加算して差信号の立上り、立下りの工
IJ Nを強調する差信号強調部とを設けたものである
から、差信号の立上りと立下りを強調することができ、
記号化が確実になるという利点があり、特に子音と母音
との結合よりなる背筋の場合には、実施例の説明におい
て述べたように第1ホルマシトに対応する差信号には、
狭顎状態から広顎状態に変化する際の立上如時に正の重
みを加えることができ、また@2ホルマシトに対応する
差信号には、舶舌状態から復古状態に変化する際の立ち
下り時に負の重みを加えることができ、話者の相違や話
し方の相違があっても記号化を良好に行ない得るという
利点がある。
さらに、併合発明にあっては、各フィルタ対の差信号出
力の微分信号を算出する微分ベクトル変換部と、前記微
分信号の正負の符号とその絶対値とに応じたオフセット
値を算出するオフセット計算部と、前記オフセット値を
元の差信号に加算するオフセット補償部とを設けたもの
であるから、立ち上かつ比差信号に?−1正のオフセッ
ト値を加え、立ち下がった差信号には負のオフセット値
を加えることによって、オフセット補償後の差信号ベク
トルが、音声信号に対して正しく正負に分かれることに
なり、これによって音声の記号化を話者の相違や話し方
の相違によらずに良好に行なうことができ、特に子音と
母音との結合よりなる音節の場合には、実施例の説明に
おいて述べたように、第1ホルマシトに対応する差信8
VC#i、狭顎状態から広顎状態に移行する隔の立上シ
時に正のオフセットを加えて立下がり時には元にもどし
第2ホシマントに対応する差信号には、前古状態が゛ら
復古状態に移行する際の立下り時に負のオフセットを与
えて立」ユリ時には元にもどすことができ、したがって
子音の後に続く母音の特徴抽出を良好に行なうことがで
きるという利点があるう
力の微分信号を算出する微分ベクトル変換部と、前記微
分信号の正負の符号とその絶対値とに応じたオフセット
値を算出するオフセット計算部と、前記オフセット値を
元の差信号に加算するオフセット補償部とを設けたもの
であるから、立ち上かつ比差信号に?−1正のオフセッ
ト値を加え、立ち下がった差信号には負のオフセット値
を加えることによって、オフセット補償後の差信号ベク
トルが、音声信号に対して正しく正負に分かれることに
なり、これによって音声の記号化を話者の相違や話し方
の相違によらずに良好に行なうことができ、特に子音と
母音との結合よりなる音節の場合には、実施例の説明に
おいて述べたように、第1ホルマシトに対応する差信8
VC#i、狭顎状態から広顎状態に移行する隔の立上シ
時に正のオフセットを加えて立下がり時には元にもどし
第2ホシマントに対応する差信号には、前古状態が゛ら
復古状態に移行する際の立下り時に負のオフセットを与
えて立」ユリ時には元にもどすことができ、したがって
子音の後に続く母音の特徴抽出を良好に行なうことがで
きるという利点があるう
第1図は従来例のブロック図、gg2図は同上に用いる
音響分析部の構成を示すブロック図、第3図(a) (
b) #−を同上に用いるフィルタバンクの特性を示す
図、第4図(a) (b) I/′i同上に用いる差信
号ベクトル変換部の構成を示す概略回路図、第5図は同
上に用いるパターン変換部、第6図および@7図は同上
の動作説明図、第8図は本発明の一実施例の1099図
、第9図は同上に用いる差信号強調処理部の概略回路図
、第10図乃至第21図は同上の動作説明図、第22図
は同上に用いる逐次判別処理を示す70−チャートであ
る。 (3)は同波数分析部、(5)は差信号ベクトル変換部
、(7)は記号ベクトル変換部、α匂は微分ベクトル変
換部、(lηは差信号強調部、(181#′iオっtッ
ト計算部、illはオフセット補償部である。 代理人 弁理士 石 1)長 七 1I15IL腔、(Hz) 第4図 (0) (b)
音響分析部の構成を示すブロック図、第3図(a) (
b) #−を同上に用いるフィルタバンクの特性を示す
図、第4図(a) (b) I/′i同上に用いる差信
号ベクトル変換部の構成を示す概略回路図、第5図は同
上に用いるパターン変換部、第6図および@7図は同上
の動作説明図、第8図は本発明の一実施例の1099図
、第9図は同上に用いる差信号強調処理部の概略回路図
、第10図乃至第21図は同上の動作説明図、第22図
は同上に用いる逐次判別処理を示す70−チャートであ
る。 (3)は同波数分析部、(5)は差信号ベクトル変換部
、(7)は記号ベクトル変換部、α匂は微分ベクトル変
換部、(lηは差信号強調部、(181#′iオっtッ
ト計算部、illはオフセット補償部である。 代理人 弁理士 石 1)長 七 1I15IL腔、(Hz) 第4図 (0) (b)
Claims (2)
- (1)音声入力の高目波成分および低周波成分の短時間
平均パワーをそれぞれ取り出す一対のフィルタの差信号
出力を入力とし、高周波成分の方が強いときには無声音
の符号を、低周波成分の方が強いときには有声音の符号
を、高目波成分と低周波成分とが略同じときには無音の
符号を出力する比較手段を設け、音声入力から相異なる
同波数領域の短時間平均パワーを取シ出す複数組のフィ
ルタ対の各差信号出力の大小関係に応じて日本語の5母
音と、その他の有声音との各符号のうちいずれか1つの
符号を割)当てる有声音分析手段を設けて、比較手段の
出力のうち、有声音の符号を上記有声音分析手段から出
力される符号に置換して、無音、無声音、および5母音
とその他の有声音の符号の時系列からなる入力バターシ
を形成し、複数種の音声メツセージを標準的に発声した
ときに形成される各入力バターシを標準式ダーツとして
予め登録し、入力バターーJVc最も近似する標準バタ
ーシを入力メツセージとして識別する音声メツセージ識
別方式において、各フィルタ対の差信号出力の微分信号
を算出する微分ベクトル変換部と、前記微分信号を元の
差信号に加算して差信号の立上り、立下りのエツジを強
調する差信号強調部とを設けて成ることを特徴とする音
声メツセージ識別方式。 - (2)音声入力の高周波成分および低周波成分の短時間
平均パワーをそれぞれ取り出す一対のフィルタの差信号
出力を入力とし、高目波成分の方が強いときには無声音
の符号を、低周波成分の方が強いとき[は有声音の符号
を、高目波成分と低目波成分とが略同じときには無音の
符号を出力する比較手段を設け、音声入力から相異なる
周波数領域の短時間平均パワーを取り出す複数組のフィ
ルタ対の各差信号出力の大小関係に応じて日本語の5母
音と、その他の有声音との各符号のうちいずれか1つの
符号を割り当てる有声音分析手段を設けて、比較手段の
出力のうち、有声音の符号を上記有声音分析手段から出
力される符号に置換して、無音、無声音、および5母音
とその他の有声音の符号の時系列からなる入力式’a−
?/を形成し、複数種の音声メツセージを標準的に発声
したときに形成される各人力J〜ターンを標準式ターン
として予め登鎌し、入カバターンに最も近似する標準パ
ターンを入カメ・!Jt−ジとして識別する音声メツセ
ージ識別方式において、各フィルタ対の差信号出力の微
分信号を算出する微分ベクトシ変換部と、前記微分信号
の正負の符号とその絶対値とに応じたオフセット値を算
出するオフセット計算部と、前記オフセット値を元の差
信号に加算するオフセット補償部とを設けて成ることを
特徴とする音声メツセージ識別方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13964283A JPS6031195A (ja) | 1983-07-30 | 1983-07-30 | 音声メツセ−ジ識別方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP13964283A JPS6031195A (ja) | 1983-07-30 | 1983-07-30 | 音声メツセ−ジ識別方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6031195A true JPS6031195A (ja) | 1985-02-16 |
| JPH02717B2 JPH02717B2 (ja) | 1990-01-09 |
Family
ID=15250029
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP13964283A Granted JPS6031195A (ja) | 1983-07-30 | 1983-07-30 | 音声メツセ−ジ識別方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6031195A (ja) |
-
1983
- 1983-07-30 JP JP13964283A patent/JPS6031195A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH02717B2 (ja) | 1990-01-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2001166789A (ja) | 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置 | |
| Hamid et al. | Makhraj recognition for Al-Quran recitation using MFCC | |
| JPS6031195A (ja) | 音声メツセ−ジ識別方式 | |
| JPS5972500A (ja) | 音声認識方式 | |
| JPS6331798B2 (ja) | ||
| JPS60250399A (ja) | 音声メツセ−ジ識別方式 | |
| JPS6245560B2 (ja) | ||
| JPH02720B2 (ja) | ||
| JPH0251520B2 (ja) | ||
| JPS60250398A (ja) | 音声メツセ−ジ識別方式 | |
| JPH026078B2 (ja) | ||
| Maleerat et al. | Tone classification for isolated Thai words using multi-layer perceptron | |
| JPS59114600A (ja) | 話者識別方式 | |
| JPS60241099A (ja) | 音声メツセ−ジ識別方式 | |
| JPS6312000A (ja) | 音声認識装置 | |
| JPS62217297A (ja) | 単語音声認識装置 | |
| JPS58139199A (ja) | 音声自動認識装置 | |
| JPS5895398A (ja) | 音声メッセージ識別方法 | |
| Hirahara | Auditory front ends in speech recognition systems | |
| JPH0230520B2 (ja) | Onseimetsuseejishikibetsuhoshiki | |
| JPS5961895A (ja) | 音声メツセ−ジ識別方式 | |
| JPS6120099A (ja) | 音韻セグメンテ−シヨン装置 | |
| JPS59111200A (ja) | 音声認識装置 | |
| JPH026079B2 (ja) | ||
| JPS6053998A (ja) | 音声認識装置 |