JPH0124320B2

JPH0124320B2 -

Info

Publication number: JPH0124320B2
Application number: JP1411583A
Authority: JP
Inventors: Hiroyoshi Yuasa; Koichi Oomura
Original assignee: Matsushita Electric Works Ltd
Current assignee: Panasonic Electric Works Co Ltd
Priority date: 1983-01-31
Filing date: 1983-01-31
Publication date: 1989-05-11
Also published as: JPS59139100A

Description

【発明の詳細な説明】

〔技術分野〕本発明は電子機器を音声メツセージによつて操
作するための音声メツセージ識別方式に関するも
のである。〔背景技術〕第１図は従来本発明者らが開発した音声メツセ
ージ識別装置（特願昭57−171933号）の概略構成
を示している。同図において、F₁a，F₁b，R₂a，
F₂b，…，Fna，Fnbは音声入力から相異なる周
波数領域の短時間平均パワーを取り出すフイルタ
対であり、これらの各フイルタ対F₁a，F₁b，…，
Fna，Fnbの出力はそれぞれ差動増憤手段S₁，
S₂，…，Snに入力されて差信号出力に変換され
る。そしてこの差信号出力は５母音判別手段VD
に入力されて、各差信号出力の大小関係に応じて
日本語の５母音／ａ／、／ｉ／、／ｕ／、／
ｅ／、／ｏ／に対応する５つの符号Va、Vi、
Vu、Ve、Voのうちいずれか１つが複合符号化
処理部CMに入力される。一方フイルタFvは音声
入力から有声音のエネルギを抽出する低周波フイ
ルタであり、またフイルタFuは音声入力から無
声音のエネルギを抽出する高周波フイルタであつ
て、各フイルタFv，Fuの出力は差動増幅手段So
によつて差信号出力に変換される。差動増幅手段
Soの出力は比較手段Coにおいて基準値Rv、Ru
（Rv＜０＜Ru）と比較され、差信号出力が基準
値Rvよりも小さい場合には有声音Ｖと判定され
る。また上記差信号出力が基準値Ruよりも大き
い場合には無声音Ｕと判定され、基準値RuとRv
との間であれば無音Ｓと判定される。そして無
音、有声音、および無声音の各場合についてＳ、
Ｖ、Ｕの各符号のうちいずれか１つの符号が複合
符号化処理部CMに入力される。この複合符号化
処理部CMは比較手段Coから出力される符号がＶ
であるときには、５母音判別手段VDから出力さ
れるVa、Vi、Vu、Ve、Voのうちいずれか１つ
の符号を出力し、また比較手段Coから出力され
る符号がＵまたはＳであるときには、その符号を
そのまま出力するものである。したがつて、複合
符号化処理部CMからはＵ、Ｓ、Va、Vi、Vu、
Ve、Voの合計７通りの複合符号が出力されるも
のである。この複合符号の時系列からなる入力パ
ターンは時間軸正規化処理部TNにより時間軸を
線形に正規化された後に、入力パターン記憶部
IMに記憶される。一方標準パターン記憶部HM
には、複数種の音声メツセージを標準的に発声し
たときに形成される各入力パターンを標準パター
ンとして予め登録してある。さらにまた近似度係
数記憶部KMには、複合符号同士の近似度を表わ
す近似度係数を２個の複合符号のすべての組合せ
に応じて予め登録してある。照合処理部SGは入
力パターンと各標準パターンとの時間軸上の対応
関係を両パターンの間で互いに対応する符号同士
の近似度が最大になるように動的計画法により最
適化し、入力パターンに最も近似する標準パター
ンを入力メツセージとして識別するものである。しかるにかかる従来例にあつては、有声音を日
本語の５母音である／ａ／、／ｉ／、／ｕ／、／
ｅ／、／ｏ／のいずれか１つに該当するものとし
て符号化しているので、音節の過渡期に現われ
る／ｅ／と／ｏ／の中間的な音や／ｉ／と／ｅ／
の中間的な音などのように必ずしも正確には５母
音に一致しない音については正しく認識照合する
ことができないという問題があつた。〔発明の目的〕本発明は上述のような点に鑑みて為されたもの
であり、音節の過渡期に現われるような５母音の
中間的な有声音についても正しく認識照合するこ
とができ、また５母音のうちのいずれか１つに分
類される有声音についてはそのまま５母音として
認識照合することができて、全体として音声入力
に含まれる情報量を有効に抽出して認識精度を向
上させ得るようにした音声メツセージ識別装置を
提供することを目的とするものである。〔発明の開示〕（構成）第２図は本発明の要旨となる構成を端的に示す
ために、特許請求の範囲に記載された機能をブロ
ツク化して示したいわゆるクレーム対応図であ
る。同図において、Fvは音声入力の低周波成分
の短時間平均パワーを取り出すフイルタであり、
Fuは音声入力の高周波成分を取り出すフイルタ
である。各フイルタFv，Fuの出力は差動増幅手
段Soに入力されて、差信号成分を抽出される。
Coは比較手段であり、上記差動増幅手段Soから
出力される差信号成分が、基準値Rvよりも小さ
いときには有声音Ｖの符号を割り当て、基準値
Ruよりも大きいときには無声音UVの符号を割り
当て、それ以外の場合には無音Ｓの符号を割り当
てるものである。ただし、Ru＞Ｏ＞Rvである。
次にF₁a，F₁b乃至Fna，Fnbはそれぞれ音声入力
から相異なる周波数領域の短時間平均パワーを取
り出すフイルタ対であり、これらの各フイルタ対
F₁a，F₁b，…，Fna，Fmbにはそれぞれ差動増
幅手段S₁〜Snが接続されている。VD₀は有声音
分析手段であり、各差動増幅手段S₁〜Snの出力
の大小関係を分析して日本語の５母音に該当する
ものについてはその母音に対応する符号Va、
Vi、Vu、Ve、Voを割り当てて、日本語の５母
音に該当しないものについては、広顎有声音Vh、
狭顎有声音Vl、前舌有声音Vf、後舌有声音Vbの
符号を割り当てるものである。複合符号化処理部
CMは、比較手段C₀から出力される符号がＶであ
るときには、有声音分析手段VD₀から出力される
Va、Vi、Vu、Ve、Vo、Vh、Vl、Vf、Vbのう
ちのいずれか１つの符号を出力し、また比較手段
C₀から出力される符号がＵまたはＳであるとき
には、その符号をそのまま出力するものである。
この複合符号化処理部CMから出力される複合符
号は、音声メツセージの登録時には標準パターン
記憶部HMに入力記憶され、音声メツセージの認
識時には入力パターン記憶部IMに入力記憶され
るものである。SGは照合処理部であり、入力パ
ターンに最も近似する標準パターンを入力メツセ
ージとして識別するものである。しかして本発明
においては上述のように有声音Ｖのうち、日本語
の５母音に該当するものについてはその母音に対
応する符号Va、Vi、Vu、Ve、Voをそのまま割
り当てて、日本語の５母音に該当しないものにつ
いては広顎、狭顎、前舌、後舌の各有声音Vh、
Vl、Vf、Vbのうちいずれか１つの符号を割り当
てるようにしたから、有声音のうち例えば／ｅ／
と／ｏ／の中間的な音や／ｉ／と／ｕ／の中間的
な音、あるいは／ｉ／と／ｅ／の中間的な音や／
ｏ／と／ｕ／の中間的な音などがそれぞれ有声音
Vh、Vl、Vf、Vbとして認識されるものであり、
このため日本語の５母音に必ずしも正確に一致し
ない中間的な有声音についても正しく認識照合す
ることができ、音節の過渡期に現われる曖昧な有
声音についても的確な照合処理を行なうことがで
きるようになつている。また本発明にあつては、
５母音のうちのいずれか１つに分類される有声音
については、そのまま５母音として認識照合して
いるので、音節の定常期における照合も的確に行
なうことができ、全体として音声入力に含まれる
情報量を有効に抽出して認識精度を向上させるこ
とができるようになつている。（実施例）以下具体的な実施例を挙げて、本発明の構成を
さらに詳述する。第３図は本発明の一実施例の構
成を示すブロツク図である。同図において、音声
はマイク１から入力され、プリアンプ２で高域強
調された後、調整アンプ３でゲインおよびオフセ
ツトを調整される。調整アンプ３の出力は、Ｖ／
UVバランス調整回路４を介してフイルタFv，
Fuに入力されるものである。またこの調整アン
プ３の出力は、レベル調整器５と、VB／VHバ
ランス調整回路６、VH／VLバランス調整回路
７、およびVF／VBバランス調整回路８を介し
てフイルタF₁，F₂，F₃，F₄にそれぞれ入力され
るものである。フイルタFvは音声信号の中から
有声音Ｖの成分が多く分布する低周波成分を抽出
するものであり、０〜1KHzの帯域フイルタ９Ｖ
と、整流回路１０Ｖおよび平均化回路１１Ｖとか
ら構成されている。フイルタFuは音声信号の中
から無声音UVの成分が多く分布する高周波成分
を抽出するものであり、５〜12KHzの帯域フイル
タ９Ｕと、整流回路１０Ｕおよび平均化回路１１
Ｕとから構成されている。一方フイルタF₁〜F₄
は、それぞれ帯域フイルタ９₁〜９₄と、整流回路
１０₁〜１０₄および平均化回路１１₁〜１１₄とか
ら構成されており、それぞれ０〜0.4KHz、0.4〜
0.8KHz、0.8〜1.6KHz、および1.6〜3.2KHzの各周
波数領域の短時間平均パワーを音声信号の中から
抽出するものである。各フイルタFv，Fu、およ
びF₁〜F₄の出力は、マルチプレクサ１２によつ
て時分割多重化された後、対数変換器１３により
対数値に変換される。対数変換器１３の出力は
Ａ／Ｄコンバータ１４によりデジタル値に変換さ
れる。このＡ／Ｄコンバータ１４は、スペクトル
分析をデジタルフイルタで行なう場合には調整ア
ンプ３の次段に位置するものである。１５は差信
号ベクトル抽出部、１６は記号ベクトル変換部、
１７は記号化処理部であつて、この差信号ベクト
ル抽出部１５乃至記号化処理部１７の更に具体的
な構成を第４図のブロツク図に示す。同図に示す
ように、差信号ベクトル抽出部１５は、差動増幅
手段S₀〜S₃を有し、フイルタFvおよびFuの差信
号出力Ｖ／UVと、フイルタF₁およびF₂の差信号
出力VH／VLと、フイルタF₃よびF₄の差信号出
力VF／VB、ならびにフイルタF₂およびF₃の差
信号出力VB／VHとからなる差信号ベクトルを
抽出するものである。記号ベクトル変換部１６
は、差動増幅手段S₀の出力を入力とする比較手段
C₀を有しており、この比較手段C₀は、フイルタ
FvとFuの差信号出力が所定の基準レベルRv以下
であれば有声音Ｖに記号化し、他の所定の基準レ
ベルRu（ただし、Ru＞０＞Rv）以上であれば無
声音Ｕに記号化し、基準レベルRuとRvとの間で
あれば無音Ｓに記号化するものである。また記号
ベクトル変換部１６は、各差動増幅手段S₁〜S₃の
出力を入力とする行列計算部MCを有しており、
この行列計算部MCは各差信号出力VH／VL、
VF／VB、およびVB／VHを成分とする３次元
ベクトルに所定の行列を乗算して、音声入力中に
含まれる各母音／ａ／、／ｉ／、／ｕ／、／
ｅ／、／ｏ／の短時間平均パワーVa、Vi、Vu、
Ve、Voを算出するものである。この行列計算部
MCにおける計算に使用される変換行列の一例を
示すと次式のようになる。上式において変換行列の行ベクトルのノルム
（成分の２乗の和の平方）は11.2と一定値になつ
ており、正規化されている。さらに各行ベクトル
はプラスマイナスの符号の組合せがそれぞれ異な
るので互いに独立している。なおVB／VHに対
するベクトル成分を他の1/2にしたのは、VH／
VLやVF／VBの方がより基本的な特徴として大
きな重みがついていることを示している。行列計
算部MCにおいて計算された各母音の短時間平均
パワーVa、Vi、Vu、Ve、Voは最大値算出部
MX₁に入力されて、最も大きい成分と第２番目
に大きい成分とが算出される。有意性判定部MJ
は上記各母音の短時間平均パワーVa、Vi、Vu、
Ve、Voのうち、最も大きい成分が所定の基準レ
ベルよりも大きく、かつこの最も大きい成分と第
２番目に大きい成分との差が所定の基準値よりも
大きいときには、前記最大の成分に対応する母音
の符号を出力し、前記最大の成分と第２番目に大
きい成分との差が、所定の基準値よりも小さいと
きには、最大値算出部MX₂により算出された各
フイルタF₁〜F₄の出力VL、VH、VB、VFのう
ち、最大の出力に対応する有声音の符号Vl、
Vh、Vb、Vfを出力するものである。したがつて
有意性判定部MJからは各母音Va、Vi、Vu、
Ve、Voと、各有声音Vl、Vh、Vb、Vfの符号の
うち、いずれか１つが入力されるものである。記
号化処理部１７は比較手段C₀から出力される有
声音Ｖ、無声音UV、および無音Ｓの各符号のう
ち、有声音Ｖの符号を、前記有意性判定部MJか
ら出力される符号に置換して１系列の複合符号を
形成するものである。したがつて記号化処理部１
７から出力される符号は、無声音UV、および無
音Ｓと、各母音Va、Vi、Vu、Ve、Voならびに
各有声音Vl、Vh、Vb、Vfの符号のうちのいず
れか１つとなる。記号化処理部１７から出力され
る符号は整形処理部１８に入力されて波形整形さ
れる。すなわちこの整形処理部１８は、各符号の
継続時間を測定し、一定の継続時間より短い符号
を前後の符号と比較し、前後の符号が同じである
ときには前後の符号と同じ符号に変換して出力
し、前後の符号が同じでないときには前の符号と
同じ符号に変換して出力するものである。整形処
理部１８の出力は時間軸線型正規化処理部１９に
入力されて、時間軸を線型に伸縮され、全継続時
間が一定になるように正規化されるものである。
時間軸の正規化処理を施されたデータは音声メツ
セージの登録時には、標準パターン記憶部２０に
記憶されるものであり、音声メツセージの認識時
には距離計算部２１によつて入力パターンと標準
パターンとの時間軸上で互いに対応する符号同士
の距離の総和を計算するものである。２２は距離
テーブルであり、入力パターンと標準パターンと
の各符号同士の距離を予め登録しておいて、距離
計算部２１における距離計算を簡単に行なえるよ
うにしているものである。２３は有意性検定部で
あり、距離計算の結果、入力パターンに最も近い
標準パターンについての近似度がある設定値より
も高く、かつ入力パターンに第２番目に近い標準
パターンについての近似度が入力パターンに最も
近い標準パターンについての近似度よりもある設
定値以上小さいときには、有意性ありとして識別
結果出力部２４に認識結果を出力し、それ以外の
場合には認識不良として音声の再入力を促すもの
である。なお距離計算部２１による照合に先立つ
て、例えば無声音UVの符号のような特定の符号
が現われる回数を入力パターンと標準パターンと
について予め比較しておいて、入力パターンと比
較する標準パターンの数を予め１個に限定してお
けば、有意性検定部２３においては入力パターン
と標準パターンとの近似度がある設定値を越えて
いるか否かを確認するだけでよく、有意性検定部
２３における検定基準を緩和できるものである。以上のように本実施例にあつては、有声音Ｖを
日本語の５母音Va、Vi、Vu、Ve、Voに符号化
し、５母音に符号化できないものについては広顎
有声音Vh、狭顎有声音Vl、前舌有声音Vf、およ
び後舌有声音Vbに符号化するようにしたから、
５母音には分類されない中間的な有声音をも符号
化することができるものであり、このため音声入
力に含まれる情報量を的確に抽出することができ
るものである。ここで広顎有声音Vhとして分類
されるのは、／ｅ／、／ａ／、／ｏ／およびその
中間音などであり、狭顎有声音Vlとして分類さ
れるのは、／ｉ／、／ｕ／およびその中間音など
である。次に前舌音Vfとして分類されるの
は、／ｉ／、／ｅ／およびその中間音などであ
り、後舌音Vbとして分類されるのは、／
ａ／、／ｏ／、／ｕ／およびその中間音などであ
る。ただし、フイルタF₃およびF₄の通過周波数
帯域を、それぞれ0.7〜1.4KHzおよび1.4〜2.8KHz
とした場合には、前舌音Vfとして分類されるの
は、／ｉ／、／ｅ／、／ａ／およびその中間音な
どであり、また後舌音Vbとして分類されるの
は、／ｏ／、／ｕ／およびその中間音などであ
る。なお広顎音Vh乃至後舌音Vbとして分類され
ない有声音のうち、フイルタF₂とF₃の差信号出
力VB／VHが大きいときは、／ａ／または／
ａ／に近い音が入力されている場合であり、また
上記差信号出力VB／VHが小さいときは、／
ｏ／、／ｅ／または／ｏ／、／ｅ／に近い音が入
力されている場合である。第５図は上記実施例における差信号ベクトル抽
出部１５乃至記号化処理部１７の具体的構成の他
の一例を示すブロツク図である。同図の回路例に
おいては、各差動増幅手段S₁〜S₃から出力される
フイルタF₁〜F₄の差信号出力VH／VL、VF／
VB、およびVB／VLを成分とする３次元ベクト
ルに変換行列Tmを乗算して、日本語の５母音
Va、Vi、Vu、Ve、Voと、広顎有声音Vh、狭顎
有声音Vl、前舌有声音Vf、後舌有声音Vb、およ
びこれらに分類されない有声音Vwの各短時間平
均パワーを成分とする10次元ベクトルを算出する
行列計算部MC₀を設けてある。MX₀は上記10次
元ベクトルの各成分のうち最大の成分を判別して
この最大の成分に対応する有声音の符号を出力す
る最大値判定部である。ここで変換行列〔Tm〕
の一例を示すと、まずフイルタF₃とF₄の通過周
波数帯域がそれぞれ0.8〜1.6KHzおよび1.6〜3.2K
Hzであるときには、式のようになり、この場合
には有声音Vwは／ａ／と／ｏ／の中間音を表わ
すものである。またフイルタF₂とF₃の通過周波
数帯域がそれぞれ0.7〜1.4KHzおよび1.4〜2.8KHz
であるときには、変換行列〔Tm〕は式のよう
になり、この場合には有声音Vwは／ａ／と／
ｅ／の中間音を表わすものである。ところで第５図回路の最大値判定部MX₀にお
いては有意性検定の機能をも付加して、10次元ベ
クトルの各成分のうち最大のものが所定の基準レ
ベルに達しない場合には、５母音と各有声音Vf、
Vl、Vf、Vb、Vwのうちいずれにも分類されな
い有声音については有声音Vmの符号を割り当て
るようにするものであり、これによつて例えば／
ｉ／と／ｏ／の中間音や／ｅ／と／ｕ／の中間音
などが、有声音Vmとし分類されることになるも
のである。第１表および第２表は、変換行列
〔Tm〕としてそれぞれ式および式のものを
用いた場合について、各母音の中間音が６種類の
有声音Vf、Vl、Vf、Vb、Vw、およびVmのう
ちいずれに分類されるかを示したものである。同
図を見れば、例えば／ｉ／と／ｅ／の中間音は、
有声音Vfとして分類され、／ｏ／と／ｕ／の中
間音は、有声音Vbとして分類されることなどが
理解されるであろう。

【表】

【表】上述したところから明らかなように、第５図回
路においては、５母音と各有声音Vh、Vl、Vf、
Vbおよびこれらに分類されない有声音Vw、Vm
の合計11種類の有声音の符号が最大値判定部
MX₀から出力されることになる。そしてこれら
の各有声音の符号Va、Vi、Vu、Ve、Vo、Vh、
Vl、Vf、Vb、Vw、Vmは、比較手段C₀から出
力されるＶ、UV、Ｓの符号のうち有声音Ｖの符
号と置換されるから、結局記号化処理部１７から
は、UV、Ｓ、Vm、Vi、Ve、Va、Vo、Vu、
Vh、Vl、Vf、Vb、Vwの合計13種類の符号が出
力されることになる。したがつて距離テーブル２
２には、これらの13種類の符号同士の近似度を表
わす係数を予め記憶させておけばよい。第４表お
よび第３表は、変換行列〔Tm〕として、それぞ
れ式および式のものを用いた場合において、
上述の13種類の各符号同士の近似度がどのような
値になるかを示したものである。ただし、第４表において、Vu行Vo列の値は−
１とする方がより望ましい。

【表】

【表】第３表および第４表において、横の欄および縦
の欄はそれぞれ標準パターンの符号および入力パ
ターンの符号に対応しており、例えば標準パター
ンの符号がVaであつて、しかも入力パターンの
符号もVaであるときには、距離テーブル２２の
出力は２となり、近似度が高いことを示すもので
ある。また標準パターンの符号がUVであり、入
力パターンの符号がVaであるときには、距離テ
ーブル２２の出力は−２となり、近似度が低いこ
とを示すものである。したがつて距離計算部２１
においては、距離テーブル２２からの出力を順次
加算するだけの演算操作により、入力パターンと
標準パターンとのパターン全体としての近似度を
容易に計算することができるものである。次に第６図は本発明の他の実施例を示すブロツ
ク図である。本実施例にあつては、各フイルタ
Fv，Fu，F₁〜F₄から出力される短時間平均パワ
ーは対数変換器２５〜３０によつて対数値に変換
されてから、差動平均化回路３１〜３４に入力さ
れ、各フイルタの差信号出力が算出されるように
なつている。差動平均化回路３１〜３４から出力
される信号は、符号化回路３５〜４２によつて所
定の基準レベルR_U、R_V、R_H、R_L、R_A、R_O、R_F、
R_Bと比較されて、その大小関係に応じて符号化
されるものである。ただし、R_U＞０＞R_V、R_H＞
０＞R_L、R_A＞０＞R_O、R_F＞０＞R_Bである。符号
化回路３５，３７，３９，４１は、入力された信
号がそれぞれ基準レベルR_U、R_H、R_A、R_Fよりも
大きい場合には、符号UV、VH、VA、VFをそ
れぞれ出力し、それ以外の場合には符号Ｓを出力
するものである。また符号化回路３６，３８，４
０，４２は、入力された信号がそれぞれ基準レベ
ルR_V、R_L、R_O、R_Bよりも小さい場合には、符号
Ｖ、VL、VO、VBをれぞれ出力し、それ以外の
場合には符号Ｓを出力するものである。各符号化
回路３５〜４２から出力されるUV、Ｖ、Ｓ、
VH、VL、VA、VO、VF、VBの各符号はコン
ポジツト記号化処理部４３に入力されて、記号化
テーブル４４の記憶内容を参照しながら上述の第
５図における記号化処理部１７から出力される符
号と同様のUV、Ｓ、Vm、Vi、Ve、Va、Vo、
Vu、Vh、Vl、Vf、Vb、Vwよりなるコンポジ
ツト符号（複合符号）に変換されるものである。
以下このコンポジツト記号化処理部４３の動作に
ついて説明すると、まず符号化回路３５，３６か
ら出力される符号がUVおよびＳあるいは共にＳ
であるときに符号UVおよび符号Ｓがそれぞれ出
力される。また符号化回路３５，３６から出力さ
れる符号がＳおよびＶであるときには、第５表ま
たは第６表に示すように符号化回路３７〜４２の
出力に基づいて、Va、Vi、Vu、Ve、Vo、Vh、
Vl、Vf、Vb、Vw、Vmにうちいずれか１つの
符号が出力されるものである。

〔発明の効果〕

本発明は叙上のように、有声音のうち日本語の
５母音に該当するものについてはその母音に対応
する符号をそのまま割り当てて、日本語の５母音
に該当しないものについては、広顎、狭顎、前
舌、後舌の各有声音のうちいずれか１つの符号を
割り当てるようにしたから、有声音のうち例え
ば／ｅ／と／ｏ／の中間的な音や／ｉ／と／ｕ／
の中間的な音、あるいは／ｉ／と／ｅ／の中間的
な音や／ｏ／と／ｕ／の中間的な音などがそれぞ
れ広顎有声音、狭顎有声音、前舌有声音、後舌有
声音として認識されるものであり、このため日本
語の５母音に必ずしも正確に一致しない中間的な
有声音についても正しく認識照合することがで
き、音節の過渡期に現われる曖昧な有声音につい
ても的確な照合処理を行なうことができるという
効果を有するものである。また本発明にあつて
は、５母音のうちのいずれか１つに分類される有
声音については、そのまま５母音として認識照合
しているので、音節の定常期における照合も的確
に行なうことができ、全体として音声入力に含ま
れる情報量を有効に抽出して認識精度を向上させ
ることができるという効果を有するものである。
次に併合発明にあつては、有声音と無声音との判
定はフイルタ対の差信号の対数変換値で行なうよ
うにしたので、有声音区間と無声音区間とを明瞭
に識別することができ、またその他の有声音につ
いての判定はフイルタの出力の対数変換値の差を
取るようにし、しかも各フイルタ間のバランスを
取るバランス調整回路を設けたので、有声音の微
妙な特徴の変化を的確に把えることができ、５母
音と他の有声音との識別精度も向上させることが
できるという効果がある。

【図面の簡単な説明】

第１図は従来例のブロツク図、第２図は本発明
の特許請求の範囲に対応するいわゆるクレーム対
応ブロツク図、第３図は本発明の一実施例のブロ
ツク図、第４図は同上の要部構成を示すブロツク
図、第５図は同上の要部の他の構成を示すブロツ
ク図、第６図は本発明の他の実施例のブロツク
図、第７図は併合発明の一実施例のブロツク図、
第８図は母音のホルマントの周波数分布を示す
図、第９図乃至第１１図はフイルタの周波数特性
を示す図、第１２図乃至第１４図は各フイルタの
差信号出力を示す図、第１５図は対数変換特性を
示す図、第１６図及び第１７図は各有声音の射影
成分を示す図、第１８図は音声メツセージに対す
る各フイルタの差信号出力を示す図、第１９図は
同上の各有声音の射影成分を示す図である。 Fv，Fu，F₁a，F₁b，…，Fna，Fnbはフイル
タ、S₀〜Snは差動増幅手段、C₀は比較手段、
VD₀は有声音分析手段、CMは複合符号化処理
部、IMは入力パターン記憶部、HMは標準パタ
ーン記憶部、SGは照合処理部である。

Claims

【特許請求の範囲】１音声入力の高周波成分および低周波成分の短
時間平均パワーをそれぞれ取り出す一対のフイル
タの差信号出力を入力とし、高周波成分の方が強
いときには無声音の符号を、低周波成分の方が強
いときには有声音の符号を、高周波成分と低周波
成分とが略同じときには無音の符号を出力する比
較手段を設け、音声入力から相異なる周波数領域
の短時間平均パワーを取り出す複数組のフイルタ
対の各差信号出力の大小関係に応じて日本語の５
母音と、顎の開きの広い広顎有声音と、顎の開き
の狭い狭顎有声音と、舌の位置が前になる前舌有
声音と、舌の位置が後になる後舌有声音との各符
号のうちいずれか１つの符号を割り当てる有声音
分析手段を設けて、比較手段の出力のうち、有声
音の符号を上記有声音分析手段から出力される符
号に置換して、無音、無声音、および５母音と広
顎、狭顎、前舌、ならびに後舌の各有声音の符号
の時系列からなる入力パターンを形成し、複数種
の音声メツセージを標準的に発生したときに形成
される各入力パターンを標準パターンとして予め
登録し、入力パターンに最も近似する標準パター
ンを入力メツセージとして識別することを特徴と
する音声メツセージ識別方式。２有声音分析手段は、広顎有声音、狭顎有声
音、前舌有声音、および後舌有声音の各短時間平
均パワーを取り出す第１乃至第４のフイルタを有
し、第１および第２のフイルタの差信号出力と、
第３および第４のフイルタの差信号出力と、第１
および第４のフイルタの差信号出力とを成分とす
る３次元ベクトルを入力とし、この３次元ベクト
ルに変換行列を乗算して日本語の５母音の短時間
平均パワーを各成分とする５次元ベクトルを算出
する行列計算部を有し、行列計算部から出力され
る５次元ベクトルの各成分のうち最大の成分が所
定の基準レベルより大きく、かつこの最大の成分
と第２番目に大きい成分との差が所定の基準値よ
りも大きいときには、前記最大の成分に対応する
母音の符号を出力し、前記最大の成分と第２番目
に大きい成分との差が、所定の基準値よりも小さ
いときには、第１乃至第４の各フイルタの出力の
うち最大の出力に対応する有声音の符号を出力す
る最大値判定部を有して成ることを特徴とする特
許請求の範囲第１項記載の音声メツセージ識別方
式。３有声音分析手段は、広顎有声音、狭顎有声
音、前舌有声音、および後舌有声音の各短時間平
均パワーを取り出す第１乃至第４のフイルタを有
し、第１および第２のフイルタの差信号出力と、
第３および第４のフイルタの差信号出力と、第１
および第４のフイルタの差信号出力とを成分とす
る３次元ベクトルを入力とし、この３次元ベクト
ルに変換行列を乗算して、日本語の５母音と広
顎、狭顎、前舌、および後舌の各有声音の短時間
平均パワーを各成分とするベクトルを算出する行
列計算部を有し、行列計算部から出力されるベク
トルの各成分のうち最大の成分を判定し、該成分
に対応する母音乃至有声音の符号を出力する最大
値判定部を有して成ることを特徴とする特許請求
の範囲第１項記載の音声メツセージ識別方式。４音声入力の高周波成分および低周波成分の短
時間平均パワーをそれぞれ取り出す一対のフイル
タの差信号出力の対数変換値を入力とし、高周波
成分の方が強いときには無声音の符号を、低周波
成分の方が強いときには有声音の符号を、高周波
成分と低周波成分とが略同じときには無音の符号
を出力する比較手段を設け、音声入力から顎の開
きの広い広顎有声音と、顎の開きの狭い狭顎有声
音と、舌の位置が前になる前舌有声音と、舌の位
置が後になる後舌有声音との各短時間平均パワー
をそれぞれ取り出す第１乃至第４のフイルタを設
け、第１および第２のフイルタにそれぞれ入力さ
れる音声入力のパワーをバランス調整する第１の
バランス調整手段と、第３および第４のフイルタ
にそれぞれ入力される音声入力のパワーをバラン
ス調整する第２のバランス調整手段と、第１およ
び第２のバランス調整手段にそれぞれ入力される
音声入力のパワーをバランス調整する第３のバラ
ンス調整手段とを設け、第１および第２のフイル
タの対数値差信号出力と、第３および第４のフイ
ルタの対数値差信号出力と、第１および第４のフ
イルタの対数値差信号出力との大小関係に応じて
日本語の５母音と、広顎有声音、狭顎有声音、前
舌有声音、および後舌有声音の各符号のうちいず
れか１つの符号を割り当てる有声音分析手段を設
けて、比較手段の出力のうち、有声音の符号を上
記有声音分析手段から出力される符号に置換し
て、無音、無声音、および５母音と広顎、狭顎、
前舌、ならびに後舌の各有声音の符号の時系列か
らなる入力パターンを形成し、複数種の音声メツ
セージを標準的に発声したときに形成される各入
力パターンを標準パターンとして予め登録し、入
力パターンに最も近似する標準パターンを入力メ
ツセージとして識別することを特徴とする音声メ
ツセージ識別方式。