JPH036520B2

JPH036520B2 -

Info

Publication number: JPH036520B2
Application number: JP57032426A
Authority: JP
Inventors: Toyozo Sugimoto; Takeo Murata
Original assignee: Agency of Industrial Science and Technology
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 1982-03-03
Filing date: 1982-03-03
Publication date: 1991-01-30
Also published as: JPS58150997A

Description

【発明の詳細な説明】

本発明は音声以外の情報から発音の認識を行な
う発音特徴抽出装置に関するものである。音声は肺から送り出された呼気流が喉頭に存す
る声帯を通過する際に声帯が振動することにより
声に変換され、口唇や鼻腔に至る呼気の通路が形
を変えることにより変調され、これら発声器管の
総合的な動きの結果、産声される。さて従来、このような音声を抽出するには音響
マイクロホンにより音声波を電気信号に変換し、
所定の周波数帯域を有する多数のフイルタ回路に
入力し、各フイルタ回路の出力から判断して発音
を特徴づけていた。しかし発声器管の総合的動きの結果である音声
を、音声波のみにより全ての音素の発音特徴を抽
出して音声認識を行なうことは極めて困難であ
る。とりわけ非定常的な子音については雑音エネ
ルギーが強く、音声波の中でほぼ確実な特徴抽出
ができる無声摩擦音／ｓ，∫／等を除けば、無声
摩擦音／ｈ／や無声破裂音／ｐ，ｔ，ｋ／や有声
破裂音／ｂ，ｄ，ｇ／や鼻音／ｍ，ｎ，η／等は
その検出及び分離は非常に困難なものである。本発明は上記欠点に鑑み、発声器管各部の動き
を検出する検出器を発声器管各部の近傍に装着ま
たは配置し、前記各検出器からの出力を処理装置
により処理させることにより、従来よりも正確に
発音抽出ができる発音特徴抽出装置を提供するも
のである。以下、図面を参照しながら本発明の一実施例に
ついて説明する。第１図は本発明の一実施例における発音抽出装
置のブロツク構成を示すものである。同図におい
て、１は喉頭部声帯付近に取付けられ声帯の振動
を検出する声帯振動検出器、２は鼻壁中央部付近
に取付けられ鼻腔内における音声の振動を検出す
る鼻振動検出器、３は口腔前方に配置し口気流を
検出する口気流検出器、４は口腔内口蓋に装着し
舌と口蓋との接触を検出する口蓋接触検出器であ
る。５は声帯振動検出器１、鼻振動検出器２、口
気流検出器３及び口蓋接触検出器４の出力から発
音特徴を抽出する処理装置で、以下第２図を用い
てさらに処理装置５における構成の詳細な説明を
行なう。第２図において、６は声帯振動検出器１の声帯
振動情報から特定の値に基づいて声帯振動の有無
を決定する閾値回路、７は鼻振動検出器２の鼻振
動情報から特定の値に基づいて鼻振動の有無を決
定する閾値回路、８は口気流検出器３の口気流情
報を微分することにより口気流の変化率（加速
度）を求める微分回路、９は口気流の変化率の有
無を特定の値に基づいて決定する閾値回路、１０
は口気流検出器３の口気流情報から特定の値に基
づいて口気流の有無を決定する閾値回路、１１は
口蓋接触検出器４の口蓋接触情報を一旦測定回路
１２により舌と口蓋との接触信号に変換した後に
後述する前舌閉鎖、後舌閉鎖及び閉鎖なしの３種
類の状態を判断する舌閉鎖検出回路、１３は閾値
回路６，７，９，１０から出力される各閾値情報
の有無、及び舌閉鎖検出回路１１における３種類
の情報から音素分類を行なう音素分類回路であ
る。上記のように構成された発音特徴抽出装置につ
いて、以下具体的な使用方法を第３図を用い説明
を行なう。声帯振動検出部１として第３図に示すように加
速度センサー１′を医療用両面テープにより人体
における喉頭の声帯部に取り付けることにより、
声帯振動を検出する。検出された声帯振動は閾値
回路６に出力され、閾値回路６は声帯振動の値が
特定の値以上であれば音素分類回路１３に有
（＋）信号を、また一定の値以下であれば無（−）
信号を出力する。また鼻振動検出器２として加速度センサー２′
を医療用両面テープにより人体における鼻壁中央
部付近に取り付けることにより、鼻振動を検出す
る。検出された鼻振動は閾値回路７に出力され、
閾値回路７は鼻振動の値が特定の値以上であれば
音素分類回路１３に有（＋）信号を、また一定の
値以下であれば無（−）信号を出力する。また口気流検出器３として熱線流量計センサー
３′を人体における口腔前方の机上等に固定し配
置することにより、口気流の検出を行なう。検出
された口気流は微分回路８に出力され、微分回路
８では口気流の変化率を求めその変化率を閾値回
路９に出力する。そして閾値回路９は変化率の値
が特定の値以上であれば音素分類回路１３に有
（＋）信号を、また一定の値以下であれば無（−）
信号を出力する。一方熱線流量計センサー３′に
より検出された口気流は閾値回路１０にも出力さ
れ、閾値回路１０ではその口気流の値が特定値以
上であれば音素分類回路１３に有（＋）信号を、
また一定値以下であれば無（−）信号を出力す
る。さらに口蓋接触検出器４としては第４図に示さ
れるような接触センサー４′を用いる。接触セン
サー４′は舌と接触する部分に多数の電極４′ａを
有し、止め部４′ｂにより人体における口腔内口
上蓋に装着され、電極４′ａにより舌との接触状
態を検出する。そして検出された電極４′ａと舌
との接触状態は測定回路１２及び舌閉鎖検出回路
１１に順次入力され、接触状態が第５図イのよう
なパターンとなつた際には前舌閉鎖としての情報
が、第５図ロのようなパターンとなつた際には後
舌閉鎖としての情報が、また舌との接触がない場
合には閉鎖なしの情報が音素分類回路１３に出力
される。最終的に音素分類回路１３では下表に示すよう
な内部の記憶テーブルから、閾値回路６，７，
９，１０及び舌閉鎖検出回路１１より入力した各
情報に基づいて音声を判断できる。

【表】

【表】さてたとえば第６図イに示すような音素波を有
する「hana」という音声を発声すると、加速度
センサー１′は第６図ロのような波形を閾値回路
６に出力する。そして閾値回路６では特定の閾値
から判断して「ｈ」の部分では無（−）信号を、
「ｎ」の部分では有（＋）信号を音素分類回路１
３に出力する。また加速度センサー１′は第６図ハのような波
形を閾値回路７に出力する。そして閾値回路７で
は特定の閾値から判断して「ｈ」の部分では無
（−）信号を、「ｎ」の部分では有（＋）信号を音
素分類回路１３に出力する。さらに熱線流量計センサー３′では第６図ニの
ような波形を微分回路８及び閾値回路１０に出力
する。そして閾値回路９では微分回路８からの微
分値を特定の閾値から判断して「ｈ」及び「ｎ」
の部分で無（−）信号を音素分類回路１３に出力
する。また閾値回路１０でも特定の閾値から判断
して「ｈ」の部分では有（＋）信号を、「ｎ」の
部分では無（−）信号を音素分類回路１３に出力
する。一方接触センサー４′は電極４ａと舌との接触
状態を検出し、測定回路１２を介して舌閉鎖検出
回路１１に出力する。そして舌閉鎖検出回路１１
では「ｈ」の部分で接触パターンにより「閉鎖な
し」の情報を、また「ｎ」の部分では「前舌閉
鎖」の情報を音素分類回路１３に出力する。そして音素分類回路１３では各情報に基づいて
表に示したような内部の記憶テーブルから「ｈ」
及び「ｎ」を認識することができる。以上のように、声帯振動検出器１、鼻振動検出
器２、口気流検出器３及び口蓋接触検出器４によ
り各発声器管の動きを検出し、処理装置５により
各検出器が検出した情報に基づいてあらかじめ記
憶しているテーブルの中から特定の音素を決定す
ることにより、従来困難であつた音声の認識を正
確に行なうことができる。以上のように本発明は声帯振動検出器が検出し
た声帯の振動情報と、鼻振動検出器が検出した鼻
腔内の振動情報と、口気流検出器が検出した口気
流情報と、口蓋接触検出器が検出した舌と口蓋と
の接触情報とに基づいて従来よりも正確に破裂音
および鼻音の各音素を識別することができ、その
実用的効果は大なるものがある。

【図面の簡単な説明】

第１図は本発明の一実施例における発音特徴抽
出装置のブロツク図、第２図は同発音特徴抽出装
置における処理装置のブロツク図、第３図は同発
音特徴抽出装置の使用例を示す図、第４図は接触
センサーの平面図、第５図は舌と口蓋との接触パ
ターンを示す図、第６図は各検出器の波形図であ
る。１……声帯振動検出器、２……鼻振動検出器、
３……口気流検出器、４……口蓋接触検出器、５
……処理装置。

Claims

【特許請求の範囲】

１喉頭部に取り付けた声帯振動検出器と、鼻部
に取り付けた鼻振動検出器と、口腔前方に配置し
た口気流検出器と、舌と口蓋の接触を検出する口
蓋接触検出器とを備えかつ、口気流検出器の出力
に基づいて破裂音ｐ，ｔ，ｋ，ｂ，ｄ，ｇおよび
ｈのグループを抽出し、鼻振動検出器の出力に基
づいて鼻音ｍ，ｎ、を抽出し、声帯振動検出器の
出力に基づいてｐ，ｔ，ｋ，ｈとｂ，ｄ，ｇとを
分離し、口蓋接触検出器の出力に基づいてｐ，
ｈ，ｔ，ｋ，ｂ，ｄ，ｇ，ｍ，ｎ、とに分離、識
別し、さらに口気流検出器の出力にもとづく口気
流の変化率によりｐとｈを分離する処理装置とを
具備したことを特徴とする発音特徴抽出装置。