JPH036520B2 - - Google Patents
Info
- Publication number
- JPH036520B2 JPH036520B2 JP57032426A JP3242682A JPH036520B2 JP H036520 B2 JPH036520 B2 JP H036520B2 JP 57032426 A JP57032426 A JP 57032426A JP 3242682 A JP3242682 A JP 3242682A JP H036520 B2 JPH036520 B2 JP H036520B2
- Authority
- JP
- Japan
- Prior art keywords
- detector
- output
- circuit
- nasal
- oral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
本発明は音声以外の情報から発音の認識を行な
う発音特徴抽出装置に関するものである。 音声は肺から送り出された呼気流が喉頭に存す
る声帯を通過する際に声帯が振動することにより
声に変換され、口唇や鼻腔に至る呼気の通路が形
を変えることにより変調され、これら発声器管の
総合的な動きの結果、産声される。 さて従来、このような音声を抽出するには音響
マイクロホンにより音声波を電気信号に変換し、
所定の周波数帯域を有する多数のフイルタ回路に
入力し、各フイルタ回路の出力から判断して発音
を特徴づけていた。 しかし発声器管の総合的動きの結果である音声
を、音声波のみにより全ての音素の発音特徴を抽
出して音声認識を行なうことは極めて困難であ
る。とりわけ非定常的な子音については雑音エネ
ルギーが強く、音声波の中でほぼ確実な特徴抽出
ができる無声摩擦音/s,∫/等を除けば、無声
摩擦音/h/や無声破裂音/p,t,k/や有声
破裂音/b,d,g/や鼻音/m,n,η/等は
その検出及び分離は非常に困難なものである。 本発明は上記欠点に鑑み、発声器管各部の動き
を検出する検出器を発声器管各部の近傍に装着ま
たは配置し、前記各検出器からの出力を処理装置
により処理させることにより、従来よりも正確に
発音抽出ができる発音特徴抽出装置を提供するも
のである。 以下、図面を参照しながら本発明の一実施例に
ついて説明する。 第1図は本発明の一実施例における発音抽出装
置のブロツク構成を示すものである。同図におい
て、1は喉頭部声帯付近に取付けられ声帯の振動
を検出する声帯振動検出器、2は鼻壁中央部付近
に取付けられ鼻腔内における音声の振動を検出す
る鼻振動検出器、3は口腔前方に配置し口気流を
検出する口気流検出器、4は口腔内口蓋に装着し
舌と口蓋との接触を検出する口蓋接触検出器であ
る。5は声帯振動検出器1、鼻振動検出器2、口
気流検出器3及び口蓋接触検出器4の出力から発
音特徴を抽出する処理装置で、以下第2図を用い
てさらに処理装置5における構成の詳細な説明を
行なう。 第2図において、6は声帯振動検出器1の声帯
振動情報から特定の値に基づいて声帯振動の有無
を決定する閾値回路、7は鼻振動検出器2の鼻振
動情報から特定の値に基づいて鼻振動の有無を決
定する閾値回路、8は口気流検出器3の口気流情
報を微分することにより口気流の変化率(加速
度)を求める微分回路、9は口気流の変化率の有
無を特定の値に基づいて決定する閾値回路、10
は口気流検出器3の口気流情報から特定の値に基
づいて口気流の有無を決定する閾値回路、11は
口蓋接触検出器4の口蓋接触情報を一旦測定回路
12により舌と口蓋との接触信号に変換した後に
後述する前舌閉鎖、後舌閉鎖及び閉鎖なしの3種
類の状態を判断する舌閉鎖検出回路、13は閾値
回路6,7,9,10から出力される各閾値情報
の有無、及び舌閉鎖検出回路11における3種類
の情報から音素分類を行なう音素分類回路であ
る。 上記のように構成された発音特徴抽出装置につ
いて、以下具体的な使用方法を第3図を用い説明
を行なう。 声帯振動検出部1として第3図に示すように加
速度センサー1′を医療用両面テープにより人体
における喉頭の声帯部に取り付けることにより、
声帯振動を検出する。検出された声帯振動は閾値
回路6に出力され、閾値回路6は声帯振動の値が
特定の値以上であれば音素分類回路13に有
(+)信号を、また一定の値以下であれば無(−)
信号を出力する。 また鼻振動検出器2として加速度センサー2′
を医療用両面テープにより人体における鼻壁中央
部付近に取り付けることにより、鼻振動を検出す
る。検出された鼻振動は閾値回路7に出力され、
閾値回路7は鼻振動の値が特定の値以上であれば
音素分類回路13に有(+)信号を、また一定の
値以下であれば無(−)信号を出力する。 また口気流検出器3として熱線流量計センサー
3′を人体における口腔前方の机上等に固定し配
置することにより、口気流の検出を行なう。検出
された口気流は微分回路8に出力され、微分回路
8では口気流の変化率を求めその変化率を閾値回
路9に出力する。そして閾値回路9は変化率の値
が特定の値以上であれば音素分類回路13に有
(+)信号を、また一定の値以下であれば無(−)
信号を出力する。一方熱線流量計センサー3′に
より検出された口気流は閾値回路10にも出力さ
れ、閾値回路10ではその口気流の値が特定値以
上であれば音素分類回路13に有(+)信号を、
また一定値以下であれば無(−)信号を出力す
る。 さらに口蓋接触検出器4としては第4図に示さ
れるような接触センサー4′を用いる。接触セン
サー4′は舌と接触する部分に多数の電極4′aを
有し、止め部4′bにより人体における口腔内口
上蓋に装着され、電極4′aにより舌との接触状
態を検出する。そして検出された電極4′aと舌
との接触状態は測定回路12及び舌閉鎖検出回路
11に順次入力され、接触状態が第5図イのよう
なパターンとなつた際には前舌閉鎖としての情報
が、第5図ロのようなパターンとなつた際には後
舌閉鎖としての情報が、また舌との接触がない場
合には閉鎖なしの情報が音素分類回路13に出力
される。 最終的に音素分類回路13では下表に示すよう
な内部の記憶テーブルから、閾値回路6,7,
9,10及び舌閉鎖検出回路11より入力した各
情報に基づいて音声を判断できる。
う発音特徴抽出装置に関するものである。 音声は肺から送り出された呼気流が喉頭に存す
る声帯を通過する際に声帯が振動することにより
声に変換され、口唇や鼻腔に至る呼気の通路が形
を変えることにより変調され、これら発声器管の
総合的な動きの結果、産声される。 さて従来、このような音声を抽出するには音響
マイクロホンにより音声波を電気信号に変換し、
所定の周波数帯域を有する多数のフイルタ回路に
入力し、各フイルタ回路の出力から判断して発音
を特徴づけていた。 しかし発声器管の総合的動きの結果である音声
を、音声波のみにより全ての音素の発音特徴を抽
出して音声認識を行なうことは極めて困難であ
る。とりわけ非定常的な子音については雑音エネ
ルギーが強く、音声波の中でほぼ確実な特徴抽出
ができる無声摩擦音/s,∫/等を除けば、無声
摩擦音/h/や無声破裂音/p,t,k/や有声
破裂音/b,d,g/や鼻音/m,n,η/等は
その検出及び分離は非常に困難なものである。 本発明は上記欠点に鑑み、発声器管各部の動き
を検出する検出器を発声器管各部の近傍に装着ま
たは配置し、前記各検出器からの出力を処理装置
により処理させることにより、従来よりも正確に
発音抽出ができる発音特徴抽出装置を提供するも
のである。 以下、図面を参照しながら本発明の一実施例に
ついて説明する。 第1図は本発明の一実施例における発音抽出装
置のブロツク構成を示すものである。同図におい
て、1は喉頭部声帯付近に取付けられ声帯の振動
を検出する声帯振動検出器、2は鼻壁中央部付近
に取付けられ鼻腔内における音声の振動を検出す
る鼻振動検出器、3は口腔前方に配置し口気流を
検出する口気流検出器、4は口腔内口蓋に装着し
舌と口蓋との接触を検出する口蓋接触検出器であ
る。5は声帯振動検出器1、鼻振動検出器2、口
気流検出器3及び口蓋接触検出器4の出力から発
音特徴を抽出する処理装置で、以下第2図を用い
てさらに処理装置5における構成の詳細な説明を
行なう。 第2図において、6は声帯振動検出器1の声帯
振動情報から特定の値に基づいて声帯振動の有無
を決定する閾値回路、7は鼻振動検出器2の鼻振
動情報から特定の値に基づいて鼻振動の有無を決
定する閾値回路、8は口気流検出器3の口気流情
報を微分することにより口気流の変化率(加速
度)を求める微分回路、9は口気流の変化率の有
無を特定の値に基づいて決定する閾値回路、10
は口気流検出器3の口気流情報から特定の値に基
づいて口気流の有無を決定する閾値回路、11は
口蓋接触検出器4の口蓋接触情報を一旦測定回路
12により舌と口蓋との接触信号に変換した後に
後述する前舌閉鎖、後舌閉鎖及び閉鎖なしの3種
類の状態を判断する舌閉鎖検出回路、13は閾値
回路6,7,9,10から出力される各閾値情報
の有無、及び舌閉鎖検出回路11における3種類
の情報から音素分類を行なう音素分類回路であ
る。 上記のように構成された発音特徴抽出装置につ
いて、以下具体的な使用方法を第3図を用い説明
を行なう。 声帯振動検出部1として第3図に示すように加
速度センサー1′を医療用両面テープにより人体
における喉頭の声帯部に取り付けることにより、
声帯振動を検出する。検出された声帯振動は閾値
回路6に出力され、閾値回路6は声帯振動の値が
特定の値以上であれば音素分類回路13に有
(+)信号を、また一定の値以下であれば無(−)
信号を出力する。 また鼻振動検出器2として加速度センサー2′
を医療用両面テープにより人体における鼻壁中央
部付近に取り付けることにより、鼻振動を検出す
る。検出された鼻振動は閾値回路7に出力され、
閾値回路7は鼻振動の値が特定の値以上であれば
音素分類回路13に有(+)信号を、また一定の
値以下であれば無(−)信号を出力する。 また口気流検出器3として熱線流量計センサー
3′を人体における口腔前方の机上等に固定し配
置することにより、口気流の検出を行なう。検出
された口気流は微分回路8に出力され、微分回路
8では口気流の変化率を求めその変化率を閾値回
路9に出力する。そして閾値回路9は変化率の値
が特定の値以上であれば音素分類回路13に有
(+)信号を、また一定の値以下であれば無(−)
信号を出力する。一方熱線流量計センサー3′に
より検出された口気流は閾値回路10にも出力さ
れ、閾値回路10ではその口気流の値が特定値以
上であれば音素分類回路13に有(+)信号を、
また一定値以下であれば無(−)信号を出力す
る。 さらに口蓋接触検出器4としては第4図に示さ
れるような接触センサー4′を用いる。接触セン
サー4′は舌と接触する部分に多数の電極4′aを
有し、止め部4′bにより人体における口腔内口
上蓋に装着され、電極4′aにより舌との接触状
態を検出する。そして検出された電極4′aと舌
との接触状態は測定回路12及び舌閉鎖検出回路
11に順次入力され、接触状態が第5図イのよう
なパターンとなつた際には前舌閉鎖としての情報
が、第5図ロのようなパターンとなつた際には後
舌閉鎖としての情報が、また舌との接触がない場
合には閉鎖なしの情報が音素分類回路13に出力
される。 最終的に音素分類回路13では下表に示すよう
な内部の記憶テーブルから、閾値回路6,7,
9,10及び舌閉鎖検出回路11より入力した各
情報に基づいて音声を判断できる。
【表】
【表】
さてたとえば第6図イに示すような音素波を有
する「hana」という音声を発声すると、加速度
センサー1′は第6図ロのような波形を閾値回路
6に出力する。そして閾値回路6では特定の閾値
から判断して「h」の部分では無(−)信号を、
「n」の部分では有(+)信号を音素分類回路1
3に出力する。 また加速度センサー1′は第6図ハのような波
形を閾値回路7に出力する。そして閾値回路7で
は特定の閾値から判断して「h」の部分では無
(−)信号を、「n」の部分では有(+)信号を音
素分類回路13に出力する。 さらに熱線流量計センサー3′では第6図ニの
ような波形を微分回路8及び閾値回路10に出力
する。そして閾値回路9では微分回路8からの微
分値を特定の閾値から判断して「h」及び「n」
の部分で無(−)信号を音素分類回路13に出力
する。また閾値回路10でも特定の閾値から判断
して「h」の部分では有(+)信号を、「n」の
部分では無(−)信号を音素分類回路13に出力
する。 一方接触センサー4′は電極4aと舌との接触
状態を検出し、測定回路12を介して舌閉鎖検出
回路11に出力する。そして舌閉鎖検出回路11
では「h」の部分で接触パターンにより「閉鎖な
し」の情報を、また「n」の部分では「前舌閉
鎖」の情報を音素分類回路13に出力する。 そして音素分類回路13では各情報に基づいて
表に示したような内部の記憶テーブルから「h」
及び「n」を認識することができる。 以上のように、声帯振動検出器1、鼻振動検出
器2、口気流検出器3及び口蓋接触検出器4によ
り各発声器管の動きを検出し、処理装置5により
各検出器が検出した情報に基づいてあらかじめ記
憶しているテーブルの中から特定の音素を決定す
ることにより、従来困難であつた音声の認識を正
確に行なうことができる。 以上のように本発明は声帯振動検出器が検出し
た声帯の振動情報と、鼻振動検出器が検出した鼻
腔内の振動情報と、口気流検出器が検出した口気
流情報と、口蓋接触検出器が検出した舌と口蓋と
の接触情報とに基づいて従来よりも正確に破裂音
および鼻音の各音素を識別することができ、その
実用的効果は大なるものがある。
する「hana」という音声を発声すると、加速度
センサー1′は第6図ロのような波形を閾値回路
6に出力する。そして閾値回路6では特定の閾値
から判断して「h」の部分では無(−)信号を、
「n」の部分では有(+)信号を音素分類回路1
3に出力する。 また加速度センサー1′は第6図ハのような波
形を閾値回路7に出力する。そして閾値回路7で
は特定の閾値から判断して「h」の部分では無
(−)信号を、「n」の部分では有(+)信号を音
素分類回路13に出力する。 さらに熱線流量計センサー3′では第6図ニの
ような波形を微分回路8及び閾値回路10に出力
する。そして閾値回路9では微分回路8からの微
分値を特定の閾値から判断して「h」及び「n」
の部分で無(−)信号を音素分類回路13に出力
する。また閾値回路10でも特定の閾値から判断
して「h」の部分では有(+)信号を、「n」の
部分では無(−)信号を音素分類回路13に出力
する。 一方接触センサー4′は電極4aと舌との接触
状態を検出し、測定回路12を介して舌閉鎖検出
回路11に出力する。そして舌閉鎖検出回路11
では「h」の部分で接触パターンにより「閉鎖な
し」の情報を、また「n」の部分では「前舌閉
鎖」の情報を音素分類回路13に出力する。 そして音素分類回路13では各情報に基づいて
表に示したような内部の記憶テーブルから「h」
及び「n」を認識することができる。 以上のように、声帯振動検出器1、鼻振動検出
器2、口気流検出器3及び口蓋接触検出器4によ
り各発声器管の動きを検出し、処理装置5により
各検出器が検出した情報に基づいてあらかじめ記
憶しているテーブルの中から特定の音素を決定す
ることにより、従来困難であつた音声の認識を正
確に行なうことができる。 以上のように本発明は声帯振動検出器が検出し
た声帯の振動情報と、鼻振動検出器が検出した鼻
腔内の振動情報と、口気流検出器が検出した口気
流情報と、口蓋接触検出器が検出した舌と口蓋と
の接触情報とに基づいて従来よりも正確に破裂音
および鼻音の各音素を識別することができ、その
実用的効果は大なるものがある。
第1図は本発明の一実施例における発音特徴抽
出装置のブロツク図、第2図は同発音特徴抽出装
置における処理装置のブロツク図、第3図は同発
音特徴抽出装置の使用例を示す図、第4図は接触
センサーの平面図、第5図は舌と口蓋との接触パ
ターンを示す図、第6図は各検出器の波形図であ
る。 1……声帯振動検出器、2……鼻振動検出器、
3……口気流検出器、4……口蓋接触検出器、5
……処理装置。
出装置のブロツク図、第2図は同発音特徴抽出装
置における処理装置のブロツク図、第3図は同発
音特徴抽出装置の使用例を示す図、第4図は接触
センサーの平面図、第5図は舌と口蓋との接触パ
ターンを示す図、第6図は各検出器の波形図であ
る。 1……声帯振動検出器、2……鼻振動検出器、
3……口気流検出器、4……口蓋接触検出器、5
……処理装置。
Claims (1)
- 1 喉頭部に取り付けた声帯振動検出器と、鼻部
に取り付けた鼻振動検出器と、口腔前方に配置し
た口気流検出器と、舌と口蓋の接触を検出する口
蓋接触検出器とを備えかつ、口気流検出器の出力
に基づいて破裂音p,t,k,b,d,gおよび
hのグループを抽出し、鼻振動検出器の出力に基
づいて鼻音m,n、を抽出し、声帯振動検出器の
出力に基づいてp,t,k,hとb,d,gとを
分離し、口蓋接触検出器の出力に基づいてp,
h,t,k,b,d,g,m,n、とに分離、識
別し、さらに口気流検出器の出力にもとづく口気
流の変化率によりpとhを分離する処理装置とを
具備したことを特徴とする発音特徴抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3242682A JPS58150997A (ja) | 1982-03-03 | 1982-03-03 | 発音特徴抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3242682A JPS58150997A (ja) | 1982-03-03 | 1982-03-03 | 発音特徴抽出装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58150997A JPS58150997A (ja) | 1983-09-07 |
| JPH036520B2 true JPH036520B2 (ja) | 1991-01-30 |
Family
ID=12358621
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3242682A Granted JPS58150997A (ja) | 1982-03-03 | 1982-03-03 | 発音特徴抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58150997A (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6111021A (ja) * | 1984-06-26 | 1986-01-18 | 工業技術院長 | 発話訓練装置 |
| CA2422811A1 (en) | 2000-09-19 | 2002-03-28 | Samuel G. Fletcher | Palatometer and nasometer apparatus |
| AU2002236483A1 (en) | 2000-11-15 | 2002-05-27 | Logometrix Corporation | Method for utilizing oral movement and related events |
| TWI576826B (zh) * | 2014-07-28 | 2017-04-01 | jing-feng Liu | Discourse Recognition System and Unit |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5923834B2 (ja) * | 1973-05-14 | 1984-06-05 | 三菱電機株式会社 | 2本針縫製装置 |
-
1982
- 1982-03-03 JP JP3242682A patent/JPS58150997A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58150997A (ja) | 1983-09-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7529670B1 (en) | Automatic speech recognition system for people with speech-affecting disabilities | |
| Stevens et al. | A miniature accelerometer for detecting glottal waveforms and nasalization | |
| Philips et al. | Acoustic–phonetic descriptions of speech production in speakers with cleft palate and other velopharyngeal disorders | |
| JPS6129000B2 (ja) | ||
| JPH036520B2 (ja) | ||
| JPH036519B2 (ja) | ||
| Demolin et al. | Whispery voiced nasal stops in rwanda. | |
| JP2000276191A (ja) | 音声認識方法 | |
| Slifka | Respiratory constraints on speech production: Starting an utterance | |
| JPH0139600B2 (ja) | ||
| JPH0475520B2 (ja) | ||
| Garnier et al. | Efforts and coordination in the production of bilabial consonants | |
| JPH025099A (ja) | 有声無声無音表示装置 | |
| JPH034919B2 (ja) | ||
| JPS60238899A (ja) | 呼気流検出装置 | |
| JPS6331795B2 (ja) | ||
| JPS6258519B2 (ja) | ||
| JPS63175897A (ja) | 呼気流検出装置 | |
| Hu et al. | Acoustic Study of Mongolian Unaspirated and Aspirated Consonants | |
| Demolin et al. | Double articulations in some Mangbutu-Efe languages | |
| JPS6329760B2 (ja) | ||
| JPS60238898A (ja) | 単音節認識方法 | |
| JPS616696A (ja) | 破裂性検出装置 | |
| JPS6329759B2 (ja) | ||
| Koenig et al. | The time course of intraoral pressure changes during the formation and release of consonants and consonant clusters of German |