JPS62174800A - 外国語母音の模範発音出力装置 - Google Patents
外国語母音の模範発音出力装置Info
- Publication number
- JPS62174800A JPS62174800A JP61017057A JP1705786A JPS62174800A JP S62174800 A JPS62174800 A JP S62174800A JP 61017057 A JP61017057 A JP 61017057A JP 1705786 A JP1705786 A JP 1705786A JP S62174800 A JPS62174800 A JP S62174800A
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- foreign language
- waveform
- partial autocorrelation
- vowels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は英語、フランス語、ドイツ語等、外国語の母音
発音の習得に際して用いることのできる外国語母音の模
範発音出力装置に関するものである。
発音の習得に際して用いることのできる外国語母音の模
範発音出力装置に関するものである。
従来の技術
従来、外国語の母音発音の習得にはカセットテープに録
音されている先生の模範発音をテープレコーダーによっ
て繰り返し再生して聴く方法が一般的であったが、近年
、音声の分析・合成技術の進歩によって、音声を声帯振
動特性と声道伝達特性とに分離し、また逆に声帯振動特
性と声道伝達特性とから音声を合成再生する偏自己相関
係数や線スペクトル対方式の音声分析合成装置が実用化
されてきている。さらにこれらの合成装置の主要部であ
る合成フィルターを中心としてLSI化されており、子
供向けの学習機器をはじめとして様々な分野に応用され
ている。外国語母音の模範発音出力装置もその応用の一
つと考えられる。
音されている先生の模範発音をテープレコーダーによっ
て繰り返し再生して聴く方法が一般的であったが、近年
、音声の分析・合成技術の進歩によって、音声を声帯振
動特性と声道伝達特性とに分離し、また逆に声帯振動特
性と声道伝達特性とから音声を合成再生する偏自己相関
係数や線スペクトル対方式の音声分析合成装置が実用化
されてきている。さらにこれらの合成装置の主要部であ
る合成フィルターを中心としてLSI化されており、子
供向けの学習機器をはじめとして様々な分野に応用され
ている。外国語母音の模範発音出力装置もその応用の一
つと考えられる。
以下、図面を参照しながら、上述した従来の外国語母音
の模範発音出力装置の一例について説明する。第2図は
従来の外国語母音の模範発音出力装置の要部ブロック図
である。同図において21は残差波形記憶部、22は偏
自己相関係数記憶部、23は波形合成部、24は音声出
力部である。
の模範発音出力装置の一例について説明する。第2図は
従来の外国語母音の模範発音出力装置の要部ブロック図
である。同図において21は残差波形記憶部、22は偏
自己相関係数記憶部、23は波形合成部、24は音声出
力部である。
以上のように構成された従来の外国語母音の模範発音出
力装置について、その動作を以下に説明する。模範話者
の発声した外国語母音をあらかじめ線形予測分析して、
残差波形および偏自己相関係数を求めておき、残差波形
を残差波形記憶部21に、偏自己相関係数を偏自己相関
係数記憶部22に記憶させる。波形合成部23は上記残
差波形と偏自己相関係数を読み出してきて、偏自己相関
係数で音声波形を合成する。合成された音声波形データ
は波形出力部24によりD/A変換されて出力される。
力装置について、その動作を以下に説明する。模範話者
の発声した外国語母音をあらかじめ線形予測分析して、
残差波形および偏自己相関係数を求めておき、残差波形
を残差波形記憶部21に、偏自己相関係数を偏自己相関
係数記憶部22に記憶させる。波形合成部23は上記残
差波形と偏自己相関係数を読み出してきて、偏自己相関
係数で音声波形を合成する。合成された音声波形データ
は波形出力部24によりD/A変換されて出力される。
発明が解決しようとする問題点
上記のような構成の外国語母音の模範発音出力装置にお
いては、あらかじめ用意された模範話者の声質が必ずし
も学習者の声質に一致しない、学習効果の上からは、出
来るだけ模範話者の声質は学習者の声質に近いことが望
ましい。これを解決するためには性別、年令の異なる多
数の模範話者の母音発音の残差波形および偏自己相関係
数を記憶しておかなければならないことになり、また学
習者にとっても多数の模範話者の母音発音を聞き較べ、
自分に最も声質の近い模範話者を選ぶという余分な作業
を強いられるのものとなる。
いては、あらかじめ用意された模範話者の声質が必ずし
も学習者の声質に一致しない、学習効果の上からは、出
来るだけ模範話者の声質は学習者の声質に近いことが望
ましい。これを解決するためには性別、年令の異なる多
数の模範話者の母音発音の残差波形および偏自己相関係
数を記憶しておかなければならないことになり、また学
習者にとっても多数の模範話者の母音発音を聞き較べ、
自分に最も声質の近い模範話者を選ぶという余分な作業
を強いられるのものとなる。
本発明はかかる点に鑑みてなされたもので、学習者の声
質に近い発声で外国語母音の模範発音を自動的に合成、
出力することのできる外国語母音の模範発音出力装置を
提供することを目的としている。
質に近い発声で外国語母音の模範発音を自動的に合成、
出力することのできる外国語母音の模範発音出力装置を
提供することを目的としている。
問題点を解決するための手段
本発明は上記問題点を解決するため、学習者の母国語母
音声を所定のサンプリング周波数でA/D変換する音声
入力部と、上記ディジタル化された音声波形データを一
定時間ごとに線形予測分析して偏自己相関係数および残
差波形を求める音響分析部と、あらかじめ用意された複
数話者の母国語母音の偏自己相関係数を記憶しておく母
国語母音テンプレート部と、上記母国語母音テンプレー
ト部と同一複数話者の外国語母音の偏自己相関係数を記
憶しておく外国語母音テンプレート部と、上記学習者の
母国語母音の偏自己相関係数と上記複数話者の母国語母
音の偏自己相関係数との類似度を算出して最も類似した
話者を最頬以話者として、選択する最類似話者選択部と
を備えたものである。
音声を所定のサンプリング周波数でA/D変換する音声
入力部と、上記ディジタル化された音声波形データを一
定時間ごとに線形予測分析して偏自己相関係数および残
差波形を求める音響分析部と、あらかじめ用意された複
数話者の母国語母音の偏自己相関係数を記憶しておく母
国語母音テンプレート部と、上記母国語母音テンプレー
ト部と同一複数話者の外国語母音の偏自己相関係数を記
憶しておく外国語母音テンプレート部と、上記学習者の
母国語母音の偏自己相関係数と上記複数話者の母国語母
音の偏自己相関係数との類似度を算出して最も類似した
話者を最頬以話者として、選択する最類似話者選択部と
を備えたものである。
作用
本発明は上記した構成により、学習者の母国語母音音声
から求めた残差波形を外国語母音の模範発音波形合成の
際の音源として用いることにより、外国語母音の模範発
音の声質を学習者の声質に近いものにするとともに、同
様に学習者の母国語母音音声から求めた偏自己相関係数
と複数話者の偏自己相関係数との類似度を算出すること
により、母国語母音発声時において声道伝達特性が最も
学習者に類似している話者を最類似話者として選び出し
、この最類似話者の外国語母音音声の偏自己相関係数を
もって学習者の模範とすべき声道伝達特性を近似するも
のである。
から求めた残差波形を外国語母音の模範発音波形合成の
際の音源として用いることにより、外国語母音の模範発
音の声質を学習者の声質に近いものにするとともに、同
様に学習者の母国語母音音声から求めた偏自己相関係数
と複数話者の偏自己相関係数との類似度を算出すること
により、母国語母音発声時において声道伝達特性が最も
学習者に類似している話者を最類似話者として選び出し
、この最類似話者の外国語母音音声の偏自己相関係数を
もって学習者の模範とすべき声道伝達特性を近似するも
のである。
実施例
以下、本発明の一実施例の外国語母音の模範発音出力装
置について図面を参照しながら説明する。
置について図面を参照しながら説明する。
第1図は本発明の外国語母音の模範発音出力装置の一実
施例を示す要部ブロック図である。
施例を示す要部ブロック図である。
第1図において11は学習者の母国語母音音声を所定の
サンプリング周波数でA/D変換する音声入力部、12
は上記ディジタル化された音声波形データを一定時間ご
とに線形予測分析して偏自己相関係数および残差波形を
求める音響分析部、13は上記残差波形を記憶しておく
残差波形記憶部、14はあらかじめ用意された複数話者
の母国語母音の偏自己相関係数を記憶しておく母国語母
音テンプレート部、15は上記母国語母音テンプレート
部と同一複数話者の外国語母音の偏自己相関係数を記憶
しておく外国語母音テンプレート部、16は上記学習者
の母国語母音の偏自己相関係数と上記複数話者の母国語
母音の偏自己相関係数との類似度を算出して、最もR4
glLだ話者を最類似話者として選択する最類似話者選
択部、17は上記学習者の母国語母音の残差波形と上記
最類似話者の外国語母音の偏自己相関係数とから、学習
者の模範とすべき外国語母音の音声波形を合成する波形
合成部、18は上記合成波形データをD/A変換して出
力する音声出力部である。
サンプリング周波数でA/D変換する音声入力部、12
は上記ディジタル化された音声波形データを一定時間ご
とに線形予測分析して偏自己相関係数および残差波形を
求める音響分析部、13は上記残差波形を記憶しておく
残差波形記憶部、14はあらかじめ用意された複数話者
の母国語母音の偏自己相関係数を記憶しておく母国語母
音テンプレート部、15は上記母国語母音テンプレート
部と同一複数話者の外国語母音の偏自己相関係数を記憶
しておく外国語母音テンプレート部、16は上記学習者
の母国語母音の偏自己相関係数と上記複数話者の母国語
母音の偏自己相関係数との類似度を算出して、最もR4
glLだ話者を最類似話者として選択する最類似話者選
択部、17は上記学習者の母国語母音の残差波形と上記
最類似話者の外国語母音の偏自己相関係数とから、学習
者の模範とすべき外国語母音の音声波形を合成する波形
合成部、18は上記合成波形データをD/A変換して出
力する音声出力部である。
以上のように構成された外国語母音の模範発音出力装置
について、以下その動作を説明する。
について、以下その動作を説明する。
第3図は音声入力部のブロック図である。学習者の母国
語母音音声はマイクロホンから取り込まれ、増幅器によ
って増幅されたのち、4.5Kbカツトオフのローパス
フィルタを通って、サンプリング周波数10KI(2で
A/D変換され、音声バッファに一時記憶される。
語母音音声はマイクロホンから取り込まれ、増幅器によ
って増幅されたのち、4.5Kbカツトオフのローパス
フィルタを通って、サンプリング周波数10KI(2で
A/D変換され、音声バッファに一時記憶される。
第4図は音響分析部における処理フロー図である。音声
バッファに記憶されている音声波形データを順次1フレ
ーム(20ms)単位で取り出し、ハミング窓掛け、プ
リエンファシスの処理を施して自己相関係数を算出し、
Durbin法によって12次の偏自己相関係数を算出
する。さらにこの偏自己相関係数で構成される格子型フ
ィルタに改めてこのフレームの音声波形データを通すこ
とにより、残差波形が求められる。
バッファに記憶されている音声波形データを順次1フレ
ーム(20ms)単位で取り出し、ハミング窓掛け、プ
リエンファシスの処理を施して自己相関係数を算出し、
Durbin法によって12次の偏自己相関係数を算出
する。さらにこの偏自己相関係数で構成される格子型フ
ィルタに改めてこのフレームの音声波形データを通すこ
とにより、残差波形が求められる。
第5図は母国語母音テンプレート部に記憶されている複
数話者の母国語母音の偏自己相関係数の内容を示す図で
ある。ここで母国語は日本語とし、10名の話者の日本
語5母音、ア、イ、つ、工、オの12次の偏自己相関係
数を記憶しているものとする。母音番号をア、イ、・・
・・・・の順に1.2゜・・・・・・とすると第1話者
の日本語第j母音の第p次の偏自己相関係数はjKpで
表わされる。
数話者の母国語母音の偏自己相関係数の内容を示す図で
ある。ここで母国語は日本語とし、10名の話者の日本
語5母音、ア、イ、つ、工、オの12次の偏自己相関係
数を記憶しているものとする。母音番号をア、イ、・・
・・・・の順に1.2゜・・・・・・とすると第1話者
の日本語第j母音の第p次の偏自己相関係数はjKpで
表わされる。
一方、外国語は英語とし、外国語母音テンプレート部に
は10名の話者の英語8単母音、1:。
は10名の話者の英語8単母音、1:。
r、e、de、A、a、U、l’の12次の偏自己相関
係数を記憶しているものとする。
係数を記憶しているものとする。
学習者が日本語5母音、ア、イ、つ、工、オを発声する
と、それぞれの音声は音声人力部11によってA/D変
換されたのち、音響分析部12によって12次の偏自己
相関係数および残差波形が算出される。残差波形は残差
波形記憶部13へ送られ、記憶される。12次の偏自己
相関係数は最類似話者選択部16へ送られる。ここで学
習者の日本語第j母音の第p次の偏自己相関係数をjK
′Pで表すものとする。最類似話者選択部16において
は、母国語母音テンプレート部14に記憶されている1
0名の話者のおのおのに対して学習者の母音との偏自己
相関係数のユークリッド距離の5母音の合計値を話者類
似度として求める。学習者と第j話者類(以度diは次
式で示される。
と、それぞれの音声は音声人力部11によってA/D変
換されたのち、音響分析部12によって12次の偏自己
相関係数および残差波形が算出される。残差波形は残差
波形記憶部13へ送られ、記憶される。12次の偏自己
相関係数は最類似話者選択部16へ送られる。ここで学
習者の日本語第j母音の第p次の偏自己相関係数をjK
′Pで表すものとする。最類似話者選択部16において
は、母国語母音テンプレート部14に記憶されている1
0名の話者のおのおのに対して学習者の母音との偏自己
相関係数のユークリッド距離の5母音の合計値を話者類
似度として求める。学習者と第j話者類(以度diは次
式で示される。
5 この話者類似度diが最小となる話者を最類似話者
として選択する。ここで第1話者が最類似話者として選
択されたものとする。この最類似話者情報は外国語母音
テンプレート部15へ送られる。
として選択する。ここで第1話者が最類似話者として選
択されたものとする。この最類似話者情報は外国語母音
テンプレート部15へ送られる。
波形合成部17は残差波形記憶部13に記憶されている
学習者の日本語母音の残差波形を音源とし、外国語母音
テンプレート部に記憶されている最類似話者の英語母音
の偏自己相関係数によって声道フィルタを構成して、偏
自己相関係数により音声波形を合成する。音声出力部1
Bは上記合成波形データをD/A変換して出力する。
学習者の日本語母音の残差波形を音源とし、外国語母音
テンプレート部に記憶されている最類似話者の英語母音
の偏自己相関係数によって声道フィルタを構成して、偏
自己相関係数により音声波形を合成する。音声出力部1
Bは上記合成波形データをD/A変換して出力する。
発明の効果
以上のように本発明は、学習者の母国語母音音声を所定
のサンプリング周波数でA/D変換する音声入力部と、
上記ディジタル化された音声波形データを一定時間ごと
に線形予測分析して偏自己相関係数および残差波形を求
める音響分析部と、上記残差波形を記憶しておく残差波
形記憶部と、あらかじめ用意された複数話者の母国語母
音の偏自己相関係数を記憶しておく母国語母音テンブレ
ー1部と、上記母国語母音テンプレート部と同一複数話
者の外国語母音の偏自己相関係数を記憶しておく外国語
母音テンプレート部と、上記学習者の母国語母音の偏自
己相関係数と上記複数話者の母国語母音の偏自己相関係
数との類似度を算出して最も類似した話者を最類似話者
として選択する最類似話者選択部と、上記学習者の母国
語母音の残差波形と上記最類似話者の外国語母音の偏自
己相関係数とから、学習者の模範とすべき外国語母音の
音声波形を合成する波形合成部と、上記合成波形データ
をD/A変換して出力する音声出力部とを備えることに
より、学習者の声質に近い外国語母音の模範発音を合成
、出力することができるという優れた効果が得られる。
のサンプリング周波数でA/D変換する音声入力部と、
上記ディジタル化された音声波形データを一定時間ごと
に線形予測分析して偏自己相関係数および残差波形を求
める音響分析部と、上記残差波形を記憶しておく残差波
形記憶部と、あらかじめ用意された複数話者の母国語母
音の偏自己相関係数を記憶しておく母国語母音テンブレ
ー1部と、上記母国語母音テンプレート部と同一複数話
者の外国語母音の偏自己相関係数を記憶しておく外国語
母音テンプレート部と、上記学習者の母国語母音の偏自
己相関係数と上記複数話者の母国語母音の偏自己相関係
数との類似度を算出して最も類似した話者を最類似話者
として選択する最類似話者選択部と、上記学習者の母国
語母音の残差波形と上記最類似話者の外国語母音の偏自
己相関係数とから、学習者の模範とすべき外国語母音の
音声波形を合成する波形合成部と、上記合成波形データ
をD/A変換して出力する音声出力部とを備えることに
より、学習者の声質に近い外国語母音の模範発音を合成
、出力することができるという優れた効果が得られる。
4、発明の詳細な説明
第1図は本発明の一実施例に係る外国語母音の模範発音
出力装置の要部ブロック図、第2図は従来の外国語母音
の模範発音出力装置の要部ブロック図、第3図は音声入
力部のブロック図、第4図は音響分析部の処理フロー図
、第5図は母国語母音テンプレート部の記憶内容を示す
図である。
出力装置の要部ブロック図、第2図は従来の外国語母音
の模範発音出力装置の要部ブロック図、第3図は音声入
力部のブロック図、第4図は音響分析部の処理フロー図
、第5図は母国語母音テンプレート部の記憶内容を示す
図である。
11・・・・・・音声入力部、12・・・・・・音響分
析部、13・・・・・・残差波形記憶部、14・・・・
・・母国語母音テンプレート部、15・・・・・・外国
語母音テンプレート部、16・・・・・・最類似話者選
択部、17・・・・・・波形合成部、18・・・・・・
音声出力部、21・・・・・・残差波形記憶部、22・
・・・・・偏自己相関係数記憶部、23・・・・・・波
形合成部、24・・・・・・音声出力部。
析部、13・・・・・・残差波形記憶部、14・・・・
・・母国語母音テンプレート部、15・・・・・・外国
語母音テンプレート部、16・・・・・・最類似話者選
択部、17・・・・・・波形合成部、18・・・・・・
音声出力部、21・・・・・・残差波形記憶部、22・
・・・・・偏自己相関係数記憶部、23・・・・・・波
形合成部、24・・・・・・音声出力部。
代理人の氏名 弁理士 中尾敏男 はか1名第4図
第5図
Claims (1)
- 学習者の母国語母音音声を所定のサンプリング周波数で
A/D変換する音声入力部と、上記ディジタル化された
音声波形データを一定時間ごとに線形予測分析して偏自
己相関係数および残差波形を求める音響分析部と、上記
残差波形を記憶しておく残差波形記憶部と、あらかじめ
用意された複数話者の母国語母音の偏自己相関係数を記
憶しておく母国語母音テンプレート部と、上記母国語母
音テンプレート部と同一複数話者の外国語母音の偏自己
相関係数を記憶しておく外国語母音テンプレート部と、
上記学習者の母国語母音の偏自己相関係数と上記複数話
者の母国語母音の偏自己相関係数との類似度を算出して
最も類似した話者を最類似話者として選択する最類似話
者選択部と、上記学習者の母国語母音の残差波形と上記
最類似話者の外国語母音の偏自己相関係数とから、学習
者の模範とすべき外国語母音の音声波形を合成する波形
合成部と、上記合成波形データをD/A変換して出力す
る音声出力部とを具備してなることを特徴とする外国語
母音の模範発音出力装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61017057A JPS62174800A (ja) | 1986-01-29 | 1986-01-29 | 外国語母音の模範発音出力装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61017057A JPS62174800A (ja) | 1986-01-29 | 1986-01-29 | 外国語母音の模範発音出力装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS62174800A true JPS62174800A (ja) | 1987-07-31 |
Family
ID=11933355
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61017057A Pending JPS62174800A (ja) | 1986-01-29 | 1986-01-29 | 外国語母音の模範発音出力装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62174800A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10177396A (ja) * | 1996-12-18 | 1998-06-30 | Brother Ind Ltd | 音声合成装置及び発音訓練装置 |
| JP2007140002A (ja) * | 2005-11-17 | 2007-06-07 | Oki Electric Ind Co Ltd | 音声合成装置,音声合成方法,およびコンピュータプログラム |
-
1986
- 1986-01-29 JP JP61017057A patent/JPS62174800A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10177396A (ja) * | 1996-12-18 | 1998-06-30 | Brother Ind Ltd | 音声合成装置及び発音訓練装置 |
| JP2007140002A (ja) * | 2005-11-17 | 2007-06-07 | Oki Electric Ind Co Ltd | 音声合成装置,音声合成方法,およびコンピュータプログラム |
| US7739113B2 (en) | 2005-11-17 | 2010-06-15 | Oki Electric Industry Co., Ltd. | Voice synthesizer, voice synthesizing method, and computer program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2004063902B1 (en) | Speech training method with color instruction | |
| JPH0876788A (ja) | 音声認識における混同しやすい語の検出方法 | |
| JP2023007405A (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
| Nafis et al. | Speech to text conversion in real-time | |
| JP2844817B2 (ja) | 発声練習用音声合成方式 | |
| JPS62174800A (ja) | 外国語母音の模範発音出力装置 | |
| Kamble et al. | Audio Visual Speech Synthesis and Speech Recognition for Hindi Language | |
| Blomberg et al. | Collection and recognition of children’s speech in the PF-Star project | |
| JPS616732A (ja) | 発声訓練装置 | |
| JPH0950286A (ja) | 音声合成装置及びこれに使用する記録媒体 | |
| JPH10333699A (ja) | 音声認識および音声合成装置 | |
| Jeyalakshmi et al. | Alphabet model-based short vocabulary speech recognition for the assessment of profoundly deaf and hard of hearing speeches | |
| JP3034554B2 (ja) | 日本語文章読上げ装置及び方法 | |
| JP2908720B2 (ja) | 合成を基本とした会話訓練装置及び方法 | |
| JP5028599B2 (ja) | 音声処理装置、およびプログラム | |
| JPS63131191A (ja) | 規則型音声合成装置 | |
| JP2001228890A (ja) | 音声認識装置 | |
| Oo et al. | Normal and whispered speech recognition systems for Myanmar digits | |
| JPH08328575A (ja) | 音声合成装置 | |
| JPS62113264A (ja) | 音声文書作成装置 | |
| JPH1165410A (ja) | 発音練習装置 | |
| JP2004145237A (ja) | 翻訳機能付対話式人形 | |
| JPH03252700A (ja) | 発声練習用音声合成方式 | |
| Abdelhamied et al. | A two-step segmentation method for automatic recognition of speech of persons who are deaf. | |
| Lea | Evaluating Speech‐Recognition Work |