JPS6410080B2 - - Google Patents
Info
- Publication number
- JPS6410080B2 JPS6410080B2 JP56213731A JP21373181A JPS6410080B2 JP S6410080 B2 JPS6410080 B2 JP S6410080B2 JP 56213731 A JP56213731 A JP 56213731A JP 21373181 A JP21373181 A JP 21373181A JP S6410080 B2 JPS6410080 B2 JP S6410080B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- speech
- section
- syllable
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
(1) 発明の技術分野
本発明は入力音声パターンの最後尾音節の無声
化又は非無声化に拘らずその入力音声パターンを
認識させ得る標準パターンを登録しうる標準パタ
ーン登録方式に関する。
化又は非無声化に拘らずその入力音声パターンを
認識させ得る標準パターンを登録しうる標準パタ
ーン登録方式に関する。
(2) 技術の背景
音声認識システムにおける認識手段の1つとし
て予め標準パターンを登録しておき、このパター
ンと入力音声パターンとを照合してその一致から
入力音声を認識する技法が用いられている。この
技法において、入力音声パターンの最後尾音節が
言葉によつては無声化してしまい、音声認識上の
1つの障害となつている。
て予め標準パターンを登録しておき、このパター
ンと入力音声パターンとを照合してその一致から
入力音声を認識する技法が用いられている。この
技法において、入力音声パターンの最後尾音節が
言葉によつては無声化してしまい、音声認識上の
1つの障害となつている。
(3) 従来技術と問題点
このような不都合を解決すべく、最後尾音節が
無声化し易い言葉については何回かその言葉を発
声し、その平均化したパターンを標準パターンと
して登録しておき、認識すべき入力音声パターン
との照合を行うか、上記発声して得られたパター
ンを複数個登録してこれと音声認識のための照合
を行う如き技法が用いられている。
無声化し易い言葉については何回かその言葉を発
声し、その平均化したパターンを標準パターンと
して登録しておき、認識すべき入力音声パターン
との照合を行うか、上記発声して得られたパター
ンを複数個登録してこれと音声認識のための照合
を行う如き技法が用いられている。
しかしながら、これらは標準パターンの登録に
際して使用者に負担をかける割に認識率の向上が
望めないばかりでなく、上記後者の技法にあつて
は標準パターンを登録しておくための記憶容量の
増大も避けられない。
際して使用者に負担をかける割に認識率の向上が
望めないばかりでなく、上記後者の技法にあつて
は標準パターンを登録しておくための記憶容量の
増大も避けられない。
(4) 発明の目的
本発明は上述の如き従来技法の有する欠点に鑑
みて創案されたもので、その目的は使用者に負担
をかけず認識率の向上を促し、しかも記憶容量の
増大もない標準パターン登録方式を提供すること
にある。
みて創案されたもので、その目的は使用者に負担
をかけず認識率の向上を促し、しかも記憶容量の
増大もない標準パターン登録方式を提供すること
にある。
(5) 発明の構成
そして、この目的は最後尾音節が無声化し易い
単語の標準パターンの登録に際し、その単語の発
声された音声パターンの最後尾音節を、平均音声
パターンから得られる無声化した最後尾音節及び
無声化していない最後尾音節と入れ替えて第1及
び第2の合成音声パターンを発生し、これら合成
音声パターンと上記発声された音声パターンとを
照合して照合距離の大きい合成音声パターン及び
上記発声された音声パターンを標準パターンとし
て登録することによつて達成される。
単語の標準パターンの登録に際し、その単語の発
声された音声パターンの最後尾音節を、平均音声
パターンから得られる無声化した最後尾音節及び
無声化していない最後尾音節と入れ替えて第1及
び第2の合成音声パターンを発生し、これら合成
音声パターンと上記発声された音声パターンとを
照合して照合距離の大きい合成音声パターン及び
上記発声された音声パターンを標準パターンとし
て登録することによつて達成される。
(6) 発明の実施例
以下、添付図面を参照しながら、本発明の実施
例を説明する。
例を説明する。
第1図は本発明方式を実施した音声認識システ
ムを示す。1はマイクロホン、2は周波数分析
部、3はパラメータ抽出部、4はセグメンテーシ
ヨン部、5はパターンバツフア、6は切換え手
段、7はパターン照合部、8は標準パターン記憶
部で、これらは従来の音声認識システムを構成し
ている。
ムを示す。1はマイクロホン、2は周波数分析
部、3はパラメータ抽出部、4はセグメンテーシ
ヨン部、5はパターンバツフア、6は切換え手
段、7はパターン照合部、8は標準パターン記憶
部で、これらは従来の音声認識システムを構成し
ている。
そのパターンバツフア5と標準パターン記憶部
8との間に標準パターン作成部9が介設されて本
発明が上記従来の音声認識システム内で実施され
ている。そして、パターンバツフア5も本発明構
成の一部をなし、本発明の具体的構成は第2図に
示されている。
8との間に標準パターン作成部9が介設されて本
発明が上記従来の音声認識システム内で実施され
ている。そして、パターンバツフア5も本発明構
成の一部をなし、本発明の具体的構成は第2図に
示されている。
第2図において、10はパターンバツフア(第
1図の参照番号5と同じ)で、これには入力音声
パターンの内の最後尾音節以外のパターン部をA
で、また最後尾音節を0で示してある。11,1
2は夫々、パターンバツフア10から入力音声パ
ターンを受ける合成部にある。合成部11は非無
声化音節パターン供給部13へ接続されている。
1図の参照番号5と同じ)で、これには入力音声
パターンの内の最後尾音節以外のパターン部をA
で、また最後尾音節を0で示してある。11,1
2は夫々、パターンバツフア10から入力音声パ
ターンを受ける合成部にある。合成部11は非無
声化音節パターン供給部13へ接続されている。
この供給部には、複数人の発声から得られる平
均音声パターンから求められた無声化していない
最後尾音節のパターンが記憶されており、合成部
11へ供給される。
均音声パターンから求められた無声化していない
最後尾音節のパターンが記憶されており、合成部
11へ供給される。
また、合成部12は無声化音声パターン供給部
14へ接続されている。この供給部14には、複
数人の発声から得られる平均音声パターンから求
められた無声化した最後尾音節のパターンが記憶
されており、合成部12へ供給される。
14へ接続されている。この供給部14には、複
数人の発声から得られる平均音声パターンから求
められた無声化した最後尾音節のパターンが記憶
されており、合成部12へ供給される。
15,16は夫々、合成音声パターン記憶部で
ある。
ある。
17,18は夫々、照合部で、照合部17は合
成音声パターン記憶部15とパターンバツフア1
0に接続され、記憶部15からの第1の合成音声
パターンとパターンバツフア10からの入力音声
パターンとを照合し、これら間の照合距離を出力
する。照合部18もまた、同様に、合成音声パタ
ーン記憶部16とパターンバツフア10とに接続
され、記憶部16からの第2の合成音声パターン
とパターンバツフア10からの入力音声パターン
とを照合し、これら間の照合距離を出力する。
成音声パターン記憶部15とパターンバツフア1
0に接続され、記憶部15からの第1の合成音声
パターンとパターンバツフア10からの入力音声
パターンとを照合し、これら間の照合距離を出力
する。照合部18もまた、同様に、合成音声パタ
ーン記憶部16とパターンバツフア10とに接続
され、記憶部16からの第2の合成音声パターン
とパターンバツフア10からの入力音声パターン
とを照合し、これら間の照合距離を出力する。
19はパターン選択部であり、これは照合距離
の大きい合成音声パターンと入力音声パターンと
を選出して標準パターン記憶部20(第1図の参
照番号8と同じ)へ供給するように構成されてい
る。
の大きい合成音声パターンと入力音声パターンと
を選出して標準パターン記憶部20(第1図の参
照番号8と同じ)へ供給するように構成されてい
る。
次に、第2図装置を用いて入力音声パターンと
照合される標準パターンが登録されるまでの過程
を説明する。
照合される標準パターンが登録されるまでの過程
を説明する。
音節がa1,a2,………aNから成り最後尾音節aN
が無声化し易い単語Aがマイクロホン1に向けて
発生され、その出力信号が従来と同様に、周波数
分析部2、パラメータ抽出部3、セグメンテーシ
ヨン部4で処理され、その入力音声パターンAP
がパターンバツフア10に置かれる。
が無声化し易い単語Aがマイクロホン1に向けて
発生され、その出力信号が従来と同様に、周波数
分析部2、パラメータ抽出部3、セグメンテーシ
ヨン部4で処理され、その入力音声パターンAP
がパターンバツフア10に置かれる。
これに先立つて、非無声化パターン供給部13
には、上述した無声化していない最後尾音節aNの
パターンaT Nが記憶され、また無声化パターン供給
部14には、上述した無声化した最後尾音節aNの
パターンaU Nが記憶され、夫々のパターンは上記入
力音声パターンAPのパターンバツフア10から
の出力時に夫々の供給部から合成部11,12へ
供給される。
には、上述した無声化していない最後尾音節aNの
パターンaT Nが記憶され、また無声化パターン供給
部14には、上述した無声化した最後尾音節aNの
パターンaU Nが記憶され、夫々のパターンは上記入
力音声パターンAPのパターンバツフア10から
の出力時に夫々の供給部から合成部11,12へ
供給される。
これらの供給を受ける合成部11,12におい
て次のような処理がなされる。即ち、合成部11
においては、入力音声パターンAPの最後尾音節
aNのパターンと無声化していないパターンaT Nとが
入れ替えられて第1の合成音声パターンAT〔その
最後尾音節を“1”で示してある〕が発生され、
合成音声パターン記憶部15へ供給されてそこに
記憶される。また、合成部12においては、入力
音声パターンAPの最後尾音節aNのパターンが無
声化したパターンaU Nと入れ替えられて第2の合成
音声パターンAU〔その最後尾音節を“2”で示し
てある〕が発生され、合成音声パターン記憶部1
6へ供給されてそこに記憶される。
て次のような処理がなされる。即ち、合成部11
においては、入力音声パターンAPの最後尾音節
aNのパターンと無声化していないパターンaT Nとが
入れ替えられて第1の合成音声パターンAT〔その
最後尾音節を“1”で示してある〕が発生され、
合成音声パターン記憶部15へ供給されてそこに
記憶される。また、合成部12においては、入力
音声パターンAPの最後尾音節aNのパターンが無
声化したパターンaU Nと入れ替えられて第2の合成
音声パターンAU〔その最後尾音節を“2”で示し
てある〕が発生され、合成音声パターン記憶部1
6へ供給されてそこに記憶される。
合成音声パターン記憶部15の第1の合成音声
パターンAT及びパターンバツフア10の入力音
声パターンAPが照合部17へ供給され、これら
両パターンが照合されてその両者間の照合距離が
出力される。これと並行して、合成音声パターン
記憶部16の第2の合成音声パターンAU及びパ
ターンバツフア10の入力音声パターンAPが照
合部18へ供給され、これら両パターンが照合さ
れてそれら両者間の照合距離が出力される。
パターンAT及びパターンバツフア10の入力音
声パターンAPが照合部17へ供給され、これら
両パターンが照合されてその両者間の照合距離が
出力される。これと並行して、合成音声パターン
記憶部16の第2の合成音声パターンAU及びパ
ターンバツフア10の入力音声パターンAPが照
合部18へ供給され、これら両パターンが照合さ
れてそれら両者間の照合距離が出力される。
これら両照合距離がパターン選択部19へ供給
され、そこにおいて照合距離の大きい合成音声パ
ターンAU又はATが選択されて出力されると共に
入力音声パターンAPが出力される。
され、そこにおいて照合距離の大きい合成音声パ
ターンAU又はATが選択されて出力されると共に
入力音声パターンAPが出力される。
これら両パターンが標準パターンとして標準パ
ターン記憶部20に記憶される。
ターン記憶部20に記憶される。
このような登録は唯一回の操作で完了する。ま
た、その標準パターンには、上述の如き登録のた
めに発声された単語に無声化が生じているか否か
に拘わらず、その単語について発声された音声パ
ターンと、その単語のための最後尾音節が無声化
していない音声パターン又は最後尾音節が無声化
した音声パターンとが標準パターンとして含まれ
ているから、上述のような登録後に上記登録され
た標準パターンに対応する単語が無声化されて発
声されようが、また無声化せずに発声されよう
が、その音声を認識しうるから、その認識率を向
上させうる。これに加えて、一つの単語毎に数多
くの標準パターンを登録する場合に比し記憶容量
が少なくて済むばかりでなく処理も簡略化する。
た、その標準パターンには、上述の如き登録のた
めに発声された単語に無声化が生じているか否か
に拘わらず、その単語について発声された音声パ
ターンと、その単語のための最後尾音節が無声化
していない音声パターン又は最後尾音節が無声化
した音声パターンとが標準パターンとして含まれ
ているから、上述のような登録後に上記登録され
た標準パターンに対応する単語が無声化されて発
声されようが、また無声化せずに発声されよう
が、その音声を認識しうるから、その認識率を向
上させうる。これに加えて、一つの単語毎に数多
くの標準パターンを登録する場合に比し記憶容量
が少なくて済むばかりでなく処理も簡略化する。
(7) 発明の効果
以上の説明から明らかなように、本発明によれ
ば、次の効果が得られる。
ば、次の効果が得られる。
(1) 1回の操作で標準パターンを登録しうる。
(2) 従つて、登録処理の簡略化を達成しうる。
(3) このような標準パターンの登録において、音
声の認識率を向上させ得る等である。
声の認識率を向上させ得る等である。
第1図は本発明を実施する音声認識システムの
構成を示す図、第2図は本発明の実施例を示す図
である。 図中、10はパターンバツフア、11,12は
合成部、13は非無声化音節パターン供給部、1
4は無声化音節パターン供給部、15,16は合
成音声パターン記憶部、17,18は照合部、1
9はパターン選択部である。
構成を示す図、第2図は本発明の実施例を示す図
である。 図中、10はパターンバツフア、11,12は
合成部、13は非無声化音節パターン供給部、1
4は無声化音節パターン供給部、15,16は合
成音声パターン記憶部、17,18は照合部、1
9はパターン選択部である。
Claims (1)
- 1 最後尾音節が無声化し易い単語の標準パター
ンの登録に際し、その単語の発声された音声パタ
ーンの最後尾音節を、平均音声パターンから得ら
れる無声化した最後尾音節及び無声化していない
最後尾音節と入れ替えて第1及び第2の合成音声
パターンを発生し、これら合成音声パターンと上
記発声された音声パターンとを照合して照合距離
の大きい合成音声パターン及び上記発声された音
声パターンを標準パターンとして登録することを
特徴とする標準パターン登録方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56213731A JPS58116600A (ja) | 1981-12-29 | 1981-12-29 | 標準パタ−ン登録方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56213731A JPS58116600A (ja) | 1981-12-29 | 1981-12-29 | 標準パタ−ン登録方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58116600A JPS58116600A (ja) | 1983-07-11 |
| JPS6410080B2 true JPS6410080B2 (ja) | 1989-02-21 |
Family
ID=16644059
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56213731A Granted JPS58116600A (ja) | 1981-12-29 | 1981-12-29 | 標準パタ−ン登録方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58116600A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6177897A (ja) * | 1984-09-26 | 1986-04-21 | 日本電信電話株式会社 | 文・音声変換装置 |
-
1981
- 1981-12-29 JP JP56213731A patent/JPS58116600A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58116600A (ja) | 1983-07-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4867804B2 (ja) | 音声認識装置及び会議システム | |
| Jelinek et al. | Perplexity—a measure of the difficulty of speech recognition tasks | |
| JPS58130393A (ja) | 音声認識装置 | |
| JPS6024597A (ja) | 音声登録方式 | |
| JPH0743599B2 (ja) | 音声認識用コンピュータ・システム | |
| JPS597998A (ja) | 連続音声認識装置 | |
| JPS6410080B2 (ja) | ||
| JPH0225517B2 (ja) | ||
| JPH0283593A (ja) | ノイズ適応形音声認識装置 | |
| JPS61180297A (ja) | 話者照合装置 | |
| JPS6312000A (ja) | 音声認識装置 | |
| JPH08110790A (ja) | 音声認識装置 | |
| JPH01161399A (ja) | 音声認識装置における話者適応化方法 | |
| JPS59184940A (ja) | 音声ワ−ドプロセツサ | |
| JPS59107391A (ja) | 発声法訓練装置 | |
| JPS6134599A (ja) | パタ−ン認識方式 | |
| JPH0119596B2 (ja) | ||
| JPS59176791A (ja) | 音声登録方式 | |
| JPS608898A (ja) | 音声認識装置 | |
| Edwards | Probabilistic vector model for voicing mode identification of intervocalic stop consonants | |
| Laddaga et al. | Testing recognition of computer‐generated speech with elementary school children | |
| JPS59204897A (ja) | 音声認識辞書登録方式 | |
| JPS59111698A (ja) | 音声認識方式 | |
| JPS6120996A (ja) | 音声認識装置 | |
| JPS6070497A (ja) | 音声認識装置 |