JPS6115440B2 - - Google Patents
Info
- Publication number
- JPS6115440B2 JPS6115440B2 JP52082585A JP8258577A JPS6115440B2 JP S6115440 B2 JPS6115440 B2 JP S6115440B2 JP 52082585 A JP52082585 A JP 52082585A JP 8258577 A JP8258577 A JP 8258577A JP S6115440 B2 JPS6115440 B2 JP S6115440B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- information
- time
- sampling information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000006870 function Effects 0.000 claims description 14
- 238000007906 compression Methods 0.000 claims description 9
- 230000006835 compression Effects 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 3
- 239000000872 buffer Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Description
【発明の詳細な説明】
本発明は、単語音声認識装置に関し特に音声パ
ターンの時間軸に関する変動を正規化すると同時
に、情報圧縮を行なうことにより単語音声の認識
を行なうことを目的とした装置に関する。
ターンの時間軸に関する変動を正規化すると同時
に、情報圧縮を行なうことにより単語音声の認識
を行なうことを目的とした装置に関する。
音声パターンには、発声速度の変動に対応した
時間軸上のパターンの変動があり、これに対処す
る一つの有効な方法として、動的計画法(DP)
を利用した時間正規化パターンマツチング方式
(特願昭45−53896号明細書、以下DPマツチング
と呼ぶ)がある。これは単語音声認識に際してあ
る話者の発声した認識対象語を、一定時間間隔
(10〜30mS)でサンプリングされた分析パラメ
ータ(スペクトル情報等)の形で前以つて登録し
ておき、入力音声に同様の処理を行なつて得られ
る分析パラメータの時系列と、各登録パターンと
の間でパターンの類似度が最大になるような時間
軸の変換を導入することにより、時間軸の変動に
影響されずにパターンの比較、認識を行なう方式
である。このようなDPマツチングによれば高精
度の単語認識が実現されるが、一方では、音声パ
ターンの登録を行なつた特定の話者の認識しかで
きず、また必要な演算処理量もかなり大きいとい
う問題点があつた。
時間軸上のパターンの変動があり、これに対処す
る一つの有効な方法として、動的計画法(DP)
を利用した時間正規化パターンマツチング方式
(特願昭45−53896号明細書、以下DPマツチング
と呼ぶ)がある。これは単語音声認識に際してあ
る話者の発声した認識対象語を、一定時間間隔
(10〜30mS)でサンプリングされた分析パラメ
ータ(スペクトル情報等)の形で前以つて登録し
ておき、入力音声に同様の処理を行なつて得られ
る分析パラメータの時系列と、各登録パターンと
の間でパターンの類似度が最大になるような時間
軸の変換を導入することにより、時間軸の変動に
影響されずにパターンの比較、認識を行なう方式
である。このようなDPマツチングによれば高精
度の単語認識が実現されるが、一方では、音声パ
ターンの登録を行なつた特定の話者の認識しかで
きず、また必要な演算処理量もかなり大きいとい
う問題点があつた。
本発明の目的は音声パターンの時間軸変動の正
規化および情報の圧縮により不特定話者の認識を
短時間にして安定に行なう単語音声認識装置を提
供することにある。
規化および情報の圧縮により不特定話者の認識を
短時間にして安定に行なう単語音声認識装置を提
供することにある。
本発明の装置によれば対象とする語のそれぞれ
の単語(あるいは類似の単語を一まとめにした単
語群)に対して、その単語を他から特徴づけるよ
うな時点を、話者の個人差の影響を受けにくいパ
ラメータ(例えば振幅パターンなど)を利用して
大城的に決定、抽出することにより、時間軸の変
動の影響を受けずに時間軸上の冗長度を除去する
ことが可能であり、このような時間軸上でのサン
プリングによるデータ圧縮(以下時間圧縮と略称
する)処理をうけた多数の話者の音声パターンを
訓練サンプルとして、ある単語をそれ以外の単語
から分離するような識別関数を計算することによ
つて不特定話者の単語認識が可能になる。この場
合、時間圧縮は全ての訓練サンプルに対して、そ
れぞれの認識関数毎に別個に行なわれ、また認識
に際しては入力パターンに対して適用する識別関
数毎に別個に対応する時間圧縮処理が行なわれ
る。こゝで多数話者の音声サンプルから識別関数
を計算する代りに、ある特定話者の発声した単語
音声に対してそれぞれ上記の時間圧縮処理を行な
つたものを標準パターンとして記憶しておき、認
識に際して同様に入力パターンを別個に時間圧縮
したものとを、比較照合することにより特定話者
の単語認識を行なうこともできる。この場合は時
間軸に関して情報が圧縮されているので、DPマ
ツチング法に比較してより少ない演算量で認識が
可能になる。
の単語(あるいは類似の単語を一まとめにした単
語群)に対して、その単語を他から特徴づけるよ
うな時点を、話者の個人差の影響を受けにくいパ
ラメータ(例えば振幅パターンなど)を利用して
大城的に決定、抽出することにより、時間軸の変
動の影響を受けずに時間軸上の冗長度を除去する
ことが可能であり、このような時間軸上でのサン
プリングによるデータ圧縮(以下時間圧縮と略称
する)処理をうけた多数の話者の音声パターンを
訓練サンプルとして、ある単語をそれ以外の単語
から分離するような識別関数を計算することによ
つて不特定話者の単語認識が可能になる。この場
合、時間圧縮は全ての訓練サンプルに対して、そ
れぞれの認識関数毎に別個に行なわれ、また認識
に際しては入力パターンに対して適用する識別関
数毎に別個に対応する時間圧縮処理が行なわれ
る。こゝで多数話者の音声サンプルから識別関数
を計算する代りに、ある特定話者の発声した単語
音声に対してそれぞれ上記の時間圧縮処理を行な
つたものを標準パターンとして記憶しておき、認
識に際して同様に入力パターンを別個に時間圧縮
したものとを、比較照合することにより特定話者
の単語認識を行なうこともできる。この場合は時
間軸に関して情報が圧縮されているので、DPマ
ツチング法に比較してより少ない演算量で認識が
可能になる。
本発明を以下に述べる実施例によつてさらに詳
細に説明する。
細に説明する。
図は本発明の単語音声認識装置の一実施例の構
成を示すブロツク図である。図に於いて参照数字
は1は音声パラメータ抽出部を示し、入力された
音声を観測・分析し音声情報をベクトル時系列と
して出力する。参照数字5a,5b………は単語
テーブルを格納するバツフアを示し、それぞれの
単語テーブルには対応する単語(又は単語群)に
対して音韻構成を代表するサンプリング点を抽出
する手順を示す情報、すなわち、単語サンプリン
グ情報が記述されている。参照数字2a,2b…
……はそれぞれバツフア5a,5b………に格納
されている単語テーブルを用いて時間圧縮を行な
う処理部を示す。処理部1において抽出された1
つの未知の単語のベクトル時系列に対しては単語
テーブルの数と同回数の圧縮処理が行なわれ、結
局時間圧縮された音声パラメータとして単語テー
ブルの数と同数のパターンベクトルが得られる。
得られたこれらのパターンベクトルに対してはそ
れぞれ参照数字3a,3b………により示された
内積演算部において内積演算処理が行なわれる。
参照数字6a,6b………は識別関数(又は標準
パターン)の格納されているバツフアを示し内積
演算部3a,3b………はそれぞれバツフア6
a,6b………に格納された識別関数の係数ベク
トルとパターンベクトルとの内積を計算し、これ
らの内積値を出力する。参照数字4は判別部を示
し、判別部4は内積演算部3a,3b………によ
り計算された内積値を比較し内積値の最も大きい
値をとる単語を最終的な識別結果として出力す
る。
成を示すブロツク図である。図に於いて参照数字
は1は音声パラメータ抽出部を示し、入力された
音声を観測・分析し音声情報をベクトル時系列と
して出力する。参照数字5a,5b………は単語
テーブルを格納するバツフアを示し、それぞれの
単語テーブルには対応する単語(又は単語群)に
対して音韻構成を代表するサンプリング点を抽出
する手順を示す情報、すなわち、単語サンプリン
グ情報が記述されている。参照数字2a,2b…
……はそれぞれバツフア5a,5b………に格納
されている単語テーブルを用いて時間圧縮を行な
う処理部を示す。処理部1において抽出された1
つの未知の単語のベクトル時系列に対しては単語
テーブルの数と同回数の圧縮処理が行なわれ、結
局時間圧縮された音声パラメータとして単語テー
ブルの数と同数のパターンベクトルが得られる。
得られたこれらのパターンベクトルに対してはそ
れぞれ参照数字3a,3b………により示された
内積演算部において内積演算処理が行なわれる。
参照数字6a,6b………は識別関数(又は標準
パターン)の格納されているバツフアを示し内積
演算部3a,3b………はそれぞれバツフア6
a,6b………に格納された識別関数の係数ベク
トルとパターンベクトルとの内積を計算し、これ
らの内積値を出力する。参照数字4は判別部を示
し、判別部4は内積演算部3a,3b………によ
り計算された内積値を比較し内積値の最も大きい
値をとる単語を最終的な識別結果として出力す
る。
識別規準としては識別関数又は標準パターンが
用いられる。識別規準として識別関数を用いる場
合には識別関数をある単語(又は単語群)をそれ
以外の単語(又は単語群)から弁別するものとし
て各単語毎に構成し、識別関数の処理の際にはそ
の単語用に作成した単語テーブルによる時間圧縮
により作成した学習用のサンプルを用い必知の方
法により識別関数を求める。また識別規準として
標準パターンを用いる場合には各単語毎に用意す
る標準パターンはそれぞれの単語の単語テーブル
を用いて時間圧縮を行なつたものを標準パターン
として用いる。
用いられる。識別規準として識別関数を用いる場
合には識別関数をある単語(又は単語群)をそれ
以外の単語(又は単語群)から弁別するものとし
て各単語毎に構成し、識別関数の処理の際にはそ
の単語用に作成した単語テーブルによる時間圧縮
により作成した学習用のサンプルを用い必知の方
法により識別関数を求める。また識別規準として
標準パターンを用いる場合には各単語毎に用意す
る標準パターンはそれぞれの単語の単語テーブル
を用いて時間圧縮を行なつたものを標準パターン
として用いる。
図は本発明の単語音声認識装置の一実施例の構
成を示すブロツク図である。 図において、参照数字1は音声パラメータ抽出
部、参照数字2a,2bは時間圧縮処理部、参照
数字3a,3bは内積演算部、参照数字4は判別
部、参照数字5a,5bは単語テーブル用バツフ
ア及び参照数字6a,6bは識別関数バツフアで
ある。
成を示すブロツク図である。 図において、参照数字1は音声パラメータ抽出
部、参照数字2a,2bは時間圧縮処理部、参照
数字3a,3bは内積演算部、参照数字4は判別
部、参照数字5a,5bは単語テーブル用バツフ
ア及び参照数字6a,6bは識別関数バツフアで
ある。
Claims (1)
- 1 対象語の各単語の音韻構造を代表し、その単
語とそれ以外の単語との弁別を容易ならしむるサ
ンプリング点とその抽出手順を示す情報(単語サ
ンプリング情報)を保持する機能を有する単語テ
ーブル記憶部と、認識対象語のうちある単語(又
は単語群)をそれ以外の単語(又は単語群)から
弁別するための認識規準(識別関数又は標準パタ
ーン)として上記単語サンプリング情報を用いた
時間圧縮により作成したものを保持する機能を有
する識別規準記憶部とを含んで構成され、識別動
作時に入力パターンをそれぞれの識別規準に適用
するに際して、上記単語サンプリング情報によつ
て各単語に対応してそれぞれ別個に時間圧縮処理
を行なうことを特徴とする単語音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8258577A JPS5418204A (en) | 1977-07-12 | 1977-07-12 | Word voice identifying device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8258577A JPS5418204A (en) | 1977-07-12 | 1977-07-12 | Word voice identifying device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5418204A JPS5418204A (en) | 1979-02-10 |
| JPS6115440B2 true JPS6115440B2 (ja) | 1986-04-24 |
Family
ID=13778547
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8258577A Granted JPS5418204A (en) | 1977-07-12 | 1977-07-12 | Word voice identifying device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5418204A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5992045A (ja) * | 1982-11-19 | 1984-05-28 | Dowa Mining Co Ltd | 非硫化鉱物の浮選法 |
-
1977
- 1977-07-12 JP JP8258577A patent/JPS5418204A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5418204A (en) | 1979-02-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH02195400A (ja) | 音声認識装置 | |
| JPH0352640B2 (ja) | ||
| US4509186A (en) | Method and apparatus for speech message recognition | |
| JPS6128998B2 (ja) | ||
| CN108091340A (zh) | 声纹识别方法和声纹识别系统 | |
| US4885791A (en) | Apparatus for speech recognition | |
| JPS6129518B2 (ja) | ||
| JPS6115440B2 (ja) | ||
| JP3905620B2 (ja) | 音声認識装置 | |
| JP3061912B2 (ja) | 音声認識装置 | |
| JPS61180297A (ja) | 話者照合装置 | |
| JPS6336678B2 (ja) | ||
| JPS599080B2 (ja) | 音声認識方法 | |
| JPS6344239B2 (ja) | ||
| JPS5944640B2 (ja) | 音声情報サンプリング装置 | |
| JPH0451840B2 (ja) | ||
| JP2602271B2 (ja) | 連続音声中の子音識別方式 | |
| JPH01193800A (ja) | 連続音声認識装置 | |
| JPH04109300A (ja) | 衝撃音識別装置 | |
| JPS6053997A (ja) | 音素判別法 | |
| JPH0316038B2 (ja) | ||
| JPS638796A (ja) | パタ−ン認識用特徴バラメ−タ抽出装置 | |
| JPS6328315B2 (ja) | ||
| JPH0220900A (ja) | 音素判別方法 | |
| JPH0887292A (ja) | 単語音声認識装置 |