JPS6068397A - 音声特徴抽出方式 - Google Patents

音声特徴抽出方式

Info

Publication number
JPS6068397A
JPS6068397A JP17632983A JP17632983A JPS6068397A JP S6068397 A JPS6068397 A JP S6068397A JP 17632983 A JP17632983 A JP 17632983A JP 17632983 A JP17632983 A JP 17632983A JP S6068397 A JPS6068397 A JP S6068397A
Authority
JP
Japan
Prior art keywords
channel
output
feature extraction
filter
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17632983A
Other languages
English (en)
Inventor
森戸 誠
田部井 幸雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP17632983A priority Critical patent/JPS6068397A/ja
Publication of JPS6068397A publication Critical patent/JPS6068397A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明は発声された言葉の内容を認識する装置の回路構
成の小型化に関するものである。
(背景技術) 従来の認識装置の構成を第1図に示す。第1図において
1は音声の入力端子、2は入力信号の低域成分を除去す
るローパスフィルタ、3はアナログ信号で出力されるロ
ーパスフィルタ2の出力を以後のディジタル処理に必要
なディジタル値に変換する騨変換器、4は音声の特徴を
抽出する特徴抽出部、5は認識の対象となる語の標準的
なパターンを格納しておくメモリ、6は特徴抽出部4の
出力によシ音声の認識語の始端と終端を決定する区間検
出部、7は検出された区間における、特徴抽出部4と標
準A’ターン5とを比較しその類似度を計算するマツチ
ング部、8は標準パターンごとに算出された類似度から
入力に対して最も類似する標準,−eターンを判定する
判定部である。
以下第1図を用いて従来の装置の動作について説明する
入力端子1から入力された音声アナログ信号はロー・ぐ
スフィルタ2によってその高城周波数成分が除かれる。
このローパスフィルタ2は後続サれている“l変換器の
ために必要であシ、ローパスフィルタ2の遮断周波数は
い変換器の標本周波数の半分以下に設定される。ロー・
ぐスフィルタ2の出力はl変換器3によってディ・フタ
ルPCM符号に変換される。このl変換器の標本化周波
数は通常8〜16 kHzに設定される。Aρ変換部3
の出力は次に特徴抽出部4によシ認識しやすい情報に変
換される。
通常、認識しやすい情報として入力音声のスペクトラム
成分が用いられる。その代表としてパント“・ぐスフィ
ルタ群によってスにクトラム成分の記述する方法、LP
C分析によってスペクトラム成分を記述する方法、ケプ
ヌトラム分析によってスにりトラム成分を記述する方法
があげられる。
特徴抽出部4と同様な抽出処理に平均化を行なったパタ
ーンが認識すべき言葉ごとにあらかじめ標準・ぐターン
メモリ5内に格納されておシそれらの標準パターンと特
徴抽出部4の出力の間で類似度計算がマツチング部6で
行なわれ、認識すべき言葉ど入力された言葉との間の類
似度がめられる。そ−れらの類似度から判定部8によっ
て最も類似していると判定される標準パターンが選択さ
れる。
さて前記説明の音声認識装置の各ブロックのうち特徴抽
出部4について詳しく考える。
前にも述べたように特徴抽出部4の方式として各種の方
式があげられるが、ここでは特にバンド・母スフィルタ
による特徴抽出方式について考える。
第2図に従来のバンドパスフィルタによル%la抽出部
の構成を示す。
第2図にお込て11は入力端子、12は特徴を抽出する
ためのBPFフィルタ群で中心周波数の異なるBpFフ
ィルタ121〜125によって構成されている。
13はBPFフィルタの出力を整流する絶対値回路群で
131〜135の絶対値回路によって構成されている。
14はLPFフィルタ群でLPFフィルタ141〜14
5によって構成されている。ただし、第2図に示された
特徴抽出部の構成はその機能を分かりやすくするための
機能ブロック図であシ実際の実施回路ではないことを付
加する。
第2図にしたがってその機能を詳細に説明する入力端チ
ェ1から入力される音声は周波数成分を検出するために
バンド・ぐスフィルタ群12に入力される。
バンドパスフィルタ群12は中心周波数の異なるいくつ
かのバンドパスフィルタによって構成される。1つのバ
ンドパスフィルタに対する信号のおいて5つのバンドパ
スフィルタ、すなわち5チる。
第3図の1211はBPFフィルタ121の特性、12
21はBPFフィルタ122の特性、1231はBPF
フィルタ123の特性、1241はBPFフィルタ12
4の特性、J251はBPFフィルタ125の(5) 特性でそれぞれl変換器の標本周波数で与えられる周期
T (1/(標本周波数))でディジタル演算を行ない
得られる。
入力信号はバンドパスフィルタ群12を通ることによっ
てバンドパスフィルタの中心周波数付近のスペクトラム
成分が抽出される。バンドパスフィルタの出力はバンド
パスフィルタの中心周波数付近の周波数をもち、入力信
号の中心周波数付近のスペクトラム成分を振幅とする正
弦波に近い波形となる。
特徴抽出部で抽出すべき情報はバンドパスフィルタの出
力である正弦波の振幅値である。この振幅値をめるため
に絶対値回路解重3とロー・クズフィルタ群14が必要
となる。例として第4図(a)にバンドパスフィルタ1
21の出力、第4図(b)に絶対値回路131の出力、
第4図(c)にローパスフィルタ141の出力を示す。
ローパスフィルタ群14は絶対値回路群13の包絡をめ
る役割夛をもっている。
また人間の発声速度が標本化周波数に比べてき(6〕 わめて遅いことから音声の周波数成分の変化もきわめて
遅いと考えられる。一般に30ミリ秒の間は音声のス(
クトラム、成分はほぼ一定と考えられる0 したがって音声の周波数成分を与えている・ぐンドパス
フィルタの包絡、すなワチローバスフィルタの出力の変
化は標本化周波数に比べてきわめて遅く、30ミリ秒の
間はほぼ一定であると考えられる。
L fc 7>Zっでロー・ぐスフィルタ群の出力、す
なわち特徴抽出部4の出力は標本化周期ごとに算出する
必要はなく 30 ミIJ秒の周期で出力すれば十分で
ある。
一般にロー・ぐスフィルタは回路構成を簡単化するため
に、平均演算によって実行されている。すなわち標本化
周期Tごとの絶対値回路の出力をanとしロー・ぐスフ
ィルタ出力周期をNTとし、ロー・ぐスフィルタの出力
ヲ で与える。例として、標本化周期Tを125マイクロ秒
とした場合Nは128が選ばれる。
これら名チャネルごとのバンドパスフィルタの演算およ
び絶対値回路の演算、ロー・ぞスフィルタの演算は1標
本周期内で行なわれ、それぞれのチャネルに対する回路
構成が同じことから1チャ≠ネル分に和尚する演算回路
を時分割的に用いることによシ実行されている。
通常マツチング部はマイクロプロセッサを用いて処理さ
れており、このマイクロプロセッサによって特徴抽出部
12のロー・ぐスフィルタの出力は読み込まれ、メモリ
に格納される。特徴抽出部47謙 のチャ≠ネル数が増大すると1サンプル周期の閂に特徴
抽出部4の出力をすべてメモリ内に格納するためには高
速のマイクロプロセッサを必要としたシ、特徴抽出部の
出力を一時格納しておくバッファレジスタが必要となり
回路の増加をまねく。
一方、第2図におけるバンドパスフィルタ群12の/?
ンドパスフィルタは巡廻型ディジタルフィルタを用いて
おシフィルタの特性の一つである群遅延特性をもってい
る。群遅延特性は入力と対して出力が出るまでの遅延を
示し°Cおシその値はバンド・母スフィルタの特性(中
心周波数、帯域幅、次数)によって決定される。
通常、音声の特徴抽出のための・々ンドパスフィルタは
中心周波数の低いバンド・ぐスフィルタはど群遅延は大
きい性質がある。
したがって、中心周波数の低いバンドパスフィルタの出
力はど結果が出る時間が遅い〇これら結果が出るまでの
時間が異なる信号を絶対値化し、平均化したのでは総合
的なチャケネルごとの出力結果も出力時間が異なる結果
となる。
(発明の課題) 本発明は、これらの欠点を除去するために特徴抽出部4
におけるロー・母スフィルタの平均化演算をチャテ傳ル
ごとにずらして行なうことによシ低速なマイクロプロセ
ッサでもローパスフィルタの出力を読むことを可能にし
、余分なバッファなどの回路構成をなくシ、かつ/Zン
ドノぐスフィルタの群遅延を補正するもので以下詳細に
説明する。
(9) (発明の構成および作用) 第5図(a)に本発明による特徴抽出部4のロー・ぐス
フィルタの演算を行なう回路の実施例を示す。
第5図において31は絶対値回路からの入力端子、32
は加算器、33はシフトレジスタ、34は(1)式の演
算を初期化するだめのANDダート、35は(1)式の
演算を初期化するだめの制御信号INIT、36は出力
レジスタ、37は出力レジスタのクロック、38はロー
パスフィルタの出力端子である。
また第5図(b)に入力信号と制御信号のタイムチャー
トを示す。
40は標本化周期を表わすパルス、41は入力端子31
かも入力される入力信号、45は制御信4INIT、4
7は出力レジスタ36のクロックである。
これら第5図(、)と第5図(b)を用いて第1の実施
例について詳しく説明する。
入力端子31から入力される値は第5図(b) 4.1
に示されるようにチャネル5からチャネル1−!、で(
10) シリアルに入力される。
制御信号45によってチャネル5が入力されるタイミン
グ時に制御信号INITは0となシ加算器の外入力はO
となる。したがって入力端子31から入力されるチャネ
ル5のデータはそのままシフトレジスタ33に格納され
る。すなわち、チャネル5のローパス演算のための平均
化価X(第(1)式)がT1の時点で初期化されたこと
になる。その他のチャネルではシフトレジスタ33と入
力との間で加算器34において第(1)式の遂次加算演
算が行なわれる。
次にT2においては、チャネル4が入力されるタイミン
グ時にINIT信号がOとなりチャネル4の平均化演算
の初期化が行なわれる。同様にT3においてはチャネル
3が、T4においてはチャネル2が、T5においてはチ
ャネルlが初期化される。また128標本周期のちの時
間点において同様の初期化が行なわれる。すなわちT1
28においてチャネル5が、TI□、にお−てチャネル
4が、T’lsoにおいてチャネル3がNT131にお
いてチャネルlが、T、3□においてチャネル1が初期
化される。
初期化されない時間点では第(1)式に示される遂次加
算演算が行なわれる。たとえば、T4における平均化演
算について考える。このときチャネル5に対して3回目
までの遂次加算の結果がシフトレジスタ33から出力さ
れてお1)ANDゲート34に加えられる。このときI
NIT信号は1となっておシフトレジスタ33の結果は
そのまま加算器32に加えられる。一方、入力端子31
からはチャネル5の入力データが入力されておシ、シフ
トレジスタ33の結果を加算され4回目の遂次加算が行
なわれシフトレジスタ33に入力される。シフトレジス
タ33にチャネル5のデータが入力されるとシフトレジ
スタの内容は1段シフトされ、シフトレジスタ33から
はチャネル4のデータが出力される。シフトレジスタ3
3からのチャネル4のデータは2回目までの遂次加算さ
れた結果であシこの値はANDゲート34を通シ加算器
32に加えられる。加算器32には入力端子からチャネ
ル4の入力データが入力されておシ、加算器32におい
て3回目の遂次加算が行なわれシフトレジスタ33に格
納される。以下同様にシフトレジスタ33からのにチャ
ネルのデータとそれと同じタイミングで入力されている
入力端子からのにチャネルの入力データとの間で遂次加
算が行なわれ、シフトレジスタ33に結果が格納される
したがって、第(1)式に示される平均化はチャネル5
に対してはT、からT、27まで、チャネル4に対して
はT2からT128まで、チャネル3に対してはT3か
らT1□。まで、チャネル2に対してはT4からTl3
81チヤネル1に対してはT、がらTl31 まで行な
われることになる。
ゆえに、それぞれの平均化された値の出力(ローパスフ
ィルタの出力)は平均化最終標本時間点において出力レ
ジスタ36に格納される。そのタイミングは第5図(b
)クロック47に示される。第5図(b)クロック47
に示され不がごとぐ出力レジスタ36に格納される各チ
ャネルのロー・ぐスフィルタの出力は最短時間615標
本周期であシ、標本(13) 周期を125マイクロ秒とした場合には150マイクロ
となる。したがって、出力レジスタ36の内容をマイク
ロプロセッサで読む場合でも低速なマイクロプロセッサ
でも読み込める間隔で出力レジスタにデータが格納され
る結果となる。
また群遅延の一番大きなパントノやスフィルタに対応す
るチャネルの平均化演算を群遅延の小さなバンド・ぐス
フィルタに対応するチャネルの平均化演算よシ数サンプ
ルずらして後に行なっているため群遅延による出力の遅
延を補正する形となる。
(発明の効果) このように第1の実施例では低速マイクロプロセッサで
も十分にデータを読み込めるため、特徴抽出部とマツチ
ング部との間にバッファレジスタを設ける必要がなく回
路規模を小さくすることができる。
また、平均化を群遅延が大きなバンドパスフィルタに相
当するチャネルの平均化を遅くしているため群遅延の補
正にもなシ、各チャネル、よシ同一時間点に近い特徴抽
出が行なわれる。
(14) 本発明は、バンド・やスフィルタによる群遅延を補正し
、かつ読み込みのためにバッファなしで低速ゾロセッザ
でもそのデータを読み込むことができるため、バンド・
ぐスフィルタによって音声の特徴抽出を行なう装置に利
用することができる。
【図面の簡単な説明】
第1図は音声認識装置の構成図、第2図は特徴抽出部の
構成図、第3図はパントノRスフィルタの特性図、第4
図(a)はバンド・母スフィルタの出力図、第4図(b
)は絶対値回路の出力図、第4図(c)はロー・ぐスフ
ィルタの出力図、第5図(a)は本発明によるロー・や
スフィルタの構成図、第5図(b)は本発明によるロー
パスフィルタの動作タイムチャート図である0 1は入力端子、2はローパスフィルタ、3は騨変換器、
4は特徴抽出部、5は標準・ぐターンメモリ、6は区間
検出部、7はマツチング部、8は判定部、11は入力端
子、12はバンドパスフィルタ群、121〜125Uパ
ントノぐスフィルタ、13け絶対値回路群、131−1
35は絶対値回路、14はローパスフィルタ群、141
〜145はローパスフィルタ、31は入力端子、32は
加算器、33はシフトレジスタ、34はANDゲート、
35は制御信号INIT、36は出力レジスタ、37は
出力レジスタクロック、38は出力端子、40は標本周
期を表わす・ぐルス、41は入力信号、45は制御信号
INI Tのタイミング、47は出力レジスタクロック
のタイミング。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士 山 本 恵 −第3図 周波歓 3.2 3,3 + 特開昭GO−68397(7)

Claims (2)

    【特許請求の範囲】
  1. (1)複数のパントノ?スフィを夕によって音声に含ま
    れる周波数成分を抽出し、各バンドパスフィルタの出力
    信号の包絡を平均化手法によってめ、結果を基準と比較
    することにより音声を認識する音声特徴抽出方式におい
    て、平均化の区間を標本化周期単位でチャ≠ネルごとに
    時間的に遅らせて設定することを特徴とする特許
  2. (2)平均化の区間の遅延に対する順序関係をチャネル
    毎のバンドパスフィルタの群遅延の小さな頴に決定する
    ことを特徴とする特許請求の範囲第1項記載の音声特徴
    抽出方式。
JP17632983A 1983-09-26 1983-09-26 音声特徴抽出方式 Pending JPS6068397A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17632983A JPS6068397A (ja) 1983-09-26 1983-09-26 音声特徴抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17632983A JPS6068397A (ja) 1983-09-26 1983-09-26 音声特徴抽出方式

Publications (1)

Publication Number Publication Date
JPS6068397A true JPS6068397A (ja) 1985-04-18

Family

ID=16011682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17632983A Pending JPS6068397A (ja) 1983-09-26 1983-09-26 音声特徴抽出方式

Country Status (1)

Country Link
JP (1) JPS6068397A (ja)

Similar Documents

Publication Publication Date Title
KR960007842B1 (ko) 음성잡음분리장치
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
JPS6068397A (ja) 音声特徴抽出方式
JPH10149187A (ja) 音声情報抽出装置
JPS63163495A (ja) 音声区間検出装置
JP2532618B2 (ja) ピッチ抽出装置
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법
JPS6051018A (ja) デイジタル低域通過濾波回路
JPS6217800A (ja) 音声区間判定方式
JPS6136240B2 (ja)
KR970067093A (ko) 음성신호의 유성음 구간에서 이포크(epoch) 검출 방법
JPS61140999A (ja) 音声区間検出方式
JPS60175098A (ja) 音声認識装置
JP2715349B2 (ja) Da変換装置
JPS60101598A (ja) 音声区間検出装置
JPS63200198A (ja) 音声区間検出方式
JPS6031196A (ja) 音声パタ−ン作成装置
JPS63262695A (ja) 音声認識方式
JPS61223797A (ja) 音声区間検出装置
JPS62141597A (ja) 有声破裂子音識別方式
JPS6035796A (ja) 基本周波数抽出装置
JPS59180594A (ja) 音声認識装置
JPS6229800B2 (ja)
JPS58123597A (ja) 音声分析装置
JPS61190398A (ja) 破裂子音認識方式