JPH05143098A - スペクトル分析のための方法及び装置 - Google Patents

スペクトル分析のための方法及び装置

Info

Publication number
JPH05143098A
JPH05143098A JP1791791A JP1791791A JPH05143098A JP H05143098 A JPH05143098 A JP H05143098A JP 1791791 A JP1791791 A JP 1791791A JP 1791791 A JP1791791 A JP 1791791A JP H05143098 A JPH05143098 A JP H05143098A
Authority
JP
Japan
Prior art keywords
frequency
signal
band
power
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1791791A
Other languages
English (en)
Inventor
Nicholas Holmes John
ジヨン・ニコラス・ホームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BTG International Ltd
Original Assignee
British Technology Group Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Technology Group Ltd filed Critical British Technology Group Ltd
Publication of JPH05143098A publication Critical patent/JPH05143098A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 (修正有) 【構成】 経時変化する値を有する第1の信号の短期的
な特性特徴を決定するための方法で、第1の信号をろ波
2して複数の周波数帯域の1つに各々存在する第1の経
時変化信号を得る段階と、周波数の近似指示値において
それぞれの周波数帯域のパワー分布のセントロイドが特
性特徴として生ずる近似指示値を決定する段階と、を備
え、この段階が各周波数帯域に対して、時間領域の帯域
に対して第2の信号の全パワーを決定して第1のパワー
値を提供する段階と、該帯域に対する第2の信号の周波
数成分にスペクトル的な重りづけを行う段階と、時間領
域においてスペクトル的に重りづけされた信号の全パワ
ーを決定して第2のパワー値を提供する段階と、第2の
パワー値を第1のパワー値で除して該帯域のセントロイ
ドの周波数の指示値を提供する段階とにより行われる方
法が提供される。 【効果】 音声のスペクトル分析のためのもので、音声
を記憶する音声符号化に有効である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はスペクトル分析、特に音
声において生ずる音のスペクトル分析、のための方法及
び装置に関する。そのような分析は例えば自動音声認識
および帯域幅を減少したり音声を記憶するための音声符
号化においてその用途がある。
【0002】
【従来技術およびその問題点】通常、自動音声認識にお
いては音声符号の予備的な音響分析を行って一定間隔
(一般的に10〜30ミリ秒の範囲)でのスペクトラム
形状の特性から理解をする。そこから得たひととおりの
測定値は特性ベクトルと呼ぶことが多い。そしてこの中
の各特性ベクトルが一般的に5〜20の特性を含む可能
性があり、特性の数は採用した分析方法により異なる。
音声符号(フォルマント)における主の短期出力濃度の
周波数及び強度とそれに付随した音声音響の音声認識と
相互的な関連性はかなり高いものであるということはよ
く知られている。音声スペクトラムの最も重要な部分内
でおこる少数のフォルマントの周波数及び強度は音声認
識にとって有益な特徴である。しかし、次のような不便
な点もある。すなわち、フォルマントの定義づけには母
音が最良であるが、分光分析による音声符号の調査は明
確なフォルマントを示すことができない場合が頻繁にあ
るということである。それは特に鼻音化の部分とかなり
弱い母音の部分と子音の割合が多い部分で現れる。従っ
てこれらの扱いにくい音響の部分では粗フォルマントの
周波数を測定するようなアルゴリズム(算法)を考案す
るのが難しいということは周知の事実なのである。既に
発表されているアルゴリズムで最も信頼できるものを用
いるにはかなりの計算量を要する。
【0003】本発明の重要な目的は望ましいフォルマン
ト特性のほとんどを有する特性のひととおりを提供する
ことであるが、それだけでなく通常のフォルマント定義
には不適当と思われる音響にさえも音声上重要な情報を
提供することでもある。更にこれらの特性を容易に計算
するための方法及び装置を提供することも目的とする。
【0004】
【課題を解決するための手段】本発明の第一の面によっ
て音声認識に使用可能な方法として音声符号の最初の代
表符号の短期的特徴を決定する方法が提供される。この
方法は次のような段階から構成される。すなわち、最初
の符号をろ波し、複数の周波数帯のそれぞれに時変第二
符号をひとつずつ得て、前述の周波数帯において配電に
対して代表周波数のセントロイドが特性として生じるよ
うな周波数のおおよその表示少なくとも決定する。
【0005】そして上記のセントロイドが測定されるよ
うな周波数帯における出力ももう一つの特性として決定
されるのが望ましい。
【0006】音声音響に適用される際に最初の符号は音
声音響の代表する電気符号とみなされる。更に時変符号
を得るためのフィルタリングは電気的フィルタリングで
ある。この電気的フィルタリングは例えば、個別部品か
ら構成されるフィルターやあるいはマイクロプロセッサ
ーといったようなコンピューターを使用してのデジタル
フィルターによって実施される。下記で説明されている
本発明の実施例は数字化したサンプル値データ符号に適
用されるデジタル計算に関するものであるが、本発明は
デジタル計算の代わりにアナログ技術によっても実施さ
れ得る。
【0007】配電のセントロイドを計算する標準的方法
は二つの積分の比率をとることである。配電が図式で表
される場合は、この比率の分子は縦座標と横座標との積
の積分である一方、分母は縦座標の積分である。スペク
トラル分析にとっては、これらの数量が周波数領域での
測定値のことを指す。すなわち、分母の積分は符号分析
中の合計出力であり、これは時間領域においても周波数
領域においても同様であるので符号の波形サンプルの二
乗を合計すれば時間領域で計算することができる。分子
は、各スペクトラル成分を周波数に比例した数量で乗じ
た後のスペクトラム成分全ての出力合計を表している。
その周波数の平方根で各スペクトラム成分の振幅を量
り、振幅を量ったスペクトラム成分全ての二乗を合計す
れば必要とされている分子が算出されであろう。このよ
うに波形サンプルをフィルターに通すことによって分子
はまた時間領域においても計算が可能なのである。そし
てこのフィルター利得は関連した周波数帯に対する周波
数の平方根に比例しており、また、ろ波した波形サンプ
ルを二乗し合計したものに比例している。フィルター利
得は1オクターブにつき3デシベルの正の勾配を特性と
して要し、標準的なフィルターデザインの方法を使用し
て中階数のサンプルデータフィルターによってかなり正
確な数値を得ることができる。各周波数帯の出力は分母
の積分により算出される。
【0008】このように本発明の第一の面では、セント
ロイドが生じるような周波数に少なくとも近似した値を
決める段階は次のようなことから構成される。
【0009】すなわち、フィルターアウトプットで時変
符号サンプルの二乗を合計して分母を算出する。この分
母がフィルターアウトプットの出力を示す。
【0010】1オクターブにつき3デシベルの周波数に
少なくとも近似した値をサンプルに適用する。
【0011】分子を算出するために合成サンプルの二乗
を合計し、セントロイドの周波数を示すために分子を分
母で割る。
【0012】本発明はまた、第一の面を実施するための
装置を備えており、時間領域で符号からセントロイドが
生じるような周波数を発見する方法が一般的その実施方
法として適用可能である。従って本発明の第二の面では
時変値を有する第一の符号の短期的特性を決める方法を
提供する。そしてこの方法は次のような段階から構成さ
れている。すなわち、複数の周波数帯のそれぞれにおい
て第二の時変符号をひとつずつ得るように第一の符号を
ろ波する。また、前述の周波数帯において配電に対して
各周波数のセントロイドが生じるような周波数を少なく
とも正確なものに近似した値を各周波数による特性ある
いは各周波数にとっての特性として決める。
【0013】最初の出力値を算出するために時間領域で
の周波数帯にとっての第二符号の出力合計を決める。
【0014】その周波数帯にとっての第二符号の周波数
成分にスペクトラル測定量を適用する。
【0015】第二の出力値を算出するために時間領域で
のスペクトラル上測定された符号の合計出力を決める。
【0016】周波数帯のセントロイドの周波数を算出す
るために第二の出力値を最初の出力値で割る。
【0017】本発明の第三の面では時変値を有する符号
の短期的特性を決めるための装置を提供している。そし
てこの装置は二つの手段から構成される。すなわち、時
変値を有する最初の符号をろ波して複数の周波数帯のそ
れぞれにひとつづつ第二の時変符号を得るという手段。
【0018】前述の周波数帯において配電に対する周波
数のセントロイドが生じるような周波数の少なくとも正
確なものに近似した表示を特性として決めるための手
段。具体的には下記のとおりである。すなわち、最初の
出力値を算出するために時間領域において周波数帯にと
っての第二の符号の出力合計を決める。
【0019】周波数帯にとっての第二の符号の周波数成
分にスペクトラル測定を適用する。
【0020】第二の出力値を算出するために時間領域で
スペクトラル上で測定した符号の出力合計を決め、周波
数帯のセントロイドの周波数を算出するために第一の出
力値で第二の出力値を割る。
【0021】本発明の第二及び第三の面においてスペク
トラルの測定は1オクターブにつき3デシベルに少なく
とも近似した値になり得る。
【0022】1オクターブにつき3デシベルが測定され
る周波数を適用するフィルターを使用する代わりにフィ
ルターからの符号は識別することが可能である。これは
よく知られているように1オクターブにつき6デシベル
の増加を適用するのに相当する。以前のサンプルから各
サンプルを減じることによってサンプルによって示され
た波形上で識別に対する近似値が出す場合その増加は低
周波数で1オクターブにつき約6デシベルであり、半標
本化定格周波数に到達するにつれてゼロ勾配へと次第に
下がってゆく。1オクターブにつき3デシベルの理想的
な勾配からの変動値の影響は2つある。まず第一に周波
数がスペクトラル最高時よりも高い時及び低い時の符号
はセントロイド計算において正しい相対荷重を得られな
いということである。しかしこれらの成分は標準的には
スペクトラル最高時に近い成分よりもはるかに弱いた
め、測定された最高時の周波数にとってこの誤差はほと
んど問題ではない。測定されている符号が純粋な正弦で
あれば、この原因から誤差が生じることはない。第二
に、計算されたパワーの比率はもはやスペクトラル最高
時の周波数に線形上では関連がなくなるであろうという
ことである。測定値は参照用予備計算テーブルによって
線形周波数に変換可能であるため、非線形であっても問
題は生じない。識別操作の周波数領域勾配がゼロになる
傾向がある半サンプリング比に周波数が接近した場合に
は、周波数変化に対する感度がほとんどなくなるであろ
う。故にこの方法はこの範囲で使用するのに適切ではな
いが。しかし、周波数範囲の上半分で測定する前に符号
をスペクトラルでインバートさせることによって識別が
有効なゼロまで高周波数がさげられてこの問題を避ける
ことができる。
【0023】音声識別及び音声符号化を適用により、次
の3つの低いフォルマントの範囲にほぼ相当する帯域フ
ィルターであればどんなフィルターでも使用して時変符
号のろ波を行うことができる。3つの低いフォルマント
とはすなわち、それぞれ大体、250〜900ヘルツと
700〜3,000ヘルツと、1,800〜3,500
ヘルツである。しかし、後に説明されているように、フ
ィルター特性を多少成形したほうが望ましい。これは特
性の重なりの部分で2つのフォルマントが生じた場合に
この2つを別々に離すためである。持続時間の短い符号
のスペクトラム測定が行われる際、符号分析の時間に符
号波形整形と正確なポイントとの関連性によって合成ス
ペクトラムにおいて誤差が生じるということは符合処理
理論でよく知られている。これらの終端効果を減らす通
常の方法は、「ウィンドウ」として知られている平滑時
間機能によって符号を乗じるというものである。このウ
ィンドウは分析期間終わりに近付いた符号の部分を減衰
させる。これと同様の考えはセントロイド測定によるス
ペクトラル分析に適用され、それによってセントロイド
測定前に符号にウィンドウが施される場合、より一貫性
のある結果が得られる。このように、各フィルターの出
力時にタイムウィンドウは帯限定符号に適用可能であ
る。そしてこれに続いて「1オクターブにつき3デシベ
ルの」フィルタリング及びウィンドウ後の出力持続期間
全体に適用される加算操作が実施可能である。有限イン
パルス応答「1オクターブにつき3デシベルの」フィル
ターの使用により、この過程の正確度は確実なものとな
り得る。そのため、一度インパルス応答持続期間を過ぎ
てしまえば出力はちょうどゼロになるということが知ら
れている。
【0024】なぜ音声認識においてパワーのセントロイ
ドが特徴としてかなり機能するのかということの理由を
略式の説明をこれから行う。どんなフォルマント最高時
の強度も通常、そのフォルマントに割り振られた帯域内
のどこかほかの場所でスペクトラル強度を越える数デシ
ベルである。フォルマントから離れたパワースペクトラ
ル密度が例えばほぼフォルマント最高時の数値を下回る
14デシベル(これはかなり標準的な数値である)であ
れば、この数値は25のパワー率を示すであろう。すな
わち、たとえフィルターでおおわれた帯域の残りがほぼ
フォルマント最高時に強度の高い部分の帯域の5倍の広
さであっても、それはまだパワー全体の1/5にしかな
らないためセントロイドをそれほど妨害することはない
であろう。かなりの程度までそのような妨害はどんな場
合にも系統的なものであり、常にフォルマント推定値を
帯域フィルターの中心に幾分偏らせている。そのような
系統的変化はどんなものでもその後非線形機能をフォル
マント測定に適用させることによって修正することがで
きる。しかし、同様の系統的効果がパターンマッチング
認識装置の訓練過程で同様に適用されるので、実際には
どんな種類の認識装置にとってもそれは重要なことでは
ない。最大周波数を直接測定する代わりにセントロイド
を使用する利点は、スペクトラル最高点が明確に定義さ
れない時でさえ常に明確な結果が得られるであろうとい
うことである。認識アルゴリズム(算法)においてパタ
ーンマッチング処理用パターンを設定するのにこれと同
様の分析方法を使用するとすれば測定値が必ずしもフォ
ルマントに相当しないという事実は重要でない。
【0025】
【実施例】マイクロフォンからの音声信号は8kHzで
サンプリングする適宜なA−D変換器によって直線的な
デジタル表現に変換される。予備的な音声スペクトル整
形及び利得制御が設けられ、これによりA−D変換シス
テムの全領域が用いられると共に信号の高周波数成分と
低周波数成分との間に良好な平均的な平衡が存在する。
整形及び利得制御はまた、通常は音声の発声の間に第1
フォルマントの周波数よりも下で生ずる低周波数のプロ
ミネンスを減衰するようになされている。
【0026】A−D変換システムの出力は、デジタル信
号プロセッサ(DSP)集積回路あるいはマイクロプロ
セッサ等のコンピュータに接続されており、このコンピ
ュータは音声認識においてセントロイドに基づく特徴抽
出に加えて認識アルゴリズムを実行する。一般的なアル
ゴリズム(図1参照)が最初に記載され、次に8ビット
マイクロプロセッサに用いられるより特殊なアルゴリズ
ムが記載される。A−DSP)変換システムの出力にお
いてサンプリングされた信号は所定の数のサンプルを各
々有するフレームに分割される。図1の演算において、
例えば2乃至30msの継続時間の各フレームの一部が
選定されるが、セントロイド測定プロセスのために十分
な計算力が可能であれば、上記継続時間はより長い(1
フレーム全体でも良い)のが好ましい。演算1からのサ
ンプルは演算2において3つの通過帯域にデジタル的に
ろ波され、これにより3つの最も低いフォルマントに関
する3つのサンプル群が得られる。図1はこれらフォル
マントの1つだけの処理を示しており、したがって完全
な分析アルゴリズムにおいては図1の演算及びこれに続
く図2の演算のすべてが他の2つのフォルマントに対し
て繰り返される。
【0027】演算2のフォルマントろ波は適宜な方法で
行うことができる。フィルタに対する通過帯域は既に説
明したが、ある種の発声音に対しては時として2つのフ
ォルマントが非常に近接して動き2つのフィルタの通過
帯域の中に入ることがある。2つのフォルマントが接近
している時には、これらフォルマントは通常近似的に等
しい強度を有することは音響理論の結果であり、それ故
に、これらの場合におけるセントロイドの測定は、必要
とされた1つのフォルマントの代わりに上記帯域中のフ
ォルマントの2つの周波数の平均値を与える。この誤差
は、フォルマント帯域フィルタが重なり合う領域におい
て例えば100Hz当たり3dBの傾斜特性を有するよ
うに設計されていれば、かなり減少する。2つのフィル
タが約300Hzよりも接近することは希であるために
これらの相対的な強度は非常に異なり、従って各帯域に
おいてより弱いフォルマントはセントロイドの計算にほ
とんど寄与しない。フォルマント強度の測定において生
ずる誤差は、フィルタ特性の逆数を強度結果に測定周波
数の関数として付与することによって、修正される。
【0028】前述のように、短い継続時間信号のスペク
トル測定を行うときには、分析期間の終了点に近い信号
のこれらの部分を減衰するウインドを与えることが望ま
しい。このプロセスは演算3において実行され、この演
算においては、フォルマントフィルタ選択の出力におけ
るサンプルに生ずる時間間隔にわたって図2の特性を乗
ずる。
【0029】選択されたフィルタ帯域のセントロイドの
周波数を見い出す次のステップはウインドの出力におけ
る信号の全パワーを測定することである。時間領域にお
いてこの信号は一般に図3に示す通りであり、周波数領
域において図4の分布を有している。図1の演算4乃至
7は既に説明した時間領域信号から分母及び分子を見い
出す目的を有している。分母は図3の波形におけるパワ
ーであり、分子は1オクターブ当たり3dBの正の勾配
を有する利得特性の形態のスペクトル重みづけを図3の
波形を有するサンプルに付与し(演算5)、結果として
生じた波形における全パワーを測定し(演算6)、そし
て演算6の出力を演算4の出力で除してセントロイドの
周波数を表すパワー比(演算7)を誘導することにより
見い出される。
【0030】演算8において、演算7からのパワー比に
スケールファクタを乗じてフォルマント周波数に変換
し、また演算9において演算4からの未ろ波のパワーの
目盛り対数を計算してフォルマント強度をdBで表現す
る。
【0031】次に本発明の8ビットマイクロプロセッサ
の使用を説明する。以下に説明する技術が特性抽出の際
の乗算及び除算を単純化するために用いられるか、ある
いは非常に効率的な演算技法(本発明は関与しない)を
認識のために用いられる場合には、例えば4MHzで作
動するタイプ6502を用いてかなり小さな認識ボキャ
ブラリを有する連続的な音声の認識を行うことができ
る。
【0032】8ビットマイクロプロセッサおよび8kH
zのサンプリングに対して、入力信号は256サンプル
を有するフレーム、すなわち1秒当たり31.25のフ
レーム、に分割される。しかしながら、そのようなマイ
クロプロセッサの計算力の制約はフォルマントセントロ
イドを決定する詳細な分析は各フレームの選択された部
分に対して実行可能なことを意味する。
【0033】8ビットマイクロプロセッサに適用された
図1の演算の目的は、波形のこの部分が分析すべき信号
の高い強度部分を有することを確認することである(例
えば、発声音に対する声門閉鎖音のすぐ後に停止音そし
てより強い摩擦音の部分)。マイクロプロセッサのプロ
グラムは最初にフレームの中のすべてのサンプル値をこ
のフレームの中で以前に見い出した最大サンプルと比較
し、これによりフレームにおける最大サンプルを決定す
る(演算11、図5)。最大サンプルを見い出すと、こ
の最大サンプルを含む20のサンプル部分をテストして
そのような部分のいずれが最大パワーを有するかを判定
する(演算12)。20サンプルのウインドの始点は最
大振幅点の前に20サンプルにわたって動かされる。始
点を設定すると、次の20サンプルにおけるパワーが付
加され、最も初期のパワーが繰り返し破棄されると共
に、ウインドが20サンプルにより動かされるまで新し
いサンプルのパワーが付加される。この移動が進行して
いる間に、ウインドの中のパワーの最大値がこれが生じ
たサンプルインデックスと共に記憶される。8ビットサ
ンプルは平方すると16ビットレンジを必要とするた
め、このパワーの積分におけるダイナミックレンジに潜
在的な問題がある。また平方演算を直接行う時間が可能
ではない。これらの問題は、ルックアップ表を用いて適
宜な平方値の目盛りバージョンを与えると共に以前に決
定されたウインドの最大値にしたがって5つの異なった
目盛りの表の1つを選定することにより解消される。平
方値の総和の実際値は必要ではなく、それが生じたサン
プルインデックスが必要なのであり、この目盛りを補償
は後に必要とされることはない。
【0034】20サンプルよりも長い間隔が分析に必要
とされ、20サンプル部分から開始する50サンプルが
演算13における分析のために選定される。
【0035】8ビットマイクロプロセッサを最も良く用
いるために、演算14が実行され、この演算において
は、各サンプルに2の最大パワーを乗じずる。この最大
パワーは50のサンプルのいずれをも−128から+1
27のレンジを越えさせない。
【0036】8ビットマイクロプロセッサに対して、フ
ォルマント帯に対する分離のための演算ろ波を単純な有
限インパルス応答(FIR)部分の縦続接続を用いて行
うことができ、これらの部分は1又は多くは2つの乗算
および加算演算を有している。各部分において、信号遅
れが1又は2のサンプル周期となり、あるいはこれら数
の自然数倍となる。1つのフィルタ部分における2又は
それ以上のサンプル周期の遅れは伝達関数における複数
の組みの0を意味し、従って計算負荷を大きく増加する
ことなく高階数のろ波を達成することができる。通常の
乗算を行う必要を排除するために、ろ波係数を例えば+
1,−1,0.5,1.75等の値を有するように選択
することができる。これらの値は多くは非常に小さな数
のシフト及び加減演算により履行することができる。例
えば、最初のフォルマントろ波のためのろ波伝達関数
は: (1−Z-6)(1+Z-2)(1+Z-1)(1+Z-1)で
あり、 一方第2フォルマントろ波に対する伝達関数は: (1−Z-3)(1−Z-3)(1+Z-2+Z-4)(1+
1.75Z-2+Z-4)(0.5+Z-2)で示され、ここ
において、Z-1はあるサンプル間隔の遅れを示してい
る。
【0037】同様の原理が第3のフォルマントのろ波の
設計に用いられる。一般に計算の経済性のために、部分
の伝達関数の倍係数は±2n(1±2-m)の形態を有す
るように選定され、ここにおいて、nおよびmは自然数
であり、0≦m≦3、また−1≦n≦1である。
【0038】そのような単純なフィルタを用いるとより
一般的なFIRデザインにより達成されるような良好な
フォルマント分離が行われないが、計算の制約の範囲内
で平坦なろ波特性を設計する困難性が、ろ波が上述の如
き帯域の重複領域における勾配を本質的に提供すること
を確実にする。各通過帯域の主要な部分における平坦な
応答がないことにより生ずる強度特性における誤差は、
必要であれば、周波数測定の結果によってルックアップ
表を付与することにより修正することができる。
【0039】図1の演算を示す図6において、各サンプ
ルは第1のフォルマントを分離するために図示のアルゴ
リズムにより処理される。第2および第3のフォルマン
トを選択するために同様のアルゴリズムが必要とされ
が、異なった伝達関数が用いられる。第1に、演算16
においてサンプル数が0に初期化され、次に適宜な全体
伝達関数が演算17乃至20の伝達関数を順に付与する
ことにより達成される。
【0040】第2及び第3のフォルマントのために、図
2のウインドイングの適宜なバージョンが、各測定間隔
における最初及び最後のサンプルの強度を単純に半分に
することにより、実行される。これは各ケースにおいて
単一のシフト作用を必要とする。しかしながら、第1の
フォルマントに対しては、測定間隔の中でのフォルマン
ト周波数のサイクルは1又は2であり、そのような単純
な技法は最終結果から重大な誤差を排除するためには十
分ではない。図6の演算及びテスト22−28により実
行される実際的な他の方法は測定間隔の2つの端部を信
号のゼロ交差として選定し、これにより第1のフォルマ
ントに対して演算22−28を図1のウインドニング演
算3と置き換えることにより実行される。最初の10の
サンプルはゼロ交差検知に関しては無視され10階数で
ありまた10のサンプルの最大遅れを用いる第1のフォ
ルマントフィルタの初期トランジェントを排除する。従
ってテスト22は演算23がサンプル数を増加すること
を許容し、もしサンプル数が10よりも少なければ新し
いサンプルを入力する。サンプル番号が10よりも多い
とテスト24が実行されて現在のサンプルの極性が前の
サンプルの極性と反対であるか否かを判定し;反対でな
ければ演算23が実行されて次のサンプルが採用される
が、もし反対であれば、次にテスト25が実行されてこ
れが最初のゼロ交差であるか否かを判定する。もし最初
のゼロ交差であれば、次にこのゼロ交差のサンプル番号
が演算26において記憶され、次いで次のサンプルが採
用されるが、もしゼロ交差でなければ次にテスト27が
実行されて最初のゼロ交差から2msより長い時間が経
過しているか否かを判定する。もし2msよりも小さけ
れば次のサンプルが採用されるが、テスト27の出力が
正であると演算28によりサンプリングが停止してこの
最終ゼロ交差のサンプル番号が演算28において記憶さ
れる。従って、第1のフォルマントに対するろ波演算2
の出力の分析は最初の10のサンプルの後の最初のゼロ
交差に続く最初のサンプルにのみおこなわれ、上記サン
プルは次の2msの間に起こり以降の間隔は次のゼロ交
差まで行われる。
【0041】8ビットマイクロプロセッサのプログラム
に与えられる図1の演算4、5及び6を図7a及び図7
bを参照してより詳細に説明する。既に述べた理由によ
り、アルゴリズムのこの部分は乗算および除算のために
対数を用いるが、DSP集積回路にたいしてはこれらの
演算を直接行うのが極めて一般的である。
【0042】先ず、図7aの演算30が実行され、サン
プル番号が図6の演算26において記憶された最初のサ
ンプル番号に初期化される。2つの変数LSUMD及び
LSUMNが次に演算31においてゼロに初期化され結
局この間隔における全パワーの対数および約3dB/オ
クターブのろ波の後の全パワーの対数をそれぞれ表す。
【0043】LSUMDは、真数を用いずに2つの数の
和の対数に対する近似値を見い出すことを含むプロセス
により、決定される。このプロセスは、Kingsbu
ry及びRaynerによりElectronic L
etters,7,1971年の56乃至58ページの
「対数演算を用いたデジタルろ波」に記載されていると
共に、本発明者の「音声合成及び認識」と題する本(V
an Nostrand Reinhold (UK)
Co., Ltd.により1988年に出版)の14
9乃至150ページに記載されている。
【0044】Kingsbury及びRaynerは、 log(A+B)=log(A(1+B/A))=lo
gA+log(1+B/A)、 であることを指摘しており、従って2つの数A及びBの
和の対数を見い出すための彼らのプロセスは以下の通り
となる: (1)もしlog(B)>log(A)であれば、lo
g(A)及びlog(B)を移項し、(2)log
(B)−log(A)を形成してlog(B/A)を見
出し、(3)(2)の結果を用いてルックアップ表から
値を選定し、(4)(3)の結果をlog(A)に加え
る。
【0045】ルックアップ表はlog(A/B)として
入力され、また表の出力はlog(1+B/A)であ
り、ここにおいて、Aは2つの値、すなわち現在のサン
プルまで見い出されたパワー及び現在のサンプルの平
方、の中の大きい方であり、またBは上記2つの値の中
の小さい方である。
【0046】各サンプルが処理された現在の状態におい
て、このサンプルのパワーに現在のサンプルの値の平方
を加えたものの対数がKingsbury及びRayn
erのプロセスにより見い出される。従って、図7aの
演算において、ルックアップ表を用いてLSSAMによ
り指定された現在のサンプルの平方の対数を見い出す。
次にテスト33及びテスト34においてLSSAMおよ
びこのサンプルまで見い出されたパワーの対数(LSU
MD)の中の大きいほうが見い出される。大きい方をL
SUMD、また小さい方をLSSAMと定義する。lo
g(B/A)を見い出すのと等価の演算35において、
LSUMDとLSSAMとの間の差を見い出し、次いで
定義log(1+B/A)を見い出すためにKings
bury及びRaynerのプロセスのための上述のル
ックアップ表を演算36において用いる。最後に演算3
7が実行され、これにより、LSUMDをlogA+l
og(1+B/A)を見い出すのに等価のルックアップ
表からの結果に加えることにより現在のサンプルを含む
現在のサンプルまでのパワーを与える。
【0047】図7bにおいて、図1の演算5の近似3d
B/オクターブろ波が現在および演算38における前の
サンプルの間の差を決定することによって置き換えられ
る。既に説明したように、低周波数においてはこのプロ
セスは6dB/オクターブの増加を示すが、これは近似
として用いられるものである。
【0048】演算39において、演算38からの各差の
平方の対数がルックアップ表および指定されたLSDI
Fによって見い出される。LSDIFおよびLSUMN
の和の対数は、演算33乃至37におけるLSSAMお
よびLSUMDに対して説明したのと同様に、演算40
乃至44においてKingsburyおよびRayne
rのプロセスを用いて見い出される。テスト45は図6
の演算28において記憶された最後のサンプルが到達し
たか否かを判断し、もし到達していなければ演算32へ
ジャンプして戻り次のサンプルを採用する。そうでなけ
れば、演算4、5の及び6がサンプルによりカバーされ
る完全な間隔に対して実行され、図7a及び図7bのア
ルゴリズムから出る。
【0049】第2及び第3のフォルマントに対する図7
a及び図7bのアルゴリズムに等かなアルゴリズムが間
隔の最初のサンプルの初期化をしゼロ交差を参照するこ
となく最後のサンプルを停止する。
【0050】第2のフォルマントに対して、近似3dB
/オクターブろ波に対する置換は微分演算38である
が、ある周波数成分がサンプリング速度の半分に近い第
3のフォルマントに対しては、微分演算39の周波数領
域の勾配はゼロとなる。従って、もしこの演算を第3の
フォルマントに対して用いると、周波数変化をほとんど
検知しない。従ってこの方法はこのフォルマントに対し
ては不適当である。この問題は第3フォルマントの領域
における測定を行う前に信号をスペクトル的に反転させ
て高周波数を微分可能なゼロに近づけることにより解決
することができる。スペクトル的な反転は、すべての選
択的な波形サンプルを反転させることにより行われ、ま
た組み合わせたスペクトル的な反転及びその後の微分が
複合されて、微分の代わりに隣接するサンプルの対を加
える単一の加算に複合される。しかしながら、このよう
にして得られた周波数測定はサンプリング周波数の半分
から減じられてスペクトル的な反転の効果を補償する。
図7bに関する限り、要するに必要とされることは演算
38を現在のサンプル及び前のサンプルの和が決定され
る演算に変えることであり、サンプリング周波数の半分
からの減算は図8の演算48において実行される。
【0051】セントロイド周波数を与えるパワー比を誘
導する演算7が演算47により実行され、ここにおいて
パワー比の分母の対数(LSUMD)が分子の対数(L
SUMN)から減じられる。結果として得られる値は演
算48における別のルックアップ表によりフォルマント
周波数に変換され、上記演算48は第3フォルマントに
対するサンプリング周波数の半分からの得られた周波数
の減算を含む。セントロイドが測定される帯域のパワー
は別のルックアップ表により演算49において得られる
が、このルックアップ表は、重複領域におけるフォルマ
ントフィルタの勾配特性を考慮してLSUMDをdBに
変換する。
【0052】図1のアルゴリズムを実行した結果として
あるいは3つのフォルマントの各々に対する図5乃至図
8のそれの近似計算の結果として、3つのフォルマント
周波数に対する近似及び3つのフォルマントパワーに対
する近似が誘導されこれらを例えば音声認識における特
徴として用いることができる。本発明を包含する装置が
図9に示されており、この装置は、マイクロフォン、可
聴スペクトル整形及びA−D変換システムを含む信号捕
捉部51と、図1のアルゴリズム又は図5乃至図8によ
り近似される図1のアルゴリズムを実行するための特徴
抽出部52と、上記部分52から得られる特徴から音声
認識を行うためのパターン/モデリング部53とを備え
ている。部分52及び53は通常は上述のように単一の
コンピュータ、DSP回路あるいはマイクロプロセッサ
の形態であり、これらは部分51のある部分を含む。
【0053】本発明は勿論上述の手法以外の他の手法に
より演算を行うことができる。例えば、16ビットある
いは32ビットマイクロプロセッサを用いて近似計算を
少なくしより大きな信号部分を分析することによりより
正確な結果を得ることができる。DSP集積回路はより
良好な結果を与えることができるが、ハードウエアおよ
び電力消費において大きな費用を要する。本発明のスペ
クトル分析においては、スペクトルピークのセントロイ
ドを見い出すのに他のコンピュータ、装置あるいは方法
を用いることができる。
【図面の簡単な説明】
【図1】フォルマントのセントロイドの周波数およびセ
ントロイドを測定する帯域のパワーを見い出すための本
発明のアルゴリズムのフローダイアグラムである。
【図2】図1のアルゴリズムに用いられる代表的なウイ
ンドニング形状である。
【図3】時間領域における代表的な第1フォルマントの
波形を示す。
【図4】図3の波形の代表的なスペクトルを示す。
【図5】8ビットマイクロプロセッサようのマイクロプ
ロセッサアルゴリズムの第1の部分のフローダイアグラ
ムである。
【図6】第1フォルマントに付与される図1の第2及び
第3の演算に近似するマイクロプロセッサアルゴリズム
の第2の部分のフローダイアグラムである。
【図7】図7aおよび図7bはフォルマント帯域におけ
る全パワーを測定すると共に、得られる出力の全パワー
を誘導する前にオクターブ当たり約3dBのろ波を帯域
に付与するためのマイクロプロセッサアルゴリズムの第
3の部分のフローダイアグラムである。
【図8】図1の最後の3つの演算に等価なマイクロプロ
セッサアルゴリズムの第4の部分のフローダイアグラム
である。
【図9】本発明の装置を含むブロックダイアグラムであ
る。
【符号の説明】
51 信号捕獲部 52 特徴分析部 53 パターン/モデリング部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成4年6月19日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図7
【補正方法】変更
【補正内容】
【図7】aおよびbはフォルマント帯域における全パワ
ーを測定すると共に、得られる出力の全パワーを誘導す
る前にオクターブ当たり約3dBのろ波を帯域に付与す
るためのマイクロプロセッサアルゴリズムの第3の部分
のフローダイアグラムである。
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図3】
【図4】
【図8】
【図5】
【図9】
【図6】
【図7】

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 経時変化する値を有する第1の信号の短
    期的な特性特徴を決定するための方法であって、 第1の信号をろ波して複数の周波数帯域の1つに各々存
    在する第2の経時変化信号を得る段階と;周波数の近似
    指示値であって、該近似指示値においてそれぞれの周波
    数に対する前記帯域におけるパワー分布のセントロイド
    が特性特徴として生ずる前記近似指示値を少なくともを
    決定する段階と、を備えて成り、この決定段階が各周波
    数帯域に対して、 時間領域における該帯域に対して第2の信号の全パワー
    を決定して第1のパワー値を提供する段階と、 該帯域に対する第2の信号の周波数成分にスペクトル的
    な重りづけを行う段階と、 時間領域においてスペクトル的に重りづけされた信号の
    全パワーを決定して第2のパワー値を提供する段階と、 第2のパワー値を第1のパワー値で除して該帯域のセン
    トロイドの周波数の指示値を提供する段階とにより行わ
    れる方法。
  2. 【請求項2】 請求項1の方法において、前記スペクト
    ル的な重りづけが少なくともオクターブ当たり3デシベ
    ルの近似であることを特徴とする方法。
  3. 【請求項3】 請求項1又は2の方法において、第1の
    信号の別の特性特徴として周波数帯域の少なくとも1つ
    に対する第1のパワー値を用いる段階を備えることを特
    徴とする方法。
  4. 【請求項4】 請求項1、2又は3の方法において、発
    声音のスペクトル分析に用いられ、周波数帯域が音声フ
    ォルマントに対応することを特徴とする方法。
  5. 【請求項5】 請求項1乃至4のいずれかの方法におい
    て、スペクトル的な重りづけを行う前記段階が該帯域に
    対する第2の信号を少なくとも近似的に微分する段階を
    含むことを特徴とする方法。
  6. 【請求項6】 請求項1乃至5のいずれかの方法におい
    て、所定の比で入力信号をサンプリングすることにより
    第1のサンプルの連続としての第1の信号を誘導し、第
    1の信号のろ波段階によりそれぞれ第2のサンプルの連
    続としての第2の信号を生じ、 各周波数帯域における分布のセントロイド位置の指示値
    を繰り返し誘導して、これら指示値が第2の信号の1つ
    の連続する第2のサンプルの群から誘導されることを特
    徴とする方法。
  7. 【請求項7】 請求項5に従属する請求項6の方法にお
    いて、帯域における最大周波数が前記比に近くない周波
    数帯域の各々に対して、スペクトル的な重りづけを行う
    前記段階が、該帯域に関連する第2のサンプルの各群に
    おけるすべてのサンプルおよび前のサンプルの間の値に
    おける差を見い出して連続的な差のサンプルを提供する
    ことを特徴とする方法。
  8. 【請求項8】 請求項5に従属する請求項6又は請求項
    7の方法において、帯域における最大周波数が前記比に
    近くない周波数帯域の各々に対して、スペクトル的な重
    りづけを行う前記段階が、該帯域に関連する第2の信号
    サンプルの各群におけるすべてのサンプルに対する各サ
    ンプルおよび前のサンプルの値の和を見い出すことによ
    り実行されることを特徴とする方法。
  9. 【請求項9】 請求項6、7又は8の方法において、第
    1及び第2のパワー値を決定する段階が、 パワー値が連続的に誘導される各群の各々のサンプル値
    を取る段階と、 そのように取られたサンプル値の平方の対数を決定する
    段階と、 取られたサンプル値までのサンプルのパワーにおける積
    算したパワーの対数を記憶する段階と、 サンプルの平方の対数と積算したパワーの対数とのいず
    れが大きいかを決定する段階と、 これら対数の大きい方を小さい方から減じてサンプルパ
    ワーと積算したパワーの大きいほうを小さい方で除した
    比の対数を形成する段階と、 所望の対数に対する比の対数の記憶値を参照して1に前
    記比を加えたものの対数を決定する段階と、 記憶値から得られた対数を以前に決定された大きい方の
    対数に加えて積算したパワーの対数を形成する段階と、
    を備えて成り、 これにより、ある群の各サンプルを取ると、積算したパ
    ワーの対数がそのサンプル群に必要とされるパワー値を
    提供することを特徴とする方法。
  10. 【請求項10】 請求項9の方法であって、第2のパワ
    ー値を第1のパワー値で除する前記段階が、 第1のパワー値の対数を第2のパワー値の対数から減じ
    てセントロイドが起こる周波数の指示値を提供する段階
    を備え、 第1のパワー値の前記対数が前記セントロイドを有する
    帯域におけるパワーの指示値を提供することを特徴とす
    る方法。
  11. 【請求項11】 請求項6乃至10のいずれかの方法に
    おいて、第2の信号の少なくとも1つの各連続的なサン
    プル群がウインドニングプロセスにより誘導され、該ウ
    インドニングプロセスが、 各々前記群の1つに対応する所定の等しい時間間隔の連
    続の始点及び終点におけるサンプルの値を減じて、これ
    らサンプルが各間隔の始点から減少しかつ各間隔の終点
    に近づくと増加する量によって値が減少するようにする
    段階を備えることを特徴とする方法。
  12. 【請求項12】 請求項5乃至11のいずれかの方法に
    おいて、最も低い周波数帯域に対する第2の信号の連続
    的なサンプル群の各々がプロセスにより誘導され、所定
    の等しい時間間隔の連続の各々に対する該プロセスが、 最も低い周波数帯域から各間隔の始点に向かう波形サン
    プルにおいてゼロ交差に隣接する第1のサンプルを見い
    出す段階と、 最も低い周波数帯域から各間隔の終点に向かう波形サン
    プルにおいてゼロ交差に隣接する第2のサンプルを見い
    出す段階と、 それぞれの前記時間間隔の第1及び第2のサンプルによ
    り範囲を定められた各群に対する第2の信号のサンプル
    を取る段階とを備える方法。
  13. 【請求項13】 請求項6の方法において、前記第1の
    信号のろ波が、 縦続接続された複数の有限インパルス応答ろ波段階を含
    み、該段階の伝達関数が±2n(1±2-m)の形態の倍
    率係数を有し、nおよびmが自然数であり、0≦m≦3
    および−1≦n≦1であることを特徴とする方法。
  14. 【請求項14】 請求項4に従属する請求項13の方法
    において、 前記周波数帯域の少なくとも2つが重複する領域を有
    し、該重複する領域における減衰特性に対する周波数が
    帯域の縁部に向かって十分に増加し、これにより重複す
    る帯域からのフォルマントからの帯域に相当するフォル
    マントを識別することを特徴とする方法。
  15. 【請求項15】 経時変化する値を有する信号の短期的
    な特性特徴を決定するための装置であって、 経時変化する値を有する第1の信号をろ波して複数の周
    波数帯域の1つに各々存在する第2の経時変化信号を得
    る手段と;周波数の近似指示値であって、該近似指示値
    において周波数に対する前記帯域におけるパワー分布の
    セントロイドが特性特徴として生ずる前記近似指示値を
    少なくともを決定する手段と、を備えて成り、この決定
    手段が、 時間領域における該帯域に対して第2の信号の全パワー
    を決定して第1のパワー値を提供する手段と、 該帯域に対する第2の信号の周波数成分にスペクトル的
    な重りづけを行う手段と、 時間領域においてスペクトル的に重りづけされた信号の
    全パワーを決定して第2のパワー値を提供する手段と、 第2のパワー値を第1のパワー値で除して該帯域のセン
    トロイドの周波数の指示値を提供する手段とを備えるこ
    とを特徴とする装置。
  16. 【請求項16】 請求項1乃至14の方法を実行するよ
    うに構成されたことを特徴とする装置。
  17. 【請求項17】 請求項16の装置において、請求項1
    乃至14における段階の少なくとも1つを実行するよう
    にプログラムされたコンピュータあるいは集積回路を有
    することを特徴とする装置。
  18. 【請求項18】 音声信号を表す第1の信号の短期的な
    特性特徴を決定する音声認識に用いられる方法であっ
    て、 第1の信号をろ波して各々複数の周波数帯域の1つの経
    時変化する第2の信号を得る段階と、 前記帯域におけるパワー分布に対するそれぞれの周波数
    のセントロイドが特性特徴として生ずる位置である周波
    数の少なくとも近似指示値を決定する段階とを備える方
    法。
  19. 【請求項19】 音声信号を表す第1の信号の短期的な
    特性特徴を決定するための音声認識装置であって、 第1の信号をろ波して各々複数の周波数帯域の1つの経
    時変化する第2の信号を得る手段と、 前記帯域におけるパワー分布に対するそれぞれの周波数
    のセントロイドが特性特徴として生ずる位置である周波
    数の少なくとも近似指示値を決定する手段とを備える装
    置。
JP1791791A 1990-02-08 1991-02-08 スペクトル分析のための方法及び装置 Pending JPH05143098A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9002852A GB2240867A (en) 1990-02-08 1990-02-08 Speech analysis
GB90028523 1990-02-08

Publications (1)

Publication Number Publication Date
JPH05143098A true JPH05143098A (ja) 1993-06-11

Family

ID=10670649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1791791A Pending JPH05143098A (ja) 1990-02-08 1991-02-08 スペクトル分析のための方法及び装置

Country Status (3)

Country Link
EP (1) EP0441642A3 (ja)
JP (1) JPH05143098A (ja)
GB (1) GB2240867A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007068847A (ja) * 2005-09-08 2007-03-22 Advanced Telecommunication Research Institute International 声門閉鎖区間検出装置および声門閉鎖区間検出方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623609A (en) * 1993-06-14 1997-04-22 Hal Trust, L.L.C. Computer system and computer-implemented process for phonology-based automatic speech recognition
GB9323991D0 (en) * 1993-11-22 1994-01-12 Holmes John N Method and apparatus for spectral analysis
CA2161045A1 (en) * 1994-11-15 1996-05-16 Michael L. Wells Error detector apparatus with digital coordinate transformation
FR2762180B1 (fr) * 1997-04-15 1999-05-07 Roland Roger Carrat Procede et dispositif d'amplification et de codage du signal vocal destine a l'amelioration de l'intelligibilite en milieu bruyant et a la correction des surdites
US20070127731A1 (en) * 2003-12-01 2007-06-07 Koninklijke Philips Electronics N.V. Selective audio signal enhancement

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3649765A (en) * 1969-10-29 1972-03-14 Bell Telephone Labor Inc Speech analyzer-synthesizer system employing improved formant extractor
DE2313141A1 (de) * 1973-03-16 1974-09-19 Philips Patentverwaltung Verfahren und anordnung zur echtzeitermittlung der uebertragungsfunktionen von systemen
DE2448909B2 (de) * 1974-10-15 1978-12-07 Olympia Werke Ag, 2940 Wilhelmshaven Elektrische Schaltungsanordnung für eine Einrichtung zur Spracherkennung
NL8203520A (nl) * 1982-09-10 1984-04-02 Philips Nv Digitale filterinrichting.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007068847A (ja) * 2005-09-08 2007-03-22 Advanced Telecommunication Research Institute International 声門閉鎖区間検出装置および声門閉鎖区間検出方法

Also Published As

Publication number Publication date
EP0441642A3 (en) 1993-03-10
GB2240867A (en) 1991-08-14
GB9002852D0 (en) 1990-04-04
EP0441642A2 (en) 1991-08-14

Similar Documents

Publication Publication Date Title
Ross et al. Average magnitude difference function pitch extractor
US4038503A (en) Speech recognition apparatus
Charpentier Pitch detection using the short-term phase spectrum
Lahat et al. A spectral autocorrelation method for measurement of the fundamental frequency of noise-corrupted speech
KR101110141B1 (ko) 주기 신호 처리 방법, 주기 신호 변환 방법, 주기 신호 처리 장치, 및 주기 신호의 분석 방법
Goto A robust predominant-F0 estimation method for real-time detection of melody and bass lines in CD recordings
US4905285A (en) Analysis arrangement based on a model of human neural responses
McGonegal et al. A semiautomatic pitch detector (SAPD)
US20170004838A1 (en) Processing Audio Signals with Adaptive Time or Frequency Resolution
Atal et al. Linear prediction analysis of speech based on a pole‐zero representation
US5136529A (en) Digital signal weighting processing apparatus and method
Prasad et al. Speech features extraction techniques for robust emotional speech analysis/recognition
JPH03266899A (ja) 雑音抑圧装置
Hess Algorithms and devices for pitch determination of speech signals
EP0092612B1 (en) Speech analysis system
JPH05143098A (ja) スペクトル分析のための方法及び装置
US5577160A (en) Speech analysis apparatus for extracting glottal source parameters and formant parameters
Cheng et al. Some comparisons among several pitch detection algorithms
Niederjohn et al. A zero-crossing consistency method for formant tracking of voiced speech in high noise levels
Yadav et al. Epoch detection from emotional speech signal using zero time windowing
Kumar et al. A new pitch detection scheme based on ACF and AMDF
CN116884438A (zh) 基于声学特征的练琴音准检测方法及系统
Rahman et al. Formant frequency estimation of high-pitched speech by homomorphic prediction
US4914702A (en) Formant pattern matching vocoder
KR0128851B1 (ko) 극성이 다른 가변길이 듀얼 임펄스의 스펙트럼 하모닉스 매칭에 의한 피치 검출 방법