JPH0552959B2 - - Google Patents

Info

Publication number
JPH0552959B2
JPH0552959B2 JP60103166A JP10316685A JPH0552959B2 JP H0552959 B2 JPH0552959 B2 JP H0552959B2 JP 60103166 A JP60103166 A JP 60103166A JP 10316685 A JP10316685 A JP 10316685A JP H0552959 B2 JPH0552959 B2 JP H0552959B2
Authority
JP
Japan
Prior art keywords
pitch
spectrum
formant
extraction method
logarithmic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60103166A
Other languages
English (en)
Other versions
JPS61260300A (ja
Inventor
Shigeo Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyo Communication Equipment Co Ltd
Original Assignee
Toyo Communication Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyo Communication Equipment Co Ltd filed Critical Toyo Communication Equipment Co Ltd
Priority to JP60103166A priority Critical patent/JPS61260300A/ja
Publication of JPS61260300A publication Critical patent/JPS61260300A/ja
Publication of JPH0552959B2 publication Critical patent/JPH0552959B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Working-Up Tar And Pitch (AREA)
  • Fats And Perfumes (AREA)
  • Steroid Compounds (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分布〕 本発明は、ピツチ抽出方法に係り、特に音声信
号をフーリエ変換してから対数変換して得た対数
スペクトルの第1ホルマントの周波数領域を強調
してそれ以外の部分の影響を抑える重み付け関数
により重み付け処理を行い、正確ピツチ周期を抽
出するピツチ抽出方法に関する。
〔従来の技術〕
ピツチ周期には音声分析合成系における重要な
基本パラメータの1つである。音声分析合成系と
して、人間の発声機構のシユミレーシヨンに基づ
いて音声波形の種々のパラメータを抽出し、その
パラメータを伝送することにより音声伝送の情報
量の圧縮を図るようにしたものがある。特に、そ
のパラメータの中でも声帯の振動に対応した音声
の基本周波数成分であるピツチパラメータは合成
音声の品質に重大な影響を及ぼすとされており、
そのためピツチ抽出ではピツチ検出の正確さが要
求されている。
従来のピツチ抽出方法としては、例えば第3図
に示すケプストラム法を利用するものがある。
第4図イ〜ハを参照しながら、このピツチ抽出
方法を説明する。例えば、第4図イに示す波形の
音声信号を入力すると、第1に、ある区間を、例
えば、スプリアス成分を除去するのに適したハミ
ング窓等の時間窓を用いて切り出しを行い、短時
間スペクトルを求める。第2に、切り出した区間
のスペクトルに対し、高速フーリエ変換を行つて
パワスペクトラムを求める。第3に、パワスペク
トラムの対数変換を行い、第4図ロに示す対数ス
ペクトルを求める。第4に、対数スペクトルを高
速逆フーリエ変換を施して、第4ハに示すケプス
トラム波形を得る。このケプストラム波形からピ
ークPを検出し、ピツチTを求める。
〔発明が解決しようとする問題点〕
しかしながら、音韻の種類により、あるいはピ
ツチの高調波が対数スペクトルの第1あるいは第
2のホルマントのピーク位置(第4図ロのH1
るいはH2)に不均一に乗つたり、環境ノイズや
口腔内ノイズが対数スペクトルの第1あるいは第
2ホルマントの低レベルの部分(第4図ロのL1
あるいはL2)にに乗つたりすると、ケプストラ
ムに鋭いピークが表われないことがあるため、ピ
ツチ抽出に正確さを欠く恐れがある。
〔問題点を解決するための手段および作用〕
本発明は上記に鑑みてなされたものであり、ケ
プストラム波形においてピツチを明確に出現さ
せ、ピツチ周期を的確に検出するため、対数スペ
クトルの第1ホルマントの周波数領域を強調して
それ以外の部分の影響を抑える重み付け関数を用
いて重み付け処理を行うピツチ抽出方法を提供す
るものである。
〔実施例〕
以下、本発明によるピツチ抽出方法を詳細に説
明する。
第1図イは本発明によるピツチ抽出方法を示す
処理工程図である。
例えば、第2図イに示す原音波形を入力する
と、第1に、音声信号のある区間を、例えば、ハ
ミング窓、サイン窓等の時間窓を用いて切り出し
を行い、短時間スペクトルを求める。第2に、時
間窓を用いて用いて切り出した区間のスペクトル
を高速フーリエ変換してパワスペクトラムを求め
る。第3に、高速フーリエ変換後、対数変換を行
い、対数スペクトルを求める(第2図ロ)。第4
に、このようにして求めた対数スペクトルを第1
図ロに示す重み付け関数により、重み付け処理を
行う。この重み付け関数は、例えば、周波数軸を
Nで表した時点nにおける値W(n)が、 W(n)=SIN2(N−2n0+2n/2Nγ) (但し、n0は重み付けの中心周波数を表わして
いる) で与えられるような関数である。
また、重み付けの中心周波数であるn0は、第1
ホルマント(第2図ロのH1)の近傍にする。更
に第1ホルマントは、大体200〜1200Hz付近に設
定しておけば良い。
このようにして、対数スペクトルの第1ホルマ
ントH1の重み付けをする重み付け処理を行つた
場合、対数スペクトルは第2図ハに示すように第
1ホルマントH1は強調され、第2ホルマントH2
は抑圧された波形を描く。第5に、重み付け処理
を行つた対数スペクトルに高速フーリエ変換を施
して第2図ニに示すケプストラムの波形を得る。
この第2図ニのケプストラムの波形からピークP
を検出し、ピツチTを抽出する。
〔発明の効果〕
以上説明した通り本発明によるピツチ抽出方法
によれば、対数スペクトルの第1ホルマントの周
波数領域を強調して、それ以外の部分の影響を抑
える重み付け関数を用いて重み付け処理を行うた
め、ケプストラム波形においてピツチを明確に出
現させ、ピツチ周期を的確に検出することができ
る。
【図面の簡単な説明】
第1図イは本発明によるピツチ抽出方法を示す
処理工程図、第1図ロは重み付け関数を示す説明
図、第2図イ,ロ,ハ,ニは、本発明に基づく処
理により原音波形が変化していく工程を示す説明
図、第3図は従来のピツチ抽出方法を示す処理工
程図、第4図イ,ロ,ハは、従来技術に基づく処
理により原音波形が変化していく工程を示す説明
図である。 符号の説明、H1……第1ホルマント、H2……
第2ホルマント、D……ピーク、T……ピツチ、
L1L2……第1あるいは、第2ホルマントの低レ
ベルの部分。

Claims (1)

  1. 【特許請求の範囲】 1 音声信号をフーリエ変換して得たパワスペク
    トラムを対数変換し、この対数変換した対数スペ
    クトラムを逆フーリエ変換して得たケプストラム
    からピツチを抽出するピツチ抽出方法において、 前記対数スペクトルの第1ホルマントの周波数
    領域を強調する重み付け関数に基づいて前記対数
    スペクトルを修正することを特徴とするピツチ抽
    出方法。
JP60103166A 1985-05-15 1985-05-15 ピツチ抽出方法 Granted JPS61260300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60103166A JPS61260300A (ja) 1985-05-15 1985-05-15 ピツチ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60103166A JPS61260300A (ja) 1985-05-15 1985-05-15 ピツチ抽出方法

Publications (2)

Publication Number Publication Date
JPS61260300A JPS61260300A (ja) 1986-11-18
JPH0552959B2 true JPH0552959B2 (ja) 1993-08-06

Family

ID=14346921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60103166A Granted JPS61260300A (ja) 1985-05-15 1985-05-15 ピツチ抽出方法

Country Status (1)

Country Link
JP (1) JPS61260300A (ja)

Also Published As

Publication number Publication date
JPS61260300A (ja) 1986-11-18

Similar Documents

Publication Publication Date Title
Sluijter et al. Spectral balance as an acoustic correlate of linguistic stress
Shrawankar et al. Techniques for feature extraction in speech recognition system: A comparative study
Serra et al. Spectral modeling synthesis: A sound analysis/synthesis system based on a deterministic plus stochastic decomposition
JP2763322B2 (ja) 音声処理方法
Cheng et al. Automatic and reliable estimation of glottal closure instant and period
EP1422693B1 (en) Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program
Mowlaee et al. Interspeech 2014 special session: Phase importance in speech processing applications
EP0853309B1 (en) Method and apparatus for signal analysis
Gopalan et al. A comparison of speaker identification results using features based on cepstrum and Fourier-Bessel expansion
JPH08509556A (ja) 音響信号中の過渡状態を検出し生成する方法とシステム
Mittal et al. Study of characteristics of aperiodicity in Noh voices
Sebastian et al. An analysis of the high resolution property of group delay function with applications to audio signal processing
EP1850328A1 (en) Enhancement and extraction of formants of voice signals
JPH05307399A (ja) 音声分析方式
CN120148484B (zh) 一种基于微型计算机的语音识别方法及装置
Ferreira et al. Impact of a shift-invariant harmonic phase model in fully parametric harmonic voice representation and time/frequency synthesis
US4982433A (en) Speech analysis method
Araujo et al. Formant frequency estimation using a Mel-scale LPC algorithm
Kawahara et al. Higher order waveform symmetry measure and its application to periodicity detectors for speech and singing with fine temporal resolution
JPH0552959B2 (ja)
Park et al. Improving pitch detection through emphasized harmonics in time-domain
Rao et al. A comparative study of various pitch detection algorithms
JP3035939B2 (ja) 音声分析合成装置
CN118942461B (zh) 一种语音辅助阅卷的声音智能识别方法及系统
Kawahara STRAIGHT-TEMPO: A universal tool to manipulate linguistic and para-linguistic speech information