JPS62229200A - ピツチ検出器 - Google Patents

ピツチ検出器

Info

Publication number
JPS62229200A
JPS62229200A JP61299895A JP29989586A JPS62229200A JP S62229200 A JPS62229200 A JP S62229200A JP 61299895 A JP61299895 A JP 61299895A JP 29989586 A JP29989586 A JP 29989586A JP S62229200 A JPS62229200 A JP S62229200A
Authority
JP
Japan
Prior art keywords
residual
pitch
calculation means
calculating
prediction residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61299895A
Other languages
English (en)
Other versions
JPH0636159B2 (ja
Inventor
安永 智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPS62229200A publication Critical patent/JPS62229200A/ja
Publication of JPH0636159B2 publication Critical patent/JPH0636159B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声の基本ピッチ周波数を求めるピッチ検出
器に関し、特に、音声のスペクトル情報・基本ピッチ周
波数情報等を伝送パラメータとする音声分析合成装置の
ピッチ検出器に関するものである。
〔従来の技術〕
デジタル伝送系統で音声伝送を行な・う場合に、情@量
の圧縮または秘話を行なうために、線形予測符号化方式
などのように、音声信号のスペクトル情報・有声無声情
報・基本ピッチ周波数・音声振幅情報等の音声を形成し
ている基本パラメータのみを一定時間毎に抽出し、量子
化伝送し、受信側で再生する方法が知られている。たと
えば、音声信号を“2400”ビット毎秒のデジタル信
号に帯域圧縮する場合に基本パラメータを抽出する単位
であるフレーム時間を“20”ミリ秒に設定すると、“
1”フレーム当たりのピント割当ては“48″ビツトに
なる。
スペクトル情報とは、線形予測符号化方式の場合は予測
係数、偏自己相関方式の場合はパコール係数、また線ス
ペクトル対分析方式の場合はLSP係数と呼ばれ、音声
の音韻情報をそれぞれ表現したものである。有声無声情
報とは、分析フレームが有音声フレームか無音声フレー
ムかで、音声合成時に音源を還択するために用いる情報
である。
基本ピッチ周波数とは、有音声フレームに求められる音
声の基本周波数であり、合成時には有声音源のパルス間
隔になる。また振幅情報とは、人力音声の電力を表わす
情報で、通常、人力音声の平均振幅およびスペクトル情
叩抽出時の予測残差振幅の積で示される。
上述した従来の音声分析合成WiWに用いられるピッチ
検出器は、入力音声波形または入力音声より逆フィルタ
で求めた残差波形の自己相関関数の最大値または平均振
幅差関数(八MDF)の最少値によりピッチを検出して
いた。特に、残差波形を用いる方法は、入力音声のスペ
クトルエンベロープを取り除き、声帯駆動波形のインパ
ルスが第3図(blに示すように顕著に現れるため、入
力音声波形から直接求める方法に比べ性能が優れている
第3図(a)は原波形であり、第3図(al、 (b)
の横軸の時間目盛りは1目盛り4msである。
〔発明が解決しようとする問題点〕
しかしながら、人力音声波形が逆フィルタの利得が非常
に高くなる正弦波のような波形である場合、第4図(b
lに示すように残差波形は白色雑音的になり、顕著なイ
ンパルスは見られず、自己相関等の手段を用いてもピッ
チを検出することは困難になるという欠点があった。第
4図(alは原波形であり、第4図(a)、 (b)の
横軸の時間目盛りは1目盛り4msである。
〔問題点を解決するだめの手段〕
このような欠点を除去するために本発明は、次数制御さ
れたスペクトル情報を係数とする逆フィルタにより入力
音声の残差を求める残差算出手段と、この残差算出手段
の出力の自己相関係数を求める相関演算手段と、この相
関演算手段の出力の最大値を検出し、これを基に入力音
声のビ・ノチを出力する基本ピッチ算出手段と、入力音
声のスペクトル情報を抽出し、これから求まる平均予測
残差により逆フィルタの次数を制御する制御手段とを設
けるようにしたものである。
また別発明として、音声データを入力し、スペクトル情
報の抽出を行ない、平均予測残差を計算し、この平均予
測残差が予め設定された値より小さくなるまで逐次繰返
し計算を行ない、予め設定された値より小さくなった時
の逐次繰返し計算の回数を出力する制御手段と、前記回
数をパラメータとして音声データに対する逆フィルタ計
算を行ない残差を算出する残差算出手段と、残差の自己
相関係数を求める相関演算手段と、自己相関係数により
音声の基本ピッチを求める基本ピッチ算出手段とを設け
るようにしたものである。
〔作用〕
本発明においては、求められたスペクトルパラメータの
平均予測残差によって、逆フィルタに使用されるスペク
トルパラメータ次数が制限される。
〔実施例〕
本発明に係わるピッチ検出器の一実施例を第1図に示す
。第1図において、1は音声入力端子、2は入力音声の
スペクトル情報を抽出する抽出手段としてのスペクトル
抽出回路、3は平均予測残差を算出する予測残差算出回
路、4はスペクトル情報から求まる平均予測残差により
逆フィルタの次数を制御する次数制御回路、5は次数制
御されたスペクトル情報を係数とする逆フィルタにより
入力音声の残差を求める残差算出手段としての逆フィル
タ、6は相関演算回路、7は残差の相関関数より入力音
声の基本ピッチを求める基本ピッチ算出手段としての最
大検出回路、8はピッチ出力端子である。
次に、このように構成されたピッチ検出器の動作につい
て説明する。音声入力端子1より入力された音声は、パ
コール分析器のようなスペクトル抽出回路2に入力され
る。予測残差算出回路3において、スペクトルパラメー
タよりこのパラメータ群の持つ平均予測残差が計算され
、次数制御回路4の制御入力信号となる。次数制御回路
4において、制御入力信号である平均予測残差が小さい
場合、逆フィルタの利得が大きくなるため、スペクトル
パラメータの次数は小さくなるように制御される。逆フ
ィルタ5においては、次数制限されたスペクトルパラメ
ータを係数とする逆フィルタにより残差が求められる。
相関演算回路6において残差の自己相関演算を行なった
後、最大検出回路7においてピッチ決定が行なわれる。
求められた基本ピッチ周波数はピッチ出力端子8より出
力される。
第2図は第1図に示すピッチ検出器をマイクロプロセッ
サで実施した実施例のフローチャートである。上記マイ
クロプロセッサの動作を第2図を用いて説明する。まず
ステップ11において、音声データx(0)、・・・、
  x (N−1)がマイクロプロセッサに入力される
。入力データxO)、・・・。
x (N−1)を用い、ダービン(Durbin)法に
よってパコール係数の計算が行なわれる。すなわちステ
ップ12において自己相関関数(R,、・・・、R4)
が求められる。以下ステップ13〜ステツプ19から成
る一連の計算をインデックスnの値を逐次増加しながら
繰返し演算を行ない、各回毎に平均予測残差E7を算出
する。
ステップ16において平均予測残差E7とE。ずなわち
R8との比E、、/Eoが、予めゼロと1の間の値たと
えば0.1に設定される閾値Ethと比較され、EI、
/E、がE、hより小さいならばループを出て、ステッ
プ20の計算へ移行する。E、、/EoがEthより小
さくならないときはステップ17でn−Pのときにルー
プから出てステップ20へ移行する。ステップ20にお
いては、ステップ16あるいはステップ17から出たと
きのnの値を最大次数P7とする。
上記ステップ12〜ステツプ20までの一連の動作によ
り第1図のスペクトル抽出回路2.予測残差算出回路3
および次数制御回路4の行なう動作を1つの処理で行な
う。
次にステップ21において、上記のPfiをパラメータ
として入力データx (11、・・・、  x(N−1
)に対する逆フィルタ計算を行ない、残差y1m)(1
≦m≦N−1)を算出する。この機能は第1図の逆フィ
ルタ5の機能に対応する。
次にステップ22において、y(m)の自己相関計算を
行ない、相関係数r、(1≦i≦i m1x)を計算す
る。この機能は第1図の相関演算回路6の機能に対応す
る。
次にステップ23において、r、の最大値「1を検出す
る。この最大値rjpの添字iPがピッチとしてマイク
ロプロセッサの出力となる。この機能は第1図の最大検
出回路7の機能に対応する。
〔発明の効果〕
以上説明したように本発明は、ステップ情報から求まる
平均予測残差により逆フィルタの次数を制御する制御手
段を設けることにより、求められたスペクトルパラメー
タの平均予測残差によって逆フィルタに使用されるスペ
クトルパラメータ次数を制限することができ、正弦波の
ように非常に予測利得の高い入力信号においても、安定
して基本ピッチを検出できる効果がある。
【図面の簡単な説明】
第1図は本発明に係わるピッチ検出器の一実施例を示す
系統図、第2図は第1図のピッチ検出器をマイクロプロ
セッサで実施した実施例のフローチャート、第3図およ
び第4図は従来のピッチ検出器における信号波形を説明
するだめの波形図である。 1・・・音声入力端子、2・・・スペクトル抽出回路、
3・・・予測残差算出回路、4・・・次数制御回路、5
・・・逆フィルタ、6・・・相関演算回路、7・・・最
大検出回路、8・・・ピッチ出力端子。

Claims (4)

    【特許請求の範囲】
  1. (1)次数制御されたスペクトル情報を係数とする逆フ
    ィルタにより入力音声の残差を求める残差算出手段と、
    この残差算出手段の出力の自己相関係数を求める相関演
    算手段と、この相関演算手段の出力の最大値を検出し、
    これを基に前記入力音声のピッチを出力する基本ピッチ
    算出手段と、前記入力音声のスペクトル情報を抽出し、
    これから求まる平均予測残差により前記逆フィルタの次
    数を制御する制御手段とを備えたことを特徴とするピッ
    チ検出器。
  2. (2)制御手段は、入力音声のスペクトル情報を抽出す
    るスペクトル抽出回路と、このスペクトル抽出回路の出
    力に基づき平均予測残差を求める予測残差算出回路と、
    前記スペクトル抽出回路と前記予測残差算出回路の出力
    とに基づき前記逆フィルタの次数を制御する信号を発生
    する次数制御回路とから成ることを特徴とする特許請求
    の範囲第1項記載のピッチ検出器。
  3. (3)音声データを入力し、スペクトル情報の抽出を行
    ない、平均予測残差を計算し、この平均予測残差が予め
    設定された値より小さくなるまで逐次繰返し計算を行な
    い、予め設定された値より小さくなった時の逐次繰返し
    計算の回数を出力する制御手段と、前記回数をパラメー
    タとして前記音声データに対する逆フィルタ計算を行な
    い残差を算出する残差算出手段と、前記残差の自己相関
    係数を求める相関演算手段と、前記自己相関係数により
    前記音声の基本ピッチを求める基本ピッチ算出手段とを
    備えたことを特徴とするピッチ検出器。
  4. (4)スペクトル情報はパコール係数であることを特徴
    とする特許請求の範囲第3項記載のピッチ検出器。
JP61299895A 1985-12-18 1986-12-18 ピツチ検出器 Expired - Lifetime JPH0636159B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP60-283066 1985-12-18
JP28306685 1985-12-18

Publications (2)

Publication Number Publication Date
JPS62229200A true JPS62229200A (ja) 1987-10-07
JPH0636159B2 JPH0636159B2 (ja) 1994-05-11

Family

ID=17660759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61299895A Expired - Lifetime JPH0636159B2 (ja) 1985-12-18 1986-12-18 ピツチ検出器

Country Status (2)

Country Link
US (1) US4845753A (ja)
JP (1) JPH0636159B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
DE69231266T2 (de) * 1991-08-09 2001-03-15 Koninklijke Philips Electronics N.V., Eindhoven Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium
DE69228211T2 (de) * 1991-08-09 1999-07-08 Koninklijke Philips Electronics N.V., Eindhoven Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
JP3248981B2 (ja) * 1992-06-02 2002-01-21 松下電器産業株式会社 計算機
DK0796489T3 (da) * 1994-11-25 1999-11-01 Fleming K Fink Fremgangsmåde ved transformering af et talesignal under anvendelse af en pitchmanipulator
KR100217372B1 (ko) * 1996-06-24 1999-09-01 윤종용 음성처리장치의 피치 추출방법
ATE423434T1 (de) * 1997-04-16 2009-03-15 Emma Mixed Signal Cv Verfahren und vorrichtung zur rauschverminderung, insbesondere bei hörhilfegeräten
KR100440973B1 (ko) * 2002-08-01 2004-07-21 삼성전자주식회사 신호간 상관계수 결정 장치 및 방법과 이를 이용한 신호피치 결정 장치 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5918717B2 (ja) * 1979-02-28 1984-04-28 ケイディディ株式会社 適応形ピツチ抽出方式
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement

Also Published As

Publication number Publication date
JPH0636159B2 (ja) 1994-05-11
US4845753A (en) 1989-07-04

Similar Documents

Publication Publication Date Title
US4912764A (en) Digital speech coder with different excitation types
US4081605A (en) Speech signal fundamental period extractor
US4890328A (en) Voice synthesis utilizing multi-level filter excitation
EP0766230A2 (en) Method and apparatus for coding speech
JPS62229200A (ja) ピツチ検出器
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
US4873723A (en) Method and apparatus for multi-pulse speech coding
JPH03119398A (ja) 音声分析合成方法
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
EP0162585B1 (en) Encoder capable of removing interaction between adjacent frames
JP3299099B2 (ja) 音声符号化装置
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
EP0987680B1 (en) Audio signal processing
JPS62102294A (ja) 音声符号化方式
JP2629762B2 (ja) ピッチ抽出装置
JPS59172690A (ja) ボコ−ダ
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置
JPH0736119B2 (ja) 区分的最適関数近似方法
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JPH02310600A (ja) マルチパルス音声符号化方法
JPS58203499A (ja) 可変長フレ−ム型線形予測ボコ−ダ
JPH0675598A (ja) 音声符号化方法及び音声合成方法
JPS59211094A (ja) 音声信号のピツチ周期抽出方法
JPH0378637B2 (ja)