JPH01238698A - Voice fundamental period extractor - Google Patents
Voice fundamental period extractorInfo
- Publication number
- JPH01238698A JPH01238698A JP6637688A JP6637688A JPH01238698A JP H01238698 A JPH01238698 A JP H01238698A JP 6637688 A JP6637688 A JP 6637688A JP 6637688 A JP6637688 A JP 6637688A JP H01238698 A JPH01238698 A JP H01238698A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- section
- fundamental period
- speech
- cepstrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
【発明の詳細な説明】
[概 要]
本発明は音声分析に係る音声基本周期の抽出、を行なう
方式に関し、
音声の基本周期の変化が多い場合てあっても安定に基本
周期を抽出することのできる音声基本周期抽出装置を提
供することを目的とし、入力された音声テイジタル信号
を分析するそれぞれ分析区間長の異なる複数の音声分析
手段と、
重複する分析区間については上記各分析手段の内の最適
なピーク検出を行なうことのできる分析手段の出力を選
択し各分析手段の出力を結合する選択結合部と、
該選択結合部の出力から音声の基本周期に対応するピー
ク検出を行なう基本周期抽出部とを具備することにより
構成する。[Detailed Description of the Invention] [Summary] The present invention relates to a method for extracting the fundamental period of speech related to speech analysis, and is capable of stably extracting the fundamental period even when there are many changes in the fundamental period of speech. The purpose of the present invention is to provide a speech fundamental period extraction device that can analyze an input speech digital signal, and includes a plurality of speech analysis means each having a different analysis section length, and for overlapping analysis sections, one of the above-mentioned analysis means. a selection combination unit that selects the output of the analysis means that can perform optimal peak detection and combines the outputs of each analysis unit; and a fundamental period extraction unit that performs peak detection corresponding to the fundamental period of speech from the output of the selection combination unit. It is constituted by comprising a section.
[産業上の利用分野]
本発明は音声分析に係る音声基本周期の抽出を行なう方
式に関するものてあって、特に、基本周期の変化が大き
い音声の場合てあっても、その基本周期を安定に抽出す
ることの可能な音声基本周期抽出装置に係る。[Field of Industrial Application] The present invention relates to a method for extracting the fundamental period of speech related to speech analysis, and in particular, it is a method for stabilizing the fundamental period even in the case of speech whose fundamental period changes greatly. The present invention relates to a speech fundamental period extraction device capable of extracting a fundamental period of speech.
[従来の技術]
第6図は従来のケプストラム法による基本周期抽出方式
の例を示す図である。同図において51は音声を電気信
号に変換するマイクロホン、52は音声電気信号をディ
ジタル化するAD変換部、53は数ミリ秒から数十ミリ
秒毎に音声ティジタル信号の固定された区間長の短区間
パワースペクトルを分析するスペクトル分析部、54は
スペクトル分析部53て得られたパワースペクトルの対
数を計算する対数変換部、55は対数スペクトルからケ
プストラムを計算するケプストラム分析部、56はケプ
ストラム上のピークを音声のピッチ(基本周期)として
抽出するピッチ抽出部を表している。[Prior Art] FIG. 6 is a diagram showing an example of a fundamental period extraction method using the conventional cepstrum method. In the figure, 51 is a microphone that converts audio into an electrical signal, 52 is an AD converter that digitizes the audio electrical signal, and 53 is a short circuit that converts the audio digital signal into a fixed section length every several milliseconds to several tens of milliseconds. A spectrum analysis section that analyzes the interval power spectrum, 54 a logarithmic conversion section that calculates the logarithm of the power spectrum obtained by the spectrum analysis section 53, 55 a cepstrum analysis section that calculates the cepstrum from the logarithmic spectrum, and 56 a peak on the cepstrum. It represents a pitch extracting unit that extracts as the pitch (fundamental period) of the voice.
AD変換部52において、標本化およびディジタル化さ
れた音声信号を+Xo+とする。スペクトル分析部53
においては、式Iおよび式■を用いて短区間パワースペ
クトル(P8)を計算する。ここでサンプリング周波数
をf5 )1z、分析区間長をτ秒とした時、分析区
間の標本数(L)は式■で得られる。式Iは高速フーリ
エ変換(FFT)の算法を用いて効率よく計算すること
ができる。式Iでjは虚数単位であり(j2−−1)、
expは自然指数関数である。式■でF8′はF、の共
役複素数を表している。The audio signal sampled and digitized in the AD converter 52 is designated as +Xo+. Spectrum analysis section 53
In , the short-term power spectrum (P8) is calculated using Equation I and Equation (2). Here, when the sampling frequency is f5)1z and the length of the analysis interval is τ seconds, the number of samples (L) in the analysis interval can be obtained by formula (2). Equation I can be efficiently calculated using fast Fourier transform (FFT) algorithms. In formula I, j is an imaginary unit (j2--1),
exp is a natural exponential function. In formula (2), F8' represents the conjugate complex number of F.
F、、−’E ω 、、 Xn exp(−2π
、ink/L) (式 I )P、 =F う
・ F、”
(式 ■ )L −τ・ f5
(弐■)対数変換部54においてはP
、、の対数を弐■により計算する。F,,-'E ω,, Xn exp(-2π
, ink/L) (Formula I) P, =F ・F,”
(Formula ■) L −τ・f5
(2) In the logarithmic conversion unit 54, P
Calculate the logarithm of , , using 2■.
Pk’=log(P、) (式
■)第7図(、)に対数変換された音声パワースペクト
ル(P、”)の例を示す。Pk'=log(P,) (Formula ■) An example of a logarithmically transformed audio power spectrum (P,'') is shown in FIG. 7 (,).
ケプストラム分析部55においては、対数変換部54て
対数変換された短区間パワースペクトルに弐■を用いて
フーリエ変換を施すことによりケプストラム分析を行な
う。The cepstrum analysis unit 55 performs cepstrum analysis by subjecting the short-term power spectrum logarithmically transformed by the logarithmic transformation unit 54 to Fourier transformation using 2).
Cn ’X P M ’ exp(2πjnk/
L) (弐■)第7図(b)にケプストラムの例を
示す。Cn 'X P M' exp(2πjnk/
L) (2■) Figure 7(b) shows an example of the cepstrum.
基本周期抽出部56(ピッチ抽出部)では、人間の音声
の基本周期にあたる約2ミリ秒から約20ミリ秒の範囲
(サンプリング周波数が10kHzの場合、+Cn+の
nが20から200の範囲)でケプストラムの最大値を
求め、その最大値の位置を基本周期とする。The fundamental period extraction unit 56 (pitch extraction unit) extracts the cepstrum in the range of about 2 milliseconds to about 20 milliseconds, which is the fundamental cycle of human speech (when the sampling frequency is 10 kHz, n of +Cn+ is in the range of 20 to 200). Find the maximum value of and set the position of the maximum value as the fundamental period.
音声の基本周期抽出方式には、上述したケプストラム法
の他にも、自己相関法および変形自己相関法などがある
が、これらのケプストラム法、自己相関法および偏自己
相関法の詳細については、電子通信学会編「デジタル信
号処理」およびNTT技術移転株式会社mr音声情報工
学」に詳しく解説されている。In addition to the cepstrum method mentioned above, there are other fundamental period extraction methods for speech, such as the autocorrelation method and the modified autocorrelation method. It is explained in detail in ``Digital Signal Processing'' edited by the Institute of Communication Engineers and ``Mr.Speech Information Engineering'' by NTT Technology Transfer Co., Ltd.
[発明か解決しようとする課題]
音声分析において、安定に基本周期を抽出するなめには
、−iに基本周期の分析区間(本方式では短区間スペク
トルを計算する区間)の中に音声波形の数周期分以上が
入る必要がある。[Problem to be solved by the invention] In speech analysis, in order to stably extract the fundamental period, it is necessary to -i include the speech waveform in the analysis interval of the fundamental period (in this method, the interval in which the short-term spectrum is calculated). It is necessary to include at least several cycles.
定常な音声を分析する場合は広い分析区間にすれは安定
に基本周期を得ることがてきる。しかし基本周期の変化
の多い場合、広い分析区間を用いると分析結果が実際の
音声の基本周期変化に追従したものにならない。また分
析区間内で実際の音声の基本周期が変化するためケプス
トラノ\上での最大値の場所が不明確になり基本周期抽
出が不安定になることがある。また語尾や文末なとのよ
うに基本周期が長くなったり20ミリ秒以上)場合に、
30ミリ秒の固定分析長ては音声波形が15個程度しか
入らす、ケプストラム上での最大値か不明確になり基本
周期抽出が不安定になりやすい という問題点があった
。When analyzing stationary speech, it is possible to stably obtain the fundamental period over a wide analysis interval. However, when there are many changes in the fundamental period, if a wide analysis interval is used, the analysis result will not follow the actual changes in the fundamental period of speech. Furthermore, since the fundamental period of the actual voice changes within the analysis interval, the location of the maximum value on the cepstrano\ becomes unclear, and fundamental period extraction may become unstable. Also, when the fundamental period is long (20 milliseconds or more), such as at the end of words or sentences,
With a fixed analysis length of 30 milliseconds, only about 15 audio waveforms can be included, and the problem is that the maximum value on the cepstrum is unclear, and fundamental period extraction tends to become unstable.
第8図はこのような基本周期の抽出について説明する図
であって、(a)は十分基本周期が抽出できる場合を示
しており (b)は基本周期の抽出が不安定になる場合
を示している。Figure 8 is a diagram explaining extraction of such a fundamental period, where (a) shows a case where the fundamental period can be extracted sufficiently, and (b) shows a case where extraction of the fundamental period becomes unstable. ing.
本発明は上述したような従来の問題点に鑑み、実際の音
声の基本周期が変化した場合であっても安定に基本周期
を抽出することのできる音声基本周期の抽出装置を提供
することを目的としている。In view of the conventional problems as described above, an object of the present invention is to provide a speech fundamental period extraction device that can stably extract the fundamental period even when the actual fundamental period of speech changes. It is said that
[課題を解決するための手段]
本発明によれば上述の目的は前記特許請求の範囲に記載
した手段により達成される。すなわち、本発明は、入力
された音声ディジタル信号を分析するそれぞれの分析区
間長の異なる複数の音声分析手段と、重複する分析区間
については上記各分析手段の内の最適なピーク検出を行
なうことのできる分析手段の出力を選択し各分析手段の
出力を結合する選択結合部と、該選択結合部の出力から
音声の基本周期に対応するピーク検出を行なう基本周期
抽出部とを具備する音声基本周期抽出装置である。[Means for Solving the Problems] According to the present invention, the above objects are achieved by the means described in the claims. That is, the present invention includes a plurality of audio analysis means for analyzing an input audio digital signal, each having a different analysis section length, and for overlapping analysis sections, performing optimum peak detection among the above-mentioned analysis sections. A speech fundamental period comprising: a selection combination section that selects the outputs of the analysis means that can be used and combines the outputs of the respective analysis means; and a fundamental period extraction section that detects a peak corresponding to the fundamental period of the speech from the output of the selection combination section. It is an extraction device.
[作 用]
本発明においては、それぞれ分析区間長の異なる複数の
音声分析手段の分析結果の中から、短い基本周期のP4
キは短い分析区間長による分析が選択されるため高い時
間追従性が得られるとともに、長い基本周期の場合は長
い分析区間長による分析が選択されるため安定抽出が行
なえる。本方式では、分析区間長の変更を意識的に行な
うことなく等価的に(自動的に)分析区間長の変更を実
現していることになる。[Function] In the present invention, P4 with a short fundamental period is selected from among the analysis results of a plurality of speech analysis means each having a different analysis section length.
Key is that analysis with a short analysis interval length is selected, so high time followability can be obtained, and in the case of a long fundamental period, analysis with a long analysis interval length is selected, so stable extraction can be performed. In this method, the analysis interval length is equivalently (automatically) changed without consciously changing the analysis interval length.
本発明の作用について、例えば音声分析手段としてケプ
ストラム法を採った場合について更に説明すれは、ケプ
ストラムの低ケフレンシー部分については分析区間長が
短い分析により得られたケプストラムを選択し、中ケフ
レンシー部分については分析区間長が中庸の分析により
得られたケプストラムを選択し、高ケフレンシ一部分に
ついては分析区間長が長い分析により一8=
得られたケプストラムを選択し、さらに各選択されたケ
プストラムを結合し新たに選択結合ケプストラムを作成
し、最後にこの選択結合ケプストラム上で基本周期抽出
を行なっている。To further explain the operation of the present invention, for example, when the cepstrum method is adopted as a speech analysis means, a cepstrum obtained by analysis with a short analysis interval length is selected for the low quefrency part of the cepstrum, and a cepstrum obtained by analysis with a short analysis interval length is selected for the low quefrency part of the cepstrum, and for the middle quefrency part. Select a cepstrum obtained by an analysis with a medium analysis interval length, and for a part with high quefrency, select a cepstrum obtained by an analysis with a long analysis interval length, and then combine each selected cepstrum to create a new one. A selectively combined cepstrum is created, and finally fundamental period extraction is performed on this selectively combined cepstrum.
これにより前述のように分析区間長を自動的に最適なも
のとする制御が実現される。As a result, control for automatically optimizing the analysis interval length is realized as described above.
[実施例]
第1図は本発明の第1の実施例の構成を示すブロック図
であって、ケプストラム法による音声基本周期の抽出装
置の例を示している。同図において、1はマイクロホン
、2はAD変換部を表している。また、3−1〜3−n
はそれぞれスペクトル分析部であり、各スペクトル分析
部は従来のスペクトル分析部と同じ機能であるが分析区
間長が異なっていて、スペクトル分析部3−1は最も短
い分析区間長を有し、他のスペクトル分析部は番号順に
より長い分析区間長を有し、スペクトル分析部3−nが
最も長い分析区間長を有している。各分析区間の相対関
係を第2図に示す。各分析区間は同図に示すように音声
の基本周期を分析しない時間位置を中心に両側に徐々に
分析区間長を長くしたものになりいる。4−1〜4−n
は対数変換部であり、従来例の対数変換部と全く同じ機
能のものである。5−1〜5−nはゲプストラム分析部
群であり、各スペクトル分析部は従来のケプストラム分
析部と同し機能であるが、前記スペクトル分析部群と同
様にそれぞれ分析化区間長が異なっていて、ケプストラ
ム分析部5−1は最も短い分析区間長を有し、他のケプ
ストラム分析部は番号順により長い分析区間長を有し、
ケプストラム分析部5−nは最も長い分析区間長を有す
る。6はケプストラノ\選択結き部てあり、ケプストラ
ム分析部5−1〜5−「lから得られたゲプスドラム群
から目的の選択結きケプストラムを作成する。選択結合
の処理の例を第3図に示す。[Embodiment] FIG. 1 is a block diagram showing the configuration of a first embodiment of the present invention, and shows an example of an apparatus for extracting fundamental periods of speech using the cepstral method. In the figure, 1 represents a microphone, and 2 represents an AD converter. Also, 3-1 to 3-n
are respectively spectrum analysis units, and each spectrum analysis unit has the same function as a conventional spectrum analysis unit, but has different analysis interval lengths, and the spectrum analysis unit 3-1 has the shortest analysis interval length, and the other The spectrum analysis sections have longer analysis section lengths in numerical order, and spectrum analysis section 3-n has the longest analysis section length. Figure 2 shows the relative relationship between each analysis section. As shown in the figure, each analysis section is such that the length of the analysis section is gradually increased on both sides of the time position where the fundamental period of the voice is not analyzed. 4-1 to 4-n
is a logarithmic conversion section, which has exactly the same function as the logarithmic conversion section of the conventional example. 5-1 to 5-n are a group of gepstrum analysis units, and each spectrum analysis unit has the same function as a conventional cepstrum analysis unit, but like the spectrum analysis unit group, each has a different analysis interval length. , the cepstrum analysis unit 5-1 has the shortest analysis interval length, and the other cepstrum analysis units have longer analysis interval lengths in numerical order,
The cepstrum analysis section 5-n has the longest analysis interval length. 6 is a cepstrano\selection connection section, and a cepstrum analysis section 5-1 to 5-5-" creates a desired selection connection cepstrum from the gepstrum group obtained from 5-1. An example of the selection connection process is shown in Fig. 3. show.
7は基本周期抽出部であり、従来の基本周期抽出部と同
じ機能のものであるが、ケプストラム選択結合部6で得
られた選択結合ケプストラl\の最大値を求め、その最
大値の位置を基本周期とする。Reference numeral 7 denotes a fundamental period extraction section, which has the same function as the conventional fundamental period extraction section, but calculates the maximum value of the selectively combined cepstra l\ obtained by the cepstrum selection and combination section 6, and determines the position of the maximum value. This is the basic period.
第4図は本発明の第2の実施例の構成を示すブロック図
であって、自己相関分析による音声基本周期の抽出装置
の例を示している。FIG. 4 is a block diagram showing the configuration of a second embodiment of the present invention, and shows an example of an apparatus for extracting fundamental periods of speech using autocorrelation analysis.
同図において、l、2は第1図と同様であって、8−1
〜8−nは自己相関分析部群であり、各自己相関分析部
では、前記第2図で示されたような分析区間長の異なる
自己相関分析を行なう。具体的には、AD変換された音
声信号を(×1)とし、分析区間切り出しの影響を除去
するための窓関数を (ωl1l−0+L〜+ (1
−は分析区間長)とすると分析区間長がLの場合の自己
相関関数(σ4.L)は次の式■で計算される。nは分
析中心位置である。In the figure, l and 2 are the same as in Figure 1, and 8-1
8-n is a group of autocorrelation analysis units, and each autocorrelation analysis unit performs autocorrelation analysis with different analysis interval lengths as shown in FIG. Specifically, the AD-converted audio signal is set to (×1), and the window function for removing the influence of cutting out the analysis section is (ωl1l-0+L~+ (1
- is the analysis interval length), the autocorrelation function (σ4.L) when the analysis interval length is L is calculated by the following formula (2). n is the analysis center position.
9は自己相関選択結合部であり、前述したゲブストラム
分析の場合のケプストラム選択結合部と同様な機能を有
するものである。Reference numeral 9 denotes an autocorrelation selection combination unit, which has the same function as the cepstrum selection combination unit in the case of the Gebstral analysis described above.
また、基本周期抽出部10も前記第1の実施例の場合と
同様な機能を有するものである。Further, the fundamental period extraction section 10 also has the same function as in the first embodiment.
第5図は本発明の第3の実施例のブロック図であって、
変形自己相関分析による音声基本周期の抽出装置の例に
ついて示している。FIG. 5 is a block diagram of a third embodiment of the present invention,
An example of a device for extracting fundamental periods of speech using modified autocorrelation analysis is shown.
同図において、1.2は、第1図あるいは第4図の場合
と同様であり、11−1〜11−nはそれぞれ自己相関
分析部であって、これも前記、第2の実施例の場合と同
様のものである。In the figure, 1.2 is the same as in FIG. 1 or 4, and 11-1 to 11-n are autocorrelation analysis units, which are also similar to those in the second embodiment. It is similar to the case.
12−1〜12−nは線形予測分析部であって各自己相
関分析部で得られた自己相関関数(σ1、L)より式■
を満たす(α1.L)を計算する。12-1 to 12-n are linear prediction analysis units, and the formula ■ is calculated from the autocorrelation function (σ1, L) obtained by each autocorrelation analysis unit.
Calculate (α1.L) that satisfies the following.
この計算にはLevinson法か利用できる。The Levinson method can be used for this calculation.
(式■)
つぎに、式■により (α1.L)の相関係数であるA
パラメーターを計算する。(Formula ■) Next, by Formula ■, A which is the correlation coefficient of (α1.L)
Calculate parameters.
13−1〜13−〇はそれぞれは変形自己相関分析部で
あり、式■に従って変形自己相関分析部+W、、L)を
計算する。Each of 13-1 to 13-0 is a modified autocorrelation analysis section, which calculates the modified autocorrelation analysis section +W, , L) according to equation (2).
−1−Σ ^J+Lσ、−1(式IX)14は自己相関
選択結合部てあり、ケプストム分析の場きのケプスラム
選択結き部6に相当する。-1-Σ ^J+Lσ, -1 (Formula IX) 14 is an autocorrelation selection coupling part, which corresponds to the cepslum selection coupling part 6 in the case of cepstom analysis.
[発明の効果]
以上説明したように本発明によれば、変化の激しい音声
の基本周波数に柔軟に追従てき、しかも安定に基本周波
数を抽出てきる音声の基本周波数抽出装置を実現できる
。[Effects of the Invention] As described above, according to the present invention, it is possible to realize a fundamental frequency extracting device for speech that can flexibly follow the fundamental frequency of speech that changes drastically and can extract the fundamental frequency stably.
本発明の方式は従来の場合に比し、若干処理量は増大す
るものの、複雑なアルゴリズムなしに非常に優れた基本
周期抽出装置を実現てきる。Although the method of the present invention requires a slight increase in the amount of processing compared to the conventional method, it is possible to realize an extremely excellent fundamental period extraction device without complicated algorithms.
そして、この程度の処理量の増大は、近年のLSI技術
によれは全く問題となるものではない。This level of increase in processing amount is not a problem at all with recent LSI technology.
第1図は本発明の第1の実施例の構成を示すブロック図
、第2図は各スペクトル分析部の分析区間の相対関係を
示す図、第3図はケプストラムの選択結合の処理の例を
示す図、第4図は本発明の第2の実施例の構成を示すブ
ロック図、第5図は本発明の第3の実施例のブロック図
、第6図は従来のケプストラム法による基本周期抽出方
式の例を示す図、第7図は対数変換された音声パワース
ペクトルとケプストラムの例を示す図、第8図は基本周
期の抽出について説明する図である。
l ・マイクロホン、2・・・−・AD変換部、3−1
〜3−n−・・・・スペクトル分析部、4−1〜4−ロ
ー・・対数変換部、5−1〜5−11 ケプストラム
分析部、6・・・・ケプストラム選択結合部、 7.1
O515・・・・・・基本周期抽出部、8−1〜8−n
、11−1〜11−n・・・・・・自己相関分析部、9
・・・・自己相関選択結合部、12−1〜12−n ・
・線形予測分析部、13−1〜13−n ・変形自己相
関分析部、14・・・・・変形自己相関選択結合部
\、
代理人 弁理士 井 桁 貞 −。
4\
X 、。
\□□
(a) 分断区間
新同期の抽出1
第 a
(b)分析y間
二ついて説明マる回
図FIG. 1 is a block diagram showing the configuration of the first embodiment of the present invention, FIG. 2 is a diagram showing the relative relationship between the analysis intervals of each spectrum analysis section, and FIG. 3 is an example of cepstrum selective combination processing. 4 is a block diagram showing the configuration of the second embodiment of the present invention, FIG. 5 is a block diagram of the third embodiment of the present invention, and FIG. 6 is fundamental period extraction using the conventional cepstral method. FIG. 7 is a diagram showing an example of the method, FIG. 7 is a diagram showing an example of a logarithmically transformed audio power spectrum and cepstrum, and FIG. 8 is a diagram explaining extraction of the fundamental period. l ・Microphone, 2...-AD converter, 3-1
~3-n-... Spectral analysis unit, 4-1 to 4-Rho... Logarithmic conversion unit, 5-1 to 5-11 Cepstrum analysis unit, 6... Cepstrum selection combination unit, 7.1
O515... Fundamental period extraction unit, 8-1 to 8-n
, 11-1 to 11-n... Autocorrelation analysis section, 9
...Autocorrelation selection combination unit, 12-1 to 12-n ・
・Linear prediction analysis section, 13-1 to 13-n ・Modified autocorrelation analysis section, 14...Modified autocorrelation selection combination section\, Agent Patent attorney Sada Igeta -. 4\X,. \□□ (a) Extraction of new synchronization in divided section 1 Part a (b) Diagram with two explanations between analysis y
Claims (1)
の分析区間長の異なる複数の音声分析手段と、 重複する分析区間については上記各分析手段の内の最適
なピーク検出を行なうことのできる分析手段の出力を選
択し各分析手段の出力を結合する選択結合部と、 該選択結合部の出力から音声の基本周期に対応するピー
ク検出を行なう基本周期抽出部とを具備することを特徴
とする音声基本周期抽出装置。 2 複数の各音声分析手段はそれぞれのスペクトル分析
部と対数変換部とケプストラム分析部とからなり、選択
結合部はケプストラム選択結合部である請求項1記載の
音声基本周期抽出装置。 3 複数の各音声分析手段は自己相関分析による分析手
段であり、選択結合部は自己相関選択結合部である請求
項1記載の音声基本周期抽出装置。 4 複数の各音声分析手段は自己相関分析部と線形予測
分析部と変形自己相関分析部とからなり、選択結合部は
変形自己相関選択結合部である請求項1記載の音声基本
周期抽出装置。 5 複数の分析区間として中心位置が同じで分析区間長
が異なるものを用いる請求項1〜請求項4記載の音声基
本周期抽出装置。[Scope of Claims] 1. A plurality of audio analysis means each having a different analysis section length for analyzing an input audio digital signal, and for overlapping analysis sections, optimal peak detection among the above-mentioned analysis means is performed. A selection combination unit that selects the outputs of the analysis means that can perform the analysis and combines the outputs of the analysis means, and a fundamental period extraction unit that detects a peak corresponding to the fundamental period of the voice from the output of the selection combination unit. Characteristic voice fundamental period extraction device. 2. The speech fundamental period extraction device according to claim 1, wherein each of the plurality of speech analysis means comprises a respective spectrum analysis section, a logarithmic conversion section, and a cepstrum analysis section, and the selective combination section is a cepstrum selection combination section. 3. The speech fundamental period extraction device according to claim 1, wherein each of the plurality of speech analysis means is an analysis means based on autocorrelation analysis, and the selective combination section is an autocorrelation selection combination section. 4. The speech fundamental period extraction device according to claim 1, wherein each of the plurality of speech analysis means includes an autocorrelation analysis section, a linear prediction analysis section, and a modified autocorrelation analysis section, and the selective combination section is a modified autocorrelation selection combination section. 5. The speech fundamental period extraction device according to claim 1, wherein the plurality of analysis sections have the same center position and different analysis section lengths.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63066376A JP2650954B2 (en) | 1988-03-19 | 1988-03-19 | Speech basic period extraction device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63066376A JP2650954B2 (en) | 1988-03-19 | 1988-03-19 | Speech basic period extraction device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01238698A true JPH01238698A (en) | 1989-09-22 |
| JP2650954B2 JP2650954B2 (en) | 1997-09-10 |
Family
ID=13314046
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63066376A Expired - Fee Related JP2650954B2 (en) | 1988-03-19 | 1988-03-19 | Speech basic period extraction device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2650954B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007304515A (en) * | 2006-05-15 | 2007-11-22 | Sony Corp | Audio signal expansion and compression method and apparatus |
| ES2432480A1 (en) * | 2012-06-01 | 2013-12-03 | Universidad De Las Palmas De Gran Canaria | Method for the clinical evaluation of the speech system of patients with laryngeal pathologies through an acoustic evaluation of voice quality (Machine-translation by Google Translate, not legally binding) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS55115100A (en) * | 1979-02-28 | 1980-09-04 | Kokusai Denshin Denwa Co Ltd | Adaptor type pitch extraction system |
| JPS57204093A (en) * | 1981-06-10 | 1982-12-14 | Hitachi Ltd | Pitch extraction system |
-
1988
- 1988-03-19 JP JP63066376A patent/JP2650954B2/en not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS55115100A (en) * | 1979-02-28 | 1980-09-04 | Kokusai Denshin Denwa Co Ltd | Adaptor type pitch extraction system |
| JPS57204093A (en) * | 1981-06-10 | 1982-12-14 | Hitachi Ltd | Pitch extraction system |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007304515A (en) * | 2006-05-15 | 2007-11-22 | Sony Corp | Audio signal expansion and compression method and apparatus |
| US8306828B2 (en) | 2006-05-15 | 2012-11-06 | Sony Corporation | Method and apparatus for audio signal expansion and compression |
| ES2432480A1 (en) * | 2012-06-01 | 2013-12-03 | Universidad De Las Palmas De Gran Canaria | Method for the clinical evaluation of the speech system of patients with laryngeal pathologies through an acoustic evaluation of voice quality (Machine-translation by Google Translate, not legally binding) |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2650954B2 (en) | 1997-09-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6349277B1 (en) | Method and system for analyzing voices | |
| CA1182222A (en) | Method and apparatus for continuous word string recognition | |
| US5056150A (en) | Method and apparatus for real time speech recognition with and without speaker dependency | |
| ATE50463T1 (en) | TEXT-TO-SPEECH TRANSLATION SYSTEM. | |
| GB2107100A (en) | Continuous speech recognition | |
| JPS58134698A (en) | Voice recognition method and apparatus | |
| GB1569990A (en) | Frequency compensation method for use in speech analysis apparatus | |
| CN102054480A (en) | Method for separating monaural overlapping speeches based on fractional Fourier transform (FrFT) | |
| JPH01238698A (en) | Voice fundamental period extractor | |
| KR0155315B1 (en) | Pitch Search Method of CELP Vocoder Using LSP | |
| JPH0527792A (en) | Voice enhancement device | |
| Indefrey et al. | Design and evaluation of double-transform pitch determination algorithms with nonlinear distortion in the frequency domain-preliminary results | |
| CN108538309B (en) | Singing voice detection method | |
| JP2871120B2 (en) | Automatic transcription device | |
| JP2905112B2 (en) | Environmental sound analyzer | |
| KR100526110B1 (en) | Method and System for Pith Synchronous Feature Generation of Speaker Recognition System | |
| JP2806048B2 (en) | Automatic transcription device | |
| JP3352144B2 (en) | Voice recognition device | |
| KR0128851B1 (en) | Pitch detecting method by spectrum harmonics matching of variable length dual impulse having different polarity | |
| JP2001083978A (en) | Voice recognition device | |
| JP3233543B2 (en) | Method and apparatus for extracting impulse drive point and pitch waveform | |
| JPH04323696A (en) | Automatic music transcriber | |
| JP2569472B2 (en) | Voice analyzer | |
| JP3263136B2 (en) | Signal pitch synchronous position extraction method and signal synthesis method | |
| CN112002343A (en) | Speech purity recognition method and device, storage medium and electronic device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |