JPH026080B2 - - Google Patents

Info

Publication number
JPH026080B2
JPH026080B2 JP16250582A JP16250582A JPH026080B2 JP H026080 B2 JPH026080 B2 JP H026080B2 JP 16250582 A JP16250582 A JP 16250582A JP 16250582 A JP16250582 A JP 16250582A JP H026080 B2 JPH026080 B2 JP H026080B2
Authority
JP
Japan
Prior art keywords
pitch
circuit
threshold value
waveform
audio waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP16250582A
Other languages
English (en)
Other versions
JPS5950500A (ja
Inventor
Taisuke Watanabe
Kenji Kaga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57162505A priority Critical patent/JPS5950500A/ja
Publication of JPS5950500A publication Critical patent/JPS5950500A/ja
Publication of JPH026080B2 publication Critical patent/JPH026080B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声波形を任意の区間に分割し、区
間毎に二つの非線形変換を行ない、その二つの変
数の相互相関係数を算出してピツチ抽出を行なう
ピツチ抽出装置に関するものである。
従来例の構成とその問題点 音声波形における有声音部分は周期的な繰り返
し波形を持ちその周期(ピツチ)の変化特性は、
音声処理においては重要なパラメータであること
が知られている。音声の分析合成系においては、
分析時に抽出したピツチの抽出結果が合成時にお
ける合成音の品質に大きな影響を与える。
音声波形のピツチ抽出方法としては、従来から
音声信号をある時間長で分割するフレーム毎に音
声信号の自己相関係数を算出し抽出する方法が広
く用いられている。しかしながら前記方法は、正
しいピツチの倍周期や半周期の成分などを誤つて
ピツチとして抽出したり、その演算の複雑さから
多くの演算時間をを必要とするため音声の実時間
分析には適さない。また実時間分析を行なうハー
ドウエア構成を考えた場合にも、前記理由により
高速な演算処理装置を必要とするために大規模な
装置となるなどの欠点を有している。
前記演算時間を短縮する方法として、音声波形
x(n)を次式 y1(n)=x(n)−CL x(n)≧CL =0 |x(n)|<CL =x(n)+CL x(n)≦−CL ……(1) y2(n)=1 x(n)≧CL =0 |x(n)|<CL =−1 x(n)≦−CL ……(2) ただし、CL:しきい値 によつて非線形変換し、その非線形変換した二値
の相互相関係数を演算してピツチを抽出する方法
が提案されている。(LAWRENCE R・
RABINER:On the Use ot Autocorrelation
Analysis for Pitch Detection、IEEE Trans.
ASSP−25、No.1、1977) しかしながら前記方法においても、正しいピツ
チの倍周期や半周期などの成分を誤つてピツチと
して抽出するという欠点を有している。
発明の目的 本発明は、以上のような従来の問題点を解決す
るためになされたもので、ピツチ抽出において、
従来に比べてトータルの演算処理量が少なくて済
みかつ高精度なピツチを得ることのできるピツチ
抽出装置を提供することを目的とする。
発明の構成 この目的を達成するために本発明は、任意の区
間に分割した音声波形を、しきい値によつて非線
形変換してy1(n)、y2(n)を得、これらの関数
の相互相関値P()を求めP()が最大になるτの値を
ピツチとする過程において、前記しきい値を、音
声波形を前半部と後半部に分割して、分割した二
つの部分の最大値を別々に求め、この求めた二つ
の最大値から決定する回路を新たに付加し、しき
い値を前記任意の区間毎に可変にすることにより
演算量を少なくし、かつピツチの誤抽出を防止す
ることができるようにしたものである。
実施例の説明 以下本発明の一実施例を図面を用いて説明す
る。第1図は本発明の実施例を説明するためのブ
ロツク図である。
音声波形が、A/D変換器1に入力される。
A/D変換器1は、音声波形をあらかじめ定めら
れた周波数で標本化し(普通、電話音声程度の音
質であれば、標本化周波数は8KHz、音声波形の
標本化は8ビツトで充分であり、以下この数値を
用いて説明する。)、音声波形を離散的な時系列信
号に変換した標本化音声波形をデータバツフアメ
モリ2へ出力する。データバツフアメモリ2は標
本化音声波形を一時的に記憶し、分析フレーム周
期分の標本化音声波形を記憶した時点で、標本化
音声波形の前半部を前半部最大値検出回路3へ残
りの後半部を後半部最大値検出回路4へ出力す
る。ここで前半部と後半部の標本化音声波形のデ
ータ量は等しい。さらにデータバツフアメモリ2
は、前記標本化音声波形のすべてを、非線形変換
回路6及び三値分類回路7へ出力する。
前半部最大値検出回路3は、前記標本化音声波
形の最大値MAX1を求め、しきい値決定回路5
へ出力する。後半部最大値検出回路4は、前記標
本化音声波形の後半部の最大値MAX2を求め、
しきい値決定回路5へ出力する。
しきい値決定回路5は前記最大値MAX1及び
最大値MAX2を基に次の(3)、(4)、(5)式によつて
しきい値CLを決定する。
IMAX=max(MAX1、MAX2) ………(3) IMAX1=min(MAX1、MAX2) ………(4) CL=min(IMAX・0.6、IMAX1・0.8) ………(5) ここでmax( 、 )はどちらか大きい方を、
min( 、 )はどちらか小さい方を選択する意
味である。
しきい値決定回路5は、この決定されたしきい
値CLを、非線形変換回路6及び三値分類回路7
へ出力する。
ここで本発明のしきい値決定方法を、第2図を
用いて説明する。
分析フレームAにおいてピツチはTであること
は明白である。ピツチTを検出するためには、し
きい値レベルを波高値201以下に、すなわちしき
い値202に設定する必要がある。次に分析フレー
ムBにおいてピツチはT1である。しかし、しき
い値202を採用すると波高値203がしきい値202を
越えて、ピツチ抽出の際に真のピツチT1の倍周
期を取る場合がある。本発明のしきい値決定法で
は分析フレームBにおいて、分析フレームBを前
半部B1、後半部B2に分割し前記前半部最大値検
出回路3及び後半部最大値検出回路4にて前半部
の最大値は波高値204、後半部の最大値は波高値
205が検出され、次にしきい値決定回路5によつ
て波高値205の60%の値がしきい値206として決定
される。この結果ピツチ抽出においては真のピツ
チT1が得られる。
また同様に分析フレームAについても本発明の
しきい値決定法を用いれば、波高値201の80%の
値がしきい値(しきい値202と同レベル)として
決定されるから、ピツチ抽出においては真のピツ
チTが得られる。
非線形変換回路6は、前記バツフアメモリ2よ
り転送され一時的に記憶されている前記標本化音
声波形を、しきい値CLを基に前記(1)式に従つて
非線形変換する。第3図は非線形変換回路6によ
つて標本化音声波形を非線形変換した例である。
第3図aは、標本化音声波形、bは非線形変換後
の標本化音声波形である。さらに非線形変換回路
6は、非線形変換した標本化音声波形をピツチ算
出回路8へ出力する。
三値分類回路7は、前記バツフアメモリ2より
転送され一時的に記憶されている前記標本化音声
波形を、しきい値CLを基に前記(2)式に従つて三
値に分類し、ピツチ算出回路8へ出力する。第4
図は三値分類回路7によつて標本化音声波形を前
記(2)式のように三値分類した例である。第4図a
は、標本化音声波形、bは三値分類後の信号であ
る。
ピツチ算出回路8は、非線形変換回路6及び三
値分類回路7を介して供給されたy1(n)、y2(n)
の信号に基づいて次の(6)式のように相互相関係数
をP()を求める。
P()N-〓 〓N=1 y1(i)・y2(i+τ) ………(6) (i=1、………N) ただし1フレーム当りの標本化音声波形の個数
はN個とする。
通常の成人男女のピツチの変化範囲は50Hz〜
400Hzであり、この範囲を探索すると、τの範囲
は、τ=20〜160である。前記式(6)から求められ
たP()の中で最大値を取るものをPmax(τo)とす
るとその時のτoをピツチとする。
発明の効果 以上説明したように本発明は、音声波形の振幅
の状態によつて、しきい値CLを分析フレーム周
期毎に変化させて、その値によつて音声波形を非
線形変換しy1(n)、y2(n)を演算し、y1(n)、
y2(n)の相互相関係数を演算することにより、
演算時間が少なくかつ高精度のピツチ抽出が可能
である。
【図面の簡単な説明】
第1図は本発明の一実施例におけるピツチ抽出
装置を説明するためのブロツク図、第2図は、し
きい値決定方法を説明するための説明図、第3図
は、非線形変換回路6の特性を示す図、第4図は
三値分類回路7の特性を示す図である。 1……A/D変換器、2……データバツフアメ
モリ、3……前半部最大値検出回路、4……後半
部最大値検出回路、5……しきい値決定回路、6
……非線形変換回路、7……三値分類回路、8…
…ピツチ算出回路。

Claims (1)

  1. 【特許請求の範囲】 1 音声波形を、任意の区間に分割し、区間毎に
    ピツチ抽出を行なうように構成され、各区間内
    で、音声波形x(n)を次式 y1(n)=x(n)−CL x(n)≧CL =0 |x(n)|<CL =x(n)+CL x(n)≦−CL ………(1) y2(n)= x(n)≧CL =0 |x(n)|<CL =−1 x(n)≦−CL
    ………(2) ただし、CL:しきい値 に従つて、非線形変換しy1(n)、y2(n)を演算
    し更にy1(n)、y2(n)の相互相関係数を演算す
    ることによりピツチが求められるとき、区間内の
    音声波形を前半部と後半部に分割し、二つの部分
    の音声波形の振幅情報より上記しきい値を、区間
    毎に決定することを特徴とするピツチ抽出装置。
JP57162505A 1982-09-17 1982-09-17 ピツチ抽出装置 Granted JPS5950500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57162505A JPS5950500A (ja) 1982-09-17 1982-09-17 ピツチ抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57162505A JPS5950500A (ja) 1982-09-17 1982-09-17 ピツチ抽出装置

Publications (2)

Publication Number Publication Date
JPS5950500A JPS5950500A (ja) 1984-03-23
JPH026080B2 true JPH026080B2 (ja) 1990-02-07

Family

ID=15755890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57162505A Granted JPS5950500A (ja) 1982-09-17 1982-09-17 ピツチ抽出装置

Country Status (1)

Country Link
JP (1) JPS5950500A (ja)

Also Published As

Publication number Publication date
JPS5950500A (ja) 1984-03-23

Similar Documents

Publication Publication Date Title
US4038503A (en) Speech recognition apparatus
EP0153787B1 (en) System of analyzing human speech
EP0033412A3 (en) Method and apparatus for speech recognition
US4081605A (en) Speech signal fundamental period extractor
US4388491A (en) Speech pitch period extraction apparatus
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
CA1164569A (en) System for extraction of pole/zero parameter values
US4282406A (en) Adaptive pitch detection system for voice signal
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
KR100366057B1 (ko) 인간 청각 모델을 이용한 효율적인 음성인식 장치
JPH0462399B2 (ja)
JPH026080B2 (ja)
US5570455A (en) Method and apparatus for encoding sequences of data
JPS60225200A (ja) 音声符号化器
JPS605000A (ja) ピツチ抽出装置
JPH0114599B2 (ja)
JPS607499A (ja) ピツチ抽出回路
JPS5834986B2 (ja) 適応形音声検出回路
KR970003035B1 (ko) 음성신호의 피치정보 검출 방법
JPH0122638B2 (ja)
JPS62194300A (ja) ピッチ抽出方法
JPH0117599B2 (ja)
JPS5942880B2 (ja) ピツチ抽出装置
JPH04372998A (ja) 音声ピッチ変換装置
JPS59102296A (ja) ピツチ抽出方法