JPS592918B2 - ピッチ抽出装置 - Google Patents

ピッチ抽出装置

Info

Publication number
JPS592918B2
JPS592918B2 JP3447380A JP3447380A JPS592918B2 JP S592918 B2 JPS592918 B2 JP S592918B2 JP 3447380 A JP3447380 A JP 3447380A JP 3447380 A JP3447380 A JP 3447380A JP S592918 B2 JPS592918 B2 JP S592918B2
Authority
JP
Japan
Prior art keywords
pitch
circuit
waveform
audio
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP3447380A
Other languages
English (en)
Other versions
JPS56130800A (en
Inventor
雅久 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP3447380A priority Critical patent/JPS592918B2/ja
Publication of JPS56130800A publication Critical patent/JPS56130800A/ja
Publication of JPS592918B2 publication Critical patent/JPS592918B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 本発明は音声波形からその基本ピッチを抽出するピッチ
抽出装置に関する。
近年、音声を認識する事ができる音声認識装置並びに音
声を合成する事のできる音声合成装置等の音声処理装置
の開発が急がれており、これ等音声処理装置に用いられ
る音声データの一つとして音声の基本ピッチが重要視さ
れている。
斯様な音声の基本ピッチとは、音声を聞いた時に感じる
音の高さの感覚であつて音声を形成する5 多数の周波
数成分の内最も低い基本周波数に相当する。
この音声の基本ピッチを抽出する手段としては、現在の
所、音声波形にみられるピッチパルスに該当する波形の
周期的ピークを検出する波形処理方10式、及び何らか
の前処理を施した音声波形の自己相関関数又は線形予測
分析における残差信号の自己相関関数を用いる相関処理
方式、等の方式がある。
斯様な基本ピッチ抽出手段の内、波形処理方式15を用
いたピッチ抽出装置に於ては、従来は音声波形のピーク
に対して所定のしきい値を設ける事に依つてピークの存
在を検出していたので、変動する音声波形のピーク値に
対して確実なピーク位置の検出が困難であり、正確な基
本ピッチは得られ20なかつた。
本発明は、上述の如き不都合を解消する目的で為された
ものであり、波形ピークを動的に求めるピッチ抽出装置
を提供するものである。
第1図に本発明のピッチ抽出装置の構成を示す。
25同図に於て、1は入力される音声を音声信号に変換
するマイクロフォン、2は該マイクロフォン1からの音
声信号を増巾するマイクアンプである。
3は該マイクアンプ2から得られる音声信号が有する音
声波形の包絡線を検出する包絡検出回路で30あつて、
音声波形の包絡線を抽出する包絡線抽出器4と、該包絡
線抽出器4から得られる音声波形の包絡線信号を微分す
る微分回路5と、該微分回路5からの信号が正であるか
負であるかを判定する第1比較器6とから構成されてい
る。
7は上記35マイクアンプ2から得られる音声信号を所
定の時間遅延させる第1遅延器であつて、包絡検出回路
3での検出時間を保障するものである。
8は該第1遅延器7からの入力音声波形を更に一定時間
遅延させた遅延音声波形の最大値を保持する保持回路で
あつて、第2遅延器9と、該遅延器9からの遅延音声波
形の増加する波高値を刻々と貯える保持器10とから構
成されている。
11は第1のピツチ回路であつて、上記第1遅延器7か
ら得られる入力音声の波高値が上記保持回路8に保持さ
れる遅延音声波形の最大値より大きい場合にはt?H1
?レベル信号を出力し、又、その逆の場合にばL゛レベ
ル信号を出力する第2比較器12と、上記包絡検出回路
3の第1比較器6から得られる信号に基いて、音声波形
の包絡線が増大している時に上記第2比較器12からの
信号を出力せしめる第1アンドゲート13と、から構成
されている。
14は第2のピツチ回路であつて、上記第1遅延器7か
ら得られる入力音声の波高値を一定の増巾率で増巾する
増巾器15と、該増巾器15からの増巾入力音声波形の
波高値が上記保持回路8に保持される遅延音声波形の最
大値より大きい場合にはIfHlレベル信号を出力し、
又その逆の場合には゛7L゜゛レベル信号を出力する第
3比較器16と、上記包絡検出回路3の第1比較器6か
ら得られる信号をインバータ17に依つて反転した信号
に基いて、音声波形の包絡線が減少している時に上記第
3比較器16からの信号を出力せしめる第2アンドゲー
ト18と、から構成されている。
尚、増巾器15での増巾率は後の説明で明らかになるが
1.3程度が選ばれる。19は該第2のピツチ回路14
の第2アンドゲート18からの信号と上記第1のピツチ
回路11のアンドゲート13からの信号との論理和を取
り゜1H′VレベルとWlL′1レベルの2値信号を出
力するオアゲートであつて、この出力が入力音声波形の
ピーク位置を表している。
又、この出力は上記保持回路8の保持器10にも印加さ
れQlH′Vレベル信号出力時に於いてのみこの保持器
10を動作せしめて、保持回路8に依る遅延音声波形の
最大値保持を可能にしている。斯様な構成の本発明ピツ
チ抽出装置に於ては、上記マイクロフオン1への音声出
力が増大状態にある時、上記包絡検出回路3は包絡線抽
出器4と微分器5と第1比較器6とに依つて増大する入
力音声波形の包絡を検出して?1H′1レベル信号を出
力する。又、上記マイクロフオン1への音声出力が減少
状態にある時は逆に、゛Lnレベル信号を出力する。こ
の包絡検出回路3の動作は、上記第1のピツチ回路11
、第2のピツチ回路14及び保持回路8の前段に設けら
れている第1遅延器7の遅延効果に依つて、これ等回路
の動作に先んじて為されるものである。従つて、上記マ
イクロフオン1とマイクアンプ2と第1遅延器7を経て
入力された音声信号が増大している時は、上記包絡検出
回路3からの゜1H1レベル信号に依つて上記第1のピ
ツチ回路11は動作状態となり、上記第2のピツチ回路
14は動作禁止状態となる。又、入力された音声信号が
減少している時は、上述と逆になる。次に、増大状態に
ある入力音声信号が第1のピツチ回路11に導入される
場合、即ち、第2図に示す如く入力音声波形にみられる
ピツチパルスに該当する周期的ピークPl,P2,P3
、のピーク点を結ぶ包絡線Aが時間と共に増大する場合
に就いて説明する。
同図に於て、ピークP1のピーク値をX1その時刻をt
1、ピークP2のピーク値をX2その時刻をT2、ピー
クP3のピーク値をX3とし、更に入力音声波形の波高
値XがX=X1となる時刻をt′1(但しt1〈t′1
くT2)とし、x=X2となる時刻をt′2(但しT2
〈t′2くT3)とする。今時刻tがt1くt<t″1
の時、上記保持回路8にはX1が保持されており、入力
音声波形の波高値Xはx<X1となり、上記第1のピツ
チ回路11は第2比較器12に依るxとX1の大小比較
の結果を出力可能状態のアンドゲート13を介して第2
図bに示す如ぐL゛゜レベル信号を出力する。時刻tが
t=t′1になると、X=X1となりこの時点を越える
と、上記第1のピツチ回路11からの出力17H?lレ
ベル信号に切り換わる。この出力はオアゲート19を経
て上記保持回路8に伝送され、保持回路8はこの11H
11レベル信号に依つて遅延音声波形の増大しつつある
波高値の取り込みを開始する。時刻tがt″,くt<.
T2の時、上記保持回路8に刻々と保持されている遅延
音声波形の波高値はこの時の増大しつつある入力音声の
波高値xより小さいので、上記第1のピツチ回路11は
51H?lレベル信号を出力しつづける。時刻tがt=
T2の時入力音声波形の波高値X&@x=X2であり、
保持回路8の遅延音声波形の波高値がこのX2と略等し
くなり、この時点を越えると上記第1のピツチ回路11
からの信号はT9L゛レベル信号に切り換わる。この1
1L1レベル信号がオアゲート19を経ゼ上記保持回路
8へ伝送される事に依り、この保持回路8は遅延音声波
形の波高値の取り込みを中止して、ピーク値X2を保持
した状態となる。更に時刻tがT2くt<,t′!の時
は、上述のt1くt<.t′1と同様に゛QL6lレベ
ル信号が得られ、t′2くt〈T3の時は、上述のt″
1くt<.T2と同様に・V5H8レベル信号が得られ
る。斯様にして第1のピツチ回路11から得られるQl
HlレベルとFlLlレベルの信号は、第2図bの如き
音声波形にみられる周期的ピークの位置をよく表わすパ
ルス信号となる。一方、減少状態にある入力音声信号が
第2のピツチ回路14に導入された場合、即ち、第3図
に示す如く入力音声波形にみられるピッチパルスに該当
する周期的ピークQl,Q2,Q3、のピーク点を結ぶ
包絡線Bが時間と共に減少する場合に就いて説明する。
同図に於て、ピークQ1のピーク値をX1その時刻をt
1、ピークQ3のピーク値をX2その時刻をT2、ピー
クQ3のピーク値をX3その時刻をT3、とし、更に入
力音声波形の波高値Xをα倍した値DxがαX=X1と
なる時刻をt′1(但しt1くt′1〈T2)とし、α
X=X2となる時刻をt′2(但しT2くt′2〈T3
)とする。このαは、上記第2のピツチ回路14を構成
し、入力音声信号を増巾する増巾器15の増巾率であつ
てX1/α〈X2且つX2/d<X3であり、X1/α
及びX2/αがピークQ2及びピークQ3以外の極大値
より大きい事が必要である。斯様な条件からこのαは、
1.3程度に選ばれるのが適当である。今時刻がt1〈
t<t″1の時、上記保持回路8にはX1が保持されて
おり、入力音声波形の波高値Xはx<X1/αとなり、
上記第2のピツチ回路14は、先ず増巾器15に依つて
xをd倍し、このαxとX1の大小比較を第3比較器1
6に依つて行ない、この比較結果を出力可能状態のアン
ドゲート18を介して第3図bに示す如ぎL′1レベル
信号を出力する。時刻tがt−t″1の時、αX=X1
となり、この時点を越えると、上記第2のピツチ回路1
4からの出力ば7H”レベル信号に切り換わる。この1
!H!?レベル信号はオアゲート19を経て上記保持回
路8に伝送され、保持回路8は遅延音声波形の増大しつ
つある波高値の取り込みを開始する。時刻tがt′1く
t<T2の時、上記保持回路8に刻々と保持されている
波高値はこの時の入力音声の波高値Xを増巾したDxよ
り小さいので、上記第1のピツチ回路11は”H8レベ
ル信号を出力しつづける。時刻tがt−T2の時、入力
音声波形の波高値はピークQ2のピーク値X2であつて
、この時点を越えると、入力音声波形の波高値xを増巾
した値αXは上記保持回路8の遅延音声波形の波高値よ
り小さくなり、上記第2のピツチ回路14は11Lt1
レベル信号に切り換わる。この!1L1レベル信号に依
つて保持回路8は遅延音声波形の波高値の取り込みを中
止して、ピーク値X2を保持した状態となり、以下同様
に第3図bの如きパルス信号が第2のピツチ回路から得
られる。斯様にして得られた第1のピツチ回路11から
のパルス信号と第2のピツチ回路12からのパルス信号
とはオアゲート19を介して一連のピツチパルスとして
出力される。
本発明のピツチ抽出回路は、以上の説明から明らかな如
く、音声出力が増大している時に動作する第1のピツチ
回路と、音声出力が減少している時に動作する第2のピ
ツチ回路と、を備え、上記第1のピツチ回路は、遅延音
声波形の最大値と音声信号との比較をする比較回路によ
つて構成され、又第2のピツチ回路は遅延音声波形の最
大値と音声信号を一定の増巾率で増巾した音声信号との
比較をする比較回路によつて構成されているので、音声
波形にみられるピツチパルスに該当する周期的ピークを
そのピーク値の変動状態に応じて動的に抽出する事がで
き、音声波形の基本ピツチが正確に得られる。
又、本発明ピツチ抽出装置から得られるピツチ情報は2
値のパルス信号であるので、この信号に基いた自己相関
関数を容易に導出する事ができ、本発明ピツチ抽出装置
は音声機器に用いられる相関処理方式に於ける前処理手
段としても最適である。
【図面の簡単な説明】
第1図は本発明のピツチ抽出装置の構成を示すプロツク
図、第2図と第3図は本発明装置の動作を説明する為の
波形図であつて、1は包絡検出回路、8は保持回路、1
1は第1のピツチ回路、12は第2比較器、14は第2
のピツチ回路、16は第3比較器、を夫々示している。

Claims (1)

    【特許請求の範囲】
  1. 1 音声波形の基本ピッチを抽出するピッチ抽出装置に
    おいて、音声波形の包絡線を検出する包絡検出回路と、
    入力音声波形を一定時間遅延させた遅延音声波形の最大
    値を保持する保持回路と、上記包絡線検出回路で音声出
    力が増大している事を検出した時動作する第1のピッチ
    回路と、上記包絡線検出回路で音声出力が減少している
    事を検出した時に動作する第2のピッチ回路と、からな
    り、上記第1のピッチ回路は上記保持回路での最大値と
    音声信号との比較をする比較回路によつて構成され、又
    、第2のピッチ回路は上記保持回路での最大値と音声信
    号を一定の増巾率で増巾した音声信号との比較をする比
    較回路とに依つて構成された事を特徴とするピッチ抽出
    装置。
JP3447380A 1980-03-17 1980-03-17 ピッチ抽出装置 Expired JPS592918B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3447380A JPS592918B2 (ja) 1980-03-17 1980-03-17 ピッチ抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3447380A JPS592918B2 (ja) 1980-03-17 1980-03-17 ピッチ抽出装置

Publications (2)

Publication Number Publication Date
JPS56130800A JPS56130800A (en) 1981-10-13
JPS592918B2 true JPS592918B2 (ja) 1984-01-21

Family

ID=12415214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3447380A Expired JPS592918B2 (ja) 1980-03-17 1980-03-17 ピッチ抽出装置

Country Status (1)

Country Link
JP (1) JPS592918B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60262197A (ja) * 1984-06-08 1985-12-25 シャープ株式会社 周期的信号の基本周波数および位相検出回路
JP4210934B2 (ja) * 2003-04-22 2009-01-21 ヤマハ株式会社 音高抽出装置およびプログラム

Also Published As

Publication number Publication date
JPS56130800A (en) 1981-10-13

Similar Documents

Publication Publication Date Title
US4811399A (en) Apparatus and method for automatic speech recognition
JPS6453623A (en) Pulse detecting circuit employing amplitude and time recognition
US5054078A (en) Method and apparatus to suspend speech
KR950034058A (ko) 음성 신호의 피치 주기 추출 장치
JPS592918B2 (ja) ピッチ抽出装置
JPS5710199A (en) Voice information extractor
JPH0916193A (ja) 話速変換装置
JPS62150295A (ja) 音声認識方法
SU1781701A1 (en) Method of separation of speech and nonstationary noise signals
JP2737109B2 (ja) 音声区間検出方式
JPS60101598A (ja) 音声区間検出装置
US20020181714A1 (en) Audio processing, e.g. for discouraging vocalisation or the production of complex sounds
KR950009329B1 (ko) 캠코더의 환경잡음 제거장치
JPH039400A (ja) 音声認識装置
KR100241414B1 (ko) 음성 인식 티브이의 음소거 회로
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPS6250837B2 (ja)
JPS61140999A (ja) 音声区間検出方式
JPS59228300A (ja) 音声区間検出方式
JPS6177100A (ja) 音声区間検出回路
JPH0644724B2 (ja) ハウリング検出装置
JPH0394300A (ja) 音声検出器
JPS60216400A (ja) 音声区間検出回路
JPS59231600A (ja) 音声区間検出方法
JPS61250700A (ja) 音声認識装置