JPS58168094A - 音声分析処理方式 - Google Patents

音声分析処理方式

Info

Publication number
JPS58168094A
JPS58168094A JP57050431A JP5043182A JPS58168094A JP S58168094 A JPS58168094 A JP S58168094A JP 57050431 A JP57050431 A JP 57050431A JP 5043182 A JP5043182 A JP 5043182A JP S58168094 A JPS58168094 A JP S58168094A
Authority
JP
Japan
Prior art keywords
power spectrum
linear prediction
coefficient
fourier transform
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57050431A
Other languages
English (en)
Other versions
JPS6238719B2 (ja
Inventor
藤崎 博也
ヒネク・ヘルマンスキ−
佐藤 泰雄
杉田 忠靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57050431A priority Critical patent/JPS58168094A/ja
Publication of JPS58168094A publication Critical patent/JPS58168094A/ja
Publication of JPS6238719B2 publication Critical patent/JPS6238719B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Eye Examination Apparatus (AREA)
  • Selective Calling Equipment (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 ■ 発明の技iI分舒 本発明線、音声分析処理方式、特にパワー・スペクトル
を抽出して自己相関係数を算出して纏形予淵係数を抽出
する音声分析処理方式において、上記パワー・スペクト
ルについてのパワー・スペクトル包絡情報を抽出してこ
れにもとづいて上記線形予測係数に対応する改良線形予
欄係歇を抽出するようにし、ノイズによる影響やピッチ
馬波数の変動による影響を受けることが少なく、かつホ
ルマント周波数を正確に抽出できるようにした音声分析
処理方式に関するものである。
(B)  技術の背景と間隠点 従来から、第1mを参照して後述する如き構成によって
線形予測係数8に)/K(→を抽出することが行われて
いる0なお上Ie@に)/K(→は係数α(→お2よび
/壕九拡K (s)を意味してい為。
上記線形予欄係歇g(s)/K(→ 紘以降の音声分析
部層的に利用されてゆくものであるが、ノイズによる影
響やピッチ馬波数の変動による影響を受は易く、ホルマ
ント周波数を正確に抽出する上で多少の問題が残されて
いる。
(C)  発明の目的と構成 本発明は、上記の点を解決することを目的としており、
パワー・スペクトルを用いて線形予測係数を抽出するに
当って、パワー・スペクトルのいわばピーク点を連らね
要所のパワー・スペクトル包絡情報にもとづいて改良線
形予測係数を抽出するようにし、ピッチ周波数の変動や
ノイズによる影響を受けに<<、かつホルマント周波数
を正しく抽出できるようにし九改良線形予測係数を得る
ようにすることを目的としている。そしてそのために、
本発明の音声分析処理方式紘、入力音声信号をフーリエ
変換するフーリエ変換部をそなえ、上記入力音声のパワ
ー・スペクトルを抽出し、鋏パワー・スペクトルをフー
リエ逆変換部を介して自己相関係数を算出して線形予測
係数を抽出する音声分析処理方式において’、、、、、
1..:(、’llr記抽出されたパワー・スペクトル
のピークに4とづいて当Ill 7’iワー・スペクト
ルのパワー・スペクトル包絡情報を抽出するよう構成す
ると共に該パワー・スペクトル包絡情報を上記フーリエ
逆変換部に供給し、これによって得られ光自己相関係数
にもとづいて改良線形予測係数を抽出するよう構成した
ことを特徴としそいる。以下図面を参照しつつ説明する
(功 発明の夷總例 第1@lは本発明の前提となる従来の構成の一例、第2
図は本発明の一夷總例構成、第3@lは本発明にいうパ
ワー・スペクトル包絡情報の−1様を説明する説明図、
嬉41Iおよび第5図は夫々本発明によって得られえ改
良線形予測係数を用いることによる効果を説明する説明
図を示す。
第1図において、lはフーリエ変換部、2は〕IJ工道
変換部、3は線形予測係数算出部、S(→は入力音声信
号、P(ロ)はパワー・スペクトル、R(→は自己相関
係数、11に)、/K(→ は線形予測係数を表わして
いる。
従来から線形予測係数C←)/K(%)を得るに当って
、第11g11示J如自構成が採用され、入力音声信号
8(→についてフーリエ変換部lによってフーリエ変換
を行い例えば2乗するなどしてパワー−スペクトルP(
へ)を抽出する。該パワー・スペクトルa、第3tlに
おいてパワー・スペクトルP(ロ)の対数値をとってL
ogP(へ)として示す如く、ピッチ周波数に対応した
凹凸をもつものであると考えてよい。
従来、骸パワー・スペクトルP−にもとづいて、フーリ
エ逆変換部2によって、自己相関係数R(→を算出し、
そして線形予測係数算出部3によって11A Is W
i’ *’l係数g(→/K(→ を抽出するようにし
ていた0 第2図は本発明の一夷織例構成を示しており、図中の符
号1,2.3は第1図に対応し、4はピッチ周波数抽出
一部、5はパワー・スペクトル包絡情報抽出部を聚わし
ている。また令(へ)紘パワー・スペクトル包絡情報、
R′に)は本発@において得られる自己相関係数、a’
 (III)/に’ (→は改良線形予測係数を表わす
本発明の場合には、第2図において入力信号S(→から
ピッチ周波数を抽出するなどして、フーリエ変換部lを
介して得られているパワー・スペクトルP (@ Kつ
いて、第3図図示+印の如き点に対応するパワー・スペ
クトル情報を抽出し、該抽出されたパワー・スペクトル
情報をフーリエ逆変換部2へ入力するようにされる0上
記+印の如き点に対応するパワー・スペクトル情報を本
明細書において社パワー・スペクトル包絡情報?(ホ)
と呼んでいる0そして上記+印の点以外のノくワー・ス
ペクトルの値を値#0”としてフーリエ逆変換部2へ入
力するようにする。勿論、十印の点のみの値をフーリエ
逆変換112へ入力してもよい0上記+印の点は、フー
リエ変換部lを介して得られ大パワー・スペクトルP(
−におけるピーク点に対応しているものと考えてよく、
第2図図示の場合に社、入力音声信号8(1)から図示
ピッチ周波数抽出部4によってピッチ周波数を抽出し、
該ピッチlll波数で1!する周期の整数倍(1倍を含
む)の周期でサンプリングする点で与えられるoしかし
本発明においてれ、上記パワー・スペクトル包絡情報省
−を得る手段については任意であるO上記パワー・スペ
クトル包絡情報f−が第2図図示の如くフーリエ逆変換
部2に入力されかつ得られえ出力fi、f(%)が線形
予測係数算出部3に人力されることKよって、本発明に
いう改良線形予測係数α′(ルバ′(→が抽出される。
第4図線本発明によって得られた改良線形予測係数を用
いる仁とによる効果を説明する説明図を示している。―
纏Aは本発明による改良線形予測係数を用いた場合に対
応し、曲線BFi第1図において得られた線形予測係数
を用いた場合に対応している。なお横軸は8/N比(d
B)を表わし、縦軸はスペクトル間の距離について対数
をとっ九値(dB)を表わしている。
骸スペクトル間の距離とは次のようなものを表わしてい
ると考えてよい。即ち、モデル・スペクトルSを合成音
によっそ\成しておく。一方、これに対して所望量のノ
イズを混入せしめてl511II(tたは第2図)図示
の構成によって線形予測係数を抽出する0皺抽出された
線形予測係数にもとづいてスペクトルTを生成する。そ
して上記スペクトル8とTとの差に相轟する距離が得ら
れ、峡距離を上記スペクトル間の距離としている。した
がって、**スペクトル間の距離が大きい程、得られて
いる線形予測係数が真のものからずれている量が大きい
ことを表わしている。
第4図図示の場合、8/N比が小さくなる程、即ちノイ
ズの混入量が大になる椙、上記距離が大となってゆくが
、本発明に対応する改良線形予測係数を用いたもの(−
線■)や側がより小さい距離となっていることが判る。
壕九嬉5111は、母音レ−1;t!l、1峠、l−1
,1*I  K対応してインパルス励起を行なう九場倉
について、原スペクトルと抽出された線形予測係数にも
とづいて得られた抽出スペクトルとの差(dB)を表わ
している。
し良がって、第5図図示の値は、小さい場、好ましい値
であり、本発−の改良線形予測係数α′(→/に/ (
→讐用い良方がよ炒好ましいものとなっていることが判
る。
また発明者ら線、第1ホルマント周波数としFl−50
0(Hz)  をもつ入力音声信号について、第1図図
示の構成による線形予測係数a(→/K(→と第2図図
示構成による改良線形予測係数G′(→/に/(→ と
を抽出し、これから上述のホルマント周波数を算出せし
めて次の結果を得え。即ち、ノイズ(dB)−60,0
00/)場合に、(1)前者a(B)/K(→を用いた
場合には、算出され九ホルiント周波数はFl−467
(Hz)  となり、(■)後者s′(→/に/ (%
)を用いた場合には、算出されたホルマント周波数は、
F1■475 Hz 、となつ九。これは改良線形予測
係数を用いた場合に、真の値(500H2)に対する誤
差が25Hzであり、第1図図示の構成を用い九場合の
誤差33H2に比較して、より好ましいものとなってい
ることを明らかにしている0 (助 発明の詳細 な説明した如く、本発明によれば、従来の構成によって
得られ丸線形予測係数にくらべて、より好ましい係数を
得ることが可能となる。そして、験改良線形予測係数α
′(→/ K/に)はピッチ周波数の変動による影響や
ノイズによる影響を受けることが少なく、当咳改良線形
予測係数を用いることによってホルマント周波数をよ抄
高い精度で抽出することが可能となる0
【図面の簡単な説明】
第1園は本発明の前提となる従来の構成の一例、第2!
11は本発明の一夷總例構成、第3図は本発明にいうパ
9−・スペクトル包絡情報の一態様を説明する説明図、
第4Ii!および第5図は夫々本発明によって得られ九
改嵐纏形予橢係数を用いることによる効果を説明する説
明図を示す。 図中、lはフーリエ変換部、2はフーリエ逆変換部、3
は線形予測係数算出部、4はピッチ周波数抽出部、5紘
パワー・スペクトル包絡情報抽出部、S←)は入力音声
信号、PCeI4はパワー・スペクトルJelleはパ
ワー・スペクトル包絡情報、R(→は自己相関係数、−
←)/Kに)′は線形予測係数、g/(→/に′(→は
改良線形予測係数を表わしている。

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号をフーリエ変換するフーリエ変換部をそな
    え、上記入力音声のパワー・スペクトルを抽出し、該パ
    ワー・スペクトルをフーリエ逆変換部を介して自己相関
    係数を算出して線形予測係数を抽出する音声分析処理方
    式において、上記抽出され九Iくワー・スペクトルのビ
    ークにもとづいて当鋏ハワー・スペクトルのパワー・ス
    ペクトル包絡情報を抽出するよう構成すると共Kllパ
    ワー・スペクトル包絡情報を上記フーリエ逆変換−に供
    給し、これによって得られた自己相関係数にもとづいて
    改東線形予橢係数を抽出するよう構成したことを特徴と
    する音声分析処理方式。
JP57050431A 1982-03-29 1982-03-29 音声分析処理方式 Granted JPS58168094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57050431A JPS58168094A (ja) 1982-03-29 1982-03-29 音声分析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57050431A JPS58168094A (ja) 1982-03-29 1982-03-29 音声分析処理方式

Publications (2)

Publication Number Publication Date
JPS58168094A true JPS58168094A (ja) 1983-10-04
JPS6238719B2 JPS6238719B2 (ja) 1987-08-19

Family

ID=12858674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57050431A Granted JPS58168094A (ja) 1982-03-29 1982-03-29 音声分析処理方式

Country Status (1)

Country Link
JP (1) JPS58168094A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015166694A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
WO2015166693A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015166694A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
WO2015166693A1 (ja) * 2014-05-01 2015-11-05 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
CN106537500A (zh) * 2014-05-01 2017-03-22 日本电信电话株式会社 周期性综合包络序列生成装置、周期性综合包络序列生成方法、生成程序、记录介质
JPWO2015166694A1 (ja) * 2014-05-01 2017-04-20 日本電信電話株式会社 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
JPWO2015166693A1 (ja) * 2014-05-01 2017-04-20 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
CN106663437A (zh) * 2014-05-01 2017-05-10 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、记录介质
JP2018005247A (ja) * 2014-05-01 2018-01-11 日本電信電話株式会社 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体
JP2018013795A (ja) * 2014-05-01 2018-01-25 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
JP2019003219A (ja) * 2014-05-01 2019-01-10 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
CN106537500B (zh) * 2014-05-01 2019-09-13 日本电信电话株式会社 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质
CN110491401A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN110491402A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
JP2019215587A (ja) * 2014-05-01 2019-12-19 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
CN110491401B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
CN110491402B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质

Also Published As

Publication number Publication date
JPS6238719B2 (ja) 1987-08-19

Similar Documents

Publication Publication Date Title
Shrawankar et al. Techniques for feature extraction in speech recognition system: A comparative study
US8706496B2 (en) Audio signal transforming by utilizing a computational cost function
Yegnanarayana et al. Extraction of vocal-tract system characteristics from speech signals
US7660718B2 (en) Pitch detection of speech signals
US8229738B2 (en) Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method
CN109817191B (zh) 颤音建模方法、装置、计算机设备及存储介质
CN1151490C (zh) 用于语音识别的高精度高分辨率基频提取方法
US20100217584A1 (en) Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program
KR20050049103A (ko) 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치
Scarr Zero crossings as a means of obtaining spectral information in speech analysis
CN108922514B (zh) 一种基于低频对数谱的鲁棒特征提取方法
Wakao et al. Variability of Lombard effects under different noise conditions
CN120148484B (zh) 一种基于微型计算机的语音识别方法及装置
JPS58168094A (ja) 音声分析処理方式
JP2940835B2 (ja) ピッチ周波数差分特徴量抽出法
Hasan et al. An approach to voice conversion using feature statistical mapping
US10354671B1 (en) System and method for the analysis and synthesis of periodic and non-periodic components of speech signals
JP3841705B2 (ja) 占有度抽出装置および基本周波数抽出装置、それらの方法、それらのプログラム並びにそれらのプログラムを記録した記録媒体
JP2654643B2 (ja) 音声分析方法
JPH0193796A (ja) 声質変換方法
CN119049494A (zh) 一种基于谐波模型基频同步改进维纳滤波的语音增强方法
Kolokolov Measuring the Fundamental Tone of Voice Signal
Belcher et al. Helium speech enhancement by frequency-domain processing
JPS58145994A (ja) 残差波形の抽出方法
JPS62235996A (ja) 合成音質変化方法