JPH01179100A - 適応ピッチ予測方式 - Google Patents

適応ピッチ予測方式

Info

Publication number
JPH01179100A
JPH01179100A JP63000957A JP95788A JPH01179100A JP H01179100 A JPH01179100 A JP H01179100A JP 63000957 A JP63000957 A JP 63000957A JP 95788 A JP95788 A JP 95788A JP H01179100 A JPH01179100 A JP H01179100A
Authority
JP
Japan
Prior art keywords
pitch
prediction
component
variation
pitch prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63000957A
Other languages
English (en)
Other versions
JP2968530B2 (ja
Inventor
Shigeru Ono
茂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63000957A priority Critical patent/JP2968530B2/ja
Publication of JPH01179100A publication Critical patent/JPH01179100A/ja
Application granted granted Critical
Publication of JP2968530B2 publication Critical patent/JP2968530B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は適応ピッチ予測方式に関し、特に音声符号化方
式における音声の適応ピッチ予測方式に関する。
〔従来の技術〕
音声波形を低ビツトレイトで表す符号化方式として、ア
タルとシュレーダーによりて提案され適応予測符号化(
文献1ニアタル アンド シュレーダー、「アダプティ
ブ プレデイクチイブ コーディング オプ スピーチ
 シグナルズ」ベルシスト チク ジェイ、49巻、1
973から1986ページ、1970年;Atal B
、S、 and 8chroederM、Ro、”Ad
aptive predictive coding 
of speechssignals”Be1l 8y
st、Tech、J、、vo1+49.pp、1973
−1986(1970)、)がある、これは音声の短期
的相関に基づく線形予測器と長期的相関に基づくピッチ
予測器とからなっておシュ以後の予測符号化方式の基本
になりている。これらの符号化においては、音声を定常
と見なせる10m5ecから30m sec間隔のフレ
ームに分割し、各フレーム毎に各予測器のパラメータを
決定している。即ち、各予測器のパラメータの更新速度
はフレーム単位であシ、フレーム内における各パラメー
タの変動はすべて予測残差に反映される形となっている
〔発明が解決しようとする問題点〕
しかし、一般に音声波形は時間的に大きく変動している
ため、各パラメータもフレーム内で可変でなければなら
ない−特に声帯振動の周期性をモデル化するピッチ予測
器のパラメータを固定にすると、予測残差に声帯振動の
変動がすべて含まれることになシ、予測残差の符号化に
高い情報量を必要とする。予測残差の符号化効率を上げ
るためにはピッチ変動を組み込んだピッチ予測方式が必
要である。
本発明の目的は、ピッチ予測器において、予測係数の時
間変動を平均的な成分とその平均値からのずれ成分とで
表すことによシ、入力信号からピッチ情報を効率的に削
減することのできる適応ピッチ予測方式を提供すること
にある。
〔問題を解決するための手段〕
本発明の適応ピッチ予測方式は、ある特定区間の音声波
形のピッチ構造をその特定区間の平均的な特性を表す基
本周期成分と前記基本周期成分以外の短期的な特性を表
す変動成分とで表すことを特徴とする。
〔作用〕 第3図は本発明の詳細な説明するための図で、第3図(
a)は本発明におけるピッチ予測器のモデルを示す。こ
のモデルのインパルス応答は、次のように表せる。
d(n)=Σ(1−a+vk)δ(n−kT+σk) 
 −−−(1)ここで、Tとαはピッチの基本周期成分
を表すもので、Tは平均的なピッチ周期成分、αは平均
ピッチ予測係数である。また、σとηはピッチの変動成
分を表すもので、ピッチ周期とピッチ予測係数の基本成
分からのずれを表している。第3図(b)は第(1)式
を模式した例を示す。η、とσ、は平均ピッチ周期毎に
ピッチ予測係数α並びにピッチ周期Tが変化する量であ
る。ちなみに、従来のピッチ予測モデルのインパルス応
答は da(n)=Σαにδ(n−kT)   ・・・・・・
・・・・・・・・・・・・・・・(2)となる。
〔実施例〕
次に本発明の実施例について第2図を参照して説明する
第1図は本発明の適応ピッチ予測方式の一実施例を示す
ブロック図である。第1図において、入力端子100か
ら一定間隔のフレームに分割されたNサンプルの離散的
音声波形(例えば、8kHzサンプリングで、N = 
160 (20m5ec))を入力し、線形予測分析器
110と線形予測誤差計算器120に供給する。線形予
測分析器)11110は入力端子100から入力した音
声サンプルからPARCOR係数を求めて量子化した後
、線形予測誤差計算器120とマルチプレクサ180と
に出力する。線形予測誤差計算器120は線形予測分析
器110から入力されるPARCOR係数を逆量子化し
て線形予測係数に変換し、線形予測誤差を計算する。
計算された線形予測残差はピッチ変動成分決定器140
と平均ピッチ予測分析器130とに供給される。平均ピ
ッチ予測分析器130は当該フレーム内の音声の基本周
期成分と平均的表ピッチ予測係数を求めるもので、線形
予測残差の自己相関関数から定められる。平均的表ピッ
チ周期成分子と平均ピッチ予測係数αを求める手段は、
例えば、文献2:古井著、ディジタル音声処理、東海大
学出版会(昭和60)の第4章に纒められている。
求められた各係数はピッチ変動成分決定器140ら入力
された各パラメータを逆量子化し、それから、ピッチ周
期の変動のためにピッチ周期変動成分コードブック15
0に予め蓄えられた乱数(例えば正規乱数)と、ピッチ
予測係数の変動のためにピッチ予測係数変動成分コード
ブック160に予め蓄えられた変動バタン(例えば二次
曲線の集合)と、平均ピッチ予測分析器130から入力
する平均ピッチ予測器のパラメータとを入力して、入力
音声に最も適したピッチ予測器の変動成分を前記コード
ブック150と160とから選ぶものである。この選択
に際して、ピッチ予測残差の電力を評価関数としてとる
ことができる。即ち、線形予測誤差計算器120から入
力される線形予測誤差e (n)から、前記コードブッ
ク150と160から供給される各変動成分に対するピ
ッチ予測残差 d (n)= e (n)−Σ(ak+η1k)e(n
−kT−’ik)  ・・−(3)を計算し、その電力
を最も小さくするコードベクトルを与えるインデックス
を出力する。(3)式で、Wikはピッチ予測係数変動
成分コードブック160にある第1番目のコードベクト
ルの成分で、ピッチ予測係数の変動分を表すものである
。σikはピッチ周期変動成分コードブック150にあ
る第j番目のコードベクトルの成分で、ピッチ周期の変
動分を表すものである。出力としてマルチプレクサ18
0に送られるインデックスは 4 i 、 j )=min (Σd”(n))   
  −・−・−・・−・−(4)なるものである。この
最適インデックス探索は予め定められたコードブックに
あるすべてのieJに対して行われる。ピッチ予測残差
量子化器170は平均ピッチ予測分析器130とピッチ
変動成分決定器140と線形予測分析器110とから入
力されるPARCOR係数とをもとにピッチ変動成分決
定器140から入力される上記(2)式のピッチ予測残
差d (n)を量子化するものである。ピッチ予測残差
d (n)を量子化する構成は種々知られておシ、例え
ばスカラー量子化を用いるものは文献3のジャイヤント
とノルの著書「ディジタル コーディング オプ ウェ
イブフォームス」プレンティス1984、)の第7章に
詳しく記載されている。
第2図にベクトル量子化に基づいた具体例のブロック図
を示す。第2図において、210はピッチ予測残差d(
n)t−人力する端子、211は線形予測分析器110
の出力であるPARCOR係数を入力する端子% 21
2は平均ピッチ予測分析器130の出力である平均ピッ
チ周期とピッチ予測係数αとを入力する平均ピッチ予測
パラメータ入力端子、213はピッチ変動成分決定器1
40で選ばれた最適インデックスが指すピッチ周期変動
成分コードブック150のピッチ周期の変動分σikと
ピッチ予測係数変動成分コードブック160の予測係数
の変動分ηikとを入力する変動ピッチ予測パラメータ
入力端子である。200は予め定められたピッチ予測残
差を蓄えであるコードブックである。
221と220は線形予測合成器でPARCOR係数入
力端子211から入力されるPARCOR係数から形成
される。230と231は上記(1)式のインパルス応
答をもつピッチ予測フィルタである。
240は入力音声のピッチ予測残差d (n)から作ら
れる合成音声とピッチ予測残差コードブック200にあ
るコードベクトルから合成される合成音声との平均二乗
距離を計算する平均二乗誤差計算器である。コードベク
トル選択器250はピッチ予測残差コードブック200
の各コードベクトルに対して作られ各合成音声の内、ピ
ッチ予測残差d (n)に対して作られる合成音声との
平均二乗距離を最小にするコードベクトルを選び、その
インデック  ・スをインデックス出力端子260から
マルチプレクサ180に出力する。第1図に示すマルチ
プレクサ180は線形予測分析器11O1平均ピッチ予
測分析器130.ピッチ変動成分決定器140゜ピッチ
予測残差量子化器170から入力される各パラメータの
符号を多重して出力端子190から伝送路へ出力する。
〔発明の効果〕
本発明はフレーム内にあるピッチ周期やピッチ予測係数
の変動を許容するピッチ予測方式を提供するものでbる
。一般に音声波形は時間的に大きく変動しているため、
パラメータの時間変動を許容する本発明はパラメータを
フレーム内で固定する従来方式と比較して、入力信号か
らよシ効率的にピッチ情報を削除できる効果がある。さ
らに1この効果によシ、本発明においてはピッチ予測残
差の変動成分が小さくなっておシ、ピッチ予測残差の符
号化効率を高くできるという効果がある。
【図面の簡単な説明】
第1図は本発明の適応ピッチ予測方式の一実施例を示す
ブロック図、第2図はベクトル量子化に基づいた具体例
のブロック図、第3図は本発明の詳細な説明するための
図である。 100・・・入力端子、110・・・線形予測分析器、
120−・・線形予測誤差計算器、130・・・平均ピ
ッチ予測分析器、140・・・ピッチ変動成分決定器、
150・・・ピッチ周期変動成分コードブック、160
・・・ピッチ予測係数変動成分コードブック、170・
・・ピッチ予測残差量子化器、180・・・マルチプレ
クサ、190・・・出力端子、200・・・ピッチ予測
残差コードブック、210・・・ピッチ予測残差入力端
子、211・・・PARCOR係数入力端子、212・
・・平均ピッチ予測パラメータ入力端子、213・・・
変動ピッチ予測パラメータ入力端子、220,221・
・・線形予測合成器、230,231・・・適応ピッチ
予測フィルタ、240・・・平均二乗誤差計算器、25
0・・・コードベクトル選択器、260・・・インデッ
クス出力端子。 代理人 弁理士  内 原   晋 第3図

Claims (1)

    【特許請求の範囲】
  1. ある特定区間の音声波形のピッチ構造をその特定区間の
    平均的な特性を表す基本周期成分と前記基本周期成分以
    外の短期的な特性を表す変動成分とで表すことを特徴と
    する適応ピッチ予測方式。
JP63000957A 1988-01-05 1988-01-05 適応ピッチ予測方法 Expired - Lifetime JP2968530B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63000957A JP2968530B2 (ja) 1988-01-05 1988-01-05 適応ピッチ予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63000957A JP2968530B2 (ja) 1988-01-05 1988-01-05 適応ピッチ予測方法

Publications (2)

Publication Number Publication Date
JPH01179100A true JPH01179100A (ja) 1989-07-17
JP2968530B2 JP2968530B2 (ja) 1999-10-25

Family

ID=11488143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63000957A Expired - Lifetime JP2968530B2 (ja) 1988-01-05 1988-01-05 適応ピッチ予測方法

Country Status (1)

Country Link
JP (1) JP2968530B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750586A (ja) * 1991-09-10 1995-02-21 At & T Corp 低遅延celp符号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750586A (ja) * 1991-09-10 1995-02-21 At & T Corp 低遅延celp符号化方法

Also Published As

Publication number Publication date
JP2968530B2 (ja) 1999-10-25

Similar Documents

Publication Publication Date Title
US6073092A (en) Method for speech coding based on a code excited linear prediction (CELP) model
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3134817B2 (ja) 音声符号化復号装置
US5140638A (en) Speech coding system and a method of encoding speech
US6249758B1 (en) Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US7792679B2 (en) Optimized multiple coding method
EP0833305A2 (en) Low bit-rate pitch lag coder
US7013270B2 (en) Determining linear predictive coding filter parameters for encoding a voice signal
US20040023677A1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US5727122A (en) Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method
US6023671A (en) Voiced/unvoiced decision using a plurality of sigmoid-transformed parameters for speech coding
US6768978B2 (en) Speech coding/decoding method and apparatus
JPH09258795A (ja) ディジタルフィルタおよび音響符号化/復号化装置
EP0557940A2 (en) Speech coding system
JPH1097294A (ja) 音声符号化装置
Vaseghi Finite state CELP for variable rate speech coding
US5884252A (en) Method of and apparatus for coding speech signal
JPH01179100A (ja) 適応ピッチ予測方式
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
EP0984432B1 (en) Pulse position control for an algebraic speech coder
JP3192051B2 (ja) 音声符号化装置
JP2700974B2 (ja) 音声符号化法
JPH09179593A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 9