JPH04101200A - 音声分析合成装置 - Google Patents

音声分析合成装置

Info

Publication number
JPH04101200A
JPH04101200A JP2219168A JP21916890A JPH04101200A JP H04101200 A JPH04101200 A JP H04101200A JP 2219168 A JP2219168 A JP 2219168A JP 21916890 A JP21916890 A JP 21916890A JP H04101200 A JPH04101200 A JP H04101200A
Authority
JP
Japan
Prior art keywords
analysis
frames
representative
frame
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2219168A
Other languages
English (en)
Inventor
Takayuki Ishikawa
孝行 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2219168A priority Critical patent/JPH04101200A/ja
Publication of JPH04101200A publication Critical patent/JPH04101200A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声分析合成装置に関し、特に分析側から合成
側に音源情報とともに供給すべき入力音声の特徴パラメ
ータであるLPC係数を可変長フレーム化して伝送する
音声分析合成装置に関する。
〔従来の技術〕
従来、この種の音声合成分析装置は、入力音声を分析す
る分析側において、音声信号を例えば10m5Ecごと
の基本分析フレームごとにLPC分析を行ない、その結
果得られたLPCPGE1音源情報であるピッチ周期、
電力情報等を合成側に伝送し入力音声の合成を行なって
いる。この場合、伝送すべき音声の情報量を極力圧縮す
るため、基本分析フレームごとに得られるLPC係数を
各基本分析フレームごとに伝送せず、例えば1個の基本
分析フレームをまとめて1個の伝送フレームとし、各伝
送フレームごとにその中からm個の代表フレームを選出
し、この1個の基本分析フレームからなる伝送フレーム
の範囲ではすべて各代表フレームのLPC係数で入力音
声のスペクトル包絡を表現する。すなわち、1個の基本
分析フレームをm個のフレーム(ffl>m)で表現す
ることで1個の基本分析フレーム全てを伝送せずに、前
述のm個の代表フレームのLPCPGE1その繰り返し
回数Li  (i=1〜mj、n=ΣLi)とを伝送す
る可変長フレーム表現を利用して伝送すべき音声情報量
を圧縮していた。
これは、音声の巨視的構造が時変性を有し、その変化率
も時間的に不均一であり、したがって音声を分析するに
あたり等間隔の固定フレームで分析するよりも、音声の
変化に応じて可変長フレームとして処理する方が効率良
く分析できることにもとづいている。
〔発明が解決しようとする課題〕
上述した従来の可変長フレームによる音声分析合成装置
は、伝送情報量を一定(例えば1200bps)にする
ため、前述の代表フレーム数mは固定的に定めており、
従って変化が速く時間歪の大きい音声はその変化に追従
できず、m個の代表フレームだけでは1個の基本分析フ
レームを有スル伝送フレームが精度よく表現出来ず、合
成音声の品質の劣化を生じ、不安定かつ不明瞭な合成音
声を生成するという欠点がある。
また、1個の基本分析フレーム内に有音、無音区間が混
在する場合には、無音区間にも代表フレームを割り当て
てしまい、有音区間へのフレームの割り当てが減るため
、合成音声品質が劣化するという欠点があった。
本発明の目的は上述した欠点を除去し、合成音声の品質
劣化を著しく抑圧し、高品質の合成音声を得る音声分析
合成装置を提供することにある。
〔課題を解決するための手段〕
本発明の音声分析合成装置は、入力音声信号を伝送フレ
ーム単位かつ所定の1個の分析フレームごとに分析して
所定の次数のLPC係数と音源情報とを抽出する特徴パ
ラメータ抽出手段と、4個の分析フレームを音源情報に
より有音と無音区間に分離して、n個の有音区間を抽出
(p≧n)する手段と、前記n個の分析フレームから互
いに異る個数のm個の分析フレームの組合せを前記n個
の分析フレームを代表して表現する代表分析フレーム候
補として選択する代表フレーム候補選択手段と、前記代
表フレーム候補選択手段によって選択される代表分析フ
レーム候補におけるLPCPGE1して内挿および外挿
による補間を実施し、n個の分析フレームを有するm個
の補間LPC係数列を得たうえ、前記m個の補間LPC
係数列と前記特徴パラメータ抽出手段によって抽出した
n個の分析フレームのLPC係数列との差を歪量として
計測し前記歪量が最小となるm個の最小歪量を得る最小
歪量計測手段と、前記最小歪量計測手段によって得られ
たm個の最小歪量がら合成音声とデータ伝送量とを勘案
して設定する最適な最小歪量を有する補間LPC係数列
を形成する代表分析フレーム候補を代表分析フレームと
して判定し、この代表分析フレームの個数ならびにナン
バーをもって前記n個の分析フレームを可変長フレーム
として表現する代表フレーム判定手段と、前記代表分析
フレームの個数ならびにナンバー及び無音フレームナン
バーを前記音源情報とともに分析側から合成側に音声分
析情報として送出する分析情報送出手段と、前記音声分
析情報にもとづいて入力音声信号の合成を行なう音声合
成手段とを備えて構成される。
C実施例〕 次に、本発明について図面を参照して説明する。
第1図は本発明の一実旅例の構成を示すブロック図であ
る。
第1図に示す実施例は、合成側(送信側)■。
合成側(受信側)2および伝送路3から構成される。
分析側1は、入力音声信号を受けてこれを所定の帯域制
限した後量子化した量子化音声信号にLPC分析を施す
LPC分析器1012代表フレームを選択する代表フレ
ーム候補選択器(1)102゜代表フレーム候補選択器
(2) 103 、代表フレーム候補選択器(3) 1
.04 、歪量を計測する最小歪量計測器(1)105
.最小歪量計測器(2) 106 、最小歪量計測器(
3) 107 、ピッチ抽出器108.最適歪量判定器
109.LPCパラメータ編集器110゜多重化器11
1を備え、また合成側2は、多重化分離器201.LP
Cパラメータ復号器202゜ピッチ発生器3.切替器4
.LPCパラメータ補間器205.雑音発生器206.
LPC合成フィルタ207.可変利得増幅器208を備
えて構成される。
次に、第1図の実施例の動作について説明する。
入力音声信号は、LPC分析器101でBPF(Ban
d Pa5s Filter)を通して不要な信号を除
去したあと、基本分析フレームごとにA−Dコンバータ
で所定のサンプリング周波数たとえば8KHzで標本化
され、所定のビット数たとえば14ビツトで量子化され
た量子化音声信号とされる。このあと、量子化音声信号
は公知の分析手法によってにパラメータなどのLPC係
数を所定の次数で抽出される。このLPC係数の抽出は
1伝送フレームあたりρ個ずつ基本分析フレームは、次
に3つの代表フレーム候補選択器(1) 102〜代表
フレーム候補選択器(3) 104によってそれぞれ4
個、5個および6個ずつの組合せでLPC係数を含み次
次に選択され、最小歪量計測器(1) 105〜最小歪
量計測器(3) 107に供給される。
本実施例では、代表フレーム候補選択器(1) 102
〜代表フレーム候補選択器(3) 104はそれぞれ、
4.5および6個の基本分析フレームとそのLPC係数
を選択しているが、互いに異る個数mをそれぞれ何種類
、何個とするかは、装置の運用目的、過去の音声資料等
にもとすき予め決定される。
こうして、代表フレーム候補選択器(1) 102は、
l伝送フレーム(あたり20個の基本分析フレーム)の
中の有音区間から4個の代表フレームをLPC係数を含
み選出する。また代表フレーム候補選択器(2) 10
3は1伝送フレームの中の有音区間から5個の代表フレ
ームを選出し、さらに代表フレーム候補選択器(3) 
104は1伝送フレームの中の有音区間から6個の代表
フレームを選出する。
最小歪量計測器(1) 105は、代表フレーム候補選
択器(1) l O5が次次に選択する4個の代表フレ
ーム候補による歪量を表現するものである。同じく、最
小歪量計測器(2) 106は代表フレーム候補選択器
(2) l O3が選んだ5個の代表フレーム候補によ
る歪量を、また最小歪量計測器(3> 107は、代表
フレーム候補選択器(3) 104が選んだ6個の代表
フレーム候補による歪量を表現する。
この歪量の計測は次のようにして行なわれる。
たとえば、最小歪量計測器(1) 105は、代表フレ
ーム候補選択器(1) 102から提供される4個ずつ
の代表フレーム候補のLPC係数を利用し、代表フレー
ム以外の有音区間に相当する部分のLPC係数を内・外
挿の補間処理によって求め、補間LPC係数列を得る。
一方、最小歪量計測器(1)105は、LPC分析器1
0から伝送フレームあたり20個の前基本分析フレーム
のLPC係数列を入力し、これと補間LPC係数列との
差を歪量として計算する。歪量計測器(1) l 05
は、すべての4個の代表フレーム候補について得られる
補間LPC係数列について歪量を計測し、この歪量の最
小のものを最適歪量判定器109に供給する。
同様にして、最小歪量計測器(2) 106および最小
歪量計測器107は、それぞれ5個および6個の代表フ
レーム候補にもとづいて得られる補間LPC係数列と有
音区間基本分析フレームによるLPC係数列との差から
歪量の最小なものを計測し、最適歪量判定器109に供
給する。
最適歪量判定器109は、3個の最小歪量計測器から提
供される最小歪量を比較し、最小歪量の大小と伝送デー
タ量の大小との条件から最適の歪量を提供する代表フレ
ーム候補の数とフレームナンバとを決定し、これを代表
フレームとして、この代表フレーム数と代表フレームナ
ンバー及び無音区間ナンバーを多重化器111に供給す
る。
こうして決定された代表フレームのナンバーはLPCパ
ラメータ編集器110に供給され、LPCパラメータ編
集器110は、代表フレームナンバーのLPC係数をL
PC分析器101から読み出してLPC係数として多重
化器111に供給する。
さて、電力抽出器112およびピッチ抽出器108はそ
れぞれ、公知の手法により量子化音声信号から基本分析
フレームごとの短時間平均音声電力とピッチ情報を柚圧
し、これら音声電力とピッチ情報も多重化器111に供
給される。
多重化器111は、こうして提供される代表フレーム数
とそのフレームナンバー、無音区間ナンバーならびにL
PC係数、および音声電力とピッチ情報に関するデータ
を量子化し、適宜組み合せて多重化データとして伝送路
3を介して合成側2に伝送する。
こうして、伝送フレームあたり20個の基本分析フレー
ムを4個か5個もしくは6個の代表フレームで表現して
合成側2に送出する可変長フレーム合成が行なわれる。
さて、合成側2は、伝送路3を介して受けた多重化情報
を多重化分離器201で多重化分離し、代表フレーム数
とLPC係数はLPCパラメータ復号化器2021代表
フレームナンバーと無音区間ナンバーはLPCパラメー
タ補間器205.音声電力は可変利得増幅器208.ピ
ッチ情報はピッチ発生器203にそれぞれ供給する。
LPCパラメータ復号器202は、代表フレーム数によ
ってLPC係数の復号化におけるビット数を決定してL
PCパラメータを正しく復号化してLPCパラメータ補
間器205に供給する。
LPCパラメータ補間器205は、代表フレームナンバ
ーとその復号化LPCパラメータにもとづいて代表フレ
ームナンバー以外のLPCパラメータを線形補間によっ
て得又、無音区間に関しては、無音用LPC係数を生成
し、これをディジタルフィルタ構成のLPC合成フィル
タ207のフィルタ係数として供給する。
ピッチ情報を提供されたピッチ発生器203は、ピッチ
情報に対応した繰返しのパルス列を発生し、これを切替
器205を介して可変利得増幅器208に供給する。
可変利得増幅器208は、音声電力に対応した可変利得
でピッチ発生器3の出力を増幅し、音源情報としてLP
C合成フィルタ207の入力としてLPC合成フィルタ
207を駆動し、ティジタル音声を得、これを内蔵D−
Aのコンバータでアナログ化したのちBPFて所定の帯
域制限を行なったのち出力音声として送出する。
雑音発生器206は、ピッチ発生器203の出力を供給
されつつ、これが零のときは無音、無音状態と判断して
ランダム雑音出力をピッチ情報に代えて出力するように
切替器204を動作させる。
こうして、伝送量を大幅に抑圧し、しかも再生音声の劣
化を著しく抑圧しうる音声分析合成が実施できる。
〔発明の効果〕
以上説明したように本発明は、伝送フレームの含む全基
本分析フレームを複数個の代表分析フレームで表現する
可変長フレームで伝送することにより、伝送量を著しく
抑圧し、かつ変化が速く時間歪量の大きい音声において
も、又有音、無音が混在する伝送フレーム内においても
安定した明瞭度の良い高品質音声が再生できるという効
果がある。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図であ
る。 1・・・・・・分析側、2・・・・・・合成側、3・・
・・・・伝送路、101・・・・・・LPC分析器、1
02・・・・・・代表フレーム候補選択器(1)、10
3・・・・・・代表フレーム候補選択器(2)、104
・・・・・・代表フレーム候補選択器(3)、105・
・・・・・最小歪量計測器(1)、106・・・・・・
最小歪量計測器(2)、107・・・・・・最小歪量計
測器(3)、108・・・・・・ピッチ抽圧器、109
・・・・・・最適歪量判定器、110・・・・・・LP
Cパラメータ編集器、111・・・・・・多重化器、2
01・・・・・・多重化分離器、202・・・・・LP
Cパラメータ復号器、203・・・・・・ピッチJil
器、204・・・・・・切替器、205・・・・・・L
PCパラメータ補間器、206・・・・・・雑音発生器
、207・・・・・・LPC合成フィルタ、208・・
・・・・可変利得増幅器。 代理人 弁理士  内 原   晋

Claims (1)

  1. 【特許請求の範囲】 入力音声信号を伝送フレーム単位かつ所定のl個の分析
    フレームごとに分析して所定の次数のLPC(Line
    ar Prediction Coding)線形予測
    分析)係数と音源情報とを抽出する特徴パラメータ抽出
    手段と、 前記l個の分析フレームを音源情報により、有音区間と
    無音区間に分離する手段と、 前記l個の分析フレームの中のn個の有音区間から互い
    に異る個数のm個の分析フレームの組合せを前記n個の
    分析フレームを代表して表現する代表分析フレーム候補
    として選択する代表フレーム候補選択手段と、 前記代表フレーム候補選択手段によって選択される代表
    分析フレーム候補におけるLPC係数に対して内挿およ
    び外挿による補間を実施し、n個の分析フレームを有す
    るm個の補間LPC係数列を得たうえ、前記m個の補間
    LPC係数列と前記特徴パラメータ抽出手段によって抽
    出したn個の分析フレームのLPC係数列との差を歪量
    として計測し前記歪量が最小となるm個の最小歪量を得
    る最小歪量計測手段と、 前記最小歪量計測手段によって得られたm個の最小歪量
    から合成音声とデータ伝送量とを勘案して設定する最適
    な最小歪量を有する補間LPC係数列を形成する代表分
    析フレーム候補を代表分析フレームとして判定し、この
    代表分析フレームの個数ならびにナンバーをもって前記
    n個の分析フレームを可変長フレームとして表現する代
    表フレーム判定手段と、 前記代表分析フレームの個数ならびにナンバーを前記音
    源情報とともに分析側から合成側に音声分析情報として
    送出する分析情報送出手段と、前記音声分析情報にもと
    づいて入力音声信号の合成を行なう音声合成手段と、 を備えて成ることを特徴とする音声分析合成装置。
JP2219168A 1990-08-21 1990-08-21 音声分析合成装置 Pending JPH04101200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2219168A JPH04101200A (ja) 1990-08-21 1990-08-21 音声分析合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2219168A JPH04101200A (ja) 1990-08-21 1990-08-21 音声分析合成装置

Publications (1)

Publication Number Publication Date
JPH04101200A true JPH04101200A (ja) 1992-04-02

Family

ID=16731269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2219168A Pending JPH04101200A (ja) 1990-08-21 1990-08-21 音声分析合成装置

Country Status (1)

Country Link
JP (1) JPH04101200A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58203499A (ja) * 1982-05-24 1983-11-26 日本電気株式会社 可変長フレ−ム型線形予測ボコ−ダ
JPS6136800A (ja) * 1984-07-30 1986-02-21 日本電気株式会社 可変長フレ−ム音声分析合成方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58203499A (ja) * 1982-05-24 1983-11-26 日本電気株式会社 可変長フレ−ム型線形予測ボコ−ダ
JPS6136800A (ja) * 1984-07-30 1986-02-21 日本電気株式会社 可変長フレ−ム音声分析合成方式

Similar Documents

Publication Publication Date Title
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
JP3144009B2 (ja) 音声符号復号化装置
JPH0439679B2 (ja)
JP3537008B2 (ja) 音声符号化通信方式とその送受信装置
JPH04101200A (ja) 音声分析合成装置
JPH03245198A (ja) 音声分析合成装置
JP3201268B2 (ja) 音声通信装置
JP2797348B2 (ja) 音声符号化・復号化装置
JP3282595B2 (ja) 音声符号化・復号化装置及び通信装置
JP3468184B2 (ja) 音声通信装置及びその通信方法
JPH0588697A (ja) 欠落音声補間方式
JP2973966B2 (ja) 音声通信装置
JP2939999B2 (ja) 可変長フレーム型ボコーダ
AU617993B2 (en) Multi-pulse type coding system
JP3166673B2 (ja) ボコーダ符号化復号装置
EP0766231A2 (en) Spike code-excited linear prediction
JPH0235994B2 (ja)
JPH11102199A (ja) 音声通信装置
JP2002076904A (ja) 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置
JPS62285541A (ja) ボコ−ダ方式の音声デイジタル伝送における誤り制御方法
JP2581050B2 (ja) 音声分析合成装置
JP2853126B2 (ja) マルチパルス符号化装置
JP2004077688A (ja) 音声通信装置
JPH04162100A (ja) マルチパルス型音声符号化復号化装置
JP2535809B2 (ja) 線形予測型音声分析合成装置