JPH0378639B2 - - Google Patents
Info
- Publication number
- JPH0378639B2 JPH0378639B2 JP57040735A JP4073582A JPH0378639B2 JP H0378639 B2 JPH0378639 B2 JP H0378639B2 JP 57040735 A JP57040735 A JP 57040735A JP 4073582 A JP4073582 A JP 4073582A JP H0378639 B2 JPH0378639 B2 JP H0378639B2
- Authority
- JP
- Japan
- Prior art keywords
- encoded data
- pcm
- adpcm
- speech
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の詳細な説明】
(従来技術)
この発明は語単位の原音声を、適応差分パルス
符号変調方式(Adaptive Differential Pulse
Code Modulation、以下ADPCMと略す)を用
いて符号化する音声符号化方法に関する。
符号変調方式(Adaptive Differential Pulse
Code Modulation、以下ADPCMと略す)を用
いて符号化する音声符号化方法に関する。
(背景技術)
従来の音声編集システムのブロツク図を第1図
に示す。第1図において、1は音声の入力端子、
2は音声を分析しADPCM符号化を行なう分析
部、3は分析部2で符号化された符号化データを
一担格納するサブメモリ部、4はサブメモリ部か
ら必要とする符号化データを格納するメインメモ
リ部、5は符号化データを原音声に変換する合成
部、6は分析部2、サブメモリ部3、メインメモ
リ部4及び合成部5の制御及び分析、合成の機能
を備えた中央処理装置CPUである。
に示す。第1図において、1は音声の入力端子、
2は音声を分析しADPCM符号化を行なう分析
部、3は分析部2で符号化された符号化データを
一担格納するサブメモリ部、4はサブメモリ部か
ら必要とする符号化データを格納するメインメモ
リ部、5は符号化データを原音声に変換する合成
部、6は分析部2、サブメモリ部3、メインメモ
リ部4及び合成部5の制御及び分析、合成の機能
を備えた中央処理装置CPUである。
従来の音声編集方式は第2図に示すフローチヤ
ートのように、語単位の音声(以下音声片とい
う)を入力端子1に入力し(ステツプ8)、分析
部2により分析してADPCM符号化し(ステツプ
9)、該結果を音声の符号化データとして一旦サ
ブメモリ部3に格納しておき(ステツプ10)、必
要とする語単位(例えば“A”)の符号化データ
をサブメモリ部3から読出し(ステツプ11)、該
データをメインメモリ4に格納し(ステツプ12)、
次の音声片(例えば“B”)を含んだ入力音声を
同様に分析してADPCM符号化し、必要とする音
声片“B”の符号化データを読出し、メインメモ
リ4に格納する。以下同様にして編集に必要な音
声片の読出し及び格納を行なう。
ートのように、語単位の音声(以下音声片とい
う)を入力端子1に入力し(ステツプ8)、分析
部2により分析してADPCM符号化し(ステツプ
9)、該結果を音声の符号化データとして一旦サ
ブメモリ部3に格納しておき(ステツプ10)、必
要とする語単位(例えば“A”)の符号化データ
をサブメモリ部3から読出し(ステツプ11)、該
データをメインメモリ4に格納し(ステツプ12)、
次の音声片(例えば“B”)を含んだ入力音声を
同様に分析してADPCM符号化し、必要とする音
声片“B”の符号化データを読出し、メインメモ
リ4に格納する。以下同様にして編集に必要な音
声片の読出し及び格納を行なう。
次に編集時に希望する順序(例えば“B”,
“A”,“C”の順)で各音声片の符号化データを
メインメモリ部4から読み出し(ステツプ14)、
音声合成器5により原音声に再生し(ステツプ
15)、希望の音声出力“BAC”を得る(ステツプ
16)。
“A”,“C”の順)で各音声片の符号化データを
メインメモリ部4から読み出し(ステツプ14)、
音声合成器5により原音声に再生し(ステツプ
15)、希望の音声出力“BAC”を得る(ステツプ
16)。
しかしながら、ADPCM方式は周知のように、
入力音声の変化量(すなわち差分値)に応じてデ
ルタパラメータΔpが最小値“0”から最大値
“MAX(Δp)”の範囲で変わるため、各音声片の
デルタパラメータΔpが“0”で終らないことが
ある。例えば連続した音声から音声片を切り出す
場合、音声片(例えば“B”)の終端が第3図a
に示すように、変化量が大きい状態で終ることが
ある。この場合前述したように音声片終端のデル
タパラメータΔp(B)は第3図bに示すように“0”
以上のある値“α”となつている。しかしなが
ら、第4図aに示す次の音声片(例えば“A”)
の先端は第4図bに示すようにデルタパラメータ
Δp(A)=αが初期化され分析され符号化されてい
るため、音声片“B,A”をこのまま結合し、合
成すると、本来は先端のΔp(A)が“0”であれば
原音声に再生されるが実際は“α”となつている
ので、第5図に示すように波形が変化してしまい
(a)、またゼロレベルがシフトする(b)というような
不都合が生ずる。
入力音声の変化量(すなわち差分値)に応じてデ
ルタパラメータΔpが最小値“0”から最大値
“MAX(Δp)”の範囲で変わるため、各音声片の
デルタパラメータΔpが“0”で終らないことが
ある。例えば連続した音声から音声片を切り出す
場合、音声片(例えば“B”)の終端が第3図a
に示すように、変化量が大きい状態で終ることが
ある。この場合前述したように音声片終端のデル
タパラメータΔp(B)は第3図bに示すように“0”
以上のある値“α”となつている。しかしなが
ら、第4図aに示す次の音声片(例えば“A”)
の先端は第4図bに示すようにデルタパラメータ
Δp(A)=αが初期化され分析され符号化されてい
るため、音声片“B,A”をこのまま結合し、合
成すると、本来は先端のΔp(A)が“0”であれば
原音声に再生されるが実際は“α”となつている
ので、第5図に示すように波形が変化してしまい
(a)、またゼロレベルがシフトする(b)というような
不都合が生ずる。
(発明の目的)
この発明は、このような従来の問題点に着目し
てなされたもので、原音声を一担PCM符号化デ
ータとし、該PCM符号化データの冗長部分(連
続音声では語と語をつなぐ音声若しくはその符号
化データであり、語単位の音声では語と語の間の
無音部若しくはその符号化データである)を切断
した各音声片の終端に強制的に無音データを付加
しその後ADPCM符号化することにより上記問題
点を解決することを目的としている。
てなされたもので、原音声を一担PCM符号化デ
ータとし、該PCM符号化データの冗長部分(連
続音声では語と語をつなぐ音声若しくはその符号
化データであり、語単位の音声では語と語の間の
無音部若しくはその符号化データである)を切断
した各音声片の終端に強制的に無音データを付加
しその後ADPCM符号化することにより上記問題
点を解決することを目的としている。
(発明の構成及び作用)
この発明を第6図に示すフローチヤートを用い
て説明する。
て説明する。
この発明を実施するための装置は、第1図に示
す従来の装置と同様な構成である。まず連続音声
を入力端子1に入力し(ステツプ17)、分析部2
により分析してADPCM符号化し(ステツプ18)、
該結果を符号化データとして一旦サブメモリ部3
に格納し(ステツプ19)、該符号化データを中央
処理装置6によりPCM符号化データに再生し、
かつ該PCM符号化データから必要とする音声片
の符号化データを切り出し、該データの冗長部を
切断、除去し(ステツプ20)、残存する音声片の
符号化データの終端に無音データ(例えば分析部
内A/Dコンバータを12ビツトバイポーラ方式で
使用した場合、7FF(H))をあるサンプル数個以上
付加し(ステツプ21)、再び中央処理装置により
分析してADPCM符号化し(ステツプ22)、該
ADPCM符号化データを主メモリ部に格納する
(ステツプ23)。以下同様にして語単位で切り出し
及び格納を行なう。
す従来の装置と同様な構成である。まず連続音声
を入力端子1に入力し(ステツプ17)、分析部2
により分析してADPCM符号化し(ステツプ18)、
該結果を符号化データとして一旦サブメモリ部3
に格納し(ステツプ19)、該符号化データを中央
処理装置6によりPCM符号化データに再生し、
かつ該PCM符号化データから必要とする音声片
の符号化データを切り出し、該データの冗長部を
切断、除去し(ステツプ20)、残存する音声片の
符号化データの終端に無音データ(例えば分析部
内A/Dコンバータを12ビツトバイポーラ方式で
使用した場合、7FF(H))をあるサンプル数個以上
付加し(ステツプ21)、再び中央処理装置により
分析してADPCM符号化し(ステツプ22)、該
ADPCM符号化データを主メモリ部に格納する
(ステツプ23)。以下同様にして語単位で切り出し
及び格納を行なう。
第7図に音声片“B”の符号化データの終端に
無音データ7FF(H)を付加し(ステツプ21)
ADPCM符号化した時(ステツプ22)のデルタパ
ラメータΔpの波形29を示す。同図において、
音声片“B”28の符号化データの終端がデルタパ
ラメータΔp(B)=αであつた場合、デルタパラメ
ータΔp29の減少はADPCM方式の特徴として1
づつであるため、デルタパラメータΔpが最小値
かつ初期値である“0”になるまでにはαサンプ
ル分を要する。従つてサンプル周期をtsとすると
付加すべき無音データの長さTは T=α・ts であり、付加する無音データはα個要する。また
音声片の終端でデルタパラメータΔpが最大値
MAX(Δp)となる場合もありうるため、付加無
音区間Tを一定値とするためには、 TMAX(Δp)・ts とする必要がある。
無音データ7FF(H)を付加し(ステツプ21)
ADPCM符号化した時(ステツプ22)のデルタパ
ラメータΔpの波形29を示す。同図において、
音声片“B”28の符号化データの終端がデルタパ
ラメータΔp(B)=αであつた場合、デルタパラメ
ータΔp29の減少はADPCM方式の特徴として1
づつであるため、デルタパラメータΔpが最小値
かつ初期値である“0”になるまでにはαサンプ
ル分を要する。従つてサンプル周期をtsとすると
付加すべき無音データの長さTは T=α・ts であり、付加する無音データはα個要する。また
音声片の終端でデルタパラメータΔpが最大値
MAX(Δp)となる場合もありうるため、付加無
音区間Tを一定値とするためには、 TMAX(Δp)・ts とする必要がある。
第8図に、付加無音区間T=MAX(Δp)・tsと
し、音声片“B”及び“A”を合成した場合(ス
テツプ25〜27)の合成音声波形30及びデルタパ
ラメータΔpの波形31を示す。同図に示すよう
に、音声片“A”の始端32までにデルタパラメ
ータΔpを“0”とすることができるので、次の
音声素片“A”は完全に原音声波形に再生され
(a)、またゼロシフトの現象も発生しない(b)。
し、音声片“B”及び“A”を合成した場合(ス
テツプ25〜27)の合成音声波形30及びデルタパ
ラメータΔpの波形31を示す。同図に示すよう
に、音声片“A”の始端32までにデルタパラメ
ータΔpを“0”とすることができるので、次の
音声素片“A”は完全に原音声波形に再生され
(a)、またゼロシフトの現象も発生しない(b)。
具体例として、MAX(Δp)=48とし、サンプリ
ング周期tsを周波数f=6KHzとして ts=1/6=167(μs)とした場合、付加無音区間
Tは TMAX(Δp)・ts=48/6=8(ms) となるが、8ms程度の無音は無音として関知で
きないものであるから、このような処理を行つて
も不自然な音声に再生されることはない。また切
断、除去される冗長部は、通常100〜200ms程度
であり、従つて付加される無音部ははるかに少な
い。
ング周期tsを周波数f=6KHzとして ts=1/6=167(μs)とした場合、付加無音区間
Tは TMAX(Δp)・ts=48/6=8(ms) となるが、8ms程度の無音は無音として関知で
きないものであるから、このような処理を行つて
も不自然な音声に再生されることはない。また切
断、除去される冗長部は、通常100〜200ms程度
であり、従つて付加される無音部ははるかに少な
い。
尚、上記の実施例は原音声信号を一担ADPCM
方式によりADPCM符号化し、該ADPCM符号化
データをPCM符号化データに再生して、該PCM
符号化データの終端部に前述した切断、除去等の
一連の処理を行なう場合であるが、第2の実施例
として原音声をいきなりPCM符号化し、該PCM
符号化データに一連の処理を行なうこともでき
る。また上記第1の実施例は、原音声が連続音で
ある場合であるが、原音声が語単位の音声である
場合にも同様に実施できる。
方式によりADPCM符号化し、該ADPCM符号化
データをPCM符号化データに再生して、該PCM
符号化データの終端部に前述した切断、除去等の
一連の処理を行なう場合であるが、第2の実施例
として原音声をいきなりPCM符号化し、該PCM
符号化データに一連の処理を行なうこともでき
る。また上記第1の実施例は、原音声が連続音で
ある場合であるが、原音声が語単位の音声である
場合にも同様に実施できる。
(発明の効果)
以上説明したように、この発明によればその構
成をADPCM方式によりADPCM符号化データと
した後該ADPCM符号化データをPCM符号化デ
ータとし、又は原音声をPCM方式によりPCM符
号化データとし、これらのPCM符号化データの
終端部の冗長部分を切断、除去し、残存する
PCM符号化データの終端に所定数の無音符号を
付加し、該PCM符号をADPCM方式により符号
化することとしたため、音声片をどの時点で切り
出してもその符号化データ終端のデルタパラメー
タを円滑に初期化することができ、編集時におけ
る音声の合成部における波形の変形等の欠点が除
去され、原音声を完全に再生することができる。
成をADPCM方式によりADPCM符号化データと
した後該ADPCM符号化データをPCM符号化デ
ータとし、又は原音声をPCM方式によりPCM符
号化データとし、これらのPCM符号化データの
終端部の冗長部分を切断、除去し、残存する
PCM符号化データの終端に所定数の無音符号を
付加し、該PCM符号をADPCM方式により符号
化することとしたため、音声片をどの時点で切り
出してもその符号化データ終端のデルタパラメー
タを円滑に初期化することができ、編集時におけ
る音声の合成部における波形の変形等の欠点が除
去され、原音声を完全に再生することができる。
第1図は従来の又は本発明を実施するための音
声編集システムのブロツク図、第2図は従来の音
声編集を示すフローチヤートを示す図、第3図a
及びbはそれぞれ連続音声から切出した音声片終
端の波形及びデルタパラメータΔpの波形を示す
図、第4図a及びbはそれぞれ連続音声から切出
した音声片先端の波形及びデルタパラメータΔp
の波形を示す図、第5図a及びbはそれぞれ第3
図及び第4図に示す音声片を合成した場合の合成
波形及びデルタパラメータΔpの波形を示す図、
第6図はこの発明による音声編集を示すフローチ
ヤートを示す図、第7図a及びbはそれぞれこの
発明により音声片の終端に無音データを付加した
場合の音声波形及びデルタパラメータΔpの波形
を示す図、第8図a,bはそれぞれ第6図に示す
編集を行つた場合の編集合成波形及びデルタパラ
メータΔpの波形を示す図である。 1……音声入力端子、2……分析部、3……サ
ブメモリ部、4……メインメモリ部、5……合成
部、6……中央処理装置。
声編集システムのブロツク図、第2図は従来の音
声編集を示すフローチヤートを示す図、第3図a
及びbはそれぞれ連続音声から切出した音声片終
端の波形及びデルタパラメータΔpの波形を示す
図、第4図a及びbはそれぞれ連続音声から切出
した音声片先端の波形及びデルタパラメータΔp
の波形を示す図、第5図a及びbはそれぞれ第3
図及び第4図に示す音声片を合成した場合の合成
波形及びデルタパラメータΔpの波形を示す図、
第6図はこの発明による音声編集を示すフローチ
ヤートを示す図、第7図a及びbはそれぞれこの
発明により音声片の終端に無音データを付加した
場合の音声波形及びデルタパラメータΔpの波形
を示す図、第8図a,bはそれぞれ第6図に示す
編集を行つた場合の編集合成波形及びデルタパラ
メータΔpの波形を示す図である。 1……音声入力端子、2……分析部、3……サ
ブメモリ部、4……メインメモリ部、5……合成
部、6……中央処理装置。
Claims (1)
- 1 原音声を適用差分パルス符号変調方式
(ADPCM方式)により符号化する音声符号化方
法において、原音声をADPCM方式により
ADPCM符号化データとした後該ADPCM符号化
データをPCM符号化データとし、又は原音声を
PCM方式によりPCM符号化データとし、上記い
ずれかの方法により得られたPCM符号化データ
の終端部の冗長部分を切断、除去し、残存する
PCM符号化データの終端にデルタパラメータΔp
の最大値Max(Δp)とサンプル同期周期tsとの積
Max(Δp)・tsで定まる長さの無音符号を付加し、
該PCM符号をADPCM方式により符号化するこ
とを特徴とする音声符号化方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57040735A JPS58158693A (ja) | 1982-03-17 | 1982-03-17 | 音声符号化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57040735A JPS58158693A (ja) | 1982-03-17 | 1982-03-17 | 音声符号化方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58158693A JPS58158693A (ja) | 1983-09-20 |
| JPH0378639B2 true JPH0378639B2 (ja) | 1991-12-16 |
Family
ID=12588886
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57040735A Granted JPS58158693A (ja) | 1982-03-17 | 1982-03-17 | 音声符号化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58158693A (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0833742B2 (ja) * | 1986-07-17 | 1996-03-29 | 日本電気株式会社 | 音声合成方式 |
| JPH0833743B2 (ja) * | 1986-11-07 | 1996-03-29 | 日本電気株式会社 | 波形合成方式 |
| JPH0833758B2 (ja) * | 1988-02-24 | 1996-03-29 | 日本電気株式会社 | 音声合成方式 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5173418A (en) * | 1974-12-20 | 1976-06-25 | Sanyo Electric Co | Jikanjikuhenkansochino zatsuonyokuatsukairo |
| JPS5736943Y2 (ja) * | 1979-09-07 | 1982-08-14 |
-
1982
- 1982-03-17 JP JP57040735A patent/JPS58158693A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58158693A (ja) | 1983-09-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0380572B1 (en) | Generating speech from digitally stored coarticulated speech segments | |
| US5682502A (en) | Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters | |
| JP2612868B2 (ja) | 音声の発声速度変換方法 | |
| JPH0378639B2 (ja) | ||
| JP3518898B2 (ja) | 音声合成装置 | |
| JP4867076B2 (ja) | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 | |
| JPH05303399A (ja) | 音声時間軸圧縮伸長装置 | |
| JP3342310B2 (ja) | 音声復号化装置 | |
| JP2001282246A (ja) | 波形データ時間伸張圧縮装置 | |
| JP3241582B2 (ja) | 韻律制御装置及び方法 | |
| JP2648138B2 (ja) | 音声パターンを圧縮する方法 | |
| JPS6295595A (ja) | 音声応答方式 | |
| JPS5948399B2 (ja) | 音声合成方式 | |
| JP2861005B2 (ja) | 音声蓄積再生装置 | |
| JPH01197793A (ja) | 音声合成装置 | |
| JPH0758438B2 (ja) | 長音結合方法 | |
| JPH0756589A (ja) | 音声合成方法 | |
| JP2527393Y2 (ja) | 音声合成装置 | |
| JPS58196598A (ja) | 法則型音声合成装置 | |
| JPH01191900A (ja) | 音声応答装置 | |
| JPS63178300A (ja) | 音声符号器 | |
| JPS60256987A (ja) | 音響信号の時間軸変換装置 | |
| JPH0355840B2 (ja) | ||
| JPS6143797A (ja) | 音声編集出力方式 | |
| JPH0431120B2 (ja) |