JPH02153396A - 音声蓄積再生装置 - Google Patents
音声蓄積再生装置Info
- Publication number
- JPH02153396A JPH02153396A JP63307475A JP30747588A JPH02153396A JP H02153396 A JPH02153396 A JP H02153396A JP 63307475 A JP63307475 A JP 63307475A JP 30747588 A JP30747588 A JP 30747588A JP H02153396 A JPH02153396 A JP H02153396A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- memory
- waveform
- pitch
- thinning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声機能付きワークステーションにおける音
声メモ、通信システムにおけるボイスメール等の音声蓄
積再生装置に関し、特に蓄積した音声を、音質を変えず
に高速(2倍速以上の早口)再生可能な、使い勝手のよ
い音声蓄積再生装置に関する。
声メモ、通信システムにおけるボイスメール等の音声蓄
積再生装置に関し、特に蓄積した音声を、音質を変えず
に高速(2倍速以上の早口)再生可能な、使い勝手のよ
い音声蓄積再生装置に関する。
従来、蓄積した音声を高速に再生する装置あるいは手法
として、 (1)特開昭57−85099号に開示されている如く
、サンプリングクロックと出力クロックの比で、時間軸
を変換する装置 (2)特開昭59−75295号に開示されている如く
、休止区間の長さを調整することにより、音声の再生速
度を変える装置 (3)アイ・イー・イー・イー、トランザクションオン
アコースティクス、スピーチアンドシグナルプロセシン
グ、エイニスエスピー 27(1979年)第121〜133頁(I E E
E 、 Trans。
として、 (1)特開昭57−85099号に開示されている如く
、サンプリングクロックと出力クロックの比で、時間軸
を変換する装置 (2)特開昭59−75295号に開示されている如く
、休止区間の長さを調整することにより、音声の再生速
度を変える装置 (3)アイ・イー・イー・イー、トランザクションオン
アコースティクス、スピーチアンドシグナルプロセシン
グ、エイニスエスピー 27(1979年)第121〜133頁(I E E
E 、 Trans。
Acoustics、5peech and Sign
al Process−ing、 A S S P−2
7(1979)、pp、121−133)において論じ
られている如く、音声のピッチ単位で波形を間引いて出
力する手法 等が知られている。
al Process−ing、 A S S P−2
7(1979)、pp、121−133)において論じ
られている如く、音声のピッチ単位で波形を間引いて出
力する手法 等が知られている。
上記従来技術には、それぞれ、下記の如き問題があった
。
。
(1)は、音質について配慮がなされておらず、音声が
テープレコーダを早回し再生したように甲高い声に変化
して、話者の特徴が失なわれるという点 (2)は、音声のポーズを削除するため、発声内容が不
自然になるとともに、意味が不明確になるばかりでなく
、それほどの高速性能が得られないという点 (3)は、音質を変えずにある程度まで高速に再生でき
るので、音声メモ等の音声蓄積再生装置には好適な手法
であるが、未だ、2倍以上の高速再生の手法と装置化に
ついての配慮がなされておらず、2倍速以上の再生を実
現するには如何に間引いて行くかという点、また、フレ
ーム単位で音声を扱う音声蓄積再生装置に適用する場合
、如何に実時間で処理するかという点 に問題があった。
テープレコーダを早回し再生したように甲高い声に変化
して、話者の特徴が失なわれるという点 (2)は、音声のポーズを削除するため、発声内容が不
自然になるとともに、意味が不明確になるばかりでなく
、それほどの高速性能が得られないという点 (3)は、音質を変えずにある程度まで高速に再生でき
るので、音声メモ等の音声蓄積再生装置には好適な手法
であるが、未だ、2倍以上の高速再生の手法と装置化に
ついての配慮がなされておらず、2倍速以上の再生を実
現するには如何に間引いて行くかという点、また、フレ
ーム単位で音声を扱う音声蓄積再生装置に適用する場合
、如何に実時間で処理するかという点 に問題があった。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の技術における上述の如き問題を解
消し、フレーム単位で音声を入力して、2倍速以上のピ
ッチ単位の波形間引きを実時間で処理可能な、比較的小
型の音声蓄積再生装【を提供することにある。
するところは、従来の技術における上述の如き問題を解
消し、フレーム単位で音声を入力して、2倍速以上のピ
ッチ単位の波形間引きを実時間で処理可能な、比較的小
型の音声蓄積再生装【を提供することにある。
C課題を解決するための手段〕
本発明の上述の目的は、音声を符号化して蓄積し、蓄積
した符号化音声を読出して復号し、音声のピッチ単位で
波形を間引いて、ディジタル/アナログ変換回路を介し
て出力する音声蓄積再生装置において、前記復号した音
声を蓄える第1のメモリと、ピッチ単位で波形を間引い
た音声を蓄える第2のメモリと、前記第1のメモリの音
声と前記第2のメモリの音声を選択して人力し、ピッチ
単位で波形を間引いて前記第2のメモリに出力する間引
き処理手段とを設けたことを特徴とする音声蓄積再生装
置によって達成される。
した符号化音声を読出して復号し、音声のピッチ単位で
波形を間引いて、ディジタル/アナログ変換回路を介し
て出力する音声蓄積再生装置において、前記復号した音
声を蓄える第1のメモリと、ピッチ単位で波形を間引い
た音声を蓄える第2のメモリと、前記第1のメモリの音
声と前記第2のメモリの音声を選択して人力し、ピッチ
単位で波形を間引いて前記第2のメモリに出力する間引
き処理手段とを設けたことを特徴とする音声蓄積再生装
置によって達成される。
本発明に係る音声蓄積再生装置においては、前記第1の
メモリには、符号化音声を復号した音声波形を蓄える。
メモリには、符号化音声を復号した音声波形を蓄える。
前記間引き処理手段は、まず、前記第1のメモリから2
ピッチ分の波形(vi、およびvi、、ここで、viは
復号した音声波形の1ピッチ分を表す)を入力して1ピ
ツチ長に間引き。
ピッチ分の波形(vi、およびvi、、ここで、viは
復号した音声波形の1ピッチ分を表す)を入力して1ピ
ツチ長に間引き。
前記第2のメモリに出力する(voいvOは間引き後の
1ピツチ長の波形を表す)。これを第1段の間引きとい
う。
1ピツチ長の波形を表す)。これを第1段の間引きとい
う。
次に、間引き処理手段は、前記第2のメモリからvO□
、また第1のメモリから次の1ピツチ長の波形vi、を
入力し、再び1ピツチ長に間引いて、第2のメモリの第
1段の間引きと同一の番地に書込む(vot)−これを
第2段の間引きという。
、また第1のメモリから次の1ピツチ長の波形vi、を
入力し、再び1ピツチ長に間引いて、第2のメモリの第
1段の間引きと同一の番地に書込む(vot)−これを
第2段の間引きという。
このように2段の間引きを行うことによって、3ピツチ
長の音声波形(vi、〜vi、)が1ピツチ長の波形(
vo、)に短縮され、録音時間に比べて173の早口再
生が可能になる。
長の音声波形(vi、〜vi、)が1ピツチ長の波形(
vo、)に短縮され、録音時間に比べて173の早口再
生が可能になる。
以下1本発明の実施例を図面に基づいて詳細に説明する
。
。
第1図は1本発明の一実施例を示す構成図である。図に
おいて、1はマイク、2は増幅およびAID変換回路、
3はCCITT G、721勧告に準拠したADPCM
エンコーダ、Mlはマイク1から入力して増幅し、8K
HzサンプリングでA/D変換後、上記ADPCMエン
コーダ3で32Kb/sに符号化した音声を蓄積する、
比較的大容量のメモリ、また、M2は1フレーム分(例
えば40m5に相当する320サンプル点)の符号化音
声を蓄えるメモリ、4はフレーム単位で符号化音声を音
声波形に復号する、CCITT勧告に準拠したADPC
Mデコーダ、M3は1フレーム前の間引き処理で残った
音声波形(Vzと言う)と、復号した1フレーム分の音
声波形(Vfと言う)を蓄えるメモリを示す(以下、V
zとVfを総称してVtと言う)。
おいて、1はマイク、2は増幅およびAID変換回路、
3はCCITT G、721勧告に準拠したADPCM
エンコーダ、Mlはマイク1から入力して増幅し、8K
HzサンプリングでA/D変換後、上記ADPCMエン
コーダ3で32Kb/sに符号化した音声を蓄積する、
比較的大容量のメモリ、また、M2は1フレーム分(例
えば40m5に相当する320サンプル点)の符号化音
声を蓄えるメモリ、4はフレーム単位で符号化音声を音
声波形に復号する、CCITT勧告に準拠したADPC
Mデコーダ、M3は1フレーム前の間引き処理で残った
音声波形(Vzと言う)と、復号した1フレーム分の音
声波形(Vfと言う)を蓄えるメモリを示す(以下、V
zとVfを総称してVtと言う)。
MCUは、音声蓄積時にはA D P CMエンコーダ
3の出力をMlに取込み、再生時には転送要求信号TR
EQが入力される度に、Mlにある符号化音声を1フレ
ームずつM2に転送して、転送が終わるとADPCMデ
コーダ3を起動(FRUN)する、マイクロコンピュー
タを中心に構成される転送制御回路である。PWRは、
M3の音声波形Vfを読出してフレームのパワ(電力)
を計算し、パワが予め設定された閾値以上のときは有声
フレーム、閾値未満のときは無音または無声フレームで
あると判定(V/U判定)してフラグの形態(VUF)
で出力するパワ処理回路である。
3の出力をMlに取込み、再生時には転送要求信号TR
EQが入力される度に、Mlにある符号化音声を1フレ
ームずつM2に転送して、転送が終わるとADPCMデ
コーダ3を起動(FRUN)する、マイクロコンピュー
タを中心に構成される転送制御回路である。PWRは、
M3の音声波形Vfを読出してフレームのパワ(電力)
を計算し、パワが予め設定された閾値以上のときは有声
フレーム、閾値未満のときは無音または無声フレームで
あると判定(V/U判定)してフラグの形態(VUF)
で出力するパワ処理回路である。
また、PTHは、有声7L/−ム(VTJF=1)(7
)ときはVfを読出してフレームのピッチ(基本周波数
:P)を計算して出力し、VUF=OのときはPを予め
決められた値2例えば、106(単位はサンプル点数)
に設定して出力する ピッチ処理回路を示している。T
DSは、M3から音声波形Vt或いはM4から音声波形
Voを読出してピッチ(P)単位で波形を間引いて行き
、間引いた波形を再びM4に書込むとともに、Vtの波
形数がピッチの整数倍でないために間引き処理できなか
った残波形VzをM3の一定の番地に移動する間引き処
理回路である。
)ときはVfを読出してフレームのピッチ(基本周波数
:P)を計算して出力し、VUF=OのときはPを予め
決められた値2例えば、106(単位はサンプル点数)
に設定して出力する ピッチ処理回路を示している。T
DSは、M3から音声波形Vt或いはM4から音声波形
Voを読出してピッチ(P)単位で波形を間引いて行き
、間引いた波形を再びM4に書込むとともに、Vtの波
形数がピッチの整数倍でないために間引き処理できなか
った残波形VzをM3の一定の番地に移動する間引き処
理回路である。
M4は間引き処理回路による書込み/読出しのアクセス
と、出力制御回路による読出しのアクセスが並行して可
能な2頁構成の出力波形メモリ。
と、出力制御回路による読出しのアクセスが並行して可
能な2頁構成の出力波形メモリ。
また、OCTは1M4のTDSが書込み/読出しをして
いる頁とは別な頁から、サンプリング周期(8KH2)
毎に出力波形Voutを読出してD/A変換回路5に出
力し、設定された数Noutの読出しが終了すると、T
REQをMCUに出力するとともに、M4の頁を切替え
て出力波形を読出す出力制御回路である。
いる頁とは別な頁から、サンプリング周期(8KH2)
毎に出力波形Voutを読出してD/A変換回路5に出
力し、設定された数Noutの読出しが終了すると、T
REQをMCUに出力するとともに、M4の頁を切替え
て出力波形を読出す出力制御回路である。
メモリの詳細な構成を、第2図(a)〜(d)に示す。
図中、M1〜M4は、それぞれ第1図と対応している。
Mlには 1フレーム320サンプル点分のADPCM
符号化音声AVがフレーム類kn(F=1.2゜・・・
、N)蓄積されている。符号化音声は、例えば、図(a
)下段のように4サンプル点分が1ワードにパックされ
ているので、1フレーム当り80ワードになる。M2に
は、(b)に示す如<Mlから転送された1フレーム分
の符号化音声AV(F=i)の他に、パワ処理回路PW
RがV/U判定を行うために読出す閾値PWRTH、ピ
ッチ処理回路PTHがピッチ計算で使用する波形の相関
閾値PTTH、ピッチ探索範囲PTMIN、PTMAX
、間引き処理回路TDSが使用する間引き速度のパター
ンCPATが蓄えられている。
符号化音声AVがフレーム類kn(F=1.2゜・・・
、N)蓄積されている。符号化音声は、例えば、図(a
)下段のように4サンプル点分が1ワードにパックされ
ているので、1フレーム当り80ワードになる。M2に
は、(b)に示す如<Mlから転送された1フレーム分
の符号化音声AV(F=i)の他に、パワ処理回路PW
RがV/U判定を行うために読出す閾値PWRTH、ピ
ッチ処理回路PTHがピッチ計算で使用する波形の相関
閾値PTTH、ピッチ探索範囲PTMIN、PTMAX
、間引き処理回路TDSが使用する間引き速度のパター
ンCPATが蓄えられている。
第2図(b)に示したCPATは、2.5倍速再生のた
めの値で、 cpは1,1,0,1,0,1,1,0,1,0.・・
・−とピッチ毎に周期的に読出される(“1″のときに
間引く)、2倍速再生の場合、MCUが、Ct=(00
10) Cp =(10) と設定することにより Cpは1,0,1,0.・・・ のように読出される。3倍速再生では、Ct=(001
1) Cp=(110) と設定し、 Cpは1,1,0,1,1,0.・・・・のように読出
される。
めの値で、 cpは1,1,0,1,0,1,1,0,1,0.・・
・−とピッチ毎に周期的に読出される(“1″のときに
間引く)、2倍速再生の場合、MCUが、Ct=(00
10) Cp =(10) と設定することにより Cpは1,0,1,0.・・・ のように読出される。3倍速再生では、Ct=(001
1) Cp=(110) と設定し、 Cpは1,1,0,1,1,0.・・・・のように読出
される。
間引き速度のパターンCPATは、上に示した如く、M
CUによってフレーム単位で設定することができる。
CUによってフレーム単位で設定することができる。
M3には第i−1フレームの間引き処理で残った人波形
Vz(F=i−1)が1番地からIz番地に、第1フレ
ームの波形Vf(F=i)がI z+1番地から I
z +320番地に蓄えられている。人波形については
、一般に1フレームのサンプル数NとnXP(Pはピッ
チに相当するサンプル数、nは自然数)は等しくないの
で、 I z =(I z’+N) −n X Pのサンプル
点の波形Vzが、未処理で残る。ここに、Iz’は1フ
レーム前の残波形数を示す。
Vz(F=i−1)が1番地からIz番地に、第1フレ
ームの波形Vf(F=i)がI z+1番地から I
z +320番地に蓄えられている。人波形については
、一般に1フレームのサンプル数NとnXP(Pはピッ
チに相当するサンプル数、nは自然数)は等しくないの
で、 I z =(I z’+N) −n X Pのサンプル
点の波形Vzが、未処理で残る。ここに、Iz’は1フ
レーム前の残波形数を示す。
M4は、間引き処理回路TDSと出力制御回路OCTが
並行してアクセスできるように2頁で構成されたメモリ
であり、間引き処理をした出力波形■0が蓄えられる。
並行してアクセスできるように2頁で構成されたメモリ
であり、間引き処理をした出力波形■0が蓄えられる。
TDSがM4のある頁を書込み/続出しアクセスしてい
るとき、OCTは他方の頁に蓄えられている1フレーム
前の間引き結果Voutを読出して、D/A変換回路に
送出する。
るとき、OCTは他方の頁に蓄えられている1フレーム
前の間引き結果Voutを読出して、D/A変換回路に
送出する。
上述の如く構成された本実施例の動作を、以下第3図〜
第5図を用いて説明する。第3図は、装置全体の動作を
フローチャートで示したもの、第4図は、ピッチ単位で
波形を間引<TDSの動作の詳細を示したもの、第5図
は、全体の動作タイミングを示したものである。
第5図を用いて説明する。第3図は、装置全体の動作を
フローチャートで示したもの、第4図は、ピッチ単位で
波形を間引<TDSの動作の詳細を示したもの、第5図
は、全体の動作タイミングを示したものである。
第3図において、PLAYは蓄積した音声の再生を開始
する入口を示す。まず、転送制御回路MCUは、残波形
数Izを0にして、MlからM2に第1フレームの符号
化音声(AV(F=1))、間引き速度のパターンCP
AT等を転送し、信号FRUNによりADPCMデコー
ダ4を起動する。
する入口を示す。まず、転送制御回路MCUは、残波形
数Izを0にして、MlからM2に第1フレームの符号
化音声(AV(F=1))、間引き速度のパターンCP
AT等を転送し、信号FRUNによりADPCMデコー
ダ4を起動する。
該デコーダ4は、M2の符号化音声を読出して、音声波
形(V f (F = 1 ))ニ復号し、VfをM3
に書込む。デコードが終了すると、パワ処理回路PWR
が、M3から音声波形(Vf)を読出して、パワを計算
し、有声/無声の判定をする(VUF)。
形(V f (F = 1 ))ニ復号し、VfをM3
に書込む。デコードが終了すると、パワ処理回路PWR
が、M3から音声波形(Vf)を読出して、パワを計算
し、有声/無声の判定をする(VUF)。
次に、ピッチ処理回路PTHは、フレームが有声(VU
F=1)のときにはピッチ(P)を計算し、無音、無声
のときにはPを106に設定する。
F=1)のときにはピッチ(P)を計算し、無音、無声
のときにはPを106に設定する。
間引き処理回路TDSは、Vt(Iz点のVzと320
点のVf)を処理の対象にするので、図中のステップT
DS1で残波形数をI z +320に設定する。(第
1フレームでは残波形数は0なので、ここでI z =
320に設定される。)続いて、間引き処理回路TDS
は1間引き速度のパターンCPに応じて、ピッチP単位
にIz点の音声波形Vtの間引きを行う。これを第4図
を用いて詳細に説明する。
点のVf)を処理の対象にするので、図中のステップT
DS1で残波形数をI z +320に設定する。(第
1フレームでは残波形数は0なので、ここでI z =
320に設定される。)続いて、間引き処理回路TDS
は1間引き速度のパターンCPに応じて、ピッチP単位
にIz点の音声波形Vtの間引きを行う。これを第4図
を用いて詳細に説明する。
第4図は、2.5倍速再生(Cp=1,1,0,1,0
.1,1,0,1.O,・・・・・の繰返し)、第1フ
レームのピッチP 1 =58(単位はサンプル点数、
周波数単位では138Hz)、第2フレームのピッチP
2=65(123Hz)としたときの間引きの動作例を
示す。
.1,1,0,1.O,・・・・・の繰返し)、第1フ
レームのピッチP 1 =58(単位はサンプル点数、
周波数単位では138Hz)、第2フレームのピッチP
2=65(123Hz)としたときの間引きの動作例を
示す。
(1)第1フレームではI z =320を初期値にし
て、間引きを開始する6まず、Cp=1(この場合は、
第1番目の1)で Iz≧2P1なのでytをピッチ単
位に間引く。すなわち、M3の1〜2P1番地から2P
1点の波形Vtを読出して、それぞれの波形に図示した
窓関数Wを乗じた後、左半分の1ピッチ分の波形と、P
lだけ隔たった右半分の1ピッチ分の波形を加算して出
力波形vOを得、M4の1〜P1番地に格納する。これ
を式で示せば、 Do τ=1.PL τ −1 DO τ=1.PL END D。
て、間引きを開始する6まず、Cp=1(この場合は、
第1番目の1)で Iz≧2P1なのでytをピッチ単
位に間引く。すなわち、M3の1〜2P1番地から2P
1点の波形Vtを読出して、それぞれの波形に図示した
窓関数Wを乗じた後、左半分の1ピッチ分の波形と、P
lだけ隔たった右半分の1ピッチ分の波形を加算して出
力波形vOを得、M4の1〜P1番地に格納する。これ
を式で示せば、 Do τ=1.PL τ −1 DO τ=1.PL END D。
となり、2ピッチ分のVtが1ピツチ長のvOに間引か
れる。間引いた後は、 Iz=Iz−2P1 =320−116=204 に残波形数を更新し、CpとしてM2から次のパターン
を読出しておく。以上が第3図のステップTDS2の説
明である。
れる。間引いた後は、 Iz=Iz−2P1 =320−116=204 に残波形数を更新し、CpとしてM2から次のパターン
を読出しておく。以上が第3図のステップTDS2の説
明である。
(2)次に、Cp=1(この場合は、第2番目の1)で
Iz≧P1なので、ステップTDS3で示される第2段
目の間引きを行う。M4の1〜P1番地から21点の波
形(すなわち、前記V o )を、M3の2P1+1〜
3P1番地から21点の波形を読出して、それぞれの波
形に窓関数Wを乗じた後、加算して出力波形vOを得、
再びM4の1〜P1番地に格納する。これを式で示せば
。
Iz≧P1なので、ステップTDS3で示される第2段
目の間引きを行う。M4の1〜P1番地から21点の波
形(すなわち、前記V o )を、M3の2P1+1〜
3P1番地から21点の波形を読出して、それぞれの波
形に窓関数Wを乗じた後、加算して出力波形vOを得、
再びM4の1〜P1番地に格納する。これを式で示せば
。
END D。
となる。間引いた後は、
Iz=Iz−PL
= 204−58 = 146
に残波形数を更新し、CpとしてM2からピッチに対応
して、次の次のパターンを読出しておく。
して、次の次のパターンを読出しておく。
以上が第3図のステップTDS3の説明である。
上に示したように、(1)と(2)で3ピッチ分のVt
が1ピツチ長のvOに間引かれる。(2)を終了して第
3図のラベルtに戻る。
が1ピツチ長のvOに間引かれる。(2)を終了して第
3図のラベルtに戻る。
(3)Cp=1(この場合は、第3番目の1)でIz=
146≧2PLなので、再びステップTDS2を行う。
146≧2PLなので、再びステップTDS2を行う。
すなわち、M3の3P1+1〜5P1番地から2P1点
の波形vしを読出して、(1)と同様にして出力波形v
Oを得、これをM4のP1+1〜2P1番地に格納する
。残波形数を Iz=Iz−2P1 = 146−116=30 に更新し、CpとしてM2から次のパターンを読出して
おく。
の波形vしを読出して、(1)と同様にして出力波形v
Oを得、これをM4のP1+1〜2P1番地に格納する
。残波形数を Iz=Iz−2P1 = 146−116=30 に更新し、CpとしてM2から次のパターンを読出して
おく。
(4)次に、Cp=O(ここでは、第2番目のO)なの
で、次のパターンを読出してラベルtに戻る。
で、次のパターンを読出してラベルtに戻る。
(5)Cp=1(第2周期日の第1番目の1)であるが
、I z =30< P 1なので、M3の5P1+1
〜5P1+I z番地の波形を、人波形としてM3の1
〜Iz番地に移動する。
、I z =30< P 1なので、M3の5P1+1
〜5P1+I z番地の波形を、人波形としてM3の1
〜Iz番地に移動する。
(6)出力制御回路OCTは、M4の頁を切替えて第2
フレームの符号化音声転送要求信号TREQをMCUに
出力し、第1フレームの間引き処理を終了する(第3図
ラベルfに戻る)。
フレームの符号化音声転送要求信号TREQをMCUに
出力し、第1フレームの間引き処理を終了する(第3図
ラベルfに戻る)。
このように、第1フレームでは320点の入力波形Vt
をピッチ単位で間引いた結果、2ピツチ長(116点)
の出力波形Voutが得られる。なお、残波形数Izは
30点である。
をピッチ単位で間引いた結果、2ピツチ長(116点)
の出力波形Voutが得られる。なお、残波形数Izは
30点である。
第2フレームの符号化音声に対する処理は、ラベルfか
ら開始する。Iz=30なので、ステップTDS1で、 I z = I z +320=350に設定される。
ら開始する。Iz=30なので、ステップTDS1で、 I z = I z +320=350に設定される。
なお、M3の1〜30番地には、第1フレームの人波形
VZ(F=1)が格納されており、また31〜350番
地には、第2フレームの復号した音声波形Vf(F=2
)が格納されている。以下、TDSの動作は、第1フレ
ームと同様で、ピッチP2=65単位でVtを間引いて
行く。その結果、Voutは130点、Izは25点に
なる。
VZ(F=1)が格納されており、また31〜350番
地には、第2フレームの復号した音声波形Vf(F=2
)が格納されている。以下、TDSの動作は、第1フレ
ームと同様で、ピッチP2=65単位でVtを間引いて
行く。その結果、Voutは130点、Izは25点に
なる。
以下、同様にして、MCUによるフレーム数管理の下で
、Mlに蓄積された符号化音声の全フレームの処理が終
了すれば、第3図の5TOPに進んで、再生を終える。
、Mlに蓄積された符号化音声の全フレームの処理が終
了すれば、第3図の5TOPに進んで、再生を終える。
なお、第3図のステップTDS4は、Cp=0でIz≧
Pのときは、間引かないで、1ピッチ分の波形をそのま
まM3(Vt)からM4(Vo)に出力する動作を示し
ている。このときには、Iz=Iz−Pに残波形数を更
新して、次のCpをM2から読出しておく。ステップT
DS4は、例えば1.5倍速再生(CP ” 1 r
Or Or・・・・)で第2番目のOのときに動作する
。
Pのときは、間引かないで、1ピッチ分の波形をそのま
まM3(Vt)からM4(Vo)に出力する動作を示し
ている。このときには、Iz=Iz−Pに残波形数を更
新して、次のCpをM2から読出しておく。ステップT
DS4は、例えば1.5倍速再生(CP ” 1 r
Or Or・・・・)で第2番目のOのときに動作する
。
ステップTDS5は、Cp=1で、2P>Iz≧Pのと
きには、1ピッチ分の波形を、そのままM3からM4に
出力する動作を示している。このときは、Iz=Iz−
Pに残波形数を更新して、次のCpをM2から読出して
おく。ステップTDS5はリアルタイム処理のために必
要な動作で。
きには、1ピッチ分の波形を、そのままM3からM4に
出力する動作を示している。このときは、Iz=Iz−
Pに残波形数を更新して、次のCpをM2から読出して
おく。ステップTDS5はリアルタイム処理のために必
要な動作で。
例えば、P = 163(49Hz )でV t <3
26点なるフレームにおいて、出力波形vOのサンプル
数Noutが0点になることを回避する動作を示してい
る。
26点なるフレームにおいて、出力波形vOのサンプル
数Noutが0点になることを回避する動作を示してい
る。
ステップTDS6は、1フレーム分の波形を間引いた結
果、Noutが96点未満のときには、M4に書込まれ
たVoの最終の1ピッチ分を2度繰返して出力すること
を示している。これは、現状のハードウェア(例えば、
ディジタル・シグナルプロセッサ)を使用して、1フレ
ームのADPCMデコード処理等に最低96サンプル時
間(12ms)が必要なためである。
果、Noutが96点未満のときには、M4に書込まれ
たVoの最終の1ピッチ分を2度繰返して出力すること
を示している。これは、現状のハードウェア(例えば、
ディジタル・シグナルプロセッサ)を使用して、1フレ
ームのADPCMデコード処理等に最低96サンプル時
間(12ms)が必要なためである。
最後に、装置の動作タイミングを、第5図を用いて説明
する。出力制御回路OCTは、前述のデコーダ4.パワ
処理回路PWR,ピッチ処理回路P T Hおよび間引
き処理回路TDSが、第iフレームの音声を処理して出
力波形をM4のある頁に書込んでいるとき、M4の別な
頁から第i−1フレームの音声を処理したNi−1点の
出力波形Vout(F = i 1 )をサンプリン
グ周期毎に読出して、D/A変換回路に出力している。
する。出力制御回路OCTは、前述のデコーダ4.パワ
処理回路PWR,ピッチ処理回路P T Hおよび間引
き処理回路TDSが、第iフレームの音声を処理して出
力波形をM4のある頁に書込んでいるとき、M4の別な
頁から第i−1フレームの音声を処理したNi−1点の
出力波形Vout(F = i 1 )をサンプリン
グ周期毎に読出して、D/A変換回路に出力している。
上記Nj−1は前述のNout(i−1)と同じで、出
力制御回路OCTにあるカウンタに、第i−1フレーム
の間引き処理が終了したときにロードされているもので
ある。
力制御回路OCTにあるカウンタに、第i−1フレーム
の間引き処理が終了したときにロードされているもので
ある。
Ni−1点のD/A出力が終了すると、出力制御回路O
CTは、第i+1フレームの符号化音声をM2に転送す
る要求TREQを、MCUに発生し、M4の読出し頁を
切替えて、次のサンプリングタイミングからはNi点の
Vout(F = i )のD/A出力を開始する。
CTは、第i+1フレームの符号化音声をM2に転送す
る要求TREQを、MCUに発生し、M4の読出し頁を
切替えて、次のサンプリングタイミングからはNi点の
Vout(F = i )のD/A出力を開始する。
このように、本装置は、125XNi(μ5ec)を区
切りにして、フレーム毎の音声をピッチ単位で間引き処
理して行く。
切りにして、フレーム毎の音声をピッチ単位で間引き処
理して行く。
上記実施例においては、主として、蓄積した音声の再生
について説明したが、音声の蓄積については、マイクか
ら入力して増幅し、8KHzサンプリングでA/D変換
後、ADPCMエンコーダ3で32Kb/s(4ビツト
/サンプリング)に符号化して比較的大容量のメモリM
1に蓄積するわけで、従来と同様と考えて良い。
について説明したが、音声の蓄積については、マイクか
ら入力して増幅し、8KHzサンプリングでA/D変換
後、ADPCMエンコーダ3で32Kb/s(4ビツト
/サンプリング)に符号化して比較的大容量のメモリM
1に蓄積するわけで、従来と同様と考えて良い。
上記実施例においては、音声の符号化方式としてCCI
TT G、721勧告に準拠したADPCM方式を用
いた例を示したが、これは、他の方式によっても良いこ
とは言うまでもない。例えば、音声の符号化方式として
PARCOR方式を用い、第1図のADPCMエンコー
ダをPARCOR分析器で、また、デコーダ4をPAR
COR合成器で構成して、PARCOR分析では、1フ
レームの音声のスペクトルパラメータと、音源情報とし
てV/Uフラグとピッチを計算する。この情報を前記M
1とM2に蓄える。この場合には、第1図のパワ処理回
路PWRおよびピッチ処理回路PTHは、M2に転送さ
れたV/Uフラグおよびピッチを読出す回路となる。
TT G、721勧告に準拠したADPCM方式を用
いた例を示したが、これは、他の方式によっても良いこ
とは言うまでもない。例えば、音声の符号化方式として
PARCOR方式を用い、第1図のADPCMエンコー
ダをPARCOR分析器で、また、デコーダ4をPAR
COR合成器で構成して、PARCOR分析では、1フ
レームの音声のスペクトルパラメータと、音源情報とし
てV/Uフラグとピッチを計算する。この情報を前記M
1とM2に蓄える。この場合には、第1図のパワ処理回
路PWRおよびピッチ処理回路PTHは、M2に転送さ
れたV/Uフラグおよびピッチを読出す回路となる。
また、無声フレーム(子音など)に対しては1間引きを
行うと明瞭性が低下して音質が劣化する場合がある。こ
れを回避するために、間引き処理回路TDSは、無声フ
レームでは、間引きを行わずにM3の波形vtをそのま
ま出力波形としてM4に書込む回路としても良い。
行うと明瞭性が低下して音質が劣化する場合がある。こ
れを回避するために、間引き処理回路TDSは、無声フ
レームでは、間引きを行わずにM3の波形vtをそのま
ま出力波形としてM4に書込む回路としても良い。
なお、話者により発声速度が異なるのを微調整するよう
な場合にも、前述の間引き速度のパターンCPATを、
MCUによってフレーム単位で設定することで、対処す
ることができる。
な場合にも、前述の間引き速度のパターンCPATを、
MCUによってフレーム単位で設定することで、対処す
ることができる。
以上述べた如く、本発明によれば、音声を符号化して蓄
積し、蓄積した符号化音声を読出して復号し、音声のピ
ッチ単位で波形を間引いて、ディジタル/アナログ変換
回路を介して出力する、音声蓄積再生装置において、−
旦ピッチ単位で波形を間引いた音声に対して、繰返して
ピッチ単位で波形を間引く手段を設けたので、録音時間
に対して172以下の短時間で再生可能な、比較的小型
の音声蓄積再生装置を実現できるという効果を奏するも
のである。
積し、蓄積した符号化音声を読出して復号し、音声のピ
ッチ単位で波形を間引いて、ディジタル/アナログ変換
回路を介して出力する、音声蓄積再生装置において、−
旦ピッチ単位で波形を間引いた音声に対して、繰返して
ピッチ単位で波形を間引く手段を設けたので、録音時間
に対して172以下の短時間で再生可能な、比較的小型
の音声蓄積再生装置を実現できるという効果を奏するも
のである。
第1図は本発明の一実施例を示す構成図、第2図はメモ
リの詳細な構成を示す図、第3図は装置全体の動作を示
すフローチャート、第4図はピッチ単位で波形を間引<
TDSの動作の詳細を示す図、第5図は全体の動作タイ
ミングを示す図である。 Ml:メモリ、M2:フレームメモリ、4:ADPCM
デコーダ、M3:波形メモリ、PWR:パワ処理回路、
PTH:ピッチ処理回路、TDS:間引き処理回路、M
4:出力波形メモリ、OCT:出力制御回路1MCU:
転送制御回路。 図(その2) (d) 第 図(その3) 第 図(その2) 第 図(その1)
リの詳細な構成を示す図、第3図は装置全体の動作を示
すフローチャート、第4図はピッチ単位で波形を間引<
TDSの動作の詳細を示す図、第5図は全体の動作タイ
ミングを示す図である。 Ml:メモリ、M2:フレームメモリ、4:ADPCM
デコーダ、M3:波形メモリ、PWR:パワ処理回路、
PTH:ピッチ処理回路、TDS:間引き処理回路、M
4:出力波形メモリ、OCT:出力制御回路1MCU:
転送制御回路。 図(その2) (d) 第 図(その3) 第 図(その2) 第 図(その1)
Claims (1)
- 【特許請求の範囲】 1、音声を符号化して蓄積し、蓄積した符号化音声を読
出して復号し、音声のピッチ単位で波形を間引いて、デ
ィジタル/アナログ変換回路を介して出力する音声蓄積
再生装置において、ピッチ単位で波形を間引いた音声に
対して、繰返してピッチ単位で波形を間引く処理を行う
手段を設けたことを特徴とする音声蓄積再生装置。 2、復号した音声を蓄える第1のメモリと、ピッチ単位
で波形を間引いた音声を蓄える第2のメモリと、前記第
1のメモリの音声と前記第2のメモリの音声を選択して
入力し、ピッチ単位で波形を間引いて前記第2のメモリ
に出力する間引き処理手段とを設けたことを特徴とする
、請求項1記載の音声蓄積再生装置。 3、所定の間引きパターンに応じて前記第1のメモリの
音声と前記第2のメモリの音声を選択して入力し、ピッ
チ単位で波形を間引いて前記第2のメモリに出力し、ま
た、間引きパターンによっては、前記第1のメモリの音
声をピッチ単位でそのまま前記第2のメモリに出力する
間引き処理手段を設けたことを特徴とする、請求項2記
載の音声蓄積再生装置。 4、1フレーム毎に、音声を符号化して蓄積し、蓄積し
た符号化音声を読出して復号し、音声のピッチ単位で波
形を間引いて、ディジタル/アナログ変換回路を介して
出力する音声蓄積再生装置において、復号した1フレー
ム分の音声を蓄える第1のメモリと、ピッチ単位で、波
形を間引いた音声を蓄える第2のメモリと、前記第1の
メモリの音声と前記第2のメモリの音声を選択して入力
し、ピッチ単位で波形を間引いて前記第2のメモリに出
力し、前記第1のメモリ中の未処理の音声数が所定の値
以下になったときには前記第1のメモリの音声をピッチ
単位でそのまま前記第2のメモリに出力する間引き処理
手段とを設けたことを特徴とする音声蓄積再生装置。 5、1フレーム分の音声を処理した結果、前記第2のメ
モリに出力された音声数が所定の値以下の場合には、前
記第2のメモリの音声をピッチ単位で繰り返して前記第
2のメモリに付加する間引き処理手段を設けたことを特
徴とする、請求項4記載の音声蓄積再生装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63307475A JP2861005B2 (ja) | 1988-12-05 | 1988-12-05 | 音声蓄積再生装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63307475A JP2861005B2 (ja) | 1988-12-05 | 1988-12-05 | 音声蓄積再生装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02153396A true JPH02153396A (ja) | 1990-06-13 |
| JP2861005B2 JP2861005B2 (ja) | 1999-02-24 |
Family
ID=17969528
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63307475A Expired - Fee Related JP2861005B2 (ja) | 1988-12-05 | 1988-12-05 | 音声蓄積再生装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2861005B2 (ja) |
-
1988
- 1988-12-05 JP JP63307475A patent/JP2861005B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2861005B2 (ja) | 1999-02-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0380572B1 (en) | Generating speech from digitally stored coarticulated speech segments | |
| JPS60102697A (ja) | 記述メッセージコードと音声メッセージコードを結合する音声符号化方法 | |
| JPS623439B2 (ja) | ||
| JPS5982608A (ja) | 音声の再生速度制御方式 | |
| JPH02153396A (ja) | 音声蓄積再生装置 | |
| JP2860991B2 (ja) | 音声蓄積再生装置 | |
| JPH03233500A (ja) | 音声合成方式およびこれに用いる装置 | |
| JP3189587B2 (ja) | 音声時間軸変換装置 | |
| JP3620787B2 (ja) | 音声データの符号化方法 | |
| JP2865714B2 (ja) | 音声蓄積再生装置 | |
| JPH04213500A (ja) | 音声の符号化方法及び装置 | |
| JP3086458B2 (ja) | 音声合成装置 | |
| JP3083830B2 (ja) | 音声の発声時間長制御方法および装置 | |
| JPH0235320B2 (ja) | ||
| JPS63234299A (ja) | 音声分析合成方式 | |
| JPS5968793A (ja) | 音声合成装置 | |
| JPH0329999A (ja) | 音声蓄積再生装置 | |
| JPS5837697A (ja) | 音声記憶再生装置 | |
| JPS61252598A (ja) | 音声単語編集方式 | |
| JPH0664477B2 (ja) | 音声合成装置 | |
| JP2910068B2 (ja) | 音声再生装置 | |
| JPS62150397A (ja) | 音声情報符号化方式 | |
| JPS5868799A (ja) | 音声合成装置 | |
| JPS6265098A (ja) | 音楽用ボコ−ダ | |
| JPS63210900A (ja) | 音声合成装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |