JPH02176797A - Speech synthesis system - Google Patents
Speech synthesis systemInfo
- Publication number
- JPH02176797A JPH02176797A JP63331744A JP33174488A JPH02176797A JP H02176797 A JPH02176797 A JP H02176797A JP 63331744 A JP63331744 A JP 63331744A JP 33174488 A JP33174488 A JP 33174488A JP H02176797 A JPH02176797 A JP H02176797A
- Authority
- JP
- Japan
- Prior art keywords
- code data
- segment
- speech
- indicating
- data indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
Description
【発明の詳細な説明】
〈産業上の利用分野〉
この発明は、波形素片を繰り返し再生することによって
合成音声を生成する音声合成方式に関する。DETAILED DESCRIPTION OF THE INVENTION <Industrial Application Field> The present invention relates to a speech synthesis method that generates synthesized speech by repeatedly reproducing waveform segments.
〈従来の技術〉
音声における母音等の定常部においては、音の高さ(ピ
ッチ)に対応した周期でほぼ同じ音声波形声符号データ
のビット長を3〜4ビット程度とすると、上記素片の繰
り返し数は音声符号データと同じビット長で符号化する
ことができる。<Prior art> In the stationary parts of speech, such as vowels, if the bit length of the speech waveform voice code data, which is approximately the same at a period corresponding to the pitch of the sound, is about 3 to 4 bits, the above-mentioned segment The number of repetitions can be encoded with the same bit length as the voice code data.
しかしながら、1素片に含まれる音声符号データ数は数
百となる場合がある。例えば、音声のわたり部(音素と
音素の中間部)においては素片の繰り返し再生を行わな
いために、上記わたり部における素片においては1素片
に3ピツチ分の波形を含むとし、サンプリング周波数が
8KHzであるとする。そうすると、ピッチ周波数10
01(zのときの音声符号データ数は、8000x3/
+00 = 24.0個となる。したがって、この場合
に1素片に含まれる音声符号データ数を表わすのに必要
なビット長は8ビツトとなり、音声符号データのビット
長が3〜4ビツトであるのに比較して2倍以上になる。However, the number of voice code data included in one elemental piece may be several hundred. For example, in order not to repeatedly play a segment at the transition part of speech (the middle part between phonemes), it is assumed that one segment at the transition part contains a waveform of 3 pitches, and the sampling frequency is Suppose that the frequency is 8KHz. Then, the pitch frequency is 10
01 (the number of voice code data when z is 8000x3/
+00 = 24.0 pieces. Therefore, in this case, the bit length required to represent the number of speech code data included in one segment is 8 bits, which is more than twice the bit length of speech code data, which is 3 to 4 bits. Become.
すなわち、記憶部に格納される素片の数が多くなると、
それだけ各素片に含まれる音声符号データ数の情報が占
めるビット数も多くなり、記憶部に格納される補助情報
のデータ量が多くなるといが繰り返されるピッチ構造が
見られる。In other words, when the number of fragments stored in the storage section increases,
The number of bits occupied by the information on the number of voice code data included in each segment increases accordingly, and as the amount of auxiliary information stored in the storage section increases, a pitch structure in which data is repeated is observed.
そこて、従来より音声波形における1ピツチの波形素片
やこれに準じた音声波形素片等の素片の波形を表す符号
データを予め記憶部に記憶しておき、この素片の波形を
表す符号データを必要回数だけ繰り返して復号化して合
成音声波形を再生することによって、記憶部に記憶する
音声波形の符号データ量の低減を図った音声合成方式が
ある。Conventionally, code data representing the waveform of a one-pitch waveform segment in a speech waveform or a similar speech waveform segment is stored in advance in a storage unit, and the waveform of this segment is represented. There is a speech synthesis method that aims to reduce the amount of coded data of a speech waveform stored in a storage unit by decoding coded data repeatedly a necessary number of times to reproduce a synthesized speech waveform.
上記音声合成方式においては、各素片毎に素片の波形を
符号化した音声符号データを記憶部に格納している。そ
の際に、素片の音声符号データに基づく合成音声波形生
成(以下、素片再生と言う)時における補助情報として
、素片の繰り返し数1素片に含まれている音声符号デー
タの個数および最終素片か否かの情報等も記憶部に格納
している。In the above speech synthesis method, speech code data obtained by encoding the waveform of each segment is stored in the storage unit. At that time, as auxiliary information when generating a synthesized speech waveform based on the speech code data of the segment (hereinafter referred to as segment reproduction), the number of repetitions of the segment, the number of speech code data included in one segment, and Information such as whether it is the final segment or not is also stored in the storage unit.
〈発明が解決しようとする課題〉
通常、素片再生時に用いる補助情報のうち素片の繰り返
し数は2〜4程度であり2ビツトのビット長で符号化す
ることができる。したがって、音う問題がある。<Problems to be Solved by the Invention> Normally, among the auxiliary information used when reproducing a segment, the number of repetitions of a segment is about 2 to 4, and can be encoded with a bit length of 2 bits. Therefore, there is a noise problem.
そこで、この発明の目的は、素片の音声符号データの個
数を記憶しないことによって、記憶部に記憶する補助情
報のデータ量を少なくすることができる音声合成方式を
提供することにある。SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a speech synthesis method that can reduce the amount of auxiliary information stored in a storage section by not storing the number of speech code data of a segment.
〈課題を解決するための手段〉
上記目的を達成するため、この発明は、音声波形を符号
化して得られた音声符号データをピッチ波形素片等の波
形の素片毎に格納する記憶部と、上記記憶部に素片毎に
格納された音声符号データを順次読み出して復号化する
素片再生動作を繰り返して行うことによって合成音声波
形を生成する合成部を有する音声合成方式において、各
素片の終端の音声符号データの直航または直後に、上記
素片の終端を示す符号データと上記素片再生動作の繰り
返し数を示す符号データとを連続して付加して上記記憶
部に格納し、上記記憶部に格納された各符号データを順
次1個ずつ読み出して、この読み出された符号データが
上記素片の終端を示す符号データか音声符号データかの
判別を素片終端判別手段によって行い、上記素片終端判
別手段が、上記読み出された符号データが音声符号デー
タであると判別した場合は、上記合成部によってその音
声符号データを音声波形データへ復号化する一方、上記
読み出された符号データが上記素片の終端を示す符号デ
ータであると判別した場合は、」−記合成部によって上
記繰り返し数を示す符号データの内容が示す回数だけ同
じ素片の先頭の音声符号データに戻って上記素片再生動
作を繰り返すようになしたことを特徴としている。<Means for Solving the Problems> In order to achieve the above object, the present invention includes a storage unit that stores speech code data obtained by encoding a speech waveform for each waveform segment such as a pitch waveform segment; , in a speech synthesis method having a synthesis unit that generates a synthesized speech waveform by repeatedly reading and decoding the speech code data stored for each segment in the storage unit, each segment is Directly or immediately after the voice code data at the end of the segment, code data indicating the end of the segment and code data indicating the number of repetitions of the segment playback operation are successively added and stored in the storage unit; Each piece of code data stored in the storage section is read out one by one, and a piece end determination means determines whether the read code data is code data indicating the end of the piece or speech code data. If the segment end determining means determines that the read code data is voice code data, the synthesizer decodes the voice code data into voice waveform data, while decoding the read code data into voice waveform data. If it is determined that the encoded data is the code data indicating the end of the segment, the "-" synthesis unit repeats the code data at the beginning of the same segment the number of times indicated by the content of the code data indicating the number of repetitions. It is characterized in that it returns and repeats the above-mentioned segment reproduction operation.
また、この発明は、上記音声合成方式において、上記素
片が上記記憶部に格納される最終素片である場合は、上
記最終素片の終端の音声符号データの直前または直後に
、上記素片の終端を示す符号データと、繰り返し数を示
す符号データに変わる最終素片を示す符号データとを連
続して付加して上記記憶部に格納し、上記素片終端判別
手段が上記読み出された符号データが上記素片の終端を
示す符号データであると判別した場合に、次に読み出さ
れた符号データが上記最終素片を示す符号デ=7
上記記憶部に格納された符号データが順次1個ずつ読み
出される。そうすると、素片終端判別手段によって、上
記読み出された符号データが上記素片の終端を示す符号
データか音声符号データかが判別される。そして、その
結果上記読み出された符号データが音声符号データであ
ると判別された場合は、合成部によってその音声符号デ
ータが音声波形データへ復号化される一方、上記読み出
された符号データが上記素片の終端を示す符号データで
あると判別された場合は、上記合成部によって上記繰り
返し数を示す符号データの内容が示す回数だけ同じ素片
の先頭の音声符号データに戻って上記素片再生動作が繰
り返して実行される。Further, in the speech synthesis method, when the segment is the final segment stored in the storage unit, the segment is added to the segment immediately before or after the end speech code data of the final segment. Code data indicating the end of the segment and code data indicating the final segment that changes to code data indicating the number of repetitions are successively added and stored in the storage unit, and the segment end discriminating means reads the segment end. When it is determined that the code data is the code data indicating the end of the segment, the code data read next is code data indicating the final segment. They are read out one by one. Then, the segment end determining means determines whether the read code data is code data indicating the end of the segment or audio code data. As a result, if it is determined that the read code data is voice code data, the voice code data is decoded into voice waveform data by the synthesis unit, while the read code data is If it is determined that the code data indicates the end of the segment, the synthesizing unit returns to the speech code data at the beginning of the same segment the number of times indicated by the content of the code data indicating the number of repetitions, and returns to the speech code data at the beginning of the segment. The playback operation is executed repeatedly.
したがって、l素片に含まれる音声符号データの数を示
す符号データを用いなくても、上記素片単位で素片再生
動作を実行することができる。Therefore, even without using code data indicating the number of speech code data included in an element, the elemental piece reproduction operation can be performed on an elemental piece basis.
また、この発明の音声合成方法においては、上記素片が
上記記憶部に格納される最終素片である場合には、上記
最終素片の終端の音声符号データの直前または直後に、
上記素片の終端を示す符号−タか繰り返し数を示す符号
データかの判別を最終素片判別手段によって行い、上記
最終素片判別手段が、上記読み出された符号データが最
終素片を示す符号データであると判別した場合は、上記
合成部は上記素片再生動作を終了する一方、上記読み出
された符号データが上記繰り返し数を示す符号データで
あると判別した場合は、上記合成部によって上記繰り返
し数を示す符号データの内容が示す回数だけ同じ素片の
先頭の音声符号データに戻って上記素片再生動作を繰り
返すようになしたことを特徴としている。Further, in the speech synthesis method of the present invention, when the segment is the final segment stored in the storage section, immediately before or after the voice code data at the end of the final segment,
The final segment determining means determines whether the code data indicates the end of the segment or the code data indicating the number of repetitions, and the final segment discriminating means determines whether the read code data indicates the final segment. If it is determined that the read code data is code data, the synthesis unit ends the segment reproduction operation, while if it is determined that the read code data is code data indicating the number of repetitions, the synthesis unit The present invention is characterized in that the segment reproduction operation is repeated by returning to the first speech code data of the same segment as many times as indicated by the content of the code data indicating the number of repetitions.
く作用〉
この発明の音声合成方法においては、ピッチ波形素片等
の波形の素片における終端の音声符号データの直前また
は直後に、上記素片の終端を示す符号データと上記記憶
部に素片毎に格納された音声符号データを順次読み出し
て復号化する素片再生動作の繰り返し数を示す符号デー
タとを連続して付加して記憶部に格納される。Effects> In the speech synthesis method of the present invention, the code data indicating the end of the segment and the segment are stored in the storage section immediately before or after the voice code data at the end of the segment of the waveform such as the pitch waveform segment. The code data indicating the number of repetitions of the segment playback operation in which the stored voice code data is sequentially read and decoded is sequentially added and stored in the storage unit.
そして、上記素片再生動作を実行する際には、データと
、上記繰り返し数を示す符号データに変わる最終素片を
示す符号データとを連続して付加して記憶部に格納され
る。When performing the segment reproduction operation, data and code data indicating the final segment that changes to the code data indicating the number of repetitions are successively added and stored in the storage section.
上記素片再生動作を実行する際には、上記記憶部に格納
された符号データが順次1個ずつ読み出される。そして
、上記素片終端判別手段によって上記読み出された符号
データが上記素片の終端を示す符号データであると判別
された場合は、次に読み出された符号データが上記最終
素片を示す符号データか素片の終端を示す符号データか
の判別が最終素片判別手段によって判別される。When performing the segment reproduction operation, the code data stored in the storage section is sequentially read out one by one. If the segment end determination means determines that the read code data is code data indicating the end of the segment, the next read code data indicates the final segment. The final segment determining means determines whether the code data is the code data or the code data indicating the end of the segment.
その結果、上記読み出された符号データが上記最終素片
を示す符号データであると判別された場合は、上記合成
部によって上記素片再生動作が終了される。一方、上記
読み出された符号データが上記素片の終端を示す符号デ
ータであると判別された場合は、上記合成部によって上
記繰り返し数を示す符号データの内容が示す回数だけ同
じ素片の先頭の音声符号データに戻って上記素片再生動
作が繰り返して実行される。As a result, if it is determined that the read code data is code data indicating the final segment, the synthesis section ends the segment reproduction operation. On the other hand, if the read code data is determined to be the code data indicating the end of the segment, the synthesizing section repeats the start of the same segment the number of times indicated by the content of the code data indicating the number of repetitions. The voice code data is returned to and the above segment reproduction operation is repeated.
したがって、I素片に含まれる音声符号データの数を示
す符号データを用いなくても、上記素片単位で素片再生
動作を実行することができる。また、上記記憶部上に最
終素片を示す符号データのための領域を別に確保するこ
となく、再生された素片が最終素片であることを判別し
て」1記素片再生動作を終了することができる。Therefore, even without using code data indicating the number of speech code data included in an I segment, the segment reproduction operation can be performed on a segment-by-segment basis. In addition, without securing a separate area on the storage unit for code data indicating the final segment, it is determined that the reproduced segment is the final segment, and the 1 segment reproduction operation is terminated. can do.
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。<Example> Hereinafter, the present invention will be explained in detail with reference to illustrated embodiments.
第1図はこの発明に係る音声合成装置のブロック図であ
る。記憶部としてのROM(リード・オンリ・メモリ)
1はアナログの音声波形データを図示しない符号化器に
よってD P CM(差分パルス符号化)、ADPCM
(適応差分パルス符号化)等の波形符号化方式で符号化
して得られた音声符号データや補助情報等の符号データ
を格納し、アドレス・カウンタ2はROMIをアクセス
する際のアドレスを指示する。このアドレス・カウンタ
2はROMIから音声符号データが読み出されるごと−
I+
音声符号データCを各素片ごとにRQMIに格納する。FIG. 1 is a block diagram of a speech synthesis device according to the present invention. ROM (read-only memory) as a storage unit
1 converts analog audio waveform data into D PCM (differential pulse coding) and ADPCM by an encoder (not shown).
The address counter 2 stores coded data such as audio coded data and auxiliary information obtained by encoding using a waveform encoding method such as (adaptive differential pulse encoding), and the address counter 2 indicates an address when accessing the ROMI. This address counter 2 is set every time voice code data is read from ROMI.
I+ Voice code data C is stored in RQMI for each segment.
そして、各素片の最後の音声符号データC(1,n)、
・・・、C(L、m)の後に、素片の終端を示ず符号デ
ータEと素片再生の繰り返しを行う際の繰り返し数を示
す符号データRとを格納する。もし、素片再生を繰り返
さない場合には繰り返し数を示す符号データRの内容を
“0″にする。また、この素片がROMIに格納された
最後の素片である最終素片(L)である場合は、繰り返
し数を表す符号データRを格納する場所に最終素片(L
)を示す符号データREを格納する。ここで、素片の終
端を示す符号データE、繰り返し数を示ず符号データR
1最終素片(L)を示す符号データREおよび音声符号
データCは互いに異なる符号データでなければならない
。すなわち、例えば、上記各符号データE、R,REの
ビット長を4ビツトとすると、上記各符号データE、R
,REは0〜15の数字で表わすことができる。このう
ち、音声符号データCおよび繰り返し数を示す符号デー
タRに0−14を割り当て、素片の終端を示す符号デー
タEおよにアドレス・カウンタ自身の内容に“ビを加算
する。アドレス・スタック3は上記素片における先頭の
音声符号データが格納されているROMI上のアドレス
の値を格納する。このアドレスはアドレス・カウンタ2
から供給される。Then, the last speech code data C(1,n) of each segment,
. . . After C(L, m), code data E which does not indicate the end of the segment and code data R which indicates the number of repetitions when repeating the segment reproduction are stored. If segment reproduction is not repeated, the content of code data R indicating the number of repetitions is set to "0". In addition, if this elemental piece is the final elemental piece (L) that is the last elemental element stored in ROMI, the final elemental element (L) is stored in the location where code data R representing the number of repetitions is stored.
) is stored. Here, code data E indicating the end of the segment, code data R indicating the number of repetitions,
Code data RE and voice code data C indicating one final segment (L) must be different code data from each other. That is, for example, if the bit length of each of the code data E, R, and RE is 4 bits, then each of the code data E, R, and
, RE can be represented by numbers from 0 to 15. Of these, 0-14 is assigned to the voice code data C and the code data R indicating the number of repetitions, and "bi" is added to the code data E indicating the end of the segment and the contents of the address counter itself.Address stack 3 stores the value of the address on the ROMI where the first voice code data in the segment is stored.This address is stored in the address counter 2.
Supplied from.
繰り返し再生処理部4は素片再生を繰り返して行う際に
必要な判別処理や制御信号の出力を行う。The repetitive reproduction processing section 4 performs discrimination processing and outputs control signals necessary for repeatedly performing fragment reproduction.
復号化部5は入力された音声符号データを復号化してデ
ィジタルの合成音声波形データを出力する。The decoding unit 5 decodes the input voice code data and outputs digital synthesized voice waveform data.
D/A変換器6は入力されたディジタルの合成音声波形
データをD/A変換してアナログの音声波形データを出
力する。パラメータ・スタック7は素片の先頭の音声符
号データを復号化する際に必要なパラメータ類を記憶す
る。繰り返し数カウンタ8は素片再生時における同じ素
片の繰り返し数を格納し、同じ素片に基づく素片再生を
繰り返す毎に上記格納した繰り返し数を減算する。The D/A converter 6 performs D/A conversion on the input digital synthesized voice waveform data and outputs analog voice waveform data. The parameter stack 7 stores parameters necessary for decoding the audio code data at the beginning of a segment. The repetition number counter 8 stores the number of repetitions of the same elemental piece during elemental piece reproduction, and subtracts the stored repetition number each time elemental piece reproduction based on the same elemental piece is repeated.
第2図はROMIに格納される音声符号データ等の符号
データのフォーマットの一例を示す。図示しない符号化
器によって符号化されて得られたび最終素片を示す符号
データREに15を割り当てればよい。FIG. 2 shows an example of the format of code data such as voice code data stored in ROMI. It is sufficient to allocate 15 to code data RE indicating the final elemental piece obtained by encoding by an encoder (not shown).
ここで素片とは、繰り返し再生を行う場合には1ピッチ
周期の音声波形素片あるいはこれに準する音声波形素片
であり、繰り返し再生を行わない場合は繰り返し再生を
行う2つの素片間の音声波形素片である。Here, a segment is a speech waveform segment with one pitch period or a similar speech waveform segment when repeated playback is performed, and an interval between two segments that are repeatedly played back when repeated playback is not performed. This is a speech waveform segment.
第2図(a)のフォーマットで各符号データが格納され
ているROMIを有する上記構成の音声合成装置は、第
3図に示す素片再生動作のフローチャートに従って動作
する。以下、このフローチャートに従って素片再生動作
を詳細に説明する。The speech synthesis apparatus having the above configuration and having the ROMI in which each code data is stored in the format shown in FIG. 2(a) operates according to the flowchart of the segment playback operation shown in FIG. 3. Hereinafter, the segment reproduction operation will be explained in detail according to this flowchart.
ステップS1で、素片再生動作が開始されると各部の初
期化が次のように行われる。すなわち、アドレス・カウ
ンタ2およびアドレス・スタック3の内容は、先頭の素
片(1)の最初の音声符号データC(1,1)を格納し
ているROM1のアドレスに設定される。また、パラメ
ータ・スタック7の内容は、復号化部5内に格納されて
いる初期化されたパラメータ類と同じに設定される。さ
らに、繰り返し数カウンタ8の内容は“0”に設定され
る。In step S1, when the elemental piece reproduction operation is started, each part is initialized as follows. That is, the contents of the address counter 2 and the address stack 3 are set to the address of the ROM 1 storing the first voice code data C(1,1) of the first segment (1). Further, the contents of the parameter stack 7 are set to be the same as the initialized parameters stored in the decoding unit 5. Furthermore, the content of the repetition number counter 8 is set to "0".
ステップS2で、アドレス・カウンタ2が指示するRO
M+のアドレスに格納されている符号データが読み出さ
れて、繰り返し再生処理部4および復号化部5に出力さ
れる。そして、アドレス・カウンタ2の内容aに“ビが
加算されて、次にROM1から符号データを読み出す際
のアドレスに更新される。In step S2, the RO indicated by address counter 2
The encoded data stored at the address M+ is read out and output to the repetitive reproduction processing section 4 and the decoding section 5. Then, "bi" is added to the content a of the address counter 2, and the address is updated to the address for reading code data from the ROM 1 next time.
ステップS3で、入力された符号データが素片の終端を
示す符号データEであるか音声符号データCであるかが
繰り返し再生処理部4によって判別される。その結果、
素片の終端を示す符号データEの場合はステップS6に
進み、音声符号データCの場合はステップS4に進む。In step S3, the repetitive reproduction processing unit 4 determines whether the input code data is code data E indicating the end of a segment or voice code data C. the result,
In the case of code data E indicating the end of a segment, the process proceeds to step S6, and in the case of speech code data C, the process proceeds to step S4.
ステップS4で、上記ステップS2においてROM1か
ら読み込まれた符号データは音声符号データCであるの
で、この音声符号データCが復号化部5によって復号化
されてディジタルの合成音声波形データが得られる。In step S4, since the coded data read from the ROM 1 in step S2 is voice coded data C, this voice coded data C is decoded by the decoding section 5 to obtain digital synthesized voice waveform data.
ステップS5で、上記ステップS4において得ら込まれ
た符号データが最終素片(L)を示す符号データREで
あるか再生の繰り返し数を示す符号データREであるか
が判別される。その結果最終素片(L)を示す符号デー
タREであると判別された場合には素片再生動作を終了
し、そうでなければステップS8に進む。In step S5, it is determined whether the code data obtained in step S4 is code data RE indicating the final segment (L) or code data RE indicating the number of repetitions of reproduction. As a result, if it is determined that the code data RE indicates the final elemental piece (L), the elemental piece reproduction operation is ended; otherwise, the process advances to step S8.
ステップS8で、繰り返し数カウンタ8の内容rが“0
″であるか否かが判別される。その結果“θ″であれば
ステップS9に進み、そうでなければステップS12に
進む。In step S8, the content r of the repetition number counter 8 is “0”.
If the result is "θ", the process advances to step S9; otherwise, the process advances to step S12.
ステップS9で、上記ステップS6において読み込まれ
た繰り返し数を示す符号データRの内容が繰り返し数カ
ウンタ8にセットされる。In step S9, the content of the code data R indicating the number of repetitions read in step S6 is set in the repetition number counter 8.
ステップSIOで、繰り返し数カウンタ8の内容rがθ
″であるか否かが判別される。その結果“0″であれば
ステップSllに進んで次の素片に基づく素片再生の準
備に入る一方、そうでなければステップS14に進んで
同じ素片に基づく素片再生の繰り返しの準備に入る。In step SIO, the content r of the repetition number counter 8 is θ
If the result is "0", the process proceeds to step Sll and preparations are made to reproduce the next elemental piece, while if not, the process proceeds to step S14 and the same elemental piece is reproduced. Preparation begins for repeated fragment reproduction based on fragments.
ステップSLIで、ROM1の次の素片におけるれたデ
ジタルの合成音声波形データが、D/A変換器6によっ
てD/A変換されてアナログの合成音声波形が出力され
る。そして、ステップS2に戻り次のアドレスの音声符
号データの処理に入る。At step SLI, the digital synthesized speech waveform data in the next segment of the ROM 1 is D/A converted by the D/A converter 6, and an analog synthesized speech waveform is output. Then, the process returns to step S2 and begins processing the voice code data at the next address.
一方、ステップS3において、入力された符号データが
素片の終端を表す符号データEであると判別された場合
には、以下のステップ86〜ステツプS14の処理が繰
り返し再生処理部4によって実行される。On the other hand, if it is determined in step S3 that the input code data is code data E representing the end of the segment, the following processes from step 86 to step S14 are executed by the repeat reproduction processing unit 4. .
ステップS6で、次の符号データがROM1から読み込
まれる。この場合、読み込まれた符号データは素片の終
端を示す符号データEの次のアドレスから読み出された
符号データであるから、繰り返し数を示す符号データR
あるいは最終素片を示す符号データREである。そして
、アドレス・カウンタ2の内容aに“ビが加算される。In step S6, the next code data is read from ROM1. In this case, the read code data is the code data read from the address next to the code data E indicating the end of the segment, so the code data R indicating the number of repetitions
Alternatively, it is code data RE indicating the final elemental piece. Then, "bi" is added to the content a of the address counter 2.
そうすると、アドレス・カウンタ2の内容aは、次の素
片における先頭の音声符号データCのアドレスに更新さ
れる。Then, the content a of the address counter 2 is updated to the address of the first speech code data C in the next segment.
ステップS7で、上記ステップS6において読み先頭の
音声符号データCのアドレスを格納しているアドレス・
カウンタの内容aをアドレス・スタック3にセットする
。また、この場合復号化部5にも次の素片の先頭の音声
符号データCを復号化する際のパラメータ類が保持され
ている。そして、この復号化部5に保持されているパラ
メータ類の値piがパラメータ・スタック7にセットさ
れ、ステップS2へ戻る。In step S7, the address storing the address of the audio code data C at the beginning of the reading in step S6 is checked.
Set counter content a to address stack 3. Further, in this case, the decoding unit 5 also holds parameters for decoding the first speech code data C of the next segment. Then, the values pi of the parameters held in the decoding unit 5 are set in the parameter stack 7, and the process returns to step S2.
ステップS12で、繰り返し数カウンタ8の内容rから
“1”が減算される。In step S12, "1" is subtracted from the content r of the repetition number counter 8.
ステップS13で、繰り返し数カウンタ8の内容rがθ
″か否かが判別される。その結果“0″である場合はス
テップSllに進んで次の素片における素片再生の準備
に入り、そうでなければステップS14に進んで同じ素
片における素片再生の繰り返しの準備に入る。In step S13, the content r of the repetition number counter 8 is θ
If the result is "0", the process advances to step Sll to prepare for the reproduction of the next elemental piece; otherwise, the process advances to step S14 to reproduce the elemental element in the same elemental piece. Begins preparation for repeating one-sided playback.
ステップ814で、今回復号化が終了した素片における
先頭の音声符号データCのROM1上のアドレスを格納
しているアドレス・スタック3の内容a°がアドレス・
カウンタ2にセットされると共に、復号化部5のパラメ
ータ類piがパラメータ・スタック7の内容pi“に更
新される。In step 814, the contents a° of the address stack 3 storing the address on ROM 1 of the first speech code data C in the fragment that has just been decoded is the address.
The counter 2 is set, and the parameters pi of the decoding unit 5 are updated to the contents pi of the parameter stack 7.
こうすることにより、今回復号化が終了した素片の先頭
の音声符号データCを再度復号化することが可能になり
、同じ素片に基づく素片再生の繰り返しの準備が完了す
る。そして、ステップS2へ戻って同じ素片に基づいて
素片再生の繰り返しが実行される。By doing so, it becomes possible to decode again the speech code data C at the beginning of the segment for which decoding has just been completed, and preparations for repeating segment reproduction based on the same segment are completed. Then, the process returns to step S2, and repetition of elemental piece reproduction is performed based on the same elemental piece.
以下、素片再生動作をより具体的に説明する。The fragment reproduction operation will be explained in more detail below.
第5図(a)はROMIの内容の一例を示し、各符号デ
ータCには第2図(a)と同じ番号がついているものと
する。第5図(b)は第5図(a)に示すROM1の内
容に従ってD/A変換器6から出力される合成音声波形
を示す。FIG. 5(a) shows an example of the contents of the ROMI, and it is assumed that each code data C has the same number as in FIG. 2(a). FIG. 5(b) shows a synthesized speech waveform output from the D/A converter 6 according to the contents of the ROM 1 shown in FIG. 5(a).
素片再生動作が開始すると、第3図に示すステップS1
で、アドレス・レジスタ2の内容aが先頭素片(1)の
最初の符号データC(1,1)が格納されているROM
Iのアドレス″0″になる。さらに、繰り返し数カウン
タ8の内容rも“0”になる。そして、ステップ82〜
ステツプS5の処理を繰り返が実行されて行く。When the fragment reproduction operation starts, step S1 shown in FIG.
Then, the content a of address register 2 is a ROM in which the first code data C (1, 1) of the first segment (1) is stored.
The address of I becomes "0". Further, the content r of the repetition number counter 8 also becomes "0". Then, step 82~
The process of step S5 is repeated.
ステップ82〜ステツプS5を繰り返して素片(2)の
合成音声波形を生成している際に、ステ・ツブS3にお
いて素片(2)の終端を示す符号データEを検出すると
ステップS6に進み、ステ・ンプS6において再生の繰
り返し数を示す符号データR2(=2)を得る。そうす
ると、R3の値は“θ″でないので、ステップS9にお
いて繰り返し数カウンタ8にR2の値“2”がセットさ
れた後ステップS14に進む。そして、ステップS14
において、先に素片(2)の最初の音声符号データC(
2,1)のアドレス″X”になっているアドレス・スタ
ック3の内容が再度アドレス・カウンタ2にセットされ
る。While repeating steps 82 to S5 to generate the synthesized speech waveform of segment (2), if code data E indicating the end of segment (2) is detected in step S3, the process advances to step S6. At step S6, code data R2 (=2) indicating the number of reproduction repetitions is obtained. Then, since the value of R3 is not "θ", the value of R2 is set to "2" in the repetition number counter 8 in step S9, and then the process proceeds to step S14. Then, step S14
First, the first speech code data C(
The contents of the address stack 3, which is the address "X" of 2, 1), are set in the address counter 2 again.
さらに、素片(2)の先頭の音声符号データC(2゜l
)を復号化する際に使われる復号化部5のパラメータ類
p1がパラメータ・スタック7から転送される。そして
、ステップS2へ戻って、素片(2)の先頭の音声符号
データC(2,1)が読み出されて、再度素片(2)に
基づく素片再生動作が実行されて行く。Furthermore, the speech code data C (2゜l
) are transferred from the parameter stack 7. Then, the process returns to step S2, and the audio code data C(2,1) at the beginning of the segment (2) is read out, and the segment reproduction operation based on the segment (2) is performed again.
しながらROMIから先頭素片(1)の音声符号データ
Cを読み込んで合成音声波形を生成していく。At the same time, the speech code data C of the first segment (1) is read from the ROMI and a synthesized speech waveform is generated.
こうして、先頭素片(1)の最後の音声符号データC(
1,n)を復号化すると、ステップS2において素片の
終端を示す符号データEが読み出されて、ステップS3
を介してステップS6へ進むのである。In this way, the last speech code data C(
1, n), the code data E indicating the end of the segment is read out in step S2, and the code data E indicating the end of the segment is read out in step S3.
The process then proceeds to step S6.
ステップS6において再生の繰り返し数を示す符号デー
タR,(−“0”)を読み出すと、繰り返し数カウンタ
8の内容rが“0″となるから、ステップS7ステツプ
S8.ステップS9.ステップSIOを介してステップ
811に進む。そうすると、アドレス・カウンタ2の内
容aは、次の素片(2)の最初の音声符号データC(2
,1)を格納しているROM1のアドレス”x”になっ
ており、この値“x”がステップSllにおいてアドレ
ス・スタック3にセットされる。さらに、復号化部5が
素片(2)の先頭の音声符号データCを復号する際に用
いるパラメータ類plが、復号化部5からパラメータ・
スタック7に転送されてセントされる。そして、ステッ
プS2にへ戻って次の素片(2)に基づく素片再生動作
ステップ82〜ステツプS5を繰り返して、再度素片(
2)の合成音声波形を生成している際に、ステップS3
において素片(2)の終端を示す符号データEを検出す
るとステップS6に進み、ステップS7を介してステッ
プ8に進む。繰り返し数カウンタ8の内容rは“2”な
のでステップS12に進み、ステップS12において繰
り返し数カウンタ8の内容は“ビになる。したがって、
繰り返し数カウンタ8の内容は“0”ではないので、上
述と同様に、ステップS14において、素片(2)の先
頭の音声符号データC(2,1)を復号化する際のRO
MIのアドレス”x″がアドレス・カウンタ2に3度セ
ットされ、復号化部5のパラメータ類piが復号化部5
に3度セットされる。その後、ステップS2に進んで素
片(2)の先頭の音声符号データC(2,1)が読み出
され、3炭素片(2)に基づく素片再生動作が実行され
て行く。When the code data R, (-"0") indicating the number of reproduction repetitions is read out in step S6, the content r of the repetition number counter 8 becomes "0", so that the process proceeds to step S7 and step S8. Step S9. The process advances to step 811 via step SIO. Then, the content a of address counter 2 is the first speech code data C (2) of the next segment (2).
, 1), and this value "x" is set in the address stack 3 in step Sll. Further, the parameters pl used when the decoding unit 5 decodes the first speech code data C of the segment (2) are sent from the decoding unit 5 as parameters pl.
It is transferred to stack 7 and is cented. Then, the process returns to step S2 and repeats the fragment reproducing operation step 82 to step S5 based on the next fragment (2).
2) When generating the synthesized speech waveform, step S3
When code data E indicating the end of elemental piece (2) is detected at step S6, the process proceeds to step S7 and then to step 8. Since the content r of the repetition number counter 8 is "2", the process advances to step S12, and in step S12, the content of the repetition number counter 8 becomes "bi". Therefore,
Since the content of the repetition number counter 8 is not "0", similarly to the above, in step S14, the RO when decoding the speech code data C(2,1) at the beginning of the segment (2) is
The address “x” of MI is set in the address counter 2 three times, and the parameters pi of the decoding unit 5 are set in the address counter 2 three times.
is set three times. Thereafter, the process proceeds to step S2, where the audio code data C(2,1) at the beginning of the segment (2) is read out, and the segment reproduction operation based on the 3-carbon segment (2) is performed.
ステップ82〜ステツプS5を繰り返して、3炭素片(
2)の合成音声波形を生成している際に、ステップS3
において素片(2)の終端を示す符号デ−タEを検出す
るとステップS6に進み、さらに、ステップS7ステッ
プS8を介してステップSI2に進み繰り返し数カウン
タ8の内容rは“0”となり、素片(2)に基づく素片
再生動作の繰り返しが終了するのである。そして、ステ
ップ913からステップSllに進む。Steps 82 to S5 are repeated until the 3 carbon pieces (
2) When generating the synthesized speech waveform, step S3
When code data E indicating the end of elemental piece (2) is detected at step S6, the process proceeds to step SI2 via step S7 and step S8, and the content r of the repetition number counter 8 becomes "0", and the element The repetition of the elemental piece reproduction operation based on piece (2) ends. Then, the process advances from step 913 to step Sll.
そうすると、アドレス・レジスタ2の内容aは、次の素
片(3)の先頭の音声符号データC(3,1)を格納し
ているROMIのアドレス“y″になっており、この値
″y”がステップSllにおいてアドレス・スタック3
にセットされる。さらに、復号化部5が素片(3)の先
頭の音声符号データC(3,1)を復号する際に用いる
パラメータ類p1がパラメータ・スタック7にセットさ
れる。そして、ステップS2にへ戻って次の素片(3)
に基づく素片再生動作が実行されて行く。Then, the content a of the address register 2 becomes the address "y" of the ROMI that stores the first speech code data C (3, 1) of the next segment (3), and this value "y" ” is added to address stack 3 in step Sll.
is set to Further, parameters p1 used when the decoding unit 5 decodes the first speech code data C(3,1) of the segment (3) are set in the parameter stack 7. Then, return to step S2 and proceed to the next elemental piece (3)
The elemental piece reproduction operation based on the above is executed.
ステップ82〜ステツプS5を繰り返し、前の素片(2
)と同様にして素片(3)の合成音声波形を生成して行
く。その際に、ROMIに格納されている素片(3)に
おける再生の繰り返し数を示す符号(L、m)の復号化
が終了したと判断して素片再生動作を終了する。Steps 82 to S5 are repeated, and the previous fragment (2
), the synthesized speech waveform of segment (3) is generated. At this time, it is determined that the decoding of the code (L, m) indicating the number of reproduction repetitions in the segment (3) stored in the ROMI has been completed, and the segment reproduction operation is ended.
このようにして、第5図(a)のROMIの内容に基づ
いて素片再生動作が実行された結果、第5図(b)に示
すように、素片(1)に基づく合成音声波形に続いて素
片(2)に基づく合成音声波形が3回続き、さらに素片
(3)に基づ(合成音声波形が2回続く合成音声波形が
出力されるのである。In this way, as a result of executing the segment playback operation based on the contents of the ROMI shown in FIG. 5(a), as shown in FIG. 5(b), a synthesized speech waveform based on segment (1) is generated. Subsequently, a synthesized speech waveform based on segment (2) continues three times, and a synthesized speech waveform based on segment (3) (synthesized speech waveform continues twice) is then output.
上述のように、この発明の音声合成方式においては、音
声符号データCをROM1に格納する際に、各素片の終
端の音声符号データCの直後に、素片の終端を示す符号
データEおよび再生の繰り返し数を示す符号データRを
同一ビットで付加する。また、最終素片の終端の音声符
号データCの直後に、素片の終端を示す符号データEお
よび再生の繰り返し数を示す符号データRに変わる最終
素片を示す符号データREを同一ビットで付加する。そ
して、素片再生時においては、音声符号データCを順次
読み出して復号化処理を行い素片の終端を示す符号デー
タEを読み出した場合には、データR3は“1”である
から、素片(3)に基づく素片再生動作が1回繰り返さ
れることになる。そして、素片(3)に基づく合成音声
波形が2回出力されると、アドレス・レジスタ2の内容
aは、次の最終素片(L)の先頭の音声符号データC(
L、1)を格納しているROMIのアドレス“Z”にな
っており、この値“2”がステップSllにおいてアド
レス・スタック3にセットされる。さらに、復号化部5
が最終素片(L)の先頭の音声符号データC(L、1)
を復号する際に用いるパラメータ類piがパラメータ・
スタック7にセットされる。そして、ステップS2にへ
戻って次の最終素片(L)に基づく素片再生動作が実行
されて行く。As described above, in the speech synthesis method of the present invention, when the speech code data C is stored in the ROM 1, immediately after the speech code data C at the end of each segment, the code data E and the code data indicating the end of the segment are stored. Code data R indicating the number of reproduction repetitions is added using the same bits. Immediately after the audio code data C at the end of the final segment, code data RE indicating the final segment, which changes to code data E indicating the end of the segment and code data R indicating the number of repetitions of reproduction, is added in the same bit. do. Then, when playing a segment, when the audio code data C is sequentially read out and decoded, and the code data E indicating the end of the segment is read out, data R3 is "1", so the segment The segment reproduction operation based on (3) is repeated once. Then, when the synthesized speech waveform based on the segment (3) is output twice, the content a of the address register 2 becomes the speech code data C(
This is the address "Z" of the ROMI storing the data L, 1), and this value "2" is set in the address stack 3 in step Sll. Furthermore, the decoding unit 5
is the first speech code data C(L, 1) of the final segment (L)
The parameters pi used when decoding are the parameters
Set on stack 7. Then, the process returns to step S2, and an elemental piece reproduction operation based on the next final elemental piece (L) is executed.
こうして、ステップ82〜ステツプS5を繰り返して最
終素片(L)の合成音声波形を生成している際に、ステ
ップS3において最終素片(L)の終端を示す符号デー
タEを検出するとステップS6に進み、ステップS6に
おいて最終素片を示す符号データREを読み出す。そう
すると、ステップS7において最終素片(L)の最後の
音声符号データC次に読み出す繰り返し数を示す符号デ
ータRの内容に応じた回数だけ同じ素片に基づく素片再
生を繰り返す。一方、素片の終端を示す符号データEに
続く符号データが最終素片を示す符号データREの場合
には、素片再生動作を終了するようにしている。そのた
めに、l素片に含まれる音声符号データ数を示す情報を
用いなくても素片単位で素片再生を実行することができ
、l素片に含まれる音声符号データ数を示す符号データ
を記憶部に記憶する必要がない。したがって、記憶部に
おける補助情報のデータ量を少なくすることができる。In this way, when the synthesized speech waveform of the final segment (L) is generated by repeating steps 82 to S5, when code data E indicating the end of the final segment (L) is detected in step S3, the process proceeds to step S6. Then, in step S6, code data RE indicating the final elemental piece is read out. Then, in step S7, the segment reproduction based on the same segment is repeated a number of times according to the content of the code data R indicating the number of repetitions to be read next to the last audio code data C of the final segment (L). On the other hand, if the code data following the code data E indicating the end of a segment is the code data RE indicating the final segment, the segment reproduction operation is ended. Therefore, it is possible to perform segment-by-fragment playback without using information indicating the number of speech code data included in l segment, and code data indicating the number of speech code data included in l segment can be reproduced. There is no need to store it in the storage unit. Therefore, the amount of auxiliary information in the storage section can be reduced.
上記実施例の第3図のフローチャートにおいて、ステッ
プS14でアドレス・レジスタ2の内容aをアドレス・
スタック3に格納されている素片の最初の音声符号デー
タCのアドレスに更新して、次にステップS2において
このアドレスから音声符号データCを読み出して素片再
生を繰り返す際に次のような問題がある。すなわち、R
OM1のアクセス時間(ROMIのアドレスが確定して
からROMIのデータを出力するまでの時間)が長い場
合には、ステップS2において音声符号データCが読み
出されるまでしばらく待つ操作が必要となる。そこで、
次の実施例においては、このような操作を必要としない
ようにしている。In the flowchart of FIG. 3 of the above embodiment, the content a of the address register 2 is set to the address in step S14.
When updating the address of the first voice code data C of the segment stored in the stack 3, and then reading the voice code data C from this address in step S2 and repeating the segment playback, the following problem occurs. There is. That is, R
If the access time of OM1 (the time from when the ROMI address is determined to when the ROMI data is output) is long, it is necessary to wait for a while until the voice code data C is read out in step S2. Therefore,
In the following embodiment, such an operation is not required.
この実施例においては、ROMIのフォーマットを第2
図(b)に示すように、最終素片(L)以外の素片の終
端を示す符号データEと再生の繰り返し数を示す符号デ
ータRとを、最後の音声符号データC(+、n)、・・
の直前に付加する。そして、第3図のフローチャートの
ステップS8以降を第4図に示すようにするのである。In this embodiment, the ROMI format is
As shown in Figure (b), the code data E indicating the end of the segment other than the final segment (L) and the code data R indicating the number of repetitions of reproduction are converted into the last audio code data C(+,n). ,...
Add immediately before. Then, the steps after step S8 in the flowchart of FIG. 3 are performed as shown in FIG.
すなわち、ステップS29で、上記ステップS6におい
て読み込まれた繰り返し数を示す符号データRの内容が
繰り返し数カウンタ8にセットされる。That is, in step S29, the content of the code data R indicating the number of repetitions read in step S6 is set in the repetition number counter 8.
ステップS30で、繰り返し数カウンタ8の内容rが0
”であるか否かが判別される。その結果″0”であれば
ステップS31に進んで次の素片に基づく素片再生動作
の準備に入り、そうでなければステップS37に進んで
同じ素片に基づく素片再生の繰り換器6によってD/A
変換されてアナログの合成音声波形が出力される。そし
て、ステップS2に戻り次のアドレスの音声符号データ
の処理に入る。In step S30, the content r of the repetition number counter 8 is 0.
If the result is "0", the process advances to step S31 to prepare for the next elemental piece reproduction operation; otherwise, the process advances to step S37 to reproduce the same elemental element. D/A by the repeater 6 of fragment-based fragment reproduction
After conversion, an analog synthesized speech waveform is output. Then, the process returns to step S2 and begins processing the voice code data at the next address.
ステップS35で、繰り返し数カウンタ8の内容rが“
1″だけ減算される。In step S35, the content r of the repetition number counter 8 is “
1″ is subtracted.
ステップ836で、繰り返し数カウンタ8の内容rが“
0″か否かが判別される。その結果“0”であればステ
ップS31に進んで次の素片における素片再生の準備に
入り、そうでなければステップS37に進んで同じ素片
に基づく素片再生の繰り返しの準備に入る。At step 836, the content r of the repetition number counter 8 is “
0". If the result is "0", the process advances to step S31 and preparations are made for the reproduction of the next elemental piece; if not, the process advances to step S37 and the reproduction is based on the same elemental piece. Begins preparation for repeating fragment playback.
ステップS37で、現在の素片における最後の音声符号
データCが読み出され、前回復号化が終了した素片にお
ける先頭の音声符号データCのROM1上のアドレスを
格納しているアドレス・スタック3の内容a゛がアドレ
ス・カウンタ2にセットされる。In step S37, the last speech code data C in the current segment is read out, and the address stack 3 stores the address on ROM 1 of the first speech code data C in the segment for which the previous decoding has been completed. The contents a' are set in address counter 2.
ステップ82Bで、上記ステップS37においてROM
1から読み込まれた最後の音声符号データCが復号化部
5によって復号化されてディジタルの返しの準備に入る
。In step 82B, the ROM is
The last audio coded data C read from 1 is decoded by the decoding section 5, and preparations are made for digital return.
ステップS31で、現在の素片における最後の音声符号
データCが読み出されて、アドレス・カウンタ2の内容
aに“ビが加算される。そうすると、アドレス・カウン
タ2の内容aは、次の素片における先頭の音声符号デー
タCのアドレスに更新される。In step S31, the last speech code data C in the current element is read out, and "bi" is added to the content a of the address counter 2. Then, the content a of the address counter 2 becomes the next element. It is updated to the address of the first voice code data C in the piece.
ステップ832で、上記ステップS31においてROM
1から読み出された最後の音声符号データCが復号化部
5によって復号化されてディジタルの合成音声波形デー
タが得られる。In step 832, the ROM in step S31 above is
The last voice code data C read out from 1 is decoded by the decoding section 5 to obtain digital synthesized voice waveform data.
ステップS33で、次の素片における先頭の音声符号デ
ータCのROMI上のアドレスを格納しているアドレス
・カウンタの内容aをアドレス・スタック3にセットす
る。また、復号化部5に保持されている次の素片の先頭
の音声符号データを復号化する際のパラメータ類の値p
iがパラメータ・スタック7にセットされる。In step S33, the contents a of the address counter storing the address on the ROMI of the first audio code data C in the next segment are set in the address stack 3. Also, the value p of parameters when decoding the first speech code data of the next segment held in the decoding unit 5
i is set in parameter stack 7.
ステップ834で、上記ステップS32において得られ
たデジタルの合成音声波形データがD/A変合成音声波
形データが得られる。In step 834, the digital synthesized speech waveform data obtained in step S32 is converted into D/A synthesized speech waveform data.
ステップS39で、復号化部5のパラメータ類piがパ
ラメータ・スタック7の内容pi゛に更新される。In step S39, the parameters pi of the decoding unit 5 are updated to the contents pi of the parameter stack 7.
こうすることにより、前回復号化が終了した素片の先頭
の音声符号データCを再度復号化することが可能になり
、同じ素片に基づく素片再生の繰り返しの準備が完了す
る。By doing this, it becomes possible to decode again the speech code data C at the head of the segment for which the previous decoding has been completed, and preparations for repeating segment reproduction based on the same segment are completed.
ステップS40で、上記ステップ838において得られ
たデジタルの合成音声波形データがD/A変換器6によ
ってD/A変換されてアナログの合成音声波形が出力さ
れる。そして、ステップS2に戻り次のアドレスの音声
符号データCの処理に入る。In step S40, the digital synthesized speech waveform data obtained in step 838 is D/A converted by the D/A converter 6, and an analog synthesized speech waveform is output. Then, the process returns to step S2 and starts processing the voice code data C at the next address.
すなわち、この実施例においては、素片再生を繰り返す
際には、ステップS37においてアドレス・カウンタ2
にアドレス・スタック3の内容a°をセットした後、ス
テップ938において復号化処理を行い、ステップS3
9において復号化部5のパラメータ類piにパラメータ
・スタック7の内容pi°をセットし、ステップS40
においてD/A変換処理を行った後に、ステップS2に
おいて上記ステップS37でアドレス・カウンタ2にセ
ットしたr’tOM+のアドレスから音声符号データC
を読み出すようにしている。したがって、アドレス・カ
ウンタ2にアドレス・スタック3の内容a”をセットし
てから、そのアドレス・カウンタ2の内容aで示される
アドレスから音声符号データCが読み出されるまで十分
な時間がある。そのために、ROM1のアクセス時間が
長くてもステップS2における符号データ読み出しを待
つ操作が不用となるのである。That is, in this embodiment, when repeating elemental piece reproduction, the address counter 2 is set in step S37.
After setting the content a° of address stack 3 to , decoding processing is performed in step 938, and step S3
9, the contents pi° of the parameter stack 7 are set to the parameters pi of the decoding unit 5, and step S40
After performing D/A conversion processing in step S2, voice code data C is obtained from the address r'tOM+ set in the address counter 2 in step S37.
I am trying to read out the . Therefore, there is sufficient time after the address counter 2 is set to the contents a'' of the address stack 3 until the audio code data C is read from the address indicated by the contents a of the address counter 2. , even if the access time to ROM1 is long, the operation of waiting for readout of code data in step S2 is unnecessary.
〈発明の効果〉
以上より明らかなように、この発明の音声合成方式は、
各素片の終端の音声符号データの直前または直後に、上
記素片の終端を示す符号データと素片再生動作の繰り返
し数を示す符号データとを連続して付加して記憶部に記
憶し、上記記憶部から読み出した符号データが音声符号
データである場合にはその音声符号データを復号化する
一方、上記素片の終端を示す符号データである場合には
同じ素片に基づいて再生動作を繰り返すようにし第1図
はこの発明に係る音声合成装置のブロック図、第2図(
a)および第2図(b)は第1図にお(プるROMに格
納される符号データの)A−マットの例を示す図、第3
図は第2図(a)のフォーマットで符号データが格納さ
れているROMを用いた場合の素片再生動作のフローチ
ャート、第4図は第2図(b)のフォーマットで符号デ
ータが格納されているROMを用いた場合にお(づる第
3図のフーヂャートのステップS8以降のフローチャー
1・、第5図(a)はROMの内容の一例を示す図、第
5図(b)は第5図(a)に示すROMの内容に従って
素片再生動作を行って得られた合成音声波形を示す図で
ある。<Effects of the Invention> As is clear from the above, the speech synthesis method of the present invention has the following effects:
Immediately or immediately after the audio code data at the end of each segment, code data indicating the end of the segment and code data indicating the number of repetitions of the segment playback operation are successively added and stored in a storage unit; If the coded data read from the storage unit is audio coded data, the audio coded data is decoded, while if it is coded data indicating the end of the segment, playback operation is performed based on the same segment. As will be repeated, Fig. 1 is a block diagram of a speech synthesis device according to the present invention, and Fig. 2 (
a) and FIG. 2(b) are diagrams showing an example of the A-mat (of code data stored in the ROM) shown in FIG. 1, and FIG.
The figure is a flowchart of the segment playback operation when using a ROM in which encoded data is stored in the format of Figure 2(a), and Figure 4 is a flowchart of the segment reproduction operation when encoded data is stored in the format of Figure 2(b). When using a ROM with FIG. 6 is a diagram showing a synthesized speech waveform obtained by performing a segment playback operation according to the contents of the ROM shown in FIG.
1−ROM、 2・・・アドレス・カウンタ、
3− アドレス・スタック、
4・繰り返し再生処理部、5・復号化部、6 ・D/A
変換器、 7・パラメータ・スタック、8・・繰り返
し数カウンタ。1-ROM, 2...address counter,
3-Address stack, 4.Repetitive playback processing section, 5.Decoding section, 6.D/A
Converter, 7. Parameter stack, 8. Repeat number counter.
特許出願人 シャープ株式会社
代理人 弁理士 青 山 葆 ほか1名たので、
1素片に含まれる音声符号データの数を示す符号データ
を用いることなく素片単位で素片再生動作を実行するこ
とができる。したがって、上記記憶部における補助情報
のデータ量を少なくすることができる。Patent applicant Sharp Co., Ltd. agent Patent attorney Aoyama Aoyama and one other person,
It is possible to perform an elemental piece reproduction operation on an elemental piece basis without using code data indicating the number of audio code data included in one elemental piece. Therefore, the amount of auxiliary information in the storage section can be reduced.
また、この発明の音声合成方式は、上記素片が最終素片
である場合には、その最終素片の終端の音声符号データ
の直前または直後に、上記素片の終端を示す符号データ
と、上記繰り返し数を示す符号データに変わる最終素片
を示す符号データとを連続して付加して記憶部に記憶し
、上記記憶部から読み出した符号データが上記素片の終
端′を示ず符号データであり、次に読み出した符号デー
タが上記最終素片を示す符号データである場合には素片
再生動作を終了するようにしたので、記憶部に最終素片
を示す符号データを記憶するための領域を別に確保する
必要がないので、さらに、上記記憶部におけるデータ量
を少なくすることができる。Furthermore, in the speech synthesis method of the present invention, when the segment is a final segment, code data indicating the end of the segment is added immediately before or after the speech code data at the end of the final segment; Code data indicating the final segment to be changed to the code data indicating the number of repetitions are successively added and stored in the storage unit, and the code data read from the storage unit does not indicate the end of the segment. If the next read code data is the code data indicating the final segment, the segment reproduction operation is terminated. Therefore, the code data indicating the final segment is stored in the storage section. Since there is no need to secure a separate area, the amount of data in the storage section can be further reduced.
Claims (2)
ピッチ波形素片等の波形の素片毎に格納する記憶部と、
上記記憶部に素片毎に格納された音声符号データを順次
読み出して復号化する素片再生動作を繰り返して行うこ
とによって合成音声波形を生成する合成部を有する音声
合成方式において、 各素片の終端の音声符号データの直前または直後に、上
記素片の終端を示す符号データと上記素片再生動作の繰
り返し数を示す符号データとを連続して付加して上記記
憶部に格納し、 上記記憶部に格納された各符号データを順次1個ずつ読
み出して、この読み出された符号データが上記素片の終
端を示す符号データか音声符号データかの判別を素片終
端判別手段によって行い、上記素片終端判別手段が、上
記読み出された符号データが音声符号データであると判
別した場合は、上記合成部によってその音声符号データ
を音声波形データへ復号化する一方、上記読み出された
符号データが上記素片の終端を示す符号データであると
判別した場合は、上記合成部によって上記繰り返し数を
示す符号データの内容が示す回数だけ同じ素片の先頭の
音声符号データに戻って上記素片再生動作を繰り返すよ
うに成したことを特徴とする音声合成方式。(1) a storage unit that stores voice code data obtained by encoding a voice waveform for each waveform element such as a pitch waveform element;
In a speech synthesis method having a synthesis unit that generates a synthesized speech waveform by repeatedly reading and decoding the speech code data stored for each segment in the storage unit, immediately before or after the end speech code data, code data indicating the end of the segment and code data indicating the number of repetitions of the segment playback operation are successively added and stored in the storage unit; Each piece of code data stored in the segment is read out one by one, and the segment end discriminating means determines whether the read code data is code data indicating the end of the segment or audio code data, and When the segment end determination means determines that the read code data is voice code data, the synthesizer decodes the voice code data into voice waveform data, while decoding the read code data. If it is determined that the data is code data indicating the end of the segment, the synthesizing unit returns to the speech code data at the beginning of the same segment the number of times indicated by the content of the code data indicating the number of repetitions. A speech synthesis method characterized by repeating one-sided playback operations.
素片が上記記憶部に格納される最終素片である場合は、
上記最終素片の終端の音声符号データの直前または直後
に、上記素片の終端を示す符号データと、繰り返し数を
示す符号データに変わる最終素片を示す符号データとを
連続して付加して上記記憶部に格納し、 上記素片終端判別手段が上記読み出された符号データが
上記素片の終端を示す符号データであると判別した場合
に、次に読み出された符号データが上記最終素片を示す
符号データか繰り返し数を示す符号データかの判別を最
終素片判別手段によって行い、 上記最終素片判別手段が、上記読み出された符号データ
が最終素片を示す符号データであると判別した場合は、
上記合成部は上記素片再生動作を終了する一方、上記読
み出された符号データが上記繰り返し数を示す符号デー
タであると判別した場合は、上記合成部によって上記繰
り返し数を示す符号データの内容が示す回数だけ同じ素
片の先頭の音声符号データに戻って上記素片再生動作を
繰り返すように成したことを特徴とする音声合成方式。(2) In the speech synthesis method according to claim 1, if the segment is the final segment stored in the storage unit,
Immediately or immediately after the audio code data at the end of the final segment, code data indicating the end of the segment and code data indicating the final segment that changes to code data indicating the number of repetitions are successively added. When the segment end determination means determines that the read code data is code data indicating the end of the segment, the next read code data is stored in the segment end discriminating unit. A final segment discriminating means determines whether the coded data indicates a segment or the number of repetitions, and the final segment discriminating means determines that the read coded data is coded data indicating a final segment. If it is determined that
The synthesizing section ends the segment reproduction operation, and if the read code data is determined to be the code data indicating the repetition number, the synthesis section causes the content of the code data indicating the repetition number. A speech synthesis method characterized in that the above-mentioned segment reproduction operation is repeated by returning to the first speech code data of the same segment a number of times indicated by .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63331744A JPH02176797A (en) | 1988-12-28 | 1988-12-28 | Speech synthesis system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63331744A JPH02176797A (en) | 1988-12-28 | 1988-12-28 | Speech synthesis system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02176797A true JPH02176797A (en) | 1990-07-09 |
Family
ID=18247128
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63331744A Pending JPH02176797A (en) | 1988-12-28 | 1988-12-28 | Speech synthesis system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02176797A (en) |
-
1988
- 1988-12-28 JP JP63331744A patent/JPH02176797A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20030009246A1 (en) | Trick play for MP3 | |
| US8010374B2 (en) | Audio coding apparatus and audio decoding apparatus | |
| US4890326A (en) | Method for compressing data | |
| US5206851A (en) | Cross interleaving circuit | |
| US5886277A (en) | Electronic musical instrument | |
| JPH02176797A (en) | Speech synthesis system | |
| JPH10222197A (en) | Voice synthesizing method and code exciting linear prediction synthesizing device | |
| US6373421B2 (en) | Voice recording/reproducing device by using adaptive differential pulse code modulation method | |
| JPH02146599A (en) | Sound source data compressing and encoding method | |
| JP2712421B2 (en) | Sound source device | |
| JPS62994A (en) | Pcm voice signal memory | |
| JP3236758B2 (en) | CRC arithmetic unit for variable length data | |
| JPS60119672A (en) | Read device of musical instrument code | |
| JP3351543B2 (en) | Signal processing method | |
| JPH01197793A (en) | Speech synthesizer | |
| JP2671456B2 (en) | Sound source device | |
| JPS6212519B2 (en) | ||
| JP3035948B2 (en) | Audio data playback method | |
| JPH01239599A (en) | Voice synthesis system | |
| JPS5837697A (en) | Voice memory reproducer | |
| JPS6017798A (en) | speech synthesizer | |
| JPH0449956B2 (en) | ||
| JPH02156298A (en) | System and device for silent compression of voice | |
| JPH02137893A (en) | Continuous sound source data reproducing device | |
| JPH0449957B2 (en) |