JPH11231885A - Speech synthesizing device - Google Patents
Speech synthesizing deviceInfo
- Publication number
- JPH11231885A JPH11231885A JP10037421A JP3742198A JPH11231885A JP H11231885 A JPH11231885 A JP H11231885A JP 10037421 A JP10037421 A JP 10037421A JP 3742198 A JP3742198 A JP 3742198A JP H11231885 A JPH11231885 A JP H11231885A
- Authority
- JP
- Japan
- Prior art keywords
- important part
- prosody
- unit
- text
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 9
- 230000002996 emotional effect Effects 0.000 claims abstract description 34
- 230000008451 emotion Effects 0.000 claims description 16
- 230000033764 rhythmic process Effects 0.000 abstract 4
- 238000010586 diagram Methods 0.000 description 24
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明はテキスト文を音声に
合成して読み上げる音声合成装置に関し、特に読み上げ
る音声合成音に読み上げの速度、強弱、感情的な調子を
付加することによって受聴者に読み上げ内容の理解の補
助を行うことができる装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech synthesizing apparatus for synthesizing a text sentence into a voice and reading it out. The present invention relates to a device capable of assisting the understanding of the device.
【0002】[0002]
【従来の技術】従来の音声合成装置では、テキスト文は
言語解釈されてテキスト文の「べた文」が各種の品詞の
単語に解釈され、音素記号と韻律記号とからなる発音記
号列に変換される。次に、この発音記号列に対して、各
音素の継続時間長、ピッチパターン、ポーズ長、イント
ネーションなどの韻律処理が行われる。例えば、音素を
合成単位として音声波形素片を接続して合成音声が合成
される。2. Description of the Related Art In a conventional speech synthesizer, a text sentence is linguistically interpreted, and the "solid sentence" of the text sentence is interpreted into words of various parts of speech, and is converted into a phonetic symbol sequence comprising phoneme symbols and prosodic symbols. You. Next, prosody processing such as a duration time of each phoneme, a pitch pattern, a pause length, and intonation is performed on the phonetic symbol string. For example, synthesized speech is synthesized by connecting speech waveform segments using phonemes as synthesis units.
【0003】このような音声合成装置が機器全般の分野
に利用され、例えば、データ送信を行うサービス局との
通信に利用される。[0003] Such a speech synthesizer is used in the field of general equipment, for example, for communication with a service station that performs data transmission.
【0004】[0004]
【発明が解決しようとする課題】ところで、近年、多種
多様なデータを送信するサービス局が増大している。一
方、この情報を受け手として、例えば自動車では、運転
中であればその情報を画面表示としているが常に見るこ
とはできないことから、主に音声合成に頼って聞くこと
になる。In recent years, the number of service stations for transmitting various types of data has been increasing. On the other hand, as a recipient of this information, for example, in a car, while driving, the information is displayed on the screen, but cannot be viewed at all times.
【0005】従来の音声合成装置では、読み上げる音声
には、聞きづらくならないように、前述の如く、アクセ
ント、イントネーション等が付いているが、特に雑音が
多い自動車内でこの情報が重要なものかどうかは受聴者
が良く注意して聞かなければ分からないという問題があ
る。また、テキスト文中に、特に、感嘆符「!」、疑問
符「?」がある場合には、感情表現が行われるが、他に
はこのような感情表現が無く、読み上げられる音声は全
般的に感情表現に乏しいという問題がある。[0005] In the conventional speech synthesizer, the speech to be read out is provided with accents and intonations as described above so as to make it difficult to hear. There is a problem that the listener cannot understand unless he listens carefully. In addition, when there is an exclamation point “!” Or a question mark “?” In a text sentence, an emotional expression is performed. However, there is no other emotional expression, and the voice read out is generally emotional. There is a problem that expression is poor.
【0006】したがって、本発明は、上記問題点に鑑
み、受聴者に注意を促し且つ感情表現に富む読み上げを
行うことができる音声合成装置を提供することを目的と
する。SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a speech synthesizer that can draw attention to a listener and can read aloud with an emotional expression.
【0007】[0007]
【課題を解決するための手段】本発明は、前記問題点を
解決するために、テキストが単語として言語解析され、
単語の読みに韻律が生成され且つテキストに対して音声
波形が生成されて音声を合成する音声合成装置におい
て、言語解析されたテキスト中の重要部分を指定する重
要部分指定部と、前記重要部分指定部により指定された
重要部分に対して、テキスト中の前記重要部分以外の他
の部分と異ならせる韻律を形成する重要部分韻律部と、
前記重要部分に対して音声波形を生成する重要部分生成
部とを備えることを特徴とする音声合成装置を提供す
る。この手段により、重要部分として、主語・述語、数
字、固有名詞が他のテキストの部分に対してゆっくりと
した音声、又は大きな音声で読み上げられるので、受聴
者が聞き取りやすい音声を合成することが可能になる。According to the present invention, in order to solve the above-mentioned problems, text is linguistically analyzed as words.
In a speech synthesizer for generating a prosody for reading a word and generating a speech waveform for a text to synthesize a speech, an important part designating unit for designating an important part in a linguistically analyzed text; An important part prosody part that forms a prosody that makes the important part specified by the part different from other parts other than the important part in the text;
An important part generation unit that generates a voice waveform for the important part is provided. By this means, subjects, predicates, numbers, and proper nouns are read out in slow or loud voice relative to other text parts as important parts, making it possible to synthesize speech that is easy for listeners to hear become.
【0008】さらに、テキストの言語解析に使用する通
常の単語辞書部に対して感情表現に富む単語を格納する
感情用単語辞書部と、前記通常の単語辞書部の格納され
る単語の音声波形に対してピッチを変更した音声波形を
格納する感情用波形辞書部とを備え、前記重要部分指定
部は前記感情用単語辞書部を用いてテキスト中の重要部
分を指定し、前記重要部分韻律部は前記重要部分指定部
により指定された重要部分にピッチを変更して感情表現
の韻律を形成し、前記重要部分音声生成部は前記感情用
波形辞書部を用いて重要部分の音声波形を生成すること
を特徴とする。この手段により、明るい感情表現に対し
てピッチが高い音声、暗い感情表現に対してはピッチが
低い音声で合成されるので、受聴者は感情に富んだ読み
上げを聞くことが可能になる。[0008] Further, an emotion word dictionary for storing words rich in emotional expression with respect to a normal word dictionary used for language analysis of text, and a speech waveform of a word stored in the normal word dictionary. An emotional waveform dictionary for storing a voice waveform whose pitch has been changed, wherein the important part designating part specifies an important part in a text using the emotional word dictionary, and the important part prosody is Changing the pitch to the important part specified by the important part designating unit to form a prosody of the emotional expression, and the important part speech generating unit using the emotional waveform dictionary unit to generate a speech waveform of the important part. It is characterized by. By this means, a voice with a high pitch is synthesized with a bright emotional expression and a voice with a low pitch is mixed with a dark emotional expression, so that the listener can hear the emotionally rich reading.
【0009】[0009]
【発明の実施の形態】以下本発明の実施の形態について
図面を参照して説明する。図1は本発明に係る音声合成
装置を有しサービス局から音声合成の入力テキストを受
信する受信機を示す図である。本図に示す如く、受信機
は、音声信号を受信するアンテナ200と、受信信号を
音声に処理する受信部201と、音声信号を音声に変換
するスピーカ203とが設けられる。さらに、この受信
機は、音声信号以外に、サービス局から多種多様のデー
タを受信し、受信部201でデータを抽出してこれをテ
キスト文として入力する音声合成装置100を具備し、
音声合成装置100の合成音声は加算部202を経由し
てスピーカ203から出力される。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing a receiver having a speech synthesizer according to the present invention and receiving an input text for speech synthesis from a service station. As shown in the figure, the receiver is provided with an antenna 200 for receiving an audio signal, a receiving unit 201 for processing the received signal into audio, and a speaker 203 for converting the audio signal into audio. The receiver further includes a speech synthesizer 100 that receives various kinds of data from the service station in addition to the speech signal, extracts the data by the receiving unit 201, and inputs the data as a text sentence,
The synthesized speech of the speech synthesis device 100 is output from the speaker 203 via the adding unit 202.
【0010】図2は図1の音声合成装置100を説明す
る図である。本図に示す音声合成装置100は、テキス
ト文を入力するテキスト解析処理部1を具備し、テキス
ト解析処理部1は単語辞書部2を有する。単語辞書部2
は、名詞、動詞、助詞、数詞等の品詞を区別した多数の
単語と、この単語の読みとアクセント等とを格納してい
る。名詞には固有名詞も多数含まれる。ここに単語の読
みは、例えば、カタカナ(平仮名でもよい)の一文字に
相当するモーラで表され、1つのモーラは音素である子
音と母音とからなる。FIG. 2 is a diagram for explaining the speech synthesizer 100 of FIG. The speech synthesis apparatus 100 shown in FIG. 1 includes a text analysis processing unit 1 for inputting a text sentence, and the text analysis processing unit 1 includes a word dictionary unit 2. Word dictionary part 2
Stores a number of words that distinguish parts of speech, such as nouns, verbs, particles, and numbers, and readings and accents of the words. Nouns include many proper nouns. Here, the reading of a word is represented, for example, by a mora corresponding to one character of katakana (or hiragana), and one mora is composed of a consonant which is a phoneme and a vowel.
【0011】テキスト解析処理部1は、単語辞書部2を
用いて、入力される「べた文」のテキスト文を、単語に
区分して各単語に読みとアクセントを付けた発音記号列
に変換する。音声合成装置100はさらにテキスト解析
処理部1から発音記号列を入力する韻律制御処理部3を
具備し、韻律制御処理部3は発音記号列を音韻系列と
し、且つ音韻系列に対して各音素の継続時間長、ピッチ
パターン、ポーズ長、アクセント、イントネーション、
振幅などの韻律系列を形成する。The text analysis processing section 1 uses the word dictionary section 2 to convert an input "solid sentence" text sentence into words and converts them into phonetic symbol strings in which each word is read and accented. . The speech synthesizer 100 further includes a prosody control processing unit 3 for inputting a phonetic symbol sequence from the text analysis processing unit 1. The prosody control processing unit 3 converts the phonetic symbol sequence into a phoneme sequence, and generates a phoneme sequence for each phoneme. Duration, pitch pattern, pose length, accent, intonation,
Form a prosodic sequence such as amplitude.
【0012】音声合成装置100はさらに音声生成処理
部4を具備し、音声生成処理部4は波形辞書部5を具備
する。波形辞書部5は音素長程度の音声波形を大量に用
意し音素のピッチ、振幅、継続時間長などの情報と共に
音声波形素片として格納される。音声生成処理部4は音
韻系列及び韻律系列から音声波形素片を波形辞書部5か
ら選択して、接続して合成音声を形成する。なお、波形
辞書部5には通常の波形辞書部5A、重要部分用波形辞
書部5B、5Cが設けられる。重要部分用波形辞書部5
Bは通常の波形辞書部5Aに対して音声波形素片の継続
時間長が大きいものが格納される。重要部分用波形辞書
部5Cは通常の波形辞書部5Aに対して音声波形素片の
振幅が大きいものが格納される。The speech synthesizer 100 further includes a speech generation processing unit 4, and the speech generation processing unit 4 includes a waveform dictionary unit 5. The waveform dictionary unit 5 prepares a large amount of speech waveforms of about the phoneme length and stores them as speech waveform segments together with information such as the pitch, amplitude, and duration of phonemes. The speech generation processing unit 4 selects speech waveform segments from the phonetic sequence and the prosodic sequence from the waveform dictionary unit 5 and connects them to form a synthesized speech. The waveform dictionary unit 5 is provided with a normal waveform dictionary unit 5A and important part waveform dictionary units 5B and 5C. Important part waveform dictionary 5
B stores a speech waveform segment having a longer duration time than the normal waveform dictionary unit 5A. The important part waveform dictionary unit 5C stores a voice waveform unit whose amplitude is larger than that of the normal waveform dictionary unit 5A.
【0013】さらに、テキスト解析処理部1は入力され
るテキスト中の重要部分を指定する重要部分指定部11
を具備する。重要部分指定部11は重要部分としてテキ
スト中の、例えば、『主語・述語』、『数字』、『固有
名詞』を指定する。韻律制御処理部3は重要部分指定部
11により指定された重要部分について特有の韻律を付
加する重要部分韻律部12を具備する。重要部分韻律部
12は、韻律の指定として、例えば、重要部分のみを
『ゆっくり』又は『大きく』読み上げる韻律を指定す
る。The text analysis processing unit 1 further includes an important part designating unit 11 for designating an important part in the input text.
Is provided. The important part designation unit 11 designates, for example, "subject / predicate", "number", and "proper noun" in the text as important parts. The prosody control processing unit 3 includes an important part prosody part 12 for adding a specific prosody to the important part specified by the important part specification part 11. The important part prosody part 12 specifies, for example, a prosody in which only the important part is read “slowly” or “largely”.
【0014】音声合成装置100は重要部分指定部11
及び重要部分韻律部12の操作を外部から行う表示操作
部14を具備する。図3は図1の表示操作部14の表示
操作を説明する図である。表示操作部14には本図に示
す如く、重要部分の指定の操作ボタンとして『主語・述
語』、『数字』、『固有名詞』を選択操作するボタンが
表示され、韻律の指定の操作ボタンとして『ゆっく
り』、『大きく』のボタンが表示される。これらのボタ
ンに加えて『サービス局の指定』のボタンが設けられ
る。The voice synthesizing apparatus 100 includes an important part specifying unit 11.
And a display operation unit 14 for operating the important part prosody unit 12 from outside. FIG. 3 is a diagram illustrating the display operation of the display operation unit 14 in FIG. As shown in the figure, the display operation unit 14 displays buttons for selecting and operating "subject / predicate", "number", and "proper noun" as operation buttons for specifying important parts. "Slow" and "Large" buttons are displayed. In addition to these buttons, a button for “designating a service station” is provided.
【0015】先ず、重要部分指定部11及び韻律制御処
理部12の具体例を説明する。図3の表示操作14の表
示で、重要部分の指定として『主語・述語』のボタンが
押された場合の重要部分指定部11の動作を、以下に、
説明する。図4は図2の重要部分指定部11の動作を説
明する例を示す図である。図4(a)の左側に示す如
く、テキスト解析処理部1に、例えば、『なんだかんだ
であれ、要点は重要です。』との漢字仮名混じりのテキ
ストが入力される。この入力テキストに対してテキスト
処理部1ではこれがカタカナのモーラである発音記号列
に変換される。First, a specific example of the important part designation unit 11 and the prosody control processing unit 12 will be described. In the display of the display operation 14 in FIG. 3, the operation of the important part specification unit 11 when the “subject / predicate” button is pressed as the specification of the important part will be described below.
explain. FIG. 4 is a diagram showing an example for explaining the operation of the important part designation unit 11 of FIG. As shown on the left side of FIG. 4 (a), the text analysis processing unit 1, for example, "Essentially, the point is important. ] And a text mixed with kanji kana. The text processing unit 1 converts the input text into a phonetic symbol string that is a katakana mora.
【0016】テキスト解析処理部1ではこの発音記号列
のうち主語・述語とが検索されて、重要部分指定部11
では、図4(a)の右側に示す『ナンダカンダデアレ、
ヨウテンハジュウヨウデス。』の下線部分の如く、主語
の助詞を除いた名詞部分と述語の語幹部分とが指定され
る。同様に、図3の表示操作14の表示で、重要部分の
指定として『数字』のボタンが押されているとする。図
4(b)の左側に示す如く、テキスト解析処理部1に、
例えば、『時速100km/hです。』との漢字仮名混
じりのテキストが入力される。この入力テキストに対し
てテキスト処理部1ではこれが発音記号列に変換され、
この発音記号列のうち数字が検索されて、重要部分指定
部11では、図4(b)の右側に示す『ジソクヒャクキ
ロメートルパーアワーデス。』の下線部分の如く、数字
が指定される。The text analysis processing section 1 searches the phonetic symbol string for the subject and the predicate, and the important part designating section 11
Then, “Nanda Kanda de Are, shown on the right side of FIG.
Gist Ha important death. , The noun part excluding the subject particle and the stem part of the predicate are designated. Similarly, in the display of the display operation 14 in FIG. 3, it is assumed that the “number” button has been pressed as the designation of an important part. As shown on the left side of FIG. 4B, the text analysis processing unit 1
For example, "100 km / h. ] And a text mixed with kanji kana. The text processing unit 1 converts the input text into a phonetic symbol string,
The phonetic symbols are retrieved numbers of columns, the important part specification section 11, shown on the right side shown in FIG. 4 (b) "flux one hundred key <br/> b meters Per Hour death. ], The number is specified as underlined.
【0017】同様に、図3の表示操作14の表示で、重
要部分の指定として『固有名詞』のボタンが押されてい
るとする。図4(c)の左側に示す如く、テキスト解析
処理部1に、例えば、『まもなく神戸する。』との漢字
仮名混じりのテキストが入力される。この入力テキスト
に対してテキスト処理部1ではこれが発音記号列に変換
され、この発音記号列のうち固有名詞が検索されて、重
要部分指定部11では、図4(c)の右側に示す『マモ
ナクコウベデス。』の下線部分の如く、固有名詞が指定
される。Similarly, in the display of the display operation 14 in FIG. 3, it is assumed that the button of "proper noun" is pressed as the designation of the important part. As shown on the left side of FIG. 4 (c), the text analysis processing unit 1 outputs, for example, "Soon Kobe. ] And a text mixed with kanji kana. The text processing unit 1 converts the input text into a phonetic symbol string, searches for a proper noun in the phonetic symbol string, and the important part designating unit 11 uses the "mamonak" shown on the right side of FIG. Kobe death. ], The proper noun is specified.
【0018】なお、本図(a)、(b)、(c)に示す
重要部分の任意の2つを組み合わせて、又は全部が同時
に指定されてもよい。韻律制御処理部12では、上記の
指定された重要部分に対して、『ゆっくり』又は『大き
く』の韻律の指定が行われる。この場合、『ゆっく
り』、『大きく』の韻律の指定が同時に行われてもよ
い。Incidentally, any two of the important parts shown in FIGS. 1A, 1B and 1C may be combined or all may be designated at the same time. The prosody control processing unit 12 specifies “slow” or “large” prosody for the specified important part. In this case, the "slow" and "large" prosody may be specified at the same time.
【0019】次に、受信機100に対するサービス局か
ら重要部分の指定ラベル、これに付加する韻律の指定ラ
ベルが入力テキストに付けられて送られる場合には図3
の表示操作14の表示で、『サービス局の指定』のボタ
ンが押される。図5は『サービス局の指定』のボタンが
押された場合の図2の重要部分指定部11の動作を説明
する例を示す図である。図5(a)の左側に示す如く、
テキスト解析処理部1に、例えば、『なんだかんだであ
れ、「<Big or Slow >要点」は「<Big or Slow >重
要」です。』とのテキストが入力される。このように、
重要部分がラベル「 」により指定され、指定された重
要部分の韻律がラベル<>内のBig (『大きく』の意
味)or Slow (『ゆっくり』の意味)より指定される。
重要部分指定部11ではこのラベルを解釈して、図5
(a)右側に示す『ナンダカンダデアレ、ヨウテンハジ
ュウヨウデス。』の下線部分の如く、主語の助詞を除い
た名詞部分と述語の語幹部分とが抽出され重要部分と指
定される。重要部分韻律部12ではラベルを解釈してこ
のように指定された重要部分に対して『ゆっくり』又は
『大きく』の韻律が抽出され指定される。FIG. 3 shows a case where the service station for the receiver 100 sends a designated label of an important part and a designated label of a prosody to be added thereto to the input text.
Is displayed, the button of "designation of service station" is pressed. FIG. 5 is a diagram showing an example for explaining the operation of the important part designating section 11 of FIG. 2 when the "designation of service station" button is pressed. As shown on the left side of FIG.
In the text analysis processing unit 1, for example, "Whatever the point,"<Big or Slow> key point "is"<Big or Slow> important ". Is entered. in this way,
The important part is specified by the label “”, and the prosody of the specified important part is specified by Big (meaning “big”) or Slow (meaning “slow”) in the label <>.
The important part designating section 11 interprets this label, and
(A) shown in the right-hand side, "Nanda Kanda de array, the main point Ha di
Yuuyou death. , The noun part excluding the subject particle and the stem part of the predicate are extracted and designated as important parts. The important part prosody section 12 interprets the label and extracts and specifies the "slow" or "large" prosody for the important part specified in this way.
【0020】図6は図2の音声生成処理部4における重
要部分音声生成部13を説明する図である。音声生成処
理部4では、韻律制御処理部3から音韻系列、韻律系列
を入力して音素のピッチ、振幅、継続時間長などの韻律
系列に対して音韻系列を構成する音素の波形が通常時の
波形辞書部5から読み出されて接続が行われる。例え
ば、指定された重要部分である『ヨウテン(要点)』の
モーラを子音と母音との音素分解したモーラ『YOUT
EN』に対して音声生成処理部4では通常の波形辞書部
5Aを用いて図6(a)に示す音声波形が生成される。FIG. 6 is a diagram for explaining the important part sound generator 13 in the sound generator 4 of FIG. The speech generation processing unit 4 receives the phoneme sequence and the prosody sequence from the prosody control processing unit 3 and outputs the waveform of the phoneme constituting the phoneme sequence to the prosody sequence such as the pitch, amplitude, and duration of the phoneme in the normal state. The connection is made by reading from the waveform dictionary unit 5. For example, a mora “YOUT” which is a phoneme decomposition of a consonant and a vowel of the specified important part “mall”
EN ”, the voice generation processing unit 4 generates the voice waveform shown in FIG. 6A using the normal waveform dictionary unit 5A.
【0021】重要部分音声生成部13では、重要部分韻
律部12から『ゆっくり』の韻律指定が入力されると、
音声生成処理部4では重要部分用波形辞書部5Bを用い
て図6(b)に示すモーラ『YOUTEN』のように時
間的に伸長した音声波形が形成される。このようにし
て、重要部分は他の部分と比較してゆっくりとした音声
で読み上げられるので、受聴者に注意を促すことが可能
になる。特に高齢者にとっても聞きやすくなる。In the important part sound generation unit 13, when the “slow” prosody designation is input from the important part prosody unit 12,
The speech generation processing unit 4 forms a speech waveform that is temporally expanded like a mora “YOUTEN” shown in FIG. 6B by using the important part waveform dictionary unit 5B. In this way, the important part is read out with a slower voice than the other parts, so that the listener can be alerted. In particular, it is easier for elderly people to hear.
【0022】重要部分音声生成部13は、重要部分韻律
部12から『大きく』の韻律指定が入力されると、音声
生成処理部4では重要部分用波形辞書部5Cを用いて図
6(c)に示すモーラ『YOUTEN』のように大きな
振幅の音声波形が形成される。このようにして、重要部
分は他の部分と比較して大きい音声で読み上げられるの
で、受聴者に注意を促すことが可能になる。特に高齢者
にとっても聞きやすくなる。When the "large" prosody designation is input from the important part prosody unit 12 to the important part speech generation unit 13, the speech generation processing unit 4 uses the important part waveform dictionary unit 5C as shown in FIG. A voice waveform having a large amplitude is formed like the mora “YOUTEN” shown in FIG. In this way, the important part is read out with a loud voice compared to the other parts, so that the listener can be alerted. In particular, it is easier for elderly people to hear.
【0023】また、情報を提供するサービス局が意図す
るニュアンスでユーザに音声合成を聞かせることが可能
になる。図7は図2の変形例を説明する図である。本図
において図1と異なるのは単語辞書2、波形辞書部5で
ある。単語辞書2として、通常の単語辞書2Aと感情用
単語辞書2Bが設けられる。さらに、波形辞書部5とし
て、通常の波形辞書部5Aと、感情用波形辞書部5D、
5Eとが設けられる。Further, it is possible to make the user hear speech synthesis with the nuance intended by the service station that provides the information. FIG. 7 is a diagram illustrating a modification of FIG. The drawing differs from FIG. 1 in the word dictionary 2 and the waveform dictionary unit 5. As the word dictionary 2, a normal word dictionary 2A and an emotion word dictionary 2B are provided. Further, as the waveform dictionary 5, a normal waveform dictionary 5A, an emotional waveform dictionary 5D,
5E.
【0024】図8は図7の音声合成装置100に設けら
れる通常の単語辞書2Aと感情用単語辞書2Bとを説明
する図である。図7に示す如く、単語辞書2として、通
常の単語辞書2Aと感情用単語辞書2Bが設けられる。
図8(a)に示す如く、通常の単語辞書2Aには、感
動、東京、慰留、結婚、退職、鎮魂等の通常の単語が登
録されている。感情用単語辞書2Bには、(1)明るく
読むモード、(2)暗く読むモードとを指定した単語を
識別して登録してある。例えば、明るく読むモード
(1)として嬉しい、楽しい、結婚等の単語が登録さ
れ、暗く読むモード(2)として悲しい、退職等の単語
が登録されている。このように、通常の単語辞書2Aを
変更することなく、感情読み上げのキーワードになる単
語に拡張情報を持たせる感情用単語辞書2Bを追加する
ことで実現することができる。FIG. 8 is a diagram for explaining a normal word dictionary 2A and an emotion word dictionary 2B provided in the speech synthesizer 100 of FIG. As shown in FIG. 7, as the word dictionary 2, a normal word dictionary 2A and an emotion word dictionary 2B are provided.
As shown in FIG. 8A, ordinary words such as impression, Tokyo, comfort, marriage, retirement, and requiem are registered in the ordinary word dictionary 2A. In the emotion word dictionary 2B, words that specify (1) a bright reading mode and (2) a dark reading mode are identified and registered. For example, words such as happy, fun, and marriage are registered as the bright reading mode (1), and words such as sad and retirement are registered as the dark reading mode (2). As described above, the present invention can be realized by adding the word dictionary for emotion 2B that adds extended information to words that are used as keywords for emotion reading without changing the normal word dictionary 2A.
【0025】感情用波形辞書部5Dは(1)明るく読む
モードに対応する単語に対してピッチを高くした単語の
音声波形を格納する。感情用波形辞書部5Eは(2)暗
く読むモードに対応する単語に対してピッチを低くした
単語の音声波形を格納する。なお、図8(b)に示す如
く、通常の単語辞書2を拡張して、例えば、結婚という
単語に明るく読むモードである記号(1)を付け、鎮魂
という単語に暗く読むモードである記号(2)を付けて
もよい。前者と比較すると、単語辞書のサイズの増大を
抑制することが可能になる。The emotional waveform dictionary section 5D stores (1) the speech waveform of a word whose pitch is higher than that of the word corresponding to the bright reading mode. The emotional waveform dictionary unit 5E stores (2) a speech waveform of a word whose pitch is lower than that of the word corresponding to the dark reading mode. As shown in FIG. 8B, the normal word dictionary 2 is expanded to add, for example, a symbol (1) that is a mode for reading brightly to the word of marriage and a symbol ( 2) may be added. Compared with the former, it is possible to suppress an increase in the size of the word dictionary.
【0026】図9は表示操作14の感情的な読み上げを
行う場合の表示操作例を説明する図である。本図に示す
表示操作で感情の表現を行うか否かの選択が行われる。
表示操作14で『はい』のボタンが押されると、重要部
分指定部11では、感情用単語辞書2Bにより、テキス
ト解析処理部1に入力したテキストの文に、明るく読む
モード(1)に属する単語、又は暗く読むモード(2)
に属する単語が含まれるかが判断される。FIG. 9 is a diagram for explaining an example of display operation when emotional reading of the display operation 14 is performed. A selection as to whether or not to express an emotion is made by the display operation shown in FIG.
When the "yes" button is pressed in the display operation 14, the important part designation unit 11 uses the sentence word dictionary 2B to add the words belonging to the mode (1) that are brightly read to the text sent to the text analysis processing unit 1. Or dark reading mode (2)
It is determined whether a word belonging to is included.
【0027】図10は明るく読むモード(1)を含む場
合、読み上げるピッチを説明する図である。本図に示す
如く、『鈴木さんが結婚しました。』という入力テキス
トに結婚という明るく読み上げるモード(1)に該当す
る結婚という単語が含まれているので、重要部分指定部
11ではこの発音記号列『スズキサンガケッコンシマシ
タ。』の下線部分を重要部分として指定する。重要部分
韻律部12では重要部分を他のテキストの部分に対し
て、本図に示す如く、ピッチを上げる韻律系列を形成す
る。重要部分音声生成部13では、感情用波形辞書部5
Dを用いて重要部分に対してピッチを上げて音声を生成
する。このようにピッチを上げると、明るい読み上げに
なる。FIG. 10 is a diagram for explaining a reading pitch when the mode (1) for reading brightly is included. As shown in this figure, "Suzuki is married. Because it contains the word marriage corresponding to the mode (1) read aloud bright that marriage to the input text ", the important part designation section 11 this string of phonetic symbols" Suzuki Sanga marriage Shimashi <br/> data. ] Is specified as an important part. The important part prosody unit 12 forms a prosody series in which the pitch is increased with respect to other text parts as shown in FIG. In the important part voice generating unit 13, the emotional waveform dictionary unit 5
A voice is generated by raising the pitch of an important part using D. Increasing the pitch in this way results in a brighter reading.
【0028】図11は暗く読むモード(2)を含む場合
の文を読み上げるピッチを説明する図である。本図に示
す如く、『鈴木さんが退職しました。』という入力テキ
ストに結婚という暗く読み上げるモード(2)に該当す
る退職という単語が含まれているので、重要部指定部1
1ではこの発音記号列『スズキサンガタイショクシマシ
タ。』の下線部分を重要部分として指定する。重要部分
韻律部12では重要部分を他のテキストに対して、本図
に示す如く、ピッチを下げる韻律系列を形成する。重要
部分音声生成部13では、感情用波形辞書部5Eを用い
て重要部分に対してピッチを下げて音声を生成する。こ
のようにピッチを下げると、暗い読み上げになる。FIG. 11 is a diagram for explaining the pitch at which a sentence is read out when the mode (2) for reading darkly is included. As shown in this figure, "Suzuki has retired. Contains the word “retirement” corresponding to the mode (2) that reads out darkly as “marriage”.
In 1 the pronunciation symbol string "Suzuki Sanga retirement Shimashi <br/> data. ] Is specified as an important part. The important part prosody unit 12 forms a prosody series for lowering the pitch, as shown in FIG. The important part sound generation unit 13 generates a sound by lowering the pitch for the important part using the emotional waveform dictionary unit 5E. When the pitch is lowered in this way, a dark reading is obtained.
【0029】したがって、受聴者に対して感情表現に富
む音声の合成を行うことが可能になる。次に、受信機1
00に対するサービス局から感情に関する重要部分の指
定ラベル、これに付加する韻律の指定ラベルが入力テキ
ストに付けられて送られる場合には図9の表示操作14
の表示で、『サービス局の指定』のボタンが押される。Therefore, it is possible to synthesize a voice rich in emotional expression for the listener. Next, the receiver 1
In the case where the service station for 00 sends a designation label of an important part related to emotion and a designation label of a prosody to be added thereto to the input text, the display operation 14 shown in FIG.
Is displayed, the button "Specify service station" is pressed.
【0030】図12は図9の表示操作で『サービス局の
指定』のボタンが押された場合の図2の重要部分指定部
11の動作を説明する例を示す図である。図12(a)
の左側に示す如く、テキスト解析処理部1に、例えば、
『鈴木さんが「<High>結婚」しました。』とのテキスト
が入力される。このように、重要部分がラベル「 」に
より指定され、指定された重要部分の感情の韻律がラベ
ル< >内のHigh(ピッチ高の意味) より指定される。
重要部分指定部11ではこのラベルを解釈して、図12
(a)右側に示す『スズキサンガケッコンシマシタ。』
の下線部分の如く、重要部分が指定される。重要部分韻
律部12ではラベルを解釈してこのように指定された重
要部分に対してピッチが高い韻律が抽出され指定され
る。FIG. 12 is a diagram showing an example for explaining the operation of the important part designating section 11 of FIG. 2 when the "designation of service station" button is pressed in the display operation of FIG. FIG. 12 (a)
As shown on the left side of FIG.
"Mr. Suzuki got married <High>. Is entered. As described above, the important part is specified by the label “”, and the prosody of the emotion of the specified important part is specified by High (meaning pitch height) in the label <>.
The important part designating section 11 interprets this label and
(A) shown in the right-hand side "Suzuki Sangha marriage Shimashita. 』
Important parts are designated as underlined. The important part prosody section 12 interprets the label and extracts and specifies a prosody with a high pitch for the important part specified in this way.
【0031】また、図12(b)の左側に示す如く、テ
キスト解析処理部1に、例えば、『鈴木さんが「<Low>
退職」しました。』とのテキストが入力される。前述と
同様に、重要部分がラベル「 」により指定され、指定
された重要部分の感情の韻律がラベル< >内のLow
(ピッチ低の意味) より指定される。重要部分指定部1
1ではこのラベルを解釈して、図12(b)右側に示す
『スズキサンガタイショクシマシタ。』の下線部分の如
く、重要部分が指定される。重要部分韻律部12ではラ
ベルを解釈してこのように指定された重要部分に対して
ピッチが低い韻律が抽出され指定される。Also, as shown on the left side of FIG. 12B, the text analysis processing unit 1 outputs, for example, “Mr.
Retired. " Is entered. As described above, the important part is designated by the label “”, and the prosody of the emotion of the designated important part is set to the low level in the label <>.
(Meaning low pitch). Important part designation section 1
In 1 interprets this label, and FIG. 12 (b) shows the right "Suzuki SANGA retirement Shimashita. Important parts are designated as underlined. The important part prosody section 12 interprets the label and extracts and specifies a prosody with a low pitch for the important part specified in this way.
【0032】このように、情報を提供するサービス局が
意図するニュアンスでユーザに音声合成を聞かせること
が可能になる。As described above, it is possible to make the user hear the speech synthesis with the nuance intended by the service station that provides the information.
【0033】[0033]
【発明の効果】以上の説明により本発明によれば、重要
部分として、主語・述語、数字、固有名詞が他のテキス
トの部分に対してゆっくりとした音声、又は大きな音声
で読み上げられるので、受聴者が聞き取りやすい音声を
合成することが可能になる。さらに、明るい感情表現に
対してピッチが高い音声、暗い感情表現に対してはピッ
チが低い音声で合成されるので、受聴者は感情に富んだ
読み上げを聞くことが可能になる。As described above, according to the present invention, as important parts, the subject / predicate, numbers and proper nouns are read aloud slowly or loudly with respect to other text parts. It is possible to synthesize speech that is easy for the listener to hear. Furthermore, since a voice with a high pitch is synthesized for a bright emotional expression and a voice with a low pitch for a dark emotional expression, the listener can hear a rich emotional reading.
【図面の簡単な説明】[Brief description of the drawings]
【図1】本発明に係る音声合成装置を有しサービス局か
ら音声合成の入力テキストを受信する受信機を示す図で
ある。FIG. 1 is a diagram showing a receiver having a speech synthesizer according to the present invention and receiving an input text for speech synthesis from a service station.
【図2】図1の音声合成装置100を説明する図であ
る。FIG. 2 is a diagram illustrating the speech synthesizer 100 of FIG.
【図3】図1の表示操作部14の表示操作を説明する図
である。FIG. 3 is a diagram illustrating a display operation of a display operation unit 14 in FIG.
【図4】図2の重要部分指定部11の動作を説明する例
を示す図である。FIG. 4 is a diagram showing an example for explaining the operation of an important part designation unit 11 of FIG. 2;
【図5】『サービス局の指定』のボタンが押された場合
の図2の重要部分指定部11の動作を説明する例を示す
図である。FIG. 5 is a diagram showing an example for explaining the operation of the important part designating unit 11 of FIG. 2 when the “designation of service station” button is pressed.
【図6】図2の音声生成処理部4における重要部分音声
生成部13を説明する図である。FIG. 6 is a diagram illustrating an important partial sound generation unit 13 in the sound generation processing unit 4 of FIG. 2;
【図7】図2の変形例を説明する図である。FIG. 7 is a diagram illustrating a modification of FIG. 2;
【図8】図7の音声合成装置100に設けられる通常の
単語辞書2Aと感情用単語辞書2Bとを説明する図であ
る。8 is a diagram illustrating a normal word dictionary 2A and an emotion word dictionary 2B provided in the speech synthesis device 100 of FIG. 7;
【図9】表示操作14の感情的な読み上げを行う場合の
表示操作例を説明する図である。FIG. 9 is a diagram illustrating a display operation example when emotional reading of the display operation 14 is performed.
【図10】明るく読むモード(1)を含む場合、読み上
げるピッチを説明する図である。FIG. 10 is a diagram illustrating a reading pitch when a bright reading mode (1) is included.
【図11】暗く読むモード(2)を含む場合の文を読み
上げるピッチを説明する図である。FIG. 11 is a diagram illustrating a pitch at which a sentence is read out when a dark read mode (2) is included.
【図12】図9の表示操作で『サービス局の指定』のボ
タンが押された場合の図2の重要部分指定部11の動作
を説明する例を示す図である。12 is a diagram illustrating an example of an operation of the important part designating unit 11 of FIG. 2 when a “designation of service station” button is pressed in the display operation of FIG. 9;
1…テキスト解析処理部 2、2A、2B…単語辞書部 3…韻律制御処理部 4…音声生成処理部 5、5A、5B、5C、5D、5E…波形辞書部 11…重要部分指定部 12…重要部分韻律部 13…重要部分音声生成部 100…音声合成部 200…アンテナ 201…受信部 202…加算部 203…スピーカ DESCRIPTION OF SYMBOLS 1 ... Text analysis processing part 2, 2A, 2B ... Word dictionary part 3 ... Prosody control processing part 4 ... Speech generation processing part 5, 5A, 5B, 5C, 5D, 5E ... Waveform dictionary part 11 ... Important part designation part 12 ... Important part prosody part 13 important part sound generation part 100 voice synthesis part 200 antenna 201 reception part 202 addition part 203 speaker
Claims (12)
語の読みに韻律が生成され且つテキストに対して音声波
形が生成されて音声を合成する音声合成装置において、 言語解析されたテキスト中の重要部分を指定する重要部
分指定部と、 前記重要部分指定部により指定された重要部分に対し
て、テキスト中の前記重要部分以外の他の部分と異なら
せる韻律を形成する重要部分韻律部と、 前記重要部分に対して音声波形を生成する重要部分生成
部とを備えることを特徴とする音声合成装置。1. A speech synthesizer for linguistically analyzing a text as a word, generating a prosody for reading the word, and generating a speech waveform for the text to synthesize speech. An important part prosody part that forms a prosody that makes the important part specified by the important part specification part different from other parts other than the important part in the text; An audio synthesizing apparatus, comprising: an important part generation unit that generates an audio waveform for a part.
語・述語を重要部分として指定することを特徴とする、
請求項1に記載の音声合成装置。2. The important part designating unit designates a subject / predicate in a text as an important part.
The speech synthesizer according to claim 1.
字を重要部分として指定することを特徴とする、請求項
1に記載の音声合成装置。3. The speech synthesizer according to claim 1, wherein the important part designating unit designates a number in a text as an important part.
有名詞を重要部分として指定することを特徴とする、請
求項1に記載の音声合成装置。4. The speech synthesizer according to claim 1, wherein the important part designation unit designates a proper noun in a text as an important part.
定部により指定された重要部分がゆっくりとした音声で
読み上げられる韻律を形成することを特徴とする、請求
項1に記載の音声合成装置。5. The speech synthesizer according to claim 1, wherein the important part prosody forms a prosody in which the important part specified by the important part specifying part is read out with a slow voice. .
定部により指定された重要部分が大きい音声で読み上げ
られる韻律を形成することを特徴とする、請求項1に記
載の音声合成装置。6. The speech synthesizer according to claim 1, wherein the important part prosody unit forms a prosody in which the important part specified by the important part specification unit is read out with a large voice.
重要部分と、これを識別するラベルと、重要部分に韻律
を付加すべきラベルとが含まれるとき、前記重要部分指
定部はテキストから重要部分を検索して重要部分を指定
し、前記重要部分韻律部は前記重要部分に対する韻律を
検索して検索された韻律を形成することを特徴とする、
請求項1に記載の音声合成装置。7. The text transmitted from the service bureau,
When an important part, a label for identifying the important part, and a label to which a prosody is to be added to the important part are included, the important part designating unit searches the text for the important part, specifies the important part, and specifies the important part prosody. The unit searches for a prosody for the important part to form a searched prosody,
The speech synthesizer according to claim 1.
通常の単語辞書部に対して感情表現に富む単語を格納す
る感情用単語辞書部と、前記通常の単語辞書部の格納さ
れる単語の音声波形に対してピッチを変更した音声波形
を格納する感情用波形辞書部とを備え、 前記重要部分指定部は前記感情用単語辞書部を用いてテ
キスト中の重要部分を指定し、 前記重要部分韻律部は前記重要部分指定部により指定さ
れた重要部分にピッチを変更して感情表現の韻律を形成
し、 前記重要部分音声生成部は前記感情用波形辞書部を用い
て重要部分の音声波形を生成することを特徴とする、請
求項1に記載の音声合成装置。8. An emotional word dictionary for storing words rich in emotional expression with respect to an ordinary word dictionary used for language analysis of text, and a voice of a word stored in the ordinary word dictionary. An emotional waveform dictionary unit for storing a voice waveform having a pitch changed with respect to the waveform, wherein the important part designating unit designates an important part in a text using the emotional word dictionary unit, The unit changes the pitch to the important part designated by the important part designating unit to form a prosody of the emotional expression, and the important part speech generating unit generates the speech waveform of the important part using the emotional waveform dictionary unit. The voice synthesizing apparatus according to claim 1, wherein:
る単語に、明るい感情表現と暗い感情表現とが識別され
るラベルを付けることを特徴とする、請求項8に記載の
音声合成装置。9. The speech synthesizer according to claim 8, wherein the sentence word dictionary unit attaches a label for distinguishing a bright sentiment expression from a dark sentiment expression to a word stored therein. .
現の韻律に対してはピッチを高くし、暗い感情表現の韻
律に対してピッチを高くすることを特徴とする、請求項
8に記載の音声合成装置。10. The important part prosody part according to claim 8, wherein the pitch is increased for a prosody of a bright emotion expression, and is increased for a prosody of a dark emotion expression. Speech synthesizer.
書部と合体し前記通常の辞書部に使用される単語のうち
感情表現に富む単語にラベルを付けることを特徴とす
る、請求項8に記載の音声合成装置。11. The word dictionary unit for emotions is combined with the normal dictionary unit and labels words rich in emotional expression among words used in the normal dictionary unit. A speech synthesizer according to claim 1.
に、感情表現に富む重要部分とこれを識別するラベル
と、感情表現に富む重要部分に韻律を付加すべきラベル
とが含まれるとき、前記重要部分指定部はテキストから
感情表現に富む重要部分を検索して感情表現に富む重要
部分を指定し、前記重要部分韻律部は前記感情に富む重
要部分に対する韻律を検索して検索された韻律を形成す
ることを特徴とする、請求項8に記載の音声合成装置。12. When the text transmitted from the service station includes an important part rich in emotional expression and a label for identifying the important part, and a label to add prosody to the important part rich in emotional expression, the important part is included. The specifying unit searches the text for an important part rich in emotional expression and designates an important part rich in emotional expression. The important part prosody unit searches the prosody for the important part rich in emotion and forms the searched prosody. The speech synthesizer according to claim 8, wherein:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10037421A JPH11231885A (en) | 1998-02-19 | 1998-02-19 | Speech synthesizing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10037421A JPH11231885A (en) | 1998-02-19 | 1998-02-19 | Speech synthesizing device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11231885A true JPH11231885A (en) | 1999-08-27 |
| JPH11231885A5 JPH11231885A5 (en) | 2005-08-25 |
Family
ID=12497069
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10037421A Pending JPH11231885A (en) | 1998-02-19 | 1998-02-19 | Speech synthesizing device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11231885A (en) |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002091474A (en) * | 2000-09-05 | 2002-03-27 | Lucent Technol Inc | Method for generating speech by processing text by using non-language dependent rhythm markup and device for the same |
| JP2003233388A (en) * | 2002-02-07 | 2003-08-22 | Sharp Corp | Speech synthesis apparatus, speech synthesis method, and program recording medium |
| KR100522889B1 (en) * | 1999-07-21 | 2005-10-19 | 코나미 가부시키가이샤 | Speech synthesizing method, speech synthesis apparatus, and computer-readable medium recording speech synthesis program |
| JP2006184921A (en) * | 2006-01-27 | 2006-07-13 | Canon Electronics Inc | Information processing device and method |
| JP2006308998A (en) * | 2005-04-28 | 2006-11-09 | Brother Ind Ltd | Speech synthesis apparatus and speech synthesis program |
| JP2006330060A (en) * | 2005-05-23 | 2006-12-07 | Univ Waseda | Speech synthesis apparatus, speech processing apparatus, and program |
| JP2007011308A (en) * | 2005-05-30 | 2007-01-18 | Kyocera Corp | Document display device and document reading method |
| WO2009050809A1 (en) * | 2007-10-18 | 2009-04-23 | Pioneer Corporation | Audio output device, audio output method, audio output program, and storage medium |
| JP2010175717A (en) * | 2009-01-28 | 2010-08-12 | Mitsubishi Electric Corp | Speech synthesizer |
| US8065157B2 (en) | 2005-05-30 | 2011-11-22 | Kyocera Corporation | Audio output apparatus, document reading method, and mobile terminal |
| CN103680491A (en) * | 2012-09-10 | 2014-03-26 | 财团法人交大思源基金会 | Speed dependent prosodic message generating device and speed dependent hierarchical prosodic module |
| JP2015064480A (en) * | 2013-09-25 | 2015-04-09 | ヤマハ株式会社 | Voice synthesizer and program |
| JP2015517684A (en) * | 2012-05-07 | 2015-06-22 | オーディブル・インコーポレイテッドAudible, Inc. | Content customization |
| CN105741829A (en) * | 2016-04-28 | 2016-07-06 | 玉环看知信息科技有限公司 | Data conversion method and data conversion device |
| US10490181B2 (en) | 2013-05-31 | 2019-11-26 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
| JP2020067808A (en) * | 2018-10-24 | 2020-04-30 | 日本電気株式会社 | Processing system, processing method and program |
| US11094313B2 (en) | 2019-03-19 | 2021-08-17 | Samsung Electronics Co., Ltd. | Electronic device and method of controlling speech recognition by electronic device |
-
1998
- 1998-02-19 JP JP10037421A patent/JPH11231885A/en active Pending
Cited By (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100522889B1 (en) * | 1999-07-21 | 2005-10-19 | 코나미 가부시키가이샤 | Speech synthesizing method, speech synthesis apparatus, and computer-readable medium recording speech synthesis program |
| JP2013011902A (en) * | 2000-09-05 | 2013-01-17 | Alcatel-Lucent Usa Inc | Method for generating speech by processing text by using non-language dependent rhythm markup and device for the same |
| JP2002091474A (en) * | 2000-09-05 | 2002-03-27 | Lucent Technol Inc | Method for generating speech by processing text by using non-language dependent rhythm markup and device for the same |
| JP2003233388A (en) * | 2002-02-07 | 2003-08-22 | Sharp Corp | Speech synthesis apparatus, speech synthesis method, and program recording medium |
| JP2006308998A (en) * | 2005-04-28 | 2006-11-09 | Brother Ind Ltd | Speech synthesis apparatus and speech synthesis program |
| JP2006330060A (en) * | 2005-05-23 | 2006-12-07 | Univ Waseda | Speech synthesis apparatus, speech processing apparatus, and program |
| JP2007011308A (en) * | 2005-05-30 | 2007-01-18 | Kyocera Corp | Document display device and document reading method |
| US8065157B2 (en) | 2005-05-30 | 2011-11-22 | Kyocera Corporation | Audio output apparatus, document reading method, and mobile terminal |
| JP2006184921A (en) * | 2006-01-27 | 2006-07-13 | Canon Electronics Inc | Information processing device and method |
| WO2009050809A1 (en) * | 2007-10-18 | 2009-04-23 | Pioneer Corporation | Audio output device, audio output method, audio output program, and storage medium |
| JPWO2009050809A1 (en) * | 2007-10-18 | 2011-02-24 | パイオニア株式会社 | Audio output device, audio output method, audio output program, and storage medium |
| JP2010175717A (en) * | 2009-01-28 | 2010-08-12 | Mitsubishi Electric Corp | Speech synthesizer |
| JP2015517684A (en) * | 2012-05-07 | 2015-06-22 | オーディブル・インコーポレイテッドAudible, Inc. | Content customization |
| CN103680491A (en) * | 2012-09-10 | 2014-03-26 | 财团法人交大思源基金会 | Speed dependent prosodic message generating device and speed dependent hierarchical prosodic module |
| US10490181B2 (en) | 2013-05-31 | 2019-11-26 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
| JP2015064480A (en) * | 2013-09-25 | 2015-04-09 | ヤマハ株式会社 | Voice synthesizer and program |
| CN105741829A (en) * | 2016-04-28 | 2016-07-06 | 玉环看知信息科技有限公司 | Data conversion method and data conversion device |
| JP2020067808A (en) * | 2018-10-24 | 2020-04-30 | 日本電気株式会社 | Processing system, processing method and program |
| US11094313B2 (en) | 2019-03-19 | 2021-08-17 | Samsung Electronics Co., Ltd. | Electronic device and method of controlling speech recognition by electronic device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6823309B1 (en) | Speech synthesizing system and method for modifying prosody based on match to database | |
| US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
| JPH11231885A (en) | Speech synthesizing device | |
| JP3616250B2 (en) | Synthetic voice message creation method, apparatus and recording medium recording the method | |
| JP5198046B2 (en) | Voice processing apparatus and program thereof | |
| WO2004066271A1 (en) | Speech synthesizing apparatus, speech synthesizing method, and speech synthesizing system | |
| JPH11231885A5 (en) | ||
| JP3270356B2 (en) | Utterance document creation device, utterance document creation method, and computer-readable recording medium storing a program for causing a computer to execute the utterance document creation procedure | |
| JP3576066B2 (en) | Speech synthesis system and speech synthesis method | |
| JP6197523B2 (en) | Speech synthesizer, language dictionary correction method, and language dictionary correction computer program | |
| JP2000056789A (en) | Speech synthesis device and telephone set | |
| Shah et al. | Bi-Lingual Text to Speech Synthesis System for Urdu and Sindhi | |
| JPH0916190A (en) | Text reading device | |
| JP2007086309A (en) | Speech synthesis apparatus, speech synthesis method, and speech synthesis program | |
| JP2003140678A (en) | Sound quality adjustment method and speech synthesizer for synthesized speech | |
| JP3060276B2 (en) | Speech synthesizer | |
| KR101742092B1 (en) | Computer-readable Recording Media recorded with Program for displaying Characters as a form of Vibration to visually impaired persons | |
| JPH09237096A (en) | Kanji explanation method and device | |
| Kaur et al. | Building atext-to-speech system for punjabi language | |
| JPH054676B2 (en) | ||
| JPH04350699A (en) | Text voice synthesizing device | |
| JPH03236099A (en) | Document read-aloud device | |
| JPH11344997A (en) | Voice synthesis method | |
| JPH0644247A (en) | Speech synthesizer | |
| JP2006330486A (en) | Speech synthesizer, navigation device with same speech synthesizer, speech synthesizing program, and information storage medium stored with same program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050221 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050221 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070403 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070417 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070814 |