JPH11242751A - Animation control apparatus and method, and text-to-speech apparatus - Google Patents

Animation control apparatus and method, and text-to-speech apparatus

Info

Publication number
JPH11242751A
JPH11242751A JP4250198A JP4250198A JPH11242751A JP H11242751 A JPH11242751 A JP H11242751A JP 4250198 A JP4250198 A JP 4250198A JP 4250198 A JP4250198 A JP 4250198A JP H11242751 A JPH11242751 A JP H11242751A
Authority
JP
Japan
Prior art keywords
animation
sentence
mood
display
expression data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4250198A
Other languages
Japanese (ja)
Other versions
JPH11242751A5 (en
Inventor
Kazue Kaneko
和恵 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP4250198A priority Critical patent/JPH11242751A/en
Publication of JPH11242751A publication Critical patent/JPH11242751A/en
Publication of JPH11242751A5 publication Critical patent/JPH11242751A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】文章の読み上げを実行するに際して、読み上げ
る文章の内容に応じた表情をもつ顔のアニメーションを
自動的に生成することを可能とする。 【解決手段】構文解析部103は文章入力部101より
入力された読み上げるべき文を解析し、更に意味解析部
108及びムード情報取り出し部109が当該文の有す
る雰囲気を示すムードを決定する。一方読み情報生成部
194は当該文の読み情報を生成する。アニメーション
生成部110は、ムード情報取り出し部109よりのム
ード情報と読み情報生成部104よりの読み情報とに基
づいて、アニメーション用辞書112を参照しながら顔
の表情や口の動きのアニメーションを生成する。そし
て、音声出力部106における当該文の音声出力と同期
させながらアニメーション表示部111が生成されたア
ニメーションを表示する。
(57) [Summary] [Problem] To read out a sentence, it is possible to automatically generate an animation of a face having an expression corresponding to the content of the sentence to be read out. A sentence analysis unit analyzes a sentence to be read, which is input from a sentence input unit, and a semantic analysis unit and a mood information extraction unit determine a mood indicating an atmosphere of the sentence. On the other hand, the reading information generation unit 194 generates reading information of the sentence. The animation generation unit 110 generates an animation of a facial expression and a mouth movement while referring to the animation dictionary 112 based on the mood information from the mood information extraction unit 109 and the read information from the read information generation unit 104. . Then, the animation display unit 111 displays the generated animation while synchronizing with the audio output of the sentence in the audio output unit 106.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はアニメーション制御
装置及び方法に関する。特に、装置によって文章読み上
げを行う際の顔のアニメーション制御に好適なアニメー
ション制御装置及び方法及び該アニメーション装置を備
えた文読み上げ装置に関する。
[0001] The present invention relates to an animation control apparatus and method. In particular, the present invention relates to an animation control device and method suitable for controlling animation of a face when a text is read out by a device, and a text-to-speech device provided with the animation device.

【0002】[0002]

【従来の技術】一般に、顔のアニメーションを有する音
声合成システムは、ユーザとの一問一答を行なうガイダ
ンスシステムのユーザーインターフェイスとして使用さ
れることが多い。この種のシステムにおいては、発声す
る文章の長さに合せて、発声時間中、唇の形を変えて、
あたかもしゃべっているように見せかけることが行われ
る。また、応答の種類によって、笑顔や悲しい顔などの
表情の切り換えを行うものもある。しかし、このような
表情の切り換えを伴うガイダンスシステムでは、予め用
意された応答文のそれぞれについてどういう表情を生成
すればよいかを決めて表情の情報を保持しておき、応答
文を発声する際に、その応答文に応じた表情の情報を制
御情報として与えている。
2. Description of the Related Art In general, a speech synthesis system having a face animation is often used as a user interface of a guidance system for asking and answering a user. In this type of system, the shape of the lips is changed during the utterance time according to the length of the sentence to be uttered,
The pretend that you are talking is performed. In addition, there is a type in which an expression such as a smiling face or a sad face is switched depending on the type of response. However, in such a guidance system that involves the switching of facial expressions, it is necessary to decide what facial expression should be generated for each prepared response sentence, hold the information on the facial expression, and use it when uttering the response sentence. , The information of the expression corresponding to the response sentence is given as control information.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、任意の
文章の読み上げを行う場合には、唇の形を文章の読み上
げ期間にわたって切り換えていくことはできるかもしれ
ないが、表情などを切り換えるための情報を取り出すこ
とはできない。
However, when reading out a given sentence, it may be possible to change the shape of the lips over the reading period of the sentence. It cannot be removed.

【0004】すなわち、一問一答を行うガイダンスシス
テムなどの場合は、システム側が予め応答の内容を用意
しているので、それに合せた表情の制御が行える。しか
しながら、任意の文章を読み上げる場合は、その内容に
ついて知る手段やそれに合った表情を選択する機能がな
いために、顔のアニメーションは無表情のまま唇を動か
して発声してゆくか、でたらめに表情を変えながら発声
してゆくかのどちらかとなる。
[0004] In other words, in the case of a guidance system in which a question and answer is given, the contents of the response are prepared in advance by the system, so that the expression can be controlled in accordance with the content. However, when reading out a given sentence, there is no means to know the content or the function to select an expression that matches it, so the facial animation either moves the lips with no expression or speaks out randomly. While changing the voice.

【0005】本発明は上記の問題に鑑みてなされたもの
であり、文章の読み上げを実行するに際して、読み上げ
る文章の内容に応じたアニメーション制御を可能とする
アニメーション制御装置及び方法を提供することを目的
とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and has as its object to provide an animation control apparatus and a method capable of performing animation control according to the contents of a sentence to be read when the sentence is read. And

【0006】[0006]

【課題を解決するための手段】上記の目的を達成するた
めの本発明によるアニメーション制御装置は、例えば以
下の構成を備える。すなわち、読み上げるべき文を解析
して当該文の有する雰囲気を示すムードを決定する決定
手段と、前記決定手段で決定されたムードに基づいてア
ニメーション表示を制御する表示制御手段とを備える。
An animation control apparatus according to the present invention for achieving the above object has, for example, the following arrangement. That is, there are provided a determination unit that analyzes a sentence to be read aloud and determines a mood indicating an atmosphere of the sentence, and a display control unit that controls an animation display based on the mood determined by the determination unit.

【0007】また、好ましくは、前記表示制御手段は、
更に、前記読み上げるべき文に対応する読み情報に基づ
いてアニメーション表示を制御する。
Preferably, the display control means includes:
Further, an animation display is controlled based on the reading information corresponding to the sentence to be read.

【0008】また、上記の目的を達成するための本発明
によるアニメーション制御方法は例えば以下の工程を有
する。すなわち、読み上げるべき文を解析して当該文の
有する雰囲気を示すムードを決定する決定工程と、前記
決定工程で決定されたムードに基づいてアニメーション
表示を制御する表示制御工程とを備える。
Further, the animation control method according to the present invention for achieving the above object has, for example, the following steps. That is, the method includes a determining step of analyzing a sentence to be read and determining a mood indicating an atmosphere of the sentence, and a display controlling step of controlling an animation display based on the mood determined in the determining step.

【0009】また、本発明によれば、上記のアニメーシ
ョン制御装置を備えた文読み上げ装置が提供される。
Further, according to the present invention, there is provided a text-to-speech apparatus provided with the above-mentioned animation control device.

【0010】[0010]

【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な実施形態を説明する。
Preferred embodiments of the present invention will be described below with reference to the accompanying drawings.

【0011】[第1の実施形態]図1は第1の実施形態
による文章読み上げ装置の概略構成を示すブロック図で
ある。図1において、10はCPUでありROM11或
いはRAM12に格納された制御プログラムを実行する
ことにより各種制御を実現する。11はROMであり、
当該装置の立ち上げ時の処理を記述するブートプログラ
ムや各種データが格納される。12はRAMであり、C
PU10が各種制御を実行するにあたっての作業領域を
提供する。13はディスプレイであり、CPU10の制
御により各種表示を行う。本実施形態では、合成音声の
発声に合わせて話し手の顔を表示するものとする。14
は入力装置であり、キーボードやマウスを備える。15
は外部記憶装置であり、各種辞書(構文解析辞書10
2、意味解析辞書107、アニメーション用辞書11
2)や制御プログラム15aを格納する。なお、制御プ
ログラム15aは、その実行時には外部記憶装置15か
らRAM12にロードされる。16はスピーカであり、
合成音声等を出力する。
[First Embodiment] FIG. 1 is a block diagram showing a schematic configuration of a text-to-speech apparatus according to a first embodiment. In FIG. 1, reference numeral 10 denotes a CPU, which realizes various controls by executing a control program stored in a ROM 11 or a RAM 12. 11 is a ROM,
A boot program describing various processes at the time of starting the device and various data are stored. 12 is a RAM, C
The PU 10 provides a work area for executing various controls. Reference numeral 13 denotes a display, which performs various displays under the control of the CPU 10. In the present embodiment, the face of the speaker is displayed according to the utterance of the synthesized voice. 14
Is an input device including a keyboard and a mouse. Fifteen
Is an external storage device, and various dictionaries (syntax analysis dictionary 10
2. Semantic analysis dictionary 107, animation dictionary 11
2) and the control program 15a are stored. The control program 15a is loaded from the external storage device 15 to the RAM 12 at the time of execution. 16 is a speaker,
Outputs synthesized speech and the like.

【0012】図2は、第1の実施形態による文章読み上
げ装置の機能構成を示すブロック図である。同図におい
て101は文章入力部であり、キーボード等の入力装置
14により読み上げるべき文章を入力する。もちろん外
部記憶装置15等に予め記憶された文章であってもよ
い。102は構文解析辞書、103は構文解析部であ
る。構文解析部103は構文解析辞書102を参照しな
がら文章入力部101より入力された文章の構文解析を
行い、その結果を意味解析部108及び読み情報生成部
104へそれぞれ提供する。
FIG. 2 is a block diagram showing a functional configuration of the text-to-speech apparatus according to the first embodiment. Referring to FIG. 1, reference numeral 101 denotes a text input unit for inputting text to be read out by an input device 14 such as a keyboard. Of course, it may be a sentence stored in the external storage device 15 or the like in advance. 102 is a syntax analysis dictionary, and 103 is a syntax analysis unit. The syntax analysis unit 103 analyzes the syntax of the text input from the text input unit 101 while referring to the syntax analysis dictionary 102, and provides the result to the semantic analysis unit 108 and the reading information generation unit 104, respectively.

【0013】104は読み情報生成部であり、入力され
た構文解析の結果に基づいて、発声のための読み情報を
生成し、これを音声合成部105及びアニメーション生
成部110に提供する。音声合成部105は提供された
読み情報に基づいて音声合成を行い、音声情報を生成す
る。106は音声出力部であり、音声情報に基づいて、
スピーカ16を介して音声を出力する。
Reference numeral 104 denotes a reading information generation unit which generates reading information for utterance based on the input result of the syntax analysis, and provides the information to the speech synthesis unit 105 and the animation generation unit 110. The voice synthesis unit 105 performs voice synthesis based on the provided reading information to generate voice information. 106 is an audio output unit, based on audio information,
The sound is output via the speaker 16.

【0014】108は意味解析部であり、構文解析部1
03より提供される解析結果に基づいて、当該文章が表
す話者の雰囲気を解析し、その結果をムード情報取り出
し部109へ提供する。109はムード情報取り出し部
であり、意味解析部108の解析結果に基づいてムード
情報を生成する。本例ではムード情報として、「伝
聞」、「困惑」、「確信」を用意しておき、ムード情報
取り出し部109は意味解析の結果に基づいてこれらの
うちのいずれかを選択して、アニメーション生成部11
0に提供する。
Reference numeral 108 denotes a semantic analysis unit.
Based on the analysis result provided by the third sentence 03, the mood of the speaker represented by the sentence is analyzed, and the result is provided to the mood information extracting unit 109. A mood information extraction unit 109 generates mood information based on the analysis result of the semantic analysis unit 108. In this example, “hearing”, “confused”, and “convenience” are prepared as mood information, and the mood information extraction unit 109 selects one of these based on the result of the semantic analysis to generate an animation. Part 11
0 is provided.

【0015】110はアニメーション生成部であり、読
み情報生成部104より提供される読み情報に基づいて
唇のアニメーション情報を生成し、ムード情報取り出し
部109より提供されるムード情報に基づいて顔の表情
のアニメーション情報を生成する。なお、アニメーショ
ン生成部110は、口の動きを発声音声に同期させるた
めに、音声合成部105で生成された音声情報を入力
し、これに基づいて唇のアニメーション情報を生成す
る。111はアニメーション表示部であり、アニメーシ
ョン生成部110で生成されたアニメーション情報に基
づいて、ディスプレイ13に顔のアニメーション表示を
行う。
Reference numeral 110 denotes an animation generator which generates lip animation information based on the reading information provided by the reading information generator 104, and expresses the facial expression based on the mood information provided by the mood information extracting unit 109. Generate animation information for In order to synchronize the movement of the mouth with the uttered voice, the animation generating unit 110 inputs the voice information generated by the voice synthesizing unit 105, and generates lip animation information based on the voice information. Reference numeral 111 denotes an animation display unit, which performs animation display of a face on the display 13 based on the animation information generated by the animation generation unit 110.

【0016】図3は本実施形態によるアニメーション用
辞書112の構成例を示す図である。アニメーション用
辞書112は、表情のアニメーション情報を格納する表
情辞書部と唇のアニメーション情報を格納する唇アニメ
ーション辞書部とを備える。表情辞書部には、ムード情
報と表情データが対になって格納されている。また、唇
アニメーション辞書部には読み情報と唇のアニメーショ
ン情報が対となって格納されている。
FIG. 3 is a diagram showing a configuration example of the animation dictionary 112 according to the present embodiment. The animation dictionary 112 includes a facial expression dictionary unit for storing facial expression animation information and a lip animation dictionary unit for storing lip animation information. The expression dictionary section stores mood information and expression data in pairs. The lip animation dictionary section stores reading information and lip animation information in pairs.

【0017】以上のような構成を備えた本実施形態の文
章読み上げ装置の動作について説明する。図4は本実施
形態による文書読み上げ処理の手順を説明するフローチ
ャートである。
The operation of the text-to-speech apparatus according to the present embodiment having the above-described configuration will be described. FIG. 4 is a flowchart illustrating the procedure of the document reading process according to the present embodiment.

【0018】まず、ステップS201では文章入力部1
01より読み上げるべき文の入力を行う。ステップS2
02では未処理の文があるかどうかの判定を行い、ある
場合は、ステップS203に進む。
First, in step S201, the text input unit 1
A sentence to be read out from 01 is input. Step S2
In 02, it is determined whether there is an unprocessed sentence, and if so, the process proceeds to step S203.

【0019】ステップS203では構文解析部103が
ステップS201で入力された文について構文解析を行
う。そして、ステップS204では、構文解析の結果に
基づいて当該入力文の読み情報を生成する。また、ステ
ップS205では構文解析の結果に基づいて意味解析部
108が意味解析を行い、ステップS206では、ムー
ド情報取り出し部109が、その意味解析の結果に基づ
いてムード情報を取り出す。
In step S203, the syntax analysis unit 103 performs syntax analysis on the sentence input in step S201. Then, in step S204, reading information of the input sentence is generated based on the result of the syntax analysis. Further, in step S205, the semantic analysis unit 108 performs semantic analysis based on the result of the syntax analysis, and in step S206, the mood information extracting unit 109 extracts mood information based on the result of the semantic analysis.

【0020】例えば、図5の文生成例における文、「気
象庁によると、先週、梅雨入りしたそうです。」では、
意味解析により、下線部分の「気象庁によると」と「そ
うです」という表現から、「伝聞」というムード情報を
得る。同様に、例えば、図6の文生成例における文、
「今週は、残念ながら、低気圧が居座り、ずっと雨の天
気になってしまいました。」の場合では、意味解析によ
り、下線部分の「残念ながら」と「ってしまいました」
という表現から、「意外」というムード情報を得る。ま
た、同様に、図7の文生成例における文、「でも、大陸
から高気圧が張り出していますから、土曜日にはきっと
良いお天気になるでしょう」の場合では、意味解析によ
り、下線部分の「きっと」と「でしょう」という表現か
ら、「確信」というムード情報を得る。
For example, in the sentence generation example in FIG. 5, "according to the Japan Meteorological Agency, it is said that the rainy season began last week."
From the semantic analysis, the mood information of "hearing" is obtained from the underlined expressions "according to the Japan Meteorological Agency" and "yes". Similarly, for example, in the sentence generation example of FIG.
In the case of "Unfortunately, this week, the low pressure was sitting down and it was raining all the time." In the case of semantic analysis, "Unfortunately" was "underlined" by semantic analysis.
Mood information "surprise" is obtained from the expression. Similarly, in the sentence generation example in FIG. 7, “But, since the high pressure is overhanging from the continent, it will surely be a good weather on Saturday”, the semantic analysis shows that the underlined “ From the expressions "" and "", the mood information of "conviction" is obtained.

【0021】次に、ステップS207では、読み情報と
ムード情報からアニメーション用辞書112を用いて顔
(表情及び唇)のアニメーションの生成を行い、ステッ
プS208では、読み情報から合成音声の生成を行う。
そして、ステップS209では音声合成の出力を行い、
ステップS210で合成音声の出力に合わせてアニメー
ションの表示を行う。なお、ステップS209とステッ
プS210は、音と唇の形にずれが起らないように同期
が取られる。
Next, in step S207, animation of a face (expression and lips) is generated from the reading information and mood information using the animation dictionary 112, and in step S208, synthesized speech is generated from the reading information.
Then, in step S209, speech synthesis is output,
In step S210, an animation is displayed according to the output of the synthesized voice. Steps S209 and S210 are synchronized so that there is no deviation between the sound and the shape of the lips.

【0022】例えば、図5の例では、「伝聞」というム
ード情報から「視線をずらす」表情データがアニメーシ
ョン用辞書112から得られ、「視線をずらす」という
表情の変化を見せながら発声音声に応じて唇を動かすこ
とになる。以上のようにして合成の出力とのアニメーシ
ョン表示が終わったら、ステップS202へ戻り、未処
理の文の処理を行う。入力された文章に関して未処理の
文が無くなったら、ステップS202からステップS2
01へ戻り、次の文章入力に備える。
For example, in the example of FIG. 5, facial expression data of "displacement of the eyes" is obtained from the mood information of "hearing" from the animation dictionary 112. Will move your lips. When the animation display with the output of the composition is completed as described above, the process returns to step S202 to process the unprocessed sentence. When there is no unprocessed sentence for the input sentence, the process proceeds from step S202 to step S2.
Return to 01 and prepare for the next sentence input.

【0023】なお、図6の例では、ムード情報が「意
外」であることから「困惑」という表情データがアニメ
ーション用辞書112から獲得され、「困惑」を示す表
情が描画されている。また、図7の例では、ムード情報
が「確信」ということから「笑顔」という表情がアニメ
ーション用辞書112から獲得され、「笑顔」を示す表
情が描画されている。
In the example of FIG. 6, since the mood information is "unexpected", facial expression data of "confused" is obtained from the animation dictionary 112, and a facial expression indicating "confused" is drawn. In the example of FIG. 7, since the mood information is "convinced", the expression "smile" is obtained from the animation dictionary 112, and the expression indicating "smile" is drawn.

【0024】以上説明したように第1の実施形態によれ
ば、読み上げる文章を意味解析して話し手のムード情報
を取り出し、話し手のムード情報に基づいて発声中の顔
のアニメーションの視線位置や表情などが制御される。
このため、読み上げる文の内容にあわせて、適切な表情
の切り換えを行える文章読み上げ装置を提供できる。
As described above, according to the first embodiment, the sentence to be read is semantically analyzed to extract the mood information of the speaker, and based on the mood information of the speaker, the gaze position, facial expression, etc. of the animation of the face being uttered. Is controlled.
Therefore, it is possible to provide a text-to-speech apparatus capable of appropriately switching expressions according to the content of the text to be read.

【0025】[第2の実施形態]なお、上記第1の実施
形態では、意味解析結果のムードに対して一つの表情を
選択するようにしているが、一つのムードに対して複数
の表情を登録しておき、話し手を変えることによって、
異なる表情を選択するようにしてもよい。例えば、ムー
ドが「確信」の場合、話し手が「女性」であれば「笑
顔」を男性であれば「真摯」な表情を選択するというよ
うに構成してもよい。
[Second Embodiment] In the first embodiment, one facial expression is selected for the mood of the semantic analysis result. However, a plurality of facial expressions are selected for one mood. By registering and changing speakers,
Different facial expressions may be selected. For example, when the mood is “convinced”, the configuration may be such that if the speaker is “female”, “smile” is selected, and if the speaker is male, “sincere” expression is selected.

【0026】また、ムード情報だけでなく、待遇表現に
ついての解析も行い、文末が「です・ます」などの改ま
った表現には、「真面目」な表情、文末「よ・わ・ね」
のようなくだけた表現には、「くだけ」た表情のセット
の中から選択するようにしてもよい。
In addition to the mood information, analysis of treatment expressions is also performed.
For an expression that is incongruous like this, a selection may be made from a set of expressions that are “incongruous”.

【0027】また、目や口などの表情だけでなく、「疑
念」のムードの場合は、アニメーションの人物の頭の上
にクエスチョンマークを置くなどの表現方法をとっても
よい。
In the case of a mood of "skepticism" as well as facial expressions such as eyes and mouth, an expression method such as putting a question mark on the head of the person in the animation may be used.

【0028】また、読み上げる文を解析してムード情報
を取り出すのではなく、システムが意味表現から文を生
成して音声による出力を行う場合は、意味表現から直接
ムード情報を取り出すようにしてもよい。
If the system does not extract the mood information by analyzing the sentence to be read but outputs the speech by the system by generating the sentence from the semantic expression, the mood information may be directly extracted from the semantic expression. .

【0029】なお、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器からなる装置に適
用してもよい。前述した実施形態の機能を実現するソフ
トウエアのプログラムコードを記録した記録媒体を、シ
ステム或いは装置に供給し、そのシステム或いは装置の
コンピュータ(またはCPUやMPU)が記録媒体に格
納されたプログラムコードを読み出し実行することによ
っても、達成されることは言うまでもない。
The present invention may be applied to a system constituted by a plurality of devices or to an apparatus constituted by a single device. A recording medium storing software program codes for realizing the functions of the above-described embodiments is supplied to a system or an apparatus, and a computer (or CPU or MPU) of the system or apparatus executes the program code stored in the recording medium. Needless to say, this can also be achieved by executing the reading.

【0030】この場合、記録媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記録した記録媒体は
本発明を構成することになる。
In this case, the program code itself read from the recording medium implements the functions of the above-described embodiment, and the recording medium on which the program code is recorded constitutes the present invention.

【0031】プログラムコードを供給するための記録媒
体としては、例えば、フロッピーディスク,ハードディ
スク,光ディスク,光磁気ディスク,CD−ROM,C
D−R,磁気テープ,不揮発性のメモリカード,ROM
などを用いることができる。また、コンピュータが読み
だしたプログラムコードを実行することにより、前述し
た実施形態の機能が実現されるだけでなく、そのプログ
ラムコードの指示に基づき、コンピュータ上で稼働して
いるOSなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
As a recording medium for supplying the program code, for example, a floppy disk, hard disk, optical disk, magneto-optical disk, CD-ROM, C
DR, magnetic tape, nonvolatile memory card, ROM
Etc. can be used. The functions of the above-described embodiment are realized by executing the program codes read by the computer, and the OS or the like running on the computer performs actual processing based on the instructions of the program codes. It goes without saying that a part or all of the above is performed, and the processing realizes the functions of the above-described embodiments.

【0032】更に、記録媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書き込まれた後、そのプログラムコードの指示
に基づき、その機能拡張ボードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
Further, after the program code read from the recording medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, based on the instruction of the program code, The CPU provided in the function expansion board or function expansion unit performs part or all of the actual processing,
It goes without saying that a case where the function of the above-described embodiment is realized by the processing is also included.

【0033】[0033]

【発明の効果】以上説明したように本発明によれば、文
章の読み上げを実行するに際して、読み上げる文章の内
容に応じたアニメーション制御が可能となる。このた
め、読み上げる文の内容にあった表情の顔のアニメーシ
ョンを自動的に生成することができる。
As described above, according to the present invention, when a text is read aloud, animation control can be performed according to the content of the text to be read. For this reason, it is possible to automatically generate an animation of a facial expression corresponding to the content of the sentence to be read.

【0034】[0034]

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の実施形態による文章読み上げ装置の概略
構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a schematic configuration of a text-to-speech apparatus according to a first embodiment.

【図2】第1の実施形態による文章読み上げ装置の機能
構成を示すブロック図である。
FIG. 2 is a block diagram illustrating a functional configuration of the text-to-speech apparatus according to the first embodiment;

【図3】本実施形態によるアニメーション用辞書112
の構成例を示す図である。
FIG. 3 is an animation dictionary 112 according to the embodiment.
FIG. 3 is a diagram showing an example of the configuration of FIG.

【図4】本実施形態による文書読み上げ処理の手順を説
明するフローチャートである。
FIG. 4 is a flowchart illustrating a procedure of a document reading process according to the embodiment;

【図5】本実施形態による読み上げ文の例と顔のアニメ
ーション制御を説明する図である。
FIG. 5 is a diagram illustrating an example of a read-aloud sentence and animation control of a face according to the embodiment.

【図6】本実施形態による読み上げ文の例と顔のアニメ
ーション制御を説明する図である。
FIG. 6 is a diagram illustrating an example of a read-out sentence and animation control of a face according to the embodiment.

【図7】本実施形態による読み上げ文の例と顔のアニメ
ーション制御を説明する図である。
FIG. 7 is a diagram illustrating an example of a read-aloud sentence and animation control of a face according to the embodiment.

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 読み上げるべき文を解析して当該文の有
する雰囲気を示すムードを決定する決定手段と、 前記決定手段で決定されたムードに基づいてアニメーシ
ョン表示を制御する表示制御手段とを備えることを特徴
とするアニメーション制御装置。
A determination unit configured to analyze a sentence to be read and determine a mood indicating an atmosphere of the sentence; and a display control unit configured to control an animation display based on the mood determined by the determination unit. An animation control device characterized by the above-mentioned.
【請求項2】 前記表示制御手段は、更に、前記読み上
げるべき文に対応する読み情報に基づいてアニメーショ
ン表示を制御することを特徴とする請求項1に記載のア
ニメーション制御装置。
2. The animation control device according to claim 1, wherein said display control means further controls animation display based on reading information corresponding to the sentence to be read.
【請求項3】 話者の雰囲気を表すムードデータと各種
の表情を表す表情データとを対応づけて記憶するアニメ
ーション辞書と、 前記決定手段で決定されたムードに基づいて前記アニメ
ーション辞書より表情データを獲得する獲得手段とを更
に備え、 前記表示制御手段は、前記獲得手段で獲得された表情デ
ータに基づいて顔のアニメーション表示を制御すること
を特徴とする請求項1に記載のアニメーション制御装
置。
3. An animation dictionary for storing mood data representing a mood of a speaker and facial expression data representing various facial expressions in association with each other, and facial expression data from the animation dictionary based on the mood determined by the determining means. 2. The animation control device according to claim 1, further comprising: an acquisition unit configured to acquire, wherein the display control unit controls the animation display of the face based on the expression data acquired by the acquisition unit. 3.
【請求項4】 前記アニメーション辞書は、更に読み情
報と各種の口の動きを表す動作データを対応付けて記憶
し、 前記読み上げるべき文を解析して読み情報を生成する生
成手段と、 前記生成手段で生成された読み情報に基づいて前記アニ
メーション辞書より対応する口の動作データを獲得する
第2獲得手段とを更に備え、 前記表示制御手段は、前記獲得手段で獲得された表情デ
ータと前記第2獲得手段で獲得された動作データとに基
づいて顔のアニメーション表示を制御することを特徴と
する請求項3に記載のアニメーション制御装置。
4. The animation dictionary further stores reading information and motion data representing various mouth movements in association with each other, and generates reading information by analyzing the sentence to be read out, and the generating means. And a second acquisition unit for acquiring the corresponding mouth movement data from the animation dictionary based on the reading information generated in the step (a), wherein the display control unit includes the expression data acquired by the acquisition unit and the second expression data. The animation control device according to claim 3, wherein the animation display of the face is controlled based on the motion data acquired by the acquisition means.
【請求項5】 前記表情データは、目の動きを示すデー
タを含むことを特徴とする請求項1乃至4のいずれかに
記載のアニメーション制御装置。
5. The animation control device according to claim 1, wherein the expression data includes data indicating an eye movement.
【請求項6】 前記表情データは、顔のアニメーション
に付加すべき図形を含むことを特徴とする請求項1乃至
5のいずれかに記載のアニメーション制御装置。
6. The animation control device according to claim 1, wherein the expression data includes a graphic to be added to the animation of the face.
【請求項7】 請求項1乃至6のいずれかに記載のアニ
メーション制御装置と、 前記生成手段で生成された読み情報に基づいて音声出力
を行う出力手段とを備えることを特徴とする文読み上げ
装置。
7. A text-to-speech apparatus comprising: the animation control device according to claim 1; and an output unit that outputs a voice based on the reading information generated by the generation unit. .
【請求項8】 前記表示手段は前記出力手段による音声
出力に同期してアニメーションの制御を行うことを特徴
とする請求項7に記載の文読み上げ装置。
8. The text-to-speech apparatus according to claim 7, wherein the display means controls the animation in synchronization with the audio output by the output means.
【請求項9】 読み上げるべき文を解析して当該文の有
する雰囲気を示すムードを決定する決定工程と、 前記決定工程で決定されたムードに基づいてアニメーシ
ョン表示を制御する表示制御工程とを備えることを特徴
とするアニメーション制御方法。
9. A method for analyzing a sentence to be read out and determining a mood indicating an atmosphere of the sentence, and a display controlling step for controlling an animation display based on the mood determined in the determining step. An animation control method characterized by the following.
【請求項10】 前記表示制御工程は、更に、前記読み
上げるべき文に対応する読み情報に基づいてアニメーシ
ョン表示を制御することを特徴とする請求項9に記載の
アニメーション制御方法。
10. The animation control method according to claim 9, wherein the display control step further controls an animation display based on reading information corresponding to the sentence to be read aloud.
【請求項11】 前記決定工程で決定されたムードに基
づいて、話者の雰囲気を表すムードデータと各種の表情
を表す表情データとを対応づけて記憶するアニメーショ
ン辞書より表情データを獲得する獲得工程を更に備え、 前記表示制御工程は、前記獲得工程で獲得された表情デ
ータに基づいて顔のアニメーション表示を制御すること
を特徴とする請求項9に記載のアニメーション制御方
法。
11. An acquisition step of acquiring expression data from an animation dictionary that stores mood data representing a mood of a speaker and expression data representing various expressions in association with each other based on the mood determined in the determination step. The animation control method according to claim 9, further comprising: controlling the display of the face animation based on the expression data acquired in the acquiring step.
【請求項12】 前記アニメーション辞書は、更に読み
情報と各種の口の動きを表す動作データを対応付けて記
憶し、 前記読み上げるべき文を解析して読み情報を生成する生
成工程と、 前記生成工程で生成された読み情報に基づいて前記アニ
メーション辞書より対応する口の動作データを獲得する
第2獲得工程とを更に備え、 前記表示制御工程は、前記獲得工程で獲得された表情デ
ータと前記第2獲得工程で獲得された動作データとに基
づいて顔のアニメーション表示を制御することを特徴と
する請求項11に記載のアニメーション制御方法。
12. The animation dictionary further stores reading information and motion data representing various mouth movements in association with each other, and generates a reading information by analyzing the sentence to be read, and the generating step. And a second acquisition step of acquiring corresponding mouth movement data from the animation dictionary based on the reading information generated in the step (a). The display control step further comprises: the facial expression data acquired in the acquisition step; The animation control method according to claim 11, wherein the animation display of the face is controlled based on the motion data acquired in the acquiring step.
【請求項13】 前記表情データは、目の動きを示すデ
ータを含むことを特徴とする請求項9乃至12のいずれ
かに記載のアニメーション制御方法。
13. The animation control method according to claim 9, wherein the expression data includes data indicating an eye movement.
【請求項14】 前記表情データは、顔のアニメーショ
ンに付加すべき図形を含むことを特徴とする請求項9乃
至13のいずれかに記載のアニメーション制御方法。
14. The animation control method according to claim 9, wherein the expression data includes a figure to be added to the animation of the face.
【請求項15】 アニメーション表示を制御するための
制御プログラムを格納するコンピューター可読メモリで
あって、該制御プログラムが、 読み上げるべき文を解析して当該文の有する雰囲気を示
すムードを決定する決定工程のコードと、 前記決定工程で決定されたムードに基づいてアニメーシ
ョン表示を制御する表示制御工程のコードとを備えるこ
とを特徴とするコンピューター可読メモリ。
15. A computer readable memory storing a control program for controlling an animation display, the control program analyzing a sentence to be read out and determining a mood indicating an atmosphere of the sentence. A computer readable memory comprising: a code; and a code of a display control step of controlling an animation display based on the mood determined in the determining step.
JP4250198A 1998-02-24 1998-02-24 Animation control apparatus and method, and text-to-speech apparatus Pending JPH11242751A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4250198A JPH11242751A (en) 1998-02-24 1998-02-24 Animation control apparatus and method, and text-to-speech apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4250198A JPH11242751A (en) 1998-02-24 1998-02-24 Animation control apparatus and method, and text-to-speech apparatus

Publications (2)

Publication Number Publication Date
JPH11242751A true JPH11242751A (en) 1999-09-07
JPH11242751A5 JPH11242751A5 (en) 2004-09-30

Family

ID=12637824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4250198A Pending JPH11242751A (en) 1998-02-24 1998-02-24 Animation control apparatus and method, and text-to-speech apparatus

Country Status (1)

Country Link
JP (1) JPH11242751A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002133445A (en) * 2000-10-30 2002-05-10 Namco Ltd Image processing apparatus, image processing method, and information storage medium
KR20020042248A (en) * 2000-11-30 2002-06-05 한가람 Method and system for perceiving emotion from the text and visualizing the perceived emotion
KR100343006B1 (en) * 2000-06-01 2002-07-02 김상덕 Language input type facial expression control mathod
US6434525B1 (en) 1998-05-27 2002-08-13 Nec Corporation Human image dialogue device and a recording medium storing a human image dialogue device
KR20030042224A (en) * 2001-11-22 2003-05-28 최규동 A Visual Character And Article For Using The Same
JP2003233616A (en) * 2002-02-13 2003-08-22 Matsushita Electric Ind Co Ltd Provided information presenting device and information providing device
JP2003296753A (en) * 2002-04-04 2003-10-17 Computer Image Laboratory Co Ltd Dialogue system for the hearing impaired
KR20040039771A (en) * 2002-11-04 2004-05-12 김남조 A device for playing a sound from imoticon and method for playing the sound
EP1226550A4 (en) * 1999-10-08 2005-03-23 Electronic Arts Inc Remote communication through visual representations
KR100663921B1 (en) 2005-02-28 2007-01-02 중앙대학교 산학협력단 Emotional Expression Method of Avatar Based on Dynamic Emotional Space
EP1122687A3 (en) * 2000-01-25 2007-11-14 Nec Corporation Emotion expressing device
JP2015069231A (en) * 2013-09-26 2015-04-13 Kddi株式会社 Character generating apparatus and program
JP2021505943A (en) * 2017-12-06 2021-02-18 株式会社ソニー・インタラクティブエンタテインメント Face animation for social virtual reality (VR)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6318458A (en) * 1986-07-10 1988-01-26 Nec Corp Method and apparatus for extracting feeling information
JPH06162167A (en) * 1992-11-20 1994-06-10 Fujitsu Ltd Composite image display system
JPH0916800A (en) * 1995-07-04 1997-01-17 Fuji Electric Co Ltd Spoken dialogue system with face image
JPH09311945A (en) * 1996-05-22 1997-12-02 Fujitsu Ltd Model emotion expression device in 3D CG

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6318458A (en) * 1986-07-10 1988-01-26 Nec Corp Method and apparatus for extracting feeling information
JPH06162167A (en) * 1992-11-20 1994-06-10 Fujitsu Ltd Composite image display system
JPH0916800A (en) * 1995-07-04 1997-01-17 Fuji Electric Co Ltd Spoken dialogue system with face image
JPH09311945A (en) * 1996-05-22 1997-12-02 Fujitsu Ltd Model emotion expression device in 3D CG

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434525B1 (en) 1998-05-27 2002-08-13 Nec Corporation Human image dialogue device and a recording medium storing a human image dialogue device
EP1226550A4 (en) * 1999-10-08 2005-03-23 Electronic Arts Inc Remote communication through visual representations
EP1122687A3 (en) * 2000-01-25 2007-11-14 Nec Corporation Emotion expressing device
KR100343006B1 (en) * 2000-06-01 2002-07-02 김상덕 Language input type facial expression control mathod
JP2002133445A (en) * 2000-10-30 2002-05-10 Namco Ltd Image processing apparatus, image processing method, and information storage medium
KR20020042248A (en) * 2000-11-30 2002-06-05 한가람 Method and system for perceiving emotion from the text and visualizing the perceived emotion
KR20030042224A (en) * 2001-11-22 2003-05-28 최규동 A Visual Character And Article For Using The Same
JP2003233616A (en) * 2002-02-13 2003-08-22 Matsushita Electric Ind Co Ltd Provided information presenting device and information providing device
JP2003296753A (en) * 2002-04-04 2003-10-17 Computer Image Laboratory Co Ltd Dialogue system for the hearing impaired
KR20040039771A (en) * 2002-11-04 2004-05-12 김남조 A device for playing a sound from imoticon and method for playing the sound
KR100663921B1 (en) 2005-02-28 2007-01-02 중앙대학교 산학협력단 Emotional Expression Method of Avatar Based on Dynamic Emotional Space
JP2015069231A (en) * 2013-09-26 2015-04-13 Kddi株式会社 Character generating apparatus and program
JP2021505943A (en) * 2017-12-06 2021-02-18 株式会社ソニー・インタラクティブエンタテインメント Face animation for social virtual reality (VR)

Similar Documents

Publication Publication Date Title
US8131551B1 (en) System and method of providing conversational visual prosody for talking heads
US7349852B2 (en) System and method of providing conversational visual prosody for talking heads
US8793133B2 (en) Systems and methods document narration
US8954328B2 (en) Systems and methods for document narration with multiple characters having multiple moods
US20190196666A1 (en) Systems and Methods Document Narration
US20230298564A1 (en) Speech synthesis method and apparatus, device, and storage medium
CN107204027B (en) Image processing device, display device, animation generation method, and animation display method
JP7069386B1 (en) Audio converters, audio conversion methods, programs, and recording media
JPH11242751A (en) Animation control apparatus and method, and text-to-speech apparatus
KR101597286B1 (en) Apparatus for generating avatar image message and method thereof
JP2003271194A (en) Voice interactive device and control method thereof
JP3958908B2 (en) Transcription text automatic generation device, speech recognition device, and recording medium
CN117372588A (en) Method and device for generating mouth image
JP2001013982A (en) Voice synthesizer
JP2003280680A (en) Speech synthesis apparatus and method, program therefor, and storage medium
JPH11175308A (en) Specifying method for tone of voice of document reading-aloud
CN119729036A (en) Role dubbing method, device, equipment and storage medium of video content
CN121459772A (en) Lip synchronous personification control method and system for high-simulation humanoid robot
JPH09258784A (en) Speech synthesizer and method
JP2003122387A (en) Speaking system
JPH0883270A (en) Speech synthesizer and method thereof
KR19990029133A (en) How to extract Hangul consonants and vowels

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061204