JPH1166345A - 画像音響処理装置および記録媒体 - Google Patents
画像音響処理装置および記録媒体Info
- Publication number
- JPH1166345A JPH1166345A JP9216163A JP21616397A JPH1166345A JP H1166345 A JPH1166345 A JP H1166345A JP 9216163 A JP9216163 A JP 9216163A JP 21616397 A JP21616397 A JP 21616397A JP H1166345 A JPH1166345 A JP H1166345A
- Authority
- JP
- Japan
- Prior art keywords
- image
- mouth
- expressing
- sound
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/60—Methods for processing data by generating or executing the game program
- A63F2300/6063—Methods for processing data by generating or executing the game program for sound processing
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/60—Methods for processing data by generating or executing the game program
- A63F2300/66—Methods for processing data by generating or executing the game program for rendering three dimensional images
- A63F2300/6607—Methods for processing data by generating or executing the game program for rendering three dimensional images for animating game characters, e.g. skeleton kinematics
Landscapes
- Processing Or Creating Images (AREA)
Abstract
(57)【要約】
【課題】 実際に人間が発音する様子を自然に模擬し、
まるでモデルが本当に唄ったり話したりしていると錯覚
させることのできる表現力を有する画像音響処理装置お
よび記録媒体を提供する。 【解決手段】 音響を生成するための音響生成手段(1
2)と、音響生成手段に発音させる音節を発音する際の
口の動きを表現する画像を表示するための画像表示手段
(10、11)と、母音を発音する際の口を表現するための画
像データを母音の種類だけした記憶手段(102、121)と、
を備える。画像表示手段(10、11)は、音響生成手段(12)
に発音させる音節に含まれる母音を識別し、識別した母
音を発音する際の口を表現するための画像データを記憶
手段(102、121)から読み取り、読み取った画像データに
基づいて画像表示する。
まるでモデルが本当に唄ったり話したりしていると錯覚
させることのできる表現力を有する画像音響処理装置お
よび記録媒体を提供する。 【解決手段】 音響を生成するための音響生成手段(1
2)と、音響生成手段に発音させる音節を発音する際の
口の動きを表現する画像を表示するための画像表示手段
(10、11)と、母音を発音する際の口を表現するための画
像データを母音の種類だけした記憶手段(102、121)と、
を備える。画像表示手段(10、11)は、音響生成手段(12)
に発音させる音節に含まれる母音を識別し、識別した母
音を発音する際の口を表現するための画像データを記憶
手段(102、121)から読み取り、読み取った画像データに
基づいて画像表示する。
Description
【0001】
【発明の属する技術分野】本発明は、声を発する人間等
の画像をその音声とともに表現する画像音響処理装置に
係り、特に、実際に人間が発音する際の口の動きを表現
できる画像音響処理技術の改良に関する。
の画像をその音声とともに表現する画像音響処理装置に
係り、特に、実際に人間が発音する際の口の動きを表現
できる画像音響処理技術の改良に関する。
【0002】
【従来の技術】コンピュータグラフィックス技術の発達
に伴い、実物の人間を模擬したモデルをポリゴン等によ
り構成できるようになった。その中で、音声に合わせて
モデルの口を動かして、モデルが唄ったり喋ったりして
いる様子を表現する画像処理装置があった。
に伴い、実物の人間を模擬したモデルをポリゴン等によ
り構成できるようになった。その中で、音声に合わせて
モデルの口を動かして、モデルが唄ったり喋ったりして
いる様子を表現する画像処理装置があった。
【0003】実際のところ、人間が言語を発音する際の
口の動きは複雑である。このため、従来の画像処理装置
では、口を開いているか閉じているかの二種類の画像デ
ータのみを保持し、これら二種の画像データに基づいて
音声に合わせてモデルの口を交互に動かす画像表示を行
っていた。
口の動きは複雑である。このため、従来の画像処理装置
では、口を開いているか閉じているかの二種類の画像デ
ータのみを保持し、これら二種の画像データに基づいて
音声に合わせてモデルの口を交互に動かす画像表示を行
っていた。
【0004】しかしながら、従来の画像処理装置では、
モデルが実際に言葉を発音しているといえるまでの巧み
な口の動きを表現できないという不都合があった。すな
わち、口を開くか閉じるかの二種類の表現のみでは、実
際に人間が発音する際の多様な口の動きを真似ることが
できないため、完全に音声に同期させて口を動かしたと
しても、不自然な口の動きしか再現できなかった。
モデルが実際に言葉を発音しているといえるまでの巧み
な口の動きを表現できないという不都合があった。すな
わち、口を開くか閉じるかの二種類の表現のみでは、実
際に人間が発音する際の多様な口の動きを真似ることが
できないため、完全に音声に同期させて口を動かしたと
しても、不自然な口の動きしか再現できなかった。
【0005】その一方で、すべての口の動きを表現でき
る画像データを記憶するのは、膨大なデータ量となるた
め、工業的な応用に適さないという不都合もあった。
る画像データを記憶するのは、膨大なデータ量となるた
め、工業的な応用に適さないという不都合もあった。
【0006】
【発明が解決しようとする課題】本発明は、従来の画像
処理装置における不都合を解決するために、実際に人間
が発音する様子を自然に模擬し、まるでモデルが本当に
唄ったり話したりしていると錯覚させることのできる表
現力を有する画像音響処理装置およびそれを実現させる
プログラムデータが記録された記録媒体を提供すること
を目的とする。
処理装置における不都合を解決するために、実際に人間
が発音する様子を自然に模擬し、まるでモデルが本当に
唄ったり話したりしていると錯覚させることのできる表
現力を有する画像音響処理装置およびそれを実現させる
プログラムデータが記録された記録媒体を提供すること
を目的とする。
【0007】すなわち、本発明の第1の課題は、一定量
の画像データで実際に人間が音節(syllable)を発音す
る様子を模擬できる画像音響処理技術を提供することで
ある。
の画像データで実際に人間が音節(syllable)を発音す
る様子を模擬できる画像音響処理技術を提供することで
ある。
【0008】本発明の第2の課題は、特殊な口の動かし
方となる音節であっても、人間が発音する様子を自然に
模擬できる画像音響処理技術を提供することである。
方となる音節であっても、人間が発音する様子を自然に
模擬できる画像音響処理技術を提供することである。
【0009】本発明の第3の課題は、同一の母音を有す
る音節が連続しても、人間が発音する様子を自然に模擬
できる画像音響処理技術を提供することである。
る音節が連続しても、人間が発音する様子を自然に模擬
できる画像音響処理技術を提供することである。
【0010】本発明の第4の課題は、連続した音節に含
まれる母音が異なる場合であっても、人間が発音する様
子をより自然に模擬できる画像処理技術を提供すること
である。
まれる母音が異なる場合であっても、人間が発音する様
子をより自然に模擬できる画像処理技術を提供すること
である。
【0011】本発明の第5の課題は、撥音を含む音節が
連続しても、人間が発音する様子を自然に模擬できる画
像音響処理技術を提供することである。
連続しても、人間が発音する様子を自然に模擬できる画
像音響処理技術を提供することである。
【0012】
【課題を解決するための手段】上記第1の課題を解決す
る発明は、口の動きを表現する画像に合わせて音響を生
成するための画像音響処理装置において、音響を生成す
るための音響生成手段と、音節を発音する際の口の動き
を表現する画像を表示するための画像表示手段と、母音
を発音する際の口を表現するための画像データを母音の
種類だけ記憶させた記憶手段と、を備える。
る発明は、口の動きを表現する画像に合わせて音響を生
成するための画像音響処理装置において、音響を生成す
るための音響生成手段と、音節を発音する際の口の動き
を表現する画像を表示するための画像表示手段と、母音
を発音する際の口を表現するための画像データを母音の
種類だけ記憶させた記憶手段と、を備える。
【0013】そして、画像表示手段は、音響生成手段に
発音させる音節に含まれる母音を識別し、識別した母音
を発音する際の口を表現するための画像データを記憶手
段から読み取り、読み取った画像データに基づいて画像
表示する。
発音させる音節に含まれる母音を識別し、識別した母音
を発音する際の口を表現するための画像データを記憶手
段から読み取り、読み取った画像データに基づいて画像
表示する。
【0014】なお、音節とは、音の単位で、一つのまと
まった音の感じを与えるものをいう。母音とは、日本語
では「あ」、「い」、「う」、「え」および「お」の五
音をいい、英語では、‘a’、‘i’、‘u’、‘e’およ
び‘o’をいう。音節に含まれる母音とは、主として音
節の語尾に含まれる母音をいう。
まった音の感じを与えるものをいう。母音とは、日本語
では「あ」、「い」、「う」、「え」および「お」の五
音をいい、英語では、‘a’、‘i’、‘u’、‘e’およ
び‘o’をいう。音節に含まれる母音とは、主として音
節の語尾に含まれる母音をいう。
【0015】上記第2の課題を解決する発明は、記憶手
段には、母音を発音する際の口を表現するための画像デ
ータの他に、半開きした口を表現するための画像データ
が記憶され、画像表示手段は、音響生成手段に発音させ
る音節が予め定められた特定の音節である場合には、記
憶手段に記憶された半開きした口を表現するための画像
データおよび当該音節に含まれる母音を発音する際の口
を表現するための画像データに基づいて、半開きした口
を表現する画像に続けて母音を発音する際の口を表現す
る画像を表示する。
段には、母音を発音する際の口を表現するための画像デ
ータの他に、半開きした口を表現するための画像データ
が記憶され、画像表示手段は、音響生成手段に発音させ
る音節が予め定められた特定の音節である場合には、記
憶手段に記憶された半開きした口を表現するための画像
データおよび当該音節に含まれる母音を発音する際の口
を表現するための画像データに基づいて、半開きした口
を表現する画像に続けて母音を発音する際の口を表現す
る画像を表示する。
【0016】なお、半開きした口とは、例えば、「あ
(a)」と「え(e)」の中間的な口の開き方をいう。
(a)」と「え(e)」の中間的な口の開き方をいう。
【0017】上記第3の課題を解決する発明は、記憶手
段には、母音を発音する際の口を表現するための画像デ
ータの他に、半開きした口を表現するための画像データ
が記憶され、画像表示手段は、音響生成手段に発音させ
る連続した音節が同一の母音を含んでいると識別した場
合には、記憶手段に記憶された半開きした口を表現する
ための画像データに基づいて、連続した音節の各々を発
音する口を表現するための画像の合間に、半開きした口
を表現する画像を表示する。
段には、母音を発音する際の口を表現するための画像デ
ータの他に、半開きした口を表現するための画像データ
が記憶され、画像表示手段は、音響生成手段に発音させ
る連続した音節が同一の母音を含んでいると識別した場
合には、記憶手段に記憶された半開きした口を表現する
ための画像データに基づいて、連続した音節の各々を発
音する口を表現するための画像の合間に、半開きした口
を表現する画像を表示する。
【0018】上記第4の課題を解決する発明は、記憶手
段には、母音を発音する際の口を表現するための画像デ
ータの他に、異なる母音の1以上の組み合わせにおい
て、各組み合わせに係る二種類の母音の中間的な口の開
き方を表現するための画像データが記憶され、画像表示
手段は、音響生成手段に異なる母音を含む連続した音節
を発音させる際に、前記記憶手段に記憶された画像デー
タに基づいて、異なる母音の各々を発音する口を表現す
るための画像の合間に、これら二種類の母音の中間的な
口の開き方を表現するための画像を表示する。
段には、母音を発音する際の口を表現するための画像デ
ータの他に、異なる母音の1以上の組み合わせにおい
て、各組み合わせに係る二種類の母音の中間的な口の開
き方を表現するための画像データが記憶され、画像表示
手段は、音響生成手段に異なる母音を含む連続した音節
を発音させる際に、前記記憶手段に記憶された画像デー
タに基づいて、異なる母音の各々を発音する口を表現す
るための画像の合間に、これら二種類の母音の中間的な
口の開き方を表現するための画像を表示する。
【0019】上記第5の課題を解決する発明は、記憶手
段には、母音を発音する際の口を表現するための画像デ
ータの他に、閉じた口を表現するための画像データが記
憶され、画像表示手段は、音響生成手段に発音させる音
節が撥音を含む場合に、記憶手段に記憶された閉じた口
を表現するための画像データに基づいて画像表示する。
段には、母音を発音する際の口を表現するための画像デ
ータの他に、閉じた口を表現するための画像データが記
憶され、画像表示手段は、音響生成手段に発音させる音
節が撥音を含む場合に、記憶手段に記憶された閉じた口
を表現するための画像データに基づいて画像表示する。
【0020】なお、本発明において、記憶手段は記憶装
置に相当する。画像表示手段は、処理回路および画像表
示回路に相当する。また、音響生成回路は、口の動きを
表現する画像データとともに提供される波形データに基
づき、その音節の音響を生成するものである。
置に相当する。画像表示手段は、処理回路および画像表
示回路に相当する。また、音響生成回路は、口の動きを
表現する画像データとともに提供される波形データに基
づき、その音節の音響を生成するものである。
【0021】上記第2の課題を解決する発明において、
特定の音節には、‘さ’、‘せ’、‘た’、‘ま’、
‘み’、‘む’、‘め’、‘も’、‘わ’、‘を’、
‘ば’、‘び’、‘ぶ’、‘べ’、‘ぼ’、‘ぱ’、
‘ぴ’、‘ぷ’、‘ぺ’および‘ぽ’の一部または全部
を含む。
特定の音節には、‘さ’、‘せ’、‘た’、‘ま’、
‘み’、‘む’、‘め’、‘も’、‘わ’、‘を’、
‘ば’、‘び’、‘ぶ’、‘べ’、‘ぼ’、‘ぱ’、
‘ぴ’、‘ぷ’、‘ぺ’および‘ぽ’の一部または全部
を含む。
【0022】前記第1の課題を解決する発明は、音節の
識別が、文字データに基づいて行われる。
識別が、文字データに基づいて行われる。
【0023】本発明における音節には、母音の他に、撥
音等任意の音を含めることができる。
音等任意の音を含めることができる。
【0024】本発明における記録媒体には、例えば、フ
ロッピーディスク、ハードディスク、磁気テープ、光磁
気ディスク、CD−ROM、DVD、ROMカートリッ
ジ、バッテリバックアップ付きのRAMメモリカートリ
ッジ、フラッシュメモリカートリッジ、不揮発性RAM
カートリッジ等を含む。
ロッピーディスク、ハードディスク、磁気テープ、光磁
気ディスク、CD−ROM、DVD、ROMカートリッ
ジ、バッテリバックアップ付きのRAMメモリカートリ
ッジ、フラッシュメモリカートリッジ、不揮発性RAM
カートリッジ等を含む。
【0025】また、電話回線等の有線通信媒体、マイク
ロ波回線等の無線通信媒体等の通信媒体を含む。インタ
ーネットもここでいう通信媒体に含まれる。
ロ波回線等の無線通信媒体等の通信媒体を含む。インタ
ーネットもここでいう通信媒体に含まれる。
【0026】記録媒体とは、何等かの物理的手段により
情報(主にデジタルデータ、プログラム)が記録されて
いるものであって、コンピュータ、専用プロセッサ等の
処理装置に所定の機能を行わせることができるものであ
る。要するに、何等かの手段でもってコンピュータにプ
ログラムをダウンロードし、所定の機能を実行させるも
のであればよい。
情報(主にデジタルデータ、プログラム)が記録されて
いるものであって、コンピュータ、専用プロセッサ等の
処理装置に所定の機能を行わせることができるものであ
る。要するに、何等かの手段でもってコンピュータにプ
ログラムをダウンロードし、所定の機能を実行させるも
のであればよい。
【0027】
【発明の実施の形態】本発明の好適な実施の形態は、ゲ
ーム装置に本発明の画像音響処理装置を適用した。以
下、図面を参照して説明する。
ーム装置に本発明の画像音響処理装置を適用した。以
下、図面を参照して説明する。
【0028】(装置構成)図1に、本実施形態のゲーム
装置の外観図を示す。図1に示すように、本形態のゲー
ム装置は、ゲーム装置本体1、パッド2bおよびモニタ
装置5を備えている。
装置の外観図を示す。図1に示すように、本形態のゲー
ム装置は、ゲーム装置本体1、パッド2bおよびモニタ
装置5を備えている。
【0029】ゲーム装置本体1は、その内部に、本発明
の画像音響処理装置が収められている。その外装には、
ROMカートリッジ接続用のインターフェース(I/
F)部1a、CD−ROM読取用のCD−ROMドライ
ブ1bが設けられている。パッド2bは、十字カーソル
や複数の操作ボタンを備え、遊技者の操作に基づいて操
作信号を生成可能に構成される。そして、この操作信号
がケーブル2cを介してコネクタ2aに供給可能に構成
されている。パッド2bは、コネクタ2aによりゲーム
装置本体1に着脱可能に設けられ、二人の遊技者が同時
に操作するために二つのパッドが接続可能に構成され
る。なお、パッドの代わりに、マウス、リモコン、キー
ボード等を接続して構成してもよい。モニタ装置5は、
ビデオケーブル4aおよびオーディオケーブル4bを介
して、ゲーム装置本体1の図示しないビデオ出力端子お
よびオーディオ出力端子に接続されて構成されている。
の画像音響処理装置が収められている。その外装には、
ROMカートリッジ接続用のインターフェース(I/
F)部1a、CD−ROM読取用のCD−ROMドライ
ブ1bが設けられている。パッド2bは、十字カーソル
や複数の操作ボタンを備え、遊技者の操作に基づいて操
作信号を生成可能に構成される。そして、この操作信号
がケーブル2cを介してコネクタ2aに供給可能に構成
されている。パッド2bは、コネクタ2aによりゲーム
装置本体1に着脱可能に設けられ、二人の遊技者が同時
に操作するために二つのパッドが接続可能に構成され
る。なお、パッドの代わりに、マウス、リモコン、キー
ボード等を接続して構成してもよい。モニタ装置5は、
ビデオケーブル4aおよびオーディオケーブル4bを介
して、ゲーム装置本体1の図示しないビデオ出力端子お
よびオーディオ出力端子に接続されて構成されている。
【0030】(ブロック構成)図2に、本発明の画像音
響処理装置を適用したゲーム装置のブロック図を示す。
図2に示すように、本ゲーム装置は、CPUブロック1
0、ビデオブロック11、サウンドブロック12および
サブシステム13により構成される。
響処理装置を適用したゲーム装置のブロック図を示す。
図2に示すように、本ゲーム装置は、CPUブロック1
0、ビデオブロック11、サウンドブロック12および
サブシステム13により構成される。
【0031】(CPUブロック)CPUブロック10
は、本発明の画像表示手段の一部および処理回路であっ
て、プログラムにしたがってゲーム処理を進めるととも
に、本発明の画像音響処理を制御するものであって、S
CU(System Control Unit)100、メインCPU1
01、RAM102、ROM103、サブCPU104
およびCPUバス105等により構成されている。
は、本発明の画像表示手段の一部および処理回路であっ
て、プログラムにしたがってゲーム処理を進めるととも
に、本発明の画像音響処理を制御するものであって、S
CU(System Control Unit)100、メインCPU1
01、RAM102、ROM103、サブCPU104
およびCPUバス105等により構成されている。
【0032】メインCPU101は、その内部にDSP
(Digital Signal Processor)を備え、CD−ROM1
から転送されたプログラムデータに基づく処理を高速に
実行可能に構成されている。RAM102は、CD−R
OM1から読み取られたアプリケーションソフトのプロ
グラムデータ、音響制御プログラムデータ、波形データ
および各音節を発音する口の形を表現させるための画像
データが格納されている。また、RAM102は、MP
EG画像復号時のワークエリアおよびCD−ROM復号
時の誤り訂正用データキャッシュとして使用可能に構成
されている。ROM103は、当該装置の初期化処理の
ために用いるイニシャルプログラムデータが格納可能に
構成されている。SCU100は、バス105、106
および107を介して行われるデータの転送を統括可能
に構成されている。また、SCU100は、内部にDM
Aコントローラを備え、RAM102等に格納されたゲ
ームの実行中に必要になる画像データをビデオブロック
11内のVRAMへ転送可能に、音響制御プログラムデ
ータおよび波形データをサウンドブロック12に転送可
能に構成されている。
(Digital Signal Processor)を備え、CD−ROM1
から転送されたプログラムデータに基づく処理を高速に
実行可能に構成されている。RAM102は、CD−R
OM1から読み取られたアプリケーションソフトのプロ
グラムデータ、音響制御プログラムデータ、波形データ
および各音節を発音する口の形を表現させるための画像
データが格納されている。また、RAM102は、MP
EG画像復号時のワークエリアおよびCD−ROM復号
時の誤り訂正用データキャッシュとして使用可能に構成
されている。ROM103は、当該装置の初期化処理の
ために用いるイニシャルプログラムデータが格納可能に
構成されている。SCU100は、バス105、106
および107を介して行われるデータの転送を統括可能
に構成されている。また、SCU100は、内部にDM
Aコントローラを備え、RAM102等に格納されたゲ
ームの実行中に必要になる画像データをビデオブロック
11内のVRAMへ転送可能に、音響制御プログラムデ
ータおよび波形データをサウンドブロック12に転送可
能に構成されている。
【0033】サブCPU104はSMPC(System Man
ager & Peripheral Control)と呼ばれ、メインCPU
101の要求に応じパッド2bからの操作信号を収集可
能に構成される。
ager & Peripheral Control)と呼ばれ、メインCPU
101の要求に応じパッド2bからの操作信号を収集可
能に構成される。
【0034】(ビデオブロックの構成)ビデオブロック
11は、本発明の画像表示手段の一部および画像表示回
路であって、VDP(Video Display Processor)12
0、VDP130、VRAM121、フレームバッファ
122、123、VRAM131およびメモリ132を
備えて構成されている。
11は、本発明の画像表示手段の一部および画像表示回
路であって、VDP(Video Display Processor)12
0、VDP130、VRAM121、フレームバッファ
122、123、VRAM131およびメモリ132を
備えて構成されている。
【0035】VRAM121は、メインCPU101に
よりSCU100を介して転送された描画コマンドを格
納可能に構成されている。
よりSCU100を介して転送された描画コマンドを格
納可能に構成されている。
【0036】VDP120は、VRAM121に格納さ
れた描画コマンドに基づいて、ビットマップ形式の画像
データの生成、図形の変形、影やシェーディング等の色
演算等を行い、生成した画像データをフレームバッファ
122および123に書込み可能に構成されている。
れた描画コマンドに基づいて、ビットマップ形式の画像
データの生成、図形の変形、影やシェーディング等の色
演算等を行い、生成した画像データをフレームバッファ
122および123に書込み可能に構成されている。
【0037】フレームバッファ122および123は、
VDP120により生成させられた画像データを格納可
能に構成されている。
VDP120により生成させられた画像データを格納可
能に構成されている。
【0038】VRAM131は、背景画像の画像デー
タ、VDP130の機能実現に必要なデータテーブル等
を格納可能に構成されている。
タ、VDP130の機能実現に必要なデータテーブル等
を格納可能に構成されている。
【0039】VDP130は、VRAM131、フレー
ムバッファ122および123に格納された画像データ
に基づいて、選択枠を設定するウインドウ処理、影をつ
ける処理、拡大・縮小、回転、モザイク処理、移動処
理、クリッピングや表示優先順位処理等の陰面処理、等
の画像処理を行い表示画像データをメモリ132に格納
可能に構成されている。
ムバッファ122および123に格納された画像データ
に基づいて、選択枠を設定するウインドウ処理、影をつ
ける処理、拡大・縮小、回転、モザイク処理、移動処
理、クリッピングや表示優先順位処理等の陰面処理、等
の画像処理を行い表示画像データをメモリ132に格納
可能に構成されている。
【0040】メモリ132は、VDP130により描画
用画像データが格納され、エンコーダ160に出力可能
に構成されている。
用画像データが格納され、エンコーダ160に出力可能
に構成されている。
【0041】エンコーダ160は、メモリ132に格納
されている描画用画像データをビデオ信号のフォーマッ
トに変換し、D/A変換してモニタ装置5へ供給可能に
構成されている。
されている描画用画像データをビデオ信号のフォーマッ
トに変換し、D/A変換してモニタ装置5へ供給可能に
構成されている。
【0042】モニタ装置5は、供給されたビデオ信号に
基づいた画像を表示可能に構成されている。
基づいた画像を表示可能に構成されている。
【0043】(サウンドブロック)サウンドブロック1
2は、本発明の音響生成手段および音響生成回路であっ
て、DSP140と、CPU141とにより構成され
る。
2は、本発明の音響生成手段および音響生成回路であっ
て、DSP140と、CPU141とにより構成され
る。
【0044】CPU141は、メインCPU101から
転送された音響制御プログラムデータおよび波形データ
をDSP140に転送可能に構成されている。DSP1
40は、音響メモリを内蔵して構成されている。そして
CPU141の制御により、波形データを参照してPC
M音源またはFM音源による波形発生、遅延データの生
成、および音声合成を行い、生成した波形データをD/
Aコンバータ170に出力可能に構成されている。DS
P140は、これらの作用により周波数制御、音量制
御、FM演算、変調、音声合成、リバーブ等の機能を備
えている。D/Aコンバータ170は、DSP140に
よって生成された波形データを2チャンネルの信号に変
換し、スピーカ5aおよび5bに供給可能に構成されて
いる。
転送された音響制御プログラムデータおよび波形データ
をDSP140に転送可能に構成されている。DSP1
40は、音響メモリを内蔵して構成されている。そして
CPU141の制御により、波形データを参照してPC
M音源またはFM音源による波形発生、遅延データの生
成、および音声合成を行い、生成した波形データをD/
Aコンバータ170に出力可能に構成されている。DS
P140は、これらの作用により周波数制御、音量制
御、FM演算、変調、音声合成、リバーブ等の機能を備
えている。D/Aコンバータ170は、DSP140に
よって生成された波形データを2チャンネルの信号に変
換し、スピーカ5aおよび5bに供給可能に構成されて
いる。
【0045】なお、上記波形データには、人間の音声が
含まれる。音響制御プログラムデータには、この人間の
音節を示す文字コードが含まれる。このコードは、例え
ば画像表示させるモデルの唄う曲の歌詞データである。
含まれる。音響制御プログラムデータには、この人間の
音節を示す文字コードが含まれる。このコードは、例え
ば画像表示させるモデルの唄う曲の歌詞データである。
【0046】(サブシステム)サブシステム13は、C
D−ROMドライブ1b、CDインターフェース(I/
F)180、CPU181、MPEGオーディオ回路1
82およびMPEGビデオ回路183を備えて構成され
ている。
D−ROMドライブ1b、CDインターフェース(I/
F)180、CPU181、MPEGオーディオ回路1
82およびMPEGビデオ回路183を備えて構成され
ている。
【0047】CD―ROMドライブ1bは、CD―RO
Mからアプリケーションソフトのプログラムデータ、画
像データ、音響制御プログラムデータおよび波形データ
を読み取り、CDインターフェース180はこれらをC
PUブロック10に供給可能に構成されている。また、
CPU181は、MPEGオーディオ回路182および
MPEGビデオ回路183を制御して、MPEG規格に
より高能率符号圧縮化された画像データおよび音響デー
タを復号化可能に構成されている。
Mからアプリケーションソフトのプログラムデータ、画
像データ、音響制御プログラムデータおよび波形データ
を読み取り、CDインターフェース180はこれらをC
PUブロック10に供給可能に構成されている。また、
CPU181は、MPEGオーディオ回路182および
MPEGビデオ回路183を制御して、MPEG規格に
より高能率符号圧縮化された画像データおよび音響デー
タを復号化可能に構成されている。
【0048】(原理説明)次に本発明の原理を説明す
る。本実施形態のゲームでは、実際のアイドルを模擬し
たモデルを、いわゆるポリゴンにより構成して表示す
る。例えば、図8に示すように、モデルの顔は、多数の
微少三角形、あるいは四角形のポリゴンの各々により構
成される。ある画像を表示させる場合、次の表示タイミ
ング(例えば垂直同期タイミング)に先んじて、メイン
CPU101は、個々のポリゴンのワールド座標系にお
ける空間位置を特定する座標データとともに、各頂点座
標等を特定するポリゴンデータをビデオブロック11の
VRAM121に転送する。ビデオブロック11では、
VDP120がこれらデータを参照して、図8に示すよ
うなモデルの顔等のセグメントを生成し、個々のポリゴ
ンの表面に模様であるテクスチャーデータをビットマッ
プ形式で適用する(貼り付ける)。さらにVDP120
は、セグメントの表面を滑らかにするシェーディング処
理を行って、図9に示すように、実際のアイドルに似せ
たセグメントの画像を完成させる。この画像は、エンコ
ーダ160により、表示させるべきタイミングに合わせ
たビデオ信号に変換され、モニタ装置5にモデルの顔が
表示される。
る。本実施形態のゲームでは、実際のアイドルを模擬し
たモデルを、いわゆるポリゴンにより構成して表示す
る。例えば、図8に示すように、モデルの顔は、多数の
微少三角形、あるいは四角形のポリゴンの各々により構
成される。ある画像を表示させる場合、次の表示タイミ
ング(例えば垂直同期タイミング)に先んじて、メイン
CPU101は、個々のポリゴンのワールド座標系にお
ける空間位置を特定する座標データとともに、各頂点座
標等を特定するポリゴンデータをビデオブロック11の
VRAM121に転送する。ビデオブロック11では、
VDP120がこれらデータを参照して、図8に示すよ
うなモデルの顔等のセグメントを生成し、個々のポリゴ
ンの表面に模様であるテクスチャーデータをビットマッ
プ形式で適用する(貼り付ける)。さらにVDP120
は、セグメントの表面を滑らかにするシェーディング処
理を行って、図9に示すように、実際のアイドルに似せ
たセグメントの画像を完成させる。この画像は、エンコ
ーダ160により、表示させるべきタイミングに合わせ
たビデオ信号に変換され、モニタ装置5にモデルの顔が
表示される。
【0049】以上の処理を、フレーム期間(一枚の画面
を表示する周期)ごとにポリゴンの空間座標を更新しな
がら行うことによって、実際の人間のように、口を動か
したり瞼を閉じたり目を動かしたりするモデルの画像を
表示する。
を表示する周期)ごとにポリゴンの空間座標を更新しな
がら行うことによって、実際の人間のように、口を動か
したり瞼を閉じたり目を動かしたりするモデルの画像を
表示する。
【0050】(母音による口の形の表現)さて、人間が
実際に一つの音節を発音する場合、発音期間中で母音を
発音している期間が比較的長い。本発明では、この原理
に基づいて、サウンドブロック11に発音させる音節の
母音が何かを判断し、この母音を発音する際の口を表現
するための画像を、この音節の発音と同時に表示させ
る。すなわち、「あ(a)」、「い(i)」、「う
(u)」、「え(e)」および「お(o)」のそれぞれ
の母音に対応する画像表示は、例えば図10乃至図14
に示すようになる。
実際に一つの音節を発音する場合、発音期間中で母音を
発音している期間が比較的長い。本発明では、この原理
に基づいて、サウンドブロック11に発音させる音節の
母音が何かを判断し、この母音を発音する際の口を表現
するための画像を、この音節の発音と同時に表示させ
る。すなわち、「あ(a)」、「い(i)」、「う
(u)」、「え(e)」および「お(o)」のそれぞれ
の母音に対応する画像表示は、例えば図10乃至図14
に示すようになる。
【0051】「こんにちは」という言葉を例に採る。各
音節の長さが等しいなら、サウンドブロックより波形デ
ータに基づき「こんにちは」と発音する間、表示画像
は、図4に示すように「おんいいあ」と発音するように
動かしていることになる。
音節の長さが等しいなら、サウンドブロックより波形デ
ータに基づき「こんにちは」と発音する間、表示画像
は、図4に示すように「おんいいあ」と発音するように
動かしていることになる。
【0052】このような処理によれば、各音節に対応す
る母音をその音節の発音期間中に表示することによっ
て、近似的にモデルがその音節を発音しているものと遊
技者に認識させることができる。
る母音をその音節の発音期間中に表示することによっ
て、近似的にモデルがその音節を発音しているものと遊
技者に認識させることができる。
【0053】(同一母音の音節が連続する場合における
口の形の表現)ところで、図4を参照すると、「こんに
ちは」という言葉のうち連続する「に」と「ち」とは、
同じ母音「い(i)」を含んでいる。このため、画像表
示される口は、この二音節にわたって同一の形のまま動
かないことになり不自然となる場合もある。
口の形の表現)ところで、図4を参照すると、「こんに
ちは」という言葉のうち連続する「に」と「ち」とは、
同じ母音「い(i)」を含んでいる。このため、画像表
示される口は、この二音節にわたって同一の形のまま動
かないことになり不自然となる場合もある。
【0054】これに対処するため、本発明では、前に発
音させた音節の母音と次回に発音させる音節の母音が同
一である場合には、さらに半開き状態の口を表現する画
像を挿入する。例えば、図5に示すように、連続する同
一母音に係る音節のうち、第二番目の音節の前半に、図
15に示すような「あ」と「え」の中間的な口の状態を
表現した、半開き状態の口の画像を挿入する。
音させた音節の母音と次回に発音させる音節の母音が同
一である場合には、さらに半開き状態の口を表現する画
像を挿入する。例えば、図5に示すように、連続する同
一母音に係る音節のうち、第二番目の音節の前半に、図
15に示すような「あ」と「え」の中間的な口の状態を
表現した、半開き状態の口の画像を挿入する。
【0055】このような処理によれば、連続する二つの
音節において同一の母音が連続する場合であっても、い
ずれの母音とも異なる口の形がその間に表示されるの
で、より自然な口の動きを表現できる。
音節において同一の母音が連続する場合であっても、い
ずれの母音とも異なる口の形がその間に表示されるの
で、より自然な口の動きを表現できる。
【0056】なお、半開きを挿入する個所は、連続する
二音節のうち第二音節の冒頭に限らず、第一音節の後で
もよい。また、第一音節の後部と第二音節の冒頭部にと
もにかかってもよい。また、半開きの口を表現する画像
を挿入する長さは、音節の長さの半分に限らず、それよ
り短くても長くてもよい。さらに半開きの口の形は、い
ずれの母音を発音する際の口の形を異なればよく、図1
5のように「あ」と「え」の中間状態における口の他、
「あ」と「お」等他の口の形でもよい。
二音節のうち第二音節の冒頭に限らず、第一音節の後で
もよい。また、第一音節の後部と第二音節の冒頭部にと
もにかかってもよい。また、半開きの口を表現する画像
を挿入する長さは、音節の長さの半分に限らず、それよ
り短くても長くてもよい。さらに半開きの口の形は、い
ずれの母音を発音する際の口の形を異なればよく、図1
5のように「あ」と「え」の中間状態における口の他、
「あ」と「お」等他の口の形でもよい。
【0057】(特定音節における口の形の表現)さら
に、図5の各音節を実際に発音する際の口の形を検討す
ると、「わ(は)」の音節は、音節冒頭の子音を発音す
る際の口の形と、その母音である「あ」を発音する際の
口の形とが大幅に異なっている。このように、一つの音
節であっても子音の口の形と母音の口の形が大きく変化
する音節には、表1に掲げるものがある。
に、図5の各音節を実際に発音する際の口の形を検討す
ると、「わ(は)」の音節は、音節冒頭の子音を発音す
る際の口の形と、その母音である「あ」を発音する際の
口の形とが大幅に異なっている。このように、一つの音
節であっても子音の口の形と母音の口の形が大きく変化
する音節には、表1に掲げるものがある。
【0058】
【表1】
【0059】このような音節を、その母音を発音する際
の口の形で表現すると不自然になる。このため本発明で
は、発音する音節が表1に掲げる音節である場合には、
その音節の冒頭に半開き状態の口を表示する。例えば、
図6に示すように、「わ」の音節において、その前半
に、図15に示すような半開きの口を表現する画像を表
示する。
の口の形で表現すると不自然になる。このため本発明で
は、発音する音節が表1に掲げる音節である場合には、
その音節の冒頭に半開き状態の口を表示する。例えば、
図6に示すように、「わ」の音節において、その前半
に、図15に示すような半開きの口を表現する画像を表
示する。
【0060】このような処理によれば、音節の子音と母
音とで口の形が大きく変化する音節においても、その音
節の冒頭に半開きの口の形を表示するので、自然な口の
動きを表現できる。
音とで口の形が大きく変化する音節においても、その音
節の冒頭に半開きの口の形を表示するので、自然な口の
動きを表現できる。
【0061】なお、半開きの口の形は、連続する音節が
同一の母音を含む場合と同様に、種々に変更が可能であ
る。
同一の母音を含む場合と同様に、種々に変更が可能であ
る。
【0062】(異なる母音を含む連続した音節間におけ
る口の形のさらに自然な表現)一方、連続した音節が異
なる母音を含んでいる場合であっても、最初の音節にお
ける母音を発音するときの口の形と次の音節における母
音を発音するときの口の形が大きく異なる場合がある。
また、両音節の間には子音も入り、これら両音節を実際
に発音する人間の口の形は、単に異なる母音を連続して
発音させたものとは相違する。したがって、異なる母音
を含む連続した音節を発音する口を模擬する場合に、こ
れら二種類の異なる母音を発音する口を表現するための
画像を連続して表現するだけでなく、これら二種類の画
像の合間に、これら二種類の母音を発音する口の中間的
な表現をさせる画像を挿入すれば、さらに自然な人間の
口の動きを模擬できる。
る口の形のさらに自然な表現)一方、連続した音節が異
なる母音を含んでいる場合であっても、最初の音節にお
ける母音を発音するときの口の形と次の音節における母
音を発音するときの口の形が大きく異なる場合がある。
また、両音節の間には子音も入り、これら両音節を実際
に発音する人間の口の形は、単に異なる母音を連続して
発音させたものとは相違する。したがって、異なる母音
を含む連続した音節を発音する口を模擬する場合に、こ
れら二種類の異なる母音を発音する口を表現するための
画像を連続して表現するだけでなく、これら二種類の画
像の合間に、これら二種類の母音を発音する口の中間的
な表現をさせる画像を挿入すれば、さらに自然な人間の
口の動きを模擬できる。
【0063】そこで、本発明では、異なる音節を含む連
続した音節を発音させる際に、異なる母音の各々を発音
する口を表現するための画像の合間に、例えば、図7に
示すように、これら二種類の母音の中間的な口の開き方
を表現するための画像を表示する。例えば、同図では、
「まっくらです」という発音を模擬する場合を示す。最
初の「まっ」という音節は、上記特殊音節に該当してい
るので図15に示すような半開きの口を表示する。残り
の音節では、前後する音節に含まれる母音の中間的な口
を表示してある。「まっ」と「く」、「く」と「ら」で
は、それぞれの音節に含まれる母音の組み合わせからみ
れば、「あ」と「う」の組み合わせであって同一の組み
合わせとなるので、同一の中間的な口を表現する画像を
表示する。
続した音節を発音させる際に、異なる母音の各々を発音
する口を表現するための画像の合間に、例えば、図7に
示すように、これら二種類の母音の中間的な口の開き方
を表現するための画像を表示する。例えば、同図では、
「まっくらです」という発音を模擬する場合を示す。最
初の「まっ」という音節は、上記特殊音節に該当してい
るので図15に示すような半開きの口を表示する。残り
の音節では、前後する音節に含まれる母音の中間的な口
を表示してある。「まっ」と「く」、「く」と「ら」で
は、それぞれの音節に含まれる母音の組み合わせからみ
れば、「あ」と「う」の組み合わせであって同一の組み
合わせとなるので、同一の中間的な口を表現する画像を
表示する。
【0064】なお、中間的な口の開き方を表現するため
の画像データは、前後する音節の組み合わせに応じて用
意する。例えば、基本的に用意してある画像データが、
「あ」、「い」、「う」、「え」および「お」の5つの
母音を表現する口、「ん」を表す撥音を表現する口並び
に上記特殊な半開き状態を表現する口の合計7種類から
なる口の形を表現する場合には、これら7種類から2つ
を選択する組み合わせの数だけ画像データを用意する。
すなわち、7C2=21通り用意する。
の画像データは、前後する音節の組み合わせに応じて用
意する。例えば、基本的に用意してある画像データが、
「あ」、「い」、「う」、「え」および「お」の5つの
母音を表現する口、「ん」を表す撥音を表現する口並び
に上記特殊な半開き状態を表現する口の合計7種類から
なる口の形を表現する場合には、これら7種類から2つ
を選択する組み合わせの数だけ画像データを用意する。
すなわち、7C2=21通り用意する。
【0065】ただし、この中間的な口の画像は、異なる
母音を発音する口の画像を連続して表示した場合に不自
然に見える組み合わせに限って挿入するものであっても
よい。例えば、母音「あ」と「え」とでは口の形があま
り変化しないので、これら二種類の異なる母音を含む音
節が連続する場合には、中間的な口の画像を挿入しなく
てもよい。
母音を発音する口の画像を連続して表示した場合に不自
然に見える組み合わせに限って挿入するものであっても
よい。例えば、母音「あ」と「え」とでは口の形があま
り変化しないので、これら二種類の異なる母音を含む音
節が連続する場合には、中間的な口の画像を挿入しなく
てもよい。
【0066】さらに、上記したような、異なる母音の中
間的な口の形を表現するための画像の代わりに、他の中
間的な口を表現するための画像を用いてもよい。例え
ば、後の音節に含まれる子音を発音する際の口の形を模
擬しうる他の中間的な口を表現するための画像を用いて
もよい。
間的な口の形を表現するための画像の代わりに、他の中
間的な口を表現するための画像を用いてもよい。例え
ば、後の音節に含まれる子音を発音する際の口の形を模
擬しうる他の中間的な口を表現するための画像を用いて
もよい。
【0067】なお、中間的な口の画像を表示する期間
は、連続する二音節のうち第二音節の前半部に限らず、
第一音節の後半部でもよい。また、第一音節の後部と第
二音節の前部にともにかかってもよい。また、中間的な
口を表現する画像を挿入する長さは、音節の長さの半分
に限らず、それより短くても長くてもよい。
は、連続する二音節のうち第二音節の前半部に限らず、
第一音節の後半部でもよい。また、第一音節の後部と第
二音節の前部にともにかかってもよい。また、中間的な
口を表現する画像を挿入する長さは、音節の長さの半分
に限らず、それより短くても長くてもよい。
【0068】(音節が撥音であるにおける口の形の表
現)また、音節のうち撥音とよばれる音節、つまり「ん
(n)」の音節では、いずれの母音も含まれない。した
がって、本発明では、音節が撥音である場合には、図1
6に示すように口を閉じた画像を表示する。
現)また、音節のうち撥音とよばれる音節、つまり「ん
(n)」の音節では、いずれの母音も含まれない。した
がって、本発明では、音節が撥音である場合には、図1
6に示すように口を閉じた画像を表示する。
【0069】このような処理によれば、音節が撥音であ
る場合にも口を閉じた画像を表示するので、自然な口の
動きを表現できる。
る場合にも口を閉じた画像を表示するので、自然な口の
動きを表現できる。
【0070】上記各処理を、音節とそれに対応させて表
示する画像と関係つけてまとめると、表2のようにな
る。
示する画像と関係つけてまとめると、表2のようにな
る。
【0071】
【表2】
【0072】(動作説明)次に、上記原理に基づく処理
を、図3のフローチャートを参照して説明する。
を、図3のフローチャートを参照して説明する。
【0073】ステップS1(初期設定): ゲームを開
始するに当たり、メインCPU101用プログラムデー
タ、画像データ、CPU141用音響制御プログラムデ
ータおよび波形データが、カートリッジインターフェー
ス回路1aまたはCD−ROMから読み取られ、RAM
102に転送される。以下、メインCPU101はRA
M102に格納されたメインCPU用プログラムを実行
し、CPU141はメインCPU101により転送され
DSP140に格納された音響制御用プログラムを実行
する。
始するに当たり、メインCPU101用プログラムデー
タ、画像データ、CPU141用音響制御プログラムデ
ータおよび波形データが、カートリッジインターフェー
ス回路1aまたはCD−ROMから読み取られ、RAM
102に転送される。以下、メインCPU101はRA
M102に格納されたメインCPU用プログラムを実行
し、CPU141はメインCPU101により転送され
DSP140に格納された音響制御用プログラムを実行
する。
【0074】ステップS2: メインCPU101は、
サウンドブロック11に転送される音響制御用プログラ
ムデータのうち歌詞データを、画像の更新タイミングご
とに読み取る。この歌詞データの示す文字を順次参照し
ていけば、次にサウンドブロック11から発音させる音
節が何であるかを判断できる。
サウンドブロック11に転送される音響制御用プログラ
ムデータのうち歌詞データを、画像の更新タイミングご
とに読み取る。この歌詞データの示す文字を順次参照し
ていけば、次にサウンドブロック11から発音させる音
節が何であるかを判断できる。
【0075】このため、メインCPU101は、歌詞デ
ータから次に発音させる音節文字を読み取り、プログラ
ムデータに含まれる、表2に示すような対応関係を規定
したテーブルデータを参照する。そして、このテーブル
から特定される母音を発音させる口を表現するための以
下の画像データ、すなわちRAM102に格納させたポ
リゴンの空間位置を特定する座標データの集合をビデオ
ブロック11に転送し、発音される音節に対応したモデ
ルの口を表現させる。
ータから次に発音させる音節文字を読み取り、プログラ
ムデータに含まれる、表2に示すような対応関係を規定
したテーブルデータを参照する。そして、このテーブル
から特定される母音を発音させる口を表現するための以
下の画像データ、すなわちRAM102に格納させたポ
リゴンの空間位置を特定する座標データの集合をビデオ
ブロック11に転送し、発音される音節に対応したモデ
ルの口を表現させる。
【0076】ステップS3: まず、次にサウンドブロ
ック11に転送する波形データにより発音させられる音
節が、表1に掲げる特定の音節であるか否かを判断す
る。特定の音節である場合(S3;YES)には、半開
きの口を表現するため半開きした口を表現する画像を表
示させ(S4)、ステップS8に移行する。すなわち、
半開きの口を表現するためのポリゴンの空間位置を定義
した座標データをビデオブロック11に転送し、図15
に示すような口の表示をさせる。半開きの口を表示する
時間長は、特定音節ごとに異なった時間長に設定しても
よいし、一定の時間長に設定してもよい。また、音節の
長さに対する半開きの口を表示する長さの比率で設定し
てもよい。
ック11に転送する波形データにより発音させられる音
節が、表1に掲げる特定の音節であるか否かを判断す
る。特定の音節である場合(S3;YES)には、半開
きの口を表現するため半開きした口を表現する画像を表
示させ(S4)、ステップS8に移行する。すなわち、
半開きの口を表現するためのポリゴンの空間位置を定義
した座標データをビデオブロック11に転送し、図15
に示すような口の表示をさせる。半開きの口を表示する
時間長は、特定音節ごとに異なった時間長に設定しても
よいし、一定の時間長に設定してもよい。また、音節の
長さに対する半開きの口を表示する長さの比率で設定し
てもよい。
【0077】ステップS5: 音節が特定の音節でない
場合(S3;NO)、前回に発音させた音節と今回新た
に発音させる音節が同一母音を含むか否かを識別する。
同一母音を含む場合には、ステップS3と同様に、半開
きの口を表示するための画像データをビデオブロック1
1に転送し、半開きした口を表現する画像をステップS
4と同様に表示させ(S6)、ステップS8に移行す
る。半開きの口を表示する時間長に関しても上記ステッ
プ4と同様である。
場合(S3;NO)、前回に発音させた音節と今回新た
に発音させる音節が同一母音を含むか否かを識別する。
同一母音を含む場合には、ステップS3と同様に、半開
きの口を表示するための画像データをビデオブロック1
1に転送し、半開きした口を表現する画像をステップS
4と同様に表示させ(S6)、ステップS8に移行す
る。半開きの口を表示する時間長に関しても上記ステッ
プ4と同様である。
【0078】ステップS7: 前回に発音させた音節と
今回新たに発音させる音節が同一母音を含まない場合
(S5;NO)、前後する音節に含まれる母音等が異な
ること考えられる。そこで、メインCPU101は、前
音節に含まれる音(母音)と今回発音させるべき音節の
音(母音、撥音若しくは半開きのいずれか、または子
音)との中間的な口を表現しうる画像データをビデオブ
ロック11に転送する。また、メインCPU101はこ
の音節を発音させるための波形データをサウンドブロッ
ク12に転送する。なお、中間的な口を表示する時間長
に関しては、上記ステップ4と同様である。
今回新たに発音させる音節が同一母音を含まない場合
(S5;NO)、前後する音節に含まれる母音等が異な
ること考えられる。そこで、メインCPU101は、前
音節に含まれる音(母音)と今回発音させるべき音節の
音(母音、撥音若しくは半開きのいずれか、または子
音)との中間的な口を表現しうる画像データをビデオブ
ロック11に転送する。また、メインCPU101はこ
の音節を発音させるための波形データをサウンドブロッ
ク12に転送する。なお、中間的な口を表示する時間長
に関しては、上記ステップ4と同様である。
【0079】ステップS8: 中間的な口を表現するた
めの画像を表示した後(S4,S6またはS7)、次に
発音させる音節が撥音であるか否かを判断する。撥音で
ある場合(S8;YES)は、閉じた口を表現するため
の口を構成するポリゴンの空間位置を定義した座標デー
タをビデオブロック11に転送し、図16に示すような
口を表示させる(S9)。
めの画像を表示した後(S4,S6またはS7)、次に
発音させる音節が撥音であるか否かを判断する。撥音で
ある場合(S8;YES)は、閉じた口を表現するため
の口を構成するポリゴンの空間位置を定義した座標デー
タをビデオブロック11に転送し、図16に示すような
口を表示させる(S9)。
【0080】撥音でない場合(S8;NO)は、次の音
節は母音を含むと考えられるので、その母音を発音する
ための口の形を特定し、特定されたポリゴンの空間位置
が定義された座標データをビデオブロック11に転送
し、図10乃至図14のいずれかに示すような口を表示
させる(S10)。
節は母音を含むと考えられるので、その母音を発音する
ための口の形を特定し、特定されたポリゴンの空間位置
が定義された座標データをビデオブロック11に転送
し、図10乃至図14のいずれかに示すような口を表示
させる(S10)。
【0081】ステップS10: 歌詞データがまだ続く
場合は(S11;NO)、再び次の歌詞データを参照す
る(S2)。歌詞データが終わった場合は(S11;Y
ES)、本発明の処理を終了する。
場合は(S11;NO)、再び次の歌詞データを参照す
る(S2)。歌詞データが終わった場合は(S11;Y
ES)、本発明の処理を終了する。
【0082】(効果)上記したように本実施の形態によ
れば、次に発音させる音節に含まれる母音を発音するた
めの口の表現で、その音節における口の表現を代用する
ので、全体として少ない画像データで音節の発音に合せ
て自然に口を動かすモデルを表現できる。
れば、次に発音させる音節に含まれる母音を発音するた
めの口の表現で、その音節における口の表現を代用する
ので、全体として少ない画像データで音節の発音に合せ
て自然に口を動かすモデルを表現できる。
【0083】特に、連続する二つの音節において、同一
の母音が連続する場合であっても、いずれの母音とも異
なる半開きの口の形をその間に表示するので、より自然
な口の動きを表現できる。
の母音が連続する場合であっても、いずれの母音とも異
なる半開きの口の形をその間に表示するので、より自然
な口の動きを表現できる。
【0084】また、連続する二つの音節において、異な
る母音となる場合であっても、それらの母音を発音する
口を表現する画像の合間に、中間的な口の形を表現する
画像を表示するので、さらに自然な口の動きを表現でき
る。
る母音となる場合であっても、それらの母音を発音する
口を表現する画像の合間に、中間的な口の形を表現する
画像を表示するので、さらに自然な口の動きを表現でき
る。
【0085】さらに、音節が撥音である場合にも口を閉
じた画像を表示するので、より自然な口の動きを表現で
きる。
じた画像を表示するので、より自然な口の動きを表現で
きる。
【0086】(その他の変形例)本発明は、上記各形態
に拘らず種々に変形できる。例えば、上記実施の形態で
は、アイドルが唄う場合を想定し、歌詞データを参照し
ていたが、歌詞の代わりに台詞であってもよい。このと
き、ステップS2では、歌詞データの代わりに、台詞の
内容をひらがなあるいはカタカナ等の音節文字あるいは
ローマ字で表わしたデータに基づいて、口の形を判断す
る。
に拘らず種々に変形できる。例えば、上記実施の形態で
は、アイドルが唄う場合を想定し、歌詞データを参照し
ていたが、歌詞の代わりに台詞であってもよい。このと
き、ステップS2では、歌詞データの代わりに、台詞の
内容をひらがなあるいはカタカナ等の音節文字あるいは
ローマ字で表わしたデータに基づいて、口の形を判断す
る。
【0087】上記実施形態では、モデルが人間の顔であ
ったが、モデルは人間に限ることなく、動物、ロボット
等、口が存在し、人間の発音する様子を表現しうるもの
であれば、種々に適用が可能である。
ったが、モデルは人間に限ることなく、動物、ロボット
等、口が存在し、人間の発音する様子を表現しうるもの
であれば、種々に適用が可能である。
【0088】上記実施形態では、モデルをポリゴンによ
り表示していたが、ビットマップ形式の画像データを口
の形に応じて複数記憶させ、これらの画像データを交互
に読み取って表示させてもよい。この場合は、二次元的
な表示に本発明が適用できることになる。
り表示していたが、ビットマップ形式の画像データを口
の形に応じて複数記憶させ、これらの画像データを交互
に読み取って表示させてもよい。この場合は、二次元的
な表示に本発明が適用できることになる。
【0089】
【発明の効果】本発明によれば、実際に人間が発音する
様子を自然に模擬し、まるでモデルが本当に唄ったり話
したりしていると錯覚させることのできる表現力を有す
る画像音響処理装置および記録媒体を提供することがで
きる。
様子を自然に模擬し、まるでモデルが本当に唄ったり話
したりしていると錯覚させることのできる表現力を有す
る画像音響処理装置および記録媒体を提供することがで
きる。
【0090】つまり、本発明によれば、各音節に対応す
る母音を発音する際の口の画像を、その音節の発音期間
中に表示することによって、近似的にそのモデルが発音
しているような画像を表示できる。画像データは母音の
みなので、一定量の画像データのみ済む。
る母音を発音する際の口の画像を、その音節の発音期間
中に表示することによって、近似的にそのモデルが発音
しているような画像を表示できる。画像データは母音の
みなので、一定量の画像データのみ済む。
【0091】本発明によれば、同一の母音を有する音節
が連続しても、人間が発音する様子を自然に模擬でき
る。
が連続しても、人間が発音する様子を自然に模擬でき
る。
【0092】本発明によれば、異なる母音を含む音節が
連続しても、二種類の母音の各々を発音する口を表現す
る画像の合間に中間的な口の形を表現する画像を挿入す
るので、人間が発音する様子をより自然に模擬できる。
連続しても、二種類の母音の各々を発音する口を表現す
る画像の合間に中間的な口の形を表現する画像を挿入す
るので、人間が発音する様子をより自然に模擬できる。
【0093】本発明によれば、音節が撥音である場合に
も口を閉じた画像を表示するので、撥音を発音する際の
自然な口の動きを表現できる。
も口を閉じた画像を表示するので、撥音を発音する際の
自然な口の動きを表現できる。
【図1】本発明の画像音響処理装置を適用したゲーム装
置の外観図である。
置の外観図である。
【図2】本発明の画像音響処理装置を提供したゲーム装
置のブロック図である。
置のブロック図である。
【図3】本実施の形態の動作を説明するフローチャート
である。
である。
【図4】母音のみで「こんにちは」を表現する場合の表
示順序である。
示順序である。
【図5】同一母音を含む音節が連続する場合の表示順序
である。
である。
【図6】特定音節である場合の表示順序である。
【図7】前後する音節が異なる音を含む場合の表示順序
である。
である。
【図8】ポリゴンのみで構成したモデルの構成図であ
る。
る。
【図9】テクスチャデータを適用したモデルの表示画像
図である。
図である。
【図10】「あ(a)」を発音させる表示画像の例であ
る。
る。
【図11】「い(i)」を発音させる表示画像の例であ
る。
る。
【図12】「う(u)」を発音させる表示画像の例であ
る。
る。
【図13】「え(e)」を発音させる表示画像の例であ
る。
る。
【図14】「お(o)」を発音させる表示画像の例であ
る。
る。
【図15】半開きした口を表現する表示画像の例であ
る。
る。
【図16】閉じた口(撥音)を表現する表示画像の例で
ある。
ある。
【符号の説明】 10…CPUブロック(画像表示手段の一部、処理回
路) 11…ビデオブロック(画像表示手段の一部、画像表示
回路) 12…サウンドブロック(音響生成手段、音響生成回
路) 102…RAM(記憶手段の一部、記憶回路の一部) 121…VRAM(記憶手段の一部、記憶回路の一部)
路) 11…ビデオブロック(画像表示手段の一部、画像表示
回路) 12…サウンドブロック(音響生成手段、音響生成回
路) 102…RAM(記憶手段の一部、記憶回路の一部) 121…VRAM(記憶手段の一部、記憶回路の一部)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G10L 3/00 G06F 15/62 350A
Claims (17)
- 【請求項1】 口の動きを表現する画像に合わせて音響
を生成するための画像音響処理装置において、 音響を生成するための音響生成手段と、 音節を発音する際の口の動きを表現する画像を表示する
ための画像表示手段と、 母音を発音する際の口を表現するための画像データを母
音の種類だけ記憶させた記憶手段と、を備え、 前記画像表示手段は、前記音響生成手段に発音させる音
節に含まれる母音を識別し、識別した母音を発音する際
の口を表現するための画像データを前記記憶手段から読
み取り、読み取った画像データに基づいて画像表示する
ことを特徴とする画像音響処理装置。 - 【請求項2】 前記記憶手段には、前記母音を発音する
際の口を表現するための画像データの他に、半開きした
口を表現するための画像データが記憶され、 前記画像表示手段は、前記音響生成手段に発音させる音
節が予め定められた特定の音節である場合には、前記記
憶手段に記憶された前記半開きした口を表現するための
画像データおよび当該音節に含まれる母音を発音する際
の口を表現するための画像データに基づいて、前記半開
きした口を表現する画像に続けて前記母音を発音する際
の口を表現する画像を表示する請求項1に記載の画像音
響処理装置。 - 【請求項3】 前記記憶手段には、前記母音を発音する
際の口を表現するための画像データの他に、半開きした
口を表現するための画像データが記憶され、 前記画像表示手段は、前記音響生成手段に発音させる連
続した音節が同一の母音を含んでいると識別した場合に
は、前記記憶手段に記憶された前記半開きした口を表現
するための画像データに基づいて、前記連続した音節の
各々を発音する口を表現するための画像の合間に、前記
半開きした口を表現する画像を表示する請求項1に記載
の画像音響処理装置。 - 【請求項4】 前記記憶手段には、前記母音を発音する
際の口を表現するための画像データの他に、異なる母音
の1以上の組み合わせにおいて、各組み合わせに係る二
種類の母音の中間的な口を表現するための画像データが
記憶され、 前記画像表示手段は、前記音響生成手段に異なる母音を
含む連続した音節を発音させる際に、前記記憶手段に記
憶された画像データに基づいて、前記異なる母音の各々
を発音する口を表現するための画像の合間に、これら二
種類の母音の中間的な口の開き方を表現するための画像
を表示する請求項1に記載の画像音響処理装置。 - 【請求項5】 前記記憶手段には、前記母音を発音する
際の口を表現するための画像データの他に、閉じた口を
表現するための画像データが記憶され、 前記画像表示手段は、前記音響生成手段に発音させる音
節が撥音を含む場合に、前記記憶手段に記憶された前記
閉じた口を表現するための画像データに基づいて画像表
示する請求項1に記載の画像音響処理装置。 - 【請求項6】 口の動きを表現する画像に合わせて音響
を生成するための画像音響処理装置において、 母音を発音する際の口を表現するための画像データ、音
響を生成する波形データおよびプログラムデータが記憶
された記憶装置と、 前記記憶装置から読み取った前記波形データに基づいて
声を発音する音響生成回路と、 前記記憶装置から読み取った前記画像データに基づいて
口の動きを表現する画像を表示する画像表示回路と、 前記記憶装置から読み取ったプログラムデータに基づい
て前記音響生成回路と前記画像表示回路とを制御する処
理回路と、を備え、 前記処理回路は、前記波形データにより発音される音節
に含まれる母音を識別し、当該波形データに基づく音響
を生成するとともに、前記母音を発音する際の口を表現
するための前記画像データを前記画像表示回路に転送
し、当該画像データに基づいて画像表示させることを特
徴とする画像音響処理装置。 - 【請求項7】 前記記憶装置には、前記母音を発音する
際の口を表現するための画像データの他に、半開きした
口を表現するための画像データが記憶され、 前記処理回路は、前記波形データにより発音される音節
が予め定められた特定の音節である場合には、当該波形
データに基づく音響を生成するとともに、前記記憶装置
に記憶された前記半開きした口を表現するための画像デ
ータおよび当該音節に含まれる母音を発音する際の口を
表現するための画像データを前記画像表示回路に転送
し、前記半開きした口を表現する画像に続けて前記母音
を発音する際の口を表現する画像を表示させる請求項6
に記載の画像音響処理装置。 - 【請求項8】 前記記憶装置には、前記母音を発音する
際の口を表現するための画像データの他に、半開きした
口を表現するための画像データが記憶され、 前記処理回路は、前記波形データにより発音される連続
した音節が同一の母音を含んでいると識別した場合に
は、当該波形データに基づく音響を生成するとともに、
前記記憶装置に記憶された当該音節に含まれる母音を発
音する際の口を表現するための画像データおよび前記半
開きした口を表現するための画像データを前記画像表示
回路に転送し、前記連続した音節の各々を発音する口を
表現するための画像の合間に、前記半開きした口を表現
する画像を表示させる請求項6に記載の画像音響処理装
置。 - 【請求項9】 前記記憶装置には、前記母音を発音する
際の口を表現するための画像データの他に、異なる母音
の1以上の組み合わせにおいて、各組み合わせに係る二
種類の母音の中間的な口を表現するための画像データが
記憶され、 前記処理回路は、異なる母音を含む連続した音節を発音
させる際に、前記記憶装置に記憶された画像データに基
づいて、前記異なる母音の各々を発音する口を表現する
ための画像の合間に、これら二種類の母音の中間的な口
の開き方を表現するための画像を表示する請求項6に記
載の画像音響処理装置。 - 【請求項10】 前記記憶装置には、前記母音を発音す
る際の口を表現するための画像データの他に、閉じた口
を表現するための画像データが記憶され、 前記処理回路は、前記波形データにより発音される音節
が撥音を含む場合に、当該波形データに基づく音響を生
成するとともに、前記記憶装置に記憶された前記閉じた
口を表現するための画像データを前記画像表示回路に転
送し、前記閉じた口を表現する画像を表示させる請求項
6に記載の画像音響処理装置。 - 【請求項11】 前記特定の音節には、‘さ’、
‘せ’、‘た’、‘ま’、‘み’、‘む’、‘め’、
‘も’、‘わ’、‘を’、‘ば’、‘び’、‘ぶ’、
‘べ’、‘ぼ’、‘ぱ’、‘ぴ’、‘ぷ’、‘ぺ’およ
び‘ぽ’の一部または全部を含む請求項2または請求項
7のいずれか一項に記載の画像音響処理装置。 - 【請求項12】 前記音節の識別は、文字データに基づ
いて行われる請求項1乃至請求項10のいずれか一項に
記載の画像音響処理装置。 - 【請求項13】 コンピュータに、 波形データにより発音される音節に含まれる母音を識別
するステップと、前記波形データに基づく音響を生成す
るステップと、 母音を発音する際の口を表現するための画像データを画
像表示回路に転送するステップと、 前記画像データに基づいて画像表示させるステップと、
を実行させるためのプログラムデータが記憶された機械
読み取り可能な記録媒体。 - 【請求項14】 コンピュータに、 波形データにより発音される音節が予め定められた特定
の音節であるか否かを識別するステップと、 前記特定の音節であると識別した場合に、当該波形デー
タに基づく音響を生成するステップと、 前記特定の音節であると識別した場合に、半開きした口
を表現するための画像データおよび当該音節に含まれる
母音を発音する際の口を表現するための画像データを画
像表示回路に転送するステップと、 前記半開きした口を表現する画像に続けて前記母音を発
音する際の口を表現する画像を表示させるステップと、
を実行させるためのプログラムデータが記憶された機械
読み取り可能な記録媒体。 - 【請求項15】 コンピュータに、 波形データにより発音される連続した音節が同一の母音
を含んでいるか否かを識別するステップと、 前記連続した音節が同一の母音を含んでいると識別した
場合に、当該波形データに基づく音響を生成するステッ
プと、 前記連続した音節が同一の母音を含んでいると識別した
場合に、当該音節に含まれる母音を発音する際の口を表
現するための画像データおよび前記半開きした口を表現
するための画像データを画像表示回路に転送するステッ
プと、 前記連続した音節の各々を発音する口を表現するための
画像の合間に、前記半開きした口を表現する画像を表示
させるステップと、を実行させるためのプログラムデー
タが記憶された機械読み取り可能な記録媒体。 - 【請求項16】 コンピュータに、 波形データにより発音される連続した音節が異なる母音
を含むか否かを識別するステップと、 前記連続した音節が異なる母音を含むと識別した場合
に、当該波形データに基づく音響を生成するステップ
と、 前記連続した音節が異なる母音を含むと識別した場合
に、それぞれの母音を発音する際の口を表現するための
画像データおよびそれら異なる母音の中間的な口の開き
方を表現するための画像データを画像表示回路に転送す
るステップと、 前記異なる母音の各々を発音する口を表現するための画
像の合間に、これら二種類の母音の中間的な口の開き方
を表現する画像を表示させるステップと、を実行させる
ためのプログラムデータが記憶された機械読み取り可能
な記録媒体。 - 【請求項17】 コンピュータに、 波形データにより発音される音節が撥音を含むか否かを
識別するステップと、 前記音節が撥音を含むと識別した場合に、当該波形デー
タに基づく音響を生成するステップと、 前記音節が撥音を含むと識別した場合に、閉じた口を表
現するための画像データを画像表示回路に転送するステ
ップと、 前記閉じた口を表現する画像を表示させるステップと、
を実行させるためのプログラムデータが記憶された機械
読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9216163A JPH1166345A (ja) | 1997-08-11 | 1997-08-11 | 画像音響処理装置および記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9216163A JPH1166345A (ja) | 1997-08-11 | 1997-08-11 | 画像音響処理装置および記録媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1166345A true JPH1166345A (ja) | 1999-03-09 |
Family
ID=16684288
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9216163A Withdrawn JPH1166345A (ja) | 1997-08-11 | 1997-08-11 | 画像音響処理装置および記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1166345A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7477253B2 (en) | 2002-05-28 | 2009-01-13 | Sega Corporation | Storage medium storing animation image generating program |
| JP2011164763A (ja) * | 2010-02-05 | 2011-08-25 | Yamaha Corp | 制御情報生成装置および形状制御装置 |
| CN102820037A (zh) * | 2012-07-21 | 2012-12-12 | 渤海大学 | 基于组合特征的汉语声韵母可视化方法 |
| JP2016102959A (ja) * | 2014-11-28 | 2016-06-02 | 株式会社第一興商 | カラオケ装置 |
| JP2016126135A (ja) * | 2014-12-26 | 2016-07-11 | 株式会社第一興商 | カラオケ装置 |
-
1997
- 1997-08-11 JP JP9216163A patent/JPH1166345A/ja not_active Withdrawn
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7477253B2 (en) | 2002-05-28 | 2009-01-13 | Sega Corporation | Storage medium storing animation image generating program |
| JP2011164763A (ja) * | 2010-02-05 | 2011-08-25 | Yamaha Corp | 制御情報生成装置および形状制御装置 |
| CN102820037A (zh) * | 2012-07-21 | 2012-12-12 | 渤海大学 | 基于组合特征的汉语声韵母可视化方法 |
| JP2016102959A (ja) * | 2014-11-28 | 2016-06-02 | 株式会社第一興商 | カラオケ装置 |
| JP2016126135A (ja) * | 2014-12-26 | 2016-07-11 | 株式会社第一興商 | カラオケ装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1282954C (en) | Speech synchronized animation | |
| US5630017A (en) | Advanced tools for speech synchronized animation | |
| US5278943A (en) | Speech animation and inflection system | |
| JP2001209820A (ja) | 感情表出装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
| US20020024519A1 (en) | System and method for producing three-dimensional moving picture authoring tool supporting synthesis of motion, facial expression, lip synchronizing and lip synchronized voice of three-dimensional character | |
| KR20240038941A (ko) | 텍스트 기반 아바타 생성 방법 및 시스템 | |
| KR102116309B1 (ko) | 가상 캐릭터와 텍스트의 동기화 애니메이션 출력 시스템 | |
| CN108492817A (zh) | 一种基于虚拟偶像的歌曲数据处理方法及演唱交互系统 | |
| JP2003084800A (ja) | 音声による感情合成方法及び装置 | |
| EP3602539A1 (en) | System providing expressive and emotive text-to-speech | |
| CN111145777A (zh) | 一种虚拟形象展示方法、装置、电子设备及存储介质 | |
| KR102116315B1 (ko) | 캐릭터의 음성과 모션 동기화 시스템 | |
| JP4032273B2 (ja) | 同期制御装置および方法、並びに記録媒体 | |
| CN116016986A (zh) | 虚拟人互动视频的渲染方法和装置 | |
| JP5531654B2 (ja) | 制御情報生成装置および形状制御装置 | |
| JPH1166345A (ja) | 画像音響処理装置および記録媒体 | |
| US10825357B2 (en) | Systems and methods for variably paced real time translation between the written and spoken forms of a word | |
| Bernardet et al. | Speech breathing in virtual humans: An interactive model and empirical study | |
| Ramsay | Mechanical speech synthesis in early talking automata | |
| Ouni et al. | Training Baldi to be multilingual: A case study for an Arabic Badr | |
| JP2000293181A (ja) | 歌詞画像描出機能に特徴を有するカラオケ装置 | |
| US11581006B2 (en) | Systems and methods for variably paced real-time translation between the written and spoken forms of a word | |
| US20040162719A1 (en) | Interactive electronic publishing | |
| JP2001042879A (ja) | カラオケ装置 | |
| JP3298076B2 (ja) | 画像作成装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20041102 |