JPH08307841A - 擬似動画tv電話装置 - Google Patents
擬似動画tv電話装置Info
- Publication number
- JPH08307841A JPH08307841A JP7111524A JP11152495A JPH08307841A JP H08307841 A JPH08307841 A JP H08307841A JP 7111524 A JP7111524 A JP 7111524A JP 11152495 A JP11152495 A JP 11152495A JP H08307841 A JPH08307841 A JP H08307841A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- voice
- pseudo
- transmitting
- mouth shape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Processing Or Creating Images (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
【目的】電話回線を用いて、送信側から画像伝送を行わ
ずに音声信号からその話者の擬似顔動画像を受信側で表
示できる方法を提供する。 【構成】電話回線2を介して送信側話者から送られてく
る信号は通信手段4を介して音声信号が出力され、音声
分析手段5で、線形予測符号化により音声パラメータに
変換出力される。一方、モデル生成手段7ではワイヤフ
レームで構成された複数の口形モデルと頭部モデルが蓄
積され、選択されたモデルに関する口形及び頭部モデル
データが出力される。音声パラメータは口形モデルデー
タをもとに、パラメータ変換手段8で口形パラメータに
変換出力され、画像合成手段9で、口形パラメータと頭
部モデルデータをもとに、送信側話者の擬似顔動画像の
生成を行い、表示手段10により表示する。
ずに音声信号からその話者の擬似顔動画像を受信側で表
示できる方法を提供する。 【構成】電話回線2を介して送信側話者から送られてく
る信号は通信手段4を介して音声信号が出力され、音声
分析手段5で、線形予測符号化により音声パラメータに
変換出力される。一方、モデル生成手段7ではワイヤフ
レームで構成された複数の口形モデルと頭部モデルが蓄
積され、選択されたモデルに関する口形及び頭部モデル
データが出力される。音声パラメータは口形モデルデー
タをもとに、パラメータ変換手段8で口形パラメータに
変換出力され、画像合成手段9で、口形パラメータと頭
部モデルデータをもとに、送信側話者の擬似顔動画像の
生成を行い、表示手段10により表示する。
Description
【0001】
【産業上の利用分野】本発明は電話回線などを利用する
通信装置に係り、特に送信側からの音声信号をもとに受
信側で擬似動画の表示を行う擬似動画TV電話装置に関
する。
通信装置に係り、特に送信側からの音声信号をもとに受
信側で擬似動画の表示を行う擬似動画TV電話装置に関
する。
【0002】
【従来の技術】従来、話者をTVカメラ等で撮像し、画
像データ圧縮して音声信号と共に伝送し、受信側で画像
伸長を行いTV画面等に表示するといったようなTV電
話が実用化されている。その詳細については村上 治著
「画像メディアと通信革命」(産業図書 p61 19
84年)に記載されている。
像データ圧縮して音声信号と共に伝送し、受信側で画像
伸長を行いTV画面等に表示するといったようなTV電
話が実用化されている。その詳細については村上 治著
「画像メディアと通信革命」(産業図書 p61 19
84年)に記載されている。
【0003】
【発明が解決しようとする課題】従来のTV電話におけ
る問題点として以下のようなことがあげられる。まず、
伝送すべき画像は話者をTVカメラ等で撮像したもので
あるため、画像圧縮の方式にもよるが、仮に画像圧縮し
たとしても情報量が膨大であり、1枚の画面を送るのに
数秒程度かかってしまう。また、送信側においてTV電
話装置を持たない場合、すなわち、一般の電話や公衆電
話、携帯電話からの送信に対しては受信側におけるTV
電話装置としての機能を発揮できないなど問題があっ
た。
る問題点として以下のようなことがあげられる。まず、
伝送すべき画像は話者をTVカメラ等で撮像したもので
あるため、画像圧縮の方式にもよるが、仮に画像圧縮し
たとしても情報量が膨大であり、1枚の画面を送るのに
数秒程度かかってしまう。また、送信側においてTV電
話装置を持たない場合、すなわち、一般の電話や公衆電
話、携帯電話からの送信に対しては受信側におけるTV
電話装置としての機能を発揮できないなど問題があっ
た。
【0004】本発明の目的は電話回線を用いて、送信側
から画像伝送を行わずに音声信号からその話者の擬似顔
動画像を受信側で表示できるTV電話装置を提供するこ
とにある。
から画像伝送を行わずに音声信号からその話者の擬似顔
動画像を受信側で表示できるTV電話装置を提供するこ
とにある。
【0005】
【課題を解決するための手段】上記の問題を解決するた
め、本発明の擬似動画TV電話装置は音声信号の声道特
性と放射特性の特徴を分析し、線形予測符号化を行い、
特徴抽出した音声パラメータを出力する音声分析手段
と、ワイヤフレームで構成された複数の口形モデル及び
頭部モデルを蓄積し、選択されたモデルに関する口形及
び頭部モデルデータを出力するモデル生成手段と、前記
音声パラメータと口形モデルデータを入力し、音声パラ
メータを時々刻々と変化する口形パラメータに変換出力
するパラメータ変換手段と、前記口形パラメータ及び頭
部モデルデータをもとに、送信側話者の擬似顔動画像の
生成を行う画像合成手段と、前記画像合成手段で得られ
る送信側話者の擬似顔動画像を表示する表示手段とを備
えたことを特徴とする。
め、本発明の擬似動画TV電話装置は音声信号の声道特
性と放射特性の特徴を分析し、線形予測符号化を行い、
特徴抽出した音声パラメータを出力する音声分析手段
と、ワイヤフレームで構成された複数の口形モデル及び
頭部モデルを蓄積し、選択されたモデルに関する口形及
び頭部モデルデータを出力するモデル生成手段と、前記
音声パラメータと口形モデルデータを入力し、音声パラ
メータを時々刻々と変化する口形パラメータに変換出力
するパラメータ変換手段と、前記口形パラメータ及び頭
部モデルデータをもとに、送信側話者の擬似顔動画像の
生成を行う画像合成手段と、前記画像合成手段で得られ
る送信側話者の擬似顔動画像を表示する表示手段とを備
えたことを特徴とする。
【0006】
【作用】本発明では例えば電話回線を介して送信側話者
から送られてくる音声信号は音声分析手段において線形
予測符号化に基づく特徴抽出により音声パラメータに変
換される。一方、モデル生成手段ではワイヤフレームで
構成された複数の口形モデルと頭部モデルが蓄積され、
選択されたモデルに関する口形及び頭部モデルデータが
出力される。音声パラメータは口形モデルデータをもと
に、パラメータ変換手段で口形パラメータに変換出力さ
れる。そして画像合成手段で、口形パラメータと頭部モ
デルデータをもとに、送信側話者の擬似顔動画像の生成
を行い、表示手段により表示する。
から送られてくる音声信号は音声分析手段において線形
予測符号化に基づく特徴抽出により音声パラメータに変
換される。一方、モデル生成手段ではワイヤフレームで
構成された複数の口形モデルと頭部モデルが蓄積され、
選択されたモデルに関する口形及び頭部モデルデータが
出力される。音声パラメータは口形モデルデータをもと
に、パラメータ変換手段で口形パラメータに変換出力さ
れる。そして画像合成手段で、口形パラメータと頭部モ
デルデータをもとに、送信側話者の擬似顔動画像の生成
を行い、表示手段により表示する。
【0007】このように本発明によれば、送信側話者の
音声信号からその擬似顔動画像を受信側で生成表示する
ので、実際に伝送する信号は音声に関するものだけとな
り、従来のTV電話装置と比較すると、情報量や伝送時
間がはるかに低減でき、一般のアナログ電話回線や、さ
らに公衆電話、携帯電話からの送信に対して適応でき、
送信側話者の音声信号からその擬似顔動画像を受信側で
生成表示するので、TV電話同士で通話しているような
感覚で通話が行える。
音声信号からその擬似顔動画像を受信側で生成表示する
ので、実際に伝送する信号は音声に関するものだけとな
り、従来のTV電話装置と比較すると、情報量や伝送時
間がはるかに低減でき、一般のアナログ電話回線や、さ
らに公衆電話、携帯電話からの送信に対して適応でき、
送信側話者の音声信号からその擬似顔動画像を受信側で
生成表示するので、TV電話同士で通話しているような
感覚で通話が行える。
【0008】これは受信側で表示される送信側話者の擬
似顔動画像については実際の通信時の送信側話者の状態
とは相違するものの、少なくとも送信側話者の擬似顔が
表示され、しかも音声に合わせた口の動きが動画表示さ
れるので、擬似的に送信側とTV電話で通話しているよ
うな感覚で通話が行える。
似顔動画像については実際の通信時の送信側話者の状態
とは相違するものの、少なくとも送信側話者の擬似顔が
表示され、しかも音声に合わせた口の動きが動画表示さ
れるので、擬似的に送信側とTV電話で通話しているよ
うな感覚で通話が行える。
【0009】
【実施例】以下、本発明の実施例を図面を用いながら詳
しく説明する。図1は本発明の第1の実施例を示すブロ
ック図である。尚、図面では擬似動画TV電話装置にお
ける受信部のブロック図のみを示しており、送信部のブ
ロック図は公知の一般の電話機であっても良いため省略
してある。
しく説明する。図1は本発明の第1の実施例を示すブロ
ック図である。尚、図面では擬似動画TV電話装置にお
ける受信部のブロック図のみを示しており、送信部のブ
ロック図は公知の一般の電話機であっても良いため省略
してある。
【0010】図1で、1は各家庭の一般電話、公衆電
話、自動車携帯電話など画像伝送装置を持たない電話
機、2は電話回線である。3は本発明の擬似動画TV電
話装置、4は電話回線を介して送信側話者から送られて
くる音声信号を出力する通信手段であり、この場合は電
話機の受信回路となる。5は音声信号を音声パラメータ
に変換出力する音声分析手段である。6は受信側話者が
送信側話者の擬似顔を選択するための選択信号を出力す
る選択手段である。7は口形モデルデータと頭部モデル
データを出力するモデル生成手段である。8は音声パラ
メータと口形モデルデータを入力し、音声パラメータを
口形パラメータに変換出力するパラメータ変換手段であ
る。9は口形パラメータと頭部モデルデータをもとに、
送信側話者の擬似顔動画像の生成を行う画像合成手段で
ある。10は送信側話者の擬似顔動画像を表示する表示
手段である。
話、自動車携帯電話など画像伝送装置を持たない電話
機、2は電話回線である。3は本発明の擬似動画TV電
話装置、4は電話回線を介して送信側話者から送られて
くる音声信号を出力する通信手段であり、この場合は電
話機の受信回路となる。5は音声信号を音声パラメータ
に変換出力する音声分析手段である。6は受信側話者が
送信側話者の擬似顔を選択するための選択信号を出力す
る選択手段である。7は口形モデルデータと頭部モデル
データを出力するモデル生成手段である。8は音声パラ
メータと口形モデルデータを入力し、音声パラメータを
口形パラメータに変換出力するパラメータ変換手段であ
る。9は口形パラメータと頭部モデルデータをもとに、
送信側話者の擬似顔動画像の生成を行う画像合成手段で
ある。10は送信側話者の擬似顔動画像を表示する表示
手段である。
【0011】次に各部の動作について説明する。
【0012】電話機1が送信側で、擬似動画TV電話装
置3の受信動作を考える場合、電話機1から送られてく
る信号は電話回線2を介して擬似動画TV電話装置3に
入力される。信号は通信手段4より、送信側話者の音声
信号aが出力される。その後、音声信号aは音声分析手
段5に入力され、音声信号aの声道特性と放射特性の特
徴を分析し、線形予測符号化を行うことにより、特徴抽
出した音声パラメータbへ変換され、パラメータ変換手
段8に出力される。
置3の受信動作を考える場合、電話機1から送られてく
る信号は電話回線2を介して擬似動画TV電話装置3に
入力される。信号は通信手段4より、送信側話者の音声
信号aが出力される。その後、音声信号aは音声分析手
段5に入力され、音声信号aの声道特性と放射特性の特
徴を分析し、線形予測符号化を行うことにより、特徴抽
出した音声パラメータbへ変換され、パラメータ変換手
段8に出力される。
【0013】一方、送信側話者の話し声を聞くことによ
り、受信側話者は選択手段6で表示したい送信側話者の
擬似顔の選択を行う。これに伴い選択手段6からは選択
信号cが出力され、モデル生成手段7に入力される。モ
デル生成手段7にはワイヤフレームで構成された複数の
口形モデルと頭部モデルが蓄積されており、選択信号c
を受けたモデル生成手段7は選択信号cをもとに選択さ
れたモデルに関する口形モデルデータdをパラメータ変
換手段8に、頭部モデルデータfを画像合成手段9に、
それぞれ出力する。
り、受信側話者は選択手段6で表示したい送信側話者の
擬似顔の選択を行う。これに伴い選択手段6からは選択
信号cが出力され、モデル生成手段7に入力される。モ
デル生成手段7にはワイヤフレームで構成された複数の
口形モデルと頭部モデルが蓄積されており、選択信号c
を受けたモデル生成手段7は選択信号cをもとに選択さ
れたモデルに関する口形モデルデータdをパラメータ変
換手段8に、頭部モデルデータfを画像合成手段9に、
それぞれ出力する。
【0014】ここで、選択手段6とモデル生成手段7の
動作に関連し、受信側話者における送信側話者の擬似顔
の選択について詳しく説明する。例えば、受信側話者
が、肉親、知人、友人などのよく電話がかかってくる人
達の顔をあらかじめ撮像するなどしておき、頭部モデル
としてモデル生成手段7に蓄積しておく。また、肉親、
知人、友人などのよく電話がかかってくる人達、以外の
人達に対応するための顔は初めからモデル生成手段7に
標準モデルの顔が頭部モデルとして蓄積されており、受
信側話者がその標準モデルの顔を自ら作成編集し、モデ
ル生成手段7に頭部モデルとして蓄積しておいても良
い。さて電話がかかってきたら、まず受信側話者はその
送信側話者の声より人物を判断する。もしその人物が肉
親、知人、友人などであれば、その顔を選択手段6で選
択し、それに伴い選択信号cがモデル生成手段7に出力
される。また、もしその人物が肉親、知人、友人などの
人物以外であれば、標準モデルの顔を選択手段6で選択
し、それに伴い選択信号cがモデル生成手段7に出力さ
れる。さらに、送信側話者の人物が誰であろうとも、あ
らかじめ受信側話者が自ら作成し蓄積しておいた標準モ
デルの顔を、選択手段6で選択しても良い。
動作に関連し、受信側話者における送信側話者の擬似顔
の選択について詳しく説明する。例えば、受信側話者
が、肉親、知人、友人などのよく電話がかかってくる人
達の顔をあらかじめ撮像するなどしておき、頭部モデル
としてモデル生成手段7に蓄積しておく。また、肉親、
知人、友人などのよく電話がかかってくる人達、以外の
人達に対応するための顔は初めからモデル生成手段7に
標準モデルの顔が頭部モデルとして蓄積されており、受
信側話者がその標準モデルの顔を自ら作成編集し、モデ
ル生成手段7に頭部モデルとして蓄積しておいても良
い。さて電話がかかってきたら、まず受信側話者はその
送信側話者の声より人物を判断する。もしその人物が肉
親、知人、友人などであれば、その顔を選択手段6で選
択し、それに伴い選択信号cがモデル生成手段7に出力
される。また、もしその人物が肉親、知人、友人などの
人物以外であれば、標準モデルの顔を選択手段6で選択
し、それに伴い選択信号cがモデル生成手段7に出力さ
れる。さらに、送信側話者の人物が誰であろうとも、あ
らかじめ受信側話者が自ら作成し蓄積しておいた標準モ
デルの顔を、選択手段6で選択しても良い。
【0015】さて、音声パラメータbには送信側話者の
会話における発音時の口形の情報が含まれており、パラ
メータ変換手段8に入力される。同時に、口形モデルデ
ータdもパラメータ変換手段8に入力される。ここで音
声パラメータbは口形モデルデータdをもとに、時々刻
々と変化する口形パラメータeに変換出力される。その
後、口形パラメータeと頭部モデルデータfは画像合成
手段9に入力される。画像合成手段9では口形パラメー
タeと頭部モデルデータfをもとに、三角形ポリゴンで
構成される三次元モデル(ワイヤフレームモデル)を変
形させ、各ポリゴンにテクスチャマッピング処理を施す
ことにより送信側話者の擬似顔動画像を合成する。尚、
図2に、三次元モデル(ワイヤフレームモデル)のイメ
ージ図を示す。図2で示した三次元モデル(ワイヤフレ
ームモデル)90を構成する無数の三角形、すなわち、
三角形ポリゴンを変形させ、その各ポリゴンに、口形パ
ラメータeと頭部モデルデータfをもとにテクスチャマ
ッピング処理を施すことにより、送信側話者の擬似顔動
画像が得られる。最後に画像合成手段9で得られた送信
側話者の擬似顔動画像を、表示手段10により表示す
る。
会話における発音時の口形の情報が含まれており、パラ
メータ変換手段8に入力される。同時に、口形モデルデ
ータdもパラメータ変換手段8に入力される。ここで音
声パラメータbは口形モデルデータdをもとに、時々刻
々と変化する口形パラメータeに変換出力される。その
後、口形パラメータeと頭部モデルデータfは画像合成
手段9に入力される。画像合成手段9では口形パラメー
タeと頭部モデルデータfをもとに、三角形ポリゴンで
構成される三次元モデル(ワイヤフレームモデル)を変
形させ、各ポリゴンにテクスチャマッピング処理を施す
ことにより送信側話者の擬似顔動画像を合成する。尚、
図2に、三次元モデル(ワイヤフレームモデル)のイメ
ージ図を示す。図2で示した三次元モデル(ワイヤフレ
ームモデル)90を構成する無数の三角形、すなわち、
三角形ポリゴンを変形させ、その各ポリゴンに、口形パ
ラメータeと頭部モデルデータfをもとにテクスチャマ
ッピング処理を施すことにより、送信側話者の擬似顔動
画像が得られる。最後に画像合成手段9で得られた送信
側話者の擬似顔動画像を、表示手段10により表示す
る。
【0016】このように、図1の実施例では送信側話者
の音声信号からその擬似顔動画像を受信側で生成表示す
ることを特徴としているので、従来のTV電話装置と比
較すると、情報量や伝送時間がはるかに低減できる。ま
た一般の電話や公衆電話、携帯電話からの送信に対して
も、従来のTV電話同士で通話しているような感覚で通
話が行える。さらに送信側話者の音声信号からその擬似
顔動画像を受信側で生成表示するのに際し、音声信号を
パラメータに変換し、そのパラメータから直接的に画像
合成へ結び付ける、というような方法を用いているた
め、複雑な音声認識の手段を用いる必要がないという長
所もある。
の音声信号からその擬似顔動画像を受信側で生成表示す
ることを特徴としているので、従来のTV電話装置と比
較すると、情報量や伝送時間がはるかに低減できる。ま
た一般の電話や公衆電話、携帯電話からの送信に対して
も、従来のTV電話同士で通話しているような感覚で通
話が行える。さらに送信側話者の音声信号からその擬似
顔動画像を受信側で生成表示するのに際し、音声信号を
パラメータに変換し、そのパラメータから直接的に画像
合成へ結び付ける、というような方法を用いているた
め、複雑な音声認識の手段を用いる必要がないという長
所もある。
【0017】次に図3、図4のブロック図を用いて本発
明の第2の実施例を詳しく説明する。図3で、100は
自動車・携帯電話といったような受信側話者における移
動体通信の無線端末装置であり、300は本発明の擬似
動画TV電話装置である。6は受信側話者が送信側話者
の擬似顔を選択するための選択信号を出力する選択手段
である。7は口形モデルデータと頭部モデルデータを出
力するモデル生成手段である。8は音声パラメータと口
形モデルデータを入力し、音声パラメータを口形パラメ
ータに変換出力するパラメータ変換手段である。9は口
形パラメータと頭部モデルデータをもとに、送信側話者
の擬似顔動画像の生成を行う画像合成手段である。10
は送信側話者の擬似顔動画像を表示する表示手段であ
る。さらに無線端末装置100における詳しいブロック
図を図4に示す。図4で、101は送受信アンテナ、1
02は高周波部、103は変復調部、104はチャネル
コーデック、105は音声符号化手段、106は音声合
成手段、107はスピーカ、108はマイクであり、例
えばPDC(Personal Digital Ce
llular)などの、財団法人電波システム開発セン
ター刊「ディジタル自動車電話システム標準規格(RC
R STD−27B」で規定されている端末である。
明の第2の実施例を詳しく説明する。図3で、100は
自動車・携帯電話といったような受信側話者における移
動体通信の無線端末装置であり、300は本発明の擬似
動画TV電話装置である。6は受信側話者が送信側話者
の擬似顔を選択するための選択信号を出力する選択手段
である。7は口形モデルデータと頭部モデルデータを出
力するモデル生成手段である。8は音声パラメータと口
形モデルデータを入力し、音声パラメータを口形パラメ
ータに変換出力するパラメータ変換手段である。9は口
形パラメータと頭部モデルデータをもとに、送信側話者
の擬似顔動画像の生成を行う画像合成手段である。10
は送信側話者の擬似顔動画像を表示する表示手段であ
る。さらに無線端末装置100における詳しいブロック
図を図4に示す。図4で、101は送受信アンテナ、1
02は高周波部、103は変復調部、104はチャネル
コーデック、105は音声符号化手段、106は音声合
成手段、107はスピーカ、108はマイクであり、例
えばPDC(Personal Digital Ce
llular)などの、財団法人電波システム開発セン
ター刊「ディジタル自動車電話システム標準規格(RC
R STD−27B」で規定されている端末である。
【0018】次に各部の動作について、図1における第
1の実施例と異なる点についてのみ詳しく説明する。
1の実施例と異なる点についてのみ詳しく説明する。
【0019】無線端末装置100に電話がかかってきた
とすると、送受信アンテナ101に受信した信号は高周
波部102で周波数の低い信号に変換され、変復調部1
03で復調される。その後、チャネルコーデック104
で誤り訂正の処理が行われ、音声処理部105に入力さ
れる。音声処理部105では内部の音声符号化手段10
6で、音声の声道特性と放射特性の特徴を分析し線形予
測符号化を行うことにより、特徴抽出した音声パラメー
タbが存在する。線形予測符号化における処理に関して
はPDCの場合、VSELP(Vector−Sum
Excitedlinear Predictive
Coding)が採用されており、同様の処理が行われ
る。音声パラメータbには送信側話者の会話における発
音時の口形の情報が含まれており、パラメータ変換手段
8に入力される。以下、選択手段6、モデル生成手段
7、パラメータ変換手段8、画像合成手段9、表示手段
10に至る機能及び動作については図1における第1の
実施例と同じであるため省略する。以上説明したよう
に、図1における第1の実施例と異なる点は通信手段4
と音声分析手段5が無線端末装置100に含まれている
ことである。
とすると、送受信アンテナ101に受信した信号は高周
波部102で周波数の低い信号に変換され、変復調部1
03で復調される。その後、チャネルコーデック104
で誤り訂正の処理が行われ、音声処理部105に入力さ
れる。音声処理部105では内部の音声符号化手段10
6で、音声の声道特性と放射特性の特徴を分析し線形予
測符号化を行うことにより、特徴抽出した音声パラメー
タbが存在する。線形予測符号化における処理に関して
はPDCの場合、VSELP(Vector−Sum
Excitedlinear Predictive
Coding)が採用されており、同様の処理が行われ
る。音声パラメータbには送信側話者の会話における発
音時の口形の情報が含まれており、パラメータ変換手段
8に入力される。以下、選択手段6、モデル生成手段
7、パラメータ変換手段8、画像合成手段9、表示手段
10に至る機能及び動作については図1における第1の
実施例と同じであるため省略する。以上説明したよう
に、図1における第1の実施例と異なる点は通信手段4
と音声分析手段5が無線端末装置100に含まれている
ことである。
【0020】次に図3、図4との実施例と本質的には同
じながらも若干変更を施したものとして一つの変形例を
図5に示す。図5で図3、図4と異なる点は図3におけ
る擬似動画TV電話装置300を無線端末装置100に
取り込んだことである。尚、図3における選択手段6は
図5における無線端末装置100には存在しないが、公
知の一般の無線端末装置における、制御部110を介し
たキーパッド111などの操作により代用が可能であ
る。また同様に、図3における表示手段10は図5にお
ける無線端末装置100には存在しないが、これも公知
の一般の無線端末装置における、電話番号などを表示す
るLCD112などで代用が可能である。図5における
具体的な動作については図3、図4における動作と実質
的に同じであるため省略する。
じながらも若干変更を施したものとして一つの変形例を
図5に示す。図5で図3、図4と異なる点は図3におけ
る擬似動画TV電話装置300を無線端末装置100に
取り込んだことである。尚、図3における選択手段6は
図5における無線端末装置100には存在しないが、公
知の一般の無線端末装置における、制御部110を介し
たキーパッド111などの操作により代用が可能であ
る。また同様に、図3における表示手段10は図5にお
ける無線端末装置100には存在しないが、これも公知
の一般の無線端末装置における、電話番号などを表示す
るLCD112などで代用が可能である。図5における
具体的な動作については図3、図4における動作と実質
的に同じであるため省略する。
【0021】このように、図3、図4、図5における第
2の実施例における効果は第1の実施例と同様に得るこ
とができる。また、周波数の有効利用に伴う伝送速度の
許容限度を考えた場合、送信側話者の画像伝送をせず
に、音声信号からその擬似顔動画像を受信側で生成表示
できる手段を無線端末装置に持たせた効果は大きい。
2の実施例における効果は第1の実施例と同様に得るこ
とができる。また、周波数の有効利用に伴う伝送速度の
許容限度を考えた場合、送信側話者の画像伝送をせず
に、音声信号からその擬似顔動画像を受信側で生成表示
できる手段を無線端末装置に持たせた効果は大きい。
【0022】
【発明の効果】本発明によれば、送信側話者の音声信号
からその擬似顔動画像を受信側で生成表示するので、実
際に伝送する信号は音声に関するものだけとなり、従来
のTV電話装置と比較すると、情報量や伝送時間がはる
かに低減でき、もちろん一般のアナログ電話回線でも実
現できる。さらに一般の電話や公衆電話、携帯電話から
の送信に対しても、送信側話者の音声信号からその擬似
顔動画像を受信側で生成表示するので、従来のTV電話
同士で通話しているような感覚で通話が行える。
からその擬似顔動画像を受信側で生成表示するので、実
際に伝送する信号は音声に関するものだけとなり、従来
のTV電話装置と比較すると、情報量や伝送時間がはる
かに低減でき、もちろん一般のアナログ電話回線でも実
現できる。さらに一般の電話や公衆電話、携帯電話から
の送信に対しても、送信側話者の音声信号からその擬似
顔動画像を受信側で生成表示するので、従来のTV電話
同士で通話しているような感覚で通話が行える。
【図1】本発明の第1の実施例を示すブロック図。
【図2】本発明の第1の実施例で用いる三次元モデルの
斜視図。
斜視図。
【図3】本発明の第2の実施例を示すブロック図。
【図4】図3の実施例で用いる無線端末装置を示すブロ
ック図。
ック図。
【図5】本発明の第2の実施例の変形例を示すブロック
図。
図。
1…電話機、 2…電話回線、 3…疑似動画TV電話装置、 4…通信手段、 5…音声分析手段、 6…選択手段、 7…モデル生成手段、 8…パラメータ変換手段、 9…画像合成手段、 10…表示手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 吉岡 厚 神奈川県横浜市戸塚区吉田町292番地株式 会社日立製作所映像メディア研究所内
Claims (2)
- 【請求項1】音声信号の声道特性と放射特性の特徴を分
析し、特徴抽出した音声パラメータを出力する音声分析
手段と、ワイヤフレームで構成された複数の口形モデル
及び頭部モデルを蓄積し、選択されたモデルに関する口
形及び頭部モデルデータを出力するモデル生成手段と、 前記音声パラメータと前記口形モデルデータを入力し、
前記音声パラメータを時々刻々と変化する口形パラメー
タに変換出力するパラメータ変換手段と、 前記口形パラメータ及び前記頭部モデルデータをもと
に、送信側話者の擬似顔動画像の生成を行う画像合成手
段と、 前記画像合成手段で得られる送信側話者の前記擬似顔動
画像を表示する表示手段と を備えたことを特徴とする
擬似動画TV電話装置。 - 【請求項2】移動体通信の無線端末装置において、音声
の声道特性と放射特性の特徴を分析し線形予測符号化を
行う音声符号化手段と、符号化された音声データからア
ナログ音声信号を合成する音声合成手段と、前記符号化
された音声データで音声情報の送受信を行う通信手段
と、特徴抽出された音声パラメータを出力するための出
力手段とを備え、ワイヤフレームで構成された複数の口
形モデル及び頭部モデルを蓄積し、選択されたモデルに
関する口形及び頭部モデルデータを出力するモデル生成
手段と、 前記出力手段の出力する前記音声パラメータと、前記モ
デル生成手段の出力する前記口形モデルデータを入力
し、前記音声パラメータを時々刻々と変化する口形パラ
メータに変換するパラメータ変換手段と、前記口形パラ
メータ及び前記頭部モデルデータをもとに、送信側話者
の前記擬似顔動画像の生成を行う画像合成手段と、前記
画像合成手段で得られる送信側話者の前記擬似顔動画像
を表示する表示手段とを備えたことを特徴とする擬似動
画TV電話装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7111524A JPH08307841A (ja) | 1995-05-10 | 1995-05-10 | 擬似動画tv電話装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7111524A JPH08307841A (ja) | 1995-05-10 | 1995-05-10 | 擬似動画tv電話装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08307841A true JPH08307841A (ja) | 1996-11-22 |
Family
ID=14563522
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7111524A Pending JPH08307841A (ja) | 1995-05-10 | 1995-05-10 | 擬似動画tv電話装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08307841A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2351638A (en) * | 1999-02-24 | 2001-01-03 | Yoshiro Akiyama | Telephone that receives image of caller |
| US6313864B1 (en) * | 1997-03-24 | 2001-11-06 | Olympus Optical Co., Ltd. | Image and voice communication system and videophone transfer method |
| JP2003109036A (ja) * | 2001-10-01 | 2003-04-11 | Minolta Co Ltd | 通信システム、端末装置、送信方法、およびコンピュータプログラム |
| WO2013031677A1 (ja) * | 2011-08-26 | 2013-03-07 | 国立大学法人豊橋技術科学大学 | 発音動作可視化装置および発音学習装置 |
| JP2014529233A (ja) * | 2012-03-29 | 2014-10-30 | テンセント テクノロジー (シェンツェン) カンパニー リミテッド | ビデオシミュレーション画像のための通信方法及びデバイス |
| CN110446000A (zh) * | 2019-08-07 | 2019-11-12 | 三星电子(中国)研发中心 | 一种生成对话人物形象的方法和装置 |
-
1995
- 1995-05-10 JP JP7111524A patent/JPH08307841A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6313864B1 (en) * | 1997-03-24 | 2001-11-06 | Olympus Optical Co., Ltd. | Image and voice communication system and videophone transfer method |
| GB2351638A (en) * | 1999-02-24 | 2001-01-03 | Yoshiro Akiyama | Telephone that receives image of caller |
| JP2003109036A (ja) * | 2001-10-01 | 2003-04-11 | Minolta Co Ltd | 通信システム、端末装置、送信方法、およびコンピュータプログラム |
| WO2013031677A1 (ja) * | 2011-08-26 | 2013-03-07 | 国立大学法人豊橋技術科学大学 | 発音動作可視化装置および発音学習装置 |
| JP2014529233A (ja) * | 2012-03-29 | 2014-10-30 | テンセント テクノロジー (シェンツェン) カンパニー リミテッド | ビデオシミュレーション画像のための通信方法及びデバイス |
| CN110446000A (zh) * | 2019-08-07 | 2019-11-12 | 三星电子(中国)研发中心 | 一种生成对话人物形象的方法和装置 |
| CN110446000B (zh) * | 2019-08-07 | 2021-04-16 | 三星电子(中国)研发中心 | 一种生成对话人物形象的方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5426460A (en) | Virtual multimedia service for mass market connectivity | |
| CN110446000B (zh) | 一种生成对话人物形象的方法和装置 | |
| CN1328909C (zh) | 便携式终端 | |
| KR100836616B1 (ko) | 영상 합성 기능을 가지는 휴대용 단말기 및 휴대용단말기의 영상 합성 방법 | |
| JP3485508B2 (ja) | 顔画像伝送方法およびシステムならびに当該システムで用いられる顔画像送信装置および顔画像再生装置 | |
| US20040114731A1 (en) | Communication system | |
| US6825873B2 (en) | TV phone apparatus | |
| WO2008079505A2 (en) | Method and apparatus for hybrid audio-visual communication | |
| JP2006330958A (ja) | 画像合成装置、ならびにその装置を用いた通信端末および画像コミュニケーションシステム、ならびにそのシステムにおけるチャットサーバ | |
| JP2004289254A (ja) | テレビ電話端末 | |
| KR20040045382A (ko) | 휴대단말기의 영상표시 장치 및 방법 | |
| JPH0983630A (ja) | 電話装置 | |
| JPH08307841A (ja) | 擬似動画tv電話装置 | |
| CN119277010A (zh) | 一种提供数字人的方法、系统及计算设备集群 | |
| JP2007213364A (ja) | 画像変換装置、画像変換方法及び画像変換プログラム | |
| JPH11341456A (ja) | 家庭用マルチメディア通信システム | |
| JP2008085421A (ja) | テレビ電話機、通話方法、プログラム、声質変換・画像編集サービス提供システム、および、サーバ | |
| JP2005057431A (ja) | テレビ電話端末装置 | |
| JP3062080U (ja) | 画面付き電話装置 | |
| JP2932027B2 (ja) | テレビ電話装置 | |
| JP2000004304A (ja) | 異なる手段での会話が可能な通話装置 | |
| JP2005130356A (ja) | テレビ電話システム及びその通信方法、並びに通信端末 | |
| JPH06205404A (ja) | テレビ電話装置 | |
| JP2001357414A (ja) | アニメーション通信方法およびシステム並びにそれに用いる端末装置 | |
| JP2644789B2 (ja) | 画像伝送方式 |