JPH09233231A - データ伝送方法及び装置 - Google Patents

データ伝送方法及び装置

Info

Publication number
JPH09233231A
JPH09233231A JP3157896A JP3157896A JPH09233231A JP H09233231 A JPH09233231 A JP H09233231A JP 3157896 A JP3157896 A JP 3157896A JP 3157896 A JP3157896 A JP 3157896A JP H09233231 A JPH09233231 A JP H09233231A
Authority
JP
Japan
Prior art keywords
data
voice
image data
input
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3157896A
Other languages
English (en)
Inventor
Katsuya Ishikawa
川 克 也 石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP3157896A priority Critical patent/JPH09233231A/ja
Priority to US08/803,043 priority patent/US6084911A/en
Publication of JPH09233231A publication Critical patent/JPH09233231A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 画像データに割り当てられる帯域幅が変動し
ても、好適に伝送できるようにする。 【解決手段】 符号化圧縮した音声データと画像データ
を固定長のパケットに混合して伝送するタイプのデータ
伝送方法において、(a)音声データの入力を試みる段
階と、(b)音声データの入力の有無を検出する段階
と、(c)画像データを所定の捕捉間隔で捕捉する段階
と、(d)画像データを所定の圧縮率で符号化圧縮する
段階と、(e)前記(b)段階の検出結果に応じて、音
声データを符号化圧縮し、符号化圧縮された画像データ
と混合してパケットを生成する段階と、(f)生成した
パケットを伝送する段階と、(g)過去1回以上の前記
(b)段階における検出結果を基に、以後の音声データ
の有無を予測する音声予測段階と、(h)前記(g)段
階の予測結果を基に、前記(c)段階の前記所定の捕捉
間隔を調整する段階と、を具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パケット形式でデ
ータを伝送するタイプのデータ伝送方法及び装置に係
り、特に、ビデオ会議のための音声データ及び画像デー
タをパケット形式にして伝送するためのデータ伝送方法
及び装置に関する。更に詳しくは、本発明は、音声デー
タ及び画像データを多重化したパケット形式にして伝送
するためのデータ伝送方法及び装置に関する。
【0002】
【従来の技術】ビデオ会議システム: 最近、パーソナル・コンピュータ
(PC)が広範に普及し、事務用及び家庭用のユーザ間
で相当に一般的なものとなってきている。これに伴っ
て、その用途も拡大し、単なるOA機器としてだけでは
なく、情報交換の媒体としても用いられるようになって
きた。例えば、遠隔にある会議室間を通信回線によって
結び、授受される音声データや画像データをPCで処理
するという、いわゆるビデオ会議システム(若しくはテ
レビ会議システム)が注目を集めるようになってきた。
【0003】このようなビデオ会議システムには、通信
媒体としてISDN(Integrated Services Digital Ne
twork)を、処理装置としてデスクトップPCを用いる
のが主流であった。ISDNは、1本の通信線に対して
音声伝送用及びデータ伝送用の2種類のチャネルを論理
的に割り当てることができる、デジタル・データ伝送用
のネットワークである。すなわち、ISDNは、電話な
どの音声に限らず、テキスト、データ、静止画、動画な
どのいわゆるマルチメディアを総合的に扱うことができ
る伝送媒体なのである。また、デスクトップPCが主流
なのは、普及率が高いことの他、ビデオ会議の各参加者
がそれぞれのオフィスの定められた場所に居ることが前
提であったことにも依拠する。
【0004】ところが、昨今の目覚しい技術革新に伴っ
て、小型・軽量な、いわゆるノートブックPCが出現し
てきた。殆ど全てのノートブックPCは、バッテリ駆動
型であり、屋外での携帯的・可搬的な使用、すなわちモ
ーバイル環境での使用が可能となっている。これに伴っ
て、モーバイル環境下でのビデオ会議に対するニーズも
高まりつつある。
【0005】モーバイル環境下でビデオ会議を実現する
場合、データ伝送媒体として何を用いるか、ということ
が1つの問題となる。先述したISDNは、高機能な反
面、高価で普及率も未だ高くない。したがって、ISD
Nによれば接続個所がかなり限定されてしまい、モーバ
イル性を損なうことになる。これに対して、一般公衆回
線(POTS:Plain Old Telephon
e System)は、安価で普及率が高い。会議の各
参加者は、自身のノートブックPCを、モデムを介して
最寄の場所から一般公衆回線に接続することができる。
したがって、ビデオ会議の通信媒体として、一般公衆回
線への期待が必然的に膨らむ訳である。
【0006】図9には、一般公衆回線とPCを用いたビ
デオ会議ネットワークの構成を模式的に示している。同
図に示すように、各PCはモデムを介して一般公衆回線
網に接続される。また、PBX(Private Branch eXcha
nge:構内交換機)を経由して構内回線網上にPCが接
続されている場合もある。なお、図示していないが、各
PCには、ユーザの姿態等を撮像するためのビデオ・カ
メラ、入力映像をデジタル化してコンピュータ内に取り
込むためのビデオ・キャプチャ・ボード/コントロー
ラ、音声を入出力するためのマイク及びスピーカ、音声
入出力をデジタル処理するためのオーディオ・コントロ
ーラ等、ビデオ会議に必須のハードウェア構成要素も備
えられている。
【0007】一般公衆回線を用いてビデオ会議を実現す
る場合、データ転送量が最大の問題となる。何故なら
ば、ビデオ会議のためには、音声や画像を含むため、伝
送しなければならない総データ量は、1本の回線に許容
される帯域幅(すなわち最大の転送レート)よりもはる
かに大きいからである。一般公衆回線を用いたビデオ会
議システムの過去の例では、(1)音声の伝送を諦め
る、あるいは、(2)音声データと画像に各1本ずつ専
用の回線を使用する、などの安直なソリューションが採
られていた。しかし、最近では、音声及び画像について
のデータ圧縮技術やCPUの処理能力が向上したことに
伴って、1本の公衆回線だけで音声データと画像データ
の両方を混合(若しくは多重化)して、伝送することが
可能になってきた。
【0008】パケット方式による音声データ・画像デー
タの伝送:回線上でのコミュニケーションは、一般に
は、パケット通信、すなわち一連のデータを固定ビット
幅のパケット単位に分割して行われる。ここで、パケッ
トとは、伝送データの実体を含んだデータ部と、伝送デ
ータの属性情報などからなるヘッダ部とで構成される。
通常、音声データや画像データは、パケットに分割する
前に、それぞれ符号化圧縮されている。
【0009】ビデオ会議のための音声データ及び画像デ
ータを一本化して伝送する場合、音声データの方にプラ
イオリティを与えるべきと考えられる。何故ならば、音
声の途切れは不快感を与えるのみならず会話自体を不能
にするため、音声により高いリアルタイム性が要求され
るからである。このため、音声データと画像データを同
時に送る場合には、パケット中の帯域を先ず音声データ
に割り当て、残りを画像データに割り当てられる。但
し、このことは、同じ通信路を共有する画像データに対
して遅延を強要することをも意味している。
【0010】図10には、音声データ及び画像データを
伝送するためのパケット構造の一例を示している。1つ
のパケットは288ビット長である。これは、最大転送
レートが14.4kbpsのモデムを用いた場合の、2
0(=50分の1)msec分のデータ量に相当する。
パケット内のデータ・フィールドの割り振り方は、音声
データを含むかどうかによって2種類に分かれる。
【0011】図10(a)には、音声データ付きパケッ
ト(「VOD(Voice Over Data)パケット」ともい
う)の構造を示している。第1ビットは、SYNCであ
り、同期を採るために用いられる。第2ビットは、該パ
ケット中に音声データを含んでいるかどうかを示すため
のGSMビットであり、音声データを含む場合には音声
フラグ(「Voice Activityビット(音声
入出力監視ビット)」ともいう)が設定(ON)され
る。SYNCビットとGSMビットが、パケットのヘッ
ダー部であり、第3ビット以降がデータ部である。第3
ビットから第8ビットの6ビットは、CRC(Cyclic R
edundancy Check)、すなわち、送信データのエラー検
出のために用いられる。第9〜第272の264ビット
は、音声データに割り当てられる(但し、264ビット
中の4ビットはパリティ・ビットとして使用される)。
伝送される音声データは、例えばGSM/*/アルゴリズ
ムによって符号化圧縮されている。残りの第273〜第
288ビットの16ビットは、画像データに割り当てら
れる。画像データは、例えばMPEG(Motion Picture
Experts Group)1やH261**によって符号化圧縮さ
れている。このパケットによれば、最大13kbps
(=260ビット÷20msec)の転送レートで音声
データが伝送される。
【0012】また、図10(b)には、音声データを含
まないパケット(「NON VOICEパケット」とも
いう)の構造を示している。第1ビットは、SYNCで
あり、同期を採るために用いられる。第2ビットは、該
パケット中に音声データを含んでいるかどうかを示すた
めのGSMビットであり、音声データを含まない場合に
はVoice Activityフラグが解除(OF
F)される。SYNCビットとGSMビットが、パケッ
トのヘッダー部であり、第3ビット以降がデータ部であ
る。この場合、残りの第3〜第288ビットの286ビ
ットの帯域全てが画像データに割り当てられる。画像デ
ータは、前述同様、MPEG1やH261に基づいて符
号化圧縮されている。
【0013】パケット通信に伴う問題点:音声データと
画像データを多重化して伝送する場合、前述したよう
に、リアルタイム性を要求される音声データの方にプラ
イオリティを与えられる。このため、音声データがパケ
ット中に存在するかどうかによって、画像データに割り
当てられる帯域幅が大きく異なってくる。このことは図
10を参照すれば、直感的に理解できよう。パケット中
の画像データの帯域幅が変動することの帰結として、以
下のような問題点が派生する。
【0014】(1)画像データの符号化圧縮のビット・
レートの問題 画像データの符号化圧縮モジュール(ソフトウェア)、
若しくは動画圧縮器(ハードウェア)は、一般には、自
身に与えられたパラメータ(例えばビット・レート)に
従って、データ圧縮率を調整するようになっている。よ
り具体的には、ビット・レートに応じて、単位時間当り
に符号化圧縮処理する画像フレーム数を一定に保つよう
に働く。したがって、適切なビット・レートを与えるこ
とによって、画像データの転送レート(帯域幅)と画質
のバランスのとれた最適なデータ転送を行うことができ
る。しかしながら、上述のように画像データに割り当て
られる帯域幅が動的に変化すると、これに応じて最適な
ビット・レートも変動してしまう。音声データがパケッ
ト中に存在しない(すなわち画像データに与えられた帯
域幅が広い)ことを前提にして、予め大きなビット・レ
ートを与えてしまうと、画質はよくなるが、画像1フレ
ーム分のデータ量が厖大になってしまう。動画の圧縮/
伸長モジュール、若しくは圧縮/伸長器は、一般には1
フレーム単位で画像データを捌くようになっている。し
たがって、1フレーム分のデータ量が大きくなり、受信
側で画像1フレームを受信するための所要時間が長くな
れば、その分画像データの伸長や表示する時期も遅滞す
る。この結果、受信者は数秒前の画像を見せられること
になる。逆に、音声データがパケット中に存在する(す
なわち画像データに与えられた帯域幅が狭い)ことを前
提にして、予め小さなビット・レートを与えれば、画像
1フレーム分のデータ量が少なくなるので、画像の遅延
は解消される。しかし、そのトレードオフとして、音声
データがなく広い帯域を与えられている間も、画像は貧
弱なものになる。
【0015】(2)ビデオ・キャプチャのフレーム・レ
ートの問題 PCをビデオ会議に利用するには、通常、ビデオ・キャ
プチャ・ボード若しくはビデオ・キャプチャ・コントロ
ーラなどのような、ビデオ・カメラからの入力画像をデ
ジタル化してファイルに落とすためのデバイスが用いら
れる。ビデオ・キャプチャ・コントローラは、一般に
は、1フレーム単位で画像データのキャプチャリングを
行う。キャブチャリング動作は、例えば、上位のハード
ウェア(例えば「ビデオ・アプリケーション・プログラ
ム」を実行するCPU)からの画像入力要求に応答して
行われる。画像の動きをなるべくスムースに見せるため
には、フレーム・レート、すなわち1秒当りにキャプチ
ャする画像フレーム数を上げればよい。しかし、その当
然の帰結として、画像データの総量が増えることにな
る。狭い帯域幅しか与えられていないとき(図10
(a)参照)には、フレーム・レートを高くしていて
は、データの滞り(バッファリング)が生じ、受信者に
は数秒前の画像を見せられることになる。逆に、フレー
ム・レートを下げ過ぎると、画像の遅延は避けられる
が、見た目の動画のスムースさを欠くことになる。ま
た、次フレームとの間にビデオ・データが送られない空
白のパケット(隙間)が生じるなど、効率的な伝送を行
えない。1フレーム以上のデータ・バッファリングは、
画像の遅延を将来するだけで全く意味がない。つまり、
1フレームの伝送を完了したときに次の1フレームの伝
送を開始できるような間隔でキャプチャリングするのが
望ましい。画像1フレーム分のデータ量(ビット数)と
通信路中で画像データに割り当てられた帯域幅とから1
フレーム分の伝送時間を計算すれば、次に画像フレーム
をキャプチャすべき最適な時間間隔が求められよう。し
かしながら、画像データに割り当てられる帯域幅が動的
に変化したのでは、この計算は成り立たない。
【0016】音声データの方にプライオリティが与えら
れるといっても、画像も一定の速度で且つ極力滑らかに
再生することが望ましい。したがって、画像データの符
号化圧縮や、ビデオ・キャプチャリングの問題の解決は
不可避なのである。
【0017】ISDNやLANのように、音声データと
画像データの各々に対して広い帯域幅の通信路を割り当
てることができるような伝送方式であれば、上述した問
題点は目立たない。単一の電話回線のように狭帯域の1
通信路をデータ・チャネルが共有するような伝送方式の
場合、このような問題点は、とりわけ重大となる。
【0018】《注釈》 *:GSMは、Global System for Mobile communicati
on の略である。GSMにおける音声符号化アルゴリズ
ムは、Regular Pulse Excited-Linear Predictive Code
r(RPE−LPC)として知られている。 **:H261はITU(International Telecommunic
ation Union)勧告に従った圧縮アルゴリズム
【0019】
【発明が解決しようとする課題】本発明の目的は、ビデ
オ会議のためのデータをパケット形式で伝送するため
の、優れたデータ伝送方法及び装置を提供することにあ
る。
【0020】本発明の更なる目的は、ビデオ会議の音声
データ及び画像データを多重化したパケット形式にして
伝送するための、優れたデータ伝送方法及び装置を提供
することにある。
【0021】本発明の更なる目的は、符号化圧縮した音
声データと符号化圧縮した画像データを多重化して固定
ビット幅のパケットにして伝送するときに、音声データ
にプライオリティを与えながらも画像データも滞りなく
伝送することができる、優れたデータ伝送方法を提供及
び装置することにある。
【0022】本発明の更なる目的は、符号化圧縮した画
像データを固定ビット幅のパケット内に入れて伝送する
場合において、画像データに割り当てられる帯域幅が変
動しても、好適に画像データを伝送することができる優
れたデータ伝送方法及び装置を提供することにある。
【0023】
【課題を解決するための手段】本発明は、上記課題を参
酌してなされたものであり、その第1の側面は、符号化
圧縮した音声データと符号化圧縮した画像データを固定
ビット幅のパケットに混合してネットワーク上に伝送す
るタイプのデータ伝送方法において、パケット内に音声
データを含むかどうかに応じて画像データの圧縮率を調
整する、ことを特徴とするデータ伝送方法である。
【0024】また、本発明の第2の側面は、入力した音
声データを符号化圧縮するとともに、捕捉した画像デー
タを符号化圧縮し、符号化圧縮された音声データと符号
化圧縮された画像データを固定ビット幅のパケットに混
合して、ネットワーク上に伝送するタイプのデータ伝送
方法において、パケット内に音声データを含むかどうか
に応じて画像データの捕捉間隔を調整する、ことを特徴
とするデータ伝送方法である。
【0025】また、本発明の第3の側面は、符号化圧縮
した音声データと符号化圧縮した画像データを固定ビッ
ト幅のパケットに混合してネットワーク上に伝送するタ
イプのデータ伝送方法において、(a)音声データの入
力を試みる段階と、(b)音声データの入力の有無を検
出する段階と、(c)画像データを所定の捕捉間隔で捕
捉する段階と、(d)画像データを所定の圧縮率で符号
化圧縮する段階と、(e)前記(b)段階の検出結果に
応じて、音声データを符号化圧縮するとともに、符号化
圧縮された画像データと混合して、パケットを生成する
段階と、(f)生成したパケットを伝送する段階と、
(g)過去1回以上の前記(b)段階における検出結果
を基に、以後の音声データの有無を予測する音声予測段
階と、(h)前記(g)段階の予測結果を基に、前記
(c)段階の前記所定の捕捉間隔を調整する段階と、を
具備することを特徴とするデータ伝送方法である。
【0026】ここで、前記(c)段階では比較的短い第
1の捕捉間隔又は比較的長い第2の捕捉間隔のうちのい
ずれか一方で画像データを捕捉し、また、前記(h)段
階では、予測結果が音声データ有りを示す場合は第2の
捕捉間隔を選択し、予測結果が音声データ無しを示す場
合は第1の捕捉間隔を選択する、ようにしてもよい。
【0027】また、本発明の第4の側面は、符号化圧縮
した音声データと符号化圧縮した画像データを固定ビッ
ト幅のパケットに混合してネットワーク上に伝送するタ
イプのデータ伝送方法において、(a)音声データの入
力を試みる段階と、(b)音声データの入力の有無を検
出する段階と、(c)画像データを所定の捕捉間隔で捕
捉する段階と、(d)画像データを所定の圧縮率で符号
化圧縮する段階と、(e)前記(b)段階の検出結果に
応じて、音声データを符号化圧縮するとともに、符号化
圧縮された画像データと混合して、パケットを生成する
段階と、(f)生成したパケットを伝送する段階と、
(g)過去1回以上の前記(b)段階における検出結果
を基に、以後の音声データの有無を予測する音声予測段
階と、(h)前記(g)段階の予測結果を基に、前記
(d)段階の前記所定の圧縮率を調整する段階と、を具
備することを特徴とするデータ伝送方法である。
【0028】ここで、前記(d)段階では、比較的高い
第1の圧縮率又は比較的低い第2の圧縮率のうちいずれ
か一方で画像データを圧縮し、また、前記(h)段階で
は、予測結果が音声データ有りを示す場合は第1の圧縮
率を選択し、予測結果が音声データ無しを示す場合は第
2の圧縮率を選択する、ようにしてもよい。
【0029】また、本発明の第5の側面は、符号化圧縮
した音声データと符号化圧縮した画像データを固定ビッ
ト幅のパケットに混合してネットワーク上に伝送するタ
イプのデータ伝送装置において、(a)音声データの入
力を試みる音声入力手段と、(b)音声データの入力の
有無を検出する音声検出手段と、(c)画像データを入
力する画像入力手段と、(d)入力した画像データを所
定の捕捉間隔で捕捉する画像捕捉手段と、(e)画像デ
ータを所定の圧縮率で符号化圧縮する画像符号化圧縮手
段と、(f)前記音声検出手段による検出結果に応じ
て、音声データを符号化圧縮するとともに、符号化圧縮
された画像データと混合して、パケットを生成するデー
タ混合手段と、(g)生成したパケットを伝送する伝送
手段と、(h)前記音声検出手段による過去1回以上の
検出結果を基に、以後の音声データの有無を予測する音
声予測手段と、(i)音声予測手段による予測結果に応
じて、前記画像捕捉手段の前記所定の捕捉間隔を調整す
る調整手段と、を具備することを特徴とするデータ伝送
装置である。
【0030】ここで、前記画像捕捉手段は比較的短い第
1の捕捉間隔又は比較的低速な第2の捕捉間隔のうちの
いずれか一方で画像データを捕捉し、また、前記調整手
段は、予測結果が音声データ有りを示す場合は第2の捕
捉間隔を選択し、予測結果が音声データ無しを示す場合
は第1の捕捉間隔を選択する、ようにしてもよい。
【0031】また、本発明の第6の側面は、符号化圧縮
した音声データと符号化圧縮した画像データを固定ビッ
ト幅のパケットに混合してネットワーク上に伝送するタ
イプのデータ伝送装置において、(a)音声データの入
力を試みる音声入力手段と、(b)音声データの入力の
有無を検出する音声検出手段と、(c)画像データを入
力する画像入力手段と、(d)入力した画像データを所
定の捕捉間隔で捕捉する画像捕捉手段と、(e)画像デ
ータを所定の圧縮率で符号化圧縮する画像符号化圧縮手
段と、(f)前記音声検出手段による検出結果に応じ
て、音声データを符号化圧縮するとともに、符号化圧縮
された画像データと混合して、パケットを生成するデー
タ混合手段と、(g)生成したパケットを伝送する伝送
手段と、(h)前記音声検出手段による過去1回以上の
検出結果を基に、以後の音声データの有無を予測する音
声予測手段と、(i)音声予測手段による予測結果に応
じて、前記画像符号化圧縮手段の前記所定の圧縮率を調
整する調整手段と、を具備することを特徴とするデータ
伝送装置である。
【0032】ここで、前記画像符号化圧縮手段は比較的
高い第1の圧縮率又は比較的低い第2の圧縮率のうちの
いずれか一方で画像データを捕捉し、また、前記調整手
段は、予測結果が音声データ有りを示す場合は第1の圧
縮率を選択し、予測結果が音声データ無しを示す場合は
第2の圧縮率を選択する、ようにしてもよい。
【0033】
【作用】音声データと画像データとを混合して固定ビッ
ト幅のパケットを生成する場合、プライオリティを与え
られた音声データが存在するかどうかによって、画像デ
ータに割り当てられる帯域幅を大いに相違する。例えば
図10に示す例では、画像データの帯域幅は16ビット
又は286ビットであり、その差は非常に大きい。
【0034】本発明に係るデータ伝送方法及び装置によ
れば、音声データが無いと考えられ、したがって、比較
的広い帯域幅が画像データに与えられる期間には、画質
を重視してパケットを生成する。すなわち、画像データ
の圧縮率を低くし、あるいは画像データをキャプチャリ
ングするフレーム・レートを上げるなどして、許容され
る範囲で、画質の向上を図っている。
【0035】逆に、音声データが有ると考えられ、した
がって、比較的狭い帯域幅しか画像データに与えられな
い期間には、画像データのトラフィックを重視してパケ
ットを生成する。すなわち、画像データの圧縮率を高く
し、あるいは、画像データをキャプチャリングするフレ
ーム・レートを下げるなどして、データの滞り(1フレ
ーム以上の無意味なバッファリング)を生じないように
している。
【0036】したがって、本発明によれば、符号化圧縮
した音声データと符号化圧縮した画像データを多重化し
て固定ビット幅長のパケットにして伝送するときに、音
声データにプライオリティを与えながらも画像データも
滞りなく伝送することができる。
【0037】また、本発明によれば、符号化圧縮した画
像データを固定ビット幅のパケット内に入れて伝送する
場合において、画像データに割り当てられる帯域幅が変
動しても、好適に画像データを伝送することができる。
換言すれば、本発明によれば、滞らず且つ隙間なく、画
像データを伝送できる訳である。
【0038】本発明のさらに他の目的、特徴や利点は、
後述する本発明の実施例や添付する図面に基づくより詳
細な説明によって明らかになるであろう。
【0039】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施例を詳解する。
【0040】A.コンピュータ・システムのハードウェ
ア構成 図1には、本発明の実施に供されるコンピュータ・シス
テム100のハードウェア構成を模式的に示している。
システム100は、一般公衆回線上に接続された1つの
コンピュータ・システムに該当する。以下、各部につい
て説明する。
【0041】メイン・コントローラであるCPU11
は、オペレーティング・システム(OS)の制御下で、
各種プログラムを実行するようになっている。CPU1
1の動作クロックは、発振器(OSC)12から供給さ
れる。CPU11は、例えば、米IBM社、米Moto
rola社及び米Apple社が共同開発した"Pow
erPC 603e−100MHz"("PowerP
C"は米IBM社の商標)でよい。CPU11は、自身
の外部ピンに直結したプロセッサ・バス16、ローカル
・バスとしてのPCI(Peripheral Component Interco
nnect)バス17、及び入出力バスとしてのISA(Ind
ustry Standard Architecture)バス23という3階層
のバスを介して、各デバイスと相互接続している。
【0042】プロセッサ・バス16とPCIバス17と
は、ブリッジ回路(ホスト−PCIブリッジ)13によ
って連絡されている。本実施例のブリッジ回路13は、
メイン・メモリ15へのアクセス動作を制御するための
メモリ・コントローラと、両バス16,17間の速度差
を吸収するためのデータ・バッファを含んだ構成となっ
ている。メイン・メモリ15は、DRAMのような書き
込み可能な半導体メモリで構成され、各プログラムの格
納領域、及び実行中のプログラムの作業領域として用い
られる。メイン・メモリ15の記憶容量は、通常、数M
B〜数十MB程度である。また、L2−キャッシュ14
は、SRAMのような高速アクセス可能な半導体メモリ
で構成され、CPU11の処理速度とメモリ15へのア
クセス速度のギャップを吸収するために、必要最小限の
データの一時的保持に用いられる。L2−キャッシュ1
4の記憶容量は、例えば256KBである。また、RO
M18は、ハードウェア操作のための制御コード(BI
OS)や、始動時のテスト・プログラム(POST)な
どを恒久的に記憶するための不揮発性半導体メモリであ
る。
【0043】PCIバス17は、米Intel社の提唱
に基づいて規格化されたバスであり、バス幅32ビッ
ト、動作周波数33MHz、最高データ転送速度132
Mbpsを主な性能としている。PCIバス17には、
グラフィック・コントローラ19やビデオ・キャプチャ
・コントローラ20などのような、比較的高速なデータ
転送を要するPCIデバイスが接続される。
【0044】グラフィック・コントローラ19は、コン
ピュータ画像の表示処理を行うための周辺コントローラ
であり、CPU11からの描画命令に従って描画情報を
画面バッファ(VRAM)19bに一旦書き込むととも
に、VRAM19bから描画情報を読み出して、標準装
備された液晶表示ディスプレイ(LCD)19aに出力
するようになっている。また、グラフィック・コントロ
ーラ19は、読み出した描画情報を付設するDAコンバ
ータ19cによってアナログ化して、外付けCRT(Ca
thod Ray Tube)ディスプレイ19dに出力することも
できる。
【0045】ビデオ・キャプチャ・コントローラ20
は、ビデオ・カメラ20a(又はVTR:図示しない)
からアナログ入力した映像信号をデジタル化してファイ
ルに落とすためのコントローラである。ビデオ・キャプ
チャ・コントローラ20は、一般には、ビデオ・キャプ
チャ用デバイス・ドライバ(後述)によってハードウェ
ア操作され、フレーム(すなわち画面)単位でキャプチ
ャリングを行うようになっている。フレーム・レート
(すなわち単位時間当りにキャプチャリングするフレー
ム数)は、ハードウェアの許容する範囲(通常は15〜
30フレーム/秒程度)で制御可能である。ビデオ・キ
ャプチャ・コントローラ20は、ビデオ会議のための画
像データの捕捉にも用いられる。
【0046】PCIバス17とISAバス23とは、ブ
リッジ回路(PCI−ISAブリッジ)21によって相
互接続されている。本実施例のブリッジ回路21は、D
MAコントローラ、プログラマブル割込みコントローラ
(PIC)、プログラマブル・インターバル・タイマ
(PIT)を含んだ構成となっている。さらに、ブリッ
ジ回路21は、ハード・ディスク・ドライブ(HDD)
22を接続するためのIDEインターフェース(Integr
ated Drive Electronics:IDEは本来ISAバスにH
DDを直結させるための規格)を含んでいる。
【0047】ISAバス23上には、キーボード/マウ
ス・コントローラ(KMC)24、シリアルI/Oコン
トローラ25、パラレルI/Oコントローラ26、フロ
ッピー・ディスク・コントローラ(FDC)27a、オ
ーディオ・コントローラ28などの、比較的低速なデー
タ転送で済むISAデバイスが接続されている。
【0048】KMC24は、キーボード24aからの入
力マトリックスやマウス24bによる指示座標値を処理
するためのコントローラである。
【0049】シリアルI/Oコントローラ25は、シリ
アル・ポート25aを介して行われる、他の機器との間
のシリアル・データ転送を制御するためのものである。
シリアル・ポート25aには例えばモデムが装着され
る。モデムは、一般公衆回線のようなアナログ通信回線
を介してデータ通信を行うための信号変換装置である。
換言すれば、コンピュータ・システム100は、モデム
によって、一般公衆回線を利用したビデオ会議に参入す
ることができる訳である。モデムの最大転送レートは、
例えば14.4kbps(又は28.8kbps)程度
である。
【0050】パラレルI/Oコントローラ26は、パラ
レル・ポート26aを介して行われる、他の機器との間
のパラレル・データ転送を制御するためのものである。
パラレル・ポート26aに接続される装置の代表例は、
プリンタである。
【0051】FDC27aは、フロッピー・ディスク・
ドライブ27の駆動を制御するためのコントローラであ
る。
【0052】オーディオ・コントローラ28は、オーデ
ィオ・ラインイン・ジャック28aに接続されたマイク
からのオーディオ入力や、オーディオ・ラインアウト・
ジャック28bに接続されたスピーカによるオーディオ
出力を制御するためのコントローラである。オーディオ
・コントローラ28は、オーディオ用デバイス・ドライ
バ(後述)によってハードウェア操作される。ビデオ会
議のための音声データの入出力は、オーディオ・コント
ローラによって行われる。
【0053】コンピュータ・システム100は、デスク
トップPC、ノートブックPC、あるいはその他のハイ
エンド・マシンであってもよい。システム100の一例
は、日本アイ・ビー・エム(株)が市販する"IBM
ThinkPad Power Series 85
0"("ThinkPad"は米IBM社の商標)であ
る。
【0054】なお、コンピュータ・システム100を構
成するためには、図1に示した以外にも多くの電気回路
等が必要であるが、これらは当業者には周知であり、且
つ本発明の要旨とは関連がないので、本明細書中では省
略してある。
【0055】B.コンピュータ・システム上で稼働する
ソフトウェア B−1.ソフトウェアの階層的構成 図2には、コンピュータ・システム100で実行される
各ソフトウェア間の連携的構成を模式的に示している。
【0056】最下層のソフトウェアは、デバイス・ドラ
イバ(D/D)のような、ハードウェアを直接制御する
ためのプログラムである。例えば、グラフィック・コン
トローラ19を操作するためのディスプレイ用デバイス
・ドライバや、ビデオ・キャプチャ・コントローラ20
を操作するためのビデオ・キャプチャ用デバイス・ドラ
イバ、シリアルI/Oコントローラ25を操作するため
のCOMデバイス・ドライバ、オーディオ・コントロー
ラ28を操作するためのオーディオ用デバイス・ドライ
バなどがこれに該当する。
【0057】オペレーティング・システム(OS)は、
システム100のハードウェア及びソフトウェアを総合
的に管理するための基本ソフトウェアであり、例えば、
OS/2("OS/2"は米IBM社の商標)がこれに該
当する。OSは、HDD22なとのの記憶装置に格納さ
れたファイルを管理するための「ファイル・マネージ
ャ」、メモリ領域の割り当てを管理するための「メモリ
・マネージャ」、CPU11のタスク実行の順序を管理
するための「スケジューラ」を含んでいる。また、ウィ
ンドウ表示やキーボード/マウス操作等の処理のための
「ユード・インターフェース」も含んでいる。
【0058】OS層の上位には、OSの管理下で実行さ
れる各種アプリケーション・プログラムが存在する。ア
プリケーション・プログラムは、必要に応じて適宜HD
D22などの外部記憶装置からメモリ15にロードされ
る。本発明の具現に関連するアプリケーション・プログ
ラムは、ビデオ会議制御プログラム、ビデオ・アプリケ
ーション・プログラム、データ混合分離プログラムであ
る。以下、各アプリケーション・プログラムについて簡
単に説明する。
【0059】ビデオ会議制御プログラム:ビデオ会議制
御プログラムは、会議(セッション)の開始・終了(電
話をかける・切るなどの操作)、ディスプレイ画面上の
ビデオ表示の開始・終了、ビデオ・アプリケーションに
よる圧縮作業の開始・終了、音声の音量やマイクロフォ
ンのゲイン調整など、会議全体の制御を行うためのソフ
トウェアである。モデムの接続速度の表示やエラー・メ
ッセージの表示も行う。
【0060】ビデオ・アプリケーション・プログラム:
ビデオ・アプリケーション・プログラムは、画像データ
の捕捉やパケット転送に伴う以下の機能を行うためのソ
フトウェアである。 1)ビデオ・キャプチャ・コントローラ20によって取
り込まれた画像フレームを符号化圧縮する。 2)符号化圧縮された画像フレームを、データ混合分離
プログラムに渡す。 3)データ混合分離プログラムより渡された画像フレー
ムを復号化伸長する。 4)復号化伸長された画像フレームを、グラフィック・
コントローラ19に渡して、コンピュータ画面上で再生
する(但し、グラフィック・コントローラ19へのハー
ドウェア的な入出力操作には、ディスプレイ・デバイス
・ドライバが介在する。)。
【0061】ビデオ・アプリケーション・プログラム
は、画像データを圧縮・伸長処理するための画像符号化
圧縮/復号化伸長モジュールを含んでいる。画像圧縮/
伸長モジュールは、例えば"MPEG1"に従うものでよ
い。画像圧縮/伸長モジュールは、一般には、フレーム
単位で画像データの圧縮及び伸長処理を行うようなって
いる。したがって、送信側では、1フレームの圧縮を完
了する前に取り込まれた次のフレームの画像データは、
バッファリングされ、データの停滞の原因になる。ま
た、受信側では、1フレーム分の画像データを受け取る
までは画像データの復号化伸長を行えないので、1フレ
ーム分の画像データが厖大で転送時間が長引けば、表示
処理の遅延につながる。また、画像符号化圧縮モジュー
ルは、与えられたパラメータ(例えばビット・レート)
に応じて、フレーム・レートを維持するように、すなわ
ち一定間隔で画像フレームを処理するように稼働する。
例えば画像データの送信が滞っている場合には、圧縮率
を上げる(すなわち画質を下げる)ことによってフレー
ム・レートの維持に努める。逆に画像データの送信に余
裕がある場合には、圧縮率を下げる(すなわち画質を上
げる)ようになっている。
【0062】データ混合分離プログラム:データ混合分
離プログラムは、音声データと画像データを混合してパ
ケットを生成したり、受け取ったパケットから音声デー
タや画像データを組み立てるためのソフトウェアであ
る。主な機能は以下の通りである。 1)オーディオ・コントローラ28により入力した音声
データを、符号化圧縮する(但し、オーディオ・コント
ローラ28へのハードウェア的な入出力操作には、オー
ディオ・デバイス・ドライバが介在する。)。 2)ビデオ・アプリケーションから渡された符号化圧縮
済みの画像データと、自身で符号化圧縮した音声データ
とを、混合する。 3)混合したデータをパケットに分割する。 4)パケットをシリアルI/Oコントローラ25に渡す
(但し、シリアルI/Oコントローラ25へのハードウ
ェア的な入出力動作には、COMデバイス・ドライバが
介在する)。シリアルI/Oコントローラ25に渡され
たパケットは、モデム、一般公衆回線経由で受信側のコ
ンピュータ・システムに伝送される。 5)受信側のコンピュータ・システムから伝送されてき
たパケットを、シリアルI/Oコントローラ25より受
け取る(但し、シリアルI/Oコントローラ25へのハ
ードウェア的な入出力動作には、COMデバイス・ドラ
イバが介在する。)。 6)受け取ったパケットを組み立てる。 7)組み立てられたデータを、音声データと画像データ
とに分離する(但し、音声データと画像データは、とも
に符号化圧縮されたままの状態)。 8)画像データを、ビデオ・アプリケーションに渡す。 9)音声データを復号化伸長して、オーディオ・コント
ローラ28により再生する(但し、オーディオ・コント
ローラ28へのハードウェア的な入出力操作には、オー
ディオ・デバイス・ドライバが介在する。)。 10)モデムのコントロール、音声の入出力の一時停
止、再開、接続後の回線の状況の監視を行う。
【0063】データ混合分離プログラムは、現在の音声
の入力の有無(すなわちVoiceActivity)
も監視して、この監視結果をVoice Activi
tyビットに書き込むようにもなっている。パケットの
GSMビットは、Voice Activityに応じ
て設定/解除するとともに、パケットの構造を決める
(図10参照)。本実施例では、データ混合分離プログ
ラムはVoice Activityビットを20ms
ec毎に更新するようになっている。また、データ混合
分離プログラムをライブラリ形式にしておくことによ
り、これとリンクした他のアプリケーション・プログラ
ムと同一のプロセス空間内で動作し、同じリソースとし
てVoice ACtivityビットを共有すること
ができる。すなわち、アプリケーション・プログラム
(例えばビデオ・アプリケーション)はVoice A
ctivityビットを自ら直接参照することができる
訳である。
【0064】なお、OS層とアプリケーション層の間
に、破線で図示したようなプラットフォーム層が介在し
ていてもよい。プラットフォーム層は、通信回線によっ
て相互接続されたコンピュータ・システム間で、ソフト
ウェアやデータのシェアリングを可能にするためのもの
である。プラットフォーム層は"Collaboration Framewo
rk"と呼ばれることもある。
【0065】B−2.各ソフトウェア間の協働的オペレ
ーション ここで、各ソフトウェア間の協働的動作を、簡単に説明
しておく。
【0066】図3には、入力した音声データと画像デー
タを分割してパケット化して一般公衆回線上に伝送する
様子を、模式的に示している。
【0067】マイクを介して入力された音声データは、
オーディオ・デバイス・ドライバによる入出力操作によ
って、データ混合分離プログラムに渡される(矢印P
1,P2,P3)。データ混合分離プログラムでは、音
声データはGSMアルゴリズムなどに従って、符号化圧
縮される。
【0068】一方、ビデオ・カメラ20aによって撮像
された画像フレームは、ビデオ・キャプチャ・コントロ
ーラ20によってデジタル化される(矢印P4,P
5)。ビデオ・アプリケーションは、ビデオ・キャプチ
ャ・デバイス・ドライバによる入出力操作によって、1
フレーム単位で画像データを取得し(矢印P6)、これ
をMPEG1などに従って符号化圧縮する。フレーム・
レートが速過ぎるなどの理由により、1フレームを符号
化圧縮処理する前に次の1フレームをキャプチャした場
合には、次の1フレーム分の画像データはバッファリン
グされ、データの停滞の原因になる。
【0069】データ混合分離プログラムは、ビデオ・ア
プリケーションより符号化圧縮された画像データを受け
取り(矢印P7)、符号化圧縮された音声データと画像
データとを混合し、混合データを所定ビット幅のパケッ
トに分割する。このとき、Voice Activit
yビットの内容に応じて、ヘッダ部のGSMビットが設
定/解除されるとともに、パケット構造が決定される。
音声データは、圧縮方式で定められた所定の帯域幅(本
実施例では264ビット幅の帯域)を優先して占有す
る。また、画像データは、その余の帯域(音声有りの場
合は16ビット幅の帯域、音声無しの場合は286ビッ
ト幅の帯域)に入れられる(図10参照)。フレーム・
サイズが厖大な画像データを伝送する場合や、音声有り
の状態が継続する場合には、所要パケット数が多くな
り、画像1フレーム分の伝送時間が長くかかることにな
る。
【0070】逐次分割されたパケットは、COMデバイ
ス・ドライバの入出力操作によって、シリアルI/Oコ
ントローラ25に渡される(矢印P9,P10)。シリ
アルI/Oコントローラ25は、モデム経由で一般公衆
回線上にパケットを伝送する。
【0071】また、図4には、一般公衆回線を介して受
け取ったパケットから音声データと画像データを組み立
てる様子を、模式的に示している。
【0072】一般公衆回線を経由して送られてきたパケ
ットは、モデムによって受け取られ且つデジタル化され
る。データ混合分離プログラムは、シリアルI/Oデバ
イス・ドライバによる入出力操作によって、パケットを
受け取る(矢印P11,P12,P13)。
【0073】データ混合分離プログラムは、パケットを
組み立てるとともに、音声データと画像データに分離す
る。音声データは、データ混合分離プログラム内で復号
化伸長処理され、オーディオ・コントローラ28に渡さ
れる(矢印P13,P14)。オーディオ・コントロー
ラ28は、音声データをスピーカによって音声出力する
(矢印P15)。
【0074】一方、画像データは、ビデオ・アプリケー
ションに渡される(矢印P16)。ビデオ・アプリケー
ションは、画像データを復号化伸長して、1フレーム分
の画像データを組み立てる。
【0075】組み立てられた画像フレームは、ディスプ
レイ・デバイス・ドライバによる入出力操作によってグ
ラフィック・コントローラ19に渡され(矢印P17,
P18)、LCD19b画面上に表示される(矢印P1
9)。なお、1フレームのデータ・サイズが厖大であ
る、あるいはパケット中で画像データに割り当てられた
帯域幅が狭いなどの理由により、画像1フレーム分のデ
ータ伝送に長時間を要した場合には、ビデオ・アプリケ
ーションによる画像フレームの出力は遅延する。この結
果、受信側のLCD19b画面上には数秒前の画像が表
示されることになる。
【0076】C.画像データ伝送の最適化オペレーショ
本発明の特徴を略言すれば、現在までの音声データの有
無に従って、将来通信路中で画像データに割り当てられ
ている帯域幅を予知し、画像データの伝送の最適化を図
ることである。音声データの有無は、データ混合分離プ
ログラムが返すVoice Activityビットを
参照することによって判定できる。過去所定期間内のV
oice Activityビットの履歴を基にすれ
ば、将来音声入力があるかどうかを経験的に予測するこ
とができる。この予測結果は将来画像データに割り当て
られるべき帯域幅を一義的に意味する。この予測された
帯域幅に応じて画像データ伝送の最適化を図ればよい、
という訳である。
【0077】ここで言う画像データ伝送の最適化とは、
データが滞らず、且つ隙間なく伝送することを意味す
る。最適化処理の具体的な例として、(1)音声の予測
結果を符号化圧縮工程にフィードバックする手法と、
(2)音声の予測結果を画像捕捉工程にフィードバック
するする手法とが挙げられる。前者によれば、予測され
た帯域幅に応じて画像データの圧縮率を調整することに
よって、データ伝送の遅延を最小化することができる。
また、後者によれば、予測された帯域幅に応じて次の画
像フレームをキャプチャすべき時間間隔を設定すること
により、隙間なく画像フレームを供給することができ
る。
【0078】C−1.遅延の最小化 この項では、音声の予測結果を符号化圧縮工程にフィー
ドバックする手法について説明する。図5には、同手法
の概念図を示している。
【0079】この例のビデオ・アプリケーションは、画
像データをフレーム単位で符号化圧縮するための画像符
号化圧縮モジュールの他に、キャプチャ・モジュール
と、音声予測モジュールを含んでいる。キャプチャ・モ
ジュールは、ビデオ・キャプチャ・コントローラ20に
対して、1フレーム分の画像データの供給を要求する機
能を備えている。また、音声予測モジュールは、過去の
所定期間内の音声入力の履歴に従ってこれから音声入力
があるかどうかを予測し、予測結果に基づいて、最適な
ビット・レートを画像符号化圧縮モジュールにフィード
バックする機構を備えている。以下、データの流れに従
って、各部の動作について説明する。
【0080】第(N−1)フレーム目の画像データが入
力されると、画像符号化圧縮モジュールは、これを符号
化圧縮してデータ混合分離プログラムに渡す。データ混
合分離プログラムは、この時点で入力した音声データを
符号化圧縮するとともに、渡された画像データと混合
し、パケットに分割する。さらに、データ混合分離プロ
グラムは、音声入力の有無を示すVoice Acti
vityビットを20msec毎に更新する。
【0081】音声予測モジュールは、所定の時間周期t
[sec]ごとにVoie Activityビットを
読み、且つ所定時間T[sec](但しT>t)内にお
けるVoice Activityビットの履歴を参照
し、所定の音声予測アルゴリズム(D項参照)に従っ
て、次の第Nフレーム目の画像データを転送する間に音
声入力があるかどうかを予測する。
【0082】さらに、音声予測モジュールは、予測結果
に基づいて最適なビット・レートを計算して、画像符号
化圧縮モジュールにフィードバックする。音声予測が"
True"、すなわち音声入力が有ると予測された場
合、最適なビット・レートは以下の式(1)により算出
される。
【0083】
【数1】 (ビット・レート) =(モデムDCE速度)−(オーバーヘッド)−(音声データのビット・レート) …(1)
【0084】ここで、モデムDCE(Data Communicati
on Equipment)速度とは、モデムの最大転送速度と等価
であり、例えば14.4kbpsである。モデムDCE
速度は、データ混合分離プログラムにより設定され、一
旦回線に接続された後は固定的に用いられる。また、オ
ーバーヘッドは、パケットのヘッダー部に割かれるビッ
ト・レートであり、固定値である(図10(a)では
0.4kbps)。また、音声データのビット・レート
は、優先して割かれる固定値であり、GSMアルゴリズ
ムを用いる場合(図10(a)参照)には、13.2k
bps(=(260+4)ビット÷20msec)であ
る。したがって、画像符号化圧縮モジュールにフィード
バックされるビット・レートは0.8kbpsというこ
とになる。
【0085】一方、音声予測が"False"、すなわち
音声入力がないと予測された場合、最適なビット・レー
トは以下の式(2)により算出される。
【0086】
【数2】 (ビット・レート)=(モデムDCE速度)−(オーバーヘッド) …(2)
【0087】この場合、オーバーヘッド(0.1kbp
s(=2ビット÷20msec))以外の全てのモデム
DCE速度、すなわち14.3kbpsが画像符号化圧
縮モジュールにフィードバックされることになる。
【0088】画像符号化圧縮モジュールは、新たに受け
取ったビット・レートに応じて、フレーム・レートを維
持するように、第Nフレーム目の画像データの符号化圧
縮処理を行う。以下、同様の処理が繰り返されることに
なる。
【0089】この方法によれば、音声予測がTrueで
あれば必然的に圧縮率が上がり(画質が低下し)、Fa
lseであれば圧縮率が下がる(画質が向上する)。こ
の結果、データ伝送の遅延を最小化することができる。
【0090】なお、音声入力の有無を予測するためのア
ルゴリズムについては、次項Dで詳解する。
【0091】C−2.フレーム・レートの最大化 この項では、音声の予測結果を画像捕捉工程にフィード
バックする手法について説明する。図6には、同手法の
概念図を示している。
【0092】この例のビデオ・アプリケーションは、画
像データをフレーム単位で符号化圧縮するための画像符
号化圧縮モジュールの他に、キャプチャ・モジュール
と、音声予測モジュールを含んでいる。キャプチャ・モ
ジュールは、ビデオ・キャプチャ・コントローラ20に
対して、1フレーム分の画像データの供給を要求する機
能を備えている。また、音声予測モジュールは、過去の
所定期間内の音声入力の履歴に従ってこれから音声入力
があるかどうかを予測し、予測結果に基づいて、次の画
像フレームを取り込むべき最適な時間間隔をキャプチャ
・モジュールにフィードバックする機構を備えている。
以下、データの流れに従って、各部の動作について説明
する。
【0093】キャプチャ・モジュールが発行した入力要
求に応じて、第(N−1)フレーム目の画像データが入
力される。画像符号化圧縮モジュールは、これを符号化
圧縮してデータ混合分離プログラムに渡す。データ混合
分離プログラムは、この時点で入力した音声データを符
号化圧縮するとともに、渡された画像データと混合し、
パケットに分割する。さらに、データ混合分離プログラ
ムは、音声入力の有無を示すVoice Activi
tyビットを20msec毎に更新する。
【0094】音声予測モジュールは、所定の時間周期t
[sec]ごとにVoie Activityビットを
読み、且つ所定時間T[sec](但しT>t)内にお
けるVoice Activityビットの履歴を参照
し、所定のアルゴリズムに従って、次の第Nフレーム目
の画像データを転送する間に音声入力があるかどうかを
予測する。
【0095】さらに、音声予測モジュールは、予測結果
に基づいて、第(N−1)フレームの画像データを取り
込んでから第Nフレーム目の画像データを取り込むまで
の最適な時間間隔Tcを計算して、キャプチャ・モジュ
ールにフィードバックする。ここで言う最適な時間間隔
cとは、データの滞りも隙間もなく画像フレームを取
り込めるタイミングを意味する。したがって、時間間隔
cは以下の式(3)により算出される。
【0096】
【数3】 Tc = Fr × 10/B + α …(3)
【0097】ここで、Frは、第(N−1)フレーム目
の符号化圧縮後のフレーム・サイズ(バイト数)であ
り、Bはパケット中で画像データに割り当てられた帯域
幅である。第1項で10を乗算しているのは、1バイト
(=8ビット)分のデータをシリアル転送する場合に
は、その前後各端に同期用のスタート/ストップ・ビッ
トを足した10ビット長にして伝送するからである。式
(3)の右辺第1項は、第(N−1)フレーム目の画像
データの伝送に要する時間に該当する。また、同第2項
の定数αは、画像フレームを取り込んだ後の処理(例え
ば画像符号化圧縮処理やデータ混合処理)に要する時間
であり、CPU11に依存する値である。
【0098】キャプチャ・モジュールは、Tc秒後に、
第Nフレーム目の画像データの入力を要求する。以下、
同様の処理が繰り返されることになる。
【0099】この方法によれば、画像フレームの伝送が
完了する前に次の画像フレームの取り込みを開始して無
益なデータ・バッファリングを誘発する、ということは
ない。また、許容範囲で最大限の画像フレームの取り込
みに努めるため、既に画像フレームの伝送が完了してい
るにも拘らず次の画像フレームの取り込みを行わない、
という帯域の浪費も避けることができる。
【0100】なお、音声入力の有無を予測するためのア
ルゴリズムは、C−1項と同様のものでよい。詳しくは
次項Dで説明する。
【0101】D.音声予測アルゴリズム C項で説明したように、音声入力の予測結果に基づいて
データ伝送の最適化が図られるようになっている。この
項では、図5及び図6の音声予測モジュールに適用可能
な音声予測アルゴリズムについて説明する。
【0102】図7には、音声予測アルゴリズムの第1の
例を、フローチャート化して示している。該アルゴリズ
ムは、データ混合分離プログラムより取得した現在及び
過去一定期間のVoice Activityビットに
従って、将来の音声入力の有無を予測する、ということ
を基本原理としている。
【0103】音声予測モジュールは、タイマー機能を持
っており、t[sec]周期でVoice Activ
ityビットを参照し、その値(すなわちTrueかF
alseか)を自身のバッファ(以下、「音声予測バッ
ファ」という)に逐次書き込む(ステップS10)。こ
の音声予測バッファは、T[sec](T>t)分、す
なわち過去複数個のVoice Activityビッ
トの値を書き込む記憶容量を持ち、バッファが一杯にな
ると古い順にデータを廃棄して新しいデータを書き込
む、という性質を持っている。
【0104】次いで、音声予測モジュールは、音声予測
バッファを参照することによって、最近T[sec]間
の音声入力の履歴を調べる。本例では、過去T[se
c]間でのTrueの割合を調べ(ステップS20)、
所定値P[%]を上回れば、画像符号化圧縮モジュール
(又はキャプチャ・モジュール)に対してTrueを出
力し(ステップS30)、P[%]未満であればFal
seを出力する(ステップS40)。
【0105】図8には、音声予測アルゴリズムの第2の
例を、フローチャート化して示している。該アルゴリズ
ムも、図7と同様に、現在及び過去一定期間のVoic
eActivityビットに従って、将来の音声入力の
有無を予測することを基本原理としている。
【0106】音声予測モジュールは、タイマー機能を持
っており、t[sec]周期でVoice Activ
ityビットを参照し、その値(すなわちTrueかF
alseか)を自身のバッファ(以下、「音声予測バッ
ファ」という)に逐次書き込む(ステップS110)。
この音声予測バッファは、T[sec](T>t)分、
すなわち過去複数個のVoice Activityビ
ットの値を書き込む記憶容量を持ち、バッファが一杯に
なると古い順にデータを廃棄して新しいデータを書き込
む、という性質を持っている。
【0107】次いで、音声予測モジュールは、音声予測
バッファを参照することによって、最近T[sec]間
の音声入力の履歴を調べる。本例では、過去T[se
c]間におけるVoice Activityビットの
時間による加重平均値Awを計算するようになっている
(ステップS120)。加重平均値Awは、下式(4)
により求められる。
【0108】
【数4】
【0109】ここで、Nは、音声予測バッファ内のデー
タの個数である。また、Viは音声予測バッファ内のi
番目のVoice Activityビットの値であ
り、Trueであれば1とし、Falseであれば0と
する。また、Wiはi番目のデータに対する時間的な重
み因子であり、新しいデータほど大きく評価するためで
ある。
【0110】Awが閾値Qを上回れば、画像符号化圧縮
モジュール(又はキャプチャ・モジュール)に対してT
rueを出力し(ステップS130)、閾値Q未満であ
ればFalseを出力する(ステップS140)。
【0111】なお、所定時間T[sec]だけ遡って音
声予測するのは、人間は一度話し始めるとある程度の期
間は話し続ける、という習性に依拠する。Voice
Activityビットは20msec毎の音声入力の
有無を示すに過ぎない。これに対して、ある一定期間T
[sec]だけ該ビットを監視した方が、1フレーム分
の画像データを伝送する間(通常複数パケットに跨が
る)という、比較的長期の音声予測をより正確に行うこ
とができる。
【0112】E.追補 以上、特定の実施例を参照しながら、本発明について詳
解してきた。しかしながら、本発明の要旨を逸脱しない
範囲で当業者が該実施例の修正や代用を成し得ることは
自明である。すなわち、例示という形態で本発明を開示
してきたのであり、限定的に解釈されるべきではない。
本発明の要旨を判断するためには、冒頭に記載した特許
請求の範囲の欄を参酌すべきである。
【0113】
【発明の効果】本発明に係るデータ伝送方法及び装置
は、音声データが無いと考えられ、したがって、比較的
広い帯域幅が画像データに与えられる期間には、画質を
重視してパケットを生成する。すなわち、画像データの
圧縮率を低くし、あるいは画像データをキャプチャリン
グするフレーム・レートを上げるなどして、許容される
範囲で、画質の向上を図っている。
【0114】逆に、音声データが有ると考えられ、した
がって、比較的狭い帯域幅しか画像データに与えられな
い期間には、画像データのトラフィックを重視してパケ
ットを生成する。すなわち、画像データの圧縮率を高く
し、あるいは、画像データをキャプチャリングするフレ
ーム・レートを下げるなどして、データの滞り(1フレ
ーム以上の無意味なバッファリング)を生じないように
している。
【0115】したがって、本発明によれば、符号化圧縮
した音声データと符号化圧縮した画像データを多重化し
て固定長のパケットにして伝送するときに、音声データ
にプライオリティを与えながらも画像データも滞りなく
伝送することができる、優れたデータ伝送方法及び装置
を提供することができる。
【0116】また、本発明によれば、符号化圧縮した画
像データを固定長のパケット内に入れて伝送する場合に
おいて、画像データに割り当てられる帯域幅が変動して
も、好適に画像データを伝送することができる優れたデ
ータ伝送方法及び装置を提供することができる。換言す
れば、本発明によれば、映像の遅延と品質を最適化し
て、画像データを伝送できる訳である。
【図面の簡単な説明】
【図1】図1は、本発明の実施に供されるコンピュータ
・システム100のハードウェア構成を模式的に示した
図である。
【図2】図2は、コンピュータ・システム100で実行
される各ソフトウェアの構成を模式的に示した図であ
る。
【図3】図3は、入力した音声データと画像データを分
割してパケット化して一般公衆回線上に伝送する様子
を、模式的に示した図である。
【図4】図4は、一般公衆回線を介して受け取ったパケ
ットから音声データと画像データを組み立てる様子を、
模式的に示した図である。
【図5】図5は、音声の予測結果を符号化圧縮工程にフ
ィードバックする手法の概念図を示している。
【図6】図6は、音声の予測結果を画像捕捉工程にフィ
ードバックする手法の概念図を示している。
【図7】図7は、音声予測アルゴリズムの第1の例をフ
ローチャート化して示した図である。
【図8】図8は、音声予測アルゴリズムの第1の例をフ
ローチャート化して示した図である。
【図9】図9は、一般公衆回線とPCを用いたネットワ
ークの構成を模式的に示した図である。
【図10】図10は、音声データ及び画像データを伝送
するためのパケット構造の一例を示した図である。
【符号の説明】
11…CPU、12…発振器、13…ブリッジ回路、1
4…L2−キャッシュ、15…メイン・メモリ、16…
プロセッサ・バス、17…PCIバス、18…ROM、
19…グラフィック・コントローラ、20…ビデオ・キ
ャプチャ・コントローラ、21…ブリッジ回路、22…
HDD、23…ISAバス、24…KMC、25…シリ
アルI/Oコントローラ、26…パラレルI/Oコント
ローラ、27…FDD、28…オーディオ・コントロー
ラ、100…コンピュータ・システム。

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】符号化圧縮した音声データと符号化圧縮し
    た画像データを固定ビット幅のパケットに混合してネッ
    トワーク上に伝送するタイプのデータ伝送方法におい
    て、パケット内に音声データを含むかどうかに応じて画
    像データの圧縮率を調整する、ことを特徴とするデータ
    伝送方法。
  2. 【請求項2】入力した音声データを符号化圧縮するとと
    もに、捕捉した画像データを符号化圧縮し、符号化圧縮
    された音声データと符号化圧縮された画像データを固定
    ビット幅のパケットに混合して、ネットワーク上に伝送
    するタイプのデータ伝送方法において、パケット内に音
    声データを含むかどうかに応じて画像データの捕捉間隔
    を調整する、ことを特徴とするデータ伝送方法。
  3. 【請求項3】符号化圧縮した音声データと符号化圧縮し
    た画像データを固定ビット幅のパケットに混合してネッ
    トワーク上に伝送するタイプのデータ伝送方法におい
    て、(a)音声データの入力を試みる段階と、(b)音
    声データの入力の有無を検出する段階と、(c)画像デ
    ータを所定の捕捉間隔で捕捉する段階と、(d)画像デ
    ータを所定の圧縮率で符号化圧縮する段階と、(e)前
    記(b)段階の検出結果に応じて、音声データを符号化
    圧縮するとともに、符号化圧縮された画像データと混合
    して、パケットを生成する段階と、(f)生成したパケ
    ットを伝送する段階と、(g)過去1回以上の前記
    (b)段階における検出結果を基に、以後の音声データ
    の有無を予測する音声予測段階と、(h)前記(g)段
    階の予測結果を基に、前記(c)段階の前記所定の捕捉
    間隔を調整する段階と、を具備することを特徴とするデ
    ータ伝送方法。
  4. 【請求項4】前記音声予測段階では、過去の所定期間内
    で複数回音声入力の有無を調べ、音声入力が所定の割合
    以上あれば将来音声入力があると判断し、所定の割合未
    満であれば将来音声入力がないと判断する、ことを特徴
    とする請求項3に記載のデータ伝送方法。
  5. 【請求項5】前記音声予測段階では、過去の所定期間内
    で複数回調べた音声入力の有無を時間的に加重平均し、
    加重平均値が閾値以上であれば将来音声入力があると判
    断し、閾値未満であれば将来音声入力がないと判断す
    る、ことを特徴とする請求項3に記載のデータ伝送方
    法。
  6. 【請求項6】前記(c)段階では比較的短い第1の捕捉
    間隔又は比較的長い第2の捕捉間隔のうちのいずれか一
    方で画像データを捕捉し、 前記(h)段階では、予測結果が音声データ有りを示す
    場合は第2の捕捉間隔を選択し、予測結果が音声データ
    無しを示す場合は第1の捕捉間隔を選択する、ことを特
    徴とする請求項3に記載のデータ伝送方法。
  7. 【請求項7】符号化圧縮した音声データと符号化圧縮し
    た画像データを固定ビット幅のパケットに混合してネッ
    トワーク上に伝送するタイプのデータ伝送方法におい
    て、(a)音声データの入力を試みる段階と、(b)音
    声データの入力の有無を検出する段階と、(c)画像デ
    ータを所定の捕捉間隔で捕捉する段階と、(d)画像デ
    ータを所定の圧縮率で符号化圧縮する段階と、(e)前
    記(b)段階の検出結果に応じて、音声データを符号化
    圧縮するとともに、符号化圧縮された画像データと混合
    して、パケットを生成する段階と、(f)生成したパケ
    ットを伝送する段階と、(g)過去1回以上の前記
    (b)段階における検出結果を基に、以後の音声データ
    の有無を予測する音声予測段階と、(h)前記(g)段
    階の予測結果を基に、前記(d)段階の前記所定の圧縮
    率を調整する段階と、を具備することを特徴とするデー
    タ伝送方法。
  8. 【請求項8】前記(d)段階では、比較的高い第1の圧
    縮率又は比較的低い第2の圧縮率のうちいずれか一方で
    画像データを圧縮し、 前記(h)段階では、予測結果が音声データ有りを示す
    場合は第1の圧縮率を選択し、予測結果が音声データ無
    しを示す場合は第2の圧縮率を選択する、ことを特徴と
    する請求項7に記載のデータ伝送方法。
  9. 【請求項9】前記音声予測段階では、過去の所定期間内
    で複数回音声入力の有無を調べ、音声入力が所定の割合
    以上あれば将来音声入力があると判断し、所定の割合未
    満であれば将来音声入力がないと判断する、ことを特徴
    とする請求項7に記載のデータ伝送方法。
  10. 【請求項10】前記音声予測段階では、過去の所定期間
    内で複数回調べた音声入力の有無を時間的に加重平均
    し、加重平均値が閾値以上であれば将来音声入力がある
    と判断し、閾値未満であれば将来音声入力がないと判断
    する、ことを特徴とする請求項7に記載のデータ伝送方
    法。
  11. 【請求項11】符号化圧縮した音声データと符号化圧縮
    した画像データを固定ビット幅のパケットに混合してネ
    ットワーク上に伝送するタイプのデータ伝送装置におい
    て、(a)音声データの入力を試みる音声入力手段と、
    (b)音声データの入力の有無を検出する音声検出手段
    と、(c)画像データを入力する画像入力手段と、
    (d)入力した画像データを所定の捕捉間隔で捕捉する
    画像捕捉手段と、(e)画像データを所定の圧縮率で符
    号化圧縮する画像符号化圧縮手段と、(f)前記音声検
    出手段による検出結果に応じて、音声データを符号化圧
    縮するとともに、符号化圧縮された画像データと混合し
    て、パケットを生成するデータ混合手段と、(g)生成
    したパケットを伝送する伝送手段と、(h)前記音声検
    出手段による過去1回以上の検出結果を基に、以後の音
    声データの有無を予測する音声予測手段と、(i)音声
    予測手段による予測結果に応じて、前記画像捕捉手段の
    前記所定の捕捉間隔を調整する調整手段と、を具備する
    ことを特徴とするデータ伝送装置。
  12. 【請求項12】前記画像捕捉手段は比較的短い第1の捕
    捉間隔又は比較的長い第2の捕捉間隔のうちのいずれか
    一方で画像データを捕捉し、 前記調整手段は、予測結果が音声データ有りを示す場合
    は第2の捕捉間隔を選択し、予測結果が音声データ無し
    を示す場合は第1の捕捉間隔を選択する、ことを特徴と
    する請求項11に記載のデータ伝送装置。
  13. 【請求項13】前記音声予測手段は、過去の所定期間内
    で複数回音声入力の有無を調べ、音声入力が所定の割合
    以上あれば将来音声入力があると判断し、所定の割合未
    満であれば将来音声入力がないと判断する、ことを特徴
    とする請求項11に記載のデータ伝送装置。
  14. 【請求項14】前記音声予測手段は、過去の所定期間内
    で複数回調べた音声入力の有無を時間的に加重平均し、
    加重平均値が閾値以上であれば将来音声入力があると判
    断し、閾値未満であれば将来音声入力がないと判断す
    る、ことを特徴とする請求項11に記載のデータ伝送装
    置。
  15. 【請求項15】符号化圧縮した音声データと符号化圧縮
    した画像データを固定ビット幅のパケットに混合してネ
    ットワーク上に伝送するタイプのデータ伝送装置におい
    て、(a)音声データの入力を試みる音声入力手段と、
    (b)音声データの入力の有無を検出する音声検出手段
    と、(c)画像データを入力する画像入力手段と、
    (d)入力した画像データを所定の捕捉間隔で捕捉する
    画像捕捉手段と、(e)画像データを所定の圧縮率で符
    号化圧縮する画像符号化圧縮手段と、(f)前記音声検
    出手段による検出結果に応じて、音声データを符号化圧
    縮するとともに、符号化圧縮された画像データと混合し
    て、パケットを生成するデータ混合手段と、(g)生成
    したパケットを伝送する伝送手段と、(h)前記音声検
    出手段による過去1回以上の検出結果を基に、以後の音
    声データの有無を予測する音声予測手段と、(i)音声
    予測手段による予測結果に応じて、前記画像符号化圧縮
    手段の前記所定の圧縮率を調整する調整手段と、を具備
    することを特徴とするデータ伝送装置。
  16. 【請求項16】前記画像符号化圧縮手段は比較的高い第
    1の圧縮率又は比較的低い第2の圧縮率のうちのいずれ
    か一方で画像データを捕捉し、 前記調整手段は、予測結果が音声データ有りを示す場合
    は第1の圧縮率を選択し、予測結果が音声データ無しを
    示す場合は第2の圧縮率を選択する、ことを特徴とする
    請求項15に記載のデータ伝送装置。
  17. 【請求項17】前記音声予測手段は、過去の所定期間内
    で複数回音声入力の有無を調べ、音声入力が所定の割合
    以上あれば将来音声入力があると判断し、所定の割合未
    満であれば将来音声入力がないと判断する、ことを特徴
    とする請求項15に記載のデータ伝送装置。
  18. 【請求項18】前記音声予測手段は、過去の所定期間内
    で複数回調べた音声入力の有無を時間的に加重平均し、
    加重平均値が閾値以上であれば将来音声入力があると判
    断し、閾値未満であれば将来音声入力がないと判断す
    る、ことを特徴とする請求項15に記載のデータ伝送装
    置。
JP3157896A 1996-02-20 1996-02-20 データ伝送方法及び装置 Pending JPH09233231A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3157896A JPH09233231A (ja) 1996-02-20 1996-02-20 データ伝送方法及び装置
US08/803,043 US6084911A (en) 1996-02-20 1997-02-19 Transmission of coded and compressed voice and image data in fixed bit length data packets

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3157896A JPH09233231A (ja) 1996-02-20 1996-02-20 データ伝送方法及び装置

Publications (1)

Publication Number Publication Date
JPH09233231A true JPH09233231A (ja) 1997-09-05

Family

ID=12335076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3157896A Pending JPH09233231A (ja) 1996-02-20 1996-02-20 データ伝送方法及び装置

Country Status (2)

Country Link
US (1) US6084911A (ja)
JP (1) JPH09233231A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0917365A3 (en) * 1997-11-17 2000-11-22 NEC Corporation Improved video conference data transfer system
WO2001063939A1 (de) * 2000-02-21 2001-08-30 Siemens Aktiengesellschaft Verfahren und vorrichtung zum codieren eines videosignals und eines sprachsignals, computerlesbares speichermedium sowie computerprogramm-element
EP1143741A3 (en) * 2000-03-28 2003-04-16 Nec Corporation Data transmission system using at cellular phones
KR100404808B1 (ko) * 1998-05-20 2003-11-07 지멘스 악티엔게젤샤프트 압축 데이터의 실시간 전송을 위한 방법 및 장치
JP2007116683A (ja) * 2002-03-27 2007-05-10 Marconi Intellectual Property (Ringfence) Inc 電気通信システム

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6618363B1 (en) * 1998-10-09 2003-09-09 Microsoft Corporation Method for adapting video packet generation and transmission rates to available resources in a communications network
JP2000341618A (ja) * 1999-03-25 2000-12-08 Seiko Epson Corp 画像データ処理システム
JP2000350136A (ja) * 1999-03-26 2000-12-15 Seiko Epson Corp 画像データ処理システム
US6665085B1 (en) * 1999-05-25 2003-12-16 Xerox Corporation Simultaneous voice and data communication for diagnostic procedures in a printing or copying machine
US6584434B1 (en) * 2000-04-24 2003-06-24 General Electric Company Method for data filtering and anomoly detection
US9622058B1 (en) 2000-06-02 2017-04-11 Timothy G. Newman Apparatus, system, methods and network for communicating information associated with digital images
US7978219B1 (en) 2000-08-30 2011-07-12 Kevin Reid Imes Device, network, server, and methods for providing digital images and associated processing information
US8326352B1 (en) 2000-09-06 2012-12-04 Kevin Reid Imes Device, network, server, and methods for providing service requests for wireless communication devices
US7287009B1 (en) * 2000-09-14 2007-10-23 Raanan Liebermann System and a method for carrying out personal and business transactions
US7190685B2 (en) * 2001-02-08 2007-03-13 Lucent Technologies Inc. Control information transmission in a wireless communication system
US20060164549A1 (en) * 2002-12-05 2006-07-27 Walid Ali System management scheme for a signal-processing-based decision support system
EP1658245B1 (en) * 2003-08-29 2017-11-29 IGM Malta Limited Optical fiber coatings
WO2006010373A1 (en) * 2004-07-27 2006-02-02 Telecom Italia S.P.A. Video-communication in mobile networks
US7596149B2 (en) * 2004-12-09 2009-09-29 Omnivision Technologies, Inc. Low bit rate video transmission over GSM network
KR101136130B1 (ko) * 2008-10-14 2012-04-17 한국전자통신연구원 가정용 기지국 장치와 그의 제어 방법
JP5678766B2 (ja) * 2011-03-29 2015-03-04 富士通株式会社 情報処理装置、遠隔操作通信装置及び情報処理装置制御方法
US11774944B2 (en) 2016-05-09 2023-10-03 Strong Force Iot Portfolio 2016, Llc Methods and systems for the industrial internet of things
US10983507B2 (en) 2016-05-09 2021-04-20 Strong Force Iot Portfolio 2016, Llc Method for data collection and frequency analysis with self-organization functionality
US11327475B2 (en) 2016-05-09 2022-05-10 Strong Force Iot Portfolio 2016, Llc Methods and systems for intelligent collection and analysis of vehicle data
US10754334B2 (en) 2016-05-09 2020-08-25 Strong Force Iot Portfolio 2016, Llc Methods and systems for industrial internet of things data collection for process adjustment in an upstream oil and gas environment
US11237546B2 (en) 2016-06-15 2022-02-01 Strong Force loT Portfolio 2016, LLC Method and system of modifying a data collection trajectory for vehicles
US11442445B2 (en) 2017-08-02 2022-09-13 Strong Force Iot Portfolio 2016, Llc Data collection systems and methods with alternate routing of input channels
CN209085657U (zh) 2017-08-02 2019-07-09 强力物联网投资组合2016有限公司 用于与化工生产工艺有关的或工业环境的数据收集系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4847829A (en) * 1985-04-08 1989-07-11 Datapoint Corporation Video conferencing network
US4710917A (en) * 1985-04-08 1987-12-01 Datapoint Corporation Video conferencing network
US5247347A (en) * 1991-09-27 1993-09-21 Bell Atlantic Network Services, Inc. Pstn architecture for video-on-demand services
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
US5598352A (en) * 1994-09-30 1997-01-28 Cirrus Logic, Inc. Method and apparatus for audio and video synchronizing in MPEG playback systems
US5815634A (en) * 1994-09-30 1998-09-29 Cirrus Logic, Inc. Stream synchronization method and apparatus for MPEG playback system
US5757784A (en) * 1996-01-04 1998-05-26 Orion Atlantic, L.P. Usage-based billing system for full mesh multimedia satellite network

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0917365A3 (en) * 1997-11-17 2000-11-22 NEC Corporation Improved video conference data transfer system
KR100404808B1 (ko) * 1998-05-20 2003-11-07 지멘스 악티엔게젤샤프트 압축 데이터의 실시간 전송을 위한 방법 및 장치
WO2001063939A1 (de) * 2000-02-21 2001-08-30 Siemens Aktiengesellschaft Verfahren und vorrichtung zum codieren eines videosignals und eines sprachsignals, computerlesbares speichermedium sowie computerprogramm-element
EP1143741A3 (en) * 2000-03-28 2003-04-16 Nec Corporation Data transmission system using at cellular phones
US7035296B2 (en) 2000-03-28 2006-04-25 Nec Corporation Data transmission system using at cellular phones
JP2007116683A (ja) * 2002-03-27 2007-05-10 Marconi Intellectual Property (Ringfence) Inc 電気通信システム

Also Published As

Publication number Publication date
US6084911A (en) 2000-07-04

Similar Documents

Publication Publication Date Title
JPH09233231A (ja) データ伝送方法及び装置
US6278478B1 (en) End-to-end network encoding architecture
JP2003524909A (ja) マルチメディアネットワーク・インタフェースを達成する方法及び装置
US20020059627A1 (en) Agent-enabled real-time quality of service system for audio-video media
EP3697088A1 (en) Video sending and receiving method, device, and terminal
JP2002534936A (ja) マルチメディア装置におけるビットレート制御
WO2002085016A1 (en) System and method for network delivery of low bit rate multimedia content
US11290680B1 (en) High-fidelity freeze-frame for precision video communication applications
JP2007505580A (ja) シンクライアントにおいてグラフィカルおよびメディア表示を生成するための方法および装置
CN112866746A (zh) 一种多路串流云游戏控制方法、装置、设备及存储介质
JP2002077260A (ja) 画像伝送のためのシステムおよび方法
US20070046980A1 (en) Remote Protocol Support For Communication Of Large Objects In Arbitrary Format
JP3390033B2 (ja) パケット通信方式
JPH07170290A (ja) 通信システム
US5608450A (en) Video conferencing system with fast packet loss recovery
JP2000295597A (ja) メディアデータ受信および送信装置
JP4447443B2 (ja) 画像圧縮処理装置
CN112543374A (zh) 一种转码控制方法、装置及电子设备
JPH07170292A (ja) 送信装置
US11831430B2 (en) Methods and apparatuses for encoding and decoding signal frame
JP3827192B2 (ja) マルチメディア通信端末
US12360722B2 (en) Managing display data
JPH07170502A (ja) 受信装置
US7716359B2 (en) Method and system for providing an interface through which an application can access a media stack
CN101378512A (zh) 一种音视频数据同步的方法、装置