JPH10506492A - 高性能密度を有するマルチメディアプロセッサアーキテクチャ - Google Patents
高性能密度を有するマルチメディアプロセッサアーキテクチャInfo
- Publication number
- JPH10506492A JPH10506492A JP9506486A JP50648697A JPH10506492A JP H10506492 A JPH10506492 A JP H10506492A JP 9506486 A JP9506486 A JP 9506486A JP 50648697 A JP50648697 A JP 50648697A JP H10506492 A JPH10506492 A JP H10506492A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- processors
- task
- communication
- performance density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7839—Architectures of general purpose stored program computers comprising a single central processing unit with memory
- G06F15/7842—Architectures of general purpose stored program computers comprising a single central processing unit with memory on one IC chip (single chip microcontrollers)
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Processing (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】
マルチメディアシステムは、高性能密度のプログラム不可能タスク特定プロセッサを有する。前記タスク特定プロセッサは、合わさってビデオアルゴリズムを構成する基礎機能を実行する。前記タスク特定プロセッサを、相互接続性をアービタによって制御する高速通信モジュールを経て相互接続する。前記アービタは、データフローグラフを格納する。低性能密度の完全プログラム可能汎用プロセッサは、前記基礎機能に容易にマッピングできないこれらのタスクを実行する。異なったレベルの性能密度およびプログラム可能性を有するこの構成は、システム全体の性能密度を先行技術に関して上昇させる。
Description
【発明の詳細な説明】
高性能密度を有するマルチメディアプロセッサアーキテクチャ発明の分野
本発明は、ビデオデータをビデオアルゴリズムに従って処理し、通信手段を経
て相互接続されたマルチプロセッサを具えるビデオデータ処理システムに関する
ものである。前記マルチプロセッサは、1つの半導体基板上に集積するのが好適
であるが、必須ではない。背景技術
現在広く注目されている情報技術の分野内の主な発展の1つは、マルチメディ
アソフトウェアアプリケーションに関係する。マルチメディアアプリケーション
は、代表的に、高解像度ディスプレイ上で、好適には相互作用的にリアルタイム
において、ビデオ、グラフィックスおよびオーディオ装置のような異なったソー
スを源とする複数の情報ストリームを結合することを可能にする。莫大な情報ス
トリームの費用効果的なリアルタイム処理の要求が、チップ設計者に多大に要求
される。製造業がプログラム可能コンピュータアーキテクチャの性能を改善しよ
うとする試みは、主に、クロックレートを上昇させることと、命令レベルおよび
タスクレベルにおける対応を拡張することとに集中している。
テキサスインスツルメンツ社は、マルチメディアビデオプロセッサ(Multlmed
ia Video Processor:MVP)TMS320C80と呼ばれる、完全プログラム可能ディ
ジタル信号プロセッサを最近提案している。MVPは、1枚の半導体基板上に、
1個の100MFLOP(1秒あたり100万回の浮動小数点演算)の浮動小数
点完全プログラム可能RISCプロセッサと、クロスバーネットワークを経てデ
ータ用の2キロバイトSRAMの25のバンクおよび命令キャッシュに接続され
た4個の同型の完全プログラム可能500MOPS(1秒あたり100万回の演
算)並列プロセッサ(DSP)と、400Mバイト/秒でチップの外と通信する
I/Oコントローラとを収容する。前記RISCプロセッサは、システムの制御
と外部プロセッサとの通信とを取り扱う。浮動小数点ユニットを有するただ1つ
のものであることから、前記RISCプロセッサは、浮動小数点中心の計算を行
う好適なプロセッサでもある。前記DSPは、Cまたはアセンブリにおいて完全
プログラム可能であり、乗算−累積中心のアルゴリズムの実行に特に適している
。各々の前記DSPは、3ないし15のRISC命令を、同時に各々のサイクル
において実行できる。前記完全プログラム可能性は、今日の汎用プロセッサのそ
れと同様に、JPEGおよびMPEGのような種々の画像圧縮技術の動的な選択
を支持している。前記完全プログラム可能性は、前記プロセッサがどのような仮
想的なタスクも行えるようにする。例えば、SID 94ダイジェスト637−640
ページにおけるR.J.Goveによる”MVP: 画像およびビデオアプリケーショ
ン用シングルチップマルチプロセッサ(The MVP: A Single-Chip Multiprocesso
r for Image and Video Applications)”、IEEEコンピュータグラフィック
スおよびアプリケーション(IEEE Computer Graphics & Applications),19
92年11月,53−64ページにおけるK.Guttag他による”マルチメディア
用シングルチップマルチプロセッサ:MVP(A Single-Chip Multiprocessor F
or Multimedia: The MVP)”または、1994年5月1−4日,カリフォルニア
州サンディエゴにおけるIEEE 1994年注文生産集積回路会議(IEEE 199
4 Custom Integrated Circuits Conference)の会報の91−94ページにおけ
るK.Balmer他による”シングルチップマルチメディアビデオプロセッサ(A Sin
gle Chip Multimedia Video Processor)”を参照されたい。
代表的に、マルチメディアビデオアルゴリズムは、高級プログラミング言語に
おいて最も簡単に設計できる。このときコンピュータを使用して、汎用プログラ
ム可能プロセッサによって実行可能なコードを発生する。ハイレベルな支援手段
なしで並列プロセッサをプログラムすることは極めて困難なため、もちろんこれ
には前記MVPを用いる。並列プロセッサ間の衝突、例えば、同じメモリのアク
セスに関する予測されない争いに対する保護のために、前記MVPは、優先化回
路網および再試行回路網のような追加のハードウェアを含む。
プロセッサの能力を量化する単位の1つは、1平方ミリメートルの半導体基板
面積当たりの計算性能であり、”性能密度(performance-density)”とも呼ば
れる量である。一般に、汎用プロセッサの性能密度は、プログラム可能性が制限
された専門化プロセッサのそれよりも相当低く、専用のハードウェア解決法の性
能密度よりも相当低い。この低い性能密度は、特に、プログラム機能を実現する
のに必要なハードウェアオーバヘッド(例えば、追加の回路網および相互接続部
)が原因であり、利用可能なハードウェアのいくらか非能率的な使用も原因であ
る。後者に関して、処理すべきデータの到着まで待たなければならない場合、す
べてのクロックサイクルが計算に使用されるとは限らない。したがって、MVP
の性能密度は、完全にプログラム可能な汎用DSPおよび完全にプログラム可能
な汎用RISCプロセッサの使用によって、相当に制限される。他の欠点は、プ
ログラムがMVPの命令キャッシュに適合しない場合、命令のトラヒックがMV
Pにおいて問題になる恐れがあることである。これは、例えば、マルチタスク動
作中のリアルタイムな要求のために頻繁な文脈の切り替えが必要な場合、特によ
り重大な問題になる。MVPは、1個のDSPにおける動的な文脈の切り替えは
できない。発明の目的
本発明の目的は、性能密度が先行技術のシステムの性能密度よりも相当高いマ
ルチメディアビデオデータプロセッサシステムを提供することである。発明の概略
この目的のために、本発明は、以下の特徴を特徴とする序文において記述した
ようなシステムを提供する。前記マルチプロセッサが、画像処理レベルにおける
アルゴリズムにおいて生じる複数の基礎機能の各々1つを実行する各々タスクが
特定された複数のプロセッサを含む。すなわち、前記基礎機能は、ビデオまたは
グラフィックス画像の処理に特有の特性に関係する。代表的に、各々の基礎機能
は、以下のタスク、フィルタ処理、DCT、色空間変換、標本レート変換、動き
予測および動き補償、特徴抽出、グラフィックスデータおよびビデオデータの合
成、表参照、可変長復号化の各々1つを含む。これらのタスク特定プロセッサの
各々は、代表的な汎用プロセッサより高い性能密度を有する。これらのタスク特
定プロセッサの各々は、プログラム不可能であるか、汎用プロセッサより相当低
いプログラム可能性を有し、例えば、前記タスク特定プロセッサの1つまたはそ
れ以上がパラメータ化可能である。前記通信手段は、前記タスク特定プロセッサ
に並列に結合し、前記タスク特定プロセッサの任意のもの同志で同時通信を可能
にする高速通信モジュールを具える。
前記通信手段は、好適には、通信アービタを具え、前記通信アービタに格納さ
れたデータフローグラフの案内の下で前記通信モジュールを制御する。
代表的に、汎用RISCプロセッサは、1−5MOPS/mm2程度の性能密
度を有し、DSPは、5−10MOPS/mm2程度の性能密度を有し、所定の
基礎機能を行うタスク特定プロセッサは、50−100MOPS/mm2程度の
性能密度を有する。例えば、本発明において、可変位相遅延フィルタを実現する
タスク特定プロセッサは、80MOPS/mm2が可能である。これは、前記プ
ロセッサが特定のタスクに最適化されているためだけでなく、本発明におけるシ
ステムによって提供されるマルチタスク環境における標本化レート変換、タイム
ベース補償、および幾何学画像補償に関する前記フィルタの多重使用のためでも
ある。上述した計算性能密度の数値は、例としてあげただけであり、現在の技術
状態に関係する。より重要に、上述した分類は、低、中および高性能密度のプロ
セッサの計算性能密度が、少なくとも程度が互いに代表的に異なることを説明す
る。
好適には、前記マルチプロセッサは、さらに、少なくとも1つの低性能密度の
汎用プロセッサを具える。前記汎用プロセッサは、前記アルゴリズムにおいて生
じる他の処理機能を実行することができ、前記機能は、そのアルゴリズム構造に
おいて、前記タスク特定プロセッサにおいてマッピングするには不規則過ぎる。
前記タスク特定プロセッサのあるものは、例えば、前記タスク特定プロセッサお
よび汎用プロセッサ間のインタフェースにおいて生じる高速データレートを取り
扱う。この汎用プロセッサは、前記データストリームから特定の情報を抽出して
、より低いデータレートであって前記汎用プロセッサに適したフォーマットに変
換する。前記汎用プロセッサは、この特徴抽出を、バックグラウンドメモリのア
クセスに関するI/Oプロセッサとして使用することもできる。前記汎用プロセ
ッサによって発生された低速情報を、特定のタスク特定プロセッサによって表示
レートに高速化することができる。
好適には、前記マルチプロセッサは、さらに、前記タスク特定プロセッサを制
御し、前記基礎機能に容易にマッピングできないビデオアルゴリズムの不規則な
部分を実行する、少なくとも1つの中性能密度のプロセッサ、代表的にDSPを
具える。前記中性能密度のプロセッサは、完全プログラム可能汎用プロセッサと
、基礎機能を実現するタスク特定高性能密度プロセッサとの間のレベルのプログ
ラム可能性を有する。前記中性能密度のプロセッサを、グラフィックスコプロセ
ッサとすることもできる。
本発明の理論的根拠を、本発明によって行われた以下の観察の参照と共に説明
する。
第1の観察は、上述したように、汎用プログラム可能プロセッサの性能密度は
、プログラム可能性が限定されるかまったくないタスク特定(すなわち、特定の
ルーチン専用または最適化された)プロセッサまたは専用ハードウェアのそれよ
りも相当低く、高速ビデオ処理には適していない汎用の解決法であるということ
である。
第2の観察は、マルチメディア/ビデオ/グラフィックス処理アプリケーショ
ンにおける高速計算は、ほとんど複雑ではなく、したがって、条件付き分岐がな
い厳密なデータフロー言語のような、より強制的なプログラム言語において、容
易に記述することができることである。この記述を、前記汎用プロセッサより極
めて互い性能密度を有する、分岐ユニットがないデータフロープロセッサに能率
的にマッピングすることができる。
第3の観察は、代表的なマルチメディアビデオ処理アプリケーションは、画像
処理レベルにおける比較的複雑な基礎機能によって構成されることである。マル
チメディアビデオアプリケーションの代表的な例は、ノイズ除去のような画像強
調、アナログビデオおよびオーディオ信号の復号化、拡大/縮小、例えば、輝度
、ガンマまたはコントラストによる画像制御、高解像度グラフィックスを含む演
算、ビデオデータ圧縮および伸張、データ通信である。
第4の観察は、これらのアプリケーションが、共通の基礎機能の大きな組を有
することである。これらの比較的複雑な基礎機能の代表的な例は、FIRフィル
タ処理およびDCT、色空間変換、フィルタ演算を有するまたは有しない水平標
本化レート変換、簡単な動き補償のためのフィルタ演算を有するまたは有しない
垂直標本化レート変換、動き予測および動き補償、特徴抽出、グラフィックスお
よびビデオの合成、表参照および表更新、可変長符号化である。これらの比較的
複雑な基礎機能を、加算器、乗算器、累算器、演算装置、等の形態における基本
的なプロセッサを必要とする、加算および乗算のようなより低いレベルの抽象に
おけるより多くの基本的な演算に分解する。これらの基本的なプロセッサのいく
つかは、並列/パイプラインに、または順次に使用され、前記基礎機能の1つを
形成する。しかしながら、個々の基本プロセッサのプログラミングと、前記プロ
セッサ間の通信とによって、オーバヘッドは、より低いレベルの抽象に対してよ
り大きくなる。したがって、性能密度は、極めて低くなる。これらの比較的複雑
な基礎機能を複数のより基本的な演算に分解する代わりに、前記機能をパラメー
タ化によってある程度一般化してもよい。この方法は、これらを、より複雑なマ
ルチメディアビデオアルゴリズムの一般的なクラスにあてはめる。このやり方の
理由は、前記複雑な基礎機能のさらなる分解は、ハードウェアの柔軟性を増加せ
ず、そのプログラム可能性も増加しないことである。代わりに、パラメータ化基
礎機能の実現と比べて非能率的であるICによる実現になる。
第5の観察は、異なったマルチメディアビデオ処理アプリケーションの大きな
クラスは、基礎機能の小さな組から成ることである。
第6の観察は、処理アプリケーションの大きなクラスは、多くの複雑な基礎機
能を並列またはパイプラインにおいて使用することである。
第7の観察は、前記基礎処理機能の各々が、代表的に100−800MOPS
の範囲における性能を必要とすることであり、ここで、演算を、加算、減算、乗
算、除算、比較、メモリ参照とし、輝度/クロミナンス符号化に関して標本あた
り2×12ビットで、RGB符号化に関して標本あたり3×12ビットによる1
3.5MHzのビデオ標本化レートとする。いくつかのアルゴリズムを含む処理
アプリケーションの実行、またはいくつかのアプリケーションの並列における実
行は、必要な性能を、基礎機能あたり400−2000MOPSに上昇させる。
明らかに、汎用プログラム可能DSPは、このような高性能を安価に提供しない
。
第8の観察は、前記ビデオアルゴリズムのいくつかの部分は、前記タスク特定
プロセッサの基礎機能に適切にマッピングできないことである。低性能密度の完
全プログラム可能汎用プロセッサか、DSPのような中性能密度のプロセッサか
を、これらの部分を処理するために設けるべきである。
第9の観察は、前記タスク特定プロセッサの制御と、ビデオアルゴリズムにお
ける前記基礎機能にマッピングできない部分の実行との双方は、より低速におけ
るより複雑なアルゴリズムを必要とし、したがって、少なくともいくらかの柔軟
性を有するプロセッサによってより良く管理されることである。
まとめると、本発明者は、ビデオアルゴリズムの特定の特性が、タスク特定の
プログラム不可能または弱くプログラム可能なプロセッサの使用を可能にし、こ
れらの各々1つを前記ビデオアルゴリズムの基礎機能の組のうちの各々1つを行
うのに最適化することを実現した。本発明のシステムは、高性能密度を有し、多
くて低レベルのプログラム可能性を有するタスク特定プロセッサを使用する。い
くつかの状況の下で、ASICおよび同等のFPGAは、前記タスク特定プロセ
ッサのより良い候補となる。さらに前記タスク特定プロセッサは、代表的に同型
ではない。前記先行技術は、代わりに、汎用完全プログラム可能で同型のプロセ
ッサのみを使用することに注意されたい。本発明のシステムを、混成プロセッサ
システムと呼ぶ。
プログラム可能性のオーバヘッドが減少するため、先行技術に関して性能密度
が大幅に上昇し、前記アルゴリズムを基礎機能にモジュール分解したため、プロ
グラミングが簡単になるという利点がある。低性能密度の完全プログラム可能汎
用プロセッサは、前記基礎機能に容易にマッピングできないタスクを行う。中間
レベルのプログラム可能性と中間レベルの性能密度を有する他のプロセッサを設
け、前記タスク特定プロセッサを制御する。前記他のプロセッサは、前記基礎機
能にマッピングできないが、中間レベルの性能密度およびプログラム可能性を有
するプロセッサによって好適に実行することができるアルゴリズム部分を扱って
もよい。このように、本発明は、先行技術のシステムによって与えられるより高
い全体的なシステム性能密度を達成するために、異なったレベルのプログラム可
能性および計算性能密度による階層的処理の概念を導入する。
本発明は、例えば、TV(TXT復号化および音声の復号化)、カメラ、VC
R、CD−I装置およびマルチメディアPCにおける一般的な音声/ビデオ処理
に特に好適であるが、これらに限定されない。図面の説明
本発明を、さらに詳細に、添付した図の参照と共に例として以下に説明する。
図1は、先行技術のマルチプロセッサアーキテクチャのブロック図である。
図2および3は、本発明におけるマルチプロセッサアーキテクチャのブロック
図である。
図4は、本発明におけるマルチプロセッサアーキテクチャのより詳細なブロッ
ク図である。
図5は、先回りテレビジョン処理アプリケーションに関するデータフローグラ
フである。
図6は、図5のデータフローグラフを実現するマルチプロセッサアーキテクチ
ャの詳細なブロック図である。
図7は、本発明によるマルチプロセッサアーキテクチャの他のブロック図であ
る。
これらの図を通じて、同じ参照符は、対応するまたは同様の特徴を示す。詳細な実施例 先行技術
図1は、上述した先行技術のマルチメディアビデオプロセッサ(MVP)10
0のシングルチップマルチメディアプロセッサアーキテクチャのブロック図であ
る。MVP100は、主プロセッサ102と、複数の同型並列プロセッサ(DS
P)104、106、108および110と、複数のメモリモジュール112、
114、116、118、120、122、124、126および128と、ク
ロスバースイッチ130と、伝送コントローラ132とを具える。
主プロセッサ102を、浮動小数点ユニットを具えた汎用RISCプロセッサ
とする。主プロセッサ102は、DSP104−110の動作を制御し、外部プ
ロセッサ(図示せず)との通信を管理する。主プロセッサは、さらに、低性能の
計算タスクを行うことができる。DSP104−110を、完全プログラム可能
並列プロセッサとする。メモリモジュール112−118は、DSP104−1
10によってクロスバースイッチ130を経てすべて並列にアクセス可能であり
、共有データメモリとして機能する。メモリモジュール120は、主プロセッサ
102用の命令およびデータ双方のキャッシュとして機能する。メモリモジュー
ル122−128は、DSP104−110の各々1つ用の命令キャッシュとし
て各々機能する。クロスバースイッチ130は、DSP104−110がメモリ
モジュール112−118の各々1つに独立して、モジュール112−118の
他のものとのアクセスと平行してアクセスすることを可能にする。DSP104
−110は、各々、2つのデータメモリポートを有し、主プロセッサ102は、
1つのデータメモリポートを有し、伝送コントローラ132は、1つのデータメ
モリポートを有し、これらのすべては、モジュール112−118に並列にクロ
スバースイッチ130を経てアクセス可能である。伝送コントローラ132は、
チップ上メモリ112−118とチップ外メモリ(図示せず)との間のメモリト
ラヒックを、メモリアクセス要求の優先順位スケジューリングを使用して管理す
る。この構成において固有の特徴に関して、上述した背景技術が参考になる。本発明の第1実施例
図2は、本発明におけるビデオデータ処理システム200に関するマルチプロ
セッサアーキテクチャの第1実施例のブロック図である。システム200は、マ
ルチメディアソフトウェアアプリケーションにおいて、ビデオおよびグラフィッ
クスデータを処理する。システム200は、高性能密度の多重のタスク特定プロ
セッサ202、204、...、および206を具える。タスク特定プロセッサ
202−206は、ビデオ信号処理アルゴリズムの基礎的で複雑な機能を実行す
る。例としては、色空間変換、標本化レート変換、...、動き補償、等がある
。プロセッサ202−206は、まったくプログラム可能ではなく、これらの振
る舞いがパラメータ化されている場合、低レベルのプログラム可能性を有する。
低レベルのプログラム可能性は、プロセッサ202−206を、同じ基礎機能が
使用されるが異なったパラメータ値を有する異なったアーキテクチャにおいて使
用できるようにする。好適には、パラメータ値の異なった組間の切り替えを可能
にするために、そしてパラメータ化プロセッサ、例えばプロセッサ202の内部
データ状態の保存/再生を可能にするために、高速制御をプロセッサ202−2
06の内部および外部において利用できるようにする。例えば、ユーザ相互作用
の結果としての個々のアルゴリズムのパラメータ値の更新は、代表的に、極めて
低いレートにおいて行われる。例えば、別個のバス(図示せず)を経て、パラメ
ータのリロードを達成する。簡潔にするために、”低レベルプログラム可能性”
という表現を、以下に、プログラム不可能プロセッサおよびパラメータ化可能プ
ロセッサの双方に使用する。
マルチメディアの状況内で、大部分のアルゴリズムおよび処理アプリケーショ
ンは、多数の複雑な基礎機能を、並列またはパイプラインにおいて使用する。好
適には、プロセッサ202−206は、互いに、並列に、プロセッサ202−2
06のすべてが並列に実行を保てるように、通信できなければならない。したが
って、システム200は、高速通信モジュール208と、通信アービタ208と
を含む。モジュール208は、プロセッサ202−206間の所望の相互接続を
実現する。モジュール208は、例えば、高速超ワイドバス、レジスタファイル
、または、バッファか小さいレジスタファイルかを有するクロスバースイッチを
含む。通信アービタ210は、タスク特定プロセッサ202−206間のモジュ
ール208を経た通信と、一方ではタスク特定プロセッサ202−206と他方
ではバックグラウンドメモリ212との間の通信とを管理する。この目的のため
に、通信プロトコルとプロセッサ202−206間のデータのルート割り当てと
を管理するデータフローグラフを、通信アービタ210に格納する。前記データ
フローグラフは、いずれかの特定の瞬時において、プロセッサ202−206の
どれが、互いに、そしてバックグラウンドメモリ212と通信するかを規定する
。本質的に、アービタ210は、プロセッサ202−206を、いずれかの所望
の方法において相互接続することができる。プロセッサ202−206の内部バ
ッファ容量に応じて、アービタ210は、好適には、通信モジュール208にお
ける相互接続を、ラインレート(プロセッサ202−206が搭載するおよび/
または通信モジュール208におけるラインバッファ)に下がったクロックレー
ト(バッファリングなし)において制御することができる。通信モジュール20
8は、内部メモリ(図示せず)をあるいは収容する。第2実施例
図3は、本発明におけるビデオデータ処理システム300に関するマルチプロ
セッサアーキテクチャの第2実施例のブロック図である。システム300は、上
述した部分202−212に加えて、汎用プロセッサ302を具える。
処理アプリケーションのある部分を、例えば、該アプリケーションのアルゴリ
ズム配置における規則性の程度が低いため、プロセッサ202、204または2
06のようなタスク特性パラメータ化可能プロセッサにおいて容易にマッピング
することができないことが常に起こりうる。したがって、これらの不規則なアル
ゴリズムを処理するために、十分にプログラム可能な1つまたはそれ以上のプロ
セッサ302を使用する。この混成処理アプローチを、システム300によって
反映させ、汎用プロセッサ302は、タスク特定プロセッサ202−206と通
信し、特定のおよびより一般的な処理タスク間の連続的なデータ交換を可能にす
る。上述したように、プロセッサ302が、タスク特定プロセッサ202−20
6より相当に低い性能密度を有することは明らかである。したがって、不規則な
アルゴリズムに関して強制する性能は、これらが関係する高度に規則正しいマル
チメディア計算機能より低くなるに違いない。幸運にも、これは、ビデオ/オー
ディオ装置およびマルチメディア端末において使用される大部分のマルチメディ
ア計算アルゴリズムに関して真である。
一方では、タスク特定プロセッサ202−206のインタフェースにおいて生
じる高速データレートと、他方では、汎用プロセッサ302における低速データ
レートとの間にあるデータレートを、ここで中間データレートと呼ぶ。この中間
レートは、例えば、特徴抽出器において、プロセッサ302のようなより一般的
な形式のプロセッサによって処理できるようにするために、より低いレートかつ
好適なフォーマットへ変換するために、特定の情報をデータストリームから抽出
する場合に生じる。汎用プロセッサ302は、バックグラウンドメモリ212に
おけるデータにアクセスするI/Oプロセッサとして特徴抽出器304を使用す
ることもできる。他方では、プロセッサ302のような低速汎用プロセッサによ
って発生される低速データを、プロセッサ304のような特別なプロセッサによ
って表示レートに、またはグラフィックス表示プロセッサ(図示せず)によって
さらにより高いレートに高速化することができる。第3実施例
図4は、本発明におけるマルチプロセッサシステム400のより詳細なブロッ
ク図である。低性能密度の汎用プロセッサと、同じアルゴリズムの異なった部分
を実行する高性能密度のタスク特定プロセッサとを有する概念を、ここではより
一般的な多層すなわち混成アーキテクチャに拡張した。
システム400は、上述したタスク特定プロセッサ202−206および汎用
プロセッサ302を含む。加えて、システム400は、中間レベルのプログラム
可能性(制限的にプログラム可能)および中間レベルの性能密度を有する1つま
たはそれ以上の他のプロセッサ402、...、404を具える。”中間”とい
う言葉は、代表的な汎用プロセッサ302のレベルと、タスク特定プロセッサ、
例えばプロセッサ202のレベルとの間にあるレベルを示す。プロセッサ402
−404は、一方で性能密度と、他方でプログラム可能性とのある程度の妥協を
与える。グラフィックスコプロセッサまたはディジタル信号プロセッサ(DSP
)のような専用プログラム可能プロセッサも、中間性能密度を有するこのような
制限プログラム可能プロセッサの範疇に入る。代表的に、制限プログラム可能プ
ロセッサ402−404は、決定構成、分岐および循環を含む制御アルゴリズム
の一般的なクラスを実行し、これらに関して、複雑な制御プログラムを読み出す
ことができる。プロセッサ402および404を、主として高速プロセッサ20
2−206の制御に使用する。加えて、プロセッサ402−404を、タスク特
定プロセッサ202−206にマッピングすることができない中速アルゴリズム
部分の実行に使用する。
本発明におけるプロセッサは、異なったレベルの計算性能密度と、異なった程
度のプログラム可能性とを有する。性能密度およびプログラム可能性は、性能密
度がより高くなるとプログラム可能性がより低くなるように関係する。システム
400は、プロセッサ202−206、402−402および302の特定の1
つの機能が、前記処理または実行すべき制御タスクをかんがみて、プロセッサの
計算性能密度とそのプログラム可能性の程度とが最高になる、したがって、シス
テム400の全体的な性能が最適化される機能的階層化構成において、これらの
プロセッサを使用する。高性能密度層を、前記基礎機能を実行するタスク特定プ
ロセッサ202−206によって形成する。メモリインタフェースプロセッサ4
06と、ポート412および414に接続されたI/Oプロセッサ408および
410とは、同様にタスク特定である。中間性能密度の処理層を、制限的プログ
ラム可能プロセッサ402−404によって形成する。低性能密度処理層を、汎
用完全プログラム可能プロセッサ302、すなわち、例えばRISCプロセッサ
によって形成する。
高速通信は、タスク特定プロセッサ202−206と、I/Oポート412お
よび414と、バックグラウンドメモリ212との間で、高速通信モジュール2
08を介して生じる。中速通信は、制限的プログラム可能プロセッサ402−4
04とタスク特定プロセッサ202−206との間で、中速バス416または明
確な相互接続を使用して起こる。低速通信は、完全プログラム可能汎用プロセッ
サ302および制限的プログラム可能プロセッサ402−404間と、プロセッ
サ302およびアービタ210間と、メモリインタフェースプロセッサ406内
の1個のメモリインタフェースプロセッサを介してプロセッサ302およびバッ
クグラウンドメモリ212間とに生じる。前記低速通信は、バスインタフェース
418を使用する。バックグラウンドメモリ212をメモリバンクに分割し、あ
るいはメモリバンクごとに異なったバンド幅を有するようにする。
好適には、すべてのプロセッサ202−206、302、402−404、4
06−410は、マルチタスク化に適切であり、データの状態保存またはデータ
の状態再生、プログラム記憶およびパラメータ記憶用の内部メモリ(図示せず)
を有する。好適には、すべてのプロセッサを扱う通信の目的のために、キャッシ
ング/バッファリング設備を有する。好適には、すべてのプロセッサは、ハンド
シェークプロトコルを介した局部的かつ動的な相互作用、または静的スケジュー
ル制御プログラムによる局部的/全体的相互作用を制御するスケジューラを具え
る。フローグラフ
図5は、先回りテレビジョン処理アプリケーションに関するデータフローグラ
フの一例である。以下において、54−70MHz程度のクロックレートが、消
費者向けICの実行に関して可能であるとする。13.5M−18M画素/秒程
度の基本ビデオレートに関して、すなわち、27−36Mバイト/秒の基本バイ
トレート(BR)に関して、各々の高速プロセッサは、(準)並列に、4つの高
速動作を行うことができる。
この例における処理アプリケーションは、例えば、ローパスフィルタ処理(L
PF)と、水平/垂直ズームと、ノイズ除去と、動き予測(ME)および動き補
償(MC)と、ビデオ/グラフィックス合成と、輝度、色合いおよびコントラス
ト強調のような画像制御とを具える。これらの機能の各々に関する計算要求は、
100ないし800MOPS程度であり、1個の汎用プロセッサによってすべて
の機能を同時に実現するには高すぎる。
図5は、以下の形式の複雑な基礎機能、すなわち、フィルタ演算を含む水平標
本化レート変換(H−SRC)と、簡単な動き補償のための特別なフィルタ処理
を含む垂直標本化レート変換(V−SRC)と、色空間変換と、ビデオおよびグ
ラフィックスの合成と、画像制御のための表参照とを示す。図5のグラフにおい
て示した演算の各々の計算が集中する部分を、これらの基礎機能の1つにマッピ
ングすることができる。しかしながら、これらの固有の不規則性によって、低い
頻度の制御および信号処理を、汎用プロセッサによって実行しなければならない
。さらに、図5に示す演算の特定のもののいくつかの部分を、複数の基礎機能に
マッピングしてもよい。例えば、”画像制御”演算は、2つの別個の色空間変換
ステップを要求し、異なった形態のガンマ変化を可能にしてもよい。
上述した6つの基礎機能の各々を、プロセッサ202−206の1つのような
1個のタスク特定プロセッサによって実行すべきである。図5におけるアプリケ
ーションを実行するために、ある数のプロセッサが必要である。この数と、必要
なプロセッサの合計の数とを、所定の最高データスループットレートに関して決
定することができる。以下においてこのデータスループットレートを、前記にお
いて規定したようなBRの単位において表す。以下の表は、図5におけるグラフ
の演算と、列”in”においてこれらのデータ入力レートと、列”out”にお
いてこれらのデータ出力レートと、”in”および”out”の下での最大数と
を、すべてBR単位において記載する。
前記表によれば、図5の演算を実行するために、合計31のスループットを必
要とする。各々のプロセッサは、この節の始めにおいて与えた仮定の下で、並列
に4つの高速信号処理タスクを行うことができる。したがって、理論上、最低8
(31/4の端数を繰上)個のプロセッサが、この目的を満たすために必要であ
る。前記タスク特定プロセッサの特性によって、同様のアルゴリズムを必要とす
る演算を、1個のタスク特定プロセッサによって能率的に実行する。したがって
同様の演算を群にする。例えば、LPFおよびH−SRC演算は、ノイズフィル
タ処理およびアップコンバージョンと群になり、2(5/4の端数を繰上)個の
タスク特定プロセッサを必要とする。YUV−RGB変換は、画像制御入力処理
および画像制御出力処理と群になり、3(9/4の端数を繰上)個のプロセッサ
を必要とする。グラフィックス/真カラー変換は、画像制御ガンマ変化と群にな
り、2(6/4の端数を繰上)個のタスク特定プロセッサを必要とする。全部で
、10個のタスク特定プロセッサが、図5のアプリケーションを実行するために
必要となる。前記10個のプロセッサが、完全には使用されないことに注意され
たい。これは、追加のタスク特定プロセッサの必要なしに、変更または拡張する
余地を与えることができる。第4実施例
図6は、本発明におけるマルチプロセッサシステム600の注釈付きのブロッ
ク図である。システム600は、図5のデータフローグラフに従って動作する。
ビデオデータを、バックグラウンドメモリ212からメモリインタフェースプロ
セッサ406を経て取り出す。前記ビデオデータを、以下のタスク、すなわち、
プロセッサ202における垂直標本化レート変換(“V−SRC”)、プロセッ
サ602における動き予測および補償(“motion estim.comp.”)、プロセッ
サ204における水平標本化レート変換(“H−SRC”)、プロセッサ604
における例えば4:2:2から4:4:4への色空間変換(“color space conv
”)を行うタスク特定プロセッサ202−206、602、604および606
の特定のものを連続して通過させる。入力部414において利用できるグラフィ
ックスデータをI/Oプロセッサ410によって処理し、表参照用プロセッサ2
06に供給する。次に前記ビデオデータおよびグラフィックスデータを合成器6
06に供給し、そこからデータを、プロセッサ604における色空間変換と、例
えば、412におけるビデオ出力部に供給する前にプロセッサ604においてガ
ンマ設定および他の色空間変換をするために、プロセッサ206における表参照
とによって処理する。
タスク特定プロセッサ602(動き予測および補償)と、完全プログラム可能
汎用プロセッサ302の範囲内のCPU608との間のデータフローに注目され
たい。このデータフローは、動き予測/補償アルゴリズムの、高速部分および低
速不規則部分への分割によるものである。動き予測器602は、ベクトル情報を
CPU608に供給し、CPU608はその結果最高の候補を選択し、動き予測
器602によって使用するために送り返す。
タスク特定プロセッサ202−206および602−606間の通信のトポロ
ギにおいて変更が必要な場合、これらの変更は、例えば、基礎機能の実行のタイ
ムスケールよりも相当に大きいタイムスケールにおいて生じる。したがって、前
記データフローグラフを、アービタ210にロードするか、汎用プロセッサ30
2によって更新する。第5実施例
図7は、本発明によるシステム700の第5実施例のブロック図である。図3
、4および6は、異なったレベルの性能密度およびプログラム可能性に属するプ
ロセッサが階層的に相互接続されたアーキテクチャを示す。例えば、図6のシス
テム600における高性能密度レベルにおける動き予測器/補償器として機能す
るタスク特定プロセッサ602は、低性能レベルにおける汎用プロセッサ608
と、中間性能密度レベルにおいて属する制限プログラム可能プロセッサ402を
経て通信する。しかしながら、2またはそれ以上の異なったレベルを、相互接続
性が関係する限り合併することができる。すなわち、異なったレベルにおいて示
したプロセッサを、並列に接続することができる。システム700の例において
、すべてのレベルを1つに合併する。高性能密度のタスク特定プロセッサ202
−206と、例えばDSPである中間性能密度の制限プログラム可能プロセッサ
402−404と、例えばRISCである完全プログラム可能低性能密度プロセ
ッサ302とを、通信モジュール208とCPUバス418との間にすべて一様
に接続する。この並列状態は、並列に配置されたプロセッサ間のデータの連続的
かつ直接的な交換を可能にする。高速通信をモジュール208によって管理し、
低速通信をCPUバス418によって管理する。アービタ210およびメモリI
/Oプロセッサ406を、図示したようにシステム700におけるCPUバス4
18に接続する。しかしながら、アービタ210およびメモリI/Oプロセッサ
406を、これらがモジュール208を経てもアクセスできることから、CPU
バス418に接続する必要はないことに注意されたい。
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FI,FR,GB,GR,IE,IT,L
U,MC,NL,PT,SE),JP,KR
Claims (1)
- 【特許請求の範囲】 1.ビデオデータをビデオアルゴリズムに従って処理し、通信手段を経て相互接 続されたマルチプロセッサを具えるビデオデータ処理システム(200;300 ;400;600;700)において、 − 前記マルチプロセッサが、各々が前記アルゴリズムの画像処理レベル における複数の基礎機能の各々1つを実行する複数のタスク特定プロセッサ(2 02,204,206;304;602,604,606)を含み、ここで、 − 前記タスク特定プロセッサの各々が代表的な汎用プロセッサより相当 に高い性能密度を有し、 − 前記タスク特定プロセッサの各々が、プログラム不可能であるか、代 表的な汎用プロセッサより実際的に低いプログラム可能性を有し、 − 前記通信手段が、 − 前記タスク特定プロセッサに並列に結合され、前記タスク特定プロセ ッサの任意のものの間の並列な通信を可能にする通信モジュール(208)を具 えることを特徴とするシステム。 2.請求の範囲1のシステムにおいて、前記基礎機能の各々1つが、以下のタス ク、すなわち、フィルタ処理、DCT、色空間変換、標本化レート変換、動き予 測および補償、特徴抽出、グラフィックデータおよびビデオデータの合成、表参 照、可変長復号化の各々1つを含むシステム。 3.請求の範囲1または2のシステムにおいて、前記タスク特定プロセッサの少 なくとも特定の1つを、パラメータの値を変えることによって前記基礎機能の関 係する1つの制御を可能にするために、パラメータ化可能としたシステム。 4.請求の範囲1、2または3のシステムにおいて、前記マルチプロセッサが少 なくとも1つの汎用プロセッサ(302;608)を含み、前記汎用プロセッサ が、各々のタスク特定プロセッサより相当に低い性能密度を有し、各々のタスク 特定プロセッサより相当に高いレベルのプログラム可能性を有するシステム。 5.請求の範囲4のシステムにおいて、前記汎用プロセッサが、前記基礎機能に マッピングするのに適していないアルゴリズムの部分を実行するシステム。 6.請求の範囲1または4のシステムにおいて、前記マルチプロセッサが、前記 汎用プロセッサと各々のタスク特定プロセッサとの間にある中間性能密度レベル およびプログラム可能性レベルを有する少なくとも1つの他のプロセッサ(40 2,404)を含むシステム。 7.請求の範囲6のシステムにおいて、前記他のプロセッサが、以下のタスク、 すなわち、 − 前記タスク特定プロセッサの制御、 − グラフィックスコプロセッサとしての機能、 − 前記基礎機能にマッピングするのに適さないアルゴリズムの実行、 の少なくとも1つを行うシステム。 8.請求の範囲4または5のシステムにおいて、バックグラウンドメモリに接続 するポートを具え、 − 前記タスク特定プロセッサの特定の1つ(304)が特徴抽出を行い、 − 前記汎用プロセッサが前記ポートに前記特定のタスク特定プロセッサを経 てアクセスするシステム。 9.請求の範囲1のシステムにおいて、通信アービタ(210)を具え、前記通 信アービタに格納されたデータフローグラフの指示の下で前記通信モジュールに よって与えられる通信を制御するシステム。 10.請求の範囲4のシステムにおいて、通信アービタ(210)を具え、前記 通信アービタに格納されたデータフローグラフの指示の下で前記通信モジュール によって与えられる通信を制御し、前記汎用プロセッサが前記データフローグラ フを制御するシステム。 11.1つの半導体基板上に集積した請求の範囲1、2、3、4、5、6、7、 8、9または10のシステム。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP95202008 | 1995-07-21 | ||
| EP95203031 | 1995-11-08 | ||
| AT95203031.0 | 1995-11-08 | ||
| AT95202008.9 | 1995-11-08 | ||
| PCT/IB1996/000683 WO1997004401A2 (en) | 1995-07-21 | 1996-07-12 | Multi-media processor architecture with high performance-density |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10506492A true JPH10506492A (ja) | 1998-06-23 |
| JPH10506492A5 JPH10506492A5 (ja) | 2004-08-19 |
Family
ID=26139512
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9506486A Pending JPH10506492A (ja) | 1995-07-21 | 1996-07-12 | 高性能密度を有するマルチメディアプロセッサアーキテクチャ |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US5959689A (ja) |
| EP (1) | EP0789882B1 (ja) |
| JP (1) | JPH10506492A (ja) |
| DE (1) | DE69610548T2 (ja) |
| WO (1) | WO1997004401A2 (ja) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005529407A (ja) * | 2002-06-07 | 2005-09-29 | マイクロン テクノロジー,インコーポレイティド | 内部キャッシュおよび/またはメモリアクセス予測を持つメモリハブ |
| US7353362B2 (en) | 2003-07-25 | 2008-04-01 | International Business Machines Corporation | Multiprocessor subsystem in SoC with bridge between processor clusters interconnetion and SoC system bus |
| US7412588B2 (en) | 2003-07-25 | 2008-08-12 | International Business Machines Corporation | Network processor system on chip with bridge coupling protocol converting multiprocessor macro core local bus to peripheral interfaces coupled system bus |
| JP2010136452A (ja) * | 2004-04-01 | 2010-06-17 | Panasonic Corp | 集積回路 |
| US7765250B2 (en) | 2004-11-15 | 2010-07-27 | Renesas Technology Corp. | Data processor with internal memory structure for processing stream data |
| JP2012128838A (ja) * | 2010-11-05 | 2012-07-05 | Src Computers Inc | アイソレーションメモリバッファを組み込んだロードリデュースド・デュアル・インライン・メモリ・モジュール(lr−dimm)を利用したスイッチ/ネットワークアダプタ・ポートインターフェースを含むヘテロジニアスコンピューティングシステム |
| US8704837B2 (en) | 2004-04-16 | 2014-04-22 | Apple Inc. | High-level program interface for graphics operations |
| US9691118B2 (en) | 2004-04-16 | 2017-06-27 | Apple Inc. | System for optimizing graphics operations |
Families Citing this family (51)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19748139A1 (de) * | 1997-10-31 | 1999-05-06 | Philips Patentverwaltung | Anordnung zum Mischen und/oder Bearbeiten von Videosignalen |
| EP0918280B1 (en) * | 1997-11-19 | 2004-03-24 | IMEC vzw | System and method for context switching on predetermined interruption points |
| JP3573614B2 (ja) * | 1998-03-05 | 2004-10-06 | 株式会社日立製作所 | 画像処理装置及び画像処理システム |
| GB9804770D0 (en) * | 1998-03-07 | 1998-04-29 | Engineering Business Ltd | Apparatus for extracting power from moving water |
| US6646639B1 (en) | 1998-07-22 | 2003-11-11 | Nvidia Corporation | Modified method and apparatus for improved occlusion culling in graphics systems |
| US6275890B1 (en) * | 1998-08-19 | 2001-08-14 | International Business Machines Corporation | Low latency data path in a cross-bar switch providing dynamically prioritized bus arbitration |
| US6323755B1 (en) * | 1998-08-19 | 2001-11-27 | International Business Machines Corporation | Dynamic bus locking in a cross bar switch |
| US6347344B1 (en) * | 1998-10-14 | 2002-02-12 | Hitachi, Ltd. | Integrated multimedia system with local processor, data transfer switch, processing modules, fixed functional unit, data streamer, interface unit and multiplexer, all integrated on multimedia processor |
| US6041400A (en) * | 1998-10-26 | 2000-03-21 | Sony Corporation | Distributed extensible processing architecture for digital signal processing applications |
| US6501480B1 (en) * | 1998-11-09 | 2002-12-31 | Broadcom Corporation | Graphics accelerator |
| US20060174052A1 (en) * | 2005-02-02 | 2006-08-03 | Nobukazu Kondo | Integrated circuit and information processing device |
| US6844880B1 (en) | 1999-12-06 | 2005-01-18 | Nvidia Corporation | System, method and computer program product for an improved programmable vertex processing model with instruction set |
| DE19962730C2 (de) | 1999-12-23 | 2002-03-21 | Harman Becker Automotive Sys | Videosignalverarbeitungssystem bzw. Videosignalverarbeitungsverfahren |
| KR100385233B1 (ko) * | 2000-03-14 | 2003-05-23 | 삼성전자주식회사 | 데이터 프로세싱 시스템의 익스포넌트 유닛 |
| US7006101B1 (en) | 2001-06-08 | 2006-02-28 | Nvidia Corporation | Graphics API with branching capabilities |
| US7456838B1 (en) | 2001-06-08 | 2008-11-25 | Nvidia Corporation | System and method for converting a vertex program to a binary format capable of being executed by a hardware graphics pipeline |
| US7162716B2 (en) * | 2001-06-08 | 2007-01-09 | Nvidia Corporation | Software emulator for optimizing application-programmable vertex processing |
| US7266703B2 (en) | 2001-06-13 | 2007-09-04 | Itt Manufacturing Enterprises, Inc. | Single-pass cryptographic processor and method |
| US7249255B2 (en) * | 2001-06-13 | 2007-07-24 | Corrent Corporation | Apparatus and method for a hash processing system using multiple hash storage areas |
| US7360076B2 (en) * | 2001-06-13 | 2008-04-15 | Itt Manufacturing Enterprises, Inc. | Security association data cache and structure |
| US7213148B2 (en) * | 2001-06-13 | 2007-05-01 | Corrent Corporation | Apparatus and method for a hash processing system using integrated message digest and secure hash architectures |
| KR20030029913A (ko) * | 2001-07-07 | 2003-04-16 | 코닌클리즈케 필립스 일렉트로닉스 엔.브이. | 프로세서 클러스터 |
| DE10141130C1 (de) * | 2001-08-22 | 2003-04-03 | Sci Worx Gmbh | Verfahren und Vorrichtung zur Kodierung und Dekodierung von digitalen Bilddatenströmen |
| WO2003041322A2 (de) | 2001-10-31 | 2003-05-15 | Infineon Technologies Ag | Hardware-struktur und verfahren für eine sende-empfangs-einrichtung mit konfigurierbaren coprozessoren für mobilfunkanwendungen |
| CN1295609C (zh) * | 2001-12-14 | 2007-01-17 | 皇家飞利浦电子股份有限公司 | 数据处理系统、通信装置和处理数据的方法 |
| US8284844B2 (en) | 2002-04-01 | 2012-10-09 | Broadcom Corporation | Video decoding system supporting multiple standards |
| AU2003263782A1 (en) * | 2002-07-12 | 2004-02-02 | Sca Technica, Inc | Self-booting software defined radio module |
| US7117316B2 (en) | 2002-08-05 | 2006-10-03 | Micron Technology, Inc. | Memory hub and access method having internal row caching |
| US6820181B2 (en) | 2002-08-29 | 2004-11-16 | Micron Technology, Inc. | Method and system for controlling memory accesses to memory modules having a memory hub architecture |
| US7395208B2 (en) * | 2002-09-27 | 2008-07-01 | Microsoft Corporation | Integrating external voices |
| US7646817B2 (en) * | 2003-03-28 | 2010-01-12 | Microsoft Corporation | Accelerating video decoding using a graphics processing unit |
| US7107415B2 (en) | 2003-06-20 | 2006-09-12 | Micron Technology, Inc. | Posted write buffers and methods of posting write requests in memory modules |
| US7406090B2 (en) * | 2003-06-30 | 2008-07-29 | Intel Corporation | Managing a buffer for media processing |
| US7075541B2 (en) * | 2003-08-18 | 2006-07-11 | Nvidia Corporation | Adaptive load balancing in a multi-processor graphics processing system |
| US7120743B2 (en) | 2003-10-20 | 2006-10-10 | Micron Technology, Inc. | Arbitration system and method for memory responses in a hub-based memory system |
| US7330992B2 (en) | 2003-12-29 | 2008-02-12 | Micron Technology, Inc. | System and method for read synchronization of memory modules |
| JP2007520809A (ja) * | 2004-01-08 | 2007-07-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 局所的な動き複雑性に基づく候補ベクトルの分布 |
| US7162567B2 (en) | 2004-05-14 | 2007-01-09 | Micron Technology, Inc. | Memory hub and method for memory sequencing |
| US7519788B2 (en) | 2004-06-04 | 2009-04-14 | Micron Technology, Inc. | System and method for an asynchronous data buffer having buffer write and read pointers |
| US8279886B2 (en) * | 2004-12-30 | 2012-10-02 | Intel Corporation | Dataport and methods thereof |
| EP1894094A1 (en) * | 2005-06-03 | 2008-03-05 | Nxp B.V. | Data processing system and method for scheduling the use of at least one exclusive resource |
| TW200734878A (en) * | 2006-03-06 | 2007-09-16 | Realtek Semiconductor Corp | Data access apparatus with multiple buses and method thereof |
| US8218091B2 (en) | 2006-04-18 | 2012-07-10 | Marvell World Trade Ltd. | Shared memory multi video channel display apparatus and methods |
| US8284322B2 (en) | 2006-04-18 | 2012-10-09 | Marvell World Trade Ltd. | Shared memory multi video channel display apparatus and methods |
| US8264610B2 (en) | 2006-04-18 | 2012-09-11 | Marvell World Trade Ltd. | Shared memory multi video channel display apparatus and methods |
| US7685409B2 (en) * | 2007-02-21 | 2010-03-23 | Qualcomm Incorporated | On-demand multi-thread multimedia processor |
| WO2008139274A1 (en) * | 2007-05-10 | 2008-11-20 | Freescale Semiconductor, Inc. | Video processing system, integrated circuit, system for displaying video, system for generating video, method for configuring a video processing system, and computer program product |
| WO2009145608A1 (en) * | 2008-05-27 | 2009-12-03 | Eonic B.V. | Flexible architecture data processing unit |
| US20110293022A1 (en) * | 2009-02-27 | 2011-12-01 | Thomson Licensing | Message passing interface (mpi) framework for increasing execution speedault detection using embedded watermarks |
| EP2372490A1 (en) * | 2010-03-31 | 2011-10-05 | Robert Bosch GmbH | Circuit arrangement for a data processing system and method for data processing |
| DE102010003521A1 (de) * | 2010-03-31 | 2011-10-06 | Robert Bosch Gmbh | Modulare Struktur zur Datenverarbeitung |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4811052A (en) * | 1985-08-08 | 1989-03-07 | Canon Kabushiki Kaisha | Control device for control of multi-function control units in an image processing apparatus |
| US5113494A (en) * | 1987-02-27 | 1992-05-12 | Eastman Kodak Company | High speed raster image processor particularly suited for use in an image management system |
| GB8823239D0 (en) * | 1988-10-04 | 1988-11-09 | Gems Of Cambridge Ltd | Improved data processing |
| US5262965A (en) * | 1988-10-31 | 1993-11-16 | Bts-Broadcast Television Systems, Inc. | System and method for high speed computer graphics image computation using a parallel connected, asynchronous multiprocessor ring coupled to a synchronous special purpose video processing ring |
| US5140444A (en) * | 1989-10-10 | 1992-08-18 | Unisys Corporation | Image data processor |
| US5410649A (en) * | 1989-11-17 | 1995-04-25 | Texas Instruments Incorporated | Imaging computer system and network |
| IL97315A (en) * | 1990-02-28 | 1994-10-07 | Hughes Aircraft Co | Multi-group signal processor |
| US5588152A (en) * | 1990-11-13 | 1996-12-24 | International Business Machines Corporation | Advanced parallel processor including advanced support hardware |
| JPH04293151A (ja) * | 1991-03-20 | 1992-10-16 | Fujitsu Ltd | 並列データ処理方式 |
-
1996
- 1996-07-12 JP JP9506486A patent/JPH10506492A/ja active Pending
- 1996-07-12 DE DE69610548T patent/DE69610548T2/de not_active Expired - Lifetime
- 1996-07-12 EP EP96921026A patent/EP0789882B1/en not_active Expired - Lifetime
- 1996-07-12 WO PCT/IB1996/000683 patent/WO1997004401A2/en not_active Ceased
- 1996-07-19 US US08/683,995 patent/US5959689A/en not_active Expired - Lifetime
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005529407A (ja) * | 2002-06-07 | 2005-09-29 | マイクロン テクノロジー,インコーポレイティド | 内部キャッシュおよび/またはメモリアクセス予測を持つメモリハブ |
| US8811422B2 (en) | 2003-07-25 | 2014-08-19 | Microsoft Corporation | Single chip protocol converter |
| US7412588B2 (en) | 2003-07-25 | 2008-08-12 | International Business Machines Corporation | Network processor system on chip with bridge coupling protocol converting multiprocessor macro core local bus to peripheral interfaces coupled system bus |
| US7917729B2 (en) | 2003-07-25 | 2011-03-29 | International Business Machines Corporation | System on chip IC with subsystem of multiple processing cores switch coupled to network protocol device and bus bridge to local system bus |
| US8036243B2 (en) | 2003-07-25 | 2011-10-11 | International Business Machines Corporation | Single chip protocol converter |
| US7353362B2 (en) | 2003-07-25 | 2008-04-01 | International Business Machines Corporation | Multiprocessor subsystem in SoC with bridge between processor clusters interconnetion and SoC system bus |
| JP2010136452A (ja) * | 2004-04-01 | 2010-06-17 | Panasonic Corp | 集積回路 |
| US8811470B2 (en) | 2004-04-01 | 2014-08-19 | Panasonic Corporation | Integrated circuit for video/audio processing |
| US9361259B2 (en) | 2004-04-01 | 2016-06-07 | Socionext Inc. | Integrated circuit with multipurpose processing and for video/audio processing optimization |
| US8704837B2 (en) | 2004-04-16 | 2014-04-22 | Apple Inc. | High-level program interface for graphics operations |
| US9691118B2 (en) | 2004-04-16 | 2017-06-27 | Apple Inc. | System for optimizing graphics operations |
| US10402934B2 (en) | 2004-04-16 | 2019-09-03 | Apple Inc. | System for optimizing graphics operations |
| US7765250B2 (en) | 2004-11-15 | 2010-07-27 | Renesas Technology Corp. | Data processor with internal memory structure for processing stream data |
| JP2012128838A (ja) * | 2010-11-05 | 2012-07-05 | Src Computers Inc | アイソレーションメモリバッファを組み込んだロードリデュースド・デュアル・インライン・メモリ・モジュール(lr−dimm)を利用したスイッチ/ネットワークアダプタ・ポートインターフェースを含むヘテロジニアスコンピューティングシステム |
Also Published As
| Publication number | Publication date |
|---|---|
| US5959689A (en) | 1999-09-28 |
| DE69610548T2 (de) | 2001-06-07 |
| WO1997004401A2 (en) | 1997-02-06 |
| WO1997004401A3 (en) | 1997-03-20 |
| DE69610548D1 (de) | 2000-11-09 |
| EP0789882B1 (en) | 2000-10-04 |
| EP0789882A2 (en) | 1997-08-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH10506492A (ja) | 高性能密度を有するマルチメディアプロセッサアーキテクチャ | |
| US5719642A (en) | Full-search block matching motion estimation processor | |
| US5448310A (en) | Motion estimation coprocessor | |
| US5594679A (en) | Adaptive video signal processing apparatus | |
| US20030070059A1 (en) | System and method for performing efficient conditional vector operations for data parallel architectures | |
| JP2000509528A (ja) | データ処理マネージメントシステム | |
| Gove | The MVP: a highly-integrated video compression chip | |
| US20030222877A1 (en) | Processor system with coprocessor | |
| Possa et al. | P2ip: a novel low-latency programmable pipeline image processor | |
| Ronner et al. | Architecture and applications of the HiPAR video signal processor | |
| Okazaki et al. | A compact real-time vision system using integrated memory array processor architecture | |
| Yates et al. | An array processor for general purpose digital image compression | |
| Dasu et al. | Reconfigurable media processing | |
| Gehrke et al. | Associative controlling of monolithic parallel processor architectures | |
| Beric et al. | A 27 mW 1.1 mm/sup 2/motion estimator for picture-rate up-converter | |
| De Greef et al. | Mapping real-time motion estimation type algorithms to memory efficient, programmable multi-processor architectures | |
| Lu et al. | Semi-systolic array based motion estimation processor design | |
| Jeon et al. | KAIST image computing system (KICS): A parallel architecture for real-time multimedia data processing | |
| Komarek et al. | VLSI architectures for block matching algorithms | |
| Molloy et al. | A 110-K transistor 25-Mpixels/s configurable image transform processor unit | |
| De Greef et al. | A Memory Efficient, Programmable Multi-Processor Architecture for Real-Time Motion Estimation Type Algorithms | |
| Thacker et al. | Specification and design of a general purpose image processing chip | |
| Lai et al. | A novel video signal processor with programmable data arrangement and efficient memory configuration | |
| Moshnyaga et al. | A memory efficient array architecture for real‐time motion estimation | |
| Bourennane et al. | Real time image rotation using dynamic reconfiguration |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060418 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060912 |