TW200529041A

TW200529041A - System and method for accelerating a special purpose processor

Info

Publication number: TW200529041A
Application number: TW093135869A
Authority: TW
Inventors: Jen-Hsun Huang; Michael Brian Cox; Ziyad S Hakura; John S Montrym; Brad W Simeral; Brian Keith Langendorf; Blanton Scott Kephart; Frank R Diard
Original assignee: Nvidia Corp
Priority date: 2003-12-11
Filing date: 2004-11-22
Publication date: 2005-09-01
Also published as: TWI298454B; DE602004021667D1; ATE434807T1; EP1542160A1; EP1542160B1; US20050128203A1; US7053901B2

Description

200529041 (1) 九、發明說明【發明所屬之技術領域】本發明大體上關於資料處理領域。詳言之，本發明關於使用特殊用途處理器來處理的系統和方法。【先前技術】桌上型電腦和其他資料處理系統通常包含中央處理單元（CPU )以進行算術計算、邏輯運算、控制功能和/或其他處理。許多應用爲處理器密集。例如，將三維（3 D )場景繪圖中，每一影像物體通常使用稱爲圖元（通常是三角形或其他多邊形）的數百或數千或甚至數萬的幾何物體來描繪。場景可由數百或數千個圖元的組合來代表。每一物體的表面可貼圖和著色以造成看起來真實的3 D影像。在指定時間限制內將圖元定義、定位、貼圖、著色、繪圖所需的計算會超乎CPU的處理能力（或頻寬）。開發許多措施從C P U減少負載處理。一措施是在多處理組態新增額外的一般用途CPU。此措施的缺點是一般用途CPU可能不適於一些應用的計算需求。此外，多處理需要某些同步和管理負擔，會在主CPU產生無效率。不用新增CPU，特殊用途處理器可從CPU減少特定任務。例如，圖形應用中，稱爲圖形處理單元（GPU )的特殊用途處理器有時用以從CPU減少配合3D圖形之產生和/或繪圖的計算。特殊用途處理器也可用來控制資料儲存碟、網路通訊、或其他功能。在應用程式或作業系統（ 200529041 (2) 〇 S )的控制下，驅動程式軟體用來管理特殊用途處理器的介面。但從C P U減少計算至特殊用途處理器的已知系統和方法也有各種缺點。例如，在圖形處理的情形，GPU甚至會負擔過多。此外，已知應用中，當特殊用途處理器故障時，特殊用途處理器所進行的整體功能失去。因此，需要能加速諸如GPU之特殊用途處理器的系統和方法。【發明內容】本發明的實施例使用至少一輔助處理器來加速諸如 GPU的至少一特殊用途處理器，或管理特殊用途處理器的驅動程式。本發明中，其他實施例可選擇性實施。任何揭露的實施例可新增一個以上的特殊用途處理器和/或輔助處理器。本發明的實施例容忍故障，若輔助處理器不能運作’則GPU或其他特殊用途處理器可執行所有計算，雖然也許性能較差。根據性能考量，輔助處理器也可選擇性使用。從下文和詳細說明會凸顯本發明的特性和優點。【實施方式】本發明實施例利用輔助處理器加速特殊用途處理器的處理，而圖形處理單元（GPU )是此特殊用途處理器的實例。說明本發明實施例中，參考圖]-4呈現四功能架構。 200529041 (3) 參考圖5 A說明故障容忍運作的方法，例如當輔助處理器不運作時。參考圖5 B說明輔助處理器選擇性使用的方法。然後，參考圖6和7提供輔助處理器二例證。圖8和9 提供關於圖形處理領域之本發明實施例的二應用：分別是頂點著色加速和二次Z - c u 11。以下次標題只爲了組織方便；任何特定特性會以一段以上來說明。架構圖1 -4顯示系統的另一功能架構，具有應用軟體、驅動程式元件、特殊用途處理器、加速特殊用途處理器的輔助處理器。這些顯示的實施例中，驅動程式是圖形驅動程式1 10，特殊用途處理器是GPU (分別是120、210、310 、4 1 〇 )，輔助處理器（分別是1 1 5、2 0 5、3 0 5 ' 4 0 5 )用來加速 GPU(分別是 120、210、310、410)。顯示的實施例中，應用軟體1 05和圖形驅動程式1 1 0可常駐於CPU (未顯示）或由其執行。圖形驅動程式1 1 0管理輔助處理器和/或G P U上進行的處理任務。圖1是本發明實施例之功能系統架構的方塊圖。如所示，圖形驅動程式 Π 〇提供資料A ( 1 2 5 )給輔助處理器 1 1 5和G P U 1 2 0。輔助處理器1 1 5輸出A ( 1 2 5 )的轉換 A’（ 1 3 0 )給 GPU 1 20。然後 GPU 1 20 使用 A ( 1 25 )和 A’ (1 3 0 )做爲輸入以產生輸出B ( 1 3 5 ) 。( 1 3 0 )使

G P U 1 2 0比只有A ( ] 2 5 )輸入G P U ] 2 0較快產生輸出B 200529041 (4) (13 5)。圖2是本發明實施例之功能系統架精示，圖形驅動程式1 1 〇提供資料A ( 2 1 2 0 5。輔助處理器2 0 5輸出A ( 2 1 5 )的車i GPU 210。然後 GPU 210 使用 A，（220) )° 圖3是本發明實施例之功能系統架構示，圖形驅動程式1 1 〇提供資料A ( 3 1 5 GP U 3 1 0將資料a ( 3〗5 )送到輔助處理§ 器305輸出A(315)的轉換A，（320)給 GPU 310 使用 A(315)和 A，（320)做爲 B ( 3 2 5 )。八’（320)使 GPU 310 比只 1 GPU 310較快產生輸出B (325)。圖4是本發明實施例之功能系統架構示，圖形驅動程式1 1 0提供資料A ( 4 1 ΐ 4 〇 5。然後輔助處理器4 0 5輸出A ( 4 ] 5 ) )給圖形驅動程式1 1 0。然後G P U 4 1 0 A’（420)做爲輸入以產生輸出 B (425) GPU 410 比只有 A(415)輸入 GPU 410 (42 5 ) 〇因此，參考圖4，輔助處理器4 0 5可但當輔助處理器4〇5進行通常配合圖形驅定處理任務時，輔助處理器4 0 5加速管理形驅動程式1 I 〇的處理。參考圖]-3所述 I的方塊圖。如所 5 )給輔助處理器 | 換 A ’（ 2 2 0 )給產生輸出B ( 225 丨的方塊圖。如所 )給 GPU 3 10。 I 3 0 5。輔助處理 GPU 3 1 0。然後輸入以產生輸出 f A ( 3 1 5 )輸入的方塊圖。如所 ;)給輔助處理器的轉換A ’（ 4 2 0 g 用 A ( 4 1 5 )和〇 A，（ 4 2 0 )使較快產生輸出B 加速 GPU 410。動程式]1 〇的特 ί GPU 4 1 0 之圖的架構同樣可加 >8- 200529041 (5) 速圖形驅動程式1 1 0。本發明一實施例中，圖形驅動程式1 1 0依據應用特定性能需求或資源可用性而選擇性實施二個以上的功能架構。例如，對一處理任務，圖形驅動程式1 1 0實施圖1的功能架構’而對不同處理任務，圖形驅動程式1 〇〇實施圖4 的功能架構。因此，本發明的實施例可交替或組合使用以提供彈性處理解決。上述架構可修改而不偏離發明的範疇和精神。例如，圖1 -4的每一實施例雖參考涉及圖形處理的應用，但本發明可用於其他驅動程式或介面取代圖形驅動程式1 1 0，另一種特殊用途處理器可用來取代 GPU ( 135、210、310、 4 10)。此外，圖1 -4的任何功能架構可修改使得多個輔助處理器提供轉換給G P U ( 1 3 5、2 1 0 ' 3 1 0或4 1 0 )或其他特殊用途處理器以加速處理。此外，其他實施例中，單一輔助處理器可用來加速多個GPU ( 1 3 5、2 ] 0、3 ] 0或4 1 0 ) 或其他特殊用途處理器的運作。於是，依據應用需求，本發明實施例可縮放。根據應用，輔助處理器（1 1 5、2 0 5、3 0 5、4 0 5、6 2 5 、73 0 )可具有進行相當簡單任務的能力。例如，圖形處理環境中，輔助處理器可進行第一次z-cull處理（下述）。其他實施例中，輔助處理器（1 15、2 05、3 05、4 05、 625、7 3 0 )可具有 GPU (120、210、310、410、635、735 )或由輔助處理器所加速之其他特殊用途處理器的所有功 200529041 (6) 能。故障容忍圖5 A是本發明實施例之故障容忍方法的流程圖。圖 5 A顯示對輔助處理器1 1 5、3 0 5或4 0 5之故障之反應的方法。如所示，流程在步驟5 0 5開始，然後前進到條件步驟 5 1 〇判定輔助處理器是否運作。當條件步驟5 1 0的結果肯定（是）時，流程前進到步驟5 1 5，GPU或其他特殊用途處理器運算輸入A和A’，或只根據A’（ A ’是輔助處理器的輸出，如圖1 -4 )。當條件步驟5 1 0的結果否定（否）時，流程前進到步驟5 2 0，GPU或其他特殊用途處理器只運算輸入A (例如，沒有來自輔助處理器的結果）。依據設計選擇，可對圖1、3、4的任何架構實施圖 5 A的故障容忍處理。若輔助處理器故障，GPU或其他特殊用途處理器只根據A來運算（例如，步驟5 2 0 )，則性能會退化。例如，依據設計選擇，當一個以上的輔助處理器故障時，可預先判定一個以上的像素解析度、色彩解析度、或框速會減小輔助處理器的選擇性使用即使一個以上的輔助處理器運作，相較於只用特殊用途處理器，使用一個以上的輔助處理器不一定增進性能。於是，輔助處理器的選擇性使用會有利。 _ 10 - 200529041 (7) 圖5 b是本發明實施例之輔助處理器選擇性使用方法的流程圖。如所示，流程在步驟5 2 5開始’然後前進到條件步驟5 3 0判定輔助處理器使用是否增進性能。性能可關於處理速度、精確度、或其他準則。當條件步驟5 3 0的結果肯定（是）時，流程前進到步驟5 3 5，GPU或其他特殊用途處理器運算輸入A和A ’，或只根據A ’（ A ’是輔助處理器的輸出’如圖1 - 4 ) 。g條件步驟5 j 0的結果否疋（否）時，流程前進到步驟5 3 5，GP U或其他特殊用途處理器只運算輸入A (例如，沒有來自輔助處理器的結果）。至少有條件步驟5 3 0的三實施例可交替或組合使用。條件步驟5 3 0的第一實施例中，預先判定哪個應用或任務經由輔助處理器的使用達成增進性能。此例中，條件步驟 5 3 0的運算根據預定設定。預定設定可包含在查表。條件步驟5 3 0的第二實施例中，歷史資料（例如，用和不用輔助處理器之實際處理時間的日誌）用來判定輔助處理器應用是否增進性能。例如，條件步驟5 3 0的運算可包含用和不用輔助處理器之平均處理時間的比較。條件步驟5 3 0的第三實施例中，輔助處理器是否增進性能的判定是根據瞬間或近瞬間知識。例如，參考圖]，若GPU 120未及時接收Af來開始處理框N + 1，則可在條件步驟5 3 〇判定輔助處理器1 1 5不增進性能。另一方面，若G P U 1 2 0及時接收A ’而開始處理框N + 2，則可在條件步驟5 3 G判定輔助處理器增進性能。參考圖2，輔助處理器2 0 5可輪詢G P U 2 1 0的狀態暫存器以判定g P U 2 ] 〇何 -11 - 200529041 (8) 時可開始處理資料的最早點。當 GP U 2 1 0可開始處理，且輔助處理器2 0 5未完成的計算時，輔助處理器可將A 送到GPU 210而非A’。參考圖3，當GPU 3 1 0開始處理 A時，GPU 3 10的正常運作模式可從輔助處理器3 0 5取還 A’。當輔助處理器3 0 5從GPU 3 1 0接收取還命令時，若輔助處理器3 0 5未完成計算A’，則輔助處理器3 0 5將零送到G P U 3 1 0以回應取還命令。當G P U 3 1 0接收零時，條件步驟5 3 0的結果否定（否），GPU 310只根據A處理（步驟5 4 0 )。如上述，依據設計需求，條件步驟5 3 0的運算可在圖形驅動程式、輔助處理器、和/或G P U中進行。輔助處理器例證圖6和7提供上述功能架構更詳細的圖。前段的任何功能架構可依據參考圖6或7的說明來實施。其他實施也可肯巨。圖6是本發明一實施例之顯示輔助處理器例證之功能系統架構的方塊圖。如所示，C P U 6 0 5包含應用軟體6 j 〇和圖形驅動程式6 1 5。核心邏輯6 2 0包含積體輔助處理器 6 2 5。核心邏輯6 2 0可爲或包含晶片組，諸如北橋和/或南橋。北橋晶片組通常將C P U接到P CI匯流排和/或系統記憶體；南橋晶片組通常控制通用串列匯流排（U S B ) 和/或積體開發環境（IDE )匯流排，和/或進行電力管理、鍵盤/滑鼠控制、或其他功能。核心邏輯620耦合到 -12 - 200529041 (9) 記憶體63 0和GPU 6 3 5。記憶體6 3 0可爲系統記憶體或區域記憶體。積體輔助處理器6 2 5加速GP U 6 3 5或其他特殊用途處理器。圖7是本發明另一實施例之顯示輔助處理器例證之功能系統架構的方塊圖。如所示，CPU 7 0 5包含應用軟體 7 1 0和圖形驅動程式7 1 5。C P U 7 0 5耦合到核心邏輯720 。核心邏輯720可爲或包含晶片組，諸如北橋和/或南橋。核心邏輯7 2 0耦!合到記憶體7 2 5、輔助處理器7 3 0、 GPU 73 5。核心邏輯72 0和輔助處理器7 3 0之間的耦合可符合PCI或其他通訊協定。記憶體72 5可爲系統記憶體或區域記憶體。積體輔助處理器73 0加速GPU 7 3 5或其他特殊用途處理器。圖1-7中，依據設計選擇，CPU(605、705)可爲或包含 I n t e 1 P e n t i u m 111 X e ο η、1111 e 1 P e n t i u m 4、I η t e 1 Pentium M、AMD Athlon、或其他 CPU。GPU ( 1 35、225 、310、410、635、735)可爲或包含 NVIDIA GeForce 2 5 6 GPU、NVIDIA Quad i-o FX 500、NVIDIA GeForce FX G〇5200、NVIDIA GeForce FX G〇5600、或其他 GPU。無關圖形處理的應用中，可使用非GPU的特殊用途處理器例示應用圖7和8提供圖形處理領域之本發明的例示應用。無關圖形處理的其他應用也可受惠於加速特殊用途處理器的 -13- 200529041 (10) 輔助處理器。圖8是本發明實施例之進行頂點著色之方法的流程圖。顯不的方法預處理頂點緩衝，因而可較快繪圖。如所示，頂點緩衝A在步驟8 0 5產生，頂點在步驟8丨〇過濾或著色’頂點緩衝A在步驟8 1 5繪圖。於是，頂點緩衝a 在步驟8 1 0預處理’因而可較快繪圖。步驟§ 1 〇和$ 1 5選擇性利用著色程式（未顯示）來執行各處理。步驟8 〇 5可由圖形驅動程式1 1 0執行，步驟8 1 0可由輔助處理器（ 1 15、20 5、3 0 5、405、62 5、7 3 0 )進行，步驟 815 可由 GPU (120、210、310、410、635、7 3 5 )執行。圖9是本發明實施例之進行二次Z-ciill之方法的流程圖。3 D成像中，z軸是離開銀幕往觀者眼睛的軸。z軸過濾（Z-cull ’ a/k/a閉塞過濾）通常是丟棄第一組圖元的處理，另一圖元要在第一組圖元和觀者眼睛之間的位置繪圖於z軸上。換言之，Z-CU11是丟棄阻隔顯示影像之圖元的處理。運作中，通常對在相同框中分享相同x和y空間的物體做Z値比較，以判定哪個可看見，哪個要過濾。二次Z-cull中，在二步驟進行過濾。於是，如圖9，在步驟9 0 5接收圖元，然後在第一次z_ c u u步驟9丨〇繪圖以產生z-cull資訊。然後，在第二次z-cuu步驟915，第一次z-cull資訊可用來過濾比單次Z_CUU措施多的圖元。步驟9 0 5可由圖形驅動程式I丨〇執行，步驟9丨〇可由輔助處理器（1 1 5、2 0 5、3 0 5、4 0 5、6 2 5、7 3 0 )進行，步驟 915 可由 GPU ( ]20、2]〇、3]0、4]0、635、735)執行。 -14 - 200529041 (11) 其他應用中，輔助處理器（1 1 5、2 0 5、3 0 5、4 0 5、 6 2 5、7 3 Ο )進行其他功能。例如，圖形應用中，輔助處理器（115、205、305、405、625、730)可進行 GPU 加速之第一次的二次模板陰影量演算法、代表驅動程式之記憶體拷貝的實施（使得拷貝不涉及C P U )、網路控制器所完成之網路封包處理的進一步加速、產生較小輸入A，以節省頻寬之輸入A的壓縮、和/或特殊用途處理器之較快存取的資料位置管理。參考美國專利案09/585,810 ( 5/31/00申請）、 0 9/8 8 5,6 6 5 ( 6/ 1 9/0 1 申請）、i〇/23〇，1 24 ( 8/2 7/02 申請 )可更完整瞭解上述實施例，倂入做爲參考。結論因此上述本發明實施例以一個以上的其他特殊用途處理器加速特殊用途處理器或管理特殊用途處理器的驅動程式來克服已知系統方法的缺點。此外，揭露的措施有彈性、可縮放，能以故障容忍和/或選擇性的方式實施。本發明得由熟悉技藝之人任施匠思而爲諸般修飾，然皆不脫如申請專利範圍所欲保護者。例如，描述單一輔助處理器之使用的貫施例可修改以使用多個輔助處理器。此外’描述G p U之使用的實施例可修改以使用不同類的特殊用途處理器’例如非關圖形處理的應用。【圖式簡單說明】 -15- 200529041 (12) 圖1是本發明實施例之功能系統圖2是本發明實施例之功能系統圖3是本發明實施例之功能系統圖4是本發明實施例之功能系統圖5 A是本發明實施例之故障容$ 圖5 B是本發明實施例之輔助處的流程圖；圖6是本發明一實施例之顯示輔系統架構的方塊圖；圖7是本發明另一實施例之顯示能系統架構的方塊圖；圖8是本發明實施例之進行頂點 j 圓9是本發明實施例之進行二次 1湖。架構的方塊圖；架構的方塊圖；架構的方塊圖；架構的方塊圖； ?、方法的流程圖；理器選擇性使用方法助處理器例證之功能輔助處理器例證之功著色之方法的流程圖 Z-cull之方法的流程荽元件符號說明 105 應用程式 1 1 0 圖形驅動程式 1 1 5 輔助處理器 1 20 圖形處理 πα 早元 205 輔助處理器 2 1 〇圖形處理單元 3 05 輔助處理器 -16- 200529041 (13) 3 10 圖形處理單元 405 輔助處理器 4 10 圖形處理 CD 口早元 605 中央處理單元 6 10 應用程式 625 圖形驅動程式 620 核心邏輯 625 積體輔助處理器 630 記憶體 63 5 圖形處理口口早元 705 中央處理單元 7 10 應用程式 725 圖形驅動程式 720 核心邏輯 73 0 積助處理器 72 5 記憶體 73 5 圖形處理單元

Claims

200529041 (1) 十、申請專利範圍 1 . 一種處理資料的方法，包括：從驅動程式輸出資料至輔助處理器和特殊用途處理器，轉換該輔助處理器的資料；從該輔助處理器輸出該轉換資料至該特殊用途處理器 ;以及根據該資料和該轉換資料來計算該特殊用途處理器的結果’該計算比該特殊用途處理器只接收該資料做爲輸入更快達成結果。 2 .如申請專利範圍第丨項的方法，其中該驅動程式是圖形驅動程式’該特殊用途處理器是圖形處理單元。 3 ·如申請專利範圍第2項的方法，其中轉換該資料包含進行第一次c U 11 ’計算結果包含進行第二次z - c u 11。 4. 一種根據來自驅動程式元件的資料從特殊用途處理器提供輸出的方法，包括：在特殊用途處理器接收資料；判定輔助處理器是否運作；若該輔助處理器運作，則從該特殊用途處理器的輔助處理器接收轉換資料；以及根據該資料和該轉換資料來計算該特殊用途處理器的結果，該計算比特殊用途處理器只接收該資料做爲輸入更快達成結果， ~ 18 - 200529041 (2) 若該輔助處理器不運作，則只根據接收自該驅動程式元件的資料來計算該特殊用途處理器的結果。 5 .如申請專利範圍第4項的方法，其中該驅動程式是圖形驅動程式，且該特殊用途處理器是圖形處理單元。 6 ·如申請專利範圍第4項的方法，進一步包括若該輔助處理器運作’則從該驅動程式元件接收該輔助處理器的資料。 7 ·如申請專利範圍第4項的方法，進一步包括若該輔助處理器運作，則從該特殊用途處理器接收該輔助處理器的資料。 8 · —種處理資料的系統，包括：輸出資料的驅動程式；耦合到驅動程式並轉換資料的輔助處理器；耦合到驅動程式和輔助處理器的特殊用途處理器，該特殊用途處理器接收來自從驅動程式的資料和來自輔助處理器的轉換資料，該特殊用途處理器進一步根據該資料和該轉換資料比該特殊用途處理器只接收該資料做爲輸入更快計算結果。 9 .如申請專利範圍第8項的系統，其中該特殊用途處理器進一步判定該輔助處理器是否運作，若該輔助處理器不運作’則只根據該資料來計算結果。 1 〇 .如申請專利範圍第8項的系統，其中該驅動程式是圖形驅動程式，且該特殊用途處理器是圖形處理單元。 ]].如申請專利範圍第]〇項的方法，其中該轉換資料 -19- 200529041 (3) 包含第一次z-cull資訊，結果包含第二次z_cuU資訊。 1 2 . —種機器可讀取媒體，儲存有處理器要執行的指令以進行方法，包括：從驅動程式輸出資料至輔助處理器和特殊用途處理器 i 轉換輔助處理器的資料； * 從該輔助處理器輸出該轉換資料至該特殊用途處理器根據資料和轉換資料來計算該特殊用途處理器的結果 ’該計算比該特殊用途處理器只接收該資料做爲輸入更快達成結果。 1 3 · —種機器可讀取媒體，儲存有處理器要執行的指令，進行根據來自驅動程式元件的資料從特殊用途處理器提供輸出的方法，包括：在該特殊用途處理器接收資料；判定該輔助處理器是否運作； φ 若該輔助處理器運作，則從該特殊用途處理器的輔助處理器接收轉換資料；根據該資料和該轉換資料來計算該特殊用途處理器的結果，該計算比該特殊用途處理器只接收該資料做爲輸入 . 更快達成結果；若該輔助處理器不運作，則只根據接收自該驅動程式元件的資料來計算該特殊用途處理器的結果。 ]4 .一種處理資料的方法，包括： -20- 200529041 (4) 從驅動程式輸出資料至輔助處理器和特殊用途處理器轉換輔助處理器的資料；從該輔助處理器輸出轉換資料至該特殊用途處理器；根據資料和轉換資料來計算特殊用途處理器的結果，該計算比特殊用途處理器只接收資料做爲輸入更快達成結果。 1 5 .如申請專利範圍第1 4項的方法，其中該驅動程式是圖形驅動程式，特殊用途處理器是圖形處理單元。 1 6 . —種處理資料的方法，包括：從驅動程式輸出資料至特殊用途處理器和輔助處理器轉換該輔助處理器的資料；從該輔助處理器輸出轉換資料至該驅動程式；從該驅動程式輸出轉換資料至該特殊用途處理器；根據該資料和轉換資料來計算特殊用途處理器的結果，該計算比該特殊用途處理器只接收該資料做爲輸入更快達成結果。 1 7 ·如申請專利範圍第1 6項的方法，其中該驅動程式逶圖形驅動程式，且特殊用途處理器是圖形處理單元。 1 8 · —種根據來自驅動程式元件的資料從特殊用途處理器提供輸出的方法，包括：在該特殊用途處理器接收該資料；判定輔助處理器是否運作； -21 - 200529041 (5) 若該輔助處理器運作，則從該驅動程式元件的輔助處理器接收轉換資料；從該驅動程式將轉換資料傳到特殊用途處理器；根據該資料和轉換資料來計算特殊甩途處理器的結果 ’該δ十昇比特殊用途處理器只接收資料做爲輸入更快達成結果，若該輔助處理器不運作，則只根據接收自該驅動程式元件的資料來計算特殊用途處理器的結果。 1 9 . 一種處理資料的方法，包括：從驅動程式輸出資料至特殊用途處理器；選擇性從該驅動程式和特殊用途處理器之一輸出資料至輔助處理器；轉換該輔助處理器的資料；若資料從該驅動程式輸出至該輔助處理器，則從該輔助處理器選擇性輸出該轉換資料至該驅動程式和該特殊用途處理器之一；若該轉換資料輸出至該驅動程式，則從該驅動程式輸出轉換資料至特殊用途處理器；若資料從該特殊用途處理器輸出至該輔助處理器，則從該輔助處理器輸出轉換資料至該特殊用途處理器；根據該資料和該轉換資料來計算該特殊用途處理器的糸ρ果’該計算比該特殊用途處理器只接收該資料做爲輸入更快達成結果。 20.—種處理圖形資料的方法，包括 200529041 (6) 在驅動程式產生頂點緩衝·，轉換該頂點緩衝，該轉換包含使用該輔助處理器將該頂點緩衝的複數個頂點過濾和著色的至少其中之一；根據該特殊用途處理器的轉換頂點緩衝將該頂點緩衝繪圖’該繪圖比該特殊用途處理器接收該頂點緩衝而不接收該轉換頂點緩衝進行更快。 2 1 . —種選擇性使用輔助處理器的方法，包括·· 判定輔助處理器的使用是否增進性能；若判定該輔助處理器的使用未增進性能，則處理該特殊用途處理器的輸入；以及若判定該輔助處理器的使用增進性能，則處理該特殊用途處理器的轉換輸入，該轉換輸入是輔助處理器的輸入處理結果。 2 2 ·如申請專利範圍第2 1項的方法，若判定該輔助處理器的使用增進性能，則進一步包括處理該特殊處理器的輸入。 2 3 .如申請專利範圍第2 1項的方法，其中判定是根據經由該輔助處理器使用增進性能之應用的預定淸單。 2 4 ·如申請專利範圍第2 1項的方法，其中判定是根據任務的歷史性能資料。 2 5 .如申請專利範圍第2 1項的方法，其中判定是根據近瞬間知識。