前言:GPU煉金試驗(yàn)室是ZOL顯卡頻道在2012年度推出的新的一檔系列文章欄目,它同時(shí)也是去年的ZOL顯卡探索與發(fā)現(xiàn)欄目的延續(xù)和發(fā)展。在GPU煉金試驗(yàn)室中,我們會(huì)針對(duì)一系列人們感興趣的關(guān)于GPU的有趣細(xì)節(jié),比如它的性能特征、適用性甚至什么樣的產(chǎn)品值得選擇等等展開(kāi)一系列深入的測(cè)試和探討。通過(guò)GPU煉金試驗(yàn)室,你將會(huì)了解到毫無(wú)意義的跑分之外的很多事情,比如說(shuō)今天的文章就會(huì)為大家?guī)?lái)一個(gè)值得關(guān)心的問(wèn)題的答案——你的CPU,對(duì)Geforce GTX 680來(lái)說(shuō)真的夠力么?
基于Kepler構(gòu)架的NVIDIA新旗艦Geforce GTX 680已經(jīng)發(fā)布近一個(gè)月了,這款比競(jìng)爭(zhēng)對(duì)手更小更涼更便宜卻又更快的新一代旗艦一經(jīng)發(fā)布便掀起了一場(chǎng)軒然大波。所有人都在問(wèn)同樣的一個(gè)問(wèn)題——為什么?為什么Kepler會(huì)表現(xiàn)得如此之快?為什么更少的晶體管和更小的規(guī)?梢詭(lái)更高的性能?為什么Kepler可以做到如此高的性能功耗比……太多的疑問(wèn)縈繞在人們的心頭,不論業(yè)界還是愛(ài)好者,甚至包括競(jìng)爭(zhēng)對(duì)手AMD在內(nèi),每個(gè)人都希望能夠獲得這些問(wèn)題的答案。
和所有人一樣,我們也渴求著這些問(wèn)題的答案,但由于初期資料以及測(cè)試的不完善,我們?cè)谶壿嫎?gòu)架解讀的細(xì)節(jié)展現(xiàn)以及特性解釋等方面都遇到了不小的困難,因此我們?cè)谑诇y(cè)文章中無(wú)法給予讀者們所有這些關(guān)于構(gòu)架細(xì)節(jié)、“黑科技”以及諸多“為什么”的答案。
在過(guò)去的近一個(gè)月時(shí)間里,我們進(jìn)行了大量可以進(jìn)行的關(guān)于開(kāi)普勒構(gòu)架底層的延展性測(cè)試,以求能夠揭開(kāi)蒙在Kepler構(gòu)架以及Geforce GTX 680周?chē)闹刂蒯∧弧,F(xiàn)在,我們相信自己已經(jīng)揭開(kāi)了這神秘面紗的重要一角——Scheduling過(guò)程的細(xì)節(jié)和意義。而我們所使用的方法,就是測(cè)試Kepler以及Fermi邏輯結(jié)構(gòu)對(duì)不同處理器性能的依賴(lài)程度。
拋去邏輯結(jié)構(gòu)那些晦澀的細(xì)節(jié)以及對(duì)愛(ài)好者較高的技術(shù)水平要求,即便是對(duì)于一般用戶來(lái)說(shuō),手頭的顯卡是不是已經(jīng)物盡其用,究竟怎樣的處理器才能讓顯卡獲得最完整的性能發(fā)揮等等同樣是值得關(guān)注的問(wèn)題。因此,我們決定利用本期的GPU煉金試驗(yàn)室欄目對(duì)我們深挖Kepler構(gòu)架黑科技過(guò)程的部分測(cè)試的結(jié)果進(jìn)行展示,在為我們接下來(lái)將要進(jìn)行的討論做鋪墊的同時(shí),為大家?guī)?lái)“Geforce GTX 680究竟搭配怎樣的處理器才不會(huì)吃虧”這個(gè)問(wèn)題的答案。
你的Geforce GTX 680真的火力全開(kāi)了么?相信我,你會(huì)對(duì)這個(gè)問(wèn)題感興趣的。
第2頁(yè):不能用游戲么,那我們要怎么測(cè)試?
● 不能用游戲么,那我們要怎么測(cè)試?
所謂GPU對(duì)處理其性能的依賴(lài)性,實(shí)際上指的是由處理器頻率來(lái)決定的GPU本身的性能。一款GPU對(duì)于處理器的依賴(lài)體現(xiàn)在很多方面,諸如生成任務(wù)的能力、對(duì)于函數(shù)庫(kù)以及內(nèi)存訪問(wèn)的中斷管理、對(duì)指令的轉(zhuǎn)譯以及管理等等。這些由處理器決定的過(guò)程每時(shí)每刻都在影響著我們的應(yīng)用,通過(guò)逐步調(diào)整處理器的頻率并收集對(duì)應(yīng)頻率下不同GPU的性能,我們就可以知道各種GPU構(gòu)架對(duì)于處理器性能的依賴(lài)程度了。
遺憾的是,這些依賴(lài)度的測(cè)試并不能很直接的使用實(shí)際游戲之類(lèi)的手段來(lái)進(jìn)行。誠(chéng)然,顯卡的各種測(cè)試最終都是要服務(wù)于游戲等實(shí)際應(yīng)用當(dāng)中才有意義,但在一般的游戲過(guò)程中,處理器除了要負(fù)責(zé)與GPU性能也就是依賴(lài)性直接相關(guān)的部分之外,還要負(fù)責(zé)處理頂點(diǎn)生成、程序中斷控制管理、典型物理過(guò)程運(yùn)算以及AI等多項(xiàng)事務(wù),這些過(guò)程的處理都會(huì)極大地影響到最終游戲執(zhí)行的速度。換句話說(shuō),處理器不僅影響著GPU的性能,其本身對(duì)應(yīng)用的最終性能同樣會(huì)產(chǎn)生直接的影響。通過(guò)調(diào)整處理器主頻確實(shí)可以得到不同的游戲表現(xiàn),但這些表現(xiàn)往往是處理器本身對(duì)游戲性能的影響,并不一定是GPU構(gòu)架依賴(lài)處理器性能所導(dǎo)致的。
GPU煉金實(shí)驗(yàn)室是一檔致力于揭示構(gòu)架底層設(shè)計(jì)特點(diǎn)的欄目,我們所做的測(cè)試均要求盡可能的回避能夠?qū)Y(jié)果產(chǎn)生干擾或造成不確定性的因素。有介于這種情況,我們決定繼續(xù)采用過(guò)去經(jīng)常采用的低圖形關(guān)聯(lián)度測(cè)試法,以直接面向底層性能的通用計(jì)算測(cè)試,也就是SDK Simulation測(cè)試來(lái)替代多種因素交織并彼此產(chǎn)生影響的常規(guī)游戲過(guò)程。在此基礎(chǔ)上,我們會(huì)同時(shí)提供對(duì)處理器性能依賴(lài)較小的圖形過(guò)程來(lái)進(jìn)一步體現(xiàn)GPU對(duì)處理器性能的依賴(lài)情況。
我們首先進(jìn)行的SDK Simulation測(cè)試是使用Direct Compute完成的流體力學(xué)模擬測(cè)試——Fluid dynamics simulation。Fluid dynamics simulation基于彈性力/黏著力/重力為基礎(chǔ)的顆粒碰撞模擬,每一個(gè)顆粒均擁有獨(dú)立的力學(xué)參數(shù),通過(guò)對(duì)顆粒本身在統(tǒng)一的重力參數(shù)作用下自有力學(xué)參數(shù)以及交互作用的計(jì)算,可以模擬大量顆粒的行為并達(dá)到模擬由它們構(gòu)成的“流體”特性的目的。由于每一個(gè)粒子最終都會(huì)被處理成與其他粒子關(guān)聯(lián)的任務(wù),大量任務(wù)及其背后的關(guān)聯(lián)性讓Fluid dynamics simulation的Grid測(cè)試部分對(duì)于線程關(guān)聯(lián)度判斷等過(guò)程非常敏感,因此該項(xiàng)測(cè)試可以考驗(yàn)不同構(gòu)架在圖形通用計(jì)算以及有針對(duì)性的物理特效計(jì)算時(shí)對(duì)處理器的依賴(lài)度。
Cascaded Shadow Maps(CSM)是一種基于陰影深度進(jìn)行的陰影判斷及快速操作模式,CSM通過(guò)將整個(gè)陰影劃分成若干級(jí)的層次,以層次內(nèi)部像素的深度來(lái)定義和快速判斷陰影位置,并對(duì)近景陰影采取高精度貼圖,遠(yuǎn)景陰影采用低精度貼圖的方式來(lái)達(dá)到節(jié)約資源同時(shí)快速準(zhǔn)確實(shí)現(xiàn)陰影貼圖的目的。CSM可以極大地加快陰影操作的速度,同時(shí)避免大多數(shù)因?yàn)楣庠葱螒B(tài)、陰影深度與像素尺寸差異所導(dǎo)致的陰影邊緣及內(nèi)部貼圖錯(cuò)誤。CSM可以透過(guò)Compute Shader來(lái)進(jìn)行大量涉及矩陣運(yùn)算及坐標(biāo)判斷,而這一過(guò)程會(huì)頻繁的訪問(wèn)API,因此對(duì)處理器的任務(wù)及中斷管理能力有著很高的要求。
不同版本的3Dmark對(duì)于圖形過(guò)程中處理器的依賴(lài)度是不同的,基于DirectX 11的3Dmark 11由于側(cè)重點(diǎn)的改變,對(duì)于處理器在常規(guī)圖形過(guò)程中的依賴(lài)要小于其他版本的3Dmark Serise。因此,通過(guò)對(duì)3Dmark 11的測(cè)試,我們不僅能夠從側(cè)面獲得一定的GPU構(gòu)架對(duì)處理器依賴(lài)度的信息,還可以取得不同處理器主頻下GPU構(gòu)架所能夠表現(xiàn)出來(lái)的圖形性能變化趨勢(shì)。