前言:GPU煉金試驗(yàn)室是ZOL顯卡頻道在2012年度推出的新的一檔系列文章欄目,它同時(shí)也是去年的ZOL顯卡探索與發(fā)現(xiàn)欄目的延續(xù)和發(fā)展。在GPU煉金試驗(yàn)室中,我們會(huì)針對(duì)一系列人們感興趣的關(guān)于GPU的有趣細(xì)節(jié),比如它的性能特征、適用性甚至什么樣的產(chǎn)品值得選擇等等展開(kāi)一系列深入的測(cè)試和探討。通過(guò)GPU煉金試驗(yàn)室,你將會(huì)了解到毫無(wú)意義的跑分之外的很多事情,比如說(shuō)今天的文章就會(huì)為大家?guī)?lái)一個(gè)值得關(guān)心的問(wèn)題的答案——你的CPU,對(duì)Geforce GTX 680來(lái)說(shuō)真的夠力么?
基于Kepler構(gòu)架的NVIDIA新旗艦Geforce GTX 680已經(jīng)發(fā)布近一個(gè)月了,這款比競(jìng)爭(zhēng)對(duì)手更小更涼更便宜卻又更快的新一代旗艦一經(jīng)發(fā)布便掀起了一場(chǎng)軒然大波。所有人都在問(wèn)同樣的一個(gè)問(wèn)題——為什么?為什么Kepler會(huì)表現(xiàn)得如此之快?為什么更少的晶體管和更小的規(guī)?梢詭(lái)更高的性能?為什么Kepler可以做到如此高的性能功耗比……太多的疑問(wèn)縈繞在人們的心頭,不論業(yè)界還是愛(ài)好者,甚至包括競(jìng)爭(zhēng)對(duì)手AMD在內(nèi),每個(gè)人都希望能夠獲得這些問(wèn)題的答案。
和所有人一樣,我們也渴求著這些問(wèn)題的答案,但由于初期資料以及測(cè)試的不完善,我們?cè)谶壿嫎?gòu)架解讀的細(xì)節(jié)展現(xiàn)以及特性解釋等方面都遇到了不小的困難,因此我們?cè)谑诇y(cè)文章中無(wú)法給予讀者們所有這些關(guān)于構(gòu)架細(xì)節(jié)、“黑科技”以及諸多“為什么”的答案。
在過(guò)去的近一個(gè)月時(shí)間里,我們進(jìn)行了大量可以進(jìn)行的關(guān)于開(kāi)普勒構(gòu)架底層的延展性測(cè)試,以求能夠揭開(kāi)蒙在Kepler構(gòu)架以及Geforce GTX 680周?chē)闹刂蒯∧弧,F(xiàn)在,我們相信自己已經(jīng)揭開(kāi)了這神秘面紗的重要一角——Scheduling過(guò)程的細(xì)節(jié)和意義。而我們所使用的方法,就是測(cè)試Kepler以及Fermi邏輯結(jié)構(gòu)對(duì)不同處理器性能的依賴(lài)程度。
拋去邏輯結(jié)構(gòu)那些晦澀的細(xì)節(jié)以及對(duì)愛(ài)好者較高的技術(shù)水平要求,即便是對(duì)于一般用戶(hù)來(lái)說(shuō),手頭的顯卡是不是已經(jīng)物盡其用,究竟怎樣的處理器才能讓顯卡獲得最完整的性能發(fā)揮等等同樣是值得關(guān)注的問(wèn)題。因此,我們決定利用本期的GPU煉金試驗(yàn)室欄目對(duì)我們深挖Kepler構(gòu)架黑科技過(guò)程的部分測(cè)試的結(jié)果進(jìn)行展示,在為我們接下來(lái)將要進(jìn)行的討論做鋪墊的同時(shí),為大家?guī)?lái)“Geforce GTX 680究竟搭配怎樣的處理器才不會(huì)吃虧”這個(gè)問(wèn)題的答案。
你的Geforce GTX 680真的火力全開(kāi)了么?相信我,你會(huì)對(duì)這個(gè)問(wèn)題感興趣的。
第2頁(yè):不能用游戲么,那我們要怎么測(cè)試?
● 不能用游戲么,那我們要怎么測(cè)試?
所謂GPU對(duì)處理其性能的依賴(lài)性,實(shí)際上指的是由處理器頻率來(lái)決定的GPU本身的性能。一款GPU對(duì)于處理器的依賴(lài)體現(xiàn)在很多方面,諸如生成任務(wù)的能力、對(duì)于函數(shù)庫(kù)以及內(nèi)存訪問(wèn)的中斷管理、對(duì)指令的轉(zhuǎn)譯以及管理等等。這些由處理器決定的過(guò)程每時(shí)每刻都在影響著我們的應(yīng)用,通過(guò)逐步調(diào)整處理器的頻率并收集對(duì)應(yīng)頻率下不同GPU的性能,我們就可以知道各種GPU構(gòu)架對(duì)于處理器性能的依賴(lài)程度了。
遺憾的是,這些依賴(lài)度的測(cè)試并不能很直接的使用實(shí)際游戲之類(lèi)的手段來(lái)進(jìn)行。誠(chéng)然,顯卡的各種測(cè)試最終都是要服務(wù)于游戲等實(shí)際應(yīng)用當(dāng)中才有意義,但在一般的游戲過(guò)程中,處理器除了要負(fù)責(zé)與GPU性能也就是依賴(lài)性直接相關(guān)的部分之外,還要負(fù)責(zé)處理頂點(diǎn)生成、程序中斷控制管理、典型物理過(guò)程運(yùn)算以及AI等多項(xiàng)事務(wù),這些過(guò)程的處理都會(huì)極大地影響到最終游戲執(zhí)行的速度。換句話說(shuō),處理器不僅影響著GPU的性能,其本身對(duì)應(yīng)用的最終性能同樣會(huì)產(chǎn)生直接的影響。通過(guò)調(diào)整處理器主頻確實(shí)可以得到不同的游戲表現(xiàn),但這些表現(xiàn)往往是處理器本身對(duì)游戲性能的影響,并不一定是GPU構(gòu)架依賴(lài)處理器性能所導(dǎo)致的。
GPU煉金實(shí)驗(yàn)室是一檔致力于揭示構(gòu)架底層設(shè)計(jì)特點(diǎn)的欄目,我們所做的測(cè)試均要求盡可能的回避能夠?qū)Y(jié)果產(chǎn)生干擾或造成不確定性的因素。有介于這種情況,我們決定繼續(xù)采用過(guò)去經(jīng)常采用的低圖形關(guān)聯(lián)度測(cè)試法,以直接面向底層性能的通用計(jì)算測(cè)試,也就是SDK Simulation測(cè)試來(lái)替代多種因素交織并彼此產(chǎn)生影響的常規(guī)游戲過(guò)程。在此基礎(chǔ)上,我們會(huì)同時(shí)提供對(duì)處理器性能依賴(lài)較小的圖形過(guò)程來(lái)進(jìn)一步體現(xiàn)GPU對(duì)處理器性能的依賴(lài)情況。
我們首先進(jìn)行的SDK Simulation測(cè)試是使用Direct Compute完成的流體力學(xué)模擬測(cè)試——Fluid dynamics simulation。Fluid dynamics simulation基于彈性力/黏著力/重力為基礎(chǔ)的顆粒碰撞模擬,每一個(gè)顆粒均擁有獨(dú)立的力學(xué)參數(shù),通過(guò)對(duì)顆粒本身在統(tǒng)一的重力參數(shù)作用下自有力學(xué)參數(shù)以及交互作用的計(jì)算,可以模擬大量顆粒的行為并達(dá)到模擬由它們構(gòu)成的“流體”特性的目的。由于每一個(gè)粒子最終都會(huì)被處理成與其他粒子關(guān)聯(lián)的任務(wù),大量任務(wù)及其背后的關(guān)聯(lián)性讓Fluid dynamics simulation的Grid測(cè)試部分對(duì)于線程關(guān)聯(lián)度判斷等過(guò)程非常敏感,因此該項(xiàng)測(cè)試可以考驗(yàn)不同構(gòu)架在圖形通用計(jì)算以及有針對(duì)性的物理特效計(jì)算時(shí)對(duì)處理器的依賴(lài)度。
Cascaded Shadow Maps(CSM)是一種基于陰影深度進(jìn)行的陰影判斷及快速操作模式,CSM通過(guò)將整個(gè)陰影劃分成若干級(jí)的層次,以層次內(nèi)部像素的深度來(lái)定義和快速判斷陰影位置,并對(duì)近景陰影采取高精度貼圖,遠(yuǎn)景陰影采用低精度貼圖的方式來(lái)達(dá)到節(jié)約資源同時(shí)快速準(zhǔn)確實(shí)現(xiàn)陰影貼圖的目的。CSM可以極大地加快陰影操作的速度,同時(shí)避免大多數(shù)因?yàn)楣庠葱螒B(tài)、陰影深度與像素尺寸差異所導(dǎo)致的陰影邊緣及內(nèi)部貼圖錯(cuò)誤。CSM可以透過(guò)Compute Shader來(lái)進(jìn)行大量涉及矩陣運(yùn)算及坐標(biāo)判斷,而這一過(guò)程會(huì)頻繁的訪問(wèn)API,因此對(duì)處理器的任務(wù)及中斷管理能力有著很高的要求。
不同版本的3Dmark對(duì)于圖形過(guò)程中處理器的依賴(lài)度是不同的,基于DirectX 11的3Dmark 11由于側(cè)重點(diǎn)的改變,對(duì)于處理器在常規(guī)圖形過(guò)程中的依賴(lài)要小于其他版本的3Dmark Serise。因此,通過(guò)對(duì)3Dmark 11的測(cè)試,我們不僅能夠從側(cè)面獲得一定的GPU構(gòu)架對(duì)處理器依賴(lài)度的信息,還可以取得不同處理器主頻下GPU構(gòu)架所能夠表現(xiàn)出來(lái)的圖形性能變化趨勢(shì)。
測(cè)試平臺(tái)及測(cè)試項(xiàng)目簡(jiǎn)介
● 測(cè)試平臺(tái)及測(cè)試項(xiàng)目簡(jiǎn)介
性能測(cè)試使用的硬件平臺(tái)由Intel Core i7-3960X、X79 Chipset和4GB*4四通道DDR3-1600內(nèi)存構(gòu)成。細(xì)節(jié)及軟件 環(huán)境設(shè)定見(jiàn)下表:
測(cè) 試 平 臺(tái) 硬 件
中央處理器
Intel Core i7-3960X
(6核 / 12線程 / 100MHz*33 /
15MB L3 Cache )
散熱器
Intel RTS2011LC
(原廠水冷散熱器 / 選配件 )
內(nèi)存模組
Samsung 黑武士 DDR3-1600 4GB
(SPD:9-9-9-24-1T)
主板
ASUS Rampage IV Extreme
(Intel X79 Chipset)
硬盤(pán)
Hitachi 1T
(1TB / 7200RPM / 16M
50GB NTFS
電源供應(yīng)器
NERMAX 白金冰核 1500W
(CSCI Platinum 80Plus / 1500W)
顯示器
DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)
為保證系統(tǒng)平臺(tái)具有最佳的穩(wěn)定性,此次硬件評(píng)測(cè)中所使用的操作系統(tǒng)均為Microsoft Windows 7 正版授權(quán)產(chǎn)品。使用Windows 7正版軟件能夠獲得最好的兼容性以及系統(tǒng)升級(jí)更新服務(wù)。
用戶(hù)在體驗(yàn)或購(gòu)買(mǎi)安裝Windows 7的操作系統(tǒng)時(shí)請(qǐng)認(rèn)準(zhǔn)所裝系統(tǒng)是否已經(jīng)獲得正版授權(quán)許可!未經(jīng)授權(quán)的非正版軟件將無(wú)法獲得包括更新等功能在內(nèi)的Windows 7服務(wù)。
操 作 系 統(tǒng) 及 驅(qū) 動(dòng)
操作系統(tǒng)
Microsoft Windows 7
Ultimate RTM SP1
(64bit / 版本號(hào)7601)
主板芯片組驅(qū)動(dòng)
Intel Chipset Device Software
for Win7
(WHQL / 版本號(hào) 9.2.3.1022)
NVIDIA 顯卡驅(qū)動(dòng)
NVIDIA Forceware
(WHQL / 版本號(hào) 301.10)
2560*1600_32bit 60Hz
各類(lèi)合成測(cè)試軟件和直接測(cè)速軟件都用得分來(lái)衡量性能,數(shù)值越高越好,以時(shí)間計(jì)算的幾款測(cè)試軟件則是用時(shí)越少越好。由于是芯片級(jí)首測(cè),因此我們將所有參測(cè)顯卡的頻率統(tǒng)一調(diào)節(jié)成了公版頻率。
● 最低頻1.2G,“不給力”的起點(diǎn)
我們的測(cè)試從Rampage IV Extreme能夠允許的最低運(yùn)行倍頻12開(kāi)始,當(dāng)倍頻被調(diào)節(jié)到小于默認(rèn)的33之后,I7 3960X的睿頻功能便被自動(dòng)關(guān)閉,CPU主頻將被定格在當(dāng)前設(shè)置的數(shù)值上,這為我們的測(cè)試提供了便利。在極低的頻率下,Kepler構(gòu)架以及Fermi構(gòu)架分別開(kāi)始了自己的表演。
在最低CPU主頻的測(cè)試中,Geforce GTX 680在通用計(jì)算測(cè)試部分表現(xiàn)出了低落的性能,其測(cè)試數(shù)值尚不及上代的Fermi構(gòu)架。而圖形測(cè)試環(huán)節(jié),獲益于超過(guò)Fermi一倍的Texture資源,Geforce GTX 680維持住了相對(duì)Fermi的優(yōu)勢(shì),但領(lǐng)先幅度與默認(rèn)狀態(tài)存在不小的差距。
● 1.6G,Kepler依舊不及Fermi
我們以400MHz為單位提升CPU的主頻,當(dāng)主頻達(dá)到1.6G時(shí)我們?cè)俅芜M(jìn)行了測(cè)試并收集了數(shù)據(jù),在1.6G的主頻上,Kepler與Fermi的差距不僅沒(méi)有縮小,反而被進(jìn)一步拉大了。
在1.6G的I7-3960X的驅(qū)動(dòng)下,Kepler的表現(xiàn)依舊比較乏力,伴隨著處理器頻率的提升,F(xiàn)ermi構(gòu)架在CSM測(cè)試中取得了增幅要明顯大于Kepler的Geforce GTX 680。而圖形相關(guān)的測(cè)試中,Geforce GTX 680終于找回了一定的自信,在增幅上超過(guò)了GTX580。
● 2.0G,F(xiàn)ermi貼近界限
伴隨著處理器頻率的進(jìn)一步提升,Geforce GTX 680終于開(kāi)始了屬于自己的表演,其測(cè)試成績(jī)開(kāi)始有了令人期待的加速增長(zhǎng)態(tài)勢(shì)。
2G的SNB-E處理器成功地阻止了Kepler與Fermi構(gòu)架之間通用計(jì)算性能差距的進(jìn)一步擴(kuò)大,不僅CSM測(cè)試Geforce GTX 680穩(wěn)定住了與Geforce GTX 580之間的差距,在Fluid測(cè)試中Geforce GTX 680更是完成了對(duì)GTX580的超越。圖形測(cè)試部分,Geforce GTX 680同樣維持了更高的性能增長(zhǎng)率,而GTX580則逐步貼近了默認(rèn)性能界限。
● 2.4G,Kepler性能增速提升
當(dāng)主頻來(lái)到2.4G時(shí),Kepler構(gòu)架終于開(kāi)始了屬于自己的表演,在測(cè)試中表現(xiàn)出了更加明顯的性能提升,并基本上完成了對(duì)Fermi的完全超越。
在2.4G的處理器頻率下,Geforce GTX 680在CSM測(cè)試中達(dá)到了與GTX580相同的測(cè)試結(jié)果,而其他的所有測(cè)試項(xiàng)目中GTX680均表現(xiàn)出了更高的性能。
● 2.8G,F(xiàn)ermi已達(dá)極限
當(dāng)頻率被提升到2.8G時(shí),我們的測(cè)試進(jìn)行到了一個(gè)冰火兩重天的狀態(tài)。一方面Kepler的性能依舊在維持著幾乎線性的增長(zhǎng),另一方面的Fermi的性能則進(jìn)入了滯漲的狀態(tài)。
在2.8G的測(cè)試中,Geforce GTX 580無(wú)論是圖形性能還是通用計(jì)算性能都已經(jīng)增長(zhǎng)到了界限,當(dāng)前的成績(jī)與我們所進(jìn)行的公測(cè)以及后續(xù)測(cè)試中所展現(xiàn)出來(lái)的默認(rèn)成績(jī)均一無(wú)二致,這表明Geforce GTX 580已經(jīng)達(dá)到了其理論性能的界限,接下來(lái)所發(fā)生的一切事情,都不是由處理器依賴(lài)性所決定的了。
● 3.2G,Kepler依舊維持增長(zhǎng)
當(dāng)頻率進(jìn)一步提升到貼近I7-3960X的默認(rèn)狀態(tài)時(shí),F(xiàn)ermi構(gòu)架的性能已經(jīng)停止了增長(zhǎng),但Kepler構(gòu)架卻依舊維持著旺盛的性能增長(zhǎng)狀態(tài)。
3Dmark 11 P模式測(cè)試
3Dmark 11 X模式測(cè)試
CSM測(cè)試
Fluid測(cè)試
在3.2G的測(cè)試中,Geforce GTX 680在所有的測(cè)試環(huán)節(jié)均完全超越了Geforce GTX 580,領(lǐng)先幅度基本上達(dá)到了公測(cè)階段默認(rèn)處理器頻率下所收集到的級(jí)別。
● 在這些頻率上,我們都遇到了什么?
前面的測(cè)試結(jié)果收集都是以特定頻率為階段進(jìn)行的,將他們割裂的進(jìn)行分析會(huì)令人很難產(chǎn)生處理器對(duì)GPU性能影響的完整印象,所以我們將這些結(jié)果進(jìn)行收集并按測(cè)試項(xiàng)目分別制成了曲線圖,接下來(lái)就讓我們來(lái)看一看處理器頻率究竟對(duì)Geforce GTX 680以及Geforce GTX 580產(chǎn)生了怎樣的影響吧。
3Dmark 11的P模式測(cè)試大幅削減了材質(zhì)以及后端輸出的需求,因此負(fù)載更加偏向于shader的執(zhí)行也就是ALU的動(dòng)作效率,在P模式的測(cè)試中,伴隨著處理器頻率的提升,Geforce GTX 680表現(xiàn)出了高于Geforce GTX 580的性能增長(zhǎng)速度,這表明Geforce GTX 680的效率比Geforce GTX 580更加依賴(lài)于處理器的性能表現(xiàn)。
X模式的3Dmark 11擁有極高的材質(zhì)以及shader吞吐壓力,同時(shí)后端也必須面對(duì)諸如抗鋸齒之類(lèi)應(yīng)用所帶來(lái)的負(fù)荷。在這些“干擾因素”的作用下,Geforce GTX 680與GGeforce GTX 580的處理器依賴(lài)性表現(xiàn)得并不明顯,但兩者仍舊隨著處理器頻率的增加而獲得了性能的提升。
CSM的測(cè)試結(jié)果一定會(huì)出乎不少人的意料,在較低的處理器頻率下,Geforce GTX 580竟然完成了對(duì)Geforce GTX 680的性能超越,這種超越在處理器主頻達(dá)到2G之后才有所緩解,當(dāng)處理器頻率超過(guò)2.4G之后,Geforce GTX 680顯然從處理器的頻率提升中獲得了更多的好處。
Fluid simulation測(cè)試的結(jié)果在趨勢(shì)上與CSM類(lèi)似,在處理器性能低落時(shí)Geforce GTX 580要比Geforce GTX 680更快,這種情況直到處理器頻率達(dá)到2G之后才得到了緩解,而伴隨著處理器頻率以及性能的提升,GTX680獲得了始終呈線性狀態(tài)良好增長(zhǎng)的性能曲線。
● 為了黑科技,買(mǎi)一顆好處理器吧少年
測(cè)試結(jié)果既出乎意料卻又在情理之中。伴隨著我們使用的3960X主頻的提升,無(wú)論是圖形測(cè)試還是通用計(jì)算測(cè)試,Geforce GTX 680均表現(xiàn)出了比Geforce GTX 580更明顯的性能延展性,性能提升幅度要明顯好于后者并且直到測(cè)試結(jié)束都維持著幾乎現(xiàn)行的性能延伸,但這句結(jié)論在這里并不是全然意義上的正面描述。這樣的測(cè)試結(jié)果,充分證明了Geforce GTX 680有著比上代Fermi構(gòu)架的Geforce GTX 580更強(qiáng)烈的處理器依賴(lài)性。
在兩項(xiàng)通用計(jì)算性能測(cè)試中,Geforce GTX 680在處理器低頻狀態(tài)下均敗給了上代的Geforce GTX 580,而伴隨著頻率的提升,GTX680的各項(xiàng)性能均呈現(xiàn)出完全的線性增長(zhǎng),最終直到處理器默認(rèn)頻率狀態(tài)下這種增長(zhǎng)仍然沒(méi)有停止。這不僅佐證了GTX680更加強(qiáng)烈的依賴(lài)性,更為國(guó)內(nèi)外各大媒體在GTX680首測(cè)期間所提供的趨勢(shì)相同但細(xì)節(jié)迥異的測(cè)試結(jié)果提供了解釋——目前我們所接觸到的處理器默認(rèn)狀態(tài),尚不足以完全發(fā)揮出Geforce GTX 680全部的性能。
對(duì)于Geforce GTX 680的用戶(hù)來(lái)說(shuō),一款強(qiáng)勁的處理器是絕對(duì)必要的,它可以讓Geforce GTX 680表現(xiàn)出“應(yīng)有”的性能。根據(jù)目前的測(cè)試結(jié)果來(lái)看,我們甚至建議用戶(hù)保證I7-3960X這樣檔次的處理器,最起碼要保證處理器在超頻狀態(tài)下具有與3.3G的SNB-E處理器相近的性能水準(zhǔn)。只有這樣的處理器性能,只有這樣才能夠保證Geforce GTX 680在圖形及通用計(jì)算應(yīng)用的絕大部分場(chǎng)合的正常發(fā)揮。而對(duì)于Geforce GTX 580的用戶(hù)來(lái)說(shuō),這一限制被放寬到了一個(gè)較低的性能等級(jí)上,只要你的處理器比2.8G的SNB-E更快,那么你手頭的Geforce GTX 580將在大多數(shù)場(chǎng)合發(fā)揮除正常的性能。
早在Geforce GTX 680的首發(fā)測(cè)試中,我們就曾經(jīng)對(duì)GK104身上出現(xiàn)的諸多“黑科技”進(jìn)行過(guò)初步的探討。在這些黑科技中,最引人注目的部分便來(lái)自Scheduling過(guò)程的巨大變革,它不僅是Geforce GTX 680目前所表現(xiàn)出來(lái)的強(qiáng)烈的處理器依賴(lài)性的主因,更是Kepler構(gòu)架中一系列重大變化,如SMX單元以及更高每瓦特性能等出現(xiàn)的重要原因。今天的測(cè)試除了向讀者們表明Geforce GTX 680需要強(qiáng)勁的處理器才能發(fā)揮應(yīng)有性能之外,更重要的意義在于為我們即將到來(lái)的關(guān)于GK104黑科技的解密過(guò)程提供討論的依據(jù)。
在接下來(lái)的文章中,我們將會(huì)對(duì)GK104全新的Scheduling過(guò)程所具備的特點(diǎn)、出現(xiàn)的原因以及對(duì)當(dāng)前以及未來(lái)所產(chǎn)生的影響進(jìn)行詳細(xì)的討論。如果你是一個(gè)希望更多更全面的了解Kepler以及未來(lái)NVIDIA GPU設(shè)計(jì)細(xì)節(jié)和發(fā)展方向的讀者,那么接下來(lái)的文章將是你不容錯(cuò)過(guò)的。Kepler的黑科技正在我們的拷問(wèn)之下初步顯現(xiàn)出更多的細(xì)節(jié),敬請(qǐng)期待我們對(duì)這些黑科技的全面展示吧。