24組數(shù)據(jù)找答案 GTX680處理器依賴性測試

來源:中關村在線 更新日期:2012-05-05 作者:顧杰

你的GTX680真的火力全開了么

    前言:GPU煉金試驗室是ZOL顯卡頻道在2012年度推出的新的一檔系列文章欄目,它同時也是去年的ZOL顯卡探索與發(fā)現(xiàn)欄目的延續(xù)和發(fā)展。在GPU煉金試驗室中,我們會針對一系列人們感興趣的關于GPU的有趣細節(jié),比如它的性能特征、適用性甚至什么樣的產(chǎn)品值得選擇等等展開一系列深入的測試和探討。通過GPU煉金試驗室,你將會了解到毫無意義的跑分之外的很多事情,比如說今天的文章就會為大家?guī)硪粋€值得關心的問題的答案——你的CPU,對Geforce GTX 680來說真的夠力么?

    基于Kepler構(gòu)架的NVIDIA新旗艦Geforce GTX 680已經(jīng)發(fā)布近一個月了,這款比競爭對手更小更涼更便宜卻又更快的新一代旗艦一經(jīng)發(fā)布便掀起了一場軒然大波。所有人都在問同樣的一個問題——為什么?為什么Kepler會表現(xiàn)得如此之快?為什么更少的晶體管和更小的規(guī)�?梢詭砀叩男阅�?為什么Kepler可以做到如此高的性能功耗比……太多的疑問縈繞在人們的心頭,不論業(yè)界還是愛好者,甚至包括競爭對手AMD在內(nèi),每個人都希望能夠獲得這些問題的答案。

    和所有人一樣,我們也渴求著這些問題的答案,但由于初期資料以及測試的不完善,我們在邏輯構(gòu)架解讀的細節(jié)展現(xiàn)以及特性解釋等方面都遇到了不小的困難,因此我們在首測文章中無法給予讀者們所有這些關于構(gòu)架細節(jié)、“黑科技”以及諸多“為什么”的答案。

    在過去的近一個月時間里,我們進行了大量可以進行的關于開普勒構(gòu)架底層的延展性測試,以求能夠揭開蒙在Kepler構(gòu)架以及Geforce GTX 680周圍的重重帷幕�,F(xiàn)在,我們相信自己已經(jīng)揭開了這神秘面紗的重要一角——Scheduling過程的細節(jié)和意義。而我們所使用的方法,就是測試Kepler以及Fermi邏輯結(jié)構(gòu)對不同處理器性能的依賴程度。

    拋去邏輯結(jié)構(gòu)那些晦澀的細節(jié)以及對愛好者較高的技術水平要求,即便是對于一般用戶來說,手頭的顯卡是不是已經(jīng)物盡其用,究竟怎樣的處理器才能讓顯卡獲得最完整的性能發(fā)揮等等同樣是值得關注的問題。因此,我們決定利用本期的GPU煉金試驗室欄目對我們深挖Kepler構(gòu)架黑科技過程的部分測試的結(jié)果進行展示,在為我們接下來將要進行的討論做鋪墊的同時,為大家?guī)怼癎eforce GTX 680究竟搭配怎樣的處理器才不會吃虧”這個問題的答案。

    你的Geforce GTX 680真的火力全開了么?相信我,你會對這個問題感興趣的。

    第2頁:不能用游戲么,那我們要怎么測試?

    ● 不能用游戲么,那我們要怎么測試?

    所謂GPU對處理其性能的依賴性,實際上指的是由處理器頻率來決定的GPU本身的性能。一款GPU對于處理器的依賴體現(xiàn)在很多方面,諸如生成任務的能力、對于函數(shù)庫以及內(nèi)存訪問的中斷管理、對指令的轉(zhuǎn)譯以及管理等等。這些由處理器決定的過程每時每刻都在影響著我們的應用,通過逐步調(diào)整處理器的頻率并收集對應頻率下不同GPU的性能,我們就可以知道各種GPU構(gòu)架對于處理器性能的依賴程度了。

    遺憾的是,這些依賴度的測試并不能很直接的使用實際游戲之類的手段來進行。誠然,顯卡的各種測試最終都是要服務于游戲等實際應用當中才有意義,但在一般的游戲過程中,處理器除了要負責與GPU性能也就是依賴性直接相關的部分之外,還要負責處理頂點生成、程序中斷控制管理、典型物理過程運算以及AI等多項事務,這些過程的處理都會極大地影響到最終游戲執(zhí)行的速度。換句話說,處理器不僅影響著GPU的性能,其本身對應用的最終性能同樣會產(chǎn)生直接的影響。通過調(diào)整處理器主頻確實可以得到不同的游戲表現(xiàn),但這些表現(xiàn)往往是處理器本身對游戲性能的影響,并不一定是GPU構(gòu)架依賴處理器性能所導致的。

    GPU煉金實驗室是一檔致力于揭示構(gòu)架底層設計特點的欄目,我們所做的測試均要求盡可能的回避能夠?qū)Y(jié)果產(chǎn)生干擾或造成不確定性的因素。有介于這種情況,我們決定繼續(xù)采用過去經(jīng)常采用的低圖形關聯(lián)度測試法,以直接面向底層性能的通用計算測試,也就是SDK Simulation測試來替代多種因素交織并彼此產(chǎn)生影響的常規(guī)游戲過程。在此基礎上,我們會同時提供對處理器性能依賴較小的圖形過程來進一步體現(xiàn)GPU對處理器性能的依賴情況。

    我們首先進行的SDK Simulation測試是使用Direct Compute完成的流體力學模擬測試——Fluid dynamics simulation。Fluid dynamics simulation基于彈性力/黏著力/重力為基礎的顆粒碰撞模擬,每一個顆粒均擁有獨立的力學參數(shù),通過對顆粒本身在統(tǒng)一的重力參數(shù)作用下自有力學參數(shù)以及交互作用的計算,可以模擬大量顆粒的行為并達到模擬由它們構(gòu)成的“流體”特性的目的。由于每一個粒子最終都會被處理成與其他粒子關聯(lián)的任務,大量任務及其背后的關聯(lián)性讓Fluid dynamics simulation的Grid測試部分對于線程關聯(lián)度判斷等過程非常敏感,因此該項測試可以考驗不同構(gòu)架在圖形通用計算以及有針對性的物理特效計算時對處理器的依賴度。

    Cascaded Shadow Maps(CSM)是一種基于陰影深度進行的陰影判斷及快速操作模式,CSM通過將整個陰影劃分成若干級的層次,以層次內(nèi)部像素的深度來定義和快速判斷陰影位置,并對近景陰影采取高精度貼圖,遠景陰影采用低精度貼圖的方式來達到節(jié)約資源同時快速準確實現(xiàn)陰影貼圖的目的。CSM可以極大地加快陰影操作的速度,同時避免大多數(shù)因為光源形態(tài)、陰影深度與像素尺寸差異所導致的陰影邊緣及內(nèi)部貼圖錯誤。CSM可以透過Compute Shader來進行大量涉及矩陣運算及坐標判斷,而這一過程會頻繁的訪問API,因此對處理器的任務及中斷管理能力有著很高的要求。

    不同版本的3Dmark對于圖形過程中處理器的依賴度是不同的,基于DirectX 11的3Dmark 11由于側(cè)重點的改變,對于處理器在常規(guī)圖形過程中的依賴要小于其他版本的3Dmark Serise。因此,通過對3Dmark 11的測試,我們不僅能夠從側(cè)面獲得一定的GPU構(gòu)架對處理器依賴度的信息,還可以取得不同處理器主頻下GPU構(gòu)架所能夠表現(xiàn)出來的圖形性能變化趨勢。

   

測試平臺及測試項目簡介

    ● 測試平臺及測試項目簡介

    性能測試使用的硬件平臺由Intel Core i7-3960X、X79 Chipset和4GB*4四通道DDR3-1600內(nèi)存構(gòu)成。細節(jié)及軟件 環(huán)境設定見下表:

   

測 試 平 臺 硬 件


中央處理器
Intel Core i7-3960X
(6核 / 12線程 / 100MHz*33 /
15MB L3 Cache )

散熱器
Intel RTS2011LC
(原廠水冷散熱器 / 選配件 )

內(nèi)存模組
Samsung 黑武士 DDR3-1600 4GB
(SPD:9-9-9-24-1T)

主板
ASUS Rampage IV Extreme
(Intel X79 Chipset)

硬盤
Hitachi 1T
(1TB / 7200RPM / 16M緩存 /
50GB NTFS系統(tǒng)

電源供應器
NERMAX 白金冰核 1500W
(CSCI Platinum 80Plus / 1500W)

顯示器
DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)

    為保證系統(tǒng)平臺具有最佳的穩(wěn)定性,此次硬件評測中所使用的操作系統(tǒng)均為Microsoft Windows 7 正版授權產(chǎn)品。使用Windows 7正版軟件能夠獲得最好的兼容性以及系統(tǒng)升級更新服務。

    用戶在體驗或購買安裝Windows 7的操作系統(tǒng)時請認準所裝系統(tǒng)是否已經(jīng)獲得正版授權許可!未經(jīng)授權的非正版軟件將無法獲得包括更新等功能在內(nèi)的Windows 7服務。

   

操 作 系 統(tǒng) 及 驅(qū) 動

操作系統(tǒng)
Microsoft Windows 7
Ultimate RTM SP1
(64bit / 版本號7601)

主板芯片組驅(qū)動
Intel Chipset Device Software
for Win7
(WHQL / 版本號 9.2.3.1022)

NVIDIA 顯卡驅(qū)動
NVIDIA Forceware
(WHQL / 版本號 301.10)

桌面環(huán)境

2560*1600_32bit 60Hz

    各類合成測試軟件和直接測速軟件都用得分來衡量性能,數(shù)值越高越好,以時間計算的幾款測試軟件則是用時越少越好。由于是芯片級首測,因此我們將所有參測顯卡的頻率統(tǒng)一調(diào)節(jié)成了公版頻率。

   

最低頻1.2GHz,“不給力”的起點

    ● 最低頻1.2G,“不給力”的起點

    我們的測試從Rampage IV Extreme能夠允許的最低運行倍頻12開始,當倍頻被調(diào)節(jié)到小于默認的33之后,I7 3960X的睿頻功能便被自動關閉,CPU主頻將被定格在當前設置的數(shù)值上,這為我們的測試提供了便利。在極低的頻率下,Kepler構(gòu)架以及Fermi構(gòu)架分別開始了自己的表演。

    在最低CPU主頻的測試中,Geforce GTX 680在通用計算測試部分表現(xiàn)出了低落的性能,其測試數(shù)值尚不及上代的Fermi構(gòu)架。而圖形測試環(huán)節(jié),獲益于超過Fermi一倍的Texture資源,Geforce GTX 680維持住了相對Fermi的優(yōu)勢,但領先幅度與默認狀態(tài)存在不小的差距。

   

1.6GHz,Kepler依舊不及Fermi

    ● 1.6G,Kepler依舊不及Fermi

    我們以400MHz為單位提升CPU的主頻,當主頻達到1.6G時我們再次進行了測試并收集了數(shù)據(jù),在1.6G的主頻上,Kepler與Fermi的差距不僅沒有縮小,反而被進一步拉大了。

    在1.6G的I7-3960X的驅(qū)動下,Kepler的表現(xiàn)依舊比較乏力,伴隨著處理器頻率的提升,F(xiàn)ermi構(gòu)架在CSM測試中取得了增幅要明顯大于Kepler的Geforce GTX 680。而圖形相關的測試中,Geforce GTX 680終于找回了一定的自信,在增幅上超過了GTX580。

   

2.0GHz,F(xiàn)ermi貼近界限

    ● 2.0G,F(xiàn)ermi貼近界限

    伴隨著處理器頻率的進一步提升,Geforce GTX 680終于開始了屬于自己的表演,其測試成績開始有了令人期待的加速增長態(tài)勢。

    2G的SNB-E處理器成功地阻止了Kepler與Fermi構(gòu)架之間通用計算性能差距的進一步擴大,不僅CSM測試Geforce GTX 680穩(wěn)定住了與Geforce GTX 580之間的差距,在Fluid測試中Geforce GTX 680更是完成了對GTX580的超越。圖形測試部分,Geforce GTX 680同樣維持了更高的性能增長率,而GTX580則逐步貼近了默認性能界限。

   

2.4GHz,Kepler性能增速提升

    ● 2.4G,Kepler性能增速提升

    當主頻來到2.4G時,Kepler構(gòu)架終于開始了屬于自己的表演,在測試中表現(xiàn)出了更加明顯的性能提升,并基本上完成了對Fermi的完全超越。

    在2.4G的處理器頻率下,Geforce GTX 680在CSM測試中達到了與GTX580相同的測試結(jié)果,而其他的所有測試項目中GTX680均表現(xiàn)出了更高的性能。

   

2.8GHz,F(xiàn)ermi已達極限

    ● 2.8G,F(xiàn)ermi已達極限

    當頻率被提升到2.8G時,我們的測試進行到了一個冰火兩重天的狀態(tài)。一方面Kepler的性能依舊在維持著幾乎線性的增長,另一方面的Fermi的性能則進入了滯漲的狀態(tài)。

    在2.8G的測試中,Geforce GTX 580無論是圖形性能還是通用計算性能都已經(jīng)增長到了界限,當前的成績與我們所進行的公測以及后續(xù)測試中所展現(xiàn)出來的默認成績均一無二致,這表明Geforce GTX 580已經(jīng)達到了其理論性能的界限,接下來所發(fā)生的一切事情,都不是由處理器依賴性所決定的了。

   

3.2GHz,Kepler依舊維持增長

    ● 3.2G,Kepler依舊維持增長

    當頻率進一步提升到貼近I7-3960X的默認狀態(tài)時,F(xiàn)ermi構(gòu)架的性能已經(jīng)停止了增長,但Kepler構(gòu)架卻依舊維持著旺盛的性能增長狀態(tài)。

3Dmark 11 P模式測試

3Dmark 11 X模式測試

CSM測試

Fluid測試

    在3.2G的測試中,Geforce GTX 680在所有的測試環(huán)節(jié)均完全超越了Geforce GTX 580,領先幅度基本上達到了公測階段默認處理器頻率下所收集到的級別。

   

在這些頻率上,我們都遇到了什么?

    ● 在這些頻率上,我們都遇到了什么?

    前面的測試結(jié)果收集都是以特定頻率為階段進行的,將他們割裂的進行分析會令人很難產(chǎn)生處理器對GPU性能影響的完整印象,所以我們將這些結(jié)果進行收集并按測試項目分別制成了曲線圖,接下來就讓我們來看一看處理器頻率究竟對Geforce GTX 680以及Geforce GTX 580產(chǎn)生了怎樣的影響吧。

    3Dmark 11的P模式測試大幅削減了材質(zhì)以及后端輸出的需求,因此負載更加偏向于shader的執(zhí)行也就是ALU的動作效率,在P模式的測試中,伴隨著處理器頻率的提升,Geforce GTX 680表現(xiàn)出了高于Geforce GTX 580的性能增長速度,這表明Geforce GTX 680的效率比Geforce GTX 580更加依賴于處理器的性能表現(xiàn)。

    X模式的3Dmark 11擁有極高的材質(zhì)以及shader吞吐壓力,同時后端也必須面對諸如抗鋸齒之類應用所帶來的負荷。在這些“干擾因素”的作用下,Geforce GTX 680與GGeforce GTX 580的處理器依賴性表現(xiàn)得并不明顯,但兩者仍舊隨著處理器頻率的增加而獲得了性能的提升。

    CSM的測試結(jié)果一定會出乎不少人的意料,在較低的處理器頻率下,Geforce GTX 580竟然完成了對Geforce GTX 680的性能超越,這種超越在處理器主頻達到2G之后才有所緩解,當處理器頻率超過2.4G之后,Geforce GTX 680顯然從處理器的頻率提升中獲得了更多的好處。

    Fluid simulation測試的結(jié)果在趨勢上與CSM類似,在處理器性能低落時Geforce GTX 580要比Geforce GTX 680更快,這種情況直到處理器頻率達到2G之后才得到了緩解,而伴隨著處理器頻率以及性能的提升,GTX680獲得了始終呈線性狀態(tài)良好增長的性能曲線。

   

為了黑科技,買一顆好處理器吧少年

    ● 為了黑科技,買一顆好處理器吧少年

    測試結(jié)果既出乎意料卻又在情理之中。伴隨著我們使用的3960X主頻的提升,無論是圖形測試還是通用計算測試,Geforce GTX 680均表現(xiàn)出了比Geforce GTX 580更明顯的性能延展性,性能提升幅度要明顯好于后者并且直到測試結(jié)束都維持著幾乎現(xiàn)行的性能延伸,但這句結(jié)論在這里并不是全然意義上的正面描述。這樣的測試結(jié)果,充分證明了Geforce GTX 680有著比上代Fermi構(gòu)架的Geforce GTX 580更強烈的處理器依賴性。

    在兩項通用計算性能測試中,Geforce GTX 680在處理器低頻狀態(tài)下均敗給了上代的Geforce GTX 580,而伴隨著頻率的提升,GTX680的各項性能均呈現(xiàn)出完全的線性增長,最終直到處理器默認頻率狀態(tài)下這種增長仍然沒有停止。這不僅佐證了GTX680更加強烈的依賴性,更為國內(nèi)外各大媒體在GTX680首測期間所提供的趨勢相同但細節(jié)迥異的測試結(jié)果提供了解釋——目前我們所接觸到的處理器默認狀態(tài),尚不足以完全發(fā)揮出Geforce GTX 680全部的性能。

    對于Geforce GTX 680的用戶來說,一款強勁的處理器是絕對必要的,它可以讓Geforce GTX 680表現(xiàn)出“應有”的性能。根據(jù)目前的測試結(jié)果來看,我們甚至建議用戶保證I7-3960X這樣檔次的處理器,最起碼要保證處理器在超頻狀態(tài)下具有與3.3G的SNB-E處理器相近的性能水準。只有這樣的處理器性能,只有這樣才能夠保證Geforce GTX 680在圖形及通用計算應用的絕大部分場合的正常發(fā)揮。而對于Geforce GTX 580的用戶來說,這一限制被放寬到了一個較低的性能等級上,只要你的處理器比2.8G的SNB-E更快,那么你手頭的Geforce GTX 580將在大多數(shù)場合發(fā)揮除正常的性能。

    早在Geforce GTX 680的首發(fā)測試中,我們就曾經(jīng)對GK104身上出現(xiàn)的諸多“黑科技”進行過初步的探討。在這些黑科技中,最引人注目的部分便來自Scheduling過程的巨大變革,它不僅是Geforce GTX 680目前所表現(xiàn)出來的強烈的處理器依賴性的主因,更是Kepler構(gòu)架中一系列重大變化,如SMX單元以及更高每瓦特性能等出現(xiàn)的重要原因。今天的測試除了向讀者們表明Geforce GTX 680需要強勁的處理器才能發(fā)揮應有性能之外,更重要的意義在于為我們即將到來的關于GK104黑科技的解密過程提供討論的依據(jù)。

    在接下來的文章中,我們將會對GK104全新的Scheduling過程所具備的特點、出現(xiàn)的原因以及對當前以及未來所產(chǎn)生的影響進行詳細的討論。如果你是一個希望更多更全面的了解Kepler以及未來NVIDIA GPU設計細節(jié)和發(fā)展方向的讀者,那么接下來的文章將是你不容錯過的。Kepler的黑科技正在我們的拷問之下初步顯現(xiàn)出更多的細節(jié),敬請期待我們對這些黑科技的全面展示吧。

廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網(wǎng) 版權所有 關于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論