投影時代首頁 > 電腦配件 >> 評測試用 > 正文

搜索新聞

24組數(shù)據(jù)找答案 GTX680處理器依賴性測試

來源：中關(guān)村在線　更新日期：2012-05-05 作者：顧杰

商顯市場最大的看點(diǎn)何在年度評選盛典獲獎揭曉 LED及大屏商顯年終總結(jié)

本文導(dǎo)航

第1頁：你的GTX680真的火力全開了么
第3頁：最低頻1.2GHz，“不給力”的起點(diǎn)
第5頁：2.0GHz，F(xiàn)ermi貼近界限
第7頁：2.8GHz，F(xiàn)ermi已達(dá)極限
第9頁：在這些頻率上，我們都遇到了什么？

第2頁：測試平臺及測試項(xiàng)目簡介
第4頁：1.6GHz，Kepler依舊不及Fermi
第6頁：2.4GHz，Kepler性能增速提升
第8頁：3.2GHz，Kepler依舊維持增長
第10頁：為了黑科技，買一顆好處理器吧少年

返回分頁閱讀文章

你的GTX680真的火力全開了么

前言：GPU煉金試驗(yàn)室是ZOL顯卡頻道在2012年度推出的新的一檔系列文章欄目，它同時也是去年的ZOL顯卡探索與發(fā)現(xiàn)欄目的延續(xù)和發(fā)展。在GPU煉金試驗(yàn)室中，我們會針對一系列人們感興趣的關(guān)于GPU的有趣細(xì)節(jié)，比如它的性能特征、適用性甚至什么樣的產(chǎn)品值得選擇等等展開一系列深入的測試和探討。通過GPU煉金試驗(yàn)室，你將會了解到毫無意義的跑分之外的很多事情，比如說今天的文章就會為大家?guī)硪粋€值得關(guān)心的問題的答案——你的CPU，對Geforce GTX 680來說真的夠力么？

基于Kepler構(gòu)架的NVIDIA新旗艦Geforce GTX 680已經(jīng)發(fā)布近一個月了，這款比競爭對手更小更涼更便宜卻又更快的新一代旗艦一經(jīng)發(fā)布便掀起了一場軒然大波。所有人都在問同樣的一個問題——為什么？為什么Kepler會表現(xiàn)得如此之快？為什么更少的晶體管和更小的規(guī)�？梢詭砀叩男阅�？為什么Kepler可以做到如此高的性能功耗比……太多的疑問縈繞在人們的心頭，不論業(yè)界還是愛好者，甚至包括競爭對手AMD在內(nèi)，每個人都希望能夠獲得這些問題的答案。

和所有人一樣，我們也渴求著這些問題的答案，但由于初期資料以及測試的不完善，我們在邏輯構(gòu)架解讀的細(xì)節(jié)展現(xiàn)以及特性解釋等方面都遇到了不小的困難,因此我們在首測文章中無法給予讀者們所有這些關(guān)于構(gòu)架細(xì)節(jié)、“黑科技”以及諸多“為什么”的答案。

在過去的近一個月時間里，我們進(jìn)行了大量可以進(jìn)行的關(guān)于開普勒構(gòu)架底層的延展性測試，以求能夠揭開蒙在Kepler構(gòu)架以及Geforce GTX 680周圍的重重帷幕�，F(xiàn)在，我們相信自己已經(jīng)揭開了這神秘面紗的重要一角——Scheduling過程的細(xì)節(jié)和意義。而我們所使用的方法，就是測試Kepler以及Fermi邏輯結(jié)構(gòu)對不同處理器性能的依賴程度。

拋去邏輯結(jié)構(gòu)那些晦澀的細(xì)節(jié)以及對愛好者較高的技術(shù)水平要求，即便是對于一般用戶來說，手頭的顯卡是不是已經(jīng)物盡其用，究竟怎樣的處理器才能讓顯卡獲得最完整的性能發(fā)揮等等同樣是值得關(guān)注的問題。因此，我們決定利用本期的GPU煉金試驗(yàn)室欄目對我們深挖Kepler構(gòu)架黑科技過程的部分測試的結(jié)果進(jìn)行展示，在為我們接下來將要進(jìn)行的討論做鋪墊的同時，為大家?guī)怼癎eforce GTX 680究竟搭配怎樣的處理器才不會吃虧”這個問題的答案。

你的Geforce GTX 680真的火力全開了么？相信我，你會對這個問題感興趣的。

第2頁：不能用游戲么，那我們要怎么測試？

● 不能用游戲么，那我們要怎么測試？

所謂GPU對處理其性能的依賴性，實(shí)際上指的是由處理器頻率來決定的GPU本身的性能。一款GPU對于處理器的依賴體現(xiàn)在很多方面，諸如生成任務(wù)的能力、對于函數(shù)庫以及內(nèi)存訪問的中斷管理、對指令的轉(zhuǎn)譯以及管理等等。這些由處理器決定的過程每時每刻都在影響著我們的應(yīng)用，通過逐步調(diào)整處理器的頻率并收集對應(yīng)頻率下不同GPU的性能，我們就可以知道各種GPU構(gòu)架對于處理器性能的依賴程度了。

遺憾的是，這些依賴度的測試并不能很直接的使用實(shí)際游戲之類的手段來進(jìn)行。誠然，顯卡的各種測試最終都是要服務(wù)于游戲等實(shí)際應(yīng)用當(dāng)中才有意義，但在一般的游戲過程中，處理器除了要負(fù)責(zé)與GPU性能也就是依賴性直接相關(guān)的部分之外，還要負(fù)責(zé)處理頂點(diǎn)生成、程序中斷控制管理、典型物理過程運(yùn)算以及AI等多項(xiàng)事務(wù)，這些過程的處理都會極大地影響到最終游戲執(zhí)行的速度。換句話說，處理器不僅影響著GPU的性能，其本身對應(yīng)用的最終性能同樣會產(chǎn)生直接的影響。通過調(diào)整處理器主頻確實(shí)可以得到不同的游戲表現(xiàn)，但這些表現(xiàn)往往是處理器本身對游戲性能的影響，并不一定是GPU構(gòu)架依賴處理器性能所導(dǎo)致的。

GPU煉金實(shí)驗(yàn)室是一檔致力于揭示構(gòu)架底層設(shè)計(jì)特點(diǎn)的欄目，我們所做的測試均要求盡可能的回避能夠?qū)Y(jié)果產(chǎn)生干擾或造成不確定性的因素。有介于這種情況，我們決定繼續(xù)采用過去經(jīng)常采用的低圖形關(guān)聯(lián)度測試法，以直接面向底層性能的通用計(jì)算測試，也就是SDK Simulation測試來替代多種因素交織并彼此產(chǎn)生影響的常規(guī)游戲過程。在此基礎(chǔ)上，我們會同時提供對處理器性能依賴較小的圖形過程來進(jìn)一步體現(xiàn)GPU對處理器性能的依賴情況。

我們首先進(jìn)行的SDK Simulation測試是使用Direct Compute完成的流體力學(xué)模擬測試——Fluid dynamics simulation。Fluid dynamics simulation基于彈性力/黏著力/重力為基礎(chǔ)的顆粒碰撞模擬，每一個顆粒均擁有獨(dú)立的力學(xué)參數(shù)，通過對顆粒本身在統(tǒng)一的重力參數(shù)作用下自有力學(xué)參數(shù)以及交互作用的計(jì)算，可以模擬大量顆粒的行為并達(dá)到模擬由它們構(gòu)成的“流體”特性的目的。由于每一個粒子最終都會被處理成與其他粒子關(guān)聯(lián)的任務(wù)，大量任務(wù)及其背后的關(guān)聯(lián)性讓Fluid dynamics simulation的Grid測試部分對于線程關(guān)聯(lián)度判斷等過程非常敏感，因此該項(xiàng)測試可以考驗(yàn)不同構(gòu)架在圖形通用計(jì)算以及有針對性的物理特效計(jì)算時對處理器的依賴度。

Cascaded Shadow Maps（CSM）是一種基于陰影深度進(jìn)行的陰影判斷及快速操作模式，CSM通過將整個陰影劃分成若干級的層次，以層次內(nèi)部像素的深度來定義和快速判斷陰影位置，并對近景陰影采取高精度貼圖，遠(yuǎn)景陰影采用低精度貼圖的方式來達(dá)到節(jié)約資源同時快速準(zhǔn)確實(shí)現(xiàn)陰影貼圖的目的。CSM可以極大地加快陰影操作的速度，同時避免大多數(shù)因?yàn)楣庠葱螒B(tài)、陰影深度與像素尺寸差異所導(dǎo)致的陰影邊緣及內(nèi)部貼圖錯誤。CSM可以透過Compute Shader來進(jìn)行大量涉及矩陣運(yùn)算及坐標(biāo)判斷，而這一過程會頻繁的訪問API，因此對處理器的任務(wù)及中斷管理能力有著很高的要求。

不同版本的3Dmark對于圖形過程中處理器的依賴度是不同的，基于DirectX 11的3Dmark 11由于側(cè)重點(diǎn)的改變，對于處理器在常規(guī)圖形過程中的依賴要小于其他版本的3Dmark Serise。因此，通過對3Dmark 11的測試，我們不僅能夠從側(cè)面獲得一定的GPU構(gòu)架對處理器依賴度的信息，還可以取得不同處理器主頻下GPU構(gòu)架所能夠表現(xiàn)出來的圖形性能變化趨勢。

測試平臺及測試項(xiàng)目簡介

● 測試平臺及測試項(xiàng)目簡介

性能測試使用的硬件平臺由Intel Core i7-3960X、X79 Chipset和4GB*4四通道DDR3-1600內(nèi)存構(gòu)成。細(xì)節(jié)及軟件環(huán)境設(shè)定見下表：

測試平臺硬件
	中央處理器
	Intel Core i7-3960X
	（6核 / 12線程 / 100MHz*33 / 15MB L3 Cache ）
	散熱器
	Intel RTS2011LC
	（原廠水冷散熱器 / 選配件）
	內(nèi)存模組
	Samsung 黑武士 DDR3-1600 4GB
	（SPD:9-9-9-24-1T）
	主板
	ASUS Rampage IV Extreme
	（Intel X79 Chipset）
	硬盤
	Hitachi 1T
	（1TB / 7200RPM / 16M緩存 / 50GB NTFS系統(tǒng)）
	電源供應(yīng)器
	NERMAX 白金冰核 1500W
	（CSCI Platinum 80Plus / 1500W）
	顯示器
	DELL UltraSharp 3008WFP
	（30英寸LCD / 2560*1600分辨率）

為保證系統(tǒng)平臺具有最佳的穩(wěn)定性，此次硬件評測中所使用的操作系統(tǒng)均為Microsoft Windows 7 正版授權(quán)產(chǎn)品。使用Windows 7正版軟件能夠獲得最好的兼容性以及系統(tǒng)升級更新服務(wù)。

用戶在體驗(yàn)或購買安裝Windows 7的操作系統(tǒng)時請認(rèn)準(zhǔn)所裝系統(tǒng)是否已經(jīng)獲得正版授權(quán)許可！未經(jīng)授權(quán)的非正版軟件將無法獲得包括更新等功能在內(nèi)的Windows 7服務(wù)。

操作系統(tǒng) 及驅(qū) 動

	操作系統(tǒng)
	Microsoft Windows 7 Ultimate RTM SP1
	（64bit / 版本號7601）
	主板芯片組驅(qū)動
	Intel Chipset Device Software for Win7
	（WHQL / 版本號 9.2.3.1022）
	NVIDIA 顯卡驅(qū)動
	NVIDIA Forceware
	（WHQL / 版本號 301.10）
	桌面環(huán)境
	2560*1600_32bit 60Hz

各類合成測試軟件和直接測速軟件都用得分來衡量性能，數(shù)值越高越好，以時間計(jì)算的幾款測試軟件則是用時越少越好。由于是芯片級首測，因此我們將所有參測顯卡的頻率統(tǒng)一調(diào)節(jié)成了公版頻率。

最低頻1.2GHz，“不給力”的起點(diǎn)

● 最低頻1.2G，“不給力”的起點(diǎn)

我們的測試從Rampage IV Extreme能夠允許的最低運(yùn)行倍頻12開始，當(dāng)倍頻被調(diào)節(jié)到小于默認(rèn)的33之后，I7 3960X的睿頻功能便被自動關(guān)閉，CPU主頻將被定格在當(dāng)前設(shè)置的數(shù)值上，這為我們的測試提供了便利。在極低的頻率下，Kepler構(gòu)架以及Fermi構(gòu)架分別開始了自己的表演。

在最低CPU主頻的測試中，Geforce GTX 680在通用計(jì)算測試部分表現(xiàn)出了低落的性能，其測試數(shù)值尚不及上代的Fermi構(gòu)架。而圖形測試環(huán)節(jié)，獲益于超過Fermi一倍的Texture資源，Geforce GTX 680維持住了相對Fermi的優(yōu)勢，但領(lǐng)先幅度與默認(rèn)狀態(tài)存在不小的差距。

1.6GHz，Kepler依舊不及Fermi

● 1.6G，Kepler依舊不及Fermi

我們以400MHz為單位提升CPU的主頻，當(dāng)主頻達(dá)到1.6G時我們再次進(jìn)行了測試并收集了數(shù)據(jù)，在1.6G的主頻上，Kepler與Fermi的差距不僅沒有縮小，反而被進(jìn)一步拉大了。

在1.6G的I7-3960X的驅(qū)動下，Kepler的表現(xiàn)依舊比較乏力，伴隨著處理器頻率的提升，F(xiàn)ermi構(gòu)架在CSM測試中取得了增幅要明顯大于Kepler的Geforce GTX 680。而圖形相關(guān)的測試中，Geforce GTX 680終于找回了一定的自信，在增幅上超過了GTX580。

2.0GHz，F(xiàn)ermi貼近界限

● 2.0G，F(xiàn)ermi貼近界限

伴隨著處理器頻率的進(jìn)一步提升，Geforce GTX 680終于開始了屬于自己的表演，其測試成績開始有了令人期待的加速增長態(tài)勢。

2G的SNB-E處理器成功地阻止了Kepler與Fermi構(gòu)架之間通用計(jì)算性能差距的進(jìn)一步擴(kuò)大，不僅CSM測試Geforce GTX 680穩(wěn)定住了與Geforce GTX 580之間的差距，在Fluid測試中Geforce GTX 680更是完成了對GTX580的超越。圖形測試部分，Geforce GTX 680同樣維持了更高的性能增長率，而GTX580則逐步貼近了默認(rèn)性能界限。

2.4GHz，Kepler性能增速提升

● 2.4G，Kepler性能增速提升

當(dāng)主頻來到2.4G時，Kepler構(gòu)架終于開始了屬于自己的表演，在測試中表現(xiàn)出了更加明顯的性能提升，并基本上完成了對Fermi的完全超越。

在2.4G的處理器頻率下，Geforce GTX 680在CSM測試中達(dá)到了與GTX580相同的測試結(jié)果，而其他的所有測試項(xiàng)目中GTX680均表現(xiàn)出了更高的性能。

2.8GHz，F(xiàn)ermi已達(dá)極限

● 2.8G，F(xiàn)ermi已達(dá)極限

當(dāng)頻率被提升到2.8G時，我們的測試進(jìn)行到了一個冰火兩重天的狀態(tài)。一方面Kepler的性能依舊在維持著幾乎線性的增長，另一方面的Fermi的性能則進(jìn)入了滯漲的狀態(tài)。

在2.8G的測試中，Geforce GTX 580無論是圖形性能還是通用計(jì)算性能都已經(jīng)增長到了界限，當(dāng)前的成績與我們所進(jìn)行的公測以及后續(xù)測試中所展現(xiàn)出來的默認(rèn)成績均一無二致，這表明Geforce GTX 580已經(jīng)達(dá)到了其理論性能的界限，接下來所發(fā)生的一切事情，都不是由處理器依賴性所決定的了。

3.2GHz，Kepler依舊維持增長

● 3.2G，Kepler依舊維持增長

當(dāng)頻率進(jìn)一步提升到貼近I7-3960X的默認(rèn)狀態(tài)時，F(xiàn)ermi構(gòu)架的性能已經(jīng)停止了增長，但Kepler構(gòu)架卻依舊維持著旺盛的性能增長狀態(tài)。

3Dmark 11 P模式測試

3Dmark 11 X模式測試

CSM測試

Fluid測試

在3.2G的測試中，Geforce GTX 680在所有的測試環(huán)節(jié)均完全超越了Geforce GTX 580，領(lǐng)先幅度基本上達(dá)到了公測階段默認(rèn)處理器頻率下所收集到的級別。

在這些頻率上，我們都遇到了什么？

● 在這些頻率上，我們都遇到了什么？

前面的測試結(jié)果收集都是以特定頻率為階段進(jìn)行的，將他們割裂的進(jìn)行分析會令人很難產(chǎn)生處理器對GPU性能影響的完整印象，所以我們將這些結(jié)果進(jìn)行收集并按測試項(xiàng)目分別制成了曲線圖，接下來就讓我們來看一看處理器頻率究竟對Geforce GTX 680以及Geforce GTX 580產(chǎn)生了怎樣的影響吧。

3Dmark 11的P模式測試大幅削減了材質(zhì)以及后端輸出的需求，因此負(fù)載更加偏向于shader的執(zhí)行也就是ALU的動作效率，在P模式的測試中，伴隨著處理器頻率的提升，Geforce GTX 680表現(xiàn)出了高于Geforce GTX 580的性能增長速度，這表明Geforce GTX 680的效率比Geforce GTX 580更加依賴于處理器的性能表現(xiàn)。

X模式的3Dmark 11擁有極高的材質(zhì)以及shader吞吐壓力，同時后端也必須面對諸如抗鋸齒之類應(yīng)用所帶來的負(fù)荷。在這些“干擾因素”的作用下，Geforce GTX 680與GGeforce GTX 580的處理器依賴性表現(xiàn)得并不明顯，但兩者仍舊隨著處理器頻率的增加而獲得了性能的提升。

CSM的測試結(jié)果一定會出乎不少人的意料，在較低的處理器頻率下，Geforce GTX 580竟然完成了對Geforce GTX 680的性能超越，這種超越在處理器主頻達(dá)到2G之后才有所緩解，當(dāng)處理器頻率超過2.4G之后，Geforce GTX 680顯然從處理器的頻率提升中獲得了更多的好處。

Fluid simulation測試的結(jié)果在趨勢上與CSM類似，在處理器性能低落時Geforce GTX 580要比Geforce GTX 680更快，這種情況直到處理器頻率達(dá)到2G之后才得到了緩解，而伴隨著處理器頻率以及性能的提升，GTX680獲得了始終呈線性狀態(tài)良好增長的性能曲線。

為了黑科技，買一顆好處理器吧少年

● 為了黑科技，買一顆好處理器吧少年

測試結(jié)果既出乎意料卻又在情理之中。伴隨著我們使用的3960X主頻的提升，無論是圖形測試還是通用計(jì)算測試，Geforce GTX 680均表現(xiàn)出了比Geforce GTX 580更明顯的性能延展性，性能提升幅度要明顯好于后者并且直到測試結(jié)束都維持著幾乎現(xiàn)行的性能延伸，但這句結(jié)論在這里并不是全然意義上的正面描述。這樣的測試結(jié)果，充分證明了Geforce GTX 680有著比上代Fermi構(gòu)架的Geforce GTX 580更強(qiáng)烈的處理器依賴性。

在兩項(xiàng)通用計(jì)算性能測試中，Geforce GTX 680在處理器低頻狀態(tài)下均敗給了上代的Geforce GTX 580，而伴隨著頻率的提升，GTX680的各項(xiàng)性能均呈現(xiàn)出完全的線性增長，最終直到處理器默認(rèn)頻率狀態(tài)下這種增長仍然沒有停止。這不僅佐證了GTX680更加強(qiáng)烈的依賴性，更為國內(nèi)外各大媒體在GTX680首測期間所提供的趨勢相同但細(xì)節(jié)迥異的測試結(jié)果提供了解釋——目前我們所接觸到的處理器默認(rèn)狀態(tài)，尚不足以完全發(fā)揮出Geforce GTX 680全部的性能。

對于Geforce GTX 680的用戶來說，一款強(qiáng)勁的處理器是絕對必要的，它可以讓Geforce GTX 680表現(xiàn)出“應(yīng)有”的性能。根據(jù)目前的測試結(jié)果來看，我們甚至建議用戶保證I7-3960X這樣檔次的處理器，最起碼要保證處理器在超頻狀態(tài)下具有與3.3G的SNB-E處理器相近的性能水準(zhǔn)。只有這樣的處理器性能，只有這樣才能夠保證Geforce GTX 680在圖形及通用計(jì)算應(yīng)用的絕大部分場合的正常發(fā)揮。而對于Geforce GTX 580的用戶來說，這一限制被放寬到了一個較低的性能等級上，只要你的處理器比2.8G的SNB-E更快，那么你手頭的Geforce GTX 580將在大多數(shù)場合發(fā)揮除正常的性能。

早在Geforce GTX 680的首發(fā)測試中，我們就曾經(jīng)對GK104身上出現(xiàn)的諸多“黑科技”進(jìn)行過初步的探討。在這些黑科技中，最引人注目的部分便來自Scheduling過程的巨大變革，它不僅是Geforce GTX 680目前所表現(xiàn)出來的強(qiáng)烈的處理器依賴性的主因，更是Kepler構(gòu)架中一系列重大變化，如SMX單元以及更高每瓦特性能等出現(xiàn)的重要原因。今天的測試除了向讀者們表明Geforce GTX 680需要強(qiáng)勁的處理器才能發(fā)揮應(yīng)有性能之外，更重要的意義在于為我們即將到來的關(guān)于GK104黑科技的解密過程提供討論的依據(jù)。

在接下來的文章中，我們將會對GK104全新的Scheduling過程所具備的特點(diǎn)、出現(xiàn)的原因以及對當(dāng)前以及未來所產(chǎn)生的影響進(jìn)行詳細(xì)的討論。如果你是一個希望更多更全面的了解Kepler以及未來NVIDIA GPU設(shè)計(jì)細(xì)節(jié)和發(fā)展方向的讀者，那么接下來的文章將是你不容錯過的。Kepler的黑科技正在我們的拷問之下初步顯現(xiàn)出更多的細(xì)節(jié)，敬請期待我們對這些黑科技的全面展示吧。

返回投影機(jī)頻道首頁