巔峰之作 4GB顯存GTX680四星大將評測

來源：泡泡網(wǎng)　更新日期：2012-05-06 作者：佚名

商顯市場最大的看點何在年度評選盛典獲獎揭曉 Infocomm China 深入報道

本文導(dǎo)航

第1頁：突破1GHz GTX680參數(shù)規(guī)格一覽
第3頁：開普勒之核心：SMX與SM的改動細(xì)節(jié)
第5頁：測試平臺簡介：3960X+X79

第2頁：開普勒之架構(gòu)：流處理器暴增之謎
第4頁：非公版做工超強(qiáng)
第6頁：性能測試及總結(jié)

返回分頁閱讀文章

突破1GHz GTX680參數(shù)規(guī)格一覽

NVIDIA的GPU從G80時代開始，其MIMD(多指令多數(shù)據(jù)流)一直以高效能而著稱，但也存在一個讓人頭疼的問題——GPU流處理器數(shù)量較少、浮點運算能力太低，這同樣限制了N卡在游戲以及計算方面的實際性能。

這種情況在GTX680發(fā)布之時終于得以終結(jié)，每個SM流處理器數(shù)量從GTX580的32個猛增到192個，共計1536個流處理器和HD6970相同！流處理器與核心同頻率，不再是兩倍。這些大刀闊斧的改進(jìn)讓GK104的浮點運算能力翻番，性能也凌駕于HD7970之上！

現(xiàn)在NVIDIA的Geforce GTX680正式發(fā)布還不到一個月，影馳便推出了4GB顯存的非公版產(chǎn)品——GTX680四星大將。影馳GTX680四星大將不僅顯存翻倍，而且擁有 1110MHZ的基礎(chǔ)核心頻率，動態(tài)加速可高達(dá)1162MHZ，如此強(qiáng)大的規(guī)格能帶來什么樣的性能？小編這就帶大家來體驗這塊4GB顯存的卡皇！

突破1GHz，GTX680參數(shù)規(guī)格一覽

是時候揭開GTX680的真面目了，我們先來看看它的規(guī)格參數(shù)：

使用“開普勒”核心的NVIDIA GEFORCE GTX680擁有1536個CUDA核心，默認(rèn)頻率1006MHz，加速頻率為1058MHz，配備2GB 256Bit GDDR5、6000MHz頻率的顯存，外接供電為雙6Pin，熱設(shè)計功耗為195W，顯示輸出接口為2個Dual-Link DVI、1個HDMI和1個Displayport 1.2。

GTX680與GTX580、HD7970、HD6970的對比表格：

GTX680采用全新28納米制造工藝，與NVIDIA上代旗艦GTX580相比，CUDA核心數(shù)量暴增至1536個，核心頻率飆升至1006MHz，成為首款默認(rèn)核心頻率超過1GHz的旗艦級顯卡。而令人吃驚的是，晶體管數(shù)量和核心面積卻都有所減少，遠(yuǎn)遠(yuǎn)低于GTX580和HD7970，這樣一來供電方面僅需要雙6Pin外接PCI-E供電，熱設(shè)計功耗也僅有195W，成為近年來最為省電的旗艦顯卡。顯存方面，GTX680采用了256Bit GDDR5，而顯存頻率大幅提高，達(dá)到了創(chuàng)紀(jì)錄的6000MHz。此外，這次GEFORCE GTX680可以支持4屏顯示，在顯示接口的配備上也有所改進(jìn)，將使用多年的DVIx2+MiniHDMI的組合改為DVIx2+HDMI+DP。

開普勒之架構(gòu)：流處理器暴增之謎

基于效能和計算能力方面的考慮，NVIDIA與AMD不約而同的改變了架構(gòu)，NVIDIA雖然還是采用SIMT架構(gòu)，但也借鑒了AMD“較老”的SIMD 架構(gòu)之作法，降低控制邏輯單元和指令發(fā)射器的比例，用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當(dāng)中容納了192個核心的壯舉就變成了現(xiàn)實！

通過上面這個示意圖就看的很清楚了，CUDA核心的縮小主要歸功于28nm工藝的使用，而如此之多的CUDA核心，與之搭配的控制邏輯單元面積反而縮小了，NVIDIA強(qiáng)化運算單元削減控制單元的意圖就很明顯了。

此時相信有人會問，降低控制單元的比例那是不是意味著NVIDIA賴以成名的高效率架構(gòu)將會一去不復(fù)返了？理論上來說效率肯定會有損失，但實際上并沒有想象中的那么嚴(yán)重。NVIDIA發(fā)現(xiàn)線程的調(diào)度有一定的規(guī)律性，編譯器所發(fā)出的條件指令可以被預(yù)測到，此前這部分工作是由專門的硬件單元來完成的，而現(xiàn)在可以用簡單的程序來取代，這樣就能節(jié)約不少的晶體管。

隨意在開普勒中NVIDIA將一大部分指令派發(fā)和控制的操作交給了軟件(驅(qū)動)來處理。而且GPU的架構(gòu)并沒有本質(zhì)上的改變，只是結(jié)構(gòu)和規(guī)模以及控制方式發(fā)生了變化，只要驅(qū)動支持到位，與游戲開發(fā)商保持緊密的合作，效率損失必然會降到最低——事實上NVIDIA著名的The Way策略就是干這一行的！

這方面NVIDIA與AMD的思路和目的是相同的，但最終體現(xiàn)在架構(gòu)上還是有所區(qū)別。NVIDIA的架構(gòu)被稱為SIMT(Single Instruction Multiple Threads，單指令多線程)，NVIDIA并不像AMD那樣把多少個運算單元捆綁為一組，而是以線程為單位自由分配，控制邏輯單元會根據(jù)線程的任務(wù)量和SM內(nèi)部CUDA運算單元的負(fù)載來決定調(diào)動多少個CUDA核心進(jìn)行計算，這一過程完全是動態(tài)的。

但不可忽視的是，軟件預(yù)解碼雖然大大節(jié)約了GPU的晶體管開銷，讓流處理器數(shù)量和運算能力大增，但對驅(qū)動和游戲優(yōu)化提出了更高的要求，這種情況伴隨著AMD度過了好多年，現(xiàn)在NVIDIA也要面對相同的問題了，希望他能做得更好一些。

開普勒之核心：SMX與SM的改動細(xì)節(jié)

全新的Kepler相比上代的Fermi架構(gòu)改變了什么，看架構(gòu)圖就很清楚了：

GK104相比GF110，整體架構(gòu)沒有大的改變，GPU(圖形處理器集群)維持4個，顯存控制器從6個64bit(384bit)減至4個64bit(256bit)，總線接口升級至PCIE 3.0。剩下的就是SM方面的改變了：

這里之所以要把GF104這顆中端核心的SM架構(gòu)圖也列出來，是因為GF104相比高端的GF100核心做了一些細(xì)小的改動，這些改動也被沿用到了GK104當(dāng)中。另外從核心代號上來看，GK104其實就是用來取代GF104的，而取代GF100的核心另有他人。

NVIDIA把GK104的SM(不可分割的流處理器集群)稱為SMX，原因就是暴增的CUDA核心數(shù)量。但實際上其結(jié)構(gòu)與上代的SM沒有本質(zhì)區(qū)別，不同的只是各部分單元的數(shù)量和比例而已。具體的區(qū)別逐個列出來進(jìn)行對比：

1. NVIDIA現(xiàn)在把流處理器稱為CUDA核心；

2. SFU(Special Function Units，特殊功能單元)是比CUDA核心更強(qiáng)的額外運算單元，可用于執(zhí)行抽象的指令，例如正弦、余弦、倒數(shù)和平方根，圖形插值指令也在SFU上執(zhí)行；

3. Warp是并行線程調(diào)度器，每一個Warp都可以調(diào)度SM內(nèi)部的所有CUDA核心或者SFU；

4. Dispatch Unit是指令分派單元，分則將Warp線程中的指令按照順序和相關(guān)性分配給不同的CUDA核心或SFU處理；

5. LD/ST就是載入/存儲單元，可以為每個線程存儲運算源地址與路徑，方便隨時隨地的從緩存或顯存中存取數(shù)據(jù)；

6. TMU是紋理單元，用來處理紋理和陰影貼圖、屏幕空間環(huán)境光遮蔽等圖形后期處理；

通過以上數(shù)據(jù)對比不難看出，GK104暴力增加CUDA核心數(shù)量的同時，SFU和TMU這兩個與圖形或計算息息相關(guān)處理單元也同比增加，但是指令分配單元和線程調(diào)度器還有載入/存儲單元的占比都減半了。這也就是前文中提到過的削減邏輯控制單元的策略，此時如何保證把指令和線程填滿一個CUDA核心，將是一個難題。

非公版做工超強(qiáng)

影馳GTX680四星大將顯卡依然是我們熟悉的風(fēng)格：藍(lán)色PCB加上銀白色的雙風(fēng)扇散熱器。

相比NVIDIA公版的GTX680使用的雙6PIN電源接口，影馳GTX680四星大將使用了6PIN+8PIN電源接口，可以提供更大的功率是GPU穩(wěn)定運行在更高的頻率之上。

由于影馳GTX680四星大將使用了4GB的顯存，所以背面也布滿了顯存顆粒。頻率同公版GTX680保持一致，為6008MHZ。

對于超頻玩家來說，每一相供電都是壓榨顯卡性能的重要配備，而影馳 GeForce GTX680 四星大將配備了5相核心供電，total power輸入由原來的150w飆升到225w，比公版更強(qiáng)。

采用了Direct FET MOSFET，其電流輸入輸出高達(dá)40A且轉(zhuǎn)換效率高達(dá)89.09%比起公版GTX680所采用的八爪魚MOSFET擁有更卓越的性能、更酷冷的溫度。配合5相核心供電，能為GPU提供強(qiáng)大的電流支持。

影馳GeForce GTX680 四星大將采用了新一代的雙子星散熱器，其散熱器TDP設(shè)計高達(dá)250W，大大高于公版的225W設(shè)計。而配合其供電相數(shù)、供電能力，將顯卡每一分的能耗性能壓榨至極限。

DIYER一直強(qiáng)調(diào)個性身份，而影馳GeForce GTX680 四星大將采用了LED設(shè)計，更加炫麗，燈光效果更加更顯DIY個性。

測試平臺簡介：3960X+X79

測試平臺我們使用目前性能最強(qiáng)勁的intel i7 3960X處理器，配合強(qiáng)大的技嘉X79UD7主板。

3960X CPU默認(rèn)頻率高達(dá)3.3GHZ，擁有6核心12線程，同時可以提供原生的PCI-E3.0總線，不會對GTX680造成總線上的瓶頸。

性能測試及總結(jié)

通過與公版GTX680的對比我們發(fā)現(xiàn)在功耗增加不多的情況下影馳GTX680四星大將的性能較公版產(chǎn)品提高13.60%。尤其是吃顯存的地鐵2033提升尤為明顯，達(dá)到了28%的性能提升。

總結(jié)：集成兩個雙通道DVI 完整尺寸的HDMI DP接口，并且首度支持4屏是GTX680的一大優(yōu)勢。但公版2GB的顯存容量顯然不是喜歡多屏和超高分辨游戲玩家的最佳選擇。影馳GTX680四星大將的誕生為這些頂級玩家提供了方便。

而公版GTX680超頻會有著TDP以及默認(rèn)頻率的限制，GTX680四星大將通過魔盤K可以將顯卡最大TDP限制調(diào)高，讓TDP限制不再是限制顯卡頻率提升的瓶頸，再通過魔盤設(shè)置提升動態(tài)超頻幅度，輕松讓顯卡運行在默認(rèn)設(shè)定更高的頻率下。而即使不超頻，四星大將基礎(chǔ)核心頻率也達(dá)到了1110MHZ，動態(tài) 提速核心頻率更是達(dá)到了史無前例的1162MHZ，這對于追求高性能的極限玩家來說無疑非常具有吸引力。

返回投影機(jī)頻道首頁