巔峰之作 4GB顯存GTX680四星大將評(píng)測(cè)

來源:泡泡網(wǎng) 更新日期:2012-05-06 作者:佚名

突破1GHz GTX680參數(shù)規(guī)格一覽

    NVIDIA的GPU從G80時(shí)代開始,其MIMD(多指令多數(shù)據(jù)流)一直以高效能而著稱,但也存在一個(gè)讓人頭疼的問題——GPU流處理器數(shù)量較少、浮點(diǎn)運(yùn)算能力太低,這同樣限制了N卡在游戲以及計(jì)算方面的實(shí)際性能。

    這種情況在GTX680發(fā)布之時(shí)終于得以終結(jié),每個(gè)SM流處理器數(shù)量從GTX580的32個(gè)猛增到192個(gè),共計(jì)1536個(gè)流處理器和HD6970相同! 流處理器與核心同頻率,不再是兩倍。這些大刀闊斧的改進(jìn)讓GK104的浮點(diǎn)運(yùn)算能力翻番,性能也凌駕于HD7970之上!

    現(xiàn)在NVIDIA的Geforce GTX680正式發(fā)布還不到一個(gè)月,影馳便推出了4GB顯存的非公版產(chǎn)品——GTX680四星大將。影馳GTX680四星大將不僅顯存翻倍,而且擁有 1110MHZ的基礎(chǔ)核心頻率,動(dòng)態(tài)加速可高達(dá)1162MHZ,如此強(qiáng)大的規(guī)格能帶來什么樣的性能?小編這就帶大家來體驗(yàn)這塊4GB顯存的卡皇!

    突破1GHz,GTX680參數(shù)規(guī)格一覽

    是時(shí)候揭開GTX680的真面目了,我們先來看看它的規(guī)格參數(shù):

    使用“開普勒”核心的NVIDIA GEFORCE GTX680擁有1536個(gè)CUDA核心,默認(rèn)頻率1006MHz,加速頻率為1058MHz,配備2GB 256Bit GDDR5、6000MHz頻率的顯存,外接供電為雙6Pin,熱設(shè)計(jì)功耗為195W,顯示輸出接口為2個(gè)Dual-Link DVI、1個(gè)HDMI和1個(gè)Displayport 1.2。

    GTX680與GTX580、HD7970、HD6970的對(duì)比表格:

    GTX680采用全新28納米制造工藝,與NVIDIA上代旗艦GTX580相比,CUDA核心數(shù)量暴增至1536個(gè),核心頻率飆升至1006MHz,成 為首款默認(rèn)核心頻率超過1GHz的旗艦級(jí)顯卡。而令人吃驚的是,晶體管數(shù)量和核心面積卻都有所減少,遠(yuǎn)遠(yuǎn)低于GTX580和HD7970,這樣一來供電方 面僅需要雙6Pin外接PCI-E供電,熱設(shè)計(jì)功耗也僅有195W,成為近年來最為省電的旗艦顯卡。顯存方面,GTX680采用了256Bit GDDR5,而顯存頻率大幅提高,達(dá)到了創(chuàng)紀(jì)錄的6000MHz。此外,這次GEFORCE GTX680可以支持4屏顯示,在顯示接口的配備上也有所改進(jìn),將使用多年的DVIx2+MiniHDMI的組合改為DVIx2+HDMI+DP。

開普勒之架構(gòu):流處理器暴增之謎

   

    基于效能和計(jì)算能力方面的考慮,NVIDIA與AMD不約而同的改變了架構(gòu),NVIDIA雖然還是采用SIMT架構(gòu),但也借鑒了AMD“較老”的SIMD 架構(gòu)之作法,降低控制邏輯單元和指令發(fā)射器的比例,用較少的邏輯單元去控制更多的CUDA核心。于是一組SM當(dāng)中容納了192個(gè)核心的壯舉就變成了現(xiàn)實(shí)!

    通過上面這個(gè)示意圖就看的很清楚了,CUDA核心的縮小主要?dú)w功于28nm工藝的使用,而如此之多的CUDA核心,與之搭配的控制邏輯單元面積反而縮小了,NVIDIA強(qiáng)化運(yùn)算單元削減控制單元的意圖就很明顯了。

    此時(shí)相信有人會(huì)問,降低控制單元的比例那是不是意味著NVIDIA賴以成名的高效率架構(gòu)將會(huì)一去不復(fù)返了?理論上來說效率肯定會(huì)有損失,但實(shí)際上并沒有想 象中的那么嚴(yán)重。NVIDIA發(fā)現(xiàn)線程的調(diào)度有一定的規(guī)律性,編譯器所發(fā)出的條件指令可以被預(yù)測(cè)到,此前這部分工作是由專門的硬件單元來完成的,而現(xiàn)在可 以用簡(jiǎn)單的程序來取代,這樣就能節(jié)約不少的晶體管。

    隨意在開普勒中NVIDIA將一大部分指令派發(fā)和控制的操作交給了軟件(驅(qū)動(dòng))來處理。而且GPU的架構(gòu)并沒有本質(zhì)上的改變,只是結(jié)構(gòu)和規(guī)模以及控制方式 發(fā)生了變化,只要驅(qū)動(dòng)支持到位,與游戲開發(fā)商保持緊密的合作,效率損失必然會(huì)降到最低——事實(shí)上NVIDIA著名的The Way策略就是干這一行的!

    這方面NVIDIA與AMD的思路和目的是相同的,但最終體現(xiàn)在架構(gòu)上還是有所區(qū)別。NVIDIA的架構(gòu)被稱為SIMT(Single Instruction Multiple Threads,單指令多線程),NVIDIA并不像AMD那樣把多少個(gè)運(yùn)算單元捆綁為一組,而是以線程為單位自由分配,控制邏輯單元會(huì)根據(jù)線程的任務(wù)量 和SM內(nèi)部CUDA運(yùn)算單元的負(fù)載來決定調(diào)動(dòng)多少個(gè)CUDA核心進(jìn)行計(jì)算,這一過程完全是動(dòng)態(tài)的。

    但不可忽視的是,軟件預(yù)解碼雖然大大節(jié)約了GPU的晶體管開銷,讓流處理器數(shù)量和運(yùn)算能力大增,但對(duì)驅(qū)動(dòng)和游戲優(yōu)化提出了更高的要求,這種情況伴隨著AMD度過了好多年,現(xiàn)在NVIDIA也要面對(duì)相同的問題了,希望他能做得更好一些。

開普勒之核心:SMX與SM的改動(dòng)細(xì)節(jié)

   

    全新的Kepler相比上代的Fermi架構(gòu)改變了什么,看架構(gòu)圖就很清楚了:

    GK104相比GF110,整體架構(gòu)沒有大的改變,GPU(圖形處理器集群)維持4個(gè),顯存控制器從6個(gè)64bit(384bit)減至4個(gè)64bit(256bit),總線接口升級(jí)至PCIE 3.0。剩下的就是SM方面的改變了:

    這里之所以要把GF104這顆中端核心的SM架構(gòu)圖也列出來,是因?yàn)镚F104相比高端的GF100核心做了一些細(xì)小的改動(dòng),這些改動(dòng)也被沿用到了GK104當(dāng)中。另外從核心代號(hào)上來看,GK104其實(shí)就是用來取代GF104的,而取代GF100的核心另有他人。

    NVIDIA把GK104的SM(不可分割的流處理器集群)稱為SMX,原因就是暴增的CUDA核心數(shù)量。但實(shí)際上其結(jié)構(gòu)與上代的SM沒有本質(zhì)區(qū)別,不同的只是各部分單元的數(shù)量和比例而已。具體的區(qū)別逐個(gè)列出來進(jìn)行對(duì)比:

    1. NVIDIA現(xiàn)在把流處理器稱為CUDA核心;

    2. SFU(Special Function Units,特殊功能單元)是比CUDA核心更強(qiáng)的額外運(yùn)算單元,可用于執(zhí)行抽象的指令,例如正弦、余弦、倒數(shù)和平方根,圖形插值指令也在SFU上執(zhí)行;

    3. Warp是并行線程調(diào)度器,每一個(gè)Warp都可以調(diào)度SM內(nèi)部的所有CUDA核心或者SFU;

    4. Dispatch Unit是指令分派單元,分則將Warp線程中的指令按照順序和相關(guān)性分配給不同的CUDA核心或SFU處理;

    5. LD/ST就是載入/存儲(chǔ)單元,可以為每個(gè)線程存儲(chǔ)運(yùn)算源地址與路徑,方便隨時(shí)隨地的從緩存或顯存中存取數(shù)據(jù);

    6. TMU是紋理單元,用來處理紋理和陰影貼圖、屏幕空間環(huán)境光遮蔽等圖形后期處理;

    通過以上數(shù)據(jù)對(duì)比不難看出,GK104暴力增加CUDA核心數(shù)量的同時(shí),SFU和TMU這兩個(gè)與圖形或計(jì)算息息相關(guān)處理單元也同比增加,但是指令分配單元 和線程調(diào)度器還有載入/存儲(chǔ)單元的占比都減半了。這也就是前文中提到過的削減邏輯控制單元的策略,此時(shí)如何保證把指令和線程填滿一個(gè)CUDA核心,將是一 個(gè)難題。

非公版做工超強(qiáng)

   

    影馳GTX680四星大將顯卡依然是我們熟悉的風(fēng)格:藍(lán)色PCB加上銀白色的雙風(fēng)扇散熱器。

    相比NVIDIA公版的GTX680使用的雙6PIN電源接口,影馳GTX680四星大將使用了6PIN+8PIN電源接口,可以提供更大的功率是GPU穩(wěn)定運(yùn)行在更高的頻率之上。

    由于影馳GTX680四星大將使用了4GB的顯存,所以背面也布滿了顯存顆粒。頻率同公版GTX680保持一致,為6008MHZ。

    對(duì)于超頻玩家來說,每一相供電都是壓榨顯卡性能的重要配備,而影馳 GeForce GTX680 四星大將配備了5相核心供電,total power輸入由原來的150w飆升到225w,比公版更強(qiáng)。

    采用了Direct FET MOSFET,其電流輸入輸出高達(dá)40A且轉(zhuǎn)換效率高達(dá)89.09%比起公版GTX680所采用的八爪魚MOSFET擁有更卓越的性能、更酷冷的溫度。配合5相核心供電,能為GPU提供強(qiáng)大的電流支持。

    影馳GeForce GTX680 四星大將采用了新一代的雙子星散熱器,其散熱器TDP設(shè)計(jì)高達(dá)250W,大大高于公版的225W設(shè)計(jì)。而配合其供電相數(shù)、供電能力,將顯卡每一分的能耗性能壓榨至極限。

    DIYER一直強(qiáng)調(diào)個(gè)性身份,而影馳GeForce GTX680 四星大將采用了LED設(shè)計(jì),更加炫麗,燈光效果更加更顯DIY個(gè)性。

測(cè)試平臺(tái)簡(jiǎn)介:3960X+X79

   

    測(cè)試平臺(tái)我們使用目前性能最強(qiáng)勁的intel i7 3960X處理器,配合強(qiáng)大的技嘉X79UD7主板。

    3960X CPU默認(rèn)頻率高達(dá)3.3GHZ,擁有6核心12線程,同時(shí)可以提供原生的PCI-E3.0總線,不會(huì)對(duì)GTX680造成總線上的瓶頸。

性能測(cè)試及總結(jié)

   

    通過與公版GTX680的對(duì)比我們發(fā)現(xiàn)在功耗增加不多的情況下影馳GTX680四星大將的性能較公版產(chǎn)品提高13.60%。尤其是吃顯存的地鐵2033提升尤為明顯,達(dá)到了28%的性能提升。

    總結(jié):集成兩個(gè)雙通道DVI 完整尺寸的HDMI DP接口,并且首度支持4屏是GTX680的一大優(yōu)勢(shì)。但公版2GB的顯存容量顯然不是喜歡多屏和超高分辨游戲玩家的最佳選擇。影馳GTX680四星大將的誕生為這些頂級(jí)玩家提供了方便。

    而公版GTX680超頻會(huì)有著TDP以及默認(rèn)頻率的限制,GTX680四星大將通過魔盤K可以將顯卡最大TDP限制調(diào)高,讓TDP限制不再是限制顯卡頻率 提升的瓶頸,再通過魔盤設(shè)置提升動(dòng)態(tài)超頻幅度,輕松讓顯卡運(yùn)行在默認(rèn)設(shè)定更高的頻率下。而即使不超頻,四星大將基礎(chǔ)核心頻率也達(dá)到了1110MHZ,動(dòng)態(tài) 提速核心頻率更是達(dá)到了史無前例的1162MHZ,這對(duì)于追求高性能的極限玩家來說無疑非常具有吸引力。

廣告聯(lián)系:010-82755684 | 010-82755685 手機(jī)版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時(shí)代網(wǎng) 版權(quán)所有 關(guān)于投影時(shí)代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁(yè) 網(wǎng)友評(píng)論 返回頂部 建議反饋
快速評(píng)論
驗(yàn)證碼: 看不清?點(diǎn)一下
發(fā)表評(píng)論