GTX560的優(yōu)秀表現(xiàn)大家還歷歷在目,大幅加強(qiáng)的CUDA、紋理單元讓GF114技驚四座,千元之上無人能出其 右,甚至威脅到了2000元價位的HD6900。之前風(fēng)光無限的A卡產(chǎn)品線一夜之間風(fēng)雨飄搖。GF114核心相比較GF104核心,借助成熟的工藝再度優(yōu) 化,性能繼續(xù)攀升,但較高的成本注定了它不再平凡的定位。市售GTX560基本定位在1300元左右。超出了部分玩家的心理價位
隨著GTX460功成身退慢慢淡出市場,千元關(guān)口亟待一款強(qiáng)有力的產(chǎn)品支撐,GTX560高昂的成本顯然無法屈尊降貴,而較之GTX560Ti規(guī)格減半的GTX550Ti也是不堪重任?眼看GTX460后繼無人,競爭對手心中竊喜。
誰也沒有想到在GTX550Ti甚至GT520之后,NVIDIA最后亮出了王牌,大家望眼欲穿的性價比接班人在最不可能的時候壓軸登場!此時大家終于明白GTX560為何高高在上,GTX550Ti為何落差巨大了……
兩年前NVIDIA Fermi核心的技術(shù)文檔大家看的津津有味,但是現(xiàn)在如果拿出來再寫一遍估計大家要拍磚了,的確從DX11 API發(fā)布以來,每逢NVIDIA新品發(fā)布,我們總是不厭其煩的介紹一遍。在好吃的東西也架不住天天頓頓,再好的東西天天拿出來說大家也就煩了。前不久的 文章中,《決戰(zhàn)性能之巔!NV雙芯旗艦GTX590評測》80頁的評測中大段完備的核心架構(gòu)和Direct 11 API介紹,我就不貼過來了,還沒看的朋友不要錯過哦。
想必大家現(xiàn)在最關(guān)心的就是這款顯卡的規(guī)格和性能了,下面我們直接步入主題!
核心故事:GF114核心的前身GF100/104
可能看過之前新聞的朋友已經(jīng)知道,這GTX 560SE和師兄GTX560所用的GF114核心,是GF104核心的完整版,很多地方兩者其實(shí)沒有差別。
GF114的前世:GF104
在GF104(GTX460)發(fā)布之前,大家都以為NVIDIA會把GF100核心的主要規(guī)格全部減半,從而制造出一顆擁有256SP 256Bit的主流核心。事實(shí)上之前國內(nèi)外的媒體都是這樣猜測的,因?yàn)镚F100模塊化四核心的設(shè)計,很容易將其“拆分為”規(guī)模大小不一的中低端核心:
但NVIDIA卻沒有這樣做,最終GF104核心的規(guī)模出乎所有人的預(yù)料!如上圖所示,GF104核心并非是GF100一半的規(guī)格,NVIDIA在微觀架構(gòu)方面做了不小的改動,那NVIDIA為什么要這樣做呢?
GF100更適合做并行計算、GF104/114更適合做圖形處理
相信細(xì)心的讀者已經(jīng)看出來了,GF104/114相比GF100,最主要改變就是GPC(圖形處理器集群)從4個減至2個,顯存控制器從6個64bit(共384bit)減至4個64bit(共256bit),而最最重要的改變就是——每組SM當(dāng)中的CUDA核心數(shù)量從32個增至48個。
我們知道,對GPU性能影響最大的模塊就是流處理器(CUDA核心),如果能在GPU內(nèi)部盡可能多的塞入CUDA核心的話,性能方面就會有很大的提升。但是CUDA核心也會消耗不少的晶體管,如果晶體管數(shù)太過龐大的話,GPU制造成本、良品率、功耗、發(fā)熱也會受到較大影響。
大家可以注意看GF100芯片透視圖,其中間位置有1/3的面積,這些是GF100一體式的二級緩存。NVIDIA為了提升GPU并行計算的效率,像 CPU那樣不惜成本的設(shè)計了大容量L2。L2對于性能的貢獻(xiàn)主要集中在密集型計算任務(wù)當(dāng)中,而對于普通的圖形渲染來說,貢獻(xiàn)就非常小了。那么如果將這些 L2的容量進(jìn)一步壓縮,把節(jié)約出來的晶體管都變成CUDA核心的話,那么圖形渲染性能將會得到顯著提升。
于是,擁有較小L2、較多CUDA核心的GF104就誕生了,新核心每組SM中包含CUDA核心的數(shù)量從32個增至48個,增加了50%,流處理器總數(shù)達(dá) 到了384個。NVIDIA在晶體管數(shù)一定的情況下,通過優(yōu)化核心與緩存的配比,制造出了一顆更適合做圖形處理的核心。
每組SM當(dāng)中的紋理單元數(shù)量從4個增至8個
當(dāng)然,NVIDIA也沒有單純增加CUDA核心的數(shù)量,針對新游戲的發(fā)展方向,GF104/114也做了較大的改進(jìn)——紋理單元數(shù)量加倍!
GF100核心的每組SM當(dāng)中擁有32個CUDA核心,還包括了4個紋理單元,這樣GF100總共就擁有64個紋理單元(GTX480屏蔽了一組是60 個),少于Cypress的80個紋理單元。而API步入到DX10、11之后,游戲紋理貼圖的大小爆發(fā)式增長,這樣一來相對較少的紋理單元使得 GTX400系列在大量使用了紋理貼圖的游戲中難以發(fā)揮全部實(shí)力,如《孤島危機(jī)》。
GF104/114核心只有8組SM,如果還是保持GF100的設(shè)計不變,那么紋理單元將只有32個,還沒有HD5770多(40個)。所以NVIDIA 對紋理單元部分也做了改良,每組SM中的數(shù)量直接加倍,最終GF104/114擁有64個紋理單元,與GF100相等!
CUDA核心數(shù)量增加了50%,而紋理單元增加了100%,偏向圖形處理的改進(jìn)意圖顯而易見。這些改進(jìn)注定GTX460就是一款為新游戲而生的顯卡。