● Tahiti is a Wicked Game
Pitcairn向我們展現(xiàn)了一個(gè)幾乎完美的GCN體系構(gòu)架,同時(shí)也將Tahiti的問題一并擺在了我們的面前。相比于Tahiti,同樣基于GCN體系且擁有雙ACE的Pitcairn擁有高出許多的等效線程密度,單元復(fù)用率以及由此帶來的相當(dāng)不錯(cuò)的shader性能。它以小得多的規(guī)模和功耗,實(shí)現(xiàn)了遠(yuǎn)遠(yuǎn)超過Tahiti的性能密度和延展性。如果不是總規(guī)模限制帶來的材質(zhì)資源不足,HD7800的絕對(duì)性能甚至應(yīng)該可以完全追上甚至超越HD7970,因此能夠擁有現(xiàn)在這樣向上壓迫HD7950的表現(xiàn),自然也就不足為奇了。
那么,我們的問題就來了——既然Pitcairn無論運(yùn)算還是圖形效率都明顯要好于Tahiti,AMD為什么不以Pitcairn為基礎(chǔ)維持比例對(duì)其進(jìn)行放大,而是弄出了Tahiti這樣一個(gè)存在效率問題,無論等效線程密度還是等效緩沖密度都不出眾的旗艦級(jí)構(gòu)架呢?今天這樣的測(cè)試結(jié)果我們可以收集到,AMD性能實(shí)驗(yàn)室同樣也可以收集到而且應(yīng)該做的更好,我們甚至敢斷言它們?cè)跇?gòu)架凝固之前的模擬階段就應(yīng)該已經(jīng)獲得了與我們測(cè)試類似的結(jié)果,但它們卻為何沒有對(duì)Tahiti構(gòu)架提出任何有效的預(yù)警或者干預(yù)呢?
對(duì)HPC市場(chǎng)的渴望,D線,勝利工程,這三者以及更多其它問題的共同作用,導(dǎo)致了今天我們所見到的Tahiti的狀態(tài)。
基于GPGPU應(yīng)用的HPC市場(chǎng)一直是AMD可望而不可及的,無論R600、R700、Evengreen還是Cayman,它們身上都有太多不適合HPC應(yīng)用的構(gòu)架級(jí)問題。因此在Tahiti研制之初,AMD便致力于修補(bǔ)來自通用計(jì)算性能和效率層面的諸多既往設(shè)計(jì)缺陷。但這種認(rèn)知依舊沒有脫離AMD對(duì)原教旨GPGPU理解的失當(dāng)。AMD對(duì)HPC市場(chǎng)較為敏感的雙精度參數(shù)的盲從,將Tahiti拖入了晶體管消耗的漩渦之中。在D線的壓力下,AMD手上能夠支配的芯片面積以及晶體管數(shù)量并不富裕,這部分晶體管還要被拿來滿足更傾向于宣傳的DP吞吐數(shù)據(jù),這直接導(dǎo)致了Tahiti構(gòu)架沒有了可以用來擴(kuò)充緩沖資源以及ACE等線程密度和并行度相關(guān)的資本,進(jìn)而造就了如今HD7900尤其是HD7970那無法令人滿意的單元復(fù)用率和絕對(duì)性能。
具體來說,如果維持雙ACE以及目前的緩沖密度不變,Tahiti完全可以以1536個(gè)Vector ALU的規(guī)模來換取更好的線程和緩沖密度,但這并不利于平衡吞吐尤其是DP吞吐與頻率/良率之間的關(guān)系,D線的橫亙又讓AMD失去了在維持2048 Vector ALU以及1/4 DP性能目標(biāo)的前提下實(shí)現(xiàn)四ACE并行以及使用更大容量緩沖的可能。所以,Tahiti只得在構(gòu)架上選擇優(yōu)先達(dá)成吞吐目標(biāo),進(jìn)而也就只得接受較低的線程密度以及并不令人滿意的單元復(fù)用率了。
在此基礎(chǔ)上,AMD性能實(shí)驗(yàn)室并未對(duì)其所面對(duì)的各種搭配失當(dāng)?shù)膯栴}作出必要的預(yù)警和干預(yù),由于羅瑞德主推的勝利工程,包括Godfrey Cheng(All In Wonder顯卡之父,AMD性能實(shí)驗(yàn)室主管)在內(nèi)的諸多高管以及員工的離職影響了AMD性能實(shí)驗(yàn)室的運(yùn)作,這使得了AMD的構(gòu)架決策團(tuán)隊(duì)失去了重要的參考依據(jù)。于是,我們所見到的Tahiti也就成了今天的樣子,充滿了改進(jìn)以及對(duì)未來的美好憧憬,但卻帶來了更多全新的麻煩和錯(cuò)誤……
Wicked Game可以被翻譯成帶有“曖昧”意味的危險(xiǎn)游戲,用這個(gè)詞來形容Tahiti以及目前正在熱切宣傳本質(zhì)上其實(shí)并不出眾通用計(jì)算能力的AMD,應(yīng)該是比較恰當(dāng)?shù)摹ahiti的圖形性能以及運(yùn)算性能都沒有想象中那樣優(yōu)秀,無論對(duì)于HPC市場(chǎng)還是民用顯示市場(chǎng)來說,其并不算高的單元復(fù)用率以及效率都讓AMD目前的宣傳和運(yùn)作有了成為雙刃劍的可能。
對(duì)于底層構(gòu)架乃至公司運(yùn)作過程的剖析看似與常規(guī)用戶非常遙遠(yuǎn),但正是這種剖析為我們提供了更多尋找優(yōu)秀的或者更加適合我們的顯卡產(chǎn)品的依據(jù)。以目前的情況來看,HD7800顯然對(duì)大多數(shù)人來說都是更值得選擇的產(chǎn)品。Pitcairn提供的優(yōu)秀基礎(chǔ)令其擁有了GCN體系中最佳的性能密度和效率,它的性價(jià)比、性能規(guī)模比以及性能功耗比均遠(yuǎn)高于HD7900系列,其默認(rèn)絕對(duì)性能更是可以對(duì)HD7950造成極大的壓迫。不管這種壓迫因何而起,從產(chǎn)品的角度出發(fā)來看,HD7800都是一款更優(yōu)秀的顯卡。我們期待AMD能夠盡快將HD7800的售價(jià)調(diào)整到適宜它的位置,這不僅對(duì)消費(fèi)者更加有利,同時(shí)也可以帶來更好的芯片出貨量,是一個(gè)雙贏的優(yōu)秀選擇。