GPU煉金試驗(yàn)室 揭秘HD7800強(qiáng)勁性能之謎

shader靈活度測(cè)試:矩陣轉(zhuǎn)置
來(lái)源:中關(guān)村在線 更新日期:2012-04-15 作者:顧杰
內(nèi)容導(dǎo)航:  分頁(yè)瀏覽 | 全文瀏覽

shader靈活度測(cè)試:矩陣轉(zhuǎn)置

    ● shader靈活度測(cè)試:矩陣轉(zhuǎn)置

    矩陣轉(zhuǎn)置同矩陣乘法一樣,也廣泛分布在包括坐標(biāo)變換等過(guò)程在內(nèi)的大量圖形處理過(guò)程中。矩陣轉(zhuǎn)置可以被理解成矩陣沿特定方向“翻轉(zhuǎn)”之后產(chǎn)生的鏡像,這導(dǎo)致了矩陣轉(zhuǎn)置操作會(huì)涉及到大量數(shù)據(jù),比如稀疏矩陣的對(duì)角線數(shù)據(jù)等的臨時(shí)存儲(chǔ),因此矩陣轉(zhuǎn)置操作對(duì)于體系的緩沖密度是相當(dāng)敏感的。

    同矩陣乘法一樣,伴隨著頻率的不斷提升,HD7950的矩陣轉(zhuǎn)置性能提升速度較之HD7970要高出許多,兩者之間的性能差異在迅速的收窄甚至趨同。由于矩陣轉(zhuǎn)置的操作過(guò)程較之矩陣乘法更加“規(guī)整”,能夠產(chǎn)生瞬間高延遲的因素較少,因此矩陣轉(zhuǎn)置測(cè)試所得的趨勢(shì)也更加明顯和直觀。

    由于矩陣轉(zhuǎn)置對(duì)緩沖體系的敏感,緩沖密度相同但總量更少的Pitcairn在這項(xiàng)測(cè)試中遇到了不小的問(wèn)題,不足以應(yīng)對(duì)測(cè)試需求的緩沖體系導(dǎo)致了大量的訪存過(guò)程,這直接拖累HD7800的矩陣轉(zhuǎn)置性能。這個(gè)過(guò)程在Tahiti中同樣存在,但擁有巨大顯存帶寬的HD7900系列成功的以更好的顯存性能應(yīng)對(duì)了緩沖溢出的問(wèn)題。sweet spot級(jí)的HD7800并不具備旗艦級(jí)的384bit顯存位寬,因此只能接受150G顯存帶寬帶來(lái)的測(cè)試結(jié)果。

   

 標(biāo)簽:
廣告聯(lián)系:010-82755684 | 010-82755685 手機(jī)版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時(shí)代網(wǎng) 版權(quán)所有 關(guān)于投影時(shí)代 | 聯(lián)系我們 | 歡迎來(lái)稿 | 網(wǎng)站地圖
返回首頁(yè) 網(wǎng)友評(píng)論 返回頂部 建議反饋
快速評(píng)論
驗(yàn)證碼: 看不清?點(diǎn)一下
發(fā)表評(píng)論