● shader靈活度測(cè)試:矩陣轉(zhuǎn)置
矩陣轉(zhuǎn)置同矩陣乘法一樣,也廣泛分布在包括坐標(biāo)變換等過(guò)程在內(nèi)的大量圖形處理過(guò)程中。矩陣轉(zhuǎn)置可以被理解成矩陣沿特定方向“翻轉(zhuǎn)”之后產(chǎn)生的鏡像,這導(dǎo)致了矩陣轉(zhuǎn)置操作會(huì)涉及到大量數(shù)據(jù),比如稀疏矩陣的對(duì)角線數(shù)據(jù)等的臨時(shí)存儲(chǔ),因此矩陣轉(zhuǎn)置操作對(duì)于體系的緩沖密度是相當(dāng)敏感的。
同矩陣乘法一樣,伴隨著頻率的不斷提升,HD7950的矩陣轉(zhuǎn)置性能提升速度較之HD7970要高出許多,兩者之間的性能差異在迅速的收窄甚至趨同。由于矩陣轉(zhuǎn)置的操作過(guò)程較之矩陣乘法更加“規(guī)整”,能夠產(chǎn)生瞬間高延遲的因素較少,因此矩陣轉(zhuǎn)置測(cè)試所得的趨勢(shì)也更加明顯和直觀。
由于矩陣轉(zhuǎn)置對(duì)緩沖體系的敏感,緩沖密度相同但總量更少的Pitcairn在這項(xiàng)測(cè)試中遇到了不小的問(wèn)題,不足以應(yīng)對(duì)測(cè)試需求的緩沖體系導(dǎo)致了大量的訪存過(guò)程,這直接拖累HD7800的矩陣轉(zhuǎn)置性能。這個(gè)過(guò)程在Tahiti中同樣存在,但擁有巨大顯存帶寬的HD7900系列成功的以更好的顯存性能應(yīng)對(duì)了緩沖溢出的問(wèn)題。sweet spot級(jí)的HD7800并不具備旗艦級(jí)的384bit顯存位寬,因此只能接受150G顯存帶寬帶來(lái)的測(cè)試結(jié)果。