作為NVIDIA Ampere架構(gòu)的最新成員,NVIDIA RTX™ A4500采用的是GA102的核心架構(gòu),與NVIDIA RTX A5000采用的核心架構(gòu)相同。RTX A4500的核心數(shù)量和顯存容量都介于RTX A5000和 RTX A4000之間,所以性能也是介于兩者之間。相對于RTX A4000,RTX A4500支持NVIDIA®NVLink™技術(shù),和RTX A5000使用相同的NVLink橋接器,雙卡下可以增加顯存通訊交互的帶寬,從而提高GPU效率。
繼上次進(jìn)行了RTX A4500的開箱之后,麗臺科技本次為大家?guī)碜钚碌腞TX A4500的實(shí)測分析,本次測試主要對比的是RTX A4500相對于RTX A4000的性能提升,一起來看看吧!
測試環(huán)境
測試工具說明
顯卡規(guī)格對比
一、計(jì)算性能實(shí)測結(jié)果對比分析
LuxMark
LuxMark是基于OpenCL庫的渲染引擎,圖像的渲染速度和OpenCL的計(jì)算速度成正比。OpenCL是開放運(yùn)算語言,目前顯卡的技術(shù)指標(biāo)中也都支持這種計(jì)算API和編程語言。
從LuxMark的OpenCL計(jì)算性能測試結(jié)果來看,RTX A4500得分是RTX A4000的1.36倍,在GPU計(jì)算性能方面提升幅度很大。
二、圖形性能實(shí)測結(jié)果對比分析
SPECviewperf 2020
SPECviewperf 2020主要是用來評測顯卡專業(yè)圖形性能的軟件,其中包括了我們常見的3ds Max、Maya、Catia、Siemens NX、SolidWorks、Creo軟件性能測試,以及醫(yī)療和能量仿真性能測試。通過模擬對軟件場景的交互操作的速度來評分,最終得出顯卡圖形方面的相對性能。
專業(yè)圖形性能方面,我們以RTX A4000的性能為1,來對比RTX A4500性能的相對提升。在3ds Max、Catia、Creo、Maya、SolidWorks項(xiàng)目測試中,RTX A4500性能是RTX A4000的1.1倍,在Energy、Medical的項(xiàng)目里RTX A4500是RTX A4000的1.2倍性能,Siemens NX的得分兩者幾乎持平。
三、實(shí)時渲染性能實(shí)測結(jié)果對比分析
Superposition Benchmark
Superposition測試的是GPU實(shí)時渲染的性能,攝像機(jī)在3D場景里漫游,顯卡實(shí)時渲染物品運(yùn)動、光影和材質(zhì)然后輸出到顯示設(shè)備。
Unigine引擎的實(shí)時渲染中,使用DirectX和OpenGL圖形API,RTX A4500的性能分別是RTX A4000的1.17倍和1.19倍。
3DMark
在3DMark中,Time Spy Extreme 4K渲染RTX A4500是RTX A4000的1.2倍,Time Spy 1080P渲染,RTX A4500是RTX A4000的1.25倍。在使用光線追蹤渲染的場景Port Royal中,RTX A4500是RTX A4000的1.28倍。
四、離線渲染性能實(shí)測結(jié)果對比分析
離線渲染在媒體娛樂、設(shè)計(jì)制造以及建筑行業(yè)廣泛應(yīng)用,目前很多渲染器均支持GPU渲染,渲染的速度就取決于顯卡的計(jì)算速度。
Blender 4K Rendering
在Blender中渲染,使用Cycles渲染器渲染,Cycles同樣可以支持CUDA和Optix兩種方式進(jìn)行渲染。在CUDA的渲染性能上RTX A4500是RTX A4000的1.35倍。在Optix的渲染性能上RTX A4500是RTX A4000的1.28倍。但是相同的場景下,使用Optix渲染速度顯然要比CUDA快很多。
Octane Benchmark
OC渲染器的benchmark測試中,RTX A4500的性能是 RTX A4000的1.39倍,離線渲染速度有了大幅的提升。
Autodesk VRED 4K Rendering
使用VRED GPU加速渲染,渲染速度對比之下,RTX A4500提升速度不多,RTX A4500渲染速度僅是RTX A4000的1.09倍。
Keyshot 4K Rendering
Keyshot是工業(yè)級的渲染器,本次測試渲染的是4K分辨率的圖片。從實(shí)際測試結(jié)果看,RTX A4500的性能是RTX A4000的1.31倍。
五、編解碼實(shí)測結(jié)果對比分析
FFmpeg
在編解碼測試中,由于兩者都是安培架構(gòu)的顯卡,所使用的編解碼芯片是一樣的,編解碼器的數(shù)量也相同,所以在編解碼性能上差距不大。從總的測試情況來RTX A4500的性能略高于RTX A4000,提高不多。
六、訓(xùn)練和推理實(shí)測結(jié)果對比分析
DL ResNet50
ResNet50分別測試了使用FP16和FP32來處理圖片的速度,半精度下,RTX A4500的處理速度是RTX A4000的1.31倍。在單精度下RTX A4500是 RTX A4000的1.36倍,提升了30%以上的性能,性能提升幅度比較大。
Image-classification
在推理方面,在FP16下,RTX A4500的處理速度是RTX A4000的1.38倍,在INT8下,RTX A4500的處理速度是RTX A4000的1.32倍,都有30%以上的性能提升。
總結(jié)
NVIDIA RTX A4500在技術(shù)指標(biāo)和測試性能上都介于RTX A4000和RTX A5000之間,是NVIDIA專業(yè)圖形卡產(chǎn)品線有力的補(bǔ)充。
總的來說,RTX A4500的亮點(diǎn)表現(xiàn)在:
支持同步卡接入實(shí)現(xiàn)多屏同步
支持NVLink雙卡顯存交互,減少延遲
20GB的大顯存可以讓RTX A4500在各種3D場景實(shí)現(xiàn)流暢操作,GPU渲染的性能很高
在深度學(xué)習(xí)訓(xùn)練和推理性能上都有30%以上的提高,可以支持更多人工智能的應(yīng)用