為了推動國家AI產(chǎn)業(yè)的發(fā)展,一系列的支持性政策陸續(xù)出臺,加上海量數(shù)據(jù)的增加、算法模型的復(fù)雜化以及應(yīng)用場景的深入發(fā)展,中國AI算力規(guī)模正在持續(xù)擴(kuò)大,算力需求的持續(xù)釋放帶動算力基礎(chǔ)設(shè)施產(chǎn)業(yè)迎來增長新周期。據(jù)IDC數(shù)據(jù)顯示,AI的應(yīng)用與普及促使2022年我國智能算力規(guī)模近乎翻倍,達(dá)到268EFLOPS,超過通用算力規(guī)模。2026年我國智能算力規(guī)模將達(dá)1271.4EFLOPS,21-26年復(fù)合增長率預(yù)計達(dá)52.3%,而硬件占AI支出比重的49.8%。其中最大投資是服務(wù)器,占AI硬件支出比重84%以上,AI將成為未來服務(wù)器市場新一輪快速增長的主要推動力。2021年全球人工智能服務(wù)器市場規(guī)模達(dá)156億美元,同比增長39.1%,2022年約為183億美元,預(yù)計未來人工智能服務(wù)器市場將繼續(xù)高速增長,2023年市場規(guī)模將達(dá)到211億美元。
資料來源:IDC
AI服務(wù)器概述
服務(wù)器隨場景需求分為通用服務(wù)器、云服務(wù)器、邊緣服務(wù)器、AI服務(wù)器四種模式。AI服務(wù)器采用GPU增強(qiáng)其并行計算能力,CPU+GPU是AI服務(wù)器的核心部件。AI服務(wù)器可分為深度學(xué)習(xí)訓(xùn)練型和智能應(yīng)用推理型,訓(xùn)練對芯片算力要求更高,推理對算力的要求偏低。中國AI服務(wù)器推理負(fù)載占比約55.5%,未來有望持續(xù)提高。當(dāng)下AI服務(wù)器通常采用異構(gòu)形式,在訓(xùn)練模型或者應(yīng)用推理等情況下,CPU+GPU組合仍然是實現(xiàn)數(shù)據(jù)中心加速的首選。
訓(xùn)練:屬于非實時業(yè)務(wù),所耗時間可能數(shù)天也可能數(shù)月,具體取決于模型參數(shù)量的多少和算力芯片性能的高低,因此在算力芯片和服務(wù)器的投入上,屬于用戶對階段性模型訓(xùn)練需求的一次性高投入成本。
推理:屬于實時業(yè)務(wù),需要響應(yīng)客戶端觸發(fā)的實際需求,算力需求取決于活躍用戶數(shù)和設(shè)計并發(fā)數(shù)的級別,因此算力芯片和服務(wù)器的投入,會隨著模型的商用流行度以及吸引的活躍用戶數(shù)持續(xù)增加。
加上數(shù)據(jù)量的劇增,不同應(yīng)用場景對AI服務(wù)器的芯片散熱、整機(jī)設(shè)備散熱和電源功率及效率要求大幅提升,RAID控制卡隨數(shù)據(jù)量同步增加,PCIe接口傳輸速率也隨之迎來升級。此外,為了保障數(shù)據(jù)安全,AI服務(wù)器必須加強(qiáng)數(shù)據(jù)加密技術(shù),并建立定期備份和恢復(fù)機(jī)制,以滿足不斷增長的AI應(yīng)用需求,并確保AI服務(wù)器性能和可靠性的持續(xù)提升。
智微智能AI服務(wù)器
智微智能AI服務(wù)器目前擁有SYS-80215R、SYS-8029R-S06、SYS-8049RG 三款產(chǎn)品。產(chǎn)品均采用Intel 至強(qiáng)可擴(kuò)展系列處理器平臺,為AI領(lǐng)域提供強(qiáng)大支持,滿足實時數(shù)據(jù)處理、訓(xùn)練和推理等關(guān)鍵需求。工規(guī)級設(shè)計,適用于各種復(fù)雜場景下的部署和應(yīng)用。
SYS-80215R 是一款2U雙路高性能AI服務(wù)器,采用Intel C741高性能芯片組,支持第四代英特爾至強(qiáng)可擴(kuò)展系列處理器。整機(jī)提供16個DDR5 RDIMM內(nèi)存槽,最大支持4TB內(nèi)存擴(kuò)展,支持最多12個3.5寸熱插拔SAS/SATA3.0硬盤;提供4個PCIe 5.0 x8和2個PCIe 5.0 x16高速插槽,方便擴(kuò)展各類PCIe設(shè)備(如高性能GPU、FPGA加速卡、RAID控制器、ASIC加速卡等),提高對CAD、仿真模擬、GCC渲染、GPU計算等應(yīng)用的支持;2個Intel 2.5G網(wǎng)絡(luò)接口,提供更快的網(wǎng)絡(luò)連接速度和更好的寬帶;1個IPMI網(wǎng)絡(luò)管理接口,支持服務(wù)器硬件檢測,可遠(yuǎn)程監(jiān)控服務(wù)器各硬件的工作狀態(tài),及時做出調(diào)整。
前后面板設(shè)計簡單易用,沒有復(fù)雜按鍵,操作簡單。服務(wù)器頂部配備一鍵拆卸開關(guān),便于用戶更換設(shè)備和進(jìn)行運(yùn)維,無需重復(fù)鎖螺,適用于對空間部署有要求和高計算性能等應(yīng)用場景。
SYS-8029R-S06 是一款2U雙路邊緣AI服務(wù)器,采用Intel C621高性能芯片組,支持第二代英特爾至強(qiáng)可擴(kuò)展系列處理器。提供16個DDR4 DIMM內(nèi)存槽,最多支持4TB內(nèi)存容量,標(biāo)配支持6個2.5寸SATA3熱插拔硬盤,最多可擴(kuò)展6個半高單寬加速卡。集成2個千兆網(wǎng)絡(luò)端口和2個2.5G網(wǎng)絡(luò)端口,具有負(fù)載均衡、鏈路匯聚和支持冗余特性,可有效減少網(wǎng)絡(luò)延遲。提供1個IPMI網(wǎng)絡(luò)管理端口,支持IPMI 2.0和KVM Over IP高級管理功能。高集成度的設(shè)計能在有限的空間內(nèi)帶來強(qiáng)勁的計算性能表現(xiàn),適用于對部署空間有要求的場景應(yīng)用,滿足邊緣端的數(shù)據(jù)推理需求。
SYS-8049RG 是一款4U雙路AI服務(wù)器,采用Intel C621高性能芯片組,支持第二代英特爾至強(qiáng)可擴(kuò)展系列處理器。提供16個DDR4 RDIMM內(nèi)存槽,最大支持4TB內(nèi)存擴(kuò)展;標(biāo)配8個3.5寸6G SATAIII熱插拔硬盤,支持Raid0,1,5,10;整機(jī)支持4張雙寬全高或7張單寬NVIDIA圖形計算加速卡(例如NVIDIA A30 Tensor Core GPU),為AI訓(xùn)練提供強(qiáng)有力的算力支撐。采用X550萬兆網(wǎng)絡(luò)控制器,支持2個萬兆電口及1個千兆IPMI管理接口,支持鏈路匯聚以及綁定冗余功能,網(wǎng)絡(luò)高速互聯(lián)為 GPU 計算集群提供高密度、高性能的節(jié)點平臺?捎糜趫D形渲染、深度學(xué)習(xí)、化學(xué)分子計算、云計算和虛擬化、計算密集型行業(yè)應(yīng)用。
助推AI應(yīng)用發(fā)展
智微智能提供完整且靈活的AI服務(wù)器產(chǎn)品組合,通過不斷創(chuàng)新和優(yōu)化,持續(xù)提升AI服務(wù)器的性能、靈活性和可擴(kuò)展性,以確保能夠適應(yīng)各種數(shù)據(jù)規(guī)模和AI的應(yīng)用需求。
硬件方面,智微智能AI服務(wù)器產(chǎn)品采用經(jīng)過深度優(yōu)化的處理器架構(gòu),借助優(yōu)異的芯片制程技術(shù),實現(xiàn)卓越的計算性能和能效比。產(chǎn)品兼容多個國產(chǎn)ASIC廠商加速卡 ,配備大規(guī)模的高速存儲配置,以提供強(qiáng)大的并行計算能力。通過IPMI管理接口,用戶可以通過網(wǎng)絡(luò)接口對服務(wù)器進(jìn)行遠(yuǎn)程管理和監(jiān)控,包括監(jiān)控服務(wù)器的硬件狀態(tài)、重啟服務(wù)器、更新固件等操作,大大提高服務(wù)器的管理效率,有效防止系統(tǒng)出錯,保護(hù)關(guān)鍵系統(tǒng)數(shù)據(jù)完整性和可靠性。
總 結(jié)
智微智能AI服務(wù)器,在設(shè)計和功能上充分考慮了應(yīng)用場景的多樣性。能夠加速數(shù)據(jù)分析、預(yù)測性維護(hù)、優(yōu)化大數(shù)據(jù)模型等關(guān)鍵應(yīng)用,為不同場景的AI需求提供了更準(zhǔn)確、高效、智能的解決方案。