江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院是江西省的第一所數(shù)字產(chǎn)業(yè)學(xué)院,學(xué)院于2021年成立,專(zhuān)注于計(jì)算機(jī)科學(xué)與技術(shù)、人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)及動(dòng)畫(huà)等領(lǐng)域的教學(xué)和研究。
作為新成立的機(jī)構(gòu),江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院計(jì)劃從零開(kāi)始構(gòu)建一套行業(yè)頂尖的數(shù)字化基礎(chǔ)架構(gòu),而這需要從設(shè)計(jì)并建立全新的數(shù)據(jù)中心開(kāi)始。
在為這個(gè)新的數(shù)據(jù)中心選擇服務(wù)器和存儲(chǔ)基礎(chǔ)架構(gòu)時(shí),江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院主要考慮兩大需求。
首先,它需要一個(gè)強(qiáng)大的平臺(tái)支持日常運(yùn)營(yíng)。該平臺(tái)將運(yùn)行學(xué)院的學(xué)生信息、圖書(shū)館、教室和校園系統(tǒng),而且需要足夠的靈活性和可擴(kuò)展性,在學(xué)院不斷發(fā)展壯大、招生人數(shù)增多的情況下實(shí)現(xiàn)快速擴(kuò)展。
其次,它還需要一套強(qiáng)大的高性能計(jì)算基礎(chǔ)架構(gòu),幫助教師和學(xué)生開(kāi)展突破性科研工作。江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院設(shè)立了多個(gè)和人工智能、深度學(xué)習(xí)相關(guān)的優(yōu)勢(shì)學(xué)科和科研項(xiàng)目。因此,找到一種不僅能夠支持CPU密集型工作負(fù)載,同時(shí)還能支持GPU密集型工作負(fù)載的通用架構(gòu)為教學(xué)和科研的必要的實(shí)驗(yàn)環(huán)境尤為重要。
由于學(xué)院可用于IT管理的資源非常有限,這兩個(gè)平臺(tái)都應(yīng)當(dāng)非?煽壳乙子诠芾。此外,考慮到隨著科研工作的逐步深入,數(shù)據(jù)量預(yù)計(jì)將迅速增加,強(qiáng)大的數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)保護(hù)功能必不可少。
聯(lián)想幫助江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院設(shè)計(jì)并部署了一套基于兩大主要解決方案的基礎(chǔ)架構(gòu),這兩套方案協(xié)同運(yùn)行,能夠?qū)W(xué)院的運(yùn)營(yíng)系統(tǒng)和科研項(xiàng)目進(jìn)行全面管理。
首先,學(xué)院采用聯(lián)想ThinkAgile AH超融合解決方案作為統(tǒng)一平臺(tái),支持日常行政管理、教學(xué)和科研管理等企業(yè)級(jí)應(yīng)用。超融合的部署意味著學(xué)院可以根據(jù)需要隨時(shí)添加計(jì)算和存儲(chǔ)資源來(lái)支持業(yè)務(wù)增長(zhǎng)。聯(lián)想ThinkAgile AH還是為數(shù)不多能夠支持異構(gòu)設(shè)備擴(kuò)容的超融合解決方案,以最大化的資源利用和靈活性充分保護(hù)學(xué)院的投資。
其次,利用聯(lián)想ThinkSystem SR650和SR670服務(wù)器組成的高性能計(jì)算集群,學(xué)院搭建了一個(gè)可供各學(xué)科完成教學(xué)和科研工作的IT環(huán)境。這些服務(wù)器搭載了CPU和NVIDIA Tesla V100及T4 Tensor Core GPU。NVIDIA V100 GPU專(zhuān)門(mén)設(shè)計(jì)用于加速人工智能和高性能計(jì)算工作負(fù)載,可提供比傳統(tǒng)CPU高32倍的訓(xùn)練吞吐量。
憑借4顆NVIDIA V100 GPU和18顆NVIDIA T4 Tensor Core GPU,聯(lián)想高性能計(jì)算集群可交付出色的性能,滿足深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)工作負(fù)載的苛刻要求。該系統(tǒng)可支持多種常見(jiàn)的深度學(xué)習(xí)框架(如Caffe和TensorFlow)以及容器技術(shù)。
與此同時(shí),聯(lián)想的LiCO 平臺(tái)(Lenovo Intelligent Computing Orchestration)作為集群管理器,提供了一個(gè)簡(jiǎn)單且直觀的操作界面,使集群資源對(duì)研究人員垂手可得,并幫助非技術(shù)用戶(hù)消除復(fù)雜性。同時(shí),聯(lián)想LiCO平臺(tái)能夠?qū)崿F(xiàn)細(xì)粒度資源監(jiān)控,和CPU、GPU資源的靈活分配。
最后,學(xué)院通過(guò)聯(lián)想ThinkSystem DM3000H和DE6000H存儲(chǔ)系統(tǒng)以及DPA24000備份一體機(jī),實(shí)現(xiàn)對(duì)核心數(shù)據(jù)的歸檔、備份和保護(hù)。這種并行文件系統(tǒng)還可幫助包括科研人員在內(nèi)的所有用戶(hù)進(jìn)行統(tǒng)一的數(shù)據(jù)訪問(wèn)。
“聯(lián)想和NVIDIA在人工智能和傳統(tǒng)高性能計(jì)算領(lǐng)域?qū)嵙π酆,在我們的評(píng)估中獲得了最高的技術(shù)評(píng)分!
江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院副院長(zhǎng)
新平臺(tái)就緒后,江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院具備了所需的工具幫助教師和學(xué)生開(kāi)展世界一流的科研工作。
通過(guò)輕松訪問(wèn)高性能計(jì)算工作負(fù)載所需的CPU和GPU資源,學(xué)院的學(xué)生和科研人員將能夠有效地規(guī)劃、實(shí)施和管理項(xiàng)目而不需要額外的技術(shù)幫助,進(jìn)而減輕IT技術(shù)人員的負(fù)擔(dān)。利用聯(lián)想LiCO平臺(tái),只需簡(jiǎn)單點(diǎn)擊鼠標(biāo)就可以分配資源,部署深度學(xué)習(xí)應(yīng)用和訓(xùn)練模型。技術(shù)和研究人員的時(shí)間和精力能夠釋放出來(lái),幫助學(xué)院集中精力于學(xué)術(shù)工作,而不必被淹沒(méi)在繁瑣的部署、運(yùn)營(yíng)或系統(tǒng)維護(hù)任務(wù)中。
基于NVIDIA GPU的強(qiáng)大處理能力,可以很好地支持人工智能和深度學(xué)習(xí)研究項(xiàng)目。用戶(hù)友好的高性能計(jì)算集群管理,使學(xué)生和科研人員如虎添翼 。小維護(hù)工作量的基礎(chǔ)架構(gòu),提供自動(dòng)備份,可輕松擴(kuò)展。
江西師范大學(xué)數(shù)字產(chǎn)業(yè)學(xué)院副院長(zhǎng)表示:“我們的學(xué)生和導(dǎo)師非常期待使用聯(lián)想和NVIDIA的高性能計(jì)算平臺(tái)開(kāi)展突破性科學(xué)研究。這將有助于我們推動(dòng)城市的數(shù)字產(chǎn)業(yè)的發(fā)展,實(shí)現(xiàn)教育鏈、創(chuàng)新鏈、產(chǎn)業(yè)鏈的深度融合!