浪潮AIStation實現(xiàn)了對人工智能計算資源的池化管理,創(chuàng)新的GPU多維細粒度分配策略能夠讓多人同時使用單張GPU,并且可充分利用閑暇時間訓練任務,最大化發(fā)揮計算資源的性能,很好的緩解了開發(fā)過程中的作業(yè)排隊、資源擠占情況。而在任務完成后,計算資源會自動釋放資源池,避免長期占用。
同時,AIStation能夠提供多種資源調(diào)度策略,運維人員可以根據(jù)銀行不同業(yè)務組和開發(fā)用戶設置資源的配額和優(yōu)先級,減少了手工分配和資源協(xié)調(diào)工作。而可視化界面資源管理功能,能夠?qū)崟r監(jiān)控GPU和CPU等計算資源的使用情況和資源性能表現(xiàn)、硬件性能和掉卡異常提醒,提供查看整體的GPU使用狀態(tài)的接口,極大的減輕了運維人員的工作量,讓運維更簡單更高效。
此外,開發(fā)人員可以通過AIStation平臺,以界面化方式快速提交并行開發(fā)任務,秒級完成任務的托管。通過AIStation內(nèi)置的監(jiān)控工具,開發(fā)人員可以實時查看訓練任務過程、各個資源的占用情況和算法情況,可視化快速定位算法的瓶頸或者bug問題,更加有針對性的調(diào)整模型參數(shù),并支持多次提交訓練任務,這可以顯著加快算法的迭代次數(shù),從而提高生產(chǎn)效率。
AIStation全面整合AI計算資源、訓練數(shù)據(jù)資源以及AI開發(fā)工具,為AI開發(fā)提供極致高性能的計算力支撐,構(gòu)建敏捷高效的一體化AI開發(fā)平臺。目前AIStation已經(jīng)聚合了包含百度、第四范式、英特爾、英偉達、VMware等數(shù)十家公司的AI框架、模型和工具組件,廣泛應用在互聯(lián)網(wǎng)、通信、金融、交通、制造、醫(yī)療等行業(yè)的人工智能業(yè)務場景中,成為生態(tài)豐富的人工智能資源平臺。