在訓練場景下,使用該高性能算子庫可將上文Stable Diffusion模型在128張A100的訓練時間從25天減少到15天,訓練性能提升40%。同時,由于AIGC模型在訓練時占用GPU顯存容量非常大,未經(jīng)優(yōu)化時的模型只能運行在最高端的A100 80GB GPU卡上?;鹕揭娓咝阅芩阕訋焱ㄟ^大量消減中間操作,將運行時GPU顯存占用量降低50%,使得大多數(shù)模型可從A100遷移到成本更低的V100或A30等GPU卡上運行,擺脫特定計算卡的限制,而且不需要做額外的模型轉(zhuǎn)換工作。
以此,以AIGC場景為代表,無論是迭代速度,還是單次的訓練成本,都有了顯著的性能提升和成本節(jié)省。未來,火山引擎云服務將持續(xù)在機器學習、科學計算、圖形處理等領域深耕,不斷追求極致性能。