圖片來(lái)源:https://github.com/deepseek-ai/Janus/blob/main/images/teaser_januspro.png
在Janus Pro統(tǒng)一的Transformer架構(gòu)下,文生圖模型的吞吐量高低已經(jīng)從依賴(lài)加速器的高算力向充分利用HBM內(nèi)存高帶寬和大容量轉(zhuǎn)換。英特爾??Gaudi 2D憑借2.45TB/秒的高帶寬和96GB HBM?大容量?jī)?nèi)存,為Janus Pro模型提供了強(qiáng)大的計(jì)算支持,使其在生圖批處理任務(wù)中,隨著批量大?。˙atch Size)的增加,吞吐性能得到顯著提升,大幅縮短任務(wù)處理時(shí)間。
與此同時(shí),結(jié)合英特爾Optimum-Habana框架的優(yōu)化,英特爾??Gaudi 2D顯著提升了文生圖任務(wù)的吞吐性能和推理效率,僅需約10?秒即可生成16張高質(zhì)量的圖片,性能表現(xiàn)卓越。而且,開(kāi)發(fā)者僅需調(diào)整數(shù)行代碼,即可實(shí)現(xiàn)這一結(jié)果,極大降低了開(kāi)發(fā)門(mén)檻和遷移成本,為AI應(yīng)用的高效部署提供便利。
圖片來(lái)源:利用英特爾Gaudi 2D AI加速器運(yùn)行DeepSeek Janus-Pro-7B模型生成
此外,DeepSeek的蒸餾模型在至強(qiáng)和Gaudi平臺(tái)上也得到了支持,能夠?yàn)榭蛻魟?chuàng)造更好的總體擁有成本(TCO),推動(dòng)AI的普惠。
一直以來(lái),英特爾始終秉承開(kāi)放的態(tài)度,并通過(guò)軟硬件相結(jié)合的方式推動(dòng)AI應(yīng)用落地。目前,英特爾豐富的AI產(chǎn)品組合,包括英特爾?至強(qiáng)?處理器、英特爾?Gaudi AI加速器、英特爾?酷睿? Ultra處理器和英特爾銳炫?顯卡等,已經(jīng)針對(duì)業(yè)界超過(guò)500個(gè)開(kāi)源AI模型提供支持,廣泛涵蓋DeepSeek、Llama 3.1和通義千問(wèn)等。同時(shí),英特爾深耕開(kāi)放生態(tài),不僅以開(kāi)放生態(tài)系統(tǒng)軟件實(shí)現(xiàn)針對(duì)性?xún)?yōu)化,也通過(guò)打造企業(yè)AI開(kāi)放平臺(tái)(OPEA)為這些模型提供支持。