Serverless化覆蓋多樣推理場(chǎng)景

作為云上AI推理服務(wù)平臺(tái),PAI-EAS在基礎(chǔ)設(shè)施層、容器調(diào)度層、模型部署層都提供豐富的產(chǎn)品功能,貼合不同場(chǎng)景的個(gè)性化需求。

? 實(shí)時(shí)同步推理場(chǎng)景,例如個(gè)性化推薦或類ChatGPT對(duì)話應(yīng)用等,用戶可通過(guò)一鍵壓測(cè)得到服務(wù)的QPS和時(shí)延閾值,并結(jié)合灰度發(fā)布和藍(lán)綠部署功能,在不影響線上業(yè)務(wù)的情況下進(jìn)行性能驗(yàn)證并順滑切換。

? 近實(shí)時(shí)異步推理場(chǎng)景,例如文圖生成或視頻處理等,涉及較為復(fù)雜模型的推理,單次推理時(shí)間從十幾秒到幾十分鐘不等,PAI-EAS在推理服務(wù)內(nèi)部集成服務(wù)維度的消息隊(duì)列,并支持面向隊(duì)列長(zhǎng)度實(shí)現(xiàn)推理的自動(dòng)彈性擴(kuò)縮容,滿足資源利用率提升及免運(yùn)維需求。

? 離線批量推理場(chǎng)景,例如語(yǔ)音數(shù)據(jù)批量文本轉(zhuǎn)換等時(shí)延不敏感的場(chǎng)景,PAI-EAS可通過(guò)搶占型資源實(shí)例的方式幫助用戶控制批量推理成本。

PAI-EAS最新活動(dòng)

從2023年4月中旬起,阿里云產(chǎn)品試用中心將正式開放PAI-EAS同等算力的試用規(guī)格,提供最長(zhǎng)3個(gè)月的模型在線服務(wù)免費(fèi)體驗(yàn)包。點(diǎn)擊PAI-EAS產(chǎn)品頁(yè)官網(wǎng)(鏈接:https://www.aliyun.com/activity/bigdata/pai/eas),可在PAI-EAS產(chǎn)品官網(wǎng)獲得最新活動(dòng)信息。

分享到

songjy

相關(guān)推薦