(圖:EasyDL平臺的全新發(fā)布與重要升級)
據介紹,EasyDL已成為目前市場上重點面向中小企業(yè)功能最全的一站式AI開發(fā)平臺。以“簡單、專業(yè)”為最核心理念的EasyDL希望通過平臺建立一條連接需求和復雜技術之間鴻溝的橋梁,幫助開發(fā)者實現(xiàn)零門檻AI開發(fā),從繁雜的數據準備、環(huán)境配置、代碼開發(fā)和服務部署中脫身,專注于業(yè)務與創(chuàng)新。
由于大量開發(fā)者在結合業(yè)務進行模型訓練前,常常深受“數據”一環(huán)的困擾,因此EasyDL此次全新推出EasyData, 面向AI開發(fā)領域,提供了一站式數據采集、清洗、標注、擴充、數據閉環(huán)等能力,與EasyDL模型訓練和部署環(huán)節(jié)配合,幫助開發(fā)者更高效更低成本的解決AI開發(fā)及應用過程中遇到的數據問題。
首先,在采集環(huán)節(jié)EasyData提供了業(yè)內首發(fā)的軟硬一體、端云協(xié)同的自動數據采集方案,極大降低了開發(fā)者在“設備選型、調測和集成開發(fā)工作上的成本”,將數據采集效率從“周級”提升到“小時級”。緊接著,針對采回的數據,平臺還提供自動數據清洗方案,將人工處理成本降低80%。而針對AI開發(fā)中另一耗費時間的“數據標注”環(huán)節(jié),EasyData可提供豐富的智能標注方案,支持物體檢測、圖像分割和文本分類三種任務場景,只需標注少量數據,即可通過啟動“智能標注”自動挖掘難例,并通過標注難例加速提升系統(tǒng)效果。與以往相同任務相比,基于EasyData智能標注解決方案,達到同等模型效果的數據標注量平均減少70%。在之后的模型訓練與發(fā)布環(huán)節(jié),自動數據閉環(huán)使得整體模型迭代周期從月到周甚至到天,極大提升了AI開發(fā)全流程效率。
舉例來看,果蔬智能識別系統(tǒng)開發(fā)企業(yè)中科立業(yè)基于EasyDL快速開發(fā)的“智能云秤”已落地20家店鋪,通過秤上的攝像頭來智能判斷商品,實現(xiàn)稱重結算一步到位。而在此前的實際開發(fā)中,中科立業(yè)遇到遮擋、光線影響、樣本多樣性等數據問題,在接入EasyDL后,基于EasyData 的自動去模糊、過濾無效圖像、智能標注和數據增強,每天可以自動收集7000張有效樣本,整體減少了80%的數據處理量和70%的人工成本,通過EasyDL Master模式,快速實現(xiàn)模型開發(fā),對50種水果實現(xiàn)智能識別,準確率超過95%。
此次峰會中,EasyDL平臺除了針對數據管理方面全新發(fā)布了EasyData,還針對AI開發(fā)中的其他環(huán)節(jié)進行了4項全新升級。首先,EasyDL平臺對預訓練模型、預置算法進行了升級,使Master模式應用更簡單高效。如在NLP領域預置了效果領先的ERNIE2.0模型,將持續(xù)針對醫(yī)療、法律等專業(yè)領域擴展“領域模型”;在CV領域則預置了“超大規(guī)模視覺”預訓練模型,大幅提升通用分類和檢測的模型效果,并在零售、安防等領域發(fā)展場景化預置模型。EasyDL平臺目前共預置了36套經典NLP網絡與模型組合、26套經典CV網絡與模型組合,支持開發(fā)者更加高效快捷地進行模型開發(fā)。
其次,自動數據增強和超參搜索能力也針對實際的工業(yè)應用做了優(yōu)化。其中,自動數據增強方面,平臺開放超過40種數據增強算子,可靈活配置,基于工業(yè)級搜索算法實現(xiàn)更高的搜索效率。同時,對于自動超參搜索,創(chuàng)新基于隨機微分方程的無梯度優(yōu)化的調參算法,收斂速度快,不依賴平滑性假設,可支持大規(guī)模并行搜索調參。這使得EasyDL線上多場景模型精度平均提升10%以上。另外,分布式訓練加速也是EasyDL平臺的一大特點,基于PaddlePaddle DGC的優(yōu)化,在常見的沒有專門經過通信優(yōu)化的公有云環(huán)境中,能夠使訓練時長平均減少70%。
總體來看,由于AI核心算法發(fā)展迅速,效果和復雜度不斷提升,并且涉及到數據處理、環(huán)境配置、結果分析、模型部署、運行監(jiān)控等等,龐雜繁復的各環(huán)節(jié),讓專注于各自領域的企業(yè),對于所需的“定制AI開發(fā)”往往存在門檻過高的現(xiàn)象。而EasyDL為了讓各領域企業(yè)在進行“智能化”升級時可解放更多人力與資源聚焦在業(yè)務與創(chuàng)新上,在降低技術門檻、加快開發(fā)的同時,也確保了核心AI開發(fā)體驗的順暢和效果。例如,瀚才獵頭作為一家只有5個人力資源專家組成的創(chuàng)業(yè)公司,借助EasyDL智能標注和預訓練模型ERNIE,公司的人力資源專家輕松快速,且具有行業(yè)創(chuàng)新性地將房地產行業(yè)“簡歷數據”建立了分類模型,針對100多個細分職業(yè)和11個通用職級進行分類,讓員工在面對“背景經驗差距巨大”卻是同一職位名稱的候選人時可進行更高效的篩選匹配。而該模型只使用了1萬條標注數據,就達到了95%以上的準確率,讓人才檢索效率迅速提升200倍。
(圖:EasyDL“盤活”瀚才獵頭海量沉沒數據價值)
最后,EasyDL還提供了市場上最全面的服務部署形態(tài),不僅同時支持公有云與私有化部署,更在端上適配廣泛,支持15+硬件和芯片類型和4大操作系統(tǒng)。會上,“EasyEdge軟硬一體方案”全新升級,包括6款方案,針對市面上流行的硬件進行專門適配,高中低全矩陣覆蓋,模型識別速度最高提升10倍,幫助開發(fā)者輕松打造嵌入式AI應用。其中,本次全新發(fā)布的“EasyDL-EdgeBoard(VMX)加速卡軟硬一體方案”基于Intel Movidius Myriad X芯片打造,具有小體積,低成本、高性能的特點,在百度AI市場售價679元起。另外,全新發(fā)布的“EasyDL + NVIDIA Jetson軟硬一體方案”,覆蓋Nano、TX2、Xavier三款硬件產品,EasyDL SDK全系列加速適配。目前,Nano + EasyDL SDK在百度AI市場限量直降,售價僅需800元。
自EasyDL平臺發(fā)布以來,已有越來越多的企業(yè)用戶和開發(fā)者將EasyDL作為他們實現(xiàn)業(yè)務創(chuàng)新和智能化升級的首選AI開發(fā)平臺。事實上,目前EasyDL已經成為了應用和落地最廣泛的AI開發(fā)平臺,已為工業(yè)、農業(yè)、交通運輸、政務等各行各業(yè)的開發(fā)者帶來了重要價值。未來,EasyDL也將繼續(xù)提供更好的開發(fā)壞境,讓開發(fā)者更加聚焦于業(yè)務與創(chuàng)新,加速AI開發(fā)落地的整個技術部署進程。