三年三變化,引領(lǐng)AI數(shù)據(jù)服務(wù)市場(chǎng)新變革
云測(cè)數(shù)據(jù)參加服貿(mào)會(huì)的三次重大成果發(fā)布,可以說(shuō)是云測(cè)數(shù)據(jù)不斷深入市場(chǎng)動(dòng)態(tài)趨勢(shì),積累技術(shù)經(jīng)驗(yàn)后對(duì)外提交的三次行動(dòng)“答卷”。莊子《齊物論》中有“論而不議,議而不辯”一說(shuō),代表不同階段做該做的事,將它放到AI數(shù)據(jù)服務(wù)市場(chǎng)也許同樣適用。
起初,AI數(shù)據(jù)服務(wù)經(jīng)歷了從小作坊到規(guī)模化生產(chǎn),從實(shí)驗(yàn)室到實(shí)際場(chǎng)景的變革,由于企業(yè)需要更多的高質(zhì)量數(shù)據(jù)作為“底層”燃料進(jìn)行訓(xùn)練和部署機(jī)器學(xué)習(xí)模型,高質(zhì)量數(shù)據(jù)在一定程度上甚至決定了項(xiàng)目的成敗。云測(cè)數(shù)據(jù)在早期就已關(guān)注到AI數(shù)據(jù)服務(wù)的需求缺口和潛在的應(yīng)用市場(chǎng),立足高質(zhì)量、場(chǎng)景化的AI訓(xùn)練數(shù)據(jù)服務(wù),對(duì)AI數(shù)據(jù)的質(zhì)量、效率、場(chǎng)景化方面提出高要求,致力于推動(dòng)數(shù)據(jù)標(biāo)椎質(zhì)量的進(jìn)一步發(fā)展。
2020年的服貿(mào)會(huì)上,云測(cè)數(shù)據(jù)首次對(duì)外宣布其AI數(shù)據(jù)項(xiàng)目交付精準(zhǔn)度最高達(dá)到99.99%,是當(dāng)時(shí)數(shù)據(jù)標(biāo)注領(lǐng)域可達(dá)到的最高服務(wù)標(biāo)準(zhǔn)。與此同時(shí),云測(cè)數(shù)據(jù)還發(fā)布了智慧城市、智能家居、智能駕駛、智慧金融等不同行業(yè)的AI訓(xùn)練數(shù)據(jù)服務(wù)方案。
接下來(lái),當(dāng)企業(yè)獲取了高質(zhì)量數(shù)據(jù),如何管理數(shù)據(jù)資產(chǎn),針對(duì)其特定場(chǎng)景更好地發(fā)掘數(shù)據(jù)價(jià)值成為AI產(chǎn)業(yè)化的難題。比如在訓(xùn)練過(guò)程中,規(guī)?;臄?shù)據(jù)資產(chǎn)往往出現(xiàn)無(wú)法充分利用、管理方式不完備等問(wèn)題。
于是云測(cè)數(shù)據(jù)從助力企業(yè)進(jìn)行數(shù)據(jù)管理,提升數(shù)據(jù)訓(xùn)練的匹配度角度出發(fā),專注AI訓(xùn)練數(shù)據(jù)全生命周期進(jìn)程,形成了一套完整的數(shù)據(jù)服務(wù)實(shí)踐方法論,并在2021年的服貿(mào)會(huì)上正式發(fā)布了“AI數(shù)據(jù)集管理系統(tǒng)”,支持?jǐn)?shù)據(jù)的上傳、管理、存儲(chǔ)、分享還有數(shù)據(jù)類型標(biāo)簽化管理,標(biāo)注結(jié)果存儲(chǔ)和可視化呈現(xiàn),幫助企業(yè)可持續(xù)管理、挖掘AI數(shù)據(jù)價(jià)值,助力企業(yè)快速開(kāi)展模型訓(xùn)練,完成對(duì)應(yīng)的數(shù)據(jù)流轉(zhuǎn)閉環(huán)。
2022年,從AI工程化數(shù)據(jù)處理三大趨勢(shì)看新一代數(shù)據(jù)解決方案
數(shù)據(jù)集管理既成體系,隨著AI技術(shù)與產(chǎn)業(yè)的深度融合,需要進(jìn)一步關(guān)注產(chǎn)品的迭代進(jìn)程,加速AI產(chǎn)業(yè)化。行業(yè)的AI產(chǎn)品迭代過(guò)程通常是算法研發(fā)流程,然后嵌入到軟件工程里完成對(duì)應(yīng)的聯(lián)調(diào)測(cè)試、灰度發(fā)布再發(fā)布到實(shí)際生產(chǎn)環(huán)境中去使用,通過(guò)在生產(chǎn)環(huán)境中持續(xù)回流的線上數(shù)據(jù)和用戶反饋進(jìn)行產(chǎn)品迭代,與此同時(shí)再用相應(yīng)數(shù)據(jù)進(jìn)行算法模型的持續(xù)調(diào)優(yōu)。
其中數(shù)據(jù)處理伴隨研發(fā)迭代,并基于對(duì)數(shù)據(jù)需求不同分為三個(gè)階段——算法預(yù)研期,針對(duì)何種具體場(chǎng)景解決方案進(jìn)行相關(guān)算法探索,這一階段下需要開(kāi)源數(shù)據(jù)集和商業(yè)成品數(shù)據(jù)集幫助企業(yè)快速完成產(chǎn)品驗(yàn)證。
第二階段是在算法研發(fā)期,企業(yè)明確了處理的場(chǎng)景和對(duì)傳感器算力的需求,需要基于定制化場(chǎng)景和對(duì)應(yīng)傳感器進(jìn)行相關(guān)數(shù)據(jù)采集、清洗和標(biāo)注服務(wù)。
第三階段則是算法持續(xù)優(yōu)化期。企業(yè)擁有了相對(duì)完整的數(shù)據(jù)模型,這時(shí)需要的數(shù)據(jù)偏向支持持續(xù)集成和迭代算法的數(shù)據(jù)即MLOps(人工智能研發(fā)運(yùn)營(yíng)一體化)所需要的數(shù)據(jù),引入類似軟件DevOps的概念。
而第三階段的數(shù)據(jù)需求變化意味著傳統(tǒng)軟件工程的瀑布式開(kāi)發(fā)逐漸轉(zhuǎn)化為數(shù)據(jù)的持續(xù)流轉(zhuǎn),通過(guò)體系、流程推動(dòng)算法與應(yīng)用的有效開(kāi)發(fā)和迭代,實(shí)現(xiàn)AI的敏捷開(kāi)發(fā),即實(shí)現(xiàn)AI工程化。
賈宇航還指出了AI工程化數(shù)據(jù)處理的三大特征——API協(xié)同中臺(tái)化,支持與不同企業(yè)數(shù)字底座無(wú)縫對(duì)接;專業(yè)的人工處理流程,隨著AI融入更多行業(yè)應(yīng)用,其處理內(nèi)容也變得越來(lái)越復(fù)雜,需要專業(yè)人員進(jìn)行高時(shí)效、高質(zhì)量的人工處理流程;還有就是數(shù)據(jù)安全性。
基于這三大特征,云測(cè)數(shù)據(jù)發(fā)布了面向AI工程化的新一代數(shù)據(jù)解決方案,從平臺(tái)工具、管理體系、數(shù)據(jù)安全三個(gè)維度延展產(chǎn)品服務(wù)。
平臺(tái)工具提供企業(yè)數(shù)據(jù)處理的各種工具和模板,并通過(guò)高度集成API實(shí)現(xiàn)數(shù)據(jù)底座無(wú)縫對(duì)接,幫助企業(yè)持續(xù)發(fā)掘數(shù)據(jù)價(jià)值。項(xiàng)目管理方面,針對(duì)人工數(shù)據(jù)處理流程中關(guān)于招聘、培訓(xùn)、績(jī)效考核及對(duì)應(yīng)項(xiàng)目管理、安全、企業(yè)責(zé)任、安全體系、相關(guān)行業(yè)知識(shí)背景培訓(xùn),云測(cè)數(shù)據(jù)總結(jié)出了一套完善的實(shí)踐方法路,包括一套完整的項(xiàng)目管理看板、績(jī)效看板持續(xù)追蹤對(duì)應(yīng)的項(xiàng)目進(jìn)度、任務(wù)進(jìn)度和數(shù)據(jù)質(zhì)量。
數(shù)據(jù)安全則是通過(guò)硬件配置、網(wǎng)絡(luò)安全、物理安全和人員安全管理實(shí)現(xiàn),完成了一套基于網(wǎng)絡(luò)VPN專線連接到云測(cè)自建數(shù)據(jù)標(biāo)注基地的端到端數(shù)據(jù)標(biāo)注安全交付方法,幫助企業(yè)完成數(shù)據(jù)合規(guī)、數(shù)據(jù)安全的相關(guān)數(shù)據(jù)操作流程。
云測(cè)數(shù)據(jù)還針對(duì)隱私安全設(shè)置了一系列嚴(yán)格措施,力圖做到步步保護(hù)、層層把關(guān),完善布局AI數(shù)據(jù)處理對(duì)實(shí)效性、準(zhǔn)確率和安全性的進(jìn)一步要求。同時(shí)云測(cè)數(shù)據(jù)還是滿足ISO27001和ISO27701標(biāo)準(zhǔn)的人工智能數(shù)據(jù)服務(wù)廠商,此外,云測(cè)數(shù)據(jù)還先后獲得ISO9001、ISO20000、CMMI3等相關(guān)認(rèn)證。
總結(jié)
每一家AI科技企業(yè)從初創(chuàng)到發(fā)展成熟,面對(duì)市場(chǎng)變化可能會(huì)經(jīng)歷以上的產(chǎn)品研發(fā)階段。云測(cè)數(shù)據(jù)將企業(yè)不同階段面臨的挑戰(zhàn)轉(zhuǎn)化為產(chǎn)品輸出,提供了一套全方位覆蓋的數(shù)據(jù)解決方案,未來(lái)隨著AI工程化快速落地,將助力越來(lái)越多的企業(yè)抓住市場(chǎng)機(jī)遇實(shí)現(xiàn)智能化迭代。