其中,云測(cè)數(shù)據(jù)作為唯一一家AI數(shù)據(jù)服務(wù)領(lǐng)域頭部企業(yè),與華為、百度、京東、中原銀行等數(shù)十家領(lǐng)先科技公司,大型金融機(jī)構(gòu)、運(yùn)營商共同參與了本次標(biāo)準(zhǔn)編寫,對(duì)企業(yè)機(jī)構(gòu)發(fā)展人工智能研發(fā)運(yùn)營管理體系具有重要的引導(dǎo)和借鑒作用。
尤其在AI數(shù)據(jù)服務(wù)領(lǐng)域,數(shù)據(jù)質(zhì)量的好壞是決定AI應(yīng)用落地效果的重要因素。云測(cè)數(shù)據(jù)參與編寫的“數(shù)據(jù)處理”部分有力地推動(dòng)了AI數(shù)據(jù)服務(wù)領(lǐng)域構(gòu)建標(biāo)準(zhǔn)化體系,為AI模型快速獲取高質(zhì)量訓(xùn)練數(shù)據(jù)提供了科學(xué)方法論。
高質(zhì)量數(shù)據(jù)是如何煉成的?
開發(fā)AI模型需要基于模型訓(xùn)練要求“定制”大量數(shù)據(jù),但這些數(shù)據(jù)不是AI應(yīng)用所需的高質(zhì)量訓(xùn)練數(shù)據(jù)。在云測(cè)數(shù)據(jù)參與編寫的數(shù)據(jù)處理部分指出,數(shù)據(jù)需要經(jīng)過處理過程,包括預(yù)處理、標(biāo)注和版本管理,以便減少數(shù)據(jù)異常、缺失、冗余等問題,保證模型訓(xùn)練效果。
數(shù)據(jù)預(yù)處理指數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)增強(qiáng)的過程。通過人工或機(jī)器輔助篩選方式,再基于特定規(guī)則,篩選出有價(jià)值的數(shù)據(jù),然后轉(zhuǎn)換成適合數(shù)據(jù)處理的描述形式,再基于現(xiàn)有數(shù)據(jù)變換出更多新的數(shù)據(jù),提高模型泛化能力。
接下來是數(shù)據(jù)標(biāo)注,數(shù)據(jù)標(biāo)注是把像素、語音信號(hào)、文本等內(nèi)容轉(zhuǎn)換成機(jī)器可理解的數(shù)據(jù),再進(jìn)行識(shí)別處理,是AI模型能學(xué)習(xí)和準(zhǔn)確預(yù)測(cè)的關(guān)鍵。支撐AI應(yīng)用質(zhì)量的背后是算法精度,因此數(shù)據(jù)標(biāo)注的精確度能直接影響AI應(yīng)用的質(zhì)量。
實(shí)際上,AI數(shù)據(jù)服務(wù)市場(chǎng)最初就是圍繞數(shù)據(jù)標(biāo)注產(chǎn)業(yè)延展壯大,而隨著AI數(shù)據(jù)選擇標(biāo)準(zhǔn)的形成,數(shù)據(jù)質(zhì)量,行業(yè)經(jīng)驗(yàn)和日漸豐富的場(chǎng)景對(duì)AI應(yīng)用有所影響,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)也開始走向細(xì)分市場(chǎng)。
作為AI數(shù)據(jù)服務(wù)市場(chǎng)的領(lǐng)頭羊,云測(cè)數(shù)據(jù)也在同步完善整體AI數(shù)據(jù)生態(tài),細(xì)化和規(guī)范數(shù)據(jù)服務(wù)。面向智能駕駛、智慧城市、智能家居、智慧金融、新零售等眾多領(lǐng)域提供一站式數(shù)據(jù)處理服務(wù),提供通用數(shù)據(jù)集、數(shù)據(jù)標(biāo)注平臺(tái)&數(shù)據(jù)管理系統(tǒng)等生產(chǎn)工具,實(shí)現(xiàn)“數(shù)據(jù)原料”到最后的“數(shù)據(jù)成品”全鏈條打通,持續(xù)為計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理、知識(shí)圖譜等AI主流技術(shù)領(lǐng)域提供高價(jià)值數(shù)據(jù)支持。實(shí)現(xiàn)場(chǎng)景數(shù)據(jù)專業(yè)化、高質(zhì)量交付,幫助科技企業(yè)更快更好地實(shí)現(xiàn)AI應(yīng)用成功落地。
總結(jié)
隨著數(shù)據(jù)的指數(shù)級(jí)增長,我們的新型人工智能應(yīng)用開發(fā)將要求更高的數(shù)據(jù)質(zhì)量來作為使用標(biāo)準(zhǔn),加速縮短我們與未來的距離,期待云測(cè)數(shù)據(jù)助力更多AI應(yīng)用場(chǎng)景化落地、更多傳統(tǒng)企業(yè)完成智能化轉(zhuǎn)型的精彩表現(xiàn)!