在行業(yè)的不斷發(fā)展探索之下,目前數(shù)據(jù)標(biāo)注的準(zhǔn)確率記錄不斷被刷新。在2020年國(guó)家級(jí)重大國(guó)際經(jīng)貿(mào)活動(dòng)服貿(mào)會(huì)上,云測(cè)數(shù)據(jù)發(fā)布了一項(xiàng)數(shù)據(jù)標(biāo)注領(lǐng)域的重要成果:其項(xiàng)目最高交付精準(zhǔn)度達(dá)到了99.99%——這是目前數(shù)據(jù)標(biāo)注領(lǐng)域可達(dá)到的最高服務(wù)標(biāo)準(zhǔn)。
99.99%,這不僅僅是數(shù)字的變化,更體現(xiàn)著人工智能對(duì)數(shù)據(jù)標(biāo)注精準(zhǔn)程度要求正在變得越來(lái)越高,對(duì)數(shù)據(jù)維度和樣本復(fù)雜性的需求也越來(lái)越高。隨著人工智能技術(shù)在各個(gè)行業(yè)的落地進(jìn)程不斷加速,質(zhì)量與效率成為了數(shù)據(jù)標(biāo)注行業(yè)新的共同追求。在這樣的背景之下,數(shù)據(jù)標(biāo)注又應(yīng)當(dāng)做到效率與質(zhì)量并存呢?
以云測(cè)數(shù)據(jù)為代表的企業(yè)開(kāi)發(fā)的工具為案例,目前來(lái)看,工具對(duì)數(shù)據(jù)標(biāo)注的價(jià)值有這三個(gè)體現(xiàn):
一是直接的操作輔助,例如對(duì)人臉進(jìn)行26點(diǎn)、54點(diǎn)、96點(diǎn)、206點(diǎn)的人臉關(guān)鍵點(diǎn)標(biāo)注、貼合度在3像素以內(nèi)的特定任務(wù)關(guān)鍵點(diǎn)追蹤,這使得標(biāo)注員的操作能夠更加精細(xì)化,并提升了標(biāo)注效率。
二是特殊數(shù)據(jù)的操作輔助,例如自動(dòng)駕駛中激光雷達(dá)形成的3D點(diǎn)云數(shù)據(jù)不同于攝像頭形成的2D圖像數(shù)據(jù),標(biāo)注起來(lái)更有難度也更可能出現(xiàn)偏差。通過(guò)融合標(biāo)注工具(把3D點(diǎn)云數(shù)據(jù)和2D圖像數(shù)據(jù)結(jié)合在一起對(duì)照)可有效提升不同維度數(shù)據(jù)的協(xié)同處理,提高標(biāo)注精準(zhǔn)度。
三是數(shù)據(jù)標(biāo)注的糾錯(cuò)保障,云測(cè)數(shù)據(jù)采用了基于規(guī)則的機(jī)器篩查方式,能夠在人工校驗(yàn)流程前根據(jù)所標(biāo)注項(xiàng)目的要求引入相關(guān)查錯(cuò)規(guī)則,進(jìn)一步保障了數(shù)據(jù)精度的提升。
當(dāng)然,機(jī)器篩查只是一種輔助,提高執(zhí)行系統(tǒng)平臺(tái)的流程化協(xié)作能力,準(zhǔn)確地把控從創(chuàng)建任務(wù)、分配任務(wù)、標(biāo)注流轉(zhuǎn)到質(zhì)檢/抽檢等環(huán)節(jié),可以更好的提高數(shù)據(jù)標(biāo)注的效率、質(zhì)量和安全。
在多元化的人工智能場(chǎng)景落地的過(guò)程中,AI數(shù)據(jù)質(zhì)量已經(jīng)成為人工智能行業(yè)發(fā)展的痛點(diǎn)?,F(xiàn)階段,各行業(yè)正在積極擁抱人工智能技術(shù),包括安防、金融、工業(yè)、醫(yī)療、教育等領(lǐng)域?qū)I技術(shù)的需求極大,高精度AI數(shù)據(jù)交付在助力AI產(chǎn)業(yè)場(chǎng)景化落地的同時(shí),不僅帶來(lái)了更好的用戶體驗(yàn),也進(jìn)一步加快了智能化時(shí)代的到來(lái),帶動(dòng)算力、算法等領(lǐng)域的振興。相信頭部和專業(yè)的AI數(shù)據(jù)服務(wù)企業(yè)將推動(dòng)人工智能產(chǎn)業(yè)落地進(jìn)程,加速未來(lái)的到來(lái)。