作為人工智能基石的數(shù)據(jù),發(fā)揮出越來(lái)越重要的作用,影響著人工智能場(chǎng)景應(yīng)用的最終效果。現(xiàn)階段,在各個(gè)細(xì)分應(yīng)用場(chǎng)景的需求下,人工智能對(duì)數(shù)據(jù)的還原度、準(zhǔn)確度提出了更高要求。
從細(xì)分結(jié)構(gòu)來(lái)看,隨著AI技術(shù)的不斷成熟,更多的場(chǎng)景和行業(yè)開(kāi)始嵌入使用AI技術(shù),比如教育、法律、智能駕駛、銀行金融等,這些AI行業(yè)應(yīng)用場(chǎng)景逐漸趨于長(zhǎng)尾和碎片化,產(chǎn)生了大量細(xì)分專(zhuān)業(yè)化的數(shù)據(jù)需求。比如道路安防攝像頭,攝像頭中囊括行人、機(jī)動(dòng)車(chē)、自行車(chē)數(shù)據(jù),卻唯獨(dú)缺少行人跌倒數(shù)據(jù);如在自動(dòng)駕駛領(lǐng)域,監(jiān)測(cè)系統(tǒng)需要采集駕駛員各種狀態(tài)數(shù)據(jù),但缺少疲勞狀態(tài)的數(shù)據(jù)等等。
云測(cè)數(shù)據(jù)的場(chǎng)景化數(shù)據(jù)采集實(shí)踐
這些數(shù)據(jù)采集需求相對(duì)復(fù)雜、聚焦,難度較大,對(duì)AI數(shù)據(jù)服務(wù)商的場(chǎng)景化采集能力提出了很高的要求。隨著人工智能對(duì)長(zhǎng)尾場(chǎng)景的數(shù)據(jù)需求進(jìn)一步擴(kuò)大,具有相關(guān)采集工具、資源、能力的數(shù)據(jù)采集標(biāo)注服務(wù)商將擁有極大的競(jìng)爭(zhēng)優(yōu)勢(shì)。為了進(jìn)一步滿足場(chǎng)景化數(shù)據(jù)的需求,數(shù)據(jù)采集標(biāo)注頭部企業(yè)云測(cè)數(shù)據(jù)首創(chuàng)了“數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室”,進(jìn)行相應(yīng)的場(chǎng)景化數(shù)據(jù)生產(chǎn)。
在數(shù)據(jù)標(biāo)注行業(yè),特定場(chǎng)景的數(shù)據(jù)在普通的場(chǎng)景下始終是可遇不可求的,比如馬路上的摔倒場(chǎng)景,如果真的調(diào)取某一個(gè)特定道路攝像頭的資料,符合“路人摔倒”要求的畫(huà)面也許在1000分鐘里都難以捕捉到一次,更不能滿足各種角度、各個(gè)時(shí)段、不同年齡、著裝、性別的AI模型學(xué)習(xí)要求。面對(duì)這種指向明確的需求,云測(cè)數(shù)據(jù)可以搭建特定的場(chǎng)景棚,邀請(qǐng)“演員”,模擬不同的形態(tài)進(jìn)行采集;為了采集不同的情緒在面部五官上的表現(xiàn),云測(cè)數(shù)據(jù)甚至還在橫店建立了一個(gè)數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室,專(zhuān)門(mén)邀請(qǐng)橫店具有面部表情表現(xiàn)力的群眾演員,為企業(yè)錄制精準(zhǔn)的情緒,以滿足需要識(shí)別情緒的場(chǎng)景。據(jù)了解,云測(cè)數(shù)據(jù)也是現(xiàn)在市面上唯一采用群演來(lái)做人工智能數(shù)據(jù)采集的數(shù)據(jù)服務(wù)商。
正如云測(cè)數(shù)據(jù)總經(jīng)理賈宇航所言,云測(cè)數(shù)據(jù)的采標(biāo)業(yè)務(wù)正是整個(gè)人工智能產(chǎn)業(yè)所迫切需要的,橫店群演的采集只是場(chǎng)景化數(shù)據(jù)的一個(gè)縮影。根據(jù)企業(yè)數(shù)據(jù)需求,還原AI應(yīng)用真實(shí)場(chǎng)景,這不僅需要深入理解需求,還需要快速構(gòu)建場(chǎng)景。這背后,需要云測(cè)數(shù)據(jù)根據(jù)項(xiàng)目經(jīng)驗(yàn)及實(shí)地調(diào)查來(lái)明確需求,此后再細(xì)化、優(yōu)化需求,運(yùn)用專(zhuān)業(yè)的軟/硬件設(shè)備,以達(dá)到覆蓋盡可能多的實(shí)際場(chǎng)景及邊際場(chǎng)景的目的,保證采集數(shù)據(jù)契合算法模型,為人工智能提供高精度的采集數(shù)據(jù),保證算法訓(xùn)練所需數(shù)據(jù)的純凈。
場(chǎng)景化數(shù)據(jù)采集能力是行業(yè)趨勢(shì)
從AI應(yīng)用迭代、用戶(hù)體驗(yàn)完善的角度來(lái)看,AI應(yīng)用需更貼合具體使用場(chǎng)景的數(shù)據(jù)進(jìn)行迭代更新。《2020年中國(guó)AI數(shù)據(jù)服務(wù)行業(yè)研究報(bào)告》中指出,隨著互聯(lián)網(wǎng)技術(shù)發(fā)展,市場(chǎng)AI需求愈發(fā)明顯,同時(shí)在經(jīng)濟(jì)、政策不斷利好下,AI數(shù)據(jù)服務(wù)行業(yè)市場(chǎng)前景廣闊。優(yōu)秀的AI數(shù)據(jù)服務(wù)商作為人工智能產(chǎn)業(yè)上游的關(guān)鍵,必須要具備三種能力之一就是“對(duì)場(chǎng)景數(shù)據(jù)深度還原的采集能力”。
人工智能對(duì)數(shù)據(jù)提出的更高要求,展現(xiàn)了在人工智能產(chǎn)業(yè)化落地進(jìn)程中,數(shù)據(jù)正在發(fā)揮的重要作用。場(chǎng)景化、高精度的數(shù)據(jù)和專(zhuān)業(yè)化、技術(shù)化的數(shù)據(jù)服務(wù),將成為未來(lái)3-5年人工智能全速發(fā)展的重要突破口,加速人工智能產(chǎn)業(yè)化落地。