計算機視覺是深度學習中最熱門的研究領(lǐng)域,也是人工智能最受關(guān)注的落地方向之一。隨著圖像分類、對象檢測、目標跟蹤、語義分割、實例分割這五大計算機視覺關(guān)鍵技術(shù)的不斷發(fā)展,CV應用場景愈發(fā)的細分化、專業(yè)化,相應的CV模型也在逐漸專注于特定的場景,這對于訓練數(shù)據(jù)的要求提出了更高的標準。
計算機視覺應用落地面臨的數(shù)據(jù)挑戰(zhàn)
賈宇航在公開課中講到:“當下階段,訓練數(shù)據(jù)要更加貼合多樣的使用場景、更加注重數(shù)據(jù)精準度、更加要求專業(yè)技能知識,同時還要保證其隱私安全等要求?!彪S著計算機視覺的發(fā)展,尤其像對抗網(wǎng)絡、生成對抗網(wǎng)絡等一些相關(guān)的技術(shù)應用,如何定義應用場景和數(shù)據(jù)值得被訓練大有講究。
以面部識別技術(shù)為例,首先需要“定義的問題”,要考慮清楚其應用場景(室內(nèi)、室外等)、應用用戶(全臉、戴口罩、墨鏡等),以及識別的效率、數(shù)據(jù)精準度等等內(nèi)容;之后的“策略方法”則需要考慮如何采集標注數(shù)據(jù),從而應用于模型訓練。再經(jīng)過模型驗證環(huán)節(jié),如有特定的場景識別不精、就需要重新“定義問題”,一直到無問題才可順利進行部署。
關(guān)于計算機視覺應用落地面臨的數(shù)據(jù)挑戰(zhàn),賈宇航談到“尤其是產(chǎn)品到了發(fā)布前期,要面對最終交付的客戶、識別的精度、適用的落地場景等內(nèi)容,都對產(chǎn)品落地有著很深的影響。而「策略性的主動獲取+大規(guī)模高效高精標注」是很多處于產(chǎn)品發(fā)布、或者重大迭代更新的階段的CV產(chǎn)品首要面臨的數(shù)據(jù)挑戰(zhàn)。
計算機視覺應用落地中的數(shù)據(jù)選擇標準與實現(xiàn)路徑
云測數(shù)據(jù)總經(jīng)理賈宇航總結(jié)道:“隨著交付經(jīng)驗的不斷豐富,云測數(shù)據(jù)總結(jié)了計算機視覺產(chǎn)品商業(yè)化落地,訓練數(shù)據(jù)選擇的標準趨向于六大趨勢,分別是數(shù)據(jù)多維化、場景多元化、 樣本多樣化、內(nèi)容專業(yè)化、作業(yè)精細化、作業(yè)高效化。”
針對這幾大趨勢,AI數(shù)據(jù)服務領(lǐng)域頭部企業(yè)云測數(shù)據(jù)利用智能標注平臺提升CV數(shù)據(jù)標注質(zhì)量與效率 。
相對于文本或者音頻來說,計算機視覺涉及的數(shù)據(jù)維度很多元。云測數(shù)據(jù)的標注平臺做到了通用品類的全品類覆蓋,并提供全品類的多元需求任務模板導入,同時支持任意層級屬性添加;
云測數(shù)據(jù)在智能標注平臺質(zhì)檢保證中,實現(xiàn)了全作業(yè)流程內(nèi)網(wǎng)中自動流轉(zhuǎn),支持多層級質(zhì)檢,及不同檢驗模式,同時引入了特定規(guī)則用以輔助質(zhì)檢,以確保數(shù)據(jù)標注的高質(zhì)量和高效率;
同時,專注于研發(fā)標注平臺人性化操作,如在語義分割中,支持共邊,自動打點等功能;在車道線標注中,針對曲線光滑性要求的貝塞爾曲線;3D點云標注中,支持基于規(guī)則的自動貼合等等方式設(shè)置,來保證數(shù)據(jù)標注精度上升的同時,數(shù)據(jù)交付的高效性和大批量等需求。
在公開課的最后,賈宇航強調(diào)“云測數(shù)據(jù)一直致力于讓企業(yè)擁有高質(zhì)量AI數(shù)據(jù),成為企業(yè)的核心競爭壁壘?!必S富的場景數(shù)據(jù)是算法研究的保障和基石,訓練數(shù)據(jù)質(zhì)量的高低直接決定最終模型效果的好壞?,F(xiàn)階段,優(yōu)質(zhì)的訓練數(shù)據(jù)之于計算機視覺,就在于可以最大程度上提升計算機視覺產(chǎn)業(yè)落地的效率和穩(wěn)定性,為相關(guān)企業(yè)起到“護城河”作用,從而助力計算機視覺產(chǎn)業(yè)的蓬勃發(fā)展。