目前人工智能已通過手機、音箱、汽車等產品,逐步走入千家百戶。這背后離不開人工智能發(fā)展的三座基石,算法、算力、和數據。離開數據談人工智能應用,與“無米之炊”無異。人工智能是通過大批量基于特定標注規(guī)則后,學習的方法論。“數據標注”通過數據標注師將像素、語音信號、文本內容等轉換為機器能理解,能看懂的數據內容,這樣機器才能習得識別處理。因此,數據標注工作自然也就成為將原始數據變成算法可用AI數據的關鍵步驟,是關乎整個AI產業(yè)的基礎,更是機器感知現實世界的源點。

當前AI發(fā)展對于數據的需求非常大,但對于AI來說數據量并非等于數據質量,只有高質量的AI數據才能對算法起到決定性作用,進而產生生產力,而精準度有偏差的海量數據對AI不但無利反而有害。

“通常來說,數據標注得越準確,數量越多,模型效果越好,最后的AI產品效果就越好?!?云測數據總經理賈宇航說,“云測數據作為高質量AI數據的倡導者和踐行者,有責任也有義務推動行業(yè)向更高質量發(fā)展。云測數據發(fā)布最高99.99%精準度的標準,也是向外傳遞數據標注高質量發(fā)展信心?!?/p>

為了產出更高質高效的AI數據,云測數據在自建數據標注基地和數據場景實驗室的基礎上,持續(xù)對技術軟硬件設施進行投入,不斷提升數據標注工具的技術含量,直接拉高了行業(yè)的進入門檻。同時,云測數據建立了一整套的標準化流程、方法論和人員機制,來保證數據服務團隊的專業(yè)能力,以確保輸出”高質精準”的數據。

用好云測數據這項標準,人工智能產業(yè)化指日可待

另外,為了做到更高精度、更高效率的支持,云測數據采用的基于規(guī)則的機器篩查方式,在人工校驗流程前根據所標注內容要求,引入相關查錯規(guī)則,為數據精度提升更有保障;同時支持豐富的標注類型,針對不同類型物體標注方式和方法多種多樣,如線段分為直線、折現、曲線、貝塞爾曲線;同時云測數據還支持多種不同維度數據融合后的數據處理方法。

“隨著人工智能落地的全面開花,各個企業(yè)對數據的精準度、安全性又提出了新的挑戰(zhàn),行業(yè)需要一批高能力、高素質的數據服務團隊,為助力人工智能應用落地提供AI數據支撐?!痹茰y數據總經理負責人表示。

據悉,在9月23日-35日舉辦的中國創(chuàng)新創(chuàng)業(yè)成果交易會上,云測數據將對“99.99%的最高交付精準度”背后所支撐的技術成果和服務能力進行詳細說明,同時詳解智慧城市、智能家居、智能駕駛、智慧金融這四大場景的“AI訓練數據服務方案”。在未來,希望云測數據能夠繼續(xù)致力于提供更高質量的場數據標注服務,并一直推動數據行業(yè)的場景化、精細化和提升數據隱私安全性,并引領著行業(yè)規(guī)范發(fā)展。

分享到

songjy

相關推薦