場景資源能力主要包括數(shù)據(jù)和人才兩個(gè)層面:高質(zhì)量的場景數(shù)據(jù)以及場景人才(領(lǐng)域?qū)<摇⑸疃扔脩舻龋_@與行業(yè)持續(xù)多年的深耕不無關(guān)系——企業(yè)懂得行業(yè)know-how,能夠根據(jù)客戶需求,快速找到并利用與場景最為貼合的數(shù)據(jù)和人才資源。
報(bào)告指出,數(shù)據(jù)標(biāo)注仍具有飛輪效應(yīng)。以往靠銷售渠道、人力成本等驅(qū)動(dòng)因素,服務(wù)商實(shí)現(xiàn)業(yè)務(wù)量增長,進(jìn)而贏得市場獲得口碑,獲得新客戶也會(huì)越來越容易。在技術(shù)和場景資源能力雙重驅(qū)動(dòng)下,數(shù)據(jù)處理能力越強(qiáng),大模型標(biāo)注經(jīng)驗(yàn)越豐富,落地案例越來越多,數(shù)據(jù)處理的可擴(kuò)展性和靈活性也越高。這樣一來,新創(chuàng)業(yè)公司入局門檻將進(jìn)一步提高,專業(yè)數(shù)據(jù)服務(wù)提供商更多機(jī)會(huì)將在垂直場景,幫助企業(yè)完成私有化部署。
根據(jù)《中國AIGC數(shù)據(jù)標(biāo)注產(chǎn)業(yè)全景報(bào)告》顯示,云測數(shù)據(jù)作為人工智能數(shù)據(jù)服務(wù)領(lǐng)先代表廠商,以高質(zhì)量、場景化的AI訓(xùn)練服務(wù)為基礎(chǔ),持續(xù)為智能駕駛、智慧城市、智能AIOT、智慧金融等眾多領(lǐng)域提供數(shù)據(jù)集、數(shù)據(jù)標(biāo)注平臺(tái)、數(shù)據(jù)管理工具、數(shù)據(jù)采集標(biāo)注等服務(wù)。
云測數(shù)據(jù)在今年發(fā)布了面向垂直行業(yè)大模型的數(shù)據(jù)解決方案。據(jù)介紹,該AI數(shù)據(jù)解決方案可為行業(yè)大模型提供從持續(xù)預(yù)訓(xùn)練、任務(wù)微調(diào)、評測聯(lián)調(diào)測試到應(yīng)用發(fā)布,全生命周期的高質(zhì)高效數(shù)據(jù),幫助垂直行業(yè)企業(yè)更好地落地大模型相關(guān)算法應(yīng)用。云測數(shù)據(jù)垂直行業(yè)大模型數(shù)據(jù)解決方案,可以為行業(yè)客戶深度定制數(shù)據(jù)采集方案,助力獲取高價(jià)值數(shù)據(jù),在面對微調(diào)任務(wù)會(huì)根據(jù)大模型落地場景特點(diǎn),提供包含QA-instruct、prompt等文本類任務(wù)項(xiàng)目和多模態(tài)大模型的相關(guān)能力支持。在完成微調(diào)后,云測數(shù)據(jù)通過垂直領(lǐng)域的人員和專家積累+評測體系和服務(wù),幫助企業(yè)對各個(gè)垂直應(yīng)用落地領(lǐng)域進(jìn)行評估。并通過以集成數(shù)據(jù)底座為核心的數(shù)據(jù)標(biāo)注平臺(tái),將難例數(shù)據(jù)回流完成清洗標(biāo)注,為更有效率的模型調(diào)優(yōu)做準(zhǔn)備。
隨著人工智能深入自動(dòng)駕駛、智慧醫(yī)療、智慧教育等諸多行業(yè)領(lǐng)域,AI算法對訓(xùn)練數(shù)據(jù)維度和樣本復(fù)雜性的要求變得越來越高,對數(shù)據(jù)標(biāo)注技術(shù)、標(biāo)注平臺(tái)能力、不同維度數(shù)據(jù)協(xié)同標(biāo)注等都提出了挑戰(zhàn)。云測數(shù)據(jù)總經(jīng)理賈宇航表示,當(dāng)前,大模型正處在產(chǎn)業(yè)落地前期,高質(zhì)量的數(shù)據(jù),是大模型實(shí)現(xiàn)產(chǎn)業(yè)化的關(guān)鍵要素。只有最大化地發(fā)揮AI訓(xùn)練數(shù)據(jù)的價(jià)值,推動(dòng)數(shù)據(jù)要素有序發(fā)展及高效利用,才能更好地幫助垂直行業(yè)相關(guān)企業(yè)可以更好的落地大模型相關(guān)算法應(yīng)用。