車東西(公眾號:chedongxi)

文 | 肖涵

自動駕駛技術經過多年發(fā)展,已經進入到了落地的關鍵時期,媒體和公眾往往也喜歡將視線都聚焦在自動駕駛公司身上。

但在長沙、廣州等地已經落地行駛的無人出租車背后,其實都離不開AI數(shù)據(jù)采集標注這個工種。

▲自動駕駛數(shù)據(jù)標注圖示

正是海量高質量AI測數(shù)據(jù)的“喂養(yǎng)”,才讓無人車上搭載的AI算法能夠感知識別道路上的物體,可以說數(shù)據(jù)訓練對于自動駕駛來講,發(fā)揮著“眼睛”的作用,如果不能正確感知道路環(huán)境,智能駕駛的決策系統(tǒng)就無法正常工作。

那么自動駕駛公司到底需要什么樣的數(shù)據(jù)?背后的AI數(shù)據(jù)采集和標注工作又是如何進行的呢?

帶著這些疑問,車東西與國內頭部數(shù)據(jù)采集標注公司云測數(shù)據(jù)總經理賈宇航進行了一次長達90分鐘的深度對話,揭開了AI數(shù)據(jù)采集標準行業(yè)的神秘面紗。

▲云測數(shù)據(jù)房山辦公區(qū)

一、自動駕駛頭部企業(yè)的特征:數(shù)據(jù)量第一

谷歌Waymo是全球公認的自動駕駛領頭羊,但官方在宣傳時,其實很少直接說自己的技術如何厲害,不過其往往會重點強調一個數(shù)據(jù),就是自己的路測里程數(shù),超過多少多少萬英里。

在此前Waymo公布第五代自動駕駛系統(tǒng)時,其實際路測里程已經到達2000萬英里(3200萬公里),虛擬測試里程更是超過了160億公里。

▲Waymo的無人車在街頭采集數(shù)據(jù)

自動駕駛軟件的核心環(huán)節(jié)為感知和決策。

為了實現(xiàn)更好的感知結果,大部分公司都會引入深度學習等AI技術。而想讓深度學習的模型對某一類物體的識別率足夠精準,就需要大量該類物體的不同數(shù)據(jù),例如圖像、視頻、3D點云等。

與此同時,無人車想要量產,還必須要能夠應付各類小概率事件(比如十字路口突然有行人摔倒在地)的情況,為了讓決策算法能夠適應這種小概率事件,自動駕駛公司也需要有這種小概率事件的數(shù)據(jù)進行針對性地研發(fā)和測試。

所以總結一下就是,無論在感知還是決策環(huán)節(jié),自動駕駛公司都需要大量的交通數(shù)據(jù)來進行研發(fā)和測試,數(shù)據(jù)量就決定了自動駕駛公司的技術水準。

這正是Waymo為什么一直強調自家數(shù)據(jù)量足夠大的原因。

除了Waymo,特斯拉也在量產車上部署了一個影子模式,就是在人類駕駛員開車時,其名為Autopilot的L2級自動駕駛系統(tǒng)也會工作,去收集一些特定數(shù)據(jù),然后上傳到后臺來優(yōu)化Autopilot系統(tǒng),并逐步從L2升級到FSD(L4級完全自動駕駛)。

▲特斯拉的L2級自動駕駛系統(tǒng)表現(xiàn)極佳

特斯拉旗下的車型目前總銷量超過100萬臺,按照每臺車2萬公里/年的行駛里程來算,特斯拉每年理論上最多可收集200億公里的實際路測數(shù)據(jù)(實際情況只收集特定數(shù)據(jù))。

正是這樣的數(shù)據(jù)規(guī)模,才讓特斯拉的Autopilot系統(tǒng)遙遙領先于奔馳、寶馬、大眾等傳統(tǒng)車企,并且不斷推出像是Navgate on Autopilot、智能召喚、紅綠燈識別等新功能。

總結來看,自動駕駛技術領先的企業(yè),數(shù)據(jù)量一定領先。

二、自動駕駛爭奪戰(zhàn)打響 對高質數(shù)據(jù)需求增加

自動駕駛技術應用后,不僅僅能夠解放人類駕駛員,還能組成智慧交通體系提升整個社會的通行效率,并改變網約車行業(yè)、汽車行業(yè)、運輸行業(yè)甚至是零售行業(yè)(例如移動無人商店),意義重大。

所以在谷歌Waymo研發(fā)數(shù)年后,中國、美國、歐洲、日韓等地區(qū)也相繼涌現(xiàn)出大量自動駕駛公司,而像是蘋果、英特爾、百度、上汽、通用、本田等IT巨頭、車企巨頭也加入到戰(zhàn)局之中,一場席卷全球的自動駕駛技術爭奪戰(zhàn)已然打響。

正如前文所言,在研發(fā)高等級自動駕駛技術時,還原實際場景的路測數(shù)據(jù)或交通數(shù)據(jù),是關鍵“燃料”。在這場自動駕駛技術爭奪戰(zhàn)的背后,高質量的數(shù)據(jù)已然成為各大車企護城河建設的重中之重。

▲美國街頭的Waymo無人車

為了助力本國企業(yè)搶占自動駕駛技術高地,各國政府也在迅速出臺政策為技術應用落地鋪路,并規(guī)范行業(yè)發(fā)展。

例如今年2月份,發(fā)改委、工信部、財政部等11部委聯(lián)合印發(fā)的《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》,給了智能汽車一個較為清晰準確的發(fā)展時間規(guī)劃,在業(yè)內人士看來,“戰(zhàn)略”勾勒出智能汽車發(fā)展的“遠大前景”。

例如北京最近出臺的路測規(guī)定,已經允許無人車進行載人測試(即無人出租車可以上路測試了),但同時也提出了一系列要求,比如想要申請載人測試,需要先通過實車+仿真測試,且此前的無載人測試中,最近1年內不能出現(xiàn)過交通事故。

毫無疑問,隨著自動駕駛競賽的逐漸白熱化和政策的不斷演變,自動駕駛行業(yè)對行駛過程中涉及的真實場景數(shù)據(jù)的需求量可謂是日益劇增,誰擁有更多的數(shù)據(jù),誰就能夠在這場爭奪戰(zhàn)中取勝。而像特斯拉和Waymo這種車企采集到的數(shù)據(jù)又十分有限,所以高質量的自動駕駛數(shù)據(jù)提供商成為了整個行業(yè)的命脈之源。

三、云測數(shù)據(jù)深耕質量 致力于為行業(yè)提供好數(shù)據(jù)

自動駕駛研發(fā)離不開數(shù)據(jù)的支持,但數(shù)據(jù)也并非是“傻多”,還需要質量到位才能發(fā)揮作用。

云測數(shù)據(jù)總經理賈宇航告訴車東西,高質量的數(shù)據(jù)有三個大框架——還原場景、大數(shù)據(jù)量、標注精準度高。

還原場景就是說自動駕駛數(shù)據(jù)要有針對性,比如某自動駕駛公司想訓練一下無人車應對十字路口行人摔倒這種突發(fā)情況的能力,那么算法需要的場景數(shù)據(jù)就必須是發(fā)生在十字路口,如果是高速公路則必然不行。

同樣的,即使是在十字路口這一特定場景下,還要盡可能多的讓數(shù)據(jù)豐富起來,比如是白天、黑夜、雨天、陰天的十字路口,同時行人的衣著、摔倒的姿勢、過程,也要盡可能的覆蓋更多的可能性。

只有這樣,才能讓無人車上的AI技術完整識別所需場景,并作出正確決策。

對自動駕駛公司來說,想要收集到類似“路口行人摔倒”的場景數(shù)據(jù),自然十分耗時耗力。

為了解決這一難題,云測數(shù)據(jù)在北京、橫店、天津等地搭建了場景實驗室,為的就是能夠模擬還原不同的場景來進行數(shù)據(jù)采集。

▲云測數(shù)據(jù)的成員在搭建場景實驗室

“比如我們在我們自己的數(shù)據(jù)采集基地搭建了路口這個場景后,會招募上千名群演過來模仿路人摔倒的情況,每個人的衣著、行為舉止都不一樣,并且還會考慮到白天、黑夜、黃昏等不同的光照條件,來還原客戶所需要的場景數(shù)據(jù),做到足夠真實。”賈宇航這樣說道。

通常情況下,云測數(shù)據(jù)團隊會使用自動駕駛公司提供的無人車來采集數(shù)據(jù),以完美匹配該公司的傳感器設定。而如果暫無車輛可用,云測數(shù)據(jù)團隊也擁有自購的各類激光雷達、攝像頭等硬件設備,并擁有專業(yè)人員進行傳感器標定,可以滿足不同自動駕駛公司需求。

采集足夠豐富的數(shù)據(jù)只是提供“養(yǎng)料”的第一步,隨后還要對數(shù)據(jù)中的關鍵物體(例如車輛、行人、甚至是固定物體)進行標注,才能供深度學習算法使用。

數(shù)據(jù)標注工作不僅需要標注人員擁有特定領域知識來保證數(shù)據(jù)標注的精準性,同時又對標注工具的熟練使用、以及作業(yè)中的效率保證、標準化流轉管理等等眾多因素有著要求。對于自動駕駛公司來說,將數(shù)據(jù)標注工作交給云測數(shù)據(jù)這類專業(yè)公司其實是最好的選擇。

這方面,云測數(shù)據(jù)在華東、華南、華北等地擁有著自建的數(shù)據(jù)標注基地,通過具有自主知識產權的標注平臺和專業(yè)的標注人員團隊,為高質量的AI數(shù)據(jù)交付提供著堅實支撐、

“數(shù)據(jù)標注的準確率和貼合度至關重要,比如要在一個2D圖片或3D點云圖里標注出汽車,要盡可能的不出現(xiàn)錯標和漏標的情況。同時,標注的矩形框還要盡可能的與物體貼合?!辟Z宇航解釋道,“云測數(shù)據(jù)利用自主開發(fā)的標注工具,即使是3D點云圖像,也可以保證數(shù)據(jù)標注的流暢性和時效性,以及行業(yè)內領先的數(shù)據(jù)標注精準度。而像是2D圖像中的標度貼合度,也可以做到5個像素以內?!?/p>

▲云測數(shù)據(jù)的團隊在進行3D點云標注

正是定制化的場景、豐富的數(shù)據(jù)量,還有高質量的標注結果,讓云測數(shù)據(jù)獲得了行業(yè)內幾乎所有的自動駕駛客戶認可,既包括自主、合資車企,大型Tier1,也有做無人出租車的自動駕駛公司。

據(jù)賈宇航介紹,涉足自動駕駛領域3年多來,云測數(shù)據(jù)僅在難度較大的3D點云數(shù)據(jù)上,就大概輸出了接近1000萬幀的數(shù)據(jù),可謂是經驗豐富。

“我們的產品價格處于主流區(qū)間,不僅能提供豐富的高質量場景化數(shù)據(jù),還能保證項目的高效交付,獲得了很多客戶的好評,有些自動駕駛公司還會直接跟我們簽訂年度服務協(xié)議,把他們采集的數(shù)據(jù)交給我們來進行標注?!痹趯υ捵詈?,賈宇航這樣說道。

分享到

songjy

相關推薦