阿里巴巴iDST團隊以90.46%的準確率奪得KITTI排名第一

據了解,此次重大技術突破是由阿里巴巴iDST視覺計算研究員華先勝領導的團隊完成。他們提出了基于區(qū)域融合決策和上下文相關的多任務深度神經網絡,用于復雜場景下的車輛檢測任務,重點解決其中多視角,多姿態(tài)以及車輛遮擋等問題。

在網絡結構設計上,團隊利用反卷積操作提高了小目標的召回率,同時拼接了多層特征以融合低層的局部信息和高層的語義信息,提高了邊框定位的準確率。在訓練過程中,還借鑒了GAN(生成對抗網絡)中的對抗訓練模式。

華先勝表示,“現在我們已經將這樣的技術集成到阿里云ET當中,并在城市大腦中得以應用。它能夠幫助城市大腦準確的看懂車流信息,快速的做出全局性判斷”。華先勝是視覺識別和搜索領域的國際級權威學者,曾獲選國際電氣與電子工程協(xié)會院士(IEEE Fellow)、美國計算機協(xié)會ACM杰出科學家。

城市大腦是包括阿里云在內的13家企業(yè)聯(lián)合杭州市政府發(fā)起的項目,旨在構建一個城市級的人工智能中樞,讓城市能夠與人類友好互動。這其中分析視頻是城市大腦獲取信息的關鍵。

以交通治理為例,通過這項技術,城市大腦通過普通攝像頭就可以感知復雜路況下車輛的運行狀態(tài)和軌跡,對這些數據進行實時分析?;诖耍M行多種智能交通優(yōu)化。在視頻數據處理規(guī)模上,全球罕有。

在視覺計算領域的持續(xù)攻堅,是阿里巴巴“NASA”計劃的一部分。該計劃聚焦于機器學習、芯片、IoT、操作系統(tǒng)、生物識別等核心領域,他們希望能解決10年、20年后的困難。此前,已在光量子計算機、全浸沒液冷服務器等方面取得重大進展。

KITTI是目前國際上最大的自動駕駛場景下的計算機視覺算法評測數據集,可以用于評測目標檢測等計算機視覺技術在復雜真實環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數據,有大量的微小目標、欠曝和過曝、多種視角變化以及各種遮擋情況。

 

分享到

xiesc

相關推薦