百度 Apollo已更新到2.5版本 但其數(shù)據(jù)會(huì)如何開(kāi)放最值得關(guān)注
轉(zhuǎn)眼間,百度的 Apollo 平臺(tái)已經(jīng)公布了一年多了。這項(xiàng)聲勢(shì)浩大的自動(dòng)駕駛開(kāi)源計(jì)劃到現(xiàn)在為止已經(jīng)更新到了 Apollo2.5 版本。Apollo 平臺(tái)陸續(xù)開(kāi)放了高精度地圖、參考硬件、云計(jì)算、視覺(jué)感知等眾多模塊。在最新的 2.5 版本中,Apollo 的方案已經(jīng)開(kāi)放了高速公路上的自動(dòng)駕駛能力,并開(kāi)始開(kāi)放車(chē)輛控制相關(guān)的模塊。
對(duì)于汽車(chē)行業(yè)來(lái)說(shuō),這個(gè)迭代速度可以說(shuō)是非??炝恕?/p>
百度 Apollo 的數(shù)據(jù)開(kāi)放計(jì)劃
其實(shí)除了迭代速度之外,百度 Apollo 計(jì)劃還有一個(gè)需要重視的舉措——開(kāi)放數(shù)據(jù)。
自動(dòng)駕駛的核心在于需要深度的 AI 算法,這又依靠海量大數(shù)據(jù)和高性能計(jì)算。數(shù)據(jù)分成原始數(shù)據(jù)、標(biāo)注數(shù)據(jù)、邏輯數(shù)據(jù)和仿真數(shù)據(jù)四個(gè)層次。原始數(shù)據(jù)由 Lidar、攝象頭、雷達(dá)、GNSS、IMU、CAN 總線等數(shù)據(jù)構(gòu)成。光有原始數(shù)據(jù)還不夠,為了做深度學(xué)習(xí)養(yǎng)料,要教會(huì)機(jī)器數(shù)據(jù)表達(dá)的是什么,這就需要標(biāo)注。進(jìn)而需要對(duì)邏輯的理解和各種模型的刻畫(huà)。要呈現(xiàn)一個(gè)完整的自動(dòng)駕駛要解決相當(dāng)多的問(wèn)題,還需要構(gòu)建更廣泛的場(chǎng)景,重組出無(wú)窮的場(chǎng)景,成為仿真數(shù)據(jù)。
熟悉自動(dòng)駕駛的人都知道,數(shù)據(jù)是驅(qū)動(dòng)整個(gè)技術(shù)優(yōu)化的核心資源。很多汽車(chē)廠商對(duì)數(shù)據(jù)十分珍視,輕易絕不愿意拿出來(lái)。
而作為一個(gè)開(kāi)放平臺(tái),百度 Apollo 數(shù)據(jù)作為重要組成部分也開(kāi)放了出來(lái)。在 Apollo1.0 版本發(fā)布時(shí),就率先將百度積累多年的數(shù)據(jù)資源對(duì)外開(kāi)放,包括 2D 紅綠燈檢測(cè)、2D 紅綠燈檢測(cè)及 Road Hackers 等。此后的 Apollo1.5、2.0 及 2.5 版本中,Apollo 的數(shù)據(jù)開(kāi)放類(lèi)型及數(shù)據(jù)量也都持續(xù)擴(kuò)大。
在今年的 3 月份,百度又公布了一個(gè)全新的模塊:ApolloScape。你可以把它看作是 Apollo 平臺(tái)下一個(gè)相對(duì)獨(dú)立的「子品牌」。它的本質(zhì)是一個(gè)公開(kāi)的數(shù)據(jù)集,包含自動(dòng)駕駛數(shù)據(jù)和仿真技術(shù)兩個(gè)部分。
自動(dòng)駕駛數(shù)據(jù)將包括具有高分辨率圖像和像素級(jí)別標(biāo)注的 RGB 視頻,具有場(chǎng)景級(jí)語(yǔ)義分割的密集三維點(diǎn)云、基于雙目立體視覺(jué)的視頻和全景圖像。數(shù)據(jù)集中提供的圖像為通過(guò)采集系統(tǒng)每米采集一幀的方式采集,分辨率為 3384 x 2710。
百度數(shù)據(jù)采集車(chē)是配備了高分辨率相機(jī)和 Riegl 采集系統(tǒng)的中型 SUV。采集場(chǎng)景包括不同城市的不同交通狀況的道路行駛數(shù)據(jù),平均每張圖中移動(dòng)障礙物的數(shù)量從幾十到上百不等。(例如,單張圖像中多達(dá) 162 輛交通工具或 80 名行人)
除了采集數(shù)據(jù)之外,百度還會(huì)用自己的視覺(jué)感知算法給每一幀畫(huà)面中的像素做相應(yīng)的語(yǔ)義分割。當(dāng)前支持的語(yǔ)義分割種類(lèi)已經(jīng)達(dá)到了 25 項(xiàng),包括車(chē)輛、行人、自行車(chē)、摩托車(chē)、道路、交通標(biāo)識(shí)等等。這樣的分割有助于開(kāi)發(fā)者可以在這個(gè)數(shù)據(jù)集中直接訓(xùn)練以及驗(yàn)證自己的自動(dòng)駕駛算法。換言之這套數(shù)據(jù)集是可以讓開(kāi)發(fā)者直接拿來(lái)就用的,而不用再做初始的數(shù)據(jù)解析。
截止到今年 3 月 8 日,百度共發(fā)布了包含 74555 幀視頻圖像序列及對(duì)應(yīng)的逐像素標(biāo)注和姿態(tài)文件。從今年到 2019 年底,百度計(jì)劃在數(shù)據(jù)集中陸續(xù)加入更改多傳感器支持以及更廣泛的數(shù)據(jù)覆蓋面。同時(shí),百度還計(jì)劃在今年年底引入「眾包」的數(shù)據(jù)采集模式,用于收集更多的罕見(jiàn)交通場(chǎng)景。
而在仿真技術(shù)上,百度也將逐漸開(kāi)放行駛軌跡制定,駕駛決策模塊,以及感知融合和導(dǎo)航等模塊。這也是為了能夠更方便的讓開(kāi)發(fā)者驗(yàn)證和訓(xùn)練自己的算法。
ApolloScape 的定位
可以明顯的感受到,百度希望通過(guò) ApolloScape 這個(gè)數(shù)據(jù)集吸引到更多的開(kāi)發(fā)者來(lái)參與到 Apollo 計(jì)劃中。但是為何要建立一個(gè)獨(dú)立的子品牌?這里有什么特殊的定位嗎?
在 4 月 24 日 ApolloScape 舉辦的一場(chǎng)學(xué)術(shù)峰會(huì)中,小編找到了答案:來(lái)參加會(huì)議的分享者全部是來(lái)自中、美、德、澳等國(guó)內(nèi)外的自動(dòng)駕駛/機(jī)器視覺(jué)研究專(zhuān)家。ApolloScape 正在嘗試打通自動(dòng)駕駛產(chǎn)業(yè)界和學(xué)術(shù)界,搭建自動(dòng)駕駛產(chǎn)學(xué)研結(jié)合的交流平臺(tái)。
在自動(dòng)駕駛領(lǐng)域一直有兩個(gè)研究方向:落地應(yīng)用和前沿學(xué)術(shù)。
落地應(yīng)用: 主要指的是汽車(chē)廠商和零部件供應(yīng)商,他們更加關(guān)注自動(dòng)駕駛技術(shù)如何在現(xiàn)有產(chǎn)品上落地,以及自動(dòng)駕駛會(huì)對(duì)汽車(chē)行業(yè)的商業(yè)模式產(chǎn)生怎樣的影響。
前沿學(xué)術(shù): 主要指的是一些知名高校、研究機(jī)構(gòu)或者是創(chuàng)新科技公司。他們主要關(guān)注的是機(jī)器視覺(jué)、人工智能等技術(shù)在自動(dòng)駕駛推動(dòng)下的技術(shù)革新。
由于落地應(yīng)用上直接關(guān)系到商業(yè)利益,因此一般情況下,汽車(chē)廠商對(duì)于數(shù)據(jù)的態(tài)度都是比較封閉的。
反倒是以高校為主的前沿學(xué)術(shù)領(lǐng)域,由于大家的目標(biāo)都是推動(dòng)技術(shù)創(chuàng)新,且相互之間利益關(guān)系相對(duì)簡(jiǎn)單。因此對(duì)數(shù)據(jù)開(kāi)放的接受度很高。
其實(shí)在前沿學(xué)術(shù)領(lǐng)域,已經(jīng)出現(xiàn)過(guò)幾個(gè)自動(dòng)駕駛的開(kāi)放數(shù)據(jù)集了,最著名的應(yīng)該就是由德國(guó)卡爾斯魯厄理工學(xué)院和豐田美國(guó)技術(shù)研究院聯(lián)合創(chuàng)辦 KITTI。很多研究機(jī)構(gòu)都會(huì)在 KITTI 數(shù)據(jù)集內(nèi)驗(yàn)證、評(píng)估自己的視覺(jué)算法。甚至還將 KITTI 作為一個(gè)評(píng)判標(biāo)準(zhǔn)來(lái)做算法排名。
百度這次的 ApolloScape 其實(shí)與 KITTI 的定位是一致的,只不過(guò)將數(shù)據(jù)的核心采集點(diǎn)設(shè)定在了中國(guó)。由于中國(guó)在政策以及駕駛環(huán)境上的特殊性,一般的研究機(jī)構(gòu)(尤其是海外的)要是想要靠自己在中國(guó)獲得駕駛數(shù)據(jù)是非常困難的。而百度這次的數(shù)據(jù)集就是為這些研究機(jī)構(gòu)提供了便利。
Kitti,CityScapes 和 ApolloScape 關(guān)于數(shù)據(jù)實(shí)例的對(duì)比
據(jù)了解,Apollo 開(kāi)放平臺(tái)還與加州大學(xué)伯克利分校在 CVPR 2018(IEEE 國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議)期間聯(lián)合舉辦自動(dòng)駕駛研討會(huì)(Workshop on Autonomous Driving),基于 ApolloScape 的大規(guī)模數(shù)據(jù)集定義了多項(xiàng)任務(wù)挑戰(zhàn)。WAD 已正式于國(guó)外知名機(jī)器學(xué)習(xí)競(jìng)賽平臺(tái) Kaggle 上線 Video Segmentation Challenge(視頻場(chǎng)景解析挑戰(zhàn)賽),比賽中所提供的數(shù)據(jù)集中將包含大量的分段原始駕駛圖像,包含有 20+種場(chǎng)景標(biāo)注信息。賽事將持續(xù)到 6 月 12 日。目前已有來(lái)自全球的三十多只隊(duì)伍正式報(bào)名參加。
其實(shí)在自動(dòng)駕駛領(lǐng)域,應(yīng)用和學(xué)術(shù)一直是兩個(gè)相輔相成的方向。比如在應(yīng)用領(lǐng)域的標(biāo)桿企業(yè) Mobileye,其靈魂人物 Shashua 教授同樣也擁有著很高的學(xué)術(shù)地位,從學(xué)術(shù)領(lǐng)域跳槽到應(yīng)用企業(yè)就職的人也屢見(jiàn)不鮮。
畢竟前沿學(xué)術(shù)的成果,最終也會(huì)落地到實(shí)際應(yīng)用領(lǐng)域,只不過(guò)是時(shí)間早晚的問(wèn)題。百度這次的 ApolloScape 計(jì)劃估計(jì)也是在默默地為自己的底層技術(shù)創(chuàng)新以及人才聚集做儲(chǔ)備。
