蔣雨宏正要回答,一直沉默品茶的陳默卻放下了茶杯。
杯底與桌面接觸,發(fā)出一聲輕微的脆響,瞬間吸引了所有人的注意。
蒜鳥蒜鳥,本人陳默,向來只裝高端局。
“姚總的顧慮很實(shí)際。”
陳默的聲音不高,瞬間成為會(huì)議室的中心,“用戶體驗(yàn)是檢驗(yàn)技術(shù)的唯一標(biāo)準(zhǔn)。
關(guān)于ALC的決策魯棒性,還有BEV感知落地難的問題,我最近看了一些前沿論文和開源項(xiàng)目,有點(diǎn)不成熟的想法,可以拋出來供大家探討?!?/p>
“第一,關(guān)于感知?!?/p>
陳默的指尖在桌面上虛點(diǎn),仿佛在勾勒無形的藍(lán)圖,“BEV是方向沒錯(cuò)。
但傳統(tǒng)基于攝像頭和雷達(dá)點(diǎn)云生成BEV特征圖,再去做目標(biāo)檢測(cè)、分割的方法,對(duì)算力和實(shí)時(shí)性要求極高。
并且對(duì)非常規(guī)障礙物(比如掉落的輪胎、倒下的樹、形狀怪異的施工設(shè)施)的識(shí)別能力,存在理論瓶頸。
我在想,是否可以引入一種更‘直接’的表達(dá)方式——占用網(wǎng)絡(luò)(OCCUpanCyNetWOrk)?!?/p>
“占用網(wǎng)絡(luò)?”
李鵬飛下意識(shí)地重復(fù)了一句,這位計(jì)算機(jī)視覺領(lǐng)域的頂尖專家,鏡片后的眼睛瞬間亮了起來,身體也不由自主地坐直了。
第684章啟發(fā)和顛覆
這個(gè)概念對(duì)他而言不算陌生,但從未在量產(chǎn)自動(dòng)駕駛領(lǐng)域被認(rèn)真討論過。
它太新,也太“重”
了。
“對(duì),”
陳默點(diǎn)頭。
“它不關(guān)心前方障礙物是車、是人、是錐桶還是別的什么具體類別。
它只關(guān)心一個(gè)最本質(zhì)的問題:車輛前方及周圍的三維空間里,哪些體素(VOXel)被占用了?
是剛性占用(如墻壁)還是柔性占用(如灌木叢)?
是可穿越的還是不可穿越的?”
他一邊說,一邊拿起桌上的白板筆,轉(zhuǎn)身在旁邊的白板上快速勾勒起來。
寥寥幾筆,畫出一個(gè)粗糙的車輛前方視角,然后打上密集的三維網(wǎng)格。
“輸入多視角攝像頭圖像,甚至融合低線束激光雷達(dá)的稀疏點(diǎn)云,通過一個(gè)精心設(shè)計(jì)的3D卷積神經(jīng)網(wǎng)絡(luò),直接輸出一個(gè)稠密的三維占用柵格圖。
每一個(gè)小格子(體素)都有一個(gè)概率值,表示它被占據(jù)的可能性。
同時(shí),還可以預(yù)測(cè)每個(gè)被占據(jù)體素的運(yùn)動(dòng)狀態(tài)(速度向量)?!?/p>
陳默的筆尖在網(wǎng)格上移動(dòng):
“這樣,無論前方是一個(gè)標(biāo)準(zhǔn)車輛,還是一堆怪異的建筑垃圾,甚至是一團(tuán)濃霧(如果能部分穿透),系統(tǒng)都能感知到‘有東西占著這個(gè)空間,可能會(huì)動(dòng)’。
避障是最核心的需求,知道‘有東西’且‘它怎么動(dòng)’,往往比精確知道‘它是什么’更重要,尤其是在極端COrnerCaSe下。