高性價比雙目相機在商用車智駕領(lǐng)域價值亮點及未來啟發(fā)

作為世界第一大商用車市場,中國商用車市場正處于轉(zhuǎn)型升級的關(guān)鍵時期。近年來,無論是相關(guān)政策法規(guī)的出臺,還是技術(shù)、方案的革新,商用車行業(yè)的發(fā)展始終圍繞著保障安全和提高效率的核心主題。

10月28日,元橡科技CTO任杰出席商用車安全大講堂線上交流會,從綜合立體視覺解決方案價值亮點及未來啟發(fā)的角度,分享和探討高性價比商用車智駕系統(tǒng)研發(fā)量產(chǎn)實踐。(以下為部分交流內(nèi)容整理。)

關(guān)于商用車的安全與效率,我們在關(guān)注什么?

相比于乘用車而言,商用車既作為一種交通運輸工具,也是我們?nèi)粘=?jīng)濟活動中重要的生產(chǎn)資料。提高商用車的安全與效率,具體來說,我們可以延展出一些關(guān)鍵詞,比如“節(jié)能環(huán)保”、“物流與交通設(shè)計”、“智慧城市”……以及我們重點關(guān)注的“智能駕駛主動安全”這一領(lǐng)域。

在商用車的營運過程中,普遍存在的一些隱患和問題包括:

l司機易疲勞駕駛,工作環(huán)境惡劣

l容易造成司機盲區(qū),產(chǎn)生安全事故

l商用車質(zhì)量慣性大,提速慢,司機駕駛習(xí)慣勻速,節(jié)省油耗

l急剎車對商用車司機造成嚴(yán)重安全傷害

l……

而現(xiàn)有的商用車智能駕駛系統(tǒng)仍存在著較大的“漏報”和“誤報”的局限性。“漏報”也就是近來常常見諸報端的一些事故,比如撞上前方側(cè)翻車輛等;“誤報”則是感知系統(tǒng)會把一些不存在或沒有風(fēng)險的目標(biāo)錯誤地識別,例如把地面上的一些畫、幻影當(dāng)成是真正的行人,從而產(chǎn)生了不必要的規(guī)避。

在漏報和誤報之間取得均衡,提升整個智能駕駛系統(tǒng)的上限,是業(yè)內(nèi)孜孜不倦追求的一個目標(biāo),因為人類社會駕駛場景里面還存在太多的長尾效應(yīng),太多目前常規(guī)的系統(tǒng)還不能克服的一些困難。

image.png

漏報(撞上前方側(cè)翻車輛)丨來自互聯(lián)網(wǎng)公開資料

image.png

image.png

誤報(道路平面上的虛假行人)丨來自互聯(lián)網(wǎng)公開資料

從場景規(guī)模和難度上我們把智能駕駛系統(tǒng)分成幾大層次:

i.其一就是規(guī)模小一點、難度也低一點的封閉場景,比如港口、礦區(qū)無人駕駛;

ii.再往前,我們現(xiàn)在有很多物流企業(yè),包括乘用車也已經(jīng)在推進高速場景的NOA等等,當(dāng)然,這種智能駕駛系統(tǒng)里也都存在著上述所提到的一些局限性;

iii.而到最后,我們真正希望推動的是在人類社會生活中更主要的一些場景,比如城市道路上,是不是能夠有更好的系統(tǒng)去輔助人類司機,替代人類去完成一些艱苦的工作。這就要求系統(tǒng)具備強大的理解場景的能力和細節(jié)把握的能力,要求系統(tǒng)感知的信息足夠稠密和高效。

image.png

這是智能駕駛發(fā)展和演進的趨勢,而為了更好地解決當(dāng)前智能駕駛的局限,面向未來更高階的智能駕駛發(fā)展趨勢,元橡科技始終專注推動“綜合立體視覺”解決方案。

為什么是綜合立體視覺解決方案?

雙目立體視覺是人眼仿生學(xué),它基于三角測量原理,通過視差和距離之間的反比關(guān)系,對周圍環(huán)境能得到一個三維的感知。而我們提出的“綜合立體視覺”的概念,在雙目相機感知傳感器的基礎(chǔ)上,還要配合大腦中樞,把立體視覺和AI充分結(jié)合起來,去達到一種高效能的感知和處理能力。

元橡科技雙目立體視覺的特點:低成本&高性能

l深度圖與RGB圖天然對齊

l立體信息可識別對象,降低對樣本量和硬件算力要求

l全類型對象檢測,降低長尾效應(yīng)風(fēng)險

l局部可見障礙物、模糊目標(biāo)均能測量

l百米檢測誤差小于5%,不依賴地面

l拓展性強,如限高、限寬、地形檢測

l圖像分辨率提高,小目標(biāo)識別性能倍增,算力基本增加不大

和目前大家比較熟知的一些傳感器(激光雷達、4D毫米波等)對比,元橡雙目相機的立體視覺成像所包含信息的豐富程度是非常高的,我們常說一圖勝千言,這是雙目相機非常擅長并且應(yīng)該發(fā)揮作用的地方,而從精準(zhǔn)度上來講,雙目立體視覺測距性能已經(jīng)非常快速地逼近激光雷達的性能。

高性價比的優(yōu)勢,決定了雙目立體視覺系統(tǒng)成為實現(xiàn)商用車安全與效率平衡的可行性方案。

元橡自研的Deep Fusion架構(gòu)很大程度上提高了系統(tǒng)魯棒性和安全閉環(huán)保障。Deep Fusion框架融合視差和AI能力,可以實現(xiàn)目標(biāo)類型的“N+1”,真正做到全類型障礙物檢測,大大降低長尾效應(yīng)的影響。

image.png

image.png

Deep Fusion特點:

l有效結(jié)合圖像與視差信息,準(zhǔn)確描述障礙物3D屬性

l較低的算力需求下實現(xiàn)更遠的檢測能力

l全類型障礙物的檢出能力

l提升融合毫米波能力:融合需要的目標(biāo)空間位置和類別屬性同時具備

其中“N+1”目標(biāo)類型,“N”指車輛、行人、自行車、交通標(biāo)識等指定多類型檢測目標(biāo),通常用AI語義處理分析,而“1”則是指一些通用障礙物,比如樹叢、柵欄,以及路面施工鐵板等不知道什么時候出現(xiàn)的未知類型。對于這些,我們?nèi)祟愑泻芎玫母兄捅苷夏芰?但目前的很多系統(tǒng),尤其是單目系統(tǒng),就很難去很好地識別。

image.png

image.png

元橡綜合立體視覺解決方案

所以這也就是我們?yōu)槭裁聪Mo業(yè)界推薦綜合立體視覺解決方案,因為我們看到了在這些方面上,我們提出的“N+1”完備目標(biāo)檢測新范式具有更好的泛化性、通用性,可以應(yīng)用到更多的實際場景。比如商用車的限高,車身較高的商用車在通過一些橋梁、山區(qū)涵洞的時候如果發(fā)生刮蹭,帶來的經(jīng)濟損失是非常大的,通過雙目相機可以去做高度可通過性的檢測,相類似的還有通過狹窄通道時的限寬預(yù)警等。立體視覺技術(shù)在諸如此類的場景需求上已經(jīng)有了一些很好的應(yīng)用,落地之后也得到了比較好的反饋。通過提前給到司機輔助性的信息和警告,可以有效避免一些刮蹭事故和經(jīng)濟損失。

高性價比商用智能駕駛的未來啟發(fā)

首先,目前在乘用車上有兩方面很強烈的趨勢,一是高分辨率,二是大角度周身環(huán)繞。我們認為,未來在乘用車先行的技術(shù)帶動下,商用車也會往這個趨勢去應(yīng)用和發(fā)展。

目前可能1M、2M的分辨率是主流,后期分辨率會變得越來越高?,F(xiàn)在乘用車有很多新的旗艦車型開始上8M的前視,甚至是周視的設(shè)備,在周視環(huán)繞感知的傳感器方案里,視覺是起到非常大的作用的。如果我們把車看成是泛機器人,有了比較好的感知傳感器,它就有了很好的視野、觸覺等感官,這樣它就可以更智能地去做一些決策和判斷,來更安全、快速、高效地完成運輸任務(wù)。

而從今年特斯拉的AI Day展示的Tesla Occupancy Networks看,它基于車身一圈的傳感器,通過占有網(wǎng)格的神經(jīng)網(wǎng)絡(luò)和大量的數(shù)據(jù)訓(xùn)練而得到一種相對比較直觀的視覺效果。其實類似的這種三維感知的能力元橡很早之前也就能做到了,我們并不需要那么多復(fù)雜的傳感器陣列,只是通過簡單的雙目立體視覺,同時也不需要那么大量的數(shù)據(jù)積累和數(shù)據(jù)閉環(huán)訓(xùn)練、標(biāo)注維護。在三維環(huán)境感知方面,立體視覺的空間表達更精細,顆粒度更細,精準(zhǔn)度也更好,這也是立體視覺高性價比和高性能的體現(xiàn)。

image.png

Tesla Occupancy Networks丨來自互聯(lián)網(wǎng)公開資料

image.png

元橡高性價比的“Occupancy grid map”空間表達

高分辨率視覺傳感器、大角度視場角(FOV)以及周身環(huán)繞感知能力將成為未來商用車智能駕駛系統(tǒng)的重中之重,是我們對于未來工作的展望和啟發(fā)。

總體來講,對于商用車發(fā)展的思考,我們始終認為是“安全第一”,在保障社會運轉(zhuǎn)和人身安全的基礎(chǔ)之上,再去提高運輸效率,通過科技賦能,輔助司機改善工作環(huán)境,減輕勞動強度,規(guī)避分心和盲區(qū)等因素導(dǎo)致的安全隱患。元橡科技將致力于綜合立體視覺解決方案,從更好的感知出發(fā),實現(xiàn)更好的決策,更好的執(zhí)行,最終得到更好的安全和效率。

image.png

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )