最近,“端到端”在車圈火了!特斯拉基于“端到端”的FSDV12(完全自動駕駛)方案形成的標(biāo)桿示范效應(yīng),疊加入華傳聞,帶動“蔚小理”等車企和華為、地平線等服務(wù)商紛紛轉(zhuǎn)向,加碼端到端自動駕駛技術(shù)。
所謂“端到端”,其實是來自深度學(xué)習(xí)中的概念,英文為“End—to—End(E2E)”,指通過一個AI模型,只要輸入原始數(shù)據(jù)就可以輸出最終結(jié)果。應(yīng)用到自動駕駛領(lǐng)域,意味著只需要一個模型,就能把攝像頭、毫米波雷達、激光雷達等傳感器收集到的感知信息,轉(zhuǎn)換成車輛方向盤的轉(zhuǎn)動角度、加速踏板的踩踏深度以及制動的力度等具體操作指令,讓汽車實現(xiàn)自動駕駛。用小鵬汽車創(chuàng)始人何小鵬的說法,表現(xiàn)得“很絲滑”,更像“人類司機駕駛”。
此前,市面上絕大部分自動駕駛系統(tǒng)為傳統(tǒng)模塊化方式,即一個人工和智能兩分天下的混搭系統(tǒng):感知依靠神經(jīng)網(wǎng)絡(luò),規(guī)劃控制則使用人類手動設(shè)計的算法。這一系統(tǒng)的好處在于分工明確,發(fā)現(xiàn)缺陷便于分模塊檢查、解決。但問題是,這種模塊化的自動駕駛系統(tǒng)在相對簡單的駕駛?cè)蝿?wù)上表現(xiàn)不錯,而在復(fù)雜的駕駛?cè)蝿?wù)面前,其天花板顯而易見。就算是號稱遙遙領(lǐng)先的城市高階智駕功能,依然會有機械感,也會在匯入快速路、通過大型路口時宕機。
考慮到自動駕駛的核心挑戰(zhàn)是解決無窮無盡的邊緣場景,以有限人力解決無限長尾問題的成本和時間難以估量,數(shù)據(jù)化、模型化成為必然趨勢。不過,端到端,同樣是一個需要老師傅精心打磨的高難度技術(shù)活。
一方面,端到端需要海量高質(zhì)量數(shù)據(jù)“投喂”訓(xùn)練。與大語言模型可以在互聯(lián)網(wǎng)上爬取海量文字數(shù)據(jù)用于訓(xùn)練不同,端到端智駕需要的視頻數(shù)據(jù)獲取成本和難度極高。以特斯拉為例,目前其FSD累計學(xué)習(xí)的人類駕駛視頻片段超過2000萬個,而這一規(guī)模的數(shù)據(jù)僅采集成本就需要50億元至80億元。
另一方面,端到端需要強大算力的支持。自動駕駛涉及激光雷達、圖像感知以及V2X車路協(xié)同等技術(shù)與解決方案。強大的算力不僅有利于實時處理海量數(shù)據(jù),降低數(shù)據(jù)傳輸延遲,還可更好地支持面向智慧城市、智慧交通、高級別自動駕駛等全場景。然而,華為車BU、百度極越、蔚來、理想、吉利、長城、小鵬等國內(nèi)企業(yè)算力增長目前均面臨較大瓶頸。
問題還在于,算力與數(shù)據(jù)的制約又會顯著影響算法的發(fā)展。雖然國內(nèi)學(xué)術(shù)界提出的端到端自動駕駛模型UniAD斬獲2023年CPVR最佳論文獎,為國內(nèi)企業(yè)提供了可以參考的方向,但是在開環(huán)驗證體系、小體量樣本數(shù)據(jù)下開發(fā)的UniAD,上車還需要一定時間的工程化改造和大規(guī)模數(shù)據(jù)訓(xùn)練。
此外,端到端會同時放大自動駕駛系統(tǒng)的上限與下限。因為端到端構(gòu)建的是一個神經(jīng)網(wǎng)絡(luò)黑箱,在獲取更高上限的過程中讓渡了一部分傳統(tǒng)模塊方案具備的可解釋性。如何在自動駕駛系統(tǒng)中保留可解釋性,將那些不應(yīng)被逾越的規(guī)則,比如別闖紅燈,表征到神經(jīng)網(wǎng)絡(luò)中去,保證端到端能安全地落地應(yīng)用、進化,也將是規(guī)控工程師們的重要課題。
攀登珠峰有兩條路線:一條是中國西藏的北坡,另一條是尼泊爾的南坡。不管選擇從南坡還是從北坡攀登,最終都將到達同一個頂峰。這與當(dāng)前自動駕駛的發(fā)展路徑有相似之處。雖然現(xiàn)在還很難判定端到端就是自動駕駛的最優(yōu)解或最終解,但這并不妨礙企業(yè)創(chuàng)新探索。畢竟端到端能夠比傳統(tǒng)模塊化方式更好地處理極端案例,并且代表了一種減少人工編碼依賴的更高效的思路。基于這個路徑,或許自動駕駛能夠通往更高階段。(本文來源:經(jīng)濟日報 作者:楊忠陽)