商湯絕影發布端到端自動駕駛技術路線R-UniAD
2025年2月22日,中國上海——以“模塑全球 無限可能”為主題的2025GDC全球開發者先鋒大會于2月21日-2月23日在上海徐匯舉辦,旨在探索大模型產業化解決方案,推進場景落地應用,實現商業模式的正向閉環。
在2月22日的商湯大模型生產力論壇上,商湯絕影CEO,商湯科技聯合創始人、首席科學家王曉剛重磅發布了行業首個「與世界模型協同交互的端到端自動駕駛路線R-UniAD」,通過構建世界模型生成在線交互的仿真環境,以此進行端到端模型的強化學習訓練。這與春節開始持續受到市場關注的DeepSeek技術創新思路同歸一源:從模仿學習向強化學習升級演進,從而實現端到端自動駕駛超越人類的駕駛表現。
商湯絕影CEO,商湯科技聯合創始人、首席科學家王曉剛發布「與世界模型協同交互的端到端自動駕駛路線R-UniAD」
「算法、算力和數據三者共同推動著人工智能技術的螺旋式上升和進步,隨著強化學習等算法引入到大模型訓練的思路得到驗證,新的尺度定律正在開啟,數據價值被進一步深入挖掘,模型能力天花板被打開。」王曉剛表示,強化學習的技術創新也同樣可以遷移到端到端自動駕駛領域。
基于UniAD端到端自動駕駛方案和「開悟」世界模型,商湯絕影R-UniAD將通過強化學習加速智駕跨越式演進。在4月即將到來的上海車展上,商湯絕影將重磅發R-UniAD端到端自動駕駛方案,并完成實車部署,持續引領端到端智駕技術的潮流。
強化學習,全新端到端自動駕駛技術路線的關鍵所在
2022年底,商湯絕影提出了行業首個感知決策一體化自動駕駛通用模型UniAD,并在次年榮獲2023年國際計算機視覺與模式識別會議(CVPR)最佳論文,同年8月,特斯拉CEO馬斯克直播試駕FSD V12,即端到端自動駕駛技術,越來越多的車企和科技公司開始跟進端到端的技術路線。如今,數據驅動的端到端自動駕駛解決方案已成為行業共識。
端到端的自動駕駛本質是通過海量的高質量人類駕駛數據,來實現最佳的「模仿」駕駛效果。然而,基于模仿學習的技術范式可以做到接近人類但難以突破人類能力上限。同時,受限于高質量場景數據的稀缺性和駕駛數據質量的參差不齊,端到端智駕方案要達到人類駕駛能力的天花板并不容易,動輒千萬Clips的高質量數據回流形成了規模門檻。
特斯拉通過七百萬輛高階智駕量產車和超10萬P算力,已經跨越了這個門檻,同時也構筑了與國內車企具有數量級差距的基礎設施壁壘。
這與人工智能的發展歷程非常相似。隨著互聯網上的數據紅利被“榨干”,大模型性能的提升只能依靠進一步擴大算力規模和增加模型參數。人工智能技術的發展遇到了瓶頸,一定程度上變成了算力的比拼,一部分人認為,尺度定律(Scaling laws)失效了。
今年春節期間,DeepSeek-R1基于純強化學習的關鍵創新引發了廣泛的關注。通過少量高質量數據的冷啟動,模型進行多階段的強化學習訓練,有效降低大模型訓練的數據規模門檻,同時也讓尺度定律得以延續,為模型變得更大更強鋪平了道路。更重要的是,強化學習能夠讓大模型自行涌現出長思維鏈能力,顯著提升推理效果,甚至可能具備超越人類的思維能力。
王曉剛表示,基于強化學習的大模型技術路線可以遷移到端到端自動駕駛算法的訓練與研發之中。
基于強化學習,商湯絕影提出「與世界模型協同交互的端到端技術路線」
從數據規模來看,多階段強化學習的訓練方法能大幅降低端到端自動駕駛數據規模門檻。R-UniAD就是通過高質量數據進行冷啟動,用模仿學習的方式訓練出一個端到端基礎模型,再通過強化學習方法進行訓練。據測算,小樣本多階段學習的技術路線能讓端到端自動駕駛的數據需求降低一個數量級,讓車企合作伙伴有望換道超車特斯拉FSD。
從性能上限來看,純強化學習訓練讓端到端智駕模型有望通過在提升性能的同時,充分探索多元場景和駕駛風格。未來,端到端智駕體驗的上限不再是「類人」,而是可以擁有超越人類的駕駛表現。
商湯絕影發布「與世界模型協同交互的端到端自動駕駛技術路線R-UniAD」
作為最專注汽車行業的AI公司,商湯絕影一直在探索和落地以AI的方式解決智駕問題,也持續著引領端到端自動駕駛的創新潮流。
在UniAD榮獲CVPR最佳論文之后,2024年北京車展,商湯絕影展示了UniAD的實車上路成果,量產端到端智駕方案則預計會在今年年底交付落地。2月22日,商湯絕影率先發布「與世界模型協同交互的端到端自動駕駛技術路線R-UniAD」,成為行業首個將基于世界模型的強化學習引入端到端智駕的研發與訓練的AI公司。
商湯絕影的R-UniAD是「多階段強化學習」端到端自動駕駛技術路線,具體分為三個階段,首先是依靠冷啟動數據通過模仿學習進行云端的端到端自動駕駛大模型訓練;然后基于強化學習,讓云端的端到端大模型與世界模型協同交互,持續提升端到端模型的性能;最后云端大模型通過高效蒸餾的方式,實現高性能端到端自動駕駛小模型的車端部署。
商湯絕影R-UniAD:「多階段強化學習」端到端自動駕駛技術路線
因為端到端智駕模型是一個多模態具身模型,最關鍵的是要與依靠世界模型生成的仿真環境進行在線交互,并獲得閉環獎勵反饋,從而實現強化學習,使得端到端模型的訓練能夠充分探索各種可能性。也就是說,能夠生成高保真的場景數據、保證長時推演一致性、并支持在線交互的強大世界模型是R-UniAD的核心基石。
早在2024年11月「絕影實力AI DAY」上,王曉剛就表示:「智駕高端局的競爭不止是車端模型的比拼,端到端的決戰,戰場在云端。」為此,商湯絕影全新升級并發布行業標桿級別的世界模型——「開悟」世界模型。世界模型最基礎也是最核心的能力是生成高質量視頻數據,基于「開悟」,1個GPU產生的仿真數據相當于500臺量產車的數據采集效果。
以絕影量產智駕方案和「開悟」世界模型為核心,實車采集的真實數據和云端生成的仿真數據在「車云一體」的新范式下進行閉環流轉,使得端到端智駕系統的訓練更加全面、高效,大幅縮短了研發周期,降低了成本。
如今,「開悟」世界模型的能力進一步提升,將支持實現端到端算法與世界模型仿真環境實時交互。
在現場演示中,商湯絕影展示了「開悟」世界模型與主車閉環交互的方式。通過場景庫文件導入一個BEV視角下的初始主車和他車位置,世界模型自動生成主車視角下11V(11個攝像頭)的傳感器仿真數據,端到端模型接收到這一數據后,生成自車下一時刻位置并進行反饋,世界模型根據刷新的主車位置和預測的他車位置渲染新的11V傳感器仿真數據。
商湯絕影現場演示端到端算法與世界模型仿真環境實時交互
商湯絕影的量產端到端智駕方案預計將在年底交付,「開悟」世界模型也正式用于數據生產,已經搶占新技術路線的先機。而在4月的上海車展,商湯絕影將會展示「與世界模型協同交互的端到端自動駕駛方案」的實車部署。
依托商湯大裝置算力基礎設施,商湯絕影能夠建立強大的云端自動駕駛大模型,蒸餾得到可以部署在更小算力芯片的端到端模型,助力車企合作伙伴,基于更小數量級的數據,超越特斯拉依靠百萬臺量產車數據回流的自動駕駛方案,更是超越人類的駕駛水平,加速智能汽車駛入AGI全新未來。
>>點擊查看今日優惠<<