自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

賈浩楠 發自 凹非寺量子位 報道 | 公眾號 QbitAI

城市領航輔助駕駛,已經是“現貨”了。

北京順義鬧市區,11公里自動駕駛全程無接管:

明年上線交付,技術來自毫末智行,一家成立2年的自動駕駛公司。

這2年間,毫末以驚人的速度完成了產品量產上車,積累了400萬公里真實路測里程,還剛剛融到近10億元,晉身獨角獸。

進展之快業內罕有,但是從何而來?

毫末智行AI DAY也許可以一探究竟。

毫末城市NOH順義城區11公里無接管

NOH,是毫末智行的智慧駕駛領航產品。

與乘用車上常見的輔助駕駛不同,NOH不再侷限於簡單的巡航、跟車、車道偏離預警這些功能,而是真正意義上給駕駛員減負。

自主規劃線路、自主選擇行駛策略、自主避讓障礙、自主變換車道…

你更熟悉的,可能是覆蓋高速路段的智慧領航產品,因為高速場景邊界條件更清晰簡單,實現起來更容易。

毫末有勇氣挑戰城市路端,表現到底怎麼樣呢?

首先是紅綠燈識別,確認可通行後進行無保護左轉

根據導航路線,下個路口即將右轉時,NOH會互動提前主動變道

主動避讓違規橫穿馬路的行人:

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

還會主動避讓加塞的車輛:

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

接下來是一連串高難度自主進出環島動作,期間還完成了避讓兩輪電動車

待轉區也能準確識別並正確駛入駛出

還有兩個很有意思的細節,其中之一是車輛減速透過沒有隔離帶的路段

這說明NOH對環境識別精準度很高。

另一個是車輛減速透過沒有紅綠燈的路口:

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

這樣的策略表明毫末的NOH不是一味保守死板,在保證安全的條件下依然會兼顧通行效率。

在行業大部分玩家還在激烈爭奪高速領航輔助駕駛落地時,毫末智行已經將NOH能力擴充套件到城市道路。

對於這樣的效率,毫末智行解釋說是因為他們給自動駕駛烙上了

思想鋼印

在這個思想鋼印的信念之下,誕生了國內首個自動駕駛資料智慧體系

MANA

給自動駕駛烙上思想鋼印

毫末智行資料智慧技術體系MANA,中文名叫

雪湖

命名來自《三體》,面壁者羅輯掉入冰封的湖面,從此參透黑暗森林法則,找到了打破三體威脅的規律,開啟威懾紀元。

毫末以此命名,含義有從MANA開始,徹底領悟掌握自動駕駛的核心能力之意。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

而這就是

資料驅動

特斯拉身先士卒,證明了巨量資料、超大算力、快速迭代的閉環能力對自動駕駛的重要性。

“資料驅動”這個概念,其實像黑暗森林法則,初聞之時感覺字字在理,卻平平無奇,難以領會深意。

資料閉環的模型其實在各個自動駕駛公司都大同小異,核心無非就是“資料收集-訓練-部署-再收集”的迴圈。

但實操起來卻不是那麼簡單。

巨量資料湧進系統後,怎麼處理?如何分類打標?怎麼加快訓練速度?驗證測試是不是要在各種氣候路況下重新跑一遍?

這些問題,成立剛滿兩年的毫末智行,悟了。

能讓資料驅動真正形成閉環的條件不復雜,毫末把它們變成思想鋼印,刻在自動駕駛研發之中。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

思想鋼印命題只有一個,那就是:

研發、量產、落地,堅定

低成本

高速度

首先是低成本,包括資料收集、處理、AI模型訓練、系統測試等環節。

其次是高速度,一一對應上面的各個環節。

其中,成本既有資料的傳輸、儲存等人力財力成本,也有AI訓練、測試時的時間成本。

不用說,成本越低當然資料獲取就越多,模型迭代越快。

而高速度,則能保證巨量資料拿到手後緊緊有條按部就班,快速把資料優勢轉化成產品端的技術進步。

參透這兩點,資料驅動才能爆發出巨大能量。

毫末智行建設的MANA資料智慧體系,一切都是為這兩個原則服務。

MANA包括了上面的所有思考點,由四個子系統組成:

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

BASE包括了資料的獲取,傳輸,儲存,計算,以及新的資料分析和資料服務。

TARS是核心演算法原型,用於感知、認知、車端建圖、和驗證的實踐。

LUCAS則是對演算法在應用場景上的實踐,包括高效能計算、診斷、驗證、轉化等核心能力。

VENUS是資料視覺化化系統,包括軟體和演算法的執行情況,對場景的還原,以及資料洞察等能力。

MANA不是一個軟體,而是一個技術體系

,其中包含眾多子模組,它們一同構成了毫末智行的資料驅動能力,也是解釋毫末業務飛速進展的關鍵。

MANA真的有魔力?

從資料本身的視角,可能更好理解。

首先,資料要被感知到。毫末智行自動駕駛方案目前核心的感知裝置,是攝像頭和鐳射雷達。

採集到的資料,首先透過一個ResNet網路計算基礎資料,然後生成兩個分支,一個是計算目標特徵的FPN網路,可以分別計算車道線、路基、車輛、訊號燈等等目標資訊。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

另一個分支則用於free space(可行駛區域)生成和場景識別。

對於鐳射雷達點雲圖,則用pointpillar演算法,首先把點雲資料降維進行偽二維化,之後再用一般影象的方法進行計算。

兩種資料來源,採取過程融合,加入時序的特徵,實現感知能力快速提高,能夠更準確的刻畫現實世界。

第二步,資料除了被感知,還要被系統認知,就是解決從客觀世界到駕駛動作的對映。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

首先是表達特定場景下駕駛行為,可以從宏觀上歸納出幾個影響因素:天氣、道路結構、交通參與者、交通流密度、彼此方位、主車路線、碰撞風險和碰撞時距。

然後從已有的資料中挖掘和表達這些屬性,然後在進行聚類和分類,以找到更加舒適和高效的解決方案。

接著透過端到端模擬學習,以之前例子作為指導,得到具體的本車動作。

模擬學習,需要更大的資料樣本,特別是標註好的資料,然後從資料中學習得到規律。

所以,問題關鍵就聚焦到到快速標註上。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

Tesla積累20億公里數據,累計標註了60億個物體,包括精準的3D資訊、深度、速度。

同樣的資料量按相同標準進行人工標註,所付出的時間和資金,沒有哪個自動駕駛公司能承擔。

所以毫末研發了一個高效標註系統,應用無監督自動標註演算法,效能比市場上很多產品強1倍。

目前,毫末大部分資料處理是透過自動標註完成的。

進行到這一步,資料已經可以餵給演算法進行訓練,那麼訓練好的模型,如何驗證效果?

尤其是在短時間對多個功能進行不同升級後,如果把所有版本依次拿到實車上跑一遍,然後再開發下一個版本…自動駕駛可能就永無實現之日了。

所以要把把驗證工作放在模擬系統中進行。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

毫末智行將每一次路側都還原為模擬中的“元宇宙”,同一場景下不同光照、不同天氣,不同曝光條件都可在系統中調整,由此來模擬演算法在不同工況下的表現。

至此,一組資料就完成了他們從被採集處理、成為訓練素材、變成系統能力提升的全部使命。

MANA對於毫末智行的重要性,看到這裡各位應該已經有了概念。

如果把資料比作燃料,那MANA就是能使燃料爆發出能量、推動整個系統運轉的引擎。

而且,這部“引擎”不僅快,還經濟實惠。

MANA要把毫末智行帶向何方?

當然是速度更快的自動駕駛能力提升,和規模更大的量產落地。

怎麼評價?

瞭解了MANA系統的來龍去脈,箇中內涵…

也就能理解MANA之於毫末智行的承前啟後意義,解釋了毫末速度的真實原因,而且還是這家自動駕駛新晉獨角獸今後戰略規劃的前提。

比如AI DAY上,毫末分享了對未來資料發展的判斷。

未來幾年,在智慧汽車的推動下,人類儲存的資料將發生結構性的改變。

影像資料會越來越多,而由於資料型別的轉變,對計算的要求也將發生改變。

深度學習的計算能力會更日益重要,對算力要求也會快速增長。

所以,除了推出單板算力360T的自研算力平臺,毫末也宣佈籌建自己的超算中心

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

等等,大模型、大資料、規模量產、自研算力平臺、自建超算中心…

熟悉嗎?

打通資料閉環的毫末,似乎走上了和特斯拉類似的路線。

核心原因還是在資料。

毫末智行CEO

顧維灝

,對於資料探勘利用的“段位”,有獨特的解讀。

他認為,特斯拉的領先,歸根結底是建立在十億公里級的里程資料上。

一個自動駕駛公司建立一套資料閉環並不難,真正有含金量的是能在多大規模的資料上跑通資料閉環。

這既代表一家公司的當下的業務進展、技術能力,也預示了未來演算法迭代的“加速度”。

而資料驅動,毫末的優勢恰好在於獲取的成本和效率。

毫末智行出自長城汽車集團旗下,客觀上具備了將自動駕駛大規模量產的先天優勢。

長城汽車6個子品牌,數十款車型,正在智慧化轉型關鍵視窗,更重要的,是這些車型過百萬的年銷量。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

事實也正是如此。

毫末智行AI DAY上,董事長

張凱

說,成立兩年來,積累實際路測里程已達400萬公里,產品已經搭載在長城坦克、WEY、哈弗等五款車型上。

3年內,毫末智慧駕駛產品裝機量會達到100萬。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

而在即將到來的2022年,這個數字會迅速擴大至34款車型,具體裝機量,據毫末估計可以達到30-40萬輛之間。

對於毫末智行來說,產品裝機量能以每年數十萬輛的規模增長,帶來的資料增量更是大部分新勢力或自動駕駛公司很難實現的。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

而將智慧駕駛套件以前裝形式搭載在量產車上,毫末獲取資料的成本,幾乎就只有資料傳輸的通訊成本。

實現低成本高效率的資料獲取後,毫末的智慧化發展路徑、展現出的未來潛力,也越來越像業內的另一個關鍵玩家——

特斯拉。

瞄準量產乘用車,快速增加裝機量、積累里程,在資料迭代中不斷進化。

毫末也一樣,在MANA拼圖完整對外披露後,另一個議題也被問及——

如此規模的資料和模型訓練,怎麼搞?

顧維灝說,逢山開路遇水搭橋,最優解就是自建超算。

是的,如果你熟悉這個領域,或許還記得,特斯拉今年最核心的技術進展,來自自建超算。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

這是巧合?顧維灝認為不完全是。

因為毫末智行在實踐後,恰恰證明了資料驅動是自動駕駛技術和核心和基礎,任何自動駕駛研發都將遵循這一原則。

現如今,幾乎所有自動駕駛玩家都意識到資料驅動的重要性,無一例外都渴望打通自己的“任督二脈”。

但是這其中,真正理解了“量產-成本-效率”內涵的玩家,真正有能力實踐這個規律的“面壁者”,實際並不多。

而毫末智行,透過種種進展和成果,解釋了何以發展神速、備受看好的原因。

自動駕駛系統為何要打上“思想鋼印”?北京順義鬧市區裡藏著毫末智行的謎底

它有先天優勢,還有後天的努力,並以“雪湖”為名實踐的自動駕駛落地法則…

而在毫末智行之前,業內也沒有過這樣的速度:

最快的規模化資料閉環、最快的自動駕駛創業公司營收增幅、最快的量產自動駕駛方案上車交付,以及最快實現燃油車的智慧駕駛,打破新勢力們引以為豪的壟斷。

所以如果之前,毫末智行的進展被以「毫末模式」視之,那現在更加值得注意的是「毫末速度」。

「毫末速度」代表了其實踐成果,更體現了在愈加清晰的自動駕駛落地法則中,中國玩家基於中國路況給出的行業尺度。