智慧汽車「利好」資料服務,特斯拉英偉達大眾都在佈局

硬體預埋,正在推動智慧駕駛行業進入資料驅動迭代週期。

今年,英偉達在Orin進入規模上量階段的同時,推出了Drive Map,基於精確測繪資料與匿名眾包資料相結合,提供釐米級的定位精度。後者,由搭載英偉達Hyperion架構的車輛提供資料眾包,包括來自攝像頭、鐳射雷達和毫米波雷達的資料。

所有這些資料,從車端不斷上傳到雲端。然後,載入到英偉達的Omniverse平臺,後者是一個為虛擬模擬和實時物理精確模擬而構建的開放平臺,用於更新地圖資料。同時,這些資料會轉換成模擬測試環境,可用於Nvidia Drive Sim,一個端到端的自動駕駛車輛模擬平臺。

window。DATA。videoArr。push({“title”:“智慧汽車「利好」資料服務,特斯拉/英偉達/大眾都在佈局”,“vid”:“f3331hhtd86”,“img”:“http://inews。gtimg。com/newsapp_ls/0/14716230743_640480/0”,“desc”:“”})

而在Omniverse的背後,還有資料自動標籤技術。

“Omniverse允許我們建立多樣化、海量、精確的資料集,以構建高質量、高效能和安全的資料集,這對人工智慧至關重要。”這其中,對於傳統手工資料標註的增強,是關鍵要素之一。

2021年初,特斯拉披露正在位於紐約的Gigafactory招聘一組資料標籤員,以提供影象標註支援,幫助訓練Autopilot/FSD神經網路。原因是,對於自動駕駛演進來說,演算法方面的差距會逐漸縮小,資料將是真正影響技術能力和使用者體驗的重要因素。

而按照此前公佈的資料,特斯拉總共有近千人的資料標註團隊規模。“資料需求缺口仍在,市場遠未飽和。這對於真正優質的資料供應商來說,正是搶佔市場高地的絕佳時機。”資料堂公司相關負責人表示。

一、

特斯拉AI主管Andrej Karpathy去年透露,公司只有“幾十名”工程師在研究神經網路,但背後有一個“龐大”的團隊在研究標籤。

一方面,手動高質量標準仍是基礎工作,另一方面,標籤自動化也是趨勢,從而應對車隊收集的大量資料。

window。DATA。videoArr。push({“title”:“智慧汽車「利好」資料服務,特斯拉/英偉達/大眾都在佈局”,“vid”:“n3331e1qvbx”,“img”:“http://inews。gtimg。com/newsapp_ls/0/14716235358_640480/0”,“desc”:“”})

對於人工標註崗位(大概每小時20美元的工資),特斯拉也多次明確其重要性:基於Autopilot標註介面來標記影象,對於訓練深度神經網路至關重要。

比如,標註團隊將與Autopilot團隊的計算機視覺工程師互動,以幫助改進內部標註工具的設計;同時,標註團隊將獲得基本的計算機視覺和機器學習知識,以更好地理解演算法如何使用標籤,因為這將幫助在標記過程中出現的困難的「邊緣情況」做出準確判斷。

實際上,這個背後所傳遞的資訊是:資料標註並非簡單的「拉框」,也不是純粹的逐條標註。“這種方式既費時又費錢。”一些行業人士指出,大部分傳統外包商交付的結果資料經多次返修,依然無法達到客戶要求的精確度。

2021年,資料堂的智慧駕駛資料服務同比去年,業務漲幅達65%。這家連續數年在智慧駕駛資料服務市場佔有率領軍的企業,也拿到了長城、上汽、小鵬、蔚來、宇通等國內一線車企的訂單。

同時,考慮到資料合規的重要性,這家公司還在去年拿到了相關的測繪資質,意味著可以在真實的道路環境下合法採集資料,併合規地進行資料標註和處理,這也是其他資料服務商難以比擬的優勢,也是拿到車企訂單的准入門檻。

而這個賽道的下一波紅利,來自標註工具的自動化。原因是,隨著搭載具備資料採集、回傳功能的新車規模逐步增長,對於龐大資料的處理成為了剛需。

智慧汽車「利好」資料服務,特斯拉英偉達大眾都在佈局

以特斯拉為例,為了配合後端Dojo超級計算機(6個訓練模組組成一個2x3的矩陣,兩個矩陣組成一個計算機機櫃,每個機櫃提供超過每秒100千兆的浮點運算)的需求,推出了自動標註工具。

當然,Andrej Karpathy也明確表示,手工標註在語義等方面非常擅長,但計算機在幾何、重建、三角測量和跟蹤方面更擅長。現在,需要人工和計算機合作來建立這些向量空間資料集。

同樣以視覺感知起家的Mobileye,龐大的實際道路行駛資料庫是這家公司的頂樑柱。這家公司擁有近二十幾年時間積累的1600萬段1分鐘的影片片段,接近200PB的資料儲存量,也是亞馬遜AWS全球儲存容量最大的客戶之一。

這背後,同樣依靠大規模資料標記。公開資料顯示,Mobileye背後有一支2500多人組成的資料標註團隊,每月處理5000萬個資料集——相當於500,000小時的駕駛里程,並建立了一個龐大的內部搜尋引擎資料庫。

這意味著,標註效率以及準確性,決定了視覺及多融合感知技術的迭代速度。

“高質量資料,某種意義上就是決定性的要素。”在行業人士看來,一套高質高效的資料集,也是加快功能開發週期的關鍵。

window。DATA。videoArr。push({“title”:“智慧汽車「利好」資料服務,特斯拉/英偉達/大眾都在佈局”,“vid”:“u3331umrn78”,“img”:“http://inews。gtimg。com/newsapp_ls/0/14716235407_640480/0”,“desc”:“”})

為此,資料堂也推出了自研的資料標註工具,內建ML輔助預識別功能,真正實現半自動化作業,有效提升人均效率30%以上。近30套標註工具,可靈活應用於語音、影象、3D點雲、文字等多型別資料的標註,已成功應用在11年近5000多個專案的實施過程中。

比如,漏標是很嚴重的標註錯誤。資料堂在工具中內建了地面檢測演算法、顏色自動渲染,標註時可以根據顏色來判斷標註物體,以減少漏標。

此外,這套工具還內建插值演算法預標註功能,如在第一、五幀標註了目標ID,則會自動標註中間幀位置,只需檢視或微調位置即可(主要用於目標追蹤專案)。

二、

事實上,從去年開始,基於影子模式、整車OTA等功能的資料驅動閉環模式已經成為智慧駕駛方案供應商、一線品牌車企的新一輪技術競賽焦點。

此外,下一代感測器也開始增加OTA功能,這意味著,基於資料驅動模式,可以實現感測器效能的最佳化並適配新的功能要求。

比如,NXP去年推出的首款專用16nm成像雷達處理器為例,S32R平臺提供高效能的硬體安全引擎,支援OTA更新,符合新的網路安全標準。

同時,鐳射雷達的OTA也正在成為標準配置。比如,此前百度Apollo定製的禾賽科技全新架構鐳射雷達,將同步支援OTA以滿足批次化智慧管理及遠端升級迭代需求。

“軟體將是鐳射雷達的另一個‘大腦‘,除了基於採集資料的融合幫助系統做出正確的決策,還將會自動適應環境變化,並透過定期更新來提高效能。”科絡達CEO吳柏儀表示,作為整車OTA解決方案提供商,公司已經率先實現了ADAS相關感測器的OTA升級。

高工智慧汽車研究院監測資料顯示,2021年中國市場(不含進出口)乘用車新車前裝標配搭載OTA功能上險量為745。37萬輛,其中,FOTA搭載量為382。93萬輛,同比增長162。03%,前裝搭載率為18。78%。

而對於智慧駕駛方案供應商來說,資料採集、處理、訓練並迴圈迭代功能被認為是實現軟體定義汽車的關鍵。本週,博世旗下的ETAS宣佈和PLC2 Design計劃聯合開發一個整體解決方案,在車載資料預處理和邊緣計算領域協助客戶實現資料驗證。

在此之前,PLC2 Design已經與博世跨領域計算解決方案部門進行合作,提供類似的開放和模組化的解決方案,比如,基於FPGA用於邊緣裝置和雲端資料中心的影片無失真壓縮和解壓縮。

目前,ETAS已經參股PLC2 Design,並計劃將雙方的整體解決方案作為一個系統元件進行對外銷售。而按照博世的規劃,ETAS將強化汽車基礎軟體、中介軟體和開發工具的業務。

同時,博世也在為L4級自動駕駛物色「資料科學家」崗位,與軟體敏捷開發團隊中的深度學習工程師和資料工程師合作,從真實世界和模擬資料中提取自動駕駛所需的關鍵要素。

眾所周知,早期的ADAS研發基本上是以基於規則的邏輯開發,這意味著開發人員決定對給定事件(輸入)的反應(輸出)。而基於神經網路訓練的決策演算法,則是根據可識別特徵的權重來決定如何對事件作出反應。

“我們從大量車輛中獲取大量資料並進行分析,以找出哪些功能執行良好,哪些不正常。我們越能分析車輛的行為,就越能更好地測試功能。”該公司負責人表示,這和傳統開發方式相比,是一次革命。

而在前裝量產賽道,市場已經啟動。

“這將是一個循序漸進的過程,從良好天氣條件、規則的道路,再到更復雜的環境和天氣情況。這將是一個長期的競爭過程。”大眾旗下軟體子公司CARIAD在收購海拉影象處理公司的基礎上,正在加快資料驅動的軟體開發,並提高影象處理演算法的自研比重。

此前,小鵬汽車多次強調,除了自有的資料採集車,大量使用者車輛產生的資料,也可以線上檢測長尾事件,並獲取這些資料上傳至雲端,用於演算法改進。

理想汽車也強調,資料是自動駕駛技術最大壁壘,公司計劃透過搭載更加豐富的感測器組合,實現高質量資料採集,從而實現自動駕駛演算法的更快收斂。

一週前,大眾集團宣佈為了加快E 2。0軟體平臺的開發程序,已經在德國及美國等國家部署數百輛定製化開發車隊,配備高效能感測器和聯網計算平臺,並提供處理實時資料的能力,縮短開發時間。

按照計劃,這家傳統汽車巨頭將從2024年開始,透過建立一個跨品牌車輛的神經網路,透過不斷交換資料,建立一個擁有數百萬輛汽車的自主學習系統。大眾集團表示,這些車將是“時間機器”,同時與其他聯網汽車共享道路、交通和其他系統的實時資料。

在這方面,除了特斯拉、Mobileye,幾家中國本土供應商也已經率先起跑。

比如,

智駕科技

去年量產的MAXIPILOT1。0,就是首度在1R1V硬體平臺中部署OTA資料閉環,與客戶協同建立資料全場景觸發機制和平臺,為自動駕駛技術迭代打下了多維基礎。

同樣已經進入前裝量產賽道的

知行科技

,也擁有一套自建的資料閉環和雲平臺網路,基於原生雲架構的設計方式,可以實現演算法和功能的快速更新和迭代,透過大資料驅動提供真正安全可靠的智慧駕駛功能。

而在大眾集團看來,這套資料驅動開發模式,與技術本身無關,而是對傳統汽車開發模式的一次顛覆性變革,比如,硬體和軟體的開發分離,並最終實現端到端自主學習。

在高工智慧汽車研究院看來,這是新一輪智慧駕駛方案市場份額爭奪戰的制高點,同時也將為整車OTA(包括域控制、感測器等)、雲服務、資料標註等產業鏈相關環節帶來新一輪市場紅利。