【芯智駕】視覺技術短板凸顯,大感知融合成自動駕駛主流趨勢

【芯智駕】視覺技術短板凸顯,大感知融合成自動駕駛主流趨勢

芯智駕──集萃產學研企名家觀點,全面剖析AI晶片、第三代半導體等在汽車“大變形”時代的機會與挑戰!

集微網訊息,目前自動駕駛方案主要有兩條路線,一是多感測器融合方案,被眾多主機廠廣泛認可並推動;二是以視覺為主的技術路線,特斯拉是該路線的堅定推動者。

近日,特斯拉多次延遲推出的純視覺版FSD Beta V 9。0終於面世,繼拋棄鐳射雷達後,新版本系統連毫米波雷達也放棄了,業內指出,特斯拉的純視覺自動駕駛系統過於激進。不巧的是,FSD Beta V9。0剛推出,特斯拉就因近年發生多起自動駕駛車輛事故,於8月16日再次被美國全國高速公路交通安全委員會(NHTSA)發起調查。

而基於視覺的自動駕駛安全性與可靠性,也再次被行業發出靈魂拷問。

視覺技術短板凸顯

隨著深度學習等人工智慧技術的成熟,視覺技術在車載領域的應用,已經從監控發展到360°環視再到目前的自動駕駛應用,併成為三大感知技術之一。與鐳射雷達、毫米波雷達、超聲波雷達、紅外等技術方案不同,視覺技術透過攝像頭來感知環境並獲取資訊,是一種模擬人眼的仿生方案。

相比其他方案,視覺技術的優勢凸顯,可以直接感知場景視野範圍內的人、車、物的形態、動作、色彩等資訊,場景內物體一目瞭然,結合人工智慧演算法,即可提取關鍵資訊,為自動駕駛策略提供關鍵資料。受到了部分自動駕駛企業的推崇,尤其是特斯拉,將視覺技術發展為自動駕駛技術的最佳乃至唯一的實現方案。

但在一位機器視覺專家看來,以視覺技術為主要手段實現自動駕駛,還有很多的路要走,從成像效果來看,他認為視覺技術還要解決四大問題。

首先是成像質量問題。視覺技術天然存在色彩偏差,無法做到百分百色彩還原;寬動態效能還達不到人眼的效果;光線變化下的重新聚焦速度有延遲,這對自動駕駛來說是不能滿足需求的。

其次是低照度成像難問題。視覺成像是被動感知技術,必須有光才能成像,在夜間、地下室、隧道等照度不足的地方,攝像機成像質量很難保證,照度越低,畫面質量越差。雖然目前人們推出了星光級成像技術,但對要求百分百安全的自動駕駛來說,目前的低照度成像技術無法滿足要求。

三是抗干擾能力弱。視覺成像技術極易受到強光、雨、雪、霧霾等環境的干擾,如霧霾或大霧天氣,攝像機成像距離大幅受限制,成像也不清晰;再如對向來車的強光干擾,畫面將會出現大面積光斑。針對各種異常場景,雖然目前提供有部分技術可以一定程度降低環境干擾,但要犧牲一部分影象資訊,如光學透霧,視距可得到一定程度提升,但要丟失色彩資訊,而且畫面效果並不能滿足自動駕駛需求。

第四個則是演算法問題。人工智慧技術的引入,確實解決了影象識別智慧化的問題,但目前的演算法並不能百分百識別,如交通應用中,AI演算法經常把藍色車識別為白色車,且錯識率可高達20%;又如十字路口的紅綠燈,當旁邊掛有燈籠時,攝像機容易識別出錯;或是路邊的人像廣告,也會被識別為行人等;“要做到自動駕駛,目前的AI演算法很難滿足複雜場景的識別要求。”該機器視覺專家表示。

即便視覺技術存在不少有待突破的技術瓶頸,但我們還是看到,目前的所有自動駕駛方案中,機器視覺都是必不可少的技術之一。“相比其他感知技術,視覺技術要成熟很多,重要的是,視覺技術的上車成本很低,相比鐳射雷達動輒上萬元,甚至十數萬元的成本,攝像頭硬體成本可低至幾十塊錢,對主機廠非常具有吸引力。”如上專家表示。

一位自動駕駛領域行業人士也證實了這一點:“目前來看,主機廠可接受的自動駕駛方案價格理想範圍為2000-4000元/套,超出這一範圍,很難把產品推向主機廠;而視覺技術可以大大降低成本,更易於推廣。”

大感知融合仍是未來主流方向

事實上,視覺技術在自動駕駛應用中,還有一項重要的應用,即測距,主流方案有單目測距、雙目測距和三目測距。在動態場景下,單目測距沒有可參照標定,測距精準度差,通常只能作為360°環視或車內監控使用;三目測距又因演算法複雜;市面上主要選用雙目測距方案。

大疆車載一份技術檔案顯示,如果場景複雜、干擾因素多、成像出現困難,將會對視覺測距精度產生重要影響,而且,雙目深度的誤差是與距離的平方成正比,探測距離越遠,誤差也越大。

視覺技術雖然存在短板,但其優勢也很明顯,在光照良好的高速公路等駕駛場景下,透過視覺技術是可以實現一定程度的自動駕駛功能,如跟車行駛、自適應巡航控制等。一位業內人士表示:“目前的自動駕駛方案,還不能解決各種場景問題,而我們要做,並不是一開始就著手全場景應用,而是從最易於實現的場景開始,優先解決理想條件下的自動駕駛應用,然後才逐個解決黑夜、多人/多車等其他場景的應用問題。”

當然,基於視覺技術的自動駕駛方案,需要有強大的演算法和算力支撐;而國內的自動駕駛解決方案提供商,還在不斷匹配各種算力方案。如上業內人士在介紹其基於視覺技術的自動駕駛方案時表示,為了獲得更好的效果,演示時採用英偉達的高算力晶片;但實際的上車方案,可能會選擇價效比更高的平臺。該人士同時指出,高算力平臺方案意味著高成本,為了實現軟硬體的最佳匹配,他們一直在不斷地除錯、最佳化方案。而特斯拉堅定採用視覺技術路線,與其強大的演算法和自研的自動駕駛晶片分不開。

不過,單純的視覺方案,並不被業界主流觀點所認可,自從特斯拉推出純視覺版自動駕駛系統FSD Beta V9。0後,業內人士質疑之聲更加強烈,因為在雨雪、霧霾等惡劣條件下,基於視覺技術的自動駕駛功能將大幅受限,放棄成本不高但可解決干擾問題的毫米波雷達,被認為是一種得不償失的激進選擇。

實際上,包括卡內基梅隆大學電氣與計算機工程教授Phil Koopman等業內人士認為,特斯拉基於視覺的自動駕駛技術只能達到L2級標準,仍嚴重依賴於駕駛員操控。在業內激烈的質疑聲中,特斯拉近期確認,FSD目前啟用的功能並不能讓汽車實現自動駕駛,仍需要駕駛員高度干預,即便汽車自主控制情況下,駕駛員也要做好隨時接管汽車的準備。

當然,視覺技術的短板,可以透過毫米波雷達、鐳射雷達等其他技術手段來彌補,如精準測距,可透過鐳射雷達來補足;全天候工作,則是毫米波雷達的強項,“在我們看來,單純透過視覺技術來實現自動駕駛很難實現;經過這麼多年的探索,大感知融合的技術方案,已經成為行業普遍共識。”來自大疆車載的一位人士表示。

目前最經濟的方案是,採用視覺技術與毫米波雷達技術融合,解決全天候的應用問題,可滿足L2、L3級自動駕駛應用。據瞭解,大疆車載與上汽五菱合作的自動駕駛,正是採用多感知融合方案。Phil Koopman分析認為,未來特斯拉如果要實現L4級及以上更高級別的自動駕駛功能,仍需要包括攝像頭、鐳射雷達在內的多感知融合手段。(校對/James)