關閉國產邊緣AI晶片落地人工智慧領域風向

電子發燒友網報道(文/李寧遠)如今,由於物聯網的興起造成了資料衝擊,對重要物聯網感測器資料的處理越來越接近資料最初所在的位置,便有了對基於邊緣計算的機器學習技術的需求。這兩年,人工智慧發展的主題已經非常明確,就是落地應用。在眾多的AI技術當中,無論是上層的演算法應用,還是產品,最終都依賴於底層算力的保障,也就是AI晶片。

邊緣AI市場落地風向

從去年起,邊緣AI市場已經進入爆發期,AIoT終端數量已經超越智慧手機。從AI落地的場景來看,AI晶片的兩大工作負載主要是資料訓練和推理計算。其中,推理計算市場份額的增速正在趕超資料訓練市場。

現在一個演算法模型能做到僅僅2KB,效能表現卻超過4MB的神經網路演算法。深度學習演算法的微型化改變表明以GPT-3為代表的超大型模型並不適用於企業級市場。

在新的物聯網框架中,資料在裝置本地就可以得到處理。這需要在底層晶片設計上就考慮好演算法模型在不同場景中有限的部署條件,包括算力、功耗和矽片面積的分配。從單位算力的成本效用上看,推理計算更能代表企業級市場所需要的落地方向。

邊緣AI晶片落地挑戰

首先就是邊緣AI的場景呈多元化,不同場景對晶片的功耗和效能要求都有差異。而另一方面,碎片化場景的市場容量具有不確定性,需要在晶片研發的工程成本和收益之間取得平衡,這是所有晶片廠商都需要面對的考驗。

高質量資料的獲取同樣是一大難點,即如何從大資料中篩選可靠的資料。大資料不意味著高質量的資料,在AI晶片上執行深度學習任務需要硬體感測器的持續最佳化。

另外對於傳統客戶而言,除了智慧產品的採購成本外,還有使用成本。晶片的功耗,產品是否易於部署,都影響著AI的落地和推廣。晶片廠商如何根據不同的場景定製不同算力的晶片也是落地環節上的痛點。

目前邊緣AI晶片缺乏高可用的開發平臺,軟體編譯工具設計複雜,使用者的開發和使用門檻偏高,但這些可預見都會在落地過程中不斷完善和迭代。

商用邊緣AI晶片

旭日系列

面向AIoT,地平線推出了旭日系列邊緣AI晶片。透過IC設計和軟體的共同努力,實現了效能、功耗、靈活性和成本之間的平衡。旭日2邊緣AI晶片採用BPU伯努利1。0 架構,可提供 4TOPS等效算力,對多類目標進行實時檢測和精準識別。旭日2集成了Dual-Cortex A53,能高效支援多種主流AI任務。同時還支援EMCC、SPI Flash。

旭日3則是地平線推出的,主打低功耗和高效能的全新一代AIoT邊緣AI晶片。其集成了地平線最先進的伯努利2。0架構AI引擎( BPU),可提供5TOPS的等效算力。

新的BPU架構極大提升了對先進CNN網路架構的支援效果,以及極大降低了AI運算對DDR頻寬的佔用率。輔以地平線天工開發AI開發平臺,極大簡化演算法開發與部署過程,降低AI產品的落地成本。

伯努利2。0 BPU結構下,DDR Utilization 呈5倍提升。先進的ISP處理演算法,使得在寬動態、低照度場景下,也能得到1200 w pixel高質量的影象。旭日3可同時處理不同解析度4 ~ 8個Camera Sensor的輸入,並支援多種影象後處理,同時支援 H。264 / H。265 編解碼,效能達到4K@60fps 。

關閉國產邊緣AI晶片落地人工智慧領域風向

(旭日3)

勘智K210 /K510

第一代晶片勘智K210專門針對機器視覺任務設計,浮點計算能力可以達到1。28TFLOPS,可以媲美嵌入式領域主流的開發選擇。同時,它的功耗只有0。3W,典型工作場景的功耗小於1W,單位算力功耗低,是一款非常經濟的選擇。第二代勘智K510根據實際的落地情況和客戶反饋進行升級。這款IP核心重新進行架構設計,實現神經網路中不同層級對計算資源、儲存和頻寬的需求,並且提升資料的複用率,降低晶片功耗。

其次,針對資料獲取的速度和質量,勘智K510配置了全新的視覺模組。與第一代晶片相比,K510在幀率和外設方面都有大幅最佳化。每T算力幀率達到業內領先水平。此外,K510還支援浮點 BF16 計算,在不適合進行模型量化的場景相比同類產品更具優勢。

關閉國產邊緣AI晶片落地人工智慧領域風向

(Video subsystem示意圖)

從長遠來看,邊緣AI晶片將把企業的物聯網應用提升到一個全新的水平。由AI晶片推動的智慧裝置將有助於擴充套件現有市場,同時改變製造、建築、物流、農業和能源等各行業的價值分配方式。