英特爾推出第二代神經擬態晶片

英特爾推出了第二代神經擬態計算晶片 Loihi 2,這是第一款基於英特爾 4 工藝技術構建的晶片。Loihi 2專為研究尖端神經形態神經網路而設計, 帶來了一系列改進。它們包括一個新的神經元指令集,提供更多的可程式設計性,允許尖峰具有超過 1 和 0 的整數值,並且能夠擴充套件到更大系統的晶片的 3D 網格中。

這家晶片製造商還推出了 Lava,這是一種用於開發神經啟發應用程式的開源軟體框架。英特爾希望讓神經形態研究人員參與 Lava 的開發,當它啟動並執行時,將允許研究團隊建立彼此的工作。

Loihi 是英特爾版本的神經形態硬體,專為受大腦啟發的尖峰神經網路 (SNN) 而設計。SNN 用於基於事件的計算,其中輸入尖峰的時間對資訊進行編碼。一般來說,較早到達的尖峰比那些較晚到達的尖峰具有更多的計算效果。

英特爾推出第二代神經擬態晶片

英特爾的 Loihi 2 第二代神經擬態處理器。(來源:英特爾)

神經形態硬體和標準 CPU 之間的主要區別之一是記憶體的細粒度分佈,這意味著 Loihi 的記憶體嵌入單個核心中。由於 Loihi 的峰值依賴於時序,因此該架構是非同步的。

“在神經擬態計算中,計算是透過這些動態元素之間的相互作用產生的,”英特爾神經擬態計算實驗室主任Mike Davies解釋說 。“在這種情況下,正是神經元具有這種動態特性,可以線上適應它接收到的輸入,而程式設計師可能不知道晶片要經過哪些步驟才能得出答案的精確軌跡。

“它經歷了一個自我組織狀態的動態過程,並適應了一些新的條件。我們稱之為最終固定點,或平衡狀態,是編碼你想要解決的問題的答案,”戴維斯補充道。“所以它與我們甚至考慮其他架構中的計算的方式有著根本的不同。”

迄今為止,第一代 Loihi 晶片已在各種研究應用中得到驗證,包括自適應機器人手臂控制,其中運動適應系統的變化,減少手臂上的摩擦和磨損。Loihi 能夠調整其控制演算法以補償錯誤或不可預測的行為,使機器人能夠以所需的精度執行。Loihi 還用於 識別不同氣味的系統。 在這種情況下,它可以比基於深度學習的等效物更有效地學習和檢測新的氣味。Deutsche Bahn 的一個專案也使用 Loihi 進行列車排程。系統對軌道關閉或列車停運等變化作出快速反應。

第二代功能

Loihi 2 基於英特爾 4 工藝的預生產版本,旨在在不影響能源效率的情況下提高可程式設計性和效能。與其前身一樣,它的功耗通常約為 100 mW(最高 1 W)。

資源密度的增加是最重要的變化之一;雖然該晶片仍包含 128 個核心,但神經元數量增加了八倍。

“在單個晶片中獲得更多的儲存、神經元和突觸對於商業可行性至關重要……並以對客戶應用程式有意義的方式將它們商業化,”戴維斯說。

英特爾推出第二代神經擬態晶片

Loihi 2 功能。(來源:英特爾)

使用 Loihi 1,工作負載通常會以非最佳方式對映到架構上。例如,當空閒記憶體仍然可用時,神經元計數通常會達到最大值。Loihi 2 中的記憶體量總體上是相似的,但已被分解為更靈活的記憶體庫。對網路引數添加了額外的壓縮,以最大限度地減少較大模型所需的記憶體量。這釋放了可以重新分配給神經元的記憶體。

結果是 Loihi 2 可以用相同數量的記憶體解決更大的問題,每毫米2 芯片面積的神經網路容量增加了大約 15 倍——請記住,新工藝技術使芯片面積整體減半。

神經元可程式設計性

可程式設計性是另一個重要的架構修改。以前固定功能的神經元雖然可配置,但在 Loihi 1 中獲得了完整的指令集,在 Loihi 2 中。指令集包括常見的算術、比較和程式控制流指令。這種程度的可程式設計性將允許更有效地執行各種 SNN 型別。

“這是一種微程式碼,允許我們對幾乎任意的神經元模型進行程式設計,”戴維斯說。“這涵蓋了 Loihi [1] 的侷限性,通常我們發現更多應用價值可以透過更復雜和更豐富的神經元模型來解鎖,這不是我們在 Loihi 開始時所期望的。但現在我們實際上可以涵蓋我們的合作伙伴試圖研究的全部神經元模型,以及計算神經科學領域 [正在] 提出和表徵的內容。”

英特爾推出第二代神經擬態晶片

Loihi 2 晶片是第一個採用英特爾 4 工藝技術的預生產版本製造的晶片。(來源:英特爾)

對於 Loihi 2,尖峰的概念也得到了推廣。Loihi 1 採用嚴格的二元尖峰來反映生物學中所見,尖峰沒有大小。所有資訊都由尖峰時間表示,較早的尖峰比後期的尖峰具有更大的計算效果。在 Loihi 2 中,尖峰攜帶可用於可程式設計神經元模型的可配置整數有效載荷。雖然生物大腦不會這樣做,但戴維斯說英特爾在不影響效能的情況下新增到矽架構相對容易。

“這是我們偏離嚴格的生物學保真度的一個例子,特別是因為我們瞭解重要性是什麼,它的時間編碼方面,”他說。“但是[我們意識到]我們可以做得更好,如果我們有這個額外的量級可以與這個峰值一起傳送,我們可以用更少的資源解決同樣的問題。”

基於廣義事件的訊息傳遞是 Loihi 2 支援稱為 sigma-delta 神經網路 (SDNN) 的深度神經網路的關鍵,該網路比 Loihi 1 上使用的計時方法快得多。SDNN 以相同的方式計算分級啟用值與傳統的 DNN 一樣,但僅在它們以稀疏的、事件驅動的方式發生時傳達重大變化。

3D 縮放

Loihi 2 據稱在電路級別上比其前身快 10 倍。戴維斯聲稱,結合功能改進,該設計可以提供高達 10 倍的速度增長。Loihi 2 支援 200ns 以下的最小全晶片時間步長;它還可以比生物神經元快 5,000 倍的速度處理神經形態網路。

新晶片還具有可擴充套件埠,允許英特爾將神經網路擴充套件到三維。由於沒有用於執行更大神經網路的外部儲存器,Loihi 1 需要多個裝置(例如英特爾的 768-Loihi 晶片系統 Pohoiki Springs)。Loihi 1 晶片的平面網格成為 Loihi 2 中的 3D 網格。同時,晶片到晶片的頻寬提高了四倍,壓縮和新協議提供了晶片之間傳送的冗餘尖峰流量的十分之一。Davies 表示,對於大多數工作負載而言,綜合容量提升約 60 倍,避免了由晶片間連線引起的瓶頸。

還支援三因素學習,這在前沿神經形態演算法研究中很流行。將第三個因素對映到特定突觸的相同修改可用於近似反向傳播,這是深度學習中使用的訓練方法。這創造了透過 Loihi 學習的新方式。

英特爾推出第二代神經擬態晶片

Loihi 2 將作為用於開發邊緣應用程式 (Oheo Gulch) 的單晶片板提供給研究人員。(來源:英特爾)

Lava

Lava 軟體框架完善了 Loihi 增強功能。該開源專案可供神經形態研究社群使用。

“軟體繼續阻礙著這個領域,”戴維斯說。“在過去的幾年裡,並沒有太大的進步,與硬體的步伐不同。而且還沒有出現單一的軟體框架,正如我們在深度學習世界中所看到的那樣,TensorFlow 和 PyTorch 獲得了巨大的動力和使用者群。”

雖然英特爾為 Loihi 演示了一系列應用程式,但開發團隊之間的程式碼共享受到限制。這使得開發人員更難在其他地方取得的進展基礎上再接再厲。

戴維斯說,作為一個新專案而不是產品推廣,Lava 旨在作為一種構建框架的方式,支援 Loihi 研究人員研究一系列演算法。雖然 Lava 的目標是基於事件的非同步訊息傳遞,但它也將支援異構執行。這允許研究人員開發最初在 CPU 上執行的應用程式。透過訪問 Loihi 硬體,研究人員可以將部分工作負載對映到神經形態晶片上。希望這種方法有助於降低進入門檻。

“我們看到這裡需要融合和共同發展,以實現這個更大的目標,這對於神經形態技術的商業化是必要的,”戴維斯說。

Loihi 2 將被開發高階神經形態演算法的研究人員使用。用於實驗室測試的單晶片系統 Oheo Gulch 最初將提供給研究人員,隨後是 Kapoho Point,Kapoho Bay 的八晶片 Loihi 2 版本。Kapoho Point 包括一個乙太網介面,旨在允許板堆疊用於需要更多計算能力的機器人等應用。

更多晶片相關知識,請搜尋“眾壹雲”