魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

在Arm與x86競爭的過去十年中,Arm已經徹底贏得了,智慧手機這些低功耗裝置的霸主地位。現在,Arm 架構也正在步入高能耗的膝上型電腦、資料中心和其他裝置領域。Arm 已經成為蘋果生態的核心元素,除了谷歌的安卓生態,Arm 也會在我們自己的鴻蒙、華為移動生態中起到重要的作用。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

多年來,科技評論員和使用者一直把膜拜的目光,放在基於Arm 魔改的蘋果 A系列 和高通的Kryo核心上。

但隨著Cortex-X CPU計劃和Cortex-X1的推出,這種情況可能會在2021年最終改變。

今年,作為Cortex-A77 CPU、Mali-G77 GPU的後續產品,Arm已經公佈了Arm Cortex-A78 CPU架構和Mali-G78 GPU。但沒有想到的是,緊跟著,Arm又宣佈了Cortex-X形式的CPU核心。可以預料,藉助5nm製程的量產,Cortex-X 被廣泛應用的日子很快就要來到。

Cortex-X 已經促使一線大廠改變產品路線

Cortex-X定製(CXC)計劃,重新吸引了眾多一線移動晶片廠商的注意。甚至ARM自己也對Cortex-X1非常自豪,稱它是迄今為止最強大的Cortex CPU。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

三星已經確定在5nm製程,放棄魔改路線,開始使用 Arm 的親生CPU IP,最近已經傳出,三星Exynos 2100 確認將使用ARM Cortex-X1核心,以彰顯與Exynos 1080 之間的差異化。

高通驍龍 875 據傳也將使用ARM Cortex-X1 為主核心,雖然 Cortex-X 也強調客戶的定製性,但傳聞如果成真,無疑說明高通將放棄了自己標榜多年的差異化元素:Kryo核心。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

華為麒麟9000 搭載了滿血Mali-G78 GPU,考慮到Mali-G78 GPU是 ARM 今年九月份推出的全新公版移動端GPU,側面印證了 ARM目前並沒有斷供華為。但因為華為麒麟9000起步研發時間早於 5nm的三星和高通,可能致使華為沒有趕上Cortex-X1,況且華為歷來把研發重心放在NPU 和Soc 上,也許如果有下一代麒麟,很大可能也會採用 Cortex-X 強效能方案。

Cortex-X 產品路線的目的何在

每年5月,ARM公司都會公佈其用於移動裝置的新移動IP(智慧財產權)。這個IP包括新的CPU核心以及新的GPU。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

ARM的產品原則裡,有一條重要的PPA概念:效能、功耗和麵積,這是移動CPU領域,Arm 設計的宗旨,其實質是一種均衡理念。

它強調,能效和電源效率是更高的優先順序,而不是絕對效能。

例如:Arm的Cortex-A78和Cortex-X1均基於上一代Cortex-A77。但是,

Cortex-A78致力於在比以前更小的區域內提供每瓦更多的效能

。為了追求最佳效能,Cortex-X1則是放棄了這些通常的顧慮。

Arm Cortex-A78有望在1W功率預算下,將比Cortex-A77的持續效能提高20%。A78 架構最大的變化是:可用時鐘速度的提升,以及從7nm到5nm製程的轉變。更令人印象深刻的是,據Arm稱,2。1GHz 5nm Cortex-A78的功耗比2。3GHz 7nm Cortex-A77少多達50%。這是對續航來說是巨大的進步。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

但ARM深知,客戶往往會根據不同產品領域的不同需求,要求提供更多的解決方案和產品。

尤其是蘋果、高通、三星為了凸顯自己的產品差異化,三者不約而同的在PPA概念裡弱化的絕對效能領域發力,透過魔改或定製,去追求更大的效能提升。當然這與華為移動方案的首選目標,有著值得注意的不同。

我們可看到,Cortex-X1偏離了Arm的典型路線圖,旨在構建更大,功能更強大的處理器,而且該處理器採用了與Apple A13的Lightning CPU驚人的設計相似之處。這充分展示了Arm 在效能方面依然有著強大的控制力,

Cortex-X1滿足了對具有卓越效能的Arm CPU的需求,而且劍指移動以外的領域

Cortex-X1效能提升在哪裡

在今年,ARM宣佈了Cortex-X定製(CXC)計劃。該計劃需要與ARM工程團隊和ARM的專案合作伙伴緊密合作,高通三星們可以透過該計劃,定製最終的CPU產品,以滿足特定的市場需求,最正宗的官方魔改,超越 PPA 概念,是該計劃的亮點。另外還有重要的一點:由ARM設計和製造的最終定製CPU將以ARM Cortex-X品牌交付,三星Mongoose 和 高通Kryo 也許會隨著Cortex-X推出,逐漸消失。

作為CXC計劃的一部分,首款CPU是ARM Cortex-X1 CPU。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

ARM表示,與Cortex-A78相比,單執行緒整數效能提升高達22%。

ARM稱,“提升 ”指的是,這些提升與短時的高效能有關,而短時的高效能最適合反應速度和響應速度。據稱,這將使智慧手機和大螢幕裝置的效能達到有史以來的最高水平,但從數字上看,Cortex-X1仍然無法與蘋果A14相媲美,不過,它的成績或許能與2019年的蘋果A13持平。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

另一方面,Cortex-X1可以實現更大的可擴充套件性,同時提升峰值效能。合作伙伴在3x Cortex-A8和4x Cortex-A55的同時,增加1x Cortex-X1作為DynamIQ叢集的一部分,其峰值效能將比上一代產品提高30%,這是一個值得注意的壯舉。如果說A78是為能效比而生的,那麼A78與Cortex-X1組合在一起時,將帶來最佳的持續和峰值效能。旗艦安卓手機將變得更快。

採用Cortex-X1的解決方案的關鍵市場是智慧手機和新的外形設計(可摺疊手機和大尺寸多屏裝置)。X1提供了更快的使用者體驗,應用載入時間更快,網頁滾動響應速度也有所提高。隨著ML效能的提升,基於AI和ML的體驗將變得更好。可以預見的是,X1還將改善生產力、通訊、安全、多重數字沉浸感、基於攝像頭、高階遊戲和XR體驗等用例。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

Cortex-X1擴大了其併發處理能力和記憶體佔用量,這讓人聯想到蘋果CPU提升效能的那些手段。ARM在Cortex-X1的基礎上又向蘋果靠近了一步,因為解碼頻寬提高了25%,達到了每個週期解碼5條指令。

Cortex-X1的Neon引擎獲得了兩個額外的管道,其計算能力比A78增加了一倍。在快取大小方面,X1支援64kB L1和高達1MB的L2快取,而DynamIQ叢集也進行了升級,現在支援8MB的L3,以獲得最終的效能。

為什麼不可以四核Cortex-X1

Cortex-X1滿足了對具有卓越效能的Arm CPU的需求。但是這種效能是以更大的表面積和增加的功率為代價的。

對於三星高通們來說,這意味著每平方毫米的矽具有更少的多執行緒效能和效率。因此,

智慧手機SoC似乎不太可能使用四核Cortex-X1叢集,

我們更有可能看到單個Cortex-X1與三個Cortex-A78配對。

這樣的配置僅比四核Cortex-A76叢集佔用15%的面積,同時提供了單執行緒加速所追求的優勢。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

與以前的Arm CPU核心相比,Cortex-X1在每個時鐘週期可以完成更多工作。但X1大核顯然需要更多的功率和矽面積。

這意味著,基於X1大核的混合叢集設計必須來自5nm製程的支援,最佳化面積和效能成為關鍵點,以此來保障裝置的續航能力。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

目前,華為麒麟9000,以及未來的高通 Snapdragon 875,三星Exynos 1080、2100 和聯發科Dimensity主要旗艦晶片都採用1 + 3 + 4架構設計。

麒麟9000擁有1xA77 、3xA77、4xA55 ,超大核心和中核依然採用打磨已久的 A77,但將大核推到3。13GHz。其中24核滿血G78 讓人矚目。

高通,聲稱即將推出的旗艦晶片將擁有一個2。84GHz超大核心Cortex X1,三個2。42GHz A78核心和四個1。8GHz A55核心。

無疑,1 + 3 + 4架構將在2021年佔據主導地位。

Arm CXC計劃對行業意味著什麼

Arm CXC計劃取代了其之前的Build on Arm Cortex計劃,該計劃允許三星高通們對其Cortex-A CPU進行定製改動,甚至,Arm的合作伙伴可以提出一個非標準路線圖規範,讓Arm自己設計出符合要求的CPU。因此,Arm還保留了維護CPU軟體和營銷的責任。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

不過,CXC計劃有一個特別嚴格的附加條件。只有在該年計劃開始時投資的合作伙伴才能從最終產品中獲益。多個合作伙伴可以同時參與該計劃,從而獲得共享技術。這一點很像ASML 的EUV光刻機,參與投資的合作伙伴,才擁有優先購買權。

這讓Arm的合作伙伴可以要求CPU遠遠超出標準的Cortex-A路線圖,而不需要承擔內部設計定製CPU的風險和費用。現在已經確認,三星已經放棄了內部魔改路線的Mongoose CPU核心,這也使得ARM不再使用那些複雜的定製架構授權了。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

Cortex-X1必然會在移動領域推動追求效能的差異化程序,顯而易見的是,恐怕不止於此:Arm處理器已經透過Windows on Arm平臺在PC市場有所行動,蘋果目前已經推出首款搭載Arm的MacBook,更強大的Cortex-X1一定非常適合這個市場。

CXC計劃和X1處理器可能會撼動PC市場,讓Arm成為更可行的處理器選擇。這對英特爾來說又是一個頭疼的問題吧?

結語

Cortex-X1偏離了Arm的典型路線圖,旨在構建更大,功能更強大的處理器。基於ARM的生態會在未來的科技領域,佔據更加主動的地位。

魔改起自己來不遜蘋果高通,揭秘ARM強效能分支Cortex-X1

從麒麟9000架構可以看出,ARM 並沒有傳言的那樣斷供華為,之所以沒用上Cortex-X1,可能基於以下原因:

1、X1沒趕上麒麟的釋出時間節點;

2、海思的CPU策略,更追求能效均衡,透過NPU能力提升獲得移動端體驗,所以一開始就沒有加入CXC計劃。

雖然失去了晶片代工支援,希望華為海思能保持一流的CPU設計能力,等待我們晶片產業鏈強大,等待科技全球化迴歸它本來樣子的那一天。