NVIDIA RTX 40系顯示卡釋出:效能提升4倍

稿源:中關村線上

不出所料,NVIDIA RTX 40系顯示卡在GTC開發者大會與我們見面。整場大會由23點開始,持續至次日0點30分左右,不過在長達1小時30分的會議期間,GeForce RTX顯示卡的釋出僅佔用了20分鐘的時間。

我們可以理解為重磅產品要簡單明瞭的公佈出來,不過顯而易見,老黃意在NVIDIA的“AI元宇宙帝國”。

還是RTX 30系顯示卡釋出會熟悉的“i am AI”,只不過這次NVIDIA賦予了AI更多的身份。

更多關於醫療、自動駕駛、數字孿生、深度學習的內容,我們不在本文過多探討,著重看看本次釋出的兩款重磅產品——GeForce RTX 4090和GeForce RTX 4080。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

01GeForce RTX 40系顯示卡簡介

雖然RTX 40系顯示卡只有短短的20分鐘時間,但能講的依然不少。本次釋出會共釋出了2款3張顯示卡,2款分別為GeForce RTX 4090/GeForce RTX 4080,而3張則是因為GeForce RTX 4080分為16GB和12GB兩個版本。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

從目前釋出會公佈的一些引數來看,GeForce RTX 4090依然是怪獸級別的效能,並且在CUDA數量懸殊如此大的情況下,即便是NVIDIA對於它的遊戲效能也是侃侃而談。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

而從賬面資料來看,GeForce RTX 4080的CUDA數量只有4090的60%左右,並且在視訊記憶體位寬上相較GeForce RTX 3080 10GB的320 bit也有所下降,功耗卻依然維持在了320W。

另外GeForce RTX 4080 12GB的視訊記憶體位寬僅有192 bit,這些資料看起來讓這張卡有點不像“80”級別的產品,不過畢竟兩代產品所使用的架構不同,我們也不好在這裡胡亂猜測,一切都要等實際測試結果出來。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

除了引數方面,在外觀上,FE版的RTX 40系顯示卡並沒有太多的變化,我們僅能從圖中看出顯示卡的側面均採用了內凹的傾角設計,而且細看的話,其中“4090”的數字字型,相較之前也有所不同。但實際還是以我們拿到手的實拍圖為準。

整體來看,此次釋出的2款產品,基本屬於“超時代”的產物,不說GeForce RTX 4090這樣的怪獸。即便是目前GeForce RTX 3060在高畫質解析度下玩3A遊戲也是不虛的,況且目前還有那麼多玩家手持GTX 1060這樣的價效比之王。

所以對於即將上市的RTX 40系顯示卡,則更適合那些純純的發燒友,RTX 30系將依舊是主流玩家之選。

RTX 4090將於10月12日上市,建議零售價12999元起。

兩種配置版本的RTX 4080將於11月上市,建議零售價分別為9499元起和7199元起。

02NVIDIA Ada Lovelace架構淺析

本次釋出的GeForce RTX 40系顯示卡由全新的NVIDIA Ada Lovelace架構打造,採用TSMC 4N定製工藝,達到了恐怖的760億個電晶體,而在RTX 30系顯示卡中為280億個。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的效能提升。最高可達到90-TFLOPS的著色器資料吞吐量,而本次釋出的GeForce RTX 4090則達到83-TFLOPs,相比上一代NVIDIA Ampere則只有40-TFOPs。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

第三代RT Cores

RT Core的作用在於更快的光線追蹤計算能力,如果說在RTX 30系顯示卡中,想要暢享4K高幀率遊戲有點吃力,那麼RTX 40系顯示卡中,將顯得輕而易舉。

在GeForce RTX 4090這張顯示卡上,達到了191 RT-TFLOPs的處理能力,而RTX 30系顯示卡最快處理能力為78 RT-TFLOPs,足足為2。4倍。並且根據NVIDIA的官方說法,第三代RT Core的峰值RT-TFLOPs相比於前代提高了2。8倍。而這隻能說明,這張4090並非Ada Lovelace架構的最終形態。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

第四代Tensor Cores

除了光追單元的升級外,第四代張量核心的升級更加恐怖。它採用了新的FP8張量引擎,在GeForce RTX 4090這張顯示卡上,吞吐量達到了1。32 Tensor petaFLOPs,提高了5倍。

注意這裡的單位——petaFLOPs。

以往的TFOPs為萬億次浮點運算,而petaFLOPs則為千萬億次浮點運算。

03DLSS 3 —— 神經網路渲染新時代

比較值得注意的是,在此次釋出會上,DLSS被著重強調了一番。並且從目前來看,只有Ada Lovelace才引入了DLSS 3。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

與此前不同的是,DLSS 3添加了AI驅動,在它的幫助下可以生成全新的高質量幀,而不僅僅是畫素。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

全新的DLSS 3結合了DLSS超解析度、DLSS幀生成和NVIDIA Reflex 這三大技術,能夠重建八分之七的畫素,極大提高效能。如果DLSS 2能夠將幀率提高2倍,那麼DLSS 3則能夠提升4倍。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

並且在10月份我們就能見到第一批支援DLSS 3的遊戲,根據NVIDIA的官方說法,DLSS 3首發即支援超過35款遊戲及應用程式,不過目前尚不知道RTX 40系以前的顯示卡是怎樣獲得提升的,這一點我們也會在後續的評測中進行實測。

04播片環節

當然除此之外,在釋出會上還公佈了Ada Lovelace架構的一些其他創新和提升,在本篇回顧文章中就不多做剖析了。

誰家釋出會也免不了播片環節,更何況是以圖形計算見長的NVIDIA,下面我們就來欣賞幾張讓人難辨真假的圖片。

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

NVIDIA RTX 40系顯示卡釋出:效能提升4倍

最後一個彩蛋,本次GTC大會,黃仁勳全程在黑底背景下講解。那麼大家猜猜,本次釋出會上的“老黃”,到底是真是假呢?