每次 NVIDIA 發(fā)布新一代的顯卡,總會在玩家群體中引起轟動。一方面是核心性能的提升往往突飛猛進,更重要的是每次 NVIDIA 都會帶來一些令人驚艷的新技術(shù)。今年的 RTX 40 系列顯卡首次引入了 DLSS 3 技術(shù),利用 AI 插幀能帶來至多 4 倍的幀數(shù)提升。這無疑會是 GPU 發(fā)展歷史上的一場革命。?
?IT之家提前收到了 RTX 40 系列 GPU 中的旗艦 ——GeForce RTX 4090 Founder Edition。在本次測試中,我們將全部配置拉滿,看看如今消費級 PC 的極限在哪里。具體配置如下:?
?外觀設(shè)計??:??冷酷的銀黑巨獸?
?剛拿到手中時,GeForce RTX 4090 就給人一種十足的力量感。過去高端顯卡一般是三風(fēng)扇三槽,而 GeForce RTX 4090 由于功耗和散熱的提升,變成了一張占據(jù) 3.5 槽的巨型卡。這意味著在裝機時需要準備一臺大一點的機箱。同時由于重量的提升,最好搭配顯卡支架使用。?
?GeForce RTX 4090 的 TDP 功耗提升到了 450W,為了承載更高的功耗,供電接口變成了 16 Pin,目前市面上的電源支持 16 Pin 的并不多,好在包裝內(nèi)附贈了 4 個 8 Pin 轉(zhuǎn) 16 Pin 的轉(zhuǎn)接線。因此也建議大家選擇至少 850W 以上的全模組電源。?
?GeForce RTX 4090 整體造型繼承了與 RTX 30 系列公版 GPU 幾乎一致的設(shè)計,在銀黑相間的裝甲中,是密集的金屬散熱裝甲與兩個巨大的風(fēng)扇。一前一后形成了垂直風(fēng)道。?
?頂部的 GEFORCE RTX 標志在點亮后也會隨之發(fā)光。?
?由于 GeForce RTX 4090 顯卡尺寸比較大,所以在顯卡側(cè)面提供了顯卡架螺絲孔,打開蓋板即可加裝顯卡支架。?
?GeForce RTX 4090 在接口依舊是標準的 3 個 DP 1.4+1 個 HDMI 2.1,可以支持最高 8K 分辨率的顯示器。?
?技術(shù)解析??:??核心規(guī)模暴漲,助力 AI 躍進?
?GeForce RTX 40 系列首發(fā)三款型號分別是 GeForce RTX 4090、GeForce RTX 4080 16GB、GeForce RTX 4080 12GB,我們手中的 GeForce RTX 4090 是基于目前最高端的 AD102 核心打造的,內(nèi)有 16384 個 CUDA 核心、512 個 Tensor 核心、128 個光追核心、512 個紋理單元、176 個 ROP 單元,比上一代 RTX 3090 核心規(guī)模大了一半還多。后續(xù)應(yīng)該還有真旗艦 RTX 4090Ti,解鎖全部 GPC 單元。?
?GeForce RTX 4090 的核心頻率是 2230-2520MHz,相比上代同樣提升了一半多。顯存方面依舊是 384-bit 24GB GDDR6X,但帶寬提升到了 1TB / s。TDP 為 450W,達到了 RTX 3090 Ti 的檔次,相比于 RTX 3090 增加了整整 100W。猜測是由于核心規(guī)模和頻率雙雙暴漲,因此功耗也不得不提高了。?
?GeForce RTX 4090 的架構(gòu)也發(fā)生了不小的變化,它升級到了最新的 NVIDIA Ada Lovelace 架構(gòu)。它基于 TSMC 4N NVIDIA 定制工藝打造,因此實現(xiàn)了高達 2 倍的性能功耗比飛躍。流式多處理器具有高達 83 TFLOPS 的著色能力,吞吐量超過上一代產(chǎn)品 2 倍。第三代 RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產(chǎn)品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的 Tensor 處理性能,超過上一代的 5 倍。SER 為光線追蹤帶來最高可達 3 倍的性能提升,整體游戲性能提升可高達 25%。?
?以上這些數(shù)據(jù)可能比較抽象。反映到具象的功能上,新架構(gòu)帶來了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能夠預(yù)測場景中幀和幀之間的運動變化,實現(xiàn) AI 插幀,在保持圖像質(zhì)量的同時提高幀率。同時支持雙 AV1 編碼器的應(yīng)用,不僅可以將視頻導(dǎo)出時間縮短,還能擁有更好的畫質(zhì)?傊褪怯螒蛏a(chǎn)兩相宜。?
?以上就是對 GeForce RTX 4090 的硬件規(guī)格和架構(gòu)的解析了。至于大家最關(guān)心的 DLSS 3 技術(shù),我們在稍后的游戲測試環(huán)節(jié)再給大家詳解。?
?理論??性能:跑分幾乎翻倍,提升令人驚艷?
?這樣一款旗艦,會在理論性能上有多大的進步呢?接下來我們進行理論測試,首先是單烤甜甜圈,烤機 15 分鐘后,核心溫度穩(wěn)定在 67.6℃左右,功耗穩(wěn)定在 443W 左右,符合 450W 的 TDP。風(fēng)扇也遠沒有滿載,看來這個散熱還是綽綽有余,甚至還有不少超頻空間的。不過這也意味著 GeForce RTX 4090 的確特別吃電源。如果配 i7 / i9 這樣等級的處理器的話,還是老老實實上 1000W 以上的電源吧。?
?接下來進行 3DMark 壓力測試,這個測試可以檢測連續(xù)跑分下顯卡性能有沒有發(fā)生下降,一般 97% 以上才算合格的顯卡。實測 GeForce RTX 4090 的得分為 98.9%,幾乎沒有降頻,完美通過測試。?
?在 3DMark TimeSpy DX12 測試中,GeForce RTX 4090 顯卡分數(shù)達到了 34725 分,作為對比,GeForce RTX 3090 的分數(shù)為 18981 分,RTX 3090Ti 為 21862 分。也就是說 GeForce RTX 4090 的提升達到了 82.95%,這個提升幅度堪稱恐怖。?
?在 3DMark Fire Strike DX11 測試中,GeForce RTX 4090 顯卡分數(shù)達到了 75013 分,作為對比,GeForce RTX 3090 的分數(shù)為 46045 分,GeForce RTX 3090Ti 為 52630 分。提升幅度同樣有達到了 62.91%,這個分數(shù)意味著可以 4K 分辨率流暢運行所有的游戲了,哪怕是光追游戲和 VR 游戲也能滿足高刷新率的需求。?
?在 3DMark Portal Royal 光追測試中,GeForce RTX 4090 獲得了 25080 分,提升幅度比光柵性能來得更大。比 GeForce RTX 3090 幾乎提升了一倍。過去 GeForce RTX 3090 可以在 2K 分辨率下流暢體驗的光追游戲,RTX 4090 已經(jīng)可以再在 4K 分辨率下暢玩了。?
RTX 4090 在理論跑分中的成績絕對稱得上是震撼,我們制作了一份 GPU 物理分數(shù)的對比表,在所有項目中 RTX 4090 相比于前代旗艦卡都有著幾乎翻倍的提升。
?DLSS 3 詳解?:AI 助力游戲,幀數(shù) 4 倍暴漲
?雖然理論性能提升了近 80%,但 NVIDIA 并不滿足于此。發(fā)布會上最重磅的一個技術(shù)升級,便是 DLSS 3 技術(shù)了。DLSS 3 是一款由 AI 驅(qū)動的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驅(qū)動,是 NVIDIA 廣受好評的深度學(xué)習(xí)超級采樣技術(shù)的最新版本,并擁有開創(chuàng)性的光學(xué)多幀生成功能,將開啟 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染游戲和應(yīng)用的新時代。?
?基于 NVIDIA Ada Lovelace 架構(gòu)的光流加速器可分析兩幀連續(xù)的游戲圖像,并計算幀到幀中物體和元素的運動矢量數(shù)據(jù),而無需傳統(tǒng)游戲引擎進行建模。多幀生成模型同時獲取游戲引擎中的運動矢量和光流數(shù)據(jù),這極大地減少了 AI 在渲染諸如粒子、反射、陰影和光照等元素時的視覺異常。?
?簡單地說,過去的 DLSS 2 是通過渲染出一個低分辨率圖像,然后 AI 放大至高分辨率,實現(xiàn)畫質(zhì)與幀數(shù)的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基礎(chǔ)上,還新增了幀生成功能,可以在兩個真實幀之間插入 AI 推算出來的全新幀,實現(xiàn)幀數(shù)的倍增。再結(jié)合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的顯示像素,與沒有 DLSS 相比,游戲性能最高可提升 4 倍!?
?口說無憑,我們直接進入測試環(huán)節(jié)。最新版的 3DMark 已經(jīng)適配了 DLSS 3 的 BenchMark,我們把 GeForce RTX 4090 的測試結(jié)果和 DLSS 2 進行控制變量的對比,可以直觀地看出差異。實測在 DLSS 2 模式下,平均幀數(shù)為 134 幀,相比于不開 DLSS 2 已經(jīng)提升了兩倍多。?
?但如果我們開啟最新的 DLSS 3 技術(shù),GeForce RTX 4090 顯卡幀數(shù)直接來到了平均 165 幀,比不開 DLSS 提升了 3 倍多。這個提升相當明顯。?
?目前,DLSS 3 已經(jīng)得到了許多全球領(lǐng)先游戲開發(fā)者的支持,例如:
《超級人類》(SUPER PEOPLE):搶先體驗版將于 10 月 12 日 13:00 發(fā)布,支持 DLSS 3
《生死輪回》(Loopmancer)將于 10 月 12 日發(fā)布更新版,支持 DLSS 3
《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新圖形展示將于 10 月 13 日發(fā)布,支持 DLSS 3
《微軟模擬飛行》(Microsoft Flight Simulator):將于 10 月 17 日為 Xbox Insider 計劃成員推出測試版,支持 DLSS 3
《瘟疫傳說:安魂曲》(A Plague Tale: Requiem):將于 10 月 18 日發(fā)布,支持 DLSS 3
此外還有超過 35 款游戲和應(yīng)用宣布即將支持該技術(shù),由于只要適配 DLSS 3 就可以向下兼容 DLSS 2,開發(fā)難度非常低,所有后續(xù)肯定會有越來越多開發(fā)商加入 DLSS 陣營。我們選取了《賽博朋克 2077》、《逆水寒》和《虛幻引擎 5:天琴座》這幾款已經(jīng)適配了 DLSS 3 的游戲和 Demo 來對 GeForce RTX 4090 進行測試。此外我們還會測試一款 Unity 引擎的 Demo《Enemies》。?
?首先是最近因為扳機社同名動畫翻紅的《賽博朋克 2077》,我們在 4K 最高畫質(zhì)超級光追 over drive 模式下運行它自帶的 BenchMark,得到了以下數(shù)據(jù)。從這些數(shù)據(jù)中我們可以得到 3 條結(jié)論:?
?1、GeForce RTX 4090 的物理性能已經(jīng)強到可以在原生 4K 分辨率下運行超級光追的《賽博朋克 2077》。?
?2、DLSS 3 的提升非常明顯,在都開到超級性能檔位的前提下,DLSS 3 比 DLSS 2 的幀數(shù)提升了 50%,比不開 DLSS 提升了 2.5 倍。?
?3、由于幀數(shù)提高,實際游玩中開在 DLSS 3 質(zhì)量檔即可體驗流暢度提升并擁有更好的畫質(zhì)。?
?那么 DLSS 3 是否會對畫質(zhì)有嚴重影響呢?我們使用 NVIDIA ICAT 工具進行畫面對比,可以看出左右兩邊的畫質(zhì)差距并不明顯,可以說 DLSS 3 技術(shù)真的可以讓我們“白撿”近一倍的幀數(shù)。?
?↑ 左 DLSS 關(guān)閉 ,右 DLSS 3 平衡?
光線追蹤也是 NVIDIA 帶來的一大革命性功能。它能在虛擬的世界模擬出真實的全景光影和反射。比如下圖中雨后濕潤的地面最能表現(xiàn)出光追賽博朋克的魅力,仔細看水坑的差異就很明顯了,未開啟光追的話只有模糊的投影,而開啟后便會產(chǎn)生栩栩如生的倒影。
?在國產(chǎn)武俠網(wǎng)游《逆水寒》??“拂云庭”更新??中,同樣提供 RTX 光線追蹤和 DLSS 3 的選項。從下面的數(shù)據(jù)可以看出,DLSS 3 在《逆水寒》中的表現(xiàn)比《賽博朋克 2077》還要出彩。不開啟 DLSS 幾乎是不可玩的狀態(tài),而在開啟 DLSS 3 后,幀率提高了近 5 倍。相比于同檔位的 DLSS 2 也提升了近 65%。?
?在畫質(zhì)方面,我們選擇了一處場景中的細節(jié),可以看出 DLSS 關(guān)閉和 DLSS 平衡的畫面差距微乎其微,甚至有些地方打開 DLSS 的畫質(zhì)反而更清楚了一些,這就是 AI 技術(shù)的魅力所在。?
?↑ 左 DLSS 關(guān)閉 ,右 DLSS 3 平衡?
?接下來是一款使用虛幻 5 引擎制作的游戲 Demo《??天琴座??》。虛幻 5 引擎提供了對 RTX 光線追蹤、DLSS 3 和 NVIDIA Reflex 完整的支持,因此后續(xù)會有大量基于虛幻 5 引擎打造的 3A 大作上線(比如《黑神話:悟空》)。?
?DLSS 3 在《天琴座》中的表現(xiàn)同樣符合預(yù)期。在開啟 DLSS 3 后,幀率提高了近 1.7 倍。相比于同檔位的 DLSS 2 也提升了近 20%。?
?除了虛幻引擎外,Unity 引擎也提供了對 RTX 光線追蹤、DLSS 3 和 NVIDIA Reflex 的完整支持。最后我們測試一款畫質(zhì)爆炸的 Demo《Unity:Enemies》。這款 Demo 就沒有那么多檔位可以選了,只能調(diào)整開關(guān)。GeForce RTX 4090 在開啟 DLSS 3 后,幀數(shù)暴漲了近 2.5 倍,4K 渲染絲般順滑。?
?在對于 AI 來說難度頗高的衣物紋理和發(fā)絲渲染方面,打開 DLSS 和關(guān)閉 DLSS 也幾乎沒有畫質(zhì)區(qū)別,可以說在 DLSS 3 的 AI 助力下,4K 光追游戲終將普及,成為各種游戲的標配。?
?那么 DLSS 3 技術(shù)就是十全十美的嗎?當然不是。DLSS 3 的本質(zhì)是 AI 生成全新幀,生成幀必定有一個副作用就是延遲的提高。畢竟我們鼠標是對我們看到的那一幀做出的反饋,而 AI 卻會加上額外的幀,這個延遲的提高對于競技游戲的影響是很大的。所以在打開 DLSS 3 的幀生成功能時,NVIDIA Reflex 會強制打開,盡量縮短生成幀帶來的渲染延遲。?
?游戲?qū)崪y??:??通吃 4K 大作,挑戰(zhàn) 8K 暢玩?
?除了支持 DLSS 3 的大作外,IT之家也為大家測試了幾款主流游戲。GeForce RTX 4090 本次會全程在 4K 分辨率最高畫質(zhì)下進行測試,在新上線的《守望先鋒》“歸來”中,幀數(shù)甚至可以跑到 600 幀的上限。即便是激烈戰(zhàn)斗也能保持在 500 幀左右,電競體驗極佳。?
?并且這款游戲還支持 NVIDIA Reflex 低延遲,它使 CPU 能夠在完成前一幀之前就開始向 GPU 提交渲染工作,從而大大減少甚至消除渲染隊列,這使得響應(yīng)時間更快,瞄準精度更高。?
?在《古墓麗影: 暗影》中,實測在 4K 分辨率最高畫質(zhì)下運行 BenchMark 能跑到 176 幀,已經(jīng)能滿足 4K144Hz 的顯示器暢玩了。?
?這款游戲也有 DLSS 支持,但版本比較老,所以效果肯定沒有 DLSS 3 那么明顯了,實測 GeForce RTX 4090 下平均提升到了 185 幀。?
?最后我們測試一款光追 3A 大作《控制》,4K 最高畫質(zhì)最高光追下不開 DLSS 只能勉強流暢游玩,而 GeForce RTX 4090 開啟 DLSS 后幀數(shù)直接翻倍,這個體驗相當出色了。?
?總的來說,GeForce RTX 4090 在 4K 分辨率下已經(jīng)能滿足高幀數(shù) 3A 的全部要求。如此強悍的性能,再加上 DLSS 3 的加持,即便是 8K 游戲也是可以挑戰(zhàn)的,并且 24G 的超大顯存使得它自始至終都沒有發(fā)生過爆顯存的問題,如果你有一臺 4K144Hz 顯示器的話,那么 RTX 4090 的顯卡會是不二之選。?
?創(chuàng)意生產(chǎn)??:??消費級生產(chǎn)力巔峰?
?到了 GeForce RTX 4090 這個級別的,肯定不僅僅是打游戲,創(chuàng)意生產(chǎn)和深度學(xué)習(xí)??也??是主要受。GeForce RTX 4090 也是一款通過 NVIDIA Studio 加速的 GPU。目前有超過 75 款創(chuàng)意應(yīng)用可以調(diào)用 AI 算力,來大大提高工作效率。?
?在建模渲染類軟件中,GeForce RTX 4090 可以利用 CUDA 為工作提供硬件加速,目前幾乎所有的建模軟件都會對 NVIDIA 的 GPU 有優(yōu)化,所以能做到效率、穩(wěn)定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光線追蹤,實現(xiàn)高性能最終幀渲染。借助搭載 AI 的降噪功能,GPU 可進一步加速交互式渲染。?
?V-Ray Benchmark 開啟??歷史記錄??rce RTX 4090 GPU CUDA 加速的話,分數(shù)達到了 4221 分,創(chuàng)下了歷史紀錄。?
?得益于光追性能的提升,GeForce RTX 4090 在 V-Ray GPU RTX 中的分數(shù)也提高到了 5840 分,足以應(yīng)對實時光追的重度渲染。?
?最后我們跑一下另外一款渲染軟件 Octane,它可以藉由 RTX 加速的光線追蹤和搭載 AI 的 OptiX 降噪可實現(xiàn)快速的交互式渲染。GeForce RTX 4090 最終的測試結(jié)果來看,其渲染能力已經(jīng)相當于至多 26 塊 GTX 980 同時工作,GPU 的提升真是日新月異啊。?
?在視頻后期這一塊,GeForce RTX 4090 配備第八代 NVIDIA NVENC 編碼器,支持 AV1 編碼和雙編碼器。AV1 是下一代的視頻編碼技術(shù),能夠在占用相同空間情況下,提供更加快速的視頻編碼和更高質(zhì)量的流媒體傳輸性能??。?
?NVIDIA 與多家行業(yè)合作伙伴密切合作,當今主流多媒體應(yīng)用均可以支持 AV1。目前國內(nèi)的剪映專業(yè)版已經(jīng)支持 NVIDIA 的 AV1 的視頻編碼器加速。OBS 直播軟件也支持了 NVENC 的 AV1 編碼的錄制,希望能盡快適配 AV1 編碼的直播,大大節(jié)約直播帶寬。?
?常用的視頻調(diào)色剪輯軟件 DaVinci 也提供了 AV1 編碼的支持,作為一個免費開源的編碼,后面會有越來越多的主流軟件加入進來。?
?IT之家為大家測試了 PugetBench For Davinci。基于 NVIDIA CUDA 技術(shù)的 GPU 加速特效可實現(xiàn)更快速度的實時視頻編輯和幀渲染,使用 NVIDIA 編碼的輸出速度提升最高可達 5 倍。GeForce RTX 4090 最終分數(shù)可以達到 2610 分,剪輯 8K 視頻也不會卡頓,實時回放也不用開代理了。?
?此外,NVIDIA 還為 RTX GPU 提供了 NVIDIA Broadcast 這個神器。它通過人工智能技術(shù),實現(xiàn)了音頻降噪、綠幕??摳像??、人像聚焦等實用效果。?
?現(xiàn)在筆者就在家里用一套簡單的 USB 攝像頭和麥克風(fēng)進行直播,即便是只有這么一臺電腦一個攝像頭,但在 RTX GPU 的幫助下,便能在各類應(yīng)用中選用 NVIDIA Broadcast 應(yīng)用從而效果。?
?總結(jié):AI 是我們這一代人的工業(yè)革命?
?雖然測試時間非常緊張,但筆者依舊被 GeForce RTX 4090 所震撼。一方面它大約 80% 的光柵性能提升屬實巨大,似乎在驕傲地宣告后摩爾定律時代的 GPU 性能突破。另一方面是感慨于 NVIDIA 將 AI 技術(shù)融入了 GPU 的方方面面,甚至突破了顯卡的物理法則,?通過 DLSS 3 的 AI 技術(shù)和全景光線追蹤,?為游戲領(lǐng)域帶來數(shù)倍的提升。?而對于廣大開發(fā)者們來說,?怎樣充分利用 RTX 40 系 GPU 的非凡 AI 算力,決定了我們?nèi)绾巫V寫下一個世代。?
?價格方面,GeForce RTX 4090 Founder Edition 的建議零售價是 12999 元。和它巨大的性能提升相比,這個價格并不算昂貴。如果你是想體驗 4K144Hz 的游戲發(fā)燒友,或者靠 GPU 吃飯的企業(yè)用戶專業(yè),那么 RTX 4090 絕對是目前獨一無二的頂級選擇。但如果你是一個?普通玩家并不需要用到那么高端的 GPU,NVIDIA Ada Lovelace 架構(gòu)的中高端型號,或考慮現(xiàn)在價格已趨于穩(wěn)定的 RTX 30 系列型號。
?值得一提的是,本次 NVIDIA 將限量推出 GeForce RTX 4090 FE 版,于北京時間 10 月 12 日晚 9 點在京東首發(fā)上市,旨在為鐘愛 FE 版設(shè)計的發(fā)燒級玩家?guī)頍o與倫比的體驗。屆時玩家可以選購來自 NVIDIA FE 版和來自頂級顯卡供應(yīng)商的 RTX 4090 GPU 標頻版和超頻版。此外,非公版的 RTX 4090 顯卡已由 NVIDIA 授權(quán)合作伙伴華碩、七彩虹、耕升、影馳、技嘉、映眾、微星和索泰推出,同樣于北京時間 10 月 12 日晚 9 點在各大平臺首發(fā)上市。