RADEON RX 6700 XT 的發佈背景

自打去年下半年起,各種物價飛漲,對 PC 玩傢來說,感受最深的則是加密幣暴漲導致的顯卡缺貨和價格哄抬,廠商缺貨、玩傢買不到顯卡的狀態已經維持瞭幾個月,而這又正恰逢新舊顯卡更新的時間點,舊卡庫存不多,新卡供應不上,正所謂青黃不接又適逢幣潮,所以大傢的感受尤為明顯。

無論是玩傢還是廠商,都希望有更多的顯卡投放市場,哪怕價格略高也會被玩傢和礦主、黃牛馬上秒掉,RADEON RX 6700 XT 12GB 就是在這樣的市場背景下問世的。

NAVI 22 芯片與 RADEON RX 6700 XT 介紹

從產品型號來看的話,RADEON 6700 XT 被設定為 RADEON 5700 XT 的換代產品,現實中 RADEON 5700 XT 其實早就沒貨瞭,所以在正常情況下 RADEON 6700 XT 真正插入的市場區間其實是英偉達當下的 GeForce RTX 3060 Ti 和 GeForce RTX 3070 之間。

RADEON RX 6700 XT 12GB 首發測試報告

RADEON 6700 XT 采用的是 AMD 代號 Navi 22 的 GPU,芯片采用臺積電 7 納米制程生產,集成瞭 172 億隻晶體管,芯片面積 336 平方毫米,基於 RDNA 2 架構。

從功能特性來說,RDNA 2 相對於 RDNA 1 來說主要的變化是引入瞭 DX12U 的硬件支持,例如 DXR 1.1 硬件光線追蹤加速、倍率可變著色(VSR)、網格著色器(Mesh Shader)、采樣器反饋(Sampler feedback,可以讓開發人員以通用計算的方式直接對場景中的對象進行高耗時的打光計算)等。

在性能拓展方面,6700 XT 和 5700 XT 的通用計算單元數量是完全一樣的(40 個 CU,或者說2560 個 SP),主要是依靠提升頻率來提高單精度性能,前者的頻率可以高達 2581MHz(基頻 2424MHz)以上,比後者的 1905MHz(基頻 1755MHz)高大約 35%,單精度性能達到 13.2 TFLOPS(5700 XT 是 9.75 TFLOPS)。

具體頻率取決於具體應用,根據觀察有時候可以達到 2.6GHz 甚至更高,在驅動內置的官方自動超頻表格裡超頻上限可以達到 2.8GHz。

RADEON 6700 XT 擁有 12 GiB GDDR6 板載顯存,內存總線為 192-bit,默認運行頻率為 8GT/s,帶寬為 384 GiB/s,不過RDNA 2 的一個重要特點是集成瞭龐大的末級高速緩存(LLC)——Infinity Cache(無限高速緩存,下面我將其簡稱為 LLC),RX 6700 XT 也具備同樣的特性,擁有高達 96MiB Infinity Cache,按照 AMD 的說法,這個設計可以有效降低傳輸每個位元的能源消耗。

根據 AMD 自己的測試,96MiB LLC能在主流 1440p 遊戲中實現 60% 的命中率,將其乘與 12 條 64字節高速模式為 1.9GHz的 LLC 規格(12 * 64Byte * 1.9GHz * 0.6 = 875.52GiB/s),接近 256-bit 12Gbps GDDR6 的 2.5 倍等效帶寬(256-bit/8-bit per byte * 12Gbps * 2.5= 960GiB/s)。

875 vs 960,差距好像有點大。這裡 1.9GHz 是 AMD review guide 中的說法,要是將數字換成 2.1GHz 的話,更接近於 960GiB/s,當然,另一個可能就是命中率可能更高(例如 67%)。撇除這些細節上的糾結,你隻需要知道,有瞭這個 Infinity Cache 後,遊戲中的訪存性能是可以顯著改善的。

6700 XT 引入瞭 40 個硬件光線追蹤加速器(Raytracing Accelerator,簡稱 RA),每個 CU匹配一個 RA。

關於 RA 的細節我們所知甚少,AMD 所公開的資料表明該單元是一個固定功能單元,隻用於執行光線追蹤中的求交(intersection)加速,性能指標方面是每個 RA 可以每個周期實現 4 個盒體或者一個三角形的求交加速。

這個做法其實和 NVIDIA 的 RTCore 是非常類似的,所不同的是 RTCore 在加速能力上涵蓋瞭更多的部分。第二代 RTCore 對運動模糊下的光線追蹤也做瞭優化,在三角形求交的時候安培 RTCore 的速度可以做到圖靈的兩倍。

BVH 是當前硬件光線追蹤的主要加速結構,原理就是把場景中的物件以多層包圍框的方式包起來,類似套瓷娃,整個場景和各個模型射線求交的時候先進行 BVH 遍歷、求交。

光線追蹤需要從數以百萬計的三角形中找到被當前射線擊中的三角形(這一步被稱為遍歷),采用 BVH 加速體可以顯著減少實際遍歷三角形的次數。

RADEON RX 6700 XT 12GB 首發測試報告

RDNA 2 光線加速器和 RT Core 相比的主要問題是缺乏對遍歷操作進行硬件加速,按照 AMD 的官方說法,在 RDNA 2 上遍歷操作是使用流處理器或者說軟件方式執行。

RDNA 2 的大容量 Infinity Cache 能夠為求交類操作提供降低時延新的效果。

目前的遊戲基本都是采用光柵+光線追蹤渲染方式,也就是光線追蹤用於計算出場景中所需特效後輸出到一個渲染目標緩存中,然後和光柵渲染的渲染目標緩存混合形成最終的畫面效果。

這樣的好處是速度比純光線追蹤快很多,但是依然能提供出色的光線追蹤才能達成的畫面效果,例如下面這兩張圖就是遊戲 Control 中開關光線追蹤透明反射的區別。

開啟光線追蹤透明反射:

RADEON RX 6700 XT 12GB 首發測試報告

關閉光線追蹤透明反射:

RADEON RX 6700 XT 12GB 首發測試報告

Variable Rate Shading 或者說可變倍率著色在 PC 上最早是 NVIDIA 的圖靈架構引入並在 DX12U 中成為微軟標準,它可以讓程序員以 8*8 像素塊為基本單位實現縱橫比例分別為 1:1、2:1、1:2、2:2 的渲染比率,控制畫面不同區域的渲染分辨率比率。例如畫面中心區域采用較高的渲染比率,四周采用較低的渲染比率,從而在畫面效果折扣較低的情況下實現更快的渲染速度。

DX12U 的 VSR 具有 Tier 1 和 Tier 2,和 Tier 1 相比 Tier2 的區別主要是粒度,Tier 1 的比率是寫死在各個渲染調用裡,而 Tier 2 允許在屏幕空間紋理裡指定渲染比率。

這句話怎麼理解?簡單來說就是在 tier 2 下,可以將屏幕輸出為一張紋理,然後對其進行分析,找出可以不犧牲畫質的低渲染率位置,用於下一幀畫面的渲染比率設定,如此一來我們就實現瞭智能化的 VSR 瞭。

下圖使用 VSR Tier 1(彩色塊區表示應用瞭較低的渲染比率):

RADEON RX 6700 XT 12GB 首發測試報告

下圖使用 VSR Tier 2(彩色塊區表示應用瞭較低的渲染比率):

RADEON RX 6700 XT 12GB 首發測試報告

按照微軟使用 Radeon RX 6900 XT 在遊戲 Gears Tactics 上的測試,在打開屏幕空間全局光照的情況下,采用 VSR 高品質模式性能最高可以提升 14%,此時的畫質區別肉眼很難分辨。

RADEON RX 6700 XT 公版實物

我收到的是來自 AMD 的 RADEON RX 6700 XT 公版,該卡采用瞭雙槽雙風扇散熱設計,外觀設計語言與之前的 RADEON RX 6800/6900 系列如出一轍,最大的區別其實就是風扇數量從 3 個改為兩個,插槽占位從 2.5 槽減少為雙槽,外接供電是 8+6(6800 XT 是 8+8),你可以將其看作是 6800 XT 的瘦身版。

從實測情況看,RX 6700 XT 的散熱曲線默認情況下偏向於靜音,我建議大傢盡量再手動調高風扇/溫度轉速曲線,讓顯卡的工況更符合你的期待。

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

由於手頭沒有好的矽脂和散熱墊片瞭,加上現在對拆解興趣不是很大,所以這次我沒有拆卡,不過 AMD 這邊提供瞭 6700 XT 的裸圖(經過修飾的),大傢可以看一下瞭解一下佈局:

RADEON RX 6700 XT 12GB 首發測試報告

RADEON 6700 XT 公版提供瞭 DP+HDMI+DP+DP 的四頭輸出,能實現 8K 60Hz 或者 4K 144Hz輸出。

在視頻編解碼方面,Radeon 6700 XT 提供瞭包括 AV1 在內的最新視頻解碼能力,屬於目前同級水平,我希望下一代的 RDNA 能提供更新的 H.266 硬件支持:


VP9

H.264/AVC

H.265/HEVC

AV1

解碼

4K 90fps

8K 24fps

4K 180fps

4K 90fps
8K 24fps

4K 120fps
8K 30fps

編碼

不具備

4K 90fps

4K 60fps

8k 24fps

不具備

測試平臺

CPU:AMD Ryzen 7 5800X八核全速定頻 4.5GHz 超線程開啟

RADEON RX 6700 XT 12GB 首發測試報告

主板:華碩 ROG Strix X570-E Gaming;BIOS 3405;Resizable Bar/SAM 開啟(RX 6700 XT 有效、RTX 3060 Ti/3070 無效)

RADEON RX 6700 XT 12GB 首發測試報告

內存:阿斯加特 Asgard DDR4 3600 8GB 洛極系列-W3 柔光炫彩RGB燈條 * 4

RADEON RX 6700 XT 12GB 首發測試報告

顯卡驅動:AMD Radeon Software 20.50

RADEON RX 6700 XT 12GB 首發測試報告

電源:Thermaltake 鋼影Toughpoewr PF1 850W 白金牌認證電源

RADEON RX 6700 XT 12GB 首發測試報告

遊戲測試結果

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

測試說明:

  1. 地鐵離去使用的是遊戲內帶官方基準測試;
  2. 刺客信條:英靈殿使用的是遊戲內帶官方基準測試;
  3. Cyberpunk 2077 使用的是第一個救人任務出來後返回傢中的過場(從女警官說“好啦”開始),時間長度為 100 秒,使用幀率采集工具采集;
  4. Control 是使用幀率采集工具采集,位置是從新遊戲開始的大廳跑到清潔工人,時間為 35 秒;
  5. 神隕使用的是遊戲內帶官方基準測試;
  6. 古墓麗影之暗影使用的是遊戲內帶官方基準測試;
  7. 看門狗:軍團使用的是遊戲內帶官方基準測試;
  8. 荒野大鏢客 2 使用的是遊戲內帶官方基準測試。

從遊戲測試結果來看,RADEON 6700 XT 的性能基本處於 GeForce RTX 3060 Ti 和 GeForce RTX 3070 之間的區間,其中占優較大的遊戲是刺客信條之英靈殿,在 1920x1200 和 2560x1600 分辨率下達到瞭 RTX 3070 的 1.6 倍和 1.1 倍。

RADEON RX 6700 XT 在一些光線追蹤效果相對簡單的遊戲中可以和 GeForce RTX 3060 Ti 一較高下,例如神隕(GodFalll),這個遊戲的光線追蹤隻有陰影處理,比較適合 RDNA 2 光線 BHV、三角形求交單元較多、頻率較高的特點。但是遇到更復雜的光線追蹤效果遊戲時候,RDNA 2 缺乏硬件遍歷加速還是拉瞭後腿。

由於目前缺乏類似 DLSS 的畫面重構技術,RADEON RX 6700 XT 有些情況下還是比較吃虧的。

遊戲實際功耗和溫度表現

我們使用 CapFrameX 來做手動遊戲測試的時候也一並記錄下瞭 RX 6700 XT 的功耗、發熱等信息,下圖均為遊戲 Control 測試時記錄的信息,測試設置為 2560x1600 最高特效、光線追蹤全開、DLSS 關閉下記錄的信息。

RADEON RX 6700 XT:

RADEON RX 6700 XT 12GB 首發測試報告

GeForce RTX 3060 Ti:

RADEON RX 6700 XT 12GB 首發測試報告

GeForce RTX 3070:

RADEON RX 6700 XT 12GB 首發測試報告

從傳感器記錄的數字來看,RX 6700 XT 的平均耗電要比 RTX 3060 Ti 低大約 10 瓦,比 RTX 3070 低大約 33 瓦。

不過 RX 6700 XT 驅動采用瞭相對偏靜音的風扇轉速/溫度控制包線,因此在溫度上會高不少(我沒有拆卡,所以溫度值是在原封不動的情況下測試出來的),玩傢們要是覺得偏高最好自行在驅動中調整一下,當然非公版的散熱效果很可能會更好。

同場加映——RDNA 2光線追蹤能力測試

正如我們前面提到的那樣,RDNA 2 的 RA(光線加速器,一共 40 個)具備每個周期 4 個 BVH求交和一個三角形求交硬件加速,但是缺乏遍歷硬件加速,硬件遍歷加速是用 GPU 流處理器以軟件方式執行,那麼這樣的設計會帶來什麼影響以及為什麼 AMD RDNA 2 會采用這樣的設計呢?接下來我會嘗試用實測來說明。

遍歷、求交、遞歸是光線追蹤渲染最常見的三個術語。

遍歷:從數以百萬計的三角形中找到當前射線擊中的三角形;

求交:在擊中的三角形或者加速體上計算出具體擊中的位置;

遞歸:遞歸是光線追蹤渲染與光線投射的最主要區別,遞歸光線追蹤增加瞭射線命中物體後的一系列衍生射線或者說次生射線,例如反射、折射等,光線追蹤中的倒影、折射效果都離不開遞歸。

對於普通讀者來說,這三個概念並不需要準確掌握,你需要知道的是,在真正的光線追蹤渲染中,最耗時的過程就是遍歷、求交,而遞歸會讓遍歷和求交的次數幾何級上升。

隻有找到被擊中的三角形後,光線追蹤的著色處理才能進行。

遍歷、求交雖然屬於真實光線追蹤中最繁重的任務,但是這種任務其實又傻又楞,最適合交給硬件固定單元來實現,因此在英偉達的圖靈架構中開始引入瞭遍歷和求交硬件加速電路——RTCore,每個 SM 搭配一個 RTCore。

有理由相信,相對於其他競爭對手而言,英偉達在 GPU 實現光線追蹤加速方面有更豐富的經驗,因為英偉達的 CUDA 在 GPU 計算市場廣度和深度上遠高於其他對手。

它在 2007 年時已經收購瞭著名的光線追蹤渲染器 Mental Ray,在圖靈架構之前已經構建起瞭圍繞 OptiX 的完整光線追蹤應用生態,在如何做硬件光線追蹤這點上英偉達的確是更有話事權。

例如 Keyshot,這是一個長期被英特爾支持的一直堅持純軟件的工業用光線追蹤渲染器,在圖靈架構發佈後,馬上轉投圖靈支持。我相信在圖靈架構之前英偉達已經和各個光線追蹤渲染器廠商有深入的接觸,瞭解對方的需求,從而使得圖靈的光線追蹤生態搭建順風順水。

AMD 這邊當然也有在努力,例如 Radeon Rays 就是一個類似於 OptiX 的光線追蹤庫,但是說實話,這個東西在生態培植方面和 OptiX 相比差距頗大,這和前幾年 AMD 財務狀況一般不無關系。

不扯遠瞭,我們馬上就要展開光線追蹤的測試。

我這裡使用到的有兩個小程序,都是 github 上的開源項目,分別是 Tanguy Fautre 的 RayTracingInVulkan 和 Will Usher 的路徑跟蹤器 ChameleonRT。

RayTracingInVulkan 是 Tanguy Fautre 編寫的基於 Vulkan 的光線追蹤渲染演示程序,最初它是使用 NVIDIA 的廠商 Vulkan 光線追蹤擴展來做電子書《一周搞定光線追蹤》(Peter Shirley 編寫)的代碼實現。

去年年底 Vulkan 的 KHR(Vulkan 的官方組織)通用光線追蹤擴展發佈後,這個小程序也更新瞭對 KHR 的支持,最新版本實現瞭對 AMD RDNA 2 的正式支持和優化,我測試的就是前兩天才從 github 上 clone 下來的最新版本,使用程序源碼附帶的 .bat 腳本配合 Vulkan SDK 1.62 和微軟 VS 2019 編譯,測試結果如下:

RADEON RX 6700 XT 12GB 首發測試報告


RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 12GB 首發測試報告

這裡的 scene 1 到 scene 5 具體名字分別是 Ray Tracing In One Weekend、Planets In One Weekend、Lucy In One Weekend、Cornell Box 以及 Cornell Box & Lucy。

場景 4、5或者說 Cornell Box 和 Cornell Box & Lucy 由於場景相對簡單,因此可以視作更偏重三角形求交性能的測試,基於安培架構的 GeForce RTX 3060 Ti 由於 RTCore 具備兩倍的三角形求交單元,因此在這個測試中取得瞭更強的性能。

場景 1、2、3 涉及大量的程序化幾何體,在這類測試中 Radeon RX 6700 XT 取得瞭優勢,這也許是因為安培架構的光線追蹤性能受限於 RTCore 的數量( 40 RA vs 36 RTCore)或者 RADEON RX 6700 XT 具備 96 MiB infinity cache 發揮瞭優勢。

接下來讓我們看看路徑跟蹤器 ChameleonRT 下雙方的表現。

我使用瞭名為 Hairball 的場景,這是一個由 288 萬個三角形構成的場景,測試分辨率依然是 2560x1600。

RADEON RX 6700 XT:

RADEON RX 6700 XT 12GB 首發測試報告

GeForce RTX 3060 Ti:

RADEON RX 6700 XT 12GB 首發測試報告

ChameleonRT 是一個支持多個光線追蹤後端(Embree/DXR/OptiX/Vulkan/Metal/OSPRay)的路徑跟蹤器。

所謂路徑跟蹤是光線追蹤的一種實現方式,前面我們說過,光線追蹤和光線投射的最大區別是引入瞭遞歸的概念,射線擊中物體可能會根據物體的特性產生衍生射線,這裡就涉及到如何判斷衍生射線的方向,路徑跟蹤或者說 Path Tracing 一般采用瞭蒙特卡洛隨機算法來確定衍生射線的方向。目前大部分的光線追蹤器都采用瞭 Path Tracing 來實現反射、折射等效果。

從測試結果來看,在這個涉及大量幾何體的測試中,RADEON RX 6700 XT 的性能是 4.8 fps,而 GeForce RTX 3060 Ti 取得瞭接近一個數量級的成績 40 fps。

從測試來看,RDNA 2 采用著色器來做遍歷加速的話,遇到類似 hairball 這種場景的時候,大量的三角形導致的遞歸引發瞭海量的遍歷操作,性能的確會遠不如集成瞭硬件遍歷的安培架構。

我相信,下一代的 RDNA 應該會在這方面做重大改進。

產品總結

RADEON RX 6700 XT 12GB 首發測試報告

RADEON RX 6700 XT 是第二波 RDNA2 顯卡,從產品的角度來看,它的遊戲性能位於 RTX3060 Ti 和 RTX 3070 之間,填補瞭 AMD 目前在 3000 到 4000 元的市場空白,如果能以官方報價 3699 購買到的話,是一個非常合理選擇。

不過今年由於眾所周知的原因,我估計不是那麼容易搶到的,因為3699 元不僅是 RDNA 2 的市場空白區間,而且是事實上整個顯卡市場的空白區間。

要知道這個價格區間在一周前也就可以買到非 Ti 版本的 RTX 3060,而前兩天隔壁的蜜汁操作把解除挖礦限制的驅動掛出來後,現在 RTX 3060 非 Ti 也都躥升到 4000 甚至 5000 以上,3000-4000 元價格區間再成為是空白中的空白,所以手速決定一切。

以上就是這次 RADEON RX 6700 XT 公版測試報告全文,歡迎大傢就產品和技術展開討論。

創作者介紹
創作者 3C王者 的頭像
3C王者宇晨

3C王者

3C王者宇晨 發表在 痞客邦 留言(0) 人氣( 2 )