為何會有GeForce RTX 3070 Ti這款產品的面世?其實除瞭NVIDIA自身擴展、細化產品線的因素之外,更重要的原因還是在於NVIDIA在4500元級左右的中高端顯卡市場上的RTX 30系產品空缺所迫。在這個價位的非光追遊戲市場上,3899元首發價格的RTX 3070被RX 6800“死死地”吃住。但顯然NVIDIA是不願意看到這一幕的,於是順著擴展產品線的勢頭,RTX 3070 Ti就這樣來到瞭臺前,並且揮劍直面RX 6800,開始瞭一場中高端顯卡市場C位的搶奪戰爭。
相對RTX 3070規格小幅提升
GeForce RTX 3070 Ti到底是一款怎樣的產品?讓我們首先來看看它的“硬”實力。
作為新推出用於填補RTX 3070與RTX 3080之間產品缺漏的“急先鋒”,GeForce RTX 3070 Ti從目前NVIDIA發佈的產品進度來看,理論上它應該是用於取代前一代的對位產品RTX 2070 SUPER(圖靈核心沒有發佈RTX 2070 Ti產品)。GeForce RTX 3070 Ti仍然是基於NVIDIA Ampere架構打造,和RTX 3070一樣采用的是面對主流市場的GA104核心,具體代號為GA104-400-A1,以400的小序號命名,是不是也意味著RTX 3070 Ti是GA104核心的頂頭大哥?而相比面向高端市場的GA102核心來說,GA104在規格上有一定幅度的縮減。
RTX 3070 Ti配置瞭48組NVIDIA Ampere架構的SM模塊,理論CUDA核心數量為6144個。與早期發佈的“兄弟”——GeForce RTX 3070相比,RTX 3070 Ti在SM模組數量上僅有2組的硬件規格優勢,也就意味著RTX 3070 Ti相比RTX 3070在CUDA數量上多出256個。此外,192個第三代Tensor Core張量核心、48個第二代RT Core光追核心的配置也相對RTX 3070有小幅提升。
在顯存方面,相對於RTX 3070,RTX 3070 Ti的顯存從GDDR6升級到瞭GDDR6X,容量仍為8GB,但速率方面得益於GDDR6X的優勢,從14Gbps提升到瞭19Gbps,不過位寬仍然限制為256-bit,這樣其顯存整體帶寬為608GB/s,相比RTX 3070有不小提升。從規格的對比上來看,RTX 3070 Ti相對於RTX 3070來說隻能算是有小幅度提升,根據經驗判斷的話,二者之間的性能差距大約會在5%左右。不過再加上GDDR6X顯存的加持,估計二者之間的性能差距應該會提高到8%~10%上下。
再來看與RTX 3080的比較。坦白講,這一代的3070 Ti與大哥RTX 3080的差別還是比較明顯的。首先在SM模塊上,48組對68組,RTX 3070 Ti相比RTX 3080在CUDA核心數量上落後瞭2560個,再加上4GB GDDR6X顯存容量的差距,可以預估的是RTX 3070 Ti與RTX 3080之間的性能差距有可能達到20%~25%,甚至更高。
NVIDIA Ampere一脈相承
一脈相承,NVIDIA Ampere架構加持
純技術向的東西總是讓很多讀者、玩傢都會感覺枯燥,但是這些卻又不能不講。在RTX 3080 Ti首發評測的時候,我們也再次重提瞭NVIDIA Ampere架構GPU的核心技術特色。輪到RTX 3070 Ti深度測試解析之前,我們認為仍然有必要對其加深印象,因此我們也把NVIDIA Ampere架構的簡單技術解析再次搬瞭過來,讓我們一起來再次復習一下吧!
▲完整的NVIDIA Ampere架構GA102核心包含7個GPC,84組SM模塊。後續包括RTX 3070系的GA104核心以及RTX 3060系的GA106核心皆是在GA102的基礎上做相應減法得到。
全新的SM模塊,CUDA翻倍
SM(Streaming Multi-processer,流式多處理器模塊)模塊一直是NVIDIA GPU的計算核心,在新核心的安培架構上,由於計算任務的變化,Ampere核心的SM模塊也有瞭巨大的變化。
▲面向圖形的安培架構的SM模塊,可以看到其內部采用瞭FP32+INT32的設計。
▲ 圖靈架構的SM模塊。
NVIDIA Ampere架構核心的SM的計算單元內部,依舊配置瞭1個warp調度單元和1個派遣單元、16384×32bit寄存器和後端LD/ST、SFU單元,但是在計算的部分卻包含瞭1組16個可自由執行FP32和INT32計算的雙功能計算單元(ALU)——它們既可以完成FP32計算,又可以完成INT32計算,另外還包含瞭1組16個FP32計算單元和1個新的第三代張量核心。這樣,同為4個SM計算單元組成的SM模塊,GA10X安培架構擁有等效128個CUDA核心(極致情況下),相當於圖靈核心的兩倍。我們知道,圖形和計算操作和算法、現代著色器工作負載通常混合使用FP32算術指令。FP32加速也有助於光線追蹤降噪著色器。光線追蹤渲染工作負載越大,相對於上一代產品的性能提升越大。
第二代RT Core光追核心
圖靈架構為遊戲引入實時光線追蹤,轟動一時,為遊戲帶來瞭逼真的光照、圖像質量、遊戲玩法和沉浸感、陰影和特效,並帶來超出想象的遊戲畫質表現。Ampere架構的第二代RT Core的性能提升一倍,帶來2倍於Turing第一代RT Core的吞吐量,同時支持光線追蹤和著色,使光線追蹤性能達到全新高度。換而言之,光線追蹤使用率越高,速度提升越大!同時第二代RT Core還引入瞭動態模糊等重要特性。
NVIDIA Ampere架構的RT Core將光線交匯處理速度提高一倍,同時支持光線追蹤與著色。光線三角形吞吐量增加一倍,Ampere架構的RT Core可達39.7 RT TFLOPS,Turing架構為23.8 RT TFLOPS,提升巨大。
第三代Tensor Core張量核心
面向圖形的安培架構也加入瞭第三代張量計算核心,專門為稀疏矩陣優化。RTX 3070 Ti所配置的Tensor Core可加速用於深度神經網絡處理功能的線性代數,這是現代AI的基礎。全新第三代Tensor Core加速AI功能,例如用於AI超分辨率的NVIDIA DLSS和用於AI增強的聲畫處理技術NVIDIA Broadcast應用。
▲在DLSS的支持下,不但遊戲幀率有大幅度提升,在畫面細節表現上也沒有損耗,甚至畫面清晰度更好。
從本質上講,Tensor Core讓DLSS能夠加快遊戲速度,同時帶來高畫質圖像,甚至更細致的圖像。借助第三代Tensor Cores的性能,NVIDIA Ampere架構GPU上的DLSS性能得到進一步增強。當前的NVIDIA DLSS已經進化到瞭2.1版本,支持最高9X的遊戲幀速率加速,這對於防止在高分辨率下開啟光追效果後的遊戲幀率下跌有著非常重要的意義。
支持HDMI 2.1與AV1解碼
支持HDMI 2.1將總帶寬從18Gigabits/秒提高到48Gigabits/秒,並增加對高動態范圍(HDR)的支持,支持更高對比度的明亮圖像和更鮮艷的色彩,以及更好的陰影和高光。而AV1解碼與現有的H.264、HEVC和VP9等編解碼器相比,它能提供更好的壓縮和質量,比H.264節省50~55%的容量;RTX IO,在DirectStorage加持下,下一代遊戲將能夠在降低CPU負載的同時,充分利用RTX IO硬件,縮短加載時間,打造更寬闊的開放世界。
支持NVIDIA Reflex低延遲電競技術
▲上圖所示測試數據來自NVIDIA官方資料,供參考。
遊戲玩傢通過鼠標按鍵觸發的效果最終呈現在顯示器畫面上之前,按鍵觸發的電信號需要先途徑CPU進行邏輯運算,得到詳實且準確的信息之後再提交給GPU進行渲染,並且將渲染後的數據最終以像素點填充的方式呈現到顯示器上。在這個過程中,電信號從觸發、傳輸再到顯示的過程所產生的耗時便被稱之為系統延遲。
而NVIDIA Reflex低延遲電競技術便是在這個過程中起到至關重要的作用——它能夠通過提升GPU的運行頻率和動態的降低渲染隊列,並由此降低CPU反壓,使得系統能夠在最後時刻采樣外設的輸入數據,從而最大化提高系統的響應速度,進一步提升玩傢操作的準確度。通俗來講,就是它能提高玩傢從點擊鼠標到顯示器畫面產生對應變化的速度,從而加快玩傢的操作速度,帶來更符合玩傢水準且更為流暢的遊戲體驗。
另外,為瞭幫助玩傢直觀地查看系統延遲的具體情況,NVIDIA還將系統延遲根據鼠標輸入信息到顯示器過程拆分為鼠標輸入延遲以及PC+顯示器延遲兩個部分。同時,玩傢們可以通過最新版的GeForce Experience開啟實驗性功能,進而在性能覆蓋顯示的功能界面中獲取遊戲延遲和幀率等性能指標,查看當前PC的狀態。它通過革命性的GeForce和G-SYNC新技術來優化和測量競技遊戲中的系統延遲,從而更快地獲取目標,做出反應,並提高瞄準精度。
支持NVIDIA Broadcast
NIDIA Broadcast這項AI驅動的聲畫處理技術的基礎是NVIDIA Encoder,支持高質量直播。用戶可以通過RTX 30系顯卡和Broadcast將自己的傢改造成直播室,通過AI驅動的噪音消除、虛擬背景和自動取景等將直播和視頻聊天提升到一個新水平。通過在GeForce RTX顯卡上加速AI驅動的Tensor Core,AI網絡能夠保證高質量直播的實時運行。
散熱結構變化,“加長版”RTX 3070
從外觀設計上來看,GeForce RTX 3070 Ti的風格與RTX 3070幾乎可以說是如出一轍,同樣是冷酷與時尚並重的濃鬱“全金屬”風格,金屬質感的香檳銀配色外框搭配黑色碩大的散熱片非常優雅,而S型的外框恰到好處地將散熱結構切割成瞭兩個部分。不過與RTX 3070采用正面同向雙風扇的設計不同,RTX 3070 Ti似乎回歸到瞭RTX 3080的那種正反雙風扇前吹後吸的結構。左風扇將熱空氣從超大的通風口支架排出,獨立的散熱鰭片引導氣流以達到更好的散熱效果。外露的鰭片堆棧在視覺上和功能上提升以氣流為中心的設計,與一體式框架一起,增強穩定性,在保證空氣阻力最小的同時使鰭片堆棧體積最大。另一側的風扇從顯卡正面吸入冷空氣,並將熱空氣從顯卡背面吹出。這種下進上出的散熱思路跟RTX 3080、RTX 3080 Ti一致,也符合當前絕大多數機箱的散熱風道設計理念。
▲散熱結構可以看作是RTX 3070的加長版,但風扇設計從正面同向雙風扇改為瞭正反兩側的設計。
▲電源接口與RTX 3080一樣,采用的是雙PCIe 8Pin轉專用12Pin的設計,而RTX 3070是單PCIe 8Pin轉12pin。
▲視頻輸出接口為3DP 1.4a+1HDMI 2.1組合
▲RTX 3070 Ti FE在供電部分采用瞭12相結構設計,顯存是來自美光的單顆1GB GDDR6X顆粒。可以看到RTX 3070 Ti仍然采用瞭異型PCB的設計,尾部被設計為瞭圓弧狀缺口,看來是為背面的散熱風扇騰出瞭未知。這種異型PCB設計雖然會導致PCB本身佈局略顯緊張,但也能為散熱結構的設計提供更多冗餘空間。
實測RTX 3070 Ti,1440p遊戲毫無壓力
NVIDIA GeForce RTX 3070 Ti Founders Edition產品資料
GPU架構:NVIDIA Ampere
核心代號:GA104-400-A1
制程工藝:SAMSUNG 8nm
SM模組數:48
CUDA Cores:6144
Tensor Cores:192 (第3代)
RT Cores:48 (第2代)
紋理單元:192
ROPs:96
GPU最高睿頻:1770MHz
顯存頻率:9500 MHz(19Gbps)
顯存容量:8GB GDDR6X
顯存位寬:256-bit
顯存帶寬:608GB/s
TGP:290W
槽位:雙槽卡設計
視頻輸出:DP1.4a×3,HDMI 2.1×1
參考價格:4499元(首發價格,僅供參考)
從規格上來看,RTX 3070 Ti相比RTX 3070來說有一定小幅度的加強。我們在之前測試RTX 3070時,3899元首發價格的RTX 3070被4599元的RX 6800在非光追遊戲上壓制得比較厲害,而偏偏NVIDIA在這個價位上的RTX 30系顯卡是一片空缺。現在首發價格4499元的RTX 3070 Ti面世,不管是從價格定位還是性能跨度上來看,RTX 3070 Ti的“假想敵”都應該是Radeon RX 6800,因此RTX 3070 Ti與RX 6800之間的性能競爭,也是我們非常想要知道的。
此外,RTX 3070 Ti與RTX 3070以及RTX 3080之間到底存在多大的性能差距,這也是我們想要通過本次的實際評測解決的疑問。對現代應用來說,除瞭遊戲之外,顯卡的專業應用創作加速性能也同樣被很多的消費者看重,RTX 3070 Ti在這一塊市場上又有何表現呢?
於是,帶著這些疑問,我們對RTX 3070 Ti進行瞭一番深度的測試。
測試平臺
顯卡:NVIDIA GeFroce RTX 3080
NVIDIA GeForce RTX 3070 Ti FE
NVIDIA GeForce RTX 3070 FE
NVIDIA GeForce RTX 2070 SUPER
AMD Radeon RX 6800
處理器:AMD銳龍9 5950X
內存:DDR4 3600 32GB雙通道
主板:ROG CROSSHAIR Ⅷ DARK HERO
電源:ROG THOR 1200W
驅動:NVIDIA Game Ready Driver 466.61
AMD Radeon Software Adrenalin 21.5.2 Optional
系統:Windows 10 Professional 64bit(20H2)
在測試項目上,我們仍然是基於顯卡評測的三部曲——3DMark測試理論性能,遊戲測試遊戲表現(分為光追遊戲環境和非光追遊戲環境兩個部分),用專業應用軟件或Benchmark來測試RTX 3070的創作加速性能。通過三個部分的綜合表現,以此來綜合判定RTX 3070 Ti的最終表現與市場期望。
3DMark理論性能測試
3DMark的理論性能測試結果基本在我們意料之中。相對於上一代的RTX 2070 SUPER,RTX 3070 Ti的平均理論性能領先程度超過瞭50%,遠遠地甩開瞭前者。相對於RTX 3080來說,RTX 3070 Ti的平均理論性能差距約為19%~20%,而相對於RTX 3070來說,RTX 3070 Ti的平均性能增幅在8%左右。
與潛在的對手Radeon RX 6800相比,GeForce RTX 3070 Ti在3DMark Firestrike三項測試中有不同程度的落後,大約在15%,這也是此前多次測試中發現的RDNA2架構的傳統優勢項目。而在3DMark Time Spy測試中,RTX 3070 Ti基本上與RX 6800握手言和,RTX 3070 Ti在TmeSpy Extreme 4K分辨率測試下小幅度領先RX 6800,而在TimeSpy 1440p分辨率測試下略略小負對手。不過在涉及光追性能的兩項測試中,RTX 3070 Ti均表現出瞭明顯的優勢,分別在PortRoyal測試中領先RX 6800約14%,在DXR光追性能測試中領先幅度更是高達70%以上。
由於當前光追遊戲可說已經是大勢所趨,因此綜合3DMark測試結果來看,RTX 3070 Ti的成績可以說是與RX 6800互有勝負,用最簡單粗暴的求平均值來看的話,RTX 3070 Ti在綜合成績表現上還略領先於RX 6800。
非光追遊戲測試
在非光追遊戲環境中,從測試結果來看,RTX 3070 Ti相對於RTX 3070的性能提升幅度比3DMark理論測試成績要稍高一些,平均遊戲性能領先在10%左右。不過相對於RTX 3080來說,RTX 3070 Ti在非光追遊戲性能上仍有不小差距,平均性能落後25%左右。
在非光追環境下,RTX 3070 Ti的遊戲表現相對於價格稍高的RX 6800確實略遜色一點點。在六個非光追遊戲測試上,RX 6800在《殺手3》《極限競速:地平線4》《刺客信條:英靈殿》以及《生化危機:村莊》4個遊戲中領先於RTX 3070 Ti,但是在《塵埃5》《無主之地3》這兩款遊戲中,RTX 3070 Ti則反超瞭RX 6800,整體來看,RTX 3070 Ti與RX 6800的非光追環境平均遊戲性能差距在5%左右,RX 6800略占優勢。
光追環境遊戲測試
在不開啟DLSS的前提下,我們選擇瞭五款同時支持NVIDIA和AMD GPU的光追遊戲對RTX 3070 Ti進行瞭體驗測試。從測試結果來看,開啟光追效果之後,RTX 3070 Ti相對於RTX 3070性能領先約10%。但是相對於RTX 3080來說,RTX 3070 Ti在整體性能上落後高達30%左右。如果說在非光追環境下RX 6800相對於RTX 3070 Ti還略有一點點優勢的話,那麼在光追環境下,RX 6800則表現得非常乏力,整體性能在1440p分辨率下落後30%,在4K分辨率下落後程度更是高達40%(除開4K光追環境下“爆顯存”導致的測試結果相差無幾的情況),可以說已經與RX 6800拉開瞭幾個檔次以上的性能差距。
DLSS+光追,1440p全特效輕松搞定
可以看到,在開啟DLSS之後,RTX 3070 Ti在光追環境下的遊戲性能再次迎來瞭超級爆發。此前在1440p分辨率下無法達到流暢運行標準的幾款遊戲都達到瞭接近或超過60fps的絕對流暢標準線,比如《賽博朋克2077》《看門狗:軍團》以及《地鐵:離去 增強版》等。在開啟DLSS之後,RTX 3070 Ti與RX 6800在光追環境下遊戲性能差距被進一步放大,此時二者之間的性能差距已經達到瞭80%以上,個別遊戲中甚至超過瞭100%。由此也可以看出DLSS對NVIDIA RTX GPU來說卻是有著非同一般的意義。AMD此前也宣佈6月份將會上線改善遊戲運行分辨率的FSR技術,到時候它可能和DLSS又有一番爭鬥。
專業創作軟件加速性能測試
接下來,我們也簡單測試瞭一下RTX 3070 Ti在創作應用上的GPU加速表現。很明顯,RTX Studio的生態覆蓋已經非常成熟,當前絕大部分常用的應用軟件都已經實現瞭RTX GPU的快車道加速。比如在Blender Cycles的靜態CG渲染測試中,RTX 3070 Ti領先RTX 2070 SUPER超過瞭50%,相對於RTX 3070則有10%以上的性能提升,但是相對於RTX 3080來說,仍然有30%左右的性能差距。其他幾款專業應用軟件的測試結果也基本大同小異。而在與RX 6800的對比上,RTX 3070 Ti的優勢更為明顯,整體性能領先30%~100%,與前者拉開瞭非常大的差距。
溫度與功耗
在最後進行的溫度與功耗測試上,RTX 3070 Ti FE的實際測試功耗接近300W,多少有點“偏高”的味道,畢竟RTX 3070 FE才剛剛達到220W左右,這應該是GDDR6X帶來的能耗提升。
而在滿載核心溫度的烤機測試上,RTX 3070 Ti FE的表現也不能稱為優秀。滿載烤機20分鐘後,RTX 3070 Ti FE的核心溫度達到瞭82℃左右,相比RTX 3070 FE提升瞭8℃左右。按理來說,RTX 3070 Ti相對於RTX 3070在CUDA核心上的提升隻有256個,二者之間GPU核心溫度控制應該不會這麼大,而且RTX 3070 Ti在散熱結構上還進行瞭強化,所以這難道是GDDR6X顯存帶來的額外提升?但不管如何,對比RTX 3080與RTX 3070的表現,我們還是認為RTX 3070 Ti在散熱結構上還有提升的空間。
RTX 3070 Ti,1440p光追遊戲穩妥
RTX 3070 Ti在我們看來是一款有些“特立獨行”的產品。首先從硬件參數規格上,歷代的“Ti”系列都是同一序列中的頂級產品,而且與上一序列的最低型號在性能上是比較接近的。比如RTX 3060 Ti的38組SM對比RTX 3060的28組以及RTX 3070的46組SM,RTX 3080 Ti的80組SM對RTX 3080的68組以及RTX 3090的82組SM。都能看到“Ti”系列的規格其實是更靠“上限”的。但是RTX 3070 Ti從硬件規格上卻更靠“下限”——它隻比RTX 3070多瞭2組SM模塊但卻比RTX 3080少瞭20組SM模塊,這就導致瞭上下限之間的規格參數差距比較大,至少和我們最開始的預想有些不同,NVIDIA或許是有自己的產品規劃考慮吧。
不過GDDR6X顯存的加持還是為RTX 3070 Ti加分不少,這也使得RTX 3070 Ti在僅比RTX 3070多256個CUDA核心的情況下,依靠GDDR6X相對於GDDR6的性能提升,使得RTX 3070 Ti的整體性能提升幅度相對RTX 3070達到瞭10%左右。
從整體測試的情況來看,RTX 3070 Ti還是有比較優秀的表現,在性能上不但拉開瞭對RTX 3070的層次差距,而且相對於之前一直壓制RTX 3070的Radeon RX 6800來說,在非光追環境下也拉近瞭與RX 6800的距離,使得RTX 3070 Ti與RX 6800在非光追環境下的性能差距縮小到5%左右,部分遊戲中的表現甚至明顯超越瞭RX 6800,比如《塵埃5》《無主之地3》等。而在開啟光追效果後,RTX 3070 Ti更是將RX 6800甩在瞭身後很遠的地方,整體30%以上的性能差距讓RX 6800有些“鞭長莫及”,這也是硬件光追核心上的性能差距體現。對於各種光線追蹤和光柵化的DirectX 和Vulkan遊戲來說, RTX 3070 Ti在同價位產品中可以算是令人印象深刻的,它帶來1.5倍於RTX 2070 SUPER的性能提升,如果同比2017年發佈的GTX 1070 Ti,性能將高出2倍以上。
RTX 3070 Ti的首發價格為4499元人民幣,相對於3899元首發價格的RTX 3070來說性能增幅與價格增幅的比例還是比較合理的。而相對於首發價格4599元的RX 6800來說,僅在非光追遊戲性能上綜合略有遜色,在光追遊戲和專業應用創作性能加速上,RX 6800可以說是望塵莫及。綜合性價比考慮的話,我們認為在4500元級價位的遊戲顯卡上,RTX 3070 Ti無疑是更值得考慮的主流顯卡優選。而且從測試結果來看,在1440p光追環境及最高特效設置下,除個別遊戲外,它也幾乎能應付目前大部分主流光追遊戲,性能表現還是非常不錯的,結合4499元的價位,怎麼買應該都不虧。
當然,我們做出的結論都是建立在有序的遊戲顯卡市場的前提下,而對目前仍處在撲朔迷離狀態的遊戲顯卡市場來說,RTX 3070 Ti非公版產品首批上市的價格與數量仍舊是霧裡看花,實在無法定論。還是那句熟悉的話,我們隻想代表玩傢真切地說一句,“不要空氣卡,讓我們都能買到吧!”
請先 登入 以發表留言。