等等党终于不用再等了!就在最近几日们终于迎来了GeForce RTX 3070 Ti的发布。至此,GeForce RTX 30系游戏卡“Ti家族”的成员全部补齐,也让还在苦等显卡的玩家有了更多的选择,今天给大家带来的就是影驰 GeForce RTX 3070 Ti黑将 OC的显卡评测。
一说到“将”系列,大家肯定不会陌生,多年以来影驰“将”系列凭借出色的性价比以及硬朗的外观,一直是影驰销量最好的系列。在评测开始之前,相比大家对这款显卡也是有许多期待。按照国际惯例,让我们先来总结一下这款显卡的几个核心亮点:
1.造型采用枪械元素,侧面有弹孔装饰,尾部有枪托结构,顶部RGB logo灯,外观拉风。
2.11片三折静霜扇叶,背板几何镂空加鱼尾型散热孔设计,提供贯穿式风流,强效散热。
3.8 8pin供电接口,强力稳定供电。
影驰 GeForce RTX 3070 Ti黑将 OC
新推出的GeForce RTX 3070 Ti与GeForce RTX 3080 Ti分别为4499元起和8999元起,尽管消费者可能无法以这样的价格购买到公版显卡,但是非公显卡的大量铺货也填补了市场上如今一卡难求的空白,当然这其中也包括了我手上的这块影驰 GeForce RTX 3070 Ti黑将 OC。从本质上讲显卡降价也只是时间问题。
影驰 GeForce RTX 3070 Ti黑将 OC
市场价格过高还是要从让玩家苦恼的“挖矿潮”说起,不过根据NVIDIA此前的官方博客说明,这批显卡已经限制了以太坊的算力。另外GeForce RTX 3070 Ti这一批的非公版显卡,在包装上不会有任何限制算力的标注,“Lite Hash Rate”或者“LHR”的说明只针对已经发售的显卡,后续为了方便区分才会在包装上进行标注。
也就是说算力的限制能让矿工不再那么急于入手,玩家们也有机会买到自己心仪已久的显卡,值得说明的一点是,显卡在进行哈希算法的时候显卡就会自动降低显存频率来锁住算力。对于游戏玩家来说,玩游戏是不会受到影响的,所以不需要有担心。
01 GeForce RTX 3070 Ti GA104核心的第二张显卡
在核心架构上,GeForce RTX 3070 Ti是采用GA104核心的第二张卡,官方白皮书上对比的对象为GeForce RTX 2070 SUPER,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3070 Ti每个时钟执行2次着色器运算,而Turing为1次,RTX 3070 Ti的着色器性能达到22 TFLOPS单精度性能,而Turing为9 TFLOPS。
RTX 3070 Ti 新老两代显卡算力对比
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到42 RT TFLOPS,而Turing为24 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达174 Tensor TFLOPS,而Turing为72 Tensor TFLOPS。
GeForce RTX 3070 Ti采用了GA104核心,与GeForce RTX 3070相同,不过NVIDIA官方并没有给出GA104核心架构图,我们仍以GA102来做讲解。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3070 Ti的CUDA数量是6144个,共有48个SM单元,也就是3个GPC 24个TPC,而刚刚发布的GeForce RTX 3080 Ti共有40个TPC 80个SM单元,这也是两款芯片的差距所在。
公版显卡参数表
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3070与GeForce RTX 3070 Ti的差距不大,相差的两个SM单元,和刚刚发布的GeForce RTX 3080 Ti情况基本相同,也就是1组TPC,256个CUDA。只不过GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根据参数来看GeForce RTX 3070 Ti与GeForce RTX 3080还有一定差距。
GDDR6X
另外GeForce RTX 3070 Ti的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗,另外在相同时间内GDDR6X可以比GDDR6传输多2倍的数据。这对于需要大量数据负载的工作尤为重要,如光线追踪的游戏、AI学习和8K视频渲染。
02 NVIDIA Ampere架构GA104解析
影驰 GeForce RTX 3070 Ti黑将 OC采用了GA104核心,拥有174亿(17400 million)个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存,这里与GeForce RTX 3070的GDDR6有所区别。
本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3070 Ti共有6144个CUDA,其实它有3072个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了6144的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 影驰 GeForce RTX 3070 Ti黑将 OC外观
影驰上一代的将系列卡身以黑色为主,工业风格更明显,而这次的影驰 GeForce RTX 3070 Ti黑将 OC显卡在外观方面做了全面改版,显卡导流罩采用香槟色和黑色搭配,表面采用金属拉丝工艺。并且表面点缀了枪支元素,更符合黑将的身份。
影驰 GeForce RTX 3070 Ti黑将 OC
影驰 GeForce RTX 3070 Ti黑将 OC显卡在尺寸上也有明显的增大,将会占用3槽空间。不过考虑到机箱兼容性的问题,影驰 GeForce RTX 3070 Ti黑将 OC在包装内还附赠了一个2槽接口的挡板可供替换,玩家可按需更换。
影驰 GeForce RTX 3070 Ti黑将 OC散热
影驰 GeForce RTX 3070 Ti黑将 OC在风扇方面的改版也尤其明显,新的显卡采用3个90mm的特殊风扇,每个风扇有11片三折扇叶,加大空气流通量,增强散热。
影驰 GeForce RTX 3070 Ti黑将 OC
影驰 GeForce RTX 3070 Ti黑将 OC的显卡尾部有可发光的LOGO设计,也算是为整个金属质感增添了些许的活力。
影驰 GeForce RTX 3070 Ti黑将 OC背板
影驰 GeForce RTX 3070 Ti黑将 OC显卡的背板十分有科技感,我们能在其中发现很多科技元素的线条。四个圆孔型的散热孔可以有效的为显卡芯片燃热。
镂空散热处理
影驰 GeForce RTX 3070 Ti黑将 OC这次将前端设计了大面积的镂空处理,正面的风扇直接吸入冷气吹过散热鳍片,将热气流排出,更加又利于使用过程中的显卡性能稳定。
弹孔枪头
值得一提的是,影驰 GeForce RTX 3070 Ti黑将 OC显卡顶部有4个枪口设计,有一种像是未来武器的科技感,让显卡整体更加具有个性。
影驰 GeForce RTX 3070 Ti黑将 OC接口
在供电接口方面,影驰 GeForce RTX 3070 Ti黑将 OC采用8 8pin的供电,没有采用公版的单12pin,对于用户来说不用做任何前期准备就能用上最新的显卡了(不过要注意电源功率,建议600W及以上)。
04 3DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥影驰 GeForce RTX 3070 Ti黑将 OC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,影驰 GeForce RTX 3070 Ti黑将 OC采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有6144个CUDA,Boost频率为1800MHz,而公版为1770MHz频率。采用8GB GDDR6X显存,位宽为256bit,显存带宽达到了608.3 GB/s,光栅单元和纹理单元为96和192。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的5张显卡进行分值对比,以便能更好的反映影驰 GeForce RTX 3070 Ti黑将 OC的性能水平。
可以看到影驰 GeForce RTX 3070 Ti黑将 OC的性能显然更接近GeForce RTX 3070,整体提升11%左右;对比GeForce RTX 3080的差距为17%左右,看来即使强如GeForce RTX 3070 Ti,可仍然和GeForce RTX 3080有一定差距。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰 GeForce RTX 3070 Ti黑将 OC的分数提升稍弱,相比GeForce RTX 3070提升8%左右,对比公版提升则不是很大,基本在百分之1以内,可见GeForce RTX 3070Ti公版的做工和散热都相当不错。而这次对比GeForce RTX 3080的分数差距为21%左右;对比上一代GeForce RTX 2070 SUPER的分数要高出43%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中影驰 GeForce RTX 3070 Ti黑将 OC的分数表现更贴近GeForce RTX 3070,分数提升为8%左右,相比公版基本也是在百分之一以内;对比GeForce RTX 3080的分数差距为29%左右;对比上一代GeForce RTX 2070 SUPER的分数提升则非常大,约为52%。GeForce RTX 3070比上代产品已经有了相当大的性能提升。
05 游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在游戏实测中可以看到影驰 GeForce RTX 3070 Ti黑将 OC和GeForce RTX 3070的帧数差距平均下来为3%左右。而对比GeForce RTX 3080的分数差距整体在10%左右。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,影驰 GeForce RTX 3070 Ti黑将 OC与GeForce RTX 3070的差距约为4%。
而相比GeForce RTX 3080的帧数差距综合为13%左右,但可以发现其实在1080P分辨率下,CPU已经限制了显卡的发挥,而在4K分辨率下GeForce RTX 3080能领先影驰 GeForce RTX 3070 Ti黑将 OC约22%的帧数。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,在这款游戏中CPU的瓶颈更加明显,1080P分辨率下三款显卡的成绩几乎相同,在2K和4K分辨率下比较能反应真实水平,影驰 GeForce RTX 3070 Ti黑将 OC相比GeForce RTX 3070提升约为8%。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,其中影驰 GeForce RTX 3070 Ti黑将 OC相比GeForce RTX 3070提升为7%;相比GeForce RTX 3080的分数差距为24%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。整体的分数分布情况与《无主之地3》非常相似。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
06 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试
影驰 GeForce RTX 3070 Ti黑将 OC经过我们的实测在满载状态下单卡功耗为300W左右,建议搭配650W及以上电源。
温度对比
温度方面,本次的影驰 GeForce RTX 3070 Ti黑将 OC经过15分钟左右的拷机,温度稳定为72℃左右,相比公版低了6℃左右,看来三风扇加鱼尾型散热孔还是发挥了一定的作用。
07 部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了几款游戏给大家展示一下。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。在上图中同样有复杂的光线追踪效果,近处的霓虹灯管有明显的漫反射效果,通过墙壁的反射,整体光线更强。可以看到地面和右侧的墙壁在开启光线追踪时能反射出门框和灯管的倒影,而关闭时就只有灯光了。
RTX ON
RTX OFF
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON
《堡垒之夜》RTX OFF
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON
《控制》RTX OFF
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
08 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
09 金属撞色 漆黑枪王
“金属撞色 漆黑枪王”,影驰 GeForce RTX 3070 Ti黑将 OC在外观添加了枪支元素,并且导流罩点缀弹孔、枪托等元素,战争气息十足。正面金属的拼色设计,也让整张显卡更加有质感,配合独到的外观设计,宛如一把来自未来的科技武器。
影驰 GeForce RTX 3070 Ti黑将 OC
背面金属背板不仅增加整体的质感,配合尾部的鱼尾型散热孔,能够输送贯穿式风流,为显卡充分散热。另外很多人担心金属外观背板会增加显卡的重量,实际上影驰 GeForce RTX 3070 Ti黑将 OC采用一体式金属压铸加固中框设计,可让散热器直接锁固在机箱上并由机箱承重,可以预防PCB因过重弯曲变形,所以没有必要一直使用显卡竖装模块。
影驰 GeForce RTX 3070 Ti黑将 OC
外观出众,个性十足。配合GeForce RTX 3070 Ti的优秀性能,影驰 GeForce RTX 3070 Ti黑将 OC的确能给玩家带来不少的惊喜。至于玩家们一直担心的售价问题,随着芯片产能的增长和对算力的限制,相信不久以后大家都能以亲民的价格入手30系显卡,改善游戏体验指日可待。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved