作为RTX 30系压轴出场的产品,RTX 3090 Ti以完美的性能表现收官,做到了本代最强。今天为大家带来的是影驰GeForce RTX 3090 Ti星曜OC评测。
此次发布的RTX 3090 Ti定位内容创作卡,拥有24GB大显存。想必大家对于性能也已经有所了解,虽然同样采用了GA102核心,但性能相较RTX 3090却有大幅提升。
另外,本次发布的RTX 3090 Ti的供电接口均采用了全新的12VHPWR设计,结合Intel刚刚发布的电源新标准,不难猜测后续NVIDIA推出的下一代显卡将继续增大功耗。并且目前很多电源品牌的旗舰产品已经开始支持12VHPWR显卡供电设计,不过价格也让人一言难尽。
RTX 3090 Ti采用了满血GA102核心,84组SM单元,比RTX 3090多了2组,同时频率和功耗也都有所增高。
影驰GeForce RTX 3090 Ti星曜OC
影驰GeForce RTX 3090 Ti星曜OC显卡的售价为15299元,在众显卡中属于较为便宜的,而随着RTX 3090 Ti的推出,大部分市售RTX 3090价格也有一定程度下调。
在评测开始前,笔者先还是先将这款显卡的特点列出方便大家阅读:
1.新12VHPWR供电设计,采用新ATX3.0电源标准,通过附赠转接线可兼容旧型号电源
2.24GB大显存,轻松应对8K HDR游戏及内容创作软件
3.支持ECC校验,增加专业软件领域稳定性
4.高频率18900MHz,高于官方1860MHz标准频率
作为RTX 30系显卡的性能代表,RTX 3090 Ti来的多少有些晚了,不过对于游戏玩家来说倒也无妨,即便是骨灰级3A游戏,RTX 3080 Ti也足够。不过鉴于此次性能提升如此大,追求高分高刷且预算充足的用户,同样可以入手。
而对于有专业需求的内容创作者来说,RTX 3090 Ti的定位本就不同于其他显卡。就算即将发布的下一代产品上市,多半在旗舰级别的专业卡上,价格还有提升。
01 NVIDIA Ampere架构的 满血GA102核心
影驰GeForce RTX 3090 Ti星曜OC显卡采用了NVIDIA Ampere架构,我们首先来看一下这次的GA102核心。
RTX 3090 Ti算力对比TITAN RTX
相较于上一代Turing RTX架构的,NVIDIA Ampere架构在算力上有着成倍的增长,GeForce RTX 3090 Ti的着色器性能达到40 TFLOPS单精度性能,而搭载NVIDIA Turing架构的TITAN为16.3 TFLOPS。
RT Core达到78 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达320 Tensor TFLOPS。
RTX 3090 Ti显存对比TITAN RTX
同时在显存方面,RTX 3090 Ti也采用了24GB GDDR6X显存,显存频率达到了21 Gpbs,带宽则是史无前例的1 TB/s,让这款显卡可以畅玩8K 60帧游戏。
RTX 3090 Ti所采用的GA102核心
GA102的完整核心图NVIDIA在RTX 3080发布时就已经公布,现在终于有显卡应用到了未阉割的GA102。完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器),CUDA数量为10752个。下面我们再来看看几款显卡的核心参数对比。
GA102核心拥有280亿(28000 million)个晶体管,628m㎡的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。
02 影驰GeForce RTX 3090 Ti星曜OC概览
在配件方面,除了带有影驰logo的金属显卡支架,由于本次在非公版显卡中首次搭载了单12VHPWR供电接口,所以还配备了一根单12pin转8pin*3的转接线(12pin兼容ATX电源3.0标准)。
包装内配件
目前Intel已经发布了ATX电源3.0的新标准,就是需要有新的12VHPWR显卡供电,目前已经有部分旗舰电源应用到,但价格也比较贵,普及尚需要些时间。不过相信不久后即便是RTX 3090 Ti的450W功耗,只接一根外接供电就够了。
影驰GeForce RTX 3090 Ti星曜OC
影驰GeForce RTX 3090 Ti星曜OC显卡则为纯白色,正面导流罩分为白色底层以及透明的亚克力罩双层,整体尺寸为349×141×66mm(不含挡板),是目前该系列尺寸最大的,大家一定要注意自己的显卡限长。
影驰GeForce RTX 3090 Ti星曜OC上机效果
星曜系列上机点亮后的效果默认为RGB颜色渐变循环,因为有透明亚克力罩的原因,每种颜色看起来都晶莹剔透。
影驰GeForce RTX 3090 Ti星曜OC风扇特写
并且由于这款显卡24GB的超大显存以及更高的频率,在散热方面也更加下功夫,三个主动散热风扇均采用11叶静霜风扇,每一片扇叶均为三折设计,能够有效加强进风量,顺畅输送风流,保障散热效果。但与RTX 3080星曜有所不同,此次为102mm*2和92mm这样两大一小的组合而成,可更进一步提升散热效果。
影驰GeForce RTX 3090 Ti星曜OC侧面展示
从显卡侧面我们可以直观感受到,影驰GeForce RTX 3090 Ti星曜OC的透明亚克力罩均为水晶切割状。
在内部散热部分,采用了星卓II Plus散热系统,大面积镀镍铜底,全面覆盖GPU和显存,搭配6根8mm加2根6mm镀镍复合热管辅助导热。采用14层PCB镂空设计,20 4相供电,可有效保障显卡供电,稳定运行。
影驰GeForce RTX 3090 Ti星曜OC背板
另外相比于此前星曜的黑色背板,影驰GeForce RTX 3090 Ti星曜OC的背板改为纯白色,更符合主题。另外由于此次RTX 3090 Ti采用了异型镂空PCB板,在尾部能够看到较大面积镂空,方便发热量高的元器件散热。
新的12VHPWR供电接口
影驰GeForce RTX 3090 Ti星曜OC是首次采用12VHPWR接口的非公型号,从视觉效果来看,更简洁更美观,从此告别插排式供电接口。
目前新的PCIe 5.0的电源规范为12 4pin的完整供电,其中最上面的4pin为讯号线,用于检测12V功耗是否可以满足显卡使用,新一代支持ATX 3.0标准的电源会自带12VHPWR的供电线。所以目前全部采用8*3pin转12pin的转换线。
DP1.4a*3 HDMI 2.1
视频输出接口依旧采用了DP1.4a*3 HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
03 3DMARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥3DMARK理论性能测试显卡的最佳性能,主板和CPU采用了11代桌面旗舰级配置,并且将内存容量提升至32GB,具体如下:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,影驰GeForce RTX 3090 Ti星曜OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10752个CUDA,Boost频率达到1890MHz,相较公版的1860MHz有一定提升。采用24GB GDDR6X显存,位宽为384bit,显存带宽达到了1008.4 GB/s,光栅单元和纹理单元为112和336。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,RTX 3090 Ti的性能提升显著。影驰GeForce RTX 3090 Ti星曜OC相较RTX 3090综合提升11%,作为本代Ti后缀的型号,除了RTX 3060 Ti,RTX 3090 Ti是提升最大的,而且这还是在没有更换核心的情况下。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 3090 Ti星曜OC相较RTX 3090提升约为9.2%。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,影驰GeForce RTX 3090 Ti星曜OC相较RTX 3090提升约为11.6%。
综合来看,RTX 3090 Ti相较RTX 3090的提升几乎相当于更换了芯片,但其实两个型号的芯片只相差2组SM单元,更多的是暴力提升了功耗和核心频率,但结果也显而易见。
04 游戏性能测试
在游戏性能测试中,我们选择了《地平线5》、《刺客信条:英灵殿》、《无主之地3》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
虽然这张RTX 3090 Ti显卡并不是为游戏玩家所准备,但此次大幅度的理论性能提升,也不禁让人好奇,在游戏中这张卡会有怎样的表现。
《地平线5》游戏测试
首先在《地平线5》中,影驰GeForce RTX 3090 Ti星曜OC显卡的1080P成绩相较RTX 3090再提升4%;2K分辨率成绩提升5%;4K分辨率成绩提升5%。
《刺客信条:英灵殿》游戏测试
在《刺客信条:英灵殿》中,可能由于驱动版本的更新和游戏更新,所有跑分相较以前的成绩均有大幅度提升,我们以本次跑分成绩为准。
影驰GeForce RTX 3090 Ti星曜OC的1080P成绩相较RTX 3090提升5%;2K分辨率成绩提升12%;4K分辨率成绩提升11%。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,影驰GeForce RTX 3090 Ti星曜OC的1080P成绩相较RTX 3090提升11%;2K分辨率成绩提升7%;4K分辨率成绩提升8%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。
影驰GeForce RTX 3090 Ti星曜OC的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升9%;4K分辨率成绩提升15%。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
影驰GeForce RTX 3090 Ti星曜OC的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升9%;4K分辨率成绩提升15%。
在整体游戏方面,NVIDIA官方给出的游戏数据是在标频情况下提升约为4-8%,而我们测试的影驰GeForce RTX 3090 Ti星曜OC在1890MHz频率下,综合提升约为10%,与理论成绩基本相符。
05 专业软件测试
除了光线追踪的强化,NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
同时,显卡的一个重要指标是显存容量和位宽,显存位宽越大,表示单位时间显卡能处理的数据的越多,RTX 3090 Ti拥有384bit 位宽,带宽为 1008.4 GB/s,以及24GB大显存,这都为内容创作提供了更好地助力。
NVIDIA控制面板中新增ECC开启功能
另外此次RTX 3090 Ti也是NVIDIA在RTX 30系中首次为消费级显卡开启ECC显存校验,开启这一功能后,显卡性能会有所下降,但稳定性会增加,更有助于在专业软件中长时间稳定工作。
NVIDIA Omniverse
在此次GTC 2022大会中NVIDIA也正式向开发者推出NVIDIA Omniverse实时设计协作和模拟平台,它可轻松构建自定义工具,以简化、加速和改进其开发工作流。更多关于Omniverse的使用体验和链接方法,可以参考笔者之前的文章“NVIDIA Omniverse体验 老板监工神器”,这里就不过多讲解了。
上图为笔者使用SPECviewperf 13这款工业、专业软件跑分测试。对比显卡为本代的游戏旗舰RTX 3080 Ti和生产力工具旗舰RTX 3090 Ti。
从结果来看,两款显卡相差不大,但测试环境都是在不爆显存的情况下得来,毕竟RTX 3080 Ti同样使用的GA102芯片,也是本代最强的游戏旗舰卡。另外如果在更高分辨率下的渲染中,大显存的优势才会突显,当显存溢出时,通常不像游戏只是卡不卡的问题,而是能不能用的问题。
KeyShot 9测试
KeyShot 意为“The Key to Amazing Shots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般真实的 3D 渲染影像。
KeyShot 9有预设模型,进入软件后直接点击渲染,为了更考验大显存所带来的帮助,我们直接将渲染分辨率改为预设的7680×7680方形8K尺寸。
同时在选项中,选择GPU渲染,可以看到目前正在采用RTX 3090 Ti进行渲染,而GPU使用量为100%
影驰GeForce RTX 3090 Ti 星曜OC 渲染时间为1分46秒
在预设模型的渲染中,可以看到整个过程的渲染时常为1分46秒,其中在渲染时的显存占用为17GB,已经远远超出了RTX 3080 Ti的12GB。
RTX 3080 Ti渲染崩溃
在使用RTX 3080 Ti后,由于渲染8K分辨率图片的显存严重溢出,会导致软件无法渲染,直接崩溃。虽然在KeyShot 9中软件崩溃没有比较明显的提示,但通过这重叠的窗口用户也能大体看出端倪了。在内容创作软件中,崩溃往往意味着前功尽弃
DaVinci(达芬奇)测试
DaVinci(达芬奇)是世界上专业8K编辑的唯一解决方案,集成颜色校正,视觉效果,音频编辑在一个软件中。
首先在偏好选项中,取消勾选自动的GPU配置,指定使用影驰GeForce RTX 3090 Ti 星曜OC显卡。
导入一段高清的8K素材后,在运动特效中增加时域降噪、时域阈值以及运动模糊的参数,下面先来看RTX 3090 Ti的演示效果。
影驰GeForce RTX 3090 Ti 星曜OC可流畅预览
这一段8K素材的可调色空间非常大,笔者增加了一层电影滤镜,可以看到在使用RTX 3090 Ti时,可以在实时预览时达到非常流畅的程度。
RTX 3080 Ti预览崩溃
在分辨率越高的情况下,实时预览对显卡显存的要求也就越高,RTX 3080 Ti采用12GB显存会出现报错,这就是因为显存不够。
在显存不够报错的情况下,解决办法基本只有创建代理进行剪辑,不过这样无法展示素材的最真实效果,所以在超高分辨率下,拥有24GB大显存的RTX 3090 Ti拥有绝对优势。
Blender测试
Blender是一个免费开放源码的3D创作套件。它支持整个三维编辑-建模,索具,动画,模拟 渲染,合成,运动跟踪,视频编辑和2D动画编辑。
首先还是设置渲染设备,Blender默认使用CPU渲染,这里选择RTX 3090 Ti。
在软件内的渲染设置内,勾选两项降噪,并且为了增加渲染时常,我们将采样率提升至400,渲染分辨率提升为200%。
影驰GeForce RTX 3090 Ti 星曜OC 渲染时间为1分21秒
RTX 3080 Ti渲染时间为1分29秒
在第一组测试中,影驰GeForce RTX 3090 Ti 星曜OC的渲染时常为1分21秒,RTX 3080 Ti的渲染时常为1分29秒,单独来看差异似乎不大,不过我们对比的为RTX 3080 Ti显卡,刨除显存的因素,这也是一张旗舰游戏显卡,算力非常强悍。
影驰GeForce RTX 3090 Ti 星曜OC 渲染时间为1分39秒
RTX 3080 Ti渲染时间为1分49秒
第二组对比中为一段900帧的循环动画,并且分为第三人称视角和第一人称视角双镜头。这组对比中,单帧的差距为10秒。
不过可能是自带运动模糊,增加了一定的显存使用率,所以在渲染时RTX 3080 Ti偶尔有报错的情况,只能重新渲染。
影驰GeForce RTX 3090 Ti 星曜OC 渲染时间为1分32秒
RTX 3080 Ti渲染时常约为1分39秒
在同一帧下,第一人称视角与之前的时间基本相同,这里不做过多阐述,但是渲染时间差距为7秒,两组渲染的平均差距我们按照9秒来计算。
在这段动画中,我们按照每帧渲染时间相差18秒(双镜头)来计算,一段900帧的动画渲染时常就会相差16200秒,等于270分钟或者4.5小时。
如果按1秒24帧来计算,那么这段动画也只有37秒左右。而在大型的动画电影中,庞大的数据量往往需要电脑夜以继日的渲染,即便是崩溃一次,可能也会浪费很久的时间,所以大显存在内容创作领域的优势显而易见。
06 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
影驰GeForce RTX 3090 Ti 星曜OC经过我们的实测在满载状态下单卡功耗为444W左右,但是可以看到下面新增的TDP项,GPU满载也只达到了98.7%的水平。所以根据这个来计算,如果达到100% TDP,实际为450W左右。
温度方面,本次的影驰GeForce RTX 3090 Ti 星曜OC经过20分钟左右的拷机,温度稳定为77℃左右,显存温度为80℃,属于正常工作范围内。
07 游戏·专业 两开花
作为RTX 30系最终的卡皇,RTX 3090 Ti在性能上的提升令人意外,毕竟RTX 3090的芯片相比完整GA102只差了2组SM单元,目前Ti系列显卡除了RTX 3060 Ti,就属它提升最大。
散热方面,由于此前的RTX 3090采用了单颗容量1GB的显存,所以PCB板双面均有排布。要知道显卡元器件中,显存的发热量巨大,双排布的设计会更难以设计散热方案。而此次所使用的的单颗2GB显存有效降低了散热难度,可更好控制温度,从而拉高频率。
影驰GeForce RTX 3090 Ti星曜OC
对比此前发布的RTX A6000显卡,不难发现两款产品其实采用了完全相同的核心,都是GA102,都是10752个CUDA,甚至Boost频率都是1860MHz,而目前RTX A6000在京东的售价为34799元,那么这两款产品到底有什么区别?
RTX A6000参数一览
显存方面,RTX 3090 Ti相比RTX A6000少了24GB显存,但由于采用了GDDR6X显存,带宽更高了,整体速度更快。不支持vGPU显存,这也是RTX A6000在专业卡上得天独厚的优势。
另外最重要的,如RTX A6000这种专业卡,在FP64运算性能上都要比消费级显卡高很多RTX A6000为1210 GFLOPS;而RTX 3090 Ti为625 GFLOPS。
但专业卡的长处在于各大专业软件的兼容和适配,以及内部调校。如Catia以及SW等软件针对专业卡都有非常好的优化,不过我们常见的3DSMAX和MAYA等软件,即使是消费级的RTX 3090 Ti同样有着出色的性能和稳定性表现。
影驰GeForce RTX 3090 Ti星曜OC
影驰GeForce RTX 3090 Ti星曜OC这张显卡最让人意外的地方在于“游戏·专业两开花”,作为一张定位内容创作者的专业显卡,游戏方面的提升同样非常显著。
如果你的预算充裕,并且对游戏帧数和分辨率都有着较为高的要求,或许这张RTX 3090 Ti也是非常不错的选择。
目前这张影驰GeForce RTX 3090 Ti星曜OC显卡的售价为14999元,感兴趣的用户可以多多关注。
08 附录1-各游戏 光线追踪 效果对比
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《幽灵线:东京》RTX ON(点击查看大图)
《幽灵线:东京》RTX OFF(点击查看大图)
在这一组对比中,可以较为明显看出光线追踪的差别。它更为真实的渲染出光线本该有的样子。不过在本作中,是没有白天出现的!游戏中大量环境光实则是为玩家提供照明作用,开启光线追踪,虽然画面更真实了,但在部分昏暗场景下,会更看不清。
这一时间也说不好是游戏本身的问题还是光线追踪的问题,还是说游戏画面并不是越真实才越好?
《幽灵线:东京》RTX ON(点击查看大图)
《幽灵线:东京》RTX OFF(点击查看大图)
在第二组对比中,情况有所好转,水面的倒影更清晰。但同样的,可以看到建筑物上的光线更暗,确实给游戏增加了不少压抑成分。
《光明记忆:无限》RTX ON(点击查看大图)
《光明记忆:无限》RTX OFF(点击查看大图)
《光明记忆:无限》温泉场景中的光追效果是最为耗费显卡性能的。不难发现,最大的变化来自水中的倒影,而这一组倒影的计算难度非常高,由于并不是平静水面,所以要首先要考虑光线在水面的变化,其次与岸边鹅卵石的光线折射效果,最后则是综合前两种效果,将光线照射在水池底部。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
《逆水寒》RTX ON(点击图片查看大图)
《逆水寒》RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
09 附录2- 各游戏DLSS效果对比
《幽灵线:东京》DLSS对比(点击查看大图)
在《幽灵线:东京》的DLSS对比中,我们在4K分辨率下,放大水面倒影局部细节,由于倒影本身为光线追踪反射形成,所以在DLSS计算下,可以明显看到从清晰到模糊的渐变过程,不过在DLSS质量和DLSS平衡模式中,均有着不错的清晰度。
同时图片最上方的霓虹灯,可以看到在DLSS超级性能模式中有着较严重的逸散情况,这也是DLSS对于灯光边界,在AI计算中较难定位的表现。
不过对于游戏画面原生的贴图来说,如最远处墙壁上的“HSHS”字母涂鸦,即使是DLSS超级性能,也有着非常精准的还原能力。
帧数提升方面,五种模式分别为34/59/72/85/99,DLSS相较原生画质的提升为74%/112%/150%/191%,非常暴力。
《幽灵线:东京》DLSS对比(点击查看大图)
在这组对比中,DLSS超级性能模式依然会有边界模糊的问题,但整体来说效果令人惊讶。包括远处灯牌上的字,依然清晰可见。
帧数提升方面,五种模式分别为32/57/68/88/93,DLSS相较原生画质的提升为78%/113%/175%/191%,与上一处对比场景几乎相同。
《幽灵线:东京》DLSS对比(点击查看大图)
最后我们再来对比一下便利店中饮料上的文字,在这一组对比中到DLSS性能模式为止,都有非常好的画面表现,字体轮廓和物体的边界清晰。
帧数提升方面,五种模式分别为40/73/83/90/97,DLSS相较原生画质的提升为83%/108%/125%/143%。
在所有的DLSS超级性能模式中,给人的感觉是画面缺少锐利度,这也是由于超高的分辨率缩放,并不太适合4K分辨率下,如果换成8K分辨率,在基础信息较丰富的情况下,DLSS超级性能中会有不错的表现。
我们再来看看《彩虹六号:异种》各个DLSS模式下的画质表现。超级分辨率技术中,最难以把控的就是这种栅栏的细节部位,但是根据实测来看,即便是超级性能模式中,细节依旧清晰。可以看出较大差距的只有标识牌上的字体,在超级性能模式中,颜色边缘会有模糊的情况。
从帧数提升上来说,相比原生画质分别提升了55%/73%/88%/131%,对于游戏玩家来说,这简直是神迹!
接下来再提高难度,第一幅对比图的栅栏为独立建模,而此图中的棋盘格则是建筑中的花纹细节,可以看到在超级性能模式以上的细节把控都是比较到位的。而遍布地图中的菌毯在DLSS效果中也没有失真或模糊的情况。
帧数方面,相比原生画质分别提升了49%/85%/111%/162%。确实如NVIDIA所说,拥有了AI就拥有了未来,DLSS无论从画质表现还是帧数提升上来说,值得每一位玩家拥有。
《光明记忆:无限》在这一组对比中,在画面差距上,从DLSS关到DLSS性能依旧看不出什么变化,但是在超级性能模式中,墙壁的清晰度以及轮廓都有所下降。
当然总的来说,尽管DLSS贡献了非常大的功劳,但可以看得出《光明记忆:无限》在优化方面下了很大功夫,这对于靠一人主导的游戏来说难能可贵。
《赛博朋克2077》DLSS模式对比
《赛博朋克2077》这款游戏中,以2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
《永劫无间》DLSS模式对比
在《永劫无间》的DLSS对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在DLSS打开后,由于其工作原理就是缩放后,再由AI算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。
而在DLSS性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在DLSS超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启DLSS超级性能模式。
10 附录3-Ampere新特性
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
(7922963)
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved