gtx2080,rtx2080

如何评价RTX2080与RTX2080TI？

如何评价RTX2080与RTX2080TI

就像刚刚过去的苹果发布会一样，NVIDIA每一代的新旗舰显卡的发布在玩家心目中也完全可以被当做一场“科技春晚”，只不过最近的“春晚”周期横跨了2016-2018三个年头，间隔长达两年零三个月。或许也只有这样一个破纪录的更新周期才能消化2016年5月发布会上Pascal架构产品那令人震惊的性能跨越。这也让我们看到老黄在2018年新品发布会上拿出新款“核弹”时有了更多的期待。

按照惯例，笔者在第一时间拿到了这两款国内外玩家翘首以盼的新显卡——”GeForce RTX 2080Ti和GeForce RTX 2080“。规格参数一览以TU102和GP102核心为例，从规格上来看，CUDA核心的数量增长并不是非常夸张，相对而言最大的变化就是增加了用于光线追踪的RT Cores 和深度学习用的Tensor Cores。

这也是这一代显卡最重量级的升级。新成员的加入也让图灵架构的显卡核心面积大幅度增加。TU102相比GP102在面积上就增加了60%。相应的频率也有所增加，但幅度相对较小。TU102核心透视实拍TU102的晶体管数量达到了186亿，而前一代GTX 1080Ti所使用的GP102则只有118亿，增加了57%。

这颗GPU核心也顺理成章成为了目前规模最大的游戏显卡核心。巨大的规模带来的副作用就是潜在的功耗和发热量的增加。相比两年前Pascal时代28nm到14/16nm工艺的巨大工艺红利来说，这一代从16nm 到12nm 的提升幅度就没那么夸张，一定意义上来说，台积电以及三星的12nm工艺更多的是在之前14/16nm工艺基础上的小改成果。

所以虽然有一定的效果，但对于NVIDIA来说并不会有太多频率和发热控制上的显著进步。RTX6000采用的完整TU102核心拥有72个SM单元，而很不幸的是RTX2080Ti阉割掉了4个SM单元，仅有68组。相应的内存控制器也阉割掉了一组，剩下11个，整体的策略和GTX 1080Ti时期对GP102的“刀法”完全一致。

每一组SM单元中都配备了一个RT Core，以及两两成对的TENSOR Cores。可以看出，事实上这一代FP32和INT32单元所占据的比例其实相对不那么高。可以说这一代是近几年来，在底层变化最大的一代产品。如果细化到Tensor Core本身，图灵架构的Tensor Core相对于Pascal上搭载的相同结构的最大变化就是将处理方式从2D平面升级到了3D，这意味着以数量级计的效率提升。

GDRR6显存：求稳之举出乎很多人意料的是NVIDIA在这一代产品中并没有使用大家所期待的性能强大的HBM2显存。继续使用了最新的DDR显存，也就是GDDR6显存。架构上没有多少变化的GDDR6是基于前一代产品的继续优化产物，通过提升频率到7000MHz（等效14000MHz）将带宽提升到了14Gbps的水平，同时降低了40%的串扰。

虽然性能仍然不可能与HBM相比，但胜在成本低，良率高，可以持续大规模供货，不至于出现被显存拖累的窘境。前文我们说到，RT Cores占用了很大的核心面积，而这些单元并不会提升传统的光栅渲染效能。他们的用途要比单独提升游戏的FPS值更有价值。基于这些单元，NVIDIA在这一代显卡产品中加入了酝酿多年的“实时光线追踪”（RTX）技术。

这也是为什么这一代显卡产品的命名从“GTX”变成“RTX”的原因。光线追踪与实时光线追踪传统的光栅化渲染其实将一个3D图形的几何信息转变为一个个栅格组成的2D图像的过程，可以理解为在这个3D图形的每个点都包含有颜色、深度以及纹理数据，经过一系列计算变换后，将其转换为2D图像的像素，进而呈现在显示设备上。

更多的是一种基于作者认为“这里应该有这个”的创作性质的图形渲染方式，一定以上来说就是已知结果并把结果写出来，而并不能知道这个结果是正确的还是错误的。而光线追踪技术则是通过通过光源位置、射线、和物体关系进行真实的光线模拟运算，来得出这里应该有哪些光线，有怎样的反射关系。这样得出的游戏画面的光影效果也就更加真实。

光线追踪在以往游戏中的应用都是在游戏的制作中提前进行运算，将得出的结果写到游戏程序中，显卡所做的也仅仅是将已经写好的“台词”念出来。这样的做法意味着无法实现大量且精细的光线追踪，那将意味着海量的计算过程和无比巨大的供调用的结果数据。而“实时光线追踪”就是将光线追踪的运算过程拿到游戏过程中来，实时地计算出光线应该投影和反射形成的效果。

如果性能足够强大，不仅可以在同样的场景中做到更高数量级的光线追踪效果，游戏画面可以得到显著的提高，还能大幅度降低游戏开发者的运算量。如果把图形渲染比喻成一场数学考试，那么光栅化渲染基本上约等于不会做题目所有的选项都靠“三短一长选最长”的直觉来回答；而“光线追踪”则是将尽可能多的题目死记硬背，靠题海战术来完成答卷；而“实时光线追踪”（RTX）技术则是将做题的方式学会，通过聪明的大脑来运算解决遇到的每一个题目。

这样毫无疑问，最后一种方式所得到的分数必然要远胜前两者。落实到游戏的话，目前支持光线追踪的游戏并不多，近期《古墓丽影：暗影》虽然已经承诺支持，但并未在首发版本中加入。而另一款NVIDIA演示的RTX游戏《战地V》也延期上市。所以目前还不能玩到支持实时光线追踪技术的游戏。但是相信不久的将来，在NVIDIA的推动下，会有更多的支持RTX技术的游戏来到我们面前。

靠“脑补”的DLSS技术科隆发布会上占据时长同样多的还有全新的基于AI人工智能技术的“深度学习超级采样”（DLSS）技术。这也是图灵GPU核心中的那些Tensor Core的用途所在。原理是这样的，NVIDIA 使用自己的超级计算机以64 倍于标准分辨率的分辨率运行游戏，绘制出极多的超高画质的画面，再用一定的方式挑选出一些细分画面作为完美渲染的“标准答案”。

然后通过DLSS深度学习，将标准分辨率的画面和这些画面进行对比，生成一张最优画面，然后再与全尺寸（64倍超采样）进行对比，得出差别，然后将这些差别反推到神经网络中，进行循环训练。在几轮之后就人工智能网络就可以学会如何将标准画面渲染到接近64倍分辨率原图的方法。这些学习结果定期通过软件更新提供给图灵GPU的显卡，通过Tensor Cores，就可以进行实时比对，将较低分辨率的画面“脑补”为正确的高分辨率画面，从而实现画面细节的提升。

超采样也消灭了画面中可能存在的锯齿。最终的效果就是，要得出一个4K分辨率的高画质反锯齿画面，通过DLSS技术并不需要真的在4K分辨率下渲染画面，实际渲染一个低分辨率画面，通过DLSS技术即可达到需要的效果。这样不仅画质有所保证，还可以大幅度降低游戏的性能需求，游戏的运行效率将大幅度提升。虽然效率提升，但画质方面却并不会因为DLSS技术而受到损失，相反的，相比TAA（时间性反锯齿），DLSS技术大量的机器学习可以避免拖影和细节错位，从而获得更好的反锯齿效果。

相比需要更深度技术基础的实时光线追踪而言，DLSS更加容易实现，所以很多现有的游戏很快就可以经过NVIDIA的运算后支持DLSS技术，运行效率，尤其是4K下的性能会显著提升。目前NVIDIA承诺的DLSS技术游戏包括《绝地求生》《古墓丽影：暗影》《剑侠情缘三》等众多我们熟悉的作品。不过由于需要硬件层面的支持，DLSS技术也是图灵架构GPU的专属功能。

后续的基准测试中，我们会有针对DLSS技术的实测数据。3DMark首先是传统的3DMark测试：在基于DX11的Firestrike测试中，RTX 2080Ti显卡相对于GTX 1080Ti有着约20%的性能优势。而RTX 2080则相对于GTX 1080有着26-28%的性能提升，而相对于GTX 1080Ti有着5%左右的差距。

而来到DX12测试中，RTX 2080Ti的性能优势大幅度扩大，相比GTX 1080Ti有着高达44%和43%的性能优势。反观RTX2080，则相对GTX 1080有着38%和51%的性能提升。Unigine Valley1.0Valley是一款常用的DX11图形性能测试工具，包含大量先进的画面技术。

在手动开启最高画质并设定3840x2160分辨率开启8x反锯齿后，Valley的测试成绩如图所示，基本上与3DMark Firestrike的测试结果保持一致。RTX 2080Ti 20%左右的性能优势，并且RTX 2080的表现扔略逊于GTX 1080Ti。DLSS技术效能测试我们使用《最终幻想15》的DLSS Benchmark程序进行了开启和关闭DLSS技术的对比测试。

分辨率为3840x2160。可以看到，在未开启DLSS的情况下，RTX 2080Ti相比GTX 1080Ti有25%左右的优势，而开启DLSS之后，RTX 2080Ti的得分提升了高达39%。相对于GTX 1080Ti的性能优势扩大到惊人的75%。甚至RTX 2080开启 DLSS之后的成绩也提升了38%，超过GTX 1080Ti 44%，相对于GTX 1080的优势更是毫无意外的达到了63.7%！由此可见，DLSS技术毫无疑问可以显著提升游戏的运行效能，不过这样的性能释放还需要游戏的支持才能解锁，让我们一起期待DLSS技术在游戏产业的普及吧。

NVIDIA前段时间宣称新一代的图灵显卡可以完美征服4K分辨率的高画质大作，那么我们就挑选几款高画质大作进行一番4K游戏的测试。在实际游戏中，RTX2080Ti展现了新一代的旗舰的性能水准，相对于GTX 1080Ti的优势基本上在20-25%之间，而RTX 2080则波动较大，总体相比GTX 1080的提升幅度在30-40%，表现不错。

可以看出，这一代显卡在现有非DLSS游戏中的提升没有上一代Pascal和Maxwell换代时的惊艳。表现基本上向上进步了一档，次旗舰RTX 2080战平前代旗舰GTX 1080Ti。但必须强调的是这都是在DLSS和RTX技术没有引入的情况下得出的结论，未来如果有足够多的DLSS游戏上市，我们还会再一次进行类似的测试，与此次的结论相比照，得出相应的最终结论。

功耗测试我们使用FurMark进行压力测试，设定为2560x1440分辨率。通过NZXT电源自带的CAM软件捕捉最高功耗值。由于此时CPU为空载状态，CPU负载维持在20W以下。另外此时显卡的功耗数据仅代表PCI-E供电线所提供的功率，不包含PCI-E插槽的供电部分。如果计算CPU满载时约100W的功耗水平，那么RTX 2080Ti整机的峰值功耗将超过400W，那么一款500W额定功率并且转化率良好的电源是最低标准，如果考虑到一些冗余的话，官方给出的650W电源需求基本上是合理的。

散热这一代公版显卡采用了有别于以往涡轮散热器的双风扇散热器，在TDP变化不大的情况下，满载烤机测试中的温度相比前代有着明显的降低，RTX 2080Ti Founders Edition满载仅78摄氏度的表现已经达到了之前一些GTX 1080Ti非公的水平。可以说公版显卡在这一代上基本上摘掉了散热不佳的帽子。

评测总结：新一代的RTX系列显卡出乎我们意料地选择了对画质和人工智能进行革新和探索，而不是我们之前所期待的大幅度的理论性能提升。RTX 2080Ti相比GTX 1080Ti在DX11下20%左右在DX12下44%的理论性能提升也意味着NVIDIA在缺少强劲的对手情况下，更加重视新技术的支持和优化。这也体现在RTX和DLSS技术的实践上，DLSS技术的AI黑科技带来的提升令人震惊，另外，此次加入的RTX实时光线追踪技术带来了堪称革命性的画质提升，将游戏画面与电影和现实世界的差距缩小到了一个新的程度。

回到值不值得买的话题上，这一代产品的主要卖点是新技术的支持，而不单纯是性能上的进步。这与以往“强不强”的讨论话题不一样，此次更多的是解决DLSS和RTX技术“有没有”的问题。从这个角度上来说，买新不买旧是绝对成立的。当然考虑这些之前你还要考虑到目前两款显卡分别达到5699元和8199元的市场指导价。。

最近更新

相关文章

OPPO最新文章

手机排行榜推荐

OPPO排行榜精选

OPPO文章排行榜

热门标签