帧数至上
很长一段时间以来,我不得不在显卡评测中提到,全球供应链问题、芯片短缺和加密货币热潮使得显卡本身的性能变得无关紧要,因为大多数人找不到显卡,即使他们可以。 您可能也买不起高级显卡。 不过,NVIDIA最新一代性能王者GeForce RTX 4090推出时,上述问题已基本不复存在。 我们终于可以惊叹于顶级显卡产生的帧数,而不必惊叹于离谱的售价。 感觉很好!
过去一周,我一直在测试公版RTX 4090的各方面性能,测试其在软件基准测试和实际游戏场景中的表现。 4090机身庞大,价格也并不低。 公版售价高达1599美元(国行12999元)。 然而,这是一款可以在光线追踪开启的情况下以 4K 分辨率运行《赛博朋克 2077》并达到 100 fps 以上的游戏硬件。 很难说不值这个价钱。NVIDIA GeForce RTX 4090 设计与特点
首先来说说大家一眼就能看到的问题——RTX 4090是一块巨大的显卡,和上一代卡王RTX 3090 Ti差不多大小。 这是一款 3 插槽显卡,重量约为 2.5 千克。 虽大但优雅,整体外观沿用了两年前公版30系列显卡的银黑配色。
Nvidia 工程师发布了一份令人瞠目结舌的规格清单,相比之下,即使是 RTX 3090 Ti 也显得有些逊色。 该显卡拥有 16,384 个 CUDA 核心,而 3090 Ti 只有 10,752 个。 其基础频率为2.23 GHz,加速频率最高可达2.52 GHz,还配备24GB GDDR6显存。 这使其具有 83 TFlop 着色器功率、1321 TFlop 张量功率和 191 TFlop 光线追踪功率(作为比较,3090 Ti 具有 40 TFlop 着色器功率、320 TFlop 张量功率和 78 TFlop 光线追踪功率)。 。
这款显卡的规格提升是巨大的。 然而,正如我们之前在许多情况下看到的那样,核心和着色器数量加倍并不意味着游戏性能也会加倍。 但这一次,Nvidia 提供了相当稳定的性能,在我的大多数测试中,我看到的不仅仅是渐进的性能改进。 这是真正的升级。
该卡显然是为主导 4K 游戏而设计的,但内容创作者和专业人士也会欣赏 24 GB GDDR6X 显存。 即使对于当今最需要性能的游戏来说,如此大的显存也有点过多了。 但如果你想要 3D 建模,这可以节省大量渲染时间。 拥有24 GB显存,OctaneRenderer可以直接使用显卡上更快的帧缓存,几乎不使用系统内存,从而大大提高了渲染速度。 同样,在 Blender 中,您可以在等待后台渲染完成的同时继续在窗口中工作。
在这些计划中的工作体验也得到了显着改善。 得益于显卡上安装的AI核心,图像去噪和渲染速度更快。 不过,如果你是使用 Unity 引擎、Unreal Engine 或 NVIDIA Omniverse 平台的游戏开发者,那么新显卡最重要的升级可能就是对 DLSS 3 的支持。这项技术给游戏带来的好处也适用于游戏开发:只需一小部分性能即可实现实时光线追踪渲染。 Nvidia 声称 RTX 4090 的渲染速度比 RTX 3090 Ti 快四倍。
如果您是专业的3D建模师,专业的工作站显卡仍然是最佳选择。 就像 RTX 系列显卡专为游戏打造一样,NVIDIA 的工作站显卡也针对专业创作者进行了独特优化。 但这些优化带来了巨大的价格差距。 如果您为小型企业工作或正在从事一些独立项目,那么与那些专业工作站卡相比,RTX 4090 确实是一个非常好的折衷方案,可以为您节省数千美元。
这一代显卡的另一个重大升级是支持AV1编码。 AV1 是一种视频压缩格式,允许您以更少的带宽和更高的质量进行渲染和流传输。 虽然RTX 30系列支持AV1解码,但编码器极大地帮助了创作过程。 它非常高效,可以在不增加带宽的情况下提高直播质量。 此外,DaVinci Resolves 中的视频渲染时间最多可缩短一半。NVIDIA GeForce RTX 4090 游戏性能
测试系统:华硕Z390 ROG Maximus XI Extreme主板。 Intel i9-9900K CPU、Corsair H115i PRO RGB 280mm AIO CPU 散热器、32GB Corsair Avengers RGB Pro DDR4-3200 内存、1TB Samsung EVO Plus NVMe SSD、Corsair HX1200 1200W 电源。
让我们从软件基准测试开始。 4090轻松刷新各项记录。 在3DMark Fire Strike Ultra中,4090的分数达到了惊人的21872。相比之下,这个分数比RX 6950 XT的14512高出约50%(在4090到来之前,这是我们记录过的最高分数)。 这个分数与Fire Strike Ultra的2x SLI超频世界纪录基本一致——要知道,那是两块GPU一起超频取得的分数。
Unigine Heaven 中的测试也是如此:4090 的性能远远优于我们测试过的所有显卡,与 3090 Ti 相比,1080p 下的分数提高了 26%,1440p 下的分数提高了 39%,4k 下的分数提高了 31%。
光线追踪分数也延续了这一趋势,4090的分数几乎是3090 Ti的两倍,在某些情况下甚至达到了两倍。 这些数据看起来确实令人印象深刻。
继续看我们的游戏分数,4090 继续在游戏中占据主导地位。 这次我们依然使用了我们平时测试的四款游戏,包括《无主之地3》、《战争机器》、《地铁:离去》和《全面战争:三个王国》。 此外,我们还测试了《Control》和《古墓丽影:暗影》。 所有游戏都以最高预设质量运行,并在支持的游戏中打开光线追踪和 DLSS。
就像软件基准测试结果一样,在每个分辨率下测试的每款游戏中,4090 都远远领先于我们测试的其他显卡。 当然,这就是它应该表现的方式。 毕竟这是新一代显卡的旗舰产品,所以只有曾经的卡王3090 Ti才有机会竞争。
问题是,4090 的性能提升了多少? 在我们测试的众多游戏中,4K 分辨率下 4090 相对于 3090 Ti 的领先优势从《地铁:离去》中的 14% 到《古墓丽影:暗影》中的 90%。 这意味着所有游戏的帧率都可以维持在 100 fps 以上——要知道,这是开启光线追踪的 4K 最高画质的测试结果。 数据再次让我惊讶。
NVIDIA GeForce RTX 4090 DLSS 性能
4090的成功无疑有一部分归功于Nvidia对DLSS技术的不断改进。 DLSS的全称是“深度学习超级采样技术”。 这种基于AI的技术可以以较低的分辨率渲染游戏,但输出更高分辨率的画面,比如以1440p渲染但最终输出4K,并且输出的画面和原生4K几乎没有区别。 早期的DLSS会因为AI算法问题而导致图像质量下降,但这项技术已经取得了长足的进步。 现在开启DLSS后,画质基本上和不开启一样好,甚至可能更好。
该技术的最新版本是DLSS 3,仅40系列显卡支持,但带来了AI自动补帧的新功能。 NVIDIA官网有非常详细的技术介绍,这里不再赘述。 如果您有兴趣,可以自行阅读。 简而言之,显卡会分析前后两帧,计算两者的差异,然后利用AI生成中间帧。
图片来源:NVIDIA
与上一代显卡相比,这是一个重大改进,有时FPS的提升只能用天壤之别来形容。 DLSS 2可以分析动态矢量数据和每一帧,智能升级图像并提高性能; 而RTX 4090的光流加速器可以分析运动路径并自行生成新帧,而无需求助于游戏引擎的本机帧输出。 该技术与 Nvidia Reflex 配合使用,可以消除导致游戏缓慢的延迟。 NVIDIA提供的数据显示,开启DLSS 3后,帧率最高可提升至原来的四倍。
在4K分辨率、最高画质、开启光线追踪的情况下测试《赛博朋克2077》时,开启DLSS带来了帧率的显着提升,开启帧生成后帧率进一步提升。 关闭 DLSS 后,4090 在一分钟游戏基准测试中达到 41.9 fps。 打开 DLSS 但禁用帧生成后,结果跃升至 84 fps。 开启帧生成后,测试结果达到了令人难以置信的136 fps,游戏画面依然华丽如初。
目前的帧生成技术确实存在一些妥协,即虽然显卡会生成额外的帧,但将此帧添加到输出流时会存在一定的延迟。 毕竟,这些帧是由 GPU 生成的,独立于游戏引擎。 单独使用 DLSS 3 可能会使 120 fps 感觉像 60 fps。 但不用担心,Nvidia Reflex 解决了一些延迟问题。 事实上,在测试《赛博朋克2077》中的帧生成技术时,我玩的部分根本感觉不到任何滞后。 然而,其他游戏中的情况可能有所不同,这种延迟可能会在一些毫秒级的快节奏电子竞技游戏中带来麻烦。 然而,在像《赛博朋克》这样非常重视图像质量的游戏中,在4K分辨率和光线追踪开启的情况下,它可以超过120 fps。 这个成就是惊人的。
另外需要注意的是,Nvidia为RTX 4090给出了相对高端的推荐配置。为了释放这款显卡的全部潜力,Nvidia建议用户将其搭配最新的CPU和DDR5内存。 它还需要 DirectX 12 和硬件加速 GPU 计划,并且不兼容垂直同步(但支持 G-Sync)。 从我们的测试机可以看出,这些硬件条件并不是绝对的硬性要求(比如我们使用的内存是DDR4),所以像我们一样,即使你最近不打算升级整个系统,你仍然可以享受显卡改进带来的好处。
最后要考虑的当然是价格。 通常新一代显卡都是从我理解的“高端主流显卡”开始的。 对于N卡来说,是指3080、2080、1080等。 而这次是4090,所以在测试的时候,我们只能和上一代产品进行比较。 虽然我们知道16GB显存的4080售价为1199美元(国行9499元),12GB版本售价899美元(国行7199元),但我们无从得知它们的性能如何。显卡在我们测试之前都会有。 。
所以现在4090肯定可以击败世界上所有的对手。 毕竟是新一代的发烧级显卡。 但它值这个钱吗? 这还有待观察。
然而,与当今可用的其他显卡(包括3090 Ti)相比,其数据非常可观。 3090 Ti今年年初刚刚发布。 首发时建议零售价为2000美元(国行14999元)。 不过最近价格下降了不少,折扣后最低价为1100美元。 如上所述,4090 在 4K 分辨率下的游戏性能比 3090 Ti 高出 15% 到 90%。 由此看来,4090似乎比上一代卡皇贵了45%。 总结
RTX 4090可能又大又贵,但在它面前,其他对手毫无还手之力。 这实际上有点不公平——它是唯一一款上市的新一代显卡,所以我们只能与过去几年发布的显卡竞争。 但在其他新卡发布之前,考虑到这张卡拥有惊人的硬件规格和神奇的 DLSS 3 AI 技术,以及运行游戏时的帧率举世无双,即使是 1599 美元的高价也显得合理。 。
本文整理自IGN US相关内容。 原作者 Chris Coke 翻译了猪骨拉面,并编辑了 Tony。 未经授权禁止转载。
优缺点评价分数
RTX 4090可能又大又贵,但在它面前,其他对手毫无还手之力。 这实际上有点不公平——它是唯一一款上市的新一代显卡,所以我们只能与过去几年发布的显卡竞争。 不过,在其他新卡发布之前,考虑到这张卡拥有惊人的硬件规格和神奇的DLSS 3 AI技术,以及运行游戏时的帧率举世无双,即使是1599美元的高价也显得合理。 。