英伟达40系显卡正式发布，售价破万元！DLSS 3.0开启渲染新时代

英伟达终于发布了备受期待的40系显卡！这次发布会一口气推出了三款新品：RTX 4090、RTX 4080 16GB 和 RTX 4080 12GB。RTX 4090 拥有 24GB 显存，RTX 4080 则分为 16GB 和 12GB 两个版本，代号均为 Ada。虽然性能显著提升，但价格也随之上涨，RTX 4090 起售价达到 12999 元，RTX 4080 的起售价分别为 9499 元和 7199 元。由于以太坊最近完成了合并，显卡挖矿已无利可图，期待这代显卡不再变成“空气卡”和“耍猴卡”。让我们一起来看看本次发布的详细情况吧！

新一代 Ada 架构，40 系列性能翻倍不止

新发布的 40 系列显卡采用了新的 Ada 架构，性能相比于上一代 Ampere 架构翻倍以上。其中，RTX 4090 搭载了 760 亿个晶体管、16384 个 CUDA 核心和 24GB GDDR6X 显存，最大 boost 频率高达 2.52 GHz。RTX 4080 16GB 版本则配备了 9728 个 CUDA 核心，基础频率为 2.21 GHz，最大 boost 频率为 2.51 GHz；而 RTX 4080 12GB 版本则有 7680 个 CUDA 核心，基础频率为 2.31 GHz，最大 Boost 频率为 2.61 GHz。

令人惊喜的是，根据官方信息，40 系列显卡与 30 系列同级别的产品相比，功耗并未增加。RTX 4080 12GB 版本只需 700W 电源供电，16GB 版本需要 750W，而 RTX 4090 需要 850W 电源。这意味着许多 30 系列用户在升级时无需更换电源。

性能方面，尽管具体的跑分和游戏实测成绩尚未出炉，但老黄自信地声称，新旗舰 RTX 4090 在部分游戏中的表现已经远超上一代旗舰 RTX 3090 Ti，甚至可达 2-4 倍的性能提升。例如在《微软模拟飞行》和《战锤 40k：黑潮》中，RTX 4090 的性能都达到了 RTX 3090 Ti 的两倍，在《赛博朋克 2077》中更是恐怖地提高了 4 倍性能。

不仅如此，16GB 版本的 RTX 4080 相较于上一代 RTX 3080 Ti，无论是开启或关闭光追，性能均有 2-4 倍的提升。12GB 版本则被英伟达宣称在很多游戏中的表现超过了上一代旗舰 GPU —— RTX 3090 Ti。而在与 RTX 3080 Ti 的对比中，RTX 4080 同样取得了类似的成绩，实现 2 倍以上的性能提升。

40 系列显卡的到来，意味着我们即将进入 2K 360 帧的时代！黄氏不等式再次应验：4090 ≈ 2 * 3090TI，4080 ≈ 2 * 3080TI……

DLSS 3.0 打开渲染新篇章

在发布会上，英伟达重点介绍了 DLSS 3.0 技术。DLSS 3.0 是一个由 AI 驱动的性能倍增器，它标志着 RTX 神经网络渲染游戏和应用的新时代。据称，DLSS 3.0 包括四个组件：光流加速器、游戏引擎运动矢量、卷积自动编码和 AI 帧生成器。

DLSS 3.0 最大的创新在于光学多帧生成技术，它可以生成全新的帧，而非仅仅进行像素增强，因此带来了巨大的性能提升。通过分析两帧连续的游戏图像并计算帧间物体和元素的运动矢量数据，而不是依赖传统的游戏引擎运动矢量，光流加速器显著降低了 AI 渲染过程中出现的视觉异常。

演示中展示了 Racer X 模拟越野赛车游戏，观众惊叹于这款光追怪兽的强大性能。综合游戏中的一对超级分辨率帧、引擎和光流运动矢量，并将其输入至卷积神经网络，就可以计算生成出新的一帧。这种方法在实时游戏渲染中是前所未有的。此外，将 DLSS 生成的全新帧与 DLSS 超级分辨率帧结合，使 DLSS 3 能够重建显示像素的八分之七，从而将帧数提高了四倍。

DLSS 3.0 还集成了 NVIDIA Reflex，能够使 GPU 和 cpu 同步，确保最佳响应速度和低系统延迟。未来，包括 Unity Engine 和虚幻引擎在内的全球热门游戏引擎都将支持 DLSS 3 技术。首批采用 DLSS 3.0 技术的游戏名单中包括了《黑神话：悟空》、《永劫无间》、《逆水寒》、《赛博朋克 2077》、《巫师 3》和《原子之心》等作品。

自动驾驶超级核弹登场：1 颗顶 8 颗

除了惊艳的 40 系列显卡外，英伟达还在发布会上揭晓了自动驾驶领域的旗舰级芯片 —— DRIVE Thor。这款搭载了 770 亿晶体管的“雷神”芯片，在算力上达到了 2000 TOPS 和 2000 TFLOPs，堪称自动驾驶领域的“超级核弹”。

相较于原计划于 2024 年推出的 1000T 的 Atlan，Thor 性能翻倍且提前问世。过去五年间，凭借 Xavier、OrinX 等高算力芯片，英伟达几乎垄断了自动驾驶领域。如今，面对拥有 256T 计算力的 OrinX，其他竞争对手只能望尘莫及。

Drive Thor 将成为首款配备 Transformer 引擎的自动驾驶汽车计算平台，有望将深度神经网络的推理性能提高 9 倍。此外，该芯片还可以处理自动驾驶系统的计算需求，并通过虚拟机运行汽车底层的 Linux、辅助驾驶的 QNX、智能座舱的安卓等多种操作系统，真正迈向“真·中央域控制器”的目标。

值得一提的是，Thor 还集成了原本应用于数据中心的 NVLINK 连接，能够加快芯片之间的数据传输。未来，吉利旗下的 ZEEKR 将成为首个采用 Thor 的品牌，并预计在 2025 年开始生产。

Omniverse 应用拓展，功能更加强大

借助 Ada Lovelace GPU 的支持，Omniverse 不仅可以加速各种复杂的 3D 工作流程，还将光线追踪、AI 和计算等复杂技术融入 3D 流水线。在 VR 中，Omniverse 也能实现追踪光线的功能。此外，它还能在 Omniverse 中创建数字孪生数据库，不断与真实数据输入保持同步，并由 Omniverse 计算平台提供 AI 支持。

借助 Pixar 的 USD（Universal Scene Description），Omniverse 可为现有 3D 工作流程提供无缝协作体验。不仅如此，Omniverse 还能在云的支持下，轻松处理大规模的数据。

深度学习项目开源

除了显卡，英伟达还宣布了最新的开源项目 CV-CUDA。CV-CUDA 包含了 50 多种 CV 算法，支持自定义内核、零拷贝接口等功能，专为加速计算机视觉工作负载设计。在单个 GPU 上，CV-CUDA 可以处理 10 倍数量的数据流，并可以与 C/C++ 和 Python 应用程序对接，也可以集成到现有的深度学习框架和其他软件中。

英伟达透露，CV-CUDA 将从今年 12 月开始以早期访问形式发布，计划于明年 3 月推出测试版。此外，英伟达还宣布了针对大型语言模型（LLM）的新服务，如用于定制