昨日夜间11点,依旧一身皮衣的黄仁勋亮相发布会,一连发布多款硬件新品,带来了两年一大升级的GeForce RTX 40系列,也带来了无人驾驶领域的最新之作。
其中,如同此前网上所传闻的,RTX 40系列首发产品包含GeForce RTX 4090和GeForce RTX 4080两个型号三款产品,至于其性能如何,我们接下来慢慢看。
在首发的三款产品中,RTX 4090 GPU为旗舰产品,采用了台积电4nm工艺,拥有760亿个晶体管、超18000个CUDA核心和美光24GB GDDR6X显存,能够在4K分辨率的游戏中持续以超过100 FPS运行。
而取代过往的Ampere架构,此次RTX 40系列首次采用了新架构——Ada Lovelace,这是一位女性的名字,她被许多人认为是世界上第一个计算机程序员。
依据黄仁勋介绍,基于Ada Lovelace架构,RTX 40系列在SM多单元处理器等方面都进行了换代升级。
比如SM多单元处理器,性能最高达到90 TFLOPS,吞吐量是上一代Ampere架构的2倍。其中英伟达全新引入了Shader Execution Reordering(着色器执行重排序技术),通过即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源。依据老黄现场介绍,基于这一改变,RTX 40系列可获得2-3倍的光线追踪性能提升,整体游戏性能提升可高达25%。
再来看RT Core,其拥有了两个全新硬件单元,分别是Opacity Micromap和Micro-Mesh引擎,前者将光线追踪的Alpha-Test几何性能提升2倍,后者可动态生成微网格,在不牺牲性能和存储的前提下产生额外的几何图形以提升丰富度。基于这一升级,RTX 40系列拥有2倍的射线三角形相交吞吐量,有效光线 TFLOPS,是上一代产品的2.8倍。
此外,黄仁勋还重点介绍了RTX 40系列新引入的DLSS 3.0技术,它包含四项组件,其中最为关键的是新加入的AI帧生成器,可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据。举个例子,DLSS 3.0可以使原本开启光线帧/秒呈现(DLSS 2.0的效果为提升到62帧/秒)。
RTX 40系列之后,老黄紧接着带来的是全新自动驾驶旗舰级芯片“Thor(雷神)”,用黄仁勋的话来说:“Atlan不再是第一了……它将被Thor取代”。
依照英伟达原先规划,单颗算力达到1000 TOPS的Atlan将于2023年向开发者提供样品,并于2025年大规模量产上车。如今来看,Atlan似乎是被砍了,并且主角也由Atlan换成了Thor。
其中,Grace是英伟达首款数据中心CPU,主要面向大型数据密集型HPC和AI应用,拥有非常好的单线程性能;Ada Lovelace是英伟达最新的GPU产品,有助于车载计算资源集中化的同时,也将成本降低数百美元;Hopper则提供了Transformer引擎和Vision Transformer的快速变革,可以将深度神经网络的推理性能提高9倍。
值得注意的是,除了性能上的提升,Thor更为令人惊叹的是能做到“身兼多职”,基于多域计算,不仅能单独负责无人驾驶系统的计算需求,还能将2000 TOPS和2000 TFLOPs分开配置使用,一部分用于驾驶舱AI和信息娱乐系统,另一部分用于自动驾驶。这在某种程度上预示着,你可以在一台计算机上同时运行汽车底层的Linux,辅助驾驶的QNX,智能座舱的安卓等多个操作系统,线颗用。
40 TOPS,采用与英伟达先前宣布的Orin NX兼容的模块,支持具有Ampere架构GPU的AI应用程序管道。
Cruise宣布着手自研无人驾驶芯片,更是一口气开发四种,背后原因,则是为降低外购芯片的成本。对于英伟达来说,这并不是一个好消息。
EVGA宣布与其终止合作,不再生产新显卡,又比如以太坊合并,终结了大规模显卡挖矿时代,这一波攻势下,新显卡的销量有待后面市场的考验。其涨价的背后,不知是否也有着想消耗旧显卡库存的考量。