这是一款采用了NVIDIA全新AdaLovelace架构核心的显卡,并且黄CEO还为我们介绍了AdaLovelace架构众多全新的特性。
包括:TSMC4N定制工艺、DLSS3、流式多处理器、第三代RTCores、第四代TensorCores、着色器执行重排序(SER)、Ada光流加速器,以及双NVIDIA编码器(NVENC)等,还真有点牙膏挤爆的感觉。
从性能和零售报价来看,此款三款显卡的定价似乎都有点合理,毕竟性能提升基本是同级上代显卡的二倍,功耗也保留在同级水平上,那持平的零售报价非常理想了。
除了NVIDIA的FE版本外,国内的华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将会推出GeForceRTX4090和4080GPU标频版和超频版。
AIC非公版也出炉了,现在就来看看手上能提供给大家的资料吧。由于NDA是10月12号,目前我们手上的资料并不算太多,或者是我们目前能对大家说的资料是相当有限的,所以直接拿现成的影驰显卡规格表来说说。
GeForceRTX408016GB采用了另外一款核心,核心代号为AD103-300,拥有9728个CUDA核心和16GB高速美光GDDR6X显存,显存位宽也缩减到了256Bit,但显存频率是三者中最高的。
按照NVIDIA官方给出的资料来看,目前的AD102-300核心规格并非全满血版本(有一定的削减),类似于上代RTX3090与RTX3090Ti的关系。
同时RTX40系列与30系列显卡将会同场竞技一段时间,啥时候才推出新的东西,按照之前上代RTX30系列显卡的节奏来看,预估得是三个月后了。
从规格来看,往下其实也难办,GeForceRTX4080显存显存位宽都到192Bit了,那我们猜想一下,或者可能未来的GeForceRTX4060注定是AD106+128Bit???废话有点多了,我们再来看一下AdaLovelace架构新特性。
AdaLovelace架构的命名还真有点意思了,根据出来的资料,AdaLovelace 人称“数字女王”,编写了历史上首款电脑程序,是被世界公认的第一位计算机程序员。不知道这样的命名是否意味着NVIDIA想凭借GeForceRTX40系列显卡的出现重新定义显卡。
制程方向NVIDIA一直都是相当激进的,采用了TSMC台积电定制4N工艺技术,AD102核心就能塞下760亿个晶体管,官方说有超过18000个CUDA核心,意味着RTX4090采用的AD102核心并非满血版本。
但即使是这样,AdaLovelace架构核心仍未上一代的Ampere架构多出了约70%的晶体管数量,同时实现了高达2倍的性能功耗比。只能说AdaLovelace架构+TSMC4N组合是线WTDP对于显卡散热还真压力不少。
首先是流式多处理器,GTC2022老黄为我们介绍的是90TFLOPS,但NVIDIA官方新闻稿介绍的是RTX4090具有高达83TFLOPS的着色器能力,那这样来看满核心的AD102会是90TFLOPS的峰值计算能力;
其次是第三代RTCores与两个重要硬件单元:OpacityMicromap引擎与全新的Micro-Mesh引擎,可以为咱们提供2倍的光线与三角形求交性能。
说人话就是GeForceRTX40系列显卡将会有着更为强劲的光线追踪能力,即使环境与物体的渲染几何更复杂也有能实现物理准确的图形计算。
第三个提升是第四代TensorCores,FP8张量处理性能性能提升到了1.32Petaflops,比上一代强出了5倍。
更强劲的算力意味着显卡的深度学习能力越强,AI算力也会提升越大,包括在使用NVIDIAOmniverse与NVIDIABroadcast,能让我们实现更高效的运算。
第四个着色器执行重排序(SER),看图就很容易理解出SER的作用(调度器),按照NVIDIA官方的讲法:“通过即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源。
作为与CPU的乱序执行一样的重大创新,SER为光线倍的性能提升,整体游戏性能提升可高达25%。”意味着SER能提前梳理好运算任务,SM单元再依据需求完成任务。
可以看到每一代的RTX显卡都有显著的技术提升,尤其是GeForceRTX40系列显卡作为第三代RTX显卡可提供更强劲光线追踪性能的同时,还实现了更快速、高效的实时运算。
而前面说了一堆,其实都是为了引出NVIDIA最新一代的用于游戏和创作应用的DeepLearningSuperSampling深度学习超级采样技术DLSS3,上一代的DLSS2技术就已经相当的强劲,但是AdaLovelace架构配合下的DLSS3将会是神经网络图形技术的下一次革命。
DLSS3也能够最终靠允许GPU生成全新帧来克服受CPU限制的游戏,利用人工智能驱动的技术能生成全新帧,从而大幅度提高游戏性能。
并且这一技术早就已经在全球最热门的游戏引擎包括UnityEngine和虚幻引擎中使用并得到了众多全球领先的游戏开发者的支持。
当我们捕捉游戏素材到一些游戏素材后,我们大家可以通过RTXRemix软件配合GeForceRTX40系列显卡的强大运算能力,利用AI辅助工具集包含的深度学习模型来提升纹理和素材的分辨率;
也可以使用一个AI模型把材质转换成具有精确物理属性的材质,例如增加光效等,这样我们就可以把一款旧游戏变得更的RTX。
我们从NVIDIA官网上能够正常的看到了初部RTX4090显卡的性能,当GeForceRTX40系列显卡和NVIDIAReflex搭配上后,直接达到1440p分辨率360FPS的体验,这着实是性能有点强劲了。
兼容NVIDIAReflex的鼠标也迎来了三款新品:联想拯救者M600s无线游戏鼠标、联想拯救者M600sQi无线游戏鼠标以及ROCCATKoneXPAir游戏鼠标。
Reflex游戏鼠标有何作用?当你的电脑使用上RTX40或者是RTX30系列显卡,配备Reflex的G-SYNC显示器以及NVIDIAReflex游戏,这时你的鼠标就能全面实现端对端的超低迟延,从而提升游戏性能。
GeForceRTX40系列显卡还有一个全新的升级,那就是双编码器,支持开放式视频编码格式AV1。包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为流行的Voukoder插件均支持AV1,且均可通过编码预设使用双编码器,这样我们等待视频导出的时间缩短将近一半。
不单是视频制作软件,AV1格式也将会是主播、游戏直播UP主们的新宠儿,在保证画面最高质量的情况下,AV1编码器可将效率提高40%,同时显卡的占用也更低。
包括OBSStudio一一代软件中也会增加AV1格式的支持。另外我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容,这样我们做游戏录制也会变得更加轻松。
当然2022秋季GTC大会其实还有许多的亮点,包括Omniverse的应用与案例、Thor处理器、NVIDIADRIVER平台、JetsonOrinNano微弄机器人计算机等,这些大家感兴趣的可以到NVIDIA官方上看重播。
至于GeForceRTX40系列显卡的性能表现如何,等到10月12号解禁后,我们就不难得知了。