独立显卡排名图 独立显卡排名天梯图( 二 )


负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持 。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度 。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍 。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代 。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半 。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS 。DLSS的全称是Deep Learning Super Sampling,翻译成中文就是深度学习超级采样,它的作用是通过降低游戏内的渲染分辨率,同时以拉伸来提高显示分辨率,例如1080P的渲染分辨率以及4K(2160P)的显示分辨率,来达成提升帧数的目的 。
此外,将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了 。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间 。
再之后就是HDMI 2.1这个备受期待的新输出端口了 。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出 。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音 。
NVIDIA Reflex伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex 。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件 。
硬件部分是Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟 。
而软件部分则是NVIDIA Reflex SDK 。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内 。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟 。
AMD RDNA 2架构简介三大改进点RDNA 2架构三大改进点:
·高频率设计:RDNA 2架构相比RDNA 1架构实现了同功耗下30%的MAX频率提升;
·无限缓存设计:可以消除带宽瓶颈,极大的提升了等效带宽并降低功耗,有助于提升能耗比;
·支持DX12U、DS API:紧随时代潮流,让A卡支持光追等高级API特性 。
RDNA 2架构是一个强大的游戏架构,相比RDNA 1代架构主要有三个大改进 。首先AMD在RDNA 2上实现了突破性的高频率设计,在拥有高频率的同时维持较好的能耗表现 。其次AMD专门为RDNA 2研发了革命性的AMD Infinity Cache无限缓存技术,无限缓存在提供非常可观的等效带宽的同时还更节能,能耗表现更上一层楼 。第三个改进点就是支持了DX12 Ultimate的高级特性,包括DXR、DirectStorage等API,让AMD的显卡也加入到支持DX12 Ultimate的大家族中 。
先来看频率改进,RDNA 2实现了突破性的高频率设计,虽然与RDNA都是相同的7nm制程工艺但是进步巨大(到了RX 6500 XT和RX 6400还进一步升级了制程,采用6nm制程,是台积电7nm的改进版) 。通过这张图表我们可以看到,以每个计算单元CU为例RDNA 2架构实现了相同功耗30%的频率提升,而如果是相同的频率则功耗只有RDNA的一半还少一些,也就是能耗比提升50%以上 。

推荐阅读