ZKX's LAB

深入解析AMD Radeon RX6000:性能翻倍的秘密

2020-10-29新闻7

说到AMD的RDNA2架构,可能算得上是近年来“保密工作”做得最差的一次GPU设计了。先是早在一年多前初代RDNA架构发布时,官方就主动公布了下代产品的架构名称。此后随着XSX/XSS与PS5次时代游戏主机,由于使用了RDNA2的GPU设计,也让新架构的大部分软件特性被外界所知。并且不仅如此,就在距离新卡正式上市还有一个多月的前段时间,AMD方面甚至干脆把新品的外观图也给公布了出来。

那么这是否意味着,AMD在今天凌晨举办的的Radeon RX6000发布会,就没有什么“干货”可以继续挖掘了呢?当然不至于。下面我们三易生活就来带大家看看,隐藏在此次Radeon RX6000系列背后,那些技术与市场层面上的有趣事实。

性能翻倍的背后,这次的命名似乎有点令人迷惑

AMD昨晚发布了Radeon RX6000系列的哪些产品?相信稍有关注科技新闻的朋友都已经知道了。他们一口气推出了三款新显卡,也就是Radeon RX6900XT、Radeon RX6800XT和Radeon RX6800。

根据官方的说法,Radeon RX6900XT的32位浮点数性能达到20.6TFlops,这是前代RDNA架构旗舰产品Radeon RX5700XT的两倍还多。请注意这不是对位的比较,因此它并不意味着RDNA 2的能效比有两倍的增长。但考虑到Radeon RX6900XT所基于的Navi 21(也叫Big Navi)核心,是AMD时隔数代后久违的全新大尺寸核心,所以能够实现旗舰性能翻番,同时价格还明显低于竞争对手(Radeon RX6900XT官方售价7999元,对标的Geforce RTX3090官方售价是11999元),AMD的诚意显然还是很够的。

但如果大家有仔细研究这次Radeon RX6000系列已发布型号的具体规格,就会发现一点更不寻常的现象。也就是此次的Radeon RX6000系列显卡在性能规格与命名上,似乎出现了那么一点点偏差。

具体来说,此次的旗舰当然是拥有80组CU(5120流处理器)、80个光追单元、128ROP(光栅单元),以及16GB显存的Radeon RX6900XT。但与它相比,“次旗舰”Radeon RX6800XT的流处理器与光追单元其实只少了10%(从80组减少到72组),光栅单元甚至完全没有减少;并且与此同时,更次一级的Radeon RX6800在流处理器、光追单元,以及光栅单元的数量上却大幅减少了25%。

这意味着什么呢?简单来说,就是Radeon RX6900XT与Radeon RX6800XT之间的性能差异并不大,甚至可能在相同分辨率、相同画质水准的游戏里,都不会有决定性的流畅度差异,但Radeon RX6800和Radeon RX6800XT的差距就要大得多了。

正因如此,实际上在我们三易生活来看,此次的Radeon RX6800XT或许被叫做Radeon RX6900反而更合适一些。而规格与旗舰差异甚大的Radeon RX6800,可能才是真正的“Radeon RX6800XT”。那么为什么AMD不这样做呢?或许定价策略才是唯一的理由吧。

制程未升级,翻倍的性能秘密在于内存子系统?

说完了基本的产品规格与命名问题,我们是时候来看看AMD这次在新显卡架构上的一些“魔法”了。

首先大家要明确的是,此次AMD Radeon RX6000系列使用的依然是与上代相同的台积电7nm制程。因此这意味着新品的性能提升和制程完全没有关系,纯粹是来自于更大的芯片、更多的流处理器、更高的运行频率,以及更新的架构设计。

很显然,在制程不改变的前提下,增加芯片规格,提高运行频率,这注定会带来更高的功耗压力。要解决功耗问题,在架构上进行改进也就成为了唯一的出路,而这一点实际上也正是RDNA2最大的奥秘所在。

对此AMD做了哪些工作呢?首先按照官方说法,此次新GPU其实是AMD旗下的CPU、GPU和定制SoC(就是专为游戏主机研发芯片的那一群人)部门协同研发的成果。这种协同研发的方式,也使得RDNA2架构融入了许多来自Ryzen锐龙CPU,以及游戏主机芯片的经验。

比如说为了让CU(计算单元)更省电,AMD给RDNA2的CU内部设计了更多的细粒度时钟门,从而能够让GPU的频率调节更加精准,也降低了频率调节的漏电率。

又比如说,AMD经过研究发现,对于如今的显卡来说,移动数据(比如把数据从显存读入到核心里)而不是处理数据的开销,正逐渐在显卡的总功耗里占据越来越高的份额。为此RDNA2架构的设计团队一方面重新设计了GPU核心内部的数据移动路径,减少了内部数据交换的能耗需求;另一方面他们也吸收了游戏主机处理器的成功经验,给RDNA2引入了全新的128MB “Infinity Cache”缓存,将其与256bit显存共同构成了这代显卡的内存子系统。

Infinity Cache可以起到什么作用?简单来说,以往GPU里虽然也有缓存(Cache)这个概念。但是它们普遍容量非常之小(比如只有几百KB或者几MB),存储不了太多的图像数据,因此当显卡处理和渲染游戏画面时,就需要频繁地到显存、内存,甚至是硬盘中去读取数据。这不仅增大了处理的延迟,提高了功耗,更糟糕的是对于那些面向4K、HDR、高帧率游戏需求的顶级显卡来说,它们就不得不配备384bit、512bit甚至是更大的显存位宽。很显然这会造成显卡的设计被复杂化,同时产品成本(售价)也大为上涨。

反之,通过给显卡加入128MB的大容量Cache,RDNA2就可以在日常工作过程中大幅降低读取显存的频率,同时降低对于显存物理带宽的需求。而这也正是它能够做到有效降低功耗,同时价格也颇有优势的秘密所在。

什么样的电脑才能用好RDNA2?这次的要求可能不低

最后,让我们来谈谈AMD Radeon RX6000系列这次的系统需求。

首先根据官方说法,Radeon RX6000系列是一款专为DX12 Ultimate API设计的GPU,这意味着它仅能支持Windows 10 2020年4月版或之后的新版操作系统。而太老的系统版本将无法使用到新显卡的许多功能,这一点请大家务必要注意。

其次与NVIDIA RTX30系列一样,Radeon RX6000系列这次也支持由GPU绕过CPU,直接读取硬盘游戏数据的DirecStorage API。很显然,这同样是源自AMD游戏机定制芯片部门的经验。而它也意味着,如果将来玩家想要在PC上享受到与微软XSX/XSS和索尼PS5一样的无加载画面游戏体验,那么搭配一块至少是中高端级别的PCIE 4.0 SSD,也是必不可少的操作。

最后,可能有些朋友已经注意到了,AMD Radeon RX6000系列这次还有一个“隐藏武器”,那就是只有搭配Ryzen锐龙5000系CPU时,才能激活的“AMD Smart Access Memory”技术。按照官方的说法,AMD Smart Access Memory允许CPU直接一次性读写显卡的全部16GB显存,而不是像现在的CPU那样,每次只能访问256MB的有限空间。这样一来,CPU与GPU之间的通信效率将会大为提高,同时显存里的碎片化现象也会得到有效缓解。

在搭配Ryzen 5000系CPU并启用新的驱动内超频功能之后,RDNA2的性能还可以再提升

最为重要的是,由于AMD Smart Access Memory技术并不严格依赖于游戏的后期优化(也就是说,只要你用的是锐龙5000系CPU和Radeon RX6000显卡,那么即使是在老游戏里该技术也能起作用),因此它将会对整套系统的游戏性能,带来自动而直接的提升效果。当然,反过来说,也就是如果你真想把新显卡的全部技术特性、所有性能潜力都发挥出来,配一台新电脑其实还是很有必要的。

#amd

qrcode
访问手机版