深入解析AMD Radeon RX6000：性能翻倍的秘密

2020-10-29新闻7

说到AMD的RDNA2架构，可能算得上是近年来“保密工作”做得最差的一次GPU设计了。先是早在一年多前初代RDNA架构发布时，官方就主动公布了下代产品的架构名称。此后随着XSX/XSS与PS5次时代游戏主机，由于使用了RDNA2的GPU设计，也让新架构的大部分软件特性被外界所知。并且不仅如此，就在距离新卡正式上市还有一个多月的前段时间，AMD方面甚至干脆把新品的外观图也给公布了出来。

那么这是否意味着，AMD在今天凌晨举办的的Radeon RX6000发布会，就没有什么“干货”可以继续挖掘了呢？当然不至于。下面我们三易生活就来带大家看看，隐藏在此次Radeon RX6000系列背后，那些技术与市场层面上的有趣事实。

性能翻倍的背后，这次的命名似乎有点令人迷惑

AMD昨晚发布了Radeon RX6000系列的哪些产品？相信稍有关注科技新闻的朋友都已经知道了。他们一口气推出了三款新显卡，也就是Radeon RX6900XT、Radeon RX6800XT和Radeon RX6800。

根据官方的说法，Radeon RX6900XT的32位浮点数性能达到20.6TFlops，这是前代RDNA架构旗舰产品Radeon RX5700XT的两倍还多。请注意这不是对位的比较，因此它并不意味着RDNA 2的能效比有两倍的增长。但考虑到Radeon RX6900XT所基于的Navi 21（也叫Big Navi）核心，是AMD时隔数代后久违的全新大尺寸核心，所以能够实现旗舰性能翻番，同时价格还明显低于竞争对手（Radeon RX6900XT官方售价7999元，对标的Geforce RTX3090官方售价是11999元），AMD的诚意显然还是很够的。

但如果大家有仔细研究这次Radeon RX6000系列已发布型号的具体规格，就会发现一点更不寻常的现象。也就是此次的Radeon RX6000系列显卡在性能规格与命名上，似乎出现了那么一点点偏差。

具体来说，此次的旗舰当然是拥有80组CU（5120流处理器）、80个光追单元、128ROP（光栅单元），以及16GB显存的Radeon RX6900XT。但与它相比，“次旗舰”Radeon RX6800XT的流处理器与光追单元其实只少了10%（从80组减少到72组），光栅单元甚至完全没有减少；并且与此同时，更次一级的Radeon RX6800在流处理器、光追单元，以及光栅单元的数量上却大幅减少了25%。

这意味着什么呢？简单来说，就是Radeon RX6900XT与Radeon RX6800XT之间的性能差异并不大，甚至可能在相同分辨率、相同画质水准的游戏里，都不会有决定性的流畅度差异，但Radeon RX6800和Radeon RX6800XT的差距就要大得多了。

正因如此，实际上在我们三易生活来看，此次的Radeon RX6800XT或许被叫做Radeon RX6900反而更合适一些。而规格与旗舰差异甚大的Radeon RX6800，可能才是真正的“Radeon RX6800XT”。那么为什么AMD不这样做呢？或许定价策略才是唯一的理由吧。

制程未升级，翻倍的性能秘密在于内存子系统？

说完了基本的产品规格与命名问题，我们是时候来看看AMD这次在新显卡架构上的一些“魔法”了。

首先大家要明确的是，此次AMD Radeon RX6000系列使用的依然是与上代相同的台积电7nm制程。因此这意味着新品的性能提升和制程完全没有关系，纯粹是来自于更大的芯片、更多的流处理器、更高的运行频率，以及更新的架构设计。

很显然，在制程不改变的前提下，增加芯片规格，提高运行频率，这注定会带来更高的功耗压力。要解决功耗问题，在架构上进行改进也就成为了唯一的出路，而这一点实际上也正是RDNA2最大的奥秘所在。

对此AMD做了哪些工作呢？首先按照官方说法，此次新GPU其实是AMD旗下的CPU、GPU和定制SoC（就是专为游戏主机研发芯片的那一群人）部门协同研发的成果。这种协同研发的方式，也使得RDNA2架构融入了许多来自Ryzen锐龙CPU，以及游戏主机芯片的经验。

比如说为了让CU（计算单元）更省电，AMD给RDNA2的CU内部设计了更多的细粒度时钟门，从而能够让GPU的频率调节更加精准，也降低了频率调节的漏电率。

又比如说，AMD经过研究发现，对于如今的显卡来说，移动数据（比如把数据从显存读入到核心里）而不是处理数据的开销，正逐渐在显卡的总功耗里占据越来越高的份额。为此RDNA2架构的设计团队一方面重新设计了GPU核心内部的数据移动路径，减少了内部数据交换的能耗需求；另一方面他们也吸收了游戏主机处理器的成功经验，给RDNA2引入了全新的128MB “Infinity Cache”缓存，将其与256bit显存共同构成了这代显卡的内存子系统。

Infinity Cache可以起到什么作用？简单来说，以往GPU里虽然也有缓存（Cache）这个概念。但是它们普遍容量非常之小（比如只有几百KB或者几MB），存储不了太多的图像数据，因此当显卡处理和渲染游戏画面时，就需要频繁地到显存、内存，甚至是硬盘中去读取数据。这不仅增大了处理的延迟，提高了功耗，更糟糕的是对于那些面向4K、HDR、高帧率游戏需求的顶级显卡来说，它们就不得不配备384bit、512bit甚至是更大的显存位宽。很显然这会造成显卡的设计被复杂化，同时产品成本（售价）也大为上涨。

反之，通过给显卡加入128MB的大容量Cache，RDNA2就可以在日常工作过程中大幅降低读取显存的频率，同时降低对于显存物理带宽的需求。而这也正是它能够做到有效降低功耗，同时价格也颇有优势的秘密所在。

什么样的电脑才能用好RDNA2？这次的要求可能不低

最后，让我们来谈谈AMD Radeon RX6000系列这次的系统需求。

首先根据官方说法，Radeon RX6000系列是一款专为DX12 Ultimate API设计的GPU，这意味着它仅能支持Windows 10 2020年4月版或之后的新版操作系统。而太老的系统版本将无法使用到新显卡的许多功能，这一点请大家务必要注意。

其次与NVIDIA RTX30系列一样，Radeon RX6000系列这次也支持由GPU绕过CPU，直接读取硬盘游戏数据的DirecStorage API。很显然，这同样是源自AMD游戏机定制芯片部门的经验。而它也意味着，如果将来玩家想要在PC上享受到与微软XSX/XSS和索尼PS5一样的无加载画面游戏体验，那么搭配一块至少是中高端级别的PCIE 4.0 SSD，也是必不可少的操作。

最后，可能有些朋友已经注意到了，AMD Radeon RX6000系列这次还有一个“隐藏武器”，那就是只有搭配Ryzen锐龙5000系CPU时，才能激活的“AMD Smart Access Memory”技术。按照官方的说法，AMD Smart Access Memory允许CPU直接一次性读写显卡的全部16GB显存，而不是像现在的CPU那样，每次只能访问256MB的有限空间。这样一来，CPU与GPU之间的通信效率将会大为提高，同时显存里的碎片化现象也会得到有效缓解。

在搭配Ryzen 5000系CPU并启用新的驱动内超频功能之后，RDNA2的性能还可以再提升

最为重要的是，由于AMD Smart Access Memory技术并不严格依赖于游戏的后期优化（也就是说，只要你用的是锐龙5000系CPU和Radeon RX6000显卡，那么即使是在老游戏里该技术也能起作用），因此它将会对整套系统的游戏性能，带来自动而直接的提升效果。当然，反过来说，也就是如果你真想把新显卡的全部技术特性、所有性能潜力都发挥出来，配一台新电脑其实还是很有必要的。

#amd

阅读全文

深入解析AMD Radeon RX6000：性能翻倍的秘密

随机阅读