芝能智芯出品
我们补充一下AMD发布的技术内容(AMD Radeon™ RX 9070系列显卡:游戏体验升级!),主要是底层RDNA 4架构的更多细节。
作为一款面向消费者市场的GPU架构,RDNA 4通过双SIMD32矢量单元、优化的光线追踪技术、更新的AI引擎以及FSR 4升级解决方案,在性能、能效和AI能力上实现了显著提升。
RDNA 4不仅将用于高端游戏GPU,还可能扩展至集成GPU(iGPU),其影响力不容小觑。
Part 1
RDNA 4的技术创新:
从计算引擎到光线追踪
的全面升级
● 计算引擎的革新:双SIMD32与矩阵运算优化
RDNA 4架构的核心在于其计算引擎的重大升级。AMD引入了双SIMD32矢量单元,这一设计显著增强了GPU的并行计算能力。
SIMD(单指令多数据)技术是GPU高效处理大量数据的基础,双SIMD32的加入意味着每个计算单元(CU)能够同时执行更多指令流。
这就像汽车引擎通过增加汽缸数量提升动力输出,在不显著增加硬件体积的情况下,实现了性能的飞跃。
与此同时,RDNA 4优化了矩阵运算能力。矩阵运算是AI和图形渲染中的关键操作,尤其是在需要处理复杂光影效果或深度学习模型时。
通过改进矩阵运算单元,RDNA 4不仅提升了AI任务的执行效率,还为游戏中的实时计算提供了更强的支持。这一改进类似于汽车中涡轮增压技术的应用,能够在有限资源下榨取更多性能。
● 光线追踪技术的突破:定向边界框与无序内存处理
光线追踪技术已成为现代游戏中实现逼真光影效果的核心。RDNA 4在这一领域取得了令人瞩目的进展,其中最引人注目的创新是引入了定向边界框(Oriented Bounding Box, OBB)。
与RDNA 3使用的轴对齐边界框(AABB)相比,OBB能够根据物体的旋转动态调整边界框形状,从而更精确地包围物体,减少不必要的计算开销。
这一技术好比为物体量身定制的“紧身衣”,相比宽松的“外套”,显著提高了光线求交计算的效率。
RDNA 4还推出了无序内存处理技术。在RDNA 3中,来自不同着色器的内存请求是按顺序处理的,这可能导致延迟并影响性能。而RDNA 4允许这些请求无序执行,类似于汽车导航系统根据实时路况动态调整路径,从而优化数据访问效率。
AMD宣称,这一改进使得RDNA 4的光线遍历性能提升了约两倍,为玩家带来更流畅、更逼真的视觉体验。
寄存器是GPU中存储临时数据的关键资源,直接影响计算效率。在RDNA 3中,AMD采用为最坏情况预留寄存器的策略,这种方法虽然稳定,但可能导致资源浪费。
RDNA 4引入了动态寄存器分配技术,允许着色器根据实际需求灵活分配寄存器。这一设计类似于汽车中的智能油耗管理系统,能够根据驾驶条件实时调整资源分配,从而提升整体效率,优化了性能,还为开发者提供了更大的创作空间。
除了计算和渲染能力的提升,RDNA 4还优化了媒体引擎,GPU不仅是游戏设备,还承担着视频编码、解码等多媒体任务。
RDNA 4的媒体引擎升级,能够更高效地处理这些任务,为用户提供无缝的多任务体验。这就像汽车中的多功能信息娱乐系统,既能导航,又能播放音乐,确保各种需求得到满足。
Part 2
AI与游戏性能的提升:
面向未来的竞争力
AI技术的快速发展对GPU的计算能力提出了更高要求。RDNA 4搭载了全新的AI引擎,AMD宣称其FP16(半精度浮点)性能相较前代提升了约两倍。
FP16格式在AI计算中广泛应用,因为它能在保证精度的同时减少内存和计算开销,意味着RDNA 4能够更快地处理AI任务,例如游戏中的智能NPC行为、环境模拟,甚至是更广泛的AI应用。
RDNA 4主要面向消费者市场,但其AI性能的提升无疑为AMD在专业领域的布局埋下伏笔。
◎ 对于玩家而言,这意味着更沉浸的游戏体验;
◎ 对于行业而言,则预示着GPU在AI应用中的潜力。
AMD的FidelityFX Super Resolution(FSR)技术一直是其游戏性能优化的杀手锏。RDNA 4引入了FSR 4,通过智能算法将低分辨率图像升级至高分辨率,从而在不牺牲过多画质的前提下提升帧率。这一技术好比汽车中的“加速器”,能够在不增加引擎负荷的情况下提升速度。
在4K分辨率下,FSR 4显著提高了游戏流畅度,尤其是在高端游戏GPU中,玩家能够在极致画质和高帧率之间找到平衡。
对于集成GPU(iGPU)而言,FSR 4的意义更为深远。在资源有限的轻薄笔记本或移动设备中,FSR 4能够提供接近独立GPU的游戏体验。这就像汽车制造商通过轻量化设计和高效引擎,让紧凑型车型也能拥有媲美高性能车的动力表现。
RDNA 4的发布不仅是技术上的突破,也是AMD在GPU市场中的一次战略布局。
英伟达凭借其高端游戏GPU和数据中心GPU业务占据市场主导地位。然而,RDNA 4在光线追踪、AI性能和能效方面的提升,使AMD在中高端消费者市场中更具竞争力。
英伟达在数据中心GPU领域的成功使其消费者业务相对较小,这为AMD提供了切入市场的机会。
通过提供高性价比的RDNA 4产品,AMD有望吸引更多游戏玩家和内容创作者,AI引擎的优化也表明AMD有意在AI领域挑战英伟达的CUDA和Tensor Core技术。
小结
AMD RDNA 4架构的发布标志着GPU技术的一次代际飞跃。从双SIMD32矢量单元到定向边界框,再到AI引擎和FSR 4技术的引入,RDNA 4在性能、能效和多功能性上均取得了显著进步。
原文标题 : AMD RDNA 4架构深度分析:技术突破在哪里?