AMD在COMPUTEX 2025上正式宣布了Zen5架构的AMD锐龙Threadripper PRO 9000WX/9000系列处理器和RDNA 4架构的Radeon AI PRO R9700专业显卡。而在当地时间6月10日,AMD在美国加州圣何塞又举办了一场深入的Workshop技术沟通会,分享了更多相关的技术细节与性能数据。
Zen5架构加持,新一代线程撕裂者再创性能巅峰
在工作站领域,AMD可以说做到了全面覆盖,提供了全平台的解决方案支持。包括搭载锐龙AI MAX PRO/AI PRO系列处理器的工作站笔记本、搭载锐龙线程撕裂者PRO的桌面工作站与搭载Radeon AI PRO系列显卡的工作站。
Threadripper(线程撕裂者)系列可以说是AMD历代处理器产品中的传奇,从初代的Ryzen Threadripper 1950X到上代Ryzen Threadripper PRO 7995WX,核心数量增长了5倍;内存带宽增长了3倍;PCIe带宽也提升了3倍。
AMD放出了Ryzen Threadripper PRO 9995WX与上代Ryzen Threadripper PRO 7995WX的性能对比数据。从图中可以看到,在多媒体和娱乐方面,PRO 9995WX领先PRO 7995WX的幅度大约在17%~26%;在设计与制造方面,领先幅度也是17%~26%;在建筑工程与施工方面,领先幅度为13%~15%;在软件和科学计算方面,大约领先22%~23%。
如果拿Ryzen Threadripper PRO 9995WX和竞品的Xeon W9-3595X对比的话,纯CPU建模速度大约快70%、渲染速度大约快119%;如果搭载GPU进行对比,建模速度和渲染速度也分别快出56%和22%。因此,AMD也宣称Ryzen Threadripper PRO 9000是最好的设计与制造处理器。
在多媒体和娱乐方面,Ryzen Threadripper PRO 9995WX和竞品的Xeon W9-3595X对比,纯CPU渲染速度大约快118%~145%;如果搭载GPU进行对比,渲染速度快出78%~83%。毫无悬念,Ryzen Threadripper PRO 9000也是最好的多媒体与娱乐内容创作的高效利器。
在建筑工程和施工方面,Ryzen Threadripper PRO 9995WX和竞品的Xeon W9-3595X对比,纯CPU建模速度最高提升40%、渲染速度大约快118%;如果搭载GPU进行对比,创作速度快出40%、剪辑速度快出34%。因此,在这个领域Ryzen Threadripper PRO 9000也是最强大的存在。
在软件和科学计算方面,Ryzen Threadripper PRO 9995WX和竞品的Xeon W9-3595X对比,纯CPU编译,在Chromium中领先52%、UE5.5中领先73%;MATLAB中领先75%。对于这方面的用户来讲,Ryzen Threadripper PRO 9000同样是最高效的选择。
在AI方面,Ryzen Threadripper PRO 9995WX和竞品的Xeon W9-3595X对比,在DeepSeek R1 32B LLM中Toks/s领先49%,在ComfyUI中文生图领先34%、Pugetbench Davinci Resolve Studio AI Extend Tests中领先28%,更多的核心/线程数量和更高的内存带宽功不可没。
具体产品规格部分,我们之前也介绍过。本次首发的锐龙Threadripper新品分为PRO 9000WX系列和9000系列,其中锐龙Threadripper PRO 9000WX系列针对专业高性能工作站,最高规格方面相对9000系列更高,一共拥有6款型号。
顶级旗舰AMD锐龙Threadripper Pro 9995WX拥有96核192线程,基础频率2.5 GHz,最高加速频率5.4 GHz,384MB三级缓存。
AMD锐龙Threadripper Pro 9985WX拥有64核128线程,基础频率3.2 GHz,最高加速频率5.4 GHz,256MB三级缓存。
AMD锐龙Threadripper Pro 9975WX拥有32核64线程,基础频率4.0 GHz,最高加速频率5.4 GHz,128MB三级缓存。
AMD锐龙Threadripper Pro 9965WX拥有24核48线程,基础频率4.2 GHz,最高加速频率5.4 GHz,128MB三级缓存。
AMD锐龙Threadripper Pro 9955WX拥有16核32线程,基础频率4.5 GHz,最高加速频率5.4 GHz,64MB三级缓存。
AMD锐龙Threadripper Pro 9945WX拥有12核24线程,基础频率4.7 GHz,最高加速频率5.4 GHz,64MB三级缓存。
所有型号的TDP都是350W,与上代保持了一致,但细心的朋友可能已经发现了,和上代核心越多加速频率越低不一样的是锐龙Threadripper Pro 9000WX系列的最高加速频率都是5.4 GHz,可见4nm Zen5架构在体质和电气性能方面确实更为强悍。
接口方面,锐龙Threadripper Pro 9000WX依然使用了sTR5,因此可以兼容WRX90和TRX50主板,上代线程撕裂者用户可以无缝升级。值得注意的是,WRX90只支持PRO 9000WX系列,而TRX50可以同时支持PRO 9000WX和HEDT的9000X系列。当然,如果把锐龙Threadripper Pro 9000WX装到TRX50主板上,那么它也只能支持4通道DDR5 6400和80条PCIe 5.0通道。
锐龙Threadripper 9000系列目前包含3款产品,分别是64核128线程的AMD锐龙Threadripper 9980X、32核64线程的AMD锐龙Threadripper 9970X与24核48线程的AMD锐龙Threadripper 9960X。这3款型号与核心数量相同的AMD锐龙Threadripper Pro 9000WX系列拥有同样的频率、缓存、PCIe版本、TDP设定与主板接口标准,只是精简了针对企业用户的AMD PRO安全技术。此外,由于只能搭配TRX50主板使用,它们也只能最多支持到4通道DDR5内存。
Radeon AI PRO R9700显存量大管饱,跑超大模型更给力
目前AMD针对不同规模的AI应用都有对应的AI生态解决方案。对于个人用户和中小型LLM,可以使用搭载统一内存的Ryzen AI MAX平台;针对多GPU边缘计算用户和中小型LLM,可以使用搭载超大显存的Radeon AI PRO平台;而对于机架扩展级别、需要训练超大LLM模型的用户,则可以选择AMD Instinct解决方案。
所以这次Radeon AI PRO R9700显卡就配备了更加高效的RDNA 4架构。主要带来了几大改进:优化的单片设计,使用4nm工艺、支持PCIe 5.0接口;改进了命令处理器,增强了包加速器;搭载高速GDDR6显存,最高提供256bit/20Gbps/32GB的规格,并增强了内存压缩;优化了缓存系统,内置64MB第三代无限缓存,配备8MB L2缓存,拥有2MB CU缓存;配备第二代AI加速器,提升了Tensor频率,支持新的FP8数据类型和结构化稀疏。
具体显卡部分,Radeon AI PRO R9700拥有128个AI加速器,搭载256bit/20Gbps/32GB GDDR6显存,最高FP16稠算力可达191 TFLOPS、INT4稀疏算力可达1531 TOPS。整板功率为300W。
综合来看,Radeon AI PRO R9700算力最高可达上代Radeon PRO W7800的4倍,从图中可以看到,对比每时钟/每CU的算力,Radeon AI PRO R9700在FP16/BF16方面领先一倍;在INT8方面领先三倍;在INT4方面也领先三倍,并且新增了对FP8以及结构化稀疏的支持。
我们知道,现在流行的AI大模型由于参数的增加,对显存的需求越来越大, 譬如 DeepSeek R1 Distill Qwen 32B Q6,就需要高达28GB显存。这就意味着显存低于32GB的显卡在运行它时就会爆显存。而具备32GB显存的Radeon AI PRO R9700自然就毫无压力了。
在单GPU配置下比较稀疏化AI性能,Radeon AI PRO R9700在DeepSeek R1 Distill Qwen的1.5B、7B、14B和Llama 8B模型中分别领先Radeon PRO W7800大约34%、74%、63%和105%,升级幅度巨大。
Radeon AI PRO R9700还支持4卡并联,最高支持180个并发实例。从图中可以看到,在使用DeepSeeK R1 Distill Qwen 32B模型/180个并发实例时,4块Radeon AI PRO R9700的Tokens/s可达1780,性能是非常抢眼的。
AMD的合作伙伴已经推出了搭载锐龙Threadripper PRO 9000WX和Radeon AI PRO R9700的工作站和服务器产品。例如Supermicro的WS 2115HV-TNRT,就搭载了单颗锐龙Threadripper PRO 9000WX处理器、8通道DDR5 ECC RDIMM内存和最多4块Radeon AI PRO R9700。特别值得一提的是,这款2U机型还支持内存超频。
从Supermicro展示的数据来看,这颗64核128线程的锐龙Threadripper PRO 9000WX工程版在搭载4通道DDR5的情况下,已经将内存超频到了7200MT/s。可见锐龙Threadripper PRO 9000WX这一代的SoC确实相当给力。
总结:AMD在AI和高性能计算方面继续创造巅峰
最后简单总结一下AMD本次Workshop技术沟通会的内容重点。首先是AMD锐龙Threadripper PRO 9000WX/9000系列将架构升级到了Zen5,IPC和能效方面都得到了大幅提升,同时还加强了SoC,支持最多8通道DDR5 6400内存,因此在各种专业应用领域都继续保持了绝对领先的地位;然后是Radeon AI PRO R9700专业显卡,它采用全面增强的RDNA 4架构,拥有32GB大显存和支持多卡并联,用它和AMD锐龙Threadripper PRO 9000WX/9000系列搭配打造的工作站/服务器,能够更好地面对更多参数的AI大模型、提供更高的推理准确度,为用户提供了强大而高效的AI硬件平台解决方案,对于高端内容创建者来说堪称无论如何都必须拥有的高效装备。搭载AMD锐龙Threadripper PRO 9000WX/9000系列和Radeon AI PRO R9700专业显卡的具体产品将在接下来的时间陆续上市,有需求的专业用户一定不要错过。
评论区
共 条评论热门最新