在美国加州圣何塞当地时间6月11日的报道中,我们已经介绍过AMD最新的INSTINCT MI350系列GPU和对应的AI RACK解决方案,同时也简单提到了2026年和2027年即将登场的两套AI RACK方案,分别使用了当年对应的新款EPYC处理器以及MI400和MI500 GPU。而在6月12日,AMD 董事会主席兼首席执行官Lisa Su 博士在ADVANCING AI 2025大会的KEYNOTE演讲中进一步透露了下一代EPYC处理器“Venice”、MI400 GPU和代号“Vulcano”的Pensando超级网卡的细节。
首先是代号Venice的第六代EPYC,它采用Zen6架构,使用2nm制程,最高可拥有256核心,CPU与GPU之间的连接带宽提升一倍,同时性能相对上代可提升70%,内存带宽也达到了1.6TB/s,2026年内登场。虽然信息还不够多,但由此可以推断,明年Zen6架构的消费级产品也会出现,性能提升幅度也会非常可观。明年代号Helios的新一代AI Rack方案就会配备Venice处理器,提供更加强大的AI性能和扩展性。
MI400 GPU昨天的文章里我们已经介绍过了,它在MI350系列的基础上进一步大幅提升性能,FP4/FP8性能高达40PF/20PF,搭载HBM4显存,最高可达432GB,显存带宽可达19.6TB/s,扩展带宽也几乎翻倍,达到了300GB/s。
同时,AMD还明确表示,搭载MI400的AI Rack方案相对MI355X最高可带来10倍的性能提升,这可以说是相当炸裂的升级幅度了。
接下来是AI Rack方案里必不可少的“超级网卡”,目前MI350系列的AI Rack方案里搭载的是刚发布的POLLARA 400,数据带宽可达400Gbps,也就是40万兆网卡。而明年推出的Vulcano,制程升级到3nm,将会把数据带宽升级到800Gbps,变成80万兆网卡,让GPU的Scale Out带宽最多升级到原先的8倍,这也是为什么下一代Helios AI Rack整体性能可以提升那么多的重要原因之一。
至于2027年即将登场的搭载“VERANO”处理器与MI500 GPU的AI Rack,目前代号还没有确定,AMD也没有更多的技术参数透露,唯一可确定的是它也会使用800Gbps带宽的Vulcano超级网卡。
简单总结一下ADVANCING AI 2025发布的重点产品与项目上线时间。MI350目前正在加紧生产,对应的最终产品今年第三季度上市;ROCm 7则将在8月上线;AMD Developer Cloud服务目前已经上线,大家都可以去申请,前1500名申请者可以获得10天内25小时的试用权限,之后收费标准为每GPU每小时1.99美元,目前可选MI300X GPU方案(单GPU或8 GPU)。这个收费标准还是比较实惠的,对于研究与学习AI的开发者来说非常实用。
接下来让我们一起逛逛ADVANCING AI 2025大会DEMO展示区吧。
DEMO区最抢眼的当然就是MI350 GPU和对应的OAM模块、UBB8模块实物了。可以看到,MI350 GPU中间是巨大的XCD与IOD堆叠的Die,周围是8颗HBM3E显存,整颗芯片硕大无比。而OAM模块则加上了OAM基板和周边电气元件,以便与UBB基板连接。
而完整的UBB8模块则可以看到基板上搭载了8颗MI350系列GPU。从官方白皮书我们可以知道,1000W TBP的MI350X提供风冷版UBB模块,而1400W的MI355X则只有液冷UBB模块,但液冷版更薄,因此可以做到单个Rack里放入更多的UBB模块。
现场我们也见到了POLLARA 400超级网卡的实物,看起来非常小巧,但却拥有400Gbps高带宽。由于性能强悍,所以我们也可以看到它配备了硕大的散热器。
本次大会DEMO区展出最多的就是基于MI350系列GPU的AI 解决方案了。这台Supermicro GPU A+服务器就配备了双EPYC 9005/9004处理器,8个MI350X GPU,支持最多6TB DDR5内存。
来自技嘉的G4L3-ZX1-LAX2,是使用MI355X GPU的液冷版AI服务器。它可以最多支持12块Pollara 400超级网卡。
来自MiTAC的MI355X Rack水冷解决方案。可以看到Rack里安装了多个不同的UBB模块。
来自和硕的方案,可以看到里面除了MI355X AI GPU服务器模块之外,还有存储模块、AI加速服务器模块等等。
来自华擎的4U/8U方案,都是配备MI355X GPU的型号。
来自Cisco的方案,配备MI350 GPU和MI210 GPU。
然后是一些AI应用方面的展示DEMO,在之前ADVANCING AI 2024上也见过,只不过现在都迭代到了新的版本,效率更高、功能更加强大。
KeyShot目前的AI功能相当强大,它支持AI分析3D模型推荐合适的材质;使用AI自动调整照明设置;智能设置相机位置、景深和场景布局;自动场景匹配和AI降噪。
微软Copilot的Click to do可以通过AI将操作与屏幕内容联系起来,它现在已经可以完美支持Ryzen AI NPU了,例如AMD Ryzen AI 300系列移动处理器,就能很好地发挥它的功能。
大名鼎鼎的AMUSE目前也可以通过Ryzen AI NPU实现SD3的AI出图了。
DaVinci Resolve的AI功能基于DirectML API,可以在AMD平台上充分发挥性能。
搭载Radeon AI PRO R9700和线程撕裂者处理器的平台现场展示通过ROCm in Windows和Comfy UI实现AI出图。实际上,目前的RX 9000消费级显卡也可以支持ROCm in Windows了,对于普通用户来说也不失为一个高性价比的AI方案。
诸如GAIA、Blender、Belt、STYRK AI等工具目前也能支持Ryzen AI的NPU和iGPU,对于移动用户来说,锐龙AI本的实用性也越来越高。
AMUSE通过AMD GPU实现对实时采集的视频添加AI滤镜,生成不同风格的视频画面。
OK,其实DEMO区展示的内容还不止这些,可以看到每一年的ADVANCING AI大会都会给我们带来新的惊喜。例如在去年的ADVANCING AI大会上,一些AI应用还并不能完全利用Ryzen AI NPU,而本次大会展示的新版本就已经对Ryzen AI NPU提供了完美支持。考虑到AMD对开发者的支持力度越来越大,不但有各种竞赛和激励制度,还上线了提供强大GPU服务器的开发者云平台,我们有理由相信未来基于AMD平台的AI应用会越来越出色、越来越好用,同时,这也会让AMD在AI领域获得更多的支持与份额。
评论区
共 条评论热门最新