随着Agent应用的爆发式增长,人工智能也从以GPU算力为中心的云端AI应用时代正式迈进了CPU+GPU协同工作的本地AI Agent时代,这对个人用户的本地AI设备提出了新的要求。就在日前,AMD正式发布了锐龙AI Halo开发者平台和锐龙 AI Max PRO 400 系列处理器,充分满足开发者与企业搭建的本地AI智能体对大内存、低延迟的严苛需求。目前锐龙AI Halo开发者平台已通过AMD系统认证,为新一代智能体主机提供核心动力,而锐龙AI Max PRO 400系列处理器则将同款能力落地至面向企业部署的商用AI PC及OEM整机设备。
锐龙AI Halo是AMD首款紧凑型AI开发者平台,旨在为AI开发者打造本地开发环境,帮助搭建、测试并运行智能体与生成式 AI 应用,从而减少对云端环境的依赖。该开发者平台搭载锐龙AI Max+ 395处理器(16核32线程,内置拥有40 CU的Radeon 8060S主流独显级GPU和50 TOPS算力的NPU),最高配备128GB统一内存。它支持本地运行最高2000亿参数的大模型,让开发者不必依托云端基础设施,即可调试使用高性能大参数模型。其他规格方面,它还搭载了2TB PCIe 4.0×4 SSD、Wi-Fi 7无线网卡、万兆有线网卡,机身体积仅有5.9英寸×5.9英寸×1.7英寸,性能释放高达120W,可谓集高性能与极致便携性于一身。
此外,这款一体化设备具备诸多实用优势,开发者可依托它完成从Linux环境原型搭建、模型微调,直至Windows系统正式部署的全流程工作。锐龙AI Halo开发者平台兼容开发者常用主流框架与工具,包括 PyTorch、vLLM、llama.cpp、Ollama、ComfyUI 及 LM Studio,同时针对AMD ROCm软件完成深度优化,可助力在单设备上本地流畅运行大语言模型、扩散模型与各类智能体工作流。
AMD还将锐龙AI Halo开发者平台与NVIDIA DGX Spark进行了对比。相比NVIDIA DGX Spark,锐龙AI Halo开发者平台加载运行120B的GPT OSS模型时最多可领先7%,加载运行122B的Qwen 3.5模型时最多可领先12%、加载运行35B的Qwen 3.6模型时最多可领先4%、加载30B的GLM 4.7 Flash模型时最多可领先14%。此外,锐龙AI Halo开发者平台同时支持Windows和Linux,而NVIDIA DGX Spark只支持Linux;锐龙AI Halo开发者平台还提供了NPU,而NVIDIA DGX Spark不具备NPU。
如果和搭载M4 Pro处理器的苹果Mac mini相比,锐龙AI Halo开发者平台拥有更广泛的大模型支持度和兼容性,提供平均4倍的生成式AI性能。从规格来看,锐龙AI Halo开发者平台拥有最高128GB统一内存(可以加载运行200B模型),远高于Mac mini支持的最高64GB内存(不能加载运行100B以上模型)。
由于模型加载运行都在本地进行,因此使用锐龙AI Halo开发者平台可以节约大量的Token费用。假设按使用Claude Sonnet 4.5 API计算,输出Token价格为15美元/百万个,输入Token价格为3美元/百万个,那么改用锐龙AI Halo开发者平台一个月可以最高节约750美元的Token费用。而电费仅仅是一个月16.2美元。
由此可见,对于需要搭建本地智能体主机的用户来讲,锐龙AI Halo开发者平台确实是当下性能、能效、模型、成本与系统支持度表现最为突出的解决方案,为覆盖更多 AI开发者,搭载锐龙 AI Max+ 395的锐龙AI Halo将由Micro Center独家发售,2026年6月启动预售。
还有更猛的!锐龙AI Max PRO 400系列也来了
另外,在2026年第三季度,AMD将进一步升级锐龙AI Halo开发者平台,新平台将搭载全新的锐龙AI Max PRO 400系列处理器,时钟频率进一步提升,最高配备192GB统一内存与 160GB显存。OEM厂商也将推出搭载锐龙AI Max PRO 400系列处理器的新锐龙AI Halo开发者平台。
锐龙AI Max PRO 400系列处理器基于Zen5架构打造,专为深耕仿真模拟、内容创作及海量数据处理领域的AI开发者、工程师与创意从业者量身设计。除了用在新版锐龙AI Halo开发者平台上之外,整机厂商也可用它推出便携款及紧凑型工作站级设备,将人工智能、视觉可视化与高性能算力融于统一架构,从而简化设备部署流程,优化专业工作流程。
目前公布的锐龙AI Max PRO 400系列处理器有三款,其中锐龙AI Max+ PRO 495定位最高,拥有16核32线程,最高加速频率5.2GHz,内置拥有40CU的Radeon 8065S GPU;锐龙AI Max PRO 490拥有12核24线程,最高加速频率5.0GHz,搭载32CU的Radeon 8050S GPU;锐龙AI Max PRO 485拥有8核16线程,最高加速频率5.0GHz,也搭载32CU的Radeon 8050S GPU。三款处理器都支持192GB统一内存,从中分配160GB作为专用显存,且都支持AMD PRO技术。
从官方信息来看,锐龙AI Max PRO 400系列处理器将于2026年第三季度由惠普、联想等厂商在其系统中采用。
总结:解决方案全面覆盖应用痛点,AI智能体时代AMD继续保持领先地位
从本地AI Agent时代的核心需求出发,AMD凭借锐龙AI Halo开发者平台与锐龙AI Max PRO 400系列处理器,构建起本地AI开发+商用部署的完整解决方案,精准解决开发者与企业在大模型运行、算力供给、系统兼容、成本控制等层面的核心痛点。
锐龙AI Halo开发者平台以极致便携+超强算力打破本地AI开发壁垒,128GB统一内存轻松实现200B大模型本地流畅运行,对比同类型竞品在模型性能、兼容性、成本节约上优势显著,让开发者彻底摆脱云端依赖,更好把控数据隐私,一站式完成从原型搭建到部署落地的全流程开发。
而锐龙AI Max PRO 400系列处理器则以更高频率与更大内存/显存配置,将本地 AI能力延伸至商用AI智能体PC、工作站等多元设备,覆盖仿真模拟、内容创作、数据处理等专业场景,为企业级部署提供高性能、易落地的算力支撑。
在面向AI智能体全面爆发的新时代,AMD以硬件创新+软件优化双轮驱动,持续深耕本地AI 赛道,既为开发者提供轻量化、高效率的开发工具,也为企业打造规模化商用方案,进一步巩固其在CPU+GPU+NPU一体化本地AI领域的领先优势,引领本地智能体主机时代的技术变革与产业落地。
评论区
共 条评论热门最新