近日,全球领先的半导体设计与软件平台公司 Arm 控股有限公司宣布,推出具有革新意义的Arm终端计算子系统(CSS),旨在提供卓越的人工智能(AI)体验,并帮助芯片合作伙伴更轻松、快速地构建基于 Arm 架构的解决方案,进一步加速产品上市进程。
Arm 终端事业部产品管理副总裁 James McNiven 提到,随着对高性能计算的需求不断增长,代工厂合作伙伴所推动的前沿技术,正在为更高性能和更高效率的设备解锁新的可能性。随着 AI 工作负载成为了新的加速器,技术生态系统正在快速发展,并且需要在边缘侧运行 AI。与此同时,计算需求要能够规模化地交付实现。对于推动行业前沿创新的合作伙伴来说,上市时间和工程效率至关重要。
“我们不断倾听合作伙伴的意见,持续将产品及解决方案迭代更新,善用最新的工艺节点,并提供可为实现设备端 AI 奠定基础的平台。”
Arm 终端 CSS 为系统级芯片(SoC)提供计算基础,包括 Armv9 CPU、Arm Immortalis GPU、最新的 CoreLink 系统互连和系统内存管理单元(SMMU),并优化到内存及 SoC 其他部分的计算路径。
“这是我们首次在终端领域以 Arm CPU 和 GPU 的优化设计形式提供物理实现解决方案。这些成果已准备好投入到我们合作伙伴的 SoC 设计中,充分发挥来自领先代工厂的三纳米工艺优势,从而加速达成高性能、高效率,以及加快上市进程。”McNiven称。
在硬件上,最新的Armv9 CPU —— Arm Cortex-X925, 是 Cortex-X 推出以来取得最高 IPC 同比增幅的 CPU,通过结合新设计所实现的微架构改进和频率提升,Cortex-X925 在 Geekbench 中实现了 36% 的单线程性能增长。以 AI 性能为例,与去年的 Cortex-X CPU 相比,词元 (Token) 首次响应时间提高了 41%,在这个例子中 LLM 的初始响应能力有了显著改善。
Immortalis GPU —— Arm Immortalis-G925作为Arm性能最强、效率最高的GPU,在各种图形应用上,Immortalis-G925 的性能同比提高了 37%;而在多个 AI/ML 网络上进行测量时,实现了约 34% 的性能提升。此外,还有光线追踪技术。
在 CSS 上的效率方面,仍能选择不同的 CPU 微架构来实现最大性能和最长使用天数,并通过 Immortalis 和 Arm Mali 提供 GPU 可扩展性,从而实现性能和效率上的灵活性。与 Cortex-A720 相比,Cortex-A725 的能效提高了 35%。该成果源于我们改进了微架构,并善用工艺和物理 IP 优化。
在软件层面,Arm同步推出了Kleidi软件,包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。这些工具旨在帮助软件开发者无缝获取Arm CPU上的最佳性能,并支持多种关键Arm架构功能,与主流AI框架如PyTorch和Tensorflow等实现高效集成。
“这将助力实现新一代领先的AI体验”,McNiven表示。Arm致力于提供完整的解决方案,以及实现更高的 Arm CPU 和 GPU 性能,并投资于未来数代的 Arm 终端 CSS。
他也提到,构建更好的解决方案离不开与领先代工厂合作伙伴的密切合作,并且要确保平台与前沿工艺节点紧密结合。期待在 Armv9 上看到更多新增的 AI 和安全功能,以确保Arm能够面向未来,紧跟整个生态系统的持续创新。Arm持续关注开发者,确保他们能够获得所需的性能、工具和软件库,以释放其创造力并打造下一波 AI 应用。




0 条评论
请「登录」后评论