品玩

科技创新者的每日必读

打开APP
关闭

Arm宣布推出终端计算子系统CSS,提供卓越的AI体验

2024年6月14日

近日,全球领先的半导体设计与软件平台公司 Arm 控股有限公司宣布,推出具有革新意义的Arm终端计算子系统(CSS),旨在提供卓越的人工智能(AI)体验,并帮助芯片合作伙伴更轻松、快速地构建基于 Arm 架构的解决方案,进一步加速产品上市进程。

Arm 终端事业部产品管理副总裁 James McNiven 提到,随着对高性能计算的需求不断增长,代工厂合作伙伴所推动的前沿技术,正在为更高性能和更高效率的设备解锁新的可能性。随着 AI 工作负载成为了新的加速器,技术生态系统正在快速发展,并且需要在边缘侧运行 AI。与此同时,计算需求要能够规模化地交付实现。对于推动行业前沿创新的合作伙伴来说,上市时间和工程效率至关重要。

“我们不断倾听合作伙伴的意见,持续将产品及解决方案迭代更新,善用最新的工艺节点,并提供可为实现设备端 AI 奠定基础的平台。”

Arm 终端 CSS 为系统级芯片(SoC)提供计算基础,包括 Armv9 CPU、Arm Immortalis GPU、最新的 CoreLink 系统互连和系统内存管理单元(SMMU),并优化到内存及 SoC 其他部分的计算路径。

“这是我们首次在终端领域以 Arm CPU 和 GPU 的优化设计形式提供物理实现解决方案。这些成果已准备好投入到我们合作伙伴的 SoC 设计中,充分发挥来自领先代工厂的三纳米工艺优势,从而加速达成高性能、高效率,以及加快上市进程。”McNiven称。

在硬件上,最新的Armv9 CPU —— Arm Cortex-X925, 是 Cortex-X 推出以来取得最高 IPC 同比增幅的 CPU,通过结合新设计所实现的微架构改进和频率提升,Cortex-X925 在 Geekbench 中实现了 36% 的单线程性能增长。以 AI 性能为例,与去年的 Cortex-X CPU 相比,词元 (Token) 首次响应时间提高了 41%,在这个例子中 LLM 的初始响应能力有了显著改善。

Immortalis GPU —— Arm Immortalis-G925作为Arm性能最强、效率最高的GPU,在各种图形应用上,Immortalis-G925 的性能同比提高了 37%;而在多个 AI/ML 网络上进行测量时,实现了约 34% 的性能提升。此外,还有光线追踪技术。

在 CSS 上的效率方面,仍能选择不同的 CPU 微架构来实现最大性能和最长使用天数,并通过 Immortalis 和 Arm Mali 提供 GPU 可扩展性,从而实现性能和效率上的灵活性。与 Cortex-A720 相比,Cortex-A725 的能效提高了 35%。该成果源于我们改进了微架构,并善用工艺和物理 IP 优化。

在软件层面,Arm同步推出了Kleidi软件,包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。这些工具旨在帮助软件开发者无缝获取Arm CPU上的最佳性能,并支持多种关键Arm架构功能,与主流AI框架如PyTorch和Tensorflow等实现高效集成。

“这将助力实现新一代领先的AI体验”,McNiven表示。Arm致力于提供完整的解决方案,以及实现更高的 Arm CPU 和 GPU 性能,并投资于未来数代的 Arm 终端 CSS。

他也提到,构建更好的解决方案离不开与领先代工厂合作伙伴的密切合作,并且要确保平台与前沿工艺节点紧密结合。期待在 Armv9 上看到更多新增的 AI 和安全功能,以确保Arm能够面向未来,紧跟整个生态系统的持续创新。Arm持续关注开发者,确保他们能够获得所需的性能、工具和软件库,以释放其创造力并打造下一波 AI 应用。 

取消 发布

下载品玩App,比99.9%的人更先知道关于「ARM」的新故事

下载品玩App

比99.9%的人更先知道关于「ARM」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测