品玩8月27日讯,英伟达在今日举办的Hot Chips 2024 大会正式公布了Blackwell 的架构细节。据悉,英伟达 Blackwell 平台涵盖了从 CPU 和 GPU 计算到用于互连的不同类型的网络,并不是在谈论单个 GPU,而是在谈论 AI 的集群级别。
Blackwell GPU 是英伟达性能最高的一款,使用 NVIDIA 高带宽接口 (NV-HBI) 在两个 GPU 芯片之间提供 10TB/s 的带宽。GPU 通过 NVLink-C2C 互联技术和 Grace CPU 进行连接。
Blackwell 支持新的 FP4 和 FP6 精度,通过降低计算精度来提高性能。NVIDIA Quasar Quantization 用于找出可以使用较低精度的内容,从而减少计算和存储。英伟达表示,用于推理的 FP4 在某些情况下可以接近 BF16 性能。
据介绍,Blackwell 架构是通用计算全栈矩阵的终极解决方案,由多个英伟达芯片组成,包括 Blackwell GPU、Grace CPU、BlueField 数据处理单元、ConnectX 网络接口卡、NVLink 交换机、Spectrum 以太网交换机和 Quantum InfiniBand 交换机。

0 条评论
请「登录」后评论