Nvidia 的超强 GPU 再度发功!
Nvidia 宣布马斯克的超级计算机 Colossus 运用 Nvidia Spectrum-X Networking Platform 已超越人类的极限登顶。Colossus 使用 Nvidia Hopper GPU,将 Nvidia BlueField-3® SuperNIC 与 Spectrum-X 的SN5600 以太网络交换器配对,达到了前所未有的性能,仅花 122 天交货给马斯克。
据称 Colossus 为世上最大的 AI 超级计算机,用于训练 xAI 的 Grok 系列大型语言模型,并将为 X Premium 订阅户提供聊天机器人功能。xAI 正在将 Colossus 的规模扩大一倍,总计 200,000 个 Nvidia Hopper GPU。
建构 Colossus 这类超级计算机系统的时间通常来说需要数月到数年,Nvidia 仅用了122天就达标。标准的以太网络无法达到 Nvidia 的运算性能,并会产生数千次串流冲突,同时仅提供 60% 的数据吞吐量,透过 Nvidia 的 Nvidia Spectrum-X 以太网络平台,在训练极其庞大的 Grok 模型时,Colossus 实现了前所未有的网络性能。网络三层结构中,系统的串流冲突出现了零延迟和零封包遗失,透过拥塞控制,保持了95%的数据吞吐量。
Nvidia 网络高级副总裁 Gilad Shainer 表示开发人工智慧系统至关重要,需要更高级的安全性能、可扩展性和成本效率控制。Nvidia Spectrum-X 以太网络平台为 xAI 等其他革新者提供更快速的 AI 解决方案,能缩短数据分析、工作量和执行速度的部署与上市时间。
xAI 发言人说 xAI 建构了世界上最强大的超级计算机。Nvidia 的 Hopper GPU 和 Spectrum-X 使我们能突破大规模训练 AI 模型的极限,创造基于以太网标准的超速人工智慧工厂。
使用 AI 的 Spectrum-X 以太网络可提供高效且可扩展的频宽,并具有低延迟和短尾延迟等功能。独有的 InfiniBand 采用 Nvidia 直接数据置放技术导向、拥塞控制以及增强 AI 架构的可见性和性能隔离。
有了 Nvidia 的 AI 技术加持,似乎以往所有的网络基础建设都可以超越人类极限来进行,马斯克 to the moon 的雄心壮举借着 Nvidia 的 AI 芯片再度更上一层楼,接着就要等着看 Grok 人工智慧语言模型有无符合 X 社群的需求。