Nvidia正在为配备10,000个H100GPU的巨型Tesla超级计算机提供动力
Tesla透露了其对一个大型计算集群的投资,该计算集群由10,000个NvidiaH100GPU组成,专门为人工智能工作负载提供动力。
据该公司人工智能基础设施负责人TimZaman介绍,该系统于本周上线,旨在处理其车队收集的海量数据,以加速全自动驾驶汽车的开发。
多年来,特斯拉一直在努力实现其车辆完全自动驾驶的目标,并已投资超过10亿美元采用基础设施来实现这一目标。
2023年7月,首席执行官埃隆·马斯克透露,该公司将在明年投资10亿美元建设Dojo超级计算机。Dojo基于特斯拉自己的技术,从D1开始,配备354个定制CPU内核。每个训练块模块包含25个D1,基本DojoV1配置总共包含53,100个D1核心。
该公司还在2012年6月建立了一个配备5,760个NvidiaA100GPU的计算集群。但该公司最新投资的10,000个H100GPU使这台超级计算机的能力相形见绌。
据Tom'sHardware称,这个价值超过3亿美元的AI集群将为技术计算提供340FP64PFLOPS的峰值性能,为AI应用提供39.58INT8ExaFLOPS的峰值性能。
该出版物指出,特斯拉可使用的功率实际上超过了莱诺阿多超级计算机提供的功率,使其成为地球上最强大的计算机之一。
Nvidia的是为许多世界领先的生成式AI平台提供动力的组件。这些安装在服务器中的GPU还有其他一些用例,从医学成像到生成天气模型。
特斯拉希望利用这些GPU的强大功能,更高效地处理其拥有的大量数据,以构建能够成功与人类媲美的模型。
虽然许多企业通常会依赖谷歌或微软等公司托管的基础设施,但特斯拉的超级计算基础设施都是本地的,这意味着该公司还必须维护所有这些基础设施。