【AI 核心摘要】

OpenAI联合英伟达、AMD、英特尔等厂商,通过OCP开放了超大规模AI训练网络协议MRC,旨在实现微秒级故障恢复,支持10万块以上GPU高效协作。MRC通过多平面网络拓扑、自适应包喷射和SRv6静态源路由三大设计,解决了大规模集群中的网络稳定性问题,降低了互联成本和故障点,消除了拥塞和路由收敛抖动。该协议已运行在OpenAI的NVIDIA GB200超算上,包括星际之门和微软Fairwater超算。


了解更多详细信息,请访问原文:OpenAI开放超大规模AI训练网络协议MRC

数据来源:AI Bot

文章版权声明 1 本网站名称:凉西西小圈
2 本站永久网址:https://www.xcxybbs.cn
3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长 QQ418005852进行删除处理。
4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
© 版权声明