OpenAI13:59機能アップデート公式ブログ
OpenAIがAIトレーニング向け新ネットワークプロトコルMRCを公開
大規模AI訓練の信頼性と速度が向上し、GPU利用効率を高められます。
ポイント
- 1多パススプレーイングで輻輳低減
- 2SRv6でマイクロ秒故障回避
- 32段スイッチで10万GPU接続
- 4OpenAIのスーパーコンピューターで実運用中
OpenAIがAMD・Broadcom・Intel・Microsoft・NVIDIAと共同でMRCプロトコルをリリースしました。100,000GPU超のクラスターで輻輳低減・故障耐性向上を実現します。AI開発者が大規模訓練のGPU浪費を減らし、コストを抑えられます。オープンソースで即利用可能です。