By PANews – 2025/02/27 11:39:13 (JST)
DeepSeekは、オープンソースウィーク中に最適化された並列戦略のオープンソース化を発表しました。これには、V3/R1トレーニングにおける計算と通信のオーバーラップを強化する双方向パイプライン並列アルゴリズムであるDualPipeが含まれます。
さらに、計算リソースの割り当て効率を改善するために、Expert Parallel Load Balancer (EPLB)がリリースされました。チームは、トレーニングパフォーマンスをさらに最適化するための計算と通信のオーバーラップを分析するツールも導入しました。
※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)
類似記事
- DeepSeekがオープンソースウィークを開始 (類似度: 88.3%)
- DeepSeekがDeepGEMMをリリース:V3/R1トレーニングと推論を最適化する効率的なFP8 GEMMライブラリ (類似度: 87.3%)
- DeepSeek、APIコール価格を最大75%引き下げ (類似度: 86.7%)
- インサイダー:DeepSeekは5月前に次世代R2モデルをリリースする可能性がある (類似度: 85.0%)