DeepSeekが最適化された並列戦略をオープンソース化、DualPipeとEPLBをリリース

By PANews – 2025/02/27 11:39:13 (JST)

DeepSeekは、オープンソースウィーク中に最適化された並列戦略のオープンソース化を発表しました。これには、V3/R1トレーニングにおける計算と通信のオーバーラップを強化する双方向パイプライン並列アルゴリズムであるDualPipeが含まれます。

さらに、計算リソースの割り当て効率を改善するために、Expert Parallel Load Balancer (EPLB)がリリースされました。チームは、トレーニングパフォーマンスをさらに最適化するための計算と通信のオーバーラップを分析するツールも導入しました。

※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)

(β版: 記事が長い場合は動かない可能性があります)

類似記事

Share on: