アリババクラウド、李飛飛チームのS1モデルがQwenトレーニングに基づいていることを確認

By PANews – 2025/02/06 23:13:19 (JST)

スタンフォード大学とワシントン大学の研究者たちが、李飛飛の指導の下、s1という名前のAI推論モデルを開発しました。このモデルは、クラウドコンピューティングコストが50ドル未満でトレーニングされました。モデルは、OpenAIのo1やDeepSeekのR1といった先進的なモデルと同等の数学およびコーディングテストのパフォーマンスを示し、テックコミュニティで大きな注目を集めました。

しかし、後にs1モデルはゼロから開発されたものではなく、Alibaba Tongyi Qianwen(Qwen)モデルを基盤としていることが明らかになりました。Alibaba Cloudは、s1モデルがQwen2.5-32B-Instructオープンソースモデルに基づいており、16台のH100 GPUで26分間ファインチューニングされたことを確認しました。

このトレーニングプロセスにより、s1モデルは先進的な推論モデルに匹敵する数学およびコーディング能力を達成し、競技数学タスクにおいてOpenAIのo1-previewを27%上回る結果を出しました。この開発は、既存のモデルを活用して効率的かつ効果的なAIソリューションを創出する可能性を示しています。

※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)

(β版: 記事が長い場合は動かない可能性があります)

類似記事

Share on: