By PANews – 2025/02/06 23:13:19 (JST)
スタンフォード大学とワシントン大学の研究者たちが、李飛飛の指導の下、s1という名前のAI推論モデルを開発しました。このモデルは、クラウドコンピューティングコストが50ドル未満でトレーニングされました。モデルは、OpenAIのo1やDeepSeekのR1といった先進的なモデルと同等の数学およびコーディングテストのパフォーマンスを示し、テックコミュニティで大きな注目を集めました。
しかし、後にs1モデルはゼロから開発されたものではなく、Alibaba Tongyi Qianwen(Qwen)モデルを基盤としていることが明らかになりました。Alibaba Cloudは、s1モデルがQwen2.5-32B-Instructオープンソースモデルに基づいており、16台のH100 GPUで26分間ファインチューニングされたことを確認しました。
このトレーニングプロセスにより、s1モデルは先進的な推論モデルに匹敵する数学およびコーディング能力を達成し、競技数学タスクにおいてOpenAIのo1-previewを27%上回る結果を出しました。この開発は、既存のモデルを活用して効率的かつ効果的なAIソリューションを創出する可能性を示しています。
※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)
類似記事
- DeepSeek-R1の影響とWeb3-AI (類似度: 87.7%)
- OpenAI、5分から30分でアナリストレベルのレポートを生成する深層研究機能を発表 (類似度: 85.5%)