OpenAIの従業員がGrok3の誤解を招くベンチマークテスト結果を公に非難

By PANews – 2025/02/23 12:11:30 (JST)

ℹ以下の既報と関連が深い記事です
イーロン・マスクのxAIがGrok 3チャットボットをリリース、数学的推論でGPT4を上回る

OpenAIの従業員が、Elon Muskが設立した会社xAIがAIモデルGrok3の誤解を招くベンチマークテスト結果を提示したと公に非難しました。この非難は、xAIがGrok3 Reasoning BetaとGrok3 mini ReasoningがOpenAIの最強モデルo3-mini-highをAIME 2025テストで上回ったと主張したことから生じました。

この主張に対し、xAIの共同創設者Igor Babushkinは、同社の行動が適切であったと主張し、弁護しました。彼は、OpenAIのスタッフがxAIのチャートにおいてo3-mini-highの特定の条件下でのスコアが欠如していることを指摘し、それを誤解を招くものと見なしたと述べました。

Babushkinはさらに、OpenAIが以前に同様の誤解を招く可能性のあるベンチマークチャートを公開していたと主張し、AIモデルの性能比較に関する業界の行動パターンを示唆しました。

※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)

(β版: 記事が長い場合は動かない可能性があります)

類似記事

Share on: