OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

2025-02-23 11:03:04

分享至

ChainCatcher 消息，据金十報導，OpenAI 的一名員工公開指責馬斯克旗下的xAI公司，稱其發布的最新 AI 模型 Grok3 的基準測試結果具有誤導性。對此，xAI 的聯合創始人伊戈爾・巴布什金（Igor Babushkin）則堅稱公司並無不當。

xAI 的圖表顯示，Grok3 的兩個版本------Grok3 Reasoning Beta 和 Grok3 mini Reasoning------在 AIME 2025 上的表現超過了 OpenAI 當前最強的可用模型 o3-mini-high。然而，OpenAI 的員工很快在 X 平台上指出，xAI的圖表並未包含 o3-mini-high 在"cons@64"條件下的 AIME 2025 得分。

巴布什金在 X 平台上辯稱，OpenAI 過去也曾發布過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。

(來源連結)

關聯標籤

OpenAI xAI Grok3

鏈捕手ChainCatcher提醒，請廣大讀者理性看待區塊鏈，切實提高風險意識，警惕各類虛擬代幣發行與炒作，站內所有內容僅係市場信息或相關方觀點，不構成任何形式投資建議。如發現站內內容含敏感信息，可點擊“舉報”，我們會及時處理。