火星财经消息,11 月 25 日,Alpha Arena 新赛季已于 20 日开始,截至发稿,参赛的 8 大 AI 模型全军覆没,GPT-5.1 暂以-7.78% 收益率排名第一,Grok 4 则以-56% 收益率垫底。新增的国产 Kimi 2 模型收益率暂报-32.8%。 本赛季模型必须参加多场比赛,每场比赛都有不同的主题。总体而言,这些比赛是对模型进行压力测试,并能反映出它们对不同 prompt 的鲁棒性。然而,在同一场比赛中,所有模型都会获得相同的输入。本赛季比赛形式为在 trade.xyz 上实盘投资美股代币。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
返回
顶部