全方位登顶排行榜!数学能力碾压和谷歌模型并列第一

  • 全方位登顶排行榜!数学能力碾压和谷歌模型,并列第一

    全方位登顶排行榜!数学能力碾压和谷歌模型,并列第一

    新智元报道编辑:乔杨【新智元导读】o1模型发布1周,lmsys的6k 投票就将o1-preview送上了排行榜榜首。同时,为了满足大家对模型「IOI金牌水平」的好奇心,OpenAI放出了o1测评时提交的所有代码。万众瞩目的最新模型OpenAIo1,终于迎来了lmsys竞技场的测评结果。不出意外,o1-preview在各种领域绝对登顶,超过了最新版的GPT-4o,在数学、困难提示和编码领域表现出色;而o1-mini虽然名字中自带「mini」,但也和最新版的GPT-4o并列综合排名第二,困难提示、编码、数学等领域和o1...

1