
o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%
o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%让大模型集体吃瘪,数学题正确率通通不到2%!
让大模型集体吃瘪,数学题正确率通通不到2%!
当地时间11月7日,Anthropic与Palantir Technologies Inc.和亚马逊网络服务(AWS)合作,将Claude 3和3.5系列AI模型引入AWS,服务于美国情报和国防机构。
智东西11月8日消息,据外媒The Information报道,亚马逊正讨论向美国AI大模型独角兽Anthropic进行第二笔数十亿美元的投资。
纳尼?AI Agent容易受到弹幕影响! 甚至比人类更容易。
刚刚,Claude 3.5 Haiku允许通过API访问,同一天,xAI也官宣Grok API也正式开启公测。
一群大模型玩你画我猜,人类一旁围观超起劲儿。 就像下面这张图展示的,由Grok画长颈鹿,一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。
Claude ,由 Anthropic 制作的 AI 聊天机器人,现在有了桌面应用程序。您可以从Anthropic 的网站免费下载 Mac 和 Windows 版本的应用程序。
Claude游戏测试,能打几分?在持续一个多小时毁灭人类游戏中,Claude能制定出长期策略,令人惊喜的同时,也暴露出了AI短板。
清华物理系传奇特奖得主Yao Shunyu,正式投身大模型,加入Anthropic的Claude团队。
这个星期,AI 大模型突然迈上了一个新台阶,竟开始具备操作计算机的能力!