
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低罕见,着实是太罕见。 一觉醒来,AI圈的两大顶流——OpenAI和Anthropic,竟然破天荒地联手合作了。
罕见,着实是太罕见。 一觉醒来,AI圈的两大顶流——OpenAI和Anthropic,竟然破天荒地联手合作了。
OpenAI和Anthropic罕见合作!因为AI安全「分手」后,这次双方却因为安全合作:测试双方模型在幻觉等四大安全方面的具体表现。这场合作,不仅是技术碰撞,更是AI安全的里程碑,百万用户每天的互动,正推动安全边界不断扩展。
一切皆可用上 AI,包括浏览器本身。 今天,AI 大模型公司 Anthropic 发布了一则最新公告——《Chrome 版 Claude 试运行》。简而言之,他们给 Chrome 浏览器开发了一款插件,让 Claude 这个大模型可以帮人自动操作网页。
刚刚,Anthropic发布了最新的浏览器agent——Claude for Chrome! 这款紧贴Chrome的agent可以作为浏览器的扩展程序直接使用: 它不仅能帮你设日历。
一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。
顶尖AI人才的争夺战在Meta和OpenAI等科技巨头之间越演越烈,但根据华尔街日报的报导: Claude的开发商Anthropic,似乎才是众多工程师更心仪的去处。
Anthropic的“快乐教育”让OpenAI份额暴跌25% 6个月自学速成AI,我成为了LLM天才❛‿˂̵✧ 成就OpenAI、打倒OpenAI(咳咳)创立对家Anthropic,从此化身前司的心腹大患……
近日,据外媒消息,Meta 在本周早些时候重组了其人工智能部门后,已冻结招聘。这一举动与 Meta 此前报道的为顶尖人才提供高达 10 亿美元薪酬的计划截然不同,此前数周,该公司已从竞争对手那里挖走了 50 多名人工智能研究人员和工程师,其中包括来自 OpenAI 的 20 名研究人员和工程师,至少 13 名来自谷歌、3 名来自苹果、3 名来自 xAI 以及 2 名来自 Anthropic。
据知情人士透露,Anthropic 即将达成协议,在新一轮融资中筹集高达 100 亿美元资金,这一金额超出预期,成为人工智能初创企业迄今规模最大的超级融资轮之一。
OpenAI在SWE-bench Verified编程测试中仅完成477道题却公布74.9%高分,对比之下,Anthropic的Claude完成全部500题。