
新版Gemini 2.5所有榜一,谷歌无敌了!一个月全面击败o3,编程反超Claude 4
新版Gemini 2.5所有榜一,谷歌无敌了!一个月全面击败o3,编程反超Claude 4谷歌深夜携全新Gemini 2.5 Pro强势归来,仅用一个月碾压旧版Gemini 2.5。数学、编程、推理全面封神,稳坐所有榜单第一。
谷歌深夜携全新Gemini 2.5 Pro强势归来,仅用一个月碾压旧版Gemini 2.5。数学、编程、推理全面封神,稳坐所有榜单第一。
当地时间 6 月 4 日,Windsurf CEO Varun Mohan 发帖称,在提前不到五天的通知时间里,Anthropic 切断了其几乎所有 Claude 3.x 模型的直接访问权限(first-party capacity),包括 Claude 3.5 Sonnet、3.7 Sonnet 和 3.7 Sonnet Thinking。
近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。
Claude发布MCP网页版本集成和Research,正式开启开挂模式。全面基于远程 MCP 的集成现已面向所有付费 Claude.ai 方案开放(包括 Pro 版用户),提供将 Claude 连接到各种工具和数据源的能力。
Claude团队来搞开源了——推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。该工具的核心在于生成归因图(attribution graphs),其作用类似于大脑的神经网络示意图,通过可视化模型内部超节点及其连接关系,呈现LLM处理信息的路径。
Genspark 借助 Claude 打造自适应的 AI Agents,改变了人们研究和创建内容的新姿势,为复杂的工作流提供了极大的效率和规模。Genspark 借助 Claude 打造自适应的 AI Agents,改变了人们研究和创建内容的新姿势,为复杂的工作流提供了极大的效率和规模。
AI coding 这条 AI 行业今年的主线,在最近这段时间愈发清晰。
“要是这些历史能在地图上‘动’起来就好了!” 这个念头一直在我脑子里盘旋。我渴望能有一张直观的地图,让我轻松洞悉历史发展的脉络。目前人工智能浪潮奔涌而至,其在文本、图像乃至动画领域的创造力令人瞩目。我便想着,能否借助AI之力,将《枪炮、病菌与钢铁》所描绘的世界,真实地投射到一张交互式的地图之上?
新版DeepSeek-R1重磅开源,凌晨已放出权重!此次模型性能几乎与o4-mini(Medium)相当,编程实测超越Claude 4 Sonnet。网友纷纷惊叹:开源又一次胜利了。
又是一个让程序员狂欢的研究!来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。