AI资讯新闻榜单内容搜索-3

刷榜AI全挂了！Meta斯坦福地狱级测试，GPT/Claude/Gemini交出0分

SWE-Bench上能拿72%的模型，换张考卷直接归零！Meta联合斯坦福、哈佛放出ProgramBench，200个项目从零手写，9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网，就有模型在36%的任务里跑去GitHub扒源码。

来自主题: AI技术研报

6386 点击 2026-05-07 12:03

OpenAI 选中的 37 名「超级大学生」，厉害在哪？做了什么？

OpenAI 揭晓了 ChatGPT Futures 项目，为 37 名年轻人提供了 1 万美元的无偿资助、前沿模型访问权限，并邀请他们 6 月去总部参访

来自主题: AI资讯

6266 点击 2026-05-07 11:02

13人干翻Transformer！新架构SSA算力暴减千倍，成本仅Opus 5%

Transformer统治地位悬了！一款SubQ模型带着SAA架构横空出世，1200万上下文成本仅Opus的5%，计算量暴减千倍。

来自主题: AI资讯

9818 点击 2026-05-07 10:59

多轮Agent蒸馏终于不翻车！港中文x通义新方法成功率暴涨18点，训练还快32%

把强大模型的能力“蒸馏”给小模型，听起来很美—— 但放到多轮对话Agent场景里，效果往往一塌糊涂。

来自主题: AI技术研报

8503 点击 2026-05-07 10:17

老黄爆改英伟达，Salesforce一次招千人！智能体时代应届生机会来了

Salesforce CEO Marc Benioff近日甩出一份招聘计划：要一口气招进1000名应届生或实习生，与他们一起搭乘AI快车。IBM更猛，北美入门级岗位直接扩招3倍，麦肯锡、Cognizant紧跟其后。智能体时代，一批10年前根本不存在的「金饭碗」正在批量诞生，应届生这个词，也将被重写。

来自主题: AI资讯

9519 点击 2026-05-07 10:16

Assort Health 用Agent 接管诊所核心运营，B轮融资7600万美金，4年估值翻了250倍。

Assort Health 是一家值得被认真拆解的初创公司。成立仅两年多，累计融资1.015亿美元，拿着300万美元的ARR（年度经常性收入），却获得了7.5亿美元的估值。Assort 最近推出主动式互动引擎 Activate，从被动接听到主动做患者唤醒和慢病管理，这已经是在为真正面向用户的智能体做铺垫了。

来自主题: AI资讯

9201 点击 2026-05-07 01:20