AI资讯新闻榜单内容搜索-HLE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: HLE
从概念到生产级部署:AWS如何破解Agentic AI落地难题?

从概念到生产级部署:AWS如何破解Agentic AI落地难题?

从概念到生产级部署:AWS如何破解Agentic AI落地难题?

红杉美国合伙人 Konstantine Buhler 预测 2025 年将成为 AI agent 的“群体协作”时代,标志着 Agent 元年的到来。

来自主题: AI资讯
8462 点击    2025-07-18 14:02
刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

刚刚,Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称,Grok 4 在 HLE(Humanities Last Exam,人类最后考试)上的标准得分是 35%,使用推理技术后提高到 45%;在 GPQA 上的得分是 87-88%;而Grok 4 Code 在 SWE Bench 上的得分则达到 72-75%。

来自主题: AI资讯
8105 点击    2025-07-05 11:38
Meta回应Llama 4大模型质量争议: Llama 4「开卷作弊」纯属无稽之谈

Meta回应Llama 4大模型质量争议: Llama 4「开卷作弊」纯属无稽之谈

Meta回应Llama 4大模型质量争议: Llama 4「开卷作弊」纯属无稽之谈

今日凌晨,Meta AI 部门副总裁 Ahmad Al-Dahle 发文,回应了近日发布的 Llama 4 大模型的争议问题:对于「不同服务中模型质量参差不齐」这一问题,Ahmad Al-Dahle 解释称,由于模型一准备好就发布了,所以 Meta 的团队预计所有公开的应用实现都需要几天时间来进行优化调整,团队后续会继续进行漏洞修复工作。

来自主题: AI资讯
7990 点击    2025-04-08 10:36