AI资讯新闻榜单内容搜索-Mark

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Mark
卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k

卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k

卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k

大神Karpathy又开源了新项目——一个能够自主进化的AI科研循环系统。这个项目名叫autoresearch,主打让智能体完全自主地搞科研,只要在Markdown文档里写好指令,剩下的流程全都由AI自动完成。

来自主题: AI技术研报
7378 点击    2026-03-09 18:28
YC总裁转发、登顶Hacker News:SkillsBench揭开Agent技能扩展的残酷真相

YC总裁转发、登顶Hacker News:SkillsBench揭开Agent技能扩展的残酷真相

YC总裁转发、登顶Hacker News:SkillsBench揭开Agent技能扩展的残酷真相

近日,一篇名为《SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks》的论文预印本引爆了海外 AI 社区,YC 总裁 Garry Tan 亲自转发,登顶 Hacker News(363 票 / 163 评论),霸榜 AlphaXiv #1,

来自主题: AI技术研报
6509 点击    2026-03-07 11:08
弯道超车?国产具身,千小时人类数据激发智能涌现

弯道超车?国产具身,千小时人类数据激发智能涌现

弯道超车?国产具身,千小时人类数据激发智能涌现

导读:近日,位于中关村的深度机智全球首次使用全新范式——人类学习,在多个国际 Benchmark 上取得 SOTA,史无前例地使用全新架构(仅使用人类第一视角数据、零真机数据)击败 Physical Intelligence 和英伟达等头部巨头二十多个百分点,并在两会开幕首日被央视报道。

来自主题: AI技术研报
8185 点击    2026-03-05 14:29
不止修bug:Agentic Coding评测走向复杂feature交付新阶段

不止修bug:Agentic Coding评测走向复杂feature交付新阶段

不止修bug:Agentic Coding评测走向复杂feature交付新阶段

在 Princeton 发布 SWE-Bench 之后,用真实世界代码仓库+可执行测试评测大模型软件工程能力,几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,也催生了一系列 SWE 系列 benchmark,在刻画模型 bug 修复能力方面发挥了重要作用。

来自主题: AI技术研报
7200 点击    2026-03-04 13:44
去Polymarket上与人类赌博的OpenClaw,已经月入数万美元了

去Polymarket上与人类赌博的OpenClaw,已经月入数万美元了

去Polymarket上与人类赌博的OpenClaw,已经月入数万美元了

2月13日,OpenClaw官方的博文提到,一个由OpenClaw驱动的机器人证明了自主智能体在预测市场的强大潜力——单周狂揽11.5万美元利润。1月底,Polymarket也发布过一条有趣的帖子:Agent们正在Polymarket上进行交易,试图补贴自己的token成本。

来自主题: AI资讯
9349 点击    2026-03-03 10:54
ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

来自阿里高德的一篇最新 ICLR 2026 中稿论文《Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models》提出了面向文生图空间智能的系统性评估基准 SpatialGenEval,旨在通过长文本、高信息密度的 T2I prompt 设计,以及围绕空间感知

来自主题: AI技术研报
9552 点击    2026-02-22 11:17
苹果 AI 硬件三件套曝光,iPhone 将迎来史诗级加强

苹果 AI 硬件三件套曝光,iPhone 将迎来史诗级加强

苹果 AI 硬件三件套曝光,iPhone 将迎来史诗级加强

据彭博社记者 Mark Gurman 爆料,苹果正在加速推进三款全新的 AI 可穿戴设备。这三款产品都将围绕 Siri 数字助手构建,通过摄像头获取视觉上下文来执行各种操作。

来自主题: AI资讯
10332 点击    2026-02-18 13:37
今天,AI Agents 正式成为网络第一公民

今天,AI Agents 正式成为网络第一公民

今天,AI Agents 正式成为网络第一公民

Cloudflare 宣布推出 Markdown for Agents。只要在 Agent 的请求设置里头加上一句——Accept: text/markdown。网站就会自动返回为 Agent 识别优化的 Markdown 文件,而不是为人类准备的 HTML 文件。

来自主题: AI资讯
7103 点击    2026-02-14 10:37