AI资讯新闻榜单内容搜索-Agent

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Agent
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报
6614 点击    2026-05-19 10:00
24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报
7766 点击    2026-05-18 16:48
Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了|香港中文大学最新

Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了|香港中文大学最新

Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了|香港中文大学最新

早在2024年,人们还倾向于给Agent提供海量的工具(例如通过MCP协议连接的API、搜索引擎、代码解释器等)。但是,“拥有工具”并不等于“知道如何使用工具”。当任务变得复杂且长周期时,要求Agent每次都从头开始推理“该用哪个工具、何时用、怎么组合、出错怎么办”,会导致系统极度脆弱、延迟极高且不可靠。

来自主题: AI技术研报
6326 点击    2026-05-18 09:55
3个人带100个AI程序员,一个月烧掉130万美元!OpenAI:钱我出

3个人带100个AI程序员,一个月烧掉130万美元!OpenAI:钱我出

3个人带100个AI程序员,一个月烧掉130万美元!OpenAI:钱我出

3个人,100个AI agent,一个月烧掉130万美元——OpenClaw之父把软件开发变成了「AI流水线」,OpenAI替他买单。

来自主题: AI资讯
9191 点击    2026-05-17 15:09
Z Tech|一个词就能视觉推理?Meta 华人颠覆性提出 ATLAS 新范式

Z Tech|一个词就能视觉推理?Meta 华人颠覆性提出 ATLAS 新范式

Z Tech|一个词就能视觉推理?Meta 华人颠覆性提出 ATLAS 新范式

近日,Meta AI 与香港中文大学颠覆性提出了一种全新的视觉推理范式 ATLAS,不用外部工具,不显式生成中间图像,没有视觉监督信号,只用一个离散 word,首次颠覆性地代替 Agentic 和 Latent Visual Reasoning。

来自主题: AI技术研报
7454 点击    2026-05-17 15:07
虾马之后又火一个!OpenHuman用20分钟了解你的一切,存成卡帕西式知识库

虾马之后又火一个!OpenHuman用20分钟了解你的一切,存成卡帕西式知识库

虾马之后又火一个!OpenHuman用20分钟了解你的一切,存成卡帕西式知识库

虾在前,马当道,居然还有新物种能在Agent赛道突出重围。OpenHuman连续霸榜GitHub Trending第一,狂揽9k+ Star,一天就涨千星。和虾马不一样,Human不用你花心思养,还能反过来主动了解你。

来自主题: AI资讯
8906 点击    2026-05-17 11:33