AI资讯新闻榜单内容搜索-智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 智能体
Claude Code工程师自曝:100万token上下文窗口是一把双刃剑,上下文腐化,每一步都是一个分叉点,曝内部最佳实践:用回溯代替纠错

Claude Code工程师自曝:100万token上下文窗口是一把双刃剑,上下文腐化,每一步都是一个分叉点,曝内部最佳实践:用回溯代替纠错

Claude Code工程师自曝:100万token上下文窗口是一把双刃剑,上下文腐化,每一步都是一个分叉点,曝内部最佳实践:用回溯代替纠错

最近,Claude Code 团队工程师 Thariq Shihipar又在X上发文了,上个月他写的Skill深度经验分享贴在社交平台爆火,这周他又发了一篇Claude的100万toke上下文窗口使用技巧的文章,平台阅读量已超过200万。

来自主题: AI资讯
9826 点击    2026-04-20 09:02
SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

伯克利团队归纳出7种反复出现的模式:智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。

来自主题: AI技术研报
8908 点击    2026-04-19 13:40
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。

来自主题: AI技术研报
7903 点击    2026-04-19 13:33
当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

2026 年初这几个月,随着 OpenClaw 的爆火,AI 领域也正式步入了 Harness 时代。在这股浪潮中,MiniMax 凭借其敏锐的技术嗅觉,成为了这场变革中的一大核心焦点。

来自主题: AI技术研报
6613 点击    2026-04-17 10:06
我给星露谷的 NPC 接入了 Hermes Agent

我给星露谷的 NPC 接入了 Hermes Agent

我给星露谷的 NPC 接入了 Hermes Agent

我和周围朋友都特别爱玩《星露谷物语》。

来自主题: AI技术研报
8638 点击    2026-04-16 16:30
迎接智能体的「觉醒时刻」:EverOS全球公测开启Agent Memory自进化序章

迎接智能体的「觉醒时刻」:EverOS全球公测开启Agent Memory自进化序章

迎接智能体的「觉醒时刻」:EverOS全球公测开启Agent Memory自进化序章

随着新一代主动执行型 Agent(如 OpenClaw、Hermes Agent 等)的爆发,AI 正经历从「被动工具」向「具备自我演化(Self-Evolving)能力的智能体」的范式跃迁。然而,受限于上下文窗口极限与记忆缺失,现有 Agent 难以在复杂任务中实现经验的复用与自我进化。

来自主题: AI技术研报
7393 点击    2026-04-15 10:07