AI资讯新闻榜单内容搜索-智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 智能体
同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。

来自主题: AI技术研报
9374 点击    2026-04-08 10:23
EigenLayer创始人的万亿赌注:AI智能体将直接变成公司

EigenLayer创始人的万亿赌注:AI智能体将直接变成公司

EigenLayer创始人的万亿赌注:AI智能体将直接变成公司

EigenLayer 创始人 Sreeram Kannan 在纽约 Digital Asset Summit 上扔出一个论点:智能体会变成公司。不是帮公司干活,不是给公司做助手——是直接变成公司本身。

来自主题: AI资讯
10083 点击    2026-04-08 09:15
CVPR2026 | 鬼手想点谁就点谁?LaSM让GUI智能体把注意力「收回来」

CVPR2026 | 鬼手想点谁就点谁?LaSM让GUI智能体把注意力「收回来」

CVPR2026 | 鬼手想点谁就点谁?LaSM让GUI智能体把注意力「收回来」

如果把手机屏幕想象成一个舞台,GUI 智能体就是台下那个 “被授权动手” 的人:它能看懂屏幕上的按钮、输入框和弹窗,能按你的指令去点、去滑、去输入。

来自主题: AI技术研报
10420 点击    2026-04-07 14:28
跨越智能体落地的可信鸿沟:玄甲(AgentWard)全链路防御操作系统正式发布

跨越智能体落地的可信鸿沟:玄甲(AgentWard)全链路防御操作系统正式发布

跨越智能体落地的可信鸿沟:玄甲(AgentWard)全链路防御操作系统正式发布

大模型技术正在经历一场从 “对话助手” 向 “自主智能体(Agent)” 的深刻演进。智能体不再局限于被动地理解与生成,而是具备了多步规划、工具调用、长期记忆与管理物理 / 数字世界的能力,正逐步深度嵌入企业侧的核心业务流程。这意味着,AI 的边界已从虚拟屏幕的对话框,正式延伸到了真实的生产系统中。

来自主题: AI技术研报
8506 点击    2026-04-07 10:00
Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体讨论,单人也能跑出「实验室」科研

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体讨论,单人也能跑出「实验室」科研

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体讨论,单人也能跑出「实验室」科研

由Liu Fayao(刘发耀,新加坡A*STAR研究科学家),Ye Deheng(叶德珩,前腾讯AI合伙人&首席专家)和Chen Tianrun(陈天润,魔芯科技创始人)带领的研究团队提出了Claw AI Lab。

来自主题: AI资讯
9418 点击    2026-04-05 20:01
深度|对话 LangChain 创始人:为什么 Manus 和 Claude Code 这么强?秘诀不在模型,而在顶级 Harness

深度|对话 LangChain 创始人:为什么 Manus 和 Claude Code 这么强?秘诀不在模型,而在顶级 Harness

深度|对话 LangChain 创始人:为什么 Manus 和 Claude Code 这么强?秘诀不在模型,而在顶级 Harness

在 AI 圈,模型至上论正在遭遇前所未有的挑战。当所有人都在屏息等待新模型再次刷新智力天花板时,AI 基础设施领军人物、LangChain 联合创始人 Harrison Chase 在最新对话中抛出了新预判:大模型正在沦为大宗商品,而决定 Agent 成败的,是那个包裹在模型外的 Harness 。

来自主题: AI资讯
9390 点击    2026-04-03 10:16
重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」

重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」

重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」

在现实世界中通过强化学习训练智能体,往往需要大量在线试错与环境探索,这不仅成本高昂,还可能带来显著安全风险:机器人可能因试错而损坏,自动驾驶的在线探索可能危及行车安全,而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报
8429 点击    2026-04-03 09:25
谷歌重磅开源Gemma 4!手机离线跑 Agent、还降内存,Qwen 被拉进正面对决

谷歌重磅开源Gemma 4!手机离线跑 Agent、还降内存,Qwen 被拉进正面对决

谷歌重磅开源Gemma 4!手机离线跑 Agent、还降内存,Qwen 被拉进正面对决

刚刚,谷歌正式发布 Gemma 4,称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计,采用商业许可的 Apache 2.0 许可证开源。Gemma 4 提供四种规格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合专家模型(MoE)和 31B 稠密模型(Dense)。

来自主题: AI资讯
9480 点击    2026-04-03 01:35
消息人士爆料!Anthropic秘密测试核弹级产品 —「永久在线」(Always-On)智能体Conway

消息人士爆料!Anthropic秘密测试核弹级产品 —「永久在线」(Always-On)智能体Conway

消息人士爆料!Anthropic秘密测试核弹级产品 —「永久在线」(Always-On)智能体Conway

就在今天,消息人士爆出:Anthropic正在秘密测试核弹级产品——「永久在线」(Always-On)智能体Conway。也就是说,从此Claude将彻底「龙虾化」!

来自主题: AI资讯
9464 点击    2026-04-03 00:42