AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
97年金融男带8只「电商龙虾」全球开店!2个月后同行慌了

97年金融男带8只「电商龙虾」全球开店!2个月后同行慌了

97年金融男带8只「电商龙虾」全球开店!2个月后同行慌了

阿里版「电商龙虾」正式打通国际站!Accio Work深度进化,选品、发品、广告、客服等7个岗位的活,现在一个工作台、一句话就能全包。28岁金融男零代码部署8个Agent,竟跑出100%好评。

来自主题: AI技术研报
9902 点击    2026-04-20 15:13
从0开始,在国内用上Claude Code的终极保姆教程来了。

从0开始,在国内用上Claude Code的终极保姆教程来了。

从0开始,在国内用上Claude Code的终极保姆教程来了。

最近很多朋友都在问我,能不能出一期Claude Code的小白教程。

来自主题: AI技术研报
9410 点击    2026-04-20 14:37
Agent不是关键!人大AiScientist实现23小时、74轮长程记忆

Agent不是关键!人大AiScientist实现23小时、74轮长程记忆

Agent不是关键!人大AiScientist实现23小时、74轮长程记忆

中国人民大学团队打造的AiScientist,旨在解决长程机器学习研究工程的持续性难题。该系统从论文理解开始,跨越环境配置、代码实现与实验迭代,保持状态连续与决策连贯,显著提升科研效率。其核心在于通过File-as-Bus机制,稳定保存项目状态,使AI能真正接手科研流程,而非仅辅助单个环节。

来自主题: AI技术研报
7815 点击    2026-04-20 14:36
你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。

来自主题: AI技术研报
9760 点击    2026-04-20 14:36
新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强

新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强

新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强

如今的大多数智能体,仍然活在一种「失忆式工作」模式中:每一次检索都是从零开始,每一条推理路径都无法沉淀,每一次失败也不会转化为经验。它们虽能多轮交互,但很难在深度研究中持续变强。

来自主题: AI技术研报
8971 点击    2026-04-20 14:02
从Vibe Coding到Wish Coding,AI编程迎来C端拐点

从Vibe Coding到Wish Coding,AI编程迎来C端拐点

从Vibe Coding到Wish Coding,AI编程迎来C端拐点

最近几个月,Vibe Coding(氛围编程)是一大刷屏热词。以 Cursor 和 Claude Code 为代表的一批工具,正在将软件开发效率推向新的高度。

来自主题: AI技术研报
8181 点击    2026-04-20 14:02
有人把 Claude Mythos 的架构逆向出来了

有人把 Claude Mythos 的架构逆向出来了

有人把 Claude Mythos 的架构逆向出来了

Anthropic 没有公开 Claude Mythos 的架构。但研究社区没有等。

来自主题: AI技术研报
5839 点击    2026-04-20 09:46
Kimi新论文:把KVCache玩成新商业模式了

Kimi新论文:把KVCache玩成新商业模式了

Kimi新论文:把KVCache玩成新商业模式了

把长上下文做到极致的Kimi又发新成果!

来自主题: AI技术研报
6996 点击    2026-04-20 09:46
Claude 进了 Word,Pro 和 Max 都能用

Claude 进了 Word,Pro 和 Max 都能用

Claude 进了 Word,Pro 和 Max 都能用

Anthropic 4 月 10 日发布 Claude for Word 公测版,第一批只开给 Team 和 Enterprise 用户

来自主题: AI技术研报
8988 点击    2026-04-20 09:46
大模型架构的下半场

大模型架构的下半场

大模型架构的下半场

研究者们花了十年去扩展层内的计算能力,却忘了扩展层间的通信能力。

来自主题: AI技术研报
6565 点击    2026-04-20 09:02
世界引擎:Post-Training开启Physical AGI新纪元

世界引擎:Post-Training开启Physical AGI新纪元

世界引擎:Post-Training开启Physical AGI新纪元

一年前,DeepSeek R1 横空出世,人们才意识到,真正让模型产生推理能力质变的,不必是更大的预训练规模 —— 后训练,用强化学习、过程奖励、闭环反馈,以极低的代价解锁了原本需要数倍算力才能触达的能力边界。

来自主题: AI技术研报
6166 点击    2026-04-20 09:00
全球84%的人从未碰过AI,你以为自己晚了?其实你早得离谱!

全球84%的人从未碰过AI,你以为自己晚了?其实你早得离谱!

全球84%的人从未碰过AI,你以为自己晚了?其实你早得离谱!

一张图在X上炸了:全球84%的人从未真正用过AI,16%偶尔玩玩免费聊天机器人,0.3%愿意每月付20美元,0.04%用AI写代码,0.01%是凌晨跑模型、买硬件的重度玩家。这不是鸡汤,微软官方数据托底。你天天刷AI资讯,以为全世界都在卷——其实你身处的那个圈子,是全球最顶端的0.01%。

来自主题: AI技术研报
7457 点击    2026-04-19 21:47
SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

伯克利团队归纳出7种反复出现的模式:智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。

来自主题: AI技术研报
8588 点击    2026-04-19 13:40
果然,最恨 AI 的人,是大学毕业生

果然,最恨 AI 的人,是大学毕业生

果然,最恨 AI 的人,是大学毕业生

对 AI 敌意最重的群体,是那些刚刚踏入社会、或正在寻找起点的职场新人。盖洛普数据显示,在已就业的 Z 世代中,高达 48% 的人认为 AI 在工作场所的风险远大于收益,这一比例在一年内激增了 11 个百分点。认为收益大于风险的仅占 15%。

来自主题: AI技术研报
7697 点击    2026-04-19 13:36
百万Token白烧?Claude官方下场:5招治好上下文腐烂

百万Token白烧?Claude官方下场:5招治好上下文腐烂

百万Token白烧?Claude官方下场:5招治好上下文腐烂

给了100万token,现在却手把手教你怎么删记录!Anthropic官方承认:塞太多东西,Claude就会变蠢。面对失控的「上下文腐烂」,Anthropic连夜甩出5招救命指南。

来自主题: AI技术研报
9395 点击    2026-04-19 13:35
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。

来自主题: AI技术研报
7564 点击    2026-04-19 13:33
一天审完两万篇!AAAI 2026首次实装AI审稿,单篇成本不到1美元

一天审完两万篇!AAAI 2026首次实装AI审稿,单篇成本不到1美元

一天审完两万篇!AAAI 2026首次实装AI审稿,单篇成本不到1美元

AI 的整体表现已经胜过了人类。或者按 AAAI 官方的说法是:「对 AAAI-26 作者和程序委员会成员的大规模调查显示,参与者不仅认为 AI 评审有用,而且在技术准确性和研究建议等关键维度上,实际上更偏好 AI 评审。」

来自主题: AI技术研报
8293 点击    2026-04-19 13:33
全球最大触觉数据集Daimon-Infinity,竟然出自一家具身上游公司

全球最大触觉数据集Daimon-Infinity,竟然出自一家具身上游公司

全球最大触觉数据集Daimon-Infinity,竟然出自一家具身上游公司

4 月 15 日,戴盟机器人联合Google DeepMind、中国移动、新加坡国立大学、香港科技大学、上海交通大学、日本东北大学等海内外数十家顶尖学术机构与知名企业,发布了全球最大规模含触觉全模态物理世界数据集Daimon-Infinity。

来自主题: AI技术研报
5612 点击    2026-04-18 07:27
Nature丨告别「炼丹」!AI+机器人闭环搞光伏:效率27.18%,可重复性直接拉高5倍

Nature丨告别「炼丹」!AI+机器人闭环搞光伏:效率27.18%,可重复性直接拉高5倍

Nature丨告别「炼丹」!AI+机器人闭环搞光伏:效率27.18%,可重复性直接拉高5倍

香港城市大学朱宗龙、曾晓成团队给出了终极终结方案。他们首创了一套AI驱动的自动化闭环研发平台。从2万个分子的“大海捞针”,到自动化机械臂精准制备,再到AI实时反馈调整,全程无需人类插手。

来自主题: AI技术研报
7143 点击    2026-04-17 14:49
Claude Opus 4.7 发布,全网最详细解读

Claude Opus 4.7 发布,全网最详细解读

Claude Opus 4.7 发布,全网最详细解读

刚刚,Anthropic 发布 Claude Opus 4.7,已经在 Claude 的所有产品、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 上全面可用。模型 id claude-opus-4-7

来自主题: AI技术研报
6671 点击    2026-04-17 10:07
当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

2026 年初这几个月,随着 OpenClaw 的爆火,AI 领域也正式步入了 Harness 时代。在这股浪潮中,MiniMax 凭借其敏锐的技术嗅觉,成为了这场变革中的一大核心焦点。

来自主题: AI技术研报
6235 点击    2026-04-17 10:06
3.9 元让 OpenClaw 实现 Token 自由!

3.9 元让 OpenClaw 实现 Token 自由!

3.9 元让 OpenClaw 实现 Token 自由!

养虾已经成为我们团队的日常了,几乎人手都有一只🦞要养,不仅能实时抓取全网前沿 AI 资讯速递,还能干一些搬砖杂活。

来自主题: AI技术研报
10200 点击    2026-04-17 09:14
卸载龙虾后,我找到了更香的爱马仕Agent,5 分钟带你极速上手

卸载龙虾后,我找到了更香的爱马仕Agent,5 分钟带你极速上手

卸载龙虾后,我找到了更香的爱马仕Agent,5 分钟带你极速上手

「人红是非多」,Hermes Agent 最近真的火了,一边是 GitHub 积累了超过 8 万星,增长趋势完全是直线上升。

来自主题: AI技术研报
5347 点击    2026-04-17 09:13