AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
7180 点击    2025-05-20 10:16
刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

“全球首个XX Agent”快成为现在AI产品发布的标配了,几乎每天一睁眼都能看到。奥特曼在最近的演讲提到,2025年将是AI Agent的突破年。这股Agent热,也席卷到了正在举行的微软Build 2025开发者大会。

来自主题: AI资讯
7622 点击    2025-05-20 09:23
颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报
8189 点击    2025-05-19 17:08
「AI 黑客」来袭,Agentic AI 如何成为新守护者?

「AI 黑客」来袭,Agentic AI 如何成为新守护者?

「AI 黑客」来袭,Agentic AI 如何成为新守护者?

随着 AI 技术的快速发展,网络安全面临的威胁日益复杂化,攻击手段不仅更高效、隐蔽,还催生了新型的「AI 黑客」形态,因此引发了各类新型网络安全危机。

来自主题: AI资讯
7422 点击    2025-05-19 15:02
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。

来自主题: AI技术研报
7855 点击    2025-05-19 14:12
1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!

1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!

1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!

你有没有这样的烦恼:辛辛苦苦写完一篇公众号文章,想转发到小红书,却要再花大量时间制作3:4比例的精美图片?作为一个小红书小号拥有者(小1万粉丝呢,虽然躺在那吃灰有点可惜),我深知这种痛苦。每次想着要做几张图片就头大,甚至因此放弃了不少内容的二次分发。

来自主题: AI技术研报
8341 点击    2025-05-19 11:06
全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

2025年初,随着Manus的火爆,其背后的“黑科技”Browser Use也同样引起了人们的关注。Browser Use专为解决上述痛点而设计,强调将AI agents与网页连接,实现对浏览器的自动化操作。它支持AI agents自动轮换,单次登录即可实现持久会话,据TechCrunch报道,Browser Use是Manus用来执行各种任务的组件之一,例如点击网站菜单和填写表格。

来自主题: AI资讯
7326 点击    2025-05-19 10:18
关于MIT博士论文造假:相信并加大质疑AI声称的最美好的东西

关于MIT博士论文造假:相信并加大质疑AI声称的最美好的东西

关于MIT博士论文造假:相信并加大质疑AI声称的最美好的东西

关于MIT博士生Aidan Toner-Rodgers论文造假一事,在AI、经济学、科研、政策和媒体圈子里引起强烈反响,正如它6个月前在相同的圈子里引起轰动一样。

来自主题: AI资讯
7107 点击    2025-05-19 10:16
首款设计Agent被挑战,Manus、Lovart 像素级对比

首款设计Agent被挑战,Manus、Lovart 像素级对比

首款设计Agent被挑战,Manus、Lovart 像素级对比

Agent 太多了,为了不让订阅费掏空我的钱包,我会通过苹果的屏幕使用时间以及 gemini 统计网页的访问次数来汇总每周使用频率。

来自主题: AI产品测评
7874 点击    2025-05-18 16:59