AI资讯新闻榜单内容搜索-Gen

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Gen
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
7053 点击    2025-05-20 10:16
刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

“全球首个XX Agent”快成为现在AI产品发布的标配了,几乎每天一睁眼都能看到。奥特曼在最近的演讲提到,2025年将是AI Agent的突破年。这股Agent热,也席卷到了正在举行的微软Build 2025开发者大会。

来自主题: AI资讯
7488 点击    2025-05-20 09:23
颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报
8073 点击    2025-05-19 17:08
「AI 黑客」来袭,Agentic AI 如何成为新守护者?

「AI 黑客」来袭,Agentic AI 如何成为新守护者?

「AI 黑客」来袭,Agentic AI 如何成为新守护者?

随着 AI 技术的快速发展,网络安全面临的威胁日益复杂化,攻击手段不仅更高效、隐蔽,还催生了新型的「AI 黑客」形态,因此引发了各类新型网络安全危机。

来自主题: AI资讯
7280 点击    2025-05-19 15:02
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。

来自主题: AI技术研报
7746 点击    2025-05-19 14:12
全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

2025年初,随着Manus的火爆,其背后的“黑科技”Browser Use也同样引起了人们的关注。Browser Use专为解决上述痛点而设计,强调将AI agents与网页连接,实现对浏览器的自动化操作。它支持AI agents自动轮换,单次登录即可实现持久会话,据TechCrunch报道,Browser Use是Manus用来执行各种任务的组件之一,例如点击网站菜单和填写表格。

来自主题: AI资讯
7163 点击    2025-05-19 10:18
首款设计Agent被挑战,Manus、Lovart 像素级对比

首款设计Agent被挑战,Manus、Lovart 像素级对比

首款设计Agent被挑战,Manus、Lovart 像素级对比

Agent 太多了,为了不让订阅费掏空我的钱包,我会通过苹果的屏幕使用时间以及 gemini 统计网页的访问次数来汇总每周使用频率。

来自主题: AI产品测评
7597 点击    2025-05-18 16:59
独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师

独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师

独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师

Lovart 值得关注,它是 AI 应用层团队产品创新能力的印证和延续,这是 Manus 之后最火的 Agent,从通用领域,成功地向垂直赛道落地了 Agent 产品形态。

来自主题: AI资讯
9248 点击    2025-05-17 09:47
Manus突发上新文生图!告别“抽卡”,Agent+深度思考联合创作

Manus突发上新文生图!告别“抽卡”,Agent+深度思考联合创作

Manus突发上新文生图!告别“抽卡”,Agent+深度思考联合创作

Manus深夜官宣,现在支持生成图像了!和一般AI绘图工具的“抽卡”模式不同,Manus能够理解你画图的目的,规划出生成方案后再“动手”。

来自主题: AI资讯
8239 点击    2025-05-16 15:54
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此,在AI竞赛进入“下半场”之际(由最近的OpenAI研究员姚顺雨所引发的共识观点),设计科学的评估机制俨然成为决定胜负的核心关键。

来自主题: AI技术研报
7054 点击    2025-05-16 15:06