AI资讯新闻榜单内容搜索-DeepSee

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSee
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
6951 点击    2025-05-20 10:16
北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。

来自主题: AI资讯
7949 点击    2025-05-19 17:19
华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构!

来自主题: AI技术研报
8935 点击    2025-05-19 16:37
中国 AI 大厂,被 Deepseek 掀了牌桌之后

中国 AI 大厂,被 Deepseek 掀了牌桌之后

中国 AI 大厂,被 Deepseek 掀了牌桌之后

当技术范式重构,强者也不得不重新起跑。

来自主题: AI资讯
6736 点击    2025-05-19 14:58
换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。

来自主题: AI技术研报
5788 点击    2025-05-19 10:11
被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

ChatGPT悄悄上线的直连Github新功能太强大!一旦连上Github,立马化身「研究怪兽」:不管是DeepSeek这样的明星开源项目,还是自己DIY的文档资料,只要放进仓库,就能交给深度研究,一键生成专业到飞起的报告。

来自主题: AI产品测评
8014 点击    2025-05-18 15:05
AI怎样模仿人类大脑的注意力机制?

AI怎样模仿人类大脑的注意力机制?

AI怎样模仿人类大脑的注意力机制?

最近,人们对AI谈得最多的是deepseek(简称DS)。这匹来自中国本土的黑马,闯入全球视野,一度扰乱美国股市,在 AI 领域掀起了一场轩然大波。

来自主题: AI技术研报
7871 点击    2025-05-17 18:15