AI技术研报-这里有最前沿的人工智能技术解读

Dify、n8n、Coze、Fastgpt、Ragflow到底该怎么选？超详细指南～

大家好，我是袋鼠帝一直以来，分享了不少关于工作流平台、LLM应用平台的不少干货文章。主要包含：Dify、Coze、n8n、Fastgpt、Ragflow。大家好，我是袋鼠帝一直以来，分享了不少关于工作流平台、LLM应用平台的不少干货文章。主要包含：Dify、Coze、n8n、Fastgpt、Ragflow

来自主题: AI技术研报

8548 点击 2025-05-22 09:11

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

7346 点击 2025-05-21 15:28

纯靠“脑补”图像，大模型推理准确率狂飙80%丨剑桥谷歌新研究

不再依赖语言，仅凭图像就能完成模型推理？

来自主题: AI技术研报

5809 点击 2025-05-21 15:07

何恺明等降维打击！彻底颠覆AI生图，无需预训练一步到位

何恺明团队又一力作！这次他们带来的是「生成模型界的降维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能碾压以往的扩散与流模型！

来自主题: AI技术研报

4757 点击 2025-05-21 14:50

华为曝光两大黑科技！打破推理延迟魔咒，大模型从此「秒回」

刚刚，昇腾两大技术创新，突破速度瓶颈重塑AI推理。FusionSpec创新的框架设计配合昇腾强大的计算能力，将投机推理框架耗时降至毫秒级，打破延迟魔咒。OptiQuant支持灵活量化，让推理性价比更高。

来自主题: AI技术研报

6947 点击 2025-05-21 14:30

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

大语言模型（LLM）的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容，而新兴的异步生成范式通过识别语义独立的内容块，实现并行生成。

来自主题: AI技术研报

6737 点击 2025-05-21 14:12

400次deep research实测有效｜报告质量差？这个prompt一劳永逸消灭“劣质信息”问题。

看到朋友在网上的分享：用Deep Research 的时候就怕在研究来源中看到ZHIHU、SINA、CSDN 这样的网址，这简直就是报告结果的灾难！垃圾进垃圾出。。在大模型还没有进化出反思修正和推理新知识能力的时候，务必屏蔽掉低质量信息源，AI无脑文越演越烈。

来自主题: AI技术研报

7001 点击 2025-05-21 11:43

用AI做酷炫的数据看板HTML，并稳定更新数据，落地到实际工作中

得益于AI上下文和审美能力的提升，现在做HTML已经没什么门槛了，可以应用到很多方面，例如小红书封面、PPT、原型图、数据看板等等。

来自主题: AI技术研报

9043 点击 2025-05-21 10:53

陶哲轩“喂饭级”AI教程来了！只用GitHub Copilot证明函数极限问题

视频新人博主陶哲轩又更新了！这次是“喂饭级”AI教程—— 手把手演示如何只用GitHub Copilot证明函数极限问题。

来自主题: AI技术研报

7916 点击 2025-05-21 10:47

Nature子刊：人类又输给了AI，尤其是当它知道你是谁时

洛桑联邦理工学院研究团队发现，当GPT-4基于对手个性化信息调整论点时，64%的情况下说服力超过人类。实验通过900人参与辩论对比人机表现，结果显示个性化AI达成一致概率提升81.2%。研究警示LLM可能被用于传播虚假信息，建议利用AI生成反叙事内容应对威胁，但实验环境与真实场景存在差异。

来自主题: AI技术研报

6428 点击 2025-05-21 09:52

这宣传图也太上流了！藏师傅教大家如何用4o搭配提示词生成

今天橘子的新产品可以一分钟将任何内容变成播客的 ListenHub发布了，照例想用提示词为他做一张长图。

来自主题: AI技术研报

8224 点击 2025-05-20 16:58

我用新版AI搜索再现了雪碧66年来的所有口味！

有多久没喝雪碧了，记不清了。

来自主题: AI技术研报

7263 点击 2025-05-20 16:48

全自动批量采集200个网站，这个37K Star的开源爬虫工具拯救了我【附：源码和爬虫MCP】

大家好，我是袋鼠帝前几天收到一个客朋友的咨询：“有没有什么爬虫软件推荐？”

来自主题: AI技术研报

6408 点击 2025-05-20 16:07

基本物理任务，全球顶级AI均失败！普通零件加工，o3不如老师傅

在基本物理任务上，前沿AI模型仍会失败！ML研究院的测试案例显示白领将被Ai替代，而制造业等蓝领工作不受影响。未来已来，只是分布得不均匀。

来自主题: AI技术研报

6963 点击 2025-05-20 15:24

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

要问最近哪个模型最火，混合专家模型（MoE，Mixture of Experts）绝对是榜上提名的那一个。

来自主题: AI技术研报

8064 点击 2025-05-20 15:16

ICML 2025 Spotlight | 多模态大模型暴露短板？EMMA基准深度揭秘多模态推理能力

「三个点电荷 + Q、-2Q 和 + 3Q 等距放置，哪个向量最能描述作用在 + Q 电荷上的净电力方向？」

来自主题: AI技术研报

8162 点击 2025-05-20 15:04

手机流畅处理128K长文本，vivo端侧新算法突破内存限制 | ACL 2025

在端侧设备上处理长文本常常面临计算和内存瓶颈。

来自主题: AI技术研报

8949 点击 2025-05-20 14:54

ICRA 2025｜通用多机器人长时任务规划框架破解任务分配难题，成功率+105%、效率+36%

2025 年 5 月，美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P。

来自主题: AI技术研报

8974 点击 2025-05-20 14:50

多模态检索大升级！智源三大SOTA模型，代码、图文理解能力拉满

就在刚刚，智源研究员联合多所高校开放三款向量模型，以大优势登顶多项测试基准。其中，BGE-Code-v1直接击穿代码检索天花板，百万行级代码库再也不用怕了！

来自主题: AI技术研报

4809 点击 2025-05-20 14:45

震撼全网，AlphaEvolve矩阵乘法突破被证明为真！开发者用代码证实

太震撼了，有开发者代码实证后发现，谷歌AlphaEvolve的矩阵乘法突破，被证明为真！Claude辅助下，他成功证明，它果然仅用了48次乘法，就正确完成了4×4矩阵的乘法运算。接下来，可以坐等AlphaEvolve更「奇点」的发现了。

来自主题: AI技术研报

9294 点击 2025-05-20 10:58

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

7026 点击 2025-05-20 10:16

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

理想中的多模态大模型应该是什么样？十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集，用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足，且多数通用模型未能超越专家模型，真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报

8051 点击 2025-05-19 17:08

Index-AniSora：B站开源动画生成模型，斩获多项SOTA入选IJCAI25

B 站开源动画视频生成模型 Index-AniSora，支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成！

来自主题: AI技术研报

7064 点击 2025-05-19 16:46

华为+DeepSeek，推理性能创新高！技术报告也公布出来了

部署超大规模MoE这件事，国产芯片的推理性能，已经再创新高了—— 不仅是“英伟达含量为0”这么简单，更是性能全面超越英伟达Hopper架构！

来自主题: AI技术研报

9014 点击 2025-05-19 16:37

LLM又曝致命缺陷：根本不会看时钟！博士惊呆，准确率不及50%

AI能写论文、画图、考高分，但连「看表读时间」「今天是星期几」都错得离谱？最新研究揭示了背后惊人的认知缺陷，提醒我们：AI很强大，但精确推理还离不开人类。

来自主题: AI技术研报

7032 点击 2025-05-19 16:06

参数量暴降，精度反升！哈工大宾大联手打造点云分析新SOTA

新架构选择用KAN做3D感知，点云分析有了新SOTA！

来自主题: AI技术研报

5835 点击 2025-05-19 15:06

全新GPU高速互联设计，为大模型训练降本增效！北大/阶跃/曦智提出新一代高带宽域架构

随着大模型的参数规模不断扩大，分布式训练已成为人工智能发展的中心技术路径。

来自主题: AI技术研报

9103 点击 2025-05-19 14:28

AI生成视频总不符合物理规律？匹兹堡大学团队新作PhyT2V：不重训练模型也能让物理真实度狂飙2.3倍！

本文由匹兹堡大学智能系统实验室（Intelligent Systems Laboratory）的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。

来自主题: AI技术研报

7720 点击 2025-05-19 14:12

1篇长文 = N张小红书爆款图？！Gemini 2.5 Pro 这效率，我跪了！

你有没有这样的烦恼：辛辛苦苦写完一篇公众号文章，想转发到小红书，却要再花大量时间制作3:4比例的精美图片？作为一个小红书小号拥有者（小1万粉丝呢，虽然躺在那吃灰有点可惜），我深知这种痛苦。每次想着要做几张图片就头大，甚至因此放弃了不少内容的二次分发。

来自主题: AI技术研报

8184 点击 2025-05-19 11:06

换模型就得重新优化提示词？用下MetaSPO，专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词？资源浪费且效率低下！本文介绍MetaSPO框架，首个专注模型迁移系统提示优化的元学习方法，让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果：框架自动生成了五种不同教育范式的系统提示，最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型，评分从0.3920提升至0.4362。

来自主题: AI技术研报

5865 点击 2025-05-19 10:11