AI资讯新闻榜单内容搜索-LLM

统计可控数据合成！新框架突破大模型数据生成局限，麦吉尔大学团队推出LLMSynthor

现有的数据合成方法在合理性和分布一致性方面存在不足，且缺乏自动适配不同数据的能力，扩展性较差。

来自主题: AI技术研报

6595 点击 2025-05-25 15:42

让GPT-4o准确率大降，这个文档理解新基准揭秘大模型短板

在文档理解领域，多模态大模型（MLLMs）正以惊人的速度进化。从基础文档图像识别到复杂文档理解，它们在扫描或数字文档基准测试（如 DocVQA、ChartQA）中表现出色，这似乎表明 MLLMs 已很好地解决了文档理解问题。然而，现有的文档理解基准存在两大核心缺陷：

来自主题: AI技术研报

7790 点击 2025-05-25 11:44

GPT-4o舔出事了！赛博舔狗背后，暗藏6大AI套路

上月，ChatGPT-4o无条件跪舔用户，被OpenAI紧急修复。然而，ICLR 2025的文章揭示LLM不止会「跪舔」，还有另外5种「套路」。

来自主题: AI技术研报

6453 点击 2025-05-23 15:46

Dify、n8n、Coze、Fastgpt、Ragflow到底该怎么选？超详细指南～

大家好，我是袋鼠帝一直以来，分享了不少关于工作流平台、LLM应用平台的不少干货文章。主要包含：Dify、Coze、n8n、Fastgpt、Ragflow。大家好，我是袋鼠帝一直以来，分享了不少关于工作流平台、LLM应用平台的不少干货文章。主要包含：Dify、Coze、n8n、Fastgpt、Ragflow

来自主题: AI技术研报

8545 点击 2025-05-22 09:11

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

7344 点击 2025-05-21 15:28

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

大语言模型（LLM）的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容，而新兴的异步生成范式通过识别语义独立的内容块，实现并行生成。

来自主题: AI技术研报

6736 点击 2025-05-21 14:12

Nature子刊：人类又输给了AI，尤其是当它知道你是谁时

洛桑联邦理工学院研究团队发现，当GPT-4基于对手个性化信息调整论点时，64%的情况下说服力超过人类。实验通过900人参与辩论对比人机表现，结果显示个性化AI达成一致概率提升81.2%。研究警示LLM可能被用于传播虚假信息，建议利用AI生成反叙事内容应对威胁，但实验环境与真实场景存在差异。

来自主题: AI技术研报

6425 点击 2025-05-21 09:52

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

7024 点击 2025-05-20 10:16

不用等了！吴恩达MCP课程来了！

MCP 是一种开放的技术协议，旨在标准化大型语言模型（LLM）与外部工具和服务的交互方式。你可以把 MCP 理解成像是一个 AI 世界的通用翻译官，让 AI 模型能够与各种各样的外部工具"对话"。

来自主题: AI资讯

5923 点击 2025-05-20 09:44

LLM又曝致命缺陷：根本不会看时钟！博士惊呆，准确率不及50%

AI能写论文、画图、考高分，但连「看表读时间」「今天是星期几」都错得离谱？最新研究揭示了背后惊人的认知缺陷，提醒我们：AI很强大，但精确推理还离不开人类。

来自主题: AI技术研报

7029 点击 2025-05-19 16:06