AI资讯新闻榜单内容搜索-LLM

GPT-4o舔出事了！赛博舔狗背后，暗藏6大AI套路

上月，ChatGPT-4o无条件跪舔用户，被OpenAI紧急修复。然而，ICLR 2025的文章揭示LLM不止会「跪舔」，还有另外5种「套路」。

来自主题: AI技术研报

8775 点击 2025-05-23 15:46

Dify、n8n、Coze、Fastgpt、Ragflow到底该怎么选？超详细指南～

大家好，我是袋鼠帝一直以来，分享了不少关于工作流平台、LLM应用平台的不少干货文章。主要包含：Dify、Coze、n8n、Fastgpt、Ragflow。大家好，我是袋鼠帝一直以来，分享了不少关于工作流平台、LLM应用平台的不少干货文章。主要包含：Dify、Coze、n8n、Fastgpt、Ragflow

来自主题: AI技术研报

13513 点击 2025-05-22 09:11

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

9505 点击 2025-05-21 15:28

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

大语言模型（LLM）的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容，而新兴的异步生成范式通过识别语义独立的内容块，实现并行生成。

来自主题: AI技术研报

8475 点击 2025-05-21 14:12

Nature子刊：人类又输给了AI，尤其是当它知道你是谁时

洛桑联邦理工学院研究团队发现，当GPT-4基于对手个性化信息调整论点时，64%的情况下说服力超过人类。实验通过900人参与辩论对比人机表现，结果显示个性化AI达成一致概率提升81.2%。研究警示LLM可能被用于传播虚假信息，建议利用AI生成反叙事内容应对威胁，但实验环境与真实场景存在差异。

来自主题: AI技术研报

8585 点击 2025-05-21 09:52

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

9656 点击 2025-05-20 10:16

不用等了！吴恩达MCP课程来了！

MCP 是一种开放的技术协议，旨在标准化大型语言模型（LLM）与外部工具和服务的交互方式。你可以把 MCP 理解成像是一个 AI 世界的通用翻译官，让 AI 模型能够与各种各样的外部工具"对话"。

来自主题: AI资讯

8818 点击 2025-05-20 09:44

LLM又曝致命缺陷：根本不会看时钟！博士惊呆，准确率不及50%

AI能写论文、画图、考高分，但连「看表读时间」「今天是星期几」都错得离谱？最新研究揭示了背后惊人的认知缺陷，提醒我们：AI很强大，但精确推理还离不开人类。

来自主题: AI技术研报

8106 点击 2025-05-19 16:06

PDF文件长出「AI大脑」？网友惊呼：这操作太「黑科技」了！

你以为PDF只是用来阅读文档的？这次它彻底颠覆了你的想象！极客Aiden Bai最新整活——直接把大语言模型（LLM）塞进PDF里，打开文件就能让AI讲故事、陪你聊天！更夸张的是，连Linux系统都能在PDF里运行。

来自主题: AI资讯

10060 点击 2025-05-16 15:33

GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

多模态大模型（Multimodal Large Language Models, MLLM）正迅速崛起，从只能理解单一模态，到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此，在AI竞赛进入“下半场”之际（由最近的OpenAI研究员姚顺雨所引发的共识观点），设计科学的评估机制俨然成为决定胜负的核心关键。

来自主题: AI技术研报

10206 点击 2025-05-16 15:06