AI资讯新闻榜单内容搜索-大模

从MiniMax到DeepSeek：为何头部大模型都在押注「交错思维」？

昨日，有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报

10094 点击 2025-12-04 16:25

句子级溯源+生成式归因，C²-Cite重塑大模型可信度

在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可追溯, 一直是学术界和工业界关注的焦点问题。想象一下,当你向ChatGPT提问时,它不仅给出答案,还能像学术论文一样标注每句话的信息来源——这就是"溯源大语言模型"要解决的核心问题。

来自主题: AI技术研报

6604 点击 2025-12-03 10:44

速递｜全球首个船舶具身大模型，「知有无界」获得卓源亚洲种子轮融资

近日，清华大学深圳国际研究生院的机器人博士团队创办的「知有无界」获得卓源亚洲领投、力合科创跟投的种子轮融资。「知有无界」诞生在清华大学王学谦教授的智能机器人实验室，实现了全球首个船舶具身通用大模型，本轮融资后，「知有无界」将会进一步加快在船坞的商业化落地，并持续进行多代产品的研发。

来自主题: AI资讯

8150 点击 2025-12-03 10:25

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

7461 点击 2025-12-03 09:54

AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

随着大语言模型（LLM）的商业价值快速提升，其昂贵的训练成本使得模型版权保护（IP Protection）成为业界关注的焦点。然而，现有模型版权验证手段（如模型指纹）往往忽略一个关键威胁：攻击者一旦直接窃取模型权重，即拥有对模型的完全控制权，能够逆向指纹 / 水印，或通过修改输出内容绕过指纹验证。

来自主题: AI技术研报

9176 点击 2025-12-02 10:20

醒醒吧，别再怪大模型有偏见了，是我们先给错了「人设」

当AI开始学会「摸鱼」，整个行业都该警醒了。

来自主题: AI技术研报

7727 点击 2025-12-01 14:30

NeurIPS 2025 | Language Ranker：从推荐系统的视角反思并优化大模型解码过程

在大语言模型（LLM）的研究浪潮中，绝大多数工作都聚焦于优化模型的输出分布 —— 扩大模型规模、强化分布学习、优化奖励信号…… 然而，如何将这些输出分布真正转化为高质量的生成结果 —— 即解码（decoding）阶段，却没有得到足够的重视。

来自主题: AI技术研报

7105 点击 2025-12-01 10:06

AI作弊风暴，席卷韩国名校

刚刚过去的深秋，韩国高校涌动着一股意想不到的技术暗流——“生成式人工智能（AI）作弊”事件席卷韩国大学圈，三所顶尖高校无一幸免。在延世大学、首尔大学、高丽大学的考试中，学生在课堂及线上考试中动用ChatGPT或群聊进行作弊。

来自主题: AI资讯

9404 点击 2025-11-30 11:10

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

9007 点击 2025-11-30 09:30

国产最强多模态宝座又易主？671B参数练就“火眼金睛”，基于DeepSeek打造

智东西11月28日报道，刚刚，快手开源其新一代旗舰多模态大模型Keye-VL-671B-A37B。该模型基于DeepSeek-V3-Terminus打造，拥有6710亿个参数，在保持基础模型通用能力的前提下，对视觉感知、跨模态对齐与复杂推理链路进行了升级，实现了较强的多模态理解和复杂推理能力。

来自主题: AI技术研报

9623 点击 2025-11-29 20:12