AI技术研报-这里有最前沿的人工智能技术解读

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

梁文锋亲自参与的DeepSeek最新论文，来了！

来自主题: AI技术研报

6979 点击 2025-05-16 11:47

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

5974 点击 2025-05-16 11:04

表格RAG语义割裂，用Pneuma+SAT增强检索准确性和效率 |最新

在上一篇文章中，我为大家介绍了SAT如何通过神经网络驱动的智能分段技术，解决传统文本处理中的语义割裂问题。今天，我将继续与您探讨SAT如何与Pneuma系统融合，开创表格数据检索与表示的新范式。

来自主题: AI技术研报

5942 点击 2025-05-16 10:43

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

和人工标记数据说拜拜，利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据！

来自主题: AI技术研报

5903 点击 2025-05-16 10:07

全球头部AI应用公司，现状如何？

随着DeepSeek的横空出世，行业竞争加剧，无论是AI原生企业还是转型中的互联网巨头，都面临战略路径的重新校准。这一现象引发了行业的连锁反应：一方面，头部企业加速产品迭代和推广；另一方面，部分企业由于战略失误和反应缓慢开始面临用户流失风险。在这样的竞争环境下，企业的战略选择显得尤为关键。成功的AI公司通常具备三大核心能力：精准的战略定位、快速的调整能力以及高效的执行落地。

来自主题: AI技术研报

8187 点击 2025-05-16 10:06

如何理解AI资产重估？

2025年国内AI技术突破推动资产重估，资源向头部企业高度集中，形成“赢家通吃”格局。高端制造受政策与资本驱动，龙头优势扩大，但就业市场与科创投资错位，加剧通缩压力。政策转向结构性调控，聚焦科技与安全资产，投资者需关注确定性强的核心资产及防御性配置。

来自主题: AI技术研报

7060 点击 2025-05-16 09:59

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外大模型。

来自主题: AI技术研报

7951 点击 2025-05-16 09:59

MCP/A2A之后，Agent补齐最后一块协议拼图

一文读懂AG-UI协议

来自主题: AI技术研报

5909 点击 2025-05-16 09:51

突破300年数学难题！陶哲轩出题，DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

谷歌DeepMind重磅推出AlphaEvolve，最强通用AI智能体横扫数学难题！它不仅推动了300年「接吻数难题」，一举颠覆了56年前Strassen算法神话。而且，还在AI训推、TPU设计、数据中心领域，展现出了极强的实力。

来自主题: AI技术研报

9002 点击 2025-05-15 19:58

“逆天”研究！Cursor 与 Windsurf 背后的核心算法机制曝光！网友惊呼：Cursor代码总出Bug的原因找到了

Vibe coding正火得一塌糊涂，但谁能想到，刚刚一位大佬已经把当红的AI编程神器Cursor和Windsurf背后的核心算法机制研究出来了！

来自主题: AI技术研报

7147 点击 2025-05-15 19:41

将大模型幻觉降低90%，一个神奇的写作Agent

为什么我们需要智能写作Agent？

来自主题: AI技术研报

6063 点击 2025-05-15 18:30

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

7367 点击 2025-05-15 17:12

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

vivo自研大模型用的数据筛选方法，公开了。

来自主题: AI技术研报

8980 点击 2025-05-15 14:11

百万规模数据集打造人形机器人通用大模型，实现精细动作跨平台、跨形态动作迁移丨北大人大联合发布

北大和人大团队在通用人形机器人动作生成领域取得重大突破！

来自主题: AI技术研报

6977 点击 2025-05-15 12:15

讨厌RAG生成幻觉？试一下SAT重构文本分块，按语义而不是Token

搞RAG开发，一个被普遍忽视却又至关重要的痛点是：如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术，巧妙解决了这一难题。它不是RAG的替代，而是RAG的强力前置增强层，通过确保每个文本块的语义完整性，显著降低下游生成的幻觉风险。

来自主题: AI技术研报

7065 点击 2025-05-15 12:02

ICML25 | 让耳朵「看见」方向！仅依靠360°全景视频，就能生成3D空间音频

空间音频，作为一种能够模拟真实听觉环境的技术，正逐渐成为提升沉浸式体验的关键。

来自主题: AI技术研报

7949 点击 2025-05-15 10:56

DanceGRPO：首个统一视觉生成的强化学习框架

R1 横空出世，带火了 GRPO 算法，RL 也随之成为 2025 年的热门技术探索方向，近期，字节 Seed 团队就在图像生成方向进行了相关探索。

来自主题: AI技术研报

7008 点击 2025-05-15 10:47

红杉资本的AI应用焦虑：AI必须要赚钱了

红杉资本连续三年关注AI应用的盈利压力，指出当前AI市场规模已达万亿美元但面临挑战：智能体技术受限于串行任务瓶颈，行业渗透率差异显著，初创企业需深耕垂直领域或整合人工环节。大模型厂商向下游扩张挤压初创空间，部分企业通过收购强化竞争力，AI应用需从工具转向交付结果以突破盈利困境。

来自主题: AI技术研报

7851 点击 2025-05-15 10:29

为什么AI视频工具长得越来越像？

比起此前对生成时长、模型参数的强调，大半年来，不提Sora的AI视频玩家将这场“军备竞赛”的重点放在了三个维度上——卷一致性、卷可用性、卷可玩性。所谓的“一致性”指的是视频生成过程中帧与帧之间的过渡性、动作的连续性和场景的真实性等。

来自主题: AI技术研报

7818 点击 2025-05-15 10:27

全网爆火的AI原生浏览器Dia最全系统提示词，建议AI产品经理都看看

看了Dia的系统提示词，真的是细节狂魔啊！（提示词放文末了）每个细节都在优化用户的使用体验，这就是产品级AI和玩具级AI的区别。提示词整体结构遵循了"总-分-总"的结构，开头设定整体角色身份的基本认知，然后分项设定规则，最终设定总体的安全策略。

来自主题: AI技术研报

8982 点击 2025-05-14 20:12

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！

来自主题: AI技术研报

5902 点击 2025-05-14 15:26

精准提取数据太折磨人，试下pip install -U contextgem，自动生成提示 | 痛快

最近ContextGem很火。它既不是RAG也不是Agent，而是专注于"结构化提取"的框架，它像一个"文档理解层"，通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数据。它可作为RAG的前置处理器、Agent的感知模块，也可独立使用。

来自主题: AI技术研报

7227 点击 2025-05-14 15:12

叶子豪、陈天奇等人开源项目FlashInfer入选，MLSys2025最佳论文奖公布

今年的两篇最佳论文一作均为华人。

来自主题: AI技术研报

8173 点击 2025-05-14 14:40

首个，专攻点云上下文学习自适应采样！支持点级、提示级｜CVPR 2025

MICAS是一种专为3D点云上下文学习设计的多粒度采样方法，通过任务自适应点采样和查询特定提示采样，提升模型在点云重建、去噪、配准和分割等任务中的稳健性和适应性，显著优于现有技术。

来自主题: AI技术研报

7978 点击 2025-05-14 14:28

ICML 2025 | 如何在合成文本数据时避免模型崩溃？

随着生成式人工智能技术的飞速发展，合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。

来自主题: AI技术研报

7209 点击 2025-05-14 14:04

首个多模态统一CoT奖励模型来了，模型、数据集、训练脚本全开源

在多模态大模型快速发展的当下，如何精准评估其生成内容的质量，正成为多模态大模型与人类偏好对齐的核心挑战。然而，当前主流多模态奖励模型往往只能直接给出评分决策，或仅具备浅层推理能力，缺乏对复杂奖励任务的深入理解与解释能力，在高复杂度场景中常出现 “失真失准”。

来自主题: AI技术研报

8941 点击 2025-05-14 11:01

ICML Spotlight | MCU：全球首个生成式开放世界基准，革新通用AI评测范式

开发能在开放世界中完成多样任务的通用智能体，是AI领域的核心挑战。开放世界强调环境的动态性及任务的非预设性，智能体必须具备真正的泛化能力才能稳健应对。然而，现有评测体系多受限于任务多样化不足、任务数量有限以及环境单一等因素，难以准确衡量智能体是否真正「理解」任务，或仅是「记住」了特定解法。

来自主题: AI技术研报

5867 点击 2025-05-14 10:26

首次！流匹配模型引入GRPO，GenEval几近满分，组合生图能力远超GPT-4o

流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能，已成为图像生成（Stable Diffusion, Flux）和视频生成（可灵，WanX，Hunyuan）领域最先进模型的训练方法。然而，这些最先进的模型在处理包含多个物体、属性与关系的复杂场景，以及文本渲染任务时仍存在较大困难。

来自主题: AI技术研报

8980 点击 2025-05-14 10:19

生成视频好看还不够，还要能自由探索！昆仑万维开源Matrix-Game，单图打造游戏世界

世界模型的进度条，最近坐上了火箭。

来自主题: AI技术研报

7032 点击 2025-05-13 16:26

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

一夜之间，老黄天塌了（doge）。

来自主题: AI技术研报

7894 点击 2025-05-13 15:30