AI技术研报-这里有最前沿的人工智能技术解读

当谣言搭上“AI”的东风

标识能否有效应对？

来自主题: AI技术研报

6291 点击 2025-06-13 10:42

AI自动写学术综述：10分钟生成6万字，成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用，特别是在研究文献快速增长的时代。传统的人工驱动综述写作需要研究者审阅大量文章，既耗时又难以跟上最新进展。而现有的自动化综述生成方法面临诸多挑战：

来自主题: AI技术研报

5416 点击 2025-06-13 10:35

DeepMind首个猜想库开源，获陶哲轩力挺！

谷歌DeepMind重磅出击，开源首个形式化数学猜想库，获陶哲轩力挺！从解析数论的兰道猜想开始，这个开源项目将为AI破解数学难题的未来铺路。

来自主题: AI技术研报

5610 点击 2025-06-12 18:03

256块NPU训成8B视频模型、超越Sora等一众闭源！抖音内容技术团队开源ContentV

近日，抖音内容技术团队开源了 ContentV，一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上，使用 256 块 NPU，在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限，ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。

来自主题: AI技术研报

7971 点击 2025-06-12 17:56

从 Cursor 到 Claude Code，我发现了 AI 编程的真正价值

张小龙说，设计就是分类，我认为写作也是一种分类，有助于定义问题和讨论问题，所以在探讨 AI 编码之前，需要分清出什么时候是在氛围编码（Vibe coding），什么时候是在用 AI 辅助编程。

来自主题: AI技术研报

4548 点击 2025-06-12 17:51

银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT，支持多机型、跨虚实，小时内可轻松部署

大数据和大模型已成为具身智能领域业界和学术界的焦点，人们也在期待人形机器人真正步入大数据、大模型时代。然而，行业一直缺乏稳定的人形机器人全身遥操作与数据采集方案。

来自主题: AI技术研报

6184 点击 2025-06-12 17:43

2D图像作中介，零训练实现3D场景生成SOTA：英伟达&康奈尔提出文本驱动新流程

想象一下，你是一位游戏设计师，正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光的蘑菇路灯、半透明的纱幔帐篷... 传统工作流程中，这可能需要数周时间：先手工建模每个 3D 资产，再逐个调整位置和材质，最后反复测试光照效果…… 总之就是一个字，难。

来自主题: AI技术研报

7396 点击 2025-06-12 17:09

AI真有希望考清北了！豆包1.6多模态推理发威，闯关数理化带图大题

豆包大模型1.6惊艳亮相，成为国内首款多模态SOTA模型，256k对话窗口，深度思考最长上下文。它不仅能看会想，还能动手操作GUI，国内最有潜力考清北。

来自主题: AI技术研报

6165 点击 2025-06-12 17:04

通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代

作者介绍：本文作者来自通义实验室 RAG 团队，致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报

6169 点击 2025-06-12 15:24

12个高效让Cursor改bug的技巧，彻底解放AI编程生产力

今天聊个让所有AI Coder都“红温”的话题：用Cursor改Bug，怎么就那么容易翻车？需求描述得清清楚楚，它却越改越乱，好不容易修好一个，又带出仨新的，简直心态爆炸！😭

来自主题: AI技术研报

6380 点击 2025-06-12 15:14

每秒生成超30帧视频，支持实时交互！自回归视频生成新框架刷新生成效率

在A100上用310M模型，实现每秒超30帧自回归视频生成，同时画面还保持高质量！

来自主题: AI技术研报

8389 点击 2025-06-12 12:42

端到端GUI智能体首次实现“犯错-反思-修正”闭环，模拟人类认知全过程

端到端多模态GUI智能体有了“自我反思”能力！南洋理工大学MMLab团队提出框架GUI-Reflection。

来自主题: AI技术研报

8614 点击 2025-06-12 12:11

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗？"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏，连不少技术大佬都在转发。再到最近，“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验，狠狠打了所有人的脸！

来自主题: AI技术研报

7104 点击 2025-06-12 11:59

CVPR 2025 | 多模态统一学习新范式来了，数据、模型、代码全部开源

我们人类生活在一个充满视觉和音频信息的世界中，近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力，衍生出了多种不同类型的任务，它们分别要求模型具备不同层面的能力。

来自主题: AI技术研报

7653 点击 2025-06-12 11:43

AI 重塑教育：2025 四维图鉴

多鲸即将发布《2025 AI 赋能教育行业发展趋势报告》，该文为预览先导精彩内容。本文将从 AI 如何驱动教育「需求演进」、AI 在「场景创新」中的具体应用，以及由此形成的「生态融合与市场爆发」这四个维度，深入探讨 AI+教育的未来图景。

来自主题: AI技术研报

7103 点击 2025-06-12 10:56

最大的开源GraphRag：知识图谱完全自主构建｜港科大＆华为

知识图谱（KGs）已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识，但目前的构建方法仍需要由领域专家预先创建模式，这限制了KGs的可扩展性、适应性和领域覆盖范围。

来自主题: AI技术研报

8169 点击 2025-06-12 10:50

医学领域也有世界模型了：精准模拟肿瘤演化，还能规划治疗方案

医学领域，也有自己的世界模型了。

来自主题: AI技术研报

6639 点击 2025-06-11 17:03

Mistral的首个强推理模型：拥抱开源，推理速度快10倍

强推理终于要卷速度了。大模型强推理赛道，又迎来一位重量级玩家。

来自主题: AI技术研报

6392 点击 2025-06-11 16:46

布局有志丨AI头部公司的生态之相丨Xsignal

当OpenAI以65亿美元估值收购前苹果传奇设计师乔纳森·伊夫（Jony Ive）的AI硬件初创公司io时，AI行业对大模型公司的生态战略产生了热议。

来自主题: AI技术研报

6039 点击 2025-06-11 16:32

“甲方快乐模型”诞生，拿下平面设计新SOTA！多条件一键生成，还能独立调整元素 | 复旦＆字节

平面设计师有救了！复旦大学和字节跳动团队联合提出CreatiDesign新模型，可实现高精度、多模态、可编辑的AI图形设计生成。

来自主题: AI技术研报

6161 点击 2025-06-11 16:18

o3绞尽脑汁仅答对40%的题目，开源模型基本乱猜？MMSI-Bench：多图空间智能试金石

AI能看图，也能讲故事，但能理解“物体在哪”“怎么动”吗？空间智能，正是大模型走向具身智能的关键拼图。

来自主题: AI技术研报

5836 点击 2025-06-11 15:58

「Next-Token」范式改变！刚刚，强化学习预训练来了

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？

来自主题: AI技术研报

5188 点击 2025-06-11 14:58

103K「硬核」题，让大模型突破数学推理瓶颈

本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。

来自主题: AI技术研报

8172 点击 2025-06-11 14:50

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

视觉注意力机制，又有新突破，来自香港大学和英伟达。

来自主题: AI技术研报

7501 点击 2025-06-11 14:34

10%训练数据超越100%表现，机器人学习领域迎来重要突破

第一作者陈昌和是美国密歇根大学的研究生，师从 Nima Fazeli 教授，研究方向包括基础模型、机器人学习与具身人工智能，专注于机器人操控、物理交互与控制优化。

来自主题: AI技术研报

9236 点击 2025-06-11 14:29

揭秘LLM“思考”之谜：推理即“梯度下降”，元学习框架解构训练过程，还给优化提供新思路

近年来，大语言模型（LLM）以其卓越的文本生成和逻辑推理能力，深刻改变了我们与技术的互动方式。然而，这些令人瞩目的表现背后，LLM的内部机制却像一个神秘的“黑箱”，让人难以捉摸其决策过程。

来自主题: AI技术研报

5427 点击 2025-06-11 14:29

刚刚，OpenAI最强推理模型o3-pro诞生！碾压Gemini 2.5 Pro击穿底价

最强推理模型一夜易主！深夜，o3-pro毫无预警上线，刷爆数学、编程、科学基准，强势碾压o1-pro和o3。更惊艳的是，o3价格直接暴降80%，叫板Gemini 2.5 Pro。

来自主题: AI技术研报

6387 点击 2025-06-11 13:20

OpenAI新模型，被曝秘密训练中！万字硬核长文直指o4核心秘密

SemiAnalysis全新硬核爆料，意外揭秘了OpenAI全新模型的秘密？据悉，新模型介于GPT-4.1和GPT-4.5之间，而下一代推理模型o4将基于GPT-4.1训练，而背后最大功臣，就是强化学习。

来自主题: AI技术研报

6295 点击 2025-06-11 12:20

一招缓解LLM偏科！调整训练集组成，“秘方”在此 | 上交大&上海AI Lab等

大幅缓解LLM偏科，只需调整SFT训练集的组成。

来自主题: AI技术研报

6128 点击 2025-06-11 12:01

14种主流Prompt技术，顶级团队2000次实验，只有这几种真能打

现在市面上有46种Prompt工程技术，但真正能在软件工程任务中发挥作用的，可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们，花了大量时间和计算资源，调研了58种，整理了46种，最终筛选测试了14种主流提示技术在10个软件工程任务上的表现，用了4个不同的大模型（包括咱们的Deepseek-V3），总共跑了2000多次实验。

来自主题: AI技术研报

9061 点击 2025-06-11 11:51