AI资讯新闻榜单内容搜索-Deep

DeepMind首个猜想库开源，获陶哲轩力挺！

谷歌DeepMind重磅出击，开源首个形式化数学猜想库，获陶哲轩力挺！从解析数论的兰道猜想开始，这个开源项目将为AI破解数学难题的未来铺路。

来自主题: AI技术研报

7326 点击 2025-06-12 18:03

通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代

作者介绍：本文作者来自通义实验室 RAG 团队，致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报

7785 点击 2025-06-12 15:24

小扎“超级智能”小组第一位大佬！谷歌DeepMind首席研究员，“压缩即智能”核心人物

小扎亲手挖人，很疯狂。

来自主题: AI资讯

6840 点击 2025-06-12 12:50

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗？"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏，连不少技术大佬都在转发。再到最近，“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验，狠狠打了所有人的脸！

来自主题: AI技术研报

8690 点击 2025-06-12 11:59

103K「硬核」题，让大模型突破数学推理瓶颈

本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。

来自主题: AI技术研报

9834 点击 2025-06-11 14:50

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？

来自主题: AI资讯

9117 点击 2025-06-11 14:23

20人团队提前实现DeepSeek构想，AI算力变天？直击大模型算力成本痛点

20人国内团队，竟然提前2年预判到了DeepSeek的构想？玉盘AI的全新计算架构方案浮出水面后，直接震动业内：当前AI算力的核心瓶颈，他们试图从硬件源头解决！

来自主题: AI资讯

8918 点击 2025-06-11 11:55

14种主流Prompt技术，顶级团队2000次实验，只有这几种真能打

现在市面上有46种Prompt工程技术，但真正能在软件工程任务中发挥作用的，可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们，花了大量时间和计算资源，调研了58种，整理了46种，最终筛选测试了14种主流提示技术在10个软件工程任务上的表现，用了4个不同的大模型（包括咱们的Deepseek-V3），总共跑了2000多次实验。

来自主题: AI技术研报

11255 点击 2025-06-11 11:51

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

7892 点击 2025-06-10 16:18

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit量化之后的 DeepSeek-R1（0528），编程能力依然能超过Claude 4 Sonnet？

来自主题: AI技术研报

7303 点击 2025-06-10 15:28