AI技术研报-这里有最前沿的人工智能技术解读

DeepSeek加持，北大通院几何模型达IMO金牌水平！32个CPU核心和1块4090就能实现满血解题

国产AI几何模型性能达IMO金牌水平，打平谷歌DeepMind最新AlphaGeometry系列——

来自主题: AI技术研报

10747 点击 2025-02-18 14:33

DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升

用代码训练大模型思考，其他方面的推理能力也能提升。

来自主题: AI技术研报

6177 点击 2025-02-18 10:40

超过o1-mini、逼近o3-mini，DeepSeek-R1在新的贪吃蛇基准上拿下1801分

那么，DeepSeek-R1 的 ARC-AGI 成绩如何呢？根据 ARC Prize 发布的报告，R1 在 ARC-AGI-1 上的表现还赶不上 OpenAI 的 o1 系列模型，更别说 o3 系列了。但 DeepSeek-R1 也有自己的特有优势：成本低。

来自主题: AI技术研报

8783 点击 2025-02-17 17:47

攻破AI最强守卫，赏金2万刀！Anthropic新方法可阻止95% Claude「越狱」行为

Anthropic，公布了新的AI模型防护方法，在之后约48小时内，无人完全攻破新系统，将赏金提高到了最高2万美元。新方法真这么强？

来自主题: AI技术研报

8124 点击 2025-02-17 16:20

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞

DeepSeek团队最新力作一上线，就获得Ai2研究所大牛推荐，和DeepSeek铁粉们的热情研读！他们提出的CodeI/O全新方法，通过代码提取了LLM推理模式，在逻辑、数学等推理任务上得到显著改进。

来自主题: AI技术研报

8831 点击 2025-02-17 15:17

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI 等提出的新基准再次暴露了大语言模型的弱点。

来自主题: AI技术研报

10725 点击 2025-02-17 14:49

Llama模仿Diffusion多模态涨分30%！不卷数据不烧卡，只需共享注意力分布

这次不是卷参数、卷算力，而是卷“跨界学习”——

来自主题: AI技术研报

8989 点击 2025-02-17 14:43

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

近年来，大语言模型（LLMs）取得了突破性进展，展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前，普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报

9504 点击 2025-02-17 14:37

从模糊到具体：高效使用DeepSeek-R1等推理型模型的前置步骤

本文的作用是帮你把问题具体化，这是用好DeepSeek-R1等推理型模型的前置步骤。

来自主题: AI技术研报

11775 点击 2025-02-17 10:07

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

自然语言 token 代表的意思通常是表层的（例如 the 或 a 这样的功能性词汇），需要模型进行大量训练才能获得高级推理和对概念的理解能力，

来自主题: AI技术研报

6956 点击 2025-02-16 13:12

Perplexity免费推出Deep Research：性能超过R1、o3-mini等，CEO：感谢DeepSeek

AI搜索“老大哥”Perplexity，刚刚也推出了自家的Deep Research——随便给个话题，就能生成有深度的研究报告。

来自主题: AI技术研报

9193 点击 2025-02-15 17:04

全球AI算力报告出炉，LLM最爱A100！谷歌坐拥超100万H100等效算力

全球有多少AI算力？算力增长速度有多快？在这场AI「淘金热」中，都有哪些新「铲子」？AI初创企业Epoch AI发布了最新全球硬件估算报告。

来自主题: AI技术研报

10103 点击 2025-02-15 16:51

比英伟达工程师还熟练！DeepSeek R1+测试时Scaling自动优化GPU内核

英伟达巧妙地将DeepSeek-R1与推理时扩展相结合，构建了全新工作流程，自动优化生成GPU内核，取得了令人瞩目的成果。

来自主题: AI技术研报

8267 点击 2025-02-15 16:27

大模型都喜欢拍马屁，Gemini最能拍！斯坦福：这不安全、不可靠

问题挺严重，大模型说的话可不能全信。

来自主题: AI技术研报

7895 点击 2025-02-15 16:20

DeepSeek R1之后，AI创业、AI投资会发生什么变化？

自一月以来， DeepSeek 在 AI 领域引发了极大的热度，也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章：「DeepSeek: A Technical and Strategic Analysis for VCs and Startups」

来自主题: AI技术研报

8725 点击 2025-02-15 16:00

炒菜、雕刻、绘画、汽车人变形！MakeAnything用扩散Transformer解锁多任务过程生成

人类智慧的一大特征是能够分步骤创造复杂作品，例如绘画、手工艺和烹饪等，这些过程体现了逻辑与美学的融合。

来自主题: AI技术研报

9540 点击 2025-02-15 15:26

ICLR 2025 Spotlight：音频生成新突破！港科北邮团队首次通过文本控制声源方向生成音频

兔子通过两只耳朵可以准确感知捕食者的一举一动，造就了不同品种广泛分布在世界各地的生命奇迹；同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境和感知周围活动状态。

来自主题: AI技术研报

9506 点击 2025-02-15 15:23

当Langflow遇见DeepSeek：可视化开发工作流的新解法

最近读者后台留言，问有没有好用的工作流平台。确实，对于大多数流程相对固定的任务，采用工作流完成确实是最优解，这种需求一直存在。

来自主题: AI技术研报

12676 点击 2025-02-15 12:52

DeepSeek R1遇难题142次"I give up"，研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议，DeepSeek R1常常在提供错误答案前就“我放弃”了？？ Cursor刚刚参与了一项研究，他们基于NPR周日谜题挑战（The Sunday Puzzle），构建了一个包含近600个问题新基准测试。

来自主题: AI技术研报

7632 点击 2025-02-14 17:41

好活！字节，南加大，斯坦福等新开源的小人跳舞X-Dyna，人脸、背景都生动起来了

在当下的技术领域中，人像视频生成（Human-Video-Animation）作为一个备受瞩目的研究方向，正不断取得新的进展。人像视频生成 (Human-Video-Animation) 是指从某人物的视频中获取肢体动作和面部表情序列，来驱动其他人物个体的参考图像来生成视频。

来自主题: AI技术研报

7877 点击 2025-02-14 17:32

李飞飞看中的万亿赛道，中国首个自研空间智能AI登场！单张图即生3D世界

中国首个全自研空间智能AI诞生了，单图即可生成360度无限3D场景，实时互动自由探索。这不仅是技术的革新，更预示着，游戏电影等领域即将迎来颠覆性的变革。

来自主题: AI技术研报

9644 点击 2025-02-14 16:11

达摩院开源VideoLLaMA3：仅7B大小，视频理解拿下SOTA | 在线可玩

7B大小的视频理解模型中的新SOTA，来了！

来自主题: AI技术研报

8672 点击 2025-02-14 15:23

超越CoT！微软剑桥中科院提出MVoT，直接可视化多模态推理过程

近日，微软和剑桥大学公布推理新方法：多模态思维可视化MVoT。新方法可以边推理，边「想象」，同时利用文本和图像信息学习，在实验中比CoT拥有更好的可解释性和稳健性，复杂情况下甚至比CoT强20%。还可以与CoT组合，进一步提升模型性能。

来自主题: AI技术研报

7539 点击 2025-02-14 14:15

AI意识更进一步！谷歌DeepMind等：LLM不仅能感受痛苦，还能趋利避害

以大语言模型为代表的AI在智力方面已经逐渐逼近甚至超过人类，但能否像人类一样有痛苦、快乐这样的感知呢？近日，谷歌团队和LSE发表了一项研究，他们发现，LLM能够做出避免痛苦的权衡选择，这也许是实现「有意识AI」的第一步。

来自主题: AI技术研报

7705 点击 2025-02-14 13:48

打破纪录！谷歌全网扒1000亿图像文本对，ViT大佬坐镇：数据Scaling潜力依旧

史上最大规模视觉语言数据集：1000亿图像-文本对！

来自主题: AI技术研报

7651 点击 2025-02-14 12:10

Meta全新脑机接口模型，挑战Neuralink！无需植入芯片实现「心灵感应」

脑机接口技术炙手可热，马斯克的Neuralink更是吸引了全球目光。然而其侵入式方案的风险不容忽视。Meta AI则另辟蹊径，近日推出了非侵入式的Brain2Qwerty深度学习模型，它能通过分析脑电图或脑磁图「读」出人们在键盘上输入的文字。

来自主题: AI技术研报

10282 点击 2025-02-14 11:39

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

近日，斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B，性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。

来自主题: AI技术研报

8246 点击 2025-02-14 11:09

Karpathy新实验火了！一个「表情」占53个token，DeepSeek-R1苦思10分解谜失败

一个简单的笑脸😀可能远不止这么简单？最近，AI大神Karpathy发现，一个😀竟然占用了多达53个token！这背后隐藏着Unicode编码的哪些秘密？如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是，这种「数据隐藏术」甚至能对AI模型进行「提示注入」！

来自主题: AI技术研报

8294 点击 2025-02-14 10:21

单卡3090帮你一口气看完《黑悟空》，港大百度打造超长视频理解引擎VideoRAG

今天向大家介绍一项来自香港大学黄超教授实验室的最新科研成果 VideoRAG。这项创新性的研究突破了超长视频理解任务中的时长限制，仅凭单张 RTX 3090 GPU (24GB) 就能高效理解数百小时的超长视频内容。

来自主题: AI技术研报

6695 点击 2025-02-14 10:04

奥特曼自曝：GPT-5要来了，所有人免费！DeepSeek逼急OpenAI，最强路线图曝光

奥特曼回应一切，OpenAI路线图全曝光。GPT-4.5数周发布，成为GPT系最后一个非推理模型。GPT-5将整合o系和GPT系，打造成一个全能系统。最令人兴奋的是，所有人皆可免费用上GPT-5。

来自主题: AI技术研报

9539 点击 2025-02-13 16:19