AI资讯新闻榜单内容搜索-deepseek

DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里（Deli Chen）和 AI 合作的第二篇论文来了！论文地址：https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning（持续学习）与 self-iteration（自我迭代）。在陈德里看来，这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报

10188 点击 2026-05-30 22:40

700亿融资赶紧到位吧，DeepSeek开始限制重生、修改次数了

5月29日下午，不少网友发现，DeepSeek重新生成、修改有次数限制了。连续修改或重新生成几次后，页面会提示达到上限。有网友反馈，在普通对话中，重新生成3到6次后就会达到上限；而在专家模式下，可能只有3次机会。修改输入次数上限一般是6次。

来自主题: AI资讯

8764 点击 2026-05-30 10:48

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek，网友晒实锤！

网上有条帖子炸了，稳定复现，通过 API 问 Claude Opus 4.8 你是什么模型。回答是：Qwen，或者 DeepSeek。重要的事说三遍：必须是通过 API，必须是通过 API，必须是通过 API。因为网页端有系统提示词，会做二次处理。

来自主题: AI资讯

9364 点击 2026-05-29 13:04

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

DeepSeek V4发布，比模型本身更受关注的，是一个根本性的转变：国产算力生态正在从过去“芯片被动适配模型”的单向奔赴，迈向“芯模协同”的新阶段。

来自主题: AI资讯

8440 点击 2026-05-29 09:39

刚刚，DeepSeek陈德里与两个AI，合写了一篇论文

「借助 CodeAgent，我终于可以重新捡起很多过去因为精力不足而搁置的事情了，写博客就是其中之一。这篇博客大概 1% 是我写的，99% 是 Agent 写的 😂」。

来自主题: AI技术研报

6844 点击 2026-05-29 09:19

首次！DeepSeek-V4-Pro全参数后训练，被第三方在国产卡上跑通

近期，深圳河套学院（SLAI）AI训练平台项目团队，联合哈尔滨工业大学（深圳）、深圳大数据研究院、华为GTS（全球技术服务）团队与深智城AI算力平台，仅用1个月，共同基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行，完成长稳训练1500+步，训练MFU超30%，关键训练算子效率提升14%。

来自主题: AI技术研报

9090 点击 2026-05-28 14:56

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

从数学、代码、复杂推理，到多轮工具调用，大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后，RL 不再只是一个算法问题，同时更加是一个系统问题。

来自主题: AI技术研报

7044 点击 2026-05-28 14:51

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力，看Qwen3.7 Max 是否实至名归？！

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro，阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名，仅次于 Claude Opus 4.7。除了真实场景的用户选择，在传统的大模型固定评测榜单上，像是终端能力 Terminal Bench、编程能力 SWE Bench 等，Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评

9378 点击 2026-05-28 12:06

Token账单爆炸？用「TELOS」强制命中缓存，一键剩下90%的账单！

就在几天前（5月22日），DeepSeek官方扔出了一枚重磅炸弹：DeepSeek-V4-Pro将在5月底结束优惠后，永久降价至原价的四分之一。各大媒体瞬间被诸如“白菜价”、“夯爆了”的标题刷屏。看看这组惊人的新定价：每百万Token输出6元，输入（缓存未命中）3元，而输入（缓存命中）仅仅只要0.025元！

来自主题: AI技术研报

7348 点击 2026-05-28 09:51

DeepSeek陈德里开发自动研究Skill，用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek研究员陈德里，在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch，DeepSeek-V4-Pro研究和写作，GPT-Image2画图。论文共迭代6次（V1：4 次，V2：1 次，V3：1 次），总耗时6天，进行了约108轮Agent调用，消耗64.8万token，写了2234行LaTeX代码。

来自主题: AI资讯

9746 点击 2026-05-27 09:47