AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek
DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里(Deli Chen)和 AI 合作的第二篇论文来了!论文地址:https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning(持续学习) 与 self-iteration(自我迭代)。在陈德里看来,这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报
10188 点击    2026-05-30 22:40
700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

5月29日下午,不少网友发现,DeepSeek重新生成、修改有次数限制了。连续修改或重新生成几次后,页面会提示达到上限。有网友反馈,在普通对话中,重新生成3到6次后就会达到上限;而在专家模式下,可能只有3次机会。修改输入次数上限一般是6次。

来自主题: AI资讯
8764 点击    2026-05-30 10:48
Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

网上有条帖子炸了,稳定复现,通过 API 问 Claude Opus 4.8 你是什么模型。回答是:Qwen,或者 DeepSeek。重要的事说三遍:必须是通过 API,必须是通过 API,必须是通过 API。因为网页端有系统提示词,会做二次处理。

来自主题: AI资讯
9364 点击    2026-05-29 13:04
DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4发布,比模型本身更受关注的,是一个根本性的转变: 国产算力生态正在从过去“芯片被动适配模型”的单向奔赴,迈向“芯模协同”的新阶段。

来自主题: AI资讯
8440 点击    2026-05-29 09:39
刚刚,DeepSeek陈德里与两个AI,合写了一篇论文

刚刚,DeepSeek陈德里与两个AI,合写了一篇论文

刚刚,DeepSeek陈德里与两个AI,合写了一篇论文

「借助 CodeAgent,我终于可以重新捡起很多过去因为精力不足而搁置的事情了,写博客就是其中之一。这篇博客大概 1% 是我写的,99% 是 Agent 写的 😂」。

来自主题: AI技术研报
6844 点击    2026-05-29 09:19
首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

近期,深圳河套学院(SLAI)AI训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳大数据研究院、华为GTS(全球技术服务)团队与深智城AI算力平台,仅用1个月,共同基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行,完成长稳训练1500+步,训练MFU超30%,关键训练算子效率提升14%。

来自主题: AI技术研报
9090 点击    2026-05-28 14:56
全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

从数学、代码、复杂推理,到多轮工具调用,大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后,RL 不再只是一个算法问题,同时更加是一个系统问题。

来自主题: AI技术研报
7044 点击    2026-05-28 14:51
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
9378 点击    2026-05-28 12:06
Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

就在几天前(5月22日),DeepSeek官方扔出了一枚重磅炸弹:DeepSeek-V4-Pro将在5月底结束优惠后,永久降价至原价的四分之一。各大媒体瞬间被诸如“白菜价”、“夯爆了”的标题刷屏。看看这组惊人的新定价:每百万Token输出6元,输入(缓存未命中)3元,而输入(缓存命中)仅仅只要0.025元!

来自主题: AI技术研报
7348 点击    2026-05-28 09:51
DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek研究员陈德里,在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch,DeepSeek-V4-Pro研究和写作,GPT-Image2画图。论文共迭代6次(V1:4 次,V2:1 次,V3:1 次),总耗时6天,进行了约108轮Agent调用,消耗64.8万token,写了2234行LaTeX代码。

来自主题: AI资讯
9746 点击    2026-05-27 09:47