AI资讯新闻榜单内容搜索-DeepSeek-V

省钱也是技术活：解密DeepSeek的极致压榨术

没有GPU Poor，只有卷得不够多。 DeepSeek-V3的横空出世，用一组惊人的数据完美诠释了这句话。

来自主题: AI资讯

7944 点击 2025-01-02 10:19

在上一篇的评论区里，大家发生了争吵：《DeepSeek-V3 是怎么训练的｜深度拆解》有的读者指出：DeepSeek V3 有“训练数据抄袭”的问题。

来自主题: AI资讯

6591 点击 2024-12-31 12:49

昨天写完DeepSeek-V3的文章，看到一段吐槽： OpenAI 是一家以创造先进人工智能技术为目标的公司。DeepSeek-V3，是在一个开源系统上进行性能和成本效益优化的。看起来有点偷懒。

来自主题: AI资讯

12345 点击 2024-12-31 10:10

雷军再次出手，以千万级薪酬招揽DeepSeek核心研究员、95后AI天才罗福莉。这位曾在国际顶会一次性发表8篇论文的技术大牛，有望领军小米AI大模型团队。

来自主题: AI资讯

8203 点击 2024-12-29 17:55

一个来自中国的开源模型，让整个AI圈再次惊呼“来自东方的神秘力量”。昨天，国内知名大模型创业公司“深度求索”通过官方公众号宣布上线并同步开源 DeepSeek-V3模型，并公布了长达53页的训练和技术细节。

来自主题: AI资讯

7805 点击 2024-12-29 10:50

在 2024 年底，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了最新的混合专家（MoE）语言模型 DeepSeek-V3-Base。虽然，目前没有放出详细的模型卡，但官方开源了V3的技术文档PDF。

来自主题: AI资讯

8222 点击 2024-12-27 14:35

还没等到官宣，Deepseek-v3竟意外曝光了？！

来自主题: AI资讯

9238 点击 2024-12-26 16:07

阔别九月，大家期待的 DeepSeek-VL2 终于来了！DeepSeek-MoE 架构配合动态切图，视觉能力再升级。从视觉定位到梗图解析，从 OCR 到故事生成，从 3B、16B 再到 27B，DeepSeek-VL2 正式开源。

来自主题: AI技术研报

11364 点击 2024-12-14 10:17

开源大模型领域，又迎来一位强有力的竞争者。

来自主题: AI技术研报

11036 点击 2024-05-07 18:24

最新国产开源MoE大模型，刚刚亮相就火了。

来自主题: AI技术研报

7431 点击 2024-05-07 18:09