全网都在扒的DeepSeek团队,是清北应届生撑起一片天
全网都在扒的DeepSeek团队,是清北应届生撑起一片天DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。
DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。
继电动车、消费品之后,中国团队又在AI领域上演了一出“成本屠夫”的好戏。
但咱觉得吧,显卡还是很重要的
2024年,我们居然进步这么大。
没有GPU Poor,只有卷得不够多。 DeepSeek-V3的横空出世,用一组惊人的数据完美诠释了这句话。
国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。
在上一篇的评论区里,大家发生了争吵: 《DeepSeek-V3 是怎么训练的|深度拆解》 有的读者指出:DeepSeek V3 有“训练数据抄袭”的问题。
昨天写完DeepSeek-V3的文章,看到一段吐槽: OpenAI 是一家以创造先进人工智能技术为目标的公司。DeepSeek-V3,是在一个开源系统上进行性能和成本效益优化的。看起来有点偷懒。
大模型的的发布固然令人欣喜,但是各类测评也是忙坏了众多 AI 工作者。大模型推理的幻觉问题向来是 AI 测评的重灾区,诸如 9.9>9.11 的经典幻觉问题,各大厂家恨不得直接把问题用 if-else 写进来。
雷军再次出手,以千万级薪酬招揽DeepSeek核心研究员、95后AI天才罗福莉。这位曾在国际顶会一次性发表8篇论文的技术大牛,有望领军小米AI大模型团队。