DeepSeek R1 Zero中文复现教程来了!
DeepSeek R1 Zero中文复现教程来了!各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。
各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。
新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提高智能语音任务的准确率和效率。
DeepSeek带火知识蒸馏,原作者现身爆料:原来一开始就不受待见。称得上是“蒸馏圣经”、由Hinton、Oriol Vinyals、Jeff Dean三位大佬合写的《Distilling the Knowledge in a Neural Network》,当年被NeurIPS 2014拒收。
2025年,软件工程要彻底变天了。先有奥特曼预言,后有微软下场All in智能体。刚刚,首个自主SWE智能体面世,不仅会主动改bug修复错误,还能自主提交PR评论。
最新消息 OpenAI 本周宣布计划向加州州立大学 23 个校区的 46 万名学生和 6.3 万名教职员工推出ChatGPT。这款以教育为重点的人工智能助手,旨在为学生提供个性化的辅导和学习指南,而教师则可以使用它来完成行政工作。
2024年,在冰火两重天的融资环境下,OpenAI和马斯克的xAI都筹集了超过100亿美元。如无意外,2025年,巨额融资和昂贵估值的造富神话,仍然将尽数来自于生成式AI赛道。
我是2024年7月毕业的博士,找工作是从2023年农历新年之后开始的,我一般只和主动联系上来的公司聊,最开始联系到的,是华为计算产品线的计算研究部昇腾和鲲鹏lab,随后联系的有上海人工智能实验室,幻方AI(年底改名为deepseek)。
A 股蛇年首个交易日,DeepSeek 概念股上演涨停潮,AI 主题基金净值也水涨船高。2 月 6 日,A 股三大指数低开高走,截至午间休盘,全部翻红。
《智能涌现》独家获悉,「乐享科技」在近期已经完成其天使轮融资,由IDG资本领投,Monolith、经纬创投、真格基金、红杉种子基金、绿洲资本跟投,融资总金额接近2亿元人民币,投后估值约为6亿元。本轮融资后,乐享科技将继续投入到第一款产品的研发,以及团队的搭建及技术储备。
今天,我想用一些数据,来盘点2024年各家银行的大模型项目招标结果。