
杨植麟和梁文锋,论文撞车了
杨植麟和梁文锋,论文撞车了在马斯克发布了他用20万张卡训出的Grok3的同一天,两篇与马氏大力出奇迹“相反”路线的论文也发表在了技术社区。在这两篇论文的作者名目里,各自有一个大家熟悉的名字:梁文锋,杨植麟。
在马斯克发布了他用20万张卡训出的Grok3的同一天,两篇与马氏大力出奇迹“相反”路线的论文也发表在了技术社区。在这两篇论文的作者名目里,各自有一个大家熟悉的名字:梁文锋,杨植麟。
DeepSeek新注意力机制论文一出,再次引爆讨论热度。
“我十分想见梁文锋。” DeepSeek火了之后,投资圈开始焦虑了。 根据“路边消息社”报道,“最近想要见DeepSeek创始人梁文锋,需要汇报到地方办公室。”根据报道,最近想要约见梁文锋的投资机构太多,为了保护这位AI大牛,想约见他的机构,需要先报到省委办公厅。
爆火的DeepSeek,足以载入史册。很多年后人们回想起这一刻,结论或许是从2022年底OpenAI发布ChaGPT,中国AI发展的主流叙事始终是“追赶”,而DeepSeek横空出世,将“追赶“变成了“创新”和“普及”,甚至是“重塑”和“超越”。
一个年过完,许多人的微信里都多了一个好友。与一些陪伴大家多年从不回复的沉默工具号不一样,这是一个事事有回应的AI助手。
梁文锋带领着DeepSeek,还在继续搅动大模型行业。继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。
2025年1月26日,拾象创始人兼CEO李广密,组织了一场关于 DeepSeek的闭门讨论会,嘉宾包括数十位顶尖AI研究员、投资人与一线 AI 从业者,围绕DeepSeek的技术细节、组织文化以及其出圈后的短中长期影响等,进行了探讨与学习。
梁文锋,一个出生于广东五线城市的80后,父亲是一名小学老师。尽管家境平凡,他却凭借卓越的才智和不懈的努力,书写了一段非凡的人生篇章。自小便对数学和计算机科学展现出浓厚兴趣的梁文锋,17岁那年以优异的成绩考入了浙江大学,主修软件工程,专攻人工智能方向。大学期间,他不仅学业优异,还积极参与科研项目,为自己的未来奠定了坚实的基础。
“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——刚刚,DeepSeek-R1跻身大模型竞技榜前三。以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。
一个来自中国的开源模型,让整个AI圈再次惊呼“来自东方的神秘力量”。 昨天,国内知名大模型创业公司“深度求索”通过官方公众号宣布上线并同步开源 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。