
DeepSeek技术解析:如何冲击英伟达两大壁垒?
DeepSeek技术解析:如何冲击英伟达两大壁垒?DeepSeek的V3模型仅用557.6万的训练成本,实现了与OpenAI O1推理模型相近的性能,这在全球范围内引发连锁反应。由于不用那么先进的英伟达芯片就能实现AI能力的飞跃,英伟达在1月27日一天跌幅高达17%,市值一度蒸发6000亿美元。
DeepSeek的V3模型仅用557.6万的训练成本,实现了与OpenAI O1推理模型相近的性能,这在全球范围内引发连锁反应。由于不用那么先进的英伟达芯片就能实现AI能力的飞跃,英伟达在1月27日一天跌幅高达17%,市值一度蒸发6000亿美元。
“如何用DeepSeek赚到100万”“DeepSeek带你躺着赚钱”......在社交媒体上,频频能看到教你如何用DeepSeek实现一夜暴富,在淘宝、闲鱼等平台上,不少商家打着“本地部署”的概念兜售DeepSeek接入教程,标价最高达到10万元,最低仅有0.01元。
现在,要想往视频里毫无违和感地添加任何东西,只需一张图就够了。
欧洲OpenAI”Mistral AI有新动作了! Le Chat(法语“猫”)全新升级,官方自称它是“您生活和工作的终极AI助手”。
在竞争激烈的游戏行业,创新技术一直是重塑着行业格局的关键,而最近几年,AI无疑是风口上的香饽饽,全球范围内各种创业团队更是如雨后春笋般涌现
IEEE/CVF国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一,将于今年 6月11日至6月15日在美国田纳西州举行。
近日有媒体报道称,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。
今年爆火的国产AI应用DeepSeek化身最火爆的赛博算命师,各种东西方玄学,如《三命通会》、《滴天髓》、《渊海子平》这些你压根没听过的书籍,只需要它“深度思考”几秒钟就能手到擒来。
在整个春节期间,DeepSeek的一夜爆火令人印象深刻,无论公域还是私域场合都随处听到讨论它的声音。而我们注意到其开发商杭州深度求索人工智能基础技术研究有限公司是一家成立仅一年半的新公司 (背后的量化私募公司运营时间较久) 。
AI的新进展频频,人才动态也愈加重磅。 新年第一则大牛人事动向,引发业内关注。 许主洪,IEEE Fellow,新加坡管理大学终身教授,被曝加盟阿里。
在蛇年春晚中,宇树科技研发的人形机器人身穿东北特色的花棉袄,扭秧歌转手绢,人机共舞的场面让观众印象深刻。这次舞台,再次将具身智能推至聚光灯下。
各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。
阿里系第一个吃上DeepSeek“螃蟹”的出现了——钉钉:已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的R1、V3等三种模型!
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。
刚刚,AI大牛吴恩达官宣创业公司新成果——Agentic Object Detection
尽管多模态大语言模型(MLLM)在简单任务上最近取得了显著进展,但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻:只有掌握推理过程的每一步,才能真正解决问题。然而,当前的 MLLM 更擅长直接生成简短的最终答案,缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM,以实现问题的深入理解与解决。
SANA 1.5是一种高效可扩展的线性扩散Transformer,针对文本生成图像任务进行了三项创新:高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本,还在生成质量上达到了最先进的水平。
新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提高智能语音任务的准确率和效率。
一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。在那个瞬间,模型学会了自我反思等涌现技能,帮助它进行上下文搜索,从而解决复杂的推理问题。
DeepSeek带火知识蒸馏,原作者现身爆料:原来一开始就不受待见。称得上是“蒸馏圣经”、由Hinton、Oriol Vinyals、Jeff Dean三位大佬合写的《Distilling the Knowledge in a Neural Network》,当年被NeurIPS 2014拒收。
适应性是自然界最引人注目的现象之一。从章鱼改变皮肤颜色以融入周围环境的方式,到人类 大脑在受伤后如何自我重塑,使个体能够恢复失去的功能并适应新的思维或运动方式。生物体表现出适应性,使生命能够在多样化和不断变化的环境中蓬勃发展。
2025年,软件工程要彻底变天了。先有奥特曼预言,后有微软下场All in智能体。刚刚,首个自主SWE智能体面世,不仅会主动改bug修复错误,还能自主提交PR评论。
有时,当某项技术变得更便宜时,反而会促使整体投入增加。我认为,从长期来看,人类对智能和算力的需求几乎没有上限,因此我仍然看好AI计算需求的持续增长。我认为DeepSeek-R1在地缘政治上的影响尚有待厘清,同时它也为AI应用开发者带来了巨大机遇。
最新消息 OpenAI 本周宣布计划向加州州立大学 23 个校区的 46 万名学生和 6.3 万名教职员工推出ChatGPT。这款以教育为重点的人工智能助手,旨在为学生提供个性化的辅导和学习指南,而教师则可以使用它来完成行政工作。
春节假期后的港股市场迎来结构性行情,以AI大模型为核心的技术革命再次成为资金追逐焦点,这次的落脚点在AI应用的商业化之中。
2024年,在冰火两重天的融资环境下,OpenAI和马斯克的xAI都筹集了超过100亿美元。如无意外,2025年,巨额融资和昂贵估值的造富神话,仍然将尽数来自于生成式AI赛道。
AI+机器人、AI+大数据、AI+基因技术......当AI与诸多新兴产业结合,常常激发出强大的创新能量,但若是AI+传统行业的中医,又会碰撞出怎样的火花呢?
我是2024年7月毕业的博士,找工作是从2023年农历新年之后开始的,我一般只和主动联系上来的公司聊,最开始联系到的,是华为计算产品线的计算研究部昇腾和鲲鹏lab,随后联系的有上海人工智能实验室,幻方AI(年底改名为deepseek)。
A 股蛇年首个交易日,DeepSeek 概念股上演涨停潮,AI 主题基金净值也水涨船高。2 月 6 日,A 股三大指数低开高走,截至午间休盘,全部翻红。
春节期间,互联网上最火的不是春晚小品,也不是春节档电影,而是 DeepSeek。