AI资讯新闻榜单内容搜索-开源大模型

终端云端三连发！无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

近日，无问芯穹发起了一次推理系统开源节，连续开源了三个推理工作，包括加速端侧推理速度的 SpecEE、计算分离存储融合的 PD 半分离调度新机制 Semi-PD、低计算侵入同时通信正交的计算通信重叠新方法 FlashOverlap，为高效的推理系统设计提供多层次助力。下面让我们一起来对这三个工作展开一一解读：

来自主题: AI技术研报

10856 点击 2025-04-30 08:50

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

阿里Qwen3凌晨开源，正式登顶全球开源大模型王座！它的性能全面超越DeepSeek-R1和OpenAI o1，采用MoE架构，总参数235B，横扫各大基准。这次开源的Qwen3家族，8款混合推理模型全部开源，免费商用。

来自主题: AI资讯

11774 点击 2025-04-29 08:49

途牛“AI助手小牛”正式上线

4月1日，途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与开源大模型（DeepSeek、通义千问），实现了机票、酒店、火车票快捷查询、预订服务，能够为用户提供智能、专业的“0搭售"旅游服务方案。

来自主题: AI资讯

10153 点击 2025-04-02 09:33

蚂蚁国产GPU训练大模型细节曝光！Ling模型研发负责人回应：关于我们抠FLOPS的一些点滴

蚂蚁开源大模型的低成本训练细节，疑似曝光！

来自主题: AI资讯

5317 点击 2025-03-28 10:14

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

13307 点击 2025-03-11 23:53

DeepSeek惊醒上海，输不起的人工智能之战

上海拥有全国1/3的人工智能重点企业、41%的智能芯片产能和日均处理的20PB级城市数据，却在2025年伊始遭遇了尴尬的叩问：一家总部杭州的初创公司DeepSeek横空出世，其开源大模型的开发者调用量在一周内突破微软亚洲研究院十年累积量，直接促成全球170个国家开发者建立起47万个衍生模型

来自主题: AI资讯

6668 点击 2025-02-10 20:21

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

在柏林工业大学的一场圆桌对话当中，奥特曼再一次谈到了DeepSeek，并大赞开源模型对世界的贡献。对话中，奥特曼还发表了对AGI的最新看法，透露了十足的信心，他认为，虽然会遇到阻碍和挑战，但他相信人类终将实现AGI。

来自主题: AI资讯

10481 点击 2025-02-09 09:16

罗福莉，北大毕业的DeepSeek天才美少女，从小镇青年成长为雷军亲自挖的AI大牛

2024年底，一则《雷军千万年薪挖角95后AI天才少女》的热搜引爆全网，让“罗福莉”这个名字再度成为热门话题。事实上，早在2019年，“八篇ACL论文”的佳绩就让她在硕士期间成为知乎上的风云人物。直通阿里星项目进入达摩院、开源大模型DeepSeek-V2的核心开发者、“天才AI美少女萝莉”……这些闪亮的头衔让人不禁好奇，这位95后女孩究竟有何特别之处？

来自主题: AI资讯

12324 点击 2025-02-05 11:25

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释

「工程师正在疯狂地分析 DeepSeek，试图从中复制任何可能的东西。」DeepSeek 开源大模型的阳谋，切切实实震撼着美国 AI 公司。最先陷入恐慌的，似乎是同样推崇开源的 Meta。

来自主题: AI资讯

8468 点击 2025-01-24 10:59

陶哲轩：通义千问QwQ奥数真厉害，开源大模型顶流

QwQ 具有神奇的推理能力。一个刚发布两天的开源模型，正在 AI 数学奥林匹克竞赛 AIMO 上创造新纪录。

来自主题: AI技术研报

8985 点击 2024-11-30 16:34