AI资讯新闻榜单内容搜索-开源大模型

刚刚！华为首个开源大模型来了

刚刚，华为正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型（参见机器之心报道：华为盘古首次露出，昇腾原生72B MoE架构，SuperCLUE千亿内模型并列国内第一）和基于昇腾的模型推理技术。

来自主题: AI资讯

10903 点击 2025-06-30 09:19

中国首个海洋领域开源大模型OceanGPT(沧渊)发布！海洋精准感知技术全国重点实验室(浙江大学)牵头研发

该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发，具备基础的海洋专业知识问答，以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制，相较现有通用大模型能有效降低幻觉式错误。

来自主题: AI资讯

7734 点击 2025-06-29 17:03

不再担心AI“健忘”，北邮团队开源大模型记忆操作系统

随着大模型应用场景的不断拓展，其在处理长期对话时逐渐暴露出的记忆局限性日益凸显，主要表现为固定长度上下文窗口导致的“健忘”问题。

来自主题: AI资讯

10047 点击 2025-06-18 16:32

“Qwen3之后，我才真正敢投AI应用”

2025年4月29日凌晨，距离通义千问Qwen3正式发布还有5小时，X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新，等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯

9709 点击 2025-05-01 13:57

Qwen3真香！通义App满血接入，一手实测在此

开源大模型新王者，正在受到空前关注。

来自主题: AI产品测评

11098 点击 2025-04-30 19:40

终端云端三连发！无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

近日，无问芯穹发起了一次推理系统开源节，连续开源了三个推理工作，包括加速端侧推理速度的 SpecEE、计算分离存储融合的 PD 半分离调度新机制 Semi-PD、低计算侵入同时通信正交的计算通信重叠新方法 FlashOverlap，为高效的推理系统设计提供多层次助力。下面让我们一起来对这三个工作展开一一解读：

来自主题: AI技术研报

10155 点击 2025-04-30 08:50

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

阿里Qwen3凌晨开源，正式登顶全球开源大模型王座！它的性能全面超越DeepSeek-R1和OpenAI o1，采用MoE架构，总参数235B，横扫各大基准。这次开源的Qwen3家族，8款混合推理模型全部开源，免费商用。

来自主题: AI资讯

11293 点击 2025-04-29 08:49

途牛“AI助手小牛”正式上线

4月1日，途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与开源大模型（DeepSeek、通义千问），实现了机票、酒店、火车票快捷查询、预订服务，能够为用户提供智能、专业的“0搭售"旅游服务方案。

来自主题: AI资讯

9669 点击 2025-04-02 09:33

蚂蚁国产GPU训练大模型细节曝光！Ling模型研发负责人回应：关于我们抠FLOPS的一些点滴

蚂蚁开源大模型的低成本训练细节，疑似曝光！

来自主题: AI资讯

4991 点击 2025-03-28 10:14

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

12472 点击 2025-03-11 23:53