华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印
华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:
华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:
7月5日下午16:59分,隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于“抄袭”指控进行了官方回应。诺亚方舟实验室表示,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型
随着 AI Agent 技术的快速发展,业界许多企业开始在 Agent 方向进行深层次探索,而不仅仅是停留在“大模型 + 工具调用”的简单应用上。
阿里巴巴达摩院提出了 WorldVLA, 首次将世界模型 (World Model) 和动作模型 (Action Model/VLA Model) 融合到了一个模型中。WorldVLA 是一个统一了文本、图片、动作理解和生成的全自回归模型。
根据 Menlo Ventures 最新发布的《2025 年消费者 AI 现状报告》,全球已有 18 亿用户使用 AI 产品,付费转化率 3% 左右。行业领头羊 ChatGPT ,拥有 8 亿月活用户,付费转化率约 5%。C 端场景基数大且有一定的付费转化率,部分产品商业化渐入佳境。
大家好,我是小林,周一在阿里魔搭现场,听知乎创始人周源老师分享,有句话非常打动我: 开源不仅仅是技术,还有思想开源。
在阿里AI战略的中枢,有一个名字越来越频繁地被提及:吴嘉。
AI音效已经进化成这样了吗??
杭州AI陪诊公司,准备赴港IPO了!
就在昨夜,阿里带着全新多模态模型Qwen-VLo开启炸场模式。据介绍,Qwen-VLo在阿里原有的多模态理解和生成能力上进行了全面升级,具备三大亮点: