
阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%
阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。
既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。
大厂AI高层大换血,字节阿里招猛将
国补后7649(原价8999),雷鸟正式发布了带有定制大模型和全彩显示的AI眼镜——X3 Pro。
上下文长度达 13 万 token,适用于多段文档综合分析、金融、法律、科研等复杂领域任务。
美图要生态,阿里云要算力。
推理大模型开卷新方向,阿里开源长文本深度思考模型QwenLong-L1,登上HuggingFace今日热门论文第二。
AI红利已兑现,然后呢?又是一年财报季,AI毫无悬念成为互联网企业高频提及的关键词。
数字生命最靠谱的项目底座。就在这几天一个项目火了,就是叫做weclone。总的来说基于微信聊天记录来生成你的数字分身,现在开源了整个项目的技术是使用python来完成的,并且支持阿里同义千问2.5,现在已经有8.7K收藏了。
中国基础大模型市场,彻底变天了!如今牌桌上的玩家已经变成了「基模五强」——字节、阿里、阶跃星辰、智谱和DeepSeek。接下来的巅峰之战,关键制胜点又会在哪里?
最近阿里通义实验室应用视觉团队负责人薄列峰被曝离职,引起了一轮热议。而这已是继2月语音团队负责人鄢志杰、2024年8月大模型技术负责人周畅之后,阿里AI核心部门第三次失去关键人物了。