仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了
仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了为什么大模型厂商给了 128K 的上下文窗口,却在计费上让长文本显著更贵?
为什么大模型厂商给了 128K 的上下文窗口,却在计费上让长文本显著更贵?
抽奖式的生图体验,确实让很多设计师在尝鲜之后又默默打开了 Photoshop。于是乎,阿里千问团队再次出手,开源了一个叫 Qwen-Image-Layered 的模型,试图从底层逻辑上解决这个问题。
人人都能创作视频的时代来了。
坏了,阿里这波是冲着Sora 2去的!
有创意,就能人人当导演的时代真的来了。
如果把用户在互联网上留下的每一个足迹都看作一段记忆,那么现在的推荐系统大多患有 “短期健忘症”。
昨天,苹果一篇新论文在 arXiv 上公开然后又匆匆撤稿。原因不明。论文中,苹果揭示了他们开发的一个基于 TPU 的可扩展 RL 框架 RLAX。是的,你没有看错,不是 GPU,也不是苹果自家的 M 系列芯片,而是谷歌的 TPU!还不止如此,这篇论文的研究中还用到了亚马逊的云和中国的 Qwen 模型。
2025 年 12 月,由 阿里巴巴 联合 中国科学技术大学、浙江大学等机构共同研发的实时虚拟人项目 LiveAvatar 正式对外开源。该项目聚焦长期困扰虚拟人行业的两大技术瓶颈——“实时响应能力”与“长时稳定生成能力”,首次在同一系统中实现了二者的工程级统一。
Meta的开源时代,要结束了。彭博社爆料,明年春季,Meta将发布一款代号为「Avocado(牛油果)」的模型。而这款新模型,很可能是「闭源」的。但如果仅仅是闭源,还不至于如此引人注目。真正让市场炸裂的是另一条更劲爆的消息:这款闭源模型,竟然在训练过程中使用了阿里巴巴的AI。
作为中国最大的B2B供应链平台,阿里巴巴集团旗下源头厂货平台1688今年几乎以「梭哈」的决心押注和布局AI。继1688 AI版App、1688诚信通AI版等一系列AI原生产品后,1688近日又发布了一个跨境电商AI智能体——遨虾(alphashop.cn)。