
让AI作画自己纠错!随机丢模块就能提升生成质量,告别塑料感废片
让AI作画自己纠错!随机丢模块就能提升生成质量,告别塑料感废片AI作画、生视频,可以「自己救自己」了?! 当大家还在为CFG(无分类器引导)的参数搞到头秃,却依然得到一堆“塑料感”废片而发愁时,来自清华大学、阿里巴巴AMAP(高德地图)、中国科学院自动化研究所的研究团队,推出全新方法S²-Guidance (Stochastic Self-Guidance)。
AI作画、生视频,可以「自己救自己」了?! 当大家还在为CFG(无分类器引导)的参数搞到头秃,却依然得到一堆“塑料感”废片而发愁时,来自清华大学、阿里巴巴AMAP(高德地图)、中国科学院自动化研究所的研究团队,推出全新方法S²-Guidance (Stochastic Self-Guidance)。
2025 是 Agent 元年,十位创业者有八位都在造 Agent。十字路口过去几个月做了大量相关的访谈与评测,发现决定 Agent 能力上限的,不止模型本身,也不止工程和交互的打磨,基础设施也至关重要——Agent Infra。
集成全球顶尖的编程模型、最强的上下文工程能力,可一次检索10万个代码文件。阿里全新AI代码编辑器Qoder表示——它可以理解整个代码库,并交付真正适合的代码。
人在从杭州回北京的路上,想趁着脑子里的记忆还火热的时候,写下一些感悟。
继通义灵码的 Lingma IDE 之后,阿里在海外推出另一款 Agent Coding 产品。据官方介绍,Qoder (/ˈkoʊdər/) 是一个专为真实软件开发而设计的 Agent Coding 平台(所以谁不真实?)
今天凌晨,阿里推出了最新图像编辑模型 Qwen-Image-Edit!该模型基于 200 亿参数的 Qwen-Image 架构构建,支持中英文双语精准文本编辑,在保持原有风格的同时完成修改。此外,Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),兼具语义与外观的双重编辑能⼒。
全世界可能是第一个,能做生意的Agent来了。 这,就是阿里国际站最近升级的Accio Agent。
8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。
做出AI时代的LABUBU,成了大厂们的目标之一。不过就AI玩具来说,技术是加分项,但并不是核心。想做出下一个LABUBU,要在技术成本和情感溢价中找到平衡。 在2025年下半年,大厂的AI争夺战已经卷到了玩具上。
据申妈朋友圈报道,原阿里通义千问语音团队负责人、前腾讯AI Lab副主任鄢志杰,已于近期正式加盟京东探索研究院