王力宏推出全球首支可交互AI音乐电影!网友:歌词能不能也用AI抢救一下?
王力宏推出全球首支可交互AI音乐电影!网友:歌词能不能也用AI抢救一下?520当天,王力宏发布了新单曲《Come What May》,同时上线了被称做“全球首支可交互AI音乐电影”的同名MV。
搜索
520当天,王力宏发布了新单曲《Come What May》,同时上线了被称做“全球首支可交互AI音乐电影”的同名MV。
5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」
智象未来正式发布基于新一代原生全模态模型架构 Unified Transformer(UiT)打造的图像大模型 HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模型,不仅在多个基准测试中刷新 SOTA 纪录,也标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。
当前,测试时扩展范式普遍致力于增加推理长度。然而,已有研究表明,随着推理长度的持续增长,以垂直扩展为核心的计算范式容易陷入探索僵化等问题。因此,从另一维度拓展推理的宽度显得尤为重要。K2.5、Step3-VL 和 LongCat-Flash-Thinking 等模型已在推理宽度方面开展了有益的探索。
2024 年 11 月,AI 生成的网络文章数量正式超过人类。Merriam-Webster 把「slop」选为 2025 年度词汇。当机器开始替人类说话,人类会不会忘记怎么思考?更麻烦的是,当人类停止书写,AI 用来学习的燃料也将一并耗尽。一场关于语言和思维的连环危机,正以多数人未曾警觉的速度展开。
机器人操作正在从结构化工业场景走向更开放的真实环境。相比完成单个预设动作,真实任务往往包含更长的执行链条、更复杂的物体交互,以及更多不可控的外部扰动。一次抓取没有完全夹稳、目标物体被轻微碰偏、双臂交接时姿态出现偏差,都可能让后续步骤偏离原本计划。
近日,谷歌在2026 I/O大会上发布了旗下AI for Science工具组合Gemini for Science。 该组合包含了谷歌旗下三款顶尖的AI科研工具,能实现假设生成、计算发现和文献综述的
今年的「全球无障碍宣传日」,苹果照例抢先官宣了将在下随 iOS 27 一同登场的新一批无障碍功能。相比过去几年,今年这批功能最明显的变化,是 AI 的存在感突然变强了, 并且一些新的特性,或许也直接提前「剧透」了 iOS 27 的系统级 AI 能力。
上个月,斯坦福大学、伦敦帝国理工学院和互联网档案馆(Internet Archive)联合发表了一篇论文。他们干了一件以前没人干过的事——结论是:到 2025 年年中,全球 35.3% 的新发布网页是 AI 生成或 AI 辅助的。
根据 Sensor Tower 发布的《2026 年全球 AI 应用趋势洞察》,2026 年第一季度,全球 AI 图像视频生成 App 的内购收入达到 1.5 亿美元,环比增长 20%,下载量达到 1.7 亿次,环比增长 12%,均超双位数。