2万元就能“驯服”AI三个月,谁在给AI投喂“垃圾”?
2万元就能“驯服”AI三个月,谁在给AI投喂“垃圾”?让AI推荐一款家用车、一款新手机,甚至一家本地餐厅,10秒钟,看起来无所不知的AI就能迅速给出“智能推荐”名单。然而这份看起来客观中立的答案,背后可能早已被“精心策划”过。
让AI推荐一款家用车、一款新手机,甚至一家本地餐厅,10秒钟,看起来无所不知的AI就能迅速给出“智能推荐”名单。然而这份看起来客观中立的答案,背后可能早已被“精心策划”过。
REG 是一种简单而有效的方法,仅通过引入一个 class token 便能大幅加速生成模型的训练收敛。其将基础视觉模型(如 DINOv2)的 class token 与 latent 在空间维度拼接后共同加噪训练,从而显著提升 Diffusion 的收敛速度与性能上限。在 ImageNet 256×256 上,
深圳的冬天依然晴朗无云。站在 2025 IDEA 大会的会场,我今年最大的感受是大会现场有关「AGI 焦虑」变少了,对 AI 落地的「颗粒度」变细了。与去年相比,人们不再讨论 AGI 到底什么时候到来,不再充斥着对参数规模的盲目崇拜,而是更关注如何让 AI 带来更多的价值。
Google 前天发布了 Antigravity,一款号称“下一代 agentic 开发平台”的全新 IDE。官方宣传强调它能规划、执行、验证整个开发流程,似乎代表着 AI 编程进入了新的阶段。然而,最早一批上手使用的开发者却纷纷吐槽:任务跑着跑着就因“模型过载”中断,信用额度几十分钟内耗尽,连完整测试都难以完成,体验堪称“开局即崩”。
刚刚,一个名为 Whisper Thunder (aka) David 的神秘模型登上了 Artificial Analysis 视频榜榜首,超越了 Veo 3、Veo 3.1、Kling 2.5 以及 Sora 2 Pro 等目前市面上所有公开的 AI 视频模型。
今年 6 月,AI 玩具赛道上热度很高的“芙崽 Fuzozo”(下文统一简称 Fuzozo)正式上线京东开卖,这个毛绒绒的挂饰吸引不少消费者,目前 Fuzozo 在京东 AI 玩具热卖榜上位列第二,据商业观察媒体“豹变”调查到的数据显示,Fuzozo 的月销量可达 2 万台以上。
具身智能的「ChatGPT时刻」还没到,机器人的「幻觉」却先来了?在需要几十步操作的长序列任务中,现有的VLA模型经常「假装在干活」,误以为任务完成。针对这一痛点,北京大学团队提出自进化VLA框架EvoVLA。该模型利用Gemini生成「硬负样本」进行对比学习,配合几何探索与长程记忆,在复杂任务基准Discoverse-L上将成功率提升了10.2%,并将幻觉率从38.5%大幅降至14.8%。
人工智能在过去的十年中,以惊人的速度革新了信息处理和内容生成的方式。然而,无论是大语言模型(LLM)本体,还是基于检索增强生成(RAG)的系统,在实际应用中都暴露出了一个深层的局限性:缺乏跨越时间的、可演化的、个性化的“记忆”。它们擅长瞬时推理,却难以实现持续积累经验、反思历史、乃至真正像人一样成长的目标。
如果说过去一年里,AI 让开发者生产力翻倍,那么如今它也开始以同样的速度放大风险。 上周,Google 刚刚推出的基于 Gemini 的全新 AI 编码工具 Antigravity,上线不到 24 小时便被一名安全研究员攻破,指出它存在严重的安全Bug。
整个 2025年,至少两款以二次元为目标用户群、产品形态类似数字手办的 AI 桌面陪伴硬件在海外取得了不错的众筹成绩:「CODE27 Character Livehouse」于 4月在 Kickstarter 开启众筹,最终获得 3500 人支持,众筹金额超过 180 万美元;