AI资讯新闻榜单内容搜索-Pixel

专访Reverie袁博地：从Google X到实时交互模型，重新定义下一代AI Interface

袁博地的答案是否定的。从清华大学接触计算机视觉，到 UC Berkeley 攻读 AI 博士，再到 Google X 负责机器人的视觉系统，袁博地过去十多年的研究几乎始终围绕 Pixel 展开：从图像识别，到 GAN、Diffusion，再到图像和视频生成，技术范式不断变化，研究对象却始终指向同一件事——如何让机器理解和生成视觉世界。

来自主题: AI资讯

9061 点击 2026-07-22 15:47

无需视觉 tokenizer，北大PRA解锁自回归图像生成潜力，135M模型性能反超1.9B基线

过去几年，扩散模型几乎定义了高质量图像生成：从随机噪声出发，经过多轮迭代，逐步 “雕刻” 出一张图像。但随着大语言模型席卷人工智能领域，另一条路线正迅速走到舞台中央 —— 图像，能否也像语言一样，通过自回归方式逐步生成？

来自主题: AI技术研报

7547 点击 2026-07-14 11:07

英伟达重新定义文生图最后一步：潜在表征直达4K，高精细节一步生成！

2K 图像 210ms 解码，4K 细节直接生成，传统「解码 + 超分」流水线可能要被重写了。

来自主题: AI技术研报

9913 点击 2026-06-08 14:50

谷歌AI不认识Google

今天，又有新的问题出现了，这一次是谷歌搜索。有用户发现，近日升级了 AI 能力的谷歌搜索在面对「google 里面有几个 P」这样的简单问题时竟然失败了！这件事引发广泛关注和测试热潮。我们也简单试了下，就算用汉语提问，谷歌搜索同样错误，而且还自行加戏，导致错上加错 —— 说 Pixel 里面有两个 P

来自主题: AI资讯

9769 点击 2026-05-28 20:57

像素绽放PixelBloom 完成C轮融资，全面发力AI办公解决方案Agent：从“一分钟生成PPT”到“交付商用级结果”

今日，像素绽放PixelBloom宣布完成C轮融资。本轮融资由国科投资与商汤国香资本联合领投，基石创投、大米创投跟投。资金将重点投入AI办公解决方案Agent的研发迭代、商业化落地及全球化人才招募。

来自主题: AI资讯

9985 点击 2026-05-09 10:35

何恺明带大二本科生颠覆扩散图像生成：扔掉多步采样和潜空间，一步像素直出

何恺明，再次出手精简架构。

来自主题: AI技术研报

7593 点击 2026-02-03 08:44

开源8300小时标注数据，新一代实时通用游戏AI Pixel2Play发布

来自 Player2 的研究员们提出了 Pixel2Play（P2P）模型，该模型以游戏画面和文本指令作为输入，直接输出对应的键盘与鼠标操作信号。在消费级显卡 RTX 5090 上，P2P 可以实现超过 20Hz 的端到端推理速度，从而能够真正像人类一样和游戏进行实时交互。P2P 作为通用游戏基座模型，在超过 40 款游戏、总计 8300 + 小时的游戏数据上进行了训练，

来自主题: AI技术研报

8993 点击 2026-01-18 15:01