ICLR 2026 Oral | 没人诱导,大模型也会「骗人」
ICLR 2026 Oral | 没人诱导,大模型也会「骗人」新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文,把视角放在了一个更贴近日常使用场景的问题上:人们更熟悉的,是用户故意诱导模型说假话的情形;而这篇工作真正追问的是,在没有刻意诱导、只是正常提问的情况下,模型会不会也出现某种 “表面这样答,实际那样想” 的现象。
搜索
新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文,把视角放在了一个更贴近日常使用场景的问题上:人们更熟悉的,是用户故意诱导模型说假话的情形;而这篇工作真正追问的是,在没有刻意诱导、只是正常提问的情况下,模型会不会也出现某种 “表面这样答,实际那样想” 的现象。
Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架,该方法是一种通用的验证机制,可与任意Agent Harness和模型结合。
允中 发自 凹非寺 量子位 | 公众号 QbitAI 这两天,大家伙朋友圈是不是被GPT-Image-2刷屏了? 文字渲染精准、高密度的信息图,复杂布局和美学UI一次到位,真实感爆棚。 连社交媒体截图
上次 Ribbi 刚开始内测的时候,好友 Joanna 就给了我邀请,东忙西忙没来得及体验,这两天玩上了,也是感受到了这个小青蛙的魅力了。
这个生物医学视觉推理框架,被CVPR 2026接收了!
如果你眼睛又干又痒、眼皮还有点发红?大概率是看屏幕太久、蓝光晒的。
IPO前夕,OpenAI一天流失三位高管!Sora创始人Bill Peebles,他负责的Sora已经直接被关停,团队转移到别的方向。AI for Science副总裁Kevin Weil,他的团队被拆分并入其他研究组。
近日,OpenAI Codex产品负责人Alexander Embiricos与开发者体验负责人Romain Huet做客Peter Yang的播客,围绕Codex团队的产品开发实践、产品规划、AI对职业的重塑,以及团队协作与招聘理念等核心问题展开了深度对话,还提到了前段时间加入OpenAI的龙虾之父Peter Steinberger。
巨头亚马逊,也深度入局生命科学了。
如果你是一家连年亏损、销售额腰斩、连线下门店都要全部关停的卖鞋公司,你要怎么做才能让公司股价在一天之内原地起飞,暴涨 700%?答案是停止卖鞋,然后大声喊出那五个拥有起死回生魔力的字母:AI+GPU。