AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐
AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐随着大型视觉语言模型在多个下游任务的广泛应用,其潜在的安全风险也开始快速显露。研究表明,即便是最先进的大型视觉语言模型,也可能在面对带有隐蔽的恶意意图的图像 — 文本输入时给出违规甚至有害的响应,而现有的轻量级的安全对齐方案都具有一定的局限性。
随着大型视觉语言模型在多个下游任务的广泛应用,其潜在的安全风险也开始快速显露。研究表明,即便是最先进的大型视觉语言模型,也可能在面对带有隐蔽的恶意意图的图像 — 文本输入时给出违规甚至有害的响应,而现有的轻量级的安全对齐方案都具有一定的局限性。
过去一个周末 Gemini 3 Pro Image 的能力被反复「折磨」,花样越来越多——噢,你问这是什么,它的另一个名字是 Nano Banana 2。这么跟个恶搞一样的名字,居然被保留下来了。
Voyage AI Vet(以下简称 Voyage),一款「口袋兽医」的AI应用最近引起了我们的注意。不同于市面上那些套壳 ChatGPT 的聊天工具,Voyage 真的想用 AI 重塑宠物医疗。带着「给自家主子找个 24 小时私人医生」的期待,我们深度体验了这款产品。这一次,AI 带来的不是噱头,而是实打实的安全感。
2025年的AI世界,开始出现两种截然不同的声音。OpenAI忙着推出语音、视频、插件生态,想让每个人都用上ChatGPT;Anthropic在研究利润。最新预测显示,这家公司到2028年或将实现700亿美元营收、170亿美元自由现金流。同样是AI巨头,一个押注规模,一个押注稳定。AI的叙事,正在悄悄换频道。
因为成功手搓了一个成本不到5000元的“拼夕夕式”丐版硬件,原旷视6号员工、研究院助理院长范浩强终于下决心,在2025年投身具身智能创业。
2025年11月13日,一则消息在中国具身智能行业引发高度关注:星动纪元宣布完成新一轮融资,领投方是来自全球顶级的汽车制造巨头吉利汽车的吉利资本。据接近交易的人士透露,这笔投资是吉利资本在中国具身智能领域继宇树后的再次出手,更是其在全球范围内对该赛道的最大单笔投资。
扩散概率生成模型(Diffusion Models)已成为AIGC时代的重要基础,但其推理速度慢、训练与推理之间的差异大,以及优化困难,始终是制约其广泛应用的关键问题。近日,被NeurIPS 2025接收的一篇重磅论文EVODiff给出了全新解法:来自华南理工大学曾德炉教授「统计推断,数据科学与人工智能」研究团队跳出了传统的数值求解思维,首次从信息感知的推理视角,将去噪过程重构为实时熵减优化问题。
上线仅4天,下载量破百万!2天后再破两百万。
Beside 要解决的正是这个核心问题。他们并不是简单地在现有电话系统上加一层 AI,而是从底层重建了整个电话基础设施。这意味着他们能够直接接入电话网络,捕获每一通来电和短信,然后让 AI 在这些实时对话中发挥作用。
2025年11月,印度国会议员、前外交部国务部长沙希·塔鲁尔(Shashi Tharoor)在《印度教徒报》发表了一篇颇具影响力的专栏文章。文章中,他以“十字路口”为喻,描绘了印度IT产业的集体焦虑。