Gemini 3,是谢尔盖・布林「骂」出来的?
Gemini 3,是谢尔盖・布林「骂」出来的?当 ChatGPT 在 2022 年底横空出世时,整个科技行业都被这股突如其来的对话式 AI 浪潮震得措手不及。
当 ChatGPT 在 2022 年底横空出世时,整个科技行业都被这股突如其来的对话式 AI 浪潮震得措手不及。
最新研究发现,只要把恶意指令写成一首诗,就能让Gemini和DeepSeek等顶尖模型突破安全限制。这项针对25个主流模型的测试显示,面对「诗歌攻击」,百亿美金堆出来的安全护栏瞬间失效,部分模型的防御成功率直接归零。最讽刺的是,由于小模型「读不懂」诗里的隐喻反而幸免于难,而「有文化」的大模型却因为过度解读而全线破防。
在推荐系统迈向多模态的今天,如何兼顾数据隐私与个性化图文理解?悉尼科技大学龙国栋教授团队联合香港理工大学杨强教授、张成奇教授团队,提出全新框架 FedVLR。该工作解决了联邦环境下多模态融合的异质性难题,已被人工智能顶级会议 AAAI 2026 接收为 Oral Presentation。
刚刚,Claude Opus 4.5问世,主打编码、Agent与computer use。Opus 4.5在前端开发、视觉能力上显著提升,更擅长使用电脑。在深度研究、PPT制作与电子表格处理等日常任务方面的表现也全面升级。
新的资金和算力基础设施将加速 Luma AI 通往多模态 AGI 的路径 —— 即能够模拟现实并在物理世界中帮助人类的 AI。
当北大哲学博士用「美学」驯化了AI,程序员的战场也变成了「艺术家」的乐园。在AI时代,人类独特的审美力或许才是无法被代码取代的终极护城河。
图像与视频重光照(Relighting)技术在计算机视觉与图形学中备受关注,尤其在电影、游戏及增强现实等领域应用广泛。当前,基于扩散模型的方法能够生成多样且可控的光照效果,但其优化过程通常依赖于语义空间,而语义上的相似性无法保证视觉空间中的物理合理性,导致生成结果常出现高光过曝、阴影错位、遮挡关系错误等不合理现象。
随着大型视觉语言模型在多个下游任务的广泛应用,其潜在的安全风险也开始快速显露。研究表明,即便是最先进的大型视觉语言模型,也可能在面对带有隐蔽的恶意意图的图像 — 文本输入时给出违规甚至有害的响应,而现有的轻量级的安全对齐方案都具有一定的局限性。
过去一个周末 Gemini 3 Pro Image 的能力被反复「折磨」,花样越来越多——噢,你问这是什么,它的另一个名字是 Nano Banana 2。这么跟个恶搞一样的名字,居然被保留下来了。
Voyage AI Vet(以下简称 Voyage),一款「口袋兽医」的AI应用最近引起了我们的注意。不同于市面上那些套壳 ChatGPT 的聊天工具,Voyage 真的想用 AI 重塑宠物医疗。带着「给自家主子找个 24 小时私人医生」的期待,我们深度体验了这款产品。这一次,AI 带来的不是噱头,而是实打实的安全感。