OpenClaw的风刮到了多模态生成,6B小模型超越Nano Banana 2!
OpenClaw的风刮到了多模态生成,6B小模型超越Nano Banana 2!近日,上海人工智能实验室联合南京大学、香港中文大学及上海交通大学,将OpenClaw的成功应用于多模态生成领域。他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。
近日,上海人工智能实验室联合南京大学、香港中文大学及上海交通大学,将OpenClaw的成功应用于多模态生成领域。他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。
2023 年,AI 生成的成人内容数量暴涨了 500%。同年,所有新增的成人素材里,有 25% 是 AI 造的。根据经济学人数据,AI 成人行业的规模在 2025 年大概 25 亿美元,这个数字往回倒 1 年是 1.5 亿美元,一年暴增 20 倍以上。AI 成人妥妥的「高速暴增品类」。
近日,京东开源图像模型JoyAI-Image-Edit,将空间智能纳入图像理解与编辑,让AI开始处理真实世界中的空间关系,让模型真正“理解空间,编辑空间”。简单解释,这是一个以空间智能为核心的图像生成与编辑模型,让 AI 真正“看懂”三维空间,从而让生成更合理、编辑更精准。
4 月 10 日,MiniMax 又带来一次重磅更新,其中最核心的新功能,就是 Cover 翻唱。一首平平无奇的生日快乐歌,可以被 cover 成 EDM 风格:经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调:
哦豁,马斯克一个“不小心”,把Claude参数抖出来了???长话短说:Sonnet 1T、Opus 5T。起因是老马发帖表示,xAI的Colossus 2超算正在训练7个模型,其中最大的一款,参数量直接冲到了10万亿。
HiVG是一个面向SVG生成的层次化分词框架,在减少63.8% token数量的同时,以仅3B参数在多项指标上超越所有开源SVG模型和GPT-5.2等闭源模型。仅3B参数的HiVG,在SVG生成任务中多项指标超越了GPT-5.2、Claude-4.5-Sonnet等闭源模型。
2026 年第一季度,它和另外四种完全不同的 Agent 产品形态在同一个窗口期同时冒了出来。OpenClaw 走个人助理、Cowork 走办公协作、Codex App 走长程工程任务、Perplexity Computer 走统一工作站、腾讯云 ADP 走企业平台。
最近,计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。
最近,来自Meta与University of Copenhagen的研究者提出了OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory(收录于CVPR 2026)。这项工作聚焦于一个核心问题:如何在生成多镜头视频时,有效保留长程跨镜头上下文,从而实现更强的叙事一致性。
到了创业第 12 年,王仕锐忽然觉得过去大多事情毫无意义。他学医 8 年,经历过互联网、移动互联网两轮技术改造医疗的潮流,当过医生、做过医生社区,最高时开过 300 家线下医疗机构和药店,是第一批拿到互联网医院牌照的公司,年营收最高时超过百亿元。“像上辈子的事。” 他提起过去时语速拖慢、声音变低,用 “最低算力” 的状态面对提问,“我有一个超级牛的目标要冲,这辈子不可能有更牛的事了”。