商汤开源全新架构的理解生成统一模型SenseNova-U1,复刻GPT-Image-2生图绝活
商汤开源全新架构的理解生成统一模型SenseNova-U1,复刻GPT-Image-2生图绝活商汤刚刚开源了一个全新架构的理解生成统一模型SenseNova-U1,虽然小尺寸版本只有8B,却能复刻不少GPT-Image-2的拿手绝活。太阳系图解,八大行星各自的轨道、属性、图文介绍一应俱全,看着挺像那么回事。
商汤刚刚开源了一个全新架构的理解生成统一模型SenseNova-U1,虽然小尺寸版本只有8B,却能复刻不少GPT-Image-2的拿手绝活。太阳系图解,八大行星各自的轨道、属性、图文介绍一应俱全,看着挺像那么回事。
就在这一背景下,银河通用联合清华北大英伟达等众多机构联合发布了跨本体「隐式世界-动作基础模型」LDA-1B,将目光投向了具身智能 Scaling Law 的这个终极命题:如何让模型有效利用互联网规模的异构数据。
没错,用的就是主打长程任务、模糊指令遵循,跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列,包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型,综合实力对标国际顶尖水准。
红警不再只是童年游戏,而成了AI Agent的硬核训练场:OpenRA-RL把25Hz实时战场、50个工具调用和64局并发打包开源,让大模型第一次真正站上RTS战争迷雾里的公开考场。
在语言学中,人类之所以能听懂“那个东西”、“它”、“这个重物”,依赖于桥接推理理论 (bridging inference),即通过上下文信息在已有记忆与当前表达之间建立联系,从而恢复指代对象。
最近,AI教父Hinton发出最尖锐警告:不受监管的AI就是一辆没有方向盘的高速跑车!全球只有1%的AI研究在做安全,4.8万亿美元的巨兽正在失控加速。
瓜多到一度吃不下的ICLR 2026,这几天终于在巴西开线下了!!没去不要紧,最热闹最好玩的,咱都已经总结好了:随机一个场景都有可能“掉落”LeCun这位巨佬NPC,学术追星人纷纷带着合照意满离;
新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文,把视角放在了一个更贴近日常使用场景的问题上:人们更熟悉的,是用户故意诱导模型说假话的情形;而这篇工作真正追问的是,在没有刻意诱导、只是正常提问的情况下,模型会不会也出现某种 “表面这样答,实际那样想” 的现象。
四月真是如风驰电掣:Anthropic 发布了 Opus 4.7,OpenAI 发布了 GPT 5.5,最后,DeepSeek 更新了暌违已久的 V4。三家公司的发布通稿读起来都差不多:跑分又涨了,上下文更长了,推理更强了,代码能力又创了新高。
科技博主兼 AI 系统架构师 Sean Donahoe 在今天凌晨发了一条帖子。他写道:这条帖子实际上有两个看点。第一,发帖人是重度 AI 编程用户,却几乎一夜之间完成迁移,月账单会从几千美元降到几百美元。第二,他不只是说便宜,还强调效果没有变差,反而更好:“输出质量提高了,而不是下降,这一点已经通过内部测试以及多个公开基准验证”。
主要作者团队:Yuxin Chen 现为伊利诺伊大学厄巴纳 - 香槟分校(UIUC)硕士一年级学生,Chumeng Liang 为 UIUC 博士一年级学生,Hangke Sui 为 UIUC 博士二年级学生,Ge Liu 为 UIUC 计算机系助理教授。Liu Lab 团队长期聚焦扩散 / 流模型方向,
近日,琶洲实验室、华南理工大学、蔻町(AIGCode)等单位科研团队联合提出潜在空间压缩注意力(Latent-Condensed Attention,LCA),研究成果入选 ACL 2026。
4月20日,最高人民法院副院长陶凯元在2026年知识产权宣传周新闻发布会上,说了一句被很多人忽略的话:「数据、人工智能等新兴领域技术迭代快,权利边界和权属相对复杂,保护规则亟需明确。人民法院妥善审理涉AI生成内容、AI模型参数等前沿问题的民事案件……最高人民法院正在抓紧起草关于依法妥善审理涉人工智能纠纷案件的意见,努力推动人工智能朝着有益、安全、公平的方向健康有序发展。」
根据《华尔街日报》报道,在中国国家发改委于周一要求撤销相关收购交易后,Meta 正在准备撤销对 Manus 的收购。
AlphaGo 之父 David Silver 创办的 Ineffable Intelligence 获 11 亿美元种子轮,创欧洲融资纪录,估值达 51 亿美元。这家公司押注强化学习和自我经验学习,试图挑战依赖 Scaling Law 的大模型主线。
以自然启发式 AI 算法闻名的 Sakana AI 宣布,其全新商用 AI 产品——多智能体编排系统「Sakana Fugu」正式开启 Beta 测试。
作为一个提供AI Workforce的新产品,Helio(https://helio.im) 正在做像人的 AI,而不是给人用的 AI 工具,要让 AI 同事成为团队的原住民。
花了2天时间,在Moxt上搓了一个免费产品出来,叫 烤模。产品地址 bestmodel.cc。在烤模上,你能看到每个模型过去48小时里,真实用户在各个平台说了些什么。惊艳的案例、好评、差评、口碑走势、关键节点、多维度评分,全都有。
社交网络应用 Series 宣布已筹集 510 万美元的种子前轮融资,投资者包括 Venmo 联合创始人 Iqram Magdon-Ismail、Pear VC、Reddit 首席执行官 Steve Huffman 以及 GPTZero 创始人 Edward Tian。该公司由耶鲁大学学生 Nathaneo Johnson 和 Sean Hargrow 于去年初创立,两人目前仍在该校就读大四。
昨天,我去了百度 AI DAY 现场。这次 AI DAY 的主角,是百度文库网盘联合推出的通用智能体GenFlow,正式升级到 4.0版本。GenFlow 4.0是一个「全端通用智能体」,给用户提供通用化、个性化、主动化的智能服务,月活已经破亿。现在还在网盘中兼容了OpenClaw的能力。
维塔流动宣布完成数千万元人民币 Pre-Seed 轮融资,由锦秋基金领投,百度风投跟投。所募资金将主要用于产品研发与市场推广。旗下产品 Jovida 定位面向 C 端用户的主动式 Life Agent,围绕个人生活场景,帮助用户完成从目标感知、路径规划到行动执行的闭环。
今天,马斯克起诉OpenAI及其CEO萨姆·奥尔特曼(Sam Altman)、总裁格雷格·布罗克曼(Greg Brockman)一案,在美国加州奥克兰联邦法院正式开庭。
一家110人的农业科技公司,周一早上集体发现Claude账号全部被封。没有预警,没有解释,API还在照常计费。申诉36小时,石沉大海。企业把命押在一个AI上,这就是代价。
黄仁勋说Agent将创造100万亿美元。易鑫用Model+Harness的硬核组合,把这一预言提前落地汽车金融,效率革命已悄然拉开帷幕。
让AI像助手一样主动帮助,才是我们心中AGI的样子。主动智能体的概念已经被多次提出,但都很难做到可以真正在生活中落地。现有的工作都还停留在概念层面,无法解决复杂世界中所要求的实时性、深度、和记忆等问题。 南洋理工大学谢之非团队提出Pask,使用「底层小模型流式意图检测」+ 「上层Agents执行」架构,实现首个能够做到实时、有深度、基于个人全局记忆自进化的主动智能体。
2026 年初,浙江大学发表了一篇系统性的 SoK 论文《Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward》,给Skill下了一个正式定义。
医生说平扫CT上看不见癌——AI找到了。 2021年5月,一位患者因突发腹痛被推进急诊,拍了一张平扫CT。 影像报告出来了——没有提及肠道有问题。 两年后,这位患者做了肠镜。确诊肠癌。肿瘤已经明显增大
Shade 完成了 1400 万美元 融资。本轮由 Khosla Ventures、Construct Capital 与 Bling Capital 共同领投,公司累计融资达到 2000 万美元。如果只看功能,这是一个支持自然语言搜索视频素材的存储工具;但从更底层来看,它试图重写的是一个更基础的前提——内容在组织内部是如何存在、被理解以及被再次使用的。
你有没有想过,不用联网、仅用一张消费级显卡,就能在个人电脑上拥有一个「边看、边听、边说、还能主动提醒」的类人 AI 助手?这就是 MiniCPM-o 4.5 所能做到的。在技术创新下,它仅凭 9B 参数,实现了业界首个端到端全双工全模态大模型,让端侧 AI 普惠成为现实。其自 2026 年 2 月模型发布以来,在 Hugging Face 上的下载量已突破 25 万+。
一个开发者公开了自己的工作流:让 OpenAI Codex 专门去审查 Hermes agent 写出来的代码,理由只有一个——审稿人不能和写稿人共享同一套记忆。这条推文引发了近万次浏览,背后藏着一个 agent 工程化的新趋势:多模型协作的价值,可能在于互相制衡。