Hermes的原生桌面应用 Hermes Desktop 来了!
Hermes的原生桌面应用 Hermes Desktop 来了!昨晚,开发者sir1st发布了Hermes Agent桌面版:Hermes Desktop,将先前很多人在用的Hermes Web UI打包塞进了一个桌面应用程序中,养马人不仅可以逃离命令行界面,这下连浏览器都不用打开了。
搜索
昨晚,开发者sir1st发布了Hermes Agent桌面版:Hermes Desktop,将先前很多人在用的Hermes Web UI打包塞进了一个桌面应用程序中,养马人不仅可以逃离命令行界面,这下连浏览器都不用打开了。
WorldArena 世界模型赛道从来都是竞争异常激烈,在经历了前几次比赛过程中的放榜之后,CVPR 2026 WorldArena 世界模型赛道锁定总成绩,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)拿下了最终的冠军,成为了 “强者中的强者”。
最近,【FoST未来叙事】与刚从戛纳回来的TapNow品牌负责人Sabrina Qin来了场深度对话。她为我们带来了最真实、一线的戛纳AI态度、AI影像生态,以及一个正在悄然崛起的“地下反叛”创作者社群。
继 Step 3.5 Flash 后,阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。该模型最大特点就是多(模)、快(速)、好(用)、省(钱)。总参数 196B,采用稀疏 MoE 架构,推理激活参数仅 11B,配备 1.88B ViT 视觉编码器,推理速度最高 400 TPS,支持 256K 上下文。
近日,字节旗下AI视频创作工具小云雀的短剧Agent正式更新到2.0版本。自Seedance 2.0这一视频生成模型横空出世以来,小云雀一直是其原生支持的平台。由于整体使用门槛相对较低,小云雀也逐渐积累起一批AI短剧和AI短片创作者。
《读佳》获知,智谱AI正在研发多款硬件产品,型号有ZAI-P1、ZAI-M2、ZAI-N1等,其中一款设备型号ZAI-P1的产品已在2026年2月获得由工信部颁发的电信设备进网许可证,电信设备进网许可证状态为试用证,申请单位及生产企业是成都智谱华章科技有限公司(智谱AI全资子公司)。
王慧文画的框像是一个聚宝盆,汇集了各方资本的关注。而太平洋另一边的旧金山,上演了类似的财富故事。这些数字给人震撼,但更有意思的问题是,模型可以云端训练,团队可以全球分布,远程办公早已成熟,但AI时代,反倒是更小的框里涌入了更巨量的财富
刚刚,自变量机器人团队带来全新解法——发布全球首个「事件级预测」具身智能世界模型WALL-WM。WALL-WM把世界模型的预测单位从时间帧换成了语义事件:
Apple 必须面对它过去三年最难堪的一个问题——为什么全世界最贵的智能手机,装着一个最蠢的 AI 助手?当地时间 5 月 28 日,在发布会前十天,外媒率先曝光了答案。
过去一年,AI 出海应用,集中爆发:Gartner 预测 2026 年全球 AI 相关支出将达到 2.53 万亿美元,预计比去年增长 44%。IDC 预测未来五年的复合增速是 31.9%,届时全球 AI IT 投资将突破万亿美元大关。
编辑|Panda 数学正在迎来 AI 革命。 最近几个月尤为明显。比如,就在前几天,Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中,解决了 3
不用JAX,SpaceX正在用C语言编写的全新堆栈训练新模型。而且马斯克本人亲口承认,Grok 5已经用的就是这个新堆栈。按马斯克的说法,这种新堆栈能让大模型训练速度提升一个数量级。
近日,千寻智能高阳团队的研究成果 《Learning Native Continuation for Action Chunking Flow Policies》 被机器人顶会 RSS 2026 接收!这项工作从训练机制出发,让机器人动作天然具有连续性,实现了 "连音" 般的流畅执行,在五个真实世界操作任务上超越了现有方法,为具身智能领域的动作生成研究提供了新的思路。
Anthropic今日正式上线Claude Code动态工作流预览版,这项功能面向超大型任务推出,Claude会根据任务自动编写脚本,调用数十到上百个智能体处理任务,无需手动设置。
网上有条帖子炸了,稳定复现,通过 API 问 Claude Opus 4.8 你是什么模型。回答是:Qwen,或者 DeepSeek。重要的事说三遍:必须是通过 API,必须是通过 API,必须是通过 API。因为网页端有系统提示词,会做二次处理。
Anthropic最强通用模型Claude Opus 4.8正式发布,新模型基准测试全面超越Gemini 3.1 Pro、Opus 4.7,仅一项逊色于GPT-5.5,但其标准模式价格不变,快速模式价格仅为Opus 4.7的1/3。与此同时,Anthropic还官宣一笔650亿美元(约合人民币4406.94亿元)H轮巨额融资,投后估值冲上9650亿美元(约合人民币6.54万亿元)
真实世界需要 200 多个小时的模型评测任务,可以在仿真中不到 0.5 小时内完成。
扎尔伯格重金押注的AI蛋白质团队,拿出了最新成果。
AI母婴硬件,正在成为出海圈新的机会。
这原本是一个看起来“毫无胜算”的众筹项目。
GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿,92.4% 正确率,评估体系直接失灵。AI 黑客能力每 6 个月翻一倍,而衡量它有多危险的尺子,已经先被干碎了。
ElevenLabs的声音克隆和长文本音频生成质量确实很好,但也太贵了。
ElevenLabs的声音克隆和长文本音频生成质量确实很好,但也太贵了。
光正在进入AI算力系统,但这次不只是拿来传数据,而是直接参与计算。
OpenAI 公开介绍 Computer-Using Agent 时,讲的也是这个方向:模型针对图形界面交互做过训练,能把屏幕理解、任务目标和鼠标键盘动作接起来。鼠标会动只是表面。遇到按钮位置变化、弹窗多一层、页面慢一点时,它还能重新看屏幕,继续判断下一步。
训练一个真正会用网页的GUI Agent,最自然的思路通常是: 去真实网站上操作,收集轨迹,再拿来训练。
后空翻、跑酷、单手抓举几十公斤……
随着全球遥感卫星持续运行,地球观测数据正在快速增长。多源、多时相、多光谱遥感影像为国土监测、生态评估、灾害预警、气候变化研究等任务提供了重要数据基础,但也带来了显著的存储、传输和计算压力。
DeepSeek V4发布,比模型本身更受关注的,是一个根本性的转变: 国产算力生态正在从过去“芯片被动适配模型”的单向奔赴,迈向“芯模协同”的新阶段。