OpenAI 四页「小作文」曝光,炮轰 Anthropic 靠恐惧卖货,营收注水 80 亿
OpenAI 四页「小作文」曝光,炮轰 Anthropic 靠恐惧卖货,营收注水 80 亿一封内部备忘录,让 AI 行业最大的两家公司之间的战争,第一次有了清晰的文字记录。OpenAI 首席营收官 Denise Dresser 在本周日向全体员工发出了一份长达四页的战略备忘录。文件随后被外媒 The Verge 获取并公开全文。
一封内部备忘录,让 AI 行业最大的两家公司之间的战争,第一次有了清晰的文字记录。OpenAI 首席营收官 Denise Dresser 在本周日向全体员工发出了一份长达四页的战略备忘录。文件随后被外媒 The Verge 获取并公开全文。
过去一段时间,生成理解统一模型(Unified Model)经常被理解成一种「既能看懂图、又能生成图」的多模态通用系统。
当前具身智能的VLA(Vision-Language-Action)赛道正陷入典型的「碎片化」泥潭:不同团队采用异构的动作解码范式、强耦合的数据管线、互不兼容的评测协议,导致方法难以横向对比,复现成本极高。
办公室里,一排排工位整整齐齐,每个人对着屏幕敲敲打打,看起来和平常没什么两样。
在具身智能快速发展的今天,高质量数据已成为驱动能力提升的关键基础,然而一个核心问题也随之而来: 如何让机器人数据采集更快、更稳、更有效?
让一个模型概括“这是一段什么视频”,并不难。
近日,知名风投机构Rock Health发布了“2026年第一季度融资概况”,报告显示:数字医疗领域在2026年第一季度获得了40亿美元的风投资金,比去年同期高出10亿美元,创下疫情高峰以来最强劲的第一季度。
2026年具身智能这么热, 美国旧金山PI Robotics这家机器人创业公司, 你真得知道。
2025年之前,想要证明自己混得好,大概得腕上戴块百达翡丽,车库里停辆库里南。但到了AI时代,硬通货变了:看你一年到底烧了多少Token。一年烧掉250亿个Token,有位25岁的韩国小伙子,成了全世界最能烧的人。
昨晚,一个 X 上的泄露账号曝光了 Claude Code 即将上线的更新:截图验证、安全扫描、设计探索、暗黑模式、登录系统、跨多个代码仓库的统一工作界面。网友们的评价是:「这可能是 Lovable 的全栈竞争对手」,危险危险危险。
刚刚,荣耀在PC新品技术沟通会上正式发布了其自研的端侧“龙虾”AI智能体“YOYO Claw”,YOYO Claw会首发搭载在荣耀MagicBook系列轻薄本新品中。
在AI应用市场上,AI命理是少有的在全球范围内都已验证商业化闭环的赛道。测测坐拥近6000万用户、数亿元营收,韩国Hellobot半年收入1.5亿元,常年稳居本土社交榜前列。印度AstroSage以8000万下载、150万日活实现连续18个月收入增长,毛利率近90%,成为零融资的AI应用成功典范。在欧美市场,Co-Star以零营销投放获得超2000万下载,Moonly活跃用户超1000万。
Claude最强“神话”模型,可能用到来自字节的技术?
硅谷新宠Hermes Agent一夜爆火,不仅在GitHub狂揽6.6万星,更因原生接入微信让开发者全线沸腾。如今,Hermes署名的首篇「顶会级」论文也出世了。如今,这款历经9个月打磨,一夜成名的Agent,已在GitHub上狂揽66k星,Fork有8.8k。
过去一年,大模型的能力曲线几乎是指数上升的——推理更强、工具调用更稳、上下文窗口越撑越大。但一个越来越尖锐的问题也随之浮出水面:模型变强了,可承接它的那层东西在哪?
有没有想过让「龙虾」替你打麻将?
昨天我发现 Qwen3.6“倒反天罡”。
现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分,以及 3300 + 人工时高质量标注,揭示模型与人类的巨大鸿沟(49 vs 90)、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。
知名苹果爆料人、彭博社记者马克·古尔曼最新曝光,苹果正在开发其首款智能眼镜,苹果内部代号为N50,其计划在2026年底或次年年初发布,正式上市则要到2027年。
1977 年,乔治·卢卡斯为了拍《星球大战》,专门成立了一家公司,叫工业光魔。
SiFive 是一家由加州大学伯克利分校工程师创办的公司,这些工程师创造了开源芯片设计,该公司已获得一轮超额认购的 4 亿美元融资,公司估值达 36.5 亿美元。
这个月,具身智能领域又卷出新高度:硅谷独角兽公司 Generalist AI 发布全新一代基础模型 GEN-1,将机器人包装手机、折纸箱这些活的平均成功率直接拉到了创纪录的 99%,折纸箱的速度更是飙到了以前的三倍(34s vs 12.1s)。
最近我测试了一下,用AI辅助创作公众号小号,陆续发了一些文章,效果有点超预期。
刚测完 Kimi K2.5,就拿到 Beta 版内测模型了。 一点喘息的机会都不给啊~~
前两天办完大会,然后昨天周末跟一个朋友吃饭,聊着聊着他突然放下筷子看着我说了一句,不是哥们,你怎么什么都懂一点?
从 2024 年底的关于潜在空间的早期探索,再到 2025 年底和 2026 年初的相关研究爆发,潜空间范式正在彻底重塑大模型 (LLMs, VLMs, VLAs 等延伸模型) 的底层设计逻辑。
随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。
在当下的创投话题里,有个热门概念叫“一人公司”,说只要熟练掌握AI工具,人们完全可以在没有同事、没有团队、没有组织结构的情况下独立创业,造出现象级的产品。
想象几个并不遥远的场景: 医院的病房里,刚做完手术的患者正在练习下床、走动,智能系统通过摄像头捕捉他的动作,判断步态是否稳定、有没有跌倒风险;回到家,在卧室或浴室这样私密的空间里,老人起身、转身、洗漱,甚至意外滑倒的瞬间,也可能被视觉传感器记录,只为了让 AI 能更早发现异常;
在本文中,我将探讨编码智能体(coding agents)及其智能体编排(agent harnesses)的整体设计:它们究竟是什么、工作原理如何,以及在实际应用中各组件是如何协同运作的。