Claude强到不敢发的Mythos,被质疑用了字节Seed技术
Claude强到不敢发的Mythos,被质疑用了字节Seed技术Claude最强“神话”模型,可能用到来自字节的技术?
Claude最强“神话”模型,可能用到来自字节的技术?
硅谷新宠Hermes Agent一夜爆火,不仅在GitHub狂揽6.6万星,更因原生接入微信让开发者全线沸腾。如今,Hermes署名的首篇「顶会级」论文也出世了。
过去一年,大模型的能力曲线几乎是指数上升的——推理更强、工具调用更稳、上下文窗口越撑越大。但一个越来越尖锐的问题也随之浮出水面:模型变强了,可承接它的那层东西在哪?
有没有想过让「龙虾」替你打麻将?
昨天我发现 Qwen3.6“倒反天罡”。
现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分,以及 3300 + 人工时高质量标注,揭示模型与人类的巨大鸿沟(49 vs 90)、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。
知名苹果爆料人、彭博社记者马克·古尔曼最新曝光,苹果正在开发其首款智能眼镜,苹果内部代号为N50,其计划在2026年底或次年年初发布,正式上市则要到2027年。
1977 年,乔治·卢卡斯为了拍《星球大战》,专门成立了一家公司,叫工业光魔。
SiFive 是一家由加州大学伯克利分校工程师创办的公司,这些工程师创造了开源芯片设计,该公司已获得一轮超额认购的 4 亿美元融资,公司估值达 36.5 亿美元。
这个月,具身智能领域又卷出新高度:硅谷独角兽公司 Generalist AI 发布全新一代基础模型 GEN-1,将机器人包装手机、折纸箱这些活的平均成功率直接拉到了创纪录的 99%,折纸箱的速度更是飙到了以前的三倍(34s vs 12.1s)。
最近我测试了一下,用AI辅助创作公众号小号,陆续发了一些文章,效果有点超预期。
刚测完 Kimi K2.5,就拿到 Beta 版内测模型了。 一点喘息的机会都不给啊~~
前两天办完大会,然后昨天周末跟一个朋友吃饭,聊着聊着他突然放下筷子看着我说了一句,不是哥们,你怎么什么都懂一点?
从 2024 年底的关于潜在空间的早期探索,再到 2025 年底和 2026 年初的相关研究爆发,潜空间范式正在彻底重塑大模型 (LLMs, VLMs, VLAs 等延伸模型) 的底层设计逻辑。
随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。
在当下的创投话题里,有个热门概念叫“一人公司”,说只要熟练掌握AI工具,人们完全可以在没有同事、没有团队、没有组织结构的情况下独立创业,造出现象级的产品。
想象几个并不遥远的场景: 医院的病房里,刚做完手术的患者正在练习下床、走动,智能系统通过摄像头捕捉他的动作,判断步态是否稳定、有没有跌倒风险;回到家,在卧室或浴室这样私密的空间里,老人起身、转身、洗漱,甚至意外滑倒的瞬间,也可能被视觉传感器记录,只为了让 AI 能更早发现异常;
在本文中,我将探讨编码智能体(coding agents)及其智能体编排(agent harnesses)的整体设计:它们究竟是什么、工作原理如何,以及在实际应用中各组件是如何协同运作的。
Anthropic 的 Claude Code 源码被扒了个干干净净。55 个目录、331 个模块、目前业界最经受实战检验的 Agent 架构——全部暴露在 .map 文件里。
我每次翻《天龙八部》,翻到少林寺藏经阁那一段,都要停下来。
现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在Google Gemini评测团队邀约下推出视频理解新基准Video-MME-v2。凭借创新的分层能力体系与组级非线性评分,以及3300+人工时高质量标注,揭示模型与人类的巨大鸿沟(49vs90)、传统Acc指标虚高、以及「Thinking」并非总是增益等现象。
生数科技或计划在2026年上半年启动港股IPO流程,估值超20亿美元。
“你好,老板,你这个视频我们用即梦Seedance 2.0 生成,这一条视频报价1235.25元人民币,我们分分钟就可以用这1609.45元做出来这条视频,这可是仅仅2235.32元人民币就能换来的视频爆款,都不知道有多划算,我们产出一条视频仅需要一天,白天开工,到了晚上您只需要支付3245.98元就可以了,现在签合同吗?”
对于已经在使用强大的 Hermes Agent 的 Mac 用户来说,现在有了一款能让您的工作流更加流畅、更具原生体验的工具——Hermes Desktop。它并非一个简单的浏览器封装,而是一款专为 macOS 设计的本地应用程序,旨在将您最关心的工作流程无缝集成到一个窗口中。
今日(4月12日)上午,软银、NEC等多家日企联合组建国家级AI产业联盟,发力物理AI。
在竞争激烈的行业中,很多创业公司即便拥有充足的资金、强大的团队和名声显赫的投资者,仍然会在短时间内面临失败。
刚刚,外媒《旧金山标准报》报道,当地时间4月12日凌晨1点40分,OpenAI CEO萨姆·阿尔特曼(Sam Altman)的住所又被袭击,两名嫌疑人从车内向阿尔特曼的住所开枪,无人受伤。
如果你只把 Vercel 理解为“一个部署前端项目的工具”,那你大概只看到了它的 10%。Vercel 现在的估值是 93 亿美元,GAAP 年化收入已达 3.4 亿,同比增长 84%。这个数字放在 2026 年的 AI 公司里不算最耀眼的,但绝对是最不可思议的——因为它的起点不是 AI,而是“部署”。
有人把这些规范都整理成了 MD 文件,都在这个网站上 getdesign.md。62 个全球顶级品牌的设计语言,提炼成结构化的DESIGN.md文件,让 AI 编码 Agent 能直接读懂并执行。
从春节开始,能直接操控电脑替人干活的开源项目 OpenClaw(网友戏称龙虾)在科技圈彻底爆火。