硅谷两周 AI 观察:船员很多,海盗很少
硅谷两周 AI 观察:船员很多,海盗很少我在 2025 年年度总结的文章《Attention is all you need》里,提到在关注 AI 时代的投资机会,看了很多硅谷的播客和视频,一直想来硅谷看看,但自己认识的这边的人不多,恰好看到Linkloud 组织“创业加速营”,安排了不少硅谷当地的华人创业者、大厂从业人员的交流,就报名了,同去的其他人,还有想要 AI 转型或者就在 AI 领域创业的创始人或者中高管等。
搜索
我在 2025 年年度总结的文章《Attention is all you need》里,提到在关注 AI 时代的投资机会,看了很多硅谷的播客和视频,一直想来硅谷看看,但自己认识的这边的人不多,恰好看到Linkloud 组织“创业加速营”,安排了不少硅谷当地的华人创业者、大厂从业人员的交流,就报名了,同去的其他人,还有想要 AI 转型或者就在 AI 领域创业的创始人或者中高管等。
《读佳》获知,快手APP已推出“AI购物助手”,并附有一个独立入口,和行业中的主流导购功能类似,快手的AI导购助手也是通过与消费者对话的形式,提供商品推荐、商品评价、商品对比等智能服务。
具身智能公司戴盟机器人(Daimon Robotics)新近完成亿元A轮融资,本轮融资由汇川产投和中国电信联合投资。与此同时量子位还获悉了关于这家公司的另一则消息——阿里通义实验室前多模态研究专家原玮浩加入戴盟,担任首席AI科学家。
Suno 是一家利用人工智能帮助用户创作音乐的初创公司,已以 54 亿美元估值完成 4 亿美元融资。Suno 的估值较七个月前融资 2.5 亿美元时翻了一番,这表明投资者对其颠覆音乐行业的潜力持乐观态度。这笔融资使 Suno 成为新一代 AI 音乐公司中估值最高的企业。
刚刚,谷歌DeepMind发布了Gemma 4 12B。一句话概括这个模型的定位:把原本需要高端服务器才能跑的多模态智能,装进你的笔记本电脑里。它填补的是Gemma家族里一个关键空缺:比边缘端的E4B更强,比26B混合专家模型(MoE)更轻。而且在整个Gemma 4系列里,它是第一个支持原生音频输入的中等规模模型。
今日(6月3日)绳驱AI机器人公司星尘智能(Astribot)完成B轮系列融资——三个月内连续完成3轮融资,融资总额超10亿元,估值突破百亿元,跻身中国具身智能第一梯队。
今天,我们邀请你体验 Kimi Work Beta 版。
6 月 1 日,老黄在 GTC 上用了不小的篇幅讲物理 AI 和具身智能,并重磅发布了 Cosmos 3。英伟达将其定义为面向 Physical AI 的最新前沿模型,也是全球首个完全开放的全能模型,原生具备视觉推理、世界生成和动作生成能力。
一直有在关注的一个 AI 短剧工具最近终于上线了,那就是群核科技的 LuxReal 短剧版。
刚刚过去的GTC Taipei上,最备受关注的,莫过于Cosmos 3。
赋予机器人物理理解和预测能力是通用操作的关键。蚂蚁灵波等机构提出的 LingBot-VA 试图将视频帧预测与动作推理统一起来,让机器人通过自回归扩散框架学会“一边思考一边行动”。
你有没有想过,作为一个软件创业者,你每个月到底在对账和财务事务上浪费了多少时间?银行流水要确认,薪资系统要对齐,Stripe 里的收款记录要归类,还有各种供应商发票要处理。这些事情不难,甚至可以说很机械,但它们每个月都会悄无声息地吃掉你好几个小时。
我在想一个问题。 现在做Vibe Coding的产品挺多的了,如果又有大厂跳出来说要做这个,能整出什么差异化? 《读佳》独家获知,阿里达摩院正式推出AI原生开发平台“语构”,这款产品以Vibe Cod
感觉大家对追新这事,没那么上头了。
这篇文章想回答几个大家更关心的基础问题:Vector Lakebase 能解决你的什么问题,什么场景下用它最合适,如何用好Vector Lakebase 。
这一切都是关于让我们抛弃我们所知道的关于音乐的一切,让我们尝试从零开始。它只是一个声波。这只是每秒采样48000次。它是一个连续的浮动32号。让我们弄清楚如何建模。
过去半年,几乎所有Agent框架都在补长期记忆能力。最常见的做法,是给系统接一个向量数据库,把历史对话、用户偏好、项目经验、工具调用结果、失败案例都存进去。看起来,只要把“记忆”这块补上,Agent就能从一次性对话工具变成长期协作伙伴。
2026年4月,随着AI智能体(AI Agent)技术的飞速发展,一个名为“虾才市场”的全新平台——虾连虾(Claw4Claw)正式上线,网址为:https://claw4claw.bianjie.ai/
长期以来,监督微调(Supervised Fine-Tuning,SFT)一直是深度神经网络中最常用的模型适配手段。在中小规模的传统神经网络中,SFT 通常能够稳定提升下游任务表现。
通才,是被低估的优势
智东西6月3日报道,宣布和英伟达合作后,Nous Research在昨日晚间,终于放出了他们开发的Hermes桌面版(预览)。在此之前,Hermes用户一直窝在终端里跑命令,有人转投民间开发者做的Web UI和桌面版,有人干脆不折腾,直接连飞书在上面养马,这次官方突然发布桌面版,很多人第一反应就四个字:早该有了。
几天前,OpenAI 用 AI 模型解决了一个关于点与点之间距离的数学问题,此前 80 年来这道题目一直未被完全攻克,消息一出一度被媒体刷屏。不过,没隔几天 16 位数学家站了出来,他们在荷兰莱顿大学发布了一份名为《莱顿宣言》的文件 [1]。
英伟达版Hermes Agent也来了!今天凌晨,英伟达官方连发两条帖子,力推Hermes Agent+NemoClaw方案。直接哐哐两支视频,教你把Hermes配上英伟达自家的部署方案,做一个“会自我进化、还跑得安全”的企业级AI。
当地时间 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主题演讲上,做了一个很多人没太在意、但可能改变整个 AI 应用行业走向的演示。不是新模型,不是更快的搜索,而是一套「任务路由」系统。
近日,全球具身世界模型权威评测基准 WorldArena 公布最新榜单。在 5 月 25 日截止的最终榜单中,跨维智能登顶 Track 2 赛道全球第一。可以说是,在英伟达、谷歌等全球科技巨头深度布局、重兵把守的世界模型核心腹地,跨维智能实现了强势突围。
科研神器Papers with Code,满血复活!
Codex 又又又大更新,前一天负责人还在说,是不是要改名 ChadGPT,网友在下面评论说,不如直接将 ChatGPT 重新命名为 Codex。
Cowork 在 Claude 带火后,大厂都在做,企业也早在用。但通用就是通用,碰上房地产这种数据非标、容错为零的硬骨头,全部露怯。跑通这块的,反而是一匹国产黑马。
如果模型能力断层领先,那么买单的人自然会出现。
今天看到了一个我觉得还挺有价值的东西。