前端大神Cheng Lou新项目火了!支持AI助手一键接入
前端大神Cheng Lou新项目火了!支持AI助手一键接入Cheng Lou:React 核心团队成员,参与 ReactJS 的早期开发;主导了 ReasonML(后来演变为 ReScript)的开发;目前在 Midjourney 工作,参与 AI 图像生成平台的开发。
Cheng Lou:React 核心团队成员,参与 ReactJS 的早期开发;主导了 ReasonML(后来演变为 ReScript)的开发;目前在 Midjourney 工作,参与 AI 图像生成平台的开发。
一场科研生产力的深度革命。
机器人能认出杯子,却看不懂杯口朝哪、离自己多远、该抓哪里。
本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文,介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复,而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark,MMDuet2 则通过强化学习训练方法实现了 SOTA 性能,无需精确的回复时间标注即可训练出及时、准确的主动交互模型。
统计时间内,可追踪到的 OpenClaw 生态玩家已超过 50 个,覆盖AI云、大模型、智能终端与边缘智能、MI(移动互联网)、Fintech、教育科技、AI 医疗、网络安全、通信运营等十余个行业,形成了一张日趋完整的生态版图。
最近,AI 圈子里又冒出一个新词:Harness Engineering。
在具身智能领域,机器人操作的泛化能力一直是一个核心挑战。当前,视觉 - 语言 - 动作(VLA)模型主要分为两大范式:端到端模型与分层模型。端到端 VLA 模型(如 RT-2 [1], OpenVLA [2])严重依赖海量的 “指令 - 视觉 - 动作” 成对数据,获取成本极高,导致其在面对新任务或新场景时零样本泛化能力受限。
大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1.0。在其公开的General AI Prediction Leaderboard上,EchoZ-1.0稳居第一,并在与Polymarket人类交易市场的直接对比中展现出显著优势。
DeepSeek崩上热搜!宕机持续超过8小时,写论文的、角色扮演的和心情不好找AI吐槽的人也都崩溃了。But!这不是一次普通的服务中断,反而被解读为模型升级的前兆。
2亿美元A轮融资,估值110亿,成立仅一年就成为独角兽。更震撼的是创始人——25岁的广州00后洪乐潼,父母是从未上过大学的普通务工者。她用数学解决AI最大的痛点:让模型推理步步可验证,彻底杜绝幻觉。为了加入她,弗吉尼亚大学终身教授直接辞职。
要论整活儿,还得是何同学。
为让AI帮忙数饺子,Thiel Fellow得主Brandon Wang向开源软件OpenClaw开放了全套数字信息。这场名为「生产力色情」的实验,正在重新定义什么是「赛博找死」。
上周发了给Agent用的superpowers插件那篇文章。 没想到反馈还不错,Skills这块的信息差,比我想的还要大一些= = 然后评论区里就有人问了,还是一个叫tim的朋友,问还有什么必装的Sk
实测生成曲目完整动听,免费可用。
Karpathy给一支平均年龄25岁的「叛军」站台,红杉和GV连眼都不眨就拍出1.8亿美金。这群人放话:要么把效率干得比人脑高10倍,要么看着AI把地球烧干!
飞书、Google、Stripe、ElevenLabs、网易云音乐。 最近几个月,一群看起来毫不相关的公司不约而同做了同一件事:发布 CLI 工具。
中关村论坛年会上,医渡科技与清华长庚医院等头部医院共同启动了「中国临床循证智能能力建设计划」,与此同时,作为计划核心技术载体与落地产品的「医渡智循」发布了 APP 版本——一款定位为医生「超级助手、第二大脑、多学科智能体专家顾问团」的临床循证决策系统。
这家新西兰的公司给奶牛戴上AI项圈,估值一年飙升20亿美元!Founders Fund领投,投资人抢到超额认购。它的秘密武器叫「Cowgorithm」——一套让牛自己放自己的算法。
想象一下这个场景:你在地铁上刷着 Slack,看到一个需要修复的 bug。你点一个 emoji 表情,等到了办公室,代码已经写好、测试通过,Pull Request 等着你审查。这不是科幻小说,这是 Stripe 工程师每天的真实工作状态。
最近,harness engineering 又成了继 prompt engineering、context engineering 之后新一代的 buzzword。
从3月29日晚21时左右起,国内大模型产品DeepSeek的网页端与APP端服务器持续处于崩溃状态,大量用户反馈无法正常访问对话服务。
“‘AI一定会改变世界’和‘AI泡沫一定会破’是两件事”
新一代代码模型的训练动态已与旧模型截然不同,主流强化学习方法和数据集在其上几乎“失效”。
当世界模型越来越大,真正制约它走向「内部模拟器」的,未必是表征能力,而可能是动力学建模。
企业微信的「极简」养虾流。
当你希望 AI 将 "士兵举起手臂,向后倾身,然后身体向前扑倒" 这段文字转化为一段 3D 角色动画,现有大多数方法给出的答案是:一段摇摇晃晃、语义残缺的短片段。这并非模型能力不足,问题的根源在于将运动表达为逐帧离散序列这一根本性的设计决策。
OpenClaw 进入下半场了。
你正在地铁上,突然想起有个API文档还没写完。以前你只能忍着到公司再弄,现在——你掏出手机,给AI发了一条指令,20分钟后代码自动跑完了。 这不是科幻,是Google员工已经用上的真东西。 它的名字叫
Granola 最初是一款面向专业消费者的应用,安装在用户电脑上,用于转录会议并生成笔记。如今,它一直在开发功能以适应企业级技术栈。例如,去年它开始允许团队成员协作处理笔记。公司表示,目前已成功打入 Vanta、Gusto、Thumbtack、Asana、Cursor、Lovable、Decagon 以及 Mistral AI 等企业客户。
《读佳》获悉,百度投资了一家专门做智能多模型推理的平台“AnyInt”,主体公司为上海宏诺伊曼科技有限公司(下简称“宏诺伊曼科技”),本月,百度关联公司北京百度网讯科技有限公司认缴17.6471万元,