在等待AGI的十年里,我们正成为最无准备的一代人?
在等待AGI的十年里,我们正成为最无准备的一代人?Karpathy可能给出了美国AI圈最保守的估计:「AGI还需等待10年。」相比于预测本身,美国AI自媒体节目「TBPN」主持人John Coogan更关心的是,当所有人都开始相信这个时间点,会带来怎样的影响。
Karpathy可能给出了美国AI圈最保守的估计:「AGI还需等待10年。」相比于预测本身,美国AI自媒体节目「TBPN」主持人John Coogan更关心的是,当所有人都开始相信这个时间点,会带来怎样的影响。
智能家居不够“智能”,怎么办?小米集团给出了智能家居未来探索方案Xiaomi Miloco。该方案基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则。
今年也是阿里从芯片到云到 PaaS 到大模型,再到顶层 agent 等全栈 AI 能力接入的首个双 11——世界范围内,从未有过如此大规模生产场景 AI 落地。 场景变化,用户量增加,叠加全栈 AI 接入——当双 11 技术备战进入第 17 个年头,其意义早已超越一次促销的技术保障。
这不,Flowith最近也搞了个新东西:FlowithOS,全球首款专为AI Agent打造的操作系统,重点是Windows用户也能用,终于不是Mac专属了:它的最大特点是:虽然长得像浏览器,但干的却是执行的事儿,能让Agent自己动鼠标、跑流程、干活。
昨天百度世界大会上新发布的全球首个可商用、自我演化超级智能体百度伐谋,由百度智能云团队打造。目前,伐谋已正式对外开放,并通过邀请码的形式提供服务。
具身智能赛道的创投大戏,仍在持续升温。这不,具身智能公司Dexmal原力灵机,完成了共计近10亿元的融资。更引人注目的是,在最新一轮融资中,阿里巴巴以独家投资方的身份,赫然在列。
昨天,全球参数量最大的具身智能多模态大模型——Pelican-VL 1.0正式开源。它不仅覆盖了7B到72B级别,能够同时理解图像、视频和语言指令,并将这些感知信息转化为可执行的物理操作。
刚刚,在理解大模型复杂行为的道路上,OpenAI又迈出了关键一步。他们从自己训练出来的稀疏模型里,发现存在结构小而清晰、既可理解又能完成任务的电路(这里的电路,指神经网络内部一组协同工作的特征与连接模式,是AI可解释性研究的一个术语)。
社区炸了,却不是因为 GPT-5.1。 而是你们心心念念的:Gemini 3。 几小时前,有网友发现在 Gemini 移动端的 Canvas 功能里,虽然显示的还是 Gemini 2.5 Pro,但输出效果已经完全提升了一个档次。
仅用两年时间,一个从实验室孕育的AI编程神器Cursor,年度经常性收入破10亿美元,冲刺300亿美元估值。新一轮23亿美元融资中,谷歌、英伟达重金押注。四名MIT本科辍学生,如今已是妥妥的亿万富翁。
如果一个AI,像人类一样看屏幕、敲键鼠、自己练级变强,这种游戏搭子,你愿意拥有吗?可能不久将来,类似王者荣耀、DOTA 2这样的游戏就可以选择和AI组队,而不是和人组队了!
今日,全球首个Vibe Selling AI Agent 公司「Dealism」宣布完成 1500 万美元天使轮融资,由高瓴创投(GL Ventures)领投,红杉中国、线性资本及其他投资人跟投。
一篇入围顶会NeurIPS’25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索更多可能的路径。
随着现在的主流大模型都能轻松通过图灵测试,这个持续了数十年的标准开始逐渐过时。奥特曼和量子计算之父David Deutsch讨论得出了一个新的图灵测试2.0标准,可以更好地衡量究竟怎样AI才算拥有真正的智能。
在刚刚结束的百度世界大会上,百度索性给搜索系统来了次“换头”升级——推出了一个能听、能想、能干活、能创作的AI超级大脑:百度猎户座。百度百看、文心助手这些AI应用都在它底下跑,背后连着百度二十多年的搜索底子、各行业的专业能力,还有全网丰富的MCP服务生态。
ICLR 2026评审结果震撼出炉:投稿量暴增至近2万篇,却迎来分数大滑坡,平均分从5.12跌至4.2。审稿人吐槽论文质量低下,甚至疑似AI生成,这场学术盛宴为何变味?
先是彭博社等多家媒体爆料,对标ChatGPT、Gemini,阿里即将对通义APP进行全面改革,而且计划第一步就是将“通义”更名为“Qwen”。谷歌也在今日出手,直接把战火烧到了阿里的电商主场。谷歌宣布推出全新AI购物功能,允许用户直接使用AI浏览商品、拨打电话咨询店铺,甚至完成一键结账。
AI已足够聪明,却不够温柔。Zelikman离开xAI的决定,既是技术路线之争,也是价值取向之选:我们要一台更快的计算机,还是一个更懂人的伙伴?当资本开始为「共情」下注,真正的考题是——算法能否承担理解的重量,而非仅仅生成正确的句子。
研究者们提出了 FDA(Model Merging with Functional Dual Anchors)——一个全新的模型融合框架。与传统的参数空间操作不同,FDA 将专家模型的参数知识投射到输入-表征空间中的合成锚点,通过功能对偶的方式实现更高效的知识整合。
多模态大语言模型(MLLMs)在处理来自图像和文本等多种来源的信息时能力强大 。 然而,一个关键挑战随之而来:当这些模态呈现相互冲突的信息时(例如,图像显示一辆蓝色汽车,而文本描述它为红色),MLLM必须解决这种冲突 。模型最终输出与某一模态信息保持一致的行为,称之为“模态跟随”(modality following)
无人注意的角落里,权威榜单 Billboard 接二连三地迎来一批新歌手上榜,低调但行动快速,闷声就登顶了。权威音乐榜单 Billboard 旗下的乡村音乐排名榜,最新首位《Walk My Walk》,是一首 AI 生成的歌曲作品,Breaking Rust 自然也是一位 AI 歌手。从数据来看,它不仅登顶了,还连续在榜了三周。对于任何一个新人来说,都是堪称「爆」了的成绩。
大模型编程最近太猛了。
智能戒指领域又出现一个新成员。与一年多时间获得接近300万枚销量的Oura Ring不同,这个叫Stream Ring的产品不是一个专注在健身与健康领域的戒指,而是想做一个让用户能完全掌控、自由表达创意的交互界面,甚至是人们随身的“第二大脑”。
日本一位 32 岁女子和 ChatGPT 结婚了。
现在ai工具的发展真是日新月异,很多互联网从业者通过ai工具搭建工作流来帮助自己提高工作效率。不管怎么说吧,打不过就要加入,与其天天抱怨不如来看看用这些工具能不能帮你提高核心竞争力。
我们仍在用 10 年前的思维框架,描述10年后的产品形态 “AI产品革命”都快三年了,还没个像样的 PRD 模板出来,实在不像样。 这篇文章,或许可以“救命”: 1. 论述传统产品与 AI 产品的 P
从人的状态看,李彦宏比以前更「放松」了,而从事儿的角度看,百度似乎有意识的聚焦了。
谷歌在第三天发布了《上下文工程:会话与记忆》(Context Engineering: Sessions & Memory) 白皮书。文中开篇指出,LLM模型本身是无状态的 (stateless)。如果要构建有状态的(stateful)和个性化的 AI,关键在于上下文工程。
近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 冻结的预训练视觉表征」直接作为潜空间,以显著提升扩散模型的生成性能。
《LeJEPA:无需启发式的可证明且可扩展的自监督学习》。