从印度二本到Meta副总裁!被世界拒绝15次的他,撑起AI时代地基
从印度二本到Meta副总裁!被世界拒绝15次的他,撑起AI时代地基他被12所大学拒绝,签证差点作废。后又被DeepMind拒了三次,在亚马逊做着最不起眼的测试工作。十二年后,这个被世界反复拒绝的人,写出了改变AI格局的PyTorch。
他被12所大学拒绝,签证差点作废。后又被DeepMind拒了三次,在亚马逊做着最不起眼的测试工作。十二年后,这个被世界反复拒绝的人,写出了改变AI格局的PyTorch。
来⾃阿⾥巴巴夸克、北京⼤学、中⼭⼤学的研究者提出了⼀种新的解决⽅案:搜索自博弈 Search Self-play(SSP)⸺⼀种⾯向深度搜索 Agent 的⾃我博弈训练范式。其核⼼思路是:让⼀个模型同时扮演两个⻆⾊⸺「出题者」和「解题者」,它们在对抗训练中共同进化,使训练难度随着模型能⼒动态提升,最终形成⼀个⽆需⼈⼯标注的动态博弈⾃我进化过程。
题图 | 来自SeaArt 作者 | 落日飞车 如今在全球AI竞赛中,中国厂商已从早期的跟跑者,转变为不可忽视的强力竞争者。 时间回到2023年,AI相关榜单都还被西方产品所霸占,仅过了一年这个格局就
糟糕!现在Agent也会这招了:原神,启动!咳咳,这其实是字节最新手搓出来的原神Agent——Lumine。不仅在《原神》里玩得很6,跑图开荒以及动辄几个小时的长主线任务,Lumine都能自己搞定,而且水平还不菜。
就在今天,OpenAI 发布了一项新研究,使用新方法来训练内部机制更易于解释的小型稀疏模型,其神经元之间的连接更少、更简单,从而观察它们的计算过程是否更容易被人理解。
谷歌AI掌舵人Jeff Dean点赞了一项新研究,还是出自清华姚班校友钟沛林团队之手。Nested Learning嵌套学习,给出了大语言模型灾难性遗忘这一问题的最新答案!简单来说,Nested Learning(下称NL)就是让模型从扁平的计算网,变成像人脑一样有层次、能自我调整的学习系统。
从手机、PC、汽车到机器人,我们需要怎样的端侧AI "芯" 思路? 作者 | 云鹏 编辑 | 漠影 机器人走猫步引爆行业、舞蹈功夫如人类般丝滑;AI手机一句话订外卖做报告、懂你所想知你所言;AI PC
昨天测试了一款很拉跨的 AIGC 类产品,再也不用了。 我不清楚,为什么有些生成类的产品还在可劲强调生成能力,而不花心思做修改和编辑的体验。 一个项目做到九成,我们脑子里经常会冒出个错觉,好像离终点只
AGI之路,终于交汇到了世界模型的战场。 李飞飞,发布了旗下首款商用世界模型Marble;几乎同一时间,Lecun离职Meta,准备创立自己的世界模型公司;在此之前,谷歌旗下的世界模型Genie 3,也曾掀起业界轰动。
每周有上百万人,向ChatGPT倾诉。它被当成朋友、倾诉对象、甚至「救命稻草」。GPT-5的最新升级中,170位精神科医生被请来教它如何劝一个濒临崩溃的人活下去。效果很明显——「危险回复」减少了80%。AI真的能救人吗?或者,这只是人类孤独的一面镜子。
在计算机科学领域, CSRankings 曾被视为一次划时代的改进。它摒弃了早期诸如 USNews 那样依赖调查问卷的主观排名体系,转而以论文发表数量这一客观指标来评估各大学的科研实力。
Transformer的火种已燃烧七年。如今,推理模型(Reasoning Models)正点燃第二轮革命。Transformer共同作者、OpenAI研究员Łukasz Kaiser预判:未来一两年,AI会极速跃升——瓶颈不在算法,而在GPU与能源。
“我活到 108 岁,试茶 80 多年了。” 2025 年 10 月,已故八年的“茶界泰斗”张天福再次“开口”,为福建张天福品牌管理有限公司代言。 张天福之子张德友称此举已获合法授权,而遗孀张晓红则痛
Karpathy可能给出了美国AI圈最保守的估计:「AGI还需等待10年。」相比于预测本身,美国AI自媒体节目「TBPN」主持人John Coogan更关心的是,当所有人都开始相信这个时间点,会带来怎样的影响。
智能家居不够“智能”,怎么办?小米集团给出了智能家居未来探索方案Xiaomi Miloco。该方案基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则。
今年也是阿里从芯片到云到 PaaS 到大模型,再到顶层 agent 等全栈 AI 能力接入的首个双 11——世界范围内,从未有过如此大规模生产场景 AI 落地。 场景变化,用户量增加,叠加全栈 AI 接入——当双 11 技术备战进入第 17 个年头,其意义早已超越一次促销的技术保障。
这不,Flowith最近也搞了个新东西:FlowithOS,全球首款专为AI Agent打造的操作系统,重点是Windows用户也能用,终于不是Mac专属了:它的最大特点是:虽然长得像浏览器,但干的却是执行的事儿,能让Agent自己动鼠标、跑流程、干活。
昨天百度世界大会上新发布的全球首个可商用、自我演化超级智能体百度伐谋,由百度智能云团队打造。目前,伐谋已正式对外开放,并通过邀请码的形式提供服务。
具身智能赛道的创投大戏,仍在持续升温。这不,具身智能公司Dexmal原力灵机,完成了共计近10亿元的融资。更引人注目的是,在最新一轮融资中,阿里巴巴以独家投资方的身份,赫然在列。
昨天,全球参数量最大的具身智能多模态大模型——Pelican-VL 1.0正式开源。它不仅覆盖了7B到72B级别,能够同时理解图像、视频和语言指令,并将这些感知信息转化为可执行的物理操作。
浙江乌镇的世界互联网大会上,备受瞩目的「杭州六小龙」首次同台亮相。阿里云创始人王坚院士亲自主持,宇树创始人及CEO王兴兴、强脑科技创始人及CEO韩璧丞、群核科技创始人及董事长黄晓煌、游戏科学创始人及CEO、《黑神话:悟空》制作人冯骥、云深处科技创始人及CEO朱秋国……悉数落座。
华东师范大学智能教育学院发布OmniEduBench,首次从「知识+育人」双维度评测大模型教育能力。测评2.4万道中文题后,实验结果显示:GPT-4o等顶尖AI会做题,却在启发思维、情感支持等育人能力上远不及人类,暴露AI当老师的关键短板。
在三维视觉领域,3D Gaussian Splatting (3DGS) 是近年来大热的三维场景建模方法。它通过成千上万的高斯球在空间中“泼洒”,拼合成一个高质量的三维世界,就像是把一片空白的舞台,用彩色的光斑和粒子逐渐铺满,最后呈现出一幅立体的画卷。
刚刚,在理解大模型复杂行为的道路上,OpenAI又迈出了关键一步。他们从自己训练出来的稀疏模型里,发现存在结构小而清晰、既可理解又能完成任务的电路(这里的电路,指神经网络内部一组协同工作的特征与连接模式,是AI可解释性研究的一个术语)。
社区炸了,却不是因为 GPT-5.1。 而是你们心心念念的:Gemini 3。 几小时前,有网友发现在 Gemini 移动端的 Canvas 功能里,虽然显示的还是 Gemini 2.5 Pro,但输出效果已经完全提升了一个档次。
仅用两年时间,一个从实验室孕育的AI编程神器Cursor,年度经常性收入破10亿美元,冲刺300亿美元估值。新一轮23亿美元融资中,谷歌、英伟达重金押注。四名MIT本科辍学生,如今已是妥妥的亿万富翁。
如果一个AI,像人类一样看屏幕、敲键鼠、自己练级变强,这种游戏搭子,你愿意拥有吗?可能不久将来,类似王者荣耀、DOTA 2这样的游戏就可以选择和AI组队,而不是和人组队了!
今日,全球首个Vibe Selling AI Agent 公司「Dealism」宣布完成 1500 万美元天使轮融资,由高瓴创投(GL Ventures)领投,红杉中国、线性资本及其他投资人跟投。
一篇入围顶会NeurIPS’25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索更多可能的路径。
随着现在的主流大模型都能轻松通过图灵测试,这个持续了数十年的标准开始逐渐过时。奥特曼和量子计算之父David Deutsch讨论得出了一个新的图灵测试2.0标准,可以更好地衡量究竟怎样AI才算拥有真正的智能。