华人女学霸AI杀疯!本科最难数赛12题全对,自主证明首次公开
华人女学霸AI杀疯!本科最难数赛12题全对,自主证明首次公开在人类满分都罕见的普特南数赛上,AI直接12题全对拿满分。陶哲轩等大佬预言AI已经取得了重要里程碑,再加上GPT-5.2 Pro在数学上强到「离谱」的表现,那种「奇点将近」的直觉,真的压不住了。
在人类满分都罕见的普特南数赛上,AI直接12题全对拿满分。陶哲轩等大佬预言AI已经取得了重要里程碑,再加上GPT-5.2 Pro在数学上强到「离谱」的表现,那种「奇点将近」的直觉,真的压不住了。
允中 发自 凹非寺 量子位 | 公众号 QbitAI 如果你对人形机器人的印象,还停留在——走两步就摔、抓东西像戴着拳击手套、干活前得先写一堆脚本…… 那么MATRIX-3的出现,可能要强行带你“翻篇
在这个“应用AI”的元年,无数让人惊掉下巴的产品接踵而至,改变了人们的生活和生存方式。就在去年年底,又一个新的AI风口突然爆发,引得无数人想去起飞。它就是AI漫剧。
在真实世界中,部署并不是一个孤立步骤,而是一条连续链路:工具能否被发现、是否被正确理解、能否构建环境,以及是否真的可以被执行。Deploy-Master 正是围绕这条链路,被设计为一个以执行为中心的一站式自动化工作流。
就在医疗AI赛道激战正酣时,一个搅局者低调入场了。它就是蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司开源的医疗大模型——蚂蚁·安诊⼉(AntAngelMed)。
几天前,DeepSeek 毫无预兆地更新了 R1 论文,将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容,包括首次公开训练全路径,即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline,以及「Aha Moment」的数据化验证等等。
这是我从 腾讯裸辞 成为自由职业以后,写的第三篇年终总结。 前两年的年终总结,以罗列产品为主。 2023,我做过的 AI 项目 2024,我追过的 AI 风口 过去两年,我基本上把能做的 AI 产品都
昨晚,Anthropic 宣布已经部署了更严格的技术保障措施,用以防止第三方工具“伪装”为官方 Claude Code 客户端,从而绕过速率限制和计费机制,低成本调用底层 Claude 模型,此外,Anthropic 也被曝出切断了包括 xAI 在内的部分竞争对手对 Claude 模型的访问权限,其中 Cursor IDE 成为了关键的“触发点”。
Information爆料称,DeepSeek将计划在2月中旬,也正是春节前后,正式发布下一代V4模型。据称,DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。
今天同事和我说,滴滴里现在有一个「AI 叫车」,可以只选油车,直接告诉它你的要求,比如我只要油车、新车、空气清晰,没有差评。天啊我一个 AI 博主,还是高频打车的人,居然才知道(🤦
我自己做内容创作这么久,一直在观察各种 AI 产品的崛起和消亡。说实话,看到 Corsif 的成功时,我的第一反应是震惊。这个应用的核心功能简单到令人难以置信,就是用一些基础的课程教人怎么写 ChatGPT 提示词
近日,liko.ai 宣布完成首轮融资,由商汤国香资本、东方富海、讯飞创投、洪泰基金、正轩投资、面壁智能等多家产业及财务投资机构联合投资,光源资本担任孵化方及独家财务顾问。本轮融资将用于端侧视觉语言模型、AI 原生硬件以及家庭多模态通用终端研发。
今天在X上读到了一个极具启发的Claude Code使用案例。 说起来,我写过很多Claude Code的经验分享了。我现在频繁用它写代码、写文章、分析股票,最近还在尝试用它做Polymarket的预
今天我们就借着科技领域的东风,花1分钟时间来了解一下MiniMax的创始人闫俊杰的个人履历和创业故事:1989年,闫俊杰出生于河南某县城。闫俊杰的爸爸是一名初中老师,妈妈是一名公务员,尽管闫俊杰说小时候县城的教育资源相对匮乏,但他父母都有稳定的工作,想必他的童年也比较幸福。
一款名为 Befreed 的产品于 11 月 17 日在 ProductHunt 上冲榜,获得了日榜第二、周榜第五成绩。Befreed 的定位也是“AI 播客+读书”,与 Aibrary 比较类似,但 App 成绩却要好一些。
「新皮层」分别在2023年和2024年参与过对两家公司的深入访谈。今天看,两家公司的创始人当时讲述的内容仍然有助于理解两家公司的内核差异。因此重发两篇旧文:
「新皮层」分别在2023年和2024年参与过对两家公司的深入访谈。今天看,两家公司的创始人当时讲述的内容仍然有助于理解两家公司的内核差异。因此重发两篇旧文:
2026年1月5日,由陈天桥和清华AI学者代季峰联合发起的MiroMind团队,正式发布了自研旗舰搜索智能体模型MiroThinker 1.5。这个消息本身并不算特别,毕竟最近几个月几乎每周都有新模型发布。但当我深入了解后发现,这个模型背后代表的思路,可能会彻底改变我们对AI能力边界的认知。
最近,Cursor 也发表了一篇文章《Dynamic context discovery》,分享了他们是怎么做上下文管理的。结合 Manus、Cursor 这两家 Agent 领域头部团队的思路,我们整理了如何做好上下文工程的一些关键要点。
美国空军近日披露,在一次围绕“战斗管理”的实验中,多款人工智能工具在生成作战行动方案方面整体表现优于人类规划人员。这次实验是在2025年秋季举行的第三轮“
Agent 并不是一次性输出的系统。它们运行在多轮交互之中:调用工具、修改内部状态、根据中间结果不断调整策略。也正是这些让 Agent 变得有用的能力 ——自主性、智能性与灵活性 —— 同时也让它们变得更难以评估。
在这场一年狂飙的亲历者之一——MCP 联合创作者、核心维护者 David Soria Parrra 看来,最戏剧性的分水岭发生在四月前后:当 Sam Altman、Satya Nadella、Sundar Pichai 先后公开表态,Microsoft、Google、OpenAI 都将采用 MCP,“大客户”突然从 Cursor、VS Code 扩散到整个行业。
近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水
清华大学智能产业研究院(AIR)联合清华大学生命学院、清华大学化学系在Science上发表论文:《深度对比学习实现基因组级别药物虚拟筛选》。团队研发了一个AI驱动的超高通量药物虚拟筛选平台DrugCLIP。
就在刚刚,Claude Code的核心开发者Boris在X平台上扔出了一个重磅炸弹。他们内部团队在使用的一个插件,叫 code-simplifier,直接开源了!我看了一下这个插件的功能和提示词,当时就兴奋了。
在传统企业中,市场调研往往是决策最慢的一环,从问卷设计到洞察输出要花上数周。Dialogue AI试图用AI自动化整个研究流程,让洞察生成的速度与产品迭代保持同步。它的出现不仅是效率的革新,更是企业理解用户方式的范式转变——让研究从被动响应变为实时驱动。
MIT天才博士一毕业,火速加盟OpenAI前CTO初创!最近,肖光烜(Guangxuan Xiao)在社交媒体官宣,刚刚完成了MIT博士学位。下一步,他将加入Thinking Machines,专注于大模型预训练的工作。
联想给出的公式是,混合AI=个人智能+企业智能+公共智能。这种模式下,AI智能体应用不再依赖于单一的云端模型,而是云端大模型与本地定制化小模型的深度融合。
Spangle 是一家由前 Bolt 首席执行官 Maju Kuruvilla 创办的 AI 电子商务初创公司,已在新一轮融资中筹集了 1500 万美元,公司投后估值达 1 亿美元。本轮完全股权性质的A 轮融资由 NewRoad Capital Partners 领投。一年多前,这家总部位于西雅图的初创企业以 3000 万美元投前估值完成了 600 万美元的种子轮融资 。
在今天(1 月 9 日)早上前往港交所敲钟前,MiniMax 创始人闫俊杰对《晚点 LatePost》分享了他此刻的想法:希望我们后续能有机会对整个行业智能水平的提升做出更大的贡献。我们初步探索了一条纯草根 AI 创业的路径,尽管后面还是非常挑战,如果能对 AI 创新创业生态的发展有启发我们会感到很光荣。