
陶哲轩最新灵魂拷问:AI几乎完全由实证研究主导,学术界完全隐身
陶哲轩最新灵魂拷问:AI几乎完全由实证研究主导,学术界完全隐身陶哲轩最新发文总结AI领域现状,当前AI发展高度依赖经验与算力,缺乏理论支撑,导致成功难以复制、失败无法解释。辛顿、Rahimi、Jordan等也纷纷警示,AI的黑箱本质和缺乏解释性将限制其可持续发展。唯有建立坚实理论基础,AI才能真正走向透明、安全与可靠的未来。
陶哲轩最新发文总结AI领域现状,当前AI发展高度依赖经验与算力,缺乏理论支撑,导致成功难以复制、失败无法解释。辛顿、Rahimi、Jordan等也纷纷警示,AI的黑箱本质和缺乏解释性将限制其可持续发展。唯有建立坚实理论基础,AI才能真正走向透明、安全与可靠的未来。
AI做奥数的神话,刚刚被戳破了!最新出炉的2025 IMO数学竞赛中,全球顶尖AI模型无一例外翻车了。即便是冠军Gemini也只拿下可怜的31分,连铜牌都摸不到。Grok-4更是摆烂到底,连DeepSeek-R1都令人失望。看来,AI想挑战人类奥数大神,还为时尚早。
迄今为止最强大的开源定理证明器登场!Goedel-Prover-V2仅用8B参数击败671B的DeepSeek-Prover,并再次夺下数学PutnamBench冠军。十位核心贡献者,八大顶尖机构,让AI形式化证明再破纪录。
近日,由普林斯顿大学牵头,联合清华大学、北京大学、上海交通大学、斯坦福大学,以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。
陶哲轩罕见接受了一次长长长长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。
当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。
高考数学满分AI出现了!豆包旗下的教育产品:豆包爱学首次公开挑战高考数学全国卷,由6位资深名师严格把关,主观题步骤全打分,竟然斩获Ⅰ卷144分、Ⅱ卷150分满分战绩。这个惊艳的成绩或许预示着,AI教育真要变天了。
上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。
本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。