
为防AI刷题,Nature等顶刊最新封面被做成数据集,考验模型科学推理能力|上海交通大学
为防AI刷题,Nature等顶刊最新封面被做成数据集,考验模型科学推理能力|上海交通大学近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。
近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。
AI的平均智商已突破110,正式超越普通人类。2025,AI开始参与经济系统的「全链条操作」。从信息收集、判断决策到实际执行,完整经济链条第一次有非人类主体独立运行,AI改写商业底层规则!凯恩斯百年预言终将来临,AI经济正在浮现。
据申妈朋友圈报道,字节Seed大模型视觉基础研究团队负责人冯佳时已正式离职。根据其在字节的职级体系判断,他的级别应在4-1或4-2之间,属于公司最为稀缺的核心研究序列。冯佳时后续去向或是AI创业。
刚刚,AI玩具公司跃然创新(Haivivi)宣布完成 2 亿元 A 轮系列融资,中金资本旗下基金、红杉中国、华山资本、愉悦资本、招银国际、Brizan Ventures 等一线投资机构共同参投。
DeepSeek涨价了。 智东西8月23日报道,8月21日,DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布,还宣布自9月6日起,DeepSeek将执行新价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整至12元/百万tokens。这一决定,让使用DeepSeek API的最低价格较过去上升了50%。
对于计算任务负载来说,越是专用,效率就越高,谷歌的 TPU 就是其中的一个典型例子。它自 2015 年开始在谷歌数据中心部署后,已经发展到了第 7 代。目前的最新产品不仅使用了最先进的制程工艺打造,也在架构上充分考虑了对于机器学习推理任务的优化。TPU 的出现,促进了 Gemini 等大模型技术的进展。
此前在2023年年末,彼时拼多多的市值曾一度逼近阿里,引得“退隐江湖”许久的阿里创始人马云罕见地在内网发声,“AI电商时代刚刚开始,对谁都是机会,也是挑战。我们要有信心,阿里会变,阿里会改”。马云的这番话除了给员工吃下一颗定心丸外,也为阿里电商的未来定了调。
每个快速发展的公司都逃不开合规噩梦,繁琐、耗时、烧钱。两个MIT辍学生用AI智能体向这个痛点宣战,不仅解放了无数打工人,更让顶级资本心甘情愿地送上支票。
2025 年 8 月的世界人形机器人运动会可说是笑点与技术齐飞,荒诞与精彩共舞。我们看到了撞翻人类和机器人的机器人运动员以及足球赛场上机器人接连倒地摔跤,也看到了最前沿机器人技术的集中展现以及一个又一个新纪录的诞生。
快手二季报于北京时间 8 月 21 日港股盘后放出。近期快手股价表现可谓是港股前排的当红炸子鸡,大功臣自然是 Kling。