全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了
全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了「Baidu is back」,在业界权威大模型公共基准测试平台 LMArena 发布最新一期文本竞技场排名(Text Arena)之后,有人发出了这样的惊呼。根据 11 月 8 日凌晨 LMArena 的最新排名显示,百度文心最新模型 ERNIE-5.0-Preview-1022(文心 5.0 Preview)在文本榜单上一举跃居全球并列第二、国内第一。
「Baidu is back」,在业界权威大模型公共基准测试平台 LMArena 发布最新一期文本竞技场排名(Text Arena)之后,有人发出了这样的惊呼。根据 11 月 8 日凌晨 LMArena 的最新排名显示,百度文心最新模型 ERNIE-5.0-Preview-1022(文心 5.0 Preview)在文本榜单上一举跃居全球并列第二、国内第一。
就在今天,谷歌Nano Banana 2预览版闪现第三方平台,生成速度飙到10秒、画质拉到4K。网友实测炸锅,一句话直出OS+UI复杂界面,还能在黑板上一键推导微积分。真正的「PS终结者」即将上线。
在旧金山北滩的一栋不起眼的建筑里,有一家公司正在悄然改变软件开发的规则。Cursor,过去一年最有名的一家 AI 独角兽,从零起步,在不到两年时间里达到了 1 亿美元 ARR,员工人数从二十几人扩张到接近 250 人,它的产品被全球顶尖开发者使用,甚至在重新定义「开发工具」的标准。
太快了!一天之内Grok连迎两大更新——Grok 4 Fast与Grok Imagine都进行了大升级。Grok 4 Fast把上下文窗口提高到2M,并把完成率拉到94.1%(推理)与97.9%(非推理)。这意味着,你不必再把一本书或一整个代码库切碎喂给模型,它可以一次吞下,然后稳定地给出结果。
现实爽文,小扎打脸! 2023年上半年,扎克伯格在Meta大裁员,几个月之内裁掉一万人,其中就包括由十几名科学家组成的Meta-FAIR蛋白质小组。 然而,被裁掉的几名科学家不甘心,创办了AI蛋白质公
2024年,加州大学圣地亚哥分校「Hao AI Lab」提出了DistServe的解耦推理理念,短短一年多时间,迅速从实验室概念成长为行业标准,被NVIDIA、vLLM等主流大模型推理框架采用,预示着AI正迈向「模块化智能」的新时代。
加州大学河滨分校团队发现,AI组合推理表现不佳部分源于评测指标过于苛刻。他们提出新指标GroupMatch和Test-Time Matching算法,挖掘模型潜力,使GPT-4.1在Winoground测试中首次超越人类,0.2B参数的SigLIP-B16在MMVP-VLM基准测试上超越GPT-4.1并刷新最优结果。这表明模型的组合推理能力早已存在,只需合适方法在测试阶段解锁。
Cal AI联合创始人Zach Yadegari自7岁起学习编程,16岁卖出自己首个应用赚得近10万美元,并与另外一名高中生联合创办了一家年营收达3000万美元的AI应用公司。在被常春藤盟校拒绝后,Yadegari选择进入迈阿密大学。Yadegari认为AI时代会出现更多年轻的创业者,他给出的最重要的一条创业建议就是:立刻行动。
去年,谢赛宁(Saining Xie)团队发布了 Cambrian-1,一次对图像多模态模型的开放式探索。但团队没有按惯例继续推出 Cambrian-2、Cambrian-3,而是停下来思考:真正的多
几个月后,这家非营利研究机构及其新拆分的商业实体 Edison Scientific 又发布了一套更强大的 AI 科学家系统 Kosmos。这个系统在单次运行中可以持续工作 12 至 48 小时,完成相当于人类科研团队数月才能完成的工作量,且其产出的发现中有近 80% 经独立专家验证为准确。