斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库只是换一下数学题的变量名称,大模型就可能集体降智??
只是换一下数学题的变量名称,大模型就可能集体降智??
2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。
在今年的 NeurIPS 2024 大会上,硅谷最著名的 VC 之一 Conviction Capital 创始人 Sarah Guo 和合伙人 Pranav Reddy 做了一场 “AI 创业公司的现状(The State of AI Startups)”的分享。
近年来,视觉语言基础模型(Vision Language Models, VLMs)大放异彩,在多模态理解和推理上展现出了超强能力。现在,更加酷炫的视觉语言动作模型(Vision-Language-Action Models, VLAs)来了!通过为 VLMs 加上动作预测模块,VLAs 不仅能 “看” 懂和 “说” 清,还能 “动” 起来,为机器人领域开启了新玩法!
按照惯例,三星通常会在每年1月举行Galaxy Unpacked特别活动,Galaxy S系列旗舰新品也将在这场活动中发布。不过,今年的情况似乎有些特殊,或许是Galaxy S24系列销量太好,截至12月中旬,三星仍没有开启预热活动。
最引人注目四笔过亿(刀乐)投资,其中三家是依靠AI驱动业务,另外一家也是早就布局AI。还是要感谢生成式AI,2024年又开始有人愿意大笔投资法律科技了!
RWA、端侧AI、AI代理、环境隐形智能和XR智能眼镜这5个预测预示着AIoT产业格局的变化。 临近年末,多家科技企业、研究机构、投资人和知名博主纷纷做出对2025年AIoT领域的相关预测。
根据 The Information 报道,字节跳动计划 2025 年斥资 70 亿美元投入英伟达最新的 Blackwell 芯片,该计划由张一鸣主导。
近日,AIP GROUP完成天使轮融资,融资金额数百万美元,由算力基金Coevolution独家投资。AIP GROUP旗下产品AIPGPT为AI驱动的一站式IP短视频创作平台,自上线后已在国内、北美等多个城市和地区提供服务。
最近,LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现,他指出,文本向量模型似乎存在一个问题:即使句子词序被打乱,模型输出的向量与原句仍然高度相似。