不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究其实……不用大段大段思考,推理模型也能有效推理!
其实……不用大段大段思考,推理模型也能有效推理!
近日,美国 AI 初创公司 Anthropic(Claude 背后公司)就美国商务部的《人工智能扩散框架》临时最终规则提交意见书,呼吁加强对高端AI 芯片的出口控制。更具争议性的是,Anthropic 在博客中声称,中国已建立起高度成熟的芯片走私网络,涉及金额高达数亿美元。
当AI闯入营销界,会掀起怎样的风暴?哥大辍学天才Kennan打造的Icon,以1美元成本颠覆6000亿广告市场,30天狂揽500万美元ARR,用技术改写行业。
4月29日,智元机器人联合创始人兼首席技术官彭志辉,在上海“模速空间”汇报了智元机器人为代表的中国具身智能技术。 彭志辉在汇报中提到了智元机器人把人工智能和机器人技术融合创新,让机器人拥有了“大脑”,会利用人类动作视频来学习,已经学会了一些基本技能,比如自主擦桌子、倒茶、叠衣服等。 作
DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。
4月29日,习近平总书记在上海考察时,在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。
刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。
来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。
渤海湾畔,天津空港经济区内,春风正轻拂天津市第一中学滨海学校(以下简称为「天津一中滨海学校」)。在这座雅名「葵园」的学校里,师生们正雀跃着走进两间由联想开天打造的「未来教室」,「信创+AI」教育的全新生态,也在春日中悄然萌发。
宇曜科技Matter-seek:用AI重构材料科学研发新范式。在高端制造领域,新材料研发的滞后性正成为制约产业升级的隐形瓶颈——光刻胶、航空发动机高温合金等核心材料长期依赖进口,单一材料研发周期动辄十年起步,失败率居高不下。宇曜(北京)科技有限公司推出的Matter-seek人工智能新材料研发平台,正试图用“数据引擎+层级神经网络”的技术组合,打破这一僵局。