蚂蚁新报告!全盘公开Ling 2.0训练细节,性能突破的四大关键曝光
蚂蚁新报告!全盘公开Ling 2.0训练细节,性能突破的四大关键曝光蚂蚁集团这波操作大圈粉!智东西10月28日报道,10月25日,蚂蚁集团在arXiv上传了一篇技术报告,一股脑将自家2.0系列大模型训练的独家秘籍全盘公开。今年9月至今,蚂蚁集团百灵大模型Ling 2.0系列模型陆续亮相,其万亿参数通用语言模型Ling-1T多项指标位居开源模型的榜首
蚂蚁集团这波操作大圈粉!智东西10月28日报道,10月25日,蚂蚁集团在arXiv上传了一篇技术报告,一股脑将自家2.0系列大模型训练的独家秘籍全盘公开。今年9月至今,蚂蚁集团百灵大模型Ling 2.0系列模型陆续亮相,其万亿参数通用语言模型Ling-1T多项指标位居开源模型的榜首
今日(10 月 28 日),高通正式宣布推出两款全新芯片——高通 AI200 和高通 AI250,以及相应的机架级解决方案。此举直接挑战了由英伟达和超威半导体长期主导的 AI 芯片领域。消息宣布后,高通股价依然应声飙升,涨幅超 11%,创 2024 年 7 月以来新高。
刚刚,不发论文、爱发博客的 Thinking Machines Lab (以下简称 TML)再次更新,发布了一篇题为《在策略蒸馏》的博客。在策略蒸馏(on-policy distillation)是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时,TML 发现在策略蒸馏可以极低的成本超越其他方法。
OpenAI凭ChatGPT坐拥8亿周活与预计约130亿美元年收入,订阅难覆盖成本、探索广告并豪赌算力扩张;Anthropic低调专攻企业,Claude在代码等场景见长,企业占营收八成、30万客户、年收入约70~90亿美元。OpenAI主攻C端,Anthropic深耕B端,前者求声量与规模,后者重价值与稳健,胜负未定。
刚刚,计算机科学家 Yoshua Bengio 创造了新的历史,成为 Google Scholar 上首个引用量超过 100 万的人!打个直观的比方,如果我们将每一篇引用论文打印成册(假设平均厚度为 1 毫米),然后将它们垂直堆叠起来,这座由知识构成的纸塔将高达 1000 米。这是什么概念?它将轻松超越目前的世界最高建筑,即 828 米的迪拜哈利法塔。
Transformer之父「叛逃」?8年前掀起AI革命的男人,如今嫌「自己孩子」太吵太卷!当资本狂飙、论文堆积如山,他却高喊:是时候放弃Transformer,重新找回好奇心了。
这个双十一,终于可以把人形机器人放入购物车了。今年,还有一件「意想不到」的商品悄悄加入——不是模型,也不是玩具,而是真·能走能跑、能跟你聊天、还能跳舞的人形机器人。
亚马逊AI博士奖学金,正式公布了!两年共计6800万美金,计划将为全球「九所」顶尖大学,100多名博士生提供研究资金的支持。这九所顶尖大学,个个都是AI界的「扛把子」,主要包括:
AI 检测准确率高达 98.9%,也防不住有人给真视频 P 上 Sora 水印。前段时间刷到一个视频,标题就是「中俄混血女明星回应地下室打婆婆传闻」,试问谁看了这个标题能不燃起熊熊的八卦之心?
上海前三季度GDP增5.5%,AI制造业增12.8%,成增长引擎。