「小模型」有更多机会点
「小模型」有更多机会点大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。
搜索
大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。
黄仁勋和乔布斯打开了两个时代 一身亮光的鳄鱼皮夹克,AI教主黄仁勋出现的那一刻,我并没有期待今天英伟达会有什么大动作,而是在想,这身鳄鱼皮会不会被环保主义者投诉(“家养的也不行”)。
Falcon 方法是一种增强半自回归投机解码框架,旨在增强 draft model 的并行性和输出质量,以有效提升大模型的推理速度。Falcon 可以实现约 2.91-3.51 倍的加速比,在多种数据集上获得了很好的结果,并已应用到翼支付多个实际业务中。
本文将介绍首个关于 o1 类长思维链模型过度思考现象。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。
这份《2024年AI应用行业年度报告》是由Xsignal打造的AI年终盘点大餐。全报告共78页,数据之翔实和页面之精美程度冠绝2024。添加客服微信 openai178,免费获取完整PDF。
当狂飙突进的AI撞上教育,会擦出怎样的火花?
三句话提提神, RTX 5070显卡性能媲美4090,价格只要1/3;
1/10训练数据激发高级推理能力!近日,来自清华的研究者提出了PRIME,通过隐式奖励来进行过程强化,提高了语言模型的推理能力,超越了SFT以及蒸馏等方法。
年度盘点第二弹:关于DeepSeek。
安东尼·葛姆雷用雕塑重新定义了身体和环境的关系,他的作品让观众重新回归身体的感知与体验。