只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%
只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%南加州大学团队只用9美元,就能在数学基准测试AIME 24上实现超过20%的推理性能提升,效果好得离谱!而其核心技术只需LoRA+强化学习,用极简路径实现超高性价比后训练。
南加州大学团队只用9美元,就能在数学基准测试AIME 24上实现超过20%的推理性能提升,效果好得离谱!而其核心技术只需LoRA+强化学习,用极简路径实现超高性价比后训练。
Hi,我想先请你只看下面这张照片,推测它的拍摄城市:
近日,ISCA Fellow 2025 入选结果揭晓!
这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。
LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。
随着技术成熟度提升,以及人们逐渐认识到AI节省时间与成本的潜力,预计将涌现大批面向消费者的AI产品,实现全流程任务代劳。
日前,诺奖得主、AI教父Geoffrey Hinton联合10名前OpenAI员工及其他业内人士联合发表公开信反对OpenAI的重组计划,理由非常直接:OpenAI违背了他们的慈善宗旨,即确保AGI的安全开发和造福人类。
昆仑自研的AI模型(SOTA)就像是“最好的锄头”,正在助力公司开采AIGC领域那片“最肥沃的金矿”。
这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉,目前网传信息的真实性含量很低。
现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。