
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单7B小模型+3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主?
7B小模型+3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主?
全面评估大模型电商领域能力,首个聚焦电商基础概念的可扩展问答基准来了!
给大模型落地,加入极致的务实主义。
尽管 DeepSeek-R1 在单模态推理中取得了显著成功,但已有的多模态尝试(如 R1-V、R1-Multimodal-Journey、LMM-R1)尚未完全复现其核心特征。
最新研究显示,以超强推理爆红的DeepSeek-R1模型竟藏隐形危险——
大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。
Hugging Face的Open R1重磅升级,7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。
大语言模型长序列文本生成效率新突破——生成10万Token的文本,传统自回归模型需要近5个小时,现在仅需90分钟!
今天凌晨,亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。
开源微调神器Unsloth带着黑科技又来了:短短两周后,再次优化DeepSeek-R1同款GRPO训练算法,上下文变长10倍,而显存只需原来的1/10!