AI资讯新闻榜单内容搜索-微调

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

小米大模型第二代来了！相比第一代，训练数据规模更大、品质更高，训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报

5539 点击 2024-11-13 09:12

一个5月份完成训练的大模型，无法对《黑神话·悟空》游戏内容相关问题给出准确回答。

来自主题: AI技术研报

4032 点击 2024-11-10 14:40

大型语言模型（LLMs）虽然在适应新任务方面取得了长足进步，但它们仍面临着巨大的计算资源消耗，尤其在复杂领域的表现往往不尽如人意。

来自主题: AI技术研报

4898 点击 2024-10-20 16:58

大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。

来自主题: AI技术研报

4756 点击 2024-10-18 13:54

Robin3D通过鲁棒指令数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。

来自主题: AI技术研报

7145 点击 2024-10-15 14:39

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。

来自主题: AI资讯

4279 点击 2024-10-08 17:20

「开源新王」Reflection 70B，才发布一个月就跌落神坛了？ 9月5日，Hyperwrite AI联创兼CEO Matt Shumer在X上扔出一则爆炸性消息—— 用Meta的开源Llama 3.1-70B，团队微调出了Reflection 70B。

来自主题: AI资讯

3999 点击 2024-10-07 13:57

十一假期第1天， OpenAI一年一度的开发者大会又来了惹！今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办，刚刚结束的是第一场。

来自主题: AI资讯

3583 点击 2024-10-03 13:07

告别传统指令微调，大模型特定任务性能提升有新方法了。一种新型开源增强知识框架，可以从公开数据中自动提取相关知识，针对性提升任务性能。与基线和SOTA方法对比，本文方法在各项任务上均取得了更好的性能。

来自主题: AI资讯

3918 点击 2024-09-29 15:59

指令调优（Instruction tuning）是一种优化技术，通过对模型的输入进行微调，以使其更好地适应特定任务。先前的研究表明，指令调优样本效率是很高效的，只需要大约 1000 个指令-响应对或精心制作的提示和少量指令-响应示例即可。

来自主题: AI技术研报

3418 点击 2024-09-26 11:06