AI资讯新闻榜单内容搜索-LLM

当LLM学会左右互搏，基础模型或将迎来集体进化

进入现今的大模型 (LLM) 时代，又有研究者发现了左右互搏的精妙用法！近日，加利福尼亚大学洛杉矶分校的顾全全团队提出了一种新方法 SPIN（Self-Play Fine-Tuning），可不使用额外微调数据，仅靠自我博弈就能大幅提升 LLM 的能力。

来自主题: AI资讯

10021 点击 2024-01-06 12:17

在MEET 2024智能未来大会现场，商汤联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚这样讲道。

来自主题: AI资讯

10034 点击 2024-01-04 10:58

本文探讨了大模型套壳的问题，解释了大模型的内核和预训练过程。同时，介绍了“原创派”和“模仿派”两种预训练框架的差异，并讨论了通过“偷”聊天模型数据进行微调的现象。最后，提出了把“壳”做厚才是竞争力的观点。

来自主题: AI资讯

7059 点击 2024-01-04 09:53

大模型固有的幻觉问题严重影响了LLM的表现。斯坦福最新研究利用维基百科数据训练大模型，得到的WikiChat成为首个几乎不产生幻觉的聊天机器人。

来自主题: AI资讯

5640 点击 2024-01-03 14:00

近日，美团、浙大等推出了能够在移动端部署的多模态大模型，包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来，每个人都能方便、快捷、低成本的拥有属于自己的大模型。

来自主题: AI资讯

10601 点击 2024-01-03 13:42

作者重点关注了基于 Transformer 的 LLM 模型体系结构在从预训练到推理的所有阶段中优化长上下文能力的进展。

来自主题: AI资讯

4959 点击 2024-01-03 13:38

大模型领域最新的一个热门趋势是把模型塞到手机里。而最应该做这个研究的公司终于带着它的论文现身，那就是苹果。

来自主题: AI资讯

4860 点击 2024-01-03 10:10

大型语言模型（LLM）虽然在诸多下游任务上展现出卓越的能力，但其实际应用还存在一些问题。其中，LLM 的「幻觉（hallucination）」问题是一个重要缺陷。

来自主题: AI资讯

8494 点击 2024-01-02 15:31

经过23年的生成式AI之年，24年AI会有哪些新突破？大佬预测，即使GPT-5发布，LLM在本质上仍然有限，在24年，基本的AGI也不足以实现。

来自主题: AI资讯

4392 点击 2024-01-01 23:25

2023年的LLM开源社区都发生了什么？来自Hugging Face的研究员带你回顾并重新认识开源LLM

来自主题: AI资讯

10505 点击 2023-12-31 14:34