AI资讯新闻榜单内容搜索-LLM

普林斯顿博士生高天宇指令微调进展速览：数据、算法和评估

自 ChatGPT 等大型语言模型推出以来，为了提升模型效果，各种指令微调方法陆续被提出。本文中，普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展，包括数据、算法和评估等。

来自主题: AI技术研报

7794 点击 2024-01-21 14:14

被OpenAI、Mistral AI带火的MoE是怎么回事？一文贯通专家混合架构部署

本文将介绍 MoE 的构建模块、训练方法以及在使用它们进行推理时需要考虑的权衡因素。

来自主题: AI技术研报

9952 点击 2024-01-20 15:16

GPT-4V惨败！CV大神谢赛宁新作：V*重磅「视觉搜索」算法让LLM理解力逼近人类

多模态大模型GPT-4V也会「有眼无珠」。UC San Diego纽约大学研究人员提出全新V*视觉搜索算法逆转LLM弱视觉宿命。

来自主题: AI资讯

6628 点击 2024-01-20 15:01

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

对模型参数量的迷信、执念也许可以放下了，混合多个小模型也是未来构造对话型 AI 的一个光明的方向。

来自主题: AI技术研报

8354 点击 2024-01-18 18:23

马毅LeCun谢赛宁曝出多模态LLM重大缺陷！开创性研究显著增强视觉理解能力

来自纽约大学和UC伯克利的研究团队成功捕捉到了多模态大模型在视觉理解方面存在的重大缺陷。针对这个问题，他们进一步提出了一个将DINOv2特征与CLIP特征结合的方法，有效地提升了多模态大模型的视觉功能。

来自主题: AI资讯

8433 点击 2024-01-18 13:27

张鹏、潘乱对谈白鸦、肖弘：大模型时代的产品经理，需要 Back to the Future

在 AI 应用的路线上，有赞和 Monica.im(简称 Monica）是两种截然不同的代表。

来自主题: AI资讯

10937 点击 2024-01-18 10:09

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

没想到啊，开源大模型家族里，居然挤进来一位特别的选手：来自央企，身份为运营商。

来自主题: AI资讯

4788 点击 2024-01-17 18:22

这款 AI 网关项目简直太棒了，轻松接入OpenAI、LLama2、Google Gem)ini等 100 多种大语言模型！

随着技术的不断发展，各种AI模型框架也越来越多，管理和整合多个模型、服务提供商和密钥可能会变得复杂。幸运的是，而今有一款名为“AI 网关”的开源项目可以帮助简化这一过程。

来自主题: AI资讯

6156 点击 2024-01-17 10:52

GitHub本月最佳：使用电脑的新方式，已经获得3万7千星

Open Interpreter 允许LLM在您的计算机上运行代码来完成任务。这可能是人类使用电脑的新方式，一句人话，电脑开始帮人类完成任务。

来自主题: AI技术研报

4949 点击 2024-01-16 14:40

大模型伪装「潜伏特工」学会欺骗！OpenAI劲敌重磅研究震惊马斯克

最近，Anthropic的研究者发现：一旦我们教会LLM学会骗人，就很难纠正它了。它会在训练过程中表现得「人畜无害」，随后神不知鬼不觉地输出恶意代码！如果想要纠正它，它的欺骗行为只会更变本加厉。

来自主题: AI资讯

9658 点击 2024-01-16 11:06

AI资讯新闻榜单内容搜索-LLM

普林斯顿博士生高天宇指令微调进展速览：数据、算法和评估

被OpenAI、Mistral AI带火的MoE是怎么回事？一文贯通专家混合架构部署

GPT-4V惨败！CV大神谢赛宁新作：V*重磅「视觉搜索」算法让LLM理解力逼近人类

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

马毅LeCun谢赛宁曝出多模态LLM重大缺陷！开创性研究显著增强视觉理解能力

张鹏、潘乱对谈白鸦、肖弘：大模型时代的产品经理，需要 Back to the Future

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

这款 AI 网关项目简直太棒了，轻松接入OpenAI、LLama2、Google Gem)ini等 100 多种大语言模型！

GitHub本月最佳：使用电脑的新方式 ，已经获得3万7千星

大模型伪装「潜伏特工」学会欺骗！OpenAI劲敌重磅研究震惊马斯克

GitHub本月最佳：使用电脑的新方式，已经获得3万7千星