AI资讯新闻榜单内容搜索-大模型

大模型行业，根本没有什么“真”开源？

最近一段时间开源大模型市场非常热闹，先是苹果开源了70亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源，在多项基准测试中Llama 3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。

来自主题: AI资讯

7895 点击 2024-08-01 11:26

7月31日，阿里通义宣布免费开放奥运AI大模型，具备奥运专业知识，并集合同声传译级别的中法互译功能。即日起，用户可以在通义APP免费使用。

来自主题: AI资讯

10050 点击 2024-08-01 11:15

国产多模态大模型，也开始卷上下文长度。

来自主题: AI资讯

11375 点击 2024-07-31 17:24

Claude团队这次惹了众怒！

来自主题: AI资讯

9520 点击 2024-07-31 17:20

AI大神李沐老师时隔1年多，终于回归B站“填坑”经典论文精读系列了！

来自主题: AI资讯

11235 点击 2024-07-31 16:46

UrbanGPT是一种创新的时空大型语言模型，它通过结合时空依赖编码器和指令微调技术，展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖，即使在数据稀缺的情况下也能提供准确的预测，为城市管理和规划提供了强大的支持。

来自主题: AI技术研报

10737 点击 2024-07-31 16:37

面对LLM逐渐膨胀的参数规模，没有H100的开发者和研究人员们想出了很多弥补方法，「量化」技术就是其中的一种。这篇可视化指南用各种图解，将「量化」的基本概念和分支方法进行了全方位总结。

来自主题: AI技术研报

10489 点击 2024-07-31 16:21

苹果AI首登iPhone！47页论文曝自研模型，多项测评超GPT-4。

来自主题: AI资讯

6916 点击 2024-07-31 15:26

音视频大语言模型在处理视频内容时，往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新：音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。

来自主题: AI技术研报

7905 点击 2024-07-31 15:05

技术创造新价值，产品拿走利润，在这个行业里近乎铁律，所以大模型公司是AI浪潮的起点，但不是AI浪潮的主流。

来自主题: AI资讯

10616 点击 2024-07-31 13:21