AI资讯新闻榜单内容搜索-LLM

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

近年来，多模态大型语言模型（MLLM）在各个领域的应用取得了显著的成功。然而，作为许多下游任务的基础模型，当前的 MLLM 由众所周知的 Transformer 网络构成，这种网络具有较低效的二次计算复杂度。

来自主题: AI技术研报

7926 点击 2024-04-22 17:42

去年爆火的大模型综述，如今出书了（免费获取见文末）

相信很多朋友都看过这篇论文，在 2023 年 3 月，一支来自加拿大滑铁卢大学、清华大学和新加坡管理大学的团队，发表了一篇大模型综述《A Survey of Large Language Models》.

来自主题: AI资讯

7813 点击 2024-04-20 10:31

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

在大算力的数字化时代下，大语言模型（LLM）以其令人瞩目的发展速度，正引领着技术的潮流

来自主题: AI资讯

2313 点击 2024-04-19 21:47

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

LLM界的「真·Open AI」，又来整顿AI圈了！

来自主题: AI技术研报

6447 点击 2024-04-19 21:40

国内百模谁第一？清华14大LLM最新评测报告出炉，GLM-4、文心4.0站在第一梯队

在2023年的「百模大战」中，众多实践者推出了各类模型，这些模型有的是原创的，有的是针对开源模型进行微调的；有些是通用的，有些则是行业特定的。如何能合理地评价这些模型的能力，成为关键问题

来自主题: AI资讯

6382 点击 2024-04-19 21:21

专治大模型说胡话，精确率100%！华科等提出首个「故障token」检测/分类方法

如今，大型语言模型（LLM）已经成为了我们生活中的好帮手

来自主题: AI技术研报

5161 点击 2024-04-19 20:56

从文字模型到世界模型！Meta新研究让AI Agent理解物理世界

LLM已经可以理解文本和图片了，也能够根据它们的历史知识回答各种问题，但它们或许对周围世界当前发生的事情一无所知

来自主题: AI技术研报

5193 点击 2024-04-18 15:52

Meta无限长文本大模型来了：参数仅7B，已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力，虽然存在线性注意力和状态空间模型等次二次解决方案

来自主题: AI技术研报

6763 点击 2024-04-17 20:17

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat，大语言模型（LLM）在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报

6040 点击 2024-04-16 18:08

生成式人工智能应用于教育，还要历经多少关卡？

生成式人工智能（Generative Artificial Intelligence，简称生成式 AI）是 AI 的一种形式，可以生成从论文到视频等任何东西，协助人类处理信息和数据。生成式人工智能的引入，特别是 ChatGPT 等「大型语言模型」（LLM）聊天机器人的引入，使得许多人预测这项新技术将改变现有的教育模式。

来自主题: AI资讯

8539 点击 2024-04-16 11:09