AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的 MLLM 由众所周知的 Transformer 网络构成,这种网络具有较低效的二次计算复杂度。

来自主题: AI技术研报
8766 点击    2024-04-22 17:42
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

近日,由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka,推出了他们最新的多模态语言模型——Reka Core

来自主题: AI技术研报
6403 点击    2024-04-17 19:11
微软 Wizard M2 碾压 GPT-4,刚开源就删库?

微软 Wizard M2 碾压 GPT-4,刚开源就删库?

微软 Wizard M2 碾压 GPT-4,刚开源就删库?

Microsoft 在今天推出了 WizardLM 2,这是一个突破性的开源大语言模型,可以说是开源领域的突破,甚至接近和超过部分 GPT-4 的能力,这在之前的开源领域是前所未有的。

来自主题: AI资讯
4684 点击    2024-04-17 17:16
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报
6930 点击    2024-04-16 18:08
生成式人工智能应用于教育,还要历经多少关卡?

生成式人工智能应用于教育,还要历经多少关卡?

生成式人工智能应用于教育,还要历经多少关卡?

生成式人工智能(Generative Artificial Intelligence,简称生成式 AI)是 AI 的一种形式,可以生成从论文到视频等任何东西,协助人类处理信息和数据。生成式人工智能的引入,特别是 ChatGPT 等「大型语言模型」(LLM) 聊天机器人的引入,使得许多人预测这项新技术将改变现有的教育模式。

来自主题: AI资讯
9480 点击    2024-04-16 11:09
谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用,并提出了一个全新的视角

来自主题: AI技术研报
8947 点击    2024-04-14 13:07