AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评

MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评

MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评

继 1 月推出国内首个基于 MoE 架构的千亿参数量大语言模型 abab6 后,上周,通用人工智能创业公司、中国估值最高的大模型公司之一 MiniMax 推出了万亿 MoE 模型 abab 6.5。根据 MiniMax 发布的技术报告,在各类核心能力测试中,abab 6.5接近 GPT-4、 Claude 3 Opus 、Gemini 1.5 Pro 等世界领先的大语言模型。

来自主题: AI技术研报
9069 点击    2024-04-25 17:06
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

在对齐大型语言模型(LLM)与人类意图方面,最常用的方法必然是根据人类反馈的强化学习(RLHF)

来自主题: AI资讯
4423 点击    2024-04-24 10:59
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了

开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了

开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了

虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。

来自主题: AI资讯
8340 点击    2024-04-23 14:46
不婚不育的年轻人,对AI对象上头

不婚不育的年轻人,对AI对象上头

不婚不育的年轻人,对AI对象上头

继2023年文生文大语言模型带来行业内外的狂欢之后,2024年春节期间,OpenAI再次曝出了正在内测的文生视频大模型Sora,其高清、丝滑、可以以假乱真的视频内容展示,再次让人见识到了科技的进步。

来自主题: AI资讯
5271 点击    2024-04-22 21:14
首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的 MLLM 由众所周知的 Transformer 网络构成,这种网络具有较低效的二次计算复杂度。

来自主题: AI技术研报
7657 点击    2024-04-22 17:42
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

近日,由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka,推出了他们最新的多模态语言模型——Reka Core

来自主题: AI技术研报
5208 点击    2024-04-17 19:11
微软 Wizard M2 碾压 GPT-4,刚开源就删库?

微软 Wizard M2 碾压 GPT-4,刚开源就删库?

微软 Wizard M2 碾压 GPT-4,刚开源就删库?

Microsoft 在今天推出了 WizardLM 2,这是一个突破性的开源大语言模型,可以说是开源领域的突破,甚至接近和超过部分 GPT-4 的能力,这在之前的开源领域是前所未有的。

来自主题: AI资讯
3349 点击    2024-04-17 17:16
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报
5769 点击    2024-04-16 18:08