AI资讯新闻榜单内容搜索-预训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 预训练

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接（Hyper-Connections），一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题，超连接可通过动态调整不同层之间的连接权重，解决梯度消失和表示崩溃（Representation Collapse）之间的权衡困境。在 Dense 模型和 MoE 模型预训练中，超连接方案展示出显著的性能提升效果，使收敛速度最高可加速 80%。

来自主题: AI技术研报

6331 点击 2024-11-07 17:41

高效评估多模态预训练对齐质量，中科大提出模态融合率MIR

高效评估多模态预训练对齐质量，中科大提出模态融合率MIR

高效评估多模态预训练对齐质量，中科大提出模态融合率MIR

来自中科大等单位的研究团队共同提出了用来有效评估多模态大模型预训练质量的评估指标 Modality Integration Rate（MIR），能够快速准确地评估多模态预训练的模态对齐程度。

来自主题: AI技术研报

5102 点击 2024-11-04 17:13

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

在人工智能领域，大型预训练模型（如 GPT 和 LLaVA）的 “幻觉” 现象常被视为一个难以克服的挑战，尤其是在执行精确任务如图像分割时。

来自主题: AI技术研报

9529 点击 2024-11-03 17:53

李开复回应一切：竞技场排名“让我们有信心继续做预训练”

李开复回应一切：竞技场排名“让我们有信心继续做预训练”

李开复回应一切：竞技场排名“让我们有信心继续做预训练”

国产大模型首次在国际最具挑战的“大模型竞技场”榜单上超过GPT-4o（5月版本），当零一万物的名字紧跟在OpenAI、Google之后，李开复却如是坦言。

来自主题: AI资讯

5306 点击 2024-11-01 10:41

大模型训练成本降一半！厦大和vivo联合推出预训练新策略，给LLM降本增效

大模型训练成本降一半！厦大和vivo联合推出预训练新策略，给LLM降本增效

大模型训练成本降一半！厦大和vivo联合推出预训练新策略，给LLM降本增效

近年来，大语言模型（Large Language Models, LLMs）的研究取得了重大进展，并对各个领域产生了深远影响。然而，LLMs的卓越性能来源于海量数据的大规模训练，这导致LLMs的训练成本明显高于传统模型。

来自主题: AI技术研报

5382 点击 2024-11-01 10:15

全球首次！时序大模型突破十亿参数，华人团队发布Time-MoE，预训练数据达3000亿个时间点

全球首次！时序大模型突破十亿参数，华人团队发布Time-MoE，预训练数据达3000亿个时间点

全球首次！时序大模型突破十亿参数，华人团队发布Time-MoE，预训练数据达3000亿个时间点

Time-MoE采用了创新的混合专家架构，能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。

来自主题: AI技术研报

6168 点击 2024-10-23 13:40

对话李开复：零一万物融的钱够做预训练，我做toB不会亏钱

对话李开复：零一万物融的钱够做预训练，我做toB不会亏钱

对话李开复：零一万物融的钱够做预训练，我做toB不会亏钱

刚从美国回来的李开复，想清楚了很多事情，他的大模型公司零一万物也开始发生变化。

来自主题: AI资讯

9268 点击 2024-10-17 15:29

李开复回应放弃预训练：训一次大模型三四百万美元，头部公司都付得起｜最前线

李开复回应放弃预训练：训一次大模型三四百万美元，头部公司都付得起｜最前线

李开复回应放弃预训练：训一次大模型三四百万美元，头部公司都付得起｜最前线

零一万物的最新模型，打榜赢了GPT-4o。

来自主题: AI资讯

4541 点击 2024-10-17 09:56

Evaluation is All You Need！首个开源多模态大模型通用评测器LLaVA-Critic

Evaluation is All You Need！首个开源多模态大模型通用评测器LLaVA-Critic

Evaluation is All You Need！首个开源多模态大模型通用评测器LLaVA-Critic

随着对现有互联网数据的预训练逐渐成熟，研究的探索空间正由预训练转向后期训练（Post-training），OpenAI o1 的发布正彰显了这一点。

来自主题: AI技术研报

6532 点击 2024-10-14 15:46

红杉资本2024：生成式AI o1新章节，代理推理时代开始，预计会出现新的“杀手级应用”

红杉资本2024：生成式AI o1新章节，代理推理时代开始，预计会出现新的“杀手级应用”

红杉资本2024：生成式AI o1新章节，代理推理时代开始，预计会出现新的“杀手级应用”

生成性人工智能正从快速预训练响应向慢速深度推理转变，开启自主应用的新篇章。

来自主题: AI资讯

8711 点击 2024-10-12 10:26

上一页当前第16页,共22页下一页