AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接（Hyper-Connections），一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题，超连接可通过动态调整不同层之间的连接权重，解决梯度消失和表示崩溃（Representation Collapse）之间的权衡困境。在 Dense 模型和 MoE 模型预训练中，超连接方案展示出显著的性能提升效果，使收敛速度最高可加速 80%。

来自主题: AI技术研报

6445 点击 2024-11-07 17:41

价值万亿的具身智能市场，大佬们如何从世界模型下刀？

价值万亿的具身智能市场，大佬们如何从世界模型下刀？

价值万亿的具身智能市场，大佬们如何从世界模型下刀？

具身智能，简单来说，就是赋予 AI 一个「身体」，让这颗聪明的大脑在物理世界中行动自如。把这颗大脑升级成世界模型 —— 它拥有记忆、直觉和常识时，机器人可以不再机械地按训练行事，而是能够灵活变通，具体问题具体分析。

来自主题: AI技术研报

5812 点击 2024-11-07 17:33

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算，它可以帮你预订酒店。既拥有海量常识，又能做长期规划的大语言模型（LLM），自然成为了智能体常用的基础模块。

来自主题: AI技术研报

5194 点击 2024-11-06 15:34

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

算法设计（AD）对于各个领域的问题求解至关重要。大语言模型（LLMs）的出现显著增强了算法设计的自动化和创新，提供了新的视角和有效的解决方案。

来自主题: AI技术研报

4773 点击 2024-11-06 15:29

下载次数破39万！CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

下载次数破39万！CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

下载次数破39万！CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能，还能通过选择最佳候选图像来实际改善生成的图像。

来自主题: AI技术研报

6125 点击 2024-11-06 15:07

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前，基于规则的系统长期以来是语言模型的主导范式。

来自主题: AI技术研报

5900 点击 2024-11-06 14:57

RAG 系统的分块难题：小型语言模型如何找到最佳断点？

RAG 系统的分块难题：小型语言模型如何找到最佳断点？

RAG 系统的分块难题：小型语言模型如何找到最佳断点？

之前我们聊过 RAG 里文档分块 (Chunking) 的挑战，也介绍了迟分 (Late Chunking) 的概念，它可以在向量化的时候减少上下文信息的丢失。今天，我们来聊聊另一个难题：如何找到最佳的分块断点。

来自主题: AI技术研报

7179 点击 2024-11-05 16:36

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型（如 GPT-4o、DALL-E 3）通常拥有数十亿参数，且模型权重不公开，使得传统的白盒优化方法（如反向传播）难以实施。

来自主题: AI技术研报

4603 点击 2024-11-05 15:28

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！团队全新公开35页技术报告，详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

来自主题: AI技术研报

4704 点击 2024-11-05 15:17

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

复刻OpenAI o1推理大模型，开源界传来最新进展： LLaMA版o1项目刚刚发布，来自上海AI Lab团队。

来自主题: AI技术研报

5743 点击 2024-11-05 15:12

上一页当前第376页,共488页下一页