AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

最近，以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升，在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称，推理可以让模型更好的遵守安全政策，是提升模型安全的新路径。

来自主题: AI技术研报

3472 点击 2024-11-07 18:17

结构化表格也成模态！浙大TableGPT2开源，最强表格AI问世

结构化表格也成模态！浙大TableGPT2开源，最强表格AI问世

结构化表格也成模态！浙大TableGPT2开源，最强表格AI问世

现在正是多模态大模型的时代，图像、视频、音频、3D、甚至气象运动都在纷纷与大型语言模型的原生文本模态组合。而浙江大学及其计算机创新技术研究院的一个数十人团队也将结构化数据（包括数据库、数仓、表格、json 等）视为了一种独立模态。

来自主题: AI技术研报

4040 点击 2024-11-07 17:45

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接（Hyper-Connections），一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题，超连接可通过动态调整不同层之间的连接权重，解决梯度消失和表示崩溃（Representation Collapse）之间的权衡困境。在 Dense 模型和 MoE 模型预训练中，超连接方案展示出显著的性能提升效果，使收敛速度最高可加速 80%。

来自主题: AI技术研报

4623 点击 2024-11-07 17:41

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算，它可以帮你预订酒店。既拥有海量常识，又能做长期规划的大语言模型（LLM），自然成为了智能体常用的基础模块。

来自主题: AI技术研报

3803 点击 2024-11-06 15:34

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

算法设计（AD）对于各个领域的问题求解至关重要。大语言模型（LLMs）的出现显著增强了算法设计的自动化和创新，提供了新的视角和有效的解决方案。

来自主题: AI技术研报

3828 点击 2024-11-06 15:29

下载次数破39万！CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

下载次数破39万！CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

下载次数破39万！CMU、Meta联合发布VQAScore文生图优化方案：Imagen3已采用

VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能，还能通过选择最佳候选图像来实际改善生成的图像。

来自主题: AI技术研报

4263 点击 2024-11-06 15:07

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前，基于规则的系统长期以来是语言模型的主导范式。

来自主题: AI技术研报

4056 点击 2024-11-06 14:57

RAG 系统的分块难题：小型语言模型如何找到最佳断点？

RAG 系统的分块难题：小型语言模型如何找到最佳断点？

RAG 系统的分块难题：小型语言模型如何找到最佳断点？

之前我们聊过 RAG 里文档分块 (Chunking) 的挑战，也介绍了迟分 (Late Chunking) 的概念，它可以在向量化的时候减少上下文信息的丢失。今天，我们来聊聊另一个难题：如何找到最佳的分块断点。

来自主题: AI技术研报

5572 点击 2024-11-05 16:36

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型（如 GPT-4o、DALL-E 3）通常拥有数十亿参数，且模型权重不公开，使得传统的白盒优化方法（如反向传播）难以实施。

来自主题: AI技术研报

2761 点击 2024-11-05 15:28

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！团队全新公开35页技术报告，详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

来自主题: AI技术研报

3006 点击 2024-11-05 15:17

上一页当前第168页,共250页下一页