AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

搞不定有表格数据和多模态的Prompt？试下微软最新的提示词编排标记语言POML

搞不定有表格数据和多模态的Prompt？试下微软最新的提示词编排标记语言POML

搞不定有表格数据和多模态的Prompt？试下微软最新的提示词编排标记语言POML

最近来自微软的研究者们带来了一个全新的思路，他们开源发布了POML（Prompt Orchestration Markup Language），它的的解决方案它的核心思想非常直接：为什么我们不能像开发网页一样，用工程化的思维来构建和管理我们的Prompt呢？这个编排语言很类似IBM的PDL

来自主题: AI技术研报

9351 点击 2025-08-27 11:11

手把手教机器人：斯坦福大学提出RTR框架，让机械臂助力人形机器人真机训练

手把手教机器人：斯坦福大学提出RTR框架，让机械臂助力人形机器人真机训练

手把手教机器人：斯坦福大学提出RTR框架，让机械臂助力人形机器人真机训练

人形机器人的运动控制，正成为强化学习（RL）算法应用的下一个热点研究领域。当前，主流方案大多遵循 “仿真到现实”（Sim-to-Real）的范式。研究者们通过域随机化（Domain Randomization）技术，在成千上万个具有不同物理参数的仿真环境中训练通用控制模型，期望它能凭借强大的泛化能力，直接适应动力学特性未知的真实世界。

来自主题: AI技术研报

8897 点击 2025-08-27 11:05

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

当大语言模型（LLM）走向千行百业，推理效率与显存成本的矛盾日益尖锐。

来自主题: AI资讯

8687 点击 2025-08-26 19:21

英伟达韩松团队新作：具有后神经架构搜索的高效语言模型

英伟达韩松团队新作：具有后神经架构搜索的高效语言模型

英伟达韩松团队新作：具有后神经架构搜索的高效语言模型

英伟达开源又放大招了！韩松团队推出了一款全新的基于后神经架构搜索的高效语言模型——Jet-Nemotron。

来自主题: AI资讯

8492 点击 2025-08-26 19:00

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语，那么我们能学好语言吗？这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报

9016 点击 2025-08-26 12:11

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来，大语言模型（LLMs）展现出强大的语言理解与生成能力，推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等，已经深刻改变了人机交互方式。

来自主题: AI技术研报

8567 点击 2025-08-26 11:30

真实场景也能批量造「险」！VLM+扩散模型打造真实域自动驾驶极限测试

真实场景也能批量造「险」！VLM+扩散模型打造真实域自动驾驶极限测试

真实场景也能批量造「险」！VLM+扩散模型打造真实域自动驾驶极限测试

浙江大学与哈工大（深圳）联合推出SafeMVDrive，利用扩散模型结合VLM实现批量化多视角真实域的安全关键视频生成。该方法在保持画质与真实感的同时，显著增强了驾驶场景的危险性。生成的场景用于端到端自动驾驶系统的极限压测，可使得模型的碰撞率提升50倍。

来自主题: AI技术研报

8257 点击 2025-08-26 10:47

为防AI刷题，Nature等顶刊最新封面被做成数据集，考验模型科学推理能力|上海交通大学

为防AI刷题，Nature等顶刊最新封面被做成数据集，考验模型科学推理能力|上海交通大学

为防AI刷题，Nature等顶刊最新封面被做成数据集，考验模型科学推理能力|上海交通大学

近年来，以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型，在各大基准测试（如MMMU）中捷报频传，纷纷刷榜成功。

来自主题: AI技术研报

9454 点击 2025-08-26 10:41

大模型能否为不同硬件平台生成高性能内核？南大、浙大提出跨平台内核生成评测框架MultiKernelBench

大模型能否为不同硬件平台生成高性能内核？南大、浙大提出跨平台内核生成评测框架MultiKernelBench

大模型能否为不同硬件平台生成高性能内核？南大、浙大提出跨平台内核生成评测框架MultiKernelBench

在深度学习模型的推理与训练过程中，绝大部分计算都依赖于底层计算内核（Kernel）来执行。计算内核是运行在硬件加速器（如 GPU、NPU、TPU）上的 “小型高性能程序”，它负责完成矩阵乘法、卷积、归一化等深度学习的核心算子运算。

来自主题: AI技术研报

9260 点击 2025-08-25 15:44

突破长视频生成瓶颈：南大、TeleAI推出全新AI生成范式MMPL，让创意一镜到底

突破长视频生成瓶颈：南大、TeleAI推出全新AI生成范式MMPL，让创意一镜到底

突破长视频生成瓶颈：南大、TeleAI推出全新AI生成范式MMPL，让创意一镜到底

你是否曾被 AI 生成视频的惊艳开场所吸引，却在几秒后失望于⾊彩漂移、画面模糊、节奏断裂？当前 AI 长视频⽣成普遍⾯临 “高开低走 ” 的困境：前几秒惊艳夺⽬，之后却质量骤降、细节崩坏；更别提帧间串行生成导致的低效问题 —— 动辄数小时的等待，实时预览几乎难以企及。

来自主题: AI技术研报

7960 点击 2025-08-25 15:33

上一页当前第191页,共432页下一页