AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。

来自主题: AI技术研报

8322 点击 2025-03-14 15:32

3700次预训练总结超参规律，开源海量实验，告别盲猜

3700次预训练总结超参规律，开源海量实验，告别盲猜

3700次预训练总结超参规律，开源海量实验，告别盲猜

近年来，大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而，要实现其高效部署，精细的超参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索，我们揭示了一套通用的最优超参数缩放定律（Optimal Hyperparameter Scaling Law）。

来自主题: AI技术研报

9767 点击 2025-03-13 15:15

阿里妈妈搜索广告2024大模型思考与实践

阿里妈妈搜索广告2024大模型思考与实践

阿里妈妈搜索广告2024大模型思考与实践

随着大模型时代的到来，搜推广模型是否具备新的进化空间？能否像深度学习时期那样迸发出旺盛的迭代生命力？带着这样的期待，阿里妈妈搜索广告在过去两年的持续探索中，逐步厘清了一些关键问题，成功落地了多个优化方向。

来自主题: AI技术研报

10355 点击 2025-03-13 15:14

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

不怕推理模型简单问题过度思考了，能动态调整CoT的新推理范式SCoT来了！

来自主题: AI技术研报

7927 点击 2025-03-13 14:58

DeepSeek“防弹衣”来了，模型内生安全加固方案，拒绝杀敌一千自损八百｜上海AI Lab

DeepSeek“防弹衣”来了，模型内生安全加固方案，拒绝杀敌一千自损八百｜上海AI Lab

DeepSeek“防弹衣”来了，模型内生安全加固方案，拒绝杀敌一千自损八百｜上海AI Lab

最新研究显示，以超强推理爆红的DeepSeek-R1模型竟藏隐形危险——

来自主题: AI技术研报

10371 点击 2025-03-13 14:53

YOLOe问世，实时观察一切，统一开放物体检测和分割

YOLOe问世，实时观察一切，统一开放物体检测和分割

YOLOe问世，实时观察一切，统一开放物体检测和分割

它能像人眼一样，在文本、视觉输入和无提示范式等不同机制下进行检测和分割。

来自主题: AI技术研报

10482 点击 2025-03-13 14:46

长链推理表象下，大模型精细表征张冠李戴的本质

长链推理表象下，大模型精细表征张冠李戴的本质

长链推理表象下，大模型精细表征张冠李戴的本质

近些年，大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始，到 2022 年底的 GPT-3，再到现在国内外大模型的「百模争锋」，DeepSeek 异军突起，各类大模型应用层出不穷。

来自主题: AI技术研报

10855 点击 2025-03-13 14:41

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8175 点击 2025-03-13 14:41

多模态训练后模型能力雪崩，上海AI Lab全面探索MLLM偏好对齐与模态融合

多模态训练后模型能力雪崩，上海AI Lab全面探索MLLM偏好对齐与模态融合

多模态训练后模型能力雪崩，上海AI Lab全面探索MLLM偏好对齐与模态融合

在实际应用过程中，闭源模型（GPT-4o）等在回复的全面性、完备性、美观性等方面展示出了不俗的表现。

来自主题: AI技术研报

8383 点击 2025-03-13 10:15

长文本向量模型在4K Tokens 之外形同盲区？

长文本向量模型在4K Tokens 之外形同盲区？

长文本向量模型在4K Tokens 之外形同盲区？

2025 年 2 月发布的 NoLiMA 是一种大语言模型（LLM）长文本理解能力评估方法。不同于传统“大海捞针”（Needle-in-a-Haystack, NIAH）测试依赖关键词匹配的做法，它最大的特点是通过精心设计问题和关键信息，迫使模型进行深层语义理解和推理，才能从长文本中找到答案。

来自主题: AI技术研报

5519 点击 2025-03-12 15:08

上一页当前第219页,共352页下一页