AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

基于内置思维链的思考方法为解决多轮会话中存在的问题提供了研究方向。按照思考方法收集训练数据集，通过有监督学习微调大语言模型；训练一个一致性奖励模型，并将该模型用作奖励函数，以使用强化学习来微调大语言模型。结果大语言模型的推理能力和计划能力，以及执行计划的能力得到了增强。

来自主题: AI资讯

6040 点击 2025-03-04 19:46

NP难问题接近被AI破解！南航牛津爆改DeepSeek-R1推理，碾压人类27年研究

NP难问题接近被AI破解！南航牛津爆改DeepSeek-R1推理，碾压人类27年研究

NP难问题接近被AI破解！南航牛津爆改DeepSeek-R1推理，碾压人类27年研究

给DeepSeek-R1推理指导，它的数学推理能力就开始暴涨。更令人吃惊是，Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例！而人类为此耗费了27年。研究者预言：LLM离破解NP-hard问题，已经又近了一步。

来自主题: AI技术研报

8351 点击 2025-03-04 16:20

Mercury：颠覆性扩散大语言模型如何重塑AI生成领域

Mercury：颠覆性扩散大语言模型如何重塑AI生成领域

Mercury：颠覆性扩散大语言模型如何重塑AI生成领域

2025年2月27日，由前扩散模型领域顶尖研究者创立的Inception Labs正式发布了全球首个商业级扩散大语言模型（dLLM）——“Mercury”。这一里程碑式产品不仅在生成速度、硬件效率和成本控制上实现突破，更标志着自然语言处理技术从自回归（Autoregressive）范式向扩散（Diffusion）范式的重大跃迁。

来自主题: AI资讯

8780 点击 2025-03-04 13:02

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长序列，来自华为港大等 | 开源

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长序列，来自华为港大等 | 开源

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长序列，来自华为港大等 | 开源

文字中貌似不起眼的标点符号，竟然可以显著加速大模型的训练和推理过程？

来自主题: AI技术研报

8242 点击 2025-03-04 10:08

生成与理解相互促进！华科字节提出Liquid，揭示统一多模态模型尺度规律！

生成与理解相互促进！华科字节提出Liquid，揭示统一多模态模型尺度规律！

生成与理解相互促进！华科字节提出Liquid，揭示统一多模态模型尺度规律！

近年来大语言模型（LLM）的迅猛发展正推动人工智能迈向多模态融合的新纪元。然而，现有主流多模态大模型（MLLM）依赖复杂的外部视觉模块（如 CLIP 或扩散模型），导致系统臃肿、扩展受限，成为跨模态智能进化的核心瓶颈。

来自主题: AI技术研报

8324 点击 2025-03-04 09:52

历时6个月，Hugging Face开源LLM「超大规模实战手册」！200页3万字4000次训练

历时6个月，Hugging Face开源LLM「超大规模实战手册」！200页3万字4000次训练

历时6个月，Hugging Face开源LLM「超大规模实战手册」！200页3万字4000次训练

Hugging Face发布了「超大规模实战手册」，在512个GPU上进行超过4000个scaling实验。联创兼CEO Clement对此感到十分自豪。

来自主题: AI技术研报

8338 点击 2025-03-03 16:35

Claude 3.7硬控马里奥90秒，GPT-4o开局暴毙！Karpathy直呼基准失效，游戏成LLM新战场

Claude 3.7硬控马里奥90秒，GPT-4o开局暴毙！Karpathy直呼基准失效，游戏成LLM新战场

Claude 3.7硬控马里奥90秒，GPT-4o开局暴毙！Karpathy直呼基准失效，游戏成LLM新战场

Karpathy发出灵魂拷问，评估AI究竟该看哪些指标？答案或许就藏在经典游戏里！最近，加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体，Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯

7252 点击 2025-03-03 16:00

LLM「啊哈时刻」竟会自我纠正，单体数学性能暴涨！UIUC华人一作

LLM「啊哈时刻」竟会自我纠正，单体数学性能暴涨！UIUC华人一作

LLM「啊哈时刻」竟会自我纠正，单体数学性能暴涨！UIUC华人一作

LLM在推理任务中表现惊艳，却在自我纠正上的短板却一直令人头疼。UIUC联手马里兰大学全华人团队提出一种革命性的自我奖励推理框架，将生成、评估和纠正能力集成于单一LLM，让模型像人类一样「边想边改」，无需外部帮助即可提升准确性。

来自主题: AI技术研报

7319 点击 2025-03-03 10:28

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

大语言模型（LLMs）在当今的自然语言处理领域扮演着越来越重要的角色，但其安全性问题也引发了广泛关注。

来自主题: AI技术研报

6105 点击 2025-03-03 09:53

LeCun世界模型再近一步！Meta研究证明：AI可无先验理解直觉物理

LeCun世界模型再近一步！Meta研究证明：AI可无先验理解直觉物理

LeCun世界模型再近一步！Meta研究证明：AI可无先验理解直觉物理

AI如何理解物理世界？视频联合嵌入预测架构V-JEPA带来新突破，无需硬编码核心知识，在自监督预训练中展现出对直观物理的理解，超越了基于像素的预测模型和多模态LLM。

来自主题: AI技术研报

9369 点击 2025-03-02 15:47

上一页当前第34页,共119页下一页