AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

推理模型常常表现出类似自我反思的行为，但问题是——这些行为是否真的能有效探索新策略呢？

来自主题: AI技术研报

7053 点击 2025-06-02 17:48

揭开大模型“伪遗忘”，港理工等团队：结构不变就是没忘

揭开大模型“伪遗忘”，港理工等团队：结构不变就是没忘

揭开大模型“伪遗忘”，港理工等团队：结构不变就是没忘

近年来，大语言模型（LLMs）的能力突飞猛进，但随之而来的隐私风险也逐渐浮出水面。

来自主题: AI技术研报

7059 点击 2025-06-02 16:22

AI数学能力暴涨100%，自进化直逼RL极限！CMU新作颠覆认知

AI数学能力暴涨100%，自进化直逼RL极限！CMU新作颠覆认知

AI数学能力暴涨100%，自进化直逼RL极限！CMU新作颠覆认知

数据枯竭正成为AI发展的新瓶颈！CMU团队提出革命性方案SRT：让LLM实现无需人类标注的自我进化！SRT初期就能迭代提升数学与推理能力，甚至性能逼近传统强化学习的效果，揭示了其颠覆性潜力。

来自主题: AI技术研报

6391 点击 2025-06-02 14:16

Claude团队打开大模型「脑回路」，开源LLM思维可视化工具来了

Claude团队打开大模型「脑回路」，开源LLM思维可视化工具来了

Claude团队打开大模型「脑回路」，开源LLM思维可视化工具来了

Claude团队来搞开源了——推出“电路追踪”（circuit tracing）工具，可以帮大伙儿读懂大模型的“脑回路”，追踪其思维过程。该工具的核心在于生成归因图（attribution graphs），其作用类似于大脑的神经网络示意图，通过可视化模型内部超节点及其连接关系，呈现LLM处理信息的路径。

来自主题: AI资讯

7772 点击 2025-06-01 14:09

全面评估多模态模型视频OCR能力，Gemini 准确率仅73.7%

全面评估多模态模型视频OCR能力，Gemini 准确率仅73.7%

全面评估多模态模型视频OCR能力，Gemini 准确率仅73.7%

多模态大模型（MLLM）在静态图像上已经展现出卓越的 OCR 能力，能准确识别和理解图像中的文字内容。MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。

来自主题: AI技术研报

6683 点击 2025-05-30 17:30

妈妈再也不用担心延迟了！斯坦福手搓Llama超级内核，推理仅需0.00068秒

妈妈再也不用担心延迟了！斯坦福手搓Llama超级内核，推理仅需0.00068秒

妈妈再也不用担心延迟了！斯坦福手搓Llama超级内核，推理仅需0.00068秒

斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」，将Llama-1B模型前向传播完整融合进单一GPU内核，实现推理时间低于1毫秒。在B200上每次推理仅需680微秒，比vLLM快3.5倍。

来自主题: AI技术研报

8008 点击 2025-05-30 12:36

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

近日，NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM，以无需训练的即插即用加速方案，实现了推理速度的突破！通过创新的技术组合，在不依赖重新训练模型的前提下，该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据，解析其核心优势。

来自主题: AI技术研报

7507 点击 2025-05-30 12:08

LLM省钱大测评！48块GH200，首个百亿级参数量实证

LLM省钱大测评！48块GH200，首个百亿级参数量实证

LLM省钱大测评！48块GH200，首个百亿级参数量实证

EfficientLLM项目聚焦LLM效率，提出三轴分类法和六大指标，实验包揽全架构、多模态、微调技术，可为研究人员提供效率与性能平衡的参考。

来自主题: AI技术研报

7101 点击 2025-05-29 17:16

基准测试揭秘大模型“字数危机”：26个模型长文本生成普遍拉胯，最大输出长度过度宣传

基准测试揭秘大模型“字数危机”：26个模型长文本生成普遍拉胯，最大输出长度过度宣传

基准测试揭秘大模型“字数危机”：26个模型长文本生成普遍拉胯，最大输出长度过度宣传

你是否曾对大语言模型（LLMs）下达过明确的“长度指令”？

来自主题: AI技术研报

8176 点击 2025-05-29 15:12

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要，近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力，但现有方法在训练过程中面临两大核心挑战：

来自主题: AI技术研报

4916 点击 2025-05-29 14:48

上一页当前第17页,共119页下一页