AI资讯新闻榜单内容搜索-语言模型

受R1启发，微软亚洲发布Logic-RL，帮助LLM通过RL解决"骑士与骗子"逻辑谜题

本文深入解析一项开创性研究——"Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning"，该研究通过基于规则的强化学习技术显著提升了语言模型的推理能力。微软亚洲的研究团队受DeepSeek-R1成功经验的启发，利用结构化的逻辑谜题作为训练场，为模型创建了一个可以系统学习和改进推理技能的环境。

来自主题: AI技术研报

7776 点击 2025-02-26 09:56

Meta首席AI科学家杨立昆，再次炮轰生成式AI

“放弃生成式模型，不研究LLM（大语言模型），我们没办法只通过文本训练让AI达到人类的智慧水平。”近日，Meta首席AI科学家杨立昆（Yann LeCun）在法国巴黎的2025年人工智能行动峰会上再一次炮轰了生成式AI。

来自主题: AI资讯

9331 点击 2025-02-24 08:41

斯坦福最新AI Agent序列化证伪假设检验自动化框架，向卡尔·波普尔致敬

在人工智能高速发展的今天，我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设，它们看似合理，却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。

来自主题: AI技术研报

9456 点击 2025-02-23 11:13

深度｜Salesforce CEO：Agent正是开启 “无限劳动力” 时代的起点

OpenAI与微软的关系出现严重裂痕，主要原因是微软开始开发自己的大型语言模型，并聘请了Mustafa Suleyman，并且OpenAI首次使用非微软的数据中心。

来自主题: AI资讯

8074 点击 2025-02-23 10:55

3元+2小时，普通人也能训练自己的AI大模型！GitHub爆火8.9k星项目，技术圈炸了！

GitHub上一个开源项目彻底打破门槛：只需3块钱、2小时，普通人也能从零训练自己的语言模型！项目“MiniMind”上线即爆火，狂揽8.9k星标，技术圈直呼：“这才是AI民主化的未来！”

来自主题: AI技术研报

11513 点击 2025-02-23 10:30

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中，预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下，通过使用搭低秩自适应（LoRA）方法的大模型参数高效微调（PEFT）技术，已经产生了大量针对特定任务、可重用的 LoRA 适配器。

来自主题: AI技术研报

8630 点击 2025-02-22 13:57

2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台

随着金融机构和专业人士越来越多地将大语言模型（LLMs）纳入其工作流程中，金融领域与人工智能社区之间依然存在显著障碍，包括专有数据和专业知识的壁垒。本文提出了 FinRobot，一种支持多个金融专业化人工智能智能体的新型开源 AI 智能体平台，每个代理均由 LLM 提供动力。

来自主题: AI技术研报

9924 点击 2025-02-20 11:33

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI 等提出的新基准再次暴露了大语言模型的弱点。

来自主题: AI技术研报

10468 点击 2025-02-17 14:49

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

近年来，大语言模型（LLMs）取得了突破性进展，展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前，普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报

9184 点击 2025-02-17 14:37

日本AI研究第一人这样评价Deepseek

中国初创企业DeepSeek（深度求索）开发的高性能、低成本生成式AI（人工智能）大规模语言模型（LLM）受到了全世界的关注。日本经济新闻（中文版：日经中文网）就如何评价该公司的最新AI模型、安全性方面的风险、以及对日本企业的影响等问题，采访了日本AI研究领域的第一人、东京大学教授松尾丰。

来自主题: AI资讯

10454 点击 2025-02-17 09:55