AI资讯新闻榜单内容搜索-LLM

Z Tech｜对话Lecun和谢赛宁爱徒，00后OpenAI奖学金博士Peter Tong：揭秘多模态大模型的革命突破

近年来，多模态大模型（MLLM）在视觉理解领域突飞猛进，但如何让大语言模型（LLM）低成本掌握视觉生成能力仍是业界难题！

来自主题: AI资讯

7065 点击 2025-02-17 09:37

全球AI算力报告出炉，LLM最爱A100！谷歌坐拥超100万H100等效算力

全球有多少AI算力？算力增长速度有多快？在这场AI「淘金热」中，都有哪些新「铲子」？AI初创企业Epoch AI发布了最新全球硬件估算报告。

来自主题: AI技术研报

9512 点击 2025-02-15 16:51

AI意识更进一步！谷歌DeepMind等：LLM不仅能感受痛苦，还能趋利避害

以大语言模型为代表的AI在智力方面已经逐渐逼近甚至超过人类，但能否像人类一样有痛苦、快乐这样的感知呢？近日，谷歌团队和LSE发表了一项研究，他们发现，LLM能够做出避免痛苦的权衡选择，这也许是实现「有意识AI」的第一步。

来自主题: AI技术研报

7252 点击 2025-02-14 13:48

被AI追杀，还要解谜逃生！UCSD等发布LLM测试神器，边玩游戏边评估

还在用枯燥的数学题和编程题测试AI？落伍啦！现在，打游戏就能测出AI的真实力。GameArena团队打造的Roblox新游《AI空间逃脱》，让你在紧张刺激的密室逃脱中，顺便就把AI模型的推理能力给评估了。这不仅比传统测试方法更有趣，还能生成宝贵的游戏数据，帮助开发者更全面地了解AI的强项与短板。

来自主题: AI资讯

9869 点击 2025-02-12 17:08

AI已学会自我复制！复旦新研究：开源LLM克隆成功率最高90%

复旦新研究揭示了AI系统自我复制的突破性进展，表明当前的LLM已具备在没有人类干预的情况下自我克隆的能力。这不仅是AI超越人类的一大步，也为「流氓AI」埋下了隐患，带来前所未有的安全风险。

来自主题: AI技术研报

6988 点击 2025-02-12 12:05

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

推理大语言模型（LLM），如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域已超越人类专家，并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习（Reinforcement Learning）和推理规模（Inference scaling）。

来自主题: AI技术研报

6999 点击 2025-02-12 11:33

清华姚班校友等揭Transformer致命缺陷，OpenAI科学家紧急回应：学术界节奏太慢

一篇报道，在AI圈掀起轩然大波。文中引用了近2年前的论文直击大模型死穴——Transformer触及天花板，却引来OpenAI研究科学家的紧急回应。谁能想到，一篇于2023年发表的LLM论文，竟然在一年半之后又「火」了。

来自主题: AI技术研报

6739 点击 2025-02-11 14:16

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

「慢思考」（Slow-Thinking），也被称为测试时扩展（Test-Time Scaling），成为提升 LLM 推理能力的新方向。近年来，OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布，进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报

6086 点击 2025-02-10 17:04

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

黑科技来了！开源LLM微调神器Unsloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊哈时刻」。

来自主题: AI资讯

10018 点击 2025-02-09 21:29

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1）。

来自主题: AI技术研报

7440 点击 2025-02-07 16:53