AI资讯新闻榜单内容搜索-Deep

使用DeepSeek的GRPO，7B模型只需强化学习就能拿下数独

没有任何冷启动数据，7B 参数模型能单纯通过强化学习学会玩数独吗？

来自主题: AI技术研报

9914 点击 2025-03-11 17:03

武大等发布大型视觉语言模型最新安全综述：全面分类攻击策略、防御机制和评估方法

武汉大学等发布了一篇大型视觉语言模型（LVLMs）安全性的综述论文，提出了一个系统性的安全分类框架，涵盖攻击、防御和评估，并对最新模型DeepSeek Janus-Pro进行了安全性测试，发现其在安全性上存在明显短板。

来自主题: AI技术研报

8791 点击 2025-03-11 16:32

DeepSeek 的联网搜索功能，竟出自这家初创公司！

2024 年 9 月 22 日，三位年少有为怀揣创业理想的有志青年，来到了特工宇宙杭州线下办公室，一起交流 AI 搜索的技术和未来。

来自主题: AI资讯

9803 点击 2025-03-11 10:53

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

开源微调神器Unsloth带着黑科技又来了：短短两周后，再次优化DeepSeek-R1同款GRPO训练算法，上下文变长10倍，而显存只需原来的1/10！

来自主题: AI技术研报

6364 点击 2025-03-11 10:42

从DeepSeek聊到AGI，Lex Fridman这期播客值得一听——投资笔记第208期

一期长达5小时的播客，究竟谁在听？MIT人工智能研究员、知名播客主持人及科技传播者Lex Fridman的对谈节目《Lex Fridman Podcast》近期推出了有关DeepSeek的一期内容：截至3月7日，这一期节目在YouTube上获得了178万播放量和2.5万like（点赞），对DeepSeek所代表的AI大模型革新的解读，获得了大量科技界、商界从业者的关注。

来自主题: AI资讯

8421 点击 2025-03-11 09:42

LeCun最新访谈对DeepSeek一顿猛夸，还谈了AI发展需理解物理世界

LeCun最新访谈，对DeepSeek一顿猛夸。他表示，DeepSeek是一项很出色的成果，它的开源不只是成果创造者受益，全世界都能从中受益。

来自主题: AI资讯

7987 点击 2025-03-10 22:06

富士康开发出台湾首个推理大模型FoxBrain，性能落后于DeepSeek

北京时间3月10日，据《华尔街日报》报道，富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型，性能上落后于DeepSeek的部分大模型。鸿海周一表示，已自主研发了具备推理能力的人工智能(AI)大语言模型FoxBrain，并在四周内完成训练。FoxBrain最初为公司内部使用而设计，具备数据分析、数学运算、推理以及代码生成的能力。

来自主题: AI资讯

11501 点击 2025-03-10 17:46