AI资讯新闻榜单内容搜索-不

Jack Clark: 美国 AI 政策的隐形推手，时代的良心还是囚徒？

Jack Clark 是最关注和熟悉中国在芯片、计算和模型上进展的 AI Lab 领导人之一。他毫不吝啬对中国 AI 进展的认可，将 DeepSeek R1 视作“推理模型大范围扩散”的起点，近期又把 HyperHetero 使用的异构集群叫做通过“超级智能进行持续自我训练”的垫脚石。

来自主题: AI资讯

8527 点击 2025-07-05 19:50

无损加速视觉语言模型推理！轻松剪掉视觉冗余Token｜腾讯AI Lab

多图像、长视频、细粒度感知正在让大型视觉语言模型（LVLM）变得越来越聪明，但也越来越“吃不消”：视觉Token数量的激增所带来的推理成本暴涨，正逐渐成为多模态智能扩展的最大算力瓶颈。

来自主题: AI技术研报

8330 点击 2025-07-05 19:00

「AI伴侣」开测，「AI好友」融资，边缘化的陪伴赛道迎来转机？

AI 社交，尤其是 AI 角色扮演方向，最近势头不太好，产品停止投入、流量下降等消息不少。但另一个细分方向，一直处于边缘位置的 AI 陪伴产品，在有点颓的市场环境中，正在默默发力。

来自主题: AI资讯

8863 点击 2025-07-05 13:28

重磅发现！大模型的「aha moment」不是装腔作势，内部信息量暴增数倍！

你肯定见过大模型在解题时「装模作样」地输出：「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。

来自主题: AI技术研报

7505 点击 2025-07-05 12:33

人机协同筛出2600万条数据，七项基准全部SOTA，昆仑万维开源奖励模型再迎新突破

大语言模型（LLM）以生成能力强而著称，但如何能让它「听话」，是一门很深的学问。基于人类反馈的强化学习（RLHF）就是用来解决这个问题的，其中的奖励模型（Reward Model, RM）扮演着重要的裁判作用，它专门负责给 LLM 生成的内容打分，告诉模型什么是好，什么是不好，可以保证大模型的「三观」正确。

来自主题: AI技术研报

9121 点击 2025-07-05 12:10

刚刚，Grok4跑分曝光：「人类最后考试」拿下45%，是Gemini 2.5两倍，但网友不信

刚刚，Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称，Grok 4 在 HLE（Humanities Last Exam，人类最后考试）上的标准得分是 35%，使用推理技术后提高到 45%；在 GPQA 上的得分是 87-88%；而Grok 4 Code 在 SWE Bench 上的得分则达到 72-75%。

来自主题: AI资讯

10767 点击 2025-07-05 11:38

不学美国砸钱烧AI，欧洲科技巨头另辟蹊径

欧洲科技巨头的CEO最新表示，欧洲在人工智能领域展开竞争时并不需要大量建立数据中心，这一说法与上月黄仁勋访欧时提出的说法相悖。当地时间周四（7月3日），德国思爱普公司（SAP）首席执行官柯睿安（Christian Klein）在接受采访时说道：“我们真的需要建五个数据中心再把高性能芯片放进去吗？”

来自主题: AI资讯

9411 点击 2025-07-05 11:33

野生DeepSeek火了，速度碾压官方版，权重开源

没等来 DeepSeek 官方的 R2，却迎来了一个速度更快、性能不弱于 R1 的「野生」变体！这两天，一个名为「DeepSeek R1T2」的模型火了！这个模型的速度比 R1-0528 快 200%，比 R1 快 20%。除了速度上的显著优势，它在 GPQA Diamond（专家级推理能力问答基准）和 AIME 24（数学推理基准）上的表现均优于 R1，但未达到 R1-0528 的水平。

来自主题: AI资讯

9897 点击 2025-07-04 22:18

DeepSeek-R2！？神秘模型惊现竞技场，真实身份引网友猜测

DeepSeek-R2，终于要来了？大模型竞技场秘密上线了一个叫steve的神秘模型，在对话中透露自己来自DeepSeek。不过，网友们并不满足于知道steve的厂商，开始讨论起了steve的具体身份。

来自主题: AI资讯

9105 点击 2025-07-04 13:14

突发，美国EDA三巨头解禁！国产芯片设计迎喘息之机

美商务部突然「松绑」，全球EDA三巨头出口中国不再申请许可证。这一重磅消息，为中国芯片设计产业带来了短暂喘息。

来自主题: AI资讯

9370 点击 2025-07-04 12:49