AI资讯新闻榜单内容搜索-大模

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

训练大模型时，有时让它“记性差一点”，反而更聪明！大语言模型如果不加约束，很容易把训练数据原封不动地复刻出来。为解决这个问题，来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失（Goldfish Loss）。

来自主题: AI资讯

6530 点击 2025-09-04 11:33

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

起猛了，美团这下真的开始明牌干AI了。

来自主题: AI资讯

9388 点击 2025-09-04 11:16

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

训练大模型时，有时让它“记性差一点”，反而更聪明！

来自主题: AI技术研报

6766 点击 2025-09-04 11:09

Claude估值暴涨300%！全球独角兽字节第三他第四

天啦噜，搞大模型的实在太疯狂了。

来自主题: AI资讯

8661 点击 2025-09-03 13:42

冲上热搜！美团大模型，靠「快」火了

国内外开发者：亲测，美团新开源的模型速度超快！

来自主题: AI技术研报

7583 点击 2025-09-03 11:41

他们在1993年就提出了Scaling Law

原来，Scaling Law在32年前就被提出了！不是2020年的OpenAI、不是2017年的百度，而是1993年的贝尔实验室。

来自主题: AI技术研报

6931 点击 2025-09-02 16:01

一张卡片，不仅 AI 了我的工作，还摸清了我的八字和 MBTI？｜AI 上新

AI 硬件，已经成为大模型之后，又一个令人兴奋的领域。正如 AI Agent 从通用开始走向垂直，AI 硬件，也已经逐渐分化到「陪伴」、「工作」等各个垂直领域。

来自主题: AI资讯

7112 点击 2025-09-02 15:17

领跑AI音乐生成新赛道，自由量级全链路自研音乐模型“音潮音乐”通过备案

国内AI音乐领域迎来突破性进展。日前，自由量级0到1全自研的音乐大模型——“音潮音乐”已成功通过国家互联网信息办公室的生成式人工智能服务备案（备案号：Shanghai-YinChaoYinYue-202507160059）。

来自主题: AI资讯

6617 点击 2025-09-02 15:12

“FP8 精度”如何赋能国产AI?

当前AI大模型（LLM）训练与推理对算力的巨大需求，以及传统计算精度（如FP16/BF16）面临的功耗、内存带宽和计算效率瓶颈。

来自主题: AI技术研报

6379 点击 2025-09-02 12:47

DeepSeek、GPT-5都在尝试的快慢思考切换，有了更智能版本，还是多模态

当前，业界顶尖的大模型正竞相挑战“过度思考”的难题，即无论问题简单与否，它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换，还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。

来自主题: AI技术研报

6414 点击 2025-09-02 12:27