AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
MIT发布自适应语言模型!新任务,自生成远超「GPT-4.1合成训练数据」

MIT发布自适应语言模型!新任务,自生成远超「GPT-4.1合成训练数据」

MIT发布自适应语言模型!新任务,自生成远超「GPT-4.1合成训练数据」

自适应语言模型框架SEAL,让大模型通过生成自己的微调数据和更新指令来适应新任务。SEAL在少样本学习和知识整合任务上表现优异,显著提升了模型的适应性和性能,为大模型的自主学习和优化提供了新的思路。

来自主题: AI技术研报
6521 点击    2025-07-10 11:33
AI为了自保假装配合!Claude团队新研究结果细思极恐

AI为了自保假装配合!Claude团队新研究结果细思极恐

AI为了自保假装配合!Claude团队新研究结果细思极恐

大模型“当面一套背后一套”的背后原因,正在进一步被解开。 Claude团队最新研究结果显示:对齐伪装并非通病,只是有些模型的“顺从性”会更高。

来自主题: AI技术研报
8227 点击    2025-07-10 11:30
AI上清北,普通人该怎么办?|甲子光年

AI上清北,普通人该怎么办?|甲子光年

AI上清北,普通人该怎么办?|甲子光年

2025 年,大模型又一次刷新了人类的认知边界,AI 模拟高考成绩大幅跃升,已达到清华、北大的录取线。但另一方面,这也让人感到些许焦虑。

来自主题: AI资讯
8247 点击    2025-07-10 11:26
如何教AI学会反思?

如何教AI学会反思?

如何教AI学会反思?

论文提出一种AI自我反思方法:通过反思错误原因、重试任务、奖励成功反思来优化训练。

来自主题: AI技术研报
8183 点击    2025-07-10 10:34
华为盘古之殇最新进展:华为吹哨人再发讨贼檄文

华为盘古之殇最新进展:华为吹哨人再发讨贼檄文

华为盘古之殇最新进展:华为吹哨人再发讨贼檄文

我们先给不知道剧情的朋友回归一下事件事件线:2025年6月30日,华为宣布开源盘古7B稠密和72B混合专家模型。然而发布会后,网络上出现华为盘古大模型抄袭的言论。7月5日,诺亚方舟实验室发布《关于盘古大模型开源代码相关讨论的声明》。本以为官方已经出来站台,这件事到此为止。

来自主题: AI资讯
9704 点击    2025-07-10 09:21
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?

来自主题: AI资讯
7507 点击    2025-07-09 15:30
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

学好数理化,走遍天下都不怕! 这一点这在大语言模型身上也不例外。

来自主题: AI技术研报
7149 点击    2025-07-09 14:54
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

香港大学NLP团队联合字节跳动Seed、复旦大学发布名为Polaris的强化学习训练配方:通过Scaling RL,Polaris让4B模型的数学推理能力(AIME25上取得79.4,AIME24上取得81.2)超越了一众商业大模型,如Seed-1.5-thinking、Claude-4-Opus和o3-mini-high(25/01/31)。

来自主题: AI资讯
5445 点击    2025-07-09 12:10