AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
重磅发现!大模型的「aha moment」不是装腔作势,内部信息量暴增数倍!

重磅发现!大模型的「aha moment」不是装腔作势,内部信息量暴增数倍!

重磅发现!大模型的「aha moment」不是装腔作势,内部信息量暴增数倍!

你肯定见过大模型在解题时「装模作样」地输出:「Hmm…」、「Wait, let me think」、「Therefore…」这些看似「人类化」的思考词。

来自主题: AI技术研报
5453 点击    2025-07-05 12:33
人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破

人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破

人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破

大语言模型(LLM)以生成能力强而著称,但如何能让它「听话」,是一门很深的学问。 基于人类反馈的强化学习(RLHF)就是用来解决这个问题的,其中的奖励模型 (Reward Model, RM)扮演着重要的裁判作用,它专门负责给 LLM 生成的内容打分,告诉模型什么是好,什么是不好,可以保证大模型的「三观」正确。

来自主题: AI技术研报
6251 点击    2025-07-05 12:10
DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

DeepSeek-R2,终于要来了?大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。不过,网友们并不满足于知道steve的厂商,开始讨论起了steve的具体身份。

来自主题: AI资讯
7298 点击    2025-07-04 13:14
“美国国运股”Palantir,怎么靠AI Agent大涨3000亿美元?

“美国国运股”Palantir,怎么靠AI Agent大涨3000亿美元?

“美国国运股”Palantir,怎么靠AI Agent大涨3000亿美元?

当全球目光都聚焦在OpenAI、Anthropic、谷歌、Meta等明星AI公司时,真正靠大模型落地大规模盈利的,却是一家相对不太知名的公司——Palantir。

来自主题: AI资讯
8018 点击    2025-07-04 12:43
海致科技,“AI除幻”的故事不好讲

海致科技,“AI除幻”的故事不好讲

海致科技,“AI除幻”的故事不好讲

第一难当。AI变革遇上IPO盛宴,港股掀起一波资本巨浪。

来自主题: AI资讯
8261 点击    2025-07-04 11:23
阿里云客服Agent业务提效实践:灵活可控的落地方法论

阿里云客服Agent业务提效实践:灵活可控的落地方法论

阿里云客服Agent业务提效实践:灵活可控的落地方法论

随着 AI Agent 技术的快速发展,业界许多企业开始在 Agent 方向进行深层次探索,而不仅仅是停留在“大模型 + 工具调用”的简单应用上。

来自主题: AI资讯
8342 点击    2025-07-04 11:18
Nature研究遭质疑:像人类一样思考的AI,竟有点“荒谬”?

Nature研究遭质疑:像人类一样思考的AI,竟有点“荒谬”?

Nature研究遭质疑:像人类一样思考的AI,竟有点“荒谬”?

人工智能(AI),如果可以像人类一样“思考”,或许能够帮助我们理解人类的思维方式,尤其是不同心理状态(如抑郁或焦虑)的人群如何做出决策,进而为人类健康研究提供一个新视角。

来自主题: AI技术研报
5366 点击    2025-07-04 10:48
推理AI致命弱点,大模型变「杠精」!被带偏后死不悔改

推理AI致命弱点,大模型变「杠精」!被带偏后死不悔改

推理AI致命弱点,大模型变「杠精」!被带偏后死不悔改

DeepMind新研究揭示了当与推理无关的想法,被直接注入到模型的推理过程中时,它们却难以恢复,而且越大的模型越难恢复。

来自主题: AI技术研报
8234 点击    2025-07-04 10:36
别瞧不起「提示词」芝大论文爆火:Prompt Science已被定义

别瞧不起「提示词」芝大论文爆火:Prompt Science已被定义

别瞧不起「提示词」芝大论文爆火:Prompt Science已被定义

最近网上出现了一些很有趣的声音——"提示词已死"、"写提示词把自己写死了",这些文章认为随着模型变得越来越智能,精心设计提示词的时代已经过去了。但芝加哥大学的最新研究却给出了完全相反的结论:prompt不仅没有死,反而是理解大模型最重要的科学工具。

来自主题: AI技术研报
6791 点击    2025-07-04 09:55
Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化

Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化

Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化

最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model )+ PPO,③ 可验证奖励 (Verifiable Reward)+ GRPO(DeepSeek R1)。

来自主题: AI技术研报
6451 点击    2025-07-04 09:44