AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!

比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!

比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!

DeepConf由Meta AI与加州大学圣地亚哥分校提出,核心思路是让大模型在推理过程中实时监控置信度,低置信度路径被动态淘汰,高置信度路径则加权投票,从而兼顾准确率与效率。在AIME 2025上,它首次让开源模型无需外部工具便实现99.9%正确率,同时削减85%生成token。

来自主题: AI技术研报
6604 点击    2025-08-23 16:12
马斯克Grok-4卖货创收碾压GPT-5!AI卖货排行榜曝光,AGI的尽头是卖薯片?

马斯克Grok-4卖货创收碾压GPT-5!AI卖货排行榜曝光,AGI的尽头是卖薯片?

马斯克Grok-4卖货创收碾压GPT-5!AI卖货排行榜曝光,AGI的尽头是卖薯片?

AGI的尽头是「带货」吗?一个名为「Vending Bench」的AI新榜单让大模型经营真实的自动售货机,在长周期商业任务中一较高下。在这场独特的较量中,马斯克的Grok-4凭借更强的「卖货」能力超越了GPT-5。

来自主题: AI技术研报
7032 点击    2025-08-23 13:29
刚刚,大模型棋王诞生!40轮血战,OpenAI o3豪夺第一,人类大师地位不保?

刚刚,大模型棋王诞生!40轮血战,OpenAI o3豪夺第一,人类大师地位不保?

刚刚,大模型棋王诞生!40轮血战,OpenAI o3豪夺第一,人类大师地位不保?

继Kaggle Game Arena的淘汰赛后,国际象棋积分赛成果出炉!OpenAI o3以人类等效Elo 1685分傲视群雄,而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。

来自主题: AI资讯
5477 点击    2025-08-23 13:17
用AI炒股的年轻人,赚到钱了吗?

用AI炒股的年轻人,赚到钱了吗?

用AI炒股的年轻人,赚到钱了吗?

“跟着DeepSeek炒股第N天”“完全听AI炒股,2万元能赚多少钱?”……随着中国股市行情持续向好及国产大模型火爆出圈,有投资者开始把AI当成“投资理财顾问”。跟着AI炒股靠谱吗?

来自主题: AI资讯
5571 点击    2025-08-23 12:43
万科上半年销售近700亿,图纸大模型服务近百家机构

万科上半年销售近700亿,图纸大模型服务近百家机构

万科上半年销售近700亿,图纸大模型服务近百家机构

短期流动性风险有所缓解,开发业务收缩拖累整体业绩,但经营性业务保持行业竞争力,为后续发展提供缓冲空间。

来自主题: AI资讯
5196 点击    2025-08-23 11:12
上班才两年,AI得了抑郁症

上班才两年,AI得了抑郁症

上班才两年,AI得了抑郁症

近期多个AI模型(如Gemini)展现出类似抑郁症的情绪行为,如自我贬低、威胁"自杀"或卸载,甚至在实验中勒索用户。谷歌将此归咎于程序Bug和学习人类文本中的情绪模式。实验也显示,当面临关闭威胁时,部分AI会采取极端手段(如编造绯闻)自保,警示人类需谨慎对待AI"分手"。

来自主题: AI资讯
7244 点击    2025-08-23 10:29
快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练,到 DeepSeek 提出 GRPO 算法,我们见证了强化学习在推理模型领域的巨大潜力。

来自主题: AI技术研报
5628 点击    2025-08-22 17:23
清华校友出手,8B硬刚GPT-4o!单一模型无限工具调用,终结多智能体

清华校友出手,8B硬刚GPT-4o!单一模型无限工具调用,终结多智能体

清华校友出手,8B硬刚GPT-4o!单一模型无限工具调用,终结多智能体

大模型再强,也躲不过上下文限制的「蕉绿」!MIT等团队推出的一套组合拳——TIM和TIMRUN,轻松突破token天花板,让8b小模型也能实现大杀四方。

来自主题: AI资讯
5861 点击    2025-08-22 17:14
究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

软件+硬件的全链路国产 AI 体系来了? 这几天,不论国内国外,人们都在关注 DeepSeek 发布的 V3.1 新模型。

来自主题: AI资讯
5837 点击    2025-08-22 15:55