AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

新版DeepSeek-R1重磅开源,凌晨已放出权重!此次模型性能几乎与o4-mini(Medium)相当,编程实测超越Claude 4 Sonnet。网友纷纷惊叹:开源又一次胜利了。

来自主题: AI资讯
6344 点击    2025-05-29 11:44
大风起兮云飞扬:Agent, o3幻觉, 刷榜, 大厂布局深意… | 南乔的月度观察

大风起兮云飞扬:Agent, o3幻觉, 刷榜, 大厂布局深意… | 南乔的月度观察

大风起兮云飞扬:Agent, o3幻觉, 刷榜, 大厂布局深意… | 南乔的月度观察

近半年来,OpenAI 形象开始变得灰暗: 团队骨干相继离职引发猜疑、组织转型遭受口诛笔伐、GPT-4.5/Sora 等模型表现不及预期,还有被 DeepSeek R1 打破的叙事神话……

来自主题: AI资讯
9639 点击    2025-05-29 10:56
MetaMind元认知多智能体,让LLM理解对话背后的深层意图,首次达到人类水平 | 最新

MetaMind元认知多智能体,让LLM理解对话背后的深层意图,首次达到人类水平 | 最新

MetaMind元认知多智能体,让LLM理解对话背后的深层意图,首次达到人类水平 | 最新

MetaMind是一个多智能体框架,专门解决大语言模型在社交认知方面的根本缺陷。传统的 LLM 常常难以应对现实世界中人际沟通中固有的模糊性和间接性,无法理解未说出口的意图、隐含的情绪或文化敏感线索。MetaMind首次使LLMs在关键心理理论(ToM)任务上达到人类水平表现。

来自主题: AI技术研报
9365 点击    2025-05-29 10:31
爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了

爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了

爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了

来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。

来自主题: AI技术研报
7281 点击    2025-05-29 10:18
准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

又是一个让程序员狂欢的研究!来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。

来自主题: AI技术研报
6400 点击    2025-05-29 10:03
Google CEO:AI 比互联网还大,未来将是多终端并行

Google CEO:AI 比互联网还大,未来将是多终端并行

Google CEO:AI 比互联网还大,未来将是多终端并行

Google I/O 2025 结束后,Google CEO Sundar Pichai 接受了《The Verge》主编专访,这也是双方连续第三年于 I/O 后展开对谈,而今年的背景更为特殊:Gemini 模型全面更新、多模态生成工具 Veo3 登场、AI 功能深度融入 Android 与 XR 平台,Google 展现出前所未有的产品化信心。

来自主题: AI资讯
8224 点击    2025-05-29 09:53
对话赫拉利王小川:当历史学家试图按下AI暂停键

对话赫拉利王小川:当历史学家试图按下AI暂停键

对话赫拉利王小川:当历史学家试图按下AI暂停键

真乐观的科学家和创业者们常低估人性的缺陷,而高谈阔论的历史和哲学家们,在描绘悲观问题时又很难提出解决方案。

来自主题: AI资讯
6066 点击    2025-05-29 09:50
小红书成立「hi lab」,提出要对AI做人文训练

小红书成立「hi lab」,提出要对AI做人文训练

小红书成立「hi lab」,提出要对AI做人文训练

第一财经「新皮层」独家获得消息称,小红书已将内部大模型技术与应用产品团队升级为「hi lab」(人文智能实验室,Humane Intelligence Lab)。同时,小红书今年年初开始组建「AI人文训练师」团队,邀请有深厚人文背景的研究者与AI领域的算法工程师、科学家共同完成对AI的后训练,以训练AI具有更好的人文素养以及表现上的一致性。而这个「AI人文训练师」团队也隶属于「hi lab」。

来自主题: AI资讯
7162 点击    2025-05-28 21:59
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,实测编程性能直逼claude 4

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,实测编程性能直逼claude 4

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,实测编程性能直逼claude 4

今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API,对用户开放思维链输出,通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯
8366 点击    2025-05-28 21:49