AI资讯新闻榜单内容搜索-模型

网友晒 21 页 PDF 质疑 Grok 3 套壳 Claude，Grok 3 自己承认了！xAI 工程师被喷无能

近日，一位 ID 名为 GpsTracker 的网友在网上爆料称，埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时，模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。

来自主题: AI资讯

8100 点击 2025-06-04 11:37

LLM根本不会思考！LeCun团队新作直接戳破了大模型神话。最新实验揭示了，AI仅在粗糙分类任务表现优秀，却在精细任务中彻底失灵。

来自主题: AI技术研报

8156 点击 2025-06-04 11:06

斯坦福最新大模型医疗任务全面评测，DeepSeek R1以66%胜率拿下第一！

来自主题: AI技术研报

5435 点击 2025-06-04 11:02

一项新的强化学习方法，直接让Qwen性能大增，GPT-4o被赶超！

来自主题: AI技术研报

7123 点击 2025-06-04 10:50

不用换模型、不用堆参数，靠 SUGAR 模型性能大增！

来自主题: AI技术研报

9235 点击 2025-06-04 10:41

想象一下，你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊，需要记住每个房间里的物品特征、位置关系，并根据反馈调整行动。

来自主题: AI技术研报

8626 点击 2025-06-04 10:08

最近AI圈子里有两个特别有意思的项目，一个是谷歌DeepMind的AlphaEvolve，另一个是UBC大学的Darwin Gödel Machine（简称DGM）。

来自主题: AI技术研报

8578 点击 2025-06-04 09:52

在数字化时代，视觉信息在知识传递和决策支持中的重要性日益凸显。然而，传统的检索增强型生成（RAG）方法在处理视觉丰富信息时面临着诸多挑战。一方面，传统的基于文本的方法无法处理视觉相关数据；另一方面，现有的视觉 RAG 方法受限于定义的固定流程，难以有效激活模型的推理能力。

来自主题: AI技术研报

9096 点击 2025-06-04 09:28

全球AI原生企业围绕OpenAI、Anthropic和谷歌三大生态阵营发展，形成开放多元、安全导向和技术闭环的差异化格局。企业通过多模型接入、自研模型及垂直深耕等策略竞争，生态构建聚焦开发者工具、行业渗透和价格策略，当前行业仍处动态演变阶段，尚未形成最终格局。

来自主题: AI技术研报

9852 点击 2025-06-04 09:13

《智能涌现》从多名独立信源处得知，大模型“六小虎”之一的阶跃星辰，C端AI应用布局，近半年来出现了以下调整：2024年12月，角色扮演类Agent产品“冒泡鸭”停止大范围投入，团队合并至对话产品“跃问”（现更名为“阶跃AI”），目前仅留部分员工运维。

来自主题: AI资讯

10344 点击 2025-06-03 23:52