AI资讯新闻榜单内容搜索-模型

AI同时学会了人类的智慧和无脑

从支持「屎棒棒创业」到数学证明，AI的「谄媚」正成隐忧：一次更新曝出迎合倾向，GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合，令用户更固执、更少反思却更信任AI；数学基准亦见模型为伪命题硬编证明。

来自主题: AI技术研报

7056 点击 2025-11-11 09:51

PixelRefer ：让AI从“看大图”走向“看懂每个对象”

多模态大模型（MLLMs）虽然在图像理解、视频分析上表现出色，但多停留在整体场景级理解。

来自主题: AI技术研报

11233 点击 2025-11-11 09:50

李飞飞最新长文火爆硅谷

刚刚，AI教母李飞飞发表长文，首次系统性地解释了什么空间智能、为什么重要以及如何构建能够解锁它的世界模型。文章里，李飞飞不仅提出了“真正具有空间智能的世界模型”必须具备的三个核心能力：

来自主题: AI资讯

8950 点击 2025-11-11 09:38

AI编程冲刺“DeepSeek时刻”：00后团队用国产模型一键直出复杂应用，效果超越Claude Code

这一次带来如此新SOTA效果的，是全球首个实现项目级开发的AI IDE——Vinsoo。刚刚，Vinsoo上新Beta 3.0版本，仅用国产大模型（Qwen），就超越了搭载Claude的Cursor、Codex、Claude Code等一众流行AI编程产品。Vinsoo是芸思智能推出的全球首个搭载云端安全Agent编程团队的AI IDE，主打从需求确认到交付验收，AI全流程自动推进项目开发。

来自主题: AI资讯

10471 点击 2025-11-10 16:48

GPT-5.1 「马甲」泄露！现在免费就能用，年底 AI 一大波更新要来了

Gemini 3 还没影子，GPT 5.1 已经在路上。7 号深夜，OpenRouter 平台上线了一个全新的隐名模型。已经有眼尖动作快的网友尝鲜体验，并且认为这就是披着马甲的 GPT 5.1，暂名：Polaris Alpha。

来自主题: AI资讯

8215 点击 2025-11-10 16:31

印度迎来AI工具“0元购”时代！OpenAI、谷歌等巨头内心os：别急，先让他们上瘾，我们再来收费

过去几个月，大型人工智能公司在印度动作频频。首先是 Perplexity AI 公司与印度第二大移动网络运营商 Airtel 合作，在印度免费提供其高级 Pro 版本。他们免费赠送了一份价值约 17000 卢比（约合人民币 1365 元）的年度订阅服务。这发生在 7 月份。此举拉开了更多类似合作的序幕。

来自主题: AI资讯

10529 点击 2025-11-10 16:31

机器人“会用手”了！银河通用首破手掌任意朝向旋转难题，拧螺丝、砸钉子样样精通

做灵巧手如果不会用工具，跟咸鱼（夹爪）有什么区别？

来自主题: AI技术研报

7491 点击 2025-11-10 16:30

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成（RAG）等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报

7018 点击 2025-11-10 15:12

NeurIPS2025 Spotlight | RobustMerge: 多模态大模型高效微调模型合并的全新范式

在 AI 技术飞速发展的今天，如何高效地将多个专业模型的能力融合到一个通用模型中，是当前大模型应用面临的关键挑战。全量微调领域已经有许多开创性的工作，但是在高效微调领域，尚未有对模型合并范式清晰的指引。

来自主题: AI技术研报

8095 点击 2025-11-10 14:25

2025 智能体元年，Agent 开发平台深度评测报告解读

AI 产业的两大核心趋势正并行发展：基础大模型的能力持续突破，而 AI Agent 的产业化落地也在全面提速。Capgemini 于 2025 年 4 月发布的一项覆盖 14 国 1500 名企业高管的调研显示[1]，已有 37% 的受访组织启动或实施 AI Agent 项目，另有高达 61 %的组织将在一年内跟进部署或进行探索，印证了该趋势的全球共识。

来自主题: AI技术研报

10085 点击 2025-11-10 11:16