AI资讯新闻榜单内容搜索-模型

中美AI炒币炒股阶段战果出炉：DeepSeek与Qwen稳健致胜，Gemini高频交易策略失效

近日，号称是首个专注于金融市场的 AI 实验室的美国实验室 Nof1 启动了一个将多个 AI 大模型置于真实金融市场中进行自动化交易对决的实验平台。这一项目的名称叫做 Alpha Arena，它是一个

来自主题: AI资讯

10667 点击 2025-10-28 08:15

MiniMax 迎来大版本号升级：M2 突袭榜单 + 限免，我们第一时间为你评测

10 月 27 日，国产「好模型」阵营又迎来一位新成员，MiniMax 发布了全新大版本模型 M2，延续了 M1 时代的开源策略。它不仅在 Coding 与 Agent 能力等方面继承了 M1 的优势，更在成本效率、智能水平、响应延迟这 3项关键指标上，同时迈出了一大步。

来自主题: AI资讯

10143 点击 2025-10-27 17:44

GPT-5.1曝光挽差评？救场背后，OpenAI 员工痛批Meta系的人正在“搞垮”公司！

近日，有开发者发现，OpenAI 官方在 “openai-agents-js” GitHub 仓库中被提及一个新模型：GPT-5.1 mini 。“显然 GPT-5.1 mini 是真实的……”以下是即将推出的 GPT 模型可能采用的命名规则。

来自主题: AI资讯

8165 点击 2025-10-27 17:35

美团视频生成模型来了！一出手就是开源SOTA

美团，你是跨界上瘾了是吧！（doge）没错，最新开源SOTA视频模型，又是来自这家“送外卖”的公司。模型名为LongCat-Video，参数13.6B，支持文生/图生视频，视频时长可达数分钟。

来自主题: AI资讯

10437 点击 2025-10-27 17:35

数据集蒸馏，连发两篇顶会！10%样本实现全量性能，鲁棒不失真

数据集蒸馏是一种用少量合成数据替代全量数据训练模型的技术，能让模型高效又节能。WMDD和GUARD两项研究分别解决了如何保留原始数据特性并提升模型对抗扰动能力的问题，使模型在少量数据上训练时既准确又可靠。

来自主题: AI技术研报

9750 点击 2025-10-27 17:16

Efficiency Law, 物理精确世界模型，及世界模型引擎驱动的具身智能学习新范式

2025 年秋的具身智能赛道正被巨头动态点燃：特斯拉上海超级工厂宣布 Optimus 2.0 量产下线，同步开放开发者平台提供运动控制与环境感知 SDK，试图通过生态共建破解数据孤岛难题；英伟达则在 SIGGRAPH 大会抛出物理 AI 全栈方案，其 Omniverse 平台结合 Cosmos 世界模型可生成高质量合成数据，直指真机数据短缺痛点。

来自主题: AI技术研报

9430 点击 2025-10-27 17:05

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

大模型Agent帮你自动操作电脑，理想很丰满，现实却骨感。

来自主题: AI技术研报

7919 点击 2025-10-27 16:56

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持上仍存挑战。

来自主题: AI技术研报

8130 点击 2025-10-27 16:46

看似万能的 AI，其实比你想的更脆弱和邪恶

十月，《纽约时报》发表了题为《The A.I. Prompt That Could End the World》（《那个可能终结世界的 AI 提示词》）的文章。作者 Stephen Witt 采访了多位业内人士：有 AI 先驱，图灵奖获奖者 Yoshua Bengio；以越狱测试著称的 Leonard Tang；以及专门研究模型欺骗的 Marius Hobbhahn。

来自主题: AI技术研报

9758 点击 2025-10-27 15:58

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

在一篇论文中，研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询，其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%，即便用户的提问涉及操纵、欺骗或其他人际伤害等情境，模型仍倾向于给予肯定回应。

来自主题: AI技术研报

7068 点击 2025-10-27 15:57