AI资讯新闻榜单内容搜索-LLM

ACM MM 2025 | EventVAD：7B参数免训练，视频异常检测新SOTA

现有视频异常检测（Video Anomaly Detection, VAD）方法中，有监督方法依赖大量领域内训练数据，对未见过的异常场景泛化能力薄弱；而无需训练的方法虽借助大语言模型（LLMs）的世界知识实现检测，但存在细粒度视觉时序定位不足、事件理解不连贯、模型参数冗余等问题。

来自主题: AI技术研报

5850 点击 2025-07-21 10:28

大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降 | ICML'25

大模型有苦恼，记性太好，无法忘记旧记忆，也区分不出新记忆！基于工作记忆的认知测试显示，LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务中，模型几乎一定会混淆无效信息与正确答案。

来自主题: AI技术研报

5308 点击 2025-07-21 10:27

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

来自主题: AI资讯

7736 点击 2025-07-20 23:43

MiniMax 技术闭门会分享：长上下文是 Agent 的 Game Changer

MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会，邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾，就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。

来自主题: AI资讯

6473 点击 2025-07-20 12:37

AI编程，LLM会写代码，但“不懂”代码，来自两篇顶级研究的“人机协作避坑指南”

从Cursor到Claude Code和最近很火的Kiro，AI编程能在几秒钟内生成完整的函数，但它真的理解代码在做什么吗？最近两项突破性研究发现了一个让人意外的结果：现在的AI虽然"会写"，但还远没有"真懂"。

来自主题: AI技术研报

7499 点击 2025-07-18 11:24

Transformer终结者！谷歌DeepMind全新MoR架构问世，新一代魔王来了

Transformer杀手来了？KAIST、谷歌DeepMind等机构刚刚发布的MoR架构，推理速度翻倍、内存减半，直接重塑了LLM的性能边界，全面碾压了传统的Transformer。网友们直呼炸裂：又一个改变游戏规则的炸弹来了。

来自主题: AI技术研报

7426 点击 2025-07-17 17:00

大模型六小虎MiniMax推出Agent全栈开发功能，一键构建全栈应用

今天，我们正式发布MiniMax Agent全栈开发功能。这可能是全球首个在复杂全栈网站应用上高交付率的Agent。它支持Supabase后端托管、Stripe支付功能、cron job定时任务、长链接维持等能力，可开发需要API、实时数据、下单支付、LLM调用、定时任务、登录注册等功能的各类应用。

来自主题: AI资讯

8591 点击 2025-07-16 22:38