AI资讯新闻榜单内容搜索-模型

Agent2025年终报告来了，UC伯克利、斯坦福和IBM联合发布

2025就要过去了。UC Berkeley、Stanford和IBM联手做了一件大事。他们调研了306份在一线“造 Agent”的从业者问卷，并深度访谈了20个已经成功落地并产生价值的一线企业案例（涵盖金融、科技、医疗等领域）。试图回答一个最朴素的工程问题：一个能用的、赚钱的Agent，到底是用什么架构搭出来的？

来自主题: AI技术研报

6817 点击 2025-12-08 08:52

Agent微调复活？英伟达开源8B新模型带飞GPT-5：在HLE狂卷37分，还把成本打下来

当问题又深又复杂时，一味上最强模型既贵又慢。测试时扩展能想得更久，却不一定想得更对。

来自主题: AI技术研报

10140 点击 2025-12-08 08:51

实测完豆包Seedream 4.5，替我设计师朋友哭了

豆包升级上新，火山引擎带着图像创作模型Doubao-Seedream-4.5来了。新模型有三个主打点。一是强化了原图保持能力，最大化保持原图的人脸、光影与色调、画面细节，可以用来P图。例如“只保留绿线中的人物，将其他角色都删掉”：

来自主题: AI资讯

9510 点击 2025-12-07 22:42

刚刚，英伟达CUDA迎来史上最大更新！

几个小时前，NVIDIA CUDA Toolkit 13.1 正式发布，英伟达官方表示：「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型，能够以更高的层次编写算法，并抽象化专用硬件（例如张量核心）的细节。

来自主题: AI资讯

9112 点击 2025-12-06 21:48

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

近日，第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告，国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现，在模型榜单中名列第一，体现了基于国产昇腾算力的大模型研发实力。

来自主题: AI资讯

8554 点击 2025-12-06 11:23

谷歌最强大模型付费上线，在DeepSeek开源后被吐槽太贵

奥特曼又得拉响红色警报了。刚刚，谷歌再次扔出重磅炸弹——Gemini 3 Deep Think正式上线！轻松把草图变成逼真3D场景，不仅结构还原到位，就连镂空花纹与光影都处理得明明白白。

来自主题: AI资讯

8694 点击 2025-12-06 11:19

浙大00后硕士破局AI记忆难题！新技术让长对话响应速度快十余倍

走上了堪称是“最佳 AI 转型路径”之后，他也在读研期间和合作者针对 AI 记忆开展了一项研究，借此发明出一种名为 LightMem（轻量记忆）的技术。在 LongMemEval 和 LoCoMo 这两个专门用于考察 AI 长期记忆能力的基准测试上，LightMem 回答问题的准确率全面超越之前的冠军模型，最高提升了 7% 以上，在某些数据集上甚至提升了将近 30%。

来自主题: AI技术研报

7965 点击 2025-12-06 11:15