AI资讯新闻榜单内容搜索-大模

真·MoE？路由LLM最全面探索：一种笔记本也能玩的大模型Scaling Up研究

事关路由LLM（Routing LLM），一项截至目前最全面的研究，来了——

来自主题: AI技术研报

9341 点击 2025-03-19 14:45

3分钟上手AI万用插头MCP，一键安装的平价方案，Manus们的工具能力不再受限

终于到了适合跟大家介绍大模型的万能接口 MCP（Model Context Protocol）的时候了！

来自主题: AI资讯

7808 点击 2025-03-19 14:39

终于可以轻松用上「真能干活」的 Agent 客服了！

在去年的 Sequoia Capital AI Ascent 2024 上，红杉的几位合伙人在活动期间提出观点：“GenAI 在客服领域已经初步找到了 PMF”。时隔一年，在大模型落地的产品形态逐渐从单纯的 ChatBot 进化为 Agent 的当下，企业级 AI 客服将会有更多落地机会和想象空间。

来自主题: AI资讯

9624 点击 2025-03-19 10:56

你正在做的大模型评测，可能有一半都是无用功 | 上海AI Lab&上交&浙大出品

评估多模态AI模型的那些复杂测试，可能有一半都是“重复劳动”！

来自主题: AI技术研报

10069 点击 2025-03-19 10:37

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想，两阶段训练提升推理能力至工业级应用标准

多模态大模型虽然在视觉理解方面表现出色，但在需要深度数学推理的任务上往往力不从心，尤其是对于参数量较小的模型来说更是如此。

来自主题: AI技术研报

6082 点击 2025-03-19 09:43

AI的杰文斯悖论，离成立还差一个英伟达

杰文斯悖论不是天然成立的。在AI的叙事中，要让算力用得越多，就要让算力变得更便宜，也要让AI更有用、好用。兑现杰文斯悖论已经成为了英伟达的命门，黄仁勋要在本届GTC上，让市场再次相信他。

来自主题: AI资讯

6204 点击 2025-03-19 09:22

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个开源多模态推理大模型来了！38B参数模型性能直逼DeepSeek-R1，同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源，正是希望同DeepSeek一样，打造开源界的技术影响力。

来自主题: AI技术研报

11408 点击 2025-03-18 19:19

中绿讯科8个月自研新一代AI生态平台！以央企担当，或破解产业核心难题

AI如何赋能千行百业？最近，中绿讯科中国重磅发布了生态级通用平台——AI生态平台。这一平台以自研「泰山大模型群」为基座，集成了多个技术组件，为企业和开发者搭建了一座连接AI与业务需求的桥梁。

来自主题: AI资讯

5893 点击 2025-03-18 19:02

文字秒变可视化网页，来玩！

大模型的代码能力在这一年突飞猛进，最近我们看到很多关于用AI直接生成前端代码，做出漂亮网页的讨论。

来自主题: AI资讯

8275 点击 2025-03-18 18:58

先别骂队友，上交如何让DeepSeek R1在分手厨房再也不糊锅？

在春节的 DeepSeek 大热后，大模型也更多走进了大家的生活。我们越来越多看到各种模型在静态的做题榜单击败人类，解决各种复杂推理问题。但这些静态的测试与模型在现实中的应用还相去甚远。模型除了能进行对话，还在许多更复杂的场景中以各种各样的方式与人类产生互动。除了对话任务外，如何实现大模型与人的实时同步交互协作越来越重要。

来自主题: AI技术研报

4610 点击 2025-03-18 17:30