真·MoE?路由LLM最全面探索:一种笔记本也能玩的大模型Scaling Up研究
真·MoE?路由LLM最全面探索:一种笔记本也能玩的大模型Scaling Up研究事关路由LLM(Routing LLM),一项截至目前最全面的研究,来了——
事关路由LLM(Routing LLM),一项截至目前最全面的研究,来了——
终于到了适合跟大家介绍大模型的万能接口 MCP(Model Context Protocol)的时候了!
在去年的 Sequoia Capital AI Ascent 2024 上,红杉的几位合伙人在活动期间提出观点:“GenAI 在客服领域已经初步找到了 PMF”。时隔一年,在大模型落地的产品形态逐渐从单纯的 ChatBot 进化为 Agent 的当下,企业级 AI 客服将会有更多落地机会和想象空间。
评估多模态AI模型的那些复杂测试,可能有一半都是“重复劳动”!
多模态大模型虽然在视觉理解方面表现出色,但在需要深度数学推理的任务上往往力不从心,尤其是对于参数量较小的模型来说更是如此。
杰文斯悖论不是天然成立的。在AI的叙事中,要让算力用得越多,就要让算力变得更便宜,也要让AI更有用、好用。兑现杰文斯悖论已经成为了英伟达的命门,黄仁勋要在本届GTC上,让市场再次相信他。
全球首个开源多模态推理大模型来了!38B参数模型性能直逼DeepSeek-R1,同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源,正是希望同DeepSeek一样,打造开源界的技术影响力。
AI如何赋能千行百业?最近,中绿讯科中国重磅发布了生态级通用平台——AI生态平台。这一平台以自研「泰山大模型群」为基座,集成了多个技术组件,为企业和开发者搭建了一座连接AI与业务需求的桥梁。
大模型的代码能力在这一年突飞猛进,最近我们看到很多关于用AI直接生成前端代码,做出漂亮网页的讨论。
在春节的 DeepSeek 大热后,大模型也更多走进了大家的生活。我们越来越多看到各种模型在静态的做题榜单击败人类,解决各种复杂推理问题。但这些静态的测试与模型在现实中的应用还相去甚远。模型除了能进行对话,还在许多更复杂的场景中以各种各样的方式与人类产生互动。除了对话任务外,如何实现大模型与人的实时同步交互协作越来越重要。