澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

3691点击 2024-03-19 22:03

专注、极致、口碑、快、成本。

这是澜舟科技创始人兼CEO周明给出的“大模型落地九字法则”，是他在雷军互联网“七字诀”的基础上，加上了“成本”一词而来。

他将2024年称为大模型落地元年，但同时坚定地表示，这并不意味着遍地是黄金。

而大模型的具体落地姿态，周明用自己带领的大模型创业团队澜舟科技身先士卒地做了个表率——利用澜舟“一横N纵”体系，以孟子大模型为基础，面向场景，发布产品。

简单来说，就是抓技术和应用的双轮驱动，在积极研究和掌握前沿技术的同时，致力于确保这些技术的有效应用。

3月18日的澜舟大模型技术和产品发布会现场，澜舟科技还与零一万物进行了战略合作签约。

澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

现场，创新工场董事长、零一万物CEO李开复分享，目前世界上最好的大模型智能已经达到人类平均智力水平的3倍，也就是说，100道题普通人只能答对33道，而最好的AI大模型可以答对99道以上。

他展望了AI 2.0时代未来的四大趋势：

最革命性的AI 2.0应用应该是AI-First / AI-Native：最终脱颖而出的应用，属于那些敢于全力投入新技术的先驱者。大语言模型的引入为 AI-First 应用带来了巨大的推动力。

大模型始于文本，未来将拓展至“全模态”：跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系，要更为精准地模拟现实世界，就需要将各种模态能力打通，例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。

AI 2.0 将超越对话，从聊天工具到智能生产力工具：用户体验以及未来交互界面和商业模式都会发生大的变革。

AI 2.0 将走向实体，大幅提振社会生产力：具身智能可以让机器人制造机器人，进一步实现AI 2.0+生产线智能规划。

专注研发10B-100B参数大模型

澜舟科技成立于2021年6月，是国内最早一批下场，进行大模型创业的团队。

去年3月，澜舟发布了孟子GPT V1（MChat）；今年1月，孟子大模型GPT V2（含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码）对公众开放。

近期，澜舟团队完成了Mengzi3-13B的大模型训练。

澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

多说一句，孟子大模型训练背后有个大功臣，即总规模3T tokens的Mengzi-3数据集，包含了网页、代码、书籍、论文等高质量数据来源。

据介绍，本月底（3月30日），Mengzi3-13B的模型将在GitHub、HuggingFace、魔搭和始智AI社区开源。

为什么开源的孟子大模型，是13B版本的？周明正面回答了这个问题。

首先，澜舟明确以服务ToB场景为主，ToC为辅。

实践发现，ToB场景使用频率最高的大模型参数量多为7B、13B、40B、100B，整体集中在10B-100B之间。

其次，在这个区间范围内，从ROI角度来讲，既满足场景需求，又最具性价比。

所以很长一段时间内，澜舟的目标都是做好10B-100B参数规模范围内的行业大模型。这就不能理解为什么开源版本选择13B。

周明解释道，他自己本身其实也是Scaling law的信仰者，但创业不同于科研。

“第一，这个大小的大模型已经可以解决80%的问题；第二，对团队来说也比较稳定，不会因为不断扩大的模型规模竞赛而感到焦躁不安。”周明补充说，这样冷静的思考，可以保证良好的成本控制，避免无谓的GPU算力、数据、人力投入竞赛。

澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

“一横N纵”体系

发布会上，澜舟公布了自己的一横N纵体系。

“一横”是模型层，是孟子大模型技术基础上研发的各个模型；

“N纵”则是基于孟子大模型的面向ToB应用最重要的技术和产品。

据了解，澜舟目前重点投入到了金融行业，辅助编程等领域，旨在通过更加全面、专业、优质的领域数据，打造更加贴近行业场景的垂直大模型。

澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

以孟子GPT通用大模型的“一横”为基础，澜舟科技合伙人、首席产品官李京梅，介绍了澜舟的应用能力型产品，包括：

AI文档理解：涵盖专业的PDF文档解析能力和信息抽取能力，为RAG方案中的文档理解提供了更优的基础能力；

AI文档问答：根据企业需要，提供私有化企业智能知识库构建的解决方案能力；

AI文档辅助写作：支持用户上传多个文档作为参考资料，支持自定义多级题目和写作提纲，由大模型赋能自动化按要求生成完整的文章初稿；

机器翻译平台：专注以中文为中心的世界主要语种之间互译和20几个领域的专业翻译；

澜舟智会：专注会议内容的智能分析和问答的产品，是基于大模型打造的大模型原生的智能会议助手；

澜舟AI搜索：大语言模型时代的搜索引擎。

澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

过去一年，大模型领域日新月异。

OpenAI在干什么我们就去干什么，短期可以，长期不可取，一定要有自己的创新思路。

如何扬长避短，走出自己的独特的创新之路，周明表达了自己的看法。

最关键的第一步，就是企业要有明确定位。澜舟科技的定位就和国内其它大模型创业公司有明显差异。

他举例，澜舟的定位就是作“大模型技术+企业场景应用”的综合公司，“我们希望能做到站在技术角度最懂应用，站在应用角度最懂技术，同时又希望把技术和应用形成一种生态连接在一起，让两边可以快速迭代。”

同时，依然需要聚焦和抓紧落地——通过落地，创造价值，拉动创新。

而且需要注意，创新和落地是相辅相成的。

不要一味的创新或者一味的落地，要把这两者联系在一起，让它快速的迭代。

最后周明还语重心长地提醒：

今年是大模型落地元年，就遍地是黄金是吗？不是的，我可以负责任地说，很多地方我们都没有开拓出来。

比如大模型如何解决落地的最后一公里？大模型的商业模式是什么？如何加强交付能力？如何提高产品的商业化？

大模型落地的一切，其实才刚刚开始。

文章来自微信公众号 “量子位” ，作者 “衡宇”。

澜舟坚持四两拨千斤：ToB场景落地，10B参数大模型足矣

关键词: AI-First , AI-Native , 孟子GPT V1 , Mengzi3-13B , 孟子大模型 , 零一大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/