教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

9301点击 2024-01-10 10:05

新的一年，教育领域大模型，迎来新玩家。

来自松鼠Ai，十年教育领域躬身者，刚刚发布首个智适应教育大模型。

据介绍，它可以实现纯文本外的更多任务支持，在知识获取、信息输入及传达信息等方面都具备更好的性能，同传统的大语言模型有着本质的不同。按计划，这一大模型将搭载在松鼠Ai已有学习机产品中。

与此同时，还有松鼠Ai牵头的IEEE AI教育大模型标准组（P3428）成立。第一批专家工作组包括北京师范大学黄荣怀教授、清华大学许斌教授、华东师范大学顾小清教授。

并且是松鼠Ai创始人兼董事长栗浩洋任该工作组主席，足以见其在行业的代表性。我们知道，行业标准一旦设立，大模型在教育领域的应用进一步得到规范，行业发展水平将提升到全新的水平。

过去一年，可以看到大模型在教育领域落地百花齐放。如今随着落地的深入，松鼠Ai的进展或许值得关注。

松鼠Ai智适应教育大模型

据介绍，整个松鼠Ai智适应教育大模型主要分为三层：底层的数据层、模型层、应用层，并由此体现了它的三大特点。

教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

首先是数据层面。

松鼠Ai在教育场景的多年积累，构成了丰富的底层数据层。包括全学科纳米级知识图谱、海量学习资料、视频讲解以及测评和题库，以及学生学习历史数据。

值得一提的是，此处学生学习历史数据是松鼠Ai过去积累的2400万学生100亿学习行为全流程，比如学习进度、学习效果、学习路径，甚至学习过程中发呆的时间都有记录。

有了个人学习数据，一方面可以对每个学生用户画像精准把握，另一方面了解了同龄学生学习的情况，也有助于对学科整体知识点的规划和安排。

这也就决定了松鼠Ai大模型同其他传统大语言模型，比如GPT系列，有着本质的不同，他们将更加个性化，针对学生学习情况对症下药。

然后在模型层，以往谈到大模型，无非有多模态、LLM、Agent这些技术和应用，但松鼠Ai此处结合大模型的知识图谱（KG）&检索增强生成 (RAG)，却值得说道说道。

简单来说，结合大模型的KG和RAG增强技术能快速找到知识点和知识点之间，知识点和题目之间，题目和孩子能力之间的关系。

若给孩子练习的题目，其与知识点的关联更高，孩子学习效率也会更高。而不同的学生对知识点的掌握也有所不同，那么具体到哪一个知识点，就需要推送与该知识点强关联的题目。

栗浩洋给出了一个具象化的形容，目前他们能实现25道题测1000个知识点，而市面上最高也只能实现25道题100个知识点，并且还能具体拆解到每个解题步骤当中去进行逐步讲解。

教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

此外，栗浩洋还强调，但松鼠Ai的LAM（Large Adaptive Model）智适应大模型应用了MoE（Mixture of Experts）混合专家系统，通过将多个模型结合在一起，以获得更好的预测性能，同时降低模型的推理成本。

而在应用层，覆盖学习推荐、学习兴趣启发、习惯培养、情感干预、学习路径规划等多个场景。

比如在给学生提供辅导时，能够覆盖预习、复习、备考、作业辅导等多场景，并给予学生更多准确的回应与激励。

此外，还可以根据孩子在学习过程中反应，给予其正面的反馈与激励改善学生的情绪，帮助解决孩子的一些心理问题

可以说，其他大模型产品有的它有，没有的它也有。

如何评价？

总结来看，从数据到应用层，其实都围绕一个共同点：个性化。

再看产品功能上，松鼠Ai智适应教育大模型该有的功能都有，并且相较于大语言大模型，技术实现更为复杂。在应用场景上面，也更能把握学生个人的学习情况实现个性化应用。

至于为何能实现这样的效果，松鼠Ai的三大布局和选择值得关注：

纳米级知识拆分、MCM系统、大模型吞吐数据类型。

首先是纳米级知识点拆分。比如在数学场景中，单独针对「求加减法中的未知项」这一大知识点，就能拆分出「同分母分数两步方程-未知数为减数」、「异分母分数两步方程-未知数为加数」这种程度的知识点。

这就相当于在整个学习系统构建一个庞大的知识网络，这样能更精准地帮助学生定位学习情况，更精细的规划学习路经。

第二是MCM系统。第一个M是Model of thinking，就是思维模式，第二个C是Capacity，是学习能力，第三个M是Methodology，是学习方法论。MCM系统针对学习思维、能力、方法构建模型，这样能更科学地实时评价学生的学习状态和能力水平。

而负载了大模型能力之后，就能预测学生在未学过知识点上的能力水平、所花时间等，以推出个性化解决方案。

第三则是大模型吞吐数据类型不同。正如前文所述，数据类型更为复杂，大模型所能提供的能力更为多样。

说了那么多，其实不论是技术融合还是数据的选择，背后还有更为底层原因。

那就是智适应教育的选择，这也是整场发布会谈及最多的关键词。

什么是智适应教育？简单来说就是基于AI、大数据、物联网等技术，结合大量用户数据，针对个体学习过程差异提供适合的教育形式，以此实现个性化教育，做到因材施教。

当前包括培生教育、麦格劳希尔、Wiley、HMH这样的传统巨头也都在布局。

作为国内较早推行这一概念的企业，松鼠Ai早已开发出核心的智适应学习引擎架构。

△智适应学习引擎架构

据此前松鼠Ai联合创始人兼CEO周伟介绍，松鼠Ai智适应教育是用了三层式的架构，去构建知识地图、学习策略架构、内容地图、教学流程，进行数据的分析、推荐、算法，到最后形成完整的教学闭环。

随着大模型到来，实现个性化教育本身就是难得的契机，那么同智适应技术的融合也就成了应时之义。

按照松鼠Ai的理解，智适应技术全自动标准能按照自动驾驶那一套评价体系进行拆分。

教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

△智适应教育按智能化水平L1-L5分级图

栗浩洋认为，目前业内大多数主流玩家仍处于L2发展阶段。即根据学生学习情况，实现题目数据量智适应、题目难度智适应，也就是辅助驾驶。而他们在L5即完全自动驾驶阶段，已经实现40%的水平。

在谈及AI变革教育最终形态，他们最终目标是实现虚拟老师，有助于生成更多视频讲解，助力社会需求的创新人才培养。这样一来，在个性化教育追求的同时，真正实现了教育普惠。

至少现在来看，也并非那么遥不可及。

发布会上松鼠Ai介绍，2023年松鼠Ai已经完成2000家线下智能学习机门店业务布局，是全国零售店规模最大的AI学习机品牌之一。

而随着大模型进一步部署，上线在他们的学习机产品上，就能快速带来产业价值。

大模型给教育带来怎样的变革？

过去一年，大模型技术快速迭代，AI应用可能性不断拓宽。尤其教育领域，被认为是大模型最应该落地的场景之一。

教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

不少企业围绕着该场景进行布局，代表的有「可汗学院」推出的人工智能助教Khanmigo；多邻国推出的内嵌GPT-4的Duolingo Max。

总结来看，大模型落地教育主要有这样几条路径。

一种是类ChatGPT，在网页端/APP侧解决学生或老师的问题。大模型通过自然语言交互充当学习助手的角色。这在语言学习场景中最为常见，比如Duolingo、以及最近备受关注初创公司Speak。

另一种则是大模型部署在原有学习硬件之上。这种自带天然交互场景，也有用户和数据基础，应用迭代速度可能更快，但对技术要求更高，已有形态包括学习机、教育机器人、词典笔等。

百花齐放的发展现状之下，不难看出，硬件形态和软件功能容易千篇一律，并逐渐趋于同质化。

企业的创新本质还是得在于AI的赋能。这也是新一波技术浪潮企业保持竞争力的核心所在。一旦完成大模型部署，可以实现更多创新应用，用户数据带来的迭代速度更快，边际成本会逐渐降低。

不过在用户侧，除了对话这种显性功能外，大模型更多核心能力内嵌于产品中，比如根据用户习惯、学习进度制定学习计划等等，但用户往往在短时间内感知不到。

这也是当前教育场景一个主要挑战。

这就需要企业，一方面进行消费者教育，另一方面则是坚持长期且持续的技术投入，构筑企业壁垒，才能抵挡外界风云诡谲。等新技术来时结合已有场景快速利用，服务于用户。

有着近十年技术部署的松鼠Ai，就是一个范例。

不过最后不管大模型在教育怎么应用，总的方向已经确定。

那就是个性化教育、因材施教。

事实上这本身也是教育行业被广泛接受且一直以来想要实现的目标，早在上世纪八十年代，著名教育心理学家Benjamin Bloom在其教育实验中提出”two sigma”理论证明了其正确性——

接受一对一辅导的教学组平均表现要明显优于传统的1:30教学方式。

教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

如今大模型本身个性化的技术特性，也就给教育行业变革带来了全新的可能性。

毫无疑问的是，随着大模型布局的深入，更多细分标准的确立，教育行业发展已经来到了关键的历史节点。

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “白交”

教育大模型迎来新玩家：十年深耕剑指智适应，25道题能测1000个知识点

关键词: AI教育 , 松鼠Ai , AI教育大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI