新的一年,教育领域大模型,迎来新玩家。
来自松鼠Ai,十年教育领域躬身者,刚刚发布首个智适应教育大模型。
据介绍,它可以实现纯文本外的更多任务支持,在知识获取、信息输入及传达信息等方面都具备更好的性能,同传统的大语言模型有着本质的不同。按计划,这一大模型将搭载在松鼠Ai已有学习机产品中。
与此同时,还有松鼠Ai牵头的IEEE AI教育大模型标准组(P3428)成立。第一批专家工作组包括北京师范大学黄荣怀教授、清华大学许斌教授、华东师范大学顾小清教授。
并且是松鼠Ai创始人兼董事长栗浩洋任该工作组主席,足以见其在行业的代表性。我们知道,行业标准一旦设立,大模型在教育领域的应用进一步得到规范,行业发展水平将提升到全新的水平。
过去一年,可以看到大模型在教育领域落地百花齐放。如今随着落地的深入,松鼠Ai的进展或许值得关注。
据介绍,整个松鼠Ai智适应教育大模型主要分为三层:底层的数据层、模型层、应用层,并由此体现了它的三大特点。
首先是数据层面。
松鼠Ai在教育场景的多年积累,构成了丰富的底层数据层。包括全学科纳米级知识图谱、海量学习资料、视频讲解以及测评和题库,以及学生学习历史数据。
值得一提的是,此处学生学习历史数据是松鼠Ai过去积累的2400万学生100亿学习行为全流程,比如学习进度、学习效果、学习路径,甚至学习过程中发呆的时间都有记录。
有了个人学习数据,一方面可以对每个学生用户画像精准把握,另一方面了解了同龄学生学习的情况,也有助于对学科整体知识点的规划和安排。
这也就决定了松鼠Ai大模型同其他传统大语言模型,比如GPT系列,有着本质的不同,他们将更加个性化,针对学生学习情况对症下药。
然后在模型层,以往谈到大模型,无非有多模态、LLM、Agent这些技术和应用,但松鼠Ai此处结合大模型的知识图谱(KG)&检索增强生成 (RAG),却值得说道说道。
简单来说,结合大模型的KG和RAG增强技术能快速找到知识点和知识点之间,知识点和题目之间,题目和孩子能力之间的关系。
若给孩子练习的题目,其与知识点的关联更高,孩子学习效率也会更高。而不同的学生对知识点的掌握也有所不同,那么具体到哪一个知识点,就需要推送与该知识点强关联的题目。
栗浩洋给出了一个具象化的形容,目前他们能实现25道题测1000个知识点,而市面上最高也只能实现25道题100个知识点,并且还能具体拆解到每个解题步骤当中去进行逐步讲解。
此外,栗浩洋还强调,但松鼠Ai的LAM(Large Adaptive Model)智适应大模型应用了MoE(Mixture of Experts)混合专家系统,通过将多个模型结合在一起,以获得更好的预测性能,同时降低模型的推理成本。
而在应用层,覆盖学习推荐、学习兴趣启发、习惯培养、情感干预、学习路径规划等多个场景。
比如在给学生提供辅导时,能够覆盖预习、复习、备考、作业辅导等多场景,并给予学生更多准确的回应与激励。
此外,还可以根据孩子在学习过程中反应,给予其正面的反馈与激励改善学生的情绪,帮助解决孩子的一些心理问题
可以说,其他大模型产品有的它有,没有的它也有。
总结来看,从数据到应用层,其实都围绕一个共同点:个性化。
再看产品功能上,松鼠Ai智适应教育大模型该有的功能都有,并且相较于大语言大模型,技术实现更为复杂。在应用场景上面,也更能把握学生个人的学习情况实现个性化应用。
至于为何能实现这样的效果,松鼠Ai的三大布局和选择值得关注:
纳米级知识拆分、MCM系统、大模型吞吐数据类型。
首先是纳米级知识点拆分。比如在数学场景中,单独针对「求加减法中的未知项」这一大知识点,就能拆分出「同分母分数两步方程-未知数为减数」、「异分母分数两步方程-未知数为加数」这种程度的知识点。
这就相当于在整个学习系统构建一个庞大的知识网络,这样能更精准地帮助学生定位学习情况,更精细的规划学习路经。
第二是MCM系统。第一个M是Model of thinking,就是思维模式,第二个C是Capacity,是学习能力,第三个M是Methodology,是学习方法论。MCM系统针对学习思维、能力、方法构建模型,这样能更科学地实时评价学生的学习状态和能力水平。
而负载了大模型能力之后,就能预测学生在未学过知识点上的能力水平、所花时间等,以推出个性化解决方案。
第三则是大模型吞吐数据类型不同。正如前文所述,数据类型更为复杂,大模型所能提供的能力更为多样。
说了那么多,其实不论是技术融合还是数据的选择,背后还有更为底层原因。
那就是智适应教育的选择,这也是整场发布会谈及最多的关键词。
什么是智适应教育?简单来说就是基于AI、大数据、物联网等技术,结合大量用户数据,针对个体学习过程差异提供适合的教育形式,以此实现个性化教育,做到因材施教。
当前包括培生教育、麦格劳希尔、Wiley、HMH这样的传统巨头也都在布局。
作为国内较早推行这一概念的企业,松鼠Ai早已开发出核心的智适应学习引擎架构。
据此前松鼠Ai联合创始人兼CEO周伟介绍,松鼠Ai智适应教育是用了三层式的架构,去构建知识地图、学习策略架构、内容地图、教学流程,进行数据的分析、推荐、算法,到最后形成完整的教学闭环。
随着大模型到来,实现个性化教育本身就是难得的契机,那么同智适应技术的融合也就成了应时之义。
按照松鼠Ai的理解,智适应技术全自动标准能按照自动驾驶那一套评价体系进行拆分。
栗浩洋认为,目前业内大多数主流玩家仍处于L2发展阶段。即根据学生学习情况,实现题目数据量智适应、题目难度智适应,也就是辅助驾驶。而他们在L5即完全自动驾驶阶段,已经实现40%的水平。
在谈及AI变革教育最终形态,他们最终目标是实现虚拟老师,有助于生成更多视频讲解,助力社会需求的创新人才培养。这样一来,在个性化教育追求的同时,真正实现了教育普惠。
至少现在来看,也并非那么遥不可及。
发布会上松鼠Ai介绍,2023年松鼠Ai已经完成2000家线下智能学习机门店业务布局,是全国零售店规模最大的AI学习机品牌之一。
而随着大模型进一步部署,上线在他们的学习机产品上,就能快速带来产业价值。
过去一年,大模型技术快速迭代,AI应用可能性不断拓宽。尤其教育领域,被认为是大模型最应该落地的场景之一。
不少企业围绕着该场景进行布局,代表的有「可汗学院」推出的人工智能助教Khanmigo;多邻国推出的内嵌GPT-4的Duolingo Max。
总结来看,大模型落地教育主要有这样几条路径。
一种是类ChatGPT,在网页端/APP侧解决学生或老师的问题。大模型通过自然语言交互充当学习助手的角色。这在语言学习场景中最为常见,比如Duolingo、以及最近备受关注初创公司Speak。
另一种则是大模型部署在原有学习硬件之上。这种自带天然交互场景,也有用户和数据基础,应用迭代速度可能更快,但对技术要求更高,已有形态包括学习机、教育机器人、词典笔等。
百花齐放的发展现状之下,不难看出,硬件形态和软件功能容易千篇一律,并逐渐趋于同质化。
企业的创新本质还是得在于AI的赋能。这也是新一波技术浪潮企业保持竞争力的核心所在。一旦完成大模型部署,可以实现更多创新应用,用户数据带来的迭代速度更快,边际成本会逐渐降低。
不过在用户侧,除了对话这种显性功能外,大模型更多核心能力内嵌于产品中,比如根据用户习惯、学习进度制定学习计划等等,但用户往往在短时间内感知不到。
这也是当前教育场景一个主要挑战。
这就需要企业,一方面进行消费者教育,另一方面则是坚持长期且持续的技术投入,构筑企业壁垒,才能抵挡外界风云诡谲。等新技术来时结合已有场景快速利用,服务于用户。
有着近十年技术部署的松鼠Ai,就是一个范例。
不过最后不管大模型在教育怎么应用,总的方向已经确定。
那就是个性化教育、因材施教。
事实上这本身也是教育行业被广泛接受且一直以来想要实现的目标,早在上世纪八十年代,著名教育心理学家Benjamin Bloom在其教育实验中提出”two sigma”理论证明了其正确性——
接受一对一辅导的教学组平均表现要明显优于传统的1:30教学方式。
如今大模型本身个性化的技术特性,也就给教育行业变革带来了全新的可能性。
毫无疑问的是,随着大模型布局的深入,更多细分标准的确立,教育行业发展已经来到了关键的历史节点。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI