2025,当大模型来到应用爆发之年,越来越多的垂直行业当中,开始涌现出AI落地的经典实践案例。
教育领域中,专注于职业教育培训的粉笔,就是其中之一。
就在第三届AIGC产业峰会现场,粉笔CTO陈建华坦言:
教育领域长期存在“不可能三角”:大规模、高质量、个性化。
但是大模型的出现,正在打破这个不可能三角,为教育带来新的可能。
并且这种可能性,正在粉笔的亲身实践中逐渐成为可以量化观察的实例。
为了完整体现陈建华的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
中国AIGC产业峰会是由量子位主办的AI领域前沿峰会,20余位产业代表与会讨论。线下参会观众超千人,线上直播观众320万+,累计曝光2000万+。
以下为陈建华演讲全文:
大家下午好,非常高兴来到量子位AIGC产业大会,来分享我们在AI赋能教育领域探索和实践的经验。可能在座的有些朋友对粉笔还不太熟悉,我先简单做一个介绍。
粉笔成立于2015年,是一家专注于职业考试培训的互联网教育公司,核心业务主要是公务员、事业单位、教师、考编、考证类培训,通过持续的产品创新和技术探索,我们构建了“教、学、练、测、评”一体化学习闭环,推出了题库、模考、课程、直播、社区、招考等多个受用户欢迎的功能模块。
在嵌入AI落地之前,我们想简单地谈一下我们对教育本质的理解。
我们把整个学习的过程分成了四个阶段:
第一个阶段是感知阶段。这个阶段其实是一种对概念的死记硬背,这时候会对知识有一个初步的理解。
第二个阶段是理解阶段。这时候开始真正地理解知识和概念的本质和内在逻辑,而不仅仅是表面记忆。
第三个阶段是实践阶段,即利用理解的知识解决实际的问题,再在不断的实践中加深对知识的理解。
最后是创造阶段,这个时候随着不断的实践和理解,我们会慢慢形成自己的知识体系。此时,知识才会变成自己的知识。
从阶段划分上可以看到,学习就是不断从输入到输出,再不断重构输入的循环过程,不是一蹴而就的。
因此,大模型落地教育,我们认为有4个特点。
第一是聚焦学会,而不是只关注答案正确。
教育领域里不管听课也好、做题也好,都只是一个过程,目标都是为了学会,然后在其他地方更好地做题或者解决问题。
第二是学习的主动性存在巨大挑战。大家也都知道学习是非常反人性的,需要克服自身的惰性或者心理障碍,激发学习主动性是极具挑战性的任务。
第三,所有的培训教育一定有一套教研体系,确保培训内容的科学性、系统性和有效性。
最后一点需要额外强调的,教育是非常严肃的场景,对准确率要求非常高。
教育领域里面有一个“不可能三角”:大规模、高质量、个性化。
三者很难兼得。比如,大班课实现了大规模和高质量,但牺牲了个性化;一对一解决了个性化和高质量,但却难以实现大规模的应用。
但是大模型的出现正在打破这个不可能的三角,让这个不可能三角变成了可能。
粉笔探索大模型在教育领域的应用分成了三个阶段。
第一个阶段是2023年,主要聚焦在三个关键词:内部、有限制、小场景。
我们最开始尝试解题,当时模型能力比较有限,正确率比较低。我们尝试用大模型进行解析发现,解析可能跟我们教研体系不太符合。但有些偏主观类场景里,给出点评框架后,大模型的效果还是非常不错的。
这个阶段我们意识到,大模型想要在教育场景里落地,推理能力仍然需要不断提升,结构化引导至关重要。
第二个阶段,我们在2024年7月份正式推出粉笔AI老师,标志着我们从单点场景慢慢走向系统化多场景融合。
粉笔AI老师主要聚焦在答疑和辅导的场景,支持十大核心的场景、上百种细分场景。
AI老师的主要实现方案是RAG+垂域模型,用户提问后先进行识别,通过RAG系统获取对应场景的数据,通过垂域模型生成对应的回答。
前面提到教育是严肃场景,对准确率要求比较高,因此我们在大模型落地中要尽可能降低幻觉的出现。基于我们积累的高质量知识库数据以及对场景和需求的洞察,通过RAG系统可以极大降低幻觉。
另外,业界对于垂域模型争议比较大。从我们角度看,垂域模型开发其实是非常有必要,职业教育的考试有自己一套全面结构化的比较有特色的考察体系,基于我们独有的高质量数据还有教员对于教学方法、教学经验的积累,还有我们对于用户学习行为的洞察,开发垂域模型能保证我们用更小模型、更低成本,实现更好的效果。
我们的垂域模型在题目答疑核心场景中,评分比通用模型优化之后高0.2分以上,尤其是一些在言语、判断推理和常识等科目上,表现的会更好一些。
在我们对AI老师的探索中,也有一些收获:
第一,提问的门槛其实很高。虽然AI老师已经有了非常好的辅导和答疑能力,我们发现用户在实际使用过程中主动提问的比例还是远低预期的。
很多用户并不知道怎么提问,甚至没有提问的意识,所以提问本身就是需要引导和训练的能力。
第二,在学习场景里,LUI(语言交互界面)对话的形式可能不是非常高效的交互模式。对大多数用户来说,图形界面结合对话的混合交互才是更合适的方案,主动学习需要跟被动学习深入结合。
第三是学习方式高度多样化。用户的学习行为非常不标准,展现出极大的个体差异,学习时长、学习路径、学习习惯等等都有非常大的差别。
前两个阶段的积累下,粉笔在2025年正式推出AI系统班,基于大模型、数字人还有TTS等语音技术推出AI时代全新产品,区别于传统的系统班。AI系统班是个系统性课程,全程由AI老师来驱动学习流程。
我们为AI系统班定义了四个特性:
第一是个性化的学习方案。基于对用户当前水平的精准评估,我们能够为每一个学员量身定制学习方案,而且会随着用户学习过程中的表现和反馈不断进行动态优化,实现真正意义上的因材施教。
第二是学习过程更具人味。我们不仅仅提供学习任务,而且为每一个学习步骤提供清晰的解释和引导,帮学生学习理解为什么这么学,下一步怎么学,这样的设计让整个学习过程更具温度,让学员更有方向感。
第三是启发式答疑。答疑过程中系统采用启发式方式引导学员思考,避免直接给出答案,以促使学员主动构建自己的知识体系,提升理解的深度。同时基于对答题过程中表达方式、错误模式的综合分析,AI能够智能识别出用户的薄弱点,实现更具针对性的学习支持。
第四点,区别于传统排课制教学模式,AI系统班具有更强的灵活性和主动性。大模型支持下,学员可以根据自己时间安排自由学习,不被固定的时间表所限制,真正做到以学生为中心的自驱式学习。
为了实现个性化学习体验,我们还引入了记忆系统,让大模型不仅聪明而且有记忆。这里主要分成三个关键组成部分:
第一部分是用户行为记录和画像,通过对用户做题、听课等等各种行为的记录,以及行为习惯和兴趣偏好等多维数据建模,构建出动态更新的用户画像,为个性化推荐和内容生成提供一个基础。
第二部分是短期记忆,根据用户跟AI老师的短期交互,响应用户提问。
第三部分是长期记忆,在用户跟AI老师长期交互的过程中,不断抽取学员核心信息放入记忆仓,帮助系统形成对用户学习风格能力演进的深度理解,制定中长期的学习策略和目标的引导。
我们始终坚信有多少Context,就有多少个性化,上下文信息是个性化基础,只有在充分理解用户当前状态、历史轨迹和学习目标前提下,大模型才能为每一个学员生成适合其需求的内容和路径,实现因人而异的智慧学习。
以上是我们此前的探索,展望未来,我们在大模型赋能教育领域的实践上面,主要聚焦以下两个关键的方向:
第一个方向是多维度的个性化升级。
当前个性化其实主要是聚焦在知识水平和学习行为,我们相信个性化的空间远不止于此,未来我们会探索更多个性化维度,包括学习风格、认知偏好、情绪状态、学习的动机等等,让每个学员都能获得更贴合自身特质的学习体验。
第二个方向是三维一体的AI老师形态。
我们正在探索构建一个更立体更具沉浸感的AI老师形态,融合文字交互、语音沟通和白板演示三种能力,形成可对话、可聆听、可演示的三位一体的AI老师形态。
这种多模态的交互方式,不仅能提升教学的实时性和响应效率,更贴近人类真实的教学场景,也能更好满足不同用户在不同场景的学习需求,让理解变得更自然,学习也会更高效。
通过持续深化个性化构建更具沉浸感与互动性的AI教师形态,我们希望推动教育从智能化迈向智慧化,真正实现以人为本的未来学习方式,谢谢大家。
文章来自于“量子位”,作者“编辑部”。
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales