让大模型给孩子当全科家教,靠谱吗?
辅导孩子功课,是每一位家长注定要经历的「修行」。
「为什么一道题讲几遍还是不会做?」
「我是本科学历,本来以为能够自己在家辅导孩子,没成想才初一课程就碰了钉子。」
相信大家对这些话的语境一定很熟悉。在打工一整天之后,再拖着疲惫的身躯亲自辅导作业,让很多家长真实地感到头疼。
再加上,随着孩子年级的升高,课程中的知识点越来越丰富,家长辅导孩子功课也越来越吃力。有些简单的题目,家长们还可以指点一二,但谈到「全科辅导」,很多家长对知识的理解也并不充分,未必能很好地为孩子答疑解惑。
其实,面对这个难题,家长们不妨寻找外力的帮助。
就在这两天,大家应该已经听说了,教育领域出现了一位新晋的明星家教 ——「小 P 老师」。
「小 P 老师」不是真人,它是一位能够进行全科答疑的「AI 家庭教师」。据说,从小学到高中全学段的语数英物化生等 10 科的各类题型,没有「小 P 老师」答不出来的。
最可贵的是,即使是那种涉及多步骤推理、理解起来难度比较大的数理化难题,「小 P 老师」也能够耐心地层层引导式讲解。就这一点来说,确实比大多数家长的心态强大……
孩子们可以给「小 P 老师」发文字、语音、图片提问,就像与真人家教线上聊微信一样自然,而且比真人回复更及时,还 24 小时在线。
问题来了,怎么联系「小 P 老师」?初步了解之后,我们知道「小 P 老师」的「驻地」是最新发布的有道 AI 学习机 X20,它的超级教学能力则源于「子曰教育大模型 2.0」。
有道 AI 学习机 X20
「小 P 老师」也是子曰教育大模型全新升级后的首个落地应用成果。相比于初代版本,有道的子曰教育大模型目前已在口语对话、教育场景知识问答、文字处理等多项能力上有了大幅提升。
那么,「小 P 老师」在教学中的表现具体如何?能否担得起「AI 全科教师」的称号?
机器之心第一时间体验了有道 AI 学习机 X20,从多个维度进行了一番考察。
一上来,我就让「小 P 老师」给我讲了道题。「一对一讲题」也是大部分家长最关心的一环,关系到孩子能不能听明白、学得投不投入、成绩能不能有效提升。
每个孩子学习的方式和思维盲点并不相同,统一的课堂教学并不能匹配每个人的进度。因此,孩子们最需要的不是学习资料,而是一个懂得因材施教的老师。也正是基于这一点,家长们亲自下场辅导或聘请一对一家教,有针对性地给孩子补课。
现在,「小 P 老师」或许可以担任这一角色:基于大模型的多轮交互能力,「小 P 老师」每次可以支持多达 8 轮对话,孩子有什么不懂的都可以问。而且面对提问,「小 P 老师」不只是给出一份简略的标准答案,还能够提供知识点解析、思路逐步拆解和举一反三等个性化讲题服务。
我们可以拿一道数学应用题试试:
此处,「小 P 老师」采取了提问启发式教学,目的是激发孩子的思考和主动性。首先提示孩子这是一道「周期性重复」类型的问题,然后给出了拆解信息的思路和方法:先确定一个周期内有多少颗珠子,再计算第 600 颗珠子落在哪个周期,以此确定这颗珠子在周期中的位置。
如果孩子暂时没理解也没关系,「小 P 老师」会进一步告知解题方法:
依照方法解题之后,「小 P 老师」会帮忙验证答案,还会帮助确认一遍思考过程:
最后,面对学生对「周期性重复问题」的好奇心,「小 P 老师」还能介绍背景知识,并进行要点总结。
在与「小 P 老师」的个性化教学互动过程中,孩子的学习效果得到了最大化提升。这个过程中,我们也能感受到「小 P 老师」和其他对话式大模型的风格差异,它更懂青少年学习知识和认知能力发展的过程,愿意用一种浅显易懂的语言去和孩子「沟通」解题思路。
以往,AI 技术在课程辅导层面的应用大多仅基于规则与知识点提供自适应学习,而生成式大模型带来了意图理解、自然语言交流层面的突破,有望实现真正的「因材施教」。
一方面,大模型能够更好地理解开放式对话。比如在提问的过程中,孩子的表达可能并不那么清晰,以前的 AI 可能很难理解这类开放性表达,但如今的大模型有能力准确理解青少年在学习过程中的不完整表述,并将获得的信息与知识文档中的内容相匹配,给出有针对性的回复。
另一方面,伴随着上下文窗口技术的突破,大模型可以更全面地理解上下文、处理更复杂的任务和需求。在与孩子的互动中,子曰教育大模型 2.0 更长的上下文窗口帮助了「小 P 老师」更好地处理对话的上下文信息,生成更加连贯、准确、全面的回答。
我们知道,对于习惯了现代汉语体系的孩子来说,往往难以充分理解古代作品,解答文言文题目的过程也必然存在很多难点:断句问题、古代文化常识背景、通假字的迷惑性、翻译技巧等等。
曾有研究者面向多个大模型做过测评,其中古汉语是最具挑战性的任务之一。古汉语虽然难懂,但对于原本就擅长「语言」的大模型来说并非不可解的难题。具体来说,引入高质量的专有数据集,通过监督微调对基础语言模型进行定制化训练,再借助人类反馈强化学习的方法改进,就可以快速弥补模型在古代汉语上的能力不足。
「小 P 老师」的优点是不仅可将其翻译为现代汉语,还能提供文化背景知识的讲解和知识点剖析。
都说「痛饮酒,熟读《离骚》,便可称名士」,但这篇来自先秦时期的抒情长诗实在太难懂,我就让「小 P 老师」帮忙解读了一下:
不只是古文,面对任何的长文本内容,大模型的理解能力都比一般的人类教师还要强大。这是因为大模型擅长理解和处理长篇文本、大规模数据集或大型知识库。即使教材内容不断更新,所涉及的背景知识有所变化,大模型也能做到持续学习。
众所周知,各个科目的题目形式是非常多样的,比如数学题有公式和几何形状,物理题有受力分析图,化学题有分子结构等等,这要求「AI 家庭教师」需要拥有和人类教师一样的多模态内容识别能力。
这一年来,大模型技术已经取得了在多模态任务上的多项突破,但现实场景中的多模态识别还存在很多形式的挑战,比如文字不一定会以规范的印刷体的出现,输入图片的「形变」和「阴影」等因素也都会加大识别和理解的难度。又比如,不同学科的试题都可能出现「多图像交织对话」,模型需要比较多个输入图像和理解与图像相关的问题,以此为依据生成答案和讲解。
「小 P 老师」的一大亮点就是支持全输入场景识别,包括用文本、图片、音频等多种形式输入提问。
比如,把一张模糊的拍摄图发给「小 P 老师」,都不用补充提问,它即刻就能分析出题目的含义与解答思路。
这一功能源于「子曰教育大模型 2.0」在多模态能力上的进步。尤其是对于涉及复杂图文输入的任务,「小 P 老师」的表现同样优秀。
大模型之所以能展现出强大的图文理解能力,与自身的多模态上下文学习(in-context learning)能力密切相关。与传统的视觉推理模型相比,多模态大模型在大规模的预训练过程中已经学习到丰富的开放世界知识,能够在零样本或少样本的情况下推广到未见过的对象或概念。具体来说,只要在训练过程中给出几个图像 - 文本对作为示例,大模型就能将任务转移到未见过的问题上。
比如面对包含图像的数理化试题,「小 P 老师」不仅可以识别图像中的文字,还能精准捕捉图像与文字之间的语义关联。
如此看来,家长们终于可以解放了。当然,有了全能的「小 P 老师」之后,我们不建议家长们对孩子的学习完全放手,毕竟这也是拉近亲子关系的重要一环(狗头)。
至此,我们已经基本了解「小 P 老师」的教学功底。不过,孩子的学习过程中还有一项艰难挑战:「全科课程辅导」。
任何 AI 解决方案想要在教育领域更好落地,发展全科认知能力是一个必须突破的关键点。「AI 全科家教」必须拥有海量的知识储备且融会贯通,才能够应对各学科的问题。
今年以来,GPT-4 率先证明了大模型能够掌握多学科知识,并在律师资格、SAT 以及 GRE 等各种考试中均取得了不俗的成绩。如今,我们知道这种「全能」不仅能用来通过考试,还可以在教育领域发挥巨大作用。就像「小 P 老师」,针对中小学阶段的任何学科,都可以为学生提供个性化的学习支持、回答问题,并提供解释和指导。
不管是 GPT-4 还是「小 P 老师」,之所以能够胜任全科任务,本质上都和大模型「擅长学习知识」的特性分不开。
人类的认知受限于生物智能的本质,导致认知能力总归存在天花板。对于普通人来说,能够精通某一个领域的教学已经非常不容易。大模型却是一个相当巨大的知识容器,可以对海量的多学科知识进行提炼、吸收,获得非常强大的认知能力,至少可以在中小学课程教学这个领域成为「通才」。
在让大模型获得「通用性」这件事上,目前已有一些行之有效的方法:一种是利用指定的数据集对大模型进行微调,短时间内就拿下全科能力;还有一种近来比较流行的方法,利用 RAG(检索增强生成)技术和专有数据源的信息来补充文本生成,就能让大模型快速吸收外挂知识库,保持知识的更新迭代。
往前想一步,大模型的这种通用能力,同时使其有资格担任教学中类似人类教师的「打分」角色。只要写出规范的评价标准,以及逐步评价的过程,大模型就能迅速适应评估流程,帮助孩子纠错,养成更好的思维方式。
长远来看,大模型技术加持下的「AI 全科家教」,一定会给教育行业带来深刻的变化。
话说回来,学习机毕竟是一款电子产品,家长们同样要从硬件角度来考量。有道 AI 学习机 X20 也从各个方面下了功夫:为了模拟纸质资料的学习体验,X20 采用了定制墨水模式搭配高清雾镀护眼屏,叠加了六种护眼功能。X20 还配备了 4096 级压感智能书写笔,在孩子沉浸式做题的过程中全面呵护孩子视力。
X20 还首创了「三合一」模式,不仅是学习机,还是学练机,更是孩子的专属电脑。在学练机模式下,X20 提供了《5.3》战略合作资源,内置海量正版中高考同源试题可供选择;在电脑模式下,可使用原装专研智控键盘和内置键盘输入练习软件,规范打字指法。
在「小 P 老师」之外,新一代虚拟人口语私教 Hi Echo 同样是 X20 内置的一款大模型原生应用,并已完成了虚拟人形象、场景、对话能力、教学模式的全面升级:Hi Echo 2.0 版本新增了「口语定级」功能,并有新的虚拟人形象可供用户灵活选择。此外,考虑到学生的学习进度和英语能力,Hi Echo 2.0 设计了更多元化和深入对话场景的练习。同时,基于「子曰教育大模型」的技术支持,有道 AI 学习机 X20 还提供了全题型语法精讲,包括阅读理解、作文批改等功能。
在大模型风起云涌的这一年,曾有多位研究者指出,教育领域是大模型落地的绝佳场景之一。
现在,我们已经从「小 P 老师」身上看到了大模型落地教育领域的未来形态。
在教学流程上,它改变了「单纯分发学习资源」的传统方式,提供了一种通过讨论、问答引导孩子培养自主学习能力的途径,还能根据提问「对症下药」,有针对性地推送相关知识,实现了从「千人一面」到「千人千面」的跨越,而这正是我们千百年来追求的教育理念。
在教学模式上,由于大模型有着强大的知识迁移和组合创新能力,能够针对不同的学科、技能实现融会贯通、举一反三,使得 AI 与教育的结合不再只限于某一个学科和环节。通用大模型涌现出的泛化能力和生成能力,大幅降低了教学工作所需的人力成本,也会催生出全新的教育形态。
与此同时,我们可以看到,生成式大模型还在更多领域不断取得突破,比如文生图、文 / 图生视频、文 / 图生 3D 等方向。这些新技术同样有望融合到「AI 家庭教师」的能力之中,衍生出新的多模态交方式,使 AI 在教育领域的应用场景更加多元,发挥更多的价值。
伴随着生成式 AI 技术的持续进步,一场教育范式的全面革新必将发生。
文章来自于微信公众号 “机器之心”,作者 “蛋酱”
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner