最近有个热点新闻 ——「清北毕业爸爸辅导孩子数学也抓狂」。点开一看,新闻主角居然是李永乐老师。要知道,李永乐老师本科北大、研究生清华,现在还是人大附中的物理老师和知名的科普博主。如果连他都辅导不了自己的孩子,普通家长该有多崩溃。正所谓「不写作业,母(父)慈子孝;一写作业,鸡飞狗跳」。在辅导孩子这件事情上,似乎没有多少家庭能做到心平气和。
巧的是,就在同一天,一个 AI 辅导孩子的视频也吸引了很多家长的注意。视频讲的是一位父亲在大模型的帮助下与女儿共同检查数学试卷。其间,大模型通过一问一答的方式,引导孩子独立思考,一步一步得出了正确答案,并指出了问题所在。有的家长看后评价说,「讲得可真细致,比我强多了」。
据悉,这是猿辅导旗下飞象星球发布的大模型场景测试视频。从发布时间来看,该场景测试距离猿辅导看云大模型正式通过备案,仅用了 15 天时间。要知道,大模型最难的是找到对用户有价值且大模型可以实现的场景,而猿辅导这一场景测试是找到场景再做技术研发,被其内部称为「拿着钉子找锤子」。
也正因如此,猿辅导看云大模型并不会像那些广为人知的通用大模型一样成为独立的应用产品,而是一个技术底座,隐藏在其产品交互的背后,为学生和家长提供服务和支持。
「大模型对我们来讲是『技术』,不是『产品』,它应该在产品中发挥价值。」猿力科技 CTO 杨元祖如是说。
其实,在教育领域,大模型能否让大家看见并不重要,关键在于它能否有效解决学生和家长面临的问题。作为一家自 2014 年就设立了 AI 实验室的教育科技公司,猿辅导在应对这些问题上拥有自己的独到见解和优势。
学生和家长需要什么样的大模型?
学生需要什么样的教育?其实早在两千多年前,孔子和苏格拉底就给出了答案。
孔子的理念是「不愤不启,不悱不发」。也就是说,教导学生时,不到他冥思苦想仍不得其解的时候,不去开导他;不到他想说却说不出来的时候,不去启发他。可以看出,孔子反对「填鸭式」教学方法,主张通过激励、诱导、启发的方式,刺激学生的学习主动性和积极性。
这种启发式的教学方法也是苏格拉底所推崇的。他主张不要把学生所应知道的原理直接教给他们,而是从学生所熟知的具体事物开始,通过师生间的对话、提问和讨论等方式来揭示学生认识中的矛盾,刺激学生在老师帮助下寻找正确答案,使其得出正确的原理。
这种循循善诱的启发式教学听起来简单,但对于家长来说难度很高。首先,家长的知识储备可能跟不上孩子的学习节奏。很多家长表示,小学的题自己就已经做不了了。还有的家长表示,自己会做,但不知道如何以孩子能听懂的方式讲给孩子。
在 ChatGPT 等大模型问世后,一些家长也想过让这些大模型 APP 充当孩子的家教。但同时,他们也担心孩子们直接去问模型答案,省去中间的思考过程,这和直接让孩子看练习册后面的答案区别不大。因此,一种折中的方式是家长先通过模型自学,再去教孩子,门槛依然很高。
此外,孔子还有一个很难被贯彻的理念 —— 因材施教。在学校,每个老师要负责几十甚至上百名学生,很难关注到每个学生的差异,因此制定的教学计划、布置的作业往往是高度一致的。家长对此也是无能为力。这可能导致学生的学习效果和兴趣受到影响。
因此,总的来看,学生和家长需要的大模型至少要满足两个要求,一是要会启发,二是能帮助孩子定制学习计划。在成立之后的十几年里,猿辅导其实已经打造了一系列旨在满足这些条件的产品,比如海豚 AI 学、猿辅导素养课、小猿学练机、飞象星球、斑马 App…… 但现在,大模型的出现给了他们一个契机,让他们有机会把这些产品全部升级到 Next Level。
不给答案还反问,「反骨」的教育垂直大模型
尽管当前通用大模型已展示出巨大的应用潜力,但不得不承认,教育的复杂性在于其高度依赖人际交流,尤其是学习新知识时。由于缺乏在教育垂直领域的数据及行为积累,通用大模型的产品逻辑并不能很好的适应教学辅导场景,下面这个例子恰巧证明了这一点。
当孩子遇到了不会做的数学题,如「甲、乙两人同时从 A、B 两地出发,相向而行。相遇时,甲与乙的路程之比为 7:5,若甲比乙多走了 200 米,则甲走了 () 米。」假设孩子不会写调教大模型的提示(比如:「回答的内容是给 10 岁的孩子看的」),而是直接把问题抛给通用大模型去做,我们看看会发生什么:
就过程和结果来说,两个模型都没有答错。但从辅导孩子的角度来看,他们给答案的方式还是过于直接了,第一个大模型给出的解法甚至是超纲的。
但猿辅导的教育垂直大模型却反其道而行之。当孩子把同样的问题抛给猿辅导旗下的海豚 AI 学时,AI 学习伙伴「小白」会通过多轮问答,引导学生逐步解疑,主动思考。该功能被称为「苏格拉底启发式 AI 答疑」。
此外,在作文等主观题中,通用大模型与教育垂直大模型的差异就更明显了。相较于直接生成「范文」或者给出几个方向的提示词,教育垂直大模型则更懂得如何提升孩子的底层能力。在猿辅导看云大模型加持下,飞象星球可以通过多轮启发式对话,帮助孩子理解题目、发散思维,引导其逐步列出作文提纲并成文;猿辅导素养课的 AI 作文批改,则能从审题、立意、语句、词汇等各个维度进行评价,并生成一份详细的报告,让孩子了解自身的优势与不足。
不难看出,教育大模型不仅是交互的、主动的,还是个性化的。随着时间的推移,这些产品会为每个孩子建立起学习大数据库,开启真正的个性化学习时代。
「大模型肯定是教育解决方案接下来改进的最大变量。假设没有大模型,我们也会一直迭代我们的产品,但相对来说是比较渐进的。但大模型理论上来说带来了全新的变量,使得我们可以重新审视教育解决方案,从这个角度说再怎么重视都不为过。」杨元祖在接受多知网的采访时谈到。
不过,重视归重视,对于一家教育类公司来说,在这么短的时间内做出一款能落地多款应用的大模型显然是非常不容易的。但如果把他们当成一家 AI 公司来看,一切就顺理成章了。
猿辅导:既是教育公司,也是 AI 公司
猿辅导的 AI 基因可以追溯到 2014 年。当时,他们成立了业内首个 AI Lab,在教育领域独树一帜。其实,在 AI 领域,这个时间也是非常早的,距离 Hinton 等人在 ImageNet 挑战赛中拿到冠军仅仅过去了两年,而李世石与 AlphaGo 的对弈两年后才会发生。
在成立后的 10 年里,这个 AI Lab 在语音、视觉及自然语言理解等方面做出了很多成果。2018 年,他们在斯坦福问答数据集水平测试上战胜了 Google;2019 年,他们探索出了基于深度学习模型的数学应用题自动解题模型;2020 年,他们出版了《深度学习核心技术与实践》一书;2021 年,他们的语音合成技术获 ICASSP M2VoC 国际赛事多说话人多风格音色克隆大赛榜首……
追根溯源,猿辅导的很多产品都是在这些研究的基础上构建起来的,比如猿题库、小猿口算、小猿搜题…… 所以,说「猿辅导本质上是一个 AI 公司」其实并不为过。
但同时,作为一家教育公司,他们又有很多 AI 公司所不具备的优势,其中最明显的就是数据。
正如我们前面所说,教育不是给个答案那么简单,背后有自己的规律和方法论。而这些规律和方法论,就藏在每一张试卷、每一个教学视频里。通过数据及行为积累,大模型可以知道怎么去拆解每一道题目,怎么按照学生的认知水平选择合适的讲解方式。
而这样的数据,仅猿辅导旗下飞象星球就积累了上百 TB,其中包括文本数据 30TB、图文数据 90TB。此外,他们还有 500 万小时的教学视频数据。可以说,猿辅导拥有行业体量最大的高质量教育数据集。在大模型技术趋同的今天,数据积累将在很大程度上决定猿辅导及其竞品所打造的教育大模型的上限。
手握这些资源,猿辅导对于自家大模型有着非常清晰的定位。「我们的大模型要更加符合教育领域,比如说更会做题,更擅长以一个老师的方式来掌握知识点。通用的大模型可能对于语言的理解能力是很强的,但它对语言的理解能力是一个普通人的理解能力,不是一个语文老师的理解能力。普通人和语文老师看待同一句话、同一句语言的视角不一样,这是两者的差异。」杨元祖解释说。
为了继续挖掘大模型在教育领域的潜力,猿辅导下一步打算在多模态大模型上持续发力。因为,教育对于原生多模态的需求会远大于其他领域,这是一种自然而然的选择。
从技术到应用,教育大模型还有很长的路要走
如果从 AI 公司的角度来看,猿辅导有很多不一样的地方。在百模大战如火如荼的阶段,他们没有急于推出一款大模型,而是在理清了大模型的能力和学生、家长的真实需求之后再重点打磨,然后将其作为技术底座与现有产品深度融合。这是一项系统工程,背后需要对教育、对 AI 都有很深的理解。
不过,从飞象星球本次曝光的视频来看,猿辅导的大模型还处于测试阶段,还没有「完完全全地落地」。诚如业内人士所言,大模型时代仍处于早期阶段,垂直大模型的落地应用也有待市场进一步检验。只是,我们几乎可以预见,谁能够把教育大模型场景应用这一环节的痛点解决得最好,谁就有可能占据教育数字化的制高点。
教育大模型的出现,不仅仅是技术的革新,也是思维的解放,它让人们重新思考教育的目的,重新定义师生关系,重新配置教育资源。通过将先进的大模型技术整合进其教育产品中,猿辅导将推动一对一优质教育资源的普及,助力缩小城乡、贫富之间的教育资源差距,实现让更多孩子享受到高质量教育的美好愿景。
参考链接:https://xueqiu.com/7423950559/290805667
文章来源于:微信公众号机器之心,作者:张倩