# 热门搜索 #
搜索
北大数学课,启用AI助教-Brainiac Buddy
3398点击    2023-10-26 10:50

这门北大数学课,学生和老师竟然都在用AI“摸鱼”?!


不仅如此,老师还是主动推荐你用,“方便跟上授课进度”。


原来,这是一位北大数学老师专门构思并落地的AI助教,不仅能当学生的课后助理,还能当老师的贴心秘书。


对学生来说,学校的冗长教案看不懂,直接扔给AI助教,马上就能划好重点,真·喂饭喂到嘴边。


而对老师来说,一拖、一拉、一拽,3步就能把自己的课程教案丢给AI助教,省去了对着人类助教大费口舌的时间。


因为使用丝滑,这个AI助教被北大数院21级本科生刘梓豪起名为Brainiac Buddy,意为“那个聪明又勤奋的家伙”(doge)。


不卖关子了,这门课叫《图像处理中的数学方法》,开课老师是北京国际数学研究中心教授、国际机器学习研究中心副主任董彬


整个Brainiac Buddy,由董彬团队和校外公司Answer.Ai团队联合打造。


在与量子位的交流过程中,董彬表示:


OpenAI创始成员Andrej Karpathy之前讲未来是Agent Base,我深以为然。

所以想在AI助教上试试,能不能实现个性化、定制化和互动式,以此提高教学质量。



基于不同prompt“一键变身”


Brainiac Buddy(以下简称BB),基于GPT-4开发。

(PS这里是全网重点,北大研发的AI工具是使用GPT-4开发的,这其实是不符合之前发布的监管政策的,而且还是和海外团队合作,也许国内的创业者们可以重新思考一下监管政策)


团队针对数学课程进行了重点优化,首先拿来试手的就是《图像处理中的数学方法》这门课。


简而言之,通过学习和分析课程大纲、参考书、讲义和代码示例,BB不仅专业知识拔尖,“大脑”也已经是数学老师的形状了。


亲身上手体验一下~


登陆后,以《机器学习》第一章绪论章为例,可以看到如下的界面:



BB界面共有三个分栏:


最左侧,是关于本章节课件的演示文档(支持多种格式),章节相关的附件及挂载的知识库;中间栏呈现了课件文件的渲染,提供在线浏览功能;最右侧则是与BB的对话界面,可以与课件、知识库进行问题的讨论以帮助学习了解课程内容。


在右侧分栏直接提问,可以从embedding教案后的课程知识库中检索出该问题的解答。


众所周知,大模型具有通用知识,但针对具体的领域可能不是很精准。


于是基于大模型的基座模型,当前BB是基于GPT-4,把课程存储到向量数据库中,方便学生在学习知识的过程中,得到大模型的支持,帮助他们分解知识难点,使不同基础的学生都可以得到适合自己的解读方式。


不过董彬也谈到,作为研究者,其实是比较喜欢大模型幻觉(hallucination)的,“因为幻觉和创造/创新其实只有一线之隔。”


通过不同的prompt,BB能够调用不同的具体服务。


BB提供给教师最大的灵活度,让他们能够充分利用大模型优点的同时,给予最大程度的自定义prompt,让课程的交互性和交互过程按照不同的课程,呈现不同的效果。


比如调用测试模式:



又或者总结文件主要内容:



整体感受,BB没有什么花里胡哨的UI界面,使用起来和一般的AI Chatbot比较类似。


AI Agent=大模型+记忆+主动规划+工具使用,基本上呈现出的就是现在大家看到的这个样子。”董彬说道。


至于后续对BB还有什么完善(的想法),他表示,希望能让BB能围绕一个数据库来准确提取信息,并根据问题判断,到底应该用数据库信息来回答问题,应该调用内外部工具,还是调用通用能力回答问题。


AI 辅助数学学习


目前AI工具这么多,为什么要专门做这样一个AI助教?


其中当然有现实的掣肘。


最基础的,就算只把《图像处理中的数学方法》这门课的教案丢给GPT,也已经超出了GPT系列的token限制。


但更多来源于董彬本人的认知和实践。这也是他寻求与校外公司Answer.AI合作,做出BB,并实际运用到课程中的主要原因。


董彬虽然是数学专业出身,但2016年起转向机器学习,现在的主要研究领域为科学计算、机器学习及其在计算成像和数据分析中的应用。


他自称从大模型大显威力的第一天起,就是其忠实追随者,根本没有国内外那些大学“先禁用再应用”的心态转变


尤其是GPT-4问世后,董彬成为了大模型高频率的重度依赖用户,“它很大的作用,不是帮我干杂事,而是我通过它来学东西”。


董彬的切身体验是,只要问题问得好,回答的质量就会非常高。无论何时何地,只要有突发奇想,就可以跟领域内最博学的“人”交流,并且从不觉得他提出的问题蠢。


有了这样的体验,董彬脑子里冒出一个念头:


不行,要给我的学生也配备这样一个工具。


“学习就是跟作者交流,听作者讲课,接受知识的形式是非常被动的。”董彬解释,“听课或看书的过程中,会产生各种各样的疑问和想法。但老师的认知、精力、耐心都是有限的。”在他看来,如果无法跟作者交互,学习就会变得非常低效,特别是还无法1v1答疑解惑的情况下。


但AI 助教,或者说大模型,就遍读全人类知识,且精力和耐心永远充沛,能够“极大程度上提升教育的效率,以及个性化和定制化。”


有了自己的想法,恰巧教过的两位学生——数学学院21级本科生刘梓豪和20级本科生唐艺铭,想跟随董彬做一些暑期项目。


于是,BB被提上日程。


这时候董彬了解到了Answer.AI。这家创业公司旨在利用智能助教(AI Tutor)让广大学生享有到最优质的教育资源和最好的学习体验。他们的教育产品发布后,在很短时间内取得美区iOS教育榜单第三名的成绩。



恰巧,他们也希望与各个学校和机构一起探索全新的教学方式,并提供成熟的产品和技术方案。


和Answer.AI接触后,董彬带着刘梓豪和唐艺铭与其工程师团队交流了自己的想法,双方一拍即合。


而后,Answer.AI 为BB提供了产品化方案。并且在工程师的帮助下,最终完成了BB的计划、设计、数据处理、自然语言编程、UI制作等。


后续可能做“学会提问”主题在线分享


最后,正式介绍一下这位热情邀请学生在课程中使用AI助教的数学老师。


董彬,北京大学北京国际数学研究中心长聘教授、国际机器学习研究中心副主任、国家生物医学成像科学中心研究员。


2003年,他在北京大学数学科学学院拿下学士学位,两年后,在新加坡国立大学数学系获得硕士学位。


后来,董彬又远赴UCLA数学系,并于2009年获得博士学位。



他表示,希望更多的同僚同侪参与使用BB,能够从中得到更多反馈和启发。


根据目前得到的一些反馈来看,最令董彬“痛心疾首”的,就是学生在对AI提问能力上的欠缺——既不爱提问题,也不擅长提问(prompt)。


普遍来讲,学生总是爱直接把问题本身丢给AI。


这本身没什么问题,但还达不到事半功倍的效果。


在量子位的追问下,董彬分享了自己常用的提问模式。在他每一次针对具体问题的提问中,往往含有好几步过程:


首先,先告诉AI这个问题的背景,比如自己是在做什么的时候、看到什么东西、如何产生了这个问题;
其次告诉AI,这个问题的难点在哪?可能和哪些已知问题相关,也会谈一下为什么自己觉得这是个好的问题;
然后会谈谈自己对问题的初步思考,以及对自己现有想法不满意的地方,并在期待什么样的更好的想法。
最后再问AI,能不能帮忙提供一些建议。
相比于直接把问题本身丢给AI,然后不停追问,这样的方式可能两三轮就能很好地解答一个问题。


董彬举了个近期的例子。


最近,他和基础数学家何旭华在arXiv上挂了一篇用机器学习辅助数学前沿探索的论文。第二天,何旭华的一位合作者看到论文,发来一封邮件,开头是“et tu Brutus”。


董彬此前从未见过这个表述,于是去问了Claude。




对比可见,只有完整告诉Claude背景信息,它的解读才会正确,还给人一种“情商很高”的感觉。


作为AI重度用户,董彬在日常和做报告时发现,好的提问和不好的提问,得到的答案差异其实有明显差异。


往后会考虑开设课程或进行在线分享,让学生学会如何提问。


通过BB,董彬使用prompt的经验和方法论也可以更方便的沉淀给学生,通过教师功能,可以方便的为每个章节设置独特的prompt。


据了解,后续BB会为学生提供prompt预设功能,并针对学生提供快捷输入prompt的功能,以提高使用体验。


以及现阶段,董彬刚在arXiv上挂出了一篇论文《Prompt Engineering Through the Lens of Optimal Control》,有关从最优控制视角解读交互工程,感兴趣的小伙伴可以阅读一下~


arXiv:https://arxiv.org/pdf/2310.14201.pdf




文章来自微信公众号 ”量子位“,作者 衡宇










AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0