本期TICLAB直播,我们特别邀请到跃然创新CEO李勇,飞迅智瞳创始人&CEO姜洪兵,和我们一起聊聊他们如何在AI教育硬件领域寻找产品的市场契合点(PMF),以及他们如何突破传统教育以及硬件的局限,用技术为教育带来创新的解决方案。
硅星人:为什么决定做这个赛道,难度系数如何?
李勇:我们选择的是3~6岁学龄前,因为我做了19年的硬件,之前也是天猫精灵的创始人之一。当时天猫精灵后台大部分都是孩子在语音交互,因为上一代的AI技术还不那么成熟,他给成年人提供情绪价值、或者说工具价值都不太够。我们就想既然孩子这么喜欢和天猫精灵互动,就想用大模型的技术给孩子做一个玩具,这是创业的初心。
姜洪兵:我最早不是学XR技术和软件应用的,我最早是做艺术培训的,在这个过程中我下沉到了很多学校,尤其是乡村小学,那里没有教师。我回想起我上学的时候,几乎都没有进过实验室,很多的实验操作一直没有真正下沉到孩子手上,尤其是在偏远的地方,理化生实验操作教学的开课率非常低。实验操作考试政策发布之后,我看到了教育信息化虚拟实验市场的空白。硬件上我们主要依靠的是Pico,随着技术迭代有了大空间交互之后,在实验的操作抓取上,比如划火柴这些微小的动作,可以在VR的虚拟现实中实现。截止到目前我们做了小学科学、初高中理化生实验、VR心理;同时我们把市场下沉到没有实验老师、没有实验教具的乡村学校,解决了教育均衡化问题,这也是我们坚定选择这个赛道的初衷。
硅星人:一个有趣的共识是,你们的创新产品都是原先产品+AI/XR,AI黑板还是黑板,AI毛绒玩具还是毛绒玩具,为什么会选择用旧的产品形态加新的技术?
李勇:发明一个新品类,需要教育市场。我们的思考主要是从营销成本的角度决定的,因为作为一个初创公司,我们没有太多的营销费用和时间去教育市场。举个例子,当年我们做了国内第一个智能音箱天猫精灵,现在大家可能觉得一个音箱会说话、会唱歌是很正常的事,但是在2017年智能音箱是个新品类,普通用户不知道一个音箱会说话应该是什么样子,所以我们花了大量的钱和时间去教育市场。
我们的想法是选择成熟的品类+大模型。毛绒玩具,是刻在人类基因里的,比如原始人都会用些皮毛去扎个玩具陪孩子,正好现在有了大模型技术,所以我们做的只是让毛绒玩具开口说话。这样在营销的时候,信息衰减就会非常小,我们一句话能讲明白我们做的是什么,就是一个会说话的毛绒玩具。换位思考,普通用户在选择产品的时候也很容易理解。
姜洪兵:李总说的我深有感触,因为飞迅智瞳也是个创业公司,载体的选择跟成本有很大的关系。首先硬件的成本,从设计、开模到生产这一条产线的支出,要耗费很大的人力、财力、精力。另外一个原因是我们所处的教育产业,它完整的教育标准,比如实验操作,虽然最后得出来的结论是一样的,但是考试考的是你的实验步骤,这个步骤从各个教材的课程大纲来看都是一模一样的,因为这是标准;我们需要把这些标准换做智能化的形式帮助老师提高教学效率、帮助学生提高学习效率及兴趣。
硅星人:就是没办法有断裂式转变,因为学生的学习过程是连续的,以前大家坐课桌,现在突然把课桌撤掉,这种模式的改变有点太大了。也就是说现在不改变它的形态是为了现在这个时候能活下来。
硅星人:用成熟的产品+AI固然有更清晰的市场和路径,但AI技术本身发展不充分的问题如何解决呢?
李勇:目前大模型还有很多幻觉问题还没解决,我们担心成年人对AI技术期望过高,用户体验不够好,所以我们首先选择了 3-6岁儿童用户市场。
在这个阶段里可能孩子更需要的是一些通用的基础教育,我们是想站在一个朋友的角度去告诉孩子,他跟老师的关系、跟朋友的关系怎么去处理?爸爸妈妈吵架了怎么办?我们的产品希望用大模型的能力去解答3-6岁孩子面临一些困惑和问题,这个是大模型很擅长的。
在模型幻觉上,一方面是数学,现在通用大模型对数学解决的其实不太好,比如13.8和13.11哪个更大。针对这个情况,我们有个自己的小模型去做意图识别,比如识别出是读古诗的话,就外挂一个古诗的知识库,数学就接一个数学领域的专业模型,我们上层的模型是可以灵活分发的,尽量的避免和消除一些幻觉。
姜洪兵:比如说VR 做实验,高算力、低延迟的大空间交互,能够将实验过程可视化、流程化、简单化,还能快速地反复练习,但问题是当下的VR设备是自主操作,还不能达到多学生协同操作,甚至我会可能还会产生眩晕感,这些一方面随着技术和设备发展会得到解决,另一方面也需要更完备的用户运营,在于我们这些厂商真正入校运营起来,建立协同育人标准。
运营上的难点展开来讲,还是因为K12教育领域的用户主要是学生,但我们的客户是学校,在客户和用户之间存在一个断层,2019年我下沉到一些学校,看到我们的设备全都落灰没有用起来,最大的难点是学校能够建设,但是没有运营好。我感觉跟我们这些厂商有直接关系,我们没有去真正的引导好学校如何运用AI解决教学当中的一些问题。
硅星人:这次双11的销售数据如何?
李勇:从上次跟硅星人的访谈到现在,我们产品正式已经开卖了,前两个月激活量已经超过2万台了,每天的 token 消耗已经超过6亿,估计很快可以破 10 亿。其实我们在产品开卖之前遇到很多质疑,很多的投资人都在问 AI玩具这个事是不是一个伪命题?产品体验和之前的儿童硬件都不一样,有没有PMF?现在我觉得没有人会怀疑这一点了,随着这个月底我们在美国开卖,我相信在全球范围内,AI玩具跟大模型的结合,不会再是一个伪命题了。
硅星人:为什么会选择抖音平台?
李勇:因为抖音的直播形式更有利于讲清这一代的 AI硬件跟之前的 AI硬件哪里不一样,通过直播很容易能演示出来。比如说之前的AI硬件都回答不了“妈妈更爱我更爱弟弟”这种问题,那现在的大模型就非常擅长,包括火箭的发射原理和一些奇思妙想,它都能答出来。而且抖音的算法推荐非常精准,我们早期用户基本上都是一二线城市的年轻妈妈,大部分人不知道什么是大模型,但她们给我们产品提了很多好的建议。所以我们也可能是全球第一个破圈的AI硬件,其他的AI硬件基本上都是卖给一些科技爱好者或者一些极客的,这也符合跨越鸿沟的经典理论。但我们不是,我们的产品正好是卖给年轻妈妈这个用户群体,结合我们选择了抖音的渠道,可以精准触达一些根本不懂什么是大模型的用户。
硅星人:那还有一个问题是,随着用户量增长,使用的token数量会有什么变化吗?
李勇:目前看还挺好的,我们这个产品刚卖两个来月,token增长的比较快,首先我们自己有一些优化的调用方式来减少 Tokens 消耗;其次,目前合作的一些大模型公司,例如 Minimax 和豆包也给了我们很大的支持,Tokens成本下降的很快。预计双十一之后,单天 Tokens 消耗就会破 10 亿了。
硅星人:有迭代出哪些基于大模型的新功能吗?
李勇:有,之前文生音乐技术还不太成熟,8月产品首发那会儿我们还没上这个功能,现在已经在内测了,音乐旋律和歌词都是豆包、MiniMax的大模型生成的,不是像传统的接一个第三方版权库,预计双11之前会全量推送。再比如,我们产品原来是有读古诗的功能,有不少用户问能不能把古诗唱出来,就是这些我们可能没想到的、大模型也很擅长的、用户需求也比较多的新功能,我们就优先上线了。还有一个就是粤语,我们一开始支持中英日韩等20多种语言,但是我们忽略了粤语,后来我们看很多用户都在问,就上线了,粤语我们现在也支持的很好了。还有多智能体、故事大王等功能,我们都在开发过程中。所以根据用户的反馈,我们就可以及时迭代的新的功能。而且这个产品好的地方在于用户什么都不需要做,它会在云端自动升级。
硅星人:目前打算一直做一个陪伴型的产品,还是会加强它的教育价值,然后做更多生态上面的扩展?
李勇:我们聚焦在陪伴上面。我们注意到有不少硬件产品给孩子充当老师的角色,我们想做的是陪伴孩子成长的 AI Friend.严肃的教育内容也不是我们擅长的方向。至于生态方面,有些玩具公司在找我们合作了,希望用到我们的 APP 和算法能力,我们很欢迎这样的合作。不管什么样的玩具形态,只要是给孩子做 AI Friend,我们都愿意开放 APP 和算法能力合作。
硅星人:好像跃然的二代产品之后,策略更注重IP本身?之后是会选择大IP合作,还是说自己去做IP,这两条路是怎么考虑的?
李勇:我们自有IP开发和大IP的合作,这两件事并行在做。我们开发的自有IP,是有他独特的个性和世界观,它跟主流的这些IP不冲突。另一方面是我们跟顶级的IP合作能迅速打开市场,建立公司的壁垒,避免一些山寨之类的问题。我们自己做的IP,是注意到一些小众的意识形态,切一些更精准的一些用户和人群,泡泡玛特其实也是这么做的,而且做的非常优秀,非常成功,我们也想学习他们,两条腿走路。
硅星人:IP联名这两年很火,但不是只要联名就能成功的,大的IP很贵,小的IP很难押中爆款,成本会是联名的问题吗?
李勇:坦率的讲,这是个问题。有些公司原来不赚钱,就是因为拿了顶级的IP,获得了巨大的成功。一线IP之所以贵,是因为它有存在的价值,我们能做到的就是在自己的认知范围之内,选择我们认为最合适的,因为它已然是世界知名的IP了,只要商业条款合适,我们倒不担心用户不买单的问题,碰巧我们有这样的资源和能力。
硅星人:XR教育场景和传统教育场景,最重要的区别在哪里?解决了哪些问题?
姜洪兵:用虚拟现实的方式让学生操作实验,首先是避免安全问题,比如像一氧化碳还原氧化铁,这是一个必考实验,但是操作不当就会发生危险,学校又很少让学生走进实验室来操作,那通过虚拟的环境中来操作实验,去培养孩子在实验过程中流程性问题,因为实验操作考试考的是流程,而不是结论。第二点,解决了老师的评价难的问题,比如面对40多个孩子在操作实验,我作为一个老师不可能监控到每个学生的操作,我需要有数据回收,有数据整理,虚拟现实+人工智能可以记录每个学生的操作步骤,去做评价给出成绩。
硅星人:那么哪些实验会放在XR教学场景,哪些实验放在传统场景?
姜洪兵:比如需要快速训练、反复练习的时候,可以借助虚拟现实方式,提升整个流程的效率。XR实验培训主要是解决了实验过程,实验流程,记录实验数据。智慧实验室不可代替传统实验室,智慧实验室一定是传统实验室的辅助教学工具。
硅星人:刚刚您提到动作评分,对于技术层面又是一个很难的问题,能不能识别、和识别的是否足够精准。
姜洪兵:没错,早期VR头显刚出来的时候,手柄只是一个遥控器,戴上VR眼镜之后只是观看者。那怎样去附加交互能力?随着技术的难点我们要高算力低延迟的方案,现在云渲染就可以更好的去解决。比如划火柴,现在我们拿起两个手柄代表双手,我要真正的还原划取这个动作,三年前这个动作是做不到的,只能点一下确定按键,出来一个小动画,现在是解决了互动层面,还原抓取火柴盒、火柴、划火柴这些真实的动作。
硅星人:老师在教学中会觉得这是一件必要的事吗,他们自己的教学风格和教学课件,能不能在这个产品之下完成出来?
姜洪兵:有必要,真正提高复杂知识点的讲解及理解效率,需要用虚拟现实的方式呈现具像化,几处在于用起来,所以我们不断的去培训和引导学校使用。帮助老师人工智能备课、做公开课、联合学校办实验大奖赛,这都是用起来的一些途径。我感觉这些标准形成之后,AI产品和XR产品慢慢的可以在教学中成为必要的一部分,它不一定是全部,起码是一部分。
硅星人:驱动XR产品落地的最大的动力来自于谁?
姜洪兵:政策性的引导。我们国家对于教育新基建的政策发布,从教育信息化1.0时代迈到2.0时代,我们是在2.0时代到3.0时代的探路者,1.0的时候可能是粉笔课桌,后来有了投影仪。到2.0之后,我们学校现在用上了智能黑板、智能课桌。之后会转变到3.0,可能是一个多元化的形态,比如AI机器人、AI编、AI智慧实验室。为什么我们在做实验的过程当中能够激发孩子的创造力,就是因为每一场实验得出来的数据都是不一样的,这是一个创新能力培养非常重要的结果。
硅星人:现在VR这块有越来越多新的硬件出现,旧的硬件可能面临随时淘汰,你们会怎么办?再加上本身销售人员就是交付人员,如果底层的东西改了他们会怎么办?
姜洪兵:这个问题问的好,这也是目前我们所有的客户一直担心的问题,因为现在的技术迭代非常快。头显到现在的迭代不超过三代,现在已经满足动手操作实验和抓取,这个内容是标准的,不管你用什么样的硬件,我的内容是迭代的。同时,我们客户也会问到说你们迭代了我们怎么办?我可以回收。但是对于内容来说,知识点是不会变的,这是我们能够做到真正的产生革变的一个事情。
硅星人:教育硬件现在在to b和to c的市场区别是什么?现阶段你觉得AI教育硬件更适合做to b还是to c?
姜洪兵:我感觉各有所长,我们之前也探索过to c,比如从平板上面来拖拽做实验,不能还原真实的操作动作,因为光做实验的话,一个平板可以融合语文,数学,科学,美术,音乐都可以加进去,但我只有实验,内容上是不够健全的。所以说我们选择了to b这一块的业务,虽然这两年经济下行,但是我们国家对于教育还是用了大量资金涌入到了教育信息化。
硅星人:做AI教育方向的参赛选手也挺多的,政府侧需要的产品是要满足什么样的标准?
姜洪兵:首先是实验流程的标准,实验考试流程是恒定的,但是通过AI去提前干预去评测,提高评测效率、提高评测精准度;我们的标准只是教研课件的标准,是否符合教学大纲、是否符合教学需要。我们想在未来的实验操作考试当中,利用虚拟现实的方式来进行考试,就和现在的体育考试一样,之前是老师做考评,现在可能通过一些智慧体育体测的设备来进行干预。另外一个重要的就是人工智能实验的标准,这个是我们需要跟权威机构做一些行业标准的共建,实现虚拟实验考试大平台,是现在最要紧的事情。
文章来自于微信公众号 “硅星人Pro”,作者“summer”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales