已获谷歌云25万美元融资
这是许多平凡家庭常有的情形:疲于工作的父母们往往无法随时随地地陪伴孩子,孩子往往满腹疑问,问出天马行空的问题,但父母也无法满足他们旺盛的好奇心。
幸而,在AI技术进步的时代,我们有了更多选择。
事实上,目前市场上已经涌现出多款AI创新产品,试图满足孩子们的教育和情感需求:
在海外,OpenAI投资的Heeyo能实时生成互动教育游戏,激发儿童想象力;国内则有如跃然科技这样的企业研发出BubblePal,让毛绒玩具“开口说话”,成为孩子的AI密友……
不同于上述产品的设计思路,近期上线的一款“AI原生”教育产品——敲敲门童话(Knock AI),或许能让被孩子们追问个不停的宝爸宝妈们松口气。
来源:敲敲门AI
相比套路固定而又有限的游戏,敲敲门童话主打完全开放的路线,把讲故事的主导权交给孩子们自己——
在敲敲门,小朋友们可以当上小小故事导演,尽情用他们天马行空的想象力指挥AI,创作专属于自己的绘本故事。而且,只要小朋友们追问,AI就能不断续写,让故事永不落幕,满足他们永不停歇的好奇心。
“我们希望敲敲门是一个故事发生器(StoryOS),产生文字和内容,让孩子自己guide(引导)自己。”敲敲门的创始人Tony Lai说。
敲敲门童话的创始人是一对华人高中生兄弟Chris和Tony。他们发起这个项目的初衷,源于Chris和Tony在学校附近参与的一个教育公益项目。
他们发现,许多贫困家庭的孩子,之所以在街上游荡、游手好闲,其实最根源的原因是没有好的教育资源。
“这个项目的核心理念不是为了教育收费。我们希望教育能做到最大的公平性,让孩子能自己选择接受什么样的教育的机会。在父母可能有限的陪伴里,主导自己的人生。”Chris Lai说。
目前,敲敲门童话(Knock AI)已在微信小程序、App Store和Google Play上线,用户可免费使用。该应用在中国区累计读者已超过10万人次,注册活跃用户2-3千人。
这款App在美国市场的下载量也已破千次。在投资方面,该公司已获得300万元人民币融资,其中包括Google Cloud的25万美元投资。
敲敲门AI小程序分别为孩子和家长设置了两个入口,在选择身份后,便会进入不同的操作模式:
△敲敲门童话使用指南
宝妈宝爸们进入故事创作页面,可以根据孩子的年龄和阅读水平设置故事主题、风格、文本长度和配图张数等,在消耗一定量的免费积分后,等待1-3分钟,一个为宝贝量身定做的AI故事就新鲜出炉了。
除了文本故事和插图外,家长还可以选择同步生成一首儿歌,这首歌曲会根据故事的内容来编写歌词,只需点击播放按钮旁边的图标,就能查看专辑封面和歌词。
这里,智涌按照下图的设置,一次性生成了两个完成度都很高的创作——一个题为《小兔妞妞的魔法钥匙》的故事,还有一首名为《善良和友谊的力量》的儿歌。
△从左到右依次为创作设置页面,作品生成后的封面和查看页面。
对孩子们来说,和敲敲门的交互方式则更为简单。他们只需要按住麦克风按键,说出自己想听的故事,剩下的一切就交给AI来一次性处理:它会在非常短的时间内生成一段文本,并且立即配乐、配音、配图,直接播放出来。
△敲敲门AI录音
如果一时间没有灵感也没关系,家长和孩子们还可以在发现广场寻找自己感兴趣的内容来看。
在这里,用户可以浏览其他用户的创作,点赞、收藏,或在这些故事的基础上进行二次创作、续写或接龙,共同打造一个群体创造的故事宇宙。
此外,用户也能按照自己的想法搜索关键词、筛选作品。如果用户生成了满意的作品或儿歌,也可以发布到广场上,或在收藏集里查看。
△敲敲门的小程序版界面
此外,防沉迷的“标配”儿童模式也准备就位。家长可以设置好使用时间后,切换到儿童模式,放心把移动设备交给孩子。
△从儿童模式进入设置前的数学题,由中文大写数字写成。20以内的加减乘除随机出现,有一定概率出现负数
除了软件,敲敲门还配有相应的硬件产品,团队对不同的硬件设备做了适配。比如白天,孩子们可以在不伤眼的墨水书上使用AI绘本。
来源:敲敲门AI
而到了晚上,家长还可以用投影仪把故事投到天花板上,和孩子一起躺在床上舒舒服服地享受睡前时间。配合团队深度适配的StoryOS和正在制作中的硬件,投影的画面甚至可以扩散到整个房间,让孩子走入自己亲手打造的童话世界。
“和新硬件的配合不是简单地安装一个软件,而是推倒现有设备的设计,重新对AI做适配和调度,让孩子也能轻松使用,最终呈现出一种区别于投影仪或者电视机的新交互模式。”硬件设计师高若彤说。
来源:敲敲门AI
目前,敲敲门创作童话故事能完成一般用户的要求,生成速度也足够快。不过,尽管有“7-12岁”和“3000字”的文本长度可选,但现在生成的故事情节相对简单,与一般小学生阶段读物的水平仍有差距,也许更适合学龄前儿童阶段的需求。
相较于其他AI教育类、陪伴类产品,敲敲门这个讲述者的与众不同之处,首先在于它的“无形”。敲敲门的技术负责人左德伟向《智能涌现》解释道:“几乎所有人在成长过程中都有个想象中的朋友。关键不在于’朋友’,而在于’想象中’。”
他认为,不少基于大模型做AI应用给予这个想象中的朋友具体形象反而会限制孩子的想象力。“如果我真的给它赋予了一个声音、一个智能,它一下会变得很creepy(怪异)。”
相反,他们希望AI成为孩子创造力的“拐杖”,帮助孩子们把自己的想法一个个具象化,并以个性化数据的形式长久地保留下来,记录孩子们思维和创造力成长的过程。
再来,因为现有大模型基于概率预测而非实际理解的运作机制,“幻觉”(生成看似合理但实际上不准确或完全虚构的信息)的问题无法规避。
对这个问题,敲敲门通过关键词屏蔽等步骤,在确保内容对儿童健康无害的同时,让AI保持了最大程度的故事创作自由——比如人物从A地点到B地点,敲敲门只会让场景的切换、人物的行动方式符合现实世界的逻辑,而不会像游戏系统那样,受限于预设的场景和路径。
“游戏里的人物的路径是限定死的,场景切换要合理。在这个情况下,它不能通过 AI 去完成特别多的步骤,而必须要用人去控制 AI 的一些动作。但我们不用控制AI,AI完全可以发挥自己全部创造力的天赋,我们只要让他不去做什么就行了。”
最后,回到AI故事创作本身,普通人想让大语言模型像童话专家一样讲出有新意的故事,其实并不是件容易的事。
一方面,这是由于普通人的提示词编写能力不足,没法充分引导大模型。另一方面,则是因为普通大模型并没有接受足够优质的童话创作训练,导致输出内容符合预期的数量少,质量不高。
实际上,童话故事的创作难度本身就很高——一个优秀的儿童故事包含着复杂的结构,不仅要有逻辑,故事情节丰满,符合儿童的认知和理解水平,还要富于想象力和新鲜感,兼具深刻的内涵和可解读性,从而寓教于乐。
这也成了敲敲门团队研发过程中的一大难关。
面对让AI这个小美人鱼拥有“不灭的灵魂”的难题,敲敲门主创团队是这样解决的:
首先,让大预言模型接受多轮深度训练,训练的数据集则由进入公版领域的经典故事和主创团队们自己创作的儿童故事、绘本、插画等相关内容组成。模型由此便学习到很多儿童故事和插画的创作规律,形成了能够模仿人类创作者的人格系统。
之后,团队又设计优化了从用户提需到最终产出绘本的整个事件流:
在接到用户的语音或文字需求后,敲敲门内部的大语言模型会先根据输入的变量创建故事骨架,然后再以骨架为基础“长出肉来”。
接着,这些结果会经过深度训练的模型处理,进行风格调整和润色,最终形成用以转化为语音和配图的文本,为孩子们构建一个完整的多媒体绘本体验。团队负责人称,未来敲敲门还会推出视频功能,以便让孩子沉浸到绘本故事中去。
值得一提的是,敲敲门也已经上线实装了能让AI代替爸爸妈妈们给孩子讲故事的“声音定制”功能,支持几乎全部主流语言。
只需要家长一句话的语音,敲敲门就可以用他们的声色讲述孩子们创造的故事,在内测版本中甚至可以让父母分别为故事的旁白和角色独立配音。
这一功能将只会出现在讲故事的环节,而不会全方面覆盖App的语音互动场景,避免了AI用父母的口吻说出反常言语的“恐怖谷效应”。这样一来,AI创作的故事借父母之口娓娓道来,能再多些亲切感和“人味儿”。
接下来,敲敲门团队还会在软件和硬件层面对产品进行快速迭代。
在未来,敲敲门希望做到的是,让每一个小孩都能拥有自己个性化的回音盒,来记录下他们珍贵的基石记忆——童年里的每一个想象的朋友、每一段“中二”故事和每一只长大后可能会遗忘的彩色独角兽。
文章来源“王奕昕”,作者“王奕昕”
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0