Ellie是一条金毛犬,狗主人对着手机上一款APP应用发了一段语音:“HI Ellie,你能给我拿下遥控器吗?”
这款应用在一秒内把人类的语言翻译成狗语——一段悠长的狗叫声加上短促的吠声。
然后,金毛犬就自己到茶几上叼了遥控器过来!
这款AI应用叫Traini,是一款AI狗语翻译器,可以在你和狗狗之间,进行跨物种翻译:你能听懂你家狗什么时候是想要吃的、什么时候是分离焦虑,你家狗也能听懂你说的“给我拿遥控器”“爱我就抱抱我”。
Traini由中国连续创业者孙邻家在美国硅谷创办的宠物共情AI应用,在冷启动的情况下,已有20万iOS注册用户。今年5月,产品浏览量已经超百万次。
Traini于今年5月完成了千万元天使轮融资,由天际资本FutureX Capital、BlueSea Partners、Tao Foundation、Mint Capital和其他投资人共同投资,包括前Meta工程总监梁英毅、Caper AI(Instacart子公司)工程负责人Lily Zhang、ORH Partners合伙人贾佩琳、博主Janie探美国等。老股东Valkyrie Fund I LP、Fengmin Gong (Palo Alto Networks Cofounder)继续跟投。
Traini不仅能让用户听懂狗狗的叫声,还能看懂狗狗的面部表情、身体行为等语言,来了解狗狗的心理状况。
训练模型时,把不同品种、不同地区的狗狗的语音数据,以及狗狗的表情、行为的多模态数据,投喂给AI大模型。自此,大模型也能理解狗语了。
△狗狗行为信号分类,图片来源:Dog Trainer
人与狗跨物种翻译的场面,不是电影,也不是以往割韭菜的狗语识别app,而是有理有据的。
要让AI大模型学习理解狗狗的语言,首先要让宠物行为学专家来翻译狗狗的各种表情、行为、叫声的含义,建立语义系统。
然后,是用收集的狗狗的数据对模型进行训练。目前,Traini收集了来自世界各地的超过10万只狗的生活化的声音、表情图片,建立了多样化的宠物情感表达数据库。
孙邻家表示,其团队研发的神经网络Dr Traini已经将行为翻译准确率提高到了80%。
关于叫声翻译的模型训练,有多种不同的方式。一种是完全用狗狗的声音数据从头训练模型;另一种是在人类语音预训练模型的基础上,使用狗狗声音数据进行微调。
对于先用人类语音预训练、再用狗狗声音来微调的方式,孙邻家表示,目前用人的语音训练模型已经有成熟的公认的标准,那么可以尝试用狗的声音去做对标,比如狗发怒的声音,和人发怒的声音是相似的。
另外,由于不同品种的狗、不同国家地区的狗,其叫声也有差异。因此在训练模型上,Traini还会采用其他的方式,比如不同品种狗之间的叫声混合训练,不同国家地区的狗的声音训练。
△Traini根据狗狗的叫声诊断症状,图片来源:Trainiapp Youtube
除了能翻译狗狗的语言,Traini另一大功能是宠物医疗——根据宠物的行为来诊断宠物是否生病、生了什么病。
比如,当你在Traini的聊天对话框里输入一段悠有气无力的狗狗叫声。很快,Traini会回答你,这是因为狗狗感到无聊。
Traini还会分析狗狗的无聊症状背后的心理和医学因素:“这一般是因为狗狗长期处在缺乏刺激的环境下,它在寻求互动和活动。狗狗感到无聊时的叫声常常是重复的,显示狗狗缺乏身体运动或精神活动。”
Traini还会给出医疗建议:“要给狗狗规律的散步、玩耍时间,有互动的玩具……更综合的医疗建议请咨询兽医或宠物医学专家。”
如果狗狗出现分离焦虑,比如打工人长时间不在家,狗狗独自在家,情绪低迷,甚至有应激反应,这时Traini会识别诊断狗狗的症状,并给出送到寄养店的建议。
这时你会不会羡慕了,当打工人都无暇顾忌自己的心理健康时,Traini已经在关爱狗狗的心理健康了。
除此之外,Traini正如其名字(Train,训练)所示,能帮用户训练狗狗。
许多狗主人在训练狗时有误区,会有各种不科学的训练方式,比如恐吓、打骂。在不理解狗的意思的情况下,狗主人的训练方向可能南辕北辙。
对此,Traini会提供各种训练狗的课程,让用户如何科学地教会狗狗坐下、转圈、玩球、握手、甚至做瑜伽等等。
除了“狗语翻译”功能外,Traini还走线下服务的商业路线,将线上的宠物个性化理解与线下的宠物医疗、寄养店等服务打通。比如,用户在Traini上通过狗语翻译,了解到宠物发出不舒服的叫声是因为生病了,就可以在应用上一键下单,直达附近的宠物医疗机构。
从2023到2024,AI大模型从模型层卷到了应用层,在美国硅谷也是如此。“一年前我们看好AI应用并做应用,被笑成傻狗(一年前硅谷在卷大模型而不是应用),一年的时间过后,做应用成了共识。”Traini创始人孙邻家说。
Traini并不是专门为了AI而做的应用,而是为了宠物市场而生。在ChatGPT横空出世之前,孙邻家在2022年7月就注册了Traini,瞄准了宠物赛道。
他认为,要先找到应用场景,再根据场景用技术,而不是拿着锤子找钉子。“不管在任何时代、任何风口期下,技术上的领先优势只属于少部分公司,比如OpenAI、Google,不是普世地对所有创业者都适用。每个创业者还是要从自己擅长的事情出发,在应用层里找场景。”
孙邻家在中美两地的创业经历积累了找应用场景的嗅觉。他曾在中国创立零食品牌“邻家铺子”和美容O2O(Online to Offline)平台,在生活服务数字化平台建设方面有12年的创业经验。到美国后,他曾在美国的华人外卖平台GESOO担任CEO,在美国亚洲餐外卖平台Chowbus担任西海岸负责人,其中Chowbus累计获得超过1亿美元融资。
孙邻家对《智能涌现》表示,最开始是在做外卖平台时,发现宠物市场的商机。
2018、2019年左右,孙邻家在美国的华人外卖平台Gesoo任职时,发现外卖平台上经常有女生用户点外卖送狗粮给自家狗狗。在当时Gesoo一天几百单的情况下,点狗粮配送的用户能达到一个月几百单。
而且当时美国已经出现宠物鲜粮品牌Just Food For Dog,主打让狗吃上新鲜现做的狗粮,即时配送,送到用户家里,客单价很高。这就像人类点外卖,只不过服务对象是狗而不是人。
在美国,狗在家里的地位真的和家庭成员一样,家里母亲怀孕了也不会送走狗,狗得癌症了也有很多主人愿意花几万美元给狗治疗。
根据2022年的数据统计,全球有超过2600亿美元的宠物消费,并且以每年18%的速度持续增长。而美国占据了全球一半以上的市场份额,超过1600亿美元。
只是在疫情期间,有经济不稳定因素,直到2022年7月孙邻家才真正下场创立Traini。
孙邻家认为美国的宠物市场很大,但是数字化程度不高。他最开始想做宠物方面的社区应用,中途ChatGPT在2022年11月横空出世,他于是想借助大模型的技术,来做宠物行为翻译,这一块当时在市场上还是空白。
目前,Traini已有自研的宠物行为翻译专用的小模型,保证宠物行为数据掌握在自家公司手中。
公司团队也在逐步扩大。联合创始人Jason曾是湖南省奥数青训队成员,后在美国东北大学大学攻读计算机研究生,曾在OpenAI和百度美国工作。增长顾问Yiyi,则有超过10年产品推荐和数据增长的经验,在布朗大学获得PhD学位,曾是CVS和Chewy数据增长负责人。
△Traini APP能与线下宠物服务结合。图片来源:Traini
在营收模式上,目前Traini在To B和To C上都有计划。To B方面,Traini向宠物诊所和宠物硬件公司提供API,让宠物医生利用Traini更好理解宠物行为、实现辅助医疗,让宠物硬件能与宠物进行交互。目前,Traini已与追觅科技等多家硬件公司建立合作。
To C方面,Traini提供的宠物训练课程,用户可以付费购买。目前 Traini 设置了 2 个订阅套餐,分别是 12.99 美金/月和 99-129 美金/月。相比于美国一节课 300 美金的线下宠物培训费用,孙邻家认为Traini应用的课程价格会有竞争力。另外Traini未来会设置广告来营收,但目前为了用户体验没有加广告。
在营收策略上,短时间内通过To C服务变现不是孙邻家的主要目标,他更倾向于给企业提供API接口来营收。
从长期看,孙邻家认为AI to Offline(从AI打通线下服务)是AI应用的机会所在,当AI融入线下生活才能改变人们的生活方式,因此Traini不仅仅是线上翻译宠物语言,还会帮助用户在APP上完成各种任务,如搜索信息、产品下单、预约医生、买药等。
线上文档办公工具之类的AI应用,主要是提供信息information,相比之下,线下服务能提供有效的解决方案solution。“狗狗毕竟是一个真实的宠物,当宠物真的出问题时,我需要给它买药、买吃的、买衣服,我们根据用户的描述,对宠物的行为进行个性化的理解,再匹配这些线下的解决方案。”
AI to Offline在业务模式上,与移动互联网时代的OTO(Online to Offline)是相通的,目前做宠物AI的线下服务跟之前的外卖配送创业很像。“外卖无非就是我们去找餐厅,把餐厅签到这个线上平台上来。而现在我们是用AI来匹配(狗狗的需求与宠物线下服务),更精准高效。”孙邻家表示。
天际资本创始合伙人张倩表示:“在人工智能技术飞速发展的今天,我们特别看好那些能够深耕垂直领域、积累丰富数据和专业知识的创新企业。Traini正是这样一个典范,它将AI技术巧妙地融入宠物经济这一垂直领域,不仅突破了传统宠物行为训练的局限,更借助数据的力量,拓展至宠物健康领域。
我们一直认为情绪价值是大模型应用的重要方向,也是当今社会、家庭乃至个体的深切需求。Traini正是通过其AI技术,不仅为宠物主提供了更加个性化、高效的服务,更在情感层面上加深了宠物与宠物主之间的纽带,让宠物主深切感受到科技带来的温情与关怀。”
在AI卷应用的拥挤赛场上,在办公工具、agent、社交陪伴之外,AI to Offline或许是一条能真正改变人们日常生活方式的新赛道,但未来的效果还需要市场验证。
文章来源于“未来一氪”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner