小智AI硬件很火,但服务端不开源大家都玩不了。
等小智自己开源是不可能的,但总会有人去做,因为说白了,没什么太大的门槛。
华南理工大学就直接把这套功能复刻并开源了。
该有的功能基本都有了,想做调整的话也可以根据自己需求去修改。
看下列表,就知道有多少功能了。
xiaozhi-esp32-server 是由华南理工大学刘思源教授团队研发的开源后端服务项目,基于人机共生智能理论,为 xiaozhi-esp32 开源智能硬件提供支持。它采用 Python、Java、Vue 实现,支持 MCP 接入点和声纹识别等功能,提供最简化和全模块两种部署方式,适配多种配置方案,可满足不同场景下智能终端的软硬件协同需求。
这里我只放一个常规功能的,功能太多,其他的你们可以到链接去看。
LLM 语言模型
VLLM 视觉模型
TTS 语音合成
VAD 语音活动检测
ASR 语音识别
Voiceprint 声纹识别
Memory 记忆存储
Intent 意图识别
https://github.com/xinnan-tech/xiaozhi-esp32-server
文章来自于“开源AI项目落地”,作者“开源AI”。
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales