还记得那个火爆全球的 AI Vtuber neuro-sama 吗?一个能实时和观众互动的 AI 虚拟主播。
现在有人把它开源复刻了,而且所有功能都能在你自己的电脑上完全离线运行。

Open-LLM-VTuber 是一个开源的 AI 语音交互伴侣,目前 GitHub 上已有 1.1 万 Star。
它把三件事合在了一起:
1. 大语言模型 —— 负责思考和对话
2. 语音识别 + 语音合成 —— 负责听和说
3. Live2D 虚拟形象 —— 负责视觉呈现
最终效果:你对着一个可爱的二次元角色说话,它会实时回复你,有表情、有动作,甚至你可以直接打断它——就像和真人对话一样自然。

所有组件都可以本地运行:
•LLM:Ollama 本地模型
•语音识别:sherpa-onnx / FunASR / Whisper
•语音合成:MeloTTS / GPTSoVITS / CosyVoice
不需要联网,不需要调 API,你的对话数据完全留在本地。
•Windows ✅
•macOS ✅(部分组件支持 GPU 加速)
•Linux ✅
硬件方面,支持 NVIDIA GPU、非 NVIDIA GPU、纯 CPU 运行,或者直接调用云端 API。

提供两种使用方式:
•网页版:浏览器直接打开,简单方便
•桌面端:支持窗口模式和桌宠模式(透明背景、全局置顶、鼠标穿透)
桌宠模式下,AI 角色就像一个小精灵一样浮在你的桌面上,随时可以聊几句。
这是 Open-LLM-VTuber 最让人惊艳的部分:

模型支持非常丰富
Ollama、OpenAI(及兼容 API)、Gemini、Claude、Mistral、DeepSeek、vLLM……
基本上主流的大模型都支持。
sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp、Groq Whisper、Azure ASR……
sherpa-onnx、MeloTTS、GPTSoVITS、CosyVoice、Edge TTS、Fish Audio、Azure TTS……
所有模块都可以通过 `conf.yaml` 配置文件无缝切换,不需要改代码。

•自定义 Live2D 模型:导入你喜欢的角色
•自定义 Prompt:设定 AI 的性格和行为方式
•声音克隆:通过 GPTSoVITS 实现声音克隆
•自定义 Agent:支持集成 HumeAI EVI、Mem0 等自定义 Agent 架构

项目提供了详细的部署文档。基本流程:
1. 安装 `uv` 包管理器
2. 克隆项目并安装依赖
3. 编辑 `conf.yaml` 选择你要使用的模型
4. 启动服务,打开浏览器即可交互
v1.0.0 版本之后,更新也很方便:
uv run update.py

Open-LLM-VTuber 的意义不只是复刻了 neuro-sama。它展示了一个趋势:
AI 伴侣正在从云端走向本地。
当所有组件都能离线运行时,AI 伴侣才真正属于你。不用担心隐私泄露,不用担心服务关闭,不用担心 API 涨价。
结合 Live2D 的视觉呈现和实时语音交互,这种体验已经非常接近「和一个虚拟角色真实对话」的感觉了。
对于想做 AI Vtuber、AI 助手、虚拟客服的开发者来说,这个项目是一个非常完整的参考实现。

项目地址: https://github.com/Open-LLM-VTuber/Open-LLM-VTuber
官方网站: https://open-llm-vtuber.github.io/
许可证: 自定义开源许可
Star 数: 11,000+
文章来自于"留仙一码农",作者 "留仙一码农"。
【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。
项目地址:https://github.com/babysor/MockingBird
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales