
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。
OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。
“Agent元年”进程过半,Agent虽已从处理简单任务转向复杂交付,却仍卡在“信息断层”的关键瓶颈—— 受限于训练数据截止日期,难以及时获取实时动态信息,企业级场景落地始终差临门一脚。
杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。
大家好,我是袋鼠帝 最近发现滴滴出手了!入局打车MCP 我还挺感兴趣的 于是找朋友帮忙开了白名单拿到了一个内测apikey https://mcp.didichuxing.com/
强化学习+任意一张牌,往往就是王炸。专注于LLM+RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。
小智AI硬件很火,但服务端不开源大家都玩不了。
知名全栈开发者和 AI 工具重度使用者 Ras Mic 在最新一期播客中,对市面上的十类热门的 AI 工具进行了深入剖析。从 n8n、Lindy、Claude Code、Devin、Code Rabbit,到 Bolt、Lovable、VAPI、MCP,再到 Vibe Coding 工具的应用,他详细讲解了这些工具的真实用途、适用人群、可达成的效果,以及隐藏的门槛和误区。
7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。
3月份,我在线下分享过办公软件的一个大趋势——未来,每个人的应用使用界面将只保留一个或极少数几个。现在,如果企业同时运行着20个软件,需要分别登录这20个应用进行相应的任务操作。而AI正在让使用界面和操作界面实现分离。以后,用户只需停留在一个高频应用界面,就能让Agent在背后完成绝大部分跨应用操作,人类只需等待执行结果。
所有使用MCP协议的企业注意:你的数据库可能正在“裸奔”!