1.5B推理模型新SOTA,RL训练新解法打破「简单题过拟合、难题学不动」的魔咒
1.5B推理模型新SOTA,RL训练新解法打破「简单题过拟合、难题学不动」的魔咒QuestA(问题增强)引入了一种方法,用于提升强化学习中的推理能力。通过在训练过程中注入部分解题提示,QuestA 实现两项重大成果
QuestA(问题增强)引入了一种方法,用于提升强化学习中的推理能力。通过在训练过程中注入部分解题提示,QuestA 实现两项重大成果
Sora2太卷了。居然能预测ChatGPT的输出、渲染HTML?!让它模拟“给ChatGPT发信息”,它不仅生成了画面,还来了一段有问有答的“交互”。先是编了一个问题:Write a playful haiku about a cat staring out the window.(写一首关于猫凝视窗外的俏皮俳句。)
新官上任三把火,自从 OpenAI 应用部门 CEO Fidji Simo 上岗之后,动作也是接连不断。 之前就有消息传出, Fidji Simo 正在组建新团队,准备给 ChatGPT 引入广告业务,新团队负责人更是要全面操盘 OpenAI 的盈利大计,广告也好订阅也罢,反正就是要把钱赚到位。
最近,千寻智能的研究人员注意到,基于模仿学习的视觉运动策略中也存在类似现象,并在论文《Do You Need Proprioceptive States in Visuomotor Policies?》中对此进行了深入探讨。
最近,微软宣布了一项新功能的公开预览。该功能使 Azure Logic Apps(标准版)能够充当 MCP 服务器,为开发者提供了一种灵活的方式来构建和管理代理。在 Azure Logic Apps 中,用户可以重新配置 Standard Logic App 使其充当远程模型上下文协议(MCP)服务器,快速启动这些工具的构建工作。
超越DeepMind的Langfun、抱抱脸的Smolagent等,国产智能体位列全球智能体第一梯队!GitHub明星开源项目、行业首个100%开源的企业级智能体JoyAgent,迎来重要更新——
Plaud 没那么需要融资,它是全世界最成功的 AI 硬件 Startup。约 150 美金的录音卡片,卖给了全球超过 100 万人,引来大厂效仿,甚至还有美国团队跑来中国找供应商。你不好奇吗?为什么?
就在上周的 Meta Connect 开发者大会上,Meta 发布了三款全新智能眼镜,但本该展示“未来体验”的现场演示却屡屡翻车。Bosworth 随后在 Instagram 上火速澄清,否认了小扎的说法。他坦言,这不是 Wi-Fi 的问题,也不是场地的原因,而是 Meta 自己的设置和失误。
谷歌云刚发布了一篇《Google Cloud Startup technical guide: Al agents》(Google Cloud 创业公司技术指南:AI 代理)这是一份非常详尽和全面的手册,这篇文档要解决的问题:原型到生产之间最大鸿沟,Agent的非确定性、复杂推理轨迹如何验证、如何部署与运维等。初创公司业务负责人或开发者看完后能获得一个系统性的、
今天给大家分享一个关于全自动构建n8n工作流的方案。下面这个相对复杂的每日新闻n8n工作流,就是AI花了几分钟,我完全没怎么动脑,AI全自动帮我生成的。这个方案的核心是一个目前只有7K Star的开源项目:n8n-mcp