
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoToolsOctoTools通过标准化工具卡和规划器,帮助LLMs高效完成复杂任务,无需额外训练。在16个任务中表现优异,比其他方法平均准确率高出9.3%,尤其在多步推理和工具使用方面优势明显。
OctoTools通过标准化工具卡和规划器,帮助LLMs高效完成复杂任务,无需额外训练。在16个任务中表现优异,比其他方法平均准确率高出9.3%,尤其在多步推理和工具使用方面优势明显。
根据英伟达发给股东的最新消息,英伟达已就收购 OctoAI 展开了深入谈判。根据 OctoAI 发给股东的一份文件,英伟达提议以约 1.65 亿美元收购该公司,这还不包括该公司的债务和其他费用。
在多样化的机器人数据集上预训练的大型策略有潜力改变机器人学习:与从头开始训练新策略相比,这种通用型机器人策略可以通过少量的领域内数据进行微调,同时具备广泛的泛化能力。
英伟达拟以1.65亿美元收购AI公司OctoAI。
根据英伟达发给股东的最新消息,英伟达已就收购 OctoAI 展开了深入谈判。根据 OctoAI 发给股东的一份文件,英伟达提议以约 1.65 亿美元收购该公司,这还不包括该公司的债务和其他费用。
比OpenAI最强的GPT-4o更快,函数调用能力与GPT-4相当,同时比它小N倍,且只需要一张卡来做推理。
“AI 监工”来了
一位优秀的相声演员需要吹拉弹唱样样在行,类似地,一个优秀的机器人模型也应能适应多样化的机器人形态和不同的任务,但目前大多数机器人模型都只能控制一种形态的机器人执行一类任务。现在 Octo(八爪鱼)来了!这个基于 Transformer 的模型堪称当前最强大的开源机器人学习系统,无需额外训练就能完成多样化的机器人操控任务并能在一定程度适应新机器人形态和新任务,就像肢体灵活的八爪鱼。
全球首个超小型多模态AI Agent模型Octopus V3,来自斯坦福大学的NEXA AI团队,让Agent更加智能、快速、能耗及成本降低。
多模态 AI 系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型 (如 GPT-4V) 的研究取得了重要进展,但如何有效地将图像信息转化为 AI 系统的可执行动作仍面临挑战。