小小具身智能成果,高中生在腾讯拿下!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
小小具身智能成果,高中生在腾讯拿下!
6422点击    2025-08-21 12:06

注意看,这个人形机器人在室内四处搜寻。


只因刚刚听到人类指令:请你走到足球的位置。


小小具身智能成果,高中生在腾讯拿下!


结果它一边自言自语,一边脚也不闲着在屋子里各种寻找,最后成功完成了任务。


这是几个十几岁的顶尖高中生,在短短五天时间里实现具身智能成果。未来一个可行的方向是机器人送外卖,解决最后10米的问题。


腾讯首席科学家张正友看了都点赞!


小小具身智能成果,高中生在腾讯拿下!


以上正是腾讯2025星火挑战周的众多成果之一。来自各地的八十余位高中生汇聚于此挑战前沿难题。


在这里,你可以看到他们四天半时间就做出来的长篇小说二次创作Agent。


以及利用长思维链技术来提升大模型的数学推理能力。


小小具身智能成果,高中生在腾讯拿下!


基于多模态感知打造的盲人AI辅助系统。


小小具身智能成果,高中生在腾讯拿下!


全面参与量子计算算法设计到编程实现的全过程。


小小具身智能成果,高中生在腾讯拿下!


2025星火挑战周


相信你也注意到了,今年的星火挑战营的产业课题全都聚焦在最前沿——


在原有量子科技、安全攻防的两大方向外,还特意新增了超长文本理解、长思维链技术、多模态感知理解、具身智能与机器人。


比如像最近异常火爆的「具身智能+机器人」


项目任务是让机器人在陌生且封闭的环境中,根据用户的指令不断探索、优化路线,寻找未探索的位置,并最终找到目标。


小小具身智能成果,高中生在腾讯拿下!


这过程中的挑战在于从虚拟环境到真机测试的适配问题,像坐标系的转换就耗费了大量时间。


小小具身智能成果,高中生在腾讯拿下!


接下来,他们计划进一步微调LLM、增加人脸识别系统、优化导航等方向进行改进。这个项目的潜在应用是解决办公室外卖“最后十米”的问题,还有像高档酒店的室内服务。


小小具身智能成果,高中生在腾讯拿下!


张正友在现场表示,在短时间内完成这些功能实现非常不容易,同时也强调了硬件问题是具身智能领域需要深入探索的关键。


再来看看长文本理解这个方向,他们打造了一个长篇小说二次创作Agent。它可以实现风格迁移、创作序章,还有评价润色等功能,整个UI界面还能动态显示思考过程,这样使用起来还能理解AI的创作思路。


他们搭建了从基于Graph的书籍知识建模,到智能创作Agent的完整工作流程。通过Graph灵活的表征能力,高效压缩并组织书籍中的核心知识,并利用模型的Function Call功能,实现Agent与书籍知识图谱的智能交互。


而在多模态感知理解方向,他们搭建了一个由优图实验室提供的VITA多模态模型与混元串联的盲人AI辅助系统,通过图像、语音、文字等多模态输入信息实现对盲人运动避障、盲人抓取物品的辅助。


小小具身智能成果,高中生在腾讯拿下!


整个系统包括实时距离模块、语音交互模块、抓取辅助模块等,可以在复杂的办公环境中,帮助有视觉障碍的用户避开椅子、包等障碍物,拿到目标物体。


再来看像长思维链技术,他们深度探索了过程监督和结果监督两种优化方式。在1.5B的模型上,结合Math-Shepherd数据集设计并实现了一套高效的训练流程。利用LLaMA-Factory等工具,成功对模型进行了监督微调,分别训练出具有结果监督和过程监督能力的奖励模型。


小小具身智能成果,高中生在腾讯拿下!


通过ORM对大量候选解答进行质量评估与排序,并设计了增强方案有效筛选出最优解答。这一方法在GSM8K数学推理基准测试上取得了显著成效,超过原论文方法,实现了86%的准确率。


而在安全攻防方向,他们打造了自动化攻击智能体。从一开始的信息收集、找漏洞、植入木马到扫描网站后台,AI完成对目标网站大部分主机的渗透任务,不仅大幅提升攻击效率,还显著降低人力消耗。


量子科技方向,腾讯量子实验室的专家导师们基于腾讯自研量子计算软件系统设计,设计了总分总的课题结构,分为“量子算法题目”、“分赛道挑战题目”和“多赛道集成题目”三个阶段。


68名同学获清北offer


今年的星火挑战周共有82名同学入选,其中68名同学获得了清北offer。


除此之外,奥赛的人才密度也拉满:IOI国际信息学奥赛国家队全员4人,NOI金牌有33人,数学奥赛集训队及金牌10人、物理奥赛集训队及金牌13人。


小小具身智能成果,高中生在腾讯拿下!


六大课题方向负责人/专家导师代表:腾讯首席科学家/Robotics X实验室主任张正友、腾讯玄武实验室负责人/杰出科学家于旸、杰出科学家胡瀚、腾讯混元T1推理模型负责人周波、优图实验室盘古研究中心技术负责人丁守鸿、微信读书产品部技术负责人许阳寅、腾讯量子实验室专家郑一聪等都来到现场。


小小具身智能成果,高中生在腾讯拿下!


后续这些星火少年们将有机会参与到不同实验室、不同业务领域的行业赛事、项目实战等定制培养中,实现对课题的深度突破。


整个星火挑战周是“星火挑战营”的一环。后者是由腾讯青少年学堂发起,专为对计算机领域怀有浓厚兴趣和卓越天赋的青少年打造,项目聚焦腾讯前沿研究课题与业务挑战。


今年,是腾讯做这件事的第六年。当初从这里走出去的同学,已经成为技术创新发展的中坚力量,不断产出优秀的成果。


这次就有来到现场的师兄们,来分享他们最新的所做所见及所得——


比如目前在腾讯混元T1实习的许庭强,他是IOI2023世界冠军,目前是清华叉院的学生,现场他分享了投身产业界大模型训练的感受;还有获得第64界IMO金牌的姜志城,现在他在MIT读书,他从学术圈的角度出发,探讨了「怎么去做好科研」的洞见,比如写论文除了考虑novelty、impact,还有correctness;以及正在创业的李文轩,如何用Agent撬动起个性化教育的杠杆……


可以看到,许多具有天赋的少年,在星火计划中找到了学术的启迪和职业的方向。


当然,星星之火还在继续,未来会有更多星火少年从这里出发,用智慧与创新燎原行业的未来。


文章来自于微信公众号“量子位”,作者是“白交”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner