专访丨华人本科生打造学习 Agent,获真格 100 万美元投资
专访丨华人本科生打造学习 Agent,获真格 100 万美元投资这是一款由在校生团队打造的通用学习智能体:可以深度解题、拆开讲清抽象概念,又能从上百页课件、文献里提炼出 cheatsheet、闪卡和练习题,还会记住每个用户的学习方式,像一个长期陪伴在身边的私人老师。
来自主题: AI资讯
9148 点击 2025-11-20 10:55
这是一款由在校生团队打造的通用学习智能体:可以深度解题、拆开讲清抽象概念,又能从上百页课件、文献里提炼出 cheatsheet、闪卡和练习题,还会记住每个用户的学习方式,像一个长期陪伴在身边的私人老师。
DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中,DIAMOND的平均得分超越了人类玩家,证明了其在模拟复杂环境中处理细节和进行决策的能力。
打造终身学习智能体,是研究界以来一直追求的目标。最近,帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体(DAAG),利用LLM+VLM+DM三大模型,让AI完成迁移学习、高效探索。
在图像生成领域占据主导地位的扩散模型,开始挑战强化学习智能体。