让大模型操纵无人机,北航团队提出具身智能新架构
让大模型操纵无人机,北航团队提出具身智能新架构进入多模态时代,大模型也会操纵无人机了!只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。
进入多模态时代,大模型也会操纵无人机了!只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。
今天,李飞飞携斯坦福联袂谷歌,用Transformer生成了逼真视频,效果媲美Gen-2比肩Pika。2023年俨然已成AI视频元年!
AI最近有点被妖魔化了,很像一个老虎在还没有橘猫大的时候,就已经被天天当成虎力大仙来讨论。这种普遍的高预期其实是有害的,尤其是当事情本身还需要耐心细致深耕且长跑的时候。资本、品牌可以匹配高预期所对应的增长倍数,业务则不行,业务先天挤出一切泡沫。
Pika 1.0首测开启了!网友抢先体验,每个视频都是经典。Pika 1.0正式上线后,拿到内测资格的网友们已经玩疯了!
虽然GPTs推出后暴露了很多问题,时不时就会有安全组织现身说法,却无法阻挡人们创建专属CahtGPT的热情。
继谷歌DeepMind AI工具成功预测出220万种晶体结构后,微软团队最新扩散模型MatterGen,能设计生成新颖、稳定的材料,刷新SOTA。
哥伦比亚大学计算机科学教授Jeff Clune则在Agent身上看到巨大商机:“可能价值数万亿美元。”而进一步,英伟达高级研究员Jim Fan预言,Agent将“推动整个文明的进化”。
后期狂喜了家人们~现在,只需一张图片就能替换视频主角,效果还是如此的丝滑!且看这个叫做“VideoSwap”的新视频编辑模型——
日前,由美国罗格斯大学和密西根大学研究团队提出的 AI Agent——WarAgent 便成功模拟了包括第一次世界大战、第二次世界大战和中国古代战国时期战争在内的历史重大国际冲突。
今年 4 月 7 日,斯坦福大学发表的《Generative Agents: Interactive Simulacra of Human Behavior》论文出来之后的几天内,其中提到了一个很有趣的细节是信息的传递:一个 agent 想要举办情人节派对的消息会在小镇中逐渐扩散开来。