登上NeurIPS,Genesis开创无需OCC引导的多模态生成新范式,在视频与激光雷达指标上达到SOTA水平
登上NeurIPS,Genesis开创无需OCC引导的多模态生成新范式,在视频与激光雷达指标上达到SOTA水平由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局(包括车道线和 3D 框),就可以生成逼真的图像和点云视频。
由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局(包括车道线和 3D 框),就可以生成逼真的图像和点云视频。
2025 年,生成式推荐(Generative Recommender,GR)的发展如火如荼,其背后主要的驱动力源自大语言模型(LLM)那诱人的 scaling law 和通用建模能力(general-purpose modeling),将这种能力迁移至搜推广工业级系统大概是这两年每一个从业者孜孜不倦的追求。
嗨大家好!我是阿真! 今天尝试最近很火的国内首个音乐创作智能体Tunee,通过对话就能创作音乐,我愿称之为更适合中国宝宝体质的音乐Agent。
Louis Amira,Stripe 前加密货币与 AI 合作伙伴关系负责人,和 David Noël-Romas,Stripe 前加密货币工程负责人,刚刚为他们的新创公司 Circuit & Chisel 筹集了 1920 万美元。他们的第一个产品是 ATXP 协议,Louis 将其描述为"AI agent 支付领域的 HTTP"。
超越DeepMind的Langfun、抱抱脸的Smolagent等,国产智能体位列全球智能体第一梯队!GitHub明星开源项目、行业首个100%开源的企业级智能体JoyAgent,迎来重要更新——
Kimi发布全新Agent模型OK Computer !这个新Agent名字好像还有点儿来头啊……别的先不说,OK Computer到底OK不OK?实测一下!
Agent元年赛程过半,最“难啃”的企业级Agent,怎么样了?表层现象是,想推动企业从“被动接受”到“主动拥抱”Agent,比想象中的难。“无论是过去的SaaS还是今天的Agent,企业在考虑引入与付费的时候遵循的原则其实都是一样的,ToB Agent要深度嵌入企业的决策与运营流程,不能因为技术门槛低就开始盲目尝试。”
Lessie 的定位简单直接:People Search AI Agent。一句话描述它的能力:帮你从互联网与数据库里快速找到任何人,并自动化完成初步联络。创始人、投资人、KOL、潜在客户、行业专家、合作伙伴……只要你能用自然语言描述需求,Lessie 就能迅速在全球范围内挖掘到合适的人选。
你有没有想过,AI助手的终极形态应该是什么样的?是更聪明的聊天机器人,还是能真正帮你完成复杂工作的数字员工?今天,当我体验了Kimi刚刚发布的"OK Computer" Agent模式后,我突然意识到:AI行业可能正在经历一次根本性的范式转变——从"回答问题"到"完成任务"。
刚刚,Meta又从OpenAI挖来一员猛将——宋飏,扩散模型领域的核心人物,DALL·E 2技术路径的早期奠基者。他已正式加入Meta Superintelligence Labs,担任研究负责人,直接向他的师兄赵晟佳汇报。