文档秒变演讲视频还带配音!开源Agent商业报告/学术论文接近人类水平
文档秒变演讲视频还带配音!开源Agent商业报告/学术论文接近人类水平现在的AI Agent在文档生成PPT或视频方面,要想像人一样,把文字、图片、讲解、音视频全都串起来讲清楚,还真不太行。
现在的AI Agent在文档生成PPT或视频方面,要想像人一样,把文字、图片、讲解、音视频全都串起来讲清楚,还真不太行。
普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。
,MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者,共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents:
当大模型改变人类信息交互方式、算力成本不断降低,一个关键问题浮现在每一位企业决策者面前:如何让AI真正成为企业的“智慧大脑”,驱动业务决策全面升级?
近期,大模型智能体(Agent)的相关话题爆火 —— 不论是 Anthropic 抢先 MCP 范式的快速普及,还是 OpenAI 推出的 Agents SDK 以及谷歌最新发布的 A2A 协议,都预示了 AI Agent 的巨大潜力。
为了让用户获得沉浸体验Parallel Live的直播间搭建几乎和Instagram别无二致,评论、表情、打赏等基础的互动功能也同样在应用中有所体现。这样逼真的虚拟空间就为吸引主播进入打下了一定的基础。
DeepWisdom完成亿元级融资,旗下智能体产品mgx.dev以零推广首月狂揽百万美元ARR,连续四周霸榜Product Hunt全球榜首。它让普通人也能一句话做出自己的APP。
大语言模型(LLM)近年来凭借训练时扩展(train-time scaling)取得了显著性能提升。然而,随着模型规模和数据量的瓶颈显现,测试时扩展(test-time scaling)成为进一步释放潜力的新方向。
2024 年,AI 音乐生成产品 Suno 的成绩很亮眼。
pentagramdesign (五角设计公司)是全球知名的创意设计公司,最近该公司使用 AI工具Midjourney ,创作了1000个图标,引发了外网设计师群体的吐槽。