下一代Windows系统曝光:基于GPT-4V,Agent跨应用调度,代号UFO
下一代Windows系统曝光:基于GPT-4V,Agent跨应用调度,代号UFO微软首个为Windows而设的智能体(Agent) 亮相:基于GPT-4V,一句话就可以在多个应用中无缝切换,完成复杂任务。整个过程无需人为干预,其执行成功率和效率是GPT-4的两倍,GPT-3.5的四倍。
搜索
微软首个为Windows而设的智能体(Agent) 亮相:基于GPT-4V,一句话就可以在多个应用中无缝切换,完成复杂任务。整个过程无需人为干预,其执行成功率和效率是GPT-4的两倍,GPT-3.5的四倍。
就在十几个小时之前,OpenAI再一次放出大招,发布了一个有望改变世界的产品,那就是文字生成视频的Sora模型。
近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3
英伟达发布了一个对话机器人 ——「Chat with RTX」,面向 GeForce RTX 30 系列和 40 系列显卡用户(至少有 8GB VRAM)。有人开玩笑说,Sam Altman 进军芯片领域,黄仁勋进入聊天机器人的领域,这是 Sam vs Jensen 的时代。
该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。
互联网有一条经典的“第 34 号规则”(Rule 34):如果一个东西存在,那么它必然会被用来搞黄色。AI 绘画就很好地说明了这一点——目前最流行的几个 AI 绘画分享网站,都有至少三分之一的内容是各种黄图。
抱着年终总结,也是对过去一年回顾与展望的态度,来自 Ahead AI 的 Sebastian Raschka 博士为我们带来了 2023 年最值得大家关注,也是最有影响力的十篇 AI 论文,这里我们就和大家一起,用这十篇工作再次为 2023 年写下一段注脚
昨日晚间,OPPO举行了OPPO AI时代发布会,发布会全程仅30秒,号称“OPPO史上最短发布会”。OPPO正式进入AI手机时代,并向超千万用户推送一版新软件,里面包含上百项AI功能。
2023年,也是AI视频元年。过去一年究竟有哪些爆款应用诞生,未来视频生成领域面临的难题还有哪些?
单图 3D 说话人视频合成 (One-shot 3D Talking Face Generation) 可以被视作解决这一难题的下一代虚拟人技术。它旨在从单张图片中重建出目标人的三维化身 (3D Avatar)