ICLR 2024 | 单图三维重建数字虚拟人,浙大&字节提出Real3D-Portrait算法
ICLR 2024 | 单图三维重建数字虚拟人,浙大&字节提出Real3D-Portrait算法单图 3D 说话人视频合成 (One-shot 3D Talking Face Generation) 可以被视作解决这一难题的下一代虚拟人技术。它旨在从单张图片中重建出目标人的三维化身 (3D Avatar)
搜索
单图 3D 说话人视频合成 (One-shot 3D Talking Face Generation) 可以被视作解决这一难题的下一代虚拟人技术。它旨在从单张图片中重建出目标人的三维化身 (3D Avatar)
大型语言模型(LLM)的成功离不开「基于人类反馈的强化学习(RLHF)」。RLHF 可以大致可以分为两个阶段,首先,给定一对偏好和不偏好的行为,训练一个奖励模型,通过分类目标为前者分配更高的分数。
OpenAI 的 CEO 山姆・奥特曼(Sam Altman)引领了近期生成式 AI 的大发展。最近,他又有了一个宏伟目标:重塑全球半导体行业。
他说英语,她说西班牙语。在这对情侣被安排进行相亲之后,一款由人工智能驱动的配音应用帮助他们建立了联系。
普通人如果想用 AI 赚钱,春节是最好的时候。
ElevenLabs宣布B轮8000万刀融资,估值超过10亿美元,跻身独角兽行列。
今天介绍一篇密歇根州立大学 (Michigan State University) 和劳伦斯・利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的一篇关于零阶优化深度学习框架的文章 ,本文被 ICLR 2024 接收,代码已开源。
2023 年,大型语言模型(LLM)以其强大的生成、理解、推理等能力而持续受到高度关注。然而,训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的方法。
混合专家(MoE)架构已支持多模态大模型,开发者终于不用卷参数量了!北大联合中山大学、腾讯等机构推出的新模型MoE-LLaVA,登上了GitHub热榜。
ChatGPT变懒问题,再次引起众怒。AI与芯片行业分析师Dylan Patel引爆话题:最新版系统提示词添加太多垃圾,难怪与6个月前的表现没法比。
生成式AI的诞生,为芯片设计开启了另一条路。现在不论是英伟达等科技公司,还是学术界,都在试图研发出能够完全自主设计芯片的AI系统。
谷歌推出Gemini大规模商业化,将其聊天机器人Bard改名为Gemini,并推出Gemini的Android版App。谷歌还将Gemini的能力加入iOS的Google App中,并免费向公众开放。Gemini还可替代原来的Google Assistant成为手机的默认语言助手。
AI大模型并非越大越好?过去一个月,关于大模型变小的研究成为亮点,通过模型合并,采用MoE架构都能实现小模型高性能。
英国政府正式回应了去年的AI监管咨询。当时英国科学、创新和技术部 (DSIT) 发布《人工智能监管白皮书》,表示对AI倾向于宽松监管,并向公众征求意见。
作为人工智能领域划时代的技术革新,大模型卓越的生成能力和流畅的自然交互方式,正不断突破人机交互的想象边界,引领我们进入到一个全新的智能交互时代。
刚刚,Google推出计划,用户可以每月花 19.99 美金订阅 Google One AI Premium,使用支持 Gemini 的 Gmail、Docs,Sheets,Slides 和 Meet——也就是说,你可以在谷歌办公全家桶中畅享 Gemini 的 AI 功能了。
2024年,是大模型落地的关键一年,国内外的大厂都在动作频频。但要想打造出首个超级AI原生应用,还是要敢啃技术硬骨头,这已成业内共识。
谷歌&南加大推出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。
辛辛苦苦手写的论文,却被审稿人鉴定为“一眼ChatGPT”而被拒收。一位副教授的遭遇引发学术界关注,登上Nature专栏。她决定从此以后每篇论文都在GitHub上写,用变更记录来证明自己的清白。
最近,诺贝尔经济学奖得主Christopher Pissarides公开表态,传统意义上的「数理化」学科知识和技能,都将会被AI取代。而如果人类大部分的工作都消失了,将以什么样的方式生存?
国外网站AIPRM收集了100多项ChatGPT统计数据,考察了ChatGPT的增长、使用和公众意见等各项数据。上线一年多以后ChatGPT真的成茶叶蛋了吗?
抖音集团CEO官宣卸任,真是一石激起千层浪!一方面,虽然字节高层要调整早有传闻,但靴子落地依然让人意外:为什么会是她?
来自小鹏汽车最新的一项研究——Anything in Any Scene。主打一个往真实环境里毫无违和感地“塞”进去任何东西。
7B开源模型,数学能力超过了千亿规模的GPT-4!它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。
硕士学历黄仁勋,刚刚当选美国工程院院士。以后他还是教主、老黄、“核武狂魔”,但也得尊尊敬敬地被叫一声“黄院士”了。
当前有不少的大语言模型已经拥有了高准确度的天气预测能力。相比传统的天气预测技术,这些被称为大型 AI 气象预测模型(Large AI Weather forecast Model,LWMs)在极端天气预测方面有着更好的效果。
在上海人工智能实验室上周刚刚公布的测评榜单上,GPT-4依旧独领风骚,排名第一,不过国产阵营已经大踏步追了上来,差距逐步缩小。
微软、谷歌、 英伟达等科技巨头加码 AI 的野心人尽皆知,但跑得快并不一定能吃上肉。从几家公司刚刚发布的Q4季度报看,有的已经享受到AI带来的红利,有的仍在为AI铺路,甚至不惜壮士断腕。