
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与何恺明入职MIT副教授后,首次带队的新作来了!
何恺明入职MIT副教授后,首次带队的新作来了!
3D场景理解让人形机器人「看得见」周身场景,使汽车自动驾驶功能能够实时感知行驶过程中可能出现的情形,从而做出更加智能化的行为和反应。而这一切需要大量3D场景的详细标注,从而急剧提升时间成本和资源投入。
如何判断一个AI模型是否属于开源阵营?开源or闭源,到底哪种系统才更安全?最近,两位荷兰学者发表的一篇ACM FAccT论文给出了富有卓见的回答。
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!
自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。
在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
按部就班 vs. 好奇心驱动,哪个更容易出研究成果?
香港大学推出的XRec模型通过融合大型语言模型的语义理解和协同过滤技术,增强了推荐系统的可解释性,使用户能够理解推荐背后的逻辑。这一创新成果不仅提升了用户体验,也为推荐技术的未来发展提供了新方向和动力。
AI卫星影像知识生成模型数据集稀缺的问题,又有新解了。
什么AI应用每秒处理20000个AI推理请求,达到2024年谷歌搜索流量的1/5?