视觉语言模型导论:这篇论文能成为你进军VLM的第一步
视觉语言模型导论:这篇论文能成为你进军VLM的第一步近些年,语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成为越来越常用的工具。
搜索
近些年,语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成为越来越常用的工具。
大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。
360 度场景生成是计算机视觉的重要任务,主流方法主要可分为两类,一类利用图像扩散模型分别生成 360 度场景的多个视角。由于图像扩散模型缺乏场景全局结构的先验知识,这类方法无法有效生成多样的 360 度视角,导致场景内主要的目标被多次重复生成,如图 1 的床和雕塑。
端午佳节,有的地方高考已经结束,有的考生还奋战在考场上。
当前大家常见的视频生成是酱婶儿的:
近年来,具身智能(如自动驾驶和机器人等自主智能体)取得了迅猛发展。
第一次见到甲骨文 AI 平台的时候我觉得特别有趣,它不仅能够查询甲骨文以及甲骨片,而且针对每一个甲骨文都有详细的来源出处、释义、甲骨片信息等等,还有高清的甲骨片,甚至能把这么多的甲骨文井然有序地汇总在一起。
突然间,大模型迈进了“免费”时代。
近年来兴起的第一人称视角视频研究为理解人类社交行为提供了无法取代的直观视角,然而,绝大多数的既往工作都侧重于分析与摄像机佩戴者相关的行为,并未关注处于社交场景中其他社交对象的状态。
偏微分方程(PDEs)被称为物理学的语言,因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。
6 月 6 日下午,在上海市浦东新区科技和经济委员会指导下,由上海市浦东新区投资促进中心、人形机器人(上海)有限公司主办,上海浦东科技创业中心、机器之心(上海)科技有限公司承办,中国银行股份有限公司上海市分行协办的「AI + 人形机器人」论坛暨张江机器人全球生态峰会具身智能开发者论坛在浦东新区张江科学会堂成功举行。
AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。
即使Sora已经强势“炸”过场,Pika还是再次带着硅谷一众明星资方的投票回到了舆论中心。
在大语言模型突飞猛进的同时,谷歌的研究团队在时序预测方面也取得了突破性的成果——今年2月发表的模型TimesFM,而且放出了模型的代码和权重,让更多开发者体验这种「开箱即用」的零样本预测能力。
近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。
在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。
咳咳,在开始讲之前,先跟差友们宣布个事儿:
为期三天的2024年台北电脑展(Computex 2024),6月7日已落下帷幕。在这一次的展会上,AI成为贯穿一切的主题。英伟达、AMD、英特尔、高通等芯片大厂的话事人们纷纷做了主题演讲,也让这次展会的参与人数比上一届暴涨了 80%。
令厂商可能有点尴尬的是,AI比人坦诚
最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。
由腾讯音乐娱乐的Lyra Lab团队开发的Muse 开源系列项目,它的最后一个模块终于来了——MusePose !发布后却真诚致谢阿里的项目?
从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。
最近,WSJ的一篇文章深度披露了Sam Altman十几年来建立的庞大投资帝国,让我们终于理解了他为什么可以不要OpenAI的股权。但文章同时指出,奥特曼的个人投资和OpenAI的业务存在各种复杂的利益关系。
近期,由清华大学自然语言处理实验室联合面壁智能推出的全新开源多模态大模型 MiniCPM-Llama3-V 2.5 引起了广泛关注
千万种声音里,只听到你。
让考生头皮发麻的高考数学,可难倒了顶尖 AI 大模型。
让语言模型「轻装上阵」。
极限量化,把每个参数占用空间压缩到1.1bit!
使用大模型合成的数据,就能显著提升3D生成能力?
马斯克部下跳槽,把人形机器人技术开源了。不少创业公司的估值,一夜被打了骨折。