AITNT-让一部分人先用AI实现商业化

视觉语言模型导论：这篇论文能成为你进军VLM的第一步

近些年，语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型（LLM）有能力解决多种不同的任务，它们也正在成为越来越常用的工具。

来自主题: AI技术研报

9846 点击 2024-06-11 10:08

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报

10528 点击 2024-06-11 10:06

CVPR 2024｜让图像扩散模型生成高质量360度场景，只需要一个语言模型

360 度场景生成是计算机视觉的重要任务，主流方法主要可分为两类，一类利用图像扩散模型分别生成 360 度场景的多个视角。由于图像扩散模型缺乏场景全局结构的先验知识，这类方法无法有效生成多样的 360 度视角，导致场景内主要的目标被多次重复生成，如图 1 的床和雕塑。

来自主题: AI技术研报

10253 点击 2024-06-11 10:02

国产AI大战高考物理，第1题全对，第2题开始放飞

端午佳节，有的地方高考已经结束，有的考生还奋战在考场上。

来自主题: AI资讯

10820 点击 2024-06-11 09:57

库里杜兰特“合舞”科目三，腾讯混元团队全新图生视频模型来了

当前大家常见的视频生成是酱婶儿的：

来自主题: AI资讯

10187 点击 2024-06-11 09:51

车路协同+多智能体协作大牛齐聚，ECCV'24「协同智能」Workshop开启征稿啦

近年来，具身智能（如自动驾驶和机器人等自主智能体）取得了迅猛发展。

来自主题: AI资讯

10043 点击 2024-06-11 09:43

人类都看不懂的甲骨文，AI 能猜到啥意思？｜AI 鲜测

第一次见到甲骨文 AI 平台的时候我觉得特别有趣，它不仅能够查询甲骨文以及甲骨片，而且针对每一个甲骨文都有详细的来源出处、释义、甲骨片信息等等，还有高清的甲骨片，甚至能把这么多的甲骨文井然有序地汇总在一起。

来自主题: AI资讯

12383 点击 2024-06-10 15:11

对话潞晨科技尤洋：如何把大模型价格“打”下来？

突然间，大模型迈进了“免费”时代。

来自主题: AI资讯

10366 点击 2024-06-10 15:04

i人小助手：Meta推出多模态对话图，帮你轻松识别社交状态

近年来兴起的第一人称视角视频研究为理解人类社交行为提供了无法取代的直观视角，然而，绝大多数的既往工作都侧重于分析与摄像机佩戴者相关的行为，并未关注处于社交场景中其他社交对象的状态。

来自主题: AI技术研报

9094 点击 2024-06-10 15:02

偏微分方程有了基础模型：样本需求数量级减少，14项任务表现最佳

偏微分方程（PDEs）被称为物理学的语言，因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。

来自主题: AI技术研报

9294 点击 2024-06-10 14:59

具身智能赋能机器人，「AI+人形机器人」论坛在浦东新区成功举行

6 月 6 日下午，在上海市浦东新区科技和经济委员会指导下，由上海市浦东新区投资促进中心、人形机器人（上海）有限公司主办，上海浦东科技创业中心、机器之心（上海）科技有限公司承办，中国银行股份有限公司上海市分行协办的「AI + 人形机器人」论坛暨张江机器人全球生态峰会具身智能开发者论坛在浦东新区张江科学会堂成功举行。

来自主题: AI资讯

9374 点击 2024-06-10 14:55