AI资讯新闻榜单内容搜索-模型

Ferret-UI 2：苹果最新跨平台通用GUI理解多模态大模型

Ferret-UI 2 是苹果研究团队最新发表的一款先进的多模态大型语言模型（MLLM），旨在实现跨多个平台的通用用户界面（UI）理解。

来自主题: AI技术研报

8899 点击 2024-11-01 12:27

Agent-to-Sim (ATS) 是一个创新的三维模拟系统，能够从日常视频集合中学习三维代理的交互行为模型，由 Meta Codec Avatar 实验室主导研发。

来自主题: AI技术研报

6670 点击 2024-11-01 12:19

来自华东师范大学、南洋理工和中科院等高校的联合研究团队提出了一种新颖的人工智能教育框架“场景-对象-评估”（SOE），旨在利用大型语言模型（LLMs）构建能够模拟人类学生行为和个体差异的虚拟学生代理（LVSA）。

来自主题: AI技术研报

9013 点击 2024-11-01 12:06

国产大模型首次在国际最具挑战的“大模型竞技场”榜单上超过GPT-4o（5月版本），当零一万物的名字紧跟在OpenAI、Google之后，李开复却如是坦言。

来自主题: AI资讯

5400 点击 2024-11-01 10:41

AI coding 是模型推理能力增加之后的下一个竞争高地，除了模型厂商、AI Labs 之外，这个领域的参与者也有着 Cursor 这样的初创团队。

来自主题: AI资讯

7735 点击 2024-11-01 10:35

一个简单但具有挑战性的基准

来自主题: AI技术研报

7168 点击 2024-11-01 10:27

近年来，大语言模型（Large Language Models, LLMs）的研究取得了重大进展，并对各个领域产生了深远影响。然而，LLMs的卓越性能来源于海量数据的大规模训练，这导致LLMs的训练成本明显高于传统模型。

来自主题: AI技术研报

5488 点击 2024-11-01 10:15

上周Anthropic发布了Claude 3.5 Sonnet的升级，让AI助手能够通过"电脑使用"功能直接与计算机交互。

来自主题: AI资讯

5875 点击 2024-11-01 09:50

自去年底以来，时序预测领域正在经历重大转型，从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。

来自主题: AI技术研报

5531 点击 2024-10-31 15:11

个性化精品数字人（Personalized Talking Face Generation）强调合成的数字人视频在感官上与真人具有极高的相似性（不管是说话人的外表还是神态）。

来自主题: AI技术研报

6464 点击 2024-10-31 15:09