AI资讯新闻榜单内容搜索-LLM

让大模型理解手机屏幕，苹果多模态Ferret-UI用自然语言操控手机

此次，苹果提出的多模态大语言模型（MLLM） Ferret-UI ，专门针对移动用户界面（UI）屏幕的理解进行了优化，其具备引用、定位和推理能力。

来自主题: AI技术研报

7048 点击 2024-05-20 18:56

数据更多更好还是质量更高更好？这项研究能帮你做出选择

当计算预算低时，重复使用高质量数据更好；当不差钱时，使用大量数据更有利。

来自主题: AI技术研报

7918 点击 2024-05-20 18:52

众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸

最公平的大模型基准测试诞生了！来自LLM竞技场，最接近人类偏好，数据新鲜、速度快、成本低，严格分离学渣和学霸。

来自主题: AI技术研报

11982 点击 2024-05-20 16:20

GPT-4通过图灵测试，胜率高达54%！UCSD新作：人类无法认出GPT-4

GPT-4可以通过图灵测试吗？

来自主题: AI资讯

11236 点击 2024-05-18 17:41

思维链不存在了？纽约大学最新研究：推理步骤可「省略」

红极一时的思维链技术，可能要被推翻了！

来自主题: AI技术研报

5675 点击 2024-05-14 10:49

70亿LLaMA媲美5400亿PaLM！MIT惊人研究用「博弈论」改进大模型｜ICLR 2024

大模型回答如何更可靠？MIT研究团队设计出「共识博弈」，将数学家常用的博弈论引入LLM改进中。没想到，LLaMA-7B的表现，击败了LLaMA-65B，甚至与PaLM-540B相媲美。

来自主题: AI技术研报

8812 点击 2024-05-12 15:19

抛弃自回归，连接一致性Diffusion和LLM！UCSD上交新作热度紧追AF 3

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门，成为了Hacker News等许多科技媒体的头版头条。

来自主题: AI技术研报

4659 点击 2024-05-11 13:06

14 项任务测下来，GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力？

2023-2024年，以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型（Multimodal LLMs）已经在文本和图像等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。

来自主题: AI技术研报

9807 点击 2024-05-10 23:32

3倍生成速度还降内存成本，超越Medusa2的高效解码框架终于来了

传统上，大型语言模型（LLMs）被认为是顺序解码器，逐个解码每个token。

来自主题: AI技术研报

5571 点击 2024-05-10 23:29

复旦大学AI³徐盈辉研究员：Agent的可视化创作界面 ——Agent Insights

传统 LLM-based AI Agent 运维平台在复杂应用开发方面存在一定局限，复旦大学人工智能创新与产业研究院（AI³）徐盈辉研究员与 AI2Apps 团队打造的 AI2Apps 可视化集成开发环境集成了工程级的开发工具，覆盖 AI Agent 完整开发周期，具有完全开放的扩展性，并自带浏览器沙盒环境，借鉴 Figma 的理念

来自主题: AI技术研报

8183 点击 2024-05-10 17:25