AI资讯新闻榜单内容搜索-Mu

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Mu
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。

来自主题: AI技术研报
8918 点击    2024-05-10 23:32
前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库

前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库

前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库

今年 3 月,以构建大型开源社区而闻名的 AI 初创公司 Hugging Face,挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot,引起了轰动。

来自主题: AI技术研报
7766 点击    2024-05-08 11:05
ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

近年来,大型语言模型(LLM)在数学应用题和数学定理证明等任务中取得了长足的进步。数学推理需要严格的、形式化的多步推理过程,因此是 LLMs 推理能力进步的关键里程碑, 但仍然面临着重要的挑战。

来自主题: AI技术研报
6752 点击    2024-05-04 20:04
100亿美元开发投资,红杉资本入局,特斯拉要搞波大的…

100亿美元开发投资,红杉资本入局,特斯拉要搞波大的…

100亿美元开发投资,红杉资本入局,特斯拉要搞波大的…

特斯拉首席执行官埃隆-马斯克(Elon Musk)宣布,今年将投资约100亿美元用于人工智能开发,特别是改进其汽车,以增强自动驾驶功能。

来自主题: AI资讯
11279 点击    2024-04-30 17:29
对话阿里多智能体大赛冠军:MumuLab 的孩子有 AI

对话阿里多智能体大赛冠军:MumuLab 的孩子有 AI

对话阿里多智能体大赛冠军:MumuLab 的孩子有 AI

近日,特工宇宙有幸邀请到了吕昭波老师进行了一次请教交谈,吕昭波老师是技术布道者、《云端架构》作者、MumuLab 创始人;他的团队 MumuLab 在全球 150+ 团队中脱颖而出,于 4 月 13 日赢得了阿里云 × 魔搭社区的 AI 创客松的冠军。

来自主题: AI资讯
8596 点击    2024-04-29 11:03
一文读懂具身智能:巨头在做什么、创业公司机会在哪、数据和 Scaling Law 难题怎么解决?

一文读懂具身智能:巨头在做什么、创业公司机会在哪、数据和 Scaling Law 难题怎么解决?

一文读懂具身智能:巨头在做什么、创业公司机会在哪、数据和 Scaling Law 难题怎么解决?

Google RT-2、Figure 01 机器人、特斯拉 Optimus 等的新演示让「具身智能」这一概念成为了机器人和大模型领域的热门话题

来自主题: AI资讯
5551 点击    2024-04-22 21:02
Salesforce AI Research 刘志伟:像Agent一样思考 | Agent Insights

Salesforce AI Research 刘志伟:像Agent一样思考 | Agent Insights

Salesforce AI Research 刘志伟:像Agent一样思考 | Agent Insights

AgentLite 便是其中一个起点,专注从科学研究的角度把 Agent 以及 Multi-Agent 的开发标准统一,让学术界的奇思妙想更快迭代

来自主题: AI资讯
6936 点击    2024-04-12 17:19
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳

国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳

国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳

国内首个音乐ChatGPT来了!提前试用「天工SkyMusic」后,整个编辑部暴风式哭泣:它改编的周杰伦和凤凰传奇简直封神。团队选择了一条少有人走的路,他们赌赢了:比OpenAI提前押中了Sora架构,并且首次在业内公开技术图。

来自主题: AI资讯
5529 点击    2024-04-11 22:12
中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。

来自主题: AI技术研报
6195 点击    2024-04-07 13:10