AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星

鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星

鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星

一不留神,大模型已经学会了操纵手机?最近,腾讯最新多模态智能体框架AppAgent曝光,可以像人类一样操作各种应用。

来自主题: AI资讯
9838 点击    2023-12-26 20:26
若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技与哈工深联合研发了语言大模型基座---立知和多模态大模型基座---九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、多轮对话、中英翻译、思维链、工具使用等多种类型的指令数据

来自主题: AI资讯
3033 点击    2023-12-26 08:47
谷歌创始人亲自给Gemini写代码,很核心那种

谷歌创始人亲自给Gemini写代码,很核心那种

谷歌创始人亲自给Gemini写代码,很核心那种

身价1050亿美元,每天还在亲自动手敲代码!?就连谷歌最新大招Gemini大模型的核心贡献者名单中,也有他的名字。

来自主题: AI资讯
4870 点击    2023-12-24 15:27
阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

OpenAI GPT-4V 和 Google Gemini 都展现了非常强的多模态理解能力,推动了多模态大模型(MLLM)快速发展,MLLM 成为了现在业界最热的研究方向。

来自主题: AI资讯
3808 点击    2023-12-23 16:09
2分钟定制Agent,「澜码科技」发布企业级AI Agent平台AskXBOT

2分钟定制Agent,「澜码科技」发布企业级AI Agent平台AskXBOT

2分钟定制Agent,「澜码科技」发布企业级AI Agent平台AskXBOT

构建AI Agent有三步:第一步,专家知识的数字化;第二步,支持更多模态的交互;第三步,领域知识的循环沉淀。

来自主题: AI资讯
7530 点击    2023-12-23 11:45
谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告

谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告

谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告

在Gemini开放API不到一周的时间,港中文等机构就完成评测,联合发布了多达128页的报告,结果显示:在37个视觉理解任务上,Gemini-Pro表现出了和GPT-4V相当的能力。

来自主题: AI资讯
6592 点击    2023-12-22 12:50
面壁智能联合清华发布最新多模态对齐框架RLHF-V,减少“过泛化”幻觉达业内最佳水平

面壁智能联合清华发布最新多模态对齐框架RLHF-V,减少“过泛化”幻觉达业内最佳水平

面壁智能联合清华发布最新多模态对齐框架RLHF-V,减少“过泛化”幻觉达业内最佳水平

多模态技术是 AI 多样化场景应用的重要基础,多模态大模型(MLLM)展现出了优秀的多模态信息理解和推理能力,正成为人工智能研究的前沿热点。上周,谷歌发布 AI 大模型 Gemini,据称其性能在多模态任务上已全面超越 OpenAI 的 GPT-4V,再次引发行业的广泛关注和热议。

来自主题: AI资讯
3578 点击    2023-12-18 14:21
GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。

来自主题: AI资讯
7491 点击    2023-12-17 18:57