AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”,大模型可能会“学得多错得多”,因为不同任务之间的冲突,导致泛化能力下降。

来自主题: AI资讯
3858 点击    2023-12-30 14:39
字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级理解方面的能力(例如物体分割)相对有限。

来自主题: AI技术研报
9566 点击    2023-12-28 17:37
鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星

鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星

鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星

一不留神,大模型已经学会了操纵手机?最近,腾讯最新多模态智能体框架AppAgent曝光,可以像人类一样操作各种应用。

来自主题: AI资讯
9527 点击    2023-12-26 20:26
若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技与哈工深联合研发了语言大模型基座---立知和多模态大模型基座---九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、多轮对话、中英翻译、思维链、工具使用等多种类型的指令数据

来自主题: AI资讯
2633 点击    2023-12-26 08:47
谷歌创始人亲自给Gemini写代码,很核心那种

谷歌创始人亲自给Gemini写代码,很核心那种

谷歌创始人亲自给Gemini写代码,很核心那种

身价1050亿美元,每天还在亲自动手敲代码!?就连谷歌最新大招Gemini大模型的核心贡献者名单中,也有他的名字。

来自主题: AI资讯
4769 点击    2023-12-24 15:27
阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

OpenAI GPT-4V 和 Google Gemini 都展现了非常强的多模态理解能力,推动了多模态大模型(MLLM)快速发展,MLLM 成为了现在业界最热的研究方向。

来自主题: AI资讯
3404 点击    2023-12-23 16:09