AI资讯新闻榜单内容搜索-GPT-4V

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: GPT-4V

击败Gemini-1.5-Pro、GPT-4V，从容大模型多模态能力跻身全球前三

击败Gemini-1.5-Pro、GPT-4V，从容大模型多模态能力跻身全球前三

击败Gemini-1.5-Pro、GPT-4V，从容大模型多模态能力跻身全球前三

近日，云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，仅次于 GPT-4o（69.9）和 Claude3.5-Sonnet（67.9）。

来自主题: AI资讯

9905 点击 2024-06-29 00:19

LeCun谢赛宁首发全新视觉多模态模型，等效1000张A100干翻GPT-4V

LeCun谢赛宁首发全新视觉多模态模型，等效1000张A100干翻GPT-4V

LeCun谢赛宁首发全新视觉多模态模型，等效1000张A100干翻GPT-4V

近日，LeCun和谢赛宁等大佬，共同提出了这一种全新的SOTA MLLM——Cambrian-1。开创了以视觉为中心的方法来设计多模态模型，同时全面开源了模型权重、代码、数据集，以及详细的指令微调和评估方法。

来自主题: AI资讯

5316 点击 2024-06-27 16:22

可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

近期，由清华大学自然语言处理实验室联合面壁智能推出的全新开源多模态大模型 MiniCPM-Llama3-V 2.5 引起了广泛关注

来自主题: AI技术研报

11246 点击 2024-06-09 17:56

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！

来自主题: AI技术研报

10720 点击 2024-06-04 17:23

开源多模态SOTA再易主，19B模型比肩GPT-4v，16G显存就能跑

开源多模态SOTA再易主，19B模型比肩GPT-4v，16G显存就能跑

开源多模态SOTA再易主，19B模型比肩GPT-4v，16G显存就能跑

开源多模态SOTA模型再易主！Hugging Face开发者大使刚刚把王冠交给了CogVLM2，来自大模型创业公司智谱AI。CogVLM2甚至在3项基准测试上超过GPT-4v和Gemini Pro，还不是超过一点，是大幅领先。

来自主题: AI资讯

8712 点击 2024-05-22 18:29

一夜掀翻 GPT-4V 的国产「小钢炮」，可能会是华为小米们对抗 AI iPhone 的关键武器

一夜掀翻 GPT-4V 的国产「小钢炮」，可能会是华为小米们对抗 AI iPhone 的关键武器

一夜掀翻 GPT-4V 的国产「小钢炮」，可能会是华为小米们对抗 AI iPhone 的关键武器

把大模型塞进手机里需要几步？

来自主题: AI资讯

10709 点击 2024-05-21 09:27

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro！稳坐端侧多模态铁王座

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro！稳坐端侧多模态铁王座

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro！稳坐端侧多模态铁王座

杀疯了！一夜之间，全球最强端侧多模态模型再次刷新，仅用8B参数，击败了多模态巨无霸Gemini Pro、GPT-4V。而且，其OCR长难图识别刷新SOTA，图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。

来自主题: AI资讯

12099 点击 2024-05-20 15:54

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

GPT-4o发布不到一周，首个敢于挑战王者的新模型诞生！最近，Meta团队发布了「混合模态」Chameleon，可以在单一神经网络无缝处理文本和图像。10万亿token训练的34B参数模型性能接近GPT-4V，刷新SOTA。

来自主题: AI技术研报

10551 点击 2024-05-19 15:48

14 项任务测下来，GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力？

14 项任务测下来，GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力？

14 项任务测下来，GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力？

2023-2024年，以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型（Multimodal LLMs）已经在文本和图像等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。

来自主题: AI技术研报

9973 点击 2024-05-10 23:32

人大卢志武：只要拿到更多算力，超过Sora也不是那么难的事｜中国AIGC产业峰会

人大卢志武：只要拿到更多算力，超过Sora也不是那么难的事｜中国AIGC产业峰会

人大卢志武：只要拿到更多算力，超过Sora也不是那么难的事｜中国AIGC产业峰会

一支人大系大模型团队，前后与OpenAI进行了三次大撞车！

来自主题: AI技术研报

12052 点击 2024-05-02 17:40

上一页当前第2页,共6页下一页