起猛了,GPT-4o被谷歌新模型超越了!
起猛了,GPT-4o被谷歌新模型超越了!
OnLeaks 与 Android Headlines 分享了一个展示 Pixel 9 「添加我」拍照新功能的视频。
巴黎奥运会期间,谷歌将首次携NBCUniversal,利用Gemini让AI技术走进赛场,为观众带来前所未有的观赛体验。
多模态大模型(Multimodal Large Language Models,MLLMs)在不同的任务中表现出了令人印象深刻的能力,尽管如此,这些模型在检测任务中的潜力仍被低估。
长上下文大模型帮助机器人理解世界。
斯坦福炒虾机器人团队时隔半年再出新作,谷歌最强Gemini 1.5 Pro加持,Mobility VLA让机器人在836平方米的办公室里轻松导航。
从智能眼镜,到AI眼镜。
性能翻倍的Gemma 2, 让同量级的Llama3怎么玩?
近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Claude3.5-Sonnet(67.9)。
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。