# 热门搜索 #
搜索
搜索: OTA
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一LLM的输入能让LLM的视觉理解能力提升。

来自主题: AI技术研报
4599 点击    2023-11-24 15:10
姚班斯隆奖马腾宇创业:大模型+顾问李飞飞

马腾宇透露,他带领团队打造了目前最好的嵌入模型,比OpenAI的还要好。此外,还会提供专注于某个领域或企业的定制化模型。

来自主题: AI资讯
6261 点击    2023-11-01 20:17
打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首

上海交大生成式人工智能研究组 (GAIR) 积极攻克难关,研发并开源了数学计算大模型 “阿贝尔(Abel)”,在多个榜单上取得开源第一!是首个海内外高校团队推出的 SOTA 数学开源大模型。

来自主题: AI技术研报
3524 点击    2023-09-22 18:26