AI资讯新闻榜单内容搜索-SOTA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: SOTA
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型

最近来自浙江大学ReLER实验室的研究人员提出SIFU模型,一种侧视图条件隐函数模型用于单张图片3D人体重建。模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,在几何与纹理重建测试中均达到SOTA,并且在真实世界中具有多种应用场景。

来自主题: AI资讯
5949 点击    2024-01-18 13:16
单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。过去TAL中的建模是片段甚至实例级的,而现在只要视频里的一帧就能实现,效果媲美全监督。

来自主题: AI技术研报
6861 点击    2024-01-08 14:33
阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA

OpenAI GPT-4V 和 Google Gemini 都展现了非常强的多模态理解能力,推动了多模态大模型(MLLM)快速发展,MLLM 成为了现在业界最热的研究方向。

来自主题: AI资讯
2898 点击    2023-12-23 16:09
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一LLM的输入能让LLM的视觉理解能力提升。

来自主题: AI技术研报
5034 点击    2023-11-24 15:10
姚班斯隆奖马腾宇创业:大模型+顾问李飞飞

姚班斯隆奖马腾宇创业:大模型+顾问李飞飞

姚班斯隆奖马腾宇创业:大模型+顾问李飞飞

马腾宇透露,他带领团队打造了目前最好的嵌入模型,比OpenAI的还要好。此外,还会提供专注于某个领域或企业的定制化模型。

来自主题: AI资讯
6628 点击    2023-11-01 20:17
打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首

打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首

打破美国AI公司霸榜,上交AI数学开源模型阿贝尔排行榜首

上海交大生成式人工智能研究组 (GAIR) 积极攻克难关,研发并开源了数学计算大模型 “阿贝尔(Abel)”,在多个榜单上取得开源第一!是首个海内外高校团队推出的 SOTA 数学开源大模型。

来自主题: AI技术研报
3936 点击    2023-09-22 18:26