
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA
智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。
就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了!
B 站开源动画视频生成模型 Index-AniSora,支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成!
新架构选择用KAN做3D感知,点云分析有了新SOTA!
统一图像理解和生成,还实现了新SOTA。
超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。
字节拿出了国际顶尖水平的视觉–语言多模态大模型。
还记得刘慈欣在《全频带阻塞干扰》中描绘的耀斑爆发吗?
「矩阵」不再是科幻!Matrix-Game震撼来袭,突破边界带来交互式引擎。只需一句话,沙漠森林等任意场景可控生成,动作丝滑操控,360°视角自由切换,沉浸感爆棚。
在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。