AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 模型
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。

来自主题: AI技术研报
5709 点击    2025-04-18 09:08
142页重磅,DeepSeek-R1的"甜蜜点",开创了一个崭新的研究领域“思维学”。 | 最新

142页重磅,DeepSeek-R1的"甜蜜点",开创了一个崭新的研究领域“思维学”。 | 最新

142页重磅,DeepSeek-R1的"甜蜜点",开创了一个崭新的研究领域“思维学”。 | 最新

这是一份142页的研究论文,本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程,以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生,为我们理解和优化AI推理能力提供了宝贵框架。

来自主题: AI技术研报
6730 点击    2025-04-17 14:26
文本向量的长度偏差及其在搜索中的影响

文本向量的长度偏差及其在搜索中的影响

文本向量的长度偏差及其在搜索中的影响

向量模型的核心功能是测量语义相似度,但这个测量结果很容易受到多种干扰因素的影响。在本文中,我们将着眼于文本向量模型中一个普遍存在的偏差来源:输入内容的长度。

来自主题: AI技术研报
8751 点击    2025-04-17 14:19
4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理

4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理

4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理

当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。

来自主题: AI技术研报
5655 点击    2025-04-17 13:54
Science:大模型,一种新时代的印刷术?

Science:大模型,一种新时代的印刷术?

Science:大模型,一种新时代的印刷术?

模型正重塑我们的社会文化生态,但其本质常被误解。《Science》上的一篇最新文章,揭示大模型并非自主智能主体,而是一种革命性文化社会技术,类似于语言、印刷与市场制度。它以独特方式汇聚并重构人类信息,成为“人类社会人工系统”的新变体。

来自主题: AI资讯
5679 点击    2025-04-17 13:48
JHU提出最强ToM方法,AutoToM横扫五大基准

JHU提出最强ToM方法,AutoToM横扫五大基准

JHU提出最强ToM方法,AutoToM横扫五大基准

如何让 AI 像人一样思考?如何拥有像人一样的认知能力和社会能力?

来自主题: AI技术研报
7942 点击    2025-04-17 10:27