AI资讯新闻榜单内容搜索-A

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: A
北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。

来自主题: AI技术研报
9233 点击    2025-03-17 16:04
一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

文心一言两周年,百度一口气上新两款模型,并且上来就是一个主题:免费。

来自主题: AI产品测评
9989 点击    2025-03-17 15:26
团队来自清华、浙大,可连续空翻的机器人完成数亿融资

团队来自清华、浙大,可连续空翻的机器人完成数亿融资

团队来自清华、浙大,可连续空翻的机器人完成数亿融资

36氪获悉,近日人形机器人公司松延动力北京科技有限公司(以下简称「松延动力」)完成连续两轮过亿元A轮及A+轮融资。A+轮由彬复领投,华强资本跟投;A轮投资方包括神骐资本、北京未来科学城基金、天启资本、泽然资本、教育科技集团战略方等机构。

来自主题: AI资讯
8919 点击    2025-03-17 15:21
低调平头哥,吹响先进存力商业化号角

低调平头哥,吹响先进存力商业化号角

低调平头哥,吹响先进存力商业化号角

“在AI时代,我们必须全面提升先进存力。”

来自主题: AI资讯
8928 点击    2025-03-17 15:17
万字详解智能体:AI手机走“盲道”

万字详解智能体:AI手机走“盲道”

万字详解智能体:AI手机走“盲道”

“2025年会是AI智能体元年。” 开年的短暂时间里,关于智能体的押注再次如潮水涌现。

来自主题: AI资讯
6945 点击    2025-03-17 15:12
ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法

ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法

ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法

在深度学习的多个应用场景中,联合优化多个损失项是一个普遍的问题。典型的例子包括物理信息神经网络(Physics-Informed Neural Networks, PINNs)、多任务学习(Multi-Task Learning, MTL)和连续学习(Continual Learning, CL)。然而,不同损失项的梯度方向往往相互冲突,导致优化过程陷入局部最优甚至训练失败。

来自主题: AI技术研报
10041 点击    2025-03-17 14:55
统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

最近的研究强调了扩散模型与表征学习之间的相互作用。扩散模型的中间表征可用于下游视觉任务,同时视觉模型表征能够提升扩散模型的收敛速度和生成质量。然而,由于输入不匹配和 VAE 潜在空间的使用,将视觉模型的预训练权重迁移到扩散模型中仍然具有挑战性。

来自主题: AI技术研报
10197 点击    2025-03-17 14:36