AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU,自家产品也全线替换了

李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU,自家产品也全线替换了

李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU,自家产品也全线替换了

第一家全面拥抱DeepSeek的“六小虎”,出现了! 不卖关子,它就是李开复亲任CEO的零一万物。 今日正式上线万智企业大模型一站式平台,宣布提供企业级DeepSeek部署定制解决方案。

来自主题: AI资讯
7430 点击    2025-03-17 21:38
上海首家AI潮品体验店亮相——消费者将参与产品共创,加速本土AI新品迭代落地

上海首家AI潮品体验店亮相——消费者将参与产品共创,加速本土AI新品迭代落地

上海首家AI潮品体验店亮相——消费者将参与产品共创,加速本土AI新品迭代落地

“零基础”也能弹奏出好听和弦的无弦吉他,能监测睡眠呼吸和血氧的智能戒指,能听音乐、打电话、做翻译的AI眼镜……近日,位于徐汇西岸的大模型创新生态社区“模速空间”联手潮流电子新零售品牌Z·Pilot,推出上海首家全球AI潮品体验店。500多平方米的店内汇集了500多件科技潮品,让每一位尝鲜者大呼过瘾。

来自主题: AI资讯
7284 点击    2025-03-17 20:06
新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。

来自主题: AI资讯
7087 点击    2025-03-17 19:52
北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。

来自主题: AI技术研报
8425 点击    2025-03-17 16:04
一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

文心一言两周年,百度一口气上新两款模型,并且上来就是一个主题:免费。

来自主题: AI产品测评
9120 点击    2025-03-17 15:26
ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法

ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法

ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法

在深度学习的多个应用场景中,联合优化多个损失项是一个普遍的问题。典型的例子包括物理信息神经网络(Physics-Informed Neural Networks, PINNs)、多任务学习(Multi-Task Learning, MTL)和连续学习(Continual Learning, CL)。然而,不同损失项的梯度方向往往相互冲突,导致优化过程陷入局部最优甚至训练失败。

来自主题: AI技术研报
9276 点击    2025-03-17 14:55
统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍

最近的研究强调了扩散模型与表征学习之间的相互作用。扩散模型的中间表征可用于下游视觉任务,同时视觉模型表征能够提升扩散模型的收敛速度和生成质量。然而,由于输入不匹配和 VAE 潜在空间的使用,将视觉模型的预训练权重迁移到扩散模型中仍然具有挑战性。

来自主题: AI技术研报
9428 点击    2025-03-17 14:36