AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
80G显存塞50个7B大模型!清华&OpenBMB开源增量压缩新算法,显存节省8倍

80G显存塞50个7B大模型!清华&OpenBMB开源增量压缩新算法,显存节省8倍

80G显存塞50个7B大模型!清华&OpenBMB开源增量压缩新算法,显存节省8倍

最新模型增量压缩技术,一个80G的A100 GPU能够轻松加载多达50个7B模型,节省显存约8倍,同时模型性能几乎与压缩前的微调模型相当。

来自主题: AI技术研报
7667 点击    2024-11-29 13:58
谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!

谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!

谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!

今年10月,OpenAI高级研究科学家、德扑AI之父Noam Brown,曾在美国旧金山举办的TED AI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。

来自主题: AI技术研报
7534 点击    2024-11-29 09:36
Kimi开源底层推理框架,1小时GitHub揽星1.2k

Kimi开源底层推理框架,1小时GitHub揽星1.2k

Kimi开源底层推理框架,1小时GitHub揽星1.2k

什么?Kimi底层推理架构刚刚宣布:开!源!了!

来自主题: AI技术研报
2910 点击    2024-11-28 20:51
让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式

让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式

让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式

颠覆现有Agent范式、让AI拥有“主动能动性! 清华&面壁等团队最新开源新一代主动Agent交互范式 ( ProActive Agent)。

来自主题: AI技术研报
6486 点击    2024-11-28 20:50
12%计算量就能媲美原模型,Adobe、罗切斯特大学等提出YOPO剪枝技术

12%计算量就能媲美原模型,Adobe、罗切斯特大学等提出YOPO剪枝技术

12%计算量就能媲美原模型,Adobe、罗切斯特大学等提出YOPO剪枝技术

尽管近期 Qwen2-VL 和 InternVL-2.0 的出现将开源多模态大模型的 SOTA 提升到了新高度,但巨大的计算开销限制了其在很多场景下的应用。

来自主题: AI技术研报
8767 点击    2024-11-28 14:16
rebuttal真的有用!这篇ICLR论文,所有审稿人都加了2分,直接跃升排名第9

rebuttal真的有用!这篇ICLR论文,所有审稿人都加了2分,直接跃升排名第9

rebuttal真的有用!这篇ICLR论文,所有审稿人都加了2分,直接跃升排名第9

最近,正处于评议阶段的 ICLR 2025 论文真是看点连连,比如前些天爆出的 ICLR 低分论文作者硬刚审稿人的事件以及今天我们要介绍的这个通过 rebuttal(反驳)硬是将自己的平均分拉高 2 分,直接晋升第 9 名的论文。

来自主题: AI技术研报
7490 点击    2024-11-28 14:08
LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型交叉研究

LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型交叉研究

LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型交叉研究

近日,《Mechanical System and Signal Processing》(MSSP)在线发表刊登北航 PHM 团队最新研究成果:基于大语言模型的轴承故障诊断框架(LLM-based Framework for Bearing Fault Diagnosis)。

来自主题: AI技术研报
8590 点击    2024-11-28 13:53