AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
Unsloth x Qwen2,提速47.32%,节省39.13%显存,最少仅需8.43GB显存

Unsloth x Qwen2,提速47.32%,节省39.13%显存,最少仅需8.43GB显存

Unsloth x Qwen2,提速47.32%,节省39.13%显存,最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B,提速44.35%,节省42.58%显存,最少仅需7.75GB显存」中,我们介绍了Unsloth,这是一个大模型训练加速和显存高效的训练框架,我们已将其整合到Firefly训练框架中,并且对Llama3-8B的训练进行了测试,Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报
5605 点击    2024-05-08 12:21
7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名

7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名

7262篇提交,ICLR 2024爆火,两篇国内论文获杰出论文提名

ICLR 全称为国际学习表征会议(International Conference on Learning Representations),今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。

来自主题: AI技术研报
10095 点击    2024-05-08 11:02
推理超越 Llama3!面壁Ultra对齐助推开源大模型「理科状元」

推理超越 Llama3!面壁Ultra对齐助推开源大模型「理科状元」

推理超越 Llama3!面壁Ultra对齐助推开源大模型「理科状元」

两周前,OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。

来自主题: AI技术研报
10194 点击    2024-05-07 22:38
最懂打工人的AI特助万知来了,李开复在线催更!2分钟手机直出PPT效率×10

最懂打工人的AI特助万知来了,李开复在线催更!2分钟手机直出PPT效率×10

最懂打工人的AI特助万知来了,李开复在线催更!2分钟手机直出PPT效率×10

快节奏的生活已经成为当今时代的常态,职场中的我们不仅要应对工作中的各种挑战,还要在有限的时间内处理日常生活中的琐事。

来自主题: AI技术研报
7624 点击    2024-05-07 18:32
斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

全球首个超小型多模态AI Agent模型Octopus V3,来自斯坦福大学的NEXA AI团队,让Agent更加智能、快速、能耗及成本降低。

来自主题: AI技术研报
5298 点击    2024-05-07 18:12