AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报
7340 点击    2024-05-12 15:49
从零开始手搓GPU,照着英伟达CUDA来,只用两个星期

从零开始手搓GPU,照着英伟达CUDA来,只用两个星期

从零开始手搓GPU,照着英伟达CUDA来,只用两个星期

近日,美国一家 web3 开发公司的创始工程师之一 Adam Majmudar 分享了他「手搓 GPU」成功的经历,引发了网友们的一大片点赞。令人惊讶的是,他仅用两周时间就完成了这一脑力壮举。在 Twitter/X 的主题帖子中,Majmudar 进行了直播,一步步带我们回顾了整个过程。

来自主题: AI资讯
8382 点击    2024-05-12 15:35
国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息

来自主题: AI技术研报
9645 点击    2024-05-12 12:35
百万tokens低至1元!大模型越来越卷了

百万tokens低至1元!大模型越来越卷了

百万tokens低至1元!大模型越来越卷了

在刚刚举行的 ICLR 2024 大会上,智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势,同时预告了GLM的后续升级版本。

来自主题: AI资讯
6777 点击    2024-05-12 11:19
坏了,我的RTX 3090 GPU在对我唱歌!

坏了,我的RTX 3090 GPU在对我唱歌!

坏了,我的RTX 3090 GPU在对我唱歌!

在一个昏暗的机箱里,一台 RTX 3090 GPU「唱」着经典英语儿歌《一闪一闪亮晶晶》(Twinkle,Twinkle,Little Star)的旋律。

来自主题: AI资讯
7462 点击    2024-05-12 11:16
OpenAI,又要放大招了

OpenAI,又要放大招了

OpenAI,又要放大招了

智东西5月11日消息,今天凌晨,OpenAI宣布将于美国时间13日上午10点(北京时间14日凌晨1点)在官网直播,演示ChatGPT、GPT-4的更新内容。

来自主题: AI资讯
5861 点击    2024-05-11 15:05
美国人为什么急着让AI开战斗机

美国人为什么急着让AI开战斗机

美国人为什么急着让AI开战斗机

就在一年前,2023年5月,OpenAI的CEO Sam Altman曾在美国国会听证会上提到过AI正在被武器化的事实,并赞同“像监管核武器一样监管AI”的提议。

来自主题: AI资讯
7804 点击    2024-05-11 13:24