
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer(nGPT),上下文越长,训练速度越快,还能维持原有精度。
LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer(nGPT),上下文越长,训练速度越快,还能维持原有精度。
在西雅图10月15日的联想科技创新大会上,罕见地汇聚了当前硅谷芯片三巨头,包括最近风头正盛的英伟达CEO黄仁勋、AMD CEO苏姿丰,以及英特尔CEO帕特·基辛格;另外,Meta CEO马克·扎克伯格、微软CEO萨提亚·纳德拉和高通CEO安蒙也通过远程连线的方式参与到活动中来。
OpenAI o1 的发布,再次给 AI 领域带来了一场地震。 o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。
英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。
让资本市场先赚“聪明钱”。自今年6月创下历史高点后,英伟达股价出现反复震荡。英伟达股价走势之所以跌宕起伏的一个主要原因是,市场担心英伟达新产品投产可能推迟。
一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。
英伟达开源了超强模型Nemotron-70B,后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet,仅次于OpenAI o1!AI社区惊呼:新的开源王者又来了?业内直呼:用Llama 3.1训出小模型吊打GPT-4o,简直是神来之笔!
性能翻倍的原因是,端到端建立整个数据中心和AI工厂,并开发软件。
在解释英伟达为何放弃Arm而选择收购Mellanox时,黄仁勋称文化融合充满了挑战。
未来的大模型,或许都是 A 卡来算的? 从 PC 端到服务器,AMD 一次发布就完成了对 AI 计算的全覆盖。 今天凌晨,AMD 首席执行官苏姿丰(Lisa Su)在旧金山举行的 Advancing AI 2024 活动上发布了全新一代 Ryzen CPU、Instinct AI 计算卡、EPYC AI 芯片等一系列产品。