单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源FP8和更低的浮点数量化精度,不再是H100的“专利”了!
FP8和更低的浮点数量化精度,不再是H100的“专利”了!
AI正成为开发创新药的关键驱动力。
算力基础设施建设,北京市有了最新的大动作—— 《北京市算力基础设施建设实施方案(2024-2027年)》
抛弃传统方法,只采用Transformer来解码真实场景!
从Llama 3到Phi-3,蹭着开源热乎劲儿,苹果也来搞事情了。
Snowflake 发布高「企业智能」模型 Arctic,专注于企业内部应用。
Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。
京东创始人刘强东啊,他昨天又加班了。 准确来说,是他的AI数字人形象“采销东哥”,昨晚开启了自己生涯第四场直播。
这段时间,AI模型界是真的热闹,新的模型不断涌现,不管是开源还是闭源,都在刷新成绩。就在前几天,Meta就上演了一出“重夺开源铁王座”的好戏。发布了Llama 3 8B和70B两个版本,在多项指标上都超越了此前开源的Grok-1和DBRX,成为了新的开源大模型王者。
关于Llama 3,又有测试结果新鲜出炉—— 大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。