
256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV
256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。
近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。
"AI装饰了你的梦,你成为了AI的韭菜" 6月7日-10日,2025年高考,1335万人参加。 如按参加高考学生平均年龄18岁计算,那么他们是第一批被AI深度影响的高考生——2022年OpenAI走红,这批学生刚进入高中。
由美国西北大学医学院研发的全球首个嵌入临床流程的生成式人工智能(AI)放射系统,可在毫秒内识别危及生命的病症,显著提高工作效率。该系统为全球放射科医生短缺问题提供了有效解决方案。相关论文发表在最新一期《美国医学会杂志》旗下的《JAMA Network Open》期刊上。
视觉注意力机制,又有新突破,来自香港大学和英伟达。
“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。 然而再一次遭到网友质疑:怎么又不跟最新版Qwen和DeepSeek R1 0528对比?
最强推理模型一夜易主!深夜,o3-pro毫无预警上线,刷爆数学、编程、科学基准,强势碾压o1-pro和o3。更惊艳的是,o3价格直接暴降80%,叫板Gemini 2.5 Pro。
现在市面上有46种Prompt工程技术,但真正能在软件工程任务中发挥作用的,可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们,花了大量时间和计算资源,调研了58种,整理了46种,最终筛选测试了14种主流提示技术在10个软件工程任务上的表现,用了4个不同的大模型(包括咱们的Deepseek-V3),总共跑了2000多次实验。
在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算复杂度为二次方的问题,成为众多研究试图突破的重点
为什么语言模型能从预测下一个词中学到很多,而视频模型却从预测下一帧中学到很少?
OpenAI深夜放大招,正式推出“最新最强版”推理模型o3-pro! 而且同一时间,o3模型降价80%不降智。官方测评结果显示,在专家评估中,所有人一致更偏爱o3-pro而非o3的回答。