
一位北大博士在DeepSeek的工作感受和择业思考!
一位北大博士在DeepSeek的工作感受和择业思考!我是2024年7月毕业的博士,找工作是从2023年农历新年之后开始的,我一般只和主动联系上来的公司聊,最开始联系到的,是华为计算产品线的计算研究部昇腾和鲲鹏lab,随后联系的有上海人工智能实验室,幻方AI(年底改名为deepseek)。
我是2024年7月毕业的博士,找工作是从2023年农历新年之后开始的,我一般只和主动联系上来的公司聊,最开始联系到的,是华为计算产品线的计算研究部昇腾和鲲鹏lab,随后联系的有上海人工智能实验室,幻方AI(年底改名为deepseek)。
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。
香港大学联合上海人工智能实验室,华为诺亚方舟实验室提出高效扩散模型 LiT:探索了扩散模型中极简线性注意力的架构设计和训练策略。LiT-0.6B 可以在断网状态,离线部署在 Windows 笔记本电脑上,遵循用户指令快速生成 1K 分辨率逼真图片。
新模型在MATH上(以数学竞赛为主)动辄跑分80%甚至90%以上,却一用就废。
红杉资本合伙人肖恩·马奎尔 在过去一年中因与埃隆·马斯克的友谊而声名鹊起,这帮助公司参与了 SpaceX 和 X 的热门融资轮。通过 X,红杉资本还将获得 xAI,马斯克的人工智能实验室的股份。
近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
近日,上海人工智能实验室推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍,书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视频生成大模型。
近年来,人工智能模型的能力显著提高。其中,计算资源的增长占了人工智能性能提升的很大一部分。规模化带来的持续且可预测的提升促使人工智能实验室积极扩大训练规模,训练计算以每年约 4 倍的速度增长。
近日,上海交通大学、上海人工智能实验室和上海交通大学附属瑞金医院联合团队发布基于异常检测预训练的心电长尾诊断模型。
Fidelity-Scalability-Controllability-Accessibility (真实度-可扩展性-可控性-可用性)是生成式 AI 领域一个很好的研究方法论。会有更多像AnimateDiff这样的技术推动视频生成的广泛应用。