视频生成界的大瓜:Runway 组织公司全员,把互联网扒了个干干净净
视频生成界的大瓜:Runway 组织公司全员,把互联网扒了个干干净净据 Runway 前员工向 4m 的爆料,Runway 公司里几乎是全员都会在这个表格里录入数据,用来训练他们自家的模型。表格里搜集的油管视频,他们是用开源软件 YouTube-DL 下载的,为了防止被 Youtube 封禁,Runway 还找供应商买了专门的代理,用这些代理 IP 地址来下载视频。
搜索
据 Runway 前员工向 4m 的爆料,Runway 公司里几乎是全员都会在这个表格里录入数据,用来训练他们自家的模型。表格里搜集的油管视频,他们是用开源软件 YouTube-DL 下载的,为了防止被 Youtube 封禁,Runway 还找供应商买了专门的代理,用这些代理 IP 地址来下载视频。
伴随着人工智能的高速发展,用户或创作者与平台间围绕AI侵权的纠纷时有发生。
具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。
华盛顿大学和Allen AI最近发表的论文提出了一种新颖有趣的数据合成方法。他们发现,充分利用LLM的自回归特性,可以引导模型自动生成高质量的指令微调数据。
Llama 3.1 405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。
RNN每个step的隐状态都取决于上一个step的输出,这种连续的状态转移方式使得RNN天然带有位置信息。
Transformer中的信息流动机制,被最新研究揭开了:
9次迭代后,模型开始出现诡异乱码,直接原地崩溃!就在今天,牛津、剑桥等机构的一篇论文登上了Nature封面,称合成数据就像近亲繁殖,效果无异于投毒。有无破解之法?那就是——更多使用人类数据!
本文介绍清华大学的一篇关于长尾视觉识别的论文: Probabilistic Contrastive Learning for Long-Tailed Visual Recognition. 该工作已被 TPAMI 2024 录用,代码已开源。
OpenAI 的新奖励机制,让大模型更听话了。