
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了,清华系团队发文回应
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了,清华系团队发文回应面壁智能回应:“深表遗憾”,这也是一种“受到国际团队认可的方式”。
面壁智能回应:“深表遗憾”,这也是一种“受到国际团队认可的方式”。
大模型抄袭丑闻总是不断。
未来人与人的交流,难道是这个样?
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。
今年 3 月,以构建大型开源社区而闻名的 AI 初创公司 Hugging Face,挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot,引起了轰动。
我们知道,Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 实验室推出的 Jamba 等开源大语言模型已经成为 OpenAI 的竞争对手。
Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键,但现状是,开源的大模型有一堆,可开源的大规模数据却没多少,而收集、清洗数据又是一项极其费时费力的工作,也导致了大模型预训练技术仍然掌握在少数高端机构的手中。
自动将不同开源模型进行组合,生成具有新能力的新模型,Sakana AI开发的新方法做到了!
自从Grok-1公开发布后,越来越多的人坐不住了。比如这家成立了11年的数据公司Databricks,他们就在Grok-1公开后的一个多礼拜,发布了自己的大模型DBRX。
大模型的训练阶段我们选择GPU,但到了推理阶段,我们果断把CPU加到了菜单上。