AI资讯新闻榜单内容搜索-Llama

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了，清华系团队发文回应

面壁智能回应：“深表遗憾”，这也是一种“受到国际团队认可的方式”。

来自主题: AI资讯

10328 点击 2024-06-04 10:43

斯坦福AI团队“套壳”清华系开源大模型被实锤，被揭穿后全网删库跑路

大模型抄袭丑闻总是不断。

来自主题: AI资讯

10267 点击 2024-06-04 10:01

活体脑细胞做成16核芯片，用Python就能编程，9个机构开展实验36所大学排队

首个“脑PU”来了！由“16核”类人脑器官（human brain organoids）组成。

来自主题: AI技术研报

9748 点击 2024-06-03 11:12

next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+

研究人员提出了一种新的大型语言模型训练方法，通过一次性预测多个未来tokens来提高样本效率和模型性能，在代码和自然语言生成任务上均表现出显著优势，且不会增加训练时间，推理速度还能提升至三倍。

来自主题: AI技术研报

9436 点击 2024-06-03 11:00

LLM的「母语」是什么？

在以英语为主的语料库上训练的多语言LLM，是否使用英语作为内部语言？对此，来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报

9973 点击 2024-06-03 10:53

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报

10230 点击 2024-06-02 14:42