AI资讯新闻榜单内容搜索-Llama

一条磁力链爆全网，Mixtral 8x7B论文来了！碾压Llama 2 70B，每token仅需激活13B参数

爆火社区的Mixtral 8x7B模型，今天终于放出了arXiv论文！所有模型细节全部公开了。

来自主题: AI资讯

7946 点击 2024-01-10 17:01

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍！而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。

来自主题: AI资讯

9531 点击 2024-01-08 14:33

Vista-LLaMA 在处理长视频内容方面的显著优势，为视频分析领域带来了新的解决框架。

来自主题: AI技术研报

4172 点击 2024-01-08 14:17

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。

来自主题: AI资讯

8662 点击 2024-01-08 14:05

华为盘古系列，带来架构层面上新！量子位获悉，华为诺亚方舟实验室等联合推出新型大语言模型架构：盘古-π。

来自主题: AI资讯

6745 点击 2024-01-02 14:34

混合专家模型（MoE）成为最近关注的热点。

来自主题: AI技术研报

7986 点击 2023-12-30 10:28

大模型打开AI新世界，Vision Pro引领空间计算，智能电车超越油车，拼多多“新王”已立，智能手机狂卷创新，新硬件层出不穷，鸿蒙系统加速壮大，AI芯片驱动万物……2023年，科技产业发生了太多重大事件。

来自主题: AI资讯

6709 点击 2023-12-27 14:48

都快到年底了，大模型领域还在卷，今天，Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手，甚至还能和Llama 70B掰手腕！

来自主题: AI资讯

9841 点击 2023-12-13 15:41

一条神秘磁力链接引爆整个AI圈，现在，正式测评结果终于来了：首个开源MoE大模型Mixtral 8x7B，已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。

来自主题: AI资讯

5393 点击 2023-12-12 15:59

前几日，一条MoE的磁力链接引爆AI圈。刚刚出炉的基准测试中，8*7B的小模型直接碾压了Llama 2 70B！网友直呼这是初创公司版的超级英雄故事，要赶超GPT-4只是时间问题了。有趣的是，创始人姓氏的首字母恰好组成了「L.L.M.」。

来自主题: AI资讯

8136 点击 2023-12-11 20:20