全球最大开源模型再刷爆纪录!4800亿参数MoE击败Llama 3、Mixtral
全球最大开源模型再刷爆纪录!4800亿参数MoE击败Llama 3、Mixtral就在刚刚,拥有128位专家和4800亿参数的Arctic,成功登上了迄今最大开源MoE模型的宝座。
就在刚刚,拥有128位专家和4800亿参数的Arctic,成功登上了迄今最大开源MoE模型的宝座。
近期,多模态大模型 (MLLM) 在文本中心的 VQA 领域取得了显著进展,尤其是多个闭源模型,例如:GPT4V 和 Gemini,甚至在某些方面展现了超越人类能力的表现。
Snowflake 发布高「企业智能」模型 Arctic,专注于企业内部应用。
在人工智能的前沿领域,大语言模型(Large Language Models,LLMs)由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中,预训练阶段占据着举足轻重的地位,它不仅消耗了大量的计算资源,还蕴含着许多尚未揭示的秘密。
似乎所有的手机都已经用上了 AI 功能,但唯独少了 iPhone。 今年 2 月底,知名科技记者 Mark Gurman 爆料称,苹果决定取消电动车项目,并转向生成式人工智能项目。这一消息令外界哗然,默默经营了十年的智能汽车项目不做了,反而去做 AI。苹果有拿的出手的 AI 手机吗?
科幻大片中的AR黑科技,竟走进了现实! 就在刚刚,Meta自家的雷朋智能眼镜,已经开始支持多模态版的Llama 3了!要知道,Llama 3的开源版本还没支持多模态呢。
一款名为 “拯救舔狗” 的大模型原生小游戏出现了。
Lean Copilot,让陶哲轩等众多数学家赞不绝口的这个形式化数学工具,又有超强进化了? 就在刚刚,加州理工教授Anima Anandkumar宣布,团队发布了Lean Copilot论文的扩展版本,并且更新了代码库。
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。
随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。