
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中,苹果似乎掀起的水花不是很大。
要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中,苹果似乎掀起的水花不是很大。
继 1 月推出国内首个基于 MoE 架构的千亿参数量大语言模型 abab6 后,上周,通用人工智能创业公司、中国估值最高的大模型公司之一 MiniMax 推出了万亿 MoE 模型 abab 6.5。根据 MiniMax 发布的技术报告,在各类核心能力测试中,abab 6.5接近 GPT-4、 Claude 3 Opus 、Gemini 1.5 Pro 等世界领先的大语言模型。
4月24日,商汤集团在港交所暂停交易,暂停交易前上涨31.15%。商汤集团回应,“昨日日日新大模型5.0发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告。”
自ChatGPT发布后,全球掀起了一股AI大模型的盛宴。
国内AI不行,是因为芯片不行? 我们跟国外的差距,是因为和英伟达芯片的差距过大?
在对齐大型语言模型(LLM)与人类意图方面,最常用的方法必然是根据人类反馈的强化学习(RLHF)
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。
Llama 3发布刚几天,微软就出手截胡了?
关于Llama 3,又有测试结果新鲜出炉—— 大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。
两个多月前,我写过一篇文章:字节的Coze、扣子和GPTs,有什么区别?浅谈了我对 Agent 和 GPTs 的一些思考。两个月后的今天,我们可以看到,GPTs 逐渐过气,字节的扣子逐步出圈,而钉钉、百度、Dify 等也都上线了工作流功能。且 Agent 的热度也越来越高,尤其是近段时间吴恩达教授在红杉演讲后。