全球最强开源模型一夜易主,1320亿参数推理飙升2倍!
全球最强开源模型一夜易主,1320亿参数推理飙升2倍!【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。
搜索
【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。
扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了生成式 AI 的应用前景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样时间端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。
今年升级的重点在于引入了多模态大模型能力。
这是迄今为止最强大的开源大语言模型,超越了 Llama 2、Mistral 和马斯克刚刚开源的 Grok-1。
AI 时代,在大模型能力还在进化、还在苦苦寻找 PMF 之前,创业者之间的交流和共识似乎变得更为重要。一次成功的尝试,或者是失败的反思;或者是最近的创业新方向和新收获;或者是对于某个垂直领域的新观察。
大连理工大学信息检索研究室在始智AI wisemodel.cn开源社区发布了司法大模型--太令(TaiLing)1.0版,“太令”是专门为司法领域定制的大语言模型,其训练基础是庞大的通用中文语料库,并结合了裁判文书、合同、司法考试材料以及司法问答等专业司法数据进行深度训练。
上下文长度真的能形成护城河吗?
除了没有成熟商业模式,Stability AI更缺乏能力证明他们可以继续开发顶尖大模型。
2022年底,OpenAI(美国人工智能研究公司)发布的大模型ChatGPT(对话生成式预训练大模型)引发了广泛关注。在“大模型+大数据+大算力”的加持下,ChatGPT能够通过自然语言交互完成多种任务,具备了多场景、多用 途、跨学科的任务处理能力。
GPT-4真的被反超了!大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。