AI资讯新闻榜单内容搜索-LLama

Stability AI发布全新代码模型Stable Code 3B！媲美70亿Code Llama，没GPU也能跑

今天，Stability AI发布了Stable Code 3B，在图片生成之外的战场上，Stability也开始发力了

来自主题: AI资讯

6733 点击 2024-01-17 13:46

随着技术的不断发展，各种AI模型框架也越来越多，管理和整合多个模型、服务提供商和密钥可能会变得复杂。幸运的是，而今有一款名为“AI 网关”的开源项目可以帮助简化这一过程。

来自主题: AI资讯

5976 点击 2024-01-17 10:52

从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。

来自主题: AI技术研报

7290 点击 2024-01-16 14:18

ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在，但投入AI大模型赛道的显然远远不止OpenAI一家，例如谷歌有Gemini、Meta有开源的Llama 2、亚马逊也有Titan。

来自主题: AI资讯

5756 点击 2024-01-15 10:17

爆火社区的Mixtral 8x7B模型，今天终于放出了arXiv论文！所有模型细节全部公开了。

来自主题: AI资讯

7273 点击 2024-01-10 17:01

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍！而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。

来自主题: AI资讯

8807 点击 2024-01-08 14:33

Vista-LLaMA 在处理长视频内容方面的显著优势，为视频分析领域带来了新的解决框架。

来自主题: AI技术研报

3464 点击 2024-01-08 14:17

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。

来自主题: AI资讯

8104 点击 2024-01-08 14:05

华为盘古系列，带来架构层面上新！量子位获悉，华为诺亚方舟实验室等联合推出新型大语言模型架构：盘古-π。

来自主题: AI资讯

5984 点击 2024-01-02 14:34

混合专家模型（MoE）成为最近关注的热点。

来自主题: AI技术研报

7170 点击 2023-12-30 10:28