AI资讯新闻榜单内容搜索-3

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

11674 点击 2024-08-02 14:26

不同类型的数据配比如何配置:先通过小规模实验确定最优配比，然后将其应用到大模型的训练中。 Token配比结论：通用知识50%；数学与逻辑25%；代码17%；多语言8%。

来自主题: AI技术研报

10987 点击 2024-08-02 11:53

换了发型的扎克伯格越来越不像机器人了。这是网友们对扎克伯格最近形象转变的普遍评价，但看顺眼的网友更多是对他旗下 Meta 公司的认可。时间往回倒退 3 年，当时的「Facebook」或许还指望着改名转运。

来自主题: AI资讯

7257 点击 2024-08-02 11:02

是时候用CPU通用服务器跑千亿参数大模型了！

来自主题: AI资讯

9113 点击 2024-08-01 16:19

今年 6 月底，谷歌开源了 9B、27B 版 Gemma 2 模型系列，并且自亮相以来，27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一，在真实对话任务中比其两倍规模以上的模型表现还要好。

来自主题: AI技术研报

7545 点击 2024-08-01 15:41

谷歌DeepMind的小模型核弹来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。

来自主题: AI技术研报

10775 点击 2024-08-01 15:32

英伟达股价这周又坐上了过山车。截至周三收盘，英伟达股价大涨13％，市值暴增3290亿美元，再次刷新过去几个月自己创下的单日纪录。

来自主题: AI资讯

7950 点击 2024-08-01 15:21

最近一段时间开源大模型市场非常热闹，先是苹果开源了70亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源，在多项基准测试中Llama 3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。

来自主题: AI资讯

8804 点击 2024-08-01 11:26

7月31日，阿里通义宣布免费开放奥运AI大模型，具备奥运专业知识，并集合同声传译级别的中法互译功能。即日起，用户可以在通义APP免费使用。

来自主题: AI资讯

10944 点击 2024-08-01 11:15

智东西7月31日消息，根据顶级学术期刊《自然》（Nature）昨日报道，生成式AI在学术写作中的使用已迎来爆发式增长。相关研究显示生物医学领域最大数据库PubMed上10%的论文摘要都有AI写作嫌疑，相当于每年15万篇论文中都有AI的参与。

来自主题: AI资讯

7909 点击 2024-08-01 11:11