AI资讯新闻榜单内容搜索-模型

崔大宝：大模型降温背后的难点、卡点、节点

大模型“退烧”？困在“恰饭”难里？

来自主题: AI资讯

7974 点击 2024-08-20 14:35

哈萨比斯：谷歌想创造第二个Transformer，还想把AlphaGo和Gemini强强联合

当一家人工智能公司的首席执行官更像是计算机科学家而不是推销员时，我感觉更舒服

来自主题: AI资讯

5240 点击 2024-08-20 14:31

这世界究竟怎么了？硅谷大佬公开支持AI公司“偷”数据

“乱世”其实早已到来，只不过这次是公开承认了这个现实。

来自主题: AI资讯

6955 点击 2024-08-20 09:56

试用了快手可灵LivePortrait，我终于理解了图恒宇的心情｜测评一下

更适合中国宝宝体质的图生视频大模型。

来自主题: AI资讯

7744 点击 2024-08-19 16:54

4秒看完2小时电影！阿里发布通用多模态大模型mPLUG-Owl3 | 开源

4秒看完2小时电影，阿里团队新成果正式亮相——

来自主题: AI资讯

7954 点击 2024-08-19 16:48

小模型站起来了，浏览器里跑出SOTA，抱抱脸：快逃，合成数据不是未来

浏览器里直接能跑的SOTA小模型来了，分别在2亿、5亿和20亿级别获胜，抱抱脸出品。

来自主题: AI资讯

7094 点击 2024-08-19 16:41

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.0秘诀曝光，智能体生成教学

合成数据2.0秘诀曝光了！来自微软的研究人员们提出了智能体框架AgentInstruct，能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3，在多项基准上刷新了SOTA。

来自主题: AI技术研报

10896 点击 2024-08-19 14:52

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

在人工智能领域，模型参数的增多往往意味着性能的提升。但随着模型规模的扩大，其对终端设备的算力与内存需求也日益增加。低比特量化技术，由于可以大幅降低存储和计算成本并提升推理效率，已成为实现大模型在资源受限设备上高效运行的关键技术之一。然而，如果硬件设备不支持低比特量化后的数据模式，那么低比特量化的优势将无法发挥。

来自主题: AI资讯

5368 点击 2024-08-19 14:49

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现，后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。

来自主题: AI技术研报

12535 点击 2024-08-19 14:47

一文看懂Mamba，Transformer最强竞争者

Mamba 虽好，但发展尚早。

来自主题: AI资讯

8339 点击 2024-08-19 14:46