AI资讯新闻榜单内容搜索-小模型

AI落地现状：大事干不了，小事没必要

大模型未必最优，小模型也有机会前几天刷B站的时候，碰到了一个很抽象很难评的事情——一个科普up主的视频里，夹带了一个AI产品的广告。

来自主题: AI资讯

6301 点击 2024-12-10 10:08

自从 Chatgpt 诞生以来，LLM（大语言模型）的参数量似乎就成为了各个公司的竞赛指标。GPT-1 参数量为 1.17 亿（1.17M），而它的第四代 GPT-4 参数量已经刷新到了 1.8 万亿（1800B）。

来自主题: AI技术研报

6883 点击 2024-12-08 12:20

用大模型“蒸馏”小模型，有新招了！

来自主题: AI技术研报

6356 点击 2024-12-04 09:34

最近，一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后，一个仅80亿参数的小模型，在科学问题上也能和GPT-4o一较高下！或许，单纯地卷AI计算能力并不是唯一的出路。

来自主题: AI技术研报

8360 点击 2024-12-02 15:53

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报

5859 点击 2024-11-24 20:02

生成式人工智能GenAI是否存在泡沫？这个问题日益成为业界热议的焦点。目前，全球对AI基础设施的投资已到了癫狂的成千上万亿美元的规模，然而大模型如何实现盈利却始终没有一个明确的答案。

来自主题: AI资讯

3306 点击 2024-11-11 10:20

商汤科技联合创始人、执行董事徐冰出席香港金融科技周活动，并与前福布斯记者Olivia Kinghorst做现场对谈。在近20分钟的对话中，双方讨论了AI云平台市场趋势、投资判断、超级应用、竞争格局等话题。

来自主题: AI资讯

3738 点击 2024-11-05 09:30

来自英伟达、CMU、UC伯克利等的全华人团队提出一个全新的人形机器人通用的全身控制器HOVER，仅用一个1.5M参数模型就可以控制人形机器人的身体。人形机器人的运动和操作之前只是外表看起来类人，现在有了HOVER，连底层运动逻辑都可以类人了！

来自主题: AI技术研报

3063 点击 2024-11-04 17:02

大模型固然性能强大，但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型，那真是小庙供不起大菩萨。近段时间，小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域，也出现在了机器人领域。

来自主题: AI技术研报

3699 点击 2024-10-31 15:06

Zamba2-7B是一款小型语言模型，在保持输出质量的同时，通过创新架构实现了比同类模型更快的推理速度和更低的内存占用，在图像描述等任务上表现出色，能在各种边缘设备和消费级GPU上高效运行。

来自主题: AI技术研报

4194 点击 2024-10-25 11:06