AI资讯新闻榜单内容搜索-小模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 小模型
AI落地现状:大事干不了,小事没必要

AI落地现状:大事干不了,小事没必要

AI落地现状:大事干不了,小事没必要

大模型未必最优,小模型也有机会 前几天刷B站的时候,碰到了一个很抽象很难评的事情——一个科普up主的视频里,夹带了一个AI产品的广告。

来自主题: AI资讯
6301 点击    2024-12-10 10:08
开源1.6B小模型「小狐狸」,表现超同类模型Qwen和Gemma

开源1.6B小模型「小狐狸」,表现超同类模型Qwen和Gemma

开源1.6B小模型「小狐狸」,表现超同类模型Qwen和Gemma

自从 Chatgpt 诞生以来,LLM(大语言模型)的参数量似乎就成为了各个公司的竞赛指标。GPT-1 参数量为 1.17 亿(1.17M),而它的第四代 GPT-4 参数量已经刷新到了 1.8 万亿(1800B)。

来自主题: AI技术研报
6883 点击    2024-12-08 12:20
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%

清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%

清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%

最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。

来自主题: AI技术研报
8360 点击    2024-12-02 15:53
研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

研究大模型门槛太高?不妨看看小模型SLM,知识点都在这

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报
5859 点击    2024-11-24 20:02
从LLM大模型到SLM小模型再到TinyML,这个领域有望增长31倍并催生新的商业模式

从LLM大模型到SLM小模型再到TinyML,这个领域有望增长31倍并催生新的商业模式

从LLM大模型到SLM小模型再到TinyML,这个领域有望增长31倍并催生新的商业模式

生成式人工智能GenAI是否存在泡沫?这个问题日益成为业界热议的焦点。目前,全球对AI基础设施的投资已到了癫狂的成千上万亿美元的规模,然而大模型如何实现盈利却始终没有一个明确的答案。

来自主题: AI资讯
3306 点击    2024-11-11 10:20
商汤执行董事徐冰最新访谈:商汤最近在做什么?数万亿的AI投资能回本吗?

商汤执行董事徐冰最新访谈:商汤最近在做什么?数万亿的AI投资能回本吗?

商汤执行董事徐冰最新访谈:商汤最近在做什么?数万亿的AI投资能回本吗?

商汤科技联合创始人、执行董事徐冰出席香港金融科技周活动,并与前福布斯记者Olivia Kinghorst做现场对谈。在近20分钟的对话中,双方讨论了AI云平台市场趋势、投资判断、超级应用、竞争格局等话题。

来自主题: AI资讯
3738 点击    2024-11-05 09:30
Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!

Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!

Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!

来自英伟达、CMU、UC伯克利等的全华人团队提出一个全新的人形机器人通用的全身控制器HOVER,仅用一个1.5M参数模型就可以控制人形机器人的身体。人形机器人的运动和操作之前只是外表看起来类人,现在有了HOVER,连底层运动逻辑都可以类人了!

来自主题: AI技术研报
3063 点击    2024-11-04 17:02
让机器人拥有人一样「潜意识」,英伟达1.5M小模型就能实现通用控制了

让机器人拥有人一样「潜意识」,英伟达1.5M小模型就能实现通用控制了

让机器人拥有人一样「潜意识」,英伟达1.5M小模型就能实现通用控制了

大模型固然性能强大,但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型,那真是小庙供不起大菩萨。近段时间,小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域,也出现在了机器人领域。

来自主题: AI技术研报
3699 点击    2024-10-31 15:06
7B新王登基!Zamba 2完胜同级模型,推理效率比Llama 3提升20%,内存用量更少

7B新王登基!Zamba 2完胜同级模型,推理效率比Llama 3提升20%,内存用量更少

7B新王登基!Zamba 2完胜同级模型,推理效率比Llama 3提升20%,内存用量更少

Zamba2-7B是一款小型语言模型,在保持输出质量的同时,通过创新架构实现了比同类模型更快的推理速度和更低的内存占用,在图像描述等任务上表现出色,能在各种边缘设备和消费级GPU上高效运行。

来自主题: AI技术研报
4194 点击    2024-10-25 11:06