AI资讯新闻榜单内容搜索-小模型

「大模型变小」成年度大趋势！1月AI四大研究精彩亮点超长总结，模型合并MoE方法是主流

AI大模型并非越大越好？过去一个月，关于大模型变小的研究成为亮点，通过模型合并，采用MoE架构都能实现小模型高性能。

来自主题: AI技术研报

4815 点击 2024-02-09 12:11

三个Agent顶个GPT-4，基于开源小模型的那种｜中大阿里联合出品

来自主题: AI技术研报

2000 点击 2024-02-08 17:06

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

在 AI 赛道中，与动辄上千亿参数的模型相比，最近，小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型，其在每个基准测试中，都优于 Llama 2 13B，并且在代码、数学和推理方面也优于 LLaMA 1 34B。

来自主题: AI技术研报

9622 点击 2024-02-02 11:50

2B小钢炮碾压Mistral-7B，旗舰级端侧模型炸场开年黑马！1080Ti可训，170万tokens成本仅1元

2B性能小钢炮来了！刚刚，面壁智能重磅开源了旗舰级端侧多模态模型MiniCPM，2B就能赶超Mistral-7B，还能越级比肩Llama2-13B。成本更是低到炸裂，170万tokens成本仅为1元！

来自主题: AI资讯

10053 点击 2024-02-02 11:18

梭哈大模型的公司，给自己找了条退路

AI大模型在业界备受关注，但对于一些公司来说，采用小模型可能是一种更好的选择。微软已经开始研发小规模、低算力需求的模型，并组建新团队进行对话式AI的开发。而对于工业、金融和汽车等领域而言，小模型更易于落地，并且具有省电、省钱、省时间的优势。

来自主题: AI资讯

2352 点击 2024-02-01 22:49

摆脱OpenAI依赖！微软组建王牌AI团队专攻「小模型」，为大模型降本增效

根据消息人士曝料，微软调集了各组中的精英，组建了一支新的AI团队，专攻小模型，希望能够摆脱对于OpenAI的依赖。

来自主题: AI技术研报

3598 点击 2024-01-24 13:03

AI狂飙，谁是中国独角兽背后的「超级买家」？

以大模型为代表的生成式AI技术经历了一年多的狂飙突进后，进入一个新的阶段。一是从跳出百模大战的「速度怪圈」，逐步迈向强调模型效果和质量。二是在应用层生态上，强调垂直化与专有化的小模型、基于大模型泛化能力的定制化、智能化的Agent（智能体）也成为了创业者们投身的热门风向。

来自主题: AI资讯

7303 点击 2024-01-23 15:40

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

对模型参数量的迷信、执念也许可以放下了，混合多个小模型也是未来构造对话型 AI 的一个光明的方向。

来自主题: AI技术研报

7647 点击 2024-01-18 18:23

小模型当打之年？2024年AI预言“一网打尽”

在本篇文章中，适道将综合Coatue、a16z、Radical Ventures等明星VC预言；The Information、FT、Sifted汇集的投资者预言；以及Greg Brockman等行业大佬的观点，试着归纳接下来一年中AI的发展脉络。

来自主题: AI资讯

7635 点击 2024-01-09 09:25

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。

来自主题: AI资讯

7564 点击 2024-01-08 14:05

AI资讯新闻榜单内容搜索-小模型

「大模型变小」成年度大趋势！1月AI四大研究精彩亮点超长总结，模型合并MoE方法是主流​

三个Agent顶个GPT-4，基于开源小模型的那种｜中大阿里联合出品

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

2B小钢炮碾压Mistral-7B，旗舰级端侧模型炸场开年黑马！1080Ti可训，170万tokens成本仅1元

梭哈大模型的公司，给自己找了条退路

摆脱OpenAI依赖！微软组建王牌AI团队专攻「小模型」，为大模型降本增效

AI狂飙，谁是中国独角兽背后的「超级买家」？

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

小模型当打之年？2024年AI预言“一网打尽”

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

「大模型变小」成年度大趋势！1月AI四大研究精彩亮点超长总结，模型合并MoE方法是主流