Hugging Face上最受欢迎的15个AI公司出炉了!
目前的冠军,是Stability AI。
开源英雄Meta AI,取得亚军之位。
而我们熟知的微软、谷歌、OpenAI,分别名列第八、九、十的位置。
截止23年11月24日,榜单如下——
1. Stability AI,20000个赞
2022年AI大爆炸的两个标志性事件,一个是ChatGPT,一个就是Stable Diffusion。
作为开源的图像生成模型,可以说,Stable Diffusion的发布将AI生图提高到了全新的高度,影响不亚于Open AI发布ChatGPT。
Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌门人和联合创始人是Emad Mostaque。
不过,他此前有一些不好的传言。
另外,Stability AI也开源了自己的大语言模型——StableLM。
2. Meta AI,20000个赞
实至名归,Llama模型的开源鼻祖,如今大模型领域开源和闭源模型能够分庭抗礼,没有全被OpenAI、谷歌等明星初创公司和大科技公司垄断,Meta AI功不可没。
也因此,小扎被公认为「开源英雄」,而图灵三巨头之一的Yann LeCun,在Meta也起着定海神针的作用。
虽然排名第二,但是赞数和第一完全没有差距。可以说Meta AI就是最受开源社区欢迎的AI公司。
正所谓,「开源AI社区共一石,Meta独占八斗」。如果没有Meta和LeCun对于AI开源社区的贡献,整个AI行业的格局都会完全改变。
整个AI行业和开源AI的未来的发展,某种程度上都要倚仗LeCun和小扎继续真金白银的投入,以及不断地摇旗呐喊。
视频生成工具Gen-2,已经成为生成式AI视频领域的标杆,每次一发布更新,都能引起业内不小的震撼。
从三无青年到15亿美元独角兽CEO,Runway CEO的故事,不过是又一个「平平无奇」的硅谷神话。
2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在纽约创办Runway, 今年5月,Runway已完成了1.41亿美元的C轮融资,估值达到15 亿美元。
4. CompVis,10000个赞
Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人员合作的结果。
在CompVis领导下的Stable Diffusion V1,改变了开源AI模型的性质,在全球范围内催生出了数百个其他模型和创新。
Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach领导了这个项目,他们在海德堡大学CompVis小组的研究奠定了这个项目的基础。
在海德堡大学,他们创建了广泛使用的VQGAN和Latent Diffusion。这两个模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以实现。
5. 清华KEG,7,000个赞
清华KEG实验室,一直是国内AI技术的领头羊。
中国顶尖开源大模型ChatGLM2-6B,可以说是清华系的ChatGPT,由清华知识工程研究室和智谱AI训练。
ChatGLM2-6B允许免费商用后,我国的开源大模型也开启了「安卓时刻」。
而清华系17人,则直接撑起了中国大模型创业的半壁江山。
6. BigScience,7,000个赞
BigScience Research Workshop,不是正式成立的实体,而是由HuggingFace、GENCI和IDRIS发起的开放式协作组织,以及一个同名的LLM研讨会,汇聚了全球1000+研究人员。
这1000多名志愿研究者,在BigScience项目中创建了拥有1760亿参数的模型BLOOM。
BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的缩写,全名代表着大科学、大型、开放科学、开源的多语言大模型。
7. 阿联酋技术创新研究所,7000个赞
阿联酋技术创新研究所隶属于阿布扎比政府先进技术研究委员会 (ATRC) ,负责监督酋长国的技术研究。
2023年9月6日,阿联酋(UAE)技术创新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。
Falcon 180B拥有惊人的1800亿参数,经过3.5万亿个token的训练,在预训练LLM的HuggingFace排行榜上名列前茅。甚至,它在各种基准测试中,都胜过了Meta的LaMA 2这种级别的竞争对手,包括推理、编码、熟练程度和知识测试。
而且作为第一个有影响力的不限制商用的开源模型,Falcon用中东金主爸爸的豪气,把开源模型的限制彻底打下来了。
这就不奇怪为什么开源社区对他们好感爆棚。
在ChatGPT大爆发之后,突然化身「创业公司」的微软,成为了硅谷大厂中今年最亮的一颗星。
微软快速跟进,利用大模型能力改造了Bing,加班加点推出Copilot,并把他们塞进了自家的拳头产品Office和Windows之中,给科技圈秀了一把这家「年近50」科技巨头的「狼性」。
另一边,微软Azure作为云计算行业的头部玩家,无缝驶入了AI算力需求的快车道。
他们和Meta合作,对Llama 2等开源模型提供的良好支持,也进一步刷了一波在开源社区的好感度和存在感。
在最近的OpenAI惊天宫斗系列剧中,微软差点通过「OpenAI 0元购」,成为了AI赛道的「终极寡头」。
9. Google AI,6000个赞
作为对于AI技术投入最早也最大的科技巨头,谷歌在AI社区中的影响力不用怀疑。
从AI基础研究到AI产品,谷歌早已浑身上下都流淌着AI的血液。
DeepMind在强人工智能领域不断地取得令人瞩目的突破,谷歌云作为AI算力提供商是AI行业的基础设计建设中最重要的一环。
虽然谷歌Bard和Palm大模型暂时在竞争之中不占优势,但传说中的Gemini似乎迟早要将谷歌拉回AI行业舞台的最中心。
而对于开源社区的发展,谷歌的贡献同样功不可没,无数的开源项目已经成为AI开源社区的基石。
10. OpenAI,4000个赞
作为AI行业今年大爆发的直接引领者,OpenAI的地位是毋庸置疑的。
虽然被调侃为「ClosedAI」,但是OpenAI对于AI开源社区的贡献也是有目共睹的。
Whisper作为开源且性能最好的语音识别模型,几乎所有相关的从业人员都能从中受益。
希望刚刚结束了「权游」的OpenAI,能继续瞄准AGI,为整个AI行业开拓上限。
11. BigCode Project,4,000个赞
BigCode是一个开放的科学合作组织,致力于为编码应用程序进行负责任的LLM训练。
他们的主要工作有——
StarCoder,一种最先进的代码语言模型。
BigCode项目中的StarCoder,是一个160亿参数的模型,它使用了80多种编程语言、GitHub问题、Git提交和Jupiter 笔记本的一万亿个token。
StarCoder可以通过聊天进行微调,创建一个性化的编码助手StarChat。
另外还有OctoPack,用于指令调优大型代码模型的工件;The Stack,最大的可用预训练数据集,具有外围代码;SantaCoder,一个1.1B参数的代码模型。
12. MosaicML,4000个赞
在今年6月被DataBrick斥资13亿刀收购的独角兽MosaicML,非常引人瞩目。
从此,MosaicML的生成式AI平台和Databricks的数据管理能力结合,将形成双赢。
这家公司创立于21年,仅有62人。
创始人Naveen Rao是创办的第一家公司Nervana Syatems,被英特尔收购。另一位创始人Hanlin Tan,是一位连续创业者,曾创立云计算公司,以及在谷歌、微软和英特尔担任职位。
MosaicML提供了一些开源、可商用的LLM,比如MPT模型。
MPT-7B和MPT-30B两个模型,是目前最先进的开源、可商用的LLM之一。
13. UKP Lab,3000个赞
UKP Lab(无处不在的知识处理实验室)由Iryna Gurevych教授于2009年创立,是达姆施塔特工业大学计算机科学系的一部分。
UKP Lab在自然语言处理(NLP)方面开展前沿研究,重点关注大型语言模型、对话式人工智能、问答、跨文档NLP以及新颖的数据集和问题定义。
14. EleutherAI,3000个赞
EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao创立,从一个讨论GPT-3的Discord服务器,发展成为一个专注于大规模人工智能研究的非营利性研究机构。
现在,它是是一个开源的社区人工智能项目,旨在创建一个完全去中心化的、具有自治文明的单例人工智能。任何能连接互联网且有GitHub帐户的人都可以参与。
2021年,EleutherAI发布了The Pile,是一个825GB的多样化文本数据集。
2021年6月,EleutherAI公布了GPT-J,它是一个60亿参数的模型,在Pile上训练。发布时,它是世界上最大的公开GPT-3风格的语言模型。
随着GPT-NeoX的出现,EleutherAI计划将参数一直提高到1750亿,发起了争夺最大GPT-3模型的挑战赛。
2023年4月,它发布了Pythia系列大模型。
15. Salesforce,3000个赞
Salesforce,是创建于1999年3月的一家客户关系管理(CRM) 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台。
创始人是Marc Benioff。27岁时,他就成为Oracle历史上最年轻的高级副总裁。
正是因为预见到,会有越来越多的企业通过互联网得到软件服务,他才选择离开Oracle,在37岁时创立Slesforce。
他提出了云计算和SaaS的理念,被誉为「软件终结者」。
当下Salesforce正在推出AI功能,试图将人工智能整合到办公空间即时通讯应用Slack等产品中,并为销售人员等推出了一款名为Einstein GPT的生成式人工智能产品。
Benioff称,「我们非常渴望确保Salesforce成为第一大人工智能CRM。」
参考资料:
https://twitter.com/osanseviero/status/1727260746289905920
文章来自微信公众号 “ 新智元 ”,作者 新智元
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner